바드가 시가 100조라고 잘못 답했는데 기술적인 한계인가요? 경영의 문제인가?


firm)) Bard의 오답으로 시가 100조 손실, 기술적인 한계인가? 경영의 문제인가?

음유시인이 오답을 내는 이유는 기술적으로 생성 AI의 한계이기 때문입니다.

간단히 말해서 생성 AI는 어떤 토큰(형태소와 같은 단어보다 작은)이 단어 다음에 문장을 계속할지 예측합니다.

이번에 Bud가 어떻게 틀렸는지 보세요. “제임스 웹 우주 망원경의 새로운 발견을 9살짜리에게 어떻게 설명하겠습니까?” 우리 태양계 밖에 있습니다.

“행성 또는 외계 행성”은 잘못된 대답입니다.

NASA에 따르면 2004년 칠레에 있는 유럽남방천문대(ESO) 극단망원경(VLT)이 외계행성의 첫 사진을 찍었다.

그런데 위키백과에서 제임스 웹 우주망원경에 대한 설명을 찾아보면 “천체의 형성을 포착하는 등 천문학과 우주론 분야에서 폭넓은 연구가 가능할 것으로 기대된다.

최초의 별과 최초의 A 은하.”

Bard의 답변과 Wikipedia 문장의 차이점을 즉시 볼 수 있습니까? 이 두 문장의 차이점을 엄격하게 이해하는 것은 쉽지 않습니다.

또한 “아홉 살짜리에게 설명하라”는 한계를 감안할 때 쉽고 간단하게 설명해야 합니다.

Wikipedia 또는 뉴스 기사는 학습 데이터로 자주 사용되며 Wikipedia의 설명 데이터 또는 여러 웹 사이트의 답변은 답변을 생성하는 데 사용됩니다.

비슷하지만 어순이나 어미가 약간 다른 문장은 과학적 지식이나 역사적 사실을 완전히 바꿀 수 있습니다.

이것은 또한 ChatGPT가 가짜 기록을 많이 만들어 대응했다는 이야기의 요점이기도 합니다.


이러한 한계를 극복하기 위해 사람이 검증할 수 있는 소스 및 기타 장치를 계속 추가하고 있습니다.

AllGayz의 AliGPT도 답변의 근거로 사용된 회사 문서를 답변 뒤에 출처로 표기하여 미리보기 형태로 보여줍니다.

그리고 기술팀과 홍보담당자간 커뮤니케이션이 부족해서 그 부분이 홍보영상에 포함되지 않았나 싶습니다.

그런 점에서 나는 이것을 기술적인 한계라기보다는 관리상의 오류라고 생각한다.


AllGays의 홍보 및 마케팅 책임자이자 AI 스타트업의 대내외 커뮤니케이션 책임자로서 업무에 대해 많은 생각을 합니다.

기술적으로 정확하고 대중이 접근할 수 있는 표현을 찾는 것은 항상 어려운 일이었습니다.

다른 방법이 없을 것 같아서 기술팀과 더 많이 소통하고, 더 많이 배우고, 이렇게 공유할 수 밖에 없습니다.