한윤성 기자의 오늘의 이슈(5월) |
|||||
---|---|---|---|---|---|
이름 | 한윤성 | 등록일 | 23.06.13 | 조회수 | 28 |
바드와 챗gpt, 빙 뭐가 더 나을까 구글이 인공지능(AI) 챗봇 '바드(Bard)'를 전격 공개하자 앞서 나온 오픈AI 챗GPT, 마이크로소프트(MS) 빙(Bing)과의 차별성에 대한 관심이 높아졌다. 특히 바드가 한국어를 지원하면서 AI 챗봇 삼형제 모두 이제 한국어에 능숙하다. 하지만 회사별로 AI 챗봇의 성능과 한국어 답변에서 차이가 있다. 바드는 챗GPT, 빙보다는 비교적 정확도가 높았고, 빙은 검색 결과에 의존하는 듯해 구체적이지 않았지만 창작면에서는 앞섰다. 챗GPT는 정보의 최신성은 떨어졌지만 새롭게 보완했고, 창의적인 아이디어에 대해서는 거침없이 제안했다.
?I 챗봇 삼형제 스팩 비교 먼저 언어 모델에 있어서는 구글이 최근 공개한 대규모 언어 모델(LLM) 팜2(PaLM)가 현재로서는 가장 앞서 있다는 평가를 받는다. 팜2는 매개변수가 5300억개가 넘어 오픈AI '챗GPT'에 탑재된 GPT-3.5(매개변수 약 1750억개)보다 3배 이상 거대하다 특히, 팜2의 학습량은 기존 출시된 LLM보다 월등히 높았다. 구글이 2년 전 발표한 LLM인 람다(LaMDA)가 학습한 토큰은 1조5000억 개였지만 이보다 5배 많은 7800억개의 토큰으로 학습됐다. 토큰은 AI가 인식하는 단어의 문자열로, LLM이 다음에 나타날 단어를 예측하도록 학습시키는 요소를 말한다. 오픈AI가 마지막으로 챗GPT의 학습 규모를 공개한 것은 GPT-3로 당시 회사는 3000억 개의 토큰으로 학습했다고 밝혔다. 데이터 학습 면에서 보면 팜2는 100개가 넘는 언어와 수학, 과학, 프로그래밍, 문학 등과 같은 다양한 영역에서 교육했으며 선별적 데이터를 사용했다. GPT-4는 인터넷에서 사용할 수 있는 거의 모든 도메인과 26개 언어를 포함해 다양한 데이터를 학습한 것이 특징이다. 유료화 역시 큰 차이다. 오픈AI의 GPT-3는 무료지만 GPT-4를 기반의 챗GPT서비스는 월 20달러의 챗GPT 플러스 유료 가입자만 이용할 수 있다. 빙은 GPT-4를 누구나 무료로 액세스 할 수 있지만 매일 제한된 수의 질문만 받고 있다. 반면에 바드는 180개국에서 무료로 사용할 수 있다. 데이터의 반영 시기 역시 챗GPT와 바드의 주요 차이점 중 하나다. 바드와 빙은 실시간으로 인터넷에서 응답을 가져올 수 있는 반면 챗GPT는 2021년 9월까지의 데이터 세트에 의존한다. 이같은 단점을 보완하기 위해 오픈AI는 챗GPT 플러그인 베타서비스를 시작했다. 플러그인은 챗GPT에 특정 웹사이트를 연결한 뒤 해당 사이트의 데이터를 가지고 정보를 검색해 이용할 수 있게 했다. 바드 VS 챗GPT VS 빙, 누가 더 낫나? 실제로 이들 AI챗봇은 다른 경쟁회사 제품에 대해 어떻게 생각할까. 바드, 챗GPT와 빙에게 각각 경쟁사의 장단점을 비교해보라고 각각 질문했다. 챗GPT는 바드의 장점을 텍스트 음성 변환 합성의 특화된 점과 범용성을 꼽았다. 빙은 정확도가 중요한 경우 바드가 좋은 선택이며, 창의성이 중요한 경우 챗GPT가 좋은 선택이고 유익성이 중요한 경우 빙이 좋은 선택이라고 답했다. 바드는 자신을 유익한 방식으로 질문에 답할 수 있지만 때때로 부정확하거나 오해의 소지가 있는 텍스트를 생성할 수 있다고 진단했다. 챗 GPT의 경우 창의적인 콘텐츠를 작성하지만 때때로 불법적이거나 유해한 텍스트를 생성할 수 있다고 답했다. 또 바드는 빙에 대해 정확하지 않은 텍스트를 생성할 수 있다고 평가했다. 바드는 "궁극적으로 당신에게 가장 적합한 모델은 당신이 요구하는 특정 사항에 따라 다르다"며 "정확도가 중요한 경우 바드가 좋은 선택이며 창의성이 중요한 경우 챗GPT가 좋은 선택이고 유익성이 중요한 경우 빙이 좋은 선택"이라고 조언했다. 세 가지 시스템 모두 기계 학습을 사용하여 출력을 생성한다는 점은 비슷하지만 서로 다른 목적을 위해 설계됐으며 서로 고유의 강점과 약점을 가지고 있다는 얘기다. 콘텐츠 창작 능력은 빙이 앞섰다. 'OO기자의 문체로 OOO 기사를 써줘'라는 질문에 빙은 바이라인 표기를 정확히 하며 얼핏 기자의 문체와 비슷하게 써내려갔다. 특히 회사의 표기 준칙에 맞게 창작을 했다. 반면 챗GPT는 '자신은 기사를 작성하는 것은 불가하며 일반적인 정보와 비교를 제공한다'고 답변했다. 바드도 기사 작성을 대신해 원론적인 답변을 내놨다. 한편 구체적이고 창의적인 아이디어는 챗GPT가 뛰어난 모습을 보였다. 예컨대 '아이가 야채와 과일을 먹지 않는데 좋은 아이디어를 제공해줘'라는 질문에 챗GPT는 요리나 도시락의 활용 등 총 7가지의 구체적인 아이디어를 제시했다. 또 아이의 나이를 특정하자 연령에 맞는 해결책도 제시했다.
|
이전글 | 한윤성 기자의 오늘의 이슈(6월) |
---|---|
다음글 | 오늘의 이슈 (6월) |