[Pick] '클로바X'🆚 챗GPT
8월 24일, 네이버가 일명 한국형 챗GPT, '하이퍼클로바X'를 공개했습니다. 아직은 베타 서비스 중인 탓에 서버가 불안정해서인지 서비스를 이용하려면 대기 등록을 해야 합니다. 3시간에 질문을 최대 30개만 할 수 있기도 합니다. 이번 Pick에선 많은 기대를 받았던 클로바X가 개발된 배경과 사용 후기를 소개하겠습니다.
국산 생성AI, 클로바X가 개발된 배경은?
인터넷을 지배하는 언어는 영어입니다. 따라서 다른 어떤 언어보다도 영어로 된 데이터가 많습니다. 해당 데이터를 학습한 챗GPT나 바드는 자연스레 영어에 특화됐습니다. 물론 영어를 주로 사용하는 미국에서, 영어 사용자들에 의해 개발된 탓도 있습니다. 이 때문에 영어와 완전히 다른 어족으로 묶이는 한국어에 대한 영미권 생성 AI의 답변은 상대적으로 부정확합니다. GPT-4의 언어별 답변 정확도에서 한국어는 19위를 차지하기도 했습니다.
데이터의 양뿐만 아니라 학습의 용이성 측면에서도 한국어는 영어보다 훨씬 불리합니다. GPT를 예로 들면, GPT를 학습시키기 위해선 어노테이션(Annotation, 프로그램에게 추가 정보를 제공하는 주석을 다는 행위)된 데이터가 필요합니다. 예컨대 <오펜하이머>에 관한 데이터에 '<오펜하이머>와 관련이 있음'이라고 지시문을 작성해서 GPT가 <오펜하이머>에 대한 질문을 받았을 때 해당 데이터를 참고하도록 하는 것입니다.
그런데 놀랍게도 어노테이션은 보통 수작업으로 이뤄진다고 합니다. 어느 정도 학습이 충분히 이뤄진 AI가 있으면, 그 AI가 어노테이션을 대신 해준다고는 하지만 적어도 GPT의 어노테이션은 수작업으로 이뤄졌다고 합니다.
영어는 세계적으로 널리 쓰이기 때문에 AI 개발사들은 어노테이션 작업을 보통 인건비가 저렴한 나라에 아웃소싱합니다. 반면 한국어는 사용자 대부분이 한국에 집중됐다 보니 어노테이션을 인건비가 저렴한 국가에 아웃소싱하기 어렵습니다. 이 때문에 AI 개발사들은 한국어를 포함한 (상대적으로) 소수 언어 학습을 소홀히 여기게 됩니다.
하지만 네이버는 국내 최대 포털 사이트를 운영하면서 블로그, 지도, 뉴스 등을 통해 한국어 데이터를 그 어느 기업보다도 많이 보유하고 있을 겁니다. 그래서 해외 개발사들과 비교할 때 한국어 데이터 학습에 절대우위를 가집니다. 최소한 '한국어'에 대해선 세계 어느 개발사보다 뛰어난 성능을 보이는 생성AI를 개발할 능력이 있는 것입니다.
챗GPT와 비교&사용 후기
이제 챗GPT와 클로바X에 똑같은 질문을 입력한 뒤, 각자 어떤 답변을 내놓았는지 비교해보겠습니다.
1) 코딩
코드를 생성해 달라고 부탁했습니다. 필자는 코딩 관련 지식이 부족하기 때문에, 컴퓨터공학을 전공한 지인에게 자문을 구했습니다. 클로바X와 챗GPT에게 "Generate the HTML, CSS, and Javascript code for two buttons of type radio input."라는 같은 질문을 입력했습니다. HTML 코드에 대한 답변만 가져왔습니다. 같은 질문인데도 일단 답변의 길이가 다릅니다. 지인에 의하면 클로바X의 답변은 부족하고, 부정확하다고 합니다. 반면 챗GPT의 답변은 괜찮다고 하네요.
결과: 챗GPT 승리(아직 코딩에 있어선 클로바X가 챗GPT보다 부족해 보입니다.)
2) 맛집 추천
이번엔 맛집을 추천해 달라고 했습니다. "9월에 전라남도 순천시 여행을 갈 거야. 순천시의 맛집을 5개만 추천해줘."라고 질문했는데요. 필자의 순천시 거주 경험을 바탕으로 둘 중 무엇의 답변이 더 정확한지 판단해보겠습니다.
클로바X는 나눌터, 대숲골농원, 금빈회관, 화월당, 건봉국밥을 추천해줬습니다. 해당 식당들은 모두 실제로 존재하며, 순천에서도 맛집으로 인정받는 식당들입니다. 식당에 대한 설명도 모두 정확합니다.
챗GPT의 답변은 모두 엉터리입니다. 저 중 단 한 식당도 실재하지 않습니다. 게다가 '옥련'이란 지역은 '인천시'에 있다고 하네요.
결과: 클로바X 승리(네이버 지도, 블로그 등의 데이터를 그대로 사용한 덕분인 것 같습니다.)
3) 쇼핑 추천
쇼핑 기능은 네이버가 수차례 강조한 기능이기도 합니다.
"20대에게 인기있는 모자를 추천해줘. 구매 링크도 알려줘."라고 질문했는데요. 클로바X는 구체적인 브랜드와 링크를 첨부해줬습니다. 실제로 인기 있는 모자들이기도 합니다. 5번 '명품 모자' 답변은 좀 아쉽네요.
챗GPT의 답변은 좀 애매합니다. 일단 구체적인 브랜드를 집어주지도 않았고요. 몇몇 모자는 유행이 지나기도 했습니다. 게다가 구매 링크도 보내주지 않았습니다.
결과: 클로바X 승리(인데...)
네이버가 보내준 링크에 접속해보면 위와 같은 페이지로 연결됩니다. 어떤 링크는 존재하지 않는다고 나오고, 판매하지 않는 상품으로 연결되기도 합니다. 네이버의 시연대로 클로바X를 쇼핑에 원활히 활용하려면 아직 많은 개선이 필요해 보입니다.
4) 창작, 저작권
다음으론 창작을 부탁해봤습니다. "윤동주 시인의 문체를 참고해서 '가을'을 소재로 시를 한 수 써줘."라고 부탁했는데요.
클로바X는 저작권을 이유로 시를 작성해줄 수 없다고 합니다. 다만 '윤동주 시인의 문체를 참고해...'라는 명령 탓으로 보입니다. 그냥 "가을을 소재로 한 시를 작성해줘"라고 질문하면 군말없이 시를 작성해줍니다.
챗GPT는 꽤 그럴싸한 시를 작성해줍니다. 챗GPT는 스스로 자신의 시에 대해 "윤동주 시인의 느낌을 담기 위해 자연의 아름다움과 감정을 시적으로 표현하려 노력했습니다. '가을'의 아름다움과 그 안에 내재한 애틋한 감정을 시로 표현하였습니다."라고 소개했습니다.
결과: 챗GPT 승리(하지만 클로바X가 저작권 문제를 더욱 신경 씀을 알 수 있습니다. 국내 규제나 네이버란 기업의 특수성 탓일 수도 있습니다.)
종합해보면, 한국어 질문에 대해서 사실에 기반한 정보 탐색 기능은 클로바X가, 코딩이나 저작권과 관련 있는 창작 기능은 챗GPT가 현재로선 더 뛰어나다고 볼 수 있겠네요. 클로바X는 전반적으로 '이만하면 아주 훌륭한 첫걸음'이라고 평가받고 있습니다. 문제점에 대해선 네이버가 적극적으로 수용하고 개선하겠다고 발표한 만큼 정말 앞으로가 더 기대됩니다. 카카오 등 다른 국내 기업들의 생성AI는 어떤 모습일지 궁금하네요.
Issues
'로봇택시 합법화'한 샌프란시스코, 벌써 문제?
8월 11일, 샌프란시스코는 세계 최초로 무인 로봇택시의 24시간 운행을 승인했습니다. 그런데 승인 직후 로봇택시와 소방차가 충돌하는 큰 사고가 나면서, 로봇택시 운영업체인 GM크루즈가 로봇택시 가동량을 50% 줄이기로 했습니다. 아직 시기상조인 걸까요? [LINK]
두산 로보틱스 IPO 돌입, 국내 IPO 시장 반등할까
23일, 두산로보틱스가 금융위에 증권신고서를 제출하면서 코스피 상장을 위한 공모 절차에 본격 돌입했습니다. 두산로보틱스는 협동로봇 등 로봇 공학 분야에서 국내 1위를 차지하고 있습니다. 또한 SGI서울보증, SK에코플랜트 등도 상장을 준비 중입니다. [LINK]
AI 도입 속도가 가장 빠른 국가는?
싱가포르가 AI 기술을 세계에서 가장 빨리 도입한 국가로 선정됐습니다. 링크드인에서 조사했는데, 이용자가 AI를 프로필에 얼마나 여러 번, 많이 포함했는지 등이 기준이었습니다. 한국은 조사 대상에 포함되지 않았습니다. [LINK]
트위터(X)보다 많이 번 웹사이트는?
Business Insider에 따르면, 온리팬즈(OnlyFans)가 트위터보다 많은 수입을 올린 웹사이트가 됐습니다. 온리팬즈는 크리에이터가 구독자의 자금을 받아 유료 콘텐츠를 제공하는 사이트인데요, 현재는 사실상 포르노 사이트가 됐다고 합니다. 놀라운 건 온리팬즈는 어떤 메이저 앱스토어에도 등록이 안 돼 있습니다. [LINK]
틱톡, 2025년엔 미국 최대 소셜미디어
틱톡이 2025년에 미국 최대 소셜미디어가 될 것이란 전망이 나오고 있습니다. 18세 이상 미국인의 하루 소셜미디어 사용 패턴을 분석한 결과, 틱톡의 성장세와 젊은 층의 높은 틱톡 선호도가 현재 미국의 '틱톡 제재'를 무용지물로 만들 것이라고 하네요. [LINK]
스레드 웹 버전 등장!
스레드 웹 버전이 공개됐습니다. [LINK]
Data
AI vs. Humans: 누가 더 뛰어날까?
ChatGPT 등 생성AI의 폭발적인 성장과 함께 AI가 인간을 뛰어넘기 시작했습니다. 특히 전통적으로 인간이 잘 한다고 여겨졌던 독해와 음성 인식, 이미지 식별 분야에서 대중에게 존재감을 드러내고 있습니다.
X(트위터) vs 스레드
당차게 등장했던 스레드가 결국 X(트위터)를 넘긴 어려워 보입니다. 안드로이드 기준, 스레드는 출시 3일만에 DAU 5천만 명을 기록했지만, 이후 쭉쭉 떨어져 현재는 DAU가 1천만 명 수준이 됐습니다. 반면 X는 꾸준이 1억 명 이상의 DAU를 기록 중입니다. 특히 X로 리브랜딩한 이후 DAU가 꽤나 상승하기도 했습니다.
당근'마켓' ⇒ '당근'
당근마켓이 설립 8년 만에 서비스명을 바꿉니다. 당근마켓에서 '마켓'을 떼고, '당근'이 됩니다. 단순 중고거래 플랫폼을 넘어 소모임, 부동산 직거래 등으로 서비스를 확장하겠단 전략입니다. 당근마켓은 꾸준히 상승하는 매출만큼, 영업손실도 큰 폭으로 커졌는데요. 이번 리브랜딩을 통해 수익화를 모색하려는 듯합니다. [LINK]