[브리핑] GPT-4o가 다른 AI보다 뛰어난 점

[1] 오픈AI, 음성비서 GPT-4o 공개, 영화 <Her>가 현실로?

오픈AI가 음성비서 GPT-4o(지피티 포오, o는 omni)를 공개했습니다. 아직 정식 배포는 되지 않았지만, 늦어도 2~3주 안에 직접 사용해볼 수 있을 듯한데요. 텍스트나 이미지뿐만 아니라 사람처럼 음성을 즉각 받아들인 뒤 사람과 상호작용할 수 있습니다. 이번 브리핑에선 핵심 정보만 간단히 추려봤습니다.

• 왜 중요하냐면 : GPT-4o는 멀티모달 데이터를 가장 사람처럼 받아들이고 그에 맞는 대답을 만들어낼 수 있는 모델입니다. 기존에도 ChatGPT는 음성 모드를 지원하긴 했죠. 하지만 2.8초(GPT-3.5)~5.4초(GPT-4) 정도 딜레이가 있었는데요. GPT-4o는 평균 0.32초의 딜레이를 기록합니다. 사람보다도 훨씬 빠르게 대답하는 셈입니다. 카메라로 얼굴을 보여주면 GPT-4o가 표정을 해석하기도 합니다. 표정을 통해 드러난 감정을 해석하고 그에 걸맞는 대화 방식을 사용합니다.

• 더 많은 정보 : GPT-4o의 텍스트와 이미지 기능은 ChatGPT에서 이미 무료로 사용할 수 있으며, 음성 모드는 지역이나 언어에 따라 순차적으로 ChatGPT+(유료)에 출시될 예정입니다. 비용 문제가 걱정되지만, GPT-4o의 API는 기존 GPT-4 API보다 속도는 2배 빠르면서 가격은 절반 수준이라고 합니다. 또, ChatGPT는 기존에 50개 언어로 제공됐는데요. 이제 65개 언어로 제공된다고 합니다.

• 기억해 둘 것 : 정말 영화 <Her> 속 음성비서 '사만다'를 현실에서 만나볼 날이 머지 않았습니다. 통번역을 넘어 비서 역할을 하는 AI가 나올 수도 있겠네요.
아래 사진은 GPT-4o와 다른 모델 간 성능 비교입니다.

왼쪽 사진은 MMLU(여러 학문을 복합적으로 활용해 문제를 해결하는 능력), GPOA(일반적 질문에 대한 대답 능력), MATH(수학능력), HumanEval(코딩, 프로그래밍 능력), MGSM(다국어의 수학적 추론 능력), DROP(문단을 이해하고 그것을 기반으로 사고하는 능력)에서 각 모델의 성능을 보여주는데요. GPT-4o는 모든 벤치마크에서 1~2위를 차지했습니다.

오른쪽 사진은 오류 발생률을 보여줍니다. GPT-4o가 가장 낮은 오류 발생률을 기록했네요.

GPT-4o vs. GPT-4 vs. Gemini 1.5 ⭐ — Performance Analysis
Measuring English Language Understanding of OpenAI’s New Flagship Model

GPT-4o가 AI 비즈니스 생태계, 나아가 스마트폰과 데스크탑 앱 시장에 어떤 영향을 미칠 수 있는지는 아래 The Core의 글을 참조하시길 바랍니다.

GPT-4o: AI 비즈니스는 어떻게 변화하는가
OpenAI는 인간과 기계가 상호 작용하는 새로운 시대를 열고자 합니다. OpenAI의 새로운 GPT-4o 모델은 GPT-4 터보보다 더 빠르고, 더 저렴하며, 더 좋습니다. GPT-5는 아닙니다. GPT-4o는 GPT-3.5에서 GPT-4로의 큰 도약은 아니지만, 획기적인 변화입니다. (준비기간이 지나면) GPT-4o는 무료로 사용할 수 있습니다. 이로써 진정한 의미에서 ‘대중을 위한 AI’가 탄생하며 이는 전 세계에

[2] 네이버, 라인 지분정리할까?

10일, 라인야후 사태에 대해 네이버가 입장문을 발표했습니다. 다소 소극적인 자세로 지분을 정리할 수 있음을 암시했는데요. 라인야후 사태의 진행 상황과 그것이 네이버에 미칠 영향을 살펴봤습니다.

• 지분 정리하나? : 네이버는 입장문을 통해 "지분 매각을 포함해 모든 가능성을 열어뒀다"고 밝혔는데요. 현재 라인야후의 지주회사(64% 보유)인 A홀딩스의 지분은 네이버와 소프트뱅크가 절반씩 보유 중입니다. 하지만 최근 유일한 한국인 이사인 신중호 CPO가 이사회에서 퇴임하며 라인야후 이사회는 전원 일본인으로 구성될 전망입니다. 다만 지분을 모두 매각할진 미지수입니다. 네이버 지분의 총가치는 약 10조원인데, 이를 소프트뱅크가 지불할 여력은 없단 분석이 나옵니다.

• 네이버와 소뱅은 왜 틀어졌나? : 양사는 네이버는 기술을, 소뱅은 자본을 담당하며 긴밀한 협력 관계를 맺어왓습니다. 관계가 틀어진 건 일본 정부 방침으로 보입니다. 업계 관계자는 "소뱅은 일본 정부의 방침대로 움직이고 있다"고 말하며 소뱅이 일본의 눈치를 보고있음을 지적했습니다.

• 동남아 사업은 어떻게 될까? : 네이버의 가장 큰 걱정은 아마 라인을 기반으로 한 동남아 사업일 텐데요. 라인야후의 일본 사업권은 소뱅에 넘기더라도, 해외 사업권은 네이버가 확보할 가능성이 있습니다. 관건은 Z인터미디어트라는 라인플러스(해외사업 담당), IPX(라인 캐릭터 담당)의 지주회사입니다. 해당 회사의 지분을 어떻게 조정할지가 관건입니다.

• 정부 대응은? : 정부는 우선 적극적으로 네이버를 돕겠다고 밝혔습니다. 다만 대통령실은 "네이버가 입장을 솔직하고 확실하게 정해줘야 한다"고 말했는데요. 네이버의 상황을 확실히 파악한 뒤, 네이버의 의중대로 지원하겠단 이야기입니다. 그러나 정부가 한일관계에 악영향을 주지 않기 위해 라인야후 사태를 방관하고 있단 비판이 진영을 가리지 않고 쏟아져 나오고 있습니다.

[일본에 배신 당한 네이버]① 글로벌 성공 간절했던 ‘이해진의 꿈’ 물거품 되나… 日 소프트뱅크와 합작이 부메랑으로
라인, 글로벌 무대 공략 위해 일본서 출발 日 이용자 9600만명… 명실상부 일본 국민 메신저로 2019년 소프트뱅크 손잡고 라인야후 출범 구글·아마존 넘겠다더니… 시너지 없고 지배구조가 리스크로 日 정부, 개인정보

[3] 반독점 위협에...MS는 독자 LLM 구축 중, 오픈AI도 독자 검색 서비스 개발 루머 나와

마이크로소프트(MS)와 오픈AI 동맹에 균열이 발생할까요? MS는 GPT와 별개의 독자 LLM을 구축 중이란 소식이 나왔고, 오픈AI는 MS 빙과 별도의 자체 검색 서비스를 구축 중이라는 루머가 나왔습니다. 알고보니 GPT-4o였긴 합니다만, 각국에서 반독점 규제가 강해지며 오픈AI와 MS의 거리가 점점 멀어지는 모양입니다.

• 왜 중요하냐면 : AI 분야에서 MS와 오픈AI 간 긴밀한 협력 관계가 무너질 경우, AI는 물론 검색 시장에도 큰 변화가 찾아올 것으로 보입니다. MS는 발 빠른 AX를 통해 애플을 제치고 시총 1위 기업 자리를 탈환한 건 물론, 검색시장에서의 점유율도 2.76%에서 3.64%로 상승시킨 바 있습니다.

• 더 많은 정보 : MS가 개발 중인 LLM 'MAI-1'은 약 5000억 개의 파라미터를 사용함으로써 GPT-3.5보다 뛰어난 성능을 갖출 것으로 보입니다. 오픈AI도 이미 AI 검색 서비스를 위한 웹 사이트 도메인(search.chatgpt.com)을 등록해놨다고 하는데요. 지난 13일에 새로운 검색 서비스에 관한 내용을 발표할 것이란 루머가 나오기도 했지만, 이는 사실이 아닌 것으로 밝혀졌습니다.

• 기억해 둘 것 : 어쩌면 둘의 균열은 규제의 칼날을 피하기 위해서일지도 모릅니다. MS와 오픈AI 간 균열은 EU와 미국 등 각국 정부가 반독점 행보를 강화하면서부터였습니다. EU 집행위는 MS의 오픈AI 투자가 반독점 조사 대상인지 검토하기도 했는데요. 동맹을 강화할 경우 강력한 제재를 받을지도 모르는 상황이기에, 일각에선 의도적으로 각자 갈 길을 가는 게 아니냔 분석도 나옵니다.

MS·오픈AI, LLM·검색서비스 따로 출시 - 매일경제
MS ‘5천억 파라미터’ 준비오픈AI, AI검색 내놓을 듯EU 반독점 조사 가능성에협업 관계 변화 여부 주목

[4] 치지직 정식 출시...스트리밍 플랫폼 경쟁 심화

지난 9일, 네이버의 스트리밍 플랫폼 '치지직'이 정식 출시하며 아프리카TV와 치지직 간 본격적인 승부가 시작됐습니다. 트위치가 국내에서 철수하며 둘 중 어느 곳이 트위치의 파이를 흡수할지가 관건이었는데요. 현재까진 치지직이 트위치 유저를 더 많이 흡수한 듯합니다.

• 왜 중요하냐면 : 트위치가 지난 2월 27일을 끝으로 국내 사업을 철수하며 국내 스트리밍 플랫폼 시장은 아프리카TV와 치지직의 2파전이 됐습니다. 일각에선 이 경쟁 구도가 국내 스트리밍 시장은 물론, K-콘텐츠 시장이 성장할 기회라고 말합니다. 한 업계 관계자는 "네이버가 뛰어들며 그동안 틈새시장으로 여겨지던 국내 스트리밍 시장이 개화기를 맞이했다"고 말하기도 했습니다.

• 더 많은 정보 : 트위치 흡수에 따른 유저 흡수에 있어선 일단 치지직이 승리한 것으로 보입니다. 트위치의 국내 사업 철수 소식이 나오고 치지직의 베타 서비스가 시작한 작년 12월 이후, 치지직은 4달 만에 MAU가 100만 명 가깝게 증가한 반면 아프리카TV MAU는 약 29만 명 증가에 그쳤습니다. 하지만 아프리카TV 유저의 월평균 사용 시간(15.9시간)은 치지직(9.8시간)보다 약 6시간 많기에 매출에 있어선 여전히 치지직이 아프리카TV를 따라잡기엔 갈 길이 멉니다.

• 기억해 둘 것 : 둘의 경쟁은 앞으로 더욱 치열해질 듯합니다. 치지직은 AI 보이스 기술, 카페 연동 등 추가 기술을 선보일 예정입니다. 아프리카TV는 지난 3월 사명을 '숲(SOOP)'으로 바꾸는 등 부정적인 대외 이미지를 개선하기 위해 노력 중입니다. 아프리카TV는 또한 2분기 내에 동남아 시장을 노린 글로벌 플랫폼을 런칭할 계획이라고 밝혔습니다.

‘치지직’ 오늘 정식 서비스 론칭...아프리카TV 턱밑 추격
네이버(NAVER)가 자사 게임방송 스트리밍 플랫폼 ‘치지직’을 9일 정식 론칭했다. 베타 서비스 기간 일부 논란으로 시행착오를 겪었지만, 매듭을 짓고 순조로운 출시를 이어가는 모양새다. 트위치(2월 한국 서비스 종

[5] 애플의 AI 관련 소식 10가지

최근 애플의 AI 소식이 쏟아져 나왔습니다. 'AI칩'이라 불리는 M4를 공개하고, 아이폰과 아이패드에 적용할 AI 서비스 공개를 예고했는데, 드디어 애플이 AI 경쟁에 나섰단 분석이 나옵니다. 사실 작년부터 애플의 AI 관련 소식을 조금씩 접할 수 있었는데요. <매일경제>에서 정리한 지난 1년간 애플의 AI 소식 10가지를 소개합니다.

  1. LLM '아작스(Ajax)' 개발 중 (2023년 7월)
  2. 모든 디바이스와 iOS에 AI 적용 고민 중 (2023년 10월)
  3. 애플 'AI 프레임워크' 및 '모델 라이브러리'와 함께 LLM '페렛(Ferret)' 공개 (2023년 12월)
  4. 생성 AI 학습을 위해 언론사・출판사와 5000만 달러 계약 논의 (2023년 12월)
  5. 애플 멀티모달 AI 모델 'MGIE' 출시 (2024년 2월)
  6. 자동 애니메이션 생성 기술 '키프레이머(Keyframer)' 공개 (2024년 2월)
  7. 개발자 코딩을 돕는 생성 AI 툴 준비 중 (2024년 2월)
  8. 구글 '제미나이(Gemini)'를 아이폰에 도입하기 위해 구글과 협상 중 (2024년 3월)
  9. AI 모델 'MM1' 발표, 이미지 해석 능력에 특화? (2024년 3월)
  10. 애플, 스위스에 AI 비밀 연구소 운영 중? (2024년 4월)
‘애플 AI’ 공개 전 정리한 애플 AI의 흔적들 | 미라클레터 - 매일경제
Newsletter
디지털 시대, 새로운 정보를 받아보세요!
작가와 대화를 시작하세요
더코어 스토어