💡
GPT-4는 대략 인공일반지능(AGI) 수준에 도달했다고 평할 수 있을까요? 어느 정도 능력이면 AGI라고 부를 수 있을까요? 사실 인간의 지능에 버금가는 인공지능이 탄생했다는 걸 정량적으로 측정한다는 건 상당히 어렵습니다. 지능이 무엇인가에 대한 정의도 저마다 다르기 때문이죠. 이 논문(혹은 백서)는 이러한 관점에서 도전적인 연구를 진행했다고 합니다. 그것도 GPT-4를 대상으로 말이죠.

논문의 발표일자는 3월22일. 한국 시간으로 하면 대략 3월23일쯤 될 겁니다. OpenAI의 도움을 얻어 미리 사용하고 평가하고 연구했다고 하네요. 제가 읽어보기에 흥미로웠던 부분은 가장 마지막 결론부에 있는 8가지 제안입니다. GPT-4가 AGI가 되려면 해결해야 할 8가지 과제를 제시했는데요. 아주 어렵지는 않으니 꼭 한번 읽어보시면 좋겠습니다. 역으로 GPT-4의 한계를 이해할 수 있기 때문이기도 합니다.

원 논문은 첨부 자료를 포함해 150페이지가 넘습니다. 제 능력으로 영문으로 된 이 논문을 모두 읽기는 벅찼습니다. 그래서 중요한 챕터만 미리 읽고 번역을 해보았습니다. DeepL의 도움을 받긴 했지만 여전히 부족한 지점이 많아서 보정, 보완도 했답니다. 매일매일 쏟아지는 GPT 소식, 깊게 이해하고 싶은 분이라면 일단 이 번역본이라도 한번 읽어보시길...

- 더코어 미디어 에디터 이성규 드림. 

인공일반지능(AGI)의 스파크 : GPT-4의 초기 실험

초록

인공지능(AI) 연구자들은 다양한 영역과 작업에서 놀라운 능력을 발휘하는 대규모 언어 모델(LLM)을 개발하고 개선하여 학습과 인지에 대한 우리의 이해에 도전해 왔습니다. OpenAI가 개발한 최신 모델인 GPT-4 [Ope23]는 전례 없는 규모의 컴퓨팅과 데이터를 사용하여 학습되었습니다. 이 논문에서는 OpenAI가 아직 개발 중이던 GPT-4의 초기 버전에 대한 조사 결과를 보고합니다. 우리는 (이 초기 버전의) GPT4가 이전의 AI 모델보다 더 일반적인 지능을 보여주는 새로운 LLM 코호트(예: ChatGPT 및 Google의 PaLM)의 일부라고 주장합니다. 이러한 모델의 향상된 기능과 의미에 대해 논의합니다. GPT-4는 언어에 대한 숙달을 넘어 수학, 코딩, 시각, 의학, 법률, 심리학 등을 아우르는 새롭고 어려운 과제를 특별한 지시 없이도 해결할 수 있음을 입증했습니다. 게다가 이러한 모든 작업에서 GPT-4의 성능은 인간 수준의 성능에 놀라울 정도로 근접했으며, ChatGPT와 같은 이전 모델을 크게 능가하는 경우가 많았습니다. GPT-4의 기능의 폭과 깊이를 고려할 때, 저희는 이를 인공일반지능(AGI) 시스템의 초기(아직 불완전한) 버전으로 합리적으로 볼 수 있다고 생각합니다. GPT-4에 대한 탐구에서 우리는 그 한계를 발견하는 데 특히 중점을 두었으며, 다음 단어 예측을 넘어서는 새로운 패러다임을 추구해야 할 필요성을 포함하여 보다 심층적이고 포괄적인 버전의 AGI로 발전하기 위한 앞으로의 과제에 대해 논의합니다. 마지막으로 최근의 기술 도약이 사회에 미치는 영향과 향후 연구 방향에 대한 성찰로 마무리합니다.