예정됐던 대로, 네이버가 대규모 언어모델 '하이퍼클로바'를 정식으로 발표했습니다. 언론사들은 그것의 의미와 가치를 앞다퉈 보도하고 있지만 정작 자신들이 어떻게 활용해야 할 것인가에 대해서는 조금은 관심이 소홀한 것 같습니다. 간단하게 활용할 방법 등에 대해 짧게 소개를 해볼까 합니다.
하이퍼클로바와 GPT-3, 판구 알파 비교
일단 하이퍼클로바를 개발한 네이버 측에 박수를 보내는 것으로 시작하는 게 좋겠습니다. GPT-3가 발표된 이후 국내 많은 개발자들이 그것의 성능을 테스트하기 위해 부단히 애를 썼습니다. 일부 전문가는 API 접근권을 얻은 뒤 한국어 작성 성능을 테스트하기 위해 여러 형태로 시연해 보이기도 했죠. 아시다시피 GPT-3는 영문 데이터를 학습 기반으로 삼았기에 한글 작성 능력은 평가하기가 쉽지 않았습니다. 다양한 애플리케이션에 적용하는 사례들이 나오고 있지만 정작 국내 사례가 등장하지 않는 이유도 이와 관련이 깊습니다.
하이퍼클로바는 한국어에 특화된 대규모 언어모델입니다. 네이버 쪽이 직접 밝힌 바 있듯, 그들의 성능 평가 목표는 하이퍼클로바가 '모델이 작성한 문장은 얼마나 유창한가'에 맞춰져 있었습니다. 언어모델이 생성한 문장들을 보면 동어반복이 많은 편입니다. 같은 의미의 여러 어휘를 활용해 유려한 문장을 만들어내는 인간과 달리 기계는 그러한 변용에 취약한 편이었죠. 그리고 그러한 글을 잘 썼다라고 평가하지 않습니다. 네이버는 '유창함'의 정의를 대략 이를 극복하는 의미로 사용을 하고 있었습니다.