언론사가 개발한 첫번째 거대언어모델(LLM), 블룸버그GPT. 이것의 등장은 사실 충격에 가까웠습니다. '언론사도 거대언어모델 경쟁에 뛰어들 수 있는 건가?'라는 희망의 메시지를 던진 셈이어서입니다. 자체 모델 개발을 위해서는 막대한 비용과 학습 데이터가 필요하기에 언론사들은 기 구축된 언어모델을 변형, 응용 하는 수준에서 도입 검토를 해온 것이 사실입니다. 하지만 블룸버그GPT의 등장은 언론사들도 이 경쟁에서 의미있는 위치를 확보할 수 있다는 자신감을 불어넣었습니다. 당연히 국내 일부 언론사들도 관심을 보이기도 했고요.
블룸버그GPT처럼 자체 거대언어모델을 가지려면 어떤 조건이 필요한지를 살펴보면서, 국내 언론사의 시도 가능성을 한번 점쳐 보겠습니다.
어떤 모델에서 시작했나 : BLOOM
블룸버그GPT는 그 이름에서부터 GPT 모델을 연상시킵니다. GPT는 정확히는 Generative Pre-trained Transformer,즉 생성형 사전학습 트랜스포머의 약자입니다. 이젠 GPT가 고유명사인지 보통명사인지 헷갈리는 상황까지 왔는데요. 생성을 목적으로 사전학습된 트랜스포머 모델이라면 GPT란 단어를 써도 크게 문제는 없어 보입니다. 블룸버그 GPT도 이러한 맥락에서 사용된 용어입니다.