거대언어모델은 덧붙이고 첨삭이 가능한 확률론적 라이브러리입니다. 텍스트 프롬프트를 통해 데이터베이스에 존재하는 모든 패턴을 다른 패턴과 결합하여 새로운 리믹스를 만들 수 있습니다. 때문에 저작권법의 근본적인 방향 전환이 필요합니다.
생성 AI 시대에 전통적 지적 재산과 저작권 개념은 급격한 변화에 직면해 있습니다. 생성 AI 시스템을 제공하는 AI 기업을 상대로 한 첫 번째 소송은 예술과 창의성이 정확히 무엇이며, 이를 보호하고 장려해야 하는 이유는 무엇인지 그리고 어떤 방식으로 보호하고 장려해야 하는지에 대한 근본적인 질문을 제기하고 있습니다. 2023년 1월 중순 Getty Images는 영국에서 그리고 2월 초에는 미국에서 Stability AI에 대한 첫 번째 법적 조치를 시작했습니다. 이전에는 세 명의 아티스트가 스테이블 디퓨전이 자신들의 저작권을 침해했다며 소송을 제기한 바 있습니다.
지식을 증식하는 도서관
AI와 저작권 논의(1): 인공지능의 정의를 찾다에서 소개한 것처럼 버클리 대학교 앨리슨 고프닉(Alison Gopnik) 교수는 생성 AI 모델을 지식에 접근하고 지식을 증식하는 도서관과 같은 문화 기술이라고 정의합니다. 생성 AI는 로봇 사서에게 원하는 책을 설명하면 로봇 사서가 적합한 책을 골라주는 (확률적) 도서관이라고 설명할 수 있습니다. 확률적 도서관은 덧분이고 첨삭이 가능한 훈련 데이터의 데이터베이스입니다. 생성 AI는 패턴 인식을 통해 학습 데이터의 다양한 특성을 학습하고 이를 소위 가중치로 저장하며, 파라미터 또는 매개변수를 통해 제어할 수 있습니다. 스테이블 디퓨전의 경우 8억 7천만 개의 파라미터가 있으며, 챗GPT의 경우 1750억 개의 파라미터가 있습니다. GPT 4.0은 무려 100조에 이르는 파라미터를 가지고 있습니다. 예를 들어 파블로 피카소의 그림에 대한 AI 모델을 만들면 거대언어모델은 학습 데이터에서 인식한 패턴을 붓질, 색채, 비율 등의 스타일에 대한 패턴으로 저장합니다. 이를 텍스트 프롬프트를 통해 차례로 제어할 수 있으며, 가칭 ‘피카소 AI’에서 거장의 스타일로 그림을 그리려는 사람이 '꽃병', '꽃', '과일', '피카소'에 대한 파라미터 또는 매개변수를 활성화하면 ‘피카소 AI’가 데이터베이스에 있는 이러한 패턴의 가중치에 따라 정물화를 만듭니다. 싸이(PSY) 음악 스타일로 볼빨간사춘기 가사를 리믹스할 때도 챗GPT에서 같은 일이 일어납니다. 생성 AI의 이러한 분자적 보간-interpolative: 덧붙이고 첨삭하기- 리믹스 원리가 바로 기존 저작권 시스템에 엄청난 폭발력을 불러일으키는 것입니다.