지난글에는 ChatGPT와 같은 생성 AI가 뉴스를 학습데이터로 사용했을 때 저작권 침해 여부를 다뤘습니다. 대략의 결론은 '공정 이용'(fair use) 범위에 포함될 확률이 높다는 것이었죠. 하지만 유료장벽 즉 페이월 뒤에 감춘 뉴스 콘텐츠를 허락없이 기계학습 용으로 사용할 경우 여러 측면에서 보상의 여지들이 존재한다는 걸 말씀드린 적이 있습니다.

오늘은 생성 AI가 제작한 문장과 내용(output)이 언론사 등의 저작권을 침해할 가능성을 알아보려고 합니다. 때마침 실증한 논문(Foundation Models and Fair Use)이 발표되면서 참고할 만한 사례가 많아졌습니다. 이 논문을 중심으로 가능성을 확인해 보도록 하겠습니다. 언론사 내에서 비즈니스 전략 등을 담당하는 리더라면 꼭 한번 참고해 보시길 바랍니다.

ChatGPT 등 LLM이 저널리즘과 수익 향상에 기여할 수 있는 이유
WSJ의 이용약관 위배 소송 준비 :ChatGPT의 개발사 오픈AI를 향한 언론사들의 소송 움직임이 본격화하고 있습니다. 월스트리트저널을 비롯해 CNN 등이 내부적으로 소송을 검토하고 있는 것으로 블룸버그가 보도했습니다. 이 움직임이 언론계 전반으로 확산될지는 아직 확신하기 어렵습니다만 둘 간의 새로운 관계를 구성할 모멘텀이 될 것으로 저는 보고 있습니다. 그 이유를 차근차근 설명을 드리도록 하겠습니다.

일반적으로 생성 AI가 작성한 콘텐츠가 '공정 이용'의 범위에서 벗어나는 경우는 대체로 2가지로 요약할 수 있습니다.