지난글에는 ChatGPT와 같은 생성 AI가 뉴스를 학습데이터로 사용했을 때 저작권 침해 여부를 다뤘습니다. 대략의 결론은 '공정 이용'(fair use) 범위에 포함될 확률이 높다는 것이었죠. 하지만 유료장벽 즉 페이월 뒤에 감춘 뉴스 콘텐츠를 허락없이 기계학습 용으로 사용할 경우 여러 측면에서 보상의 여지들이 존재한다는 걸 말씀드린 적이 있습니다.
오늘은 생성 AI가 제작한 문장과 내용(output)이 언론사 등의 저작권을 침해할 가능성을 알아보려고 합니다. 때마침 실증한 논문(Foundation Models and Fair Use)이 발표되면서 참고할 만한 사례가 많아졌습니다. 이 논문을 중심으로 가능성을 확인해 보도록 하겠습니다. 언론사 내에서 비즈니스 전략 등을 담당하는 리더라면 꼭 한번 참고해 보시길 바랍니다.
일반적으로 생성 AI가 작성한 콘텐츠가 '공정 이용'의 범위에서 벗어나는 경우는 대체로 2가지로 요약할 수 있습니다.