AI 기업들, 프리미엄 언론사 콘텐츠 의존도 높아
Ziff Davis 연구, AI 기업들의 LLM 학습 데이터 출처 분석 결과 공개
디지털 미디어 업계의 거물 Ziff Davis가 최근 발표한 연구 결과에 따르면, OpenAI, Google, Meta 등 주요 AI 기업들이 대규모 언어 모델(LLM) 학습에 프리미엄 언론사들의 콘텐츠를 공개적으로 인정하는 것보다 더 많이 활용하고 있는 것으로 나타났습니다.
이번 연구 결과는 AI 시대에 고품질 콘텐츠 제작자들의 저작권 보호와 보상 요구에 대한 협상력을 높일 수 있는 중요한 근거가 될 것으로 보입니다.
Ziff Davis의 수석 AI 변호사 George Wukoson과 최고기술책임자(CTO) Joey Fortuna가 작성한 이 보고서는 일부 LLM의 경우, 15개 프리미엄 출판사의 콘텐츠가 학습 데이터셋의 상당 부분을 차지한다고 밝혔습니다.
예를 들어, GPT-2 학습에 사용된 OpenAI의 OpenWebText 데이터셋 오픈소스 복제본을 분석한 결과, 포함된 URL의 약 10%가 연구 대상이 된 15개 프리미엄 언론사(premium publishers)에서 나온 것으로 확인되었습니다.
Ziff Davis는 수천 개의 프리미엄 출판사를 대표하는 업계 단체인 News/Media Alliance(NMA)의 회원사입니다. 이번 연구 결과는 지난해 NMA가 미국 저작권청에 제출한 연구 논문의 결과와 유사한 양상을 보입니다.
NMA의 연구에 따르면, 주요 LLM의 기반이 되는 인기 있는 큐레이션 데이터셋은 Common Crawl이 웹에서 수집한 일반적인 콘텐츠 모음에 비해 "5배에서 거의 100배에 이르는 요인으로" 출판사 콘텐츠를 과도하게 가중치를 두고 있는 것으로 나타났습니다.
Dotdash Meredith나 Condé Nast 같은 대부분의 주요 경쟁 언론사들과 달리, Ziff Davis는 아직 주요 AI 기업과 대규모 데이터 라이선싱 또는 콘텐츠 공유 계약을 체결하지 않았습니다. 이번 연구는 업계 교육과 AI 기업들과의 대화를 위한 기초 자료로 활용될 예정입니다.
Fortuna CTO는 "AI 기업들이 프리미엄 언론사들에 얼마나 많이 의존하고 있는지 알게 되면서, 이 모델들이 세상을 이해하는 방식에 대해 우리가 큰 책임을 지고 있다는 것을 깨달았습니다"라고 말했습니다. 그는 "이제 우리가 발행하는 콘텐츠가 새로운 지능의 교육 기반이 된다는 것을 알게 되었으니, 우리가 발행하는 내용에 더욱 주의를 기울여야 합니다"라고 덧붙였습니다.
보고서는 또한 구형 LLM 학습에 사용된 일부 공개 데이터셋이 현재 새로운 모델 학습에도 여전히 사용되고 있다고 밝혔습니다. 저자들은 프리미엄 언론사 콘텐츠에 대한 불균형적인 의존도가 최신 LLM에도 확장되고 있다고 제안했습니다.
보고서는 "최첨단 모델들의 학습 과정이 비밀로 유지되고 있지만, 우리는 구형 공개 학습 세트가 여전히 새로운 모델에 영향을 미치고 있다는 증거를 발견했습니다"라고 언급했습니다.
현재 대부분의 뉴스 기업들은 AI 기업들과 일회성 수익에 그치는 데이터 학습 계약보다는 실시간 현재 이벤트 쿼리에 답변할 수 있는 생성형 AI 챗봇에 뉴스 콘텐츠를 제공하는 장기 계약에 초점을 맞추고 있습니다.
한편, New York Times가 OpenAI와 Microsoft를 상대로 제기한 주목받는 소송은 언론사의 허가 없이 콘텐츠를 스크래핑하여 AI 모델 학습과 출력에 사용하는 것이 저작권 침해에 해당하는지에 대한 업계 전반의 기준을 정립하는 데 도움이 될 것으로 예상됩니다.
- 추천 태그: #AI학습데이터, #프리미엄콘텐츠, #저작권보호
- 출처 : 액시오스 미디어 트렌드
미 대선, 주요 신문사 대부분 후보 지지 안해
트럼프, 100대 신문사 중 2곳만 지지... 소셜미디어 영향력 주목
미국 대선을 앞두고 주요 신문사들이 대선 후보 지지를 자제하는 이례적인 움직임이 포착됐다. 이는 과거 선거 주기와는 확연히 다른 양상으로, 미디어 환경 변화와 정치적 압박이 주요 원인으로 지목된다.
수치로 보면, 도널드 트럼프 전 대통령은 미국 인쇄 발행부수 기준 상위 100개 신문사 중 단 두 곳의 지지만을 받았다. 뉴욕포스트와 라스베이거스 리뷰-저널이 그 주인공으로, 두 신문사 모두 트럼프의 동맹으로 알려진 인사들이 소유하고 있다.
지난 대선 때 트럼프는 7개 신문사의 지지를 받았다. 그러나 이번에는 아칸소 데모크랫-가제트와 보스턴 헤럴드 등 과거 트럼프를 지지했던 신문사들조차 대선 후보 지지 의사를 밝히지 않았다.
이 같은 변화의 이면에는 미국 신문업계의 구조적 변화가 자리 잡고 있다. 과거 독립적이거나 가족 소유였던 많은 신문사들이 현재는 대형 신문그룹에 속해 있다. 이들의 소유주, 주로 헤지펀드나 사모펀드 그룹들은 정치적 보복이나 반발을 우려해 후보 지지를 중단하기로 결정한 것으로 보인다.
한편, 소셜미디어 시대를 맞아 수백만 명의 온라인 팔로워를 보유한 유명인사들의 지지 선언이 더욱 주목받고 있다. 실제로 인기 팟캐스트 진행자 조 로건이 전날 공식적으로 트럼프 지지를 선언해 화제를 모았다.
이번 대선에서 전통 미디어의 영향력 감소와 소셜미디어를 통한 여론 형성이 어떤 결과로 이어질지 주목된다.
- 추천 태그: #미국대선 #신문사지지선언 #소셜미디어영향력
https://www.axios.com/2024/11/05/presidential-election-newspaper-endorsements
뉴욕타임스의 스포츠 뉴스 브랜드 'The Athletic', 첫 흑자 달성
The Athletic의 흑자 전환: 디지털 미디어의 새로운 이정표
• The Athletic이 2024년 3분기에 처음으로 흑자를 달성했습니다. 이는 2016년 출범 이후 최초의 수익성 있는 분기입니다.
• 뉴욕타임스 컴퍼니가 2022년 1월 5억 5천만 달러에 인수한 이후 2년 반 만에 이루어낸 성과로, 3분기에 260만 달러의 이익을 기록했습니다. 이는 작년 동기 790만 달러 손실에서 크게 개선된 결과입니다. 구독과 광고 수익 증가가 주요 원인으로 분석됩니다.
디지털 구독 모델의 성장
• The Athletic의 3분기 매출은 전년 대비 30% 증가한 4,470만 달러를 기록했습니다. 이 중 70%가 구독 수익이며, 광고가 10%, 기타 수익이 나머지를 차지했습니다.
• 뉴욕타임스 컴퍼니 전체적으로 1,109만 명의 구독자를 확보해 처음으로 1,100만 명을 돌파했습니다. 이 중 46%가 번들 또는 멀티 제품 구독자입니다.
• 번들 구독자의 평생 가치가 더 높다는 점에서, 이러한 구독 모델의 성장은 큰 의미를 갖습니다.
밀레니얼 세대를 겨냥한 콘텐츠 전략
• The Athletic은 NFL과 영국 프리미어리그 시즌 시작과 함께 올림픽 보도에서 강세를 보이며 스포츠 팬들 사이에서 인지도를 높였습니다.
• 주간 방문 구독자 비율이 2020년 이후 최고치를 기록하며, 사용자당 월평균 수익이 9.28달러에서 9.45달러로 증가했습니다.
• 이는 밀레니얼 세대의 관심사와 소비 패턴을 정확히 겨냥한 콘텐츠 전략의 성공을 보여줍니다.
뉴욕타임스의 The Athletic 흑자 전환은 디지털 미디어 산업에서 구독 모델의 가능성을 보여주는 중요한 사례입니다. 특히 밀레니얼 세대를 타겟으로 한 맞춤형 콘텐츠 전략과 번들 구독 모델의 성공은 향후 미디어 기업들의 전략 수립에 중요한 시사점을 제공할 것으로 보입니다.
- 추천 태그: #TheAthletic, #디지털구독, #스포츠미디어, #뉴욕타임스, #밀레니얼
국민 신뢰 회복을 위한 AP 통신의 선거 보도 혁신
AP 통신이 선거 결과 보도 방식을 대폭 개선했습니다. 투명성 강화와 상세한 설명을 통해 유권자들의 신뢰를 되찾으려 노력하고 있습니다.
• 왜 중요하냐면 : 최근 4년간 선거 음모론으로 인해 선거 과정에 대한 국민의 신뢰가 크게 떨어졌습니다. AP 통신은 이에 대응해 단순한 결과 발표를 넘어 선거 과정 전반에 대한 상세한 설명을 제공하기로 했습니다. 이는 유권자들의 이해를 돕고 민주주의 과정의 투명성을 높이는 중요한 시도입니다.
• 큰 그림 : 선거 보도의 패러다임이 결과 중심에서 과정 중심으로 변화하고 있습니다. 미디어의 역할이 단순 정보 전달에서 민주주의 과정 전반에 대한 교육과 설명으로 확대되고 있습니다.
• 더 많은 정보 : [AP 통신은 2024년 미국 대선을 앞두고 설명 중심의 저널리즘을 강화하고 있습니다. 선거 결과의 첫 디지털 생중계를 시작하고, 웹사이트에 선거 과정 전반에 대한 질문에 답하는 전용 허브를 만들었습니다. 또한 'Decision Notes' 섹션을 통해 각 주의 선거일 상황을 상세히 설명할 예정입니다. AP 통신은 이번 선거에서 역대 최대 규모인 5,000명을 투입해 6,800개 이상의 선거 결과를 발표할 계획입니다.]
• 기억해 둘 것 : [AP 통신의 이러한 노력은 선거 과정의 투명성을 높이고 허위 정보의 확산을 막는 데 도움이 될 것으로 기대됩니다. 미국 대선의 규모와 복잡성을 고려할 때, 선거일 당일 밤이나 다음날 아침에 결과를 알 수 있다는 것은 놀라운 일입니다. 유권자들이 이러한 과정을 이해하고 신뢰하는 것이 건강한 민주주의를 위해 매우 중요합니다.]
- 추천 태그 : #선거보도혁신, #민주주의투명성, #미디어의역할
뉴욕타임스 테크 길드, 대선 당일 파업으로 60년 만의 역사 쓰다
• 뉴욕타임스 테크 길드 소속 직원 수백 명이 오늘 아침 계약 협상 지연과 불공정 노동 관행에 항의하며 파업에 돌입했어요. 이번 파업은 60년 만에 처음으로 대통령 선거일과 맞물려 일어난 NewsGuild-CWA 소속 노조의 파업이라 더욱 주목받고 있죠. 엔지니어링, 제품, 기술, 디자인 분야에서 일하는 약 600명의 직원들이 테크 길드를 구성하고 있는데요, 이들의 파업이 선거 보도에 어떤 영향을 미칠지 관심이 쏠리고 있어요.
• 파업에 참여한 직원들은 모바일 푸시 알림, 앱과 웹사이트 유지보수, 실시간 선거 결과 인포그래픽 등 선거 보도에 핵심적인 편집 제품들을 담당하고 있어요. 뉴욕타임스 측은 이미 파업으로 인해 유명한 선거일 바늘(Election Day needle)의 실시간 버전 발행이 어려워질 수 있다고 경고했죠. 하지만 회사 측은 파업이 "잘못된 판단"이며 "생산적이지 않다"고 주장하면서, 파업이 더 나은 계약으로 이어지지 않을 것이라고 강조했어요.
• 테크 길드의 노조 조직자들은 이번 계약 협상을 통해 다른 테크 노조들을 위한 선례를 만들고자 해요. 그래서 임금 외에도 원격 근무권과 특별한 정당한 사유 보호 등 더 많은 보호 조항을 계약에 포함시키기 위해 노력하고 있어요. 이번 파업은 단순히 임금 문제를 넘어 테크 업계 노동자들의 권리와 근무 환경 개선을 위한 중요한 움직임으로 볼 수 있어요. 앞으로 이 파업이 어떤 결과를 가져올지, 그리고 다른 기업들에는 어떤 영향을 미칠지 지켜볼 필요가 있겠죠.
https://www.axios.com/2024/11/04/nyt-tech-workers-strike-ahead-of-election-day