[번역] 생성 AI는 기자 업무와 책임 어떻게 바꿀까

💡
닉 디아코풀러스 노스웨스턴대 커뮤니케이션학부 교수는 특별합니다. 컴퓨터과학으로 박사를 받고 저널리즘 학부에서 학생들을 가르치고 연구합니다. 그의 저서 'Automating the News'는 그이기에 쓸 수 있었다고 생각합니다. 컴퓨터과학자가 저널리즘을? 그래서 그의 연구 대부분은 뉴스와 관련한 알고리즘과 AI에 대한 것들입니다. 현재까진 특이한 이력을 지닌 분입니다.

그가 안식년을 맞아서 '뉴스룸 내 AI'라는 프로젝트를 진행하고 있습니다. 그 일환으로 생성 AI를 언론사들이 어떻게 활용하고 있는지 조사하고 분석하고 있습니다. 때마침 ChatGPT가 언론 산업에도 상당한 영향을 미치고 있는 상황이라 여건도 나쁘지 않습니다. 최근 이 프로젝트 등과 관련해서 토우센터와 인터뷰를 했는데요. 'How Can Generative AI Help Journalists?'라는 제목으로 그의 블로그에 발행됐습니다. 그의 허락을 구하지 않고 감히 번역해 봤습니다. 나중에 따로 허락을 구해볼게요. [미디어 에디터 이성규]

닉 디아코풀러스 교수(출처: 닉 디아코풀러스 홈페이지)

SG: 프로그래밍을 처음 접하는 기자나 학생에게 ChatGPT가 계산 작업에 얼마나 유용하다고 생각하시나요?

ND: 저도 사용자로서 ChatGPT가 특정 종류의 프로그래밍 문제를 해결하는 데 확실히 유용하다는 것을 알게 됐습니다. 하지만 프로그래밍을 이해하고 올바른 쿼리를 작성한 다음 실제 솔루션으로 응답을 종합할 수 있으려면 이미 프로그래밍에 대한 상당한 수준의 역량이 필요하다는 것도 알고 있습니다. 기본 사항, 응답을 평가하는 방법, 종합하는 방법을 알고 있다면 중급 코더에게 유용할 수 있습니다. 하지만 코드를 읽는 방법을 모른다면 응답을 제공할 뿐, 실제로 원하는 대로 작동하는지 알 수 없습니다.

프로그래밍 언어가 있는 데에는 이유가 있습니다. 문제를 해결해야 하는 방법을 코드로 정확하게 표현해야 하기 때문입니다. 반면 자연어로 말하면 모호한 부분이 많습니다. 따라서 ChatGPT는 질문의 의미를 명확히 파악하고 원하는 코드를 제공하는 데 능숙하지만, 항상 정확하지는 않을 수 있습니다.

SG: 저널리즘 전공 학생들이 과제를 위해 ChatGPT를 사용할 경우 기초적인 지식 습득 능력을 상실하게 되는 건 아닌지 궁금합니다. 학생들이 프로그래밍 방법을 배울 때 ChatGPT에 의존하는 것보다 처음부터 코드를 작성하는 방법을 배우는 것이 더 낫다고 생각하나요?

ND: 제가 이 문제를 바라보는 한 가지 관점은 AI의 대체 vs 상보성입니다. AI가 사람의 노동력을 대체한다고 하면 사람들은 두려워합니다. 하지만 실제로는 AI가 전문가의 노동력을 보완하는 경우가 대부분입니다. 즉, 이미 전문가인 사람이 있고, 그 사람에게 AI가 결합하여 더 똑똑하고 효율적으로 일할 수 있도록 보충해 주는 것이죠. ChatGPT는 코딩에 대해 어느 정도 알고 있는 인간 코더를 보완할 수 있는 훌륭한 도구이며, 코더의 능력을 가속화할 수 있다고 생각합니다.

[얼리버드 + 책 포함] 더코어 컨퍼런스 - ChatGPT와 AI혁명 & 빅 체인지 6
* 연사 가운데 성영아님은 일본에 주재중인 바, 당일 온라인으로 연결해 진행 예정입니다. ** 행사 참석증(또는 수료증)이 필요하신 분은 별도로 요청주시면 발행해 드립니다. [도서 안내 - 생성 AI 혁명]이번 컨퍼런스는 더코어의 비즈니스 에디터 강정수박사팀에서 AI혁명과 관련한 책을 출간하면서 정리한 내용을 토대로 현장 강연도 기획하면서 마련됐습니다. 지금 구매하신 상품은 컨퍼런스 티켓과

SG: 기자들이 뉴스룸 내에서 ChatGPT를 어떻게 사용했는지에 대한 사례 연구를 제출할 수 있는 '뉴스룸의 AI'라는 프로젝트를 시작하셨어요. 이 프로젝트는 어떻게 진행되고 있나요?

ND: 다양한 수준의 아이디어를 가진 12명 이상의 사람들과 연락을 주고받았습니다. 지역 뉴스 미디어, 전국 미디어, 글로벌 미디어, 지역 출판물, 스타트업 등 다양한 유형의 조직에서 참여했습니다. 기술을 탐구하고 특정 사용 사례에서 기술을 어디까지 활용할 수 있는지 확인하는 데 관심이 있는 다양한 사람들이 참여하고 있습니다. 저는 안식년을 보내고 있는 암스테르담 대학교 정보법 연구소에서 몇몇 법학자들과 교류하고 있습니다. 그들은 저작권과 사용 약관 문제를 검토하고 있는데, 이는 실무자들이 알아야 할 매우 관련성이 높고 중요한 문제라고 알고 있습니다.

또한 저는 이 기술을 통해 다양한 활용 사례를 직접 탐구하고 있습니다. 이에 대한 블로그를 작성하고 파일럿 프로젝트를 공개하여 커뮤니티의 사람들을 돕고 기능과 한계가 무엇인지 이해하기 위해 노력하고 있습니다. 전반적으로 이 프로젝트에 매우 만족하고 있습니다. 잘 진행되고 있다고 생각합니다. 다음 달에는 이러한 프로젝트 중 일부가 어느 정도 숙성되어 공개될 수 있기를 바랍니다.

SG: 기자들이 제출하는 내용(활용 사례)을 살펴보니 뉴스룸에서 ChatGPT가 어떤 작업을 지원하는 데 도움이 될 수 있는지, 더 직관적으로 알 수 있을까요?

ND: 사람들이 탐구 중인 활용 사례는 정말 다양합니다. 정말 잘하는 분야가 단 한 가지만 있을지조차도 잘 모르겠습니다. 사람들은 콘텐츠 재작성, 요약 및 개인화, 뉴스 검색, 번역, 참여형 저널리즘에 대해 탐구하고 있었습니다. 저는 이 프로젝트의 매력 중 하나가 바로 이러한 범위를 탐구하는 것이라고 생각합니다. 몇 달 안에 이러한 프로젝트가 성숙해져서 더 많은 피드백을 받을 수 있기를 바랍니다. 저는 사람들에게 사용 사례를 평가해 보도록 독려하고 있습니다. 예를 들어, 워크플로의 일부로 배포해도 될 만큼 정확하고 안정적으로 작동하는지는 어떻게 알 수 있을까요?

SG: 컴퓨테이셔널 저널리스트들이 주로 우려하는 것은 ChatGPT가 때때로 데이터를 '환각/착각'(hallucinate)한다는 것입니다. 예를 들어 PDF에서 데이터를 추출할 때 첫 페이지에서는 모든 것이 정상적으로 작동할 수 있습니다. 하지만 2,000개의 PDF로 이 작업을 수행하면 갑자기 오류가 여기저기 흩어집니다. 이러한 위험을 어떻게 극복할 수 있을까요?

ND: 정확성은 저널리즘의 핵심 가치입니다. AI 시스템과 머신러닝 시스템에는 통계적 불확실성 요소가 있기 때문에 기본적으로 100% 정확도를 보장하는 것은 불가능합니다. 따라서 가능한 한 정확한 시스템을 구축해야 합니다. 하지만 결국에는 이것이 저널리즘의 핵심 가치이고 노력해야 할 부분이지만, 100% 정확성을 보장해야 하는지 여부는 AI 시스템에서 생성된 정보를 사용하여 어떤 종류의 주장(claim)을 하려는지에 따라 달라집니다.

따라서 수많은 PDF 문서를 분석하여 사기를 저지른 사람을 식별하는 시스템을 원한다면, 그리고 그러한 문서 분석을 바탕으로 해당 개인을 공개적으로 고발할 계획이라면, 그 정확성이 매우 높아야 합니다. 수년간 언론인들과 이런 사안에 대해 이야기해 본 결과, 언론인들이 머신러닝 도구에만 의존해 증거를 찾으려 하지는 않을 것이라고 생각합니다. 그것을 출발점으로 사용할 수 있습니다. 하지만 그 다음에는 다른 증거 자료와 함께 삼각검증해서 확실성을 높일 것입니다.

하지만 큰 추세를 보고 있는 경우라면 2%의 오류율이든 5%의 오류율이든 크게 중요하지 않은 다른 사용 사례도 있을 수 있습니다. 추세가 너무 커서 5%의 오류율로 약간의 오류가 있어도 추세가 숨겨지지 않을 수도 있습니다. 따라서 사용 사례와 그 사용 사례가 얼마나 많은 오류를 허용할 수 있는지에 대해 생각하는 것은 중요합니다. 그런 다음 이 생성 AI 도구가 얼마나 많은 오류를 생성하는지를 파악할 수 있습니다. 내가 주장하고자 하는 종류의 증거를 생성하는 데 있어 이 도구가 실제로 내 요구 사항을 충족하는지도 볼 수 있고요.

SG: 향후 저널리스트를 대상으로 책임감 있게 AI를 사용하는 방법에 대한 일종의 AI 수업이나 튜토리얼을 구상하고 있나요?

ND: 사람들이 자동화에 전적으로 의존할 수 있다고 느끼게 되는 미래의 상황은 피하고 싶습니다. 사람이 직접 출력물을 확인해야 하는 상황과 확인하지 않아도 되는 상황에 대한 견고하고 빠른 규칙이 있을 수 있습니다. 하지만 저는 그 두 극단 사이에 많은 부분이 있다고 생각합니다. 전문직 저널리스트 협회에서는 다양한 유형의 저널리즘 윤리에 대한 사례 연구와 성찰을 담은 '미디어 윤리'라는 책을 발간하고 있습니다. 이 책에 어떤 상황에서 더 많은 문제가 발생할 수 있고 어떤 상황에서 더 적은 문제가 발생할 수 있는지 분석하기 위해 AI에 대한 챕터가 필요하다는 식으로 생각해 보면 흥미로울 수 있습니다.

정확성이나 해를 끼치지 않는다는 원칙과 같은 저널리즘의 핵심 원칙이 있는 지금과 크게 다르지 않을 수도 있습니다. 정보를 게시할 때 목표는 정보의 공익적 가치와 무고한 사람에게 미칠 수 있는 잠재적 피해의 균형을 맞추는 것입니다. 따라서 이 두 가지를 균형 있게 고려해야 합니다. 인공지능이나 생성 AI가 무언가를 요약하는 과정에서 발생할 수 있는 오류에 대해 생각할 때, 이러한 종류의 기준집합(rubric)을 적용하는 것이 합리적일 수 있습니다. 예를 들어, 이 오류로 인해 발생할 수 있는 잠재적 피해는 무엇인가요? 해당 정보로 인해 누가 피해를 입을 수 있나요? 해당 정보로 인해 어떤 피해가 발생할 수 있나요?

[얼리버드] 더코어 컨퍼런스 - ChatGPT와 AI혁명 & 빅 체인지 6
* 연사 가운데 성영아님은 일본에 주재중인 바, 당일 온라인으로 연결해 진행 예정입니다. ** 행사 참석증(또는 수료증)이 필요하신 분은 별도로 요청주시면 발행해 드립니다. [안내 - ‘생성AI혁명’ 도서] 이번 컨퍼런스는 더코어의 비즈니스 에디터 강정수박사팀에서 AI혁명과 관련한 책을 출간하면서 정리한 내용을 토대로 현장 강연도 기획하면서 마련됐습니다. 현재 예약판매중인 아래의 책을 구매하고 현장 강연도

SG: 네, 기자도 데이터를 다룰 때 오류를 범하죠.

ND: 하지만 차이점이 있는데, 그것은 책임 문제로 돌아옵니다. 사람이 실수를 하면 책임 소재가 매우 명확합니다. 누군가는 자신의 프로세스를 설명하고 왜 이 부분을 놓쳤는지, 왜 실수를 했는지 깨달을 수 있습니다. 그렇다고 AI가 책임을 져서는 안 된다는 말은 아닙니다. 다만 AI 시스템을 거친 인간의 책임을 추적하는 것이 훨씬 더 복잡하다는 것입니다.

만약 생성 AI 시스템이 요약에서 오류를 범했다면, 그 AI 시스템을 만든 Open AI를 비난할 수 있습니다. 하지만 이 시스템을 사용할 때는 사용 약관에 동의하고 아웃풋 정확도에 대한 책임도 져야 합니다. 따라서 Open AI는 사용자의 책임이라고 말하며 책임을 사용자에게 전가합니다. 그들은 실수에 대한 책임을 지고 싶어하지 않습니다. 그리고 계약상으로는 사용자가 책임을 져야 할 의무가 있습니다. 이제 여러분의 문제입니다. 해당 도구를 사용하는 언론사나 뉴스 조직처럼 책임을 지고 책임을 질 의향이 있으신가요?

SG: 기자가 오류를 되짚어봐야 할 경우에 직면했을 때 AI를 어떻게 사용했는지 추적할 수 있을까요?

ND: 좋은 질문입니다. 프롬프트를 추적하는 것도 한 가지 방법이 될 수 있습니다. 기술 사용자로서 기술을 사용하는 데 있어 자신의 역할이 무엇이었는지를 파악할 수 있습니다. 기술에 대한 프롬프트를 사용할 때 매개변수는 무엇이었을까요? 그것이 적어도 출발점입니다. 따라서 내가 프롬프트에서 무책임한 행동을 했다면 과실의 예가 될 수 있습니다. 예를 들어, 문서를 요약하라는 프롬프트에 온도값(temperature)을 0.9t로 설정했다고 하면, 온도값이 높으면 아웃풋에 무작위성이 훨씬 더 많다는 뜻이 됩니다.

이러한 모델을 사용하려면 이 점을 알아야 합니다. 온도값을 높게 설정하면 출력에 훨씬 더 많은 노이즈가 발생한다는 것을 알아야 합니다. 따라서 출력에 오류가 발생하면 사용자가 어느 정도 책임을 져야 할 수도 있습니다. 출력의 무작위 가능성을 줄이기 위해 온도를 0 또는 훨씬 낮게 설정했어야 할 수도 있습니다. 사용자로서 프롬프트를 표시하는 방법과 선택하는 매개변수에 대해 책임을 져야 하며, 기술 사용 방법을 설명할 준비가 되어 있어야 한다고 생각합니다.


현업 리더들이 직접 전망하는 생성 AI 혁명과 빅체인지 : 4월6일 오후 2시 개최

코어 컨퍼런스 - ChatGPT와 AI혁명 & 빅 체인지 6

ChatGPT 등 생성 AI가 바꿔나갈 6가지 분야 '산업구조, 검색, 일자리, 교육, 마케팅, 의료'의 변화 양상을 현업 리더들이 직접 분석하고 전망합니다. 6개 분야에 속한 종사자분들이라면 자신의 입지와 위상이 어떻게 바뀌게 될지 현장에서 직접 들어보세요. 현업 리더들이 직접 들려주는 컨퍼런스이기에 훨씬 유익할 것입니다.

Newsletter
디지털 시대, 새로운 정보를 받아보세요!
작가와 대화를 시작하세요
더코어 스토어