2025년 한국 정부는 초중고 영어, 수학 그리고 정보 과목에 인공지능 교과서(?)를 도입하기로 결정했습니다. 그 교과서가 어떤 내용으로 구성될지, 이 때 학생 수행 평가의 기준과 방식은 어떻게 될지 등에 대해서는 아직 정해진바 없습니다. 쉽게 이야기해서 영어, 수학 그리고 정보 과목 시험에서 챗GPT의 도움을 어느 정도 받을 수 있을지 결정되지 않았습니다. 이 글은 전통적인 시험이 AI 시대에 어떤 유의미성을 가지고 있는지 따져보려 합니다.

존재하는 모든 (전통) 시험을 챗GPT가  통과하는 일이 벌어진다해도 놀라운 일이 아닙니다. 대표적으로 GPT-4는 다양한 시험에서 좋은 성적을 거두고 있습니다. 미국 변호사 시험에서는 GPT-4의 점수가 상위 10%안에 들었습니다. 악명 높은 미국 대학 입학 시험(College Admissions Tests)에서도 결과는 비슷했습니다. 인공지능에게 이들 시험은 장난에 불과합니다.

물론 이 시험 실험의 진행 조건이 실험실이 아닌 다른 조건과 같은지 여부 또는 실험실이 아닌 조건에서도 GPT-4가 우수한 성적으로 각종 시험을 통과할 수 있을지 여부에는 의문의 여지가 남아있습니다. 그러나 이러한 조건을  논하는 것은 20미터 높이의 장애물을 뛰어넘은 슈퍼 로봇에게 출발선을 조금 넘어서 뛰어넘기 시작했다고 나무라는 것과 같습니다.

교육기관이 (초중고등) 학생의 능력과 지능을 평가하는데 이용되는 과제 또는 문제에 있어 인공지능은 매우 능숙하다는 점은 부정할 수 없는 사실입니다. 그리고 인공지능의 능력은 매우 빠른 속도로 진화하고 있습니다. 비영어권 시험에서는 인공지능의 정확도가 떨어진다는 문제가 여전히 남아있지만 이 또한 곧 해결될 것입니다.