2024년 대학입시가 며칠 전 막을 내렸는데 대학입시 문제로 인공지능(AI)의 능력을 시험하는 것이 인터넷 인기화제가 되였다. 작문제목을 입력하면 10초 만에 작문이 한편 나오고 수학문제를 내면 2분만에 답안을 써내는데 이런 답안은 몇점이나 맞을 수 있을가? ‘령혼’이 담겨있을가?
AI로 작성한 답안, 몇점이나 맞을 수 있을가?
수학문제:과학기술미디어 TechWeb은 국내외 AI 대모델을 사용해 전국Ⅰ권의 수학문제 2개를 해답했다.
정확도는 ChatGPT가 100%였고 바이트 떠우바오(字节豆包), 바이샤오잉(百小应), 바이두 문심일언(百度文心一言)이 50%였으며 알리 통의천문(阿里通义千问), 텐센트 원보(腾讯元宝), 구장대모델(九章大模型)이 0%였다.
어문문제:여러가지 매체가 국내 AI 대모델로 전국Ⅰ권의 작문을 생성하였다. 작문제목은 “인터넷, 인공지능의 응용이 보급됨에 따라 점점 더 많은 문제가 빠른 답안을 얻게 되였다. 그럼 우리의 문제가 점점 더 적어질가?”였다. 극목뉴스가 유명한 어문교원을 초청하여 채점한 결과 만점 60점에서 바이트떠우바오가 60점, 알리 통의천문이 48점, 바이두 문심일언이 46점, 텐센트 혼원(腾讯混元)이 40점을 받았다.
구패뉴스(九派新闻)가 전문가를 초청해 평가한 결과 장점은 대학입시 작문의 기본요구에 부합되고 매사를 온당하게 표현했으며 각 방면을 잘 고려한 것이였으나 단점은 독특한 인식이 없고 론증공간에서 산발적인 사유가 부족한 것이였다.
총결:AI대모델이 읽었던 책이 우리보다 많을 수 있지만 그의 신경네트워크모델은 진정한 인류의 대뇌보다 아직까지 비교적 큰 차이가 있다. 이는 AI가 매우 박식하고 많은 자료를 응용하여 증명할 수 있어보이지만 제목을 리해하고 창조적 사유를 하는 방면에서는 단점이 뚜렷하다는 것을 결정한다.