구글과 오픈AI 인공지능(AI)이 국제수학올림피아드(IMO)에 이어 국제대학프로그래밍콘테스트(ICPC)에서 금메달을 획득했다. AI가 세계 최상위 프로그래머 급 성적을 낸 것이다. AI 완성도가 급속도로 높아지며 AI 교육을 위해 고용된 전문가들은 “가르칠 게 없다”는 한탄을 내놓고 있다고 한다. 여기에 구글은 AI 에이전트용 결제 표준까지 내놓으며 사람보다 뛰어난 AI가 일상 생활을 보조하는 ‘개인 집사’로 진화하고 있다는 평가가 따른다.
17일(현지 시간) 구글 딥마인드는 제미나이 2.5 딥싱크 고급버전이 ICPC 2025에 정식 참가해 12개 문제 중 10개를 풀어 금메달을 받았다고 밝혔다. 139개 참가 팀 중 4개 팀만이 금메달을 획득했고, 제미나이는 2위를 기록했다. ICPC는 단순 ‘코딩’이 아닌 문제 해결을 위한 알고리즘을 찾아내는 대회로 분야는 다르지만 고등학교 수준 대회인 IMO보다 수준이 높다. 구글은 “심도 있는 추상적 추론, 창의성, 새 해결책을 종합하는 능력 등 ‘진정한 독창성’이 필요한 대회”라고 설명했다.
제미나이는 대회 시작 45분 만에 8개 문제를 풀었고 3시간 만에 2개 문제를 더 풀어냈다. 어느 인간 팀도 풀어내지 못한 문제 ‘C’를 30분만에 해결하기도 했다. 구글은 “제미나이 2.5 딥싱크가 세계 상위 20위권 프로그래머와 동일한 수준의 성과를 낼 수 있는 것으로 나타났다”고 강조했다. 오픈AI도 GPT-5와 비공개 추론 모델을 통해 ‘AI 경쟁’ 부문에 출전했다. 오픈AI는 일반 모델이 내놓은 해법을 추론 모델이 검증해 최적 답안을 내놓는 방식으로 11개 문제를 한번에 풀어냈고 1개 문제는 9번째 제출한 답안에서 해결하는 데 성공했다.
지난해 IMO 은메달, 올 7월 IMO 금메달에 이어 2달만에 ICPC서 최상위권 성적을 내며 AI 성능이 단순한 ‘벤치마크’ 지표를 넘어 급격히 향상되고 있다는 평가가 이어진다. 이에 구글은 물론 오픈AI, 엔트로픽 등 주요 AI 개발사에서 AI 교육을 도맡던 박사급 전문가들도 ‘제자’인 AI에 대체될 수 있다는 공포감까지 느끼는 중이다. 이날 디인포메이션은 지난해 오픈AI o3 추론 모델을 가르치던 언어학 전문가가 “GPT-5가 답변하지 못하는 질문이 o3 대비 절반 수준으로 줄어 ‘마치 우리 자신을 대체할 모델을 훈련시키는 것 같다”는 감상을 남겼다고 보도했다.
AI 개발사들은 모델 훈련에 각 분야 박사 학위급 전문가를 고용하고 있으나, 모델 수준이 높아지며 ‘교사’가 될 전문가가 줄어드는 중이다. 일례로 ‘세계 20위권’ 프로그래밍 능력을 입증한 제미나이 2.5 딥싱크를 가르칠 전문가는 20명 남짓에 불과하고, 자연히 단순 AI 교육을 위해 고용하기에는 몸값이 높다. 디인포메이션은 “오픈AI와 엔트로픽이 모델 교육을 위해 노벨상 수상자나 수십년 경력을 지닌 의사 등 ‘슈퍼 전문가’에게 시간당 수천 달러를 지불해야 할 수 있다”면서도 “그들이 AI에 대체될 수 있다 느낀다면 참여를 주저할 수 있다는 점도 문제”라고 지적했다.
AI는 지식면에서 일반인공지능(AGI)에 다가가는 동시에 에이전트화로 단순한 질문에 답변하는 수준을 넘어선 ‘개인화 비서’로 도약 중이다. AI 기업들은 AI 모델과 에이전트, 플랫폼 생태계 장악에도 속도를 붙이고 있다.
구글은 전날 AI 에이전트용 결제 프로토콜(규약) ‘AP2’를 공개했다. AI가 사람 대신 안전하게 결제까지 마무리 할 수 있도록 돕는 규약이다. 페이팔을 비롯해 60여 개 금융기관과 협력해 사용자가 허용한 경우 별도 승인 없이 결제까지 AI가 완료할 수 있게 했다. 원하는 제품·서비스와 가격대에 맞다면 자동 주문이 되는 식이다.
앞서 구글은 각기 다른 AI 에이전트를 통합할 수 있는 ‘A2A’ 표준을 공개한 바 있다. AI 모델과 외부 데이터·기기 간 연결을 돕는 엔트로픽의 MCP에 이어 AI 에이전트 생태계 표준을 장악하겠다는 의도다. 나아가 결제 영역을 공략해 구글이 지닌 검색·광고·쇼핑 플랫폼을 AI 에이전트 내에서 직결하겠다는 구상이 엿보인다. 테크계 한 관계자는 “AI가 평범한 인간 이상 지식과 이해도를 갖게 된 시점에서 단순 성능 경쟁으로 차별점이 적어지고 있다”며 “고성능 AI 에이전트를 실 생활에 통합해내는 플랫폼 간 서비스, 편의성 싸움이 격화할 전망”이라고 했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >