전체메뉴

검색
팝업창 닫기
이메일보내기

전문가 검증 거친 中 딥시크…4억원으로 AI 훈련 끝냈다

네이처 논문에 훈련 비용 첫 공개

개발비 합쳐도 경쟁사 10분의 1

주요 AI 프로그램 중 첫 동료 심사 거쳐

엔비디아 고사양 칩 A100 보유 첫 인정

딥시크. 로이터 연합뉴스




중국 딥시크가 출시한 저비용 고사양 생성형 인공지능(AI)인 ‘R1’의 훈련 비용이 4억 원에 불과하다는 연구 결과가 나왔다. 올해 1월 출시 직후 개발 비용이 축소되고 과대 포장됐다는 평가가 나왔지만 주요 대규모 언어모델(LLM) 모델 가운데 처음으로 유력 학술지 검증을 통과하면서 주목을 끌고 있다.

18일(현지 시간) 외신에 따르면 딥시크는 전날 국제 학술지 네이처 논문을 통해 R1 모델 훈련에 29만 4000달러(4억 821만 원)가 소요됐다고 밝혔다. 미국 AI 반도체 제조사인 엔비디아의 저사양 그래픽처리장치(GPU)인 ‘H800’ 512개를 단위 시간당 2달러씩 들였다고 계산해 산출한 비용이다. 여기에는 R1의 미세 조정 전 모델인 ‘R1 제로’ 훈련 비용과 미세 조정 비용이 포함됐다. R1 훈련에 소요된 시간은 약 80시간이다.



반도체 구입 등 시설 구축을 제외하고 훈련 값만 따로 계산하기는 했지만 딥시크가 구체적인 비용을 공개한 것은 이번이 처음이다. 딥시크는 올해 1월 R1 개발 비용이 경쟁사 10분의 1 수준인 558만 달러라고 밝혔다. 여기에 이번에 공개된 훈련 비용을 더해도 600만 달러를 밑돈다.

주목할 점은 딥시크가 주요 LLM 개발사 가운데 처음으로 권위있는 동료 심사를 받았다는 점이다. 동료 평가는 복수의 전문가를 심사위원으로 지정해 논문의 품질·신뢰성을 검증하는 절차다. 그동안 경쟁사들은 딥시크가 5억 달러 이상을 썼을 것이라며 R1을 평가절하했지만 전문가 검증을 거쳤다는 점에서 신뢰를 확보하게 됐다. 신화통신은 “R1은 형식적인 동료 심사를 받아 LLM의 새로운 기준을 세우게 됐다”면서 “혁신적인 접근이 경쟁사와는 독립적으로 이뤄졌다는 점을 강조했다”고 평가했다.

딥시크는 논문에서 개발 준비 단계에서 엔비디아 A100 칩을 사용했다고 처음 인정했다. 그동안 업계에서는 R1 추론 능력을 높이기 위해 고사양 반도체인 A100을 썼을 것이라는 분석이 제기됐다. 또 R1은 AI가 정확한 답변을 하면 보상하는 순수 강화 학습 방식으로 추론 능력을 향상 시킨 것으로 나타났다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널