
글로벌 인공지능(AI) 업계는 중국 딥시크(DeepSeek)의 등장과 함께 저비용으로 고성능 AI 모델을 개발할 수 있다는 가능성을 주목하고 있다.
딥시크의 개발비용이 약 82억원에 불과하면서도, 오픈AI의 GPT-4 수준의 성능을 갖췄다는 주장이 나오면서 관심은 더욱 커지는 상황이다. 그러나 반도체 업계 및 AI 전문가들은 GPT-4 수준의 AI 모델 개발에는 현실적으로 최소 1년 2개월 동안 6000억원 이상의 비용이 필요하다고 분석하고 있다.
이에 따라 딥시크에 대한 과도한 기대감이 형성되는 것에 대한 경계의 목소리도 나오고 있다. 업계 전문가들은 저비용으로 고성능 AI 모델을 개발할 수 있다는 주장에 대해 보다 신중한 접근이 필요하다고 지적한다.
17일 오픈AI의 GPT-4o 모델을 통해 딥시크 V3 수준의 AI 모델을 개발하는 데 필요한 비용을 추론한 결과, 현실적으로는 최소 14개월 동안 약 7800억원이 필요하다는 답변이 나왔다.
AI 모델 개발 과정은 ‘연구 및 기획→모델 설계→학습→평가 및 파인튜닝(Fine-tuning)→배포→유지보수’의 단계를 거친다. 이 중 가장 많은 비용과 시간이 투입되는 과정은 ‘학습’으로, 딥시크 V3 수준의 AI 모델을 개발하려면 대규모 GPU(그래픽카드) 인프라가 필수적이다.
딥시크 V3 모델의 성능을 보면 6710억개의 파라미터(매개변수)를 보유하고 있으며, 학습 데이터는 수조 개의 토큰에 달하는 것으로 추정된다. 이와 비슷한 수준의 모델로는 GPT-4o, 메타의 LLaMA 3.1, 앤스로픽의 클로드 3.5 소네트 등이 있다.
딥시크 V3의 개발에는 엔비디아의 중국 시장 전용 GPU인 H800이 사용된 것으로 알려졌다. H800은 H100 대비 실제 훈련 성능이 50~60% 수준이며, 가격은 개당 2만5000~3만 달러(약 3600만~4300만원)로 추정된다.
딥시크 V3의 예상훈련 시간을 가장 현실적인 1년 2개월(14개월)로 설정하면, 약 2만개의 H800 GPU가 필요하다. 이 경우 GPU 구매비용은 6500억~7800억원이 소요된다.
훈련 속도를 높이기 위해 5만개 이상의 GPU를 투입할 경우, 개발 시간을 5~6개월로 단축할 수 있다. 그러나 이 경우 GPU 구매비용이 1조6000억~1조9000억원에 이를 것으로 예상된다.
H800 GPU 2만개를 임대할 경우, 3개월 기준 비용은 1400억원이며, 14개월 동안의 임대 비용은 약 6500억원이 필요하다.
즉 82억원이라는 비용으로 딥시크 V3 수준의 모델을 개발하는 것은 현실적으로 불가능하다는 것이 GPT-4의 분석이다.
이 같은 의구심은 AI 및 반도체 업계에서도 제기됐다. 반도체 및 AI 전문 연구 및 분석 기업인 세미애널리시스(SemiAnalysis)는 지난달 31일 보고서를 통해, 딥시크가 발표한 82억원이라는 개발비용은 과장됐으며, 실제 개발비용은 최소 5억 달러(약 7200억원) 이상일 것이라고 발표했다.
세미애널리시스는 딥시크를 설립한 헤지펀드 ‘하이플라이어 퀀텀(High-Flyer Quant)’이 2021년 엔비디아 A100 GPU 1만개를 구매한 사실을 근거로 제시했다. 또 해당 펀드가 GPU 구매에 투입한 비용을 고려하면, 딥시크가 H800 1만개뿐만 아니라, 중국 수출이 금지된 H100 1만개와 중국 주력 수출 칩인 H20을 포함해 총 5만개 이상의 엔비디아 GPU를 활용했을 가능성이 크다고 주장했다.
특히 지난달 공개된 딥시크의 R1 모델의 개발 비용이 공개되지 않았다는 점도 의문점으로 지적했다. 세미애널리시스는 딥시크가 유지보수 및 인건비를 포함하지 않은 채 비용을 축소 발표했을 가능성이 크다고 보고 있다.
국내 AI 업계도 딥시크의 개발 비용 발표에 대해 회의적인 입장을 보이고 있다.
한 AI 스타트업 관계자는 “딥시크의 성능 자체를 문제 삼는 것이 아니라, 82억원이라는 터무니없이 낮은 개발비에 의문을 제기하는 것”이라며 “마치 저비용으로 고성능 AI 모델을 쉽게 개발할 수 있는 것처럼 과장된 주장이 확산되면, 투자 시장에 혼란을 줄 수 있다”고 우려했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지