네이버클라우드가 인공지능(AI) 인프라의 핵심인 그래픽처리장치(GPU)의 운영 효율은 물론, 글로벌 수준의 운영 역량을 확보하고 구독형 GPU(GPUaaS) 사업을 본격화할 방침이다.
이상준 네이버클라우드 최고운용책임자(CIO)는 지난 27일 네이버의 제2데이터센터 '각 세종'에서 열린 테크밋업에서 "그간 축적한 AI 인프라 운영 역량을 GPUaaS 모델로 발전시켜 국내 기업들이 손쉽게 AI를 활용할 수 있는 생태계를 만들겠다"면서 이같이 밝혔다.
GPUaaS는 AI 모델 학습·추론을 위한 고성능 GPU를 기업 고객에게 빌려주는 서비스다. 이미 네이버클라우드는 각 춘천과 각 세종을 통해 축적한 기술 운영 역량을 바탕으로 GPUaaS 모델을 추진해왔다. 이 CIO는 "이미 삼성전자·현대자동차·한국은행·한국수력원자력 등 국내기업과 공공기관에 GPU를 제공하고 있다"면서 "AI 관련한 다양한 비즈니스를 준비 중인데, 산업에 특화한 버티컬 AI 모델을 만드는 것에 집중함과 동시에 최근에든 GPUaaS 추진에 무게를 두고 있다"고 말했다.
특히 네이버는 글로벌 수준의 고도화된 GPU 역량을 내제화했다. 2019년 엔비디아의 슈퍼컴퓨팅 인프라인 '슈퍼팟(SuperPod)'을 세계에서 가장 빠르게 상용화했고, 초고성능 GPU 클러스터를 직접 설계·운영한 경험을 보유하고 있다. 이를 바탕으로 '각 세종'에서 대규모 GPU 클러스터를 직접 설계·운영하며 냉각·전력·네트워크 등 데이터센터 핵심 인프라를 자체적으로 설계하고 AI 워크로드에 최적화하는 기술을 내재화했다.
지난 2023년 개관한 '각 세종'은 네이버의 고성능 AI 인프라가 집약된 AI 데이터센터로, 기존 IDC가 수행하던 저장·처리 기능을 넘어 AI 학습과 추론이 동시에 이뤄지는 고밀도 GPU 연산 공간으로 설계됐다. 전력과 냉각 효율, 무정지 운영까지 모두 고려해 AI 인프라가 24시간 안정적으로 작동할 수 있는 환경을 구축했다. 현재 1단계 오픈해 모두 운영 중이며, 올해 2~3단계 시공에 착수할 예정이다. 각각 2027년과 2029년 완공이 목표다.
이 CIO는 "네이버의 데이터센터는 AI 워크로드 전체를 통합적으로 제어할 수 있는 풀스택 AI 인프라"라며 "이처럼 인프라를 하나의 시스템으로 통합적으로 설계·운영할 수 있는 역량은 국내는 물론 글로벌에서도 손꼽힌다"고 강조했다.
AI 데이터센터 설계의 핵심 중 하나는 발열 관리다. 고성능 연산이 집중될수록, GPU 전력 밀도가 높아지고 냉각은 데이터센터 효율과 안정성을 좌우하는 중요 요소다. 각 세종에는 직접외기·간접외기·냉수를 병행하는 하이브리드 냉각 시스템을 적용했다. 이는 계절별로 냉각 방식을 자동 전환해, 겨울에는 외부의 찬 공기로 직접 냉각하고 간절기와 여름에는 간접외기와 냉수를 병행한다. 이를 통해 GPU 밀도가 높아져도 안정적인 열 제어와 높은 에너지 효율을 유지할 수 있다.
네이버는 차세대 냉각 방식인 액침냉각과 직접액체냉각(DLC)을 검증하고 있다. 네이버클라우드는 고전력·고밀도 환경에 대응하는 차세대 냉각 기술 로드맵을 구체화하고, 수냉식 서버 냉각 관련 자체 특허도 출원 완료했다. 각 세종의 2차 설계에는 이러한 방식이 적용될 예정이다. 노상민 네이버 데이터센터 통합센터장은 "액침냉각은 각 춘천에서 지난 5월부터 개념검증(PoC)을 진행 중이고, 직업액체냉각은 내년 4월까지 PoC를 끝내고 2차 설계에 적용될 예정"이라고 밝혔다.
아울러 철저한 이중화 구조로 설계돼 각종 재해에도 24시간 안정적인 운영이 가능하다. 각 세종은 장애 상황에서도 서비스가 멈추지 않도록 전력과 냉각, 서버 운용 체계를 완전히 분리하면서도 유기적으로 통합한 '이중화 구조'로 설계됐다. 또 UPS(무정전 전원 장치)와 배전 설비를 재배치해 장애 전파를 구조적으로 차단했다.
또한 대규모 GPU 운영에는 자원 관리·배치·복구를 자동화하는 기술이 적용됐다. 반복적인 장애 대응이나 자원 조정 작업 상당 부분도 시스템이 자동으로 처리하도록 설계돼 운영 효율을 높였다. 노 센터장은 "네이버가 국내 어느 기업보다 IDC와 IT 서비스에 대한 이해력이 높다"면서 "데이터센터 규모는 점점 커질텐데, 커질만큼 사람을 배치하면 비효율적이고 소통도 어렵기 때문에 기술 최적화와 내재화에 집중하고 있다"고 강조했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



