![](https://image.ajunews.com/content/image/2022/08/23/20220823183015148488.png)
[사진=네이버클라우드]
초거대 인공지능(AI) 언어모델 '하이퍼클로바'를 비(非) 전문가가 쓸 수 있게 만든 네이버의 노코드 AI 플랫폼 '클로바스튜디오'가 사용자 데이터 학습으로 더 나은 성능을 제공하는 '튜닝' 기능을 지원한다. 비공개 시범 서비스 참여자들은 이를 활용해 더 한국어 텍스트 분석과 문장 생성 결과물을 얻을 수 있게 됐다.
네이버클라우드는 클로바스튜디오에 추가된 튜닝 기능이 하이퍼클로바 언어모델 매개변수 일부를 과제 종류, 언어, 데이터 등에 맞게 최적화해 기존 '인컨텍스트 러닝' 방식 대비 우수한 성능을 더 적은 비용과 작업 시간으로 얻을 수 있게 됐다고 23일 밝혔다. 튜닝 기능은 한국어 모델에 제공되고 있고 영어 등 다국어 모델에 추가될 예정이며 수행 가능한 과제 종류와 기법이 더 확대될 예정이다.
기존 클로바스튜디오 기능은 '플레이그라운드' 영역에 사용자가 입력한 정보를 분석해 요약, 분류, 창작 등 주어진 과제를 수행하는 인컨텍스트 러닝 방식으로만 제공됐다. 이 방식은 예시와 지시문을 함께 입력해 결과를 얻는 '프롬프트'를 어떻게 구성하느냐에 따라 결과물 품질이 달라질 수 있어 안정적이지 않다. 프롬프트로 입력할 수 있는 글자수 자체도 제한된다.
사용자는 클로바스튜디오 튜닝 기능을 통해 규격화된 데이터 세트를 일정량 이상 업로드해 개발 지식이나 입력 데이터 크기 제한 없이 원하는 언어 모델을 만들 수 있다. 네이버가 만든 하이퍼클로바를 활용하는 만큼 튜닝을 통해 네이버의 데이터를 활용하는 효과도 누릴 수 있다. 네이버클라우드는 튜닝을 통해 모델이 사용자 의도에 적합한지 간편하게 테스트할 수 있고 API로 실제 서비스에 적용할 수 있다고 설명했다.
네이버클라우드는 클로바스튜디오에 적용된 하이퍼클로바가 다양한 자연어처리(NLP) 과제에 쉽고 빠르게 적용될 수 있다고 밝혔다. 자연어처리(NLP) 분야 최고 AI 학회 EMNLP 2021에 채택된 연구 논문을 근거로 하이퍼클로바가 수백~수천건 데이터 세트를 학습해 나타내는 한국어 처리 성능이 BERT 등 다른 대규모 언어모델이 수만건을 학습한 것과 비슷하다고 강조했다.
클로바스튜디오는 튜닝 기능으로 문서 이중·다중 분류, 문장 요약·생성·교정, 문체 전환 등 여섯 가지 NLP 과제를 수행할 수 있다. 네이버 사내에서 지난 6월부터 시범 운영돼 대화, 요약, 번역, 분류 등 NLP 과제에 활용되면서 서비스 성능을 향상했다. AI 돌봄 전화 서비스 '클로바 케어콜'은 튜닝 기능으로 데이터 검슈율을 기존 30%에서 91%로 높였다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지