전병곤 서울대 교수팀, 딥러닝 약점 절충 기법 개발…MS와 공동연구

임민철 기자입력 2021-08-09 13:31

기사공유
폰트크기

표 데이터 기반 클릭률예측·추천시스템 성능향상
"기존 머신러닝·최신 딥러닝 장점 함께 AI에 활용"

유경인 서울대 공과대학 컴퓨터공학부 박사과정(왼쪽)과 전병곤 서울대 공과대학 교수. [사진=서울대 제공]

딥러닝과 전통적인 머신러닝 기법의 장점을 결합해, 기존 딥러닝 기술이 취약한 정형 데이터 기반 콘텐츠·검색 서비스의 클릭률 예측과 추천시스템 성능을 높일 수 있는 기술이 국내 연구진과 마이크로소프트의 공동 연구로 개발됐다.

서울대학교 공과대학은 전병곤 컴퓨터공학부 교수팀이 마이크로소프트와 공동으로 전통적인 머신러닝 파이프라인을 신경망으로 변환해 최적화하는 프레임워크인 '윈드터널(WindTunnel)'을 개발했다고 9일 밝혔다. 이번 연구 결과는 다음달 초 호주에서 개최되는 빅데이터 분야 국제학술대회인 'VLDB 2022'에서 'WindTunnel: Towards Differentiable ML Pipelines Beyond a Single Model'이라는 논문 제목으로 발표될 예정이다.

윈드터널 프레임워크는 선형모델이나 경사증폭의사결정나무(GBDT·gradient boosting decision tree)와 같은 전통적 머신러닝 기법의 장점을 딥러닝 기법으로 구현된 인공지능(AI) 애플리케이션에 결합해, 딥러닝 AI 앱의 클릭률 예측, 추천시스템 등의 성능 향상을 도울 수 있다.

딥러닝 기법이 컴퓨터 비전이나 자연어 처리 등의 분야에서 뛰어난 성능을 보여 각광받고 있지만, 클릭률 예측이나 추천 시스템 등의 인공지능 응용에서 사용되는 표 형식 데이터(tabular data)는 여전히 선형 모델이나 GBDT 등 전통적 머신러닝 기법이 더 나은 성능을 보이는 경우가 많다. 이런 전통적 머신러닝 기법을 사용시 다수의 머신러닝 모델과 데이터 변환 연산을 엮어서 하나의 머신러닝 파이프라인을 구성하고, 학습 시에는 파이프라인을 구성하는 각 요소를 개별적으로 학습한 후 사용하게 된다.

관련기사

전 교수팀은 이 파이프라인의 각 구성 요소를 개별적으로 학습한 후, 이를 인공신경망으로 변환해 여러 구성 요소를 '역전파(backpropagation)'로 한 번에 최적화하는 기술을 개발하고 GBDT나 범주형 데이터 인코더 등 일반적으로 미분 불가능한 구성 요소를 신경망으로 변환하고 최적화하는 방법을 제안했다. 이 기술로 개발된 윈드터널 프레임워크를 통해 기존 대비 더 높은 예측 성능, 표 형식 데이터에 대한 딥러닝과 전통적인 머신러닝 기법 간의 절충안을 찾는 후속 연구가 진행될 수 있다.

전 교수팀 측은 "이번 성과는 전통적 머신러닝 기법과 최신 딥러닝 기법의 장점을 모두 취하는 핵심 기술로, 클릭률 예측, 추천 시스템 등 다양한 실제 AI 응용에 활용될 것"이라고 기대했다.