전병곤 교수 연구진, 머신러닝 파이프라인을 인공신경망으로 변환하는 기술 개발

전병곤 교수 연구진이 마이크로소프트와 공동으로 전통적 머신러닝 파이프라인을 신경망(neural network)으로 변환해 최적화하는 프레임워크인 WindTunnel을 개발하였다. 이번 성과는 전통적 머신러닝 기법과 최신 딥러닝 기법의 장점을 모두 취하는 핵심 기술로, 클릭률 예측, 추천 시스템 등 다양한 실제 인공지능 응용에 활용될 것으로 예상된다.

딥러닝 기법이 컴퓨터 비전이나 자연어 처리 등 분야에서 효과적인 것으로 나타나 많은 각광을 받고 있지만, 클릭률 예측이나 추천 시스템 등의 인공지능 응용에서 사용되는 표 형식 데이터(tabular data)에 대해선 여전히 선형 모델(linear model)이나 GBDT(gradient boosting decision trees)와 같은 전통적 머신러닝 기법이 더 나은 성능을 보이는 경우가 많다. 전통적 머신러닝 기법을 사용할 때는 보통 다수의 머신러닝 모델 및 데이터 변환 연산을 엮어서 하나의 머신러닝 파이프라인을 구성하고, 학습 시에는 파이프라인을 구성하는 각 요소를 개별적으로 학습한 후 사용하게 된다.

전병곤 교수 연구진은 파이프라인의 각 구성 요소를 개별적으로 학습한 후 이를 인공신경망으로 변환하여, 변환된 여러 구성 요소를 역전파(backpropagation)을 이용해 한번에 최적화하는 기술을 개발하였다. 특히 GBDT나 범주형 데이터 인코더(categorical feature encoder)와 같이 일반적으로 미분 불가능한 구성 요소를 신경망으로 변환하고 최적화하는 방법을 제안하였다. 이 기술을 이용해 개발된 WindTunnel 프레임워크는 기존 방법 대비 더 높은 예측 성능을 달성할 뿐 아니라, 표 형식 데이터에 대해 전통적인 머신러닝과 딥러닝 기법 사이의 절충안을 찾는 다양한 향후 연구로 이어질 수 있을 것이란 평가를 받았다.

20210803_bgchun2.png

이번 연구 결과는 VLDB(International Conference on Very Large Data Bases) 2022에서 발표될 예정이다.

"WindTunnel: Towards Differentiable ML Pipelines Beyond a Single Model", Gyeong-In Yu, Saeed Amizadeh, Sehoon Kim, Artidoro Pagnoni, Ce Zhang, Byung-Gon Chun, Markus Weimer, and Matteo Interlandi.

2021년 8월 3일 화요일