데이터 마이닝 연구실

교수: 강유
랩실: 
301동 519호
전화: 
(02) 880-7263

빅 데이터에서 어떻게 유용한 패턴과 이상 신호를 찾을 수 있을까? 단일 머신의 메모리나 디스크에 들어가지 않는 대용량 데이터를 어떻게 처리할 수 있을까? 초고속 데이터 스트림을 어떻게 분석할 수 있을까? 데이터 마이닝 연구실에서는 초대용량, 초고속 데이터를 분석하기 위한 알고리즘, 시스템을 개발하고 이를 통해 유용한 패턴과 이상 신호를 발견하는 연구를 진행중이다. 주요 연구 분야는 그래프 마이닝, 텐서 분석, 고확장성 기계 학습, 스트림 마이닝이다.

그래프 마이닝

단일 머신의 메모리나 디스크에 들어가지 않은 대용량 그래프에서 어떻게 패턴과 이상 신호를 찾을 수 있을까? 데이터 마이닝 연구실에서는 소셜 네트워크와 웹과 같은 대용량 그래프를 분석하는 알고리즘과 시스템을 개발한다.

텐서 분석

네트워크 침입 로그, 또는 시간 정보가 추가된 소셜 네트워크 등의 다차원 데이터를 어떻게 분석할 수 있을까? 텐서는 다차원 데이터를 모델링하기에 적합한 툴이며, 데이터 마이닝 연구실에서는 고확장성 텐서 분석 알고리즘 (고유값 계산, 텐서 분해)을 연구한다.

고확장성 기계 학습

대용량 데이터를 어떻게 효율적으로 학습할 수 있을까? 데이터 마이닝 연구실에서는 고확장성 기계 학습 알고리즘을 연구한다. 대표적인 연구로 belief propagation, 클러스터링, 그래프에서의 유사도 계산, logistic regression, 대용량 추천 시스템 등이 있다.

스트림 마이닝

시간이 지남에 따라 급격히 변화하는 초고속 데이터 스트림에서 어떻게 유용한 패턴을 찾을 수 있을까? 시스템의 공간 사용을 최소화하며 어떻게 데이터 스트림을 빠르고 정확하게 분석할 수 있을까? 데이터 마이닝 연구실에서는 시간을 고려한 최빈 아이템 계산 등의 고속 스트림 마이닝 알고리즘을 연구하고, 이를 소셜 네트워크와 헬스 케어 등의 분야에 적용하고 있다.

이미지