2020년 9월 10일 목요일제 1회 율촌 AI 스타에 컴퓨터공학부 대학원생 3명 선정서울대학교 AI 핵심기술 분야 최고 인재를 가리는 ‘율촌 AI 스타’에 컴퓨터공학부 대학원생 3명 선정 AI 핵심기술 분야에서 최고의 인재를 가려 AI Star 상금 800만원 수여 총 34명 지원, 5명 중 3명이 컴퓨터공학부 학생 AI 핵심기술 분야의 최고 인재를 선발하는 ‘율촌 AI 스타’ 공개 선발에서 컴퓨터공학부의 유재민, 정연우, 정은지 학생이 제1회 AI 스타로 선정되었다. ‘율촌 AI 스타’는 농심그룹 율촌재단이 AI 인재를 육성해 국가발전에 이바지한다는 목표로 올해부터 출연하는 ‘율촌 AI 장학금’의 일환으로, AI핵심기술분야에서 가장 우수한 연구를 보인 대학원생들을 매년 5명씩 선발해 800만원의 상금을 지급하는 장학금이다. 서울대 AI연구원을 통해 대상자를 공개 모집한 결과 ICML, NeurIPS 등 AI 분야 최고의 학회에 재학 중에만 여러 편의 논문을 발표한 학생들이 34명 지원하였다. 심사를 맡은 교수들은 “우리 학교에 이렇게 우수한 Core AI 학생들이 많다는 것을 새삼스럽게 실감했다” 며, “연차에 따른 실적과 연구 발전 속도, 향후 연구 계획을 모두 계산하여 선발했다” 고 설명했다. https://cse.snu.ac.kr/sites/default/files/node--notice/20200909_%EC%9C%A8%EC%B4%8C_size770.png 유재민 학생(석박통합과정 9학기, 지도교수 강유)은 데이터 마이닝 분야 중 그래프 데이터에 머신 러닝 기법을 적용하는 연구로 ICDM, IJCAI, NeurIPS, WSDM 등에 1저자로 논문을 발표하였다. 그는 최근에 데이터가 없는 상태에서의 제로샷 학습에 대해 연구하고 있다고 설명하고, “빠른 속도로 발전하고 있는 머신 러닝 기술을 다양한 형태의 실세계 데이터에 적용하고, 제약 상황에서 모델의 효율성을 키우는 한편, 해석 가능한 결과를 도출함으로써 기술의 수직적 발전보다는 적용 분야와 응용 능력을 키우는 수평적 방향의 발전을 목표로 연구하고 있다”고 밝혔다. 지도교수인 강유 교수는 유재민 학생은 “전 세계 우수대학 학생과 비교해도 비교우위가 있는 학생”이라며 설명했다. 정연우 학생(석박통합과정 6학기, 지도교수 송현오)은 데이터의 효율적인 검색을 위한 이진 코드 생성 알고리즘과 비지도학습에서 데이터의 설명 가능한 이산 정보와 연속 정보를 분리 시키는 알고리즘으로 2018년 ICML, 2019년 ICML, CVPR에 논문을 기재하였다. 그는 최근에 커다란 네트워크에서 자원이 부족한 상황에서 사용할 수 있도록 작고 빠른 네트워크를 추출하는 연구를 하고 있으며, "현재의 사람의 정보를 저장해 미래에서 과거의 자신과 소통할 수 있게 만드는 연구를 하고 싶다" 라고 포부를 밝혔다. 송현오 교수는 연구를 수행하는 정연우 학생의 주도적인 태도와 창의적인 연구자세를 높이 샀다. 정은지 학생(박사 8학기, 지도교수 전병곤)은 딥러닝 시스템의 성능과 사용성을 높이는 연구로 NSDI, EuroSys 등 시스템 분야 최우수 학회에 발표하였다. 컴퓨팅 자원을 효율적으로 관리하고 사용하는 인공지능의 필수적인 시스템을 개발하는 그녀의 연구는 국제적인 주목을 받아 Google Brain, UC 버클리 등에서 먼저 협업을 제안해 프로젝트를 함께 수행하였다. 그녀는 “인공지능 연구자가 작성한 모델 전체를 분석하고, 주어진 CPU와 GPU에서 모델을 어떻게 더 효율적으로 수행할 것인지 컴파일러, 런타임 시스템 측면에서 연구를 진행할 계획”이라고 밝혔다. 율촌재단에서는 9월 중에 온라인 시상식을 실시하고 율촌 AI 스타에게 각 800만원의 상금을 수여할 예정이다. 율촌 AI 스타는 매년 8월 공고를 통해 5명씩 선발할 예정이다....과거 미분류2020년 9월 10일 목요일
2020년 8월 28일 금요일2020년 8월 우수학위논문상 수상자 안내서울대학교 컴퓨터공학부에서는 매 학기 졸업생을 대상으로 우수학위논문상을 수여합니다. 석박사 과정 졸업논문의 경우 논문 심사 위원들이, 학부 졸업 논문의 경우 지도교수가 뛰어난 논문을 선별하여 우수학위논문상 후보로 추천하고, 논문상 심사위원회에서 엄격한 심사를 거쳐 수상자를 선정하고 있습니다. 2020년 가을학기에는 박사 논문상 수상자 1명, 석사 논문상 수상자 1명, 학사 논문상 수상자 1명을 최종 선발하였습니다. o 박사 논문상 수상자: 김명석 (지도교수: 김지홍) 제목: Cross-layer Optimization Techniques for Secure Real-time 3D NAND Flash-Based Storage Systems 김명석 학생은 플래시메모리 저장 장치의 수명과 성능을 개선하기 위한 다양한 최적화 기법을 연구하였다. 이를 바탕으로 최신 컴퓨팅 환경에서 요구되는 실시간성과 보안성을 고려한 SSD 최적화 기법을 개발 하였다. 관련 연구 결과는 컴퓨터시스템분야의 최우수 학술대회인 MICRO와 ASPLOS를 포함하여 다수의 학술 대회 및 저널에 발표되었다. o 석사 논문상 수상자: 김형석 (지도교수: 송현오) 제목: Exploration in Reinforcement Learning with Mutual Information-based Embeddings 김형석 학생은 석사 학위 과정 중 심층 강화학습(Deep Reinforcement Learning)의 탐색 대한 연구를 수행했습니다. 에이전트의 상태와 행동 사이의 상호정보량을 최대화하여 보상이 희소한 환경에서 탐색을 원활히 수행할 수 있는 알고리즘을 연구하였습니다. 이를 바탕으로 인공지능 분야 최우수 학술대회인 ICML에 논문을 발표하였습니다. o 학사 논문상 수상자: 원재연 (지도교수: 이재욱) 제목: IIU : Specialized Architecture for Inverted Index Search 원재연 학생은 웹서치 엔진에서 주로 사용되는 역색인 구조를 이용한 검색을 획기적으로 가속시키는 아키텍쳐를 제안하였습니다. 하드웨어 친화적인 역색인구조 압축/검색하는 알고리즘을 고안하였고 이 결과를 컴퓨터 시스템 분야 최우수 학회인 ASPLOS 논문에 공저자로 참여하였습니다....과거 미분류2020년 8월 28일 금요일
2020년 7월 31일 금요일송현오 교수 연구진, 최고 성능의 mixup 알고리즘 고안서울대학교 송현오 교수 연구진, 인공신경망의 활용 가능성을 크게 높이는 새로운 알고리즘으로 세계 선도 송현오 교수 연구진(김장현 석박통합과정, 추원호 학사과정)은 데이터의 돌출성(saliency) 정보를 활용하여 기존 데이터 증대 기법인 mixup의 성능을 크게 향상하는 알고리즘을 개발하였다고 밝혔다. 해당 기법은 인공신경망의 일반화 성능과 데이터 왜곡 또는 적대적 공격에 대한 강건성을 향상시켜 인공신경망의 실제 응용 분야에서의 활용 가능성을 크게 높여줄 것으로 기대된다. 기존의 mixup 기법은 이미지의 대상 물체, 음성 데이터의 의미있는 음절 등 주어진 과제에 대한 답을 도출하는데 필요한 핵심적인 정보를 반영하지 않아 잘못된 데이터와 레이블을 만들어내는 경우가 존재한다. 잘못된 데이터를 생성하여 인공신경망 학습에 활용할 경우 인공신경망의 일반화 성능이 감소하게 된다. 이러한 문제를 해결하기 위해 송현오 교수 연구진은 데이터 돌출성과 국소적 연속성(smoothness)을 고려하였고 돌출성 정보를 극대화하기 위해 수송(transport) 과정을 모델링한 새로운 mixup 목적함수를 제안하였다 [식 1]. 연구팀은 해당 목적함수를 최적화하기 위해 GPU 최적화된 2단계 교차 알고리즘을 개발하였다. 본 논문에서 제안한 Puzzle Mix는 이미지 분류 벤치마크 데이터셋인 CIFAR, Tiny-ImageNet, ImageNet에서 기존 mixup 방법들보다 뛰어난 일반화 성능을 보였으며, 적대적 공격과 데이터 왜곡에 대해서도 향상된 강건성을 보였다 [그림 1]. 송현오 교수 연구진은 해당 기술을 다룬 논문을 머신러닝 최고 학회인 ICML 2020에 게재하였다고 밝혔다. https://cse.snu.ac.kr/sites/default/files/node--notice/20200729_%EC%86%A1%ED%98%84%EC%98%A41.png https://cse.snu.ac.kr/sites/default/files/node--notice/20200729_%EC%86%A1%ED%98%84%EC%98%A42.png 논문: Jang-Hyun Kim, Wonho Choo, Hyun Oh Song, Puzzle Mix: Exploiting Saliency and Local Statistics for Optimal Mixup, ICML 2020 링크: https://proceedings.icml.cc/static/paper_files/icml/2020/6618-Paper.pdf 코드: https://github.com/snu-mllab/PuzzleMix 발표 영상: https://icml.cc/virtual/2020/poster/6827 [문의] 송현오 교수 / 서울대학교 컴퓨터공학부 / hyunoh@snu.ac.kr 김장현 석박통합과정 / 서울대학교 컴퓨터공학부 / blue378@snu.ac.kr 추원호 학사과정 / 서울대학교 통계학부 / cwh104504@snu.ac.kr...과거 미분류2020년 7월 31일 금요일
2020년 7월 3일 금요일[문병로의 알고리즘 여행] 불가능하다는 사실이 유용할 때도 있다출처: 중앙일보 2020년 7월 3일자 [문병로의 알고리즘 여행] 대부분의 연구는 무얼 어떻게 잘해볼 것인가에 관한 것이다. 이런 가운데 몇몇 천재들은 자신들 분야의 근본적인 한계를 규명한다. 쿠르트 괴델은 1931년 어떠한 정상적인 논리 체계 내에서도 근본적으로 풀 수 없는 문제가 존재한다는 것을 증명했다. 20세기 수학의 기념비적 업적이 된 불완전성 정리다. 정신질환을 앓던 괴델은 자신이 오래 못 살 것으로 생각하고 프린스턴 고등연구소의 선배 교수인 세기의 천재 폰 노이만에게 자신의 유고 정리를 부탁했다. 그러기로 약속한 노이만은 먼저 죽고 괴델은 노이만보다 21년이나 더 살다가 죽는다. 괴델의 논제는 문제를 풀 수 있느냐 없느냐다. 즉 계산의 가능성에 관한 것이다. 알고리즘 분야에서도 가능성에 관한 논의를 포함하지만 대개 풀 수 있는 문제들을 얼마나 빠른 시간에 풀 수 있느냐에 관심이 더 많다. 풀 수 있지만 너무 오래 걸리면 실용적 의미가 없다. 수행 ‘시간’은 알고리즘 연구의 중심축 중의 하나다. 1971년 스티븐 쿡과 레너드 레빈은 GSAT이란 문제를 빨리 풀 수 있으면 어마어마하게 많은 알고리즘 문제를 빨리 풀 수 있다는 것을 증명했다. 이어서 리처드 캅은 21개의 문제를 제시하며 이들 중 어느 하나라도 빨리 풀 수 있으면 GSAT 문제가 빨리 풀린다는 사실을 증명했다. 이러면 논리적 체인에 의해 앞의 ‘어마어마하게 많은’ 문제가 빨리 풀린다. 이런 식으로 한 문제를 빨리 풀 수 있으면 다른 문제가 빨리 풀리는 연결 관계를 가진 문제 군이 급속히 커졌는데, 이로부터 ‘NP-완비’라는 거대한 연구 분야가 만들어졌다. 쿡은 자신의 연구 결과가 그저 흥미로운 것 정도로 생각했고 후에 거대한 연구 분야를 만들 것이라고 전혀 짐작하지 못했다고 한다. NP-완비는 현실적인 시간 내에 잘 안 풀리는 문제들에 대한 이야기다. 고객 방문 스케줄링 문제나 반도체 디자인에서 게이트들을 배치하고 연결하는 문제 등이 가까운 예다. 실로 다양한 문제들이 NP-완비 문제 군에 속한다. 알려진 것만 적어도 수만 개는 될 것이고 이론적으로 무한히 만들 수 있다. 이 그룹의 문제들은 현재까지의 기술로는 빨리(현실적인 시간 내에) 푸는 방법이 알려져 있지 않다. 이들 중 단 하나만 현실적인 시간에 해결되면 순식간에 이 군의 모든 문제들이 현실적인 시간에 해결되어 버린다. 현실적인 시간을 의미하는 전문적 정의가 있지만 여기서는 생략한다. 장난감 사이즈를 넘어서는 문제에 대해 어떤 컴퓨터든 돌려서 죽기 전에 결과를 볼 수 있다면 현실적인 시간에 속한다는 정도로만 받아들이자. 알고리즘 과목에서 배우는 대부분의 주제가 어떻게 잘할 것인가에 관한 이야기인데 반해 NP-완비는 뭐가 잘 안되는가에 관한 이야기다. 클레이 수학연구소에서 21세기에 접어들면서 세기의 7대 난제를 정하고 각각에 대해 100만 달러씩 상금을 걸었다. 그중 하나가 “P=NP인가?”라는 질문이다. NP-완비 문제 중 하나만 현실적인 시간에 풀면 이 질문에 대한 답을 얻을 수 있어 상금을 받는다. 아마도 그런 일은 없을 것이고 현실적인 시간에 풀 수 없다는 것을 증명하는 것으로 결론이 날 것이다. 7대 난제 중 하나인 푸앵카레 추측은 2002년 러시아 수학자 그리고리 페렐만이 증명했다. 페렐만은 100만 달러를 거부하고 허드렛일을 하는 어머니와 궁핍한 생활을 하고 있다. 어떤 문제가 잘 안 풀리면 자신의 지적 역량이 부족해서 그런지, 문제 자체가 어려워서 그런지 모르는 불안한 상태가 된다. 그 문제가 NP-완비에 속한다는 것이 판명되면 이런 걱정을 접어둘 수 있다. 지난 수십 년간 많은 천재들이 시도했지만 단 한 명도 해내지 못한 일이기 때문에 거의 불가능할 것이라고 잠정 결론지을 수 있다. 그러면 주어진 시간 내에 최적 품질은 보장할 수 없지만 꽤 괜찮은 답을 찾는 것을 목표로 하면 된다. 필자의 연구실에서 박사학위를 취득한 최성순 박사는 영어 대화도 잘 안 되는 상태로 실리콘 밸리의 반도체 자동 디자인 툴을 만드는 회사에 취업했다. 처음엔 좀 고생하더니 몇 년 후 게이트의 배치와 연결 품질에 관한 NP-완비 문제의 답을 획기적으로 개선하여 회사를 도약시켰다. 이 그룹의 문제들은 이미 어떤 좋은 알고리즘이 알려졌어도 최적을 보장하지는 못하므로 항상 개선될 여지가 남아 있는 장점이 있다. 서울대학교 컴퓨터공학부 문병로 교수...과거 미분류2020년 7월 3일 금요일
2020년 6월 23일 화요일박근수 교수 연구진, 빅데이터 그래프 검색 기술 개발서울대학교 박근수 교수 연구진, 세계가 주목하는 성능의 빅데이터 그래프 검색 알고리즘 개발 박근수 교수 연구진이 개발한 슈퍼그래프 검색 기술은 화합물 등의 그래프 데이터를 인덱싱하고 특정한 패턴에 포함되는 그래프들을 찾아내는 알고리즘을 제시한 것으로서, 현재까지 알려진 알고리즘 중에서 가장 빠른 성능을 보인다. 논문에서 제안한 알고리즘은 benchmark 그래프들을 이전 최신 알고리즘들보다 최대 수십 배 빠르게 인덱싱하며 최대 수천 배 빠르게 패턴에 포함되는 그래프들을 찾아낸다. 또한 크기가 큰 패턴에서도 대량의 그래프 데이터를 빠르게 찾을 수 있다. 박근수 교수 연구진의 슈퍼그래프 검색(supergraph search) 알고리즘에 관한 최신 연구 논문은 VLDB 2020에 게재되었으며, 2020년 8월에 열리는 VLDB 2020에서 발표될 예정이다. VLDB는 데이터베이스와 빅데이터 분야에서 세계 최고로 인정받고 있는 학회이다. H. Kim, S. Min, K. Park, X. Lin, S.H. Hong, and W.S. Han, IDAR: Fast Supergraph Search Using DAG Integration, International Conference on Very Large Data Bases (VLDB) 2020....과거 미분류2020년 6월 23일 화요일
2020년 6월 15일 월요일전병곤.이영기 교수 연구실, MSRA 공동연구프로젝트 선정서울대학교 컴퓨터공학부 전병곤.이영기 교수 연구실,마이크로소프트와 공동연구 프로젝트 선정 서울대학교 컴퓨터공학부 교수진이 세계 최고 수준의 인공지능 역량을 보유한 마이크로소프트 아시아 연구소 (Microsoft Research Asia, MSRA)와의 공동연구 프로젝트를 다수 수행할 예정이다. 이번 프로젝트는 과학기술정보통신부의 2020년 글로벌 핵심인재 양성지원 사업 ‘글로벌 기업 연계형’ 과제로 추진되는 것으로, MSRA에서 정한 연구주제에 부합하는 창의적 아이디어 공모를 통해 총 12개의 과제가 선정되었다. 이 프로젝트에 참여하는 서울대학교 컴퓨터공학부 교수는 전병곤, 이영기 교수이다. 전병곤 교수는 전 지구적 규모의 데이터 센터 로그 요약 기술, 이영기 교수는 엣지 서버 기반 저지연 딥러닝 시스템 기술을 주제로 연구를 진행한다. 또한 이 프로젝트를 통해 서울대학교 컴퓨터공학부 학생들이 MSRA에 직접 방문하여 공동연구를 수행한다. 연구원으로 선정된 학생들은 6개월간 MSRA의 세계적인 인공지능 전문가들에게 공동지도를 받으며 세계적 수준의 연구결과를 도출하고 글로벌 협력 네트워크를 구축할 예정이다....과거 미분류2020년 6월 15일 월요일
2020년 6월 5일 금요일[문병로의 알고리즘 여행] 인간답지 않은 알고리즘출처: 중앙일보 2020년 6월 5일자 [문병로의 알고리즘 여행] 알고리즘은 인간의 사고와 분리해서 생각할 수 없다. 전통적인 알고리즘은 대개 시간만 충분하면 인간이 할 수 있는 일은 대신한다. 해답을 찾는 과정도 인간의 머릿속에서 먼저 구상하고 이 과정을 알고리즘으로 구현한다. ‘인간다운’ 알고리즘이라 할 수 있다. 학부의 알고리즘 클래스에서 배우는 대부분의 알고리즘이 이 부류에 속한다. 80년대 AI 분야를 풍미하던 전문가 시스템도 이 부류에 속한다. 반면 인간이 찾기 힘들거나 근본적으로 찾을 수 없는 해답을 찾는 알고리즘들이 있다. 이 부류에는 인간의 타고난 불합리성을 이용해서 인간이 비켜가는 좋은 해답을 찾는 스타일이 있고, 너무 복잡해서 인간이 근본적으로 찾을 수 없는 해답을 찾아가는 스타일도 있다. 이런 알고리즘으로 문제의 해답을 찾다보면 우리 인간이 얼마나 근본적인 한계를 지닌 존재인지를 실감하게 된다. 방대한 문제의 공간을 생각하면 인간의 머리가 조금 더 좋고 좋지 않고는 별 심각한 차이가 아니다. 두 개의 행렬을 곱하는 작업은 행렬 크기의 3제곱에 비례하는 시간이 든다는 사실은 누구도 의심하지 않은 사실이었다. 1969년에 스트라센이라는 독일 청년이 행렬 크기의 2.81제곱에 비례하는 시간이 드는 알고리즘을 내놓았을 때 수학과 컴퓨터 세계는 경악했다. 그것을 찾기까지의 경우의 수가 도저히 인간으로서 가능할 것 같지 않았다. 스트라센은 천재적인 머리로 가능성 있는 공간으로 좁히고 좁혀서 하나의 알고리즘을 찾아냈다. 이후에 위노그라드가 같은 시간이 드는 다른 알고리즘을 찾아냈다. 필자는 박사과정때부터 이들의 알고리즘과 동일한 시간이 드는 다른 알고리즘이 없을까 궁금했다. 스트라센과 같은 방식으로 필자가 직접 문제공간을 뒤져서는 승산이 없다. 저런 천재와 같은 방식으로 경쟁해야 한다면 그냥 찻집이나 하나 차려 책 읽으면서 사는 게 나을 것이다. 대신에 필자의 전문 분야인 탐색 알고리즘을 개발해서 공간을 뒤지도록 하면 어쩌면 가능하지 않을까 하는 생각을 했다. 서울대에 부임한 이후 간헐적으로 이 문제에 도전했는데 실패를 거듭했다. 모든 경우의 수를 따지는 것은 영겁의 시간이 들어 불가능했다. 선형대수적 지식을 최대한 이용해서 시간을 단축하면 모든 경우의 수를 따지는 데 6700만년 정도까지는 줄일 수 있었다. 여전히 불가능한 시간이다. 극심한 축소 탐색을 할 수밖에 없다. 유전 알고리즘과 다른 알고리즘들을 혼합해서 시도했는데 적어도 5년 이상 실패를 거듭했다. 2005년 학부생으로 필자의 대학원 유전 알고리즘을 수강하던 오승현 학생과의 연구에서 드디어 스트라센과 동일한 복잡도를 가진 알고리즘을 608개 찾아내었다. 이 중에는 스트라센과 위노그라드의 알고리즘도 포함되어 있었다. 그들의 알고리즘 말고도 같은 품질의 알고리즘이 적어도 606개나 더 있다는 사실을 발견했다. 필자의 연구 이력에서 가장 자랑스러운 논문 중 하나인데 재미있게도 학부생이랑 만들어낸 결과다. 우리가 개발한 알고리즘이 하나를 찾아내는데 평균 20분이 걸리지 않았다. 개인의 역량은 스트라센에 못 미치지만 “신에게는 공간을 여행하는 막강한 교통수단이 있습니다” 이런 기분이었다. 이런 알고리즘은 인간답지 않다. 알파고가 이세돌을 이길 때 컴퓨터 분야의 사람들조차 알파고는 모든 경우의 수를 계산해놓고 이세돌을 농락하고 있다고 많이 착각했다. 공간 탐색에 익숙하지 않으면 이렇게 착각한다. 바둑이 얼마나 어마어마한 문제공간을 갖고 있으며 알파고도 문제공간의 크기에 비해서는 쥐꼬리만큼밖에 탐색할 수밖에 없다는 사실을 이해시키기 힘들었다. 지금도 이런 착각은 여전하다. 이런 문제를 푸는 알고리즘은 극심한 축소 탐색의 기술이 핵심이다. 역시 인간답지 않다. 인간을 보는 두 가지 대조적인 관점이 있다. 하나는 인간이 우주에서 특별한 사명을 가진 존재라는 관점이다. 이 관점의 인간은 신의 외양을 재현하고 철저히 합리성을 추구하는 존재다. 다른 관점은 인간은 불완전한 존재고 진화의 과정에서 우연히 운 좋게 지구를 지배하게 된 고등 영장류라는 관점이다. 이 관점의 인간은 불완전하고, 비합리적이고, 동물적이다. 전통적인 알고리즘은 전자의 관점과 통한다. 반면 최근 이슈가 되는 알고리즘들은 후자의 관점과 통한다. 과정이 정확히 드러나지 않는 좋은 결과를 받아들여야 하는 시대가 되었다. ‘인간답지 않은’ 알고리즘의 시대가 왔다. 서울대학교 컴퓨터공학부 문병로 교수...과거 미분류2020년 6월 5일 금요일
2020년 6월 5일 금요일이재욱 교수 연구진, 빅데이터 처리 가속 아키텍처 핵심 기술 개발서울대학교 이재욱 교수 연구진, 빅데이터 처리 가속 아키텍처 핵심 기술 개발 유전체 빅데이터 분석 FPGA 가속 프레임워크 Genesis 개발 빅데이터 응용을 위한 자바 오브젝트 직렬화(serialization) 가속기 아키텍처 Cereal 개발 초저지연 SSD를 위한 하드웨어 기반 디맨드 페이징 기술 개발 및 NoSQL 데이터베이스 적용 ISCA 2020 프로그램: https://www.iscaconf.org/isca2020/program/ 이재욱 교수 연구진이 컴퓨터 아키텍처 분야의 플래그십 컨퍼런스인 제47회 ACM/IEEE International Symposium on Computer Architecture(ISCA)에 3편의 논문을 게재하였다. 올해 ISCA에는 이재진 교수 연구진의 논문을 포함하여, 전체 채택 논문 77편 중 5% 이상(4편)의 논문을 우리 학부 연구진이 게재하는 성과를 거두었다. Genesis[1]: 이재욱 교수 연구진(제1저자: 함태준 박사후 연구원)은 UC Berkeley, Duke 대학과 공동으로 유전체 빅데이터 분석의 FPGA 가속을 위한 Genesis 프레임워크를 발표하였다. 이 논문에서는 유전체 빅데이터를 데이터베이스 형태로 저장하고, 널리 사용되는 데이터 조작 연산들을 SQL 연산으로 표현한 후, 이러한 SQL 연산을 가속하기 위한 FPGA 하드웨어를 효율적으로 구현할 수 있는 방법을 제시하였다. 연구진은 Genesis 프레임워크를 이용하여, 표준 유전체 시퀀싱 파이프라인 GATK4에서 데이터 조작 연산(중복 리드 검출, 메타데이터 갱신, 품질 점수 보정)을 위한 FPGA 가속기를 설계하고, 이를 Amazon AWS F1 클라우드에 적용하여, 기존 CPU 대비 2-18배에 달하는 성능 향상과 2-15배의 비용 절감을 달성하였다. https://cse.snu.ac.kr/sites/default/files/node--notice/20200527_01_jaewlee.png Cereal[2]: 이재욱 교수 연구진(제1저자: 장재영 박사, 현 삼성전자 연구원)은 메모리 오브젝트 직렬화(serialization) 가속기 아키텍처인 Cereal을 발표하였다. Apache Spark등 분산 빅데이터 분석 환경에서 서로 다른 노드간에 정보를 전송할 때 직렬화가 필수적으로 요구되는데, 이는 상당한 성능 비용을 유발한다. 해당 연구에서는 모든 메모리 오브젝트를 순차적으로 탐색하고 처리하는 기존 알고리즘을 개선하여, 이들을 효과적으로 병렬처리 할 수 있는 새로운 직렬화 포맷을 제안하고, 이 개선된 알고리즘을 수행하는 가속기 하드웨어(Cereal)를 설계하였다. Cereal은 Apache Spark 응용 수행시 Java Serializer 대비 평균 7.9배, Kryo 대비 평균 4.8배의 (역)직렬화 성능 향상을 달성하였다. https://cse.snu.ac.kr/sites/default/files/node--notice/20200527_02_jaewlee.png 하드웨어 기반 디맨드 페이징[3]: 이재욱 교수 연구진(공동1저자 김문경 박사과정)은 성균관대와 공동으로 Ultra low-latency SSD를 위한 하드웨어 기반 디맨드 페이징(demand paging) 기술을 발표하였다. 제안된 기술은 페이지 폴트가 발생했을 때, 기존의 OS가 예외를 처리하는 대신, CPU 캐시 미스 처럼 예외 발생 없이 이를 파이프라인에서 직접 처리하는 기술이다([그림 3]). 이를 통해 OS 커널에서 낭비되는 CPU 사이클을 제거하여, OS에서 제공하는 페이지 보호 기능을 유지하면서 디스크 액세스 시간에 가까운 페이지 폴트 처리시간을 제공한다. https://cse.snu.ac.kr/sites/default/files/node--notice/20200527_03_jaewlee.png 올해 ISCA 2020은 최근 COVID-19 확산으로 인해 지난 5월 29일부터 가상 컨퍼런스로 개최되었다. 세 논문 모두 학부생 인턴이 연구에 참여하여 의미있는 기여를 하였으며, 이 중 두 논문에 공저자로 등재되었다. [1] Tae Jun Ham, et al., "Genesis: A Hardware Acceleration Framework for Genomic Data Analysis", 47th IEEE/ACM International Symposium on Computer Architecture (ISCA-47), Valencia, Spain, May 2020. [2] Jaeyoung Jang, et al., "A Specialized Architecture for Object Serialization with Applications to Big Data Analytics", 47th IEEE/ACM International Symposium on Computer Architecture (ISCA-47), Valencia, Spain, May 2020. [3] Gyusun Lee*, Wenjing Jin*, et al., "A Case for Hardware-Based Demand Paging", 47th IEEE/ACM International Symposium on Computer Architecture (ISCA-47), Valencia, Spain, May 2020. (* equal contributions)...과거 미분류2020년 6월 5일 금요일
2020년 5월 28일 목요일강유 교수 연구진, PAKDD 최우수 논문상 수상서울대학교 강유 교수 연구진,뉴스 추천 기법 관련 논문으로 PAKDD 최우수 논문상 수상 컴퓨터공학부 강유 교수 연구진(구본헌 석사, 전현식 박사과정 학생)이 데이터마이닝 분야 국제 우수 학회인 PAKDD (Pacific-Asia Conference on Knowledge Discovery and Data Mining) 2020에서 최우수 학생 논문상 (Best Student Paper) 을 수상하였다. 올해 24번째로 개최된 PAKDD 학회는 총 628편의 제출된 논문 중 135편의 논문이 채택되었으며(게재율: 21.5%), 전체 논문 중 단 한 편만이 최우수 학생 논문상을 수상하였다. 수상 논문 "Accurate News Recommendation Coalescing Personal and Global Temporal Preferences"은 뉴스 추천 기법에 관한 것으로, 개별 뉴스에 대한 대중의 선호도가 시간에 따라 급격하게 변하는 것에 기반하여 대중의 선호도와 개인의 선호도를 동시에 효과적으로 고려하여 사용자에게 정확한 뉴스 추천을 하는 방법을 제시하였다. 논문에서 제안한 방법은 개인의 선호도에만 집중하였던 기존의 연구들에 비해 최대 77%의 정확도 향상을 보였다. 뉴스 추천 서비스는 수많은 뉴스 중 사용자에게 적합한 최적의 뉴스를 제공하여 사용자의 만족도를 높이는 중요한 기술로 IT 서비스에서 널리 쓰이고 있다. 논문에서 제안한 기술은 뉴스 추천 서비스의 성능을 크게 높이는데 기여할 것으로 예상된다. 논문에 대한 자세한 내용은 아래의 링크를 통해 확인할 수 있다. 논문 소개 페이지: https://datalab.snu.ac.kr/pgt 논문 정보: Bonhun Koo, Hyunsik Jeon, and U Kang, Accurate News Recommendation Coalescing Personal and Global Temporal Preferences, PAKDD 2020...과거 미분류2020년 5월 28일 목요일
2020년 5월 4일 월요일강유.송현오 교수 연구실, 2020년 SW스타랩 선정2020년 인공지능 분야 소프트웨어(SW) 스타랩에 강유 교수 연구실과 송현오 교수 연구실이 선정되었다(교수명 가나다순). SW스타랩은 매년 3억원씩 최대 8년간 지원된다. 강유 교수의 데이터마이닝 연구실은 ‘다양한 응용과 환경을 지원하는 유연하고 효율적인 모델 압축 기술 개발’에 관한 연구를 진행한다. 최근에는 딥러닝 모델의 크기가 급격히 커지고 있기 때문에 스마트폰이나 IoT 등 자원이 제한된 환경에서 딥러닝 기술을 활용하기 어렵다. 본 연구에서는 경량화된 딥러닝 모델을 설계하고 학습하는 기술, 이미 학습된 모델이 주어졌을 때 이를 압축하는 기술, 훈련 데이터가 부족한 경우에 효율적으로 모델을 압축하는 기술을 개발한다. 본 연구는 기존에 복잡한 딥러닝 모델을 실행하기 어려웠던 스마트폰, IoT 장비 등에서 효율적으로 딥러닝 모델을 실행할 수 있게 함으로써 딥러닝의 적용 분야와 사용자를 획기적으로 늘릴 것으로 기대된다. 송현오 교수의 머신러닝 연구실은 ‘독립적으로 지속가능하고 신뢰할 수 있는 머신러닝 기술에 기반한 학습 지능 개발’에 관한 연구를 진행한다. 구체적으로 머신러닝 기술의 실제 작동 상황에서 일어나는 왜곡, 악의적 공격, 정보 편향 등에 대처 가능하고, 사용자와 능동적으로 상호작용하며 사용자 최적화를 이루는 실제 적용 가능 학습 지능을 개발한다. 본 연구에서는 실제 상황에서의 최적 적응 및 상호작용이 가능한 머신러닝 핵심 기술을 개발하여 오작동에 따른 위험 부담이 큰 자율주행이나 보안 시스템, 스스로 학습 데이터를 찾아 학습하는 범용적 학습지능 프레임워크, 제한적인 계산 환경에서 동작하는 인공지능 시스템 등에 활용하도록 한다....과거 미분류2020년 5월 4일 월요일