2024년 5월 16일 목요일서울대학교 컴퓨터공학부 x Upstage LLM 프로젝트 단기 강의 개최서울대학교 컴퓨터공학부와 Upstage는 2024년 5월 16일(목)부터 5월 18일(토)까지 3일간 302동 105호에서 LLM 프로젝트 단기 강의를 성공적으로 진행하였습니다. 이번 강의에는 총 210여 명이 등록하여 참여하였습니다. 강의에서는 컴퓨터공학부 이광근 교수님, 김건희 교수님, 그리고 Upstage 성킴 대표님의 LLM 강의를 들을 수 있었으며, 해커톤 형식의 프로젝트를 통해 LLM Apps를 이해하고 직접 제작하는 기회를 제공하였습니다.각 강의 시작 전에는 식사와 네트워킹 시간을 가졌으며, 참가자들은 조별로 프로젝트를 진행하고 발표하는 시간을 가졌습니다. 발표 결과, 가장 우수한 3팀에게는 경품이 시상되었습니다. 이번 강의를 통해 참가자들은 LLM에 대한 깊은 이해와 실전 경험을 쌓을 수 있었습니다....행사2024년 5월 16일 목요일
2024년 5월 3일 금요일제46회 및 제47회 국제 대학생 프로그래밍 경진대회 은메달 수상ICPC (International Collegiate Programming Contest) Foundation이 주최하는 세계 최대 프로그래밍 대회인 제46회, 제47회 국제 대학생 프로그래밍 경진대회(ICPC)에서 서울대학교가 각각 은메달을 수상했다. 2023년 코로나19 및 중동 분쟁으로 대회가 연기됨에 따라 올해 제46회 및 제47회 대회가 2024년 4월 18일 이집트 룩소르(Egypt Luxor)에서 같은 날에 통합해서 개최되었다.제46회에 출전한 서울대학교 'FSM'팀(김세빈, 이민제, 윤교준 학생)은 총 11개 문제 중 9문제를 해결하여 종합 6위를 기록하였으며, 제47회에 출전한 서울대학교 'HappyLastDance'팀(안정현, 이하린, 김동현 학생)은 총 11개 문제 중 8문제를 해결하여 종합 7위를 기록하여 각각 은메달을 수상하였다. 서울대학교는 2017년 대회 금메달, 2018년 대회 은메달, 2019년 대회 은메달, 2021년 대회 금메달, 2022년 금메달을 수상한 데 이어, 올해 두 대회에서 은메달을 얻으며 7회 연속으로 메달을 수상하였다(2020년 대회는 코로나19 확산으로 한 차례 연기됨). 故 염헌영 교수님께서는 해당 대회를 위해 2017년 수상 당시부터 수 년 동안 계속하여 코치를 맡아주셨으며, 최근 몇 년 동안은 서울지역대회 regional director도 맡아주셨다.ICPC는 1977년 ACM(미국컴퓨터협회) 컴퓨터 과학 컨퍼런스에서 처음 개최되어, 매년 전 세계 대학생들이 참가하는 가장 권위 있는 컴퓨터 프로그래밍 경시대회이다. 이번 대회를 위한 지역대회에는 111개국 3천여 개 대학에서 5만여 명 이상의 대학생이 참가했으며, 그 중 최상위 성적으로 지역 대회를 통과한 264개 팀, 8백여 명의 대학생이 '월드 파이널'로 불리는 본선에서 경쟁을 벌였다....수상2024년 5월 3일 금요일
2024년 4월 2일 화요일김선 교수 연구진이 네트워크 사이언스와 머신러닝을 결합하여 약물에 적합한 질병을 예측소셜 네트워크에서 활용되는 네트워크 알고리즘을 생물학적 네트워크에 적합하도록 변형머신러닝 기술을 접목시켜 약물과 질병의 치료 관계를 높은 정확도로 예측인공지능 신약개발 분야에 기존 약학, 병리학적 정보를 십분 활용하는 머신러닝 방법론의 가능성 제시 김선 교수와 아이겐드럭의 방동민 연구원이 주도한 인공지능 신약개발 분야 연구가 세계적으로 우수성을 인정받아 Nature Communications에 게재되었다. 김선 교수 연구진은 수십만가지의 의생물학적 데이터를 그래프 형태로 가공해 놓은 의생물학적 지식 그래프(biomedical knowledge graph) 를 활용하여 약물 재창출 (Drug repurposing, drug repositioning) 인공지능 모델인 드림워크(DREAMwalk)를 제시하였다. 이를 위하여, 기존의 소셜 네트워크 분야에서 활용되던 네트워크 알고리즘의 대표적인 줄기인 랜덤워크 (random walk) 알고리즘을 의생물학적 지식 그래프에 적합하도록 변형하였다.특히 의생물학적 지식 그래프는 유전자, 질병, 약물 등의 다양한 종류의 요소들로 구성되어 있으며 이들 중 대부분이 유전자와 그들 간의 관계에 치중되어 있다는 특징이 있으며, 이를 해결하기 위해 약물 간의 관계와 질병 간의 관계 지식들을 알고리즘에 효율적으로 녹여내었다. 또한 인공지능 예측 모델을 활용하여, 앞서 학습된 네트워크 정보를 기반으로 약물과 질병 간의 치료관계를 높은 정확도로 예측하였다.인공지능과 약학 분야의 융합의 산물인 본 연구는 기존에 컴퓨터 과학 분야에서 발전된 네트워크 과학 기술이 인공지능 신약개발 분야에 알맞게 변형되고, 또한 알려진 도메인의 지식을 잘 활용할 수 있도록 변형될 수 있다는 새로운 연구 패러다임의 실질적인 예를 제시하였다. 구축된 모델은 알츠하이머와 유방암에 대해 높은 신뢰도의 치료 약물을 발굴해주었으며, 이후에도 새로운 질병에 적용 가능한 약물들을 제시하도록 활용이 가능할 것으로 보인다. "Biomedical knowledge graph learning for drug repurposing by extending guilt-by-association to multiple layers", Dongmin Bang, Sangsoo Lim, Sangseon Lee & Sun Kim, Nature Communications 14.1 (2023): 3570...연구2024년 4월 2일 화요일
2024년 3월 25일 월요일제4회 CSE 종신교수 취임 기념 강연 (김건희 교수)2024년 3월 25일(월) 오후 12시 30분, 302동 105호에서 제4회 CSE 종신교수 취임 기념 강연이 개최되었습니다.이날 강연은 김건희 교수님의 종신교수 취임을 기념하여 '다양한 형식의 데이터를 이해하고 생성하는 멀티모덜 인공지능' 이라는 주제로 진행되었습니다. 본 발표에서는 김건희 교수님이 핵심 분야로 삼고 있는 멀티모덜 인공지능 연구에 대해 소개하였습니다. 박사과정 때 진행한 온라인 사진 기반 스토리라인 생성 연구부터 서울대학교에서 집중했던 시각 정보와 언어 정보의 교점에 있는 연구, 근래 초거대 멀티모덜 언어모델 개발 이후 시작된 최신 연구까지 다양하게 살펴본 후, 향후 멀티모덜 인공지능 연구 방향에 대해 살펴보았습니다.약 60분 동안 진행된 김건희 교수님의 종신교수 취임 기념 강연은 100여 명 이상의 많은 학생들과 교수님들이 참석한 가운데 성황리에 개최되었습니다.김건희 교수님은 2015년부터 서울대학교에서 교수로 재직하고 있습니다. 2018년에는 세계수준의 멀티모덜AI 기술 연구 기반으로 영상편집AI 스타트업 리플에이아이를 창업하였습니다. 김건희 교수님은 KAIST의 기계공학과에서 학사와 석사 학위를 받았으며, KIST지능로봇센터에서 연구원으로 일한 후 미국 카네기멜론대학에서 로봇학으로 석사 학위, 컴퓨터과학으로 박사 학위를 받았습니다. 또한 서울대학교에 합류하기 직전에 디즈니 연구소에서 박사후 연구원으로 일하였습니다. 2014 ACM SIGKDD 박사학위 논문상, ACM VRST 2019 최우수논문상, EMNLP 2023 우수논문상 등을 수상하였습니다. ...행사강연2024년 3월 25일 월요일
2024년 2월 26일 월요일제78회 전기 컴퓨터공학부 졸업기념행사제78회 전기 컴퓨터공학부 졸업기념행사를 2024년 2월 26일(월) 10시 30분, 26동 B101호에서 개최하였습니다. 이번 졸업기념행사는 총 졸업생 87명 중 61명(학사 35명, 석사 13명, 박사 13명)이 참석하였으며, 우수논문상과 최우등상 시상도 진행되었습니다.컴퓨터공학부 우수학위논문상은 윤용호 박사(지도교수: 이광근), 이주헌 박사(지도교수: 이영기), 이동재 석사(지도교수: 허충길), 김희아 학사(지도교수: 권태경), 민경효 학사(지도교수: 박근수), 박재현 학사(19)(지도교수: 이영기), 박재현 학사(16)(지도교수: 이창건), 엄대현 학사(지도교수: 김진수), 염준영 학사(지도교수: 주한별), 유재훈 학사(지도교수: 김태현), 이성찬 학사(지도교수: 허충길), 이아영 학사(지도교수: 황승원), 차병희 학사(지도교수: 유승주) 에게 수여되었습니다.특별히 이번 행사에서는 학부장님의 축사와 대표 학생의 답사 이후에, 오성진 테너가 졸업을 축하하는 의미에서 축가를 부르며 행사를 아름답게 장식하였습니다. 졸업생들과 가족, 친지, 교수 및 재학생 등 총 150여 명이 참석하여 졸업생들의 미래를 응원하였습니다....행사2024년 2월 26일 월요일
2024년 2월 15일 목요일제4회 민상렬 장학금 수여식 개최故 민상렬 교수님의 연구에 대한 열정과 후학 양성의 뜻을 기리고자 '민상렬 장학금'이 제정되었습니다. 민상렬장학금은 컴퓨터시스템 관련 연구업적이 탁월한 대학원생을 매년 1인 선정하여 학업/연구 장려금 600만원을 지급합니다.제4회 장학생으로 이주헌 학생(지도교수 이영기)이 선정되었습니다. 이주헌 학생의 연구 분야는 실시간 비디오 분석 시스템으로, 다중 딥 뉴럴 네트워크(DNN) 및 렌더링 연산의 동시, 실시간 수행을 요구하는 미래형 실시간 비디오 분석 응용(혼합 현실, 자율주행 등) 워크로드를 특징짓고, 이를 지원하기 위한 모바일-클라우드 협력적 AI 시스템 기술을 연구하여 모바일 컴퓨팅 분야 최우수 국제학회 및 저널에 총 3편의 논문을 주저자로 게재하였습니다(ACM MobiCom 2020 2편, IEEE Trans. on Mobile Computing 2022 1편). 이러한 성과를 인정받아, Microsoft Research Asia Ph.D. Fellowship 2020, ACM Students in MobiSys Workshop 2021 Best Paper Award, 서울대학교 AI 연구원 AI Stars Fellowship 2021, BK21 2022 우수대학원생 등 산업계, 학계에서 다수의 상을 수상한바 있습니다.민상렬장학금 수여식은 2024년 2월 8일 서울대 컴퓨터연구소 민상렬홀에서 개최되었습니다. 앞으로도 컴퓨터시스템과 관련된 연구를 하는 많은 훌륭한 학생들이 민상렬 장학생으로 선정되는 명예를 차지하길 기대합니다....연구행사수상2024년 2월 15일 목요일
2024년 2월 13일 화요일원정담 교수 연구진, "NeurIPS MyoChallenge 2023" locomotion track 1위 기록NeurlPS conference 2023 에서 열린 MyoChallenge 2023 에서 locomotion track 1위물리 기반 시뮬레이션 환경에서 다수의 근육을 갖춘 인간 모델을 효율적이고 안정적으로 원하는 방향으로 조종할 수 있도록 하는 제어 시스템 학습 알고리즘을 개발원정담 교수 연구실 박사과정생 박정남 학생(Team GaitNet)이 NeurIPS 2023에서 열린 MyoChallenge 2023 competition의 locomotion track 에서 1위를 차지하였다. MyoChallenge 2023 은 물리 기반 근골격 시뮬레이션 환경에서 주어진 목표들을 수행하도록 사람 모델의 근육을 제어하여야 하며, '목표의 달성 정도', '제어의 효율성' 등의 기준을 바탕으로 순위를 매긴다. 총 2개의 track(locomotion, manipulation) 으로 구성되어 있으며, locomotion track은 복잡한 지형 위에서 80개의 다리 근육을 제어하여, 움직이는 물체를 따라가거나 피하는 목표가 주어진다. 해당 목표를 성공적으로 수행하는 근육 제어기를 학습함으로써 실제 사람의 동작 매커니즘과 유사한 근육기반의 시뮬레이션에서 사람의 움직임에 대한 더 깊은 이해를 할 수 있다.원정담 교수 팀은 심층강화학습에 기반한 curriculum learning 을 제안하여, 빠르게 움직이는 물체를 쫓아가거나 그 물체를 피하는 목표를 수행하면서 균형을 유지할 수 있는 제어기를 학습하는 것에 성공하였다. 연구팀은 실제 인간 동작 데이터를 활용하여 기본 걷기 및 균형 잡기 기술을 학습시킨 후, 이를 바탕으로 보다 복잡하고 민첩한 동작을 습득하는 알고리즘을 제안하였다. 실제 사람의 근골격 모델을 바탕으로 하는 복잡한 시뮬레이션 환경에서 안정적면서 민첩한 제어에 성공함으로써, 사람의 동작과 근골격계 사이의 관계를 밝히는 연구에 큰 기여를 할 것으로 기대한다. ...연구수상2024년 2월 13일 화요일
2024년 1월 4일 목요일송현오 교수 연구진, 데이터 효율적인 강화학습 및 대규모 데이터셋 분석 기술로 세계 선도보상함수의 모델링 없이 사용자 선호 (preference) 데이터만으로 강화학습 에이전트 학습마인크래프트와 같은 대규모 게임에서 작동하는 강화학습 에이전트 개발대규모 데이터셋의 레이블 오류와 이상치 데이터를 식별하는 프레임워크 개발송현오 교수 연구진이 선호 정보를 직접적으로 최적화 하는 강화학습 알고리즘, 절차적 생성 환경을 위한 데이터 효율적인 계층적 강화학습 알고리즘, 그리고 일반적인 도메인에 적용가능한 대규모 데이터 분석 프레임워크를 개발하였다. 선호 데이터를 통한 강화학습 [1]: 기존의 강화학습 알고리즘은 잘 정의된 보상함수를 요구하기 때문에 현실 적용에 어려움이 있었다. 본 연구진은 대조학습 방법을 활용하여 보상함수 없이 인간의 선호 데이터만을 가지고 에이전트를 학습할 수 있는 강화학습 알고리즘을 제시하였다. 개발된 알고리즘은 기존의 보상함수를 활용하는 방법 대비 더 적은 학습 데이터로 더 우수한 성능을 달성하며, 보상함수 정의가 어려운 일반적인 환경에 적용 가능하다.대규모 게임에서 작동하는 강화학습 [2]: 본 연구진은 마인크래프트와 같이 다양한 시각적 변이가 존재하는 대규모 환경에서 효율적으로 작동하는 새로운 계층적 강화학습 에이전트을 개발하였다. 본 연구진은 대조학습 기법을 이용하여 에이전트의 시각 인코더가 하위 작업 계층구조의 내재된 정보를 스스로 학습하도록 설계하였다. 개발된 알고리즘은 Google DeepMind가 최근 발표한 강화학습 알고리즘인 DreamerV3에 비해 파라미터 수를 4%만 사용하면서 50%의 성능 향상을 보였다.대규모 데이터셋 분석 [3]: 인공신경망 학습에 활용되는 대규모 데이터셋은 레이블 오류 혹은 이상치와 같은 복합적인 문제를 지며, 이는 인공신경망의 학습 성능을 저하하는 주요 원인이다. 본 연구진은 데이터셋의 복합적인 문제를 효율적으로 탐지하는 데이터 관계 기반 그래프 알고리즘을 개발하였다. 제안하는 데이터 분석 프레임워크는 이미지,오디오,텍스트 등 일반적인 도메인에 적용 가능하며 수백만 크기의 대규모 데이터셋에도 효율적으로 적용 가능하다.해당 연구들은 머신러닝 최우수 학회인 NeurIPS 2023에 발표되었다.[1] "Direct Preference-based Policy Optimization without Reward Modeling", Gaon An*, Junhyeok Lee*, Xingdong Zuo, Norio Kosaka, Kyung-Min Kim, Hyun Oh Song, NeurIPS 2023[2] "Discovering Hierarchical Achievements in Reinforcement Learning via Contrastive Learning", Seungyong Moon, Junyoung Yeom, Bumsoo Park, Hyun Oh Song, NeurIPS 2023[3] "Neural Relation Graph: A Unified Framework for Identifying Label Noise and Outlier Data", Jang-Hyun Kim, Sangdoo Yun, Hyun Oh Song, NeurIPS 2023...연구2024년 1월 4일 목요일
2023년 12월 22일 금요일제41회 대학생 수학 경시대회 수상(유태영, 이기석, 김태윤, 전진용 학생)제41회 대학생 수학 경시대회에서 학부생 4명 수상1분야에서 유태영, 이기석 학생이 금상, 2분야에서 김태윤, 전진용 학생이 은상으로 우수한 성적을 거둠2023년 11월 11일(토)에 개최된 제41회 대학생 수학 경시대회에서 우리 학부 학생 4명(유태영, 이기석, 김태윤, 전진용 학생)이 훌륭한 성적을 거두어 수상하였습니다. 해당 대회는 대학교 재학생들을 대상으로 진행되는 경시대회로 제1분야(수학 및 수학 관련 학과 대학생), 제2분야(제1분야 이외의 학과 대학생)으로 나누어서 진행되었습니다.유태영, 이기석 학생은 금상, 김태윤, 전진용 학생은 은상을 수상하여 전국 대학생들 중에서 우수함을 인정받았습니다. 이러한 수상은 각 학생들에게 상장 등으로 시상되었습니다....수상2023년 12월 22일 금요일
2023년 12월 20일 수요일서울대 김현우 박사, 국제 최우수 AI 학회 EMNLP2023에서 국내 대학 연구자 최초로 논문상 수상거대 언어모델을 활용하여 기호 기반 상식 그래프에 맥락을 더하는 방법론을 개발하여 세계 최초의 백만 단위 세계 최대 규모 고품질 일상 대화 데이터셋 SODA를 무료로 공개데이터셋 SODA는 다방면에서 기존 대화 데이터셋보다 품질이 훨씬 뛰어나, 이에 학습한 대화 모델은 기존모델들보다 더 자연스러운 답변 생성 가능김현우 박사가 서울대 박사과정 중 미국 시애틀의 AI2에 인턴을 수행하며 국제 협력 연구를 이끌었으며 졸업 후 AI2에서 박사후 연구원으로 취업하여 후속 연구 이어가는 중김현우 박사와 김건희 교수가 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI; AI2) 및 워싱턴 대학교(University of Washington)의 최예진 교수 등과 함께 진행한 연구가 국제 최우수 자연어처리 학술대회 EMNLP 2023에서 Outstanding Paper Award를 수상하였다. 국내 대학 연구진이 EMNLP에서 수상을 한 것은 이번이 최초다.기존 인공지능 대화 분야는 고질적으로 데이터 부족 문제에 시달려왔다. 왜냐하면 일상에서 이루어지는 대화들은 데이터로 기록되지 않는 경우가 대부분이기 때문이다. 설령, 문자 메세지나 이메일 같은 형태로 대화가 기록되더라도 여러 법적 제약들이 존재하기 때문에 이를 연구에 활용하기에는 어려웠다. 이에 대한 대안으로 그동안 크라우드 소싱을 통해 대화 데이터셋을 제작하여 왔지만 이는 비용도 많이 들뿐더러 만들 수 있는 데이터셋 크기도 작은 문제점이 있다. 그 결과, 기존 대화 관련 연구들은 모두 소수의 작은 데이터셋 위에서 이루어져 범용성에 큰 제약이 있었다.수상 논문인 ‘사회 상식 맥락화 기법을 통한 백만 단위의 대화 증류(SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization)’는 이를 해결하기 위해 거대 언어모델(large language model; LLM)과 기호 기반 상식 그래프(symbolic commonsense knowledge graph)를 함께 사용하여 데이터셋을 효율적으로 자동 구축하는 방법론인 CO_3 증류 프레임웍(distillation framework)을 제시하였다. 기존에 크라우드 소싱을 활용할 경우 대화 하나 당 길게는 몇 분이 걸리던 작업을 CO_3 프레임웍은 6초 내외로 단축시킨다.연구팀은 이를 통해 세계 최초로 150만 규모의 세계 최대 고품질 일상 대화 데이터셋인 SODA를 무료로 공개하였는데, 이는 기존 데이터셋 대비 100배 큰 규모다. 크기 뿐만 아니라, 대화의 자연스러움, 일관성, 구체성 등 품질 또한 기존 크라우드 소싱 기반 대화 데이터셋에 비해 2배 이상 뛰어난 것으로 연구 결과가 나타났다. 그 결과, SODA에 학습시킨 챗봇 COSMO는 파라미터 수가 30억 개로 작은 크기임에도 불구하고 기존 큰 챗봇들(파라미터 수 70억)보다 대화 맥락에 더 적합하고 자연스러운 답변이 가능하다.이번 연구는 대화 데이터셋 부족 문제를 해결하고, 누구나 간편하게 세계 최대 규모의 고품질 대화 데이터셋을 구축할 수 있는 방법론을 제시했다는 데에 의의가 있다. 이 방법론으로 탄생한 데이터셋 SODA는 다양한 대화 연구에 기반 자료로 쓰일 수 있을 것으로 기대된다. 해당 코드, SODA 데이터셋, COSMO 모델은 모두 오픈소스로 공개되어 있다.해당 논문은 미국 시애틀의 앨런 인공지능 연구소(Allen Institute for AI; AI2), 워싱턴 대학교(University of Washington), 카네기멜론 대학교 (Carnegie Mellon University), 서던 캘리포니아 대학교 (University of Southern California), 그리고 피츠버그 대학교 (University of Pittsburgh)와 함께 국제 공동협력 연구로 이루어낸 결과다. 김현우 박사와 김건희 교수는 정보통신기획평가원(IITP)의 연구비를 지원받았다(No.2019-0-01082, No.2022-0-00156).“SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization”, Hyunwoo Kim, Jack Hessel, Liwei Jiang, Peter West, Ximing Lu, Youngjae Yu, Pei Zhou, Ronan Le Bras, Malihe Alikhani, Gunhee Kim, Maarten Sap, and Yejin Choi....연구수상2023년 12월 20일 수요일