1. Community
  2. arrow_forward_ios

News

Tags
Search
all

배준익 학생, NeurIPS 2025 PokéAgent 챌린지 스피드런 트랙 우승

세계적인 인공지능 학회 NeurIPS 2025에서 열린 포켓몬 게임 기반 AI 대회인 PokéAgent 챌린지에서, 본교 컴퓨터공학부 4학년 배준익 학생이 스피드런(speedrun) 트랙 우승을 차지했다. 이번 챌린지는 포켓몬 에메랄드 환경을 기반으로 강화학습(RL)과 대형 언어 모델(LLM)을 결합한 새로운 형태의 에이전트를 평가하기 위해 설계되었다. 스폰서로는 구글 DeepMind가 참여했으며, Princeton, CMU, UT Austin 등 주요 연구 기관의 연구진이 공동으로 대회를 기획했다. 총 상금 규모는 1만 5천 달러를 상회하며, 우승팀에게는 NeurIPS 워크숍 발표 초청과 대회 보고서 공동 저자 참여 기회 등이 제공된다.스피드런 트랙은 에이전트가 포켓몬 에메랄드를 가능한 한 빠르게 엔딩까지 진행하도록 설계된 과제로, 부분 관측(partial observability) 환경에서 수천 타임스텝에 걸쳐 일관된 전략을 유지해야 하는 long-horizon planning 문제라는 점이 특징이다. 배준익 학생이 개발한 에이전트는 약 40분 만에 게임을 완주해, 약 70분을 기록한 2위 팀을 큰 격차로 앞서며 스피드런 트랙 1위를 기록했다.우승 에이전트의 핵심은 LLM 기반 코드 생성(code generation)을 활용한 계층적 계획 방식에 있다. 먼저 LLM이 주어진 장기 목표를 여러 하위 목표(subgoal)로 자동 분해하고, 각 하위 목표를 처리하기 위한 파이썬 코드 형태의 루틴을 생성한다. 이렇게 생성된 코드 루틴은 에이전트가 어떤 상태에서 어떤 행동을 택해야 할지에 대한 구조화된 힌트나 보상 신호 역할을 하며, 강화학습이 더 빠르고 안정적으로 수렴하도록 돕는다. 계획이 코드로 남기 때문에 사람이 에이전트의 의사결정 과정을 추적하고 수정하기에도 비교적 수월하다는 장점이 있다.배준익 학생은 이번에 개발한 LLM+RL 하이브리드 에이전트를 샌드박스형 시뮬레이션 게임 등 다른 복잡한 환경으로 확장해 실험할 계획이다. 나아가 로보틱스와 같이 복잡한 장기 의사결정이 요구되는 분야로 응용 범위를 넓히는 후속 연구도 추진할 예정이다. 본 연구는 연세대학교 이영운 교수와 서울대학교 박재식 교수의 지도 하에 컴퓨터공학부 학부 졸업논문으로 정리될 계획이다....
포스트 대표 이미지
포스트 대표 이미지

박재식 교수 연구진, 복잡한 실세계 문제 해결하는 AI 플래닝 기술 TDP 개발

기존 AI 플래너의 한계를 극복하는 제로샷(zero-shot) 테스트 시간(test-time) 플래닝 프레임워크 개발탐색(Exploration)과 활용(Exploitation)의 균형을 맞추는 트리 탐색(tree search) 기반의 이중(bi-level) 샘플링 접근법 제시미로 탐색, 로봇 팔 제어 등 복잡한 문제에서 기존 최신 기술 대비 뛰어난 성능 입증박재식 교수 연구진이 복잡하고 예측 불가능한 환경에서도 AI가 최적의 행동 계획을 수립할 수 있는 새로운 기술, TDP(Tree-guided Diffusion Planner)를 개발하였다. 사전 학습된 확산 모델(diffusion model)을 활용한 AI 플래닝은 주어진 문제를 해결하기 위한 일련의 행동 순서를 생성하는 효과적인 접근법이다. 기존 기술들은 보상(reward) 구조가 단순하고 미분 가능한 볼록(convex)한 문제에서는 잘 작동했지만, 여러 개의 상충하는 목표가 있거나(non-convex), 특정 규칙을 반드시 지켜야 하는(non-differentiable) 복잡한 실제 환경에서는 최적의 해를 찾지 못하고 국소 최적해(local optima)에 머무르는 한계를 보였다. 또한, 새로운 문제에 적용하기 위해 추가적인 학습이나 전문가 데이터가 필요하여 유연성이 떨어졌다.연구진은 이러한 문제를 해결하기 위해, 추가 학습 없이 테스트 시간에 바로 적용 가능한 제로샷(zero-shot) 플래닝 프레임워크인 TDP를 제안하였다. TDP는 행동 계획 수립을 트리 탐색 문제로 재구성하여, 광범위한 가능성을 탐색(Exploration)하는 단계와 주어진 목표에 맞춰 계획을 구체화하는 활용(Exploitation) 단계를 유기적으로 결합했다. TDP의 핵심적인 이중(bi-level) 샘플링 과정은 다음과 같다:상위 가지 생성 (Parent Branching):훈련 없이 사용 가능한 파티클 유도(particle guidance) 방식을 통해 서로 다른 다양한 초기 경로들을 생성하여 탐색 공간을 넓힌다.하위 트리 확장 (Sub-Tree Expansion):생성된 다양한 부모 경로들을 바탕으로, 주어진 목표(task objective)에 최적화된 자식 경로들을 빠르고 정교하게 다듬는다.이러한 이중 샘플링 구조를 통해 TDP는 기존의 단순한 그래디언트 기반 안내(gradient guidance) 방식이 빠지기 쉬운 국소 최적해 문제를 효과적으로 해결한다. 연구진은 (1) 미로 속 중간 목표물 찾기, (2) 로봇 팔을 이용해 최적 위치에 블록 쌓기, (3) 개미형 로봇의 여러 목표 지점을 순서대로 방문해야 하는 탐색 등 세 가지 복잡한 테스크에서 TDP가 기존 최첨단 기술들을 모두 능가하는 성능을 보임을 실험적으로 입증했다. 본 연구는 인공지능 분야 최고 권위 학술대회 중 하나인 NeurIPS2025에 정식 논문으로 채택되어 12월 중 발표될 예정이며, 이 논문을 포함하여 박재식 교수 연구실에서는 총 4편의 논문을 NeurIPS에 발표할 예정이다....
포스트 대표 이미지

송현오 교수 연구진 NeurIPS oral presentation 논문 선정 (상위 0.35%, 77/21575)

NeurIPS 2025 3편 (이중 1편은 Oral Presentation, 최상위 0.35% = 77/21,575 선정) 및 TMLR 1편 게재문맥 복원 기반 중요도 정량화를 활용한 질의 비의존적 KV 캐시 압축 기법 개발 (oral)최적 비트 할당을 위한 분수 비트 LLM 양자화기 집합 및 혼합 비트 양자화 기법 개발강화 자기학습을 통한 언어 모델 기반 탐색 기법 개발대규모 시스템에서 표적 변수에 대한 인과 변수들을 효율적으로 추론하는 기계학습 기반 인과 추론 기법 개발송현오 교수 연구진이 질의 비의존적 KV 캐시 압축, 최적 비트 할당을 위한 분수 비트 LLM 양자화기, 강화 자기학습을 통한 언어 모델 기반 탐색 기법, 기계학습 기반 인과 추론 기법을 개발하였다.1. 질의 비의존적 KV 캐시 압축 [1] (Oral Presentation, 최상위 0.35%): 본 논문은 LLM 추론 과정의 메모리와 답변 속도 향상을 위한 KV 캐시 압축 기법인 KVzip을 제안한다. ChatGPT와 같은 Transformer LLM은 사용자 정보나 이전 대화 내용과 같은 맥락 정보를 KV 쌍의 형태로 캐싱한다. KVzip은 이러한 맥락 정보를 담고 있는 KV 쌍의 중요도를 측정하고, 중요도가 낮은 KV 쌍을 캐시로부터 방출 함으로써 압축을 수행한다. 기존 기법들의 경우 압축 과정에서 LLM 추론 성능이 크게 감소하지만, KVzip은 30% 압축 수준까지 임의의 하위 태스크에 대한 성능을 유지한다. 특히 LLaMA, Qwen, Gemma와 같은 최첨단 언어모델의 수십 GB에 달하는 KV 캐시의 크기를 최대 4배까지 무손실로 줄이며, 디코딩 속도를 2배 향상하는 데 성공하였다. 아울러 KVzip은 NVIDIA의 KV 캐시 압축 라이브러리인 KVPress에 통합되어 최고 수준의 성능을 보이며, 사용자는 KVPress를 이용하여 간편하게 KVzip을 사용할 수 있다. 본 기술은 기업 규모의 대규모 검색 증강 (RAG) 시스템, 사용자의 개인화된 맥락을 사용하는 시스템 등에서 특별히 유용하게 적용될 수 있다.2. 최적 비트 할당을 위한 분수 비트 LLM 양자화기 [2]: 본 논문은 LLM 경량화를 위해 분수 비트 양자화기 집합 Q-Palette와 이를 활용한 혼합 비트 양자화 기법을 제안한다. 최근 모델 가중치의 이상치를 완화하기 위해 가중치를 회전 변환하는 기법이 활발히 연구되고 있다. 본 연구에서는 회전 변환을 통해 가우시안화된 가중치 분포를 전제로 정보이론적으로 최적의 비트 할당을 분석하고, 이에 가까운 비트 할당을 위해 더욱 조밀한 분수 비트를 지원하는 양자화기 집합 Q-Palette를 개발하였다. 또한 비트 할당 과정에서 레이어 병합까지 함께 고려하는 혼합 비트 양자화 기법을 통해 추론 속도를 더욱 향상시켰다. 그 결과, 기존 NormalFloat 대비 적은 정확도 손실로 디코딩 속도를 36% 향상하는 데 성공하였다.3. 강화 자기학습을 통한 언어 모델 기반 탐색 [3]: 본 논문은 거대 언어 모델의 탐색 효율을 향상시키기 위한 강화학습 알고리즘인 Guided-ReST를 제안한다. OpenAI o1과 같은 추론 특화 모델은 광범위한 탐색을 통해 높은 성능을 달성하지만, 이는 종종 비효율적인 탐색 경로와 불필요한 토큰 소모를 야기하는 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구는 고품질의 합성 탐색 데이터를 생성하고 이를 바탕으로 모델이 스스로 더 나은 탐색 전략을 학습하도록 유도하는 새로운 강화 학습 알고리즘을 개발했다. 제안된 기법은 고난도 연산 추론 벤치마크인 Countdown에서 정확도와 추론 효율을 각각 10%, 50%씩 크게 향상시켰고, MATH-500과 AMC-23 같은 더욱 복잡한 실제 수학 문제에서도 그 확장성을 입증하였다.4. 대규모 시스템에서도 효율적인 인과 추론 [4]: 본 논문은 대규모 시스템에서 전체 인과 그래프 추론 없이 표적 변수(target variable)의 인과 변수(causal variable)를 추론하는 지도학습 기반 인과 추론 방법을 제안한다. 기존 인과 추론 기법은 전체 인과 그래프 추론을 필요로 해 변수 수가 많은 거대 규모 시스템에서 연산 부담이 컸다. 본 연구는 시뮬레이션 데이터로 학습한 신경망 모델과 샘플링 기반 추론(subsampled inference) 전략을 적용해 변수 수 증가에 따라 알고리즘 복잡도가 선형적으로 확장될 수 있도록 설계하였다. 그 결과 대규모 유전자 조절 네트워크에서 최첨단의 인과 발견 성능을 달성하는 데 성공하였다.해당 연구들은 머신러닝 최우수 학회인 NeurIPS 2025와 저널인 TMLR에 발표될 예정이다.[1] “KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction”, Jang-Hyun Kim, Jinuk Kim, Sangwoo Kwon, Jae W. Lee, Sangdoo Yun, Hyun Oh Song, NeurIPS 2025[2] “Q-Palette: Fractional-Bit Quantizers Toward Optimal Bit Allocation for Efficient LLM Deployment”, Deokjae Lee, Hyun Oh Song, NeurIPS 2025[3] “Learning to Better Search with Language Models via Guided Reinforced Self-Training”, Seungyong Moon, Bumsoo Park, Hyun Oh Song, NeurIPS 2025[4] “Large-Scale Targeted Cause Discovery with Data-Driven Learning”, Jang-Hyun Kim, Claudia Skok Gibbs, Sangdoo Yun, Hyun Oh Song, Kyunghyun Cho, TMLR...
포스트 대표 이미지

이영기 교수, 2026년 ACM MobiSys 프로그램위원장 선임

​이영기 교수가 세계적인 모바일 시스템 학술대회인 ACM MobiSys 2026의 프로그램위원장(Technical Program Committee Co-Chair)으로 선임됐다. 이 교수는 2026년 열리는 MobiSys 학술대회에서, 논문 심사와 프로그램 구성을 총괄하는 핵심 역할을 맡는다. 그는 전 세계 연구자들로 구성되는 프로그램위원회(TPC)를 조직하고, 학회에 제출되는 수백 편의 논문 중에서 발표작을 선정하는 중요한 과정을 주도할 예정이다.ACM MobiSys(International Conference on Mobile Systems, Applications, and Services)는 ACM SIGMOBILE의 대표 국제 학회로, 모바일·IoT·AI 기술 기반의 차세대 시스템과 서비스를 다룬다. 컴퓨팅 기술의 미래를 제시하고, 창의성과 기술력을 함께 평가받는 학술대회다. ​이영기 교수는 온디바이스 AI 시스템, 증가상 현실, 인터렉티브 AI 에이전트 등 다양한 분야에서 활발한 연구를 이어오고 있다. 특히 인공지능 기술과 사용자 경험을 융합한 차세대 컴퓨팅 플랫폼 연구를 선도하고 있으며, 관련 분야 국제 학회와 산업계에서도 폭넓은 협업을 이어가고 있다. 이번 프로그램위원장 선임은 이 교수의 국제적 연구 역량과 학계 내 입지를 반영하는 것으로 평가된다. 2026년 MobiSys 학회는 전 세계 연구자들의 주목 속에 차세대 모바일·IoT 시스템 기술의 방향성을 제시하는 자리가 될 전망이다....
포스트 대표 이미지

이재욱 교수 연구진, 머신러닝 포텐셜(MLIP) 기반 분자동역학 가속을 위한 FlashTP 라이브러리 개발

​분자동역학에서 대두되는 머신러닝 기반 포텐셜 (MLIP)의 학습·추론 단계의 병목인 Tensor‑Product 레이어를 가속하는 GPU 라이브러리인 FlashTP 개발FlashTP 라이브러리를 서울대 재료공학부 및 삼성종합기술원에 제공해 세계 최고 수준의 MLIP 모델 개발 성공ICML 2025  Spotlight Poster (최상위 2.6%) 논문선정이재욱 교수 연구진이 분자동역학(Molecular Dynamics Simulation)에 사용되는 머신러닝 기반 포텐셜(MLIP)의 학습 및 추론 단계에서 주요 병목으로 작용하는 Tensor‑Product 레이어를 획기적으로 가속화하는 GPU 커널 기반 라이브러리 FlashTP를 개발했다. 라이브러리는 파편화된 연산을 하나의 커널로 통합(kernel fusion)해 중간 결과에 대한 메모리 전송을 대폭 줄이고, 연산 내 희소성(sparsity)을 이용해 불필요한 계산을 제거했으며, 입력값 재사용을 최적화해 메모리 통신량을 감소시켰다.이 결과, 화학·생물학·재료공학 등 다양한 분야에서 MLIP를 활용한 대규모 분자동역학 시뮬레이션의 처리 속도가 종전 대비 수십 배 향상되어, 기존에 불가능했던 대규모 시스템에 활용이 가능해졌다. 이재욱 교수 연구진은 FlashTP를 서울대 재료공학부 한승우 교수 연구진 및 삼성종합기술원에 제공하였고, 이들은 FlashTP를 사용해 최고 수준의 MLIP 모델(EquFlash)을 개발하였다.한편, 본 연구 성과는 지난 7월에 개최되는 머신러닝 분야 최고 권위의 학회인 ICML 2025에 발표되었다. 특히 전체 제출된 12,107 편의 논문 중 313편(최상위 2.6%)만 선정되는 스포트라이트 포스터(Spotlight Poster)로 채택되어 그 우수성을 인정받았다.“FlashTP: Fused, Sparsity-Aware Tensor Product for Machine Learning Interatomic Potentials”, Seung Yul Lee, Hojoon Kim, Yutack Park, Dawoon Jeong, Seungwu Han, Yeonhong Park and Jae W. Lee, ICML 2025.​...
포스트 대표 이미지

유영재 교수, Google Research Scholar Award의 2025년 수상자로 선정

​유영재 교수, Google Research Scholar Award의 2025년 수상자로 선정​한국 교수로는 최초로 AI, NLP 분야에서 수상​컴퓨터공학부 및 첨단융합학부 신임교수인 유영재 교수가 Google Research Scholar Award의 2025년 수상자로 선정되어 올해 9월부터 구글과 협력 프로젝트를 시작하게 되었다. 이 상은 전 세계 대학의 신진 연구자를 대상으로 컴퓨터 과학 및 관련 분야의 연구를 지원하고, 구글과의 협업 및 장기적 파트너십을 도모하기 위한 글로벌 프로그램이다.유영재 교수는 올해 자연어처리(NLP) 분야에서 수상한 다섯 명의 교수 중 하나로, 한국 교수로는 최초로 AI, NLP 분야에서 수상하는 성과를 거두었다. 이번 수상을 통해 약 7천만 원 규모의 연구비를 지원받게 되며, Embodied Commonsense Reasoning for Safe, Human-Like AI Agents 라는 주제로 대규모 언어모델 및 Physical AI, Safety 연구를 Google 연구자들과 장기적인 협업으로 추진할 계획이다.Google Research Scholar Award는 매년 인공지능, 시스템, 로보틱스, 보안, HCI 등 다양한 분야에서 혁신적인 성과를 보인 연구자를 선정하고 있으며, 수상자 명단은 전 세계 연구자들에게 공개된다. 전체 수상자 명단과 관련 소식은 구글 리서치 공식 웹사이트(Google Research Scholar Program Recipients)에서 확인할 수 있다....
포스트 대표 이미지

박재식 교수 연구진, 제로샷 3D 포인트클라우드 정합 기술 ‘BUFFER-X’로 최우수 컴퓨터비전 학회 ICCV 2025 Highlight 선정

사전 정보나 매뉴얼 파라미터 튜닝 없이 동작하는 제로샷 3D 포인트클라우드 정합 기술 개발다중 스케일 적응 정합 파이프라인 및 학습 기반 키포인트 검출기 제거로 일반화 성능 극대화실내외, 다양한 센서 조건 포함한 11개 벤치마크에서 기존 SOTA 기법 대비 빼어난 성능 입증박재식 교수 연구진이 MIT SPARK LAB과 함께 복잡하고 다양한 환경에서도 학습 없이 바로 동작하는 제로샷(Zero-Shot) 3D 포인트클라우드 정합(point cloud registration) 기술을 개발하였다. 3D 포인트클라우드 정합은 기술은 서로 다른 시점이나 위치에서 촬영된 포인트클라우드를 하나의 좌표계로 정확히 맞추는 기술이다. 해당 기술은 3차원 센서를 활용하는 자율주행, 로봇 내비게이션, 3D 지도 제작 등 다양한 분야에서 핵심적인 역할을 한다. 현존하는 정합기술이 가진 문제는 포인트클라우드가 라이다(LiDAR), 3D 스캐너, 심도 카메라(depth camera) 등 서로 다른 특성을 가진 센서에서 얻어지면, 데이터의 밀도, 해상도, 노이즈 특성이 달라 환경이 바뀌어 성능이 쉽게 저하된다.특히 기존 학습 기반 정합 기술은 특정 센서나 환경에 맞춰 학습해야만 높은 성능을 낼 수 있었으며, 테스트 환경이 달라질 때마다 파라미터를 수동으로 조정해야 하는 어려움이 있었다. 연구진은 이러한 한계를 극복하기 위해, 사전 학습 없이도 다양한 환경에서 즉시 동작할 수 있는 제로샷 정합 파이프라인 BUFFER-X를 제안했다.BUFFER-X는 데이터의 기하적 특성을 자동으로 분석해 최적의 파라미터를 설정하고, 사전 학습된 모델 없이도 정합에 필요한 핵심 지점을 안정적으로 추출한다. 또한 크기와 해상도가 다른 데이터 간의 차이를 보정해 정확한 정합을 가능하게 하며, 작은 범위부터 큰 범위까지 일관성 있게 매칭이 이루어지도록 설계됐다.이러한 BUFFER-X 파이프라인은 RGB-D, 라이다(LiDAR) 등 다양한 센서 환경과 실내외를 아우르는 11개 공개 데이터셋을 기반으로 구성된 신규 제로샷 일반화 벤치마크(Zero-Shot Generalization Benchmark)에서 기존의 학습 기반 최신 기법들을 압도하는 성능을 보였다.본 연구는 컴퓨터 비전 분야 최우수 학술대회 중 하나인 ICCV 2025에 오는 2025년 10월 발표 예정이며, 우수논문 상위 약 10%에 해당하는 Highlight 논문으로 선정되었다."BUFFER-X: Towards Zero-Shot Point Cloud Registration in Diverse Scenes", Minkyun Seo*, Hyungtae Lim*, Kanghee Lee, Luca Carlone, Jaesik Park, International Conference on Computer Vision (ICCV), 2025....
포스트 대표 이미지
포스트 대표 이미지

이재진 교수 연구팀, 법원 판결문 내 개인정보를 비식별화하는 AI 개발

이재진 교수 연구팀이 인공지능(AI)를 이용해 법원 판결문 내 개인정보를 빠르게 비식별화하는 기술을 개발했다. 이재진 교수가 이끄는 서울대 데이터사이언스대학원 연구팀은 판결문의 개인정보를 비식별화하는 ‘SNU Thunder-DeID 모델’을 개발하였다. 연구팀은 개발 과정에서 강제추행·폭행·사기 등 3가지 형사 사건으로 구성된 4500건의 판결문으로부터 2만 7000여 개의 개체를 추출하는 방식을 이용했다. 이후 수작업으로 이를 라벨링한 뒤 595종의 세분화된 개인식별정보 유형 체계를 수립해 정밀하게 비식별 처리가 가능하도록 학습 데이터를 구축했다.​헌법 제109조에 따르면 판결문은 민·형사 소송법 관련 규정에 제시된 절차와 근거를 바탕으로 열람 및 복사가 가능하다. 여기에 더해 법원은 판결서 등의 열람 및 복사를 위한 비실명 처리기준 규정에 따라 판결문 내 개인정보와 간접식별정보(다른 정보와 결합해 개인을 식별할 수 있게 하는 정보)를 가리고 공개해야 한다. 그러나 2019년 발표된 ‘판결문 공개 확대를 위한 국회토론회’ 자료에 따르면 법원행정처의 ‘지능형 비식별 시스템’ 정확도는 15%에 불과하다. 법원행정처에 따르면 시스템의 처리율도 8% 수준으로 매우 낮은 상황이다. 대부분의 비식별화 작업이 수작업에 의존하게 되면서 재판 공개가 병목 현상을 빚는 이유다.연구팀이 개발한 AI 모델은 판결문 내 표현의 비식별화 대상 여부를 99% 이상의 정확도로 판별하는 것으로 나타났다. 이름·주소·기관명 등 비식별화 대상으로 판별된 항복의 세부 유형 분류도 89% 이상의 성능이 측정됐다. 연구팀은 “헌법상 재판공개의 원칙에 따라 국민에게 공개되어야 하는 판결문이 비식별화 작업의 병목으로 인해 원활히 공개되지 못하고 있다”면서 “이 연구는 AI 기술이 단순한 기술적 성능을 넘어, 공공성과 법적 가치를 함께 고려할 수 있는 수단이 될 수 있다는 점을 보여준다”고 밝혔다.연구팀은 이번 연구에서 개발한 모델과 데이터셋, 데이터 구축 과정에 사용된 소스코드를 공개했다. 모델 관련 정보들은 법원·검찰·변호사 단체 등에서 판결문과 재판기록물 공개를 위한 자동 비식별 처리 시스템으로 활용될 수 있다. 연구팀은 형사 사건뿐 아니라 민사 사건과 행정·특허 소송 판례, 진술서·수사보고서 등 다양한 재판기록물을 아우르는 법률 특화 언어모델 연구의 기반을 마련하는 것을 목표로 후속 연구를 이어갈 전망이다.​※ 출처: "AI로 판결문 비식별화 빠르게…서울대 연구팀, 99% 정확도 AI 개발", 서울경제, 2025년 7월 8일​...
포스트 대표 이미지