1. 소식
  2. arrow_forward_ios

새 소식

태그
검색
전체

박재식 교수 연구진, 제로샷 3D 포인트클라우드 정합 기술 ‘BUFFER-X’로 최우수 컴퓨터비전 학회 ICCV 2025 Highlight 선정

사전 정보나 매뉴얼 파라미터 튜닝 없이 동작하는 제로샷 3D 포인트클라우드 정합 기술 개발다중 스케일 적응 정합 파이프라인 및 학습 기반 키포인트 검출기 제거로 일반화 성능 극대화실내외, 다양한 센서 조건 포함한 11개 벤치마크에서 기존 SOTA 기법 대비 빼어난 성능 입증박재식 교수 연구진이 MIT SPARK LAB과 함께 복잡하고 다양한 환경에서도 학습 없이 바로 동작하는 제로샷(Zero-Shot) 3D 포인트클라우드 정합(point cloud registration) 기술을 개발하였다. 3D 포인트클라우드 정합은 기술은 서로 다른 시점이나 위치에서 촬영된 포인트클라우드를 하나의 좌표계로 정확히 맞추는 기술이다. 해당 기술은 3차원 센서를 활용하는 자율주행, 로봇 내비게이션, 3D 지도 제작 등 다양한 분야에서 핵심적인 역할을 한다. 현존하는 정합기술이 가진 문제는 포인트클라우드가 라이다(LiDAR), 3D 스캐너, 심도 카메라(depth camera) 등 서로 다른 특성을 가진 센서에서 얻어지면, 데이터의 밀도, 해상도, 노이즈 특성이 달라 환경이 바뀌어 성능이 쉽게 저하된다.특히 기존 학습 기반 정합 기술은 특정 센서나 환경에 맞춰 학습해야만 높은 성능을 낼 수 있었으며, 테스트 환경이 달라질 때마다 파라미터를 수동으로 조정해야 하는 어려움이 있었다. 연구진은 이러한 한계를 극복하기 위해, 사전 학습 없이도 다양한 환경에서 즉시 동작할 수 있는 제로샷 정합 파이프라인 BUFFER-X를 제안했다.BUFFER-X는 데이터의 기하적 특성을 자동으로 분석해 최적의 파라미터를 설정하고, 사전 학습된 모델 없이도 정합에 필요한 핵심 지점을 안정적으로 추출한다. 또한 크기와 해상도가 다른 데이터 간의 차이를 보정해 정확한 정합을 가능하게 하며, 작은 범위부터 큰 범위까지 일관성 있게 매칭이 이루어지도록 설계됐다.이러한 BUFFER-X 파이프라인은 RGB-D, 라이다(LiDAR) 등 다양한 센서 환경과 실내외를 아우르는 11개 공개 데이터셋을 기반으로 구성된 신규 제로샷 일반화 벤치마크(Zero-Shot Generalization Benchmark)에서 기존의 학습 기반 최신 기법들을 압도하는 성능을 보였다.본 연구는 컴퓨터 비전 분야 최우수 학술대회 중 하나인 ICCV 2025에 오는 2025년 10월 발표 예정이며, 우수논문 상위 약 10%에 해당하는 Highlight 논문으로 선정되었다."BUFFER-X: Towards Zero-Shot Point Cloud Registration in Diverse Scenes", Minkyun Seo*, Hyungtae Lim*, Kanghee Lee, Luca Carlone, Jaesik Park, International Conference on Computer Vision (ICCV), 2025....
포스트 대표 이미지
포스트 대표 이미지

이재진 교수 연구팀, 법원 판결문 내 개인정보를 비식별화하는 AI 개발

이재진 교수 연구팀이 인공지능(AI)를 이용해 법원 판결문 내 개인정보를 빠르게 비식별화하는 기술을 개발했다. 이재진 교수가 이끄는 서울대 데이터사이언스대학원 연구팀은 판결문의 개인정보를 비식별화하는 ‘SNU Thunder-DeID 모델’을 개발하였다. 연구팀은 개발 과정에서 강제추행·폭행·사기 등 3가지 형사 사건으로 구성된 4500건의 판결문으로부터 2만 7000여 개의 개체를 추출하는 방식을 이용했다. 이후 수작업으로 이를 라벨링한 뒤 595종의 세분화된 개인식별정보 유형 체계를 수립해 정밀하게 비식별 처리가 가능하도록 학습 데이터를 구축했다.​헌법 제109조에 따르면 판결문은 민·형사 소송법 관련 규정에 제시된 절차와 근거를 바탕으로 열람 및 복사가 가능하다. 여기에 더해 법원은 판결서 등의 열람 및 복사를 위한 비실명 처리기준 규정에 따라 판결문 내 개인정보와 간접식별정보(다른 정보와 결합해 개인을 식별할 수 있게 하는 정보)를 가리고 공개해야 한다. 그러나 2019년 발표된 ‘판결문 공개 확대를 위한 국회토론회’ 자료에 따르면 법원행정처의 ‘지능형 비식별 시스템’ 정확도는 15%에 불과하다. 법원행정처에 따르면 시스템의 처리율도 8% 수준으로 매우 낮은 상황이다. 대부분의 비식별화 작업이 수작업에 의존하게 되면서 재판 공개가 병목 현상을 빚는 이유다.연구팀이 개발한 AI 모델은 판결문 내 표현의 비식별화 대상 여부를 99% 이상의 정확도로 판별하는 것으로 나타났다. 이름·주소·기관명 등 비식별화 대상으로 판별된 항복의 세부 유형 분류도 89% 이상의 성능이 측정됐다. 연구팀은 “헌법상 재판공개의 원칙에 따라 국민에게 공개되어야 하는 판결문이 비식별화 작업의 병목으로 인해 원활히 공개되지 못하고 있다”면서 “이 연구는 AI 기술이 단순한 기술적 성능을 넘어, 공공성과 법적 가치를 함께 고려할 수 있는 수단이 될 수 있다는 점을 보여준다”고 밝혔다.연구팀은 이번 연구에서 개발한 모델과 데이터셋, 데이터 구축 과정에 사용된 소스코드를 공개했다. 모델 관련 정보들은 법원·검찰·변호사 단체 등에서 판결문과 재판기록물 공개를 위한 자동 비식별 처리 시스템으로 활용될 수 있다. 연구팀은 형사 사건뿐 아니라 민사 사건과 행정·특허 소송 판례, 진술서·수사보고서 등 다양한 재판기록물을 아우르는 법률 특화 언어모델 연구의 기반을 마련하는 것을 목표로 후속 연구를 이어갈 전망이다.​※ 출처: "AI로 판결문 비식별화 빠르게…서울대 연구팀, 99% 정확도 AI 개발", 서울경제, 2025년 7월 8일​...
포스트 대표 이미지

이재진 교수 연구팀, 고성능 한국어 LLM 개발

천문학적 비용을 들이지 않고 고성능 한국어 '거대 언어 모델(LLM)’을 개발할 수 있다는 점이 입증됐다. LLM은 방대한 양의 텍스트 데이터를 학습해 인간 언어를 이해하고 생성하는 인공지능(AI) 모델이다. 이재진 서울대 데이터사이언스대학원 교수 연구팀이 영어 기반 언어 모델인 ‘라마(Llama)’를 개량해 한국어에 특화된 언어 모델인 ‘Llama-Thunder-LLM’, 한국어 전용 토크나이저 ‘Thunder-Tok’, 한국어 LLM 성능을 객관적으로 평가하는 ‘Thunder-LLM 한국어 벤치마크’를 개발하였다. 토크나이저는 문장을 언어 모델이 이해할 수 있는 단위인 ‘토큰’으로 쪼개는 도구이고 벤치마크는 특정 기준과 비교해 성능을 측정하고 평가하는 도구다. 한국어에 특화된 LLM을 만들려면 개발에 막대한 비용이 든다. LLM 구축을 위한 데이터가 한정적이라는 한계도 있다. LLM이 대기업과 해외 빅테크 기업 중심으로 개발돼온 이유다. 중소 연구기관이나 대학에서는 LLM 연구개발을 하기 어렵다. 연구팀은 데이터 수집부터 사후 학습까지 언어 모델 학습의 모든 단계를 자체 진행해 중국 LLM ‘딥시크’처럼 제한된 자원으로 고성능 언어 모델을 구축할 수 있다는 점을 입증했다. Llama-Thunder-LLM은 3TB(테라바이트, 1TB=1024GB) 크기의 한국어 웹 데이터를 수집·전처리한 다음 라마 모델에 연속 학습과 사후 학습 등의 개량 기법을 적용한 한국어 특화 LLM이다. 연속 학습은 기존 모델에 새로운 데이터를 추가로 학습시켜 능력을 확장하는 과정이고 사후 학습은 사용자의 질문·응답 등으로 추가 미세조정하는 학습 과정이다. 한국어의 문법적 특성을 반영한 토크나이저 Thunder-Tok은 기존 라마 토크나이저 대비 토큰 수를 약 44% 절약해 추론 속도 및 학습 효율성을 높였다. 토큰 수가 줄면 AI 모델 운영 비용이 감소한다. 연구팀이 자체 개발한 ‘한국어 평가용 데이터셋’을 포함한 Thunder-LLM 한국어 벤치마크는 한국어 LLM 성능을 객관적이고 체계적으로 평가할 수 있는 기반을 제공한다.​이재진 교수는 “이번 연구는 학계도 자주적인 LLM 개발이 가능하다는 점을 입증했고 국내 소버린 AI(자국 AI)에 기여한 의미 있는 결과”라며 “한국어 기반 LLM 및 토크나이저, 벤치마크 데이터셋을 온라인에 공개하고 개발 과정 또한 상세히 기술해 누구나 후속 및 재현 연구에 활용할 수 있도록 했다”고 말했다. 연구 성과는 ‘초거대 AI모델 및 플랫폼 최적화 센터’ 웹페이지(https://champ.snu.ac.kr/resource)에 공개됐다. ※ 출처: 동아사이언스, 한국판 '딥시크' 만들 수 있다…서울대 연구진 '고성능 한국어 LLM' 개발​...
포스트 대표 이미지

김선 교수 연구실, 세계적 AI 바이오인포매틱스 학회 ISMB 2025에 논문 두 편 동시 게재 성과

서울대학교 컴퓨터공학부 김선 교수 연구실 및 (주)아이겐드럭 소속 방동민 연구원이 공동 제1저자로 참여한 연구 논문 두 편이 오는 7월 20일 영국리버풀에서 개최되는 세계 최고 권위의 AI 바이오인포매틱스 학회 ISMB/ECCB 2025에 동시 게재되는 영예를 안았다. ISMB 학회는 매년 전세계에서 50여편만 선정하기 때문에 2편의 논문이 한해에 게재되는 일은 매우 드문 성과이다.두 논문의 제목은 각각 "ADME-Drug-Likeness: Enriching Molecular Foundation Models via Pharmacokinetics-Guided Multi-Task Learning for Drug-likeness Prediction" (주저자: 방동민 25년 8월 박사 졸업예정) 과 "MixingDTA: Improved Drug-Target Affinity Prediction by Extending Mixup with Guilt-By-Association" (주저자: 김영오 25년 2월 석사졸업)으로, 모두 AI 기반 약물 개발 연구에서 획기적인 기술적 발전을 제시한 것으로 평가받고 있다. ADME-Drug-Likeness 논문은 화합물의 약동학적 데이터(ADME)에 연속적 멀티태스크 러닝기법을 활용하여 약물 유사도를 정의하는 최초의 인공기술이며 생물의학지식정렬및 단일 클래스 기반 경계최적화기법으로약물유사도를정의하는최초의 인공기술이고, MixingDTA 논문은 약물과 타겟단백질 결합력 예측력 향상을 위해 새로운 데이터증강 기법을 개발한 연구이다. ​김선 교수 연구팀의 이번 성과는 서울대 컴퓨터공학부의 AI 및 바이오인포매틱스 연구 역량을 다시 한번 세계적으로 입증하는 계기가 될 것으로 기대된다....
포스트 대표 이미지

서울대 학생 공동창업 AI 스타트업 에임인텔리전스, 세계 최정상 AI 학회서 논문 4편 동시 발표

서울대 학생 공동창업 '에임인텔리전스', ICML 및 ACL 2025 논문 4편 채택AI 모델의 안전성, 보안 취약점 분석 및 방어 기술 등 핵심 문제 해결 기여에임 연구 인턴 1기(대부분 학부생), 참여 3팀 전원 최정상 학회 논문 채택 (100% 합격률)AI 안전과 보안 스타트업 에임인텔리전스가 세계 최고 권위의 AI 학회인 ICML과 ACL에 총 4편의 논문이 동시 채택되는 쾌거를 이뤘다. 설립 10개월 만의 성과로, AI 안전 및 보안 분야에서 국제적인 연구 역량을 입증했다는 평가다. 에임인텔리전스는 유상윤 대표(서울대 전기정보공학부 석사 졸업), 박하언(서울대 컴퓨터공학부), 김하늘(연세대), 이의준(가천대 졸업) 4인이 공동 창업한 스타트업이다.에임인텔리전스는 짧은 기간 안에 메타 Llama 혁신상 (국내 유일), 국내 및 글로벌 대기업 고객 확보, 구글 포 스타트업 AI 퍼스트 배치 등 주목할 만한 성과를 거두며 빠르게 성장하고 있다.이번에 발표된 주요 연구는 다음과 같다:ELITE (ICML 2025): 비전언어모델(VLM)의 유해성을 정밀 평가하는 체계로, AI 응답의 숨은 위험까지 탐지한다. (서울대, 연세대, KIST, 숙명여대 공동 연구)M2S (ACL 2025 Main Track): 다중 턴 LLM 공격을 효율적인 단일 턴으로 압축하는 프레임워크로, 적은 비용으로 높은 공격 효과를 보였다. (서울시립대, KAIST, 서울대, 연세대, KIST 공동 연구)SUDO (ACL 2025 Industry Track): AI 에이전트의 보안 취약성을 실증한 공격 프레임워크로, AI 에이전트의 거절 명령 우회 가능성을 입증했다. (서울대, 연세대 공동 연구)REPBEND (ACL 2025 Main Track): LLM 내부의 유해 표현을 교란시켜 안전성을 높이는 기법으로, 공격 성공률을 크게 낮추면서도 사용성은 유지했다. (서울대, 연세대, UMichigan, Stanford, Amazon AWS 공동 연구)특히, 이 중 3편의 논문(ELITE, M2S, SUDO)은 '에임인텔리전스 연구 인턴 1기' 프로그램에 참여한 인턴(대부분 학부생)들이 주도하여 얻은 성과다. 총 6명의 인턴이 3개 팀으로 연구를 진행, 모든 팀이 논문 채택에 성공률 100%의 성과로 뛰어난 역량을 입증했다.에임인텔리전스 박하언 CTO는 "서울대에서 경험이 큰 밑거름이 되었고, 에임 인턴십을 통해 인턴분들이 큰 성과를 내서 매우 자랑스럽다"며, "앞으로 이미지/비디오 생성, 에이전트, 로봇, 의료 및 국방 AI 등 다양한 분야의 AI 안전 기술을 지속적으로 연구 개발하겠다"고 밝혔다.[논문 정보]"ELITE: Enhanced Language-Image Toxicity Evaluation for Safety", Wonjun Lee*, Doehyeon Lee*, Eugene Choi, Sangyoon Yu, Ashkan Yousefpour, Haon Park, Bumsub Ham, Suhyun Kim, ICML 2025."SUDO: Screen-based Universal Detox2Tox Offense for Large Agent Models", Sejin Lee*, Jian Kim*, Haon Park, Ashkan Yousefpour, Sangyoon Yu, Min Song, ACL 2025 Industry Track. "One-Shot is Enough: Consolidating Multi-Turn Attacks into Efficient Single-Turn Prompts for LLMs", Junwoo Ha*, Hyunjun Kim*, Sangyoon Yu, Haon Park, Ashkan Yousefpour, Yuna Park, Suhyun Kim, ACL 2025. "Representation Bending for Large Language Model Safety", Ashkan Yousefpour*, Taeheon Kim*, Ryan S. Kwon, Seungbeen Lee, Wonje Jeung, Seungju Han, Alvin Wan†, Harrison Ngan, Youngjae Yu, R Jonghyun Choi, ACL 2025.​...
포스트 대표 이미지

김건희 교수 연구팀, 자연어처리 최우수학회 NAACL 2025 음성인식 부분 최고 논문상 수상

AI가 사람처럼 말버릇, 추임새, 끼어들기 등 대화 행동을 이해하고 재현하는 음성 대화 기술이 개발되었다.연구팀은 세계 최대 규모의 대화 행동 기반 음성 데이터셋인 Behavior-SD를 구축하고, 이를 바탕으로 자연스러운 AI 음성 대화 모델 BeDLM을 제안했다.해당 기술은 팟캐스트 제작, 상담 AI, 개인화 음성비서 등 사람과 상호작용이 중요한 다양한 분야에 활용 가능성이 높다.사람들이 대화를 할 때는 정보를 주고 받는 것 외에도 “음…”, “그니까…” 같은 말버릇을 쓰고, 적절한 순간에 “맞아”, “응” 같은 추임새를 넣거나, 때로는 상대의 말을 끊기도 하면서 소통한다. 하지만 기존 인공지능 대화 시스템은 이런 미묘한 말버릇이나 대화 습관을 반영하지 못해, 말투가 부자연스럽고 기계적으로 느껴질 수밖에 없었다.김건희 교수 연구팀(이세훈 박사과정, 김강욱 학사과정)은 이러한 문제를 해결하기 위해, 사람의 말버릇과 추임새(backchannel), 끼어들기(interruption), 감정 표현 등 대화 행동을 정밀하게 반영한 음성 데이터셋과 대화 생성 기술을 함께 제안하였다.연구팀은 먼저 10만 개 이상, 총 2천 시간 분량의 대규모 대화 행동 기반 음성 데이터셋인 Behavior-SD를 구축했다. 이 데이터는 단순한 문장이 아니라, 각 화자의 말투와 말버릇이 행동 단위로 주석 처리되어 있어, 실제 사람 간의 자연스러운 대화를 정밀하게 구현할 수 있도록 설계되었다.이 데이터를 바탕으로 개발된 행동 기반 대화 생성 모델(BeDLM)은, 대화 상황과 화자의 대화 행동 패턴을 입력으로 받아, 사람 간 대화에 가까운 음성 대화를 쉽게 생성할 수 있는 AI 기술을 구현했다. 대화 행동을 반영하여 말버릇을 자연스럽게 끼워 넣는다. 이 기술은 생동감 있는 팟캐스트 콘텐츠 제작, 개인 맞춤형 음성 비서, 정서적 반응이 필요한 상담 AI 등, 자연스러운 말하기와 듣기가 중요한 응용 분야에서 활용도가 높다.이 연구는 세계 최고 수준의 자연어처리 학회인 NAACL 2025에서 구두로 발표되었으며, 음성 처리 및 음성 언어 이해(Speech Processing and Spoken Language Understanding) 분야에서 최우수 논문에게 수여되는 Senior Area Chair Award를 수상했다. Senior Area Chair Award 는 자연어처리 핵심 9개 분야에서 각 최우수 논문 1편씩을 선정하였다.이 연구에서 개발된 Behavior-SD 데이터셋과 코드는 모두 오픈소스로 공개되어, 국내외 연구자 누구나 자유롭게 활용할 수 있다. 관련 기술의 확산과 후속 연구를 촉진할 수 있을 것으로 기대된다.[연구지원]본 연구는 정보통신기획평가원(IITP)의 ICT R&D 사업(No. RS-2022-II220156, No. RS-2019-II191082), ITRC 지원사업(No. IITP-2025-RS-2024-00437633), 서울대학교 글로벌 우수연구센터 사업, NRF 기초연구사업(RS-2023-00274280)의 지원을 받아 수행되었다.[논문 정보]​“Behavior-SD: Behaviorally Aware Spoken Dialogue Generation with Large Language Models”, Sehun Lee*, Kang-wook Kim*, Gunhee Kim, 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025)...
포스트 대표 이미지

"AI 속도 따라잡을 '새로운 몸'…창의적 컴퓨터가 미래 가른다"

인공지능(AI)이 두뇌라면 컴퓨터는 AI를 담은 물리적 실체다. 서진욱 서울대 컴퓨터연구소 소장은 11일 “미래의 컴퓨터는 스스로 사고하고 인간과 소통하는 ‘기계 이상의 존재’가 될 것”이라고 말했다. 두뇌의 속도에 따라 몸도 날렵해질 것이란 얘기다. 한국을 비롯해 미국, 중국, 유럽, 일본 등 주요 국가는 ‘창의적인 컴퓨터’를 누가 먼저 내놓느냐는 아키텍처 경쟁에 돌입했다. 인간의 두뇌처럼 적은 전력만으로도 중요한 정보에만 집중함으로써 효율을 높이는 ‘어텐션(attention·집중) 연산’을 비롯해 인간 행동을 모사해 로봇의 움직임을 만들어내는 ‘인간-물체 상호작용(HOI) 모델링’ 등이 주요 경쟁 영역이다. 서 소장을 비롯해 연구소의 핵심인 이재욱, 주한별, 원정담 서울대 컴퓨터공학과 교수는 “컴퓨터가 인류 난제에 도전하고 이를 다양한 영역으로 확장시킬 것”이라고 입을 모았다.◇인간의 두뇌 닮아가는 컴퓨터서 소장은 “생성형 AI 시대에서 나타난 가장 큰 문제는 기존 컴퓨터로는 초대규모 데이터를 처리하는 것이 점점 어려워지고 있다는 점”이라고 말했다. 몸이 두뇌 속도를 못 따라간다는 것이다. 전력을 너무 많이 소모하는 것도 해결해야 할 과제 중 하나다. 이를 위해 서울대 컴퓨터연구소는 AI 연산을 가속화하고 저전력·고효율·고확장 컴퓨팅 환경을 구축하기 위한 새로운 컴퓨터 아키텍처 개발에 주력하고 있다.예컨대 하드웨어(HW)와 소프트웨어(SW)가 최적의 성능을 낼 수 있도록 함께 설계하는 ‘협조 최적화’(co-design)가 대표적인 기술로 꼽힌다. 현재까지의 설계 방식은 ‘따로국밥’ 식이다. HW 엔지니어는 빠르고 안정적인 회로와 장치를 설계하는 데만 주력하고, SW 개발자는 그 위에서 돌아가는 프로그램을 별도로 개발한다. 하지만 AI에 최적화된 컴퓨터를 만들려면 이에 특화된 전용 회로를 설계해야 하고, SW도 AI 모델 구조를 HW가 더 잘 처리할 수 있도록 최적화해야 한다.서 소장은 “일반 컴퓨터가 평범한 자동차라면 서울대가 연구 중인 AI 연산 특화 컴퓨터는 레이싱카처럼 특정 작업을 훨씬 빠르고 효율적으로 수행하는 것이 목표”라고 설명했다.주요 연구로는 어텐션 연산을 빠르게 처리하는 전용 하드웨어 가속기 개발이 꼽힌다. 수조 개의 파라미터(매개변수)를 갖는 어텐션 연산은 딥러닝과 자연어 처리(NLP), 이미지 처리와 같은 AI 분야에서 핵심 역할을 한다. 어텐션 연산은 AI 모델이 데이터 중에서 어디에 집중할지, 무엇이 중요한지를 찾아내고 이에 집중하게 만든다. 책을 읽을 때 중요한 부분에 빨간펜으로 표시해가며 반복해 읽고 이해하는 것에 비유할 수 있다.이재욱 교수는 “어텐션 연산에 최적화된 칩으로 가속기를 만들었고, 측정 결과 연산량과 전력 소비를 기존 컴퓨팅의 절반 수준으로 줄이면서도 정확도를 유지했다”고 말했다. 어텐션 연산은 AI 연구와 개발에서 핵심적인 기술로 자리 잡는 추세다. 구글의 BERT, 마이크로소프트의 터닝 NLG, 페이스북의 RoBERTa, 삼성전자의 스마트폰 음성 인식 기술이 어텐션 연산의 대표 사례다.◇주목받는 로봇 학습 컴퓨팅서울대 컴퓨터연구소가 주목한 또 다른 차세대 연구는 ‘휴먼 AI’다. 서 소장은 “이 연구에는 컴퓨터 비전, 머신러닝, 3차원(3D) 모델링 등이 유기적으로 융합된다”며 “인간의 외형, 동작, 의류, 의사소통, 물체와의 상호작용을 AI가 정밀하게 이해하고 사실적으로 재현할 수 있을 것”이라고 설명했다. 주한별 교수는 연구소 내 연구시설인 ‘패러덱스(pardex)’에서 인간의 움직임을 여러 대의 카메라로 촬영해 인간 동작을 모사하는 AI 모델을 개발하고 이를 로봇으로 재현하는 기술을 연구하고 있다.이 과정에서 강조되는 기술이 HOI 모델링이다. 주 교수는 “HOI 모델링과 70대 이상의 카메라를 활용한 멀티센서 기반 3D 데이터 수집 시스템을 통해 고품질 학습 데이터를 확보하고 있다”며 “AI의 표현력과 적응력을 끌어올릴 것”이라고 말했다. HOI 모델링이 고도화되면 스마트 가전과 홈 오토메이션 분야에서 획기적인 변화가 일어날 것으로 예상된다.HOI 모델링이 적용된 AI는 사람의 동작을 보다 정교하게 이해해 스마트홈 기기가 사용자 행동을 예측하고 자동으로 작동할 수 있다. 사용자가 컵을 집으면 AI가 이를 감지해 정수기에서 물을 채우거나 요리를 시작하면 오븐을 적절한 온도로 설정하는 식이다. 로보틱스 및 스마트 제조 분야, 자율주행과 스마트 모빌리티 등 산업 현장에도 다양하게 적용할 수 있다. 주 교수는 “HOI 모델링을 적용한 협업 로봇은 작업자가 어떤 도구를 사용하려 하는지 인식하고 필요한 도구를 전달하거나 작업의 다음 단계를 예측해 준비한다”고 예를 들었다.◇수백 개 전신 근육도 디지털로 구현인간의 행동을 모방하는 ‘로봇 학습’은 휴머노이드 완성을 위한 필수 기술로 꼽힌다. 불과 몇 년 전까지만 해도 로봇 행동 모델은 코딩에 의존해 왔다. 정해진 대본에 따라 움직이는 배우에 비유할 수 있다. 하지만 인간처럼 미세한 움직임을 로봇으로 구현하려면 아주 사소한 행동 하나라도 구현할 수 있어야 하는데 이를 위해선 로봇이 스스로 행동을 배우도록 하는 것이 핵심이다.주 교수는 “로봇 학습은 동작 모사를 넘어 사람의 복잡한 신체 움직임과 물체를 다루는 방식까지 정밀하게 학습한다”며 “AI 기반 로봇이 실제 환경에서 사람의 역할을 대체하거나 보조할 능력을 갖추도록 하는 데 집중하고 있다”고 했다. 로봇이 인간이 처한 상황과 대화의 맥락까지 이해할 수 있다는 뜻이다. 향후 노동, 의료, 재난 대응, 노인 돌봄 등의 분야에서 큰 사회적 파급력을 가질 것으로 기대된다.근골격 디지털 트윈 모델링 및 시뮬레이션 기술도 컴퓨터연구소가 주목하는 차세대 연구 분야다. 정밀 의료와 헬스케어 분야에 특화된 기술로 인간 신체를 디지털 트윈으로 구현하는 것이 목표다....
포스트 대표 이미지
포스트 대표 이미지
포스트 대표 이미지