

창의와 지식을 융합하여
컴퓨터 기술의
진화를 선도합니다.
News
More이재진 교수 연구팀, 법원 판결문 내 개인정보를 비식별화하는 AI 개발
이재진 교수 연구팀이 인공지능(AI)를 이용해 법원 판결문 내 개인정보를 빠르게 비식별화하는 기술을 개발했다. 이재진 교수가 이끄는 서울대 데이터사이언스대학원 연구팀은 판결문의 개인정보를 비식별화하는 ‘SNU Thunder-DeID 모델’을 개발하였다. 연구팀은 개발 과정에서 강제추행·폭행·사기 등 3가지 형사 사건으로 구성된 4500건의 판결문으로부터 2만 7000여 개의 개체를 추출하는 방식을 이용했다. 이후 수작업으로 이를 라벨링한 뒤 595종의 세분화된 개인식별정보 유형 체계를 수립해 정밀하게 비식별 처리가 가능하도록 학습 데이터를 구축했다.헌법 제109조에 따르면 판결문은 민·형사 소송법 관련 규정에 제시된 절차와 근거를 바탕으로 열람 및 복사가 가능하다. 여기에 더해 법원은 판결서 등의 열람 및 복사를 위한 비실명 처리기준 규정에 따라 판결문 내 개인정보와 간접식별정보(다른 정보와 결합해 개인을 식별할 수 있게 하는 정보)를 가리고 공개해야 한다. 그러나 2019년 발표된 ‘판결문 공개 확대를 위한 국회토론회’ 자료에 따르면 법원행정처의 ‘지능형 비식별 시스템’ 정확도는 15%에 불과하다. 법원행정처에 따르면 시스템의 처리율도 8% 수준으로 매우 낮은 상황이다. 대부분의 비식별화 작업이 수작업에 의존하게 되면서 재판 공개가 병목 현상을 빚는 이유다.연구팀이 개발한 AI 모델은 판결문 내 표현의 비식별화 대상 여부를 99% 이상의 정확도로 판별하는 것으로 나타났다. 이름·주소·기관명 등 비식별화 대상으로 판별된 항복의 세부 유형 분류도 89% 이상의 성능이 측정됐다. 연구팀은 “헌법상 재판공개의 원칙에 따라 국민에게 공개되어야 하는 판결문이 비식별화 작업의 병목으로 인해 원활히 공개되지 못하고 있다”면서 “이 연구는 AI 기술이 단순한 기술적 성능을 넘어, 공공성과 법적 가치를 함께 고려할 수 있는 수단이 될 수 있다는 점을 보여준다”고 밝혔다.연구팀은 이번 연구에서 개발한 모델과 데이터셋, 데이터 구축 과정에 사용된 소스코드를 공개했다. 모델 관련 정보들은 법원·검찰·변호사 단체 등에서 판결문과 재판기록물 공개를 위한 자동 비식별 처리 시스템으로 활용될 수 있다. 연구팀은 형사 사건뿐 아니라 민사 사건과 행정·특허 소송 판례, 진술서·수사보고서 등 다양한 재판기록물을 아우르는 법률 특화 언어모델 연구의 기반을 마련하는 것을 목표로 후속 연구를 이어갈 전망이다.※ 출처: "AI로 판결문 비식별화 빠르게…서울대 연구팀, 99% 정확도 AI 개발", 서울경제, 2025년 7월 8일
2025학년도 2학기 한국장학재단 학자금대출 안내[재학생]
2025학년도 2학기 한국장학재단 학자금대출 안내[재학생]한국장학재단에서 실시하는 2025학년도 2학기 학자금대출계획을 알려드리니, 희망하는 학생들의 이용 바랍니다.
한국판 '딥시크' 만들 수 있다… 서울대 연구진 '고성능 한국어 LLM' 개발
천문학적 비용을 들이지 않고 고성능 한국어 '거대 언어 모델(LLM)’을 개발할 수 있다는 점이 입증됐다. LLM은 방대한 양의 텍스트 데이터를 학습해 인간 언어를 이해하고 생성하는 인공지능(AI) 모델이다. 이재진 서울대 데이터사이언스대학원 교수 연구팀이 영어 기반 언어 모델인 ‘라마(Llama)’를 개량해 한국어에 특화된 언어 모델인 ‘Llama-Thunder-LLM’, 한국어 전용 토크나이저 ‘Thunder-Tok’, 한국어 LLM 성능을 객관적으로 평가하는 ‘Thunder-LLM 한국어 벤치마크’를 개발하였다. 토크나이저는 문장을 언어 모델이 이해할 수 있는 단위인 ‘토큰’으로 쪼개는 도구이고 벤치마크는 특정 기준과 비교해 성능을 측정하고 평가하는 도구다. 한국어에 특화된 LLM을 만들려면 개발에 막대한 비용이 든다. LLM 구축을 위한 데이터가 한정적이라는 한계도 있다. LLM이 대기업과 해외 빅테크 기업 중심으로 개발돼온 이유다. 중소 연구기관이나 대학에서는 LLM 연구개발을 하기 어렵다. 연구팀은 데이터 수집부터 사후 학습까지 언어 모델 학습의 모든 단계를 자체 진행해 중국 LLM ‘딥시크’처럼 제한된 자원으로 고성능 언어 모델을 구축할 수 있다는 점을 입증했다. Llama-Thunder-LLM은 3TB(테라바이트, 1TB=1024GB) 크기의 한국어 웹 데이터를 수집·전처리한 다음 라마 모델에 연속 학습과 사후 학습 등의 개량 기법을 적용한 한국어 특화 LLM이다. 연속 학습은 기존 모델에 새로운 데이터를 추가로 학습시켜 능력을 확장하는 과정이고 사후 학습은 사용자의 질문·응답 등으로 추가 미세조정하는 학습 과정이다. 한국어의 문법적 특성을 반영한 토크나이저 Thunder-Tok은 기존 라마 토크나이저 대비 토큰 수를 약 44% 절약해 추론 속도 및 학습 효율성을 높였다. 토큰 수가 줄면 AI 모델 운영 비용이 감소한다. 연구팀이 자체 개발한 ‘한국어 평가용 데이터셋’을 포함한 Thunder-LLM 한국어 벤치마크는 한국어 LLM 성능을 객관적이고 체계적으로 평가할 수 있는 기반을 제공한다.이재진 교수는 “이번 연구는 학계도 자주적인 LLM 개발이 가능하다는 점을 입증했고 국내 소버린 AI(자국 AI)에 기여한 의미 있는 결과”라며 “한국어 기반 LLM 및 토크나이저, 벤치마크 데이터셋을 온라인에 공개하고 개발 과정 또한 상세히 기술해 누구나 후속 및 재현 연구에 활용할 수 있도록 했다”고 말했다. 연구 성과는 ‘초거대 AI모델 및 플랫폼 최적화 센터’ 웹페이지(https://champ.snu.ac.kr/resource)에 공개됐다. ※ 출처: 동아사이언스, 한국판 '딥시크' 만들 수 있다…서울대 연구진 '고성능 한국어 LLM' 개발
2025학년도 2학기 등록, 복학, 재입학 및 휴학 일정 안내
2025학년도 2학기 등록 기간 안내등록〔재학생, 복학생, 재입학(복적)생〕1. 기간: 2025. 8. 25.(월) ~ 2025. 8. 29.(금), 5일간 (주말 및 공휴일 수납 제외)2. 장소: 농협은행, 신한은행 및 우리은행 전국 소재 지점복학(귀), 재입학(복적)1. 복학(복귀)❍ 신청기간: 2025. 6. 17.(화) ~ 2025. 8. 31.(일)❍ 신청방법- 서울대학교 포털 → 학사정보 → 학적변동(신청) → 휴학·복학-수강신청이 복학 신청을 대신하지 않음. 따라서 수강신청을 하였어도 반드시 복학은 별도로 신청하여야 함2. 군 휴학생의 복학(복귀) 신청❍ 신청기간: 2025. 6. 17.(화) ~ 2025. 9. 23.(화)※ 단, 군 휴학생이 본 등록 기간 이후 복학을 신청할 경우에는 2025. 9. 23.(화)까지 반드시 복학(복귀) 승인 및 등록금 납부까지 모두 완료되어야 함❍ 군 복학(복귀)생 구비서류 및 검토사항- 수업일수 4분의 1선 2025. 9. 23.(화)까지 전역자: 병적증명서 또는 전역증 사본 등- 수업일수 4분의 1선 2025. 9. 24.(수)이후 전역자구 분제출 서류검토사항수업일수 4분의 1선부터 전역일까지 연속하여 휴가(연가)를 사용할 수 있는 경우전역예정증명서, 전역예정일까지의휴가증 사본, 소속 부대장의 수학(복학)승인서① 군 복무를 마치기 전에 복학을 하여도군 복무와 학교 수학에 무리가 없고, 정상적인 학사행정에 지장을 초래하지 않을 것② 병역법령 등 관련 법령에 따라 복무중 수학이 제한되지 않을 것수업일수 4분의 1선부터 전역일까지 연속하여 휴가(연가)를 사용할 수 없는 경우전역예정증명서, 수업이 있는 날의휴가증 사본, 소속 부대장의 수학(복학)승인서, 지도교수 또는 학과장추천서, 학생 확인서재입학(복적)❍ 신청기간: (1차) 2025. 6. 16.(월) ~ 2025. 6. 23.(월), (2차) 2025. 7. 2.(수) ~ 2025. 7. 11.(금) ❍ 허가일: (1차) 2025. 6. 27.(금), (2차) 2025. 7. 18.(금)❍ 신청방법: 학과 사무실에 직접 신청서 제출(인터넷 신청 불가)※ 2차 재입학(복적)은 1차 재입학(복적) 허가 후 잔여 여석이 있는 경우에 한하여 신청 가능※ 복적 및 재입학을 허가받은 자는 등록 기간 중 반드시 등록하여야 하며, 미등록 시 복적 및 재입학 포기원서를 제출하여야 함 (개강일 이전 휴학 신청 불가, 개강일 이후 휴학 신청 시 등록금 반환 신청 불가)휴학1. 기간❍ 미등록 휴학: 2025. 6. 17.(화) ~ 2025. 9. 23.(화) (수업일수 4분의 1선 이내)❍ 등록 후 휴학: 2025. 6. 17.(화) ~ 2025. 10. 24.(금) (수업일수 4분의 2선 이후 가사휴학 불가)※ 휴학 신청 후에는 등록금 고지서 출력이 불가, 따라서 등록 후 휴학하고자 하는 학생은 반드시 등록 기간에 등록금 납부 이후, 휴학 신청※ 등록금 분납 중인 자는 완납하여야 휴학 신청 가능2. 신청방법:서울대학교 포털 → 학사정보 → 학적변동(신청) → 휴학·복학❍ 가사휴학 외의 휴학은 증빙서류를 첨부하여야 승인 가능❍ 창업휴학은 소속학과(부) 사무실에 사업계획서 등 직접 서류 제출 후 승인 요청하여야 함 3. 휴학의 유효기간: 최대 1년(2개 학기)❍ 휴학기간이 종료되는 학생은 복학(귀) 또는 휴학을 다시 신청하여야 함(미신청 시 미등록제적)❍ 2025학년도 2학기에 휴학연한이 초과되는 학생은 반드시 복학(귀)하여야 함(미신청 시 미등록제적)※ 휴학연한(총 휴학 기간): 학사과정 6학기, 석사과정 4학기, 박사과정 6학기, 석·박사통합과정 8학기※ 휴학연한에 산입되지 않는 휴학기간: 군휴학(복무기간), 임신·출산휴학(2학기), 육아휴학(4학기), 질병휴학(4학기), 창업휴학(4학기), 권고휴학(4학기)유 의 사 항1. 수업연한을 초과한 학생 (수업연한: 학사 8학기, 석사, 박사 4학기)❍ 수강신청 학점에 따른 차액이 발생할 수 있으므로 등록금 고지서 금액을 반드시 확인 (복귀생 포함)❍ 수강신청 또는 휴학을 신청하지 않을 경우, 미등록 제적 처리2. 기타 문의사항업무담당과전화번호업무담당과전화번호휴·복학 및 재입학(복적) 등 학적변동소속 대학(원) 학과(부) 사무실 또는 교무행정실각 행정실수강신청 관련학사과880-5042등록금 분납 등록금 관련재무과880-5107장학금, 학자금융자 관련장학복지과880-5078, 5079
말버릇·추임새·끼어들기와 같은 대화 습관까지 따라한 AI, 사람처럼 대화한다.
AI가 사람처럼 말버릇, 추임새, 끼어들기 등 대화 행동을 이해하고 재현하는 음성 대화 기술이 개발되었다.연구팀은 세계 최대 규모의 대화 행동 기반 음성 데이터셋인 Behavior-SD를 구축하고, 이를 바탕으로 자연스러운 AI 음성 대화 모델 BeDLM을 제안했다.해당 기술은 팟캐스트 제작, 상담 AI, 개인화 음성비서 등 사람과 상호작용이 중요한 다양한 분야에 활용 가능성이 높다.사람들이 대화를 할 때는 정보를 주고 받는 것 외에도 “음…”, “그니까…” 같은 말버릇을 쓰고, 적절한 순간에 “맞아”, “응” 같은 추임새를 넣거나, 때로는 상대의 말을 끊기도 하면서 소통한다. 하지만 기존 인공지능 대화 시스템은 이런 미묘한 말버릇이나 대화 습관을 반영하지 못해, 말투가 부자연스럽고 기계적으로 느껴질 수밖에 없었다.김건희 교수 연구팀(이세훈 박사과정, 김강욱 학사과정)은 이러한 문제를 해결하기 위해, 사람의 말버릇과 추임새(backchannel), 끼어들기(interruption), 감정 표현 등 대화 행동을 정밀하게 반영한 음성 데이터셋과 대화 생성 기술을 함께 제안하였다.연구팀은 먼저 10만 개 이상, 총 2천 시간 분량의 대규모 대화 행동 기반 음성 데이터셋인 Behavior-SD를 구축했다. 이 데이터는 단순한 문장이 아니라, 각 화자의 말투와 말버릇이 행동 단위로 주석 처리되어 있어, 실제 사람 간의 자연스러운 대화를 정밀하게 구현할 수 있도록 설계되었다.이 데이터를 바탕으로 개발된 행동 기반 대화 생성 모델(BeDLM)은, 대화 상황과 화자의 대화 행동 패턴을 입력으로 받아, 사람 간 대화에 가까운 음성 대화를 쉽게 생성할 수 있는 AI 기술을 구현했다. 대화 행동을 반영하여 말버릇을 자연스럽게 끼워 넣는다. 이 기술은 생동감 있는 팟캐스트 콘텐츠 제작, 개인 맞춤형 음성 비서, 정서적 반응이 필요한 상담 AI 등, 자연스러운 말하기와 듣기가 중요한 응용 분야에서 활용도가 높다.이 연구는 세계 최고 수준의 자연어처리 학회인 NAACL 2025에서 구두로 발표되었으며, 음성 처리 및 음성 언어 이해(Speech Processing and Spoken Language Understanding) 분야에서 최우수 논문에게 수여되는 Senior Area Chair Award를 수상했다. Senior Area Chair Award 는 자연어처리 핵심 9개 분야에서 각 최우수 논문 1편씩을 선정하였다.이 연구에서 개발된 Behavior-SD 데이터셋과 코드는 모두 오픈소스로 공개되어, 국내외 연구자 누구나 자유롭게 활용할 수 있다. 관련 기술의 확산과 후속 연구를 촉진할 수 있을 것으로 기대된다.[연구지원]본 연구는 정보통신기획평가원(IITP)의 ICT R&D 사업(No. RS-2022-II220156, No. RS-2019-II191082), ITRC 지원사업(No. IITP-2025-RS-2024-00437633), 서울대학교 글로벌 우수연구센터 사업, NRF 기초연구사업(RS-2023-00274280)의 지원을 받아 수행되었다.[논문 정보]“Behavior-SD: Behaviorally Aware Spoken Dialogue Generation with Large Language Models”, Sehun Lee*, Kang-wook Kim*, Gunhee Kim, 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025)
[최종 등록기간] 2025학년도 1학기 등록 수납계획 안내
2025학년도 1학기 최종등록 기간 안내드리오니 등록 예정인 학생들은 반드시! 최종 납부 일정 확인하시어 기간 내 등록해 주시기 바랍니다.<최종 등록금 수납 일정표>구분최종수납분납분납 1차2차3차4차재학생학부·대학원3.25.(화)9시~ 3.27.(목) 17시4.18.(금)9시~ 4.22.(화) 17시5.7.(수)9시~ 5.9.(금) 17시 5.21.(수)9시~ 5.23.(금) 17시※ 평일 24시간 납부 가능 (휴일납부 불가, 마지막 날 17시 마감)
[중요!] 컴퓨터공학부 대학원 입시 구술고사 교과목 변경 안내(2025학년도 전기 모집부터 적용)
안녕하세요. 컴퓨터공학부입니다.컴퓨터공학부 대학원 구술고사 교과목이 아래와 같이 변경되어 안내드리오니 컴퓨터공학부 대학원 진학을 준비하는 학생들은 반드시 아래 내용 확인하시기 바랍니다.[컴퓨터공학부 대학원 입시 구술고사 교과목 변경 안내] <변경 전> 석사 및 석사박사통합과정• 구술고사는 4과목 (자료구조, 전자회로, 운영체제, 컴퓨터구조) 중에서 지원자가 신청한 2과목에서 문제를 풉니다.<변경 후>석사 및 석사박사통합과정• 구술고사는 4과목(소프트웨어의 기초, 하드웨어의 기초, 컴퓨터공학을 위한 수학, 컴퓨터시스템) 중에서 지원자가 신청한 2과목에서 문제를 풉니다. - 각 과목 당 시험 범위는 다음과 같음. - 반드시 참고 도서로 준비해야 하는 것은 아니며 시험 범위에서 다루는 주제들을 참조할 것. - 세부적인 내용을 묻는 문제보다는 가장 중요한 핵심 개념을 이해하고 있는지 위주로 출제됨.과목명범위참고도서소프트웨어의 기초Chapter 2, 3, 6, 8-13쉽게 배우는 자료구조 with 자바 / 문병로 / 한빛미디어 / 2022하드웨어의 기초Chapter 9-11Foundations of Analog and Digital Electronic Circuits / Anant Agarwal, Jeffrey Lang / Morgan Kaufman / 2005Chapter 10Contemporary Logic Design / Katz / Prentice-Hall / 2012컴퓨터공학을 위한 수학Chapter 1-2, 5-7Discrete Mathematics and Its Applications / Kenneth H. Rosen / McGraw-Hill / 2019Chapter 7-8Advanced Engineering Mathematics / Erwin Kreyszig / John Wiley & Sons / 2011컴퓨터시스템Chapters 4-5Computer Organization and Design: The Hardware Software Interface / David A. Patterson, John L. Hennessy / Morgan Kaufmann / 2020
컴퓨터공학부 개설 전필 과목 수강취소 방안 안내(2024학년도 2학기부터 시행)
컴퓨터공학부 필수 과목들이 최근 너무 많은 수요로 수강신청이 매우 어려운 상황입니다.이에 대해 학생들이 무분별한 수강 신청 후 취소를 방지하고자 2024년 2학기부터 전필 과목의 수강 취소는 다음과 같이 진행됩니다.전필 과목의 수강을 희망하는 학생들은 내용을 확인하여 수강신청 취소에 대해 착오가 없도록 해 주시기 바랍니다. - 수강신청 변경 기간 이후 수강취소 시 교원 승인으로 일괄 적용함.- 개강 2주 이후에는 수강취소 불가- 수강신청 변경 기간 중에는 동일하게 승인 없이 변경 가능* 컴퓨터공학부 전필 과목 리스트 *교과목번호(Course Code)강좌번호(Course Number)교과구분(Course Type)교과목명(Course Title, KOR)교과목명(Course Title, ENG)비고4190.101001전필(Major Required)이산수학Discrete MathematicsM1522.000600001전필(Major Required)컴퓨터프로그래밍Computer Programming M1522.000700001전필(Major Required)논리설계Logic Design M1522.000900 001전필(Major Required)자료구조Data Structures 4190.206A001전필(Major Required)전기전자회로Electrical and Electronic Circuits 2025년 부터 전필 ->전선 변경4190.308001전필(Major Required)컴퓨터구조Computer Architecture M1522.000800001전필(Major Required)시스템프로그래밍Systems Programming 4190.407001전필(Major Required)알고리즘Algorithms 감사합니다.
SNU Computing Commons 건축기금 모금
서울대학교 발전재단 X 컴퓨터공학부