서울대 컴퓨터공학부 이재욱 교수·전병곤 교수 연구진,
ATC 2019 논문 3편 게재
● SSD기반 빅데이터 어플리케이션의 응답시간을 크게 단축시킬 수 있는 NAND 플래시 블록 지우기 선점/지연 기술 및 비동기식 OS 커널 I/O 스택 개발
● 빅데이터 애플리케이션의 분산 수행 방식을 다양한 자원환경 및 데이터셋에 맞추어 최적화하는 시스템 Apache Nemo 개발
● 시스템 분야 최우수 학회 중 하나인 ATC 2019에 논문 3편 게재
출판 전 논문페이지: https://www.usenix.org/conference/atc19/technical-sessions (최종 출판본은 2019년 7월 공개 예정)
이재욱 교수 연구진과 전병곤 교수 연구진이 시스템 분야 최고 우수 학회 중 하나인 USENIX Annual Technical Conference (ATC) 2019에 3편의 논문을 게재하였다고 밝혔다.
이재욱 교수 연구진은 데이터센터 등에서 구동되는 SSD기반 빅데이터 어플리케이션의 응답시간을 크게 단축시킬 수 있는 두 편의 연구결과를 발표하였다. 먼저 NAND 플래시 메모리 기반 SSD의 꼬리 응답 시간(tail latency)을 획기적으로 낮추는, 저비용/고신뢰성의 NAND 블록 지우기 선점/재개 기술을 개발하였다([그림 1](a)). 본 기술을 적용하면 SSD의 최대 읽기 응답 시간을 기존 약 10ms 수준에서 수백 us 이내로 오십배 이상 단축할 수 있다. 또한, 성균관대 연구팀과 공동으로 초저지연 SSD의 I/O 지연시간을 최대 1/3가량 단축할 수 있는 비동기식 OS 커널 I/O 스택을 발표하였다([그림 1](b)). 본 연구결과를 적용하면 데이터센터 사용자 서비스 품질을 좌우하는 저장장치의 읽기 지연 시간이 극적으로 감소되어, 많은 사용자들의 이용경험 개선에 크게 기여할 것으로 기대된다.
https://cse.snu.ac.kr/sites/default/files/node--notice/20190523_img1.jpg
전병곤 교수 연구팀에서 제안한 Apache Nemo는 빅데이터 애플리케이션의 분산 수행 방식을 다양한 자원환경 및 데이터 특성에 맞추어 최적화하는 시스템이다. Apache Nemo는 분산 수행 최적화 정책을 애플리케이션의 중간 표현을 변형하는 함수로서 개발할 수 있는 프로그래밍 인터페이스를 제공한다. Apache Nemo를 사용하여 쉽고 간결하게 개발한 최적화 정책들은 특정 환경에 특화된 복잡한 기존 시스템들과 같은 수준의 성능 개선을 달성한다. 더불어, 여러 정책들을 조합하여 여러 자원환경 및 데이터셋 특성이 동시에 발생하는 환경에서 보다 더 높은 성능 개선을 달성한다. 이런 쉬운 최적화 표현 및 수행으로 Nemo는 현재 가장 많이 사용되는 Apache Spark 보다 월등하게 높은 성능을 보인다. 아파치 Apache Nemo는 현재 아파치 소프트웨어 재단(Apache Software Foundation, ASF) 공식 오픈소스 인큐베이션 프로젝트이다.
https://cse.snu.ac.kr/sites/default/files/node--notice/20190523_img2.jpg
ATC 2019는 7월 미국 워싱턴주 렌턴시에서 개최될 예정이다.
[문의사항]
이재욱 서울대학교 컴퓨터공학부 교수 / jaewlee@snu.ac.kr
전병곤 서울대학교 컴퓨터공학부 교수 / bgchun@snu.ac.kr
김신 서울대학교 컴퓨터공학부 박사과정 / postshine@snu.ac.kr
양영석 서울대학교 컴퓨터공학부 박사과정 / yyang@snu.ac.kr