AI EXPO KOREA 2026 / 초청강연
초청강연 I
신진우 교수
KAIST 김재철AI대학원 교수
멀티모달 디퓨전 기반 로봇 파운데이션 모델
Multimodal Diffusion-based Robot Foundataion Model
Biography
- 2013-현재, KAIST 김재철AI대학원 교수
- 2012-2013, IBM 연구원
- 2010-2012, 조지아 공대 연구원
- 2010, MIT 수학 박사
- 2001, 서울대학교 수학/전산 학사
Abstract
KAIST 신진우 교수 연구실은 로봇 파운데이션 모델 스타트업 리얼월드와 협력하여 Vision-Language-Action 모델 RLDX-1을 개발했습니다. 본 발표에서는 대규모 로봇 학습 데이터 처리, 멀티모달 모델 학습 파이프라인 구축, 클라우드 기반 실험 가속화 과정에서 마주한 기술적 도전과 해법을 공유하며, 학계-산업계 협력이 Physical AI 혁신을 어떻게 앞당길 수 있는지를 제시합니다.
초청강연 II
오성준 교수 (Seong Joon Oh)
KAIST 김재철AI대학원 부교수
AI - 이제 개인의 영역으로
Deploying General AI in the Private World
발표자료 다운로드Biography
학력
- 2013, 케임브리지 대학교 수학 학사
- 2014, 케임브리지 대학교 수학 석사
- 2018, 막스플랑크 정보과학연구소 컴퓨터 비전·머신러닝 박사 (지도교수: Bernt Schiele, Mario Fritz)
경력
- 2018-2022, NAVER AI Lab 연구과학자
- 2022-2026, 튀빙겐 대학교 W2 교수
- 2026-현재, KAIST 김재철AI대학원 부교수
연구 분야
신뢰 가능한 AI (Trustworthy AI): 설명 가능성, 데이터 귀인, 프라이버시·보안, AI 정렬
Abstract
범용 AI는 놀라운 성능을 보여주지만, 실제 개인 환경에 적용하기엔 아직 한계가 많습니다. 이 강연에서는 AI 실용화를 가로막는 세 가지 장벽을 다룹니다.
첫째, 인간이 AI에게 의도를 정확히 전달하기 어렵습니다. 모듈형 구조와 에이전트 기반 설계가 해법이 될 수 있습니다. 둘째, AI의 판단을 사람이 이해할 수 있어야 합니다. 설명 가능한 AI와 학습 데이터 귀인 연구가 이 문제를 다룹니다. 셋째, 개인정보 유출, 적대적 공격, 규제 준수 등 보안·프라이버시 문제가 민감한 분야의 도입을 막고 있습니다.
강연 후반부에서는 AI 연구의 새로운 방향을 제시합니다. 모델 확장 경쟁이 아닌, 개인화·에이전트 인터페이스·지식과 지능의 분리로 무게중심이 옮겨가고 있습니다. 50년 전 소프트웨어 공학이 코드와 데이터를 분리한 것처럼, AI에서도 유사한 분리가 이루어진다면 투명하고 수정 가능한 신뢰할 수 있는 시스템이 가능해질 것입니다.
초청강연 III
노병석 리더
(주)카카오 Unified Foundation Model 스튜디오 리더
Kanana-o: 눈으로 보고, 귀로 듣고, 입으로 말하는 AI
Kanana-o: The Journey to an Omnimodal AI That Sees, Hears, and Speaks
발표자료 다운로드Biography
- 카카오 Unified Foundation Model 스튜디오 리더
- 카카오브레인, Intel, 한국전자통신연구원
Abstract
From scratch로 학습한 카카오의 자체 언어모델 kanana를 바탕으로, 비전 언어모델 kanana-v, 오디오 언어모델 kanana-a, 그리고 통합 옴니모달 언어모델 kanana-o로 확장되어 온 카카오의 멀티모달 언어모델 개발 여정을 소개합니다.
각 모델의 개발 과정과 주요 고민, 현재의 성과, 그리고 앞으로의 방향성을 공유합니다.