XAIC

초청강연 I

Invited Talk 1

신진우 교수

KAIST 김재철AI대학원 교수

멀티모달 디퓨전 기반 로봇 파운데이션 모델

Multimodal Diffusion-based Robot Foundataion Model

Biography

2013-현재, KAIST 김재철AI대학원 교수
2012-2013, IBM 연구원
2010-2012, 조지아 공대 연구원
2010, MIT 수학 박사
2001, 서울대학교 수학/전산 학사

Abstract

KAIST 신진우 교수 연구실은 로봇 파운데이션 모델 스타트업 리얼월드와 협력하여 Vision-Language-Action 모델 RLDX-1을 개발했습니다. 본 발표에서는 대규모 로봇 학습 데이터 처리, 멀티모달 모델 학습 파이프라인 구축, 클라우드 기반 실험 가속화 과정에서 마주한 기술적 도전과 해법을 공유하며, 학계-산업계 협력이 Physical AI 혁신을 어떻게 앞당길 수 있는지를 제시합니다.

초청강연 II

Invited Talk 2

오성준 교수 (Seong Joon Oh)

KAIST 김재철AI대학원 부교수

AI - 이제 개인의 영역으로

Deploying General AI in the Private World

발표자료 다운로드

Biography

학력

2013, 케임브리지 대학교 수학 학사
2014, 케임브리지 대학교 수학 석사
2018, 막스플랑크 정보과학연구소 컴퓨터 비전·머신러닝 박사 (지도교수: Bernt Schiele, Mario Fritz)

경력

2018-2022, NAVER AI Lab 연구과학자
2022-2026, 튀빙겐 대학교 W2 교수
2026-현재, KAIST 김재철AI대학원 부교수

연구 분야

신뢰 가능한 AI (Trustworthy AI): 설명 가능성, 데이터 귀인, 프라이버시·보안, AI 정렬

Abstract

범용 AI는 놀라운 성능을 보여주지만, 실제 개인 환경에 적용하기엔 아직 한계가 많습니다. 이 강연에서는 AI 실용화를 가로막는 세 가지 장벽을 다룹니다.

첫째, 인간이 AI에게 의도를 정확히 전달하기 어렵습니다. 모듈형 구조와 에이전트 기반 설계가 해법이 될 수 있습니다. 둘째, AI의 판단을 사람이 이해할 수 있어야 합니다. 설명 가능한 AI와 학습 데이터 귀인 연구가 이 문제를 다룹니다. 셋째, 개인정보 유출, 적대적 공격, 규제 준수 등 보안·프라이버시 문제가 민감한 분야의 도입을 막고 있습니다.

강연 후반부에서는 AI 연구의 새로운 방향을 제시합니다. 모델 확장 경쟁이 아닌, 개인화·에이전트 인터페이스·지식과 지능의 분리로 무게중심이 옮겨가고 있습니다. 50년 전 소프트웨어 공학이 코드와 데이터를 분리한 것처럼, AI에서도 유사한 분리가 이루어진다면 투명하고 수정 가능한 신뢰할 수 있는 시스템이 가능해질 것입니다.

초청강연 III

Invited Talk 3

노병석 리더

(주)카카오 Unified Foundation Model 스튜디오 리더

Kanana-o: 눈으로 보고, 귀로 듣고, 입으로 말하는 AI

Kanana-o: The Journey to an Omnimodal AI That Sees, Hears, and Speaks

발표자료 다운로드

Biography

카카오 Unified Foundation Model 스튜디오 리더
카카오브레인, Intel, 한국전자통신연구원

Abstract

From scratch로 학습한 카카오의 자체 언어모델 kanana를 바탕으로, 비전 언어모델 kanana-v, 오디오 언어모델 kanana-a, 그리고 통합 옴니모달 언어모델 kanana-o로 확장되어 온 카카오의 멀티모달 언어모델 개발 여정을 소개합니다.

각 모델의 개발 과정과 주요 고민, 현재의 성과, 그리고 앞으로의 방향성을 공유합니다.

초청강연 I

신진우 교수

Biography

Abstract

초청강연 II

오성준 교수 (Seong Joon Oh)

Biography

Abstract

초청강연 III

노병석 리더

Biography

Abstract

About

Events

Resources