윙배너

한 장의 사진으로 초실사 AI 아바타 구현

자율주행차부터 키오스크까지…디지털 휴먼 상호작용 기술 상용화 기대

한 장의 사진으로 초실사 AI 아바타 구현 - 산업종합저널 동향
ETRI 연구진이 '실사 인물 발화 영상 생성 프레임워크 기술'에 대해 논의하는 모습

한국전자통신연구원(ETRI)이 단 한 장의 인물 사진을 바탕으로 실제 사람처럼 자연스럽게 말하는 초실사형 AI 아바타 기술을 구현했다. 이 기술은 자율주행 시대를 대비한 인간-기계 간 인터페이스로서 새로운 상호작용 방식을 제시하고 있으며, 키오스크, 금융, 방송 등 다양한 분야에 적용 가능성이 제기되고 있다.

ETRI가 개발한 AI 아바타는 기존 음성 기반 비서 시스템과 달리, 정밀한 입 모양과 표정, 피부 주름까지 세밀하게 표현할 수 있다. 운전자와 AI가 직접 대화하거나 보행자와 소통하는 등, 차량 내 직관적인 커뮤니케이션 환경을 구현할 수 있도록 설계됐다.

핵심 기술은 발화에 관여하는 입술과 턱 등의 움직임을 선택적으로 학습하는 독자 알고리즘에 있다. 이 방식은 비정형 정보까지 무작위로 학습하는 기존 생성형 AI 모델과 달리, 표현 정확도를 높이면서도 처리 효율성을 확보할 수 있도록 구성됐다.

ETRI는 해당 기술이 국제 주요 학술대회(CVPR, AAAI 등)에서 발표된 유사 기술들보다 영상 합성 품질과 입술 동기화 성능 측면에서 높은 수준을 기록했다고 설명했다. 한 장의 사진만으로도 자연스럽게 말을 하는 얼굴 영상을 만들어내는 이 기술은, 인공지능 기반 디지털 휴먼 산업 확산을 견인할 수 있는 실용적 도구로 평가된다.

한 장의 사진으로 초실사 AI 아바타 구현 - 산업종합저널 동향
(기술개념도) 영상 창작자(크리에이터)는 목표 인물의 사진 한 장 만으로 그 사람이 실제로 말하는 것 같은 합성 영상을 만들 수 있을 뿐만 아니라 특정 음성, 자세, 문장 입력에 맞춰 합성 인물을 제어가능하다.

응용 범위도 넓다. 키오스크, 은행 창구, 뉴스 진행, 광고 모델 등에 접목해 실제 인력과 유사한 사용자 경험을 제공할 수 있으며, 주문이나 상담 업무 등 반복적 상호작용을 자동화하는 데에도 활용될 수 있다.

ETRI 모빌리티UX연구실은 현재 운전자와 보행자의 감정, 피로도, 집중 상태 등을 분석하는 AI 기반 인터페이스 기술도 함께 개발 중이다. 윤대섭 연구실장은 “기술 발전 속도에 따라 고령자나 정보 소외계층이 배제되지 않도록, 이번 아바타 기술이 모두에게 친숙한 인터페이스로 자리 잡길 바란다”고 말했다.

연구책임자인 최대웅 선임연구원은 “실제 사람처럼 말하고 움직이는 아바타를 구현하는 생성형 AI 기술을 지속적으로 고도화하고 있으며, 향후에는 일부 인력의 업무를 대체할 수 있을 만큼 상호작용 정밀도를 높이는 것이 목표”라고 밝혔다.

해당 기술은 현재 ETRI 기술이전 포털에 ‘실사 인물 발화 영상 생성 프레임워크 기술’로 등록돼 있으며, 연구진은 다양한 산업 분야에서의 이전과 상용화 전략도 함께 추진하고 있다. 이 연구는 『초실사 영상 생성 AI 제어 프레임워크 요소기술 개발』 과제의 일환으로, ‘차세대주역 신진연구사업’ 지원을 받아 수행됐다.


0 / 1000


많이 본 뉴스

불 끄는 전해액, 전기차 배터리 열폭주 제어 기술 확보

전기차 배터리 화재의 주요 원인으로 지목되는 열폭주를 제어할 수 있는 난연성 전해액 기술이 국내 연구진에 의해 확인됐다. 전해액 발화를 막기 위해 소화 원리를 접목한 접근으로, 리튬이온배터리의 구조적 안전성을 높이는 방식이다. 한국연구재단에 따르면, 충남대학교 송승완 교수 연구팀은

국내 연구진, 박막 탠덤 태양전지 세계 최고 효율 달성

차세대 태양광 발전의 핵심 기술로 꼽히는 박막 탠덤 태양전지 분야에서 국내 연구진이 세계 최고 효율을 달성하며 기술 주도권 확보의 전환점을 마련했다. 서울대와 한국과학기술연구원(KIST) 공동연구팀은 페로브스카이트/CIGS 탠덤 태양전지에서 26.3%의 광발전성능을 구현해, 미국 국립재생에너

세계 최초 고압 분사 방식 2리터급 친환경 암모니아 엔진 개발 성공

온실가스 발생이 없는 재생 가능한 에너지원인 암모니아를 연료로 사용하는 2리터급 엔진이 개발됐다. 이 기술은 향후 차량, 선박, 항공용 모빌리티의 동력원과 산업용 발전기 등 다양한 분야에서 핵심 기술로 활용될 전망이다. 한국기계연구원(기계연) 친환경에너지연구본부 박철웅 책임연구원

"정보 탈취형 악성코드 이메일 84% 급증"

2024년 한 해 동안 인포스틸러 악성코드를 이용한 이메일 공격이 전년 대비 84% 급증했다. IBM이 24일 발표한 ‘2025 엑스포스 위협 인텔리전스 인덱스’에 따르면, 사이버 공격자들은 AI를 활용해 피싱 수법을 정교화하고, 주요 기반시설과 제조업을 중심으로 공격을 집중시키고 있는 것으로

ETRI-웨이비스, 질화갈륨 반도체 국산화…국방·위성 핵심부품 자립 길 열어

국내 연구진이 군수용 레이더 및 위성통신용 핵심부품인 질화갈륨(GaN) 반도체 송수신칩을 국산화하는 데 성공했다. 한국전자통신연구원(ETRI)은 ㈜웨이비스와 함께 군용 및 고해상도 영상레이더(SAR)에 탑재되는 GaN 기반 송수신 집적회로(MMIC) 3종을 개발했다고 28일 밝혔다. 이 연구






산업전시회 일정


미리가보는 전시회