윙배너
윙배너

"AI가 위험 감지한다"… ETRI, '10배 더 안전한' 시각언어모델 공개

텍스트·이미지 유해성 판단 '세이프 라바'… 국내 최초 통합 벤치마크 'HoliSafe' 함께 제시



생성형 인공지능(AI) 모델에 안전성을 구조적으로 내재화한 새로운 유형의 시각언어모델(VLM)이 국내 연구진에 의해 처음 공개됐다. 이 모델은 기존 공개 모델 대비 최대 10배 이상 안전성 향상을 달성했으며, 이미지와 텍스트를 동시에 판단하여 위험까지 감지한다.

한국전자통신연구원(ETRI)은 생성형 AI 모델에 안전성을 구조적으로 내재화한 '세이프 라바(Safe LLaVA)'를 공개했다고 밝혔다. 이 기술은 기존 데이터 중심 파인튜닝 방식에서 벗어나, 20여 종의 안전성 기준을 모델 내부에 직접 내장했다.

7대 위험 자동 탐지… 국내외 모델 검증 실패
'세이프 라바'는 이미지·텍스트 입력에 대해 불법 활동, 폭력, 혐오, 사생활 침해, 성적 콘텐츠, 자해 위험, 전문 조언 등 주요 7개 분야의 위험성을 자동 탐지하고, 안전한 응답과 판단 근거를 함께 제시하는 것이 특징이다.

ETRI는 이 기술을 공개 SW 기반의 LLaVA, Qwen, Gemma 모델에 적용해 Safe LLaVA(7B/13B), Safe Qwen-2.5-VL(7B/32B), Safe Gemma-3-IT(12B/27B) 등 총 6종의 안전 모델을 함께 공개했다.

"AI가 위험 감지한다"… ETRI, '10배 더 안전한' 시각언어모델 공개 - 산업종합저널 전자
AI 앵커

연구진이 '소매치기 방법 질문'과 '성인잡지 이미지'에 특정 질문을 함께 입력해 비교 실험한 결과, Safe LLaVA는 범죄 조장 요청과 부적절한 콘텐츠 요청을 즉시 거부하며 안전 응답을 제시했다. 반면 국내 생성형 모델들은 범죄 실행 방법을 설명하는 등 안전한 답변 거부에 실패한 것으로 나타났다.

AI 안전 기준 부재 극복… 'HoliSafe' 벤치마크 공개
ETRI는 모델 공개와 함께 안전성 벤치마크 데이터셋 '홀리 세이프(HoliSafe)'도 공개했다. HoliSafe는 약 1천700장 이미지, 4천여 개 질문·응답 쌍으로 구성된 평가셋으로, 이미지·텍스트 조합 안전성을 동시에 평가하는 국내 최초의 통합 안전성 벤치마크다.

HoliSafe 기반 정량 실험 결과, 안전성 정량 평가에서 Safe LLaVA는 93%, Safe Qwen은 97%의 안전 응답률을 보여줬다. 이는 AI 기술이 실제 생성형 AI의 안전 활용을 위한 기반을 마련한 중요한 성과임을 입증한다.

이용주 ETRI 시각지능연구실장은 "Safe LLaVA는 안전한 답변과 판단 근거를 동시에 제공하는 국내 최초의 시각언어모델"이라며, "HoliSafe와 같은 구체적 평가 체계가 부재한 상황에서 본 연구는 중요한 성과"라고 강조했다. ETRI는 앞으로 한국어 대형언어모델 개발사업과 연계해 K-AI 안전성 연구를 본격 확대할 계획이다.


0 / 1000


많이 본 뉴스

전기차 충전기 보조사업 점검…관리 부실·보조금 횡령 등 대규모 적발

정부가 최근 5년간 6천600억 원 넘게 투입한 전기차 충전기 설치 지원사업에서 관리 부실과 보조금 횡령 등 대규모 위법 사례가 드러났다. 충전기 수는 빠르게 늘었지만, 관리·감독 체계는 제 역할을 못 하면서 국민 불편과 예산 낭비가 이어진 것으로 확인됐다. 국무조정실 정부합동 부패예

두께 27㎛ 고체전해질막 개발… 전고체 전지 상용화 한 걸음 더

두께 27㎛ 고체전해질막 개발… 전고체 전지 상용화 한 걸음 더두께 27㎛ 고체전해질막 개발… 전고체 전지 상용화 한 걸음 더 한국전자통신연구원(ETRI)이 차세대 에너지저장장치로 주목받는 전고체 전지의 상용화를 앞당길 수 있는 고체전해질막을 개발했다. 연구팀은 고이온전도성 황화물계

[한주간의 산업이슈] ETRI XR 원격 협업 기술 공개…중견기업 채용 확대·스미싱 주의보도

이번 주 산업·기술 분야에서는 차세대 원격 협업 기술 공개, 하반기 중견기업 채용 동향, 그리고 스미싱 주의보 발령 등 주요 이슈가 이어졌다. ETRI(한국전자통신연구원)는 디지털 휴먼과 햅틱 장갑을 활용해 실제 손을 맞잡는 듯한 ‘가상 악수’가 가능한 몰입형 XR 회의 기술을 선보였다.

제이큐 레이저, 글로벌 파이프 커팅 장비 시장 공략 강화

전 세계 산업 현장에서 사용하는 고정밀 파이프 레이저 커팅기의 상당수가 한 기업의 손에서 탄생한다. 2006년 설립된 제이큐 레이저(JQ Laser)는 16년 넘게 레이저 장비 기술에만 집중하며, 400여 명의 임직원 중 절반 이상을 연구개발과 고객 서비스 부문에 배치해 글로벌 시장에서 입지를 넓혀

ETRI, AI 안전성·신뢰성 국제표준 주도… 글로벌 규칙 제정 퍼스트 무버로 부상

인공지능(AI)의 활용이 산업과 일상 전반으로 확산되면서 안전성과 신뢰성 확보가 글로벌 차원의 핵심 과제로 부상했다. 이 가운데 한국전자통신연구원(ETRI)이 'AI 레드팀 테스팅'과 '신뢰성 사실 라벨(TFL)' 두 개 국제표준 개발을 주도하며, 기술 추격자를 넘어 규칙 제정자로 도약하는 행보






산업전시회 일정


미리가보는 전시회