윙배너
윙배너

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복

필기체 인식 어려운 OCR…AI 도입해 다양한 비정형 문서 대응

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
파워젠 관계자가 참관객과 대화하고 있다

이미지 파일에서 텍스트를 추출하는 광학문자인식(Optical Character Recognition, 이하 OCR)기술이 인공지능(AI) 도입으로 진화했다. 기존에는 읽기 어려웠던 필기체나 비정형 문서도 AI로 인식할 수 있다.

5일 양재동 aT센터에서 진행 중인 ‘2023 한글문화산업전시회(이하 전시회)’에 참여한 파워젠이 생성형 AI를 결합한 OCR 솔루션을 전시했다.

OCR은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 스캐너로 획득해 컴퓨터가 편집할 수 있는 문자코드 등의 형식으로 변환하는 소프트웨어다. 다양한 비즈니스 문서를 디지털화해 활용도를 높일 수 있다.

기존 OCR은 정형화된 폰트 외에는 인식이 어려웠다. 기존 폰트와 비교하는 방식이기 때문에 손으로 쓴 글씨는 인식 오류가 잦고, 표나 그림이 들어간 문서는 특히 인식률이 낮았다.

파워젠 관계자는 “정형문서는 폰트를 학습하면 거의 100%의 인식률을 보이지만, 필기체는 어려웠다”며 “AI로 문제점을 보완했다”라고 설명했다.
이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
비정형 문서 예시. 박스에 붙은 라벨도 인식한다

서명이 들어간 문서, 표나 그림이 첨부된 문서도 데이터화 할 수 있다. RPA(Robotic Process Automation)와 연동으로 추출 데이터의 가공도 가능하다.

관계자는 “고객이 추출한 1차 데이터를 자동화 툴로 가공한다”면서 “단순 데이터 추출에 그치지 않고 최종 사용자가 활용할 수 있는 형태로 만든다”라고 설명했다.


0 / 1000


많이 본 뉴스

“프롬프트가 새 유출 통로”… 생성형 AI 확산에 기업 보안 ‘사각지대’

생성형 인공지능(AI) 도입이 기업 업무 전반으로 확산하면서 생산성은 높아졌지만, 프롬프트 입력과 파일·이미지 업로드가 새로운 정보 유출 통로로 떠올랐다. 현장에서는 AI 사용을 일괄 차단할 경우 개인 기기와 비인가 서비스로 수요가 이동하는 ‘섀도우 AI’가 늘 수 있는 만큼, 정책과 기

야놀자, 파편화된 여행 산업 ‘에이전틱 AI’로 잇는다… “여행 10배 쉬워질 것”

야놀자가 인공지능(AI) 기술을 통해 파편화된 여행 산업 구조 개선에 나선다. 기업 간 거래(B2B) 영역의 호텔 운영 자동화부터 소비자(B2C) 맞춤형 여행 일정 생성까지 전 과정을 아우르는 ‘에이전틱 AI(Agentic AI)’ 생태계 구축을 골자로 한다, 야놀자는 6일 서울 코엑스에서 개막한 ‘202

"AI 개발 위해 제조 데이터 모은다"… M.AX 얼라이언스, 내년 7천억 투입

정부가 인공지능(AI)을 활용해 제조업의 혁신을 이끄는 'M.AX(Manufacturing AI Transformation) 얼라이언스'에 내년에만 7,000억 원의 예산을 투입한다. 개별 기업이 독자적으로 확보하기 어려운 제조 데이터를 공유하고, 업종별 AI 모델과 전용 반도체를 개발해 산업 경쟁력을 끌어올린다는 구상이다

“AI 비서 넘어 AI 조직으로”… 페다, 자율운영 플랫폼 ‘에이전트그라운드’ 선봬

페다(Feda)가 6일부터 8일까지 서울 코엑스에서 개최된 ‘AI EXPO KOREA 2026(국제인공지능대전)’에 참가해 자율운영 AI 에이전트 SaaS 솔루션인 ‘에이전트그라운드(AgentGround)’를 선보였다. 에이전트그라운드는 단순한 텍스트 기반의 챗봇을 넘어, 복수의 AI 에이전트가 가상의 조직처럼 협업

국회서 ‘AGI 시대’ 대비 논의 본격화…“다른 나라 쫓아가기도 급급해”

미국과 중국 중심의 글로벌 AI(인공지능) 패권 경쟁이 날로 심화되는 가운데, AI 기술은 사람과 비슷한 수준의 이해·적용 능력과 지능을 갖춘 AGI(범용인공지능)을 향해 박차를 가하고 있다. 이에, 국회의원 연구단체 ‘지속 가능 성장을 위한 구조개혁 실천 포럼(지성포럼, 대표의원 고동진·안




산업전시회 일정


미리가보는 전시회