윙배너

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복

필기체 인식 어려운 OCR…AI 도입해 다양한 비정형 문서 대응

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
파워젠 관계자가 참관객과 대화하고 있다

이미지 파일에서 텍스트를 추출하는 광학문자인식(Optical Character Recognition, 이하 OCR)기술이 인공지능(AI) 도입으로 진화했다. 기존에는 읽기 어려웠던 필기체나 비정형 문서도 AI로 인식할 수 있다.

5일 양재동 aT센터에서 진행 중인 ‘2023 한글문화산업전시회(이하 전시회)’에 참여한 파워젠이 생성형 AI를 결합한 OCR 솔루션을 전시했다.

OCR은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 스캐너로 획득해 컴퓨터가 편집할 수 있는 문자코드 등의 형식으로 변환하는 소프트웨어다. 다양한 비즈니스 문서를 디지털화해 활용도를 높일 수 있다.

기존 OCR은 정형화된 폰트 외에는 인식이 어려웠다. 기존 폰트와 비교하는 방식이기 때문에 손으로 쓴 글씨는 인식 오류가 잦고, 표나 그림이 들어간 문서는 특히 인식률이 낮았다.

파워젠 관계자는 “정형문서는 폰트를 학습하면 거의 100%의 인식률을 보이지만, 필기체는 어려웠다”며 “AI로 문제점을 보완했다”라고 설명했다.
이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
비정형 문서 예시. 박스에 붙은 라벨도 인식한다

서명이 들어간 문서, 표나 그림이 첨부된 문서도 데이터화 할 수 있다. RPA(Robotic Process Automation)와 연동으로 추출 데이터의 가공도 가능하다.

관계자는 “고객이 추출한 1차 데이터를 자동화 툴로 가공한다”면서 “단순 데이터 추출에 그치지 않고 최종 사용자가 활용할 수 있는 형태로 만든다”라고 설명했다.


0 / 1000


많이 본 뉴스

인공지능이 건축 설계도 ‘뚝딱’

인공지능(이하 AI)이 건축 설계도를 ‘뚝딱’ 내놓는다. 관련 법규 파악은 기본이다. ‘2023 코리아빌드위크(2023 KOREA BUILD WEEK, 이하 전시회)’에 AI 기반 건축설계 솔루션이 등장했다. 2차원 지도상에서 건축 영역을 설정하면, AI가 설계안 10여 개를 제작한다. 이호영 텐일레븐 대표는 “AI가

AI로 영상 속 얼굴 ‘자동 모자이크’

인공지능(AI)으로 영상 속 개인정보를 지운다. 경성테크놀러지가 3일 일산 킨텍스에서 진행 중인 ‘2023 디지털미디어테크쇼(Digital Media Tech Show, DMTS)’에서 ‘영상 개인정보 자동 비식별화 솔루션’을 소개했다. 개인정보를 식별할 수 있는 얼굴이나 차량 번호판 등을 AI가 자동으로 모자이

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복

이미지 파일에서 텍스트를 추출하는 광학문자인식(Optical Character Recognition, 이하 OCR)기술이 인공지능(AI) 도입으로 진화했다. 기존에는 읽기 어려웠던 필기체나 비정형 문서도 AI로 인식할 수 있다. 5일 양재동 aT센터에서 진행 중인 ‘2023 한글문화산업전시회(이하 전시회)’에 참여한 파워

광화문 광장에서 만나는 AI 전시 'AI to Seoul'

생성형 AI(인공지능)가 ‘서울’을 그려냈다. 광화문 광장 해치마당에서는 1일부터 ‘AI to Seoul’ 전시가 진행되고 있다. 광장에서 광화문역까지 이어지는 벽면 LED 미디어월에서 볼 수 있는 해당 전시는 서울시가 기획하는 'Hi, Ai' 시리즈의 첫 번째 전시다. 전시는 참여작가 이창희·뮌·함지

[움짤뉴스] 생성형 AI로 만드는 ‘가상 기상캐스터’

‘제14회 2023 에듀플러스위크 미래교육박람회(이하 미래교육박람회)’에서 생성형 인공지능(AI)을 경험해 볼 수 있는 교육 플랫폼이 출품됐다. 해당 플랫폼은 하나의 툴에서 다양한 생성형 AI를 실습할 수 있다. 챗GPT 같은 채팅 기능을 비롯해 음성, 비디오, 이미지, 음악 등도 제작 가능하






산업전시회 일정


미리가보는 전시회