윙배너
윙배너

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복

필기체 인식 어려운 OCR…AI 도입해 다양한 비정형 문서 대응

이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
파워젠 관계자가 참관객과 대화하고 있다

이미지 파일에서 텍스트를 추출하는 광학문자인식(Optical Character Recognition, 이하 OCR)기술이 인공지능(AI) 도입으로 진화했다. 기존에는 읽기 어려웠던 필기체나 비정형 문서도 AI로 인식할 수 있다.

5일 양재동 aT센터에서 진행 중인 ‘2023 한글문화산업전시회(이하 전시회)’에 참여한 파워젠이 생성형 AI를 결합한 OCR 솔루션을 전시했다.

OCR은 사람이 쓰거나 기계로 인쇄한 문자의 영상을 스캐너로 획득해 컴퓨터가 편집할 수 있는 문자코드 등의 형식으로 변환하는 소프트웨어다. 다양한 비즈니스 문서를 디지털화해 활용도를 높일 수 있다.

기존 OCR은 정형화된 폰트 외에는 인식이 어려웠다. 기존 폰트와 비교하는 방식이기 때문에 손으로 쓴 글씨는 인식 오류가 잦고, 표나 그림이 들어간 문서는 특히 인식률이 낮았다.

파워젠 관계자는 “정형문서는 폰트를 학습하면 거의 100%의 인식률을 보이지만, 필기체는 어려웠다”며 “AI로 문제점을 보완했다”라고 설명했다.
이미지서 텍스트 추출하는 광학문자인식, AI로 한계 극복 - 산업종합저널 전시회
비정형 문서 예시. 박스에 붙은 라벨도 인식한다

서명이 들어간 문서, 표나 그림이 첨부된 문서도 데이터화 할 수 있다. RPA(Robotic Process Automation)와 연동으로 추출 데이터의 가공도 가능하다.

관계자는 “고객이 추출한 1차 데이터를 자동화 툴로 가공한다”면서 “단순 데이터 추출에 그치지 않고 최종 사용자가 활용할 수 있는 형태로 만든다”라고 설명했다.


0 / 1000


많이 본 뉴스

AI 기술의 진화와 미래, 공존하는 '기회'와 '우려'

최근 인공지능(AI) 기술이 빠르게 발전하며 다양한 분야에서 주목받고 있다. 그 영향력은 산업, 의료, 교육, 금융 등 거의 모든 분야에 걸쳐 있으며, AI를 활용한 자동화와 데이터 분석 기술이 많은 일상적 과제를 해결하고 있다. 하지만 AI의 발전이 가져올 미래에는 기대와 함께 우려도 존재한다.

AI 시장, 2032년 1.7조 달러 규모로 급성장... 한국 기업 '기회의 문' 열리나

글로벌 데이터 폭증과 고령화 추세가 인공지능(AI) 산업 혁명을 가속화하는 가운데, 한국 기업들의 AI 시장 진출 기회가 확대되고 있다. 가트너에 따르면 세계 AI 시장 규모는 2024년 2천334억 달러에서 2032년 1조 7천716억 달러로 연평균 29.2% 성장할 것으로 내다봤다. 특히 생성형 A

AI 데이터센터 전력 수요 급증… 2027년까지 전력 부족 위기 예상

AI와 생성형 AI 기술의 빠른 발전과 함께 데이터센터의 전력 수요가 급증하고 있어, 2027년까지 일부 데이터센터에서 전력 부족 문제가 발생할 가능성이 높아졌다. 가트너는 이러한 전력 수요 증가로 인해 기업들이 전력 비용 인상과 지속가능성 문제에 직면할 것이라 전망했다. AI와 데이터센터 전

중소기업 AI 도입 지원 본격화… 정책과제와 법안 마련 착수

중소벤처기업부(중기부)는 23일 서울 광화문 빌딩에서 중소기업의 인공지능(AI) 도입·활용을 지원하기 위한 ‘중소기업 AI 정책자문단’(이하 정책자문단) 출범식을 개최했다고 밝혔다. 정책자문단은 중소기업과 소상공인의 AI 기술 활용 확대를 위해 정책과제를 도출하고, ‘(가칭)중소기업 A

대한민국 제조업, 인공지능(AI) 자율제조로 혁신

산업통상자원부가 인공지능(AI)을 활용해 제조업의 생산성을 대폭 향상시키고 인구구조 변화, 탄소 감축 등 현안 문제를 해결할 'AI 자율제조 선도프로젝트'를 본격 추진한다. 산업부는 28일 안덕근 장관이 참석한 가운데 'AI 자율제조 선도프로젝트 협약식'을 열고, 현대자동차, GS칼텍스, 삼성






산업전시회 일정


미리가보는 전시회