기능설명

특징

이미지 속 문자 추출하여 컴퓨터 데이터로 변환

복잡하고 다양한 문서나 이미지 속 문자를 추출하여 데이터화하고 관리할 수 있는 서비스입니다.

정확한 데이터 추출

Optical character recognition(OCR, 광학 문자 인식)은 이미지(사진)에서 글자 위치를 찾고 인식하여 컴퓨터 텍스트로 변환하는 기술입니다. 사용된 OCR은 OCR 분야에서 가장 권위 있는 글로벌 챌린지인 ICDAR2019 4개 분야에서 1위, CVPR 및 ICCV 국제 학회 논문에 선정되는 등 독보적인 기술력을 자랑합니다. 특히 인식 대상의 레이아웃을 분석하고 글자를 읽는 순서와 방향을 추정하여 문자를 인식할 수 있습니다. 또한 곡선으로 배열되거나 기울어진 문자, 필기체 등도 인식할 수 있어 정확한 데이터를 추출할 수 있습니다.

차별화된 모델

OCR 서비스는 AI 기술을 사용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 적용하였습니다. 문자 인식은 한국어, 영어, 일본어를 지원하며 필기체 인식은 한국어와 일본어를 지원합니다.

템플릿 생성

특정 양식을 갖춘 문서나 이미지에서 문자를 추출할 때 해당 양식에 맞는 템플릿을 만들고 지정한 영역에서 필요한 문자만 추출할 수 있습니다. 특정 양식을 디지털 데이터로 변환하는 데 용이하게 활용할 수 있습니다.

문서 처리 자동화

인식한 문서와 생성한 템플릿 간 유사도를 측정하여 문서를 자동으로 분류합니다. 문서 분류 작업이 생략되므로 업무를 효율적으로 처리할 수 있습니다. 또한 인식한 문자(인식 값)를 검증하여 검증 반복 작업을 줄이고 신뢰도를 높일 수 있습니다.

상세기능

지원 기능

OCR Process

단순히 문자를 인식하는 수준을 넘어 문서 종류를 분류하고 구조화된 형태로 문자를 추출합니다.

제공 서비스

문자를 인식할 이미지 데이터를 RESTful API 방식으로 OCR에 전달하면 해당 이미지를 분석하여 추출한 텍스트 데이터를 JSON 형태로 제공합니다.

항목

내용

이미지 속 문자 탐지

- 지원하는 이미지 파일 형식: *.jpg, *.png, *.pdf, *.tiffF (추가 예정)

인식 템플릿

- 지정한 영역의 문자를 추출하여 템플릿에 맞게 정형화된 결과로 전송 가능
- OCR 빌더에서 다양한 인식 템플릿 설정 및 배포 가능

인식 값 검증

검증 연동 End-point를 제공하여 검증이 필요한 이미지의 판독 값을 외부 검증 서버와 연결 가능

멀티 박스

글자 입력 칸을 여러 개 조합하여 인식 가능
<예시> 우편 번호

체크 박스

체크박스 체크 여부 인식 가능

도메인 복사

기존 템플릿 설정값을 복사하여 새로운 도메인 생성 및 플랜 변경 가능

API 제공

API 이용

비로그인 오픈 API이므로, POST로 호출할 때 HTTP Header에 애플리케이션 등록 시 발급받은 Token 값을 같이 전송해 주시면 서비스 이용이 가능합니다.