KR101435860B1 - 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법 - Google Patents

전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법 Download PDF

Info

Publication number
KR101435860B1
KR101435860B1 KR1020130006011A KR20130006011A KR101435860B1 KR 101435860 B1 KR101435860 B1 KR 101435860B1 KR 1020130006011 A KR1020130006011 A KR 1020130006011A KR 20130006011 A KR20130006011 A KR 20130006011A KR 101435860 B1 KR101435860 B1 KR 101435860B1
Authority
KR
South Korea
Prior art keywords
template
electronic document
information
image
reading
Prior art date
Application number
KR1020130006011A
Other languages
English (en)
Other versions
KR20140093514A (ko
Inventor
이재원
송봉섭
이진욱
김민진
Original Assignee
주식회사 슈프리마
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 슈프리마 filed Critical 주식회사 슈프리마
Priority to KR1020130006011A priority Critical patent/KR101435860B1/ko
Publication of KR20140093514A publication Critical patent/KR20140093514A/ko
Application granted granted Critical
Publication of KR101435860B1 publication Critical patent/KR101435860B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)

Abstract

전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법이 개시된다. 본 발명의 일 실시 예에 따른 전자문서 템플릿 사용자 조작방법은, 전자문서에 대한 영상을 획득하여 획득된 영상의 기준좌표를 추출하는 단계와, 획득된 영상에서 사용자로부터 육안판독영역(Visual Inspection zone: VIZ)의 템플릿을 선택받아 사용자 조작명령을 입력받는 단계와, 선택된 템플릿의 위치정보를, 추출된 기준좌표와 미리 저장된 해상도 정보를 이용하여 전자문서 내 템플릿의 실제 위치정보로 변환하여 제공하는 단계를 포함한다.

Description

전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법 {Method for manipulating template of electronic document and method for reading the electronic document using the template}
본 발명은 정보 식별 및 인증 기술에 관한 것으로, 보다 상세하게는 전자문서 판독을 통해 사용자의 신원과 권한을 확인하는 기술 및 전자문서 판독을 위한 사용자 인터페이스 기술에 관한 것이다.
전자여권이나, 주민등록증, 운전면허증 등의 아이디 카드에 해당하는 전자문서의 정보를 취득하기 위해서 광학식 판독장치를 사용할 수 있다. 광학식 판독장치는 광학계를 가진 이미지 센서(CCD, CMOS)와, 획득된 영상을 처리하기 위한 디지털 신호 처리부(Digital Signal Processor: DSP)로 구성되며, 컴퓨터 또는 임베디드 장치에서 광 문자 인식(Optical Character Recognition: 이하 OCR라 칭함)을 통해 판독된 정보를 활용할 수 있다.
일반적으로 전자여권이나 아이디 카드에서의 OCR은 사전에 정의된 기계판독영역(Machine Readable Zone: 이하 MRZ라 칭함)에 인쇄된 문자만을 주로 판독하나, 최근에는 MRZ 이외의 영역, 즉 사람이 눈으로 식별하는 육안판독영역(Visual Inspection Zone: 이하 VIZ라 칭함)의 문자도 기계가 판독할 수 있게 하는 기술이 시도되고 있다. 이는 MRZ 인식과 함께 VIZ 인식을 이용하여 문서의 위변조를 교차 검증함에 따라 인식 신뢰성을 높임과 동시에, 사람이 해당 정보를 눈으로 확인하여 수기로 입력하는 중에 생기는 오류를 최소화할 수 있으며, 출입국 및 각종 민원 사이트에서 작업 시간을 단축할 수 있다.
MRZ OCR의 경우, MRZ는 표준 규격(ICAO Doc9303 등)에 의해 특정 위치, 정해진 폰트와 크기, 영문 대문자와 숫자로만 작성되기 때문에, 표준으로 제작된 전자여권이나 아이디 카드의 MRZ는 광학식 판독장치에서 자동으로 식별하여 OCR 결과를 쉽게 도출할 수 있다.
그러나, VIZ의 경우, 글씨의 위치, 항목, 폰트 등에 대한 특정한 기준이 없으며, 각 국가별로 현지언어를 사용하여 작성되기 때문에, MRZ과 같은 방법으로 OCR을 진행하기 어렵다. 즉, 표준 규격을 따르지 않는 비표준 규격의 OCR은 각 광학식 판독장치 제조사의 고객 맞춤화(Customization)에 의한 템플릿이 적용되어야 하며, 장비 구입 후 별도의 요청 절차에 의해 비공개로 진행된다. 이러한 이유 때문에 사용자가 직접 템플릿을 수정하기 어렵고, 다양한 전자문서의 VIZ 판독을 유연하게 처리하기 어렵다.
일 실시 예에 따라, 전자여권이나 아이디 카드 등의 전자문서를 대상으로 VIZ의 판독을 위해 필요한 템플릿을 사용자가 직접 제작 및 관리 가능하고, 사용자가 제작한 템플릿을 이용하여 전자문서의 VIZ를 유연하게 처리할 수 있는 기술을 제안한다.
일 실시 예에 따른 전자문서 템플릿 사용자 조작방법은, 전자문서에 대한 영상을 획득하여 획득된 영상의 기준좌표를 추출하는 단계와, 획득된 영상에서 사용자로부터 VIZ의 템플릿을 선택받아 사용자 조작명령을 입력받는 단계와, 선택된 템플릿의 위치정보를, 추출된 기준좌표와 미리 저장된 해상도 정보를 이용하여 전자문서 내 템플릿의 실제 위치정보로 변환하여 제공하는 단계를 포함한다.
영상의 기준좌표를 추출하는 단계는, 전자문서가 전자여권인 경우, 획득된 영상을 대상으로 기계판독영역의 제1 라인의 중앙 지점을 기준좌표로 추출할 수 있다. 또는, 전자문서가 아이디 카드인 경우, 획득된 영상을 대상으로 최 외곽선의 중앙 지점을 기준좌표로 추출할 수 있다.
사용자 조작명령을 입력받는 단계는, 획득된 영상을 화면에 표시하고, 화면에 표시되는 영상을 대상으로 그래픽 사용자 인터페이스를 제공하여, 사용자로부터 그래픽 사용자 인터페이스를 통해 템플릿 선택 및 선택된 템플릿에 대한 템플릿 속성정보 조작 신호를 입력받을 수 있다.
템플릿 속성정보는 템플릿 타입, 언어 설정정보를 포함한 광학 문자 판독 정보, 바코드 정보, 포토 정보, 템플릿 요약정보 중 적어도 하나를 포함할 수 있다. 또한, 템플릿 속성정보는 전자문서 판독장치가 전자문서 내 템플릿을 검색하기 위해 필요한 기본 키 정보를 포함할 수 있다.
추가 실시 예에 따르면, 전자문서 판독장치의 생산공정 시의 표준차트를 이용하여 전자문서 판독장치의 해상도를 측정하고, 측정된 해상도 값을 미리 저장하는 단계를 포함한다.
추가 실시 예에 따르면, 변환된 전자문서 내 템플릿의 실제 위치정보를 화면에 표시하는 단계를 포함하며, 화면에 표시되는 실제 위치정보는 실수 기반의 벡터 좌표계를 이용하여 표시될 수 있다. 나아가, 변환된 실제 위치정보를 포함하여 템플릿에 대한 템플릿 속성정보를 구조화하여 저장하는 단계를 더 포함할 수 있다.
다른 실시 예에 따른 템플릿을 이용한 전자문서 판독방법은, 전자문서에 대한 영상을 획득하고 획득된 영상을 분석하여 템플릿 검색을 위한 기본 키를 추출하는 단계와, 추출된 기본 키를 이용하여 VIZ에서 사용자가 설정한 템플릿을 검색하는 단계와, 검색된 템플릿의 정보를 읽어들여 상기 육안판독영역을 판독하는 단계를 포함한다.
이때, 템플릿 검색을 위한 기본 키는, 전자문서가 전자여권인 경우 국가코드일 수 있으며, 아이디 카드인 경우 카드 특징 정보일 수 있다.
일 실시 예에 따르면, 전자문서의 VIZ 판독을 위해 필요한 템플릿을 사용자가 직접 제작 및 관리할 수 있으며, 사용자가 제작한 템플릿을 이용하여 전자문서의 VIZ를 판독할 수 있다.
구체적으로, 사용자가 직접 템플릿을 제작 가능함에 따라, 각종 비 표준 규격을 따르는 전자문서의 정보 판독을 위해 템플릿 정보를 제작 및 관리하는 제조사로부터 이를 구매할 필요가 없게 된다. 이에 따라, 구매 비용과 구매에 소요되는 시간을 절감할 수 있다. 또한, 개발중인 전자문서가 수정될 때마다 지속적으로 제조사에 해당 정보를 전송하여 수정본을 받아야 하는 번거로움도 필요 없게 되며, 다양한 응용 및 확판이 가능하다.
나아가, 사용자의 템플릿 조작 시에 조작을 용이하게 할 수 있는 사용자 인터페이스를 제공함에 따라 사용자가 손쉽게 템플릿을 제작 및 관리할 수 있다.
더 나아가, 사용자가 조작한 템플릿을 이용하여 전자문서의 VIZ에 대해 정확한 판독이 가능하다. 즉, 전자문서 영상에서 템플릿 검색을 위한 기본 키를 이용하여 VIZ에서 사용자가 설정한 템플릿을 검색하고, 검색된 템플릿의 정보를 읽어들임에 따라 VIZ를 정확하게 판독할 수 있다.
이는 MRZ 인식과 함께 VIZ 인식을 이용하여 전자문서의 위변조를 교차 검증함에 따라, 신뢰성을 높임과 동시에 사람이 해당 정보를 눈으로 확인하여 수기로 입력하는 중에 생기는 오류를 최소화할 수 있으며, 출입국 및 각종 민원 사이트에서 작업 시간을 단축할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 전자문서 판독장치의 구성도,
도 2는 본 발명의 일 실시 예에 따른 전자여권의 기준좌표 추출 프로세스를 설명하기 위한 전자문서 영상을 도시한 참조도,
도 2와 도 3은 본 발명의 일 실시 예에 따른 아이디 카드의 기준좌표 추출 프로세스를 설명하기 위한 전자문서 영상을 도시한 참조도,
도 4는 본 발명의 일 실시 예에 따라 기준점을 기준으로 템플릿의 실제 위치정보 획득 프로세스를 설명하기 위한 전자문서 영상을 도시한 참조도,
도 5 내지 도 7은 본 발명의 다양한 실시 예에 따른 사용자의 템플릿 조작을 설명하기 위한 화면을 도시한 예시도,
도 8은 본 발명의 일 실시 예에 따라 템플릿을 이용한 전자여권 판독방법을 도시한 흐름도,
도 9는 본 발명의 일 실시 예에 따라 템플릿을 이용한 아이디 카드 판독방법을 도시한 흐름도,
도 10은 도 9의 VIZ 판독 결과의 일 실시 예를 도시한 참조도이다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시 예들을 상세히 설명한다. 본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시 예에 따른 전자문서 판독장치(2)의 구성도이다.
도 1을 참조하면, 전자문서 판독장치(2)는 영상 입력부(20), 영상 처리부(21), 문서 판독부(22), 출력부(23), 저장부(24), 제어부(25) 및 템플릿 조작부(26)를 포함한다.
전자문서(1)는 전자여권(electronic passport)이나 아이디 카드(ID card) 등을 총칭한다. 아이디 카드는 예를 들어, 주민등록증, 운전면허증 등이다. 전자문서 판독장치(2)는 전자문서(1)에 기록된 정보를 판독하는데, 광학식으로 전자문서(1)의 정보를 판독할 수 있다. 판독하고자 하는 정보에는 전자문서(1) 사용자에 대한 신원이나 권한을 확인할 수 있는 정보가 포함된다.
전자문서 판독장치(2)는 스캐너, 카메라 등과 같이 광학계를 가진 이미지 센서(CCD, CMOS 등)를 통해 영상을 생성하는 영상 데이터 생성장치에 포함되거나 연결될 수 있다. 또한, 전자문서 판독장치(2)의 적어도 일부 구성요소는 호스트에 해당하는 컴퓨터나, 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같은 디지털 기기에 포함되거나 연결될 수 있다. 또한, 적어도 일부 구성요소는 외부 단말 장치나 외부 서버 등과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈로서 전자문서 판독장치(2)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억장치 또는 전자문서 판독장치(2)와 통신 가능한 원격 기억장치 등에 저장될 수 있다.
이하, 전자문서 판독장치(2)의 구성요소에 대해 도 1을 참조로 상세히 후술한다.
영상 입력부(20)는 광학계를 가진 영상센서 등을 이용하여 전자문서(1)에 대한 영상을 획득한다. 영상 처리부(21)는 영상 입력부(20)를 통해 획득된 영상을 디지털 신호 처리한다. 문서 판독부(22)는 영상 처리부(21)에서 디지털 신호 처리된 전자문서 영상을 분석하여 문서 정보를 판독한다. 출력부(23)는 영상 처리부(21)에서 디지털 신호 처리된 영상을 화면에 표시하고, 문서 판독부(22)에서 판독된 문서 정보를 화면에 표시한다. 저장부(24)는 전자문서 판독장치(2)의 문서 판독을 위해 필요한 각종 정보와 판독 결과를 저장한다. 제어부(25)는 전술한 각 구성요소들을 통괄 제어한다.
문서 판독부(22)는 광 문자 인식(Optical Character Recognition: 이하 OCR라 칭함)을 통해 전자문서(1)의 문자를 판독할 수 있다. 해당 문자에는 전자문서(1) 사용자에 대한 신원이나 권한을 확인할 수 있는 정보가 포함된다. 예를 들어, 사용자의 국적, 이름, 나이, 성별 등에 대한 정보이다.
세부적으로, 문서 판독부(22)는 OCR을 이용하여, 전자문서(1)의 기계판독영역(Machine Readable Zone: 이하 MRZ라 칭함)에 인쇄된 문자를 판독할 수 있다. 또한, 문서 판독부(22)는 MRZ 이외의 영역, 즉 사람이 눈으로 식별 가능한 육안판독영역(Visual Inspection Zone: 이하 VIZ라 칭함)의 정보도 판독할 수 있다. VIZ 판독은 OCR을 통해서는 어렵지만, 본 발명은 VIZ의 템플릿(template)을 이용하여 VIZ를 판독 가능하다. 템플릿은 전자문서(1)에서 사용자의 정보가 기록된 문자나 이미지 등에 해당하는 영역으로서, 해당 영역의 기본 골격은 사각형 등의 도형 형태로 표현될 수 있다. 문서 판독부(22)의 문서 판독에 대한 세부 프로세스는 도 8 및 도 9에서 후술한다.
템플릿 조작부(26)는 사용자가 직접 VIZ의 템플릿을 제작하고 사용하기 위한 사용자 조작명령을 입력받아 처리한다. 템플릿 조작부(26)를 통한 템플릿 사용자 조작 프로세스는 전자문서 판독장치(2)의 소프트웨어 개발 단계(Software Development Kit level)에서 수행될 수 있다. 한편, 도 1에서는 템플릿 조작부(26)가 전자문서 판독장치(2)에 포함되어 있으나, 템플릿 조작부(26)는 컴퓨터나 디지털 기기 등의 호스트에 포함되거나 연결될 수 있다.
일반적인 전자문서 판독장치에 있어서, 각종 비 표준 규격을 따른 전자문서에 대한 OCR을 위해, 각각의 고유 템플릿 정보를 제조사가 제작, 관리 및 배포하고 있다. 보통 템플릿 한 종을 제작하거나 수정하는 데에 1개월 이상의 많은 시간이 소요되며, 개발중인 전자문서가 수정될 때마다 지속적으로 제조사에 정보를 전송하여 수정본을 받아야 하는 번거로움이 있다.
또한, 대부분의 전자문서의 경우 보안성을 중요시하므로 일부 샘플을 제외하고는 실물 전자문서의 대여 및 양도가 불가능하여, 제조사에서도 최종 제품을 사용하여 VIZ 템플릿을 제작할 수 없다.
이러한 각종 전자문서의 템플릿 정보를 전문으로 구조화하여 판매하는 대형 업체들이 있으나, 그 가격이 너무 고가이고, 제품원가 상승 및 시장 문턱이 높아 다양한 응용 및 확판이 어렵다. 신규 또는 등록되어 있지 않은 문서의 경우, 템플릿 정보 작성에 고비용과 장기간이 소요되며, 2차적인 고객화(Customization) 및 추가 정보 관리에 어려움이 따른다.
따라서, 본 발명은 템플릿 조작부(26)를 통해 사용자가 직접 템플릿 생성, 수정 또는 삭제 등의 손쉬운 조작을 할 수 있도록 하고, 사용자가 조작한 템플릿을 이용하여 VIZ를 정확하게 판독할 수 있는 방법을 제안한다. 이하, 본 발명의 일 실시 예에 따른 전자문서 템플릿 사용자 조작방법에 대해 후술한다.
영상 입력부(20)가 전자문서(1)에 대한 영상을 획득하고, 영상 처리부(21)가 영상 입력부(20)를 통해 획득된 영상을 디지털 신호 처리하면, 문서 판독부(22)는 영상 처리부(21)에서 신호 처리된 영상을 분석하여 문서 정보를 판독한다.
문서 판독부(22)는 디지털 신호 처리된 영상의 기준좌표를 추출한다. 일 실시 예에 따라, 전자문서(1)가 전자여권인 경우, 기준좌표는 영상의 MRZ의 제1 라인의 중앙 지점일 수 있다. 또는, 전자문서(1)가 아이디 카드인 경우, 영상의 최 외곽선의 중앙 지점이 기준좌표일 수 있다. 이에 대한 실시 예는 도 2와 도 3에서 각각 후술한다.
템플릿 조작부(26)는 전자문서 영상에서 사용자로부터 VIZ의 템플릿을 선택받고 선택된 템플릿에 대해 사용자 조작명령을 입력받는다. 그리고, 사용자로부터 선택된 템플릿의 위치정보를, 문서 판독부(22)에서 추출된 기준좌표와 저장부(24)에 미리 저장된 해상도 정보를 이용하여 전자문서 내 템플릿의 실제 위치정보로 변환하여 제공한다. 해상도 정보는, 디피아이(dots per inch: dpi)로 표현될 수 있는데, 예를 들어, 200 dpi는 1 inch 안에 세로 200×가로 200 즉, 40,000 화소가 포함된다. 해상도 정보는, 전자문서 판독장치(2)의 생산공정 시의 표준차트(standard chart)를 이용하여 측정된 후 저장부(24)에 미리 저장될 수 있다. 템플릿의 위치정보는 템플릿의 좌표정보와 크기정보를 포함한다.
일 실시 예에 따라, 템플릿 조작부(26)는 화면에 표시되는 전자문서 영상을 대상으로 그래픽 사용자 인터페이스(GUI)를 제공함에 따라, 사용자가 그래픽 사용자 인터페이스를 통해 템플릿 선택 및 템플릿 속성정보를 조작할 수 있다. 이때, 사용자는 드래그 앤 드롭 방식(drag & drop) 등을 통해 직관적으로 템플릿 조작을 수행할 수 있다.
사용자는 템플릿 속성정보를 조작할 수 있는데, 템플릿 속성정보는 템플릿 타입, 언어 설정정보를 포함한 광학 문자 판독 정보, 바코드 정보, 포토 정보, 템플릿 요약정보 등일 수 있다. 나아가, 템플릿 속성정보는 전자문서 판독장치(2)가 전자문서 내 템플릿을 검색하기 위해 필요한 기본 키(primary key) 정보를 포함할 수 있다. 사용자의 템플릿 조작 프로세스에 대한 실시 예는 도 5 내지 도 7을 참조로 후술한다.
출력부(23)는 템플릿 조작부(26)를 통해 획득된 전자문서 내 템플릿의 실제 위치정보를 화면에 표시하는데, 화면에 표시되는 실제 위치정보는 실수 기반의 벡터 좌표계를 이용하여 표시될 수 있다. 이에 대한 실시 예는 도 4를 참조로 후술한다. 저장부(24)는 템플릿 조작부(26)를 통해 획득된 전자문서 내 템플릿의 실제 위치정보를 포함하여 템플릿에 대한 템플릿 속성정보를 구조화하여 저장할 수 있다.
이하, 후술되는 도면들을 참조로 하여, 도 1을 참조로 하여 전술한 템플릿 사용자 조작방법에 대한 구체적인 실시 예들을 설명한다.
도 2와 도 3은 본 발명의 일 실시 예에 따른 전자문서의 기준좌표 추출 프로세스를 설명하기 위해 전자문서 영상을 도시한 참조도로서, 세부적으로 도 2는 전자여권 영상의 기준좌표를, 도 3은 아이디 카드 영상의 기준좌표를 각각 도시한 것이다.
사용자 템플릿을 제작하기 위해 가장 중요하면서 첫 번째로 선행되어야 할 문제는, 입력받은 영상의 기준점을 찾고, 디지털 영상의 좌표(예: pixel 단위)와 실제 전자문서의 좌표(예: mm 단위)를 매칭시키는 일이다. 이를 위해 본 발명에서는 다음과 같은 과정을 수행한다.
광학식 전자문서 판독장치마다 광학계(렌즈)를 탑재하고 있으며, 기구물의 공차 등으로 인해 장치 별 해상도(DPI)의 차이가 발생한다. 따라서, 본 발명은 장치 생산공정 시 표준차트(Standard Chart)를 이용하여 장치 별 해상도(DPI) 값을 측정하고 장치 내 저장부, 예를 들어 EEPROM에 해당 값을 저장한다.
이하, 각 전자문서 영상에서 흔들리지 않는 기준점을 찾는 방법을 설명한다. 전자여권의 경우, ICAO Doc 9303 등에 명시된 바와 같이, 전자여권의 크기는 고정되어 있으나, 전자여권 표지 혹은 보호 커버 등에 따라 영상에서 보이는 전자문서의 크기가 확장되어 보일 수 있다. 따라서, 전자여권의 경우, 전자여권의 최 외곽(Edge) 면을 기준점으로 삼으면 문제가 발생할 수 있다.
이를 방지하기 위해 본 발명은, 도 2에 도시된 바와 같이, 전자여권 영상의 MRZ의 Line 1의 중앙 지점(200)을 기준점으로 사용할 수 있다. 모든 전자여권에는 하단부에 2 Lines의 MRZ가 존재하는데, 이 위치는 일정하게 유지된다. 물론 Line 1이 아닌 Line 2의 중앙 지점을 기준점으로 삼을 수도 있다. 기울어진 전자여권 영상을 획득한 경우는, MRZ Line을 기준으로 수평보정을 한 후 기준점을 찾는 작업이 추가될 수 있다.
아이디 카드의 경우에는 보호 커버 등의 간섭이 거의 없고, 사이즈가 일정(예: ID-1 85.6×53.98 mm)하여 최 외곽(Edge)을 기준으로 사용하여도 무방하다. 예를 들어, 도 3에 도시된 바와 같이, 아이디 카드의 경우 하단부 경계면의 중앙 지점을 기준점으로 사용할 수 있다. 전자여권과 마찬가지로 기울어진 아이디 카드 영상을 획득한 경우, 상·하단부 경계 면을 기준으로 수평보정을 한 후 기준점을 찾는 작업이 추가될 수 있다.
도 4는 본 발명의 일 실시 예에 따라 기준점을 기준으로 템플릿의 실제 위치정보 획득 프로세스를 설명하기 위한 전자문서 영상을 도시한 참조도이다.
도 1과 도 4를 참조하면, 전자문서 영상에는 VIZ 템플릿에 대한 실제 위치정보가 표시된다. 실제 위치정보는 해당 템플릿의 좌표정보와 크기정보가 포함된다. 실제 위치정보 획득을 위하여, 템플릿 조작부(26)는 해상도(DPI) 정보와 기준좌표를 바탕으로 템플릿에 대한 실제 위치정보를 화면상에 투영할 수 있다.
보통의 OS 환경에서는 위치정보가 정수 기반의 디지털 좌표(Pixel) 단위로 수행된다. 그러나, 본 발명은 수치를 좀 더 세밀하게 표현하고 입력받기 위해, 윈도우즈 프리젠테이션 파운데이션(Windows Presentation Foundation: WPF)의 백터(Vector) 좌표계를 사용한다. 이 방식을 사용하면, 사용자가 자(Ruler) 혹은 버니어 켈리퍼스로 실물의 전자문서를 실측한 데이터를 이용하여 템플릿에 바로 사용할 수 있으며, 장치 간 오차 문제를 근본적으로 해결할 수 있다.
도 4를 참조하면, 사용자가 마우스 등의 사용자 인터페이스를 이용하여 템플릿의 사각형(Rectangle) 영역(410)을 지정할 수 있는데, 해당 사각형 영역(410)의 위치정보를, 검출된 기준좌표와 저장된 해상도 정보를 바탕으로 실제 위치정보로 변환할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 전자문서가 아이디 카드인 경우, 최 외곽의 기준좌표(Start Point (X,U))(400)를 기준으로, 템플릿의 사각형 영역(410)까지의 실제거리인 가로 길이(Width) 15.5mm와, 세로 길이(Height) 36.4mm를 계산하고, 이를 전자문서 영상에 표시할 수 있다. 이때, 해당 좌표는 정수 단위가 아닌 실수 단위로 표시됨을 확인할 수 있다.
도 5 내지 도 7은 본 발명의 다양한 실시 예에 따른 사용자의 템플릿 조작을 설명하기 위한 화면을 도시한 예시도이다.
도 1과, 도 5, 도 6 및 도 7을 참조하면, 전자문서 판독장치(1)는 전자문서 영상을 대상으로 화면에 그래픽 사용자 인터페이스(GUI)를 제공한다. 그러면, 사용자는 그래픽 사용자 인터페이스를 통해 템플릿 선택 및 선택된 템플릿에 대한 속성정보 조작을 직접 수행할 수 있다. 이때, 그래픽 사용자 인터페이스는, 드래그 앤 드롭 방식(drag & drop), 검색 필터 방식, 버튼 선택 방식 등 다양한 방식을 포함하며, 사용자는 해당 인터페이스를 통해 직관적으로 손쉽게 템플릿 조작을 수행할 수 있다.
구체적으로, 사용자는 템플릿 선택 및 선택된 템플릿에 대한 속성정보를 조작할 수 있다. 도 5를 참조하면, 사용자가 조작 가능한 전자문서의 템플릿 속성정보는, 템플릿 리스트(Template List)(500), 템플릿 타입(Template type)(전자여권, 아이디 카드 또는 기타 용지)(510), 기본 키(Primary Key) 정보(520), 텍스트 형태의 템플릿 요약 정보(description)(530), BIZ 선택정보(Select Zone)(540), 판독 형태 정보(OCR, 바코드, 포토)(550), 광학 문자 판독 시 언어 정보(560) 등을 포함한다. 기본 키 정보는, 전자문서가 전자여권인 경우 국가코드 3자리일 수 있고, 아이디 카드인 경우 카드 특징 영상 템플릿 정보일 수 있다. 요약 정보(530)는 사용자가 지정한 템플릿이 어떤 의미를 갖는지를 나타낸다. 언어 정보(560)를 통해서는 다양한 국가별 언어를 설정할 수 있다. BIZ의 경우, 각 국가별로 현지언어를 사용하여 문자가 기록되기 때문에, 언어 정보(560)를 통해 해당 문자의 언어를 지정하는 것이 필요하다.
일 실시 예에 따라, 사용자는 마우스 등의 사용자 인터페이스를 이용하여 템플릿 사각형(Rectangle) 영역을 지정하고, 지정된 사각형 영역에 대한 좌표, 타입, 설명 등 상세정보를 입력할 수 있다. 또한, 사용자는 광학 문자 판독뿐 아니라 도 6의 참조부호 600과 같이 다양한 종류의 바코드(Barcode)를 설정할 수 있다. 이때, 다양한 바코드 타입들 중에서 소정의 타입을 지정할 수 있다. 나아가, 도 7의 참조부호 700과 같이, 영상 정보(photo)를 추출할 수도 있다. 템플릿 속성정보는 구조화한 후 INI, XML, Database 등으로 저장 관리될 수 있다.
도 8은 본 발명의 일 실시 예에 따라 템플릿을 이용한 전자여권 판독방법을 도시한 흐름도이다.
도 1과 도 8을 참조하면, 전자여권 판독장치(1)는 전자문서에 대한 영상을 획득(800)하여 획득된 영상에서 MRZ를 판독(810)하고, 판독 결과를 출력한다(820).
이어서, 템플릿 검색을 위한 기본 키를 추출하는데, 예를 들어, 전자여권 영상에서 국가코드를 추출한다(830). 그리고, 추출된 기본 키를 이용하여 VIZ에서 사용자가 설정한 템플릿을 검색한다(840). 이어서, 검색된 템플릿의 정보를 읽어들여(850) VIZ를 판독(860)하고, VIZ 판독 결과를 출력한다(870).
도 9는 본 발명의 일 실시 예에 따라 템플릿을 이용한 아이디 카드 판독방법을 도시한 흐름도이다.
도 1과 도 9를 참조하면, 전자여권 판독장치(1)는 전자문서에 대한 영상을 획득(900)하여 템플릿 검색을 위한 기본 키를 추출하는데, 예를 들어, 아이디 카드 영상에서 카드 추출 정보를 추출한다(910). 그리고, 추출된 기본 키를 이용하여 VIZ에서 사용자가 설정한 템플릿을 검색한다(920). 이어서, 검색된 템플릿의 정보를 읽어들여(930) VIZ를 판독(940)하고, VIZ 판독 결과를 출력한다(950).
도 10은 도 9의 VIZ 판독 결과의 일 실시 예를 도시한 참조도이다.
도 10을 참조하면, VIZ에 해당하는 Number, Date of Birthday, Face, Local Name 등이 판독되어 출력됨을 확인할 수 있다.
이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
1 : 전자문서 2 : 전자문서 판독장치
20 : 영상 입력부 21 : 영상 처리부
22 : 문서 판독부 23 : 출력부
24 : 저장부 25 : 제어부
26 : 템플릿 조작부

Claims (12)

  1. 전자여권 또는 아이디 카드에 해당하는 전자문서에 대한 영상을 획득하여 획득된 영상의 기준좌표를 추출하는 단계;
    상기 획득된 영상을 화면에 표시하고, 화면에 표시된 영상을 대상으로 그래픽 사용자 인터페이스를 제공하여, 사용자로부터 그래픽 사용자 인터페이스를 통해 전자문서의 육안판독영역(Visual Inspection zone: VIZ)의 템플릿을 선택받고 선택된 템플릿의 속성정보를 조작하는 사용자 조작명령을 전자 입력받는 단계; 및
    상기 선택된 템플릿의 위치정보를, 상기 추출된 기준좌표와 미리 저장된 해상도 정보를 이용하여 상기 전자문서 내 템플릿의 실제 위치정보로 변환하여 제공하는 단계;
    를 포함하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  2. 제 1 항에 있어서, 상기 영상의 기준좌표를 추출하는 단계는,
    상기 전자문서가 전자여권이면, 상기 획득된 영상을 대상으로 기계판독영역의 제1 라인의 중앙 지점을 기준좌표로 추출하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  3. 제 1 항에 있어서, 상기 영상의 기준좌표를 추출하는 단계는,
    상기 전자문서가 아이디 카드이면, 상기 획득된 영상을 대상으로 최 외곽선의 중앙 지점을 기준좌표로 추출하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  4. 삭제
  5. 제 1 항에 있어서,
    상기 템플릿 속성정보는 템플릿 타입, 언어 설정정보를 포함한 광학 문자 판독 정보, 바코드 정보, 포토 정보, 템플릿 요약정보 중 적어도 하나를 포함하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  6. 제 1 항에 있어서,
    상기 템플릿 속성정보는 전자문서 판독장치가 전자문서 내 템플릿을 검색하기 위해 필요한 기본 키 정보를 포함하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  7. 제 1 항에 있어서,
    전자문서 판독장치의 생산공정 시의 표준차트를 이용하여 상기 전자문서 판독장치의 해상도를 측정하고, 측정된 해상도 값을 미리 저장하는 단계;
    를 더 포함하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  8. 제 1 항에 있어서,
    상기 변환된 전자문서 내 템플릿의 실제 위치정보를 화면에 표시하는 단계;를 더 포함하며,
    상기 화면에 표시되는 실제 위치정보는 실수 기반의 벡터 좌표계를 이용하여 표시되는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  9. 제 1 항에 있어서,
    상기 변환된 실제 위치정보를 포함하여 템플릿에 대한 템플릿 속성정보를 구조화하여 저장하는 단계;
    를 더 포함하는 것을 특징으로 하는 전자문서 템플릿 사용자 조작방법.
  10. 전자여권 또는 아이디 카드에 해당하는 전자문서에 대한 영상을 획득하고 획득된 영상을 분석하여 템플릿 검색을 위한 기본 키를 추출하는 단계;
    상기 추출된 기본 키를 이용하여 전자문서의 육안판독영역(Visual Inspection zone: VIZ) 내에서 사용자로부터 선택 받아 속성정보가 조작된 템플릿을 검색하는 단계; 및
    상기 검색된 템플릿의 정보를 읽어들여 상기 육안판독영역을 판독하는 단계;
    를 포함하는 것을 특징으로 하는 템플릿을 이용한 전자문서 판독방법.
  11. 제 10 항에 있어서, 상기 템플릿 검색을 위한 기본 키는,
    상기 전자문서가 전자여권이면, 국가코드인 것을 특징으로 하는 템플릿을 이용한 전자문서 판독방법.
  12. 제 10 항에 있어서, 상기 템플릿 검색을 위한 기본 키는,
    상기 전자문서가 아이디 카드이면, 카드 특징 정보인 것을 특징으로 하는 템플릿을 이용한 전자문서 판독방법.
KR1020130006011A 2013-01-18 2013-01-18 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법 KR101435860B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130006011A KR101435860B1 (ko) 2013-01-18 2013-01-18 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130006011A KR101435860B1 (ko) 2013-01-18 2013-01-18 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법

Publications (2)

Publication Number Publication Date
KR20140093514A KR20140093514A (ko) 2014-07-28
KR101435860B1 true KR101435860B1 (ko) 2014-08-29

Family

ID=51739688

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130006011A KR101435860B1 (ko) 2013-01-18 2013-01-18 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법

Country Status (1)

Country Link
KR (1) KR101435860B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101901965B1 (ko) * 2017-01-12 2018-09-28 엘에스산전 주식회사 프로젝트 화면 작성장치
CN107862303B (zh) * 2017-11-30 2019-04-26 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005110243A (ja) * 2003-09-30 2005-04-21 Toshiba Corp 文書識別情報を走査し、あて先および識別情報をユーザが手書きできるテンプレートを用いて送信する方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005110243A (ja) * 2003-09-30 2005-04-21 Toshiba Corp 文書識別情報を走査し、あて先および識別情報をユーザが手書きできるテンプレートを用いて送信する方法

Also Published As

Publication number Publication date
KR20140093514A (ko) 2014-07-28

Similar Documents

Publication Publication Date Title
US9098765B2 (en) Systems and methods for capturing and storing image data from a negotiable instrument
US20110157215A1 (en) Image output device, image output system and image output method
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
JP2014106692A (ja) 画像処理装置、画像処理方法、画像処理システム及びプログラム
EP2639713A1 (en) Document management systems and methods
US9311529B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP6534355B2 (ja) Pdfファイル管理システム、pdfファイル管理サーバ、pdfファイルデータ取得サーバ、pdfファイル管理方法、pdfファイルデータ取得方法、pdfファイル管理プログラム、およびpdfファイルデータ取得プログラム
US10440197B2 (en) Devices and methods for enhanced image capture of documents
KR101435860B1 (ko) 전자문서 템플릿 사용자 조작방법 및 템플릿을 이용한 전자문서 판독방법
JP6886100B2 (ja) 情報処理装置、その処理方法及びプログラム
US20150227690A1 (en) System and method to facilitate patient on-boarding
US11605219B2 (en) Image-processing device, image-processing method, and storage medium on which program is stored
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP2019070933A (ja) 年末調整業務支援システム
JP5878004B2 (ja) 複数文書認識システム及び複数文書認識方法
JP7318289B2 (ja) 情報処理装置およびプログラム
JP6547654B2 (ja) 書類撮像装置、書類撮像方法、書類撮像装置用のプログラム、および、管理システム
JP7392322B2 (ja) 画像処理装置、画像処理方法、画像処理装置用プログラム、および、書類管理システム
JP2018182664A (ja) 管理装置、管理方法、および、管理装置用のプログラム
JP2013161143A (ja) 文字テキスト化システム
JP2017097859A (ja) 情報処理装置と、その処理方法及びプログラム
US20210027052A1 (en) Image-processing device, image processing method, and storage medium on which program is stored
KR102375566B1 (ko) 종이로 인쇄된 진료비 영수증을 전자 문서화 처리하는 전자 장치 및 그 동작 방법
KR101511590B1 (ko) 스마트 룰러상의 인식 존을 이용한 데이터 입력시스템
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20170817

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180808

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190807

Year of fee payment: 6