KR20170061630A - 영역 추출 방법 및 장치 - Google Patents

영역 추출 방법 및 장치 Download PDF

Info

Publication number
KR20170061630A
KR20170061630A KR1020167005538A KR20167005538A KR20170061630A KR 20170061630 A KR20170061630 A KR 20170061630A KR 1020167005538 A KR1020167005538 A KR 1020167005538A KR 20167005538 A KR20167005538 A KR 20167005538A KR 20170061630 A KR20170061630 A KR 20170061630A
Authority
KR
South Korea
Prior art keywords
area
information area
character
region
pixel points
Prior art date
Application number
KR1020167005538A
Other languages
English (en)
Other versions
KR101760109B1 (ko
Inventor
페이 롱
타오 장
지준 천
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Publication of KR20170061630A publication Critical patent/KR20170061630A/ko
Application granted granted Critical
Publication of KR101760109B1 publication Critical patent/KR101760109B1/ko

Links

Images

Classifications

    • G06K9/20
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • G06K9/3283
    • G06K9/344
    • G06K9/6212
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 영역 추출 방법 및 장치를 개시하는 것이며, 이미지 처리 분야에 속한다. 상기 영역 추출 방법은, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하는 단계와; 상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하는 단계와; 상기 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 단계를 포함하며, 관련 기술에서 직접 촬영한 증명서 이미지 중 일부 정보 영역의 인식 난이도가 크고 일부 정보 영역의 위치 결정이 정확하지 않은 문제점을 해결하며, 증명서 이미지에서 제1정보 영역의 영역 위치를 통하여 제2정보 영역을 확정하고 제2정보 영역에 대하여 분할를 실시하여, 제2정보 영역의 위치를 정확하게 결정하고, 제2정보 영역 중의 문자 영역을 정확하게 인식하는 효과를 달성할 수 있다.

Description

영역 추출 방법 및 장치{METHOD AND DEVICE FOR REGION EXTRACTION}
본 출원은 출원번호가 201510726272.4이고, 출원일 2015년 10월 30일인 중국 특허 출원에 기초하여 제출된 것이고, 상기 중국 특허 출원의 우선권을 주장하며, 상기 중국 특허 출원의 모든 내용은 참고로 본 출원에 인용된다.
본 발명은 이미지 처리 분야에 관한 것이고, 구체적으로는 영역 추출 방법 및 장치에 관한 것이다.
신분증의 자동 인식 기술은 이미지 처리를 통하여 신분증의 문자 정보를 인식하는 기술이다.
관련 기술은, 신분증 스캔 설비를 통하여 고정된 상대적 위치에 따라 신분증을 스캔하여, 신분증의 스캔 이미지를 획득하는 단계와; 스캔 이미지 중 n개의 소정의 영역에 대한 문자 인식을 실시하여, 이름 정보, 성별 정보, 민족 정보, 생년월일 정보, 주소 정보와 주민 등록 번호 정보 중 적어도 하나를 획득하는 단계를 포함하는 신분증의 자동 인식 방법을 제공한다. 하지만, 직접 촬영하여 얻은 신분증 이미지에 대해서는 여전히 인식 난이도가 크다.
관련 기술에 존재하는 문제점을 해결하기 위하여, 본 발명은 영역 추출 방법 및 장치를 제공한다.
본 발명의 실시예의 제1측면에 의하면,
증명서 이미지에서 제1정보 영역의 영역 위치를 획득하는 단계와;
상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하는 단계와;
제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 단계를 포함하는 영역 추출 방법을 제공한다.
바람직한 일 실시예에 있어서, 영역 위치는 정점 좌표로 나타내고,
상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하는 단계는,
상기 제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하는 단계를 포함하고,
상기 상대적 위치 관계는 정점 좌표와 제2정보 영역 사이의 상대적 위치 관계이다.
바람직한 일 실시예에 있어서, 제1정보 영역은 제2대 신분증에서의 주민 등록 번호 영역이고, 적어도 2개의 정점 좌표는 주민 등록 번호 영역의 2개의 정점 좌표이며, 제2정보 영역은 제2대 신분증에서의 주소 정보 영역이고,
제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하는 단계는,
2개의 정점 좌표에서 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 주소 정보 영역의 하단 가장자리를 확정하는 단계와;
가장 가까운 한 정점 좌표의 종좌표와 소정의 높이에 의하여, 주소 정보 영역의 상단 가장자리를 확정하는 단계와;
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 주소 정보 영역의 왼쪽 가장자리를 확정하는 단계와;
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 주소 정보 영역의 오른쪽 가장자리를 확정하는 단계와;
하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 따라 주소 정보 영역을 트리밍하는 단계를 포함한다.
바람직한 일 실시예에 있어서, 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 단계는,
제2정보 영역에 대하여 이치화를 수행하여, 이치화 후의 제2정보 영역을 획득하는 단계와;
이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행의 화소점의 세로 좌표와 각 행의 화소점 중의 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산하는 단계와;
제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득하는 단계와;
제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 가로 좌표와 각 열의 화소점 중 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산하는 단계와;
제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득하는 단계를 포함한다.
바람직한 일 실시예에 있어서, 상기 방법은,
제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득하는 단계와;
행 간격이 제3역치보다 큰 경우, 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 더욱 가까운 한 행의 텍스트 영역을 페기하는 단계를 더 포함한다.
바람직한 일 실시예에 있어서, 상기 방법은,
제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 문자 영역 사이의 문자 간격을 인식하여 획득하는 단계와;
인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식하는 단계와;
인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식하는 단계를 더 포함한다.
본 발명의 실시예의 제2측면에 의하면,
증명서 이미지에서 제1정보 영역의 영역 위치를 획득하도록 구성된 획득 모듈과;
제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하도록 구성된 확정 모듈과;
제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 인식 모듈을 포함하는 영역 추출 장치를 제공한다.
바람직한 일 실시예에 있어서, 영역 위치는 정점 좌표로 나타내고,
확정 모듈은 제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하도록 구성되고,
상기 상대적 위치 관계는 정점 좌표와 제2정보 영역 사이의 상대적 위치 관계이다.
바람직한 일 실시예에 있어서, 제1정보 영역은 제2대 신분증에서의 주민 등록 번호 영역이고, 적어도 2개의 정점 좌표는 주민 등록 번호 영역의 2개의 정점 좌표이며, 제2정보 영역은 제2대 신분증에서의 주소 정보 영역이고,
확정 모듈은,
2개의 정점 좌표에서 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 주소 정보 영역의 하단 가장자리를 확정하는 제1확정 서브 모듈과;
가장 가까운 한 정점 좌표의 종좌표와 소정의 높이에 의하여, 주소 정보 영역의 상단 가장자리를 확정하는 제2확정 서브 모듈과;
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 주소 정보 영역의 왼쪽 가장자리를 확정하도록 구성된 제3확정 서브 모듈과;
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 주소 정보 영역의 오른쪽 가장자리를 확정하도록 구성된 제4확정 서브 모듈과;
하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 의하여, 주소 정보 영역을 트리밍하는 트리밍 서브 모듈을 포함한다.
바람직한 일 실시예에 있어서, 인식 모듈은,
제2정보 영역에 대하여 이치화를 수행하여, 이치화 후의 제2정보 영역을 획득하는 이치화 서브 모듈과;
이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행의 화소점의 종좌표와 각 행의 화소점 중의 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산하는 제1계산 서브 모듈과;
제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득하는 행 인식 서브 모듈과;
제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 횡좌표와 각 열의 화소점 중의 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산하는 제2계산 서브 모듈과;
제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득하도록 구성된 문자 인식 서브 모듈을 포함한다.
바람직한 일 실시예에 있어서, 상기 장치는,
제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득하는 행 간격 인식 모듈과;
행 간격이 제3역치보다 큰 경우, 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 더욱 가까운 한 행의 텍스트 영역을 페기하는 페기 모듈을 더 포함한다.
바람직한 일 실시예에 있어서, 상기 장치는,
제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 문자 영역 사이의 문자 간격을 인식하여 획득하는 문자 간격 인식 모듈과;
인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식하는 문자 인식 모듈과;
인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식하는 단일 문자 인식 모듈을 더 포함한다.
본 발명의 실시예의 제3측면에 의하면,
프로세서와;
프로세서에서 실행 가능한 명령을 기억하는 메모리를 포함하고,
상기 프로세서는,
증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고;
제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며;
제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하도록 구성된 영역 추출 장치를 제공한다.
본 발명의 실시예에 의한 기술방안은 아래의 유리한 효과를 포함할 수 있다.
증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고; 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며; 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 것을 통하여, 관련 기술에서 직접 촬영한 증명서 이미지 중 일부 정보 영역의 인식 난이도가 크고 일부 정보 영역의 위치 결정이 정확하지 않은 문제점을 해결하며, 증명서 이미지에서 제1정보 영역의 영역 위치를 통하여 제2정보 영역을 확정하고, 제2정보 영역에 대하여 분할를 실시하여, 제2정보 영역의 위치를 정확하게 결정하고, 제2정보 영역 중의 문자 영역을 정확하게 인식하는 효과를 달성할 수 있다.
상기 일반적인 설명과 아래의 상세한 설명은 예시적인 것에 불과하고, 본 발명을 한정할 수 없음을 이해하여야 할 것이다.
여기서 도면은 명세서에 포함되어 본 명세서의 일부를 구성하고, 본 발명에 적합한 실시예를 도시하고 있으며, 명세서와 함께 본 발명의 원리를 해석하는데 사용된다.
도1은 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도2a는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도2b는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도2c는 예시적 일 실시예에 따른 주소 정보 영역의 하단 가장자리를 확정하는 단계를 도시한 도면이다.
도2d는 예시적 일 실시예에 따른 주소 정보 영역의 상단 가장자리를 확정하는 단계를 도시한 도면이다.
도2e는 예시적 일 실시예에 따른 주소 정보 영역의 왼쪽 가장자리를 확정하는 단계를 도시한 도면이다.
도2f는 예시적 일 실시예에 따른 주소 정보 영역의 오른쪽 가장자리를 확정하는 단계를 도시한 도면이다.
도2g는 예시적 일 실시예에 따른 주소 정보 영역을 확정하는 단계를 도시한 도면이다.
도3a는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도3b는 예시적 일 실시예에 따른 제2정보 영역의 이치화를 도시한 도면이다.
도3c는 예시적 일 실시예에 따른 수평 방향에 따라 제1히스토그램을 계산하는 단계를 도시한 도면이다.
도3d는 예시적 일 실시예에 따른 연속 행 집합을 도시한 도면이다.
도3e는 예시적 일 실시예에 따른 세로 방향에 따라 제2히스토그램을 계산하는 단계를 도시한 도면이다.
도3f는 예시적 일 실시예에 따른 연속 열 집합을 도시한 도면이다.
도4a는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도4b는 예시적 일 실시예에 따른 인접하는 두 행의 텍스트 영역 사이의 행 간격을 도시한 도면이다.
도5a는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이다.
도5b는 예시적 일 실시예에 따른 인접하는 두 문자 영역 사이의 문자 간격을 도시한 도면이다.
도6은 예시적 일 실시예에 따른 영역 추출 장치의 블록도이다.
도7은 다른 예시적 일 실시예에 따른 영역 추출 장치의 블록도이다.
도8은 다른 예시적 일 실시예에 따른 영역 추출 장치의 블록도이다.
도9는 또 다른 예시적 일 실시예에 따른 영역 추출 장치의 블록도이다.
도10은 예시적 일 실시예에 따른 영역 추출 장치의 블록도이다.
이하, 첨부된 도면을 참조하여 예시적 실시예에 대하여 상세히 설명한다. 아래의 설명이 도면에 관계되는 경우, 별도의 설명이 없는 한, 상이한 도면 중의 동일한 숫자는 동일 또는 유사한 요소를 가리킨다. 아래의 예시적 실시예에 설명되는 실시 형태는 본 발명과 일치한 모든 실시 형태를 대표하는 것이 아니라, 첨부된 특허청구범위에 상세히 설명된 바와 같은, 본 발명의 일부 측면과 일치한 장치 및 방법의 예일 뿐이다.
도1는 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이고, 도1에 도시한 바와 같이, 상기 영역 추출 방법은 아래의 단계를 포함한다.
101단계에 있어서, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득한다.
증명서 이미지는 증명서를 직접 촬영하여 얻은 이미지, 예를 들면 신분증 이미지, 사회 보장 카드 이미지 등이다.
제1정보 영역은 증명서 이미지에서 문자 정보를 포함한 영역, 예를 들면, 이름 정보 영역, 생년월일 정보 영역, 성별 정보 영역, 주소 정보 영역, 주민 등록 번호 정보 영역, 관리 번호 정보 영역, 증명서 발급 기관 정보 영역, 유효 기간 정보 영역 등 정보 영역 중의 적어도 하나를 말한다.
102단계에 있어서, 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정한다.
바람직하게는, 제1정보 영역의 위치 결정의 난이도가 제2정보 영역의 위치 결정 난이도보다 낮은 것이다.
103단계에 있어서, 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득한다.
상기를 요약하면, 본 발명의 실시예에 따른 영역 추출 방법은, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고; 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며; 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 것을 통하여, 관련 기술에서 직접 촬영한 증명서 이미지 중 일부 정보 영역의 인식 난이도가 크고 일부 정보 영역의 위치 결정이 정확하지 않은 문제점을 해결하며, 증명서 이미지에서 제1정보 영역의 영역 위치를 통하여 제2정보 영역을 확정하고, 제2정보 영역에 대하여 분할를 실시하여, 제2정보 영역의 위치를 정확하게 결정하고, 제2정보 영역 중의 문자 영역을 정확하게 인식하는 효과를 달성할 수 있다.
도2a는 다른 예시적 일 실시예에 따른 영역 추출 방법의 흐름도이고, 도2a에 도시한 바와 같이, 상기 영역 추출 방법은 아래의 단계를 포함한다.
201단계에 있어서, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고, 정점 좌표로 영역 위치를 나타낸다.
증명서 이미지는 증명서를 직접 촬영하여 얻은 이미지, 예를 들면 신분증 이미지, 사회 보장 카드 이미지 등이다. 바람직하게는, 증명서 이미지를 촬영할 때, 촬영 화면에 촬영을 유도하는 직사각형 영역이 설정되어 있고, 사용자가 직사각형 영역을 증명서에 맞추면, 증명서 이미지를 촬영할 수 있다.
단말기는 증명서 이미지 중 제1정보 영역의 영역 위치를 획득하고, 제1정보 영역의 영역 위치에 의하여, 상기 제1영역 위치 중의 각 정점의 좌표를 획득한다. 또는 정점 좌표로 영역 위치를 나타낸다.
예를 들면, 증명서 이미지의 왼쪽 위를 원점으로 하고, 상단 가장자리를 횡좌표 x의 양의 반축, 왼쪽 가장자리를 종좌표 y의 양의 반축으로 하여 직각 좌표계를 구축하고, 제1정보 영역의 각 정점의 직각 좌표계에서의 위치에 의하여, 각 정점에 대응하는 정점 좌표를 획득하고, 정점 좌표를 이용하여 상기 제1정보 영역의 영역 위치를 나타낸다.
202단계에 있어서, 제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정한다. 상기 상대적 위치 관계는 정점 좌표와 제2정보 영역 사이의 상대적 위치 관계이다.
소정의 상대적 위치 관계는 제1정보 영역의 정점 좌표와 제2정보 영역의 상단 가장자리, 하단 가장자리, 왼쪽 가장자리 및 오른쪽 가장자리 사이의 상대적 위치를 말한다.
단말기는 제1정보 영역에서 획득한 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역의 위치 정보를 확정할 수 있다.
바람직하게, 제1정보 영역은 4개의 정점을 포함하고, 제1정보 영역에서 4개의 정점 중 어느 두 정점의 좌표를 사용하는 가에 대해서는 구체적으로 한정하지 않는다. 바람직하게, 제1정보 영역에서 두 정점 좌표 사이의 거리가 크면 클수록 확정된 제2정보 영역에 발생하는 오차도 작다.
203단계에 있어서, 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득한다.
제2정보 영역의 영역 위치를 확정한 후, 제2정보 영역에 대하여 영역 분할을 수행한다. 영역 분할을 수행한 후, 제2정보 영역은 적어도 한 개의 문자 영역으로 분할된다. 문자 영역은 단일 문자를 포함하는 이미지 영역이다.
상기를 요약하면, 본 발명의 실시예에 따른 영역 추출 방법은, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고; 제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하고, 상대적 위치 관계는 정점 좌표와 제2정보 영역 사이의 상대적 위치 관계이며; 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 것을 통하여, 신분증 자동 인식 방법에서 직접 촬영한 증명서 이미지 중 신분증 정보의 인식 난이도가 크고 신분증 정보의 위치 결정이 정확하지 않은 문제점을 해결하며, 증명서 이미지에서 제1정보 영역의 영역 위치를 통하여 제2정보 영역을 확정하고 제2정보 영역에 대하여 분할를 실시하여, 제2정보 영역의 위치를 정확하게 결정하고, 제2정보 영역 중의 문자 영역을 정확하게 인식하는 효과를 달성할 수 있다.
도2a에 도시된 바람직한 실시예에 있어서, 제1정보 영역은 제2대 신분증에서의 주민 등록 번호 영역이고, 적어도 2개의 정점 좌표는 주민 등록 번호 영역의 왼쪽 위의 정점과 오른쪽 위의 정점 이 2개의 정점 좌표이며, 제2정보 영역은 제2대 신분증에서의 주소 정보 영역이다. 도2b에 도시한 바와 같이, 202단계는 아래의 202a단계 내지 202e단계로 교체할 수 있다.
202a단계에 있어서, 2개의 정점 좌표에서 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 주소 정보 영역의 하단 가장자리를 확정한다.
주민 등록 번호 영역과 주소 정보 영역 사이의 상대적 위치 관계로부터 주소 정보 영역이 주민 등록 번호 영역의 윗측에 있음을 알 수 있다. 따라서, 직각 좌표계의 구축 방식으로부터 알 수 있는바, 2개의 정점 좌표에서 정점이 높으면 높을수록 종좌표는 작고, 주소 정보 영역에 더 근접하므로, 획득한 2개의 정점 좌표에서 더욱 높은 정점의 종좌표가 위치한 수평선을 주소 정보 영역의 하단 가장자리로 한다. 도2c에 도시한 바와 같이, 주민 등록 번호 영역의 첫번째 숫자 3의 종좌표가 위치하는 수평선을 주소 정보 영역의 하단 가장자리 m1로 한다.
202b단계에 있어서, 가장 가까운 한 정점 좌표의 종좌표와 소정의 높이에 의하여, 주소 정보 영역의 상단 가장자리를 확정한다.
주소 정보 영역과 가장 가까운 한 개의 정점 좌표의 종좌표를 확정한 후, 상기 정점 좌표의 종좌표를 시작 위치로 하여, 위로 소정의 높이에 상당하는 거리를 평행 이동하며, 소정의 높이를 평행 이동한 종좌표가 위치하는 수평선을 주소 정보 영역의 상단 가장자리로 한다.
바람직하게는, 상기 소정의 높이는 비교적 여우가 있는 높이이고, 소정의 높이를 평행 이동한 영역이 주소 정보 영역을 포함하기만 하면 된다. 도2d에 도시한 바와 같이, 주민 등록 번호 영역의 첫번째 숫자 3의 종좌표를 시작 위치로 하여, 위로 h높이 평행 이동한 후, h 높이에 대응하는 종좌표가 위치하는 수평선을 주소 정보 영역의 상단 가장자리 m2로 한다.
단계 202c에 있어서, 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 주소 정보 영역의 왼쪽 가장자리를 확정한다.
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표를 왼쪽으로 제1소정 너비 평행 이동하고, 상기 정점 좌표를 평행 이동한 후의 횡좌표가 위치하는 수직선을 주소 정보 영역의 왼쪽 가장자리로 한다. 도2e에 도시한 바와 같이, 주민 등록 번호 영역의 첫번째 숫자 3의 횡좌표를 시작 위치로 하고, 왼쪽으로 r*w(r은 백분율이고, w는 주민 등록 번호 영역의 길이)너비 평행 이동한 후, r*w 너비에 대응하는 황좌표가 위치하는 수직선을 주소 정보 영역의 왼쪽 가장자리 m3으로 한다.
바람직하게, 상이한 정점 좌표의 횡좌표에 대응하는 제1소정 너비는 상이하다. 즉, 상이한 정점 좌표의 횡좌표를 이용하여 왼쪽으로 평행 이동하는 제1소정 너비도 상이하다.
바람직하게, 제1 소정 너비는 주민 등록 번호 영역의 길이의 백분율이다.
202d단계에 있어서, 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 주소 정보 영역의 오른쪽 가장자리를 확정한다.
2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표를 제2소정 너비 평행 이동하고, 상기 정점 좌표를 평행 이동한 후의 횡좌표가 위치하는 수직선을 주소 정보 영역의 오른쪽 가장자리로 한다. 도2f에 도시한 바와 같이, 주민 등록 번호 영역의 마지막 숫자 4의 횡좌표를 시작 위치로 하고, 왼쪽으로 d 너비 평행 이동한 후, d 너비에 대응하는 황좌표가 위치하는 수직선을 주소 정보 영역의 오른쪽 가장자리 m4로 한다.
바람직하게, 상이한 정점 좌표의 횡좌표에 대응하는 제2소정 너비는 상이하다. 즉, 상이한 정점 좌표의 횡좌표를 이용하여 평행 이동한 제2소정 너비도 상이하며, 아울러, 주소 정보 영역의 오른쪽 가장자리를 확정할 때, 일부 정점 좌표의 횡좌표는 왼쪽으로 평행 이동해야 하고, 일부 정점 좌표의 횡좌표는 오른쪽으로 평행 이동해야 하며, 상이한 정점 좌표의 횡좌표의 평행 이동 방향은 상이하다. 이 부분의 내용은 상기 상대적 위치 관계에 의하여 정의된다.
바람직하게, 제2소정 너비는 주민 등록 번호 영역의 길이의 백분율이다.
202e단계에 있어서, 하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 따라 주소 정보 영역을 트리밍한다.
도2g에 도시한 바와 같이, 202a단계 내지 202b단계에서 확정한 주소 정보 영역의 하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 의하여, 주소 정보 영역을 트리밍한다.
상기를 요약하면, 본 실시예에 따른 영역 추출 방법은, 제1정보 영역 중의 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 각각 제2정보 영역의 상단 가장자리, 하단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리를 확정하여, 제2정보 영역의 대략 위치를 트리밍할 수 있게 하고, 제2정보 영역 중의 문자를 분할할 때의 정확한 위치 결정에 유리하다.
설명이 필요한 점은, 도2b의 실시예에 있어서, 201단계에서 제2대 신분증 이미지에서 주민 등록 번호 영역의 영역 위치를 획득하는 실시 형태에 대하여, 제2대 신분증 이미지에서 주민 등록 번호 영역의 양식이 상대적으로 고정되어 있고, 관련 기술의 획득 방법이 비교적 성숙되어 있으므로 본 실시예에서 반복 설명을 생략한다. 예시적인 형태로, 제2대 신분증 이미지의 haar 특징 또는 기타 특징을 추출하여, 추출한 특징을 Adaboost 또느 SVM(Support Vector Machine, 지지 벡터 머신)에 입력하여 트레이닝하고 트레이닝 모델을 획득하며; 트레이닝 모델을 이용하여 인식하고자 하는 제2대 신분증 이미지의 주민 등록 번호 영역을 인식하여, 주민 등록 번호 영역의 영역 위치를 확정한다.
도2a에 도시된 바람직한 실시예에 기초하여, 도3a에 도시한 바와 같이, 203단계는 아래의 203a단계~203e단계로 대체할 수 있다.
203a단계에 있어서, 제2정보 영역을 이치화하여, 이치화 후의 제2정보 영역을 획득한다.
바람직하게는, 202단계에서 확정한 제2정보 영역에 의해, 상기 제2정보 영역에 대한 전처리를 실시하며, 상기 전처리는 잡음 제거, 필터링, 가장자리 추출 등 동작을 포함할 수 있고; 전처리 후의 제2정보 영역을 이치화한다.
도3b에 도시한 바와 같이, 이치화는, 제2정보 영역 중 화소점의 그레이스케일 값과 미리 설정된 그레이스케일 역치를 비교하여, 제2정보 영역 중의 화소점을 미리 설정된 그레이스케일 역치보다 큰 화소그룹과 미리 설정된 그레이스케일 역치보다 작은 화소그룹 두 부분으로 나누며, 두 부분의 화소그룹을 제2정보 영역에서 각각 검은색과 흰색의 상이한 두 색채으로 표현하여, 이치화 후의 제2정보 영역을 획득하는 것을 가리킨다. 전경에 위치하는 색채의 화소점을 전경색 화소점이라고 하는바, 즉 도3b의 백색 화소점이고; 배경에 위치하는 색채의 화소점을 배경색 화소점이라고 하는바, 즉 도3b의 흑색 화소점이다.
203b단계에 있어서, 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행의 화소점의 종좌표와 각 행의 화소점 중 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산한다.
이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라 제1히스토그램을 계산하고, 도3c에 도시한 바와 같이, 상기 제1히스토그램은 세로 방향에서 각 행의 화소점의 종좌표를 나타내고, 수평 방향에서 각 행의 화소점 중 전경색 화소점의 개수의 누계치를 나타낸다.
203c단계에 있어서, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득한다.
제1히스토그램에 의해, 각 행의 화소점 중 전경색 화소점의 누계치를 획득하며, 각 행의 화소점 중 전경색 화소점의 누계치와 제1역치를 비교하여, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합을, 텍스트 영역이 위치하는 행으로 확정할 수 있다.
연속 행 집합은, 전경색 화소점의 누계치가 제1역치보다 큰 행이 연속된 m행이고, 상기 연속된 m행 화소점으로 구성된 집합을 가리킨다. 도3d에 도시한 바와 같이, 도면의 m행 화소점에 있어서, 왼쪽에 위치하는 히스토그램에서의 전경색 화소점의 누계치는 모두 제1역치보다 크다. 상기 m행 화소점이 증명서 이미지에서 대응하는 텍스트 영역은 "촌따둥왕126호"이다.
각 연속 행 집합은 한 행의 텍스트 영역으로 인식되고, n개의 연속 행 집합은 n행의 텍스트 영역으로 인식된다.
203d단계에 있어서, 제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 횡좌표와 각 열의 화소점 중 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산한다.
도3e에 도시한 바와 같이, n행의 텍스트 영역을 확정한 후, 세로 방향에 따라, 제2히스토그램을 계산하며, 상기 제2히스토그램은 수평 방향에서 각 열 화소점의 횡좌표를 나타내고, 세로 방향에서 각 열 화소점 중 전경색 화소점의 누계치를 나타낸다.
203e단계에 있어서, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득한다.
제2히스토그램에 의해 각 열의 화소점 중 전경색 화소점의 누계치를 획득할 수 있고, 각 열의 화소점 중 전경색 화소점의 누계치와 제2역치를 비교하여, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합을, 문자 영역이 위치하는 열로 확정할 수 있다.
연속 열 집합은, 전경색 화소점의 누계치가 제2역치보다 큰 열이 연속된 p열이고, 상기 연속된 p열 화소점으로 구성된 집합을 말하며, 도3f에 도시한 바와 같이, 연속 열 집합은 p이고, 즉, 제2히스토그램에서 형성된 연속 백색 영역이다. 도면의 p열 화소점에 있어서, 아래측에 위치하는 히스토그램에서 전경색 화소점의 누계치는 모두 제2역치보다 크다. 상기 p열 화소점이 증명서 이미지에서 대응하는 문자 영역은 "저"이다.
각 연속 열 집합은 하나의 문자 영역으로 인식되고, n개의 연속 열 집합은 n개의 문자 영역으로 인식된다.
상기를 요약하면, 본 실시예에 의한 영역 추출 방법은, 제2정보 영역을 이치화하고, 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라 제1히스토그램을 계산하여, 제2정보 영역에서 n행 텍스트 영역을 확정하고, n행 텍스트 영역에 대하여, 각각, 세로 방향에 따라 제2히스토그램을 계산하여, 각 문자에 대응하는 문자 영역을 인식한다. 먼저 텍스트 영역이 위치하는 행을 확정하고, 후에 텍스트 영역이 위치하는 행에 따라, 각 행 텍스트 영역 중의 문자 영역을 확정함으로써, 제2정보 영역 중 문자 영역의 위치 결정을 더욱 정확하게 한다.
도 3a에 도시한 실시예에 있어서, 제1정보 영역의 영역 위치와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하는 과정에 있어서, 오차가 발생할 수 있고, 제2정보 영역 외의 문자 또는 잡음을 제2정보 영역의 영역 범위에 포괄할 수 있으므로, 아래의 실시예와 같이, 행 간격을 통하여 제2정보 영역 외의 텍스트 영역을 페기할 수 있다.
도3a에 도시된 바람직한 실시예에 기초하여, 도4a에 도시한 바와 같이, 203c단계 후에 아래의 단계를 더 포함할 수 있다.
401단계에 있어서, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득한다.
설명이 필요한 것은, 주소 정보 영역은 일반적으로 1행 내지 3행의 텍스트 영역을 포함하고, 상기 1행 내지 3행의 텍스트 영역은 비교적 작은 행 간격을 구비한다. 아울러, 상기 1행 내지 3행의 텍스트 영역과 기타 정보 영역 중의 텍스트 영역은 비교적 큰 행 간격을 구비한다. 본 단계는 행 간격의 특징을 이용하여 제2정보 영역 외의 텍스트 영역을 페기한다.
203c단계에서 인식하여 획득한 n행의 텍스트 영역에 대하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 획득한다. 행 간격은 두 행의 텍스트 영역이 제1히스토그램에서의 간격이고, 도4b에 도시한 바와 같이, 한 행의 텍스트 영역과 인접하는 행의 텍스트 영역 사이의 행 간격은 h1이다.
402단계에 있어서, 행 간격이 제3역치보다 큰 경우, 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 더욱 가까운 한 행의 텍스트 영역을 페기한다.
제1히스토그램에 의하여, 아래에서 위로 텍스트 영역에 대한 검색을 수행하고, 첫번째의 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 아래 한 행의 텍스트 영역을 페기하고, 계속하여 위로 검색하여, 재차 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 검색을 종료하고 위의 한 행의 텍스트 영역을 페기한다. 아울러, 나머지 텍스트 영역이 제2정보 영역에 속함을 확정한다.
첫번째의 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 작은 것이 검색되었을 경우, 상기 두 행의 텍스트 영역이 모두 제2정보 영역에 속한다고 확정한다. 계속하여 위로 검색하여, 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큼이 검색되면, 위의 한 행의 텍스트 영역을 페기하고, 검색을 종료한다. 또는, 계속하여 위로 검색하여, 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큼을 검색하지 못하였을 경우, 검색을 종료한다.
바람직하게, 제1히스토그램에 의하여, 위에서 아래로 텍스트 영역에 대한 검색을 수행하고, 첫번째의 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 위의 한 행의 텍스트 영역을 페기하고, 계속하여 위로 검색하여, 재차 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 검색을 종료하고 아래 한 행의 텍스트 영역을 페기한다. 아울러, 나머지 텍스트 영역이 제2정보 영역에 속함을 확정한다.
첫번째의 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 작은 것이 검색되었을 경우, 상기 두 행의 텍스트 영역이 모두 제2정보 영역에 속함을 확정하고, 계속하여 아래로 검색하여, 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큼이 검색되면, 아래 한 행의 텍스트 영역을 페기하고, 검색을 종료한다. 또는, 계속하여 아래로 검색하여, 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큼을 검색하지 못하였을 경우, 검색을 종료한다.
상기를 요약하면, 본 실시예에 따른 영역 추출 방법은, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득하고, 행 간격이 제3역치보다 큰 경우, 제2정보 영역의 상단 가장자리 또는 하단 가장자리와 더욱 가까운 1행의 텍스트 영역을 페기하며, 행 간격의 크기에 의하여, 제2정보 영역 중의 행 텍스트 영역을 확정함으로써 제2정보 영역에 대한 위치 결정을 보다 정확하게 한다.
도 3a에 도시한 실시예에 있어서, 제2정보 영역의 왼쪽 가장자리와 오른쪽 가장자리를 확정하는 과정에 있어서, 오차가 발생할 수 있고, 제2정보 영역 외의 문자 영역을 제2정보 영역의 범위에 포괄할 수 있으므로, 아래의 실시예와 같이, 행 간격을 통하여 제2정보 영역 외의 문자 영역을 페기할 수 있다.
도4a에 도시된 바람직한 실시예에 기초하여, 도5a에 도시한 바와 같이, 203e단계 후에 아래의 단계를 더 포함할 수 있다.
501단계에 있어서, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 개의 문자 영역 사이의 문자 간격을 인식하여 획득한다.
203e단계에서 인식하여 획득한 ni개의 문자 영역에 의하여, 인접하는 두 개의 문자 영역 사이의 문자 간격을 획득하는 바, 각 행 텍스트 영역 중에서 인접하는 두 개의 문자 영역 사이의 문자 간격은 작다.
문자 간격이란 두 개의 문자 영역이 제2히스토그램에서의 간격을 말하고, 도5b에 도시한 바와 같이, 문자와 문자 사이의 문자 간격은 h2이다.
502단계에 있어서, 인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식한다.
현재 텍스트 영역의 중간의 한 문자를 시작 위치로 하여, 시작 위치에서 왼쪽으로 검색하기 시작하며, 첫번째의 인접하는 두 개의 문자 영역 사이의 문자 간격이 제4역치보다 큰 것이 검색되었을 경우, 인접하는 두 개의 문자 영역에서 왼쪽에 위치하는 문자 영역(상기 문자 간격 왼쪽에 위치하는 전부 문자 영역)을 페기하며, 인접하는 두 개의 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식한다. 첫번째 문자 영역을 인식한 후, 첫번째 문자 영역의 위치에 의하여, 오른쪽으로 검색을 시작하고, 인접하는 두 개의 문자 영역 사이의 문자 간격이 제4역치보다 큼이 검색되면, 검색을 종료한다.
첫번째 인접하는 두 개의 문자 영역 사이의 문자 간격이 제4역치보다 작은 것이 검색되었을 경우, 인접하는 두 개의 문자 영역을 모두 현재 행의 텍스트 영역 중의 문자 영역으로 확정할 수 있다.
503단계에 있어서, 인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식한다.
현재 텍스트 영역의 중간의 한 문자를 시작 위치로 하여, 시작 위치에서 오른쪽으로 검색하기 시작하며, 첫번째의 인접하는 두 개의 문자 영역 사이의 문자 간격이 제5역치보다 큰 것이 검색되었을 경우, 인접하는 두 개의 문자 영역에서 오른쪽에 위치하는 문자 영역(상기 문자 간격 오른쪽에 위치하는 전부 문자 영역)을 페기하며, 인접하는 두 개의 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식한다. 마지막 문자 영역을 인식한 후, 마지막 문자 영역의 위치에 의하여, 왼쪽으로 검색을 시작하고, 인접하는 두 개의 문자 영역 사이의 문자 간격이 제5역치보다 큼이 검색되면, 검색을 종료한다.
첫번째 인접하는 두 개의 문자 영역 사이의 문자 간격이 제5역치보다 작은 것이 검색되었을 경우, 인접하는 두 개의 문자 영역을 모두 현재 행의 텍스트 영역 중의 문자 영역으로 확정할 수 있다.
상기를 요약하면, 본 실시예에 따른 영역 추출 방법은, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 개의 문자 영역 사이의 문자 간격을 인식하여 획득하고; 인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식하며; 인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식하고; 문자 간격의 크기에 의하여, 제2정보 영역 중의 문자 영역을 확정함으로써, 제2정보 영역 중의 각 문자 영역의 위치를 정확히 결정하게 한다.
설명이 필요한 점은, 도1에 도시된 실시예, 도2a에 도시된 실시예, 도2b에 도시된 실시예, 도3a에 도시된 실시예, 도4a에 도시된 실시예와 도5a에 도시된 실시예에 있어서 문자 영역을 인식한 후, 기존의 문자 인식 알고리즘에 의하여, 문자 영역에 대하여 가일층 처리하여, 문자 영역 중의 문자를 인식할 수 있다.
설명이 필요한 점은, 상기 방법 실시예에 관계되는 신분증 이미지는 본 발명에서 예시적인 설명이고, 진실한 신분증 이미지가 아니다.
아래 설명은 본 발명의 장치 실시예이고, 본 발명의 방법 실시예를 실행하는데 사용될 수 있다. 본 발명의 장치 실시예에 개시되지 않은 상세한 내용은, 본 발명의 방법 실시예에 대한 설명을 참조할 수 있다.
도6은 예시적 일 실시예에 따른 영역 추출 장치의 블록도이고, 도6에 도시한 바와 같이, 상기 영역 추출 장치는 하기를 포함하나 그에 한정되지는 않는다.
획득 모듈(610)은 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하도록 구성된다.
증명서 이미지는 증명서를 직접 촬영하여 얻은 이미지, 예를 들면 신분증 이미지, 사회 보장 카드 이미지 등이다.
제1정보 영역은 증명서 이미지에서 텍스트 정보를 포함한 영역, 예를 들면, 이름 정보 영역, 생년월일 정보 영역, 성별 정보 영역, 주소 정보 영역, 주민 등록 번호 정보 영역, 번호 정보 영역, 증명서 발급 기관 정보 영역, 유효 기간 정보 영역 등 정보 영역 중의 적어도 하나를 말한다.
확정 모듈(620)은 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하도록 구성된다.
인식 모듈(630)은, 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하도록 구성된다.
상기를 요약하면, 본 발명의 실시예에 따른 영역 추출 방법은, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고; 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며; 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 것을 통하여, 관련 기술에서 직접 촬영한 증명서 이미지 중 일부 정보 영역의 인식 난이도가 크고 일부 정보 영역의 위치 결정이 정확하지 않은 문제점을 해결하며, 증명서 이미지에서 제1정보 영역의 영역 위치를 통하여 제2정보 영역을 확정하고 제2정보 영역에 대하여 분할를 실시하여, 제2정보 영역의 위치를 정확하게 결정하고, 제2정보 영역 중의 문자 영역을 정확하게 인식하는 효과를 달성할 수 있다.
도7은 다른 예시적 일 실시예에 따른 영역 추출 장치의 블록도이고, 도7에 도시한 바와 같이, 상기 영역 추출 장치는 아래의 모듈을 포함하나 이에 한정되지 않는다.
획득 모듈(610)은 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하도록 구성된다.
증명서 이미지는 증명서를 직접 촬영하여 얻은 이미지, 예를 들면 신분증 이미지, 사회 보장 카드 이미지 등이다.
획득 모듈(610)은, 증명서 이미지에서 제1정보 영역의 영역 위치를 획득한 경우, 제1정보 영역의 영역 위치에 의하여, 상기 제1영역 위치 중의 각 정점의 좌표를 획득한다. 또는 정점 좌표로 영역 위치를 나타낸다.
예를 들면, 증명서 이미지의 왼쪽 위를 원점으로 하고, 상단 가장자리를 횡좌표 x의 양의 반축, 왼쪽 가장자리를 종좌표 y의 양의 반축으로 하여 직각 좌표계를 구축하고, 제1정보 영역의 각 정점의 직각 좌표계에서의 위치에 의하여, 각 정점에 대응하는 정점 좌표를 획득하고, 정점 좌표를 이용하여 상기 제1정보 영역의 영역 위치를 나타낸다.
확정 모듈(620)은 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하도록 구성된다.
확정 모듈(620)은, 또한 제1정보 영역의 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역을 확정하도록 구성되고, 상대적 위치 관계는 소정의 정점 좌표와 제2정보 영역 사이의 상대적 위치 관계를 말한다.
소정의 상대적 위치 관계는 제1정보 영역의 정점 좌표와 제2정보 영역의 상단 가장자리, 하단 가장자리, 왼쪽 가장자리 및 오른쪽 가장자리 사이의 상대적 위치를 말한다.
확정 모듈(620)은 제1정보 영역에서 획득한 적어도 2개의 정점 좌표와 소정의 상대적 위치 관계에 의하여, 제2정보 영역의 위치 정보를 확정할 수 있다.
본 실시예에 있어서, 확정 모듈(620)은 아래의 서브 모듈을 포함할 수 있다.
제1확정 서브 모듈(621)은, 2개의 정점 좌표에서 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 주소 정보 영역의 하단 가장자리를 확정하도록 구성된다.
주민 등록 번호 영역과 주소 정보 영역 사이의 소정의 상대적 위치 관계로부터, 주소 정보 영역이 주민 등록 번호 영역의 윗측에 있음을 알 수 있다. 그러므로, 직각 좌표계의 구축 방식으로부터 알 수 있는바, 2개의 정점 좌표에서 정점이 높으면 높을수록 종좌표는 작고, 주소 정보 영역에 근접하므로, 제1확정 서브 모듈(621)은 획득한 2개의 정점 좌표에서 더욱 높은 정점의 종좌표가 위치한 수평선을 주소 정보 영역의 하단 가장자리로 한다.
제2확정 서브 모듈(622)는 가장 가까운 한 정점 좌표의 종좌표와 소정의 높이에 의하여, 주소 정보 영역의 상단 가장자리를 확정하도록 구성된다.
제1확정 서브 모듈(621)은 주소 정보 영역과 가장 가까운 한 개의 정점 좌표의 종좌표를 확정한 후, 제2확정 서브 모듈(622)는 상기 정점 좌표의 종좌표를 시작 위치로 하여, 위로 소정의 높이에 상당하는 거리를 평행 이동하며, 소정의 높이를 평행 이동한 종좌표가 위치하는 수평선을 주소 정보 영역의 상단 가장자리로 한다.
제3확정 서브 모듈(623)은 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 주소 정보 영역의 왼쪽 가장자리를 확정하도록 구성된다.
제3확정 서브 모듈(623)은 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표를 왼쪽으로 제1소정 너비 평행 이동하고, 상기 정점 좌표를 평행 이동한 후의 횡좌표가 위치하는 수직선을 주소 정보 영역의 왼쪽 가장자리로 한다.
제4확정 서브 모듈(624)는 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 주소 정보 영역의 오른쪽 가장자리를 확정하도록 구성된다.
제4확정 서브 모듈(624)는 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표를 제2소정 너비 평행 이동하고, 상기 정점 좌표를 평행 이동한 후의 횡좌표가 위치하는 수직선을 주소 정보 영역의 오른쪽 가장자리로 한다.
트리밍 서브 모듈(625)는 하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 의하여, 주소 정보 영역을 트리밍하도록 구성된다.
제1확정 모듈(621) 내지 제4확정 모듈(624)에서 확정한 주소 정보 영역의 하단 가장자리, 상단 가장자리, 왼쪽 가장자리와 오른쪽 가장자리에 의하여, 트리밍 서브 모듈(625)는 주소 정보 영역을 트리밍한다.
인식 모듈(630)은, 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하도록 구성된다.
트리밍 서브 모듈(625)이 제2정보 영역의 영역 위치를 확정한 후, 인식 모듈(630)은 제2정보 영역에 대하여 영역 분할을 수행한다. 영역 분할을 수행한 후, 제2정보 영역은 적어도 한 개의 문자 영역으로 분할된다. 문자 영역은 단일 문자를 포함하는 이미지 영역이다.
도7에 도시된 바람직한 실시예에 있어서, 도8에 도시한 바와 같이, 인식 모듈(630)은 아래의 서브 모듈을 포함할 수 있다.
이치화 서브 모듈(631)은 제2정보 영역을 이치화하여, 이치화 후의 제2정보 영역을 획득하도록 구성된다.
트리밍 서브 모듈(625)에 의해 확정된 제2정보 영역에 의하여, 상기 제2정보 영역을 전처리하는 것이 바람직하고, 상기 전처리는 잡음 제거, 필터링, 가장자리 추출 등의 동작을 포함할 수 있으며; 전처리 후의 제2정보 영역에 대하여 이치화를 수행한다.
이치화는, 제2정보 영역 중 화소점의 그레이스케일 값과 미리 설정된 그레이스케일 역치를 비교하여, 제2정보 영역 중 화소점을 미리 설정된 그레이스케일 역치보다 큰 화소그룹과 미리 설정된 그레이스케일 역치보다 작은 화소그룹 두 부분으로 나누고, 두 부분의 화소 그룹을 제2정보 영역에서 각각 검은색과 흰색의 상이한 두가지 색으로 표현하여, 이치화 후의 제2정보 영역을 획득하는 것을 가리킨다.
제1계산 서브 모듈(632)은, 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행의 화소점의 종좌표와 각 행의 화소점 중 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산하도록 구성된다.
제1계산 서브 모듈(632)은 이치화 서브 모듈(631)에 의해 처리된 제2정보 영역에 대하여, 수평 방향에 따라 제1히스토그램을 계산하고, 상기 제1히스토그램은 세로 방향에서 각 행의 화소점의 종좌표를 나타내고, 수평 방향에서 각 행의 화소점 중 전경색 화소점의 개수의 누계치를 나타낸다.
행 인식 서브 모듈(633)은, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득하도록 구성된다.
제1히스토그램에 의해, 각 행의 화소점 중 전경색 화소점의 누계치를 획득하며, 행 인식 서브 모듈(633)은 각 행의 화소점 중 전경색 화소점의 누계치와 제1역치를 비교하여, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합을, 텍스트 영역이 위치하는 행으로 확정할 수 있다.
연속 행 집합은, 전경색 화소점의 누계치가 제1역치보다 큰 행이 연속되는 m행이고, 상기 연속되는 m행 화소점으로 구성된 집합을 가리킨다.
각 연속 행 집합은 한 행의 문자 영역으로 인식되고, n개의 연속 행 집합은 n행의 문자 영역으로 인식된다.
제2계산 서브 모듈(634)는, 제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 횡좌표와 각 열의 화소점 중 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산하도록 구성된다.
행 인식 서브 모듈(633)에 의해, n행의 텍스트 영역을 확정한 후, 제2계산 서브 모듈(634)는 세로 방향에 따라, 제2히스토그램을 계산하며, 상기 제2히스토그램은 수평 방향에서 각 열 화소점의 횡좌표를 나타내고, 세로 방향은 각 열 화소점 중 전경색 화소점의 누계치를 나타낸다.
문자 인식 서브 모듈(635)는 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득하도록 구성된다.
제2히스토그램에 의해, 각 열 화소점 중 전경색 화소점의 누계치를 획득할 수 있고, 문자 인식 서브 모듈(635)는 각 열 화소점 중 전경색 화소점의 누계치와 제2역치를 비교하여, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합을 문자 영역이 위치하는 열로 확정한다.
연속 열 집합은, 전경색 화소점의 누계치가 제2역치보다 큰 열이 연속 p열이고, 상기 연속 p열 화소점에 의하여 구성된 집합을 말한다.
각 연속 열 집합은 하나의 문자 영역으로 인식되고, n개의 연속 열 집합은 n개의 문자 영역으로 인식된다.
상기를 요약하면, 본 실시예에 의한 영역 추출 장치는, 제2정보 영역을 이치화하고, 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라 제1히스토그램을 계산하여, 제2정보 영역에서 n행 텍스트 영역을 확정하고, n행의 텍스트 영역을 각각 세로 방향에 따라 제2히스토그램을 계산함으로써, 각 문자에 대응하는 문자 영역을 인식한다. 먼저 텍스트 영역이 위치하는 행을 확정하고, 후에 텍스트 영역이 위치하는 행에 의하여 각 행 텍스트 영역 중의 문자 영역을 확정함으로써, 제2정보 영역 중 문자 영역의 위치 결정을 더욱 정확하게 한다.
도8에 도시된 바람직한 실시예에 기초하여, 도9에 도시한 바와 같이, 상기 장치는 아래의 모듈을 더 포함할 수 있다.
행 간격 인식 모듈(910)은, 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득하도록 구성된다.
인식 서브 모듈(633)에 의해 인식하여 획득된 n행의 텍스트 영역에 대하여, 행 간격 인식 모듈(910)은 인접하는 두 행의 텍스트 영역 사이의 행 간격을 획득한다. 행 간격은 두 행의 텍스트 영역이 제1히스토그램에서의 간격을 말한다.
페기 모듈(920)은 행 간격이 제3역치보다 큰 경우, 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 더욱 가까운 한 행의 텍스트 영역을 페기하도록 구성된다.
제1히스토그램에 의하여, 아래에서 위로 텍스트 영역에 대한 검색을 수행하고, 첫번째의 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 페기 모듈(920)은 아래 한 행의 텍스트 영역을 페기하고, 계속하여 위로 검색하고, 재차 인접하는 두 행의 텍스트 영역의 행 간격이 제3역치보다 큰 것이 검색되었을 경우, 검색을 종료하고 위의 한 행의 텍스트 영역을 페기한다. 아울러, 나머지 텍스트 영역이 제2정보 영역에 속함을 확정한다.
문자 간격 인식 모듈(930)은, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 개의 문자 영역 사이의 문자 간격을 인식하여 획득하도록 구성된다.
문자 인식 서브 모듈(635)에서 인식하여 획득된 ni개의 문자 영역에 의하여, 문자 간격 인식 모듈(930)은 인접하는 두 개의 문자 영역 사이의 문자 간격을 획득하는 바, 각 행 텍스트 영역 중에서 인접하는 두 개의 문자 영역 사이의 문자 간격은 작다.
문자 간격은 두 개의 문자 영역이 제2히스토그램에서의 간격을 말한다.
텍스트 인식 모듈(940)은 인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식하도록 구성된다.
단일 문자 인식 모듈(950)은 인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식하도록 구성된다.
상기를 요약하면, 본 실시예에 따른 영역 추출 장치는, 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 개의 문자 영역 사이의 문자 간격을 인식하여 획득하고; 인접하는 두 문자 영역이 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 두 문자 영역에서 오른쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 첫번째 문자 영역으로 인식하며; 인접하는 두 문자 영역이 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 두 문자 영역에서 왼쪽에 위치하는 문자 영역을 현재 행 텍스트 영역 중의 마지막 문자 영역으로 인식하고; 문자 간격의 크기에 의하여 제2정보 영역 중의 문자 영역을 확정함으로써, 제2정보 영역 중의 각 문자 영역의 위치를 정확히 결정하게 한다.
상기 실시예에 있어서의 장치에 대하여, 그 중 각 모듈이 동작을 실행하는 구체적 형태에 대해서는 이미 상기 방법에 관계되는 실시예에서 상세히 설명하였으므로, 여기서 더 이상 상세한 설명을 하지 않는다.
본 발명의 예시적 일 실시예에 따른 영역 추출 장치는, 본 발명에 의한 영역 추출 방법을 실현할 수 있고, 상기 영역 추출 장치는,
프로세서와 프로세서에서 실행 가능한 명령을 기억하는 메모리를 포함하고,
상기 프로세서는,
증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고;
제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며;
제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하도록 구성된다.
도10은 예시적 일 실시예에 따른 영역 추출 방법에 사용되는 장치의 블록도이다. 예를 들면, 장치(1000)는 휴대폰, 컴퓨터, 디지털 방송 단말기, 메시지 송수신 장치, 게임 콘솔, 태블릿 장치, 의료 설비, 운동 기구, 개인 휴대 정보 단말기 등일 수 있다.
도10에 도시한 바와 같이, 장치(1000)는, 처리 컴포넌트(1002), 메모리(1004), 전원 컴포넌트(1006), 멀티미디어 컴포넌트(1008), 오디오 컴포넌트(1010), 입력/출력(I/O) 인터페이스(1012), 센서 컴포넌트(1014), 및 통신 컴포넌트(1016) 중 한 개 또는 복수 개의 컴포넌트을 포함할 수 있다.
처리 컴포넌트(1002)은, 일반적으로 장치(1000)의 전체 동작, 예를 들면, 표시, 전화 호출, 데이터 통신, 카메라 동작 및 기록 동작에 관계되는 동작을 제어한다. 처리 컴포넌트(1002)은, 상기 방법의 전부 또는 부분적 단계를 완성하기 위하여, 명령을 실행하는 한 개 또는 복수 개의 프로세서(1018)를 포함할 수 있다. 또한, 처리 컴포넌트(1002)는, 한 개 또는 복수 개의 모듈을 포함할 수 있고, 처리 컴포넌트(1002)과 기타 컴포넌트 사이의 인터랙티브를 편리하게 할 수 있다. 예를 들면, 멀티미디어 컴포넌트(1008)과 처리 컴포넌트(1002) 사이의 인터랙티브에 편리를 도모하기 위해, 처리 컴포넌트(1002)는 멀티미디어 모듈을 포함할 수 있다.
메모리(1004)는, 장치(1000)에 있어서의 동작을 지원하기 위하여, 다양한 유형의 데이터를 기억하도록 구성되어 있다. 이러한 데이터의 사례는, 장치(1000)에서 동작하는 모든 응용 프로그램 또는 방법의 명령, 연락자 데이터, 전화 번호부 데이터, 메시지, 사진, 비디오 등을 포함한다. 메모리(1004)는 임의 유형의 휘발성 또는 비휘발성 기억 장치 또는 그들의 조합일 수 있다.예를 들면, 임의 유형의 휘발성 또는 비휘발성 기억 장치는, SRAM(static random access memory, 정적 램), EEPROM(Electrically Erasable Programmable Read - Only Memory, 전기적 소거 및 프로그램 가능 읽기 전용 기억 장치), EPROM(Electrically Programmable Read-Only-Memory, 소거 및 프로그램 가능 읽기 전용 기억 장치), PROM(Programmable Read-Only Memory, 프로그램 가능 읽기전용 메모리), ROM(read only memory, 읽기 전용 기억 장치), 자성 메모리, 플래시 메모리, 디스크, 또는 광 디스크이다.
전원 컴포넌트(1006)은 장치(1000)의 각 컴포넌트에 전력을 공급한다. 전원 컴포넌트(1006)은 전원 관리 시스템, 한 개 또는 복수 개의 전원 및 기타의 장치(1000)를 위해 전력을 생성, 관리 및 배치하는 관계되는 컴포넌트을 포함할 수 있다.
멀티미디어 컴포넌트(1008)은 상기 장치(1000)과 사용자 사이에서 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시예에 있어서, 스크린은 액정 표시 장치(LCD) 및 터치 패널(TP)을 포함할 수 있다. 스크린이 터치 패널을 포함하는 경우, 스크린은 터치 스크린으로 실현될 수 있고, 사용자가 전송하는 입력 신호를 수신한다. 터치 페널은 터치, 스와이핑 및 터치 패널에서의 제스처를 감지하는 한 개 또는 복수 개의 터치 센서를 포함한다. 터치 센서는 터치 또는 스와이핑 동작의 한계를 감지할 수 있을 뿐만 아니라, 또한 상기 터치 또는 스와이핑 동작에 관계되는 지속 시간과 압력을 검출할 수 있다. 일부 실시예에 있어서, 멀티미디어 컴포넌트(1008)은, 전면 카메라 및/또는 후면 카메라를 포함한다. 장치(1000)가 동작 모드, 예를 들면 촬영 모드 또는 비디오 모드일 때, 전면 카메라 및/또는 후면 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 각 전면 카메라와 후면 카메라는 고정된 광학 렌즈 시스템일 수도 있고, 또는 초점 거리와 광학 줌 능력을 갖고 있다.
오디오 컴포넌트(1010)는 오디오 신호를 출력 및/또는 입력하도록 구성되어 있다. 예를 들면, 오디오 컴포넌트(1010)은 마이크(MIC)를 포함하고, 장치(1000)이 동작 모드, 예를 들면, 호출 모드, 기록 모드 및 음성 인식 모드일 때, 마이크는 외부 오디오 신호를 수신하도록 구성되어 있다. 상기 수신한 오디오 신호는 가일층 메모리(1004)에 기억되거나 또는 통신 컴포넌트(1016)에 의하여 송신될 수 있다. 일부 실시예에 있어서, 오디오 컴포넌트(1010)은 스피커를 더 포함하고, 오디오 신호를 출력하는데 사용된다.
I/O 인터페이스(1012)는 처리 컴포넌트(1002)와 주변 인터페이스 모듈 사이에 인터페이스를 제공하고, 상기 주변 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 음량 버튼, 시작 버튼 및 잠금 버튼을 포함할 수 있으나 이에 한정되지 않는다.
센서 컴포넌트(1014)는 한 개 또는 복수 개의 센서를 포함하고, 장치(1000)에 각 측면의 상태 평가를 제공하는데 사용된다. 예를 들면, 센서 컴포넌트(1014)은 장치(1000)의 ON/OFF 상태, 장치(1000)의 모니터와 숫자판과 같은 컴포넌트의 상대 위치를 검출할 수 있고, 센서 컴포넌트(1014)은 또한 장치(1000)의 한 컴포넌트의 위치 변경, 사용자와 장치(1000) 사이의 접촉의 유무, 장치(1000)의 방위 또는 가속도/감속도 및 장치(1000)의 온도 변화를 검출할 수 있다. 센서 컴포넌트(1014)는 근접 센서를 포함할 수 있고, 그 어떤 물리적 접촉도 없을 때 주변 물체의 존재를 검출하도록 구성되어 있다. 센서 컴포넌트(1014)는 또한 광 센서, 예를 들면, CMOS 또는 CCD 이미지 센서를 포함할 수 있고, 이미지화 응용에서 사용된다. 일부 실시예에 있어서, 상기 센서 컴포넌트(1014)는 또한 가속도 센서, 자이로 센서, 자기 센서, 압력 센서 또는 온도 센서를 포함할 수 있다.
통신 컴포넌트(1016)는 장치(1000)와 기타 장치 사이의 유선 또는 무선 형태의 통신에 편리하도록 구성되어 있다. 장치(1000)는 통신 기준에 따른 무선 네트워크, 예를 들면, Wi-Fi, 2g 또는 3G, 또는 그들의 조합에 접속할 수 있다. 예시적 일 실시예에 있어서, 통신 컴포넌트(1016)은 방송 채널을 통해 외부 방송 관리 시스템으로부터의 방송 신호 또는 방송의 관련 정보를 수신한다. 예시적 일 실시예에 있어서, 통신 컴포넌트(1016)은 단거리 통신을 추진하기 위한 근거리 무선 통신 (NFC) 모듈을 더 포함한다. 예를 들면, NFC모듈은 무선주파수 인식(RFID) 기술, 적외선 무선 통신(lRDA) 기술, 초광대역(UWB) 기술, 블루투스(BT) 기술과 기타 기술에 의해 실현할 수 있다.
예시적 실시예에 있어서, 장치(1000)는 한 개 또는 복수 개의 응용 주문형 직접회로(ASIC), 디지털 신호 처리기(DSP), 디지털 신호 처리 장치(DSPD), 프로그램 가능 논리 소자(PLD), 필드 프로그래머블 게이트 어레이(FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 기타 전자 소자에 의해 실현될 수 있고, 상기 영역 추출 방법을 실행하는데 사용된다.
예시적 실시예에 있어서, 또한 명령을 포함하는 비일시적 컴퓨터 판독가능한 매체, 예를 들면, 명령을 포함하는 메모리(1004)를 제공하고, 상기 명령은 상기 영역 추출 방법을 실현하기 위하여, 장치(1000)의 프로세서(1018)에 의해 실행할 수 있다. 예를 들면, 비일시적 컴퓨터 판독가능한 매체는 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 자기 테이프, 플로피 디스크 및 광 데이터 저장 장치 등일 수도 있다.
당업자라면, 명세서를 고려하고 여기에 개시된 발명을 실시한 후, 본 발명의 기타 실시형태를 쉽게 생각하게 될 것이다. 본 출원은 본 발명의 모든 변형, 용도 또는 적응성 변화를 포괄하는 것을 목적으로 하고, 이러한 변형, 용도 또는 적응성 변화는 본 발명의 일반적 원리에 따르고, 본 발명에 개시되지 않은 당해 기술분야의 일반 지식 또는 관용적 기술 수단을 포함한다. 명세서와 실시예는 예시적인 것에 불과하고, 본 발명의 실질적 범위와 주지는 아래의 청구항에 의해 결정된다.
본 발명은 위와 같이 설명되고 도면에서 도시된 정확한 구조에 한정되지 않으며, 그 범위를 벗어나지 않는다면 다양한 수정 및 변경을 실시할 수 있다는 것을 이해하여야 할 것이다. 본 발명의 범위는 첨부된 청구항에 의해 한정된다.

Claims (13)

  1. 증명서 이미지에서 제1정보 영역의 영역 위치를 획득하는 단계와;
    상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하는 단계와;
    상기 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 단계를 포함하는 것을 특징으로 하는 영역 추출 방법.
  2. 제1항에 있어서,
    상기 영역 위치는 정점 좌표로 나타내고,
    상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하는 단계는,
    상기 제1정보 영역의 적어도 2개의 상기 정점 좌표와 소정의 상대적 위치 관계에 의하여, 상기 제2정보 영역을 확정하는 단계를 포함하고,
    상기 상대적 위치 관계는 상기 정점 좌표와 상기 제2정보 영역 사이의 상대적 위치 관계인 것을 특징으로 하는 영역 추출 방법.
  3. 제2항에 있어서,
    상기 제1정보 영역은 제2대 신분증에서의 주민 등록 번호 영역이고, 상기 적어도 2개의 상기 정점 좌표는 상기 주민 등록 번호 영역의 2개의 정점 좌표이며, 상기 제2정보 영역은 상기 제2대 신분증에서의 주소 정보 영역이고,
    상기 제1정보 영역의 적어도 2개의 상기 정점 좌표와 소정의 상대적 위치 관계에 의하여, 상기 제2정보 영역을 확정하는 상기 단계는,
    상기 2개의 정점 좌표에서 상기 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 상기 주소 정보 영역의 하단 가장자리를 확정하는 단계와;
    상기 가장 가까운 한 정점 좌표의 상기 종좌표와 소정의 높이에 의하여, 상기 주소 정보 영역의 상단 가장자리를 확정하는 단계와;
    상기 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 상기 주소 정보 영역의 왼쪽 가장자리를 확정하는 단계와;
    상기 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 상기 주소 정보 영역의 오른쪽 가장자리를 확정하는 단계와;
    상기 하단 가장자리, 상기 상단 가장자리, 상기 왼쪽 가장자리와 상기 오른쪽 가장자리에 의하여, 상기 주소 정보 영역을 트리밍하는 단계를 포함하는 것을 특징으로 하는 영역 추출 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 상기 단계는,
    상기 제2정보 영역에 대하여 이치화를 수행하여, 이치화 후의 제2정보 영역을 획득하는 단계와;
    상기 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행 화소점의 종좌표와 상기 각 행 화소점 중의 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산하는 단계와;
    상기 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득하는 단계와;
    제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 횡좌표와 상기 각 열의 화소점 중의 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산하는 단계와;
    상기 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득하는 단계를 포함하는 것을 특징으로 하는 영역 추출 방법.
  5. 제4항에 있어서,
    상기 제1히스토그램에서 전경색 화소점의 누계치가 상기 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 텍스트 영역 사이의 행 간격을 인식하여 획득하는 단계와;
    상기 행 간격이 제3역치보다 큰 경우, 상기 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 가장 가까운 한 행의 텍스트 영역을 페기하는 단계를 더 포함하는 것을 특징으로 하는 영역 추출 방법.
  6. 제4항에 있어서,
    상기 제2히스토그램에서 전경색 화소점의 누계치가 상기 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 문자 영역 사이의 문자 간격을 인식하여 획득하는 단계와;
    인접하는 상기 두 문자 영역이 상기 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 상기 두 문자 영역에서 오른쪽에 위치하는 상기 문자 영역을 현재 행 텍스트 영역 중의 첫번째 상기 문자 영역으로 인식하는 단계와;
    인접하는 상기 두 문자 영역이 상기 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 상기 두 문자 영역에서 왼쪽에 위치하는 상기 문자 영역을 현재 행 텍스트 영역 중의 마지막 상기 문자 영역으로 인식하는 단계를 더 포함하는 것을 특징으로 하는 영역 추출 방법.
  7. 영역 추출 장치에 있어서,
    증명서 이미지에서 제1정보 영역의 영역 위치를 획득하도록 구성된 획득 모듈과;
    상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하도록 구성된 확정 모듈과;
    상기 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하는 인식 모듈을 포함하는 것을 특징으로 하는 영역 추출 장치.
  8. 제7항에 있어서,
    상기 영역 위치는 정점 좌표로 나타내고,
    상기 확정 모듈은 상기 제1정보 영역의 적어도 2개의 상기 정점 좌표와 소정의 상대적 위치 관계에 의하여, 상기 제2정보 영역을 확정하도록 구성되고,
    상기 상대적 위치 관계는 상기 정점 좌표와 상기 제2정보 영역 사이의 상대적 위치 관계인 것을 특징으로 하는 영역 추출 장치.
  9. 제8항에 있어서,
    상기 제1정보 영역은 제2대 신분증에서의 주민 등록 번호 영역이고, 상기 적어도 2개의 상기 정점 좌표는 상기 주민 등록 번호 영역의 2개의 정점 좌표이며,
    상기 제2정보 영역은 상기 제2대 신분증에서의 주소 정보 영역이고,
    상기 확정 모듈은,
    상기 2개의 정점 좌표에서 상기 주소 정보 영역에 가장 가까운 한 정점 좌표의 종좌표에 의하여, 상기 주소 정보 영역의 하단 가장자리를 확정하는 제1확정 서브 모듈과;
    상기 가장 가까운 한 정점 좌표의 상기 종좌표와 소정의 높이에 의하여, 상기 주소 정보 영역의 상단 가장자리를 확정하는 제2확정 서브 모듈과;
    상기 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제1소정 너비에 의하여, 상기 주소 정보 영역의 왼쪽 가장자리를 확정하는 제3확정 서브 모듈과;
    상기 2개의 정점 좌표 중 임의의 한 정점 좌표의 횡좌표와 제2소정 너비에 의하여, 상기 주소 정보 영역의 오른쪽 가장자리를 확정하는 제4확정 서브 모듈과;
    상기 하단 가장자리, 상기 상단 가장자리, 상기 왼쪽 가장자리와 상기 오른쪽 가장자리에 의하여, 상기 주소 정보 영역을 트리밍하는 트리밍 서브 모듈을 포함하는 것을 특징으로 하는 영역 추출 장치.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서,
    상기 인식 모듈은,
    상기 제2정보 영역에 대하여 이치화를 수행하여, 이치화 후의 제2정보 영역을 획득하는 이치화 서브 모듈과;
    상기 이치화 후의 제2정보 영역에 대하여, 수평 방향에 따라, 각 행의 화소점의 종좌표와 상기 각 행의 화소점 중의 전경색 화소점의 누계치를 포함하는 제1히스토그램을 계산하는 제1계산 서브 모듈과;
    상기 제1히스토그램에서 전경색 화소점의 누계치가 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, n(n은 양의 정수)행의 텍스트 영역을 인식하여 획득하는 행 인식 서브 모듈과;
    제i(n≥i≥1, i는 양의 정수)행 텍스트 영역에 대하여, 세로 방향에 따라, 각 열의 화소점의 횡좌표와 상기 각 열의 화소점 중의 전경색 화소점의 누계치를 포함하는 제2히스토그램을 계산하는 제2계산 서브 모듈과;
    상기 제2히스토그램에서 전경색 화소점의 누계치가 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, ni개의 문자 영역을 인식하여 획득하는 문자 인식 서브 모듈을 포함하는 것을 특징으로 하는 영역 추출 장치.
  11. 제10항에 있어서,
    상기 제1히스토그램에서 전경색 화소점의 누계치가 상기 제1역치보다 큰 행으로 구성된 연속 행 집합에 의하여, 인접하는 두 행의 텍스트 영역 사이의 행 간격을 인식하여 획득하는 행 간격 인식 모듈과;
    상기 행 간격이 제3역치보다 큰 경우, 상기 제2정보 영역의 상단 가장자리 또는 하단 가장자리에 더욱 가까운 상기 한 행의 텍스트 영역을 페기하는 페기 모듈을 더 포함하는 것을 특징으로 하는 영역 추출 장치.
  12. 제10항에 있어서,
    상기 제2히스토그램에서 전경색 화소점의 누계치가 상기 제2역치보다 큰 열로 구성된 연속 열 집합에 의하여, 인접하는 두 문자 영역 사이의 문자 간격을 인식하여 획득하는 문자 간격 인식 서브 모듈과;
    인접하는 상기 두 문자 영역이 상기 제2정보 영역의 왼쪽에 위치하고, 문자 간격이 제4역치보다 클 경우, 인접하는 상기 두 문자 영역에서 오른쪽에 위치하는 상기 문자 영역을 현재 행 텍스트 영역 중의 첫번째 상기 문자 영역으로 인식하는 문자 인식 모듈과;
    인접하는 상기 두 문자 영역이 상기 제2정보 영역의 오른쪽에 위치하고, 문자 간격이 제5역치보다 클 경우, 인접하는 상기 두 문자 영역에서 왼쪽에 위치하는 상기 문자 영역을 현재 행 텍스트 영역 중의 마지막 상기 문자 영역으로 인식하는 단일 문자 인식 모듈을 더 포함하는 것을 특징으로 하는 영역 추출 장치.
  13. 프로세서와;
    상기 프로세서에서 실행 가능한 명령을 기억하는 메모리를 포함하고,
    상기 프로세서는,
    증명서 이미지에서 제1정보 영역의 영역 위치를 획득하고;
    상기 제1정보 영역의 영역 위치에 따라 제2정보 영역을 확정하며;
    상기 제2정보 영역에 대하여 영역 분할을 수행하여, 적어도 하나의 문자 영역을 획득하도록 구성되는 것을 특징으로 하는 영역 추출 장치.
KR1020167005538A 2015-10-30 2015-12-29 영역 추출 방법 및 장치 KR101760109B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510726272.4A CN105426818B (zh) 2015-10-30 2015-10-30 区域提取方法及装置
CN201510726272.4 2015-10-30
PCT/CN2015/099298 WO2017071062A1 (zh) 2015-10-30 2015-12-29 区域提取方法及装置

Publications (2)

Publication Number Publication Date
KR20170061630A true KR20170061630A (ko) 2017-06-05
KR101760109B1 KR101760109B1 (ko) 2017-07-31

Family

ID=55505018

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167005538A KR101760109B1 (ko) 2015-10-30 2015-12-29 영역 추출 방법 및 장치

Country Status (8)

Country Link
US (1) US10127471B2 (ko)
EP (1) EP3163504B1 (ko)
JP (1) JP6396605B2 (ko)
KR (1) KR101760109B1 (ko)
CN (1) CN105426818B (ko)
MX (1) MX364147B (ko)
RU (1) RU2642404C2 (ko)
WO (1) WO2017071062A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190131631A (ko) * 2018-04-19 2019-11-27 한밭대학교 산학협력단 딥러닝과 문자인식으로 구현한 시각주의 모델 기반의 문서 종류 자동 분류 장치 및 방법
WO2021145466A1 (ko) * 2020-01-13 2021-07-22 엘지전자 주식회사 객체의 정보를 확인하는 이동 단말기 및 그 제어 방법

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229932B (zh) * 2016-03-25 2021-05-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN106547912A (zh) * 2016-11-25 2017-03-29 西安理工大学 身份证数据库中非二代身份证照片的识别和剔除方法
CN108388872B (zh) * 2018-02-28 2021-10-22 北京奇艺世纪科技有限公司 一种基于字体颜色的新闻标题识别方法及装置
CN108764240A (zh) * 2018-03-28 2018-11-06 中科博宏(北京)科技有限公司 基于字符相对大小的计算机视觉身份证字符分割识别技术
CN109977959B (zh) * 2019-03-29 2021-07-06 国家电网有限公司 一种火车票字符区域分割方法及装置
US11501548B2 (en) * 2019-04-02 2022-11-15 Edgeverve Systems Limited Method and system for determining one or more target objects in an image
CN110321895A (zh) * 2019-04-30 2019-10-11 北京市商汤科技开发有限公司 证件识别方法和装置、电子设备、计算机可读存储介质
CN110378340A (zh) * 2019-07-23 2019-10-25 上海秒针网络科技有限公司 地址合规识别方法、装置、存储介质及电子装置
CN111539269A (zh) * 2020-04-07 2020-08-14 北京达佳互联信息技术有限公司 文本区域的识别方法、装置、电子设备和存储介质
CN111582085B (zh) * 2020-04-26 2023-10-10 中国工商银行股份有限公司 单据拍摄图像识别方法及装置
CN111639648B (zh) * 2020-05-26 2023-09-19 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111898601A (zh) * 2020-07-14 2020-11-06 浙江大华技术股份有限公司 一种身份证要素提取方法及装置
CN112633193A (zh) * 2020-12-28 2021-04-09 深圳壹账通智能科技有限公司 地址信息的提取方法、装置、设备及介质
US20240112348A1 (en) * 2021-02-09 2024-04-04 Hewlett-Packard Development Company, L.P. Edge identification of documents within captured image
CN113592877B (zh) * 2021-03-25 2024-04-12 国网新源控股有限公司 一种抽水蓄能电站红线超标识别方法及装置
CN115082919B (zh) * 2022-07-22 2022-11-29 平安银行股份有限公司 一种地址识别方法、电子设备及存储介质
CN115862041B (zh) * 2023-02-13 2023-05-09 武汉天恒信息技术有限公司 一种基于神经网络的不动产证书识别方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3795238B2 (ja) * 1998-10-01 2006-07-12 シャープ株式会社 文書画像処理装置及び文書画像処理方法
RU2329535C2 (ru) * 2006-05-24 2008-07-20 Самсунг Электроникс Ко., Лтд. Способ автоматического кадрирования фотографий
JP2010231541A (ja) * 2009-03-27 2010-10-14 Oki Electric Ind Co Ltd 情報処理装置、文字認識方法、およびプログラム
CN101561876A (zh) * 2009-06-05 2009-10-21 四川泸州航天金穗高技术有限公司 一种身份证信息采集与识别方法及系统
JP5591578B2 (ja) * 2010-04-19 2014-09-17 日本電産サンキョー株式会社 文字列認識装置および文字列認識方法
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
KR101295000B1 (ko) * 2013-01-22 2013-08-09 주식회사 케이지모빌리언스 카드 번호의 영역 특성을 이용하는 신용 카드의 번호 인식 시스템 및 신용 카드의 번호 인식 방법
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
JP6188052B2 (ja) * 2013-02-26 2017-08-30 Kddi株式会社 情報システム及びサーバー
CN103488984B (zh) * 2013-10-11 2017-04-12 瑞典爱立信有限公司 基于智能移动设备的二代身份证识别方法及装置
KR20150047060A (ko) 2013-10-23 2015-05-04 주식회사 디오텍 명함 이미지 여부를 판별하는 장치 및 방법
CN104573616A (zh) * 2013-10-29 2015-04-29 腾讯科技(深圳)有限公司 一种信息识别方法、相关装置及系统
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190131631A (ko) * 2018-04-19 2019-11-27 한밭대학교 산학협력단 딥러닝과 문자인식으로 구현한 시각주의 모델 기반의 문서 종류 자동 분류 장치 및 방법
WO2021145466A1 (ko) * 2020-01-13 2021-07-22 엘지전자 주식회사 객체의 정보를 확인하는 이동 단말기 및 그 제어 방법

Also Published As

Publication number Publication date
CN105426818A (zh) 2016-03-23
US10127471B2 (en) 2018-11-13
MX2016003769A (es) 2017-05-30
WO2017071062A1 (zh) 2017-05-04
RU2642404C2 (ru) 2018-01-24
JP2018500704A (ja) 2018-01-11
RU2016110818A (ru) 2017-10-02
JP6396605B2 (ja) 2018-09-26
KR101760109B1 (ko) 2017-07-31
MX364147B (es) 2019-04-12
US20170124718A1 (en) 2017-05-04
CN105426818B (zh) 2019-07-02
EP3163504B1 (en) 2019-01-02
EP3163504A1 (en) 2017-05-03

Similar Documents

Publication Publication Date Title
KR101760109B1 (ko) 영역 추출 방법 및 장치
JP6401873B2 (ja) 領域認識方法及び装置
KR101782633B1 (ko) 영역 인식 방법 및 장치
KR101805090B1 (ko) 영역 인식 방법 및 장치
JP6392467B2 (ja) 領域識別方法及び装置
KR101763891B1 (ko) 영역 추출 방법, 모델 트레이닝 방법 및 장치
CN105117680B (zh) 一种识别信息卡的信息的方法和装置
KR20150033190A (ko) 멀티 스크린 제어 방법 및 이를 위한 단말기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right