KR20180117596A - 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체 - Google Patents

운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체 Download PDF

Info

Publication number
KR20180117596A
KR20180117596A KR1020187019518A KR20187019518A KR20180117596A KR 20180117596 A KR20180117596 A KR 20180117596A KR 1020187019518 A KR1020187019518 A KR 1020187019518A KR 20187019518 A KR20187019518 A KR 20187019518A KR 20180117596 A KR20180117596 A KR 20180117596A
Authority
KR
South Korea
Prior art keywords
character
outline
area
candidate
segment
Prior art date
Application number
KR1020187019518A
Other languages
English (en)
Other versions
KR102152191B1 (ko
Inventor
잰쭝 왕
밍 리유
징 시야오
Original Assignee
핑안 테크놀로지 (션젼) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 핑안 테크놀로지 (션젼) 컴퍼니 리미티드 filed Critical 핑안 테크놀로지 (션젼) 컴퍼니 리미티드
Publication of KR20180117596A publication Critical patent/KR20180117596A/ko
Application granted granted Critical
Publication of KR102152191B1 publication Critical patent/KR102152191B1/ko

Links

Images

Classifications

    • G06K9/00456
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • G06K9/2054
    • G06K9/4604
    • G06K9/66
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18133Extraction of features or characteristics of the image regional/local feature not essentially salient, e.g. local binary pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

본원 발명은 차량 운전면허의 영상파일에서의 후보윤곽영역을 추출하고 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계; 선별해낸 후보윤곽영역에서 각 문자 윤곽을 추출하는 단계; 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임을 각 단일 문자 세그먼트로 분할하는 단계; 각 단일 문자 세그먼트가 상기 윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계; 상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계; 상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및 상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 윤곽영역의 정기검사 유효기간으로 하는 단계를 포함하는 운전면허 유효기간 자동 추출 방법을 개시한다. 본원 발명은 상기 방법에 적용되는 기기, 시스템 및 저장 매체를 더 제공한다. 본원 발명은 운전면허의 정기검사 유효기간을 자동으로 추출할 수 있다.

Description

운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체
본원 발명은 데이터 처리기술분야에 관한 것으로서 특히 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체에 관한 것이다.
자동차 보험의 보험 가입 비즈니스 및 자동차 보험의 클레임 비즈니스에 있어서 운전면허의 정기검사 유효기간은 하나의 중요한 심사사항이지만 자연적인 시나리오에서 운전면허에 대해 정기검사 유효기간을 추출하는 것은 다음과 같은 여러 가지 도전에 직면하게 된다. 1) 빛의 세기와 분포가 불균형하여 운전면허 영상파일의 세목이 모호하거나 심지어 음영이 생기게 되는데 이 두가지는 모두 타겟 영역에 대한 타겟팅에 크나큰 교란을 조성하게 된다; 2) 운전면허 자체의 선명한 정도도 타겟 영역의 추출에 영향을 주게 되는데 일부 운전면허는 훼손으로 인해 사람의 눈으로 근거리에서 관찰하여도 구분할 수 없다; 3) 운전면허는 때로는 다수의 정기검사 기록이 나타나고 기록의 순서는 시간의 선후순서로 배열된 것이 아닐 때가 있는데 이는 사용자로 하여금 모든 기록을 인식한 후 최신 정기검사 기록을 선택하도록 한다.
본원 발명의 주된 목적은 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체를 제공하여 운전면허의 정기검사 유효기간을 자동으로 추출하는데 있다.
상기 내용을 감안하면 본원 발명은 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체를 제공하는데 이는 운전면허의 정기검사 유효기간을 자동으로 추출할 수 있다.
운전면허 유효기간 자동 추출 방법은,
차량 운전면허의 영상파일을 수신하는 단계;
윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 포함한다.
운전면허 유효기간 자동 추출 기기는,
한 운전면허 유효기간 자동 추출 시스템을 저장하기 위한 저장기기; 및
상기 운전면허 유효기간 자동 추출 시스템을 호출하여 실행하는 프로세서를 포함하여,
차량 운전면허의 영상파일을 수신하는 단계;
윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 수행하도록 한다.
운전면허 유효기간 자동 추출 시스템은,
차량 운전면허의 영상파일을 획득하기 위한 영상파일획득모듈;
윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 선별분류규칙에 따라 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하기 위한 영역선별모듈;
선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하기 위한 문자추출모듈;
상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키기 위한 문자분할모듈;
각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하기 위한 정렬모듈;
상기 단일 문자 세그먼트와 대응되는 문자를 인식하기 위한 문자인식모듈; 및
상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성함과 동시에 인식해낸 문자열이 유효할 경우 상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 윤곽영역의 정기검사 유효기간으로 하기 위한 유효기간결정모듈을 포함한다.
컴퓨터 판독가능 명령이 저장된 비휘발성 저장 매체에서 상기 컴퓨터 판독가능 명령는 하나 또는 다수의 프로세서에 의해 실행되어,
차량 운전면허의 영상파일을 수신하는 단계;
윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 수행하도록 한다.
본원 발명의 상기 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체는 운전면허에서의 정기검사 유효기간을 효과적으로 추출할 수 있고 운전면허에서의 정기검사가 효과적으로 다수가 있을 경우 최신 정기검사 유효기간을 추출하여 작업의 효율을 향상시킬 수 있다.
본원 발명의 상기 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체는 운전면허에서의 정기검사 유효기간을 효과적으로 추출할 수 있고 운전면허에서의 정기검사가 효과적으로 다수가 있을 경우 최신 정기검사 유효기간을 추출하여 작업의 효율을 향상시킬 수 있다.
도 1은 본원 발명의 운전면허 유효기간 자동 추출 시스템의 제1 바람직한 실시예의 하드웨어 환경모식도이다.
도 2는 본원 발명의 운전면허 유효기간 자동 추출 시스템의 제2 바람직한 실시예의 하드웨어 환경모식도이다.
도 3은 본원 발명의 운전면허 유효기간 자동 추출 시스템의 바람직한 실시예의 기능모듈도이다.
도 4는 본원 발명의 운전면허 유효기간 자동 추출 방법의 바람직한 실시예의 방법실시 흐름도이다.
도 5는 도 4에서 설명한 운전면허 유효기간 자동 추출 방법의 바람직한 실시예에서 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 상세한 실시 흐름도이다.
도 6은 극치영역에 의해 구축한 하나의 트리형 조직을 설명한다.
본 실시예에서 상기 운전면허 유효기간 자동 추출 시스템(10)은 전자 기기에 장착되어 운행할 수 있다. 상기 전자 기기는 서버 또는 단말기기와 같은 본원 발명의 기술적 목적을 달성할 수 있는 임의의 기기 일 수 있다. 일부 실시예에서 전자 기기는 프로세서 및 저장기기를 포함할 수 있는데 상기 프로세서는 연산 코어(Core Unit)와 컨트롤 코어(Control Unit)로서 컴퓨터 명령을 해석하고 컴퓨터 소프트웨어에서의 데이터를 처리하기 위한 것이다. 저장기기는 내부 메모리와 비휘발성 판독 가능 저장매체를 포함할 수 있는데 여기서 비휘발성 판독 가능 저장매체는 운영체제, 데이터 베이스 및 운전면허 유효기간 자동 추출 시스템(10)을 저장하기 위한 것이고 내부 메모리는 운영체제, 데이터 베이스와 운전면허 유효기간 자동 추출 시스템을 위해 캐시의 운행환경을 제공한다. 일부 실시예에서 운전면허 유효기간 자동 추출 시스템(10)은 적어도 하나의 컴퓨터가 실행 가능한 프로그램 명령 코드를 포함하는데 상기 적어도 하나의 컴퓨터가 실행 가능한 프로그램 명령 코드는 프로세서에 의해 실행되어 본원 발명의 실시예에서 제공하는 운전면허 유효기간 자동 추출 방법을 실현할 수 있다. 상기 방법의 구체적인 단계는 본원 발명의 후속적인 내용을 참조하기 바란다.
비휘발성 저장 매체는 읽기 전용 기억 장치(ROM), 예하면 프로그램 가능 읽기용 기억 장치(PROM), 이피롬(EPROM), 이이피롬(EEPROM)과 플래시 메모리를 포함하고 U디스크, 하드디스크, 랜덤 액세스 메모리(RAM), 디스크 또는 시디롬 등 프로그램 코드를 저장할 수 있는 여러 가지 매체도 포함한다.
본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 상술한 전자 기기 구조에 대한 설명은 본원 발명의 해결수단의 전자 기기에 대한 한정이 아닌 바, 구체적으로 프로세서 및 저장기기를 포함하는 외에 전자 기기는 사용자 인터페이스, 입력기기, 출력기기, 네트워크 인터페이스 등과 같은 기타 부품을 포함하여 대응되는 기능을 실현할 수도 있다는 것을 이해할 수 있다.
상술한 바와 같이 일부 실시예에서 기기는 서버일 수 있다. 도 1에 도시된 바와 같이 상기 서버는 클라우드 서버(1) 일 수 있다. 상기 클라우드 서버(1)는 통신모듈(미도시)을 통해 한대 또는 여러 대의 단말기기(2)와 통신연결할 수 있다. 상기 단말기기(2)는 개인용 컴퓨터, 스마트 폰, 태블릿 피씨 등 기기 일 수 있다. 운전면허 유효기간 자동 추출 시스템(10)은 저장기기에 저장된 컴퓨터가 실행 가능한 프로그램 명령 코드를 포함한다. 프로세서는 이러한 프로그램 명령 코드를 실행하여 하기와 같은 기능을 실현한다.
클라우드 서버(1)는 단말기기(2)로부터 차량 운전면허의 영상파일(20)을 수신하고 상기 영상파일(20)에서의 후보윤곽영역을 추출하며 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별함과 동시에 선별해낸 각 후보윤곽영역의 문자 윤곽을 하나하나 추출한다. 선별해낸 후보윤곽영역의 모든 문자 윤곽이 모두 추출된 후 상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시킨다. 본 실시예에서 상기 각 단일 문자 세그먼트의 분할방법은, 문자 윤곽의 최소 외접 직사각형을 기존의 영상파일(20)과 마스크하는데 예하면 문자 윤곽영역에 속하는 것은 변하지 않고 기타 영역은 올 블랙 배경으로 설치한 다음 각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해낸다.
진일보로 상기 운전면허 유효기간 자동 추출 시스템(10)은 상기 선별해낸 후보윤곽영역의 각 단일 문자 세그먼트와 대응되는 문자를 인식하고 상기 후보윤곽영역의 각 단일 문자 세그먼트의 횡좌표의 크기에 근거하여 상기 후보윤곽영역의 각 단일 문자 세그먼트를 정렬하는데 예하면 횡좌표가 작은 것부터 큰 것의 순서에 따라 왼쪽으로부터 오른쪽으로 정렬함과 동시에 인식한 각 문자를 대응되는 단일 문자 세그먼트의 정렬순서에 따라 배열함으로써 정기검사 유효기간을 대표하는 문자열을 형성하고 상기 문자열에서의 시간 부분, 예하면 연도 및 월분을 추출하여 상기 후보윤곽영역의 정기검사 유효기간의 텍스트로서 나타낸다. 예하면 우선 문자 "년"의 인덱스 위치를 찾고 이 앞의 4개 문자를 절취하면 연도인데 그 다음 문자 "월"의 인덱스를 찾고 이 앞의 2개 문자를 추출한다. 가끔 월분은 단지 단일한 숫자이므로 추출된 월분의 첫번째 문자에 대해 숫자 여부 판정을 진행하고 제일 마지막으로 추출된 연도 월분 부분을 하나의 문자열로 접합하여 하나의 정기검사 유효기간을 형성한다.
본원 발명에서의 한 실시예에서 하나의 후보윤곽영역의 정기검사 유효기간이 추출되게 되면 상기 정기검사 유효기간을 상기 영상파일(20)과 대응되는 최신 정기검사 유효기간으로 한다. 본원 발명의 기타 실시예에서 다수의 후보윤곽영역의 정기검사 유효기간이 추출되게 되면 상기 운전면허 유효기간 자동 추출 시스템(10)은 각 정기검사 유효기간의 날짜의 크기를 비교하여 날짜가 제일 큰 정기검사 유효기간을 상기 영상파일(20)과 대응되는 최신 정기검사 유효기간으로 한다. 예하면 각 정기검사 유효기간을 하나의 문자열 리스트에 저장한 다음 하나의 시간비교함수를 정의하여 두개의 날짜 크기를 비교함으로써 왼쪽 날짜가 오른쪽 날짜보다 크면 -1로 리턴하고 동일하면 0으로 리턴하며 그렇지 않으면 1로 리턴하도록 규정한다. 그 다음 이 비교함수에 근거하여 상기 리스트에서의 시간 문자열에 대해 내림 순서에 따라 정렬하고 서열에서의 첫번째 시간 문자열 원소를 취하여 상기 운전면허의 현재 최신 정기검사 유효기간으로 한다.
본 발명의 기타 바람직한 실시예에서 상기 전자 기기는 도 2에 도시된 바와 같이 단말기기(2) 일 수 있다. 상기 단말기기(2)는 개인용 컴퓨터, 스마트 폰, 태블릿 피씨 등 기기 일 수 있다. 단말기기(2)는 운전면허를 촬영하기 위한 촬영장치 일 수 있는 바, 상기 실시예에서 운전면허 유효기간 자동 추출 시스템(10)은 단말기기(2)의 저장기기에 저장된 컴퓨터가 실행 가능한 프로그램 명령 코드를 포함한다. 촬영장치가 획득한 영상파일을 수신한 후 단말기기(2)의 프로세스는 이러한 프로그램 명령 코드를 수행하여 본원 발명의 실시예에서 제공하는 운전면허 유효기간 자동 추출 방법을 실현하도록 한다.
도 3에 도시된 내용을 참조하면 이는 본원 발명의 운전면허 유효기간 자동 추출 시스템의 바람직한 실시예의 기능모듈도이다.
상기 운전면허 유효기간 자동 추출 시스템(10)의 프로그램 코드는 이의 상이한 기능에 근거하여 다수의 기능 모듈로 구분될 수 있다. 본 발명의 바람직한 실시예에서 상기 운전면허 유효기간 자동 추출 시스템(10)은 영상파일획득모듈(100), 영역선별모듈(101), 문자추출모듈(102), 문자분할모듈(103), 정렬모듈(104), 문자인식모듈(105) 및 유효기간결정모듈(106)을 포함할 수 있다.
상기 영상파일획득모듈(100)은 단말기기(2)로부터 차량 운전면허의 영상파일(20)을 획득하는데 사용된다. 상기 단말기기(2)는 스캔, 촬영 등 방식으로 상기 차량 운전면허의 영상파일을 획득할 수 있다.
상기 영역선별모듈(101)은 윤곽추출규칙에 근거하여 상기 영상파일(20)에서의 후보윤곽영역을 추출하고 선별분류규칙에 따라 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는데 사용된다.
본 실시예에서 상기 윤곽추출규칙은 예하면 MSER(Maximally Stable Extremal Regions, 최대 안정 극치영역)알고리즘을 사용하여 상기 영상파일(20)에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙 일 수 있다. 여기서 설명해야 할 것은 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규정은 타겟의 정기검사 유효기간 영역을 더 정확히 타겟팅 할 수 있다. 관찰을 통하여 운전면허의 포캣은 비교적 고정되는데 이의 정기검사 유효기간 영역의 종횡비는 10:1 좌우를 유지한다. 상기 기설정된 범위는 정기검사 유효기간의 관련 기학학적 특성에 근거하여 결정하고 하나의 미세한 파동 임계값(예하면 9.5:1 내지 10.5:1 사이)을 설정하는 것을 통해 종횡비가 이 범위내에 있는 영역도 정기검사 유효기간 영역임을 허용하도록 한다. 이러한 휴리스틱 규칙의 응용을 통해 약 50%의 후보윤곽영역을 절감할 수 있고 휴리스틱 규칙을 사용하지 않으면 나중에 관련이 없는 수많은 윤곽영역을 추출하게 되는데 이러한 영역은 진일보로 처리해야 하는 난이도 및 산출량을 증가하게 된다.
설명해야 할 것은 MSER알고리즘의 원리는 다음과 같다. 일련의 등차적인 그레이스케일 임계값(예하면 75, 105, 135, 165, 195, ......)을 사용하여 영상파일(20)에 이진화 처리를 진행하고 매 하나의 임계값에 대해 획득한 이진 영상에 상응한 블랙 영역과 화이트 영역을 획득하며 비교적 넓은 그레이스케일 임계값 범위내에서 형상 안정을 유지하는 영역이 바로 최대 안정 극치영역이다. 여기서 상기 극치영역 ER의 정의는 다음과 같다. 만약 하나의 연통영역(영역에는 중단점이 존재하지 않음)이 R(Region의 첫번째 알파벳)라고 약칭되고 영역 내부의 임의의 한 점 Ri점과 경계에서의 점 Rb점에 모두 Ф(Ri)>Τ(Rb)와 같은 부등식이 존재하되, 여기서 Ф(Ri)는 점 Ri의 픽셀값을 나타내고 Τ(Rb)는 점 Rb의 픽셀값을 나타내는 조건을 만족하면 상기 부등식의 직관적인 의미는 한 영역 내부의 모든 점의 픽셀값이 늘 영역 경계 또는 그 이외의 점의 픽셀값보다 크고 이러한 특성에 부합되는 영역은 바로 ER(극치영역, 이미지의 국부적인 범위내에서 픽셀값이 주변 영역에 비해 상대적으로 큰 픽셀집합이 형성한 영역)이라고 불릴 수 있다. 이진화 임계값에 대한 변화를 통하여 하나의 그레이스케일 이미지는 수많은 ER을 생성할 수 있다. ER을 형성할 때 사용한 이진화 임계값의 크기에 근거하여 이러한 ER는 하나의 트리형 조직으로 구축될 수 있는데 도 6에 도시된 바와 같이 ER 트리라고 불리며 그 중의 매 하나의 이진화 임계값이 생성한 ER은 모두 ER 트리의 동일한 층에 위치하게 되고 다음 레벨의 이진화 임계값(매 레벨의 이진화 임계값 사이에는 어떤 값의 차이를 가지는데 예하면 30이다)은 현재 층의 ER에 대해 다시 이진화하여 다음 층의 ER을 형성한다. 제일 높은 한 층을 형성하는 ER의 이진화 임계값이 제일 작고 그 다음 위로부터 아래로의 순서로 트리의 잎 노드에서 이진화 임계값은 점차 증가한다. 다단계 이진화 동작에 의해 발생한 ER이 형성한 트리 모양의 구조는 다음과 같다. 매 하나의 이진화 임계값은 일부 ER(극치영역)을 발생하여 한층의 ER을 구성하는데 다음 레벨의 임계값을 사용하여 현재 이진화 임계값이 발생한 ER에 대해 다시 이진화를 진행함으로써 트리에서의 다음 층의 ER을 발생하고 다단계 임계값은 일반적으로 제1 레벨에서 하나의 비교적 작은 임계값(예컨대 20~80)을 지정한 다음 어느 한 증가량, 예컨대 이 예에서의 30(증가는 너무 많거나 적지 말아야 하는 바, 20~30 사이가 비교적 적합하다)에 따라 임계값을 증가한다. 도 6에서의 블록 모양 영역의 크기는 이의 실제 면적값의 크기를 반영하는데 Area는 상이한 영역의 면적을 나타낸다. 트리에서의 ER의 관계에 있어서 동일한 레벨의 이진화 임계값이 발생한 ER는 동일한 레벨에 위치하고 비교적 큰 이진화 임계값이 발생한 ER은 트리의 다음 층에 위치하는 바, 다시 말하면 다음 층의 ER은 현재 층 ER의 다음 노드이다. 트리에서의 경로는 다음과 같다. ER의 생성관계(상하 레벨 관계)에 따라 ER 트리에 대해 순회를 진행한다. ER 트리를 통해 ER의 하나의 안정적인 값 variation을 정의할 수 있는데 이 값은 다음과 같은 공식을 통해 부여한 것이다.
Figure pct00001
,
여기서
Figure pct00002
는 하나의 파라미터로서 ER 트리에서의 두 ER 사이가 ER 트리에서 이격된 노드 수를 가늠하고 기본적으로 5로 설정한다.
Figure pct00003
는 t번째 ER의 면적을 대표하고
Figure pct00004
는 t번째 ER사이에
Figure pct00005
개 거리를 이격한 ER의 면적을 대표한다. 한 ER 트리의 전체 경로(트리에서의 노드의 종속관계에 따라 액세스 함)에서 variation값이 제일 작은 ER을 제일 안정적인 ER, 즉 면적이 임계값의 변화에 대해 민감하지 않은 영역이라고 부른다.
본 실시예에서 상기 선별분류규칙은 예하면 추출된 후보윤곽영역에 트레이닝이 된 제1 Deep ConvNet(딥 컨벌루션 뉴럴 네트워크 모델)를 입력하는 것 일 수 있다. 선별의 정확도를 담보하기 위하여 상기 제1 딥 컨벌루션 뉴럴 네트워크 모델은 23층의 모델 구조를 사용하는데 각각 1개의 입력층, 21층의 컨벌루션층, 2개의 분류층이고 여기서 입력층은 총적인 층수에 계산되지 않는다. 상기 제1 딥 컨벌루션 뉴럴 네트워크 모델은 대량의 정기검사 유효기간을 가진 윤곽영역과 정기검사 유효기간을 갖지 않은 윤곽영역이 트레이닝해낸 것이다. 상기 제1 Deep ConvNet를 이용하여 상기 후보윤곽영역이 정기검사 유효기간을 포함하는 신뢰도(즉 확률)를 결정하고; 상기 후보윤곽영역이 정기검사 유효기간을 포함하는 신뢰도가 기설정된 임계값(예하면 85%)보다 크면 상기 후보윤곽영역을 정기검사 유효기간을 포함하는 후보윤곽영역으로 한다.
상기 문자추출모듈(102)은 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는데 사용된다.
본 실시예에서 상기 문자추출모듈(102)은 다음과 같은 방법에 따라 각 문자 윤곽을 추출한다. A, 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환한다; B, 옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행함으로써 그레이스케일 이미지의 그레이스케일 변화범위를 0~255로부터 0-1과 같은 이진 영역으로 압축하여 대부분의 교란배경을 제거한다; C, 윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출하는데 예하면 상기 윤곽추출함수는 findContours함수 일 수 있다; D, 기설정된 높이와 기설정된 너비의 윤곽을 선별하되, 여기서 상기 기설정된 높이는 예하면 33 일 수 있고 상기 기설정된 너비는 예하면 20 일 수 있다; E, 선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하는데 예하면 10 일 수 있고, 만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 F이며 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭, 예하면 1에 따라 점차 증가하거나 또는 점차 감소하는데 예하면 기설정된 높이를 34로 조정하거나 및/또는 기설정된 너비를 21로 조정하여 상기 D를 수행한다.
상기 D, E, F의 목적은 문자의 분할이 더욱 정확하도록 하기 위함이다. 일반적으로 정기검사 유효기간에서 중문 문자든 영문 문자든 모두 하나의 대체적으로 동일한 높이 및 제일 작은 너비가 있으며 높이와 너비 두개의 임계값 조건을 통해 이미지 임계값이 단계별로 인입한 관련되지 않은 윤곽을 필터링하게 된다. 이와 동시에 각 문자의 윤곽이 산출된 후 정기검사 유효기간 칼럼의 문자 개수는 상대적으로 고정된 것이므로 정기검사 유효기간 칼럼의 문자 윤곽 수량을 통계함으로써 상기 분할의 성공 여부를 결정할 수 있다. 만약 수량이 정확하지 않으면 35와 같은 기타 문자 높이 임계값과 22와 같은 너비 임계값을 사용하여 정확한 수량의 문자 윤곽을 분할하도록 해야 한다.
상기 문자분할모듈(103)은 상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는데 사용된다. 예하면 문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하는데, 예하면 문자 윤곽영역에 속하는 것은 변하지 않고 기타 영역은 올 블랙 배경으로 설치한 다음 각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해낸다.
상기 정렬모듈(104)은 각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는데 사용된다. 상세하게 상기 정렬모듈(104)은 선별해낸 후보윤곽영역의 각 단일 문자 세그먼트의 횡좌표의 크기에 근거하여 상기 선별해낸 후보윤곽영역의 각 단일 문자 세그먼트를 정렬하되 예하면 횡좌표가 작은 것부터 큰 것의 순서에 따라 좌측으로부터 우측으로 정렬하는 것이다.
상기 문자인식모듈(105)은 문자인식규칙에 따라 상기 단일 문자 세그먼트와 대응되는 문자를 인식하는데 사용된다.
본 실시예에서 상기 문자인식규칙은 분할된 각 단일 문자 세그먼트에 트레이닝이 된 제2 Deep ConvNet(즉, 제2 딥 컨벌루션 뉴럴 네트워크 모델)를 입력하는 것 일 수 있다. 산출시간과 산출리소스에 대한 고려로부터 볼 때 여러번의 시산을 거쳐 발견하다시피 상기 제2 Deep ConvNet는 11층 모델구조를 사용할 경우 인식 정확도를 담보할 수 있었다. 상기 제2 Deep ConvNet는 1개의 입력층, 10층의 컨벌루션층, 1개의 분류층을 가지는데 여기서 입력층은 총적인 층수에 계산되지 않는다. 상기 제2 Deep ConvNet는 대량의 여러 가지 단일 문자 세그먼트를 통해 트레이닝해낸 것이다. 상기 제2 Deep ConvNet를 이용하면 분할된 각 단일 문자 세그먼트와 대응되는 문자를 인식할 수 있다. 상기 Deep ConvNet는 먼저 입력된 단일 문자 이미지에서 컨벌루션층을 통해 분류특징을 추출한 후 추출된 분류특징을 제일 마지막층의 MLP(Multiple Layer Perceptron, 멀티 레이어 퍼셉트론) 분류층에 전달하여 분류한다. 총적인 분류가10개의 불변하는 문자 년/검/유/효/기/년/월/까지/(/)와 10개 숫자, 25개 대문자 영문 알파벳, 31개 성 약칭을 을 포함하는 76종류이므로 분류층이 대응되는 숫자를 출력하게 되면 현재 문자가 어느 한 문자 유형에 분류되었는지를 대표할 수 있다.
상기 유효기간결정모듈(106)은 상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성함과 동시에 인식해낸 문자열이 유효할 경우 상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 윤곽영역의 정기검사 유효기간으로 하는데 사용된다.
본 실시예에서 상기 유효기간결정모듈(106)은 상기 후보윤곽영역이 형성한 문자열의 첫 6자리 문자가 기설정된 문자열, 예하면 "정기검사 유효 기간은 ......까지"인지 여부를 검사하고 11번째 문자, 예하면 "년"이 제1 기설정된 문자인지 여부를 검사하며 거꾸로 네번째 문자, 예하면 "("이 제2 기설정된 문자인지 여부를 검사하고 제일 마지막 문자, 예하면 ")"이 제3 기설정된 문자인지 여부를 검사하여 인식해낸 문자열이 효과적인지 여부를 결정한다.
본 실시예에서는 다음과 같은 방법을 사용하여 상기 문자열에서의 시간 데이터를 추출할 수 있다. 예하면 먼저 문자 "년"의 인덱스 위치를 찾고 이 앞의 4개 문자를 절취하면 연도이며 그 다음 문자 "월"의 인덱스를 찾아 그 앞의 2개 문자를 절취한다. 가끔 월분이 한자리 숫자이므로 추출된 첫번째 문자에 대하여 숫자 여부를 판정해야 한다. 마지막으로 추출된 연도 월분 부분을 하나의 문자열로 모으는데 이렇게 되면 하나의 정기검사 유효기간의 시간 부분이 추출된다.
도 4에 도시된 내용을 참조하면 이는 본원 발명의 운전면허 유효기간 자동 추출 방법의 바람직한 실시예의 방법실시 흐름도이다. 본 실시예상기 운전면허 유효기간 자동 추출 방법은 흐름도에 도시된 단계에 한정되지 않고 또 흐름도에 도시된 단계에서 어떠한 단계는 생략될 수 있고 단계 사이의 순서는 변화할 수 있다.
단계S10, 영상파일획득모듈(100)은 단말기기(2)로부터 차량 운전면허의 영상파일(20)을 수신한다.
단계S11, 영역선별모듈(101)은 윤곽추출규칙에 근거하여 상기 영상파일(20)에서의 후보윤곽영역을 추출하고 선별분류규칙에 따라 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별한다.
본 실시예에서 상기 윤곽추출규칙은 예하면 MSER(Maximally Stable Extremal Regions, 최대 안정 극치영역)알고리즘을 사용하여 상기 영상파일(20)에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙 일 수 있다. 여기서 설명해야 할 것은 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규정은 타겟의 정기검사 유효기간 영역을 더 정확히 타겟팅 할 수 있다. 관찰을 통하여 운전면허의 포캣은 비교적 고정되는데 이의 정기검사 유효기간 영역의 종횡비는 10:1 좌우를 유지한다. 상기 기설정된 범위는 정기검사 유효기간의 관련 기학학적 특성에 근거하여 결정하고 하나의 미세한 파동 임계값(예하면 9.5:1 내지 10.5:1 사이)을 설정하는 것을 통해 종횡비가 이 범위내에 있는 영역도 정기검사 유효기간 영역임을 허용하도록 한다. 이러한 휴리스틱 규칙의 응용을 통해 약 50%의 후보윤곽영역을 절감할 수 있고 휴리스틱 규칙을 사용하지 않으면 나중에 관련이 없는 수많은 윤곽영역을 추출하게 되는데 이러한 영역은 진일보로 처리해야 하는 난이도 및 산출량을 증가하게 된다.
설명해야 할 것은 MSER알고리즘의 원리는 다음과 같다. 일련의 등차적인 그레이스케일 임계값(예하면 75, 105, 135, 165, 195, ......)을 사용하여 영상파일(20)에 이진화 처리를 진행하고 매 하나의 임계값에 대해 획득한 이진 영상에 상응한 블랙 영역과 화이트 영역을 획득하며 비교적 넓은 그레이스케일 임계값 범위내에서 형상 안정을 유지하는 영역이 바로 최대 안정 극치영역이다. 여기서 상기 극치영역ER 정의는 다음과 같다. 만약 하나의 연통영역(영역에는 중단점이 존재하지 않음)이 R(Region의 첫번째 알파벳)라고 약칭되고 영역 내부의 임의의 한 점 Ri점과 경계에서의 점 Rb점에 모두 Ф(Ri)>Τ(Rb)와 같은 부등식이 존재하되, 여기서 Ф(Ri)는 점 Ri의 픽셀값을 나타내고 Τ(Rb)는 점 Rb의 픽셀값을 나타내는 조건을 만족하면 상기 부등식의 직관적인 의미는 한 영역 내부의 모든 점의 픽셀값이 늘 영역 경계 또는 그 이외의 점의 픽셀값보다 크고 이러한 특성에 부합되는 영역은 바로 ER(극치영역, 이미지의 국부적인 범위내에서 픽셀값이 주변 영역에 비해 상대적으로 큰 픽셀집합이 형성한 영역)이라고 불릴 수 있다. 이진화 임계값에 대한 변화를 통하여 하나의 그레이스케일 이미지는 수많은 ER을 생성할 수 있다. ER을 형성할 때 사용한 이진화 임계값의 크기에 근거하여 이러한 ER는 하나의 트리형 조직으로 구축될 수 있는데 도 6에 도시된 바와 같이 ER 트리라고 불리며 그 중의 매 하나의 이진화 임계값이 생성한 ER은 모두 ER 트리의 동일한 층에 위치하게 되고 다음 레벨의 이진화 임계값(매 레벨의 이진화 임계값 사이에는 어떤 값의 차이를 가지는데 예하면 30이다)은 현재 층의 ER에 대해 다시 이진화하여 다음 층의 ER을 형성한다. 제일 높은 한 층을 형성하는 ER의 이진화 임계값이 제일 작고 그 다음 위로부터 아래로의 순서로 트리의 잎 노드에서 이진화 임계값은 점차 증가한다. 다단계 이진화 동작에 의해 발생한 ER이 형성한 트리 모양의 구조는 다음과 같다. 매 하나의 이진화 임계값은 일부 ER(극치영역)을 발생하여 한층의 ER을 구성하는데 다음 레벨의 임계값을 사용하여 현재 이진화 임계값이 발생한 ER에 대해 다시 이진화를 진행함으로써 트리에서의 다음 층의 ER을 발생하고 다단계 임계값은 일반적으로 제1 레벨에서 하나의 비교적 작은 임계값(예컨대 20~80)을 지정한 다음 어느 한 증가량, 예컨대 이 예에서의 30(증가는 너무 많거나 적지 말아야 하는 바, 20~30 사이가 비교적 적합하다)에 따라 임계값을 증가한다. 도 6에서의 블록 모양 영역의 크기는 이의 실제 면적값의 크기를 반영하는데 Area는 상이한 영역의 면적을 나타낸다. 트리에서의 ER의 관계에 있어서 동일한 레벨의 이진화 임계값이 발생한 ER는 동일한 레벨에 위치하고 비교적 큰 이진화 임계값이 발생한 ER은 트리의 다음 층에 위치하는 바, 다시 말하면 다음 층의 ER은 현재 층 ER의 다음 노드이다. 트리에서의 경로는 다음과 같다. ER의 생성관계(상하 레벨 관계)에 따라 ER 트리에 대해 순회를 진행한다. ER 트리를 통해 ER의 하나의 안정적인 값 variation을 정의할 수 있는데 이 값은 다음과 같은 공식을 통해 부여한 것이다.
Figure pct00006
,
여기서
Figure pct00007
는 하나의 파라미터로서 ER 트리에서의 두 ER 사이가 ER 트리에서 이격된 노드 수를 가늠하고 기본적으로 5로 설정한다.
Figure pct00008
는 t번째 ER의 면적을 대표하고
Figure pct00009
는 t번째 ER사이에
Figure pct00010
개 거리를 이격한 ER의 면적을 대표한다. 한 ER 트리의 전체 경로(트리에서의 노드의 종속관계에 따라 액세스 함)에서 variation값이 제일 작은 ER을 제일 안정적인 ER, 즉 면적이 임계값의 변화에 대해 민감하지 않은 영역이라고 부른다.
본 실시예에서 상기 선별분류규칙은 예하면 추출된 후보윤곽영역에 트레이닝이 된 제1 Deep ConvNet(딥 컨벌루션 뉴럴 네트워크 모델)를 입력하는 것 일 수 있다. 선별의 정확도를 담보하기 위하여 상기 제1 딥 컨벌루션 뉴럴 네트워크 모델은 23층의 모델 구조를 사용하는데 각각 1개의 입력층, 21층의 컨벌루션층, 2개의 분류층이고 여기서 입력층은 총적인 층수에 계산되지 않는다. 상기 제1 Deep ConvNet를 이용하여 상기 후보윤곽영역이 정기검사 유효기간을 포함하는 신뢰도(즉 확률)를 결정하고; 상기 후보윤곽영역이 정기검사 유효기간을 포함하는 신뢰도가 기설정된 임계값(예하면 85%)보다 크면 상기 후보윤곽영역을 정기검사 유효기간을 포함하는 후보윤곽영역으로 한다.
단계S12, 문자추출모듈(102)은 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출한다. 본 단계의 상세한 실시 흐름도는 하기 도 5의 설명을 참조하기 바란다.
단계S13, 문자분할모듈(103)은 상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시킨다.
본 실시예에서 상기 문자분할모듈(103)은 문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하는데 "예하면 문자 윤곽영역이 불변을 유지하고 기타 영역을 올 블랙 배경으로 설치하는 것에 속하는 것이고", 그 다음 각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해낸다.
단계S14, 정렬모듈(104)은 각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬한다.
상세하게 상기 정렬모듈(104)은 선별해낸 후보윤곽영역의 각 단일 문자 세그먼트의 횡좌표의 크기에 근거하여 상기 후보윤곽영역의 각 단일 문자 세그먼트를 정렬하는데 예하면 횡좌표가 작은 것부터 큰 것의 순서에 따라 좌측으로부터 우측으로 정렬하는 것이다.
단계S15, 문자인식모듈(105)은 문자인식규칙에 따라 상기 단일 문자 세그먼트와 대응되는 문자를 인식한다.
본 실시예에서 상기 문자인식규칙은 분할된 각 단일 문자 세그먼트에 트레이닝이 된 제2 Deep ConvNet(즉, 제2 딥 컨벌루션 뉴럴 네트워크 모델)를 입력하는 것 일 수 있다. 산출시간과 산출리소스에 대한 고려로부터 볼 때 여러번의 시산을 거쳐 발견하다시피 상기 제2 Deep ConvNet는 11층 모델구조를 사용할 경우 인식 정확도를 담보할 수 있었다. 상기 제2 Deep ConvNet는 1개의 입력층, 10층의 컨벌루션층, 1개의 분류층을 가지는데 여기서 입력층은 총적인 층수에 계산되지 않는다. 상기 제2 Deep ConvNet는 대량의 여러 가지 단일 문자 세그먼트를 통해 트레이닝해낸 것이다. 상기 제2 Deep ConvNet를 이용하면 분할된 각 단일 문자 세그먼트와 대응되는 문자를 인식할 수 있다. 상기 Deep ConvNet는 먼저 입력된 단일 문자 이미지에서 컨벌루션층을 통해 분류특징을 추출한 후 추출된 분류특징을 제일 마지막층의 MLP(Multiple Layer Perceptron, 멀티 레이어 퍼셉트론) 분류층에 전달하여 분류한다. 총적인 분류가10개의 불변하는 문자 년/검/유/효/기/년/월/까지/(/)와 10개 숫자, 25개 대문자 영문 알파벳, 31개 성 약칭을 을 포함하는 76종류이므로 분류층이 대응되는 숫자를 출력하게 되면 현재 문자가 어느 한 문자 유형에 분류되었는지를 대표할 수 있다.
단계S16, 유효기간결정모듈(106)은 상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성한다.
단계S17, 상기 유효기간결정모듈(106)은 인식해낸 문자열의 효과 여부를 진일보로 판정한다.
본 실시예에서 상기 유효기간결정모듈(106) 은 상기 후보윤곽영역이 형성한 문자열의 첫 6자리 문자가 기설정된 문자열, 예하면 "정기검사 유효 기간은 ......까지"인지 여부를 검사하고 11번째 문자, 예하면 "년"이 제1 기설정된 문자인지 여부를 검사하며 거꾸로 네번째 문자, 예하면 "("이 제2 기설정된 문자인지 여부를 검사하고 제일 마지막 문자, 예하면 ")"이 제3 기설정된 문자인지 여부를 검사하여 인식해낸 문자열이 효과적인지 여부를 결정한다.
인식해낸 문자열이 효과가 없을 경우 문자추출모듈(102)은 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭(예하면 1)에 따라 점차 증가하거나 또는 점차 감소하며 프로세스가 상기의 단계S12로 돌아가도록 한다.
인식해낸 문자열이 효과적일 경우 다음 단계S18을 수행한다.
단계S18, 상기 유효기간결정모듈(106)은 상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 윤곽영역의 정기검사 유효기간으로 한다.
본 실시예에서는 다음과 같은 방법을 사용하여 상기 문자열에서의 시간 데이터를 추출할 수 있다. 예하면 먼저 문자 "년"의 인덱스 위치를 찾고 이 앞의 4개 문자를 절취하면 연도이며 그 다음 문자 "월"의 인덱스를 찾아 그 앞의 2개 문자를 절취한다. 가끔 월분이 한자리 숫자이므로 추출된 첫번째 문자에 대하여 숫자 여부를 판정해야 한다. 마지막으로 추출된 연도 월분 부분을 하나의 문자열로 모으는데 이렇게 되면 하나의 정기검사 유효기간의 시간 부분이 추출된다.
단계S19, 상기 문자분할모듈(103)은 기타 선별해낸 후보윤곽영역에서의 모든 문자 윤곽이 모두 추출되었는지 여부를 판정한다. 만약 기타 윤곽영역에서의 모든 문자 윤곽이 모두 추출되면 상기의 단계S13으로 돌아가 계속하여 수행한다. 만약 기타 윤곽영역에서의 모든 문자 윤곽이 모두 추출되지 않았으면 다음 단계S20을 수행한다.
단계S20, 상기 유효기간결정모듈(106)은 추출해낸 하나 또는 다수의 선별해낸 후보윤곽영역에서의 정기검사 유효기간의 최근 정기검사 유효기간을 산출하고 상기 최근 기검사 유효기간을 출력한다.
본원 발명의 한 실시예에서는 단지 하나의 선별해낸 후보윤곽영역의 정기검사 유효기간이 추출되면 상기 정기검사 유효기간을 상기 이미지와 대응되는 최신 정기검사 유효기간으로 한다.
본원 발명의 다른 한 실시예에서 다수의 선별해낸 후보윤곽영역의 정기검사 유효기간이 추출되게 되면 상기 유효기간결정모듈(106)은 각 정기검사 유효기간의 날짜의 크기를 비교하여 날짜가 제일 큰, 즉 날짜가 제일 뒤에 있는, 예하면 날짜"2015년 12월"이 날짜"2014년 11월"보다 큰 정기검사 유효기간을 상기 이미지와 대응되는 최신 정기검사 유효기간으로 한다. 예하면 상기 유효기간결정모듈(106)은 각 후보윤곽영역의 정기검사 유효기간을 하나의 문자열 리스트에 저장한 다음 하나의 시간비교함수를 정의하여 두개의 날짜 크기를 비교함으로써 왼쪽 날짜가 오른쪽 날짜보다 크면 -1로 리턴하고 동일하면 0으로 리턴하며 그렇지 않으면 1로 리턴하도록 규정한다. 그 다음 이 비교함수에 근거하여 상기 리스트에서의 시간 문자열에 대해 내림 순서에 따라 정렬하고 서열에서의 첫번째 시간 문자열 원소를 취하여 상기 운전면허의 현재 최신 정기검사 유효기간으로 한다.
도 5에 도시된 내용을 참조하면 이는 도 4에서의 단계S12, 즉 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 상세한 실시 흐름도이다. 본 실시예에서 상기 운전면허 유효기간 자동 추출 방법은 흐름도에 도시된 단계에 한정되지 않고 또 흐름도에 도시된 단계에서 어떠한 단계는 생략될 수 있고 단계 사이의 순서는 변화할 수 있다.
단계S21, 상기 문자추출모듈(102)은 선별해낸 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환한다.
단계S22, 상기 문자추출모듈(102)은 옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행함으로써 그레이스케일 이미지의 그레이스케일 변화범위를 0~255로부터 0-1과 같은 이진 영역으로 압축하여 이진 영상을 획득함으로써 대부분의 교란배경을 제거한다.
단계S23, 상기 문자추출모듈(102)은 윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출한다. 예하면 상기 윤곽추출함수는 findContours함수 일 수 있다.
단계S24, 상기 문자추출모듈(102)은 기설정된 높이와 기설정된 너비의 윤곽을 선별한다. 여기서 상기 기설정된 높이는 예하면 33 일 수 있고 상기 기설정된 너비는 예하면 20 일 수 있다.
단계S25, 상기 문자추출모듈(102)은 선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하는데 예하면 10 일 수 있다. 만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 단계S26을 수행한다.
단계S26, 상기 문자추출모듈(102)은 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭, 예하면 1에 따라 점차 증가하거나 또는 점차 감소하는데 예하면 기설정된 높이를 34로 조정하거나 및/또는 기설정된 너비를 21로 조정하여 상기 단계S24를 수행한다.
만약 선별해낸 윤곽수량이 기설정된 수량과 같으면 과정을 완료한다.
상기 단계S24~S26의 목적은 문자의 분할이 더욱 정확하도록 하기 위함이다. 일반적으로 정기검사 유효기간에서 중문 문자든 영문 문자든 모두 하나의 대체적으로 동일한 높이 및 제일 작은 너비가 있으며 높이와 너비 두개의 임계값 조건을 통해 이미지 임계값이 단계별로 인입한 관련되지 않은 윤곽을 필터링하게 된다. 이와 동시에 각 문자의 윤곽이 산출된 후 정기검사 유효기간 칼럼의 문자 개수는 상대적으로 고정된 것이므로 정기검사 유효기간 칼럼의 문자 윤곽 수량을 통계함으로써 상기 분할의 성공 여부를 결정할 수 있다. 만약 수량이 정확하지 않으면 35와 같은 기타 문자 높이 임계값과 22와 같은 너비 임계값을 사용하여 정확한 수량의 문자 윤곽을 분할하도록 해야 한다.
설명해야 할 것은, 비록 상기 실시예에서 모두 차량 운전면허의 영상파일이 단말기기(2)에 의해 제공되는 것을 예로 하여 설명하였으나 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 기타 실시예에서 영상파일이 기타 경로를 통해 획득, 예하면 영상파일이 클라우드 서버 또는 클라우드 데이터 서버에 저장되어 상기 영상파일을 획득해야 할 경우 네트워크를 통해 상기 영상파일의 전송을 실현하면 된다는 것을 이해할 수 있다. 물론 기타 일부 실시예에서 이러한 영상파일은 USB와 같은 독립적인 저장기기에 저장되어 상기 영상파일을 획득해야 할 경우 상기 저장기기에서 직접 획득하면 된다.
응당 이해해야 할 것은 상기 실시예에서 각 단계의 번호의 크기는 수행 순서의 선후를 의미하는 것이 아니고 각 단계의 수행순서는 응당 그 기능과 내적인 논리에 의해 결정해야 하며 본 발명의 실시예의 실시과정에 어떠한 한정도 하지 말아야 한다.
설명해야 할 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 상기 실시예의 전부 또는 일부 단계의 실현은 하드웨어를 통해 완성될 수 있고 또 프로그램에 의해 관련 하드웨어를 명령하여 완성될 수 있으며 상기 프로그램은 컴퓨터 판독 가능 저장매체에 저장될 수 있고 상기 제기한 저장매체는 롬, 디스크 또는 시디롬 등 일 수 있음을 이해할 수 있다.
마지막으로 설명해야 할 것은 이상의 실시예는 단지 본 발명의 기술적 해결수단을 설명하기 위한 것일 뿐 한정하기 위한 것이 아니고 비록 바람직한 실시예를 참조하여 본 발명에 대해 상세히 설명하였으나 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들이 이해해야 할 것은 본 발명의 기술적 해결수단의 정신과 범위를 벗어나지 않도록 본 발명의 기술적 해결수단에 대해 수정 또는 균등하게 대체할 수 있다.

Claims (16)

  1. 차량 운전면허의 영상파일을 수신하는 단계;
    윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
    선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
    상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
    각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
    상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
    상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
    상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 방법.
  2. 제1항에 있어서,
    상기 윤곽추출규칙은,
    최대 안정 극치영역 알고리즘을 사용하여 상기 영상파일에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 및
    추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙을 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 방법.
  3. 제1항에 있어서,
    상기 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계는,
    A, 상기 선별해낸 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환하는 단계;
    B, 옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행하여 이진 영상을 획득하는 단계;
    C, 윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출하는 단계;
    D, 기설정된 높이와 기설정된 너비의 윤곽을 선별하는 단계;
    E, 선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하는 단계; 및
    F, 만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭을 따르도록 하고 상기 D를 수행하는 단계를 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 방법.
  4. 제1항에 있어서,
    상기 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계는,
    문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하는 단계;
    각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해내는 단계를 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 방법.
  5. 한 운전면허 유효기간 자동 추출 시스템을 저장하기 위한 저장기기; 및
    상기 운전면허 유효기간 자동 추출 시스템을 실행하기 위한 프로세서를 포함하여,
    차량 운전면허의 영상파일을 수신하는 단계;
    윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
    선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
    상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
    각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
    상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
    상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
    상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 수행하도록 하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 기기.
  6. 제5항에 있어서,
    상기 윤곽추출규칙은,
    최대 안정 극치영역 알고리즘을 사용하여 상기 영상파일에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 및
    추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙을 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 기기.
  7. 제5항에 있어서,
    상기 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계는,
    A, 상기 선별해낸 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환하는 단계;
    B, 옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행하여 이진 영상을 획득하는 단계;
    C, 윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출하는 단계;
    D, 기설정된 높이와 기설정된 너비의 윤곽을 선별하는 단계;
    E, 선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하는 단계; 및
    F, 만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭을 따르도록 하고 상기 D를 수행하는 단계를 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 기기.
  8. 제5항에 있어서,
    상기 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계는,
    문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하는 단계;
    각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해내는 단계를 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 기기.
  9. 차량 운전면허의 영상파일을 획득하기 위한 영상파일획득모듈;
    윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 선별분류규칙에 따라 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하기 위한 영역선별모듈;
    선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하기 위한 문자추출모듈;
    상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키기 위한 문자분할모듈;
    각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하기 위한 정렬모듈;
    상기 단일 문자 세그먼트와 대응되는 문자를 인식하기 위한 문자인식모듈; 및
    상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성함과 동시에 인식해낸 문자열이 유효할 경우 상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 윤곽영역의 정기검사 유효기간으로 하기 위한 유효기간결정모듈을 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 시스템.
  10. 제9항에 있어서,
    상기 윤곽추출규칙은,
    최대 안정 극치영역 알고리즘을 사용하여 상기 영상파일에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 및
    추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙을 포함하는 것을 특징으로 하는 운전면허 유효기간 자동 추출 시스템.
  11. 제9항에 있어서,
    상기 문자추출모듈은,
    선별해낸 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환하고;
    옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행하여 이진 영상을 획득하며;
    윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출하고;
    기설정된 높이와 기설정된 너비의 윤곽을 선별하며;
    선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하고;
    만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭을 따르도록 하고 기설정된 높이와 기설정된 너비의 윤곽을 선별하는데 사용되는 것을 특징으로 하는 운전면허 유효기간 자동 추출 시스템.
  12. 제9항에 있어서,
    상기 문자분할모듈이 상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득한 후 상기 문자분할모듈은 문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하며; 각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해내는데 사용되는 것을 특징으로 하는 운전면허 유효기간 자동 추출 시스템.
  13. 컴퓨터 판독가능 명령이 하나 또는 다수의 프로세서에 의해 실행되어,
    차량 운전면허의 영상파일을 수신하는 단계;
    윤곽추출규칙에 근거하여 상기 영상파일에서의 후보윤곽영역을 추출하고 추출된 후보윤곽영역에서 정기검사 유효기간을 포함하는 후보윤곽영역을 선별하는 단계;
    선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계;
    상기 선별해낸 후보윤곽영역의 각 문자 윤곽의 최소 외접 직사각형 프레임을 획득하고 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계;
    각 단일 문자 세그먼트가 상기 선별해낸 후보윤곽영역에서의 위치에 근거하여 상기 단일 문자 세그먼트를 정렬하는 단계;
    상기 단일 문자 세그먼트와 대응되는 문자를 인식하는 단계;
    상기 정렬에 근거하여 인식해낸 문자를 이용하여 정기검사 유효기간을 대표하는 문자열을 생성하는 단계; 및
    상기 문자열에서의 시간 데이터를 추출하고 상기 시간 데이터를 상기 선별해낸 후보윤곽영역의 정기검사 유효기간으로 하는 단계를 수행하도록 하는 것을 특징으로 하는 컴퓨터 판독가능 명령이 저장된 비휘발성 저장 매체.
  14. 제13항에 있어서,
    상기 윤곽추출규칙은,
    최대 안정 극치영역 알고리즘을 사용하여 상기 영상파일에서의 여러 가지 정보의 윤곽영역을 추출하는 규칙; 및
    추출된 윤곽영역에서 종횡비가 기설정된 범위내에 있는 윤곽영역을 후보윤곽영역으로 추출하는 규칙을 포함하는 것을 특징으로 하는 컴퓨터 판독가능 명령이 저장된 비휘발성 저장 매체.
  15. 제13항에 있어서,
    상기 선별해낸 후보윤곽영역에서의 각 문자 윤곽을 추출하는 단계는,
    A, 상기 선별해낸 후보윤곽영역을 단일 채널의 그레이스케일 이미지로 전환하는 단계;
    B, 옷수 임계값 방법을 사용하여 그레이스케일 이미지에 이진화 처리를 진행하여 이진 영상을 획득하는 단계;
    C, 윤곽추출함수를 호출하여 이진 영상에서의 모든 윤곽을 추출하는 단계;
    D, 기설정된 높이와 기설정된 너비의 윤곽을 선별하는 단계;
    E, 선별해낸 윤곽수량이 기설정된 수량과 같은지 여부를 분석하는 단계; 및
    F, 만약 선별해낸 윤곽수량이 기설정된 수량과 같지 않으면 기설정된 높이 및/또는 기설정된 너비를 기설정된 폭을 따르도록 하고 상기 D를 수행하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 명령이 저장된 비휘발성 저장 매체.
  16. 제13항에 있어서,
    상기 획득한 최소 외접 직사각형 프레임에서의 세그먼트를 일일이 분할하여 각 단일 문자 세그먼트로 분할시키는 단계는,
    문자 윤곽의 최소 외접 직사각형을 기존 이미지와 마스크하는 단계;
    각 문자의 최소 외접 직사각형이 제기한 마스크영역을 통해 각 문자가 위치한 세그먼트를 결정하고 이를 분리해내는 단계를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 명령이 저장된 비휘발성 저장 매체.
KR1020187019518A 2016-03-02 2017-02-28 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체 KR102152191B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610119474.7A CN106156767A (zh) 2016-03-02 2016-03-02 行驶证有效期自动提取方法、服务器及终端
CN201610119474.7 2016-03-02
PCT/CN2017/075282 WO2017148377A1 (zh) 2016-03-02 2017-02-28 行驶证有效期自动提取方法、设备、系统及存储介质

Publications (2)

Publication Number Publication Date
KR20180117596A true KR20180117596A (ko) 2018-10-29
KR102152191B1 KR102152191B1 (ko) 2020-09-07

Family

ID=57353489

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187019518A KR102152191B1 (ko) 2016-03-02 2017-02-28 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체

Country Status (8)

Country Link
US (1) US10089553B1 (ko)
EP (1) EP3425563B1 (ko)
JP (1) JP6485894B2 (ko)
KR (1) KR102152191B1 (ko)
CN (1) CN106156767A (ko)
AU (1) AU2017226429B2 (ko)
SG (1) SG11201800348YA (ko)
WO (1) WO2017148377A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156767A (zh) 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端
CN106682669A (zh) * 2016-12-15 2017-05-17 深圳市华尊科技股份有限公司 一种图像处理方法及移动终端
CN106815561A (zh) * 2016-12-22 2017-06-09 北京五八信息技术有限公司 营业执照版面分析方法及装置
CN108629340A (zh) * 2017-03-20 2018-10-09 深圳怡化电脑股份有限公司 一种存单识别方法及识别系统
CN108268868B (zh) * 2017-07-28 2020-07-10 平安科技(深圳)有限公司 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108764226B (zh) * 2018-04-13 2022-05-03 顺丰科技有限公司 图像文本识别方法、装置、设备及其存储介质
CN108805116B (zh) * 2018-05-18 2022-06-24 浙江蓝鸽科技有限公司 图像文本检测方法及其系统
CN109086756B (zh) * 2018-06-15 2021-08-03 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109034050B (zh) * 2018-07-23 2022-05-03 顺丰科技有限公司 基于深度学习的身份证图像文本识别方法及装置
CN110942420B (zh) * 2018-09-21 2023-09-15 阿里巴巴(中国)有限公司 一种图像字幕的消除方法及装置
CN109101856A (zh) * 2018-09-25 2018-12-28 广东工业大学 一种二维码图像识别方法及装置
CN111368838A (zh) * 2018-12-26 2020-07-03 珠海金山网络游戏科技有限公司 一种举报截图的识别方法及装置
CN109871845B (zh) 2019-01-10 2023-10-31 平安科技(深圳)有限公司 证件图像提取方法及终端设备
CN109859224B (zh) * 2019-01-31 2023-01-24 东北大学 一种传送带矿岩颗粒图像分割方法
JP7293693B2 (ja) * 2019-02-05 2023-06-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN111898623B (zh) * 2019-05-05 2023-09-05 杭州海康威视数字技术股份有限公司 一种字符识别方法、装置及电子设备
CN110458138A (zh) * 2019-08-19 2019-11-15 浙江新再灵科技股份有限公司 基于云服务器的直梯内目标检测方法
WO2021087334A1 (en) * 2019-11-01 2021-05-06 Vannevar Labs, Inc. Neural network-based optical character recognition
CN111462035B (zh) * 2020-01-21 2024-03-08 北京明略软件系统有限公司 一种图片检测方法及装置
CN111832390B (zh) * 2020-05-26 2022-10-25 西南大学 一种手写古文字检测方法
CN111741491B (zh) * 2020-08-12 2021-04-27 绿漫科技有限公司 一种蓝牙连接成功率的自动统计方法
CN115082923B (zh) * 2022-08-24 2022-11-08 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014195802A2 (en) * 2013-06-03 2014-12-11 Alipay.Com Co., Ltd Method and system for recognizing information
WO2015008732A1 (ja) * 2013-07-16 2015-01-22 株式会社湯山製作所 光学文字認識装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4752694B2 (ja) * 2006-09-13 2011-08-17 沖電気工業株式会社 画像抽出装置
JP4594952B2 (ja) * 2007-03-20 2010-12-08 株式会社東芝 文字認識装置及び文字認識方法
US9298979B2 (en) * 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10102583B2 (en) * 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
US8457448B2 (en) 2008-02-04 2013-06-04 Hewlett-Packard Development Company, L.P. Removing inserted text from an image using extrapolation for replacement pixels after optical character recognition
IL202028A (en) * 2009-11-10 2016-06-30 Icts Holding Company Ltd Product, devices and methods for computerized authentication of electronic documents
US20120226600A1 (en) * 2009-11-10 2012-09-06 Au10Tix Limited Computerized integrated authentication/document bearer verification system and methods useful in conjunction therewith
CN102236782A (zh) 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
CN102332119A (zh) 2011-09-16 2012-01-25 西安潜安信息科技有限责任公司 一种证件识别系统
US9483794B2 (en) * 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8698896B2 (en) * 2012-08-06 2014-04-15 Cloudparc, Inc. Controlling vehicle use of parking spaces and parking violations within the parking spaces using multiple cameras
EP2885751A4 (en) * 2012-08-15 2016-03-30 Jumio Inc IMAGE PROCESSING FOR CREDIT VALIDATION
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
CN103488998A (zh) * 2013-09-11 2014-01-01 东华大学 一种基于神经网络和图像处理技术的身份证识别方法
CN104298976B (zh) * 2014-10-16 2017-09-26 电子科技大学 基于卷积神经网络的车牌检测方法
CN104408449B (zh) * 2014-10-27 2018-01-30 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
CN104700256A (zh) 2014-12-10 2015-06-10 深圳市中兴移动通信有限公司 一种期限管理方法及其移动终端
CN105320952B (zh) 2015-10-15 2018-06-05 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法
CN106156767A (zh) 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014195802A2 (en) * 2013-06-03 2014-12-11 Alipay.Com Co., Ltd Method and system for recognizing information
WO2015008732A1 (ja) * 2013-07-16 2015-01-22 株式会社湯山製作所 光学文字認識装置

Also Published As

Publication number Publication date
EP3425563B1 (en) 2021-06-23
US20180276493A1 (en) 2018-09-27
JP6485894B2 (ja) 2019-03-20
EP3425563A1 (en) 2019-01-09
JP2018533808A (ja) 2018-11-15
AU2017226429A1 (en) 2017-11-23
WO2017148377A1 (zh) 2017-09-08
US10089553B1 (en) 2018-10-02
EP3425563A4 (en) 2019-10-23
CN106156767A (zh) 2016-11-23
SG11201800348YA (en) 2018-02-27
KR102152191B1 (ko) 2020-09-07
AU2017226429B2 (en) 2019-10-10

Similar Documents

Publication Publication Date Title
KR102152191B1 (ko) 운전면허 유효기간 자동 추출 방법, 기기, 시스템 및 저장 매체
JP6831480B2 (ja) テキスト検出分析方法、装置及びデバイス
CN106529380B (zh) 图像的识别方法及装置
US9971929B2 (en) Fingerprint classification system and method using regular expression machines
US9367766B2 (en) Text line detection in images
US8620094B2 (en) Pattern recognition apparatus, pattern recogntion method, image processing apparatus, and image processing method
CN111695453B (zh) 绘本识别方法、装置及机器人
CN111583180B (zh) 一种图像的篡改识别方法、装置、计算机设备及存储介质
CN112966758B (zh) 一种农作物病虫草害识别方法、装置、系统及存储介质
JP2008251029A (ja) 文字認識装置、ナンバープレート認識システム
KR101732359B1 (ko) 이미지 내의 텍스트를 검출하는 방법 및 장치
CN106663212A (zh) 文字识别装置、文字识别方法以及程序
CN112651417A (zh) 车牌识别方法、装置、设备及存储介质
JP4264332B2 (ja) 文字認識装置、ナンバープレート認識システム
CN113537253A (zh) 一种红外图像目标检测方法、装置、计算设备及存储介质
KR102064974B1 (ko) 블럽 기반의 문자 인식 방법 및 이를 위한 장치
Souza et al. Handwritten numerical character recognition based on paraconsistent artificial neural networks
Yang et al. A skeleton based binarization approach for video text recognition
JP4231375B2 (ja) パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。
Siddique et al. An absolute Optical Character Recognition system for Bangla script Utilizing a captured image
Stehr et al. A real-time visual card reader for mobile devices
CN116310952A (zh) 样本数据集生成方法、装置、设备和存储介质
CN116628662A (zh) 基于掌纹识别的身份认证方法、系统、设备及存储介质
CN114038018A (zh) 一种指纹采集方法及系统
CN117611882A (zh) 文本图像的分类方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant