JP2018533808A - 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体 - Google Patents

運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体 Download PDF

Info

Publication number
JP2018533808A
JP2018533808A JP2018524786A JP2018524786A JP2018533808A JP 2018533808 A JP2018533808 A JP 2018533808A JP 2018524786 A JP2018524786 A JP 2018524786A JP 2018524786 A JP2018524786 A JP 2018524786A JP 2018533808 A JP2018533808 A JP 2018533808A
Authority
JP
Japan
Prior art keywords
contour
character
expiration date
driver
license
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018524786A
Other languages
English (en)
Other versions
JP6485894B2 (ja
Inventor
健宗 王
健宗 王
銘 劉
銘 劉
京 肖
京 肖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2018533808A publication Critical patent/JP2018533808A/ja
Application granted granted Critical
Publication of JP6485894B2 publication Critical patent/JP6485894B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18133Extraction of features or characteristics of the image regional/local feature not essentially salient, e.g. local binary pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

運転免許証有効期限自動抽出方法であって、運転免許証の画像ファイルの候補輪郭領域を抽出し、候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを単一文字ブロックに分割するステップと、、前記候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列するステップと、単一文字ブロックに対応する文字を識別するステップと、前記配列に基づき、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、前記文字列中の時間データを抽出し、該時間データを該輪郭領域の年度審査の有効期限とするステップとを含む。本発明は、上記運転免許証有効期限自動抽出方法に適用する装置、システム及び記憶媒体をさらに提供する。本発明によれば、転免許証の年度審査の有効期限が自動的に抽出される。

Description

本出願は、2016年3月2日に出願され、「運転免許証有効期限自動抽出方法、サーバー、端末装置」と題された中国特許出願第201610119474.7号の優先権を主張し、その全体の内容が参照により本明細書に組み込まれている。
本発明は、データ処理分野に関するものであり、運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体に関するものである。
車両保険業務及び車両賠償業務に対して、運転免許証の年度審査(毎年の検査)の有効期限は、重要な審査事項である。しかし、自然環境で運転免許証に対して年度審査の有効期限を抽出することは、多くの挑戦に臨み、例えば、1)光の強さと不均一な分布が運転免許証の画像ファイルは、細部がはっきりと表示できなく、ひいては影を形成し、この両方で目標領域を位置決めることに対して大きな干渉を引き起こす。2)運転免許証の解像度は目標領域の抽出を行うことにも影響を与え、いくつかの運転免許証の表面が汚れたので、近い距離で観察しても識別できない。3)運転免許証は、よく複数の年度審査の記録に同時に現れ、且つ各記録は時間の順序に従って配列されず、このようにユーザーが全ての記録を識別し、その中から最新の年度審査の記録を探し出す必要がある。
本発明は、上記したような従来の技術において、前記問題点を解決するためになされたものであり、運転免許証の年度審査の有効期限が自動的に抽出される運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体を提供することにその目的がある。
運転免許証有効期限自動抽出方法は、
運転免許証の画像ファイルを取得するステップと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップと、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列するステップと、
前記単一文字ブロックに対応する文字を識別するステップと、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成するステップと、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とするステップと、を備える。
記憶装置及び処理器を備える運転免許証有効期限自動抽出装置は、前記記憶装置が、運転免許証有効期限自動抽出システムを格納することに用いられ、前記処理器は、前記運転免許証有効期限自動抽出システムを実行する。すなわち、
運転免許証の画像ファイルを取得し、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、
選択された候補輪郭領域の中の各文字輪郭を抽出し、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割され、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列し、
前記単一文字ブロックに対応する文字を識別し、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とする。
運転免許証有効期限自動抽出システムは、
運転免許証の画像ファイルを取得することに用いられる画像ファイル取得モジュールと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる領域選択モジュールと、
選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる文字抽出モジュールと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されることに用いられる文字分割モジュールと、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列することに用いられる配列モジュールと、
前記単一文字ブロックに対応する文字を識別することに用いられる文字識別モジュールと、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とすることに用いられる有効期限確認モジュールと、を備える。
コンピュータ読み取り可能なコマンドを格納している不揮発性の運転免許証有効期限自動抽出記憶媒体は、コンピュータ読み取り可能なコマンドが一つ又は複数の処理器によって以下のステップを実行する。すなわち、
運転免許証の画像ファイルを取得し、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、
選択された候補輪郭領域の中の各文字輪郭を抽出し、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割され、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列し、
前記単一文字ブロックに対応する文字を識別し、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とする。
本発明の運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体は、運転免許証における年度審査の有効期限を効果的に抽出でき、且つ運転免許証における年度審査の有効期限が複数である場合、最新の年度審査の有効期限を抽出でき、作業効率を向上させるという効果を奏することができる。
本発明に係る運転免許証有効期限自動抽出システムの第一の好ましい実施形態のハードウェア環境図である。 本発明に係る運転免許証有効期限自動抽出システムの第二の好ましい実施形態のハードウェア環境図である。 本発明に係る運転免許証有効期限自動抽出システムの好ましい実施形態のブロック図である。 本発明に係る運転免許証有効期限自動抽出方法の好ましい実施形態のフローチャートである。 図4に係る運転免許証有効期限自動抽出方法の好ましい実施形態の選択された候補輪郭領域の中の各文字輪郭を抽出する詳しい実施フローチャートである。 一つの極値領域から構築された一つの樹形の組織を示す図である。
本実施形態において、前記運転免許証有効期限自動抽出システム10は、電子装置に搭載して実行されている。前記電子装置は、本発明の技術的な目的を達成できるいずれかの装置であり、例えば、サーバー又は端末装置である。いくつかの実施形態において、電子装置は、処理器及び記憶装置を備え、前記処理器はコアユニット(Core Unit)及びコントロールユニット(Control Unit)であり、コンピュータの命令を読み取り、コンピュータソフトウェアのデータを処理することに用いられる。記憶装置は、内蔵メモリと不揮発性記憶媒体を備える。なお、不揮発性記憶媒体には、オペレーティングシステム、データベース及び運転免許証有効期限自動抽出システム10が格納されている。内蔵メモリは、オペレーティングシステム、データベース及び運転免許証有効期限自動抽出システム10に高速なキャッシュの実行環境を提供する。いくつかの実施形態において、運転免許証有効期限自動抽出システム10は、少なくとも1つのコンピュータ実行可能プログラム命令コードを含む。前記少なくとも1つのコンピュータ実行可能プログラム命令コードは、処理器によって実行されて本実施形態の運転免許証有効期限自動抽出方法を実現することができる。前記方法の具体的なステップは後続の内容を参照する。
不揮発性記憶媒体は、プログラム可能読み出し専用メモリ(PROM)、消去可能・プログラム可能の読み出し専用メモリ(EPROM)、電気的消去可能読み出し専用メモリ(EEPROM)、フラッシュメモリなどのような読み出し専用メモリ(ROM)を含み、USBフラッシュディスク、ハードディスク、ランダムアクセスメモリ(RAM)、磁気ディスク、光ディスクなどのようなコードを格納するための各種の媒体であることができる。
この技術分野の技術者が理解できることであるが、上述した電子装置に対する記述は、本実施形態の電子装置の限定を構成するものではない。具体的に、処理器及び記憶装置以外他の部品も含んで対応する機能を実現し、例えば、ユーザーインターフェース、入力装置、出力装置、ネットワークインターフェース等々である。
上述したように、いくつかの実施形態において、装置はサーバーに搭載される。図1に示すように、前記サーバーは、クラウドサーバー1である。前記クラウドサーバー1は、通信モジュール(図示せず)を介して一つの又は複数の端末装置2に通信可能に接続される。前記端末装置2は、パソコン、スマート携帯電話、タブレットパソコンなどのような装置である。運転免許証有効期限自動抽出システム10は、記憶装置に記憶されているコンピュータ実行可能プログラム命令コードを備える。処理器はこちらのプログラム命令コードを実行することによって下記の機能を実現する。クラウドサーバー1は、端末装置2から運転免許証の画像ファイル20を受信し、前記画像ファイル20の候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、選択した各候補輪郭領域から文字輪郭を一つずつ抽出する。選択された候補輪郭領域の全ての文字輪郭が抽出された後、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割される。本実施形態において、各文字ブロックの分割方法は、文字輪郭の最小の外接矩形及び原画像ファイル20をマスクとして、例えば、文字輪郭領域に属する領域を不変に保持させる一方、残りの領域は、全て黒い背景に設定され、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離することとすることができる。
さらに、前記運転免許証有効期限自動抽出システム10は、選択された候補輪郭領域の各単一文字ブロックに対応する文字を識別し、前記候補輪郭領域の各文字ブロックの横座標の大小に基づいて、前記候補輪郭領域の各文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列され、識別された各文字を対応する単一文字ブロックの配列順序に従って配列し、年度審査を表す文字列を形成し、且つ前記文字列の中の時間部分(例えば、年及び月である)を抽出して前記候補輪郭領域の年度審査の有効期限のテキスト形式で表示する。例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が1つの数字だけの場合があるであるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を1つの文字にして年度審査の有効期限を形成する。
本発明の中の1つの実施形態において、一つだけの候補輪郭領域の年度審査の有効期限が抽出された場合、前記年度審査の有効期限を前記画像ファイル20に対応する最新の年度審査の有効期限とする。本発明の他の実施形態において、複数の候補輪郭領域の年度審査の有効期限が抽出された場合、前記運転免許証有効期限自動抽出システム10は、各年度審査の有効期限の日付の大小を比較し、日付が最大である年度審査の有効期限を前記画像ファイル20に対応する最新の年度審査の有効期限とする。例えば、各年度審査の有効期限は1つの文字列のリストに格納され、時間比較関数を定義することによって二つの日付の大小を比較し、左の日付が右の日付より大きい場合、‐1と出力し、等しい場合、0と出力し、さもなければ、1と出力する。比較関数によって該リストの中の時間文字列が降順に従って配列された後の最上面に位置する文字列を最新の年度審査の有効期限とする。
本発明の他の実施形態において、電子装置は、端末装置2であることができる。図2に示すように、前記端末装置2は、パソコン、スマート携帯電話、タブレットパソコンなどのような装置である。前記端末装置2は、運転免許証を撮影するための撮影装置を有する。本実施形態において、前記運転免許証有効期限自動抽出システム10は、端末装置2の記憶装置に格納されているコンピュータ実行可能プログラム命令コードを含む。撮影装置によって取得された画像ファイルを受信した後、端末装置2の処理器は、こちらのプログラム命令コードを実行して本実施形態によって提供される運転免許証有効期限自動抽出方法を実現する。
図3に示すように、本発明に係る運転免許証有効期限自動抽出システムの好ましい実施形態のブロック図である。
前記運転免許証有効期限自動抽出システム10のプログラムコードは、異なる機能に基づいて複数の機能モジュールに分割される。本発明の好ましい実施形態において、前記運転免許証有効期限自動抽出システム10は、画像ファイル取得モジュール100と、領域選択モジュール101と、文字抽出モジュール102と、文字分割モジュール103と、配列モジュール104と、文字識別モジュール105と、有効期限確認モジュール106と、を備える。
前記画像ファイル取得モジュール100は、端末装置2から運転免許証の画像ファイル20を取得することに用いられる。前記端末装置2は、走査、撮影などのような方式によって運転免許証の画像ファイル20を取得することができる。
領域選択モジュール101は、輪郭抽出ルールに従って前記画像ファイル20の候補輪郭領域を抽出し、選択分類ルールに従って抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる。
本実施形態において、前記輪郭抽出ルールは、例えば、MSER(Maximally Stable Extremal Regions、最大安定極値領域)アルゴリズムを用いて前記画像ファイル20の各種の情報の輪郭領域を抽出し、抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とすることができる。ここで、説明する必要があることは、縦横比が設定範囲内にある輪郭領域は候補輪郭領域として抽出されるため、目標とする年度審査の有効期限領域を正確に位置決めることができる。観察によって運転免許証のフォーマットは固定されており、年度審査の有効期限の縦横比は、約10:1であり、従って、前記設定範囲は、年度審査の有効期限の関連する幾何学的特性に基づいて確認され、わずかな変動閾値を設定することによって、例えば、9.5:1と10.5:1との間にあり、縦横比がこの範囲内の領域にある領域も年度審査の有効期限の領域である。このステップの示唆ルールを使用することによって約50%の候補輪郭領域を減少することができるが、示唆ルールを使用しない場合、多くの無関連な輪郭領域を抽出するので、こちらの領域は、後続の処理の難しさ及び計算量を増加させる。
説明する必要があることは、MSERアルゴリズムの原理は、一連の等級グレースケール閾値(例えば、75、105、135、165、195、......)を用いて画像ファイル20を2値化し、各閾値によって得られる2値画像に基づいてそれに対応する黒色領域及び白色領域を得、広いグレースケール閾値範囲で形状を安定に保持させる領域は最大安定極値領域である。ここで、前記極値領域ERは、以下のように定義される。1つの連結領域(該領域内で間断点がない)がR(Regionの最初の文字)と略称され、以下の条件を満たし、該領域内の任意の1つのRi点と境界点Rb点における以下の不等式が成立し、Ф(Ri)>Ф(Rb)、ここで、Ф(Ri)は点Riの画素値を表し、Ф(Rb)は点Rbの画素値を表す。この不等式の直接的な意味は、1つの領域内の全ての点の画素値が領域境界又は領域境界外の点の画素値より常に大きいことであり、この特性に適合する領域はER(極値領域、画像の一部分範囲内で周囲領域に対してより大きな画素値から集合して形成される領域)と呼ばれる。1つのグレースケール画像は、二値化閾値の変換によって多くのERを生成することができる。こちらのERは、ERを生成する時に使用された二値化閾値の大小に応じて樹形の組織に構築され、ER樹と呼ばれる。図6に示すように、各二値化閾値に応じて生成されたERは、ER樹の同じレベルに位置し、次のレベルの二値化閾値(各レベルごとの二値化閾値の間にある値(例えば、30)がある)は、現在のレベルのERを2値化して次のレベルのERを形成する。最高のレベルのERを形成する二値化閾値は最も小さく、次に、上から下に向かって樹の葉ノードに至り、二値化閾値が徐々に増大する。マルチレベル二値化処理によって形成されたERを介して形成される樹状構造は、二値化閾値ごとに、いくつかのER(極値領域)を形成した後1つのレベルのERを構成し、次のレベルの二値化閾値を使用して現在の二値化閾値によって形成されたERに対して2値化して樹の中の次のレベルのERを形成し、マルチレベル閾値は、第一レベルで20〜80のような小さな閾値を指定し、レベルごとにある増量(例えば、30であり、前記増量が大き過ぎるか又は小さ過ぎるべきではなく、20と30との間が良い)に従って閾値を増加する。図6の中のブロック領域の大小は実際な面積値の大小を反映し、Areaは該領域の面積を表す。樹のERの関連は、同じレベルの二値化閾値によって形成されたERが、同じレベルに位置し、大きな二値化閾値によって形成されたERは、樹の次のレベルに位置する。即ち、次のレベルのERは、現在のレベルのERの次のレベルのノードである。樹の中の経路は、ERの形成関係(上下レベル関係)に従ってER樹を遍歴することである。ER樹を介してERの安定性値variationを定義し、この値は以下の公式を介して得られる。
ここで、δはパラメーターであり、ER樹にある二つのERの間に隔たっているノードの数量を測定することに用いられ、既定値は5に設定される。|ER|は、t番目のERの面積を表す。|ER+δ|は、t番目のERとδ個の距離で隔たっているERの面積を表す。ER樹の全ての経路(樹のノードの従属関係に沿ってアクセスする)において、variation値が最も小さいERは、最も安定なERと呼ばれ、即ち、面積が閾値変化に敏感でない領域である。
本実施形態において、前記選択分類ルールは、例えば、抽出された候補輪郭領域を訓練された第一深層畳み込みニューラルネットワーク(Deep ConvNet)モデルに入力することとすることができる。選択精度を保証するために、前記第一深層畳み込みニューラルネットワークモデルは、1つの入力層と21層の畳み込み層と二つの分類層が含まれている23層モデル構造を採用し、ここで、入力層は層の合計に計算されない。前記第一深層畳み込みニューラルネットワークモデルは、大量の年度審査の有効期限が含まれる輪郭領域及び年度審査の有効期限が含まれない輪郭領域に基づいて訓練された。前記第一深層畳み込みニューラルネットワークモデルを利用して前記候補輪郭領域における年度審査の有効期限が含まれる確信度(即ち、確率)を判定する。前記候補輪郭領域における年度審査の有効期限が含まれる確信度が予め設定された閾値(例えば、85%)より大きい場合、前記候補輪郭領域を年度審査の有効期限が含まれる候補輪郭領域とする。
前記文字抽出モジュール102は、選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる。
本実施形態において、前記文字抽出モジュール102は、以下の方法に従って各文字輪郭を抽出する:A、候補輪郭領域を単一チャネルのグレースケール画像に変換する。B、大津の閾値法(判別分析法)を採用してグレースケール画像を2値化し、グレースケール画像のグレースケール変化範囲0〜255を二値領域0〜1に変換することによって、大部分の干渉背景を削除する。C、輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、例えば、前記輪郭抽出関数はfind contours関数とすることができる。D、予め設定された高さ及び予め設定された幅を有する輪郭を選択し、ここで、前記予め設定された高さは例えば33とすることができ、また、前記予め設定された幅は例えば20とすることができる。E、選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、例えば、選択した輪郭の数量は10であり、選択した輪郭の数量が予め設定された数量と等しくない場合、F、予め設定された高さ及び/又は予め設定された幅を予め設定された大きさ(例えば、1)に従って逓増するか又は逓減し、例えば、予め設定された高さを34に調整し、及び/又は、予め設定された幅を21に調整し、上述したステップDを実行する。
上述したステップD、E、Fの目的は、文字分割を更に正確にすることである。一般的に、年度審査の有効期限における漢字と英文字がほぼ同じ高さ及び最小の幅を有し、高さ及び幅の二つの閾値条件に従って無関係な輪郭を削除する。同時に、各文字輪郭が算出された後に、年度審査の有効期限欄の文字の文字数が比較的固定であるため、年度審査の有効期限の文字輪郭の数量を統計することによってこの分割が成功したかどうかを判定することができる。文字輪郭の数量が間違った場合、35のような他の文字高さ閾値と22のような他の幅閾値を試すことによって正しい数量の文字輪郭を分割する必要がある。
前記文字分割モジュール103は、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割することに用いられる。例えば、文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、例えば、文字輪郭領域に属する領域は不変で保持させる一方、残りの領域は、全て黒い背景に設定し、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離する。
前記配列モジュール104は、選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列することに用いられる。具体的に、前記配列モジュール104は、選択された候補輪郭領域の各単一文字ブロックの横座標の大小に基づいて、選択された候補輪郭領域の各単一文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列される。
前記文字識別モジュール105は、文字識別ルールに従って前記単一文字ブロックに対応する文字を識別することに用いられる。
本実施形態において、前記文字識別ルールは、分割された各単一文字ブロックを、訓練された第二深層畳み込みニューラルネットワーク(Deep ConvNet)モデルに入力することとすることができる。第二深層畳み込みニューラルネットワークモデルは、11層モデル構造を採用するため、計算時間及び計算資源を考慮し、数回の試行で識別精度を保証できることが分かる。前記第二深層畳み込みニューラルネットワークモデルは、1つの入力層と10層の畳み込み層と1つの分類層を含み、ここで、入力層は層の合計に計算されない。前記第二深層畳み込みニューラルネットワークモデルは、大量の各種の単一文字ブロックに基づいて訓練される。前記第二深層畳み込みニューラルネットワークモデルを利用して分割された各単一文字ブロックに対応する文字を識別する。Deep ConvNetは、まず入力された単一文字ブロックから畳み込み層を介して分類特性を抽出し、抽出した分類特性を最後の層の多重層パーセプトロン(Multiple Layer Perceptron、MLP)分類層に入力して分類する。全体の分類は76個の類別があり、年/度/審/査/の/有/効/期/限/年/月/日/(/)のような14個の不変の文字と、10個の数字と、25個の英語の大文字、31の省の略称を含み、分類層から出力された対応する数字は、現在の文字がどの文字類別に分類されるかを表す。
有効期限確認モジュール106は、前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とすることに用いられる。
本実施形態において、前記有効期限確認モジュール106は、前記候補輪郭領域によって形成された文字列の最初から数えて6個の文字が予め設定された文字列であるかどうかを判定し、例えば、「年度審査の有効期間」、15番目の文字は第一の予め設定された文字であるかどうかを判定し、例えば、「年」、後ろから数えて4番目の文字は第二の予め設定された文字であるかどうかを判定し、例えば、「(」、及び最後の文字は第三予め設定された文字であるかどうかを判定し、例えば、「)」、識別された文字列が有効かどうかを判定する。
本実施形態において、以下の方法を用いて前記文字列の時間データを抽出し、例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が1つの数字だけの場合があるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を1つの文字列にし、このようにして年度審査の有効期限の時間データが抽出される。
図4に示すように、本発明に係る運転免許証有効期限自動抽出方法の好ましい実施形態のフローチャートである。フローチャートに示すようなステップを限定するものではないことを理解できる。そのフローチャートに示すステップの中のあるステップは省略でき、ステップの間の手順も変更することができる。
ステップS10:画像ファイル取得モジュール100は、端末装置2から運転免許証の画像ファイル20を取得する。
ステップS11:領域選択モジュール101は、輪郭抽出ルールに従って前記画像ファイル20の候補輪郭領域を抽出し、選択分類ルールに従って抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択する。
本実施形態において、前記輪郭抽出ルールは、例えば、MSER(Maximally Stable Extremal Regions、最大安定極値領域)アルゴリズムを用いて前記画像ファイル20の各種の情報の輪郭領域を抽出し、抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とすることができる。ここで、説明する必要があることは、縦横比が設定範囲内にある輪郭領域は候補輪郭領域として抽出されるため、目標とする年度審査の有効期限領域を正確に位置決めることができる。観察によって運転免許証のフォーマットは固定されており、年度審査の有効期限の縦横比は、約10:1である。従って、前記設定範囲は、年度審査の有効期限の関連する幾何学的特性に基づいて確認され、わずかな変動閾値を設定することによって、例えば、9.5:1と10.5:1との間にあり、縦横比がこの範囲内の領域にある領域も年度審査の有効期限の領域である。このステップの示唆ルールを使用することによって約50%の候補輪郭領域を減少することができるが、示唆ルールを使用しない場合、多くの無関連な輪郭領域を抽出するので、こちらの領域は、後続の処理の難しさ及び計算量を増加させる。
説明する必要があることは、MSERアルゴリズムの原理は、一連の等級グレースケール閾値(例えば、75、105、135、165、195、......)を用いて画像ファイル20を2値化し、各閾値によって得られる2値画像に基づいてそれに対応する黒色領域及び白色領域を得、広いグレースケール閾値範囲で形状を安定に保持させる領域は最大安定極値領域である。ここで、前記極値領域ERは、以下のように定義される。1つの連結領域(該領域内で間断点がない)がR(Regionの最初の文字)と略称され、以下の条件を満たし、該領域内の任意の1つのRi点と境界点Rb点における以下の不等式が成立し、Ф(Ri)>Ф(Rb)、ここで、Ф(Ri)は点Riの画素値を表し、Ф(Rb)は点Rbの画素値を表す。この不等式の直接的な意味は、1つの領域内の全ての点の画素値が領域境界又は領域境界外の点の画素値より常に大きいことであり、この特性を適合する領域はER(極値領域、画像の一部分範囲内で周囲領域に対してより大きな画素値から集合して形成される領域)と呼ばれる。1つのグレースケール画像は、二値化閾値の変換によって多くのERを生成することができる。こちらのERは、ERを生成する時に使用された二値化閾値の大小に応じて樹形の組織に構築され、ER樹と呼ばれる。図6に示すように、各二値化閾値に応じて生成されたERは、ER樹の同じレベルに位置し、次のレベルの二値化閾値(各レベルごとの二値化閾値の間にある値(例えば、30)がある)は、現在のレベルのERを2値化して次のレベルのERを形成する。最高のレベルのERを形成する二値化閾値は最も小さく、次に、上から下に向かって樹の葉ノードに至り、二値化閾値が徐々に増大する。マルチレベル二値化処理によって形成されたERを介して形成される樹状構造は、二値化閾値ごとに、いくつかのER(極値領域)を形成した後1つのレベルのERを構成し、次のレベルの二値化閾値を使用して現在の二値化閾値によって形成されたERに対して2値化して樹の中の次のレベルのERを形成し、マルチレベル閾値は、第一レベルで20〜80のような小さな閾値を指定し、レベルごとにある増量(例えば、30であり、前記増量が大き過ぎるか又は小さ過ぎるべきではなく、20と30との間が良い)に従って閾値を増加する。図6の中のブロック領域の大小は実際の面積値の大小を反映し、Areaは該領域の面積を表す。樹のERの関連は、同じレベルの二値化閾値によって形成されたERは、同じレベルに位置し、大きな二値化閾値によって形成されたERは、樹の次のレベルに位置する。即ち、次のレベルのERは、現在のレベルのERの次のレベルのノードである。樹の中の経路は、ERの形成関係(上下レベル関係)に従ってER樹を遍歴することである。ER樹を介してERの安定性値variationを定義し、この値は以下の公式を介して得られる。
ここで、δはパラメーターであり、ER樹にある二つのERの間に隔たっているノードの数量を測定することに用いられ、既定値は5に設定される。|ER|は、t番目のERの面積を表す。|ER+δ|は、t番目のERの間にδ個の距離があって隔たっているERの面積を表す。ER樹の全ての経路(樹のノードの従属関係に沿ってアクセスする)において、variation値が最も小さいERは、最も安定なERと呼ばれ、即ち、面積が閾値変化に敏感でない領域である。
本実施形態において、前記選択分類ルールは、例えば、抽出された候補輪郭領域を訓練された第一深層畳み込みニューラルネットワーク(Deep ConvNet)モデルに入力することとすることができる。選択精度を保証するために、前記第一深層畳み込みニューラルネットワークモデルは、1つの入力層と21層の畳み込み層と二つの分類層が含まれている23層モデル構造を採用し、ここで、入力層は層の合計に計算されない。前記第一深層畳み込みニューラルネットワークモデルは、大量の年度審査の有効期限が含まれる輪郭領域及び年度審査の有効期限が含まれない輪郭領域に基づいて訓練された。前記第一深層畳み込みニューラルネットワークモデルを利用して前記候補輪郭領域における年度審査の有効期限が含まれる確信度(即ち、確率)を判定する。前記候補輪郭領域における年度審査の有効期限が含まれる確信度が予め設定された閾値(例えば、85%)より大きい場合、前記候補輪郭領域を年度審査の有効期限が含まれる候補輪郭領域とする。
ステップS12:文字抽出モジュール102は、選択された候補輪郭領域の中の各文字輪郭を抽出する。本ステップの詳しい実施フローチャートは、下記の図5の説明を参照する。
ステップS13:文字分割モジュール103は、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割する。
本実施形態において、文字分割モジュール103は、文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、例えば、文字輪郭領域に属する領域を不変に保持させる一方、残りの領域は、全ての黒い背景に設定され、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離する。
ステップS14:配列モジュール104は、選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列する。
具体的に、前記配列モジュール104は、選択された候補輪郭領域の各単一文字ブロックの横座標の大小に基づいて、選択された候補輪郭領域の各単一文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列される。
ステップS15:文字識別モジュール105は、文字識別ルールに従って前記単一文字ブロックに対応する文字を識別する。
本実施形態において、前記文字識別ルールは、分割された各単一文字ブロックを訓練された第二深層畳み込みニューラルネットワーク(Deep ConvNet)モデルに入力することとすることができる。第二深層畳み込みニューラルネットワークモデルは、11層モデル構造を採用するため、計算時間及び計算資源を考慮し、数回の試行で識別精度を保証できることが分かる。前記第二深層畳み込みニューラルネットワークモデルは、1つの入力層と10層の畳み込み層と1つの分類層を含み、ここで、入力層は層の合計に計算されない。前記第二深層畳み込みニューラルネットワークモデルは、大量の各種の単一文字ブロックに基づいて訓練される。前記第二深層畳み込みニューラルネットワークモデルを利用して分割された各単一文字ブロックに対応する文字を識別する。Deep ConvNetは、まず入力された単一文字ブロックから畳み込み層を介して分類特性を抽出し、抽出した分類特性を最後の層の多重層パーセプトロン(Multiple Layer Perceptron、MLP)分類層に入力して分類する。全体の分類は76個の類別があり、年/度/審/査/の/有/効/期/限/年/月/日/(/)のような14個の不変の文字と、10個の数字と、25個の英語の大文字、31の省の略称を含み、分類層から出力された対応する数字は、現在の文字がどの文字類別に分類されるかを表す。
ステップS16:有効期限確認モジュール106は、前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成する。
ステップS17:有効期限確認モジュール106は、識別された文字列が有効かどうかを判定する。
本実施形態において、前記有効期限確認モジュール106は、前記候補輪郭領域によって形成された文字列の最初から数えて6個の文字が予め設定された文字列であるかどうかを判定し、例えば、「年度審査の有効期間」、15番目の文字は第一の予め設定された文字であるかどうかを判定し、例えば、「年」、後ろから数えて4番目の文字は第二の予め設定された文字であるかどうかを判定し、例えば、「(」、及び最後の文字は第三の予め設定された文字であるかどうかを判定し、例えば、「)」、識別された文字列が有効かどうかを判定する。
識別された文字列が無効である場合、文字抽出モジュール102は、予め設定された高さ及び/又は予め設定された幅を予め設定された長さ(例えば、1)に従って逓増するか又は逓減し、上述したステップS12に戻る。
識別された文字列が有効である場合、以下のステップS18を実行する。
ステップS18:前記有効期限確認モジュール106は、前記文字列の時間データを抽出し、例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が1つの数字だけの場合があるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を1つの文字列にして、このように年度審査の有効期限の時間データが抽出される。
ステップS19:前記文字分割モジュール103は、他の選択された候補輪郭領域の中の全ての文字輪郭が選択されるかどうかを判定する。他の選択された候補輪郭領域の中の全ての文字輪郭が選択される場合、上述したステップS13に戻る。他の選択された候補輪郭領域の中の全ての文字輪郭が選択されない場合、下記のステップS20を実行する。
ステップS20:前記有効期限確認モジュール106は、抽出された1つ又は複数の選択された候補輪郭領域の中の年度審査の有効期限における最近の年度審査の有効期限を計算し、且つ前記最近の年度審査の有効期限を出力する。
本発明の中の実施形態において、1つだけの選択された候補輪郭領域の中の年度審査の有効期限が抽出された場合、年度審査の有効期限を画像に対応する最新の年度審査の有効期限とする。
本発明の中の他の実施形態において、複数の選択された候補輪郭領域の中の年度審査の有効期限が抽出された場合、前記有効期限確認モジュール106は、各年度審査の有効期限の日付の大小を比較し、日付が最も後ろに近い年度審査の有効期限を前記画像ファイル20に対応する最新の年度審査の有効期限として、例えば、日付「2015年12月」が日付「2015年11月」より大きい場合、日付「2015年12月」を最新の年度審査の有効期限とする。また、各年度審査の有効期限は1つの文字列のリストに格納され、時間比較関数を定義することによって二つの日付の大小を比較し、左の日付が右の日付より大きい場合、‐1と出力し、等しい場合、0と出力し、さもなければ、1と出力する。比較関数によって該リストの中の時間文字列が降順に従って配列された後の最上面に位置する文字列を最新の年度審査の有効期限とする。
図5に示すように、図4に係るステップS12であり、選択された候補輪郭領域の中の各文字輪郭を抽出する詳しい実施フローチャートである。本実施形態の運転免許証有効期限自動抽出方法は、ブロック図に示すようなステップを限定するものではないことを理解できる。そのブロック図に示すステップの中のあるステップは省略でき、ステップの間の手順も変更することができる。
ステップS21:前記文字抽出モジュール102は、選択された候補輪郭領域を単一チャネルのグレースケール画像に変換する。
ステップS22:前記文字抽出モジュール102は、大津の閾値法(判別分析法)を採用してグレースケール画像を2値化し、グレースケール画像のグレースケール変化範囲0〜255を二値領域0〜1に変換して二値画像を得ることによって大部分の干渉背景を削除する。
ステップS23:前記文字抽出モジュール102は、輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、例えば、前記輪郭抽出関数はfind contours関数とすることができる。
ステップS24:前記文字抽出モジュール102は、予め設定された高さ及び予め設定された幅を有する輪郭を選択し、ここで、前記予め設定された高さは例えば33とすることができ、また、前記予め設定された幅は例えば20とすることができる。
ステップS25:前記文字抽出モジュール102は、選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、例えば、選択した輪郭の数量は10であり、選択した輪郭の数量が予め設定された数量と等しくない場合、ステップS26を実行する。
ステップS26:前記文字抽出モジュール102は、予め設定された高さ及び/又は予め設定された幅を予め設定された長さ(例えば、1)に従って逓増するか又は逓減し、例えば、予め設定された高さを34に調整し、及び/又は、予め設定された幅を21に調整し、上述したステップS24を実行する。
選択した輪郭の数量が予め設定された数量と等しい場合、プロセスを終了する。
上述したステップS24〜S26の目的は、文字分割を更に正確にすることである。一般的に、年度審査の有効期限における漢字と英文字がほぼ同じ高さ及び最小の幅を有し、高さ及び幅の二つの閾値条件に従って無関係な輪郭を削除する。同時に、各文字輪郭が算出された後に、年度審査の有効期限欄の文字の文字数が比較的固定であるため、年度審査の有効期限の文字輪郭の数量を統計することによってこの分割が成功したかどうかを判定することができる。文字輪郭の数量が間違った場合、例えば35のような他の文字高さ閾値と例えば22のような他の幅閾値を試すことによって正しい数量の文字輪郭を分割する必要がある。
説明する必要があることは、上述した実施形態において、運転免許証の画像ファイルは端末装置によって提供されることを例として説明する。しかしながら、この技術分野の技術者が理解できることは、他の実施形態において、画像ファイルは、他の方式によって取得される。例えば、画像ファイルは、クラウドサーバー又はクラウドデータに格納されることができる。前記画像ファイルを取得する必要がある場合、ネットワークを介して前記画像ファイルを伝送することができる。勿論、他の実施形態において、この画像ファイルは、単独の記憶装置に格納されることができ、例えば、USBフラッシュディスクである。前記画像ファイルを取得する必要がある場合、前記記憶装置から直接的に読み取ることができる。
理解できることは、上述した実施形態において、各ステップの番号の大小は実行順序を意味しない。各ステップの実行順序は、その機能と本質的な論理に基づいて確認され、本発明の実施形態の実施過程に限定されるものではない。
説明する必要があることは、この技術分野の技術者が理解できることは、上述した実施形態の方法の中の全体又は一部分のステップを実行することは、ハードウェアを命令して完成することができ、プログラムによってハードウェアを命令して完成することもできる。前記プログラムは、コンピュータ読み取り可能な記憶媒体に格納され、前記コンピュータ読み取り可能な記憶媒体は、磁気ディスク、光ディスク、読み取り専用メモリなどのような不揮発性記憶媒体であることができる。
最後に説明すべきであることは、以上の実施形態は、本発明の技術方案を説明するためだけであり、限定を構成するものではない。好ましい実施形態を参照して詳細に説明したが、この技術分野の技術者は、本発明の技術方案に対して様々な変更と同等の代替を行っても良く、本発明の精神と範囲を逸脱しないことを理解できる。

Claims (16)

  1. 運転免許証有効期限自動抽出方法であって、
    運転免許証の画像ファイルを取得するステップと、
    輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
    選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
    選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップと、
    選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列するステップと、
    前記単一文字ブロックに対応する文字を識別するステップと、
    前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、
    前記文字列の時間データを抽出し、前記時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、
    を備えることを特徴とする運転免許証有効期限自動抽出方法。
  2. 前記輪郭抽出ルールは、
    最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
    抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
    を備えることを特徴とする請求項1に記載の運転免許証有効期限自動抽出方法。
  3. 選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
    A:前記選択された候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
    B:大津の閾値法を採用してグレースケール画像を2値化して二値画像を得るステップと、
    C:輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
    D:予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
    E:選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
    F:選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び/又は予め設定された幅を予め設定された長さに従って、上述したステップDを実行するステップと、
    を備えることを特徴とする請求項1に記載の運転免許証有効期限自動抽出方法。
  4. 取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップは、
    文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
    各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離するステップと、
    を備えることを特徴とする請求項1に記載の運転免許証有効期限自動抽出方法。
  5. 記憶装置及び処理器を備える運転免許証有効期限自動抽出装置であって、
    前記記憶装置は、運転免許証有効期限自動抽出システムを格納することに用いられ、
    前記処理器は、前記運転免許証有効期限自動抽出システムを実行して、
    運転免許証の画像ファイルを取得するステップと、
    輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
    選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
    選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップと、
    各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列するステップと、
    前記単一文字ブロックに対応する文字を識別するステップと、
    前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成するステップと、
    前記文字列の時間データを抽出し、前記時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、
    を実行することに用いられることを特徴とする運転免許証有効期限自動抽出装置。
  6. 前記輪郭抽出ルールは、最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
    抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
    を備えることを特徴とする請求項5に記載の運転免許証有効期限自動抽出装置。
  7. 選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
    A:候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
    B:大津の閾値法を採用してグレースケール画像を2値化して二値画像を得るステップと、
    C:輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
    D:予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
    E:選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
    F:選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び/又は予め設定された幅を予め設定された長さに従って、上述したステップDを実行するステップと、
    を備えることを特徴とする請求項5に記載の運転免許証有効期限自動抽出装置。
  8. 取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップは、
    文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
    各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離するステップと、
    を備えることを特徴とする請求項5に記載の運転免許証有効期限自動抽出装置。
  9. 運転免許証有効期限自動抽出システムであって、
    運転免許証の画像ファイルを取得することに用いられる画像ファイル取得モジュールと、
    輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、かつ、抽出した候補輪郭領域から、選択分類ルールに従って、年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる領域選択モジュールと、
    選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる文字抽出モジュールと、
    前記選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割することに用いられる文字分割モジュールと、
    前記選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列することに用いられる配列モジュールと、
    前記単一文字ブロックに対応する文字を識別することに用いられる文字識別モジュールと、
    前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、該時間データを輪郭領域の年度審査の有効期限とすることに用いられる有効期限確認モジュールと、
    を備えることを特徴とする運転免許証有効期限自動抽出システム。
  10. 前記輪郭抽出ルールは、最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
    抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
    を備えることを特徴とする請求項9に記載の運転免許証有効期限自動抽出システム。
  11. 前記文字抽出モジュールは、
    選択された候補輪郭領域を単一チャネルのグレースケール画像に変換し、
    大津の閾値法を採用してグレースケール画像を2値化して二値画像を得、
    輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、
    予め設定された高さ及び予め設定された幅を有する輪郭を選択し、
    選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、
    選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び/又は予め設定された幅を予め設定された長さに従って、上述したステップDを実行することに用いられる
    ことを特徴とする請求項9に記載の運転免許証有効期限自動抽出システム。
  12. 文字分割モジュールは、
    文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、
    各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離することに用いられる
    ことを特徴とする請求項9に記載の運転免許証有効期限自動抽出システム。
  13. コンピュータ読み取り可能なコマンドを格納している不揮発性の運転免許証有効期限自動抽出記憶媒体であって、前記コンピュータ読み取り可能なコマンドは一つ又は複数の処理器によって、
    運転免許証の画像ファイルを取得するステップと、
    輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
    選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
    選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップと、
    前記選択された候補輪郭領域における各単一文字ブロックの位置に基づいて前記単一文字ブロックを配列するステップと、
    前記単一文字ブロックに対応する文字を識別するステップと、
    前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、
    前記文字列の時間データを抽出し、該時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、

    を実行するために用いられることを特徴とする運転免許証有効期限自動抽出記憶媒体。
  14. 前記輪郭抽出ルールは、
    最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
    抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
    を備えることを特徴とする請求項13に記載の運転免許証有効期限自動抽出記憶媒体。
  15. 選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
    A:前記選択された候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
    B:大津の閾値法を採用してグレースケール画像を2値化して二値画像を得るステップと、
    C:輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
    D:予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
    E:選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
    F:選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び/又は予め設定された幅を予め設定された長さに従って、上述したステップDを実行するステップと、
    を備えることを特徴とする請求項13に記載の運転免許証有効期限自動抽出記憶媒体。
  16. 取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップは、
    文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
    各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離するステップと、
    を備えることを特徴とする請求項13に記載の運転免許証有効期限自動抽出記憶媒体。
JP2018524786A 2016-03-02 2017-02-28 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体 Active JP6485894B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610119474.7A CN106156767A (zh) 2016-03-02 2016-03-02 行驶证有效期自动提取方法、服务器及终端
CN201610119474.7 2016-03-02
PCT/CN2017/075282 WO2017148377A1 (zh) 2016-03-02 2017-02-28 行驶证有效期自动提取方法、设备、系统及存储介质

Publications (2)

Publication Number Publication Date
JP2018533808A true JP2018533808A (ja) 2018-11-15
JP6485894B2 JP6485894B2 (ja) 2019-03-20

Family

ID=57353489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018524786A Active JP6485894B2 (ja) 2016-03-02 2017-02-28 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体

Country Status (8)

Country Link
US (1) US10089553B1 (ja)
EP (1) EP3425563B1 (ja)
JP (1) JP6485894B2 (ja)
KR (1) KR102152191B1 (ja)
CN (1) CN106156767A (ja)
AU (1) AU2017226429B2 (ja)
SG (1) SG11201800348YA (ja)
WO (1) WO2017148377A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871845A (zh) * 2019-01-10 2019-06-11 平安科技(深圳)有限公司 证件图像提取方法及终端设备
JP2020527260A (ja) * 2018-06-15 2020-09-03 ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド テキスト検出分析方法、装置及びデバイス

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156767A (zh) 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端
CN106682669A (zh) * 2016-12-15 2017-05-17 深圳市华尊科技股份有限公司 一种图像处理方法及移动终端
CN106815561A (zh) * 2016-12-22 2017-06-09 北京五八信息技术有限公司 营业执照版面分析方法及装置
CN108629340A (zh) * 2017-03-20 2018-10-09 深圳怡化电脑股份有限公司 一种存单识别方法及识别系统
CN108268868B (zh) * 2017-07-28 2020-07-10 平安科技(深圳)有限公司 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN108764226B (zh) * 2018-04-13 2022-05-03 顺丰科技有限公司 图像文本识别方法、装置、设备及其存储介质
CN108805116B (zh) * 2018-05-18 2022-06-24 浙江蓝鸽科技有限公司 图像文本检测方法及其系统
CN109034050B (zh) * 2018-07-23 2022-05-03 顺丰科技有限公司 基于深度学习的身份证图像文本识别方法及装置
CN110942420B (zh) * 2018-09-21 2023-09-15 阿里巴巴(中国)有限公司 一种图像字幕的消除方法及装置
CN109101856A (zh) * 2018-09-25 2018-12-28 广东工业大学 一种二维码图像识别方法及装置
CN111368838A (zh) * 2018-12-26 2020-07-03 珠海金山网络游戏科技有限公司 一种举报截图的识别方法及装置
CN109859224B (zh) * 2019-01-31 2023-01-24 东北大学 一种传送带矿岩颗粒图像分割方法
JP7293693B2 (ja) * 2019-02-05 2023-06-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN111898623B (zh) * 2019-05-05 2023-09-05 杭州海康威视数字技术股份有限公司 一种字符识别方法、装置及电子设备
CN110458138A (zh) * 2019-08-19 2019-11-15 浙江新再灵科技股份有限公司 基于云服务器的直梯内目标检测方法
WO2021087334A1 (en) * 2019-11-01 2021-05-06 Vannevar Labs, Inc. Neural network-based optical character recognition
CN111462035B (zh) * 2020-01-21 2024-03-08 北京明略软件系统有限公司 一种图片检测方法及装置
CN111832390B (zh) * 2020-05-26 2022-10-25 西南大学 一种手写古文字检测方法
CN111741491B (zh) * 2020-08-12 2021-04-27 绿漫科技有限公司 一种蓝牙连接成功率的自动统计方法
CN115082923B (zh) * 2022-08-24 2022-11-08 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071076A (ja) * 2006-09-13 2008-03-27 Oki Electric Ind Co Ltd 画像抽出装置
JP2008234291A (ja) * 2007-03-20 2008-10-02 Toshiba Corp 文字認識装置及び文字認識方法
WO2014195802A2 (en) * 2013-06-03 2014-12-11 Alipay.Com Co., Ltd Method and system for recognizing information
WO2015008732A1 (ja) * 2013-07-16 2015-01-22 株式会社湯山製作所 光学文字認識装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9298979B2 (en) * 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10102583B2 (en) * 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
US8457448B2 (en) 2008-02-04 2013-06-04 Hewlett-Packard Development Company, L.P. Removing inserted text from an image using extrapolation for replacement pixels after optical character recognition
IL202028A (en) * 2009-11-10 2016-06-30 Icts Holding Company Ltd Product, devices and methods for computerized authentication of electronic documents
US20120226600A1 (en) * 2009-11-10 2012-09-06 Au10Tix Limited Computerized integrated authentication/document bearer verification system and methods useful in conjunction therewith
CN102236782A (zh) 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
CN102332119A (zh) 2011-09-16 2012-01-25 西安潜安信息科技有限责任公司 一种证件识别系统
US9483794B2 (en) * 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8698896B2 (en) * 2012-08-06 2014-04-15 Cloudparc, Inc. Controlling vehicle use of parking spaces and parking violations within the parking spaces using multiple cameras
EP2885751A4 (en) * 2012-08-15 2016-03-30 Jumio Inc IMAGE PROCESSING FOR CREDIT VALIDATION
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
CN103488998A (zh) * 2013-09-11 2014-01-01 东华大学 一种基于神经网络和图像处理技术的身份证识别方法
CN104298976B (zh) * 2014-10-16 2017-09-26 电子科技大学 基于卷积神经网络的车牌检测方法
CN104408449B (zh) * 2014-10-27 2018-01-30 西安电子科技大学宁波信息技术研究院 智能移动终端场景文字处理方法
CN104700256A (zh) 2014-12-10 2015-06-10 深圳市中兴移动通信有限公司 一种期限管理方法及其移动终端
CN105320952B (zh) 2015-10-15 2018-06-05 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法
CN106156767A (zh) 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071076A (ja) * 2006-09-13 2008-03-27 Oki Electric Ind Co Ltd 画像抽出装置
JP2008234291A (ja) * 2007-03-20 2008-10-02 Toshiba Corp 文字認識装置及び文字認識方法
WO2014195802A2 (en) * 2013-06-03 2014-12-11 Alipay.Com Co., Ltd Method and system for recognizing information
WO2015008732A1 (ja) * 2013-07-16 2015-01-22 株式会社湯山製作所 光学文字認識装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020527260A (ja) * 2018-06-15 2020-09-03 ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド テキスト検出分析方法、装置及びデバイス
CN109871845A (zh) * 2019-01-10 2019-06-11 平安科技(深圳)有限公司 证件图像提取方法及终端设备
JP2021531571A (ja) * 2019-01-10 2021-11-18 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co., Ltd. 証明書画像抽出方法及び端末機器
US11790499B2 (en) 2019-01-10 2023-10-17 Ping An Technology (Shenzhen) Co., Ltd. Certificate image extraction method and terminal device
CN109871845B (zh) * 2019-01-10 2023-10-31 平安科技(深圳)有限公司 证件图像提取方法及终端设备

Also Published As

Publication number Publication date
EP3425563B1 (en) 2021-06-23
US20180276493A1 (en) 2018-09-27
JP6485894B2 (ja) 2019-03-20
EP3425563A1 (en) 2019-01-09
AU2017226429A1 (en) 2017-11-23
WO2017148377A1 (zh) 2017-09-08
US10089553B1 (en) 2018-10-02
EP3425563A4 (en) 2019-10-23
CN106156767A (zh) 2016-11-23
SG11201800348YA (en) 2018-02-27
KR102152191B1 (ko) 2020-09-07
KR20180117596A (ko) 2018-10-29
AU2017226429B2 (en) 2019-10-10

Similar Documents

Publication Publication Date Title
JP6485894B2 (ja) 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体
US10191889B2 (en) Systems, apparatuses and methods for generating a user interface by performing computer vision and optical character recognition on a graphical representation
US10482174B1 (en) Systems and methods for identifying form fields
US9971929B2 (en) Fingerprint classification system and method using regular expression machines
Kumar et al. A dataset for quality assessment of camera captured document images
US11816138B2 (en) Systems and methods for parsing log files using classification and a plurality of neural networks
US11157816B2 (en) Systems and methods for selecting and generating log parsers using neural networks
US10560601B2 (en) Image processing method, image processing apparatus, and storage medium
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2013206187A (ja) 情報変換装置、情報検索装置、情報変換方法、情報検索方法、情報変換プログラム、情報検索プログラム
US20230360354A1 (en) Detection of annotated regions of interest in images
CN112036145A (zh) 财务报表的识别方法、装置、计算机设备与可读存储介质
Malakar et al. An image database of handwritten Bangla words with automatic benchmarking facilities for character segmentation algorithms
CN115205866A (zh) 一种基于区块链的科技论文大数据抄袭检测方法及系统
CN110688998A (zh) 票据识别方法及装置
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
KR101660476B1 (ko) 인쇄 결제카드에서 결제 정보를 인식하는 방법
CN109840461B (zh) 一种基于动态虹膜图像的识别方法及装置
EP3640861A1 (en) Systems and methods for parsing log files using classification and a plurality of neural networks
JP2020047138A (ja) 情報処理装置
JP4328511B2 (ja) パターン認識装置、パターン認識方法、プログラムおよび記憶媒体
CN116524525A (zh) 表格处理方法、装置、系统及存储介质
CN115620296A (zh) 一种权重式语义关联性后验的非显著性文字识别方法及装置
JP4594765B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体
CN114882507A (zh) 文档图像信息结构化处理方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180511

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180511

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190214

R150 Certificate of patent or registration of utility model

Ref document number: 6485894

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250