JP2018533808A

JP2018533808A - 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体

Info

Publication number: JP2018533808A
Application number: JP2018524786A
Authority: JP
Inventors: 健宗王; 銘劉; 京肖
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2016-03-02
Filing date: 2017-02-28
Publication date: 2018-11-15
Anticipated expiration: 2037-02-28
Also published as: EP3425563B1; US20180276493A1; JP6485894B2; EP3425563A1; AU2017226429A1; WO2017148377A1; US10089553B1; EP3425563A4; CN106156767A; SG11201800348YA; KR102152191B1; KR20180117596A; AU2017226429B2

Abstract

運転免許証有効期限自動抽出方法であって、運転免許証の画像ファイルの候補輪郭領域を抽出し、候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを単一文字ブロックに分割するステップと、、前記候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列するステップと、単一文字ブロックに対応する文字を識別するステップと、前記配列に基づき、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、前記文字列中の時間データを抽出し、該時間データを該輪郭領域の年度審査の有効期限とするステップとを含む。本発明は、上記運転免許証有効期限自動抽出方法に適用する装置、システム及び記憶媒体をさらに提供する。本発明によれば、転免許証の年度審査の有効期限が自動的に抽出される。

Description

本出願は、２０１６年３月２日に出願され、「運転免許証有効期限自動抽出方法、サーバー、端末装置」と題された中国特許出願第２０１６１０１１９４７４．７号の優先権を主張し、その全体の内容が参照により本明細書に組み込まれている。

本発明は、データ処理分野に関するものであり、運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体に関するものである。

車両保険業務及び車両賠償業務に対して、運転免許証の年度審査（毎年の検査）の有効期限は、重要な審査事項である。しかし、自然環境で運転免許証に対して年度審査の有効期限を抽出することは、多くの挑戦に臨み、例えば、１）光の強さと不均一な分布が運転免許証の画像ファイルは、細部がはっきりと表示できなく、ひいては影を形成し、この両方で目標領域を位置決めることに対して大きな干渉を引き起こす。２）運転免許証の解像度は目標領域の抽出を行うことにも影響を与え、いくつかの運転免許証の表面が汚れたので、近い距離で観察しても識別できない。３）運転免許証は、よく複数の年度審査の記録に同時に現れ、且つ各記録は時間の順序に従って配列されず、このようにユーザーが全ての記録を識別し、その中から最新の年度審査の記録を探し出す必要がある。

本発明は、上記したような従来の技術において、前記問題点を解決するためになされたものであり、運転免許証の年度審査の有効期限が自動的に抽出される運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体を提供することにその目的がある。

運転免許証有効期限自動抽出方法は、
運転免許証の画像ファイルを取得するステップと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップと、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列するステップと、
前記単一文字ブロックに対応する文字を識別するステップと、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成するステップと、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とするステップと、を備える。

記憶装置及び処理器を備える運転免許証有効期限自動抽出装置は、前記記憶装置が、運転免許証有効期限自動抽出システムを格納することに用いられ、前記処理器は、前記運転免許証有効期限自動抽出システムを実行する。すなわち、
運転免許証の画像ファイルを取得し、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、
選択された候補輪郭領域の中の各文字輪郭を抽出し、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割され、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列し、
前記単一文字ブロックに対応する文字を識別し、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とする。

運転免許証有効期限自動抽出システムは、
運転免許証の画像ファイルを取得することに用いられる画像ファイル取得モジュールと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる領域選択モジュールと、
選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる文字抽出モジュールと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されることに用いられる文字分割モジュールと、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列することに用いられる配列モジュールと、
前記単一文字ブロックに対応する文字を識別することに用いられる文字識別モジュールと、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とすることに用いられる有効期限確認モジュールと、を備える。

コンピュータ読み取り可能なコマンドを格納している不揮発性の運転免許証有効期限自動抽出記憶媒体は、コンピュータ読み取り可能なコマンドが一つ又は複数の処理器によって以下のステップを実行する。すなわち、
運転免許証の画像ファイルを取得し、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、
選択された候補輪郭領域の中の各文字輪郭を抽出し、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割され、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列し、
前記単一文字ブロックに対応する文字を識別し、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、
前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とする。

本発明の運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体は、運転免許証における年度審査の有効期限を効果的に抽出でき、且つ運転免許証における年度審査の有効期限が複数である場合、最新の年度審査の有効期限を抽出でき、作業効率を向上させるという効果を奏することができる。

本発明に係る運転免許証有効期限自動抽出システムの第一の好ましい実施形態のハードウェア環境図である。本発明に係る運転免許証有効期限自動抽出システムの第二の好ましい実施形態のハードウェア環境図である。本発明に係る運転免許証有効期限自動抽出システムの好ましい実施形態のブロック図である。本発明に係る運転免許証有効期限自動抽出方法の好ましい実施形態のフローチャートである。図４に係る運転免許証有効期限自動抽出方法の好ましい実施形態の選択された候補輪郭領域の中の各文字輪郭を抽出する詳しい実施フローチャートである。一つの極値領域から構築された一つの樹形の組織を示す図である。

本実施形態において、前記運転免許証有効期限自動抽出システム１０は、電子装置に搭載して実行されている。前記電子装置は、本発明の技術的な目的を達成できるいずれかの装置であり、例えば、サーバー又は端末装置である。いくつかの実施形態において、電子装置は、処理器及び記憶装置を備え、前記処理器はコアユニット（ＣｏｒｅＵｎｉｔ）及びコントロールユニット（ＣｏｎｔｒｏｌＵｎｉｔ）であり、コンピュータの命令を読み取り、コンピュータソフトウェアのデータを処理することに用いられる。記憶装置は、内蔵メモリと不揮発性記憶媒体を備える。なお、不揮発性記憶媒体には、オペレーティングシステム、データベース及び運転免許証有効期限自動抽出システム１０が格納されている。内蔵メモリは、オペレーティングシステム、データベース及び運転免許証有効期限自動抽出システム１０に高速なキャッシュの実行環境を提供する。いくつかの実施形態において、運転免許証有効期限自動抽出システム１０は、少なくとも1つのコンピュータ実行可能プログラム命令コードを含む。前記少なくとも1つのコンピュータ実行可能プログラム命令コードは、処理器によって実行されて本実施形態の運転免許証有効期限自動抽出方法を実現することができる。前記方法の具体的なステップは後続の内容を参照する。

不揮発性記憶媒体は、プログラム可能読み出し専用メモリ（ＰＲＯＭ）、消去可能・プログラム可能の読み出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能読み出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュメモリなどのような読み出し専用メモリ（ＲＯＭ）を含み、ＵＳＢフラッシュディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、磁気ディスク、光ディスクなどのようなコードを格納するための各種の媒体であることができる。

この技術分野の技術者が理解できることであるが、上述した電子装置に対する記述は、本実施形態の電子装置の限定を構成するものではない。具体的に、処理器及び記憶装置以外他の部品も含んで対応する機能を実現し、例えば、ユーザーインターフェース、入力装置、出力装置、ネットワークインターフェース等々である。

上述したように、いくつかの実施形態において、装置はサーバーに搭載される。図１に示すように、前記サーバーは、クラウドサーバー１である。前記クラウドサーバー１は、通信モジュール（図示せず）を介して一つの又は複数の端末装置２に通信可能に接続される。前記端末装置２は、パソコン、スマート携帯電話、タブレットパソコンなどのような装置である。運転免許証有効期限自動抽出システム１０は、記憶装置に記憶されているコンピュータ実行可能プログラム命令コードを備える。処理器はこちらのプログラム命令コードを実行することによって下記の機能を実現する。クラウドサーバー１は、端末装置２から運転免許証の画像ファイル２０を受信し、前記画像ファイル２０の候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択し、選択した各候補輪郭領域から文字輪郭を一つずつ抽出する。選択された候補輪郭領域の全ての文字輪郭が抽出された後、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割される。本実施形態において、各文字ブロックの分割方法は、文字輪郭の最小の外接矩形及び原画像ファイル２０をマスクとして、例えば、文字輪郭領域に属する領域を不変に保持させる一方、残りの領域は、全て黒い背景に設定され、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離することとすることができる。

さらに、前記運転免許証有効期限自動抽出システム１０は、選択された候補輪郭領域の各単一文字ブロックに対応する文字を識別し、前記候補輪郭領域の各文字ブロックの横座標の大小に基づいて、前記候補輪郭領域の各文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列され、識別された各文字を対応する単一文字ブロックの配列順序に従って配列し、年度審査を表す文字列を形成し、且つ前記文字列の中の時間部分（例えば、年及び月である）を抽出して前記候補輪郭領域の年度審査の有効期限のテキスト形式で表示する。例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が１つの数字だけの場合があるであるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を１つの文字にして年度審査の有効期限を形成する。

本発明の中の１つの実施形態において、一つだけの候補輪郭領域の年度審査の有効期限が抽出された場合、前記年度審査の有効期限を前記画像ファイル２０に対応する最新の年度審査の有効期限とする。本発明の他の実施形態において、複数の候補輪郭領域の年度審査の有効期限が抽出された場合、前記運転免許証有効期限自動抽出システム１０は、各年度審査の有効期限の日付の大小を比較し、日付が最大である年度審査の有効期限を前記画像ファイル２０に対応する最新の年度審査の有効期限とする。例えば、各年度審査の有効期限は1つの文字列のリストに格納され、時間比較関数を定義することによって二つの日付の大小を比較し、左の日付が右の日付より大きい場合、‐１と出力し、等しい場合、０と出力し、さもなければ、１と出力する。比較関数によって該リストの中の時間文字列が降順に従って配列された後の最上面に位置する文字列を最新の年度審査の有効期限とする。

本発明の他の実施形態において、電子装置は、端末装置２であることができる。図２に示すように、前記端末装置２は、パソコン、スマート携帯電話、タブレットパソコンなどのような装置である。前記端末装置２は、運転免許証を撮影するための撮影装置を有する。本実施形態において、前記運転免許証有効期限自動抽出システム１０は、端末装置２の記憶装置に格納されているコンピュータ実行可能プログラム命令コードを含む。撮影装置によって取得された画像ファイルを受信した後、端末装置２の処理器は、こちらのプログラム命令コードを実行して本実施形態によって提供される運転免許証有効期限自動抽出方法を実現する。

図３に示すように、本発明に係る運転免許証有効期限自動抽出システムの好ましい実施形態のブロック図である。

前記運転免許証有効期限自動抽出システム１０のプログラムコードは、異なる機能に基づいて複数の機能モジュールに分割される。本発明の好ましい実施形態において、前記運転免許証有効期限自動抽出システム１０は、画像ファイル取得モジュール１００と、領域選択モジュール１０１と、文字抽出モジュール１０２と、文字分割モジュール１０３と、配列モジュール１０４と、文字識別モジュール１０５と、有効期限確認モジュール１０６と、を備える。

前記画像ファイル取得モジュール１００は、端末装置２から運転免許証の画像ファイル２０を取得することに用いられる。前記端末装置２は、走査、撮影などのような方式によって運転免許証の画像ファイル２０を取得することができる。

領域選択モジュール１０１は、輪郭抽出ルールに従って前記画像ファイル２０の候補輪郭領域を抽出し、選択分類ルールに従って抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる。

本実施形態において、前記輪郭抽出ルールは、例えば、ＭＳＥＲ（ＭａｘｉｍａｌｌｙＳｔａｂｌｅＥｘｔｒｅｍａｌＲｅｇｉｏｎｓ、最大安定極値領域）アルゴリズムを用いて前記画像ファイル２０の各種の情報の輪郭領域を抽出し、抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とすることができる。ここで、説明する必要があることは、縦横比が設定範囲内にある輪郭領域は候補輪郭領域として抽出されるため、目標とする年度審査の有効期限領域を正確に位置決めることができる。観察によって運転免許証のフォーマットは固定されており、年度審査の有効期限の縦横比は、約１０：１であり、従って、前記設定範囲は、年度審査の有効期限の関連する幾何学的特性に基づいて確認され、わずかな変動閾値を設定することによって、例えば、９．５：１と１０．５：１との間にあり、縦横比がこの範囲内の領域にある領域も年度審査の有効期限の領域である。このステップの示唆ルールを使用することによって約５０％の候補輪郭領域を減少することができるが、示唆ルールを使用しない場合、多くの無関連な輪郭領域を抽出するので、こちらの領域は、後続の処理の難しさ及び計算量を増加させる。

説明する必要があることは、ＭＳＥＲアルゴリズムの原理は、一連の等級グレースケール閾値（例えば、７５、１０５、１３５、１６５、１９５、．．．．．．）を用いて画像ファイル２０を２値化し、各閾値によって得られる２値画像に基づいてそれに対応する黒色領域及び白色領域を得、広いグレースケール閾値範囲で形状を安定に保持させる領域は最大安定極値領域である。ここで、前記極値領域ＥＲは、以下のように定義される。１つの連結領域（該領域内で間断点がない）がＲ（Ｒｅｇｉｏｎの最初の文字）と略称され、以下の条件を満たし、該領域内の任意の１つのＲｉ点と境界点Ｒｂ点における以下の不等式が成立し、Ф（Ｒｉ）＞Ф（Ｒｂ）、ここで、Ф（Ｒｉ）は点Ｒｉの画素値を表し、Ф（Ｒｂ）は点Ｒｂの画素値を表す。この不等式の直接的な意味は、１つの領域内の全ての点の画素値が領域境界又は領域境界外の点の画素値より常に大きいことであり、この特性に適合する領域はＥＲ（極値領域、画像の一部分範囲内で周囲領域に対してより大きな画素値から集合して形成される領域）と呼ばれる。１つのグレースケール画像は、二値化閾値の変換によって多くのＥＲを生成することができる。こちらのＥＲは、ＥＲを生成する時に使用された二値化閾値の大小に応じて樹形の組織に構築され、ＥＲ樹と呼ばれる。図６に示すように、各二値化閾値に応じて生成されたＥＲは、ＥＲ樹の同じレベルに位置し、次のレベルの二値化閾値（各レベルごとの二値化閾値の間にある値（例えば、３０）がある）は、現在のレベルのＥＲを２値化して次のレベルのＥＲを形成する。最高のレベルのＥＲを形成する二値化閾値は最も小さく、次に、上から下に向かって樹の葉ノードに至り、二値化閾値が徐々に増大する。マルチレベル二値化処理によって形成されたＥＲを介して形成される樹状構造は、二値化閾値ごとに、いくつかのＥＲ（極値領域）を形成した後１つのレベルのＥＲを構成し、次のレベルの二値化閾値を使用して現在の二値化閾値によって形成されたＥＲに対して２値化して樹の中の次のレベルのＥＲを形成し、マルチレベル閾値は、第一レベルで２０〜８０のような小さな閾値を指定し、レベルごとにある増量（例えば、３０であり、前記増量が大き過ぎるか又は小さ過ぎるべきではなく、２０と３０との間が良い）に従って閾値を増加する。図６の中のブロック領域の大小は実際な面積値の大小を反映し、Ａｒｅａは該領域の面積を表す。樹のＥＲの関連は、同じレベルの二値化閾値によって形成されたＥＲが、同じレベルに位置し、大きな二値化閾値によって形成されたＥＲは、樹の次のレベルに位置する。即ち、次のレベルのＥＲは、現在のレベルのＥＲの次のレベルのノードである。樹の中の経路は、ＥＲの形成関係（上下レベル関係）に従ってＥＲ樹を遍歴することである。ＥＲ樹を介してＥＲの安定性値ｖａｒｉａｔｉｏｎを定義し、この値は以下の公式を介して得られる。

ここで、δはパラメーターであり、ＥＲ樹にある二つのＥＲの間に隔たっているノードの数量を測定することに用いられ、既定値は５に設定される。｜ＥＲ_ｔ｜は、ｔ番目のＥＲの面積を表す。｜ＥＲ_ｔ+δ｜は、ｔ番目のＥＲとδ個の距離で隔たっているＥＲの面積を表す。ＥＲ樹の全ての経路（樹のノードの従属関係に沿ってアクセスする）において、ｖａｒｉａｔｉｏｎ値が最も小さいＥＲは、最も安定なＥＲと呼ばれ、即ち、面積が閾値変化に敏感でない領域である。

本実施形態において、前記選択分類ルールは、例えば、抽出された候補輪郭領域を訓練された第一深層畳み込みニューラルネットワーク（ＤｅｅｐＣｏｎｖＮｅｔ）モデルに入力することとすることができる。選択精度を保証するために、前記第一深層畳み込みニューラルネットワークモデルは、１つの入力層と２１層の畳み込み層と二つの分類層が含まれている２３層モデル構造を採用し、ここで、入力層は層の合計に計算されない。前記第一深層畳み込みニューラルネットワークモデルは、大量の年度審査の有効期限が含まれる輪郭領域及び年度審査の有効期限が含まれない輪郭領域に基づいて訓練された。前記第一深層畳み込みニューラルネットワークモデルを利用して前記候補輪郭領域における年度審査の有効期限が含まれる確信度（即ち、確率）を判定する。前記候補輪郭領域における年度審査の有効期限が含まれる確信度が予め設定された閾値（例えば、８５％）より大きい場合、前記候補輪郭領域を年度審査の有効期限が含まれる候補輪郭領域とする。

前記文字抽出モジュール１０２は、選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる。

本実施形態において、前記文字抽出モジュール１０２は、以下の方法に従って各文字輪郭を抽出する：Ａ、候補輪郭領域を単一チャネルのグレースケール画像に変換する。Ｂ、大津の閾値法（判別分析法）を採用してグレースケール画像を２値化し、グレースケール画像のグレースケール変化範囲０〜２５５を二値領域０〜１に変換することによって、大部分の干渉背景を削除する。Ｃ、輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、例えば、前記輪郭抽出関数はｆｉｎｄｃｏｎｔｏｕｒｓ関数とすることができる。Ｄ、予め設定された高さ及び予め設定された幅を有する輪郭を選択し、ここで、前記予め設定された高さは例えば３３とすることができ、また、前記予め設定された幅は例えば２０とすることができる。Ｅ、選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、例えば、選択した輪郭の数量は１０であり、選択した輪郭の数量が予め設定された数量と等しくない場合、Ｆ、予め設定された高さ及び／又は予め設定された幅を予め設定された大きさ（例えば、１）に従って逓増するか又は逓減し、例えば、予め設定された高さを３４に調整し、及び／又は、予め設定された幅を２１に調整し、上述したステップＤを実行する。

上述したステップＤ、Ｅ、Ｆの目的は、文字分割を更に正確にすることである。一般的に、年度審査の有効期限における漢字と英文字がほぼ同じ高さ及び最小の幅を有し、高さ及び幅の二つの閾値条件に従って無関係な輪郭を削除する。同時に、各文字輪郭が算出された後に、年度審査の有効期限欄の文字の文字数が比較的固定であるため、年度審査の有効期限の文字輪郭の数量を統計することによってこの分割が成功したかどうかを判定することができる。文字輪郭の数量が間違った場合、３５のような他の文字高さ閾値と２２のような他の幅閾値を試すことによって正しい数量の文字輪郭を分割する必要がある。

前記文字分割モジュール１０３は、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割することに用いられる。例えば、文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、例えば、文字輪郭領域に属する領域は不変で保持させる一方、残りの領域は、全て黒い背景に設定し、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離する。

前記配列モジュール１０４は、選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列することに用いられる。具体的に、前記配列モジュール１０４は、選択された候補輪郭領域の各単一文字ブロックの横座標の大小に基づいて、選択された候補輪郭領域の各単一文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列される。

前記文字識別モジュール１０５は、文字識別ルールに従って前記単一文字ブロックに対応する文字を識別することに用いられる。

本実施形態において、前記文字識別ルールは、分割された各単一文字ブロックを、訓練された第二深層畳み込みニューラルネットワーク（ＤｅｅｐＣｏｎｖＮｅｔ）モデルに入力することとすることができる。第二深層畳み込みニューラルネットワークモデルは、１１層モデル構造を採用するため、計算時間及び計算資源を考慮し、数回の試行で識別精度を保証できることが分かる。前記第二深層畳み込みニューラルネットワークモデルは、１つの入力層と１０層の畳み込み層と１つの分類層を含み、ここで、入力層は層の合計に計算されない。前記第二深層畳み込みニューラルネットワークモデルは、大量の各種の単一文字ブロックに基づいて訓練される。前記第二深層畳み込みニューラルネットワークモデルを利用して分割された各単一文字ブロックに対応する文字を識別する。ＤｅｅｐＣｏｎｖＮｅｔは、まず入力された単一文字ブロックから畳み込み層を介して分類特性を抽出し、抽出した分類特性を最後の層の多重層パーセプトロン（ＭｕｌｔｉｐｌｅＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ、ＭＬＰ）分類層に入力して分類する。全体の分類は７６個の類別があり、年／度／審／査／の／有／効／期／限／年／月／日／（／）のような１４個の不変の文字と、１０個の数字と、２５個の英語の大文字、３１の省の略称を含み、分類層から出力された対応する数字は、現在の文字がどの文字類別に分類されるかを表す。

有効期限確認モジュール１０６は、前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、前記時間データを前記輪郭領域の年度審査の有効期限とすることに用いられる。

本実施形態において、前記有効期限確認モジュール１０６は、前記候補輪郭領域によって形成された文字列の最初から数えて６個の文字が予め設定された文字列であるかどうかを判定し、例えば、「年度審査の有効期間」、１５番目の文字は第一の予め設定された文字であるかどうかを判定し、例えば、「年」、後ろから数えて４番目の文字は第二の予め設定された文字であるかどうかを判定し、例えば、「（」、及び最後の文字は第三予め設定された文字であるかどうかを判定し、例えば、「）」、識別された文字列が有効かどうかを判定する。

本実施形態において、以下の方法を用いて前記文字列の時間データを抽出し、例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が１つの数字だけの場合があるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を１つの文字列にし、このようにして年度審査の有効期限の時間データが抽出される。

図４に示すように、本発明に係る運転免許証有効期限自動抽出方法の好ましい実施形態のフローチャートである。フローチャートに示すようなステップを限定するものではないことを理解できる。そのフローチャートに示すステップの中のあるステップは省略でき、ステップの間の手順も変更することができる。

ステップＳ１０：画像ファイル取得モジュール１００は、端末装置２から運転免許証の画像ファイル２０を取得する。

ステップＳ１１：領域選択モジュール１０１は、輪郭抽出ルールに従って前記画像ファイル２０の候補輪郭領域を抽出し、選択分類ルールに従って抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択する。

本実施形態において、前記輪郭抽出ルールは、例えば、ＭＳＥＲ（ＭａｘｉｍａｌｌｙＳｔａｂｌｅＥｘｔｒｅｍａｌＲｅｇｉｏｎｓ、最大安定極値領域）アルゴリズムを用いて前記画像ファイル２０の各種の情報の輪郭領域を抽出し、抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とすることができる。ここで、説明する必要があることは、縦横比が設定範囲内にある輪郭領域は候補輪郭領域として抽出されるため、目標とする年度審査の有効期限領域を正確に位置決めることができる。観察によって運転免許証のフォーマットは固定されており、年度審査の有効期限の縦横比は、約１０：１である。従って、前記設定範囲は、年度審査の有効期限の関連する幾何学的特性に基づいて確認され、わずかな変動閾値を設定することによって、例えば、９．５：１と１０．５：１との間にあり、縦横比がこの範囲内の領域にある領域も年度審査の有効期限の領域である。このステップの示唆ルールを使用することによって約５０％の候補輪郭領域を減少することができるが、示唆ルールを使用しない場合、多くの無関連な輪郭領域を抽出するので、こちらの領域は、後続の処理の難しさ及び計算量を増加させる。

説明する必要があることは、ＭＳＥＲアルゴリズムの原理は、一連の等級グレースケール閾値（例えば、７５、１０５、１３５、１６５、１９５、．．．．．．）を用いて画像ファイル２０を２値化し、各閾値によって得られる２値画像に基づいてそれに対応する黒色領域及び白色領域を得、広いグレースケール閾値範囲で形状を安定に保持させる領域は最大安定極値領域である。ここで、前記極値領域ＥＲは、以下のように定義される。１つの連結領域（該領域内で間断点がない）がＲ（Ｒｅｇｉｏｎの最初の文字）と略称され、以下の条件を満たし、該領域内の任意の１つのＲｉ点と境界点Ｒｂ点における以下の不等式が成立し、Ф（Ｒｉ）＞Ф（Ｒｂ）、ここで、Ф（Ｒｉ）は点Ｒｉの画素値を表し、Ф（Ｒｂ）は点Ｒｂの画素値を表す。この不等式の直接的な意味は、１つの領域内の全ての点の画素値が領域境界又は領域境界外の点の画素値より常に大きいことであり、この特性を適合する領域はＥＲ（極値領域、画像の一部分範囲内で周囲領域に対してより大きな画素値から集合して形成される領域）と呼ばれる。１つのグレースケール画像は、二値化閾値の変換によって多くのＥＲを生成することができる。こちらのＥＲは、ＥＲを生成する時に使用された二値化閾値の大小に応じて樹形の組織に構築され、ＥＲ樹と呼ばれる。図６に示すように、各二値化閾値に応じて生成されたＥＲは、ＥＲ樹の同じレベルに位置し、次のレベルの二値化閾値（各レベルごとの二値化閾値の間にある値（例えば、３０）がある）は、現在のレベルのＥＲを２値化して次のレベルのＥＲを形成する。最高のレベルのＥＲを形成する二値化閾値は最も小さく、次に、上から下に向かって樹の葉ノードに至り、二値化閾値が徐々に増大する。マルチレベル二値化処理によって形成されたＥＲを介して形成される樹状構造は、二値化閾値ごとに、いくつかのＥＲ（極値領域）を形成した後１つのレベルのＥＲを構成し、次のレベルの二値化閾値を使用して現在の二値化閾値によって形成されたＥＲに対して２値化して樹の中の次のレベルのＥＲを形成し、マルチレベル閾値は、第一レベルで２０〜８０のような小さな閾値を指定し、レベルごとにある増量（例えば、３０であり、前記増量が大き過ぎるか又は小さ過ぎるべきではなく、２０と３０との間が良い）に従って閾値を増加する。図６の中のブロック領域の大小は実際の面積値の大小を反映し、Ａｒｅａは該領域の面積を表す。樹のＥＲの関連は、同じレベルの二値化閾値によって形成されたＥＲは、同じレベルに位置し、大きな二値化閾値によって形成されたＥＲは、樹の次のレベルに位置する。即ち、次のレベルのＥＲは、現在のレベルのＥＲの次のレベルのノードである。樹の中の経路は、ＥＲの形成関係（上下レベル関係）に従ってＥＲ樹を遍歴することである。ＥＲ樹を介してＥＲの安定性値ｖａｒｉａｔｉｏｎを定義し、この値は以下の公式を介して得られる。

ここで、δはパラメーターであり、ＥＲ樹にある二つのＥＲの間に隔たっているノードの数量を測定することに用いられ、既定値は５に設定される。｜ＥＲ_ｔ｜は、ｔ番目のＥＲの面積を表す。｜ＥＲ_ｔ+δ｜は、ｔ番目のＥＲの間にδ個の距離があって隔たっているＥＲの面積を表す。ＥＲ樹の全ての経路（樹のノードの従属関係に沿ってアクセスする）において、ｖａｒｉａｔｉｏｎ値が最も小さいＥＲは、最も安定なＥＲと呼ばれ、即ち、面積が閾値変化に敏感でない領域である。

ステップＳ１２：文字抽出モジュール１０２は、選択された候補輪郭領域の中の各文字輪郭を抽出する。本ステップの詳しい実施フローチャートは、下記の図５の説明を参照する。

ステップＳ１３：文字分割モジュール１０３は、選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割する。

本実施形態において、文字分割モジュール１０３は、文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、例えば、文字輪郭領域に属する領域を不変に保持させる一方、残りの領域は、全ての黒い背景に設定され、各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離する。

ステップＳ１４：配列モジュール１０４は、選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列する。

具体的に、前記配列モジュール１０４は、選択された候補輪郭領域の各単一文字ブロックの横座標の大小に基づいて、選択された候補輪郭領域の各単一文字ブロックを配列する。例えば、横座標が小から大に至る順序に従って左から右に向かって配列される。

ステップＳ１５：文字識別モジュール１０５は、文字識別ルールに従って前記単一文字ブロックに対応する文字を識別する。

本実施形態において、前記文字識別ルールは、分割された各単一文字ブロックを訓練された第二深層畳み込みニューラルネットワーク（ＤｅｅｐＣｏｎｖＮｅｔ）モデルに入力することとすることができる。第二深層畳み込みニューラルネットワークモデルは、１１層モデル構造を採用するため、計算時間及び計算資源を考慮し、数回の試行で識別精度を保証できることが分かる。前記第二深層畳み込みニューラルネットワークモデルは、１つの入力層と１０層の畳み込み層と１つの分類層を含み、ここで、入力層は層の合計に計算されない。前記第二深層畳み込みニューラルネットワークモデルは、大量の各種の単一文字ブロックに基づいて訓練される。前記第二深層畳み込みニューラルネットワークモデルを利用して分割された各単一文字ブロックに対応する文字を識別する。ＤｅｅｐＣｏｎｖＮｅｔは、まず入力された単一文字ブロックから畳み込み層を介して分類特性を抽出し、抽出した分類特性を最後の層の多重層パーセプトロン（ＭｕｌｔｉｐｌｅＬａｙｅｒＰｅｒｃｅｐｔｒｏｎ、ＭＬＰ）分類層に入力して分類する。全体の分類は７６個の類別があり、年／度／審／査／の／有／効／期／限／年／月／日／（／）のような１４個の不変の文字と、１０個の数字と、２５個の英語の大文字、３１の省の略称を含み、分類層から出力された対応する数字は、現在の文字がどの文字類別に分類されるかを表す。

ステップＳ１６：有効期限確認モジュール１０６は、前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成する。

ステップＳ１７：有効期限確認モジュール１０６は、識別された文字列が有効かどうかを判定する。

本実施形態において、前記有効期限確認モジュール１０６は、前記候補輪郭領域によって形成された文字列の最初から数えて６個の文字が予め設定された文字列であるかどうかを判定し、例えば、「年度審査の有効期間」、１５番目の文字は第一の予め設定された文字であるかどうかを判定し、例えば、「年」、後ろから数えて４番目の文字は第二の予め設定された文字であるかどうかを判定し、例えば、「（」、及び最後の文字は第三の予め設定された文字であるかどうかを判定し、例えば、「）」、識別された文字列が有効かどうかを判定する。

識別された文字列が無効である場合、文字抽出モジュール１０２は、予め設定された高さ及び／又は予め設定された幅を予め設定された長さ（例えば、１）に従って逓増するか又は逓減し、上述したステップＳ１２に戻る。

識別された文字列が有効である場合、以下のステップＳ１８を実行する。

ステップＳ１８：前記有効期限確認モジュール１０６は、前記文字列の時間データを抽出し、例えば、まず文字「年」のインデックスの位置を探し、その前の四つの文字を抽出すると年を得る。次に文字「月」のインデックスの位置を探し、その前端の二つの文字を抽出する。月が１つの数字だけの場合があるので、抽出された月の最初の文字が数字であるかどうかを判定する必要がある。最後に、抽出された年月を１つの文字列にして、このように年度審査の有効期限の時間データが抽出される。

ステップＳ１９：前記文字分割モジュール１０３は、他の選択された候補輪郭領域の中の全ての文字輪郭が選択されるかどうかを判定する。他の選択された候補輪郭領域の中の全ての文字輪郭が選択される場合、上述したステップＳ１３に戻る。他の選択された候補輪郭領域の中の全ての文字輪郭が選択されない場合、下記のステップＳ２０を実行する。

ステップＳ２０：前記有効期限確認モジュール１０６は、抽出された1つ又は複数の選択された候補輪郭領域の中の年度審査の有効期限における最近の年度審査の有効期限を計算し、且つ前記最近の年度審査の有効期限を出力する。

本発明の中の実施形態において、1つだけの選択された候補輪郭領域の中の年度審査の有効期限が抽出された場合、年度審査の有効期限を画像に対応する最新の年度審査の有効期限とする。

本発明の中の他の実施形態において、複数の選択された候補輪郭領域の中の年度審査の有効期限が抽出された場合、前記有効期限確認モジュール１０６は、各年度審査の有効期限の日付の大小を比較し、日付が最も後ろに近い年度審査の有効期限を前記画像ファイル２０に対応する最新の年度審査の有効期限として、例えば、日付「２０１５年１２月」が日付「２０１５年１１月」より大きい場合、日付「２０１５年１２月」を最新の年度審査の有効期限とする。また、各年度審査の有効期限は1つの文字列のリストに格納され、時間比較関数を定義することによって二つの日付の大小を比較し、左の日付が右の日付より大きい場合、‐１と出力し、等しい場合、０と出力し、さもなければ、１と出力する。比較関数によって該リストの中の時間文字列が降順に従って配列された後の最上面に位置する文字列を最新の年度審査の有効期限とする。

図５に示すように、図４に係るステップＳ１２であり、選択された候補輪郭領域の中の各文字輪郭を抽出する詳しい実施フローチャートである。本実施形態の運転免許証有効期限自動抽出方法は、ブロック図に示すようなステップを限定するものではないことを理解できる。そのブロック図に示すステップの中のあるステップは省略でき、ステップの間の手順も変更することができる。

ステップＳ２１：前記文字抽出モジュール１０２は、選択された候補輪郭領域を単一チャネルのグレースケール画像に変換する。

ステップＳ２２：前記文字抽出モジュール１０２は、大津の閾値法（判別分析法）を採用してグレースケール画像を２値化し、グレースケール画像のグレースケール変化範囲０〜２５５を二値領域０〜１に変換して二値画像を得ることによって大部分の干渉背景を削除する。

ステップＳ２３：前記文字抽出モジュール１０２は、輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、例えば、前記輪郭抽出関数はｆｉｎｄｃｏｎｔｏｕｒｓ関数とすることができる。

ステップＳ２４：前記文字抽出モジュール１０２は、予め設定された高さ及び予め設定された幅を有する輪郭を選択し、ここで、前記予め設定された高さは例えば３３とすることができ、また、前記予め設定された幅は例えば２０とすることができる。

ステップＳ２５：前記文字抽出モジュール１０２は、選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、例えば、選択した輪郭の数量は１０であり、選択した輪郭の数量が予め設定された数量と等しくない場合、ステップＳ２６を実行する。

ステップＳ２６：前記文字抽出モジュール１０２は、予め設定された高さ及び／又は予め設定された幅を予め設定された長さ（例えば、１）に従って逓増するか又は逓減し、例えば、予め設定された高さを３４に調整し、及び／又は、予め設定された幅を２１に調整し、上述したステップＳ２４を実行する。

選択した輪郭の数量が予め設定された数量と等しい場合、プロセスを終了する。

上述したステップＳ２４〜Ｓ２６の目的は、文字分割を更に正確にすることである。一般的に、年度審査の有効期限における漢字と英文字がほぼ同じ高さ及び最小の幅を有し、高さ及び幅の二つの閾値条件に従って無関係な輪郭を削除する。同時に、各文字輪郭が算出された後に、年度審査の有効期限欄の文字の文字数が比較的固定であるため、年度審査の有効期限の文字輪郭の数量を統計することによってこの分割が成功したかどうかを判定することができる。文字輪郭の数量が間違った場合、例えば３５のような他の文字高さ閾値と例えば２２のような他の幅閾値を試すことによって正しい数量の文字輪郭を分割する必要がある。

説明する必要があることは、上述した実施形態において、運転免許証の画像ファイルは端末装置によって提供されることを例として説明する。しかしながら、この技術分野の技術者が理解できることは、他の実施形態において、画像ファイルは、他の方式によって取得される。例えば、画像ファイルは、クラウドサーバー又はクラウドデータに格納されることができる。前記画像ファイルを取得する必要がある場合、ネットワークを介して前記画像ファイルを伝送することができる。勿論、他の実施形態において、この画像ファイルは、単独の記憶装置に格納されることができ、例えば、ＵＳＢフラッシュディスクである。前記画像ファイルを取得する必要がある場合、前記記憶装置から直接的に読み取ることができる。

理解できることは、上述した実施形態において、各ステップの番号の大小は実行順序を意味しない。各ステップの実行順序は、その機能と本質的な論理に基づいて確認され、本発明の実施形態の実施過程に限定されるものではない。

説明する必要があることは、この技術分野の技術者が理解できることは、上述した実施形態の方法の中の全体又は一部分のステップを実行することは、ハードウェアを命令して完成することができ、プログラムによってハードウェアを命令して完成することもできる。前記プログラムは、コンピュータ読み取り可能な記憶媒体に格納され、前記コンピュータ読み取り可能な記憶媒体は、磁気ディスク、光ディスク、読み取り専用メモリなどのような不揮発性記憶媒体であることができる。

最後に説明すべきであることは、以上の実施形態は、本発明の技術方案を説明するためだけであり、限定を構成するものではない。好ましい実施形態を参照して詳細に説明したが、この技術分野の技術者は、本発明の技術方案に対して様々な変更と同等の代替を行っても良く、本発明の精神と範囲を逸脱しないことを理解できる。

Claims

運転免許証有効期限自動抽出方法であって、
運転免許証の画像ファイルを取得するステップと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップと、
選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列するステップと、
前記単一文字ブロックに対応する文字を識別するステップと、
前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、
前記文字列の時間データを抽出し、前記時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、
を備えることを特徴とする運転免許証有効期限自動抽出方法。
前記輪郭抽出ルールは、
最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
を備えることを特徴とする請求項１に記載の運転免許証有効期限自動抽出方法。
選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
Ａ：前記選択された候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
Ｂ：大津の閾値法を採用してグレースケール画像を２値化して二値画像を得るステップと、
Ｃ：輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
Ｄ：予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
Ｅ：選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
Ｆ：選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び／又は予め設定された幅を予め設定された長さに従って、上述したステップＤを実行するステップと、
を備えることを特徴とする請求項１に記載の運転免許証有効期限自動抽出方法。
取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップは、
文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離するステップと、
を備えることを特徴とする請求項１に記載の運転免許証有効期限自動抽出方法。
記憶装置及び処理器を備える運転免許証有効期限自動抽出装置であって、
前記記憶装置は、運転免許証有効期限自動抽出システムを格納することに用いられ、
前記処理器は、前記運転免許証有効期限自動抽出システムを実行して、
運転免許証の画像ファイルを取得するステップと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割されるステップと、
各単一文字ブロックが選択された候補輪郭領域にある位置に基づいて単一文字ブロックを配列するステップと、
前記単一文字ブロックに対応する文字を識別するステップと、
前記配列に従って識別された文字を介して年度審査の有効期限を表す文字列を生成するステップと、
前記文字列の時間データを抽出し、前記時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、
を実行することに用いられることを特徴とする運転免許証有効期限自動抽出装置。
前記輪郭抽出ルールは、最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
を備えることを特徴とする請求項５に記載の運転免許証有効期限自動抽出装置。
選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
Ａ：候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
Ｂ：大津の閾値法を採用してグレースケール画像を２値化して二値画像を得るステップと、
Ｃ：輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
Ｄ：予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
Ｅ：選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
Ｆ：選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び／又は予め設定された幅を予め設定された長さに従って、上述したステップＤを実行するステップと、
を備えることを特徴とする請求項５に記載の運転免許証有効期限自動抽出装置。
取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップは、
文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離するステップと、
を備えることを特徴とする請求項５に記載の運転免許証有効期限自動抽出装置。
運転免許証有効期限自動抽出システムであって、
運転免許証の画像ファイルを取得することに用いられる画像ファイル取得モジュールと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、かつ、抽出した候補輪郭領域から、選択分類ルールに従って、年度審査の有効期限が含まれる候補輪郭領域を選択することに用いられる領域選択モジュールと、
選択された候補輪郭領域の中の各文字輪郭を抽出することに用いられる文字抽出モジュールと、
前記選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割することに用いられる文字分割モジュールと、
前記選択された候補輪郭領域における各単一文字ブロックの位置に基づいて単一文字ブロックを配列することに用いられる配列モジュールと、
前記単一文字ブロックに対応する文字を識別することに用いられる文字識別モジュールと、
前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成し、識別された文字列が有効である場合、前記文字列の時間データを抽出し、該時間データを輪郭領域の年度審査の有効期限とすることに用いられる有効期限確認モジュールと、
を備えることを特徴とする運転免許証有効期限自動抽出システム。
前記輪郭抽出ルールは、最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
を備えることを特徴とする請求項９に記載の運転免許証有効期限自動抽出システム。
前記文字抽出モジュールは、
選択された候補輪郭領域を単一チャネルのグレースケール画像に変換し、
大津の閾値法を採用してグレースケール画像を２値化して二値画像を得、
輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出し、
予め設定された高さ及び予め設定された幅を有する輪郭を選択し、
選択した輪郭の数量が予め設定された数量と等しいかどうかを解析し、
選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び／又は予め設定された幅を予め設定された長さに従って、上述したステップＤを実行することに用いられる
ことを特徴とする請求項９に記載の運転免許証有効期限自動抽出システム。
文字分割モジュールは、
文字輪郭の最小の外接矩形及び原画像ファイルをマスクとして、
各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確認し、且つそれを分離することに用いられる
ことを特徴とする請求項９に記載の運転免許証有効期限自動抽出システム。
コンピュータ読み取り可能なコマンドを格納している不揮発性の運転免許証有効期限自動抽出記憶媒体であって、前記コンピュータ読み取り可能なコマンドは一つ又は複数の処理器によって、
運転免許証の画像ファイルを取得するステップと、
輪郭抽出ルールに従って前記画像ファイルの候補輪郭領域を抽出し、抽出した候補輪郭領域から年度審査の有効期限が含まれる候補輪郭領域を選択するステップと、
選択された候補輪郭領域の中の各文字輪郭を抽出するステップと、
選択された候補輪郭領域の各文字輪郭の最小の外接矩形を取得し、取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップと、
前記選択された候補輪郭領域における各単一文字ブロックの位置に基づいて前記単一文字ブロックを配列するステップと、
前記単一文字ブロックに対応する文字を識別するステップと、
前記配列に従って、識別された文字を用いて年度審査の有効期限を表す文字列を生成するステップと、
前記文字列の時間データを抽出し、該時間データを前記選択された候補輪郭領域の年度審査の有効期限とするステップと、

を実行するために用いられることを特徴とする運転免許証有効期限自動抽出記憶媒体。
前記輪郭抽出ルールは、
最大安定極値領域アルゴリズムを用いて前記画像ファイルの各種の情報の輪郭領域を抽出するステップと、
抽出した輪郭領域から縦横比が設定範囲内にある輪郭領域を抽出して候補輪郭領域とするステップと、
を備えることを特徴とする請求項１３に記載の運転免許証有効期限自動抽出記憶媒体。
選択された候補輪郭領域の中の各文字輪郭を抽出するステップは、
Ａ：前記選択された候補輪郭領域を単一チャネルのグレースケール画像に変換するステップと、
Ｂ：大津の閾値法を採用してグレースケール画像を２値化して二値画像を得るステップと、
Ｃ：輪郭抽出関数を呼び出して二値画像の中の全ての輪郭を抽出するステップと、
Ｄ：予め設定された高さ及び予め設定された幅を有する輪郭を選択するステップと、
Ｅ：選択した輪郭の数量が予め設定された数量と等しいかどうかを解析するステップと、
Ｆ：選択した輪郭の数量が予め設定された数量と等しくない場合、予め設定された高さ及び／又は予め設定された幅を予め設定された長さに従って、上述したステップＤを実行するステップと、
を備えることを特徴とする請求項１３に記載の運転免許証有効期限自動抽出記憶媒体。
取得した最小の外接矩形の中のブロックを一つ一つ分割し、複数の単一文字ブロックに分割するステップは、
文字輪郭の最小の外接矩形及び原画像ファイルをマスクとするステップと、
各文字輪郭の最小の外接矩形から取得されたマスク領域を介して各文字が含まれるブロックを確定し、且つそれを分離するステップと、
を備えることを特徴とする請求項１３に記載の運転免許証有効期限自動抽出記憶媒体。