JP2009075892A - 証明書読取認識装置 - Google Patents

証明書読取認識装置 Download PDF

Info

Publication number
JP2009075892A
JP2009075892A JP2007244514A JP2007244514A JP2009075892A JP 2009075892 A JP2009075892 A JP 2009075892A JP 2007244514 A JP2007244514 A JP 2007244514A JP 2007244514 A JP2007244514 A JP 2007244514A JP 2009075892 A JP2009075892 A JP 2009075892A
Authority
JP
Japan
Prior art keywords
information
certificate
address
file
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007244514A
Other languages
English (en)
Other versions
JP5204448B2 (ja
Inventor
Toshinari Yonemura
俊成 米村
Hideto Henmoto
英人 辺本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2007244514A priority Critical patent/JP5204448B2/ja
Publication of JP2009075892A publication Critical patent/JP2009075892A/ja
Application granted granted Critical
Publication of JP5204448B2 publication Critical patent/JP5204448B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができ、住所情報の文字認識精度を向上させることができる、証明書読取認識装置を提供することを課題とする。
【解決手段】本発明は、画像読取装置に接続され、記憶部と制御部を少なくとも備え、住所情報を記憶する住所辞書ファイルを世代毎に蓄積し、住所辞書ファイルの世代情報とファイル名を対応付けて記憶し、画像読取装置を制御して、証明書の画像を読取り、読取られた証明書の画像データに基づいて、証明書に記載された少なくとも日付情報と、住所情報候補としての上記住所情報と、を文字認識し、認識された日付情報と記憶された世代情報とを比較して、当該日付情報に対応する世代の住所辞書ファイルのファイル名を取得し、ファイル名の住所辞書ファイルを住所知識として住所情報候補を照会し、証明書の住所情報の知識処理を行う。
【選択図】 図1

Description

本発明は、証明書読取認識装置に関し、特に、運転免許証を証明書として読取り文字認識する証明書読取認識装置に関する。
従来、スキャナ等により読み込まれた画像データから、OCR(Optical Character Recognition)技術等により文字データを取得する場合、まず文字単位の認識処理を行い、つぎに得られた候補文字の集合から知識データベース(知識辞書)等を用いて知識処理を行って、文字認識における認識精度を向上させる技術が用いられている。
ここで、最新の住所データベースを作成する方法として、特許文献1がある。特許文献1の方法は、郵便番号に対応する住所を示す住所録リストの更新を行うための方法であり、住所録リストのデータより郵便番号を検索キーとして最新郵便番号から住所データを読み出し、データを比較し、双方のデータに相違があれば、利用者に住所データの更新の要不要を入力させるよう表示する方法である。
特開平9−198450号公報
しかしながら、従来の文字認識技術においては、運転免許証等の証明書に記載された住所情報を取得する場合、知識処理に用いる住所辞書が証明書の作成時または発行時のものに対応しないため、文字認識精度が低下する、という問題がある。すなわち、証明書が作成された後、市町村の統廃合などにより住所表記が変更された場合、変更後の新しい住所辞書を知識処理に使用すると、住所辞書に存在しない住所に対して知識処理を実施することになり、誤った結果を返す場合がある、という問題点を有していた。
また、特許文献1の方法においては、知識処理に用いる住所辞書等を証明書作成時の住所表記に更新することができるが、証明書の異なるそれぞれの作成時点に対応する住所辞書を作成することができない、という問題がある。
本発明は、上記に鑑みてなされたもので、知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができ、住所情報の文字認識精度を向上させることができる証明書読取認識装置を提供することを目的とする。
このような目的を達成するため、請求項1に記載の証明書読取認識装置は、画像読取装置に接続され、記憶部と制御部を少なくとも備えた証明書読取認識装置であって、上記記憶部は、住所情報を記憶する住所辞書ファイルを世代毎に蓄積する住所情報蓄積手段と、上記住所辞書ファイルの世代情報とファイル名を対応付けて記憶する世代情報管理手段と、を備え、上記制御部は、上記画像読取装置を制御して、証明書の画像を読取るよう制御する画像読取手段と、上記画像読取手段によって読取られた上記証明書の画像データに基づいて、上記証明書に記載された少なくとも日付情報と、住所情報候補としての上記住所情報と、を文字認識する文字認識手段と、上記文字認識手段により文字認識された上記日付情報と、上記世代情報管理手段に記憶された上記世代情報と、を比較して、当該日付情報に対応する世代の上記住所辞書ファイルの上記ファイル名を取得するファイル名取得手段と、上記ファイル名取得手段により取得された上記ファイル名の上記住所辞書ファイルを住所知識として上記住所情報候補を照会し、上記証明書の上記住所情報の知識処理を行う知識処理手段と、を備えたことを特徴とする。
また、請求項2に記載の証明書読取認識装置は、請求項1に記載の証明書読取認識装置において、上記証明書は、運転免許証であり、上記記憶部は、上記運転免許証の運転免許証番号の上2桁に対応する都道府県名情報を記憶する都道府県名情報記憶手段、を更に備え、上記文字認識手段は、上記運転免許証に記載された上記運転免許証番号を更に文字認識し、上記制御部は、上記文字認識手段により文字認識された上記運転免許証番号の上2桁に基づいて、上記都道府県名情報記憶手段に記憶された対応する上記都道府県名情報を取得する都道府県名情報取得手段、を更に備え、上記知識処理手段は、上記都道府県名情報取得手段により取得された上記都道府県名情報を、上記住所情報候補を照会する際の知識処理に用いること、を特徴とする。
また、請求項3に記載の証明書読取認識装置は、請求項1に記載の証明書読取認識装置において、上記証明書は、運転免許証であり、上記文字認識手段は、上記運転免許証の都道府県公安委員会の欄に記載された都道府県名情報を更に文字認識し、上記知識処理手段は、上記文字認識手段により文字認識された上記都道府県名情報を、上記住所情報候補を照会する際の知識処理に用いること、を特徴とする。
また、請求項4に記載の証明書読取認識装置は、請求項1乃至3のいずれか一つに記載の証明書読取認識装置において、上記制御部は、上記画像読取手段によって読取られた上記画像データに基づいて、上記住所情報、上記日付情報、上記運転免許証番号、または、上記都道府県名情報が記載された欄のレイアウトを認識し、認識した上記レイアウトに基づいて上記文字認識手段により文字認識されるよう制御するレイアウト認識手段、を更に備えたことを特徴とする。
また、請求項5に記載の証明書読取認識装置は、請求項1乃至4のいずれか一つに記載の証明書読取認識装置において、上記知識処理手段により知識処理された上記証明書の上記住所情報に基づいて、対応する新住所情報を、上記住所情報蓄積手段に蓄積された最新世代の上記住所辞書ファイルから取得する新住所取得手段、を更に備えたことを特徴とする。
この発明によれば、知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができ、住所情報の文字認識精度を向上させることができる。
以下に、本発明にかかる証明書読取認識手段の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
[本発明の概要]
以下、本発明の概要について説明し、その後、本発明の構成および処理等について詳細に説明する。図1は、本発明の基本原理を示すフローチャートである。
本発明は、概略的に、以下の基本的特徴を有する。すなわち、本発明は、画像読取装置に接続され、記憶部と制御部を少なくとも備えた証明書読取認識装置であって、記憶部は、住所情報を記憶する住所辞書ファイルを世代毎に蓄積し、住所辞書ファイルの世代情報とファイル名を対応付けて記憶する。
ここで、「世代情報」とは、住所情報の新旧に関する情報であり、例えば、住所辞書ファイルが作成された年・月・日・時(これら一部であってもよい。)に関する情報である。
そして、図1に示すように、本証明書読取認識装置は、画像読取装置を制御して、証明書の画像を読取るよう制御する(ステップSA−1)。ここで、証明書は、例えば、運転免許証などの身分証明書であってもよい。
そして、本証明書読取認識装置は、読取られた証明書の画像データに基づいて、証明書に記載された少なくとも日付情報と、住所情報候補としての住所情報と、を文字認識する(ステップSA−2)。
ここで、本証明書読取認識装置は、運転免許証に記載された運転免許証番号を更に文字認識してもよく、また、運転免許証の都道府県公安委員会の欄に記載された都道府県名情報を更に文字認識してもよい。
そして、本証明書読取認識装置は、文字認識された日付情報と、記憶部に記憶された世代情報と、を比較して、当該日付情報に対応する世代の住所辞書ファイルのファイル名を取得する(ステップSA−3)。例えば、本証明書読取認識装置は、日付情報の日付に最も近い世代の住所辞書ファイルを選択して、ファイル名を取得してもよい。
ここで、「日付情報」は、証明書が作成または発行された年・月・日・時(これら一部であってもよい。)に関する情報である。
そして、本証明書読取認識装置は、取得されたファイル名の住所辞書ファイルを住所知識として住所情報候補を照会し、証明書の住所情報の知識処理を行う(ステップSA−4)。
ここで、「知識処理」とは、文字単位の文字認識(ステップSA−2)により得られる認識処理の精度には限界があるため認識精度を向上させるために行われる処理であり、文字認識の結果得られた文字候補を、知識データベース等を用いて照会し、文字認識の結果を変更、または、候補の絞込を行う処理のことである。また、「住所知識」とは、証明書の住所情報について知識処理を行う場合に使用される知識データベース等のことである。
以上により、知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができるので、住所情報の文字認識精度を向上させることができる。ここで、本証明書読取認識装置は、運転免許証番号を文字認識し、運転免許証番号の上2桁に対応する都道府県名情報を取得し、都道府県名情報を知識処理に用いてもよい。また、本証明書読取認識装置は、運転免許証の都道府県公安委員会の欄に記載された都道府県名情報を文字認識し、都道府県名情報を知識処理に用いてもよい。以上で、本発明の概要の説明を終了する。
[証明書読取認識装置の構成]
まず、本証明書読取認識装置の構成について説明する。図2は、本発明が適用される本証明書読取認識装置の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
図2において証明書読取認識装置100は、概略的に、証明書読取認識装置100の全体を統括的に制御するCPU等の制御部102、通信回線等に接続されるルータ等の通信装置(図示せず)に接続される通信制御インターフェース部104、画像読取装置112や出力装置114に接続される入出力制御インターフェース部108、および、各種のデータベースやテーブルなどを格納する記憶部106を備えて構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
記憶部106に格納される各種のデータベースやテーブル(読取画像ファイル106a〜レイアウト情報ファイル106g)は、固定ディスク装置等のストレージ手段であり、各種処理に用いる各種のプログラムやテーブルやファイルやデータベース等を格納する。
これら記憶部106の各構成要素のうち、読取画像ファイル106aは、画像読取装置112により読取られた画像データを記憶する読取画像データ記憶手段である。ここで、読取画像ファイル106aに格納される画像データは、BMPファイル形式でもよく、JPGファイル形式であってもよい。
また、世代情報管理ファイル106bは、住所辞書ファイルの世代情報とファイル名を対応付けて記憶する世代情報管理手段である。ここで、世代情報管理ファイル106bは、住所知識のINIファイルとして実現してもよい。
また、住所データベース106cは、住所情報を記憶する住所辞書ファイル106c−1〜nを世代毎に蓄積する住所情報蓄積手段である。また、これら住所辞書ファイル106c−1〜nは、住所知識として住所情報の知識処理に使用される。
また、住所辞書パス設定ファイル106dは、知識処理の対象となる住所辞書ファイル(106c−1〜n)のファイル名を含むファイルパスを設定情報として記憶する住所辞書パス設定記憶手段である。
また、都道府県名ファイル106eは、運転免許証の運転免許証番号の上2桁に対応する都道府県名情報を記憶する都道府県名情報記憶手段である。ここで、下の表は、都道府県名ファイル106eに格納される、都道府県名情報と、対応する運転免許証番号の上二桁との対応リストの一例を示す表である。この都道府県名ファイル106eに格納される情報は、下表に示すように、運転免許証番号の上二桁に対応する都道府県面情報を定義している。
<表・都道府県名情報と対応する上2桁番号の例>
北海道本部 10、函館 11、旭川 12、釧路 13、北見 14、青森 20、岩手 21、宮城 22、秋田 23、山形 24、福島 25、東京 30、茨城 40、栃木 41、群馬 42、埼玉 43、千葉 44、神奈川 45、新潟 46、山梨 47、長野 48、静岡 49、富山 50、石川 51、福井 52、岐阜 53、愛知 54、三重 55、滋賀 60、京都 61、大阪 62、兵庫 63、奈良 64、和歌山 65、鳥取 70、島根 71、岡山 72、広島 73、山口 74、徳島 80、香川 81、愛媛 82、高知 83、福岡 90、佐賀 91、長崎 92、熊本 93、大分 94、宮崎 95、鹿児島 96、沖縄 97
また、認識結果出力ファイル106fは、OCR制御部102bにより出力された文字認識結果情報を記憶する認識結果出力情報記憶手段である。認識結果出力ファイル106fに記憶された文字認識結果情報は、任意のアプリケーション(図示せず)により利用される。また、認識結果出力ファイル106fに出力される文字認識結果情報は、例えば、CSVファイル形式でもよい。
また、レイアウト情報ファイル106gは、各証明書(例えば、運転免許証)のフォーマットに従って、住所情報や日付情報が記載された欄の位置情報をレイアウト情報として記憶するレイアウト情報記憶手段である。
また、図2において、通信制御インターフェース部104は、証明書読取認識装置100とネットワーク300(またはルータ等の通信装置)との間における通信制御を行う。すなわち、通信制御インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
また、図2において、入出力制御インターフェース部108は、画像読取装置112や出力装置114の制御を行う。ここで、画像読取装置112としては、スキャナやカメラ等を用いることができる。また、出力装置114としては、モニタ(家庭用テレビを含む。)の他、スピーカを用いることができる。
また、図2において、制御部102は、OS(Operating System)等の制御プログラム、各種の処理手順等を規定したプログラム、および所要データを格納するための内部メモリを有し、これらのプログラム等により、種々の処理を実行するための情報処理を行う。制御部102は、機能概念的に、画像読取制御部102a、および、OCR制御部102bを備えて構成されている。
このうち、画像読取制御部102aは、画像読取装置112を制御して、証明書の画像を読取るよう制御する画像読取手段である。
また、OCR制御部102bは、OCR技術を用いて、読取画像ファイル106aに記憶された画像データから文字データを認識し、認識結果出力ファイル106fに出力するOCR制御手段である。ここで、画像読取制御部102aは、図2に示すように、レイアウト認識部102c、文字認識部102d、ファイル名取得部102e、知識処理部102f、都道府県名取得部102g、新住所取得部102hを備えて構成されている。
このうち、レイアウト認識部102cは、画像読取制御部102aによって読取られ読取画像ファイル106aに記憶された証明書の画像データに基づいて、住所情報、日付情報、運転免許証番号、または、都道府県名情報が記載された欄のレイアウトを、レイアウト情報ファイル106gに記憶されたレイアウト情報に従って認識するレイアウト認識手段である。
また、文字認識部102dは、画像読取制御部102aによって読取られ読取画像ファイル106aに記憶された証明書の画像データに基づいて、証明書に記載された少なくとも日付情報と、住所情報候補としての住所情報と、を文字認識する文字認識手段である。また、文字認識部102dは、運転免許証に記載された運転免許証番号を更に文字認識してもよく、運転免許証の都道府県公安委員会の欄に記載された都道府県名情報を文字認識してもよい。また、文字認識部102dは、レイアウト認識部102cによって認識されたレイアウトに基づいて、対応する各欄の情報を文字認識してもよい。
また、ファイル名取得部102eは、文字認識部102dにより認識された日付情報と、世代情報管理ファイル106bに記憶された世代情報と、を比較して、当該日付情報に対応する世代の住所辞書ファイルのファイル名を取得するファイル名取得手段である。ここで、ファイル名取得部102eは、日付情報に対応する世代の住所辞書ファイルのファイル名をファイルパスとともに取得してもよく、ファイル名またはファイルパスを住所辞書パス設定ファイル106dに格納し、当該住所辞書ファイルを知識処理部102fによる知識処理の住所知識として設定してもよい。
また、知識処理部102fは、ファイル名取得部102eにより取得されたファイル名の住所辞書ファイルを住所知識として、文字認識部102dにより文字認識された住所情報候補を照会し、証明書の住所情報の知識処理を行う知識処理手段である。ここで、知識処理部102fは、都道府県名取得部102gにより取得された都道府県名情報を住所情報候補を照会する際の知識処理に用いてもよい。また、知識処理部102fは、文字認識部102dにより文字認識された都道府県公安委員会の欄の都道府県名情報を、住所情報候補を照会する際の知識処理に用いてもよい。
また、都道府県名取得部102gは、文字認識部102dにより認識された運転免許証番号の上2桁に基づいて、都道府県名ファイル106eに記憶された対応する都道府県名情報を取得する都道府県名情報取得手段である。
また、新住所取得部102hは、知識処理部102fにより知識処理された証明書の住所情報に基づいて、対応する新住所情報を、住所データベース106cに蓄積された最新世代の住所辞書ファイルから取得し更新する新住所取得手段である。
以上が、本発明が適用される本証明書読取認識装置100の構成の一例である。ここで、証明書読取認識装置100は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、ネットワーク300に通信可能に接続されていてもよい。すなわち、証明書読取認識装置100は、住所情報に関する外部住所データベースや外部プログラム等を提供する外部システム200と、ネットワーク300を介して通信可能に接続して構成されていてもよい。
すなわち、図2において、ネットワーク300は、証明書読取認識装置100と外部システム200とを相互に接続する機能を有し、例えば、インターネット等である。
また、図2において、外部システム200は、ネットワーク300を介して、証明書読取認識装置100と相互に接続され、証明書読取認識装置100に対して住所情報に関する外部住所データベースや外部プログラム等を提供する機能を有する。ここで、外部システム200は、WEBサーバやASPサーバ等として構成していてもよく、そのハードウェア構成は、一般に市販されるワークステーション、パーソナルコンピュータ等の情報処理装置およびその付属装置により構成していてもよい。また、外部システム200の各機能は、外部システム200のハードウェア構成中のCPU、ディスク装置、メモリ装置、入力装置、出力装置、通信制御装置等およびそれらを制御するプログラム等により実現される。
以上で、本証明書読取認識装置100の構成についての説明を終える。
[証明書読取認識装置100の処理]
次に、このように構成された本実施の形態における証明書読取認識装置100のOCR処理の一例について、以下に図3および図4を参照して詳細に説明する。図3は、本実施の形態における本証明書読取認識装置100の処理の一例を示すフローチャートである。
図3に示すように、まず、画像読取制御部102aは、入出力制御インターフェース部108を介して画像読取装置112を制御して、証明書の画像を読取るよう制御し、読取られた画像データを読取画像ファイル106aに格納する(ステップSB−1)。
つづいて、読取画像ファイル106aに格納された画像データに基づいて、OCR制御部102bは、以下の処理を実行する。
すなわち、レイアウト認識部102cは、読取画像ファイル106aに記憶された証明書の画像データに基づいて、証明書に記載された欄の各項目別にレイアウトを、レイアウト情報ファイル106gに記憶されたレイアウト情報に従って判断する(ステップSB−2)。
そして、レイアウト認識部102cは、一の項目を取り出し(ステップSB−3)、交付日の項目であるか否か判断する(ステップSB−4)。交付日の項目でない場合は(ステップSB−4、No)、次の項目に移り(ステップSB−3)、交付日の項目であるか否か判断する(ステップSB−4)。ここで、図4は、読取画像ファイル106aに記憶された運転免許証の画像データの一例を示す図である。
図4に示すように、レイアウト認識部102cは、画像データから、氏名欄や本籍欄や住所欄や交付日欄や有効日欄や条件等記載欄や運転免許証番号欄や顔写真欄や車両種別記載欄や都道府県公安委員会欄等の各項目にレイアウトを判断する。ここで、レイアウト認識部102cは、交付日の項目以外にも、住所情報(本籍の住所情報MA−1、住民票の住所情報MA−2)、日付情報MA−3、運転免許証番号MA−4、または、都道府県公安委員会の都道府県名情報MA−5が記載された欄の項目を判断してもよい。
そして、レイアウト認識部102cが交付日の項目であると判断すると(ステップSB−4、Yes)、文字認識部102dは、証明書の交付日の項目に記載された日付情報を文字認識する(ステップSB−5)。例えば、レイアウト認識部102cは、図4の画像データに基づいて、交付日の項目MA−3に記載された日付情報「平成19年6月18日」の文字データを取得する。
ここで、レイアウト認識部102cにより認識された、交付日の項目以外の住所情報(本籍の住所情報MA−1、住民票の住所情報MA−2)や、日付情報MA−3や、運転免許証番号MA−4や、都道府県公安委員会の都道府県名情報MA−5等が記載された項目の情報を、文字認識部102dは文字認識してもよい。また、文字認識部102dが運転免許証番号を文字認識した場合、都道府県名取得部102gは、文字認識部102dにより認識された運転免許証番号の上2桁に基づいて、都道府県名ファイル106eに記憶された対応する都道府県名情報を取得してもよい。
そして、文字認識部102dは、交付日の日付情報を西暦に変換する(ステップSB−6)。図4の例では、「平成19年」を「2007年」に変換する。
そして、ファイル名取得部102eは、世代情報管理ファイル106bからファイル名と世代情報としての作成日時を住所辞書ファイル106c−1〜nの個数であるn個取得する(ステップSB−7)。ここで、世代情報管理ファイル106bは、住所知識(住所辞書ファイル106c−1〜n)のINIファイルであってもよい。
そして、ファイル名取得部102eは、取得した作成日時を古い順にソートする(ステップSB−8)。
そして、ファイル名取得部102eは、文字認識部102dにより認識された証明書の作成日と、ソートされた上位の作成日時と、を比較して、交付日が作成日時と同じか作成日時より古いか否か判断する(ステップSB−9)。
そして、ファイル名取得部102eは、交付日が作成日時より新しいと判断した場合(ステップSB−9、交付日>作成日時)、ソートされた次の住所辞書ファイルの作成日時を取り出し(ステップSB−10)、再び、ソートされた上位の作成日時と、を比較して、交付日が作成日時と同じか作成日時より古いか否か判断する(ステップSB−9)。
そして、ファイル名取得部102eは、交付日が作成日時と同じか作成日時より古いと判断した場合(ステップSB−9、交付日≦作成日時)、当該作成日時の住所辞書ファイルのファイル名から、ファイルパス(以下、「辞書パス」という。)を生成する(ステップSB−11)。
そして、ファイル名取得部102eは、生成されたファイルパスを住所辞書パス設定ファイル106dに格納し(ステップSB−12)、該当する住所辞書ファイルをファイル名取得部102eによる知識処理の住所知識として設定する(ステップSB−13)。
つづいて、知識処理部102fは、住所辞書パス設定ファイル106dに記憶された辞書パスに基づいて、該当する住所辞書ファイルを開く(ステップSB−14)。
そして、知識処理部102fは、当該住所辞書ファイルを住所知識として、文字認識部102dにより文字認識された住所情報候補を照会し、証明書の住所情報の知識処理を行う(ステップSB−15)。
ここで、知識処理部102fは、都道府県名取得部102gにより取得された都道府県名情報を、住所情報候補を照会する際の知識処理に用いてもよい。また、知識処理部102fは、文字認識部102dにより文字認識された都道府県公安委員会の欄の都道府県名情報を、住所情報候補を照会する際の知識処理に用いてもよい。また、ここで、新住所取得部102hは、知識処理部102fにより知識処理された証明書の住所情報に基づいて、対応する新住所情報を、住所データベース106cに蓄積された最新世代の住所辞書ファイルから取得し、更新してもよい。
そして、OCR制御部102bは、文字認識部102dにより文字認識され知識処理部102fにより知識処理された証明書の文字認識結果情報を認識結果出力ファイル106fに格納することにより出力する。この認識結果出力ファイル106fに出力された文字認識結果情報は、証明書データベース化アプリケーションなどにより利用される。
以上が、本証明書読取認識装置100の処理の一例である。これにより、証明書読取認識装置100が、知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させるので、住所情報の文字認識精度を向上させることができる。また、運転免許証番号の上2桁や都道府県公安委員会記載の欄等から都道府県名情報を取得するので、国籍欄または住所欄の住所情報の一部が省略されている場合であっても、取得した都道府県名情報を用いて知識処理を行うことができ、より一層住所情報の文字認識精度を向上させることができる。また、各項目のレイアウトを認識するので、対応する項目に対して適切な文字認識処理を行うことができる。また、最新世代の住所辞書ファイルを用いて新住所に更新するので、常に最新の住所表記を記録することができる。
[他の実施の形態]
さて、これまで本発明の実施の形態について説明したが、本発明は、上述した実施の形態以外にも、上記特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施の形態にて実施されてよいものである。
特に、上述の実施の形態においては、本発明の対象を主に運転免許証に適用した例について説明したが、この場合に限られず、保険証やパスポートなどの証明書において、同様に適用することができる。
例えば、証明書読取認識装置100がスタンドアローンの形態で処理を行う場合を一例に説明したが、証明書読取認識装置100とは別筐体で構成されるクライアント端末からの要求に応じて処理を行い、その処理結果を当該クライアント端末に返却するように構成してもよい。
また、実施の形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや照会条件等のパラメータを含む情報、画像例、データベース構成については、特記する場合を除いて任意に変更することができる。
また、証明書読取認識装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、証明書読取認識装置100の各装置が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現することができ、あるいは、ワイヤードロジックによるハードウェアとして実現することも可能である。尚、プログラムは、後述する記録媒体に記録されており、必要に応じて証明書読取認識装置100に機械的に読み取られる。すなわち、ROMまたはHDなどの記憶部106などは、OS(Operating System)として協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
また、このコンピュータプログラムは、証明書読取認識装置100に対して任意のネットワーク300を介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明に係るプログラムを、コンピュータ読み取り可能な記録媒体に格納することもできる。ここで、この「記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVD等の任意の「可搬用の物理媒体」、あるいは、LAN、WAN、インターネットに代表されるネットワークを介してプログラムを送信する場合の通信回線や搬送波のように、短期にプログラムを保持する「通信媒体」を含むものとする。
また、「プログラム」とは、任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施の形態に示した各装置において記録媒体を読み取るための具体的な構成、読み取り手順、あるいは、読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶部106に格納される各種のデータベース等(読取画像ファイル106a〜レイアウト情報ファイル106g)は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラムやテーブルやデータベースやウェブページ用ファイル等を格納する。
また、証明書読取認識装置100は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置を接続し、該情報処理装置に本発明の方法を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の負荷等に応じた任意の単位で、機能的または物理的に分散・統合して構成することができる。
以上詳述に説明したように、本発明によれば、知識処理に用いる住所辞書を証明書の作成時または発行時のものに自動的に対応させることができるので、住所情報の文字認識精度を向上させることができる、証明書読取認識装置を提供することができる。
本発明の基本原理を示すフローチャートである。 本発明が適用される本証明書読取認識装置の構成の一例を示すブロック図である。 本実施の形態における本証明書読取認識装置100の処理の一例を示すフローチャートである。 読取画像ファイル106aに記憶された運転免許証の画像データの一例を示す図である。
符号の説明
100 証明書読取認識装置
102 制御部
102a 画像読取制御部
102b OCR制御部
102c レイアウト認識部
102d 文字認識部
102e ファイル名取得部
102f 知識処理部
102g 都道府県名取得部
102h 新住所取得部
104 通信制御インターフェース部
106 記憶部
106a 読取画像ファイル
106b 世代情報管理ファイル
106c 住所データベース
106c−1〜n 住所辞書ファイル
106d 住所辞書パス設定ファイル
106e 都道府県名ファイル
106f 認識結果出力ファイル
106g レイアウト情報ファイル
108 入出力制御インターフェース部
112 画像読取装置
114 出力装置
200 外部システム
300 ネットワーク

Claims (5)

  1. 画像読取装置に接続され、記憶部と制御部を少なくとも備えた証明書読取認識装置であって、
    上記記憶部は、
    住所情報を記憶する住所辞書ファイルを世代毎に蓄積する住所情報蓄積手段と、
    上記住所辞書ファイルの世代情報とファイル名を対応付けて記憶する世代情報管理手段と、
    を備え、
    上記制御部は、
    上記画像読取装置を制御して、証明書の画像を読取るよう制御する画像読取手段と、
    上記画像読取手段によって読取られた上記証明書の画像データに基づいて、上記証明書に記載された少なくとも日付情報と、住所情報候補としての上記住所情報と、を文字認識する文字認識手段と、
    上記文字認識手段により文字認識された上記日付情報と、上記世代情報管理手段に記憶された上記世代情報と、を比較して、当該日付情報に対応する世代の上記住所辞書ファイルの上記ファイル名を取得するファイル名取得手段と、
    上記ファイル名取得手段により取得された上記ファイル名の上記住所辞書ファイルを住所知識として上記住所情報候補を照会し、上記証明書の上記住所情報の知識処理を行う知識処理手段と、
    を備えたことを特徴とする証明書読取認識装置。
  2. 請求項1に記載の証明書読取認識装置において、
    上記証明書は、運転免許証であり、
    上記記憶部は、
    上記運転免許証の運転免許証番号の上2桁に対応する都道府県名情報を記憶する都道府県名情報記憶手段、
    を更に備え、
    上記文字認識手段は、
    上記運転免許証に記載された上記運転免許証番号を更に文字認識し、
    上記制御部は、
    上記文字認識手段により文字認識された上記運転免許証番号の上2桁に基づいて、上記都道府県名情報記憶手段に記憶された対応する上記都道府県名情報を取得する都道府県名情報取得手段、
    を更に備え、
    上記知識処理手段は、
    上記都道府県名情報取得手段により取得された上記都道府県名情報を、上記住所情報候補を照会する際の知識処理に用いること、
    を特徴とする証明書読取認識装置。
  3. 請求項1に記載の証明書読取認識装置において、
    上記証明書は、運転免許証であり、
    上記文字認識手段は、
    上記運転免許証の都道府県公安委員会の欄に記載された都道府県名情報を更に文字認識し、
    上記知識処理手段は、
    上記文字認識手段により文字認識された上記都道府県名情報を、上記住所情報候補を照会する際の知識処理に用いること、
    を特徴とする証明書読取認識装置。
  4. 請求項1乃至3のいずれか一つに記載の証明書読取認識装置において、
    上記制御部は、
    上記画像読取手段によって読取られた上記画像データに基づいて、上記住所情報、上記日付情報、上記運転免許証番号、または、上記都道府県名情報が記載された欄のレイアウトを認識し、認識した上記レイアウトに基づいて上記文字認識手段により文字認識されるよう制御するレイアウト認識手段、
    を更に備えたことを特徴とする証明書読取認識装置。
  5. 請求項1乃至4のいずれか一つに記載の証明書読取認識装置において、
    上記知識処理手段により知識処理された上記証明書の上記住所情報に基づいて、対応する新住所情報を、上記住所情報蓄積手段に蓄積された最新世代の上記住所辞書ファイルから取得する新住所取得手段、
    を更に備えたことを特徴とする証明書読取認識装置。
JP2007244514A 2007-09-20 2007-09-20 証明書読取認識装置 Active JP5204448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007244514A JP5204448B2 (ja) 2007-09-20 2007-09-20 証明書読取認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007244514A JP5204448B2 (ja) 2007-09-20 2007-09-20 証明書読取認識装置

Publications (2)

Publication Number Publication Date
JP2009075892A true JP2009075892A (ja) 2009-04-09
JP5204448B2 JP5204448B2 (ja) 2013-06-05

Family

ID=40610790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007244514A Active JP5204448B2 (ja) 2007-09-20 2007-09-20 証明書読取認識装置

Country Status (1)

Country Link
JP (1) JP5204448B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016173710A (ja) * 2015-03-17 2016-09-29 大日本印刷株式会社 情報入力装置、およびプログラム
JP2019175317A (ja) * 2018-03-29 2019-10-10 三井住友海上火災保険株式会社 文字認識装置、文字認識方法およびプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997469A (zh) * 2017-03-16 2017-08-01 芜湖星途机器人科技有限公司 证件信息采集系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04123185A (ja) * 1990-09-14 1992-04-23 Hitachi Ltd 文書認識方式
JPH0546815A (ja) * 1991-08-13 1993-02-26 Oki Electric Ind Co Ltd 光学式文字読取装置における住所単語照合方法
JPH08241314A (ja) * 1995-03-06 1996-09-17 Fujitsu Ltd 文書ファイリングシステム
JPH09160973A (ja) * 1995-12-08 1997-06-20 Hitachi Ltd 住所情報管理方法
JPH09251509A (ja) * 1996-03-15 1997-09-22 Sharp Corp 運転免許証認識装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04123185A (ja) * 1990-09-14 1992-04-23 Hitachi Ltd 文書認識方式
JPH0546815A (ja) * 1991-08-13 1993-02-26 Oki Electric Ind Co Ltd 光学式文字読取装置における住所単語照合方法
JPH08241314A (ja) * 1995-03-06 1996-09-17 Fujitsu Ltd 文書ファイリングシステム
JPH09160973A (ja) * 1995-12-08 1997-06-20 Hitachi Ltd 住所情報管理方法
JPH09251509A (ja) * 1996-03-15 1997-09-22 Sharp Corp 運転免許証認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016173710A (ja) * 2015-03-17 2016-09-29 大日本印刷株式会社 情報入力装置、およびプログラム
JP2019175317A (ja) * 2018-03-29 2019-10-10 三井住友海上火災保険株式会社 文字認識装置、文字認識方法およびプログラム

Also Published As

Publication number Publication date
JP5204448B2 (ja) 2013-06-05

Similar Documents

Publication Publication Date Title
US20060268352A1 (en) Digitized document archiving system
JP5280156B2 (ja) 電子化文書管理装置および電子化文書管理方法
JP6743445B2 (ja) 携帯型情報装置およびプログラム
JP5102650B2 (ja) 情報検索システム、情報検索方法、情報検索プログラム及び記録媒体
JP5204448B2 (ja) 証明書読取認識装置
JP6786658B2 (ja) 書類読取システム
US20220068276A1 (en) Information processor, print system, and control method
JP2010256994A (ja) 文字認識装置、文字認識方法、および、プログラム
US8712155B2 (en) Device for identifying types of document files
JP5669041B2 (ja) 文書処理装置及び文書処理方法
JP2003030211A (ja) 電子名刺、電子名刺管理方法及びそのプログラム
JP2006313489A (ja) 文書登録装置及びその制御方法、並びに制御プログラム
US11363162B2 (en) System and method for automated organization of scanned text documents
JP2009301272A (ja) 証憑管理装置および証憑管理方法
JP6142769B2 (ja) 情報処理装置及びプログラム
JP5515481B2 (ja) 文書処理装置、文書処理システム及びプログラム
JP7491022B2 (ja) 書類識別装置、書類識別方法及びコンピュータプログラム
US9195888B2 (en) Document registration apparatus and non-transitory computer readable medium
JP5023010B2 (ja) 文書管理装置および文書管理方法
JP2009048321A (ja) 電子申請処理システム
JP2008033647A (ja) ドキュメントセット作成装置及びドキュメントセット作成方法
JP5309664B2 (ja) 文書管理装置及びプログラム
JP2007004429A (ja) 文書処理装置
JP2024068871A (ja) 図面管理システム
JP2024021668A (ja) 情報管理サーバ、情報管理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130215

R150 Certificate of patent or registration of utility model

Ref document number: 5204448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3