JP2006163446A - 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体 - Google Patents

情報処理装置およびデータ検索方法およびプログラムおよび記録媒体 Download PDF

Info

Publication number
JP2006163446A
JP2006163446A JP2004349215A JP2004349215A JP2006163446A JP 2006163446 A JP2006163446 A JP 2006163446A JP 2004349215 A JP2004349215 A JP 2004349215A JP 2004349215 A JP2004349215 A JP 2004349215A JP 2006163446 A JP2006163446 A JP 2006163446A
Authority
JP
Japan
Prior art keywords
data
search
character string
normalization
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004349215A
Other languages
English (en)
Inventor
Itsuki Shimokooriyama
敬己 下郡山
Yumi Inoue
ゆみ 井上
Hideto Kajiyama
秀人 梶山
Ryuichi Fuse
竜一 布施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon IT Solutions Inc
Original Assignee
Canon Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Software Inc filed Critical Canon Software Inc
Priority to JP2004349215A priority Critical patent/JP2006163446A/ja
Publication of JP2006163446A publication Critical patent/JP2006163446A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】顧客の利用する自動車のナンバープレートを撮影してOCR認識する場合のように、信憑性の低いOCRの認識結果を用いて顧客データ検索する場合であっても、検索データのヒット率を向上すること。
【解決手段】カメラ101で撮影されたナンバープレート画像102から文字列を認識し、該認識された文字列データに検索候補展開エンジン106が正規化処理を加えて複数の検索候補データを生成し、該生成された複数の検索候補データに基づいて検索エンジン107が顧客データベースのデータ検索を行い、該検索結果(顧客データ)を画面109に出力することにより店員に通知する構成を特徴とする。
【選択図】図1

Description

本発明は、画像データのOCR結果のように信憑性の低いデータに基づいて検索処理を行う情報処理装置およびデータ検索方法およびプログラムおよび記録媒体に関する。
従来より、特許文献1では、顧客サービス向上ために、顧客のナンバープレート画像から自動車ナンバーをOCR認識し、顧客情報をデータベースから検索する装置が提案されている。
特開平06−139263号公報
しかしながら、OCR認識には誤りが含まれるものであるが、特許文献1では、OCR認識には誤りが含まれるという問題への対処が無く、OCR認識結果をそのまま用いてデータ検索を行う構成となっている。
実際、カメラの精度、OCRソフトの精度によりナンバーが100%正確に読み取れる確率は高くない。さらに天候、照明、ナンバープレートの汚れなどによるナンバーの識別が困難なケースが多く、これらは高精度のカメラやOCRなどを使用したとしても、解決のできる問題ではない。
このように、特に、自動車のナンバープレートを撮影してOCR認識する場合のように、信憑性の低いOCRの認識結果をそのまま用いてデータ検索を行う特許文献1の装置では、正しいデータへのヒット率が低くなってしまうという問題点があった。
本発明は、上記の問題点を解決するためになされたもので、本発明の目的は、カメラ撮影された画像データから文字列を認識し、該認識された文字列データに正規化処理を加えて複数の検索候補データを生成し、該生成された複数の検索候補データに基づいてデータ検索を行い、該検索結果を出力することにより、自動車のナンバープレートを撮影してOCR認識する場合のように、信憑性の低いOCRの認識結果を用いてデータ検索する場合であっても、検索のヒット率を向上し、ユーザの満足度を向上させることができる利便性の高いデータ検索システムを構築することができるOCRの誤認識に対応可能な情報処理装置およびデータ検索方法およびプログラムおよび記録媒体を提供することである。
本発明は、撮影された画像データから文字列を認識する認識手段と、前記認識手段により認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化手段と、前記正規化手段により生成された複数の検索候補データに基づいてデータ検索を行う検索手段と、前記検索手段の検索結果を出力する出力手段とを有することを特徴とする。
また、本発明は、カメラにより撮影された自動車のナンバープレートを含む画像データからナンバープレートに記載された文字列を認識する認識手段と、前記認識手段により認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化手段と、顧客の使用する自動車のナンバープレートの情報と顧客情報とを紐付けて保持する顧客データベースと、前記正規化手段により生成された複数の検索候補データをキーにして前記顧客データベースから顧客データを検索する検索手段と、前記検索手段により検索された顧客データを出力する出力手段とを有することを特徴とする。
本発明によれば、カメラ撮影された画像データから文字列を認識し、該認識された文字列データに正規化処理を加えて複数の検索候補データを生成し、該生成された複数の検索候補データに基づいてデータ検索を行い、該検索結果を出力するので、自動車のナンバープレートを撮影してOCR認識する場合のように、信憑性の低いOCRの認識結果を用いてデータ検索する場合であっても、検索のヒット率を向上し、ユーザの満足度を向上させることができる利便性の高いデータ検索システムを構築することができるOCRの誤認識に対応したデータ検索システムを構築することができる。
従って、OCR認識したデータを検索にかける前に、データに正規化処理をかけ検索の幅を広げて、OCR認識の精度がクリティカルでない場面においても、OCR認識結果を利用したデータ検索のヒット率を向上することができる等の効果を奏する。
〔第1実施形態〕
図1は、本発明の情報処理装置を適用可能なデータ検索システムの構成の一例を示すシステム構成図である。
図1において、101はカメラで、ビデオカメラ又はデジタルカメラ等のカメラであり、自動車の動きに合わせ画像を撮影する。
本発明のデータ検索システムでは、このカメラ101により、店舗等の駐車場に進入してくる顧客自動車を撮影し、該撮影された自動車画像をサーバ103に取り込む。
そして、サーバ103において、自動車ナンバーをOCR認識して、自動車ナンバーで顧客データベース108を検索し、検索結果(顧客データ)を画面109に表示して、自動車で来客する顧客へのサービスの向上に利用しようというものである。例えば、画面9の顧客データ表示により、店舗内の販売員等が来店した顧客を即座に判別し、効率的に、その顧客のニーズに合った顧客サービスを実施するというものである。
なお、自動車のナンバー等を読み取る場合、カメラの精度,OCRの精度等により実際に自動車のナンバーが正確に読み取れる確率は高くない。また、天候,照明,ナンバープレートの汚れ等によるナンバーの識別が困難なケースも多く、これらは高精度のカメラやOCRなどを使用したとしても、解決のできる問題ではない。
これに対して、本発明のデータ検索システムでは、サーバ103において、顧客データベース108の検索前に、自動車ナンバーのOCR認識結果に対して正規化処理(データを一定のルールに従って変形して検索に利用しやすいデータを生成する処理)を加えて複数の検索候補データを生成し、該生成した複数の候補データで顧客データベース108を検索することにより、自動車ナンバーの誤認識により誤った顧客データを検索してしまうことへ対処しようとするものである。
以下、サーバ103について詳細に説明する。
サーバ103において、104はナンバープレート切り出しモジュールで、カメラ101により撮影された画像からナンバープレートの位置の画像を切り出し、該切り出したナンバープレートの位置の画像を解析してナンバープレートの特徴を備えた画像であると判断した場合に、その画像をナンバープレート画像102として抽出する。
105はOCR部(OSRソフトウェア)で、ナンバー切り出しモジュール104により抽出されたナンバープレート画像102からナンバーに対応する文字列を認識する。
106は検索候補展開エンジンで、OCR部105により認識されたナンバー文字列を、ルールデータベース110に格納されたルールに基づいて正規化し、検索結果の候補となるデータを増やす処理を行う。
なお、ルールデータベース110は、認識したナンバー文字列に正規化処理を加えるためのプログラムデータを、ルールという単位で複数保持するものである。詳細は図2に示す。
107は検索エンジンで、検索候補展開エンジン106で展開した候補となるデータをキーとして、顧客データベース108に格納された顧客のデータを検索し、画面109に出力する。なお、顧客データベース108は、顧客のデータを保持するものである。詳細は図4に示す。
画面109は、検索エンジン107の検索結果である顧客のデータを表示するためのものである。この表示画面109により、顧客のデータが係員に通知され、サービスに利用されることとなる。
以下、図2を参照して、図1で示したルールデータベース110について説明する。
本データ検索システムでは、上述したように、正規化を実行するためのルールプログラムが、ルールデータベース110に格納されている。そして、このルールプログラムを、検索候補展開エンジン106が、ルールデータベース110から読み込み、実行することで、認識されたデータを展開し、検索の幅を広げていく。
即ち、本発明のデータ検索システムでは、ルールデータベース110に格納されたプログラムデータを書き換えることで、容易に正規化のルールを変更することができる。
図2は、図1で示したルールデータベース110のデータ構成の一例を示すデータ構成図である。
図2に示すように、ルールデータは、条件部プログラムデータ601,アクション部プログラムデータ602,継続フラグ603から構成される。
条件部プログラムデータ601には、ルールが適用されるための条件を示すデータが格納される。アクション部プログラムデータ602には、条件部プログラムデータ601に示される条件に合致した場合に実行する展開処理方法を示すデータが格納される。継続フラグ603には、後続するルールの継続の是非を決定するためのフラグが設定されている。
以下、図2に示したルールデータベース110の各ルール604〜607について具体的に説明する。
ルール604(最低認識桁数ルール)は、条件部プログラムデータ601が「認識桁数が3桁未満である」であり、これを満たす場合に実行するアクション部プログラムデータ602の処理が「以下のすべての条件を無視し、検索失敗と表示するの処理を実行する」というものである。
ルール605(誤認識文字ルール1)は、条件部プログラムデータ601が「認識文字の中に4が含まれる」であり、これを満たす場合に実行するアクション部プログラムデータ602の処理が「4を9に変換して展開する」というものである。
ルール606(誤認識文字ルール2)は、条件部プログラムデータ601が「認識文字の中に9が含まれる」であり、これを満たす場合に実行するアクション部プログラムデータ602の処理が「9を4に変換して展開する」というものである。
ルール607(補完ルール)は、条件部プログラムデータ601が「認識文字数が4桁未満である」であり、これを満たす場合に実行するアクション部プログラムデータ602の処理が「1,2,3,4桁目にそれぞれ入りうる数字をすべて補完して展開する」というものである。
なお、図2では、条件部プログラムデータ601,アクション部プログラムデータ602を日本語表現で記載しているが、条件部プログラムデータ601,アクション部プログラムデータ602は、正規表現を利用した形式,所定のスクリプト言語等で記載可能であり、条件部プログラムデータ601,アクション部プログラムデータ602のデータ形式,表現形式は如何なるものであってもよい。
以下、図3を参照して、図1で示した検索候補展開エンジン106の構成について説明する。
図3は、図1で示した検索候補展開エンジン106の構成を示すブロック図である。
図3において、201は入力文字列処理部で、OCR部105で読み取った(認識した)文字列を入力処理する。205はルール読込部で、ルールデータベ−ス110から全ルール(図2に示した例ではルール604〜607)を読み込む。208はルール展開部で、ルール読込部205で読み込んだルールを一つ一つのルールに展開する(図2に示した例ではルール604,ルール605,ルール606,ルール607に展開する)。
202は条件部読込部で、ルール展開部208で展開された各ルールの条件部(条件部プログラムデータ601)を読み込む。209はアクション部読込部で、ルール展開部208で展開された各ルールのアクション部(アクション部プログラムデータ602)を読み込む。206はフラグ判定部で、ルール展開部208で展開された各ルールのフラグ(継続フラグ603)を判別する。
207は条件部実行部で、条件部読込部202で読み込まれたルールの条件部を実行する(OCR部105の認識文字列が条件部プログラムデータ601で示される条件にマッチしたか判定する)。203はアクション部実行部で、アクション部読込部209で読み込まれたルールのアクション部を実行する(アクション部プログラムデータ602で示される処理を実行する)。
210は展開文字列保持部で、アクション部実行部203で展開された文字列を保持する。204は出力文字列処理部で、展開文字列保持部210で保持されている文字列を検索エンジン107に出力する。
以下、図4を参照して、図1で示した顧客データベース108について説明する。
図4は、図1で示した顧客データベース108のデータ構成の一例を示すデータ構成図である。
図4に示すように、顧客データベース108のレコードは、キー値901,ナンバープレートの情報902,顧客名903,車体画像904,ナンバープレート画像905,訪問日906等から構成される。
以下、図5を参照して、図1で示した画面109に表示される検索結果画面について説明する。
図5は、図1で示した画面109への検索結果表示の一例を示す模式図である。
図5において、301は顧客データベースの検索結果件数の表示に対応する。302は、OCR部105により認識されたナンバーの表示に対応する。303は、カメラ101により撮影された画像全体の表示に対応する。304は、ナンバープレート切り出しモジュール104により切り出されたナンバープレート画像102の表示に対応する。
305は、検索エンジン107により検索されて顧客データベース108から取得されたナンバープレートの情報,顧客名の表示に対応する。306は、検索エンジン107により検索されて顧客データベース108から取得された車体画像の表示に対応する。307は、検索エンジン107により検索されて顧客データベース108から取得されたナンバープレート画像の表示に対応する。
308は詳細情報ボタンで、このボタンを指示(クリック,タッチ等)することにより、該当する顧客に対する詳細データが表示される。なお、この詳細データは、顧客データベース108内に格納されたデータに限られるものではなく、該当する顧客をキーにして、他のデータベース等から取得したデータも合わせて表示するように構成してもよい。
図6は、図1に示したサーバ103のハードウェア構成を示すブロック図である。
図6において、401はCPUで、ROM403内のプログラムROM、ハードディスク(HDD)411、又はその他の図示しない記録媒体(例えば、ハードディスク,フレキシブルディスク,CD−ROM,DVD−ROM等)に格納されたプログラム(OS,各種アプリケーション)をRAM402上にロードして実行することにより、バス404を介して接続される各デバイスを制御する。なお、RAM402は、CPU401の作業領域として使用される。また、ROM403は、フォントROM,プログラムROM,データROM等から構成される。
405はキーボードコントローラ(KBC)で、キーボード(KB)409や図示しないマウス等のポインティングデバイス等の入力装置を制御する。406はCRTコントローラ(CRTC)で、CRT,LCD,SED等の表示装置を制御する。
407はメモリコントローラ(MC)で、HDD411や又はその他の図示しない記録媒体(例えば、ハードディスク,フレキシブルディスク,CD−ROM,DVD−ROM等)を制御する。
408はネットワークインタフェース(NW I/F)で、LAN等のネットワークとのデータ送受信を制御する。
なお、図1に示したナンバー切り出しモジュール104,OCR部105,検索候補展開エンジン106,検索エンジン107は、CPU401が、ROM403、ハードディスク(HDD)411、又はその他の図示しない記録媒体に格納されたプログラムをRAM402上にロードして実行することにより実現される。
また、図1に示したルールデータベース110,顧客データベース108は、ハードディスク(HDD)411、又は、サーバ103が読み出し可能なその他の図示しない記録媒体上(他のコンピュータ上であってもよい)に保持される。
以下、図7,図8を参照して、本発明の情報処理装置を適用可能なデータ検索システムにおける全体処理(サーバ103において自動車画像を入力し、自動車ナンバーを自動認識で取得し、その結果に正規化処理を加えて顧客データベースを検索し、検索結果を表示するまでの一連の処理)動作について説明する。
図7は、本発明の情報処理装置を適用可能なデータ検索システムにおける第1の制御処理手順の一例を示すフローチャートであり、全体処理(サーバ103において自動車画像を入力し、自動車ナンバーを自動認識で取得し、その結果に正規化処理を加えて顧客データベースを検索し、検索結果を表示するまでの一連の処理)動作に対応する。なお、このフローチャートの処理は、図4に示したCPU401がHDD又はその他の記録媒体に格納されたプログラムをRAM402上にロードして実行することにより実現される。また、図中、S501〜S507は各ステップを示す。
図1に示したカメラ101で撮影された画像をサーバ103が受け取ると、CPU401はフローチャートの処理を開始させる。
まず、ステップS501において、ナンバープレート切り出しモジュール104は、カメラ101から撮影画像を受け取り、ステップS502において、撮影画像からナンバープレート画像を切り出し、ナンバープレート画像102を抽出する処理を行う。
次に、ステップS503において、ナンバー切り出しモジュール104は、ステップS502でナンバープレート画像を抽出できたか否かを判定し、抽出できなかったと判断した場合には、ステップS501に処理を戻す。なお、カメラ101では、随時、定期的、又は、所定のセンサが自動車等を感知したタイミング等で撮影が行われ、撮影の度に、撮影画像がサーバ103に入力されることとなっている。
一方、ステップS503で、ナンバー切り出しモジュール104が、ナンバープレート画像を抽出できたと判断した場合には、ステップS504において、OCR部105は、ステップS502で抽出したナンバープレート画像より文字列を抽出し、該抽出した文字列を検索公報展開エンジンに渡す。
次に、ステップS505において、検索候補展開エンジン106は、ステップS504で抽出された文字列にナンバー正規化ルールを適用する処理(正規化処理)を行い、展開結果(展開文字列)を展開文字列保持部210に保持させる(詳細は図8に示す)。
次に、ステップS506において、検索エンジン107は、ステップS505で検索候補展開エンジン106により正規化された展開文字列(候補文字列)を展開文字列保持部210から取得し、該取得した正規化された展開文字列をキーとして顧客データベースから顧客情報の検索を行う。なお、この検索は、ステップS505で生成された全ての展開文字列に対して行うものである。また、ステップS505の処理がエラーとなった場合や展開文字列保持部210に文字列が格納されていない場合には、検索処理を実行することなく処理を終了する。
次に、ステップS507において、検索エンジン107は、ステップS506の検索結果を画面109に出力して、検索された顧客情報を表示し、処理を終了する。
図8は、本発明の情報処理装置を適用可能なデータ検索システムにおける第1の制御処理手順の一例を示すフローチャートであり、図7のステップS505に示したナンバー正規化ルールの適用処理の詳細を示したフローチャートである。なお、このフローチャートの処理は、図4に示したCPU401がHDD又はその他の記録媒体に格納されたプログラムをRAM402上にロードして実行することにより実現される。また、図中、S601〜S606は各ステップを示す。
まず、入力文字列処理部201において、図7のステップS504で抽出された文字列を受け取り、該受け取った文字列を展開文字列保持部210に格納し(これ以前に展開文字列保持部210に保持されていたデータは削除される)、処理を開始する。
ステップS601において、ルールデータベース110からルールの読み込み処理を行う。詳細には、ルール読込部205が、ルールデータベ−ス110から全ルールデータを読み込み、ルール展開部208が、ルール読込部205で読み込んだルールを一つ一つのルールデータに展開する。
次に、ステップS602において、条件読込部202は、処理すべきルールデータがあるか否かを判定し、処理すべきルールデータが無いと判断した場合には、入力文字列処理部201が受け取った文字列(図7のステップS504で抽出された文字列)をそのまま展開文字列保持部210に格納し、図7のフローチャートに処理を戻し、検索エンジン107にて検索処理を実行させるように制御する。
一方、ステップS602で、条件読込部202が、処理すべきルールデータがあると判断した場合には、ステップS603において、所定の順序に従い(図2では上から順に)1つルールデータを取得し、該ルールデータから条件部プログラムデータ601を読み込み、条件部実行部207で、展開文字列保持部210内に保持されている各文字列が条件部プログラムデータ601で示される条件にマッチしたかそれぞれ判定する。
ステップS605において、条件部実行部207が、展開文字列保持部210に保持される各文字列がいずれも、読み込んだ条件部プログラムデータ601で示される条件にマッチしなかったと判断した場合には、ステップS602に処理を戻し、条件読込部202に次のルールデータの処理を行わせるように制御する。
一方、ステップS605において、条件部実行部207が、展開文字列保持部210に保持されるいずれかの文字列が、読み込んだ条件部プログラムデータ601で示される条件にマッチしたと判断した場合には、ステップS605において、アクション部読込部209は、カレントのルールデータからアクション部プログラムデータ602を読み込み、アクション部実行部203で、マッチしたと判断された全ての文字列に対して、アクション部プログラムデータ602で示される処理をそれぞれ実行する。そして、展開された文字列を展開文字列保持部210に上書き保存する(即ち、これ以前に展開文字列保持部210に保持されていたデータは削除される)。
次に、フラグ判定部206は、ステップS606において、カレントのルールデータが保持する継続フラグ603が「1」(継続を示す値)であるか否かを判定し、継続フラグが「1」(継続を示す値)であると判断した場合には、ステップS602に処理を戻し、条件読込部202に次のルールデータの処理を行わせるように制御する。
一方、フラグ判定部206が、ルールデータの継続フラグ603が継続を示す値「1」でない(継続を示さない値である)と判断した場合には、出力文字列処理部おいて展開文字列保持部210に保持されている文字列を検索エンジン107に出力し、図7のフローチャートに処理を戻し、検索エンジン107にて検索処理を実行させるように制御する。
以下、図9を参照して、検索候補展開エンジン106による展開処理を具体的に説明する。なお、ルールデータベースは図2に示したものを用いるものとする。
ここでは、仮に“23−45”というナンバーの車が進入してきたとする。そして、このナンバーをカメラ101で撮影し、OCR認識した結果、OCR部105の誤認識により“295”という3桁の文字を認識してしまったとする。この場合の展開結果を図9に示す。
図9は、検索候補展開エンジン106による展開処理結果の一例を示す模式図である。
図9において、列801は、図2に示したルールデータのうち、列802に示す展開する前のデータにマッチしたルールを示す。列803は、列802に示す展開する前のデータが、801に示すマッチしたルールで展開されたあとのデータを示す。
以下、図8のフローチャートに対応させて説明する。
まず、検索候補展開エンジン106には、認識結果である“295”が入力されると、図8のステップS601において、ルールデータベース110からルールを読み込み、図8のステップS602において、ルールの有無を判定し、図8のステップS603に進む。
図8のステップS603で、図2に示したルールデータ604(最低認識桁数ルール)の条件部プログラムデータ「認識桁数が3桁未満である」を読み込み、文字列“295”が「認識桁数が3桁未満である」とマッチングするか判定する。ここで、文字列“295”は3桁以上であるので、図8のステップS604で、マッチングしないと判断し、図8のステップS602に処理を戻す。
次に、ステップS603で、図2に示したルールデータ605(誤認識文字ルール1)の条件部プログラムデータ「認識文字に4が含まれている」を読み込み、文字列“295”が「認識文字に4が含まれている」とマッチングするか判定する。ここで、文字列“295”には'4'が含まれていないので、ステップS604で、マッチングしないと判断し、図8のステップS602に処理を戻す。
次に、図8のステップS603で、図2に示したルールデータ606(誤認識文字ルール2)の条件部プログラムデータ「認識文字に9が含まれている」を読み込み、文字列“295”が「認識文字に9が含まれている」とマッチングするか判定する。ここで、文字列“295”には'9'が含まれているので、図8のステップS604で、マッチングすると判断し、図8のステップS605に処理を進める。
図8のステップS605で、ルールデータ604(最低認識桁数ルール)のアクション部プログラムデータ「9を4に変換して展開する」を読み込み、実行する。即ち、文字列“295”の'9'を'4'に変換して、文字列“295”を展開する。この処理が終了すると、図9の804に示す展開されたあとのデータのように、二個の文字列“295”,“245”が展開される。そして、展開されたあとのデータ“295”,“245”を展開文字列保持部210に上書きする。
そして、認識文字ルール2(606)の継続フラグ603が「1」であるので、ルール実行を継続するものと判断し、ステップS603に処理を戻す。
次に、図8のステップS603で、図2に示したルールデータ607(補完ルール)の条件部プログラムデータ「認識文字数が4桁未満である」を読み込み、展開文字列保持部210内に保持されている文字列“295”,“245”が「認識文字数が4桁未満である」とマッチングするかをそれぞれ判定する。ここで、文字列“295”,“245”はいずれも4桁未満であるので、図8のステップS604で、マッチングすると判断し、図8のステップS605に処理を進める。
図8のステップS605で、ルールデータ604(最低認識桁数ルール)のアクション部プログラムデータ「4桁に補完し展開する。補完する桁の位置は1,2,3,4桁目とする」を読み込み、実行する。即ち、文字列“295”の1,2,3,4桁目をそれぞれ'0'〜'9'で補完する。この処理が終了すると、図9の806−1,806−2,806−3,806−4に示すような40個の文字列が展開される。また、文字列“245”の1,2,3,4桁目をそれぞれ'0'〜'9'で補完する。この処理が終了すると、図9の805−1,805−2,805−3,805−4に示すような40個の文字列が展開される。そして、展開されたあとのデータ(図9の805−1〜4,806−1〜4)を展開文字列保持部210に上書きする。
そして、補完ルール607の継続フラグ603が「0」であるので、ルール実行を継続しないものと判断し、図7のフローチャートに処理を戻し、検索エンジン107にて検索処理を実行させるように制御する。即ち、図7のステップS506の検索処理では、図9の805−1〜4,806−1〜4に示す展開されたあとのデータ(80個)をキーにしてそれぞれ検索処理を行うこととなる。
なお、図9の805−1〜4,806−1〜4に示す展開されたあとのデータには、807に示すように、上述した正しいナンバー“23−45”も含まれており、これにより、目的の顧客の情報を検索することができる。よって、駐車場に進入してきた自動車のナンバーをOCRが誤認識したとしても、検索結果より、来店する顧客の情報を高い確率で取得することができる。
この検索結果の一例が、図5に示したものである。図5では、検索結果の1番上にカーナンバー“23−45”の顧客データが表示されている。
なお、検索結果の表示の際、図5に示すように、検索結果だけでなく、撮影した車両とナンバープレートの画像と、検索でヒットした顧客の車両の画像の双方を画面表示(通知)するように構成してもよい。この構成により、複数の顧客情報がヒットしてしまった場合でも、販売員が正しい顧客(正しい検索結果)を容易に選択することができる、より利便性の高いデータ検索システムを提供できる。
また、自動車ナンバーを自動認識で取得し、その結果に正規化処理を加えて顧客データベースを検索し、顧客サービスを向上させる装置の構成について説明したが、さらに、検索結果の出力に関して、図5に示したように、顧客データベース108に顧客の訪問回数や最終訪問日などの情報をもたせることによって、数件ヒットした場合に訪問可能性の高い順番に、検索結果を画面表示させるように構成してもよい。これにより、販売員が正しい顧客(正しい検索結果)を容易に選択することができる、より利便性の高いデータ検索システムを提供できる。
さらに、上記実施形態では、自動車ナンバーを自動認識で取得し、その結果に正規化処理を加えて顧客データベースを検索し、結果を画面に出力する構成について説明したが、結果を自動的にプリントするように構成にしてもよい。
また、上記実施形態では、自動車ナンバープレートから検索に用いるための文字列を下部4桁の数字に絞って検索する構成について説明したが、さらにナンバープレート右端に記載されているひらがな文字や、上部に記載されている地域ナンバーも検索対象にすることによって、より信頼性をあげるデータ検索システムを構築することができる。
また、上記実施形態では、顧客データベースに情報を登録されている既存顧客が所有している自動車が進入してきた場合において、本発明のデータ検索システムを利用し、その自動車ナンバーを取得し、その結果に正規化処理を加えて顧客データベースを検索、検索結果をもとに店舗内の販売員などがいち早く対象の顧客に関する情報を把握し資料を用意するなど、より良いサービスを提供する目的であるシステムの構成について説明したが、電話やインターネットによりアクセスしてきた新規顧客に対して、あらかじめ自動車ナンバーを伺い、それを顧客データベースに入力しておくことによって、来店経験のない顧客に対しても、より迅速なサービスを提供することができる。
以上説明したように、OCRによって受け取ったデータに適切な正規化処理を加えて、該当するデータの検索を行うことにより、OCR認識したデータを検索にかける前に、データに正規化処理をかけ検索の幅を広げ、OCR認識の精度がクリティカルでない場面においても、目的のデータ(本来検索されるべき正しいデータ)を検索結果の一つとして出力することができる。
よって、このデータ検索システムを店舗等の駐車場に進入してくる自動車のナンバーをOCR認識して、該認識結果により顧客データを検索するシステムに適用した場合、駐車場に進入してきた自動車のナンバーをOCRが誤認識したとしても、来店する顧客の情報を顧客の来店前に高い確率で取得して、効率的に顧客ニーズに合った顧客サービスを実施することができる。
以上に示したように、OCRの認識した文字に正規化処理を加えて検索を行なうことにより、認識文字列を検索にかける前にデータに正規化処理を行って、検索の幅を広げるように構成しているので、ナンバー認識の精度がクリティカルでない場面において、カメラやOCRの精度に頼ることなく、OCRの誤認識に対応可能な安価なデータ検索システムを提供することを可能にする。
また、データの正規化を行うためのルールを持ったルールデータベース110は、システム本体とは独立しており、例えば、スクリプト言語により変更可能である。従って、適用する場面が異なる場合には、システム自体を変更せず、動作の変更を制御できる。例えば、日本市場向けに作成したナンバー読み取り(日本のナンバーのパターン)を開発した後、北米向け(アメリカのナンバープレートのパターン)読み取りには変更が必要であるが、簡単に変更可能である。また、自動車のナンバープレート以外のデータを認識するシステムを構築する場合も、容易に変更構築可能である。
ルールは、正規表現を利用した形式で記述し、またシステム本体ではなく、独立したルールファイルに記述することにより、テキストエディタ等により容易に編集し、カスタマイズできる。
なお、本実施形態では、読み取りの対象を自動車のナンバープレートに特定したシステムの構成について説明したが、ルールデータベースの変更の容易性に基づき、読み取り対象を他の文字列(電話番号,住所など)とし、該読み取ったデータをOCR認識してデータ検索するように構成してもよい。
〔第2実施形態〕
上記第1実施形態では、OCRを利用して取得したデータによりデータ検索するシステムについて説明したが、ルールデータベースの変更が容易なため、カメラ等で撮影した画像データを天候,撮影時間等の撮影条件に基づいて、画像処理し(色補正等を行い)、該画像処理後の画像データで、画像データ検索するように構成してもよい。
即ち、ルールデータの条件部プログラムデータに撮影条件を示すデータを設定し、アクション部プログラムデータに色補正処理を指定するデータを設定するように構成する。
例えば、入口で顧客の自動車や顧客自身の肖像を撮影し、該撮影画像により顧客データを画像検索して、顧客データを取得するようなシステムにおいて、顧客データの検索のヒット率を向上することができる。
以上示したように、撮影データのOCR結果のように信憑性の低いデータに基づいて検索処理を行うデータ検索システム全般に対して、検索のヒット率を向上し、ユーザの満足度を向上させることができる利便性の高いデータ検索システムを構築することができる。
なお、上記各実施形態及びその変形例の全て又はいずれかを組み合わせた構成も全て本発明に含まれるものである。
また、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
以下、図10に示すメモリマップを参照してデータ検索システムを構成する情報処理装置で読み取り可能なデータ処理プログラムの構成について説明する。
図10は、本発明に係るデータ検索システムを構成する情報処理装置で読み取り可能な各種データ処理プログラムを格納する記録媒体(記憶媒体)のメモリマップを説明する図である。
なお、特に図示しないが、記録媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、インストールするプログラムやデータが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
本実施形態における図7,図8に示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記録媒体により、あるいはネットワークを介して外部の記録媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
以上のように、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記録媒体は本発明を構成することになる。
プログラムコードを供給するための記録媒体としては、例えば、フレキシブルディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,DVD−ROM,磁気テープ,不揮発性のメモリカード,ROM,EEPROM,シリコンディスク等を用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのソフトウェアによって表されるプログラムをネットワーク上のサーバ,データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
本発明は、撮影データのOCR結果のように信憑性の低いデータに基づいて検索処理を行うデータ検索システムの検索ヒット率を向上させる用途に適用できる。
本発明の情報処理装置を適用可能なデータ検索システムの構成の一例を示すシステム構成図である。 図1で示したルールデータベースのデータ構成の一例を示すデータ構成図である。 図1で示した検索候補展開エンジンの構成を示すブロック図である。 図1で示した顧客データベースのデータ構成の一例を示すデータ構成図である。 図1で示した画面への検索結果表示の一例を示す模式図である。 図1に示したサーバのハードウェア構成を示すブロック図である。 本発明の情報処理装置を適用可能なデータ検索システムにおける第1の制御処理手順の一例を示すフローチャートである。 本発明の情報処理装置を適用可能なデータ検索システムにおける第2の制御処理手順の一例を示すフローチャートである。 検索候補展開エンジンによる展開処理結果の一例を示す模式図である。 本発明に係るデータ検索システムを構成する情報処理装置で読み取り可能な各種データ処理プログラムを格納する記録媒体(記憶媒体)のメモリマップを説明する図である。
符号の説明
101 カメラ
102 ナンバープレート画像
103 サーバ
104 ナンバープレート切り出しモジュール
105 OCR部
106 検索候補展開エンジン
107 検索エンジン
108 顧客データベース
110 ルールデータベース
201 入力文字列処理部
202 条件部読込部
203 アクション部実行部
204 出力文字列処理部
205 ルール読込部
206 フラグ判定部
207 条件部実行部
208 ルール展開部
209 アクション部読込部
210 展開文字列保持部
401 CPU
402 RAM
411 HDD

Claims (10)

  1. 撮影された画像データから文字列を認識する認識手段と、
    前記認識手段により認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化手段と、
    前記正規化手段により生成された複数の検索候補データに基づいてデータ検索を行う検索手段と、
    前記検索手段の検索結果を出力する出力手段と、
    を有することを特徴とする情報処理装置。
  2. カメラにより撮影された自動車のナンバープレートを含む画像データからナンバープレートに記載された文字列を認識する認識手段と、
    前記認識手段により認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化手段と、
    顧客の使用する自動車のナンバープレートの情報と顧客情報とを紐付けて保持する顧客データベースと、
    前記正規化手段により生成された複数の検索候補データをキーにして前記顧客データベースから顧客データを検索する検索手段と、
    前記検索手段により検索された顧客データを出力する出力手段と、
    を有することを特徴とする情報処理装置。
  3. 入力される、カメラにより撮影された自動車のナンバープレートを含む画像データからナンバープレート画像データを切り出す切り出し手段を設け、
    前記認識手段は、前記切り出し手段により切り出されたナンバープレート画像データからナンバープレートに記載された文字列を認識することを特徴とする請求項2記載の情報処理装置。
  4. 前記正規化手段による正規化処理のルールを格納したルールデータベースを設け、
    前記正規化手段は、前記ルールデータベースに格納されたルールに基づいて文字列データに正規化処理を行うことを特徴とする請求項1〜3のいずれかに記載の情報処理装置。
  5. 前記ルールデータベースは、前記正規化手段による正規化処理のルールを複数保持するものであり、
    前記正規化手段は、前記複数のルールに基づいて文字列データに正規化処理を行う際には、文字列データに対して前記いずれかのルールに基づく正規化処理を行い、該正規化処理結果に対して次のルールに基づく正規化処理を順次行うことを特徴とする請求項4記載の情報処理装置。
  6. 前記ルールデータベースは、ルールを適用する際の条件を示す条件データと、該条件データを満たした場合に、実行する正規化処理を示すアクションデータとを含むものであり、
    前記正規化手段は、前記認識手段により認識された文字列データと、前記ルールデータベース内の条件データとを比較して、前記文字列データが前記条件データが示す条件を満たす場合に、前記ルールデータベース内のアクションデータが示す正規化処理を実行して、前記文字列データから複数の検索候補データを生成することを特徴とする請求項4又は5記載の情報処理装置。
  7. 撮影された画像データに基づいてデータ検索するデータ検索方法において、
    撮影された画像データから文字列を認識する認識ステップと、
    該認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化ステップと、
    該生成された複数の検索候補データに基づいてデータ検索を行う検索ステップと、
    該検索結果を出力する出力ステップと、
    を有することを特徴とするデータ検索方法。
  8. カメラにより撮影された自動車のナンバープレートを含む画像データに基づいてデータ検索するデータ検索方法において、
    カメラにより撮影された自動車のナンバープレートを含む画像データからナンバープレートに記載された文字列を認識する認識ステップと、
    該認識された文字列データに正規化処理を加えて複数の検索候補データを生成する正規化ステップと、
    前記正規化ステップで生成された複数の検索候補データをキーにして、顧客の使用する自動車のナンバープレートの情報と顧客情報とを紐付けて保持する顧客データベースから、顧客データを検索する検索ステップと、
    該検索された顧客データを出力する出力ステップと、
    を有することを特徴とするデータ検索方法。
  9. 請求項7又は8に記載されたデータ検索方法を実行するためのプログラム。
  10. 請求項7又は8に記載されたデータ検索方法を実行するためのプログラムをコンピュータが読み取り可能に記憶した記録媒体。
JP2004349215A 2004-12-02 2004-12-02 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体 Pending JP2006163446A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004349215A JP2006163446A (ja) 2004-12-02 2004-12-02 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004349215A JP2006163446A (ja) 2004-12-02 2004-12-02 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2006163446A true JP2006163446A (ja) 2006-06-22

Family

ID=36665438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004349215A Pending JP2006163446A (ja) 2004-12-02 2004-12-02 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2006163446A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008099664A1 (ja) * 2007-02-15 2008-08-21 Mitsubishi Heavy Industries, Ltd. 車両番号認識装置
JP2018156403A (ja) * 2017-03-17 2018-10-04 富士ゼロックス株式会社 検索装置、検索プログラム、および検索システム
CN110956169A (zh) * 2018-09-27 2020-04-03 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及电子设备
JP2021162964A (ja) * 2020-03-30 2021-10-11 デジタルア−ツ株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008099664A1 (ja) * 2007-02-15 2008-08-21 Mitsubishi Heavy Industries, Ltd. 車両番号認識装置
JP4727732B2 (ja) * 2007-02-15 2011-07-20 三菱重工業株式会社 車両番号認識装置
JP2018156403A (ja) * 2017-03-17 2018-10-04 富士ゼロックス株式会社 検索装置、検索プログラム、および検索システム
US10977301B2 (en) 2017-03-17 2021-04-13 Fuji Xerox Co., Ltd. Search apparatus, search system, and non-transitory computer readable medium
JP7017027B2 (ja) 2017-03-17 2022-02-08 富士フイルムビジネスイノベーション株式会社 検索装置、検索プログラム、および検索システム
CN110956169A (zh) * 2018-09-27 2020-04-03 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及电子设备
JP2021162964A (ja) * 2020-03-30 2021-10-11 デジタルア−ツ株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7227935B2 (ja) 2020-03-30 2023-02-22 デジタルアーツ株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Similar Documents

Publication Publication Date Title
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US20020138476A1 (en) Document managing apparatus
US20090006482A1 (en) Electronic image filing method, electronic image filing device and electronic image filing system
KR100701132B1 (ko) 정보처리장치 및 정보처리방법
US20070050709A1 (en) Character input aiding method and information processing apparatus
JP2001265811A (ja) 画像検索システムおよび画像検索方法
JP2007026316A (ja) 画像管理装置、ならびに画像管理用コンピュータプログラムおよびそれを記録した記録媒体
EP2806336A1 (en) Text prediction in a text input associated with an image
JP2010205257A (ja) 画像管理装置およびその制御方法およびプログラム
US11797551B2 (en) Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method
JP2005107931A (ja) 画像検索装置
JP2006163446A (ja) 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体
CN115841862A (zh) 病例报告表生成方法、装置、设备及存储介质
JPH0729003A (ja) 指紋照合装置
JP6370082B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP3768743B2 (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
JP2002169823A (ja) データベース検索プログラムを記録したコンピュータ読み取り可能な記録媒体、データベース検索方法およびデータベース検索装置
JP2001320571A (ja) 帳票筆跡データの処理システム及び処理方法
CN107967300B (zh) 机构名称的检索方法、装置、设备及存储介质
KR20220086336A (ko) Ocr을 이용한 실내 위치추정 방법 및 장치
JP2004363871A (ja) データ保存装置とその方法、及びそのプログラムとそのプログラムを記録した記録媒体
JP2910662B2 (ja) 回路接続情報の比較装置
US20210149721A1 (en) Information processing system, information processing apparatus, and non-transitory computer readable medium storing program
JP2006185342A (ja) 情報処理装置および文字列分類方法およびプログラムおよび記録媒体