JP2018513495A

JP2018513495A - デュアル埋め込み型光学文字認識（ｏｃｒ）エンジン

Info

Publication number: JP2018513495A
Application number: JP2017554868A
Authority: JP
Inventors: アイステンズピーター; アール．シューマッハーステファニー; ダブリュ．ワトソンベンジャミン
Original assignee: 3M Innovative Properties Co
Current assignee: 3M Innovative Properties Co
Priority date: 2015-04-20
Filing date: 2016-04-06
Publication date: 2018-05-24
Also published as: WO2016171901A1; TW201702936A; US20180107892A1; EP3286693A1; CN107533645A; AR104321A1

Abstract

デュアル埋め込み型光学文字認識（ＯＣＲ）エンジンを有するカメラシステム。本カメラシステムは、車両の画像を捕捉するためのカメラモジュールを含み、当該画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートと、ライセンスプレートから文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成する第１のＯＣＲエンジンと、ライセンスプレートから文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成する、第１のＯＣＲエンジンとは異なるパターンベースのＯＣＲエンジンと、を含む。本カメラシステムは、第１の読み取りと第２の読み取りとを比較するためのコンパレータを更に含む。第１の読み取りと第２の読み取りとが一致した場合、本システムは、最終読み取りとして一致読み取りを生成する。第１の読み取りと第２の読み取りとが一致しない場合、融合モジュールは、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、最終読み取りを生成する。

Description

本開示は、自動ナンバープレート認識（ＡＮＰＲ：automatic number plate recognition）システム又は自動ラインセンスプレート認識（ＡＬＰＲ：automatic license plate recognition）システムのための光学文字認識の分野に関する。より詳細には、本開示は、２つの異なる光学文字認識（ＯＣＲ：optical character recognition）エンジンを使用してライセンスプレート上の文字を識別することに関する。

ＡＮＰＲシステム及びＡＬＰＲシステム（本願明細書では互換的に使用される）は、様々なインテリジェントな輸送管理システム及び交通管理システムにおいて使用される。例えば、ＡＬＰＲシステムは、ライセンスプレート登録と関連付けられた個人に通行料の請求又は課金を送信することができるように、有料道路上のガントリーの下を通過する車両のライセンスプレート（ナンバープレート又はプレートとも称される）を読み取るために使用することができる。

ＡＬＰＲシステムは、参照により本明細書に組み込まれるＢｕｃｈｏｌｚの米国特許第７，５７９，９６５号に記載されているように、車両が時間制限付きの駐車場所にあまりにも長い時間にわたって駐車されているかどうかを監視する駐車取り締まりにおいて使用することができる。

ＡＬＰＲシステムは、紛失車両又は盗難車両の位置を特定するために使用することができる。このような適用例では、モバイルＡＬＰＲシステムを搭載した車両は、ライセンスプレート番号あるいは駐車車両又は運転時に通過した移動車両を検出し得る。当該システムは、検出したライセンスプレート番号を、盗難車両又は他の社会的な又は犯罪上の理由で手配されている個人に登録された車両を含むライセンスプレートの「ホットリスト」と比較することができる。このような適用例は、参照により本明細書に組み込まれるＳｉｍｏｎの米国特許第７，８８１，４９８号に記載されている。

これらの及び他のＡＬＰＲ適用例のそれぞれでは、ライセンスプレートの読み取り精度を最大化することが重要である。ライセンスプレート上の文字は、様々な理由で、ＯＣＲエンジンには検出しづらいことがある。例えば、多くのライセンスプレートは、プレートがどの国又は州から来たのかを示すために、特別な理由をサポートするために、あるいは、運転者が好きなプレートを選択することを可能にするために含まれる、様々な意匠又は絵柄を有する。これらの意匠又は絵柄は、絵柄が文字と重なった時に、あるいは絵柄がプレートの外周に配置された時であっても、プレート上の文字の検出をより困難にすることがある。

他の事例では、プレートは汚れていることがあり、あるいは、雪、砂、ライセンスプレートのフレーム、牽引棒又はヒッチ、あるいはプレートを見えにくくする他のオブジェクト又はデブリによって、部分的に又は完全に覆われている、又は見えにくくなっていることがある。プレートはまた、経年劣化し、天気、又は交通事故などの衝撃に起因して損傷を受け得る。

正確なプレートの読み取り又は文字認識を保証するために、様々な手法が使用される。１つの手法は、可視光及び赤外光のそれぞれにより照明されるプレートの画像を収集することである。これらの画像の一方又は両方を使用すると、２０１４年８月１３日付けで本願出願人により出願され、参照により本明細書に組み込まれる米国特許出願第６２／０３６，７９７号「ＯｐｔｉｃａｌｌｙＡｃｔｉｖｅＡｒｔｉｃｌｅｓａｎｄＳｙｓｔｅｍｓＩｎＷｈｉｃｈＴｈｅｙＭａｙＢｅＵｓｅｄ」により論じるように、より良好な読み取り精度を保証することができる。

更に、様々な種類のＯＣＲエンジン又はシステムを使用して、ライセンスプレート上の文字を読み取ることができる。しかしながら、様々なＯＣＲエンジンの正確な読み取りレートの結果及びレベルは、特定のエンジンが使用するアルゴリズムに基づいて変動する。

ライセンスプレート上の文字の正確な識別における改善が歓迎される。

本開示は、現状に勝る様々な利点を提供する。例えば、本開示は、ライセンスプレートの読み取り結果の精度の向上を可能にする。個々の文字レベルで、又はライセンスプレート番号全体に関して、精度の向上を達成することができる。２つ以上の異なるＯＣＲエンジンからの読み取り結果を使用すると、精度の工場が可能になる。

また、本開示は、複数の異なるＯＣＲエンジンを使用したリアルタイムでのライセンスプレートの読み取りの検証を可能にする。

本開示により、読み取り精度の信頼性の向上が能になる。多くの料金徴収策又は他の解決策では、オペレータは、読み取りが信頼性の高い読み取りでない限り、正確なプレートの読み取りを手動で確認することなく、違反者に違反切符又は罰金を送信するための、あるいは、プリペイドユーザが料金徴収エリアを通ることを可能にするアクションを起こすことはない。手動による確認は、人がライセンスプレート番号の読み取りとライセンスプレートの画像とを視覚的に比較することによって行われる。

本開示は、信頼性の高い読み取りの割合を増大させることができる。更に、読み取りの信頼性が高い結果として、システムの精度を全体的に向上させることができる。システム、読み取りが正確である高い信頼性を有することができる１つのそのようなやり方は、２つの異なるＯＣＲエンジンが、単一のライセンスプレート番号について、同一の読み取り結果を生成する時である。信頼性が高い読み取りの割合の向上及び精度の向上は、読み取り精度を確認するために必要な手動作業を低減することができる。これは、システムを動作させるコストを低減することによって、必要な手動作業を低減することによって、並びに、フォールスポジティブ読み取りの数及びフォールスポジティブに基づく誤って発行されたチケットの数を減少させることによって、料金徴収システム又は違反切符を発行し得る他のシステムについて著しい財政的恩恵を有することができる。本開示から生じる精度の向上はまた、違反切符を発行するためのベースを形成する正しい読み取りの数を増加し得る。

一事例では、本開示は、デュアル埋込み光学文字認識（ＯＣＲ）エンジンを有するカメラシステムを含む。本カメラシステムは、車両の画像を捕捉するためのカメラモジュールを含み、当該画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートと、ライセンスプレートから文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成する第１のＯＣＲエンジンと、ライセンスプレートから文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成する、第１のＯＣＲエンジンとは異なるパターンベースのＯＣＲエンジンと、を含む。本カメラシステムは、第１の読み取りと第２の読み取りとを比較するためのコンパレータを更に含む。第１の読み取りと第２の読み取りとが一致した場合、本システムは、最終読み取りとして一致読み取りを生成する。第１の読み取りと第２の読み取りとが一致しない場合、融合モジュールは、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、最終読み取りを生成する。

別の事例では、本開示は、ライセンスプレートの最終読み取りを生成するための方法を含む。本方法は、デュアル埋め込み型光学文字認識（ＯＣＲ）エンジンを有するカメラシステムを提供することであって、カメラシステムは、カメラモジュール、第１のＯＣＲエンジン、第２のＯＣＲエンジン、コンパレータ、及び融合モジュールを含む、カメラシステムを提供すること、を含む。本方法は、カメラモジュールを用いて、車両の画像を捕捉することであって、画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む、車両の画像を捕捉することと、特徴ベースのＯＣＲエンジンを用いてライセンスプレートから文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成することと、パターンベースのＯＣＲエンジンを用いてライセンスプレートから文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成することと、を更に含む。本方法は、第１の読み取りと第２の読み取りとを比較すること、を更に含む。第１の読み取りと第２の読み取りとが一致した場合、最終読み取りとして一致読み取りを生成する。第１の読み取りと第２の読み取りとが一致しない場合、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、融合モジュールを用いて最終読み取りを生成する。

別の事例では、本開示は、デュアル埋込み光学文字認識（ＯＣＲ）エンジンを有するカメラシステムを含む。本システムは、車両の画像を捕捉するためのカメラモジュールであって、画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む、カメラモジュールと、ライセンスプレートから文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成する第１のＯＣＲエンジンと、ライセンスプレートから文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成する第２のＯＣＲエンジンと、を備える。本システムは、第１の読み取りと第２の読み取りとを比較するためのコンパレータを更に備える。第１の読み取りと第２の読み取りとが一致した場合、本システムは、最終読み取りとして一致読み取りを生成する。第１の読み取りと第２の読み取りとが一致しない場合、融合モジュールは、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、最終読み取りを生成する。

いくつかの実施形態では、融合モジュールは、第１の読み取りから少なくとも１つの文字を選択し、第２の読み取りから少なくとも１つの文字を選択して、最終読み取りを生成する。

いくつかの実施形態では、融合モジュールは、最終読み取りと関連付けられた第３の信頼性レベルを提供する。更に、いくつかの事例では、第３の信頼性レベルが既定のしきい値を下回った場合、最終読み取りは無効として指定される。

いくつかの実施形態では、特徴ベースのＯＣＲエンジン及びパターンベースのＯＣＲエンジンは、第１の読み取り及び第２の読み取りを生成するために、同一の画像を評価する。

いくつかの実施形態では、特徴ベースのＯＣＲエンジン及びパターンベースのＯＣＲエンジンは、第１の読み取り及び第２の読み取りを生成するために、異なる画像を評価する。

いくつかの実施形態では、特徴ベースのＯＣＲエンジンは、第１のチャネルを通じて受信した情報から、第１の読み取りを生成し、パターンベースのＯＣＲエンジンは、第２のチャネルを通じて受信した情報から、第２の読み取りを生成する。

以下の各図は、本発明を図解するものである。各図は、本発明を更に説明し、明瞭にすることを目的とするものであり、本発明の範囲を制限するものではない。

ライセンスプレートの一例である。

ライセンスプレートの画像の例である。ライセンスプレートの画像の例である。

デュアル埋め込み型ＯＣＲエンジンを有するカメラシステムの例示的なブロック図である。

デュアル埋め込み型ＯＣＲエンジンのプロセス図である。

融合モジュールのプロセス図である。

同様の番号は、全般的に同様の構成要素を指すために使用される。それらの図面は原寸に比例せず、説明のみを目的とする。

図１は、ライセンスプレート１０の一例である。ライセンスプレート１０は、プレートフレーム１１により取り囲まれている。ライセンスプレート１０は、州の名前１２「ジョージア」、桃１３のイメージ、及びライセンスプレート番号１４を含む。ライセンスプレート番号は、ライセンスプレートにエンボス加工又は印刷されている英数字の識別子である。この事例では、ライセンスプレート番号１４は、７つの文字１５で構成されている。ライセンスプレート番号１４は、より多数の又はより少数の文字を含み得る。文字は、英数字、グラフィクス、シンボル、ロゴ、形状、及び他の識別子を含み得る。

図２ａ及び図２ｂは、異なる波長の照明で撮影された画像ライセンスプレートである。図２ａは、可視光又は可視スペクトルで撮影された図１のライセンスプレート２２の画像である。可視スペクトルとは、人の眼に見える（即ち、人の眼により検出することができる）電磁スペクトルの一部分を指す。典型的なヒトの眼は、約３９０〜７００ｎｍの波長に反応する。ライセンスプレート２２は、文字２５からなるライセンスプレート番号２４を含む。文字は、背景の桃２３の画像によりいくらか見えにくくなっている。

図２ｂは、赤外スペクトルの照明を使用して撮影された同じライセンスプレート２２の画像である。「赤外」という用語は、可視放射の波長よりも長い波長を有する電磁放射を指し、７００ナノメートル（ｎｍ）程度の可視スペクトルの公称レッドエッジから１０００ｎｍ超までから拡張する。赤外スペクトルは、この値を越えて拡張することが認識される。本明細書で使用する場合「近赤外」という用語は、７００ｎｍ〜１３００ｎｍの波長を有する電磁放射を指す。

このような画像は、状況に応じて赤外放射又は紫外放射に感応性であり、かつ、可視スペクトル外の再帰反射放射を検出することが可能であるセンサ（検出器）により、捕捉され得る。例示的な市販のカメラは、３ＭＣｏｍｐａｎｙが販売しているＰ３７２カメラ、Ｐ３８２カメラ、及びＰ４９２カメラを含むが、これらには限定されない。

図２ａ及び図２ｂのそれぞれに示したライセンスプレート２２は、光学活性物品であり得、したがって、反射性物品及び／又は再帰反射性物品である。「再帰反射性物品」とは斜めに入射する放射線を、放射源又はそのごく近傍に戻るように、その入射方向に対して概ね逆平行な方向に反射させる属性を有する。

図２ａ及び図２ｂに示した画像は、異なるチャネルを通じて捕捉された画像の例であり、図２ａの画像は、（オフアクシスで照明された）色チャネルで捕捉され、図２ｂの画像は、（オンアクシスで照明された）狭帯域赤外チャネルで捕捉される。異なる種類のチャネルに関する更なる議論は、２０１４年８月１３日付けで本願出願人により出願され、参照により本明細書に組み込まれる米国特許出願第６２／０３６，７９７号「ＯｐｔｉｃａｌｌｙＡｃｔｉｖｅＡｒｔｉｃｌｅｓａｎｄＳｙｓｔｅｍｓＩｎＷｈｉｃｈＴｈｅｙＭａｙＢｅＵｓｅｄ」に見ることができる。

図３は、デュアル埋め込み型ＯＣＲエンジン３２及び３４を有するカメラシステム３０の例示的なブロック図である。カメラシステム３０は、車両の画像を捕捉するためのカメラモジュール３１を含み、この画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む。カメラモジュール３１は、２つ以上の別個のチャネルを通じて同時に２つ以上の画像を捕捉することが可能であり得る。別の実施形態では、カメラモジュール３１は、単一のチャネルを通じて、又は２つ以上の別個のチャネルを通じて、同一のライセンスプレートの後続の画像を捕捉し得る。１つ、２つ又はそれ以上の捕捉された画像は、第１のＯＣＲエンジン３２及び第２のＯＣＲエンジン３４に送信され得る。いくつかの実施形態では、同一の画像（単数又は複数）が、第１のＯＣＲエンジン３２及び第２のＯＣＲエンジン３４のそれぞれに送信され得、他の実施形態では、異なる画像が、第１のＯＣＲエンジン３２及び第２のＯＣＲエンジン３４のそれぞれに送信され得る。いくつかの実施形態では、カメラシステム３０は、３つ以上の異なるＯＣＲエンジンを含み得る。

カメラモジュール３１により複数の画像が捕捉される実施形態では、選択基準を使用して、読み取り可能なプレートを含んでいる可能性が最も高い候補画像を識別し得る。次いで、ＯＣＲエンジンへの発信のために、これらの候補画像に優先順位をつける。画像選択プロセスのステップは、候補画像レコード（それぞれの画像レコードは、例えば、プレート発見データを含む画像メタデータを含んでいる）の時間順キューを維持する。このキューの長さは制限されている。新しい画像レコードは、チャネルから到着すると、既にキューにあるそれらの画像レコードに対して評価される。新しい画像レコードが、既にキューにあるいずれかよりも「良好である」と見なされた場合、又は、キューがフルでない場合、新しい画像レコードが、キューの後ろに加えられる。キューが「フル」である場合、キューの中でその時点で最も弱い候補が除去される。これは、画像選択を取り扱うための１つの方法であるが、本開示を読むと、当業者には、本発明の範囲内の他の方法が明らかになるであろう。

第１のＯＣＲエンジン３２は、画像中のライセンスプレート番号から文字を抽出し、それらを正しく識別することによって、第１のＯＣＲエンジン３２が受信した画像と関連付けられた第１の読み取り及び第１の信頼性レベルを生成する。「読み取り値」、「読み取り」又は「読み取り精度」とは、ライセンスプレート上のライセンスプレート番号又は文字の機械解釈を意味する。

信頼性レベルとは、文字又はライセンスプレート番号が正しいという尤度を規定するパーセンテージである。第１のＯＣＲエンジン３２は、ライセンスプレート番号全体の読み取りと関連付けられた信頼性レベルと、ライセンスプレート上のそれぞれの文字と関連付けられた、又はライセンスプレート番号の一部を含む信頼性レベルと、を生成し得る。第１のＯＣＲエンジン３２は、処理するライセンスプレートのそれぞれの画像について、同様のデータセットを生成し得る。

第１のＯＣＲエンジン３２とは異なる第２のＯＣＲエンジン３４は、画像中のライセンスプレート番号から文字を抽出し、それらを正しく識別することによって、第２のＯＣＲエンジン３４が受信した画像と関連付けられた第２の読み取り及び第２の信頼性レベルを生成する。第２のＯＣＲエンジン３４は、ライセンスプレート番号全体の読み取りと関連付けられた信頼性レベルと、ライセンスプレート上のそれぞれの文字と関連付けられた、又はライセンスプレート番号の一部を含む信頼性レベルと、を生成し得る。第２のＯＣＲエンジン３４は、処理するライセンスプレートのそれぞれの画像について、同様のデータセットを生成し得る。更に、ＯＣＲエンジンは、プレートの読み取りの複数の代替推測値を生成し、それぞれの推測値について、同様のデータセットを生成し得る。

第１のＯＣＲエンジン３２及び第２のＯＣＲエンジン３４は、異なる種類のＯＣＲエンジンである。例えば、一実施形態では、第１のＯＣＲエンジン３２は、特徴ベースのＯＣＲエンジンであり得る。特徴ベースのＯＣＲエンジンは、ループ、線、穴及び角など、文字の特徴に基づいて、文字を認識又は識別する。一実施形態では、第２のＯＣＲエンジン３４は、パターンベースのＯＣＲエンジンであり得る。パターンベースのＯＣＲエンジンは、文字と既知のパターンとの相関に基づいて、文字を認識又は識別する。２つのＯＣＲエンジンが異なるアルゴリズムを含み、それにより、同一の画像から、異なる文字又はライセンスプレート番号の読み取りを生成することが可能であるように、一方のＯＣＲエンジンは、もう一方ＯＣＲエンジンとは異なる。

第１のＯＣＲエンジン３２及び第２のＯＣＲエンジン３４は、それらの読み取り結果のそれぞれを送信する。読み取り結果は、コンパレータ３６への、ライセンスプレート番号及び／又は文字の読み取り、及び関連付けられた信頼性レベルを含む。コンパレータ３６は、第１の読み取りを第２の読み取りと比較する。第１の読み取りと第２の読み取りとが一致した場合、カメラシステム３０は、最終読み取りとして一致読み取りを生成する。

第１の読み取りと第２の読み取りとが一致しない場合、融合モジュール３８は、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、最終読み取りを生成する。融合モジュール３８は、それぞれの読み取り結果からの全ての候補文字を分析し、それぞれの文字と関連付けられた信頼性レベルに基づいて、正しい可能性が最も高い最終読み取り結果を計算する。

いくつかの実施形態では、融合モジュール３８は、第１の読み取りから少なくとも１つの文字を選択し、第２の読み取りから少なくとも１つの文字を選択して、最終読み取りを生成する。いくつかの実施形態では、融合モジュール３８は、第１の読み取り又は第２の読み取りのうちの１つのみから、全ての文字を選択する。いくつかの実施形態では、融合モジュール３８は、最終読み取りと関連付けられた第３の信頼性レベルを提供する。いくつかの実施形態では、第３の信頼性レベルが既定のしきい値を下回った場合、最終読み取りは無効として指定される。

融合モジュール３８及び／又はコンパレータ３６は、最終読み取りを通信モジュール３９に送信する。通信モジュール３９は、料金徴収、駐車取り締まり、又は他の適用例などの所望の適用例のために、最終読み取り及び関連付けられた信頼性レベルを、最終読み取りを使用する外部システム又はバックエンドシステムに送信してもよく、関連付けられた信頼性レベルを使用してもよい。

カメラシステム３０の様々な構成要素は、別々に図示されているが、単一のプロセッサ又はプロセッサの任意の組み合せに含まれるか、又はそれらによって実行され得る。更に、本開示を読むと当業者には明らかであるように、本発明のカメラシステムの多くの変形形態が本発明の範囲に含まれる。カメラシステムは、３つ以上のＯＣＲエンジンを含んでもよく、複数のチャネル及びそれらの任意の組み合せを通じて画像を捕捉することが可能なカメラモジュール（単数又は複数）を含み得る。

図４は、デュアル埋め込み型ＯＣＲエンジンのプロセス図である。プロセス４０は、第１のＯＣＲエンジン４２及び第２のＯＣＲエンジン４３のそれぞれが、カメラモジュールから、ライセンスプレート４１を含んでいる画像を受信することで開始する。第１のＯＣＲエンジン４２及び第２のＯＣＲエンジン４３のそれぞれは、コンパレータ４４への、読み取り結果、ライセンスプレート番号読み取り及び／又は文字読み取りと関連付けられた信頼性レベルの双方を生成する。

ＯＣＲエンジンのそれぞれからのライセンスプレート番号の読み取りが一致した場合、コンパレータは、ＯＣＲエンジンのそれぞれからの読み取り結果のそれぞれの信頼性レベルに基づく信頼性レベルと共に、一致読み取りを通信モジュール４６に送信する。多くの事例では、２つの異なるＯＣＲエンジンが同一の読み取りに達するので、この最終読み取りと関連付けられた信頼性レベルは比較的高いことが予想される。

２つのＯＣＲエンジンのそれぞれからのライセンスプレートの読み取りが一致しない場合、融合モジュール４５は、第１の読み取り、第１の信頼性レベル、第２の読み取り及び第２の信頼性レベルを使用して、最終読み取りを生成する。融合モジュール４５は、それぞれの読み取り結果からの全ての候補文字を分析し、それぞれの文字と関連付けられた信頼性レベルに基づいて、正しい可能性が最も高い最終読み取り結果を計算する。

いくつかの実施形態では、融合モジュール４５は、第１の読み取りから少なくとも１つの文字を選択し、第２の読み取りから少なくとも１つの文字を選択して、最終読み取りを生成する。いくつかの実施形態では、融合モジュール４５は、最終読み取りと関連付けられた第３の信頼性レベルを提供する。いくつかの実施形態では、第３の信頼性レベルが既定のしきい値を下回った場合、最終読み取りは無効として指定される。

融合モジュール４５は、最終読み取りを通信モジュール４６に送信する。通信モジュール４６は、料金徴収、駐車取り締まり、又は他の適用例などの所望の適用例のために、最終読み取り及び関連付けられた信頼性レベルを、最終読み取りを使用する外部システム又はバックエンドシステムに送信し得る。

図５は、融合モジュールの例示的なプロセス図である。ステップ５１では、第１のＯＣＲエンジン及び第２のＯＣＲエンジンからの読み取り結果を融合モジュールに送信する。いくつかの事例では、それぞれのＯＣＲエンジンから単一の読み取り結果のみが送信される。他の事例では、それぞれのＯＣＲエンジンからの複数の読み取り結果が融合モジュールに送信される。

図５に示した例では、ライセンスプレート番号における所与の文字の読み取り結果について説明する。第１のＯＣＲエンジンは、文字が「Ｂ」であって、その結果に９２％の信頼性レベルを割り当てられていることを識別した。第１のＯＣＲエンジンは、代替的には文字が「８」であって、関連付けられた信頼性レベルが７０％であることを識別した。第２のＯＣＲエンジンは、文字が「８」であって、関連付けられた信頼性レベルが９４％であることを識別した。第２のＯＣＲエンジンは、文字が「Ｂ」であって、関連付けられた信頼性レベルが９０％であることを識別した。

ステップ５２では、融合モジュールは、第１のＯＣＲエンジンからのトップ結果についての信頼性レベル（「Ｂ」；９２％）と、第２のＯＣＲエンジンからのトップ結果についての信頼性レベル（９０％）とを平均して、「Ｂ」についての平均信頼性レベル９１％を識別する。融合モジュールはまた、第２のＯＣＲエンジンからのトップ結果について信頼性レベル（「８」；９４％）と、第１のＯＣＲエンジンからのトップ結果の関連信頼性レベル（７０％）とを平均して、「８」の平均信頼性レベル８２％を識別する。

ステップ５３では、融合モジュールは、第１のＯＣＲエンジンからのトップ結果と関連付けられた平均信頼性レベル（「Ｂ」；９１％」）と、第２のＯＣＲエンジンからのトップ結果と関連付けられた平均信頼性レベル（「８」；８２％）とを比較して、平均信頼性レベルがより高いことを理由に、その所与の文字「Ｂ」についての最終結果を選択する。

図５に示したプロセスは、双方のエンジンについての信頼性値に着目して「最良の」結果を判定する。これは、第１の結果だけでなく、可能性が低い結果も比較することを含む。この手法は、それぞれのＯＣＲエンジンと、それぞれのＯＣＲエンジンからの最終読み取り結果だけでなく、可能な結果の群を問い合わせることができる融合モジュールとの間に双方向通信によって可能になる。この双方向通信は、ＯＣＲエンジンの埋め込み型構成と、ＯＣＲエンジンがカメラ又はカメラシステムに外部接続された構成とを通じてイネーブルされる。

当業者には、融合モジュールについて説明した方法は、２つ以上の異なるＯＣＲエンジンからの読み取り結果を融合させるために使用され得る多くの計算法の一例にすぎないことが明らかになるであろう。単一の画像に基づくそれぞれのＯＣＲエンジンからの複数の結果が融合され得る。複数のエンジンに基づくそれぞれのＯＣＲエンジンからの複数の結果を融合し得る。本開示を読むと、当業者には、本発明の範囲内の様々な計算法が明らかになるであろう。

本開示の技術は、サーバ、ラップトップコンピュータ、デスクトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、ハンドヘルドコンピュータ、スマートフォンなど、多種多様なコンピュータデバイスにおいて実装され得る。機能的態様を強調するために、任意の構成要素、モジュール又はユニットについて記載してきたが、必ずしも、異なるハードウェアユニットによる実現が必要とは限らない。また、本明細書に記載の技術は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合せによって実装され得る。モジュール、ユニット又は構成要素として説明した任意の特徴部は、集積論理デバイス中に一緒に実装しても、あるいは、個別であるが相互使用可能な論理デバイスとして別々に実装してもよい。いくつかの場合には、様々な特徴部は、集積回路チップ又はチップセットなど、集積回路デバイスとして実装され得る。更に、本明細書全体にわたって、それらの多くが固有の機能を実行する複数の別個のモジュールについて説明してきたが、モジュールの全ての全機能を単一のモジュールへと結合してしても、あるいは更なる追加のモジュールへと分割してもよい。本明細書で説明したモジュールは、例示的なものにすぎず、理解をより一層容易にするように記載したものである。

ソフトウェアに実装される場合、当該技術は、プロセッサによって実行される時に、上記で説明した方法のうちの１つ以上を実行する命令を含む、コンピュータ可読媒体によって少なくとも部分的に実現され得る。コンピュータ可読媒体は、タンジブルコンピュータ可読記録媒体を含み得、梱包材料を含み得るコンピュータプログラム製品の一部を形成し得る。コンピュータ可読記憶媒体は、同期型ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気的消去・再書き込み可能な読み出し専用メモリ（ＥＥＰＲＯＭ）、フラッシュメモリ、磁気又は光学データ記憶媒体等などのランダムアクセスメモリ（ＲＡＭ）を含み得る。また、コンピュータ可読記憶媒体は、ハードディスク、磁気テープ、コンパクトディスク（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）、ブルーレイディスク、ホログラフィックデータ記憶媒体又は他の不揮発性記憶デバイスなどの不揮発性記憶デバイスを含み得る。

本明細書で使用する場合「プロセッサ」という用語は、前述の構造のうちのいずれか、あるいは本明細書で説明した技術の実装に適した任意の他の構造を指し得る。加えて、いくつかの態様では、本明細書で説明した機能は、本開示の技術を実行するように構成された専用のソフトウェアモジュール又はハードウェアモジュール内に提供され得る。ソフトウェアに実装される場合であっても、当該技術は、ソフトウェアを実行するプロセッサなどのハードウェア、又はソフトウェアを記憶するメモリを使用し得る。このような場合には、本明細書で説明したコンピュータは、本明細書で説明した特定の機能を実行することが可能な特定のマシンを規定し得る。また、当該技術は、プロセッサと見なしてもよい１つ以上の回路又は論理素子に完全に実装してもよい。

Claims

デュアル埋め込み型光学文字認識（ＯＣＲ）エンジンを有するカメラシステムであって、
車両の画像を捕捉するためのカメラモジュールであって、前記画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む、カメラモジュールと、
前記ライセンスプレートから前記文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成する特徴ベースのＯＣＲエンジンと、
前記ライセンスプレートから前記文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成する、前記第１のＯＣＲエンジンとは異なるパターンベースのＯＣＲエンジンと、
前記第１の読み取りと前記第２の読み取りとを比較するためのコンパレータとを備え、
前記第１の読み取りと前記第２の読み取りとが一致した場合、前記システムは、最終読み取りとして一致読み取りを生成し、
前記第１の読み取りと前記第２の読み取りとが一致しない場合、融合モジュールは、前記第１の読み取り、前記第１の信頼性レベル、前記第２の読み取り及び前記第２の信頼性レベルを使用して、最終読み取りを生成する、
カメラシステム。
前記融合モジュールは、前記第１の読み取りから少なくとも１つの文字を選択し、前記第２の読み取りから少なくとも１つの文字を選択して、前記最終読み取りを生成する、請求項１に記載のシステム。
前記融合モジュールは、前記最終読み取りと関連付けられた第３の信頼性レベルを提供する、請求項１に記載のシステム。
前記第３の信頼性レベルが既定のしきい値を下回った場合、前記最終読み取りは無効として指定される、請求項３に記載のシステム。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、同一の画像を評価する、請求項１に記載のシステム。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、異なる画像を評価する、請求項１に記載のシステム。
前記特徴ベースのＯＣＲエンジンは、第１のチャネルを通じて受信した情報から、前記第１の読み取りを生成し、前記パターンベースのＯＣＲエンジンは、前記第２のチャネルを通じて受信した情報から、前記第２の読み取りを生成する、請求項１に記載のシステム。
ライセンスプレートの最終読み取りを生成するための方法であって、
デュアル埋め込み型光学文字認識（ＯＣＲ）エンジンを有するカメラシステムを提供することであって、前記カメラシステムは、カメラモジュール、特徴ベースのＯＣＲエンジン、パターンベースのＯＣＲエンジン、コンパレータ、及び融合モジュールを含む、カメラシステムを提供することと、
前記カメラモジュールを用いて、車両の画像を捕捉することであって、前記画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む、車両の画像を捕捉することと、
前記特徴ベースのＯＣＲエンジンを用いて前記ライセンスプレートから前記文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成することと、
前記パターンベースのＯＣＲエンジンを用いて前記ライセンスプレートから前記文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成することと、
前記第１の読み取りと前記第２の読み取りとを比較することと、
前記第１の読み取りと前記第２の読み取りとが一致した場合、最終読み取りとして一致読み取りを生成することと、
前記第１の読み取りと前記第２の読み取りとが一致しない場合、前記第１の読み取り、前記第１の信頼性レベル、前記第２の読み取り及び前記第２の信頼性レベルを使用して、前記融合モジュールを用いて最終読み取りを生成することとを含む、方法。
前記融合モジュールは、前記第１の読み取りから少なくとも１つの文字を選択し、前記第２の読み取りから少なくとも１つの文字を選択して、前記最終読み取りを生成する、請求項８に記載の方法。
前記融合モジュールは、前記最終読み取りと関連付けられた第３の信頼性レベルを提供する、請求項８に記載の方法。
前記第３の信頼性レベルが既定のしきい値を下回った場合、前記最終読み取りは無効として指定される、請求項１０に記載の方法。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、同一の画像を評価する、請求項８に記載の方法。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、異なる画像を評価する、請求項８に記載の方法。
前記特徴ベースのＯＣＲエンジンは、第１のチャネルを通じて受信した情報から、前記第１の読み取りを生成し、前記パターンベースのＯＣＲエンジンは、前記第２のチャネルを通じて受信した情報から、前記第２の読み取りを生成する、請求項８に記載の方法。
デュアル埋め込み型光学文字認識（ＯＣＲ）エンジンを有するカメラシステムであって、
車両の画像を捕捉するためのカメラモジュールであって、前記画像は、文字を含んでいるライセンスプレート番号を有するライセンスプレートを含む、カメラモジュールと、
前記ライセンスプレートから前記文字を抽出することによって、第１の読み取り及び第１の信頼性レベルを生成する第１のＯＣＲエンジンと、
前記ライセンスプレートから前記文字を抽出する、第２の読み取り及び第２の信頼性レベルを生成する第２のＯＣＲエンジンと、
前記第１の読み取りと前記第２の読み取りとを比較するためのコンパレータと、
を備え、
前記第１の読み取りと前記第２の読み取りとが一致した場合、前記システムは、最終読み取りとして一致読み取りを生成し、
前記第１の読み取りと前記第２の読み取りとが一致しない場合、融合モジュールは、前記第１の読み取り、前記第１の信頼性レベル、前記第２の読み取り及び前記第２の信頼性レベルを使用して、最終読み取りを生成する、
カメラシステム。
前記融合モジュールは、前記第１の読み取りから少なくとも１つの文字を選択し、前記第２の読み取りから少なくとも１つの文字を選択して、前記最終読み取りを生成する、請求項１５に記載のシステム。
前記融合モジュールは、前記最終読み取りと関連付けられた第３の信頼性レベルを提供する、請求項１５に記載のシステム。
前記第３の信頼性レベルが既定のしきい値を下回った場合、前記最終読み取りは無効として指定される、請求項１７に記載のシステム。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、同一の画像を評価する、請求項１５に記載のシステム。
前記特徴ベースのＯＣＲエンジン及び前記パターンベースのＯＣＲエンジンは、前記第１の読み取り及び前記第２の読み取りを生成するために、異なる画像を評価する、請求項１５に記載のシステム。
前記特徴ベースのＯＣＲエンジンは、第１のチャネルを通じて受信した情報から、前記第１の読み取りを生成し、前記パターンベースのＯＣＲエンジンは、前記第２のチャネルを通じて受信した情報から、前記第２の読み取りを生成する、請求項１５に記載のシステム。