WO2023007669A1

WO2023007669A1 - 認識装置、認識方法、及び認識プログラム

Info

Publication number: WO2023007669A1
Application number: PCT/JP2021/028191
Authority: WO
Inventors: 皓平森; 夕貴横畑; 亜紀林; 崇洋秦; 和昭尾花
Original assignee: 日本電信電話株式会社
Priority date: 2021-07-29
Filing date: 2021-07-29
Publication date: 2023-02-02
Also published as: JPWO2023007669A1

Abstract

認識装置は、車両が走行する環境において取得される時系列の画像を取得し、前記画像から所定の文字列の文字の各々を検出し、検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する。

Description

認識装置、認識方法、及び認識プログラム

　開示の技術は、認識装置、認識方法、及び認識プログラムに関する。

　ドライブレコーダ等の車載カメラの映像に映った他の物体の形状を認識する技術がある。

　ここで、他の物体ついて、例えば、煽り運転といった危険行為を繰り返す問題の車両を観測することを想定する。問題の車両に関して、検知エリアに進入した場合に自動で検知する技術が開発されている（非特許文献１参照）。問題の車両は、別地点、別時間、及び別の車両に対しても危険行為を繰り返すことが想定される。よって、その車両が危険であることを、他の車両にも通知する必要性が高いと考えられる。そのためには当該車両を識別可能な情報を得ることが重要となる。しかし、危険行為を繰り返す車両の側から特定可能な情報として、位置情報、行動履歴、及び車内の映像等を提供するとは考えにくく、外部から特定する必要がある。

　車両を特定するためには、例えば、車種、車体の色、自動車登録番号標（ナンバープレート）に記載のナンバーが特定に有用な情報となる。図１は、観測車両から他の車両を観測する場合について模式的に示す図である。図１に示すように、観測車両（Ａ１）から他の車両（Ａ２）を観測して、他の車両のナンバープレート（Ａ３）を対象として形状を認識することが想定される。また、同一車種、又は同一色の車両が問題の車両の近隣に存在する可能性が存在しており、一意に問題の車両を特定するにはナンバーの特定が必須となる。

"ケンウッド、あおり運転を自動検知する「AIセンシング」機能搭載ドラレコ「DRV-MR8500」",URL:"https://car.watch.impress.co.jp/docs/news/1266971.html" "ナンバープレート認識",URL:" https://www.jstage.jst.go.jp/article/isciesci/43/6/43_KJ00003974529/_article/-char/ja/" "Real-Time Brazilian License Plate Detection and Recognition Using Deep Convolutional Neural Networks",URL:"http://www.inf.ufrgs.br/~smsilva/real-time-brazilian-alpr/" "国土交通省／地方版図柄入りナンバープレート",URL:"https://www.mlit.go.jp/jidosha/jidosha_tk6_000036.html"

　既存技術として、ナンバープレートを物体検知技術により検知し、その中に記載された文字を読み取る手法が提案されている（非特許文献２及び非特許文献３参照）。フロント／リア検出をし、ナンバープレート検出、文字認識（文字検知）と段階的に処理する手法である。

　図２は、ナンバープレートの検出から認識までの処理の一般的な流れを示す図である。（１）映像（時系列の画像）の取得、（２）ナンバープレート検出、（３）領域分割、（４）領域ごとの文字認識（ＯＣＲ又は物体検知）、の流れである。ナンバープレート検出では、例えば物体検知、又は２値化による輪郭抽出及び四角形の形状から検出する。また、（２）の前に車両の物体検知を挟むことで検知精度を上げる場合もある。また、（３）の前に領域の形状が長方形になるよう傾き補正を行う場合もある。

　ここで、ナンバープレートの認識は、非特許文献３において想定されている英字圏ではアルファベット２６文字＋数字１０種によって構成され、主要となる文字列が大きく一行であらわされることが多いため、文字認識が比較的容易であることが想定される。しかし、日本又は中国のようなローカライズされたナンバープレートの態様がある国においては、複数の段に分かれたひらがなや漢字を含む文字の認識が必要となり、パターンが複雑になるケースが想定される。また、非特許文献３の例では３段階の物体検知を実施しており、計算コストは大きい。

　例えば、一部の文字のサイズが小さいケース、漢字の文字が含まれるケース、数字１～３桁について一部桁がアルファベットのケース、ひらがな１文字のケース、及びドット（・）が含まれるケース等である。ドットが含まれるケースとは、例えば「・１－４３」のように３桁以下の数字の場合が挙げられる。また、ナンバープレートの背景についても、一般用、若しくは事業用、又は普通車両、若しくは軽乗用車、及び車検切れ等の区分に応じて複数の種類の背景が存在し、車体の色には関係なく決定される。また、地域特有のご当地ナンバープレートの影響で背景のバリエーションが増えている（非特許文献４参照）。このようにナンバープレートの認識に関する課題がある。

　また、高価な高性能カメラと異なり、車載カメラでは被写体のブレ、すなわち観測車両及び対象車両との相対速度の影響で発生するブレの影響が大きくなる。主に露光及び反射等の撮影条件が都度異なるため従来の手法では認識が困難なケースがある。

　例えば、車体色とナンバープレートに関係性は無いため、ナンバープレートと車体色が類似している場合、境界が不明瞭となり、物体検知、及び形状認識が難しいことが想定される。例えば、白又は銀の車体に白地のナンバープレート、黒い車体に黒地のナンバープレート等が想定される。また、ナンバープレートの領域を拡大しても「ＸＸ―ＸＸ」の数字以外の部分は不明瞭であるケースもある。このように被写体のブレに関する課題がある。

　開示の技術は、上記の事情に鑑みてなされたものであり、特定の対象の認識が困難な場合であっても、検出した文字について評価を行い、対象を認識できる認識装置、認識方法、及び認識プログラムを提供することを目的とする。

　本開示の第１態様は、認識装置であって、車両が走行する環境において取得される時系列の画像を取得する取得部と、前記画像から所定の文字列の文字の各々を検出する検出部と、検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する形状認識部と、を含む。

　本開示の第２態様は、認識方法であって、車両が走行する環境において取得される時系列の画像を取得し、前記画像から所定の文字列の文字の各々を検出し、検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、処理をコンピュータに実行させる。

　本開示の第３態様は、認識プログラムであって、車両が走行する環境において取得される時系列の画像を取得し、前記画像から所定の文字列の文字の各々を検出し、検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、処理をコンピュータに実行させる。

　開示の技術によれば、特定の対象の認識が困難な場合であっても、検出した文字について評価を行い、対象を認識できる。

観測車両から他の車両を観測する場合について模式的に示す図である。ナンバープレートの検出から認識までの処理の一般的な流れを示す図である。本実施形態のナンバープレートの認識の流れの一例を示す図である。文字列の選定に関する条件に関する画像における例を示す図である。カメラと物体との写り方の関係を説明する図である。認識装置のハードウェア構成を示すブロック図である。本実施形態の認識装置の機能的な構成を示すブロック図である。画像から検知矩形により検出する場合の例を示す図である。検出した検知矩形の座標の情報の例を示す図である。認識装置による認識処理の流れを示すフローチャートである。

　以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。

　まず、本開示の概要について説明する。以下、本実施形態で説明する例では、観測車両から捉えた対象車両のナンバープレートを対象に形状を認識する場合を説明する。本実施形態の手法では、ナンバープレートに相当するパターン、又は形状を検知するのではなく、ナンバープレートに相当する文字列が描かれたパターンがナンバーであり、その文字列のパターンがある領域をナンバープレートであると認識する。以下、文字列に関する記載は文字列のパターンを表すことを前提とする。これは、ナンバープレートの背景がどのような色及び模様であったとしても、描かれている文字列はナンバープレートの記載ルールに沿っているからである。また、以下では、ナンバープレートの文字列の部分をナンバーと記載し、物体としてのナンバープレート自体をプレートと記載する場合がある。なお、本実施形態の手法は、ナンバープレートだけでなく、標識、及びその他文字が描かれた地物にも適用可能である。

　図３は、本実施形態のナンバープレートの認識の流れの一例を示す図である。例えば、課題において説明した一般的な例では、ナンバープレートの検出を行っていたが、本実施形態の手法では、（１）映像（時系列の画像）の取得をした後、（２）文字の検出を行い、ナンバープレートに相当する文字を選別する。文字の選別としては、例えば、数字４つが規定の間隔で存在し、かつ、高さがほぼ均一であり、画像の消失点より下側に存在している等の条件によって、ナンバープレートの文字列を選別する。また、（３）領域分割ではなく、逆に領域を拡大する。そして、（４）近接領域を文字認識の結果と結合する。これにより、ナンバープレートと車体色が類似しており境界が曖昧であっても、境界線を仮定することができる。また、地域特有のナンバープレートのように、背景が特殊な場合であっても、追加学習等を必要とせず対応できる。

　以下の実施形態の説明では、ナンバープレートのナンバー部分の文字列である「ＸＸ－ＸＸ」の箇所に焦点を当てて説明する。フォントの特殊性、及び記載ルールを考慮すると、「ＸＸ－ＸＸ」の部分だけでナンバープレートが認識できると想定される。ナンバープレートには制約があり、設置される位置、角度、プレート内の配置等に制約が課されている。なお、本実施形態において、文字列の文字の定義は、数字、記号、ひらがな、及び漢字を含む。

　図４は、文字列の選定に関する条件に関する画像における例を示す図である。例えば、消失点より下の領域に限定可能してもよく、画像下半分を対象に文字列を検出してもよい。また、「ＸＸ－ＸＸ」の部分であれば、０～９とドットしか登場しないため、車両の前方又は後方を撮影する車載カメラであれば、それらの文字列は水平方向かつ特定の間隔で画像に映る。また、英字が複数羅列されているものはナンバーではないと判断できる。また、特殊なフォントが用いられている場合は、フォントでも絞り込みが可能である。また、電柱の広告等における縦書きの文字列は検出から除外してもよい。

　本実施形態で活用する既存技術について説明する。

　文字列の文字の各々の検出には、例えば参考文献１に記載されている物体検知技術を活用する。この技術では、例えば物体、及び英数字の各文字を画像から検知し、外接矩形状の画像上の座標情報（矩形の左上ＸＹ座標、及び右下のＸＹ座標）を出力する手法であり、文字列の文字の各々を検出できる。
［参考文献１］" YOLO: Real-Time Object Detection",URL:"https://pjreddie.com/darknet/yolo/"

　また、参考文献２に記載されているようなカメラの原理を活用する。
［参考文献２］"遠近感",URL:" http://www.persfreaks.jp/main/intro/pers/"

　一般的な車載カメラのような単眼カメラを用いる場合、他車両、又はビルといった地物は消失点に対して収束するように描画される。また、非広角レンズを用いた場合、又は広角レンズの歪みの少ない領域を切り出す場合等、レンズ歪みの影響を受けにくい画像を用いるのであれば、画像に写る物体のサイズは、透視図のように近似することができ、基準となる地点からの距離に対して法則に従って変化する。

　図５は、カメラと物体との写り方の関係を説明する図である。カメラが他の車両の前方又は後方をまっすぐ捉えているとすると、投影面に並行な面、すなわち車体のフロント又はリアは奥行方向の距離が同一なら同じサイズで画像に写る。カメラと投影面は、３角形の相似で表現でき、底辺の長さと高さは同じ値になるからである。つまり観測車両に搭載された車載カメラと、ナンバーを読み取りたい他の車両とが何車線離れていたとしても、ナンバープレート自体の文字は同じように写る。

　以上を踏まえて本実施形態の構成を説明する。

　図６は、認識装置１００のハードウェア構成を示すブロック図である。

　図６に示すように、認識装置１００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１３、ストレージ１４、入力部１５、表示部１６及び通信インタフェース（Ｉ／Ｆ）１７を有する。各構成は、バス１９を介して相互に通信可能に接続されている。

　ＣＰＵ１１は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４からプログラムを読み出し、ＲＡＭ１３を作業領域としてプログラムを実行する。ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ＲＯＭ１２又はストレージ１４には、認識プログラムが格納されている。

　ＲＯＭ１２は、各種プログラム及び各種データを格納する。ＲＡＭ１３は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ１４は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等の記憶装置により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

　入力部１５は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。

　表示部１６は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部１６は、タッチパネル方式を採用して、入力部１５として機能してもよい。

　通信インタフェース１７は、端末等の他の機器と通信するためのインタフェースである。当該通信には、例えば、イーサネット（登録商標）若しくはＦＤＤＩ等の有線通信の規格、又は、４Ｇ、５Ｇ、若しくはＷｉ－Ｆｉ（登録商標）等の無線通信の規格が用いられる。

　次に、認識装置１００の各機能構成について説明する。図７は、本実施形態の認識装置の機能的な構成を示すブロック図である。各機能構成は、ＣＰＵ１１がＲＯＭ１２又はストレージ１４に記憶された認識プログラムを読み出し、ＲＡＭ１３に展開して実行することにより実現される。

　図７に示すように、認識装置１００は、取得部１１０と、認識部１１２と、記憶部１１４とを含んで構成されている。

　取得部１１０は、観測車両の車載カメラにより撮影された映像から時系列の画像を取得する。

　認識部１１２は、検出部１２０と、形状認識部１２２とを含んでいる。

　記憶部１１４には、対象となる地物に関する対応情報が格納されている。対応情報は、例えば、ナンバープレート又は標識のフォントの種類を識別する情報、ナンバーの間隔等の制約の情報である。

　検出部１２０は、画像から文字列の文字の各々を検出する。図８に示すように、物体検知技術を用いて、例えば画像内の数字（又は記号のドット等）で表される文字を、座標で規定される文字の範囲を表す検知矩形により検出する。図９に示すように、画像内の文字の位置は座標として検出でき、左上Ｘ、左上Ｙ、右下Ｘ、右下Ｙの各点の座標により検知矩形を得る。

　また、検出部１２０の検出では、予め特定のフォントの文字を検出するように学習されたモデルを用いて、特定のフォントの文字列の文字の各々を検出するようにしてもよい。

　形状認識部１２２は、検出された文字列の文字の各々の関係を評価し、文字列を含む対象の形状を認識する。

　形状認識部１２２による評価の例を説明する。形状認識部１２２は、関係性に関する評価として、各文字に相当する各検知矩形の位置関係を評価し、検知矩形の画素の関係を評価する。図８に示した例の場合で説明する。位置関係については、ナンバープレートのナンバーに該当する文字の各々が認識されるかを評価する。横軸方向は近接の度合いを評価する。５と６、７と８、３と０はそれぞれの画像の横軸方向で近接している。４文字について、２文字目と３文字目の離れ度合いを評価する。６と７は、５と６、７と８の横軸方向の間隔よりは若干離れている。画像の縦方向の位置座標が５、６、７、８の座標、３と０の座標が隣接している。そのため、４文字について、隣接度合いを評価する。画素の関係については、各検知矩形内の色の分布を評価し、５、６、７、８が同色かつグレー、３と０が同色で青又は紺に類似した色であるかを評価する。以上の評価の例では、位置関係では、１文字目及び２文字目、３文字目及び４文字目の間隔が横軸方向で近接しており、文字列の２文字目と３文字目の離れ度合い／間隔が制約を満たし、縦方向の位置座標が隣接していることをナンバーと認識する条件としている。画素の関係では、４文字の検知矩形の画素が同様の色の分布であること、をナンバーと認識する条件としている。また、２文字単位、又は４文字単位で認識してもよい。２文字単位であれば、５及び６と、７及び８とが横軸方向で近接しているかを評価する。また、ナンバーの間のハイフンを考慮してもよい。

　また、形状認識部１２２は、文字列の文字の各々についてフォントが同一であるかを判定し、同一と判定されたフォント同士の位置関係を評価する。記憶部１１４の対応情報を参照し、フォントが用いられていることが既知である地物のリストから対象を特定してもよい。フォントは、さらに各文字の縦横比といった特徴を用いて各検知矩形を比較して求めてもよい。

　以上で、形状認識部１２２は、ナンバーに相当する「ＸＸ－ＸＸ」の部分を認識できる。そこで、形状認識部１２２は、追加でナンバーに相当する「ＸＸ－ＸＸ」の部分の周囲の文字を認識してもよい。また文字の大きさから対象の形状を認識し検知してもよい。例えば、ナンバープレートの形状を認識しようとしている場合、「ＸＸ－ＸＸ」の上と左の領域に追加の文字が存在すること、「ＸＸ－ＸＸ」の各々の文字の文字サイズ、ここでは検知矩形の縦横の画素数を考慮し、周囲に文字、又は文字とは認識できない小さな要素として、「ＸＸ－ＸＸ」の文字と同色の画素がないかを探索し、ナンバープレートの写ったナンバー以外の画素を推測してもよい。

　また、形状認識部１２２では、ナンバープレートのナンバーに相当する４文字の文字列の周囲を探索して、周囲に、ナンバープレートの背景と同じ色の画素があればナンバープレートの領域であると判断する、という追加処理を実施してもよい。なお、ナンバープレートの背景は、座標で検出した矩形内の文字の画素以外の画素である。また、４文字の検知矩形の画素数からナンバープレートが写っていると想定される領域を認識してもよい。

　形状認識部１２２は、以上のようにしてナンバープレートを認識して、ナンバープレートが描画された画像上の領域を特定する。以上により、認識装置１００は、特定した領域により、ナンバープレートの形状を認識し、認識結果を出力する。

　なお、ナンバープレートを例に説明したが、例えば速度制限等を表す道路標識、又は路面標示を対象としてもよい。図８に示した標識であれば、３０等の特定の数字の文字列の文字の各々を検出する。そして、文字の各々を評価し、文字の色、フォント、及び同心円上の画素値が白から赤へと変化する場合等に道路標識と判断することができる。

　次に、認識装置１００の作用について説明する。

　図１０は、認識装置１００による認識処理の流れを示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から認識プログラムを読み出して、ＲＡＭ１３に展開して実行することにより、認識処理が行なわれる。

　ステップＳ１００において、ＣＰＵ１１は、取得部１１０として、観測車両の車載カメラにより撮影された映像から時系列の画像を取得する。

　ステップＳ１０２において、ＣＰＵ１１は、検出部１２０として、画像から文字列の文字の各々を検知矩形により検出する。

　ステップＳ１０４において、ＣＰＵ１１は、形状認識部１２２として、文字列の各文字に相当する検知矩形の位置関係を評価する。

　ステップＳ１０６において、ＣＰＵ１１は、形状認識部１２２として、検知矩形の画素の関係を評価する。

　ステップＳ１０８において、ＣＰＵ１１は、形状認識部１２２として、位置関係の評価結果、及び画素の関係の評価結果に基づいて、ナンバープレートが描画された画像上の領域を特定する。

　ステップＳ１１０において、ＣＰＵ１１は、形状認識部１２２として、特定した領域により、ナンバープレートの形状を認識し、認識結果を出力する。

　以上説明したように本実施形態の認識装置１００によれば、特定の対象の認識が困難な場合であっても、検出した文字について評価を行い、対象を認識できる。

　また、物体検知技術を用いて数値を含む文字を認識する例を説明したが、パターンマッチング等の別手法を用いてもよい。例えば、複数のパターンを用意し、画像内にパターンと類似性のある箇所を探索する。

　ナンバープレートで使用される文字のうち、ドットは日本固有のナンバーに用いられる認識が困難な記号である。例えば、「００－０８」のような０を先頭にするルールになっておらず、「・・－・８」、「・・－２８」、「・１－２８」というように先頭が０の場合にはドットで表現するルールがある。そこで変形例として、あくまで物体検知技術は数字への適用として、ドットを個別に探索してもよい。検出した数字が１文字の場合は「左」の該当し得る画素にドットと捉えられそうなパターンの画素領域が３カ所ないかを、ハイフンの領域も考慮に入れて、探索する。そして、ドットの候補となる周辺の領域を２値化し、中央が黒画素、他は白画素であるかを判定することにより、ドットを検出する等である。また、検知した数位が２文字の場合は２カ所、３文字の場合は１か所が探索範囲となる。

　また車載カメラを用いる例を記載したが、車両が走行する環境を撮影するカメラであれば何を用いてもよい。交差点上部又は駐車場に設置された固定の監視カメラ、又はスピード違反車両を特定するための撮影機器でもよく、また歩道、又は店頭に設置された監視カメラ等を用いてもよい。またその場合、ナンバープレート及び道路標識等が真正面ではなく傾いて映る可能性があるため、検知した文字や数字の縦横比を考慮し、縦又は横に伸びている部分、又は曲がっている部分を補正して、形状認識してもよい。また、検知矩形同士の関係性の評価において、対象の１文字あたりの縦横比がどの程度であるかを考慮してもよい。

　なお、上記実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した認識処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）、及びＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、認識処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

　また、上記実施形態では、認識プログラムがストレージ１４に予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、及びＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリ等の非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

　以上の実施形態に関し、更に以下の付記を開示する。

　（付記項１）
　メモリと、
　前記メモリに接続された少なくとも１つのプロセッサと、
　を含み、
　前記プロセッサは、
　車両が走行する環境において取得される時系列の画像を取得し、
　前記画像から所定の文字列の文字の各々を検出し、
　検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、
　ように構成されている認識装置。

　（付記項２）
　認識処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
　車両が走行する環境において取得される時系列の画像を取得し、
　前記画像から所定の文字列の文字の各々を検出し、
　検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、
　非一時的記憶媒体。

１００認識装置
１１０取得部
１１２認識部
１１４記憶部
１２０検出部
１２２形状認識部

Claims

　車両が走行する環境において取得される時系列の画像を取得する取得部と、
　前記画像から所定の文字列の文字の各々を検出する検出部と、
　検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する形状認識部と、
　を含む認識装置。
　前記画像として、車載カメラにより撮影された前記画像を用い、
　前記形状認識部は、ナンバープレート及び標識の少なくとも一方を前記対象として、前記対象が描画された画像上の領域を特定することにより、前記対象の形状を認識する請求項１に記載の認識装置。
　前記形状認識部は、前記文字の各々の関係性について、位置関係について評価を行う請求項１又は請求項２に記載の認識装置。
　前記形状認識部は、前記文字列の文字の各々についてフォントを判定し、同一と判定されたフォント同士の位置関係を評価する請求項１～請求項３の何れか１項に記載の認識装置。
　前記検出部は、前記文字の各々の座標で規定される文字の範囲を表す検知矩形を検出し、
　前記形状認識部は、前記検知矩形における、文字の画素と文字以外の画素とについて、画素の関係の評価を行う請求項１～請求項４の何れか１項に記載の認識装置。
　前記検出部は、予め特定のフォントの文字を検出するように学習されたモデルを用いて、前記文字列の文字の各々を検出する請求項１～請求項５の何れか１項に記載の認識装置。
　車両が走行する環境において取得される時系列の画像を取得し、
　前記画像から所定の文字列の文字の各々を検出し、
　検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、
　処理をコンピュータに実行させる認識方法。
　車両が走行する環境において取得される時系列の画像を取得し、
　前記画像から所定の文字列の文字の各々を検出し、
　検出された前記文字列の文字の各々の関係を評価し、前記文字列を含む対象の形状を認識する、
　処理をコンピュータに実行させる認識プログラム。