JP2021119506A

JP2021119506A - ナンバープレート認識方法、ナンバープレート認識モデルの訓練方法及び装置

Info

Publication number: JP2021119506A
Application number: JP2021076270A
Authority: JP
Inventors: ニ，シハン; Zihan Ni; ソン，イーペン; Yipeng Sun; ハン，ジュンウ; Junyu Han
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-12
Filing date: 2021-04-28
Publication date: 2021-08-12
Anticipated expiration: 2041-04-28
Also published as: CN111832568A; JP7166388B2; US20210209395A1; KR20210080291A; CN111832568B; EP3907660A1

Abstract

【課題】ナンバープレート認識の精度を大幅に向上させる方法、装置、記憶媒体及びプログラムを提供する。【解決手段】ナンバープレート認識方法ｈが、ナンバープレート領域の特徴マップの複数の特徴ベクトルを取得することにより、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。【選択図】図１

Description

本出願は、人工知能、コンピュータビジョン及び深層学習技術の分野に関し、具体的には画像認識技術の分野に関し、特に、ナンバープレート認識方法、ナンバープレート認識モデルの訓練方法及び装置に関する。

ナンバープレート認識は、都市車両管理の重要な技術の一つであり、様々な複雑なシーンでのナンバープレートの正確、且つ迅速な認識は、交通法執行、駐車場管理、及び道路通行の効率を効果的に向上させることができる。

現在、ナンバープレート認識技術は、検問所、道路監視などのシーンでほぼ成熟しているが、２行ナンバープレートや中国語文字などの複雑なシーンでの認識精度は、未だ理想的ではない。

本出願は、ナンバープレート認識方法、ナンバープレート認識モデルの訓練方法、装置、電子機器及び記憶媒体を提供する。

第１態様では、本出願第１の実施例は、ナンバープレート領域の特徴マップを取得するステップであって、前記特徴マップには複数の特徴ベクトルが含まれるステップと、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得するステップと、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得するステップと、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成するステップと、複数の前記ターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するステップと、を含むナンバープレート認識方法を提供する。

第２態様では、本出願の第２実施例は、複数の訓練画像を取得するステップと、前記複数の訓練画像を用いてナンバープレート認識モデルを訓練するステップであって、前記ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含むステップと、を含み、前記特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、前記特徴マップには複数の特徴ベクトルが含まれ、前記認識ネットワークは、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得し、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得し、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成し、複数の前記ターゲットコードをデコードしてナンバープレート内の複数の文字を取得するように構成されるナンバープレート認識モデルの訓練方法を提供する。

第３の態様では、本出願の実施例は、ナンバープレート領域の特徴マップを取得するように構成される取得モジュールであって、前記特徴マップには複数の特徴ベクトルが含まれる取得モジュールと、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得するように構成される第１エンコードモジュールと、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得するように構成される第２エンコードモジュールと、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成するように構成される生成モジュールと、複数の前記ターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するように構成されるデコードモジュールと、を含むナンバープレート認識装置を提供する。

第４の態様では、本出願の実施例は、複数の訓練画像を取得するように構成される取得モジュールと、前記複数の訓練画像を用いてナンバープレート認識モデルを訓練するように構成される訓練モジュールであって、前記ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含む訓練モジュールと、を含み、前記特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、前記特徴マップには複数の特徴ベクトルが含まれ、前記認識ネットワークは、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得し、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得し、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成し、複数の前記ターゲットコードをデコードしてナンバープレート内の複数の文字を取得するように構成されるナンバープレート認識モデルの訓練装置を提供する。

第５の態様では、本出願の実施例は、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されたメモリと、を含み、前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが第１態様に記載のナンバープレート認識方法、又は、第２態様に記載のナンバープレート認識モデルの訓練方法を実行可能である電子機器を提供する。

第６の態様では、本出願の実施例は、コンピュータ命令が記憶された非一時的コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに第１態様に記載のナンバープレート認識方法、又は、第２態様に記載のナンバープレート認識モデルの訓練方法を実行させる非一時的コンピュータ読み取り可能な記憶媒体を提供する。
第７の態様では、本出願の実施例は、コンピュータに第１態様に記載のナンバープレート認識方法、又は、第２態様に記載のナンバープレート認識モデルの訓練方法を実行させるコンピュータプログラムを提供する。

出願の上記の一実施例は、以下の利点又は有益な効果を有する。ナンバープレート領域の特徴マップを取得し、特徴マップには複数の特徴ベクトルが含まれ、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。この方法では、抽出されたナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを、それぞれリカレントニューラルネットワークを用いて正逆方向にエンコードすることで、エンコードされた特徴にはコンテキスト情報が含まれるようになり、ナンバープレート認識の精度が大幅に向上する。

この部分に記載された内容は、本出願の実施例の肝心な又は重要な特徴を特定することを意図しておらず、本出願の範囲を限定するものでもないことを理解されたい。本出願の他の特徴は、以下の説明を通じて容易に理解される。

図面は、本解決的手段をより良く理解するために使用され、本出願を制限するものではない。
本出願の実施例１に係るナンバープレート認識方法の概略フローチャートである。本出願の実施例２に係るナンバープレート認識方法の概略フローチャートである。本出願の実施例に係るデコードプロセスのサブフローの概略図である。本出願の実施例３に係る特徴マップを取得するためのサブフローの概略図である。本出願の実施例４に係るナンバープレート認識モデルの訓練方法の概略フローチャートである。本出願の実施例５に係るサンプル画像を取得するためのサブフローの概略図である。本出願の実施例６に係るナンバープレート認識装置の概略構成図である。本出願の実施例７に係るナンバープレート認識モデルの訓練装置の概略構成図である。本出願の実施例に係る電子機器の概略構成図である。

本出願の例示的な実施例について、図面を参照しながら以下に説明し、理解を容易にするためにその中には本出願の実施例の様々な詳細事項が含まれており、それらは単なる例示するものと見なされるべきである。したがって、当業者は、本出願の範囲及び精神から逸脱することなく、ここで説明される実施例に対して様々な変更及び修正を行うことができる。同様に、わかりやすく且つ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

従来のナンバープレート認識システムは、一般に、エッジ検出、輪郭抽出などの方法でナンバープレートを位置決めしてから、ナンバープレートの四隅の点の位置に基づいて補正を行い、続いてＭＳＥＲなどの方法を用いて単一の文字の検出を行い、単一の文字領域ごとにＳＶＭなどの分類器を用いて分類を行い、最終的にすべての単一の文字の認識結果を統合してナンバープレート番号を取得する。

ただし、従来のナンバープレートのエンドツーエンドシステムは、ニューラルネットワークに基づくコネクショニスト時系列分類モデル（ＣｏｎｎｅｃｔｉｏｎｉｓｔＴｅｍｐｏｒａｌＣｌａｓｓｉｆｉｃａｔｉｏｎ，ＣＴＣ）を用いてナンバープレート認識を行い、１行ナンバープレートしか処理できないため、行分割する方式で複数行文字のナンバープレート認識を行うことが多い。２行ナンバープレートを認識する時に、コンテキスト情報を利用することができなため、特徴表現力が限られ、ナンバープレートの認識効果が不十分となる。

上記の従来のナンバープレート認識技術に存在する技術的問題に対し、本出願は、ナンバープレート領域の特徴マップを取得するステップであって、特徴マップには複数の特徴ベクトルが含まれるステップと、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得するステップと、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得するステップと、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成するステップと、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するステップと、を含むナンバープレート認識方法を提供する。抽出されたナンバープレート領域の特徴を、リカレントニューラルネットワークを用いて正逆方向にエンコードすることで、特徴コードにはコンテキスト情報含まれるようになり、特徴表現力が向上し、複数種類のナンバープレートをより正確に認識することができ、ナンバープレート認識効果を最適化することができる。

以下、本出願の実施例に係るナンバープレート認識方法、ナンバープレート認識モデルの訓練方法、装置、電子機器及び記憶媒体について、図面を参照しながら説明する。

図１は、本出願の実施例１に係るナンバープレート認識方法の概略フローチャート図である。

本出願の実施例は、このナンバープレート認識方法がナンバープレート認識装置に配置されたことを例にして説明するが、このナンバープレート認識装置は、任意の電子機器に適用することができ、これにより、この電子機器がナンバープレート認識機能を実行することができる。

電子機器は、パーソナルコンピュータ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ、ＰＣと略称する）、クラウド機器、モバイル機器などであってもよく、モバイル機器は、例えば、携帯電話、タブレットコンピュータ、パーソナルデジタルアシスタント、ウェアラブル機器、車載機器などの各種のオペレーティングシステムを有するハードウェア機器であってもよい。

図１に示すように、このナンバープレート認識方法は、以下のステップ１０１〜ステップ１０５と、を含んでもよい。

ステップ１０１において、ナンバープレート領域の特徴マップを取得する。

特徴マップには複数の特徴ベクトルが含まれる。

例えば、ナンバープレート領域の特徴マップには、ナンバープレートの色特徴、テクスチャ特徴、形状特徴、空間関係特徴などが含まれてもよい。

本出願の実施例では、撮影機器を用いてナンバープレートを撮影し、ナンバープレート領域を含むナンバープレート画像を取得した後、畳み込みニューラルネットワークモデルによりナンバープレート画像の特徴マップを抽出し、ナンバープレート画像の特徴マップからナンバープレート領域の特徴マップを決定することができる。

なお、ナンバープレート画像を取得する際、通常の撮影機器を用いてナンバープレートを撮影して、ナンバープレート領域を含む２次元画像を取得してもよいし、深度カメラを用いてナンバープレートを撮影して、ナンバープレート領域を含む３次元画像を取得してもよいが、ここでは限定されない。

例えば、畳み込みニューラルネットワークは、畳み込み層とプーリング層とを含み、畳み込み層によりナンバープレート画像の特徴抽出を行って、ナンバープレート画像の特徴マップを取得し、ナンバープレート画像の特徴マップからナンバープレート領域の特徴マップを決定することができる。

ナンバープレート認識のスピードを制御するために、畳み込みニューラルネットワークに入力されたナンバープレート画像は、例えば５１２＊５１２などの特定のサイズにスケーリングすることができる。しかし、小さいサイズのナンバープレートのナンバープレート画像におけるサイズがより小さいため小さいサイズのナンバープレートの認識効果が悪い。１つの可能な場合では、ナンバープレート画像の特徴抽出を行う時に、特徴抽出の範囲を適宜拡大して、ナンバープレート領域の特徴マップを得てもよい。

例えば、小さいサイズのナンバープレート領域の外接矩形を取得した後、幅又は高さを外側に０．５倍適宜拡張し、小さいサイズのナンバープレート領域の特徴抽出範囲を拡大することで、小さいサイズのナンバープレート領域の特徴マップを得てもよい。

２行ナンバープレートの国家標準サイズは２２０＊４４０であるので、分岐の認識にかかる時間を均一にし、且つ十分な特徴を確保するために、本出願では、８＊１６をナンバープレート領域の特徴マップのサイズとして選択することができる。

ステップ１０２において、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得する。

ステップ１０３において、複数の特徴ベクトルを、第２順序で順次第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得する。

リカレントニューラルネットワーク（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ，ＲＮＮ）は、シーケンスデータを入力として、シーケンスの進化方向に再帰を行い、且つ全てのノードがチェーンで接続される再帰型ニューラルネットワークである。

区別を容易にするために、本出願では、複数の特徴ベクトルを第１順序で順次エンコードするリカレントニューラルネットワークを第１リカレントニューラルネットワークと呼び、複数の特徴ベクトルを第２順序で順次エンコードするリカレントニューラルネットワークを第２リカレントニューラルネットワークと呼ぶ。当然ながら、他の命名方式も可能であり、本出願では単に例示的な表現とする。

同様に、区別を容易にするために、本出願では、各特徴ベクトルを第１リカレントニューラルネットワークに入力してエンコードし、エンコードされた特徴ベクトルを第１コードと呼び、各特徴ベクトルを第２リカレントニューラルネットワークに入力してエンコードし、エンコードされた特徴ベクトルを第２コードと呼ぶ。当然ながら、他の命名方式も可能であり、本出願では単に例示的な表現とする。

本出願では、ナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを取得した後、複数の特徴ベクトルを第１順序で第１リカレントニューラルネットワークに順次入力してエンコードし、第１リカレントニューラルネットワークのエンコード結果に基づいて、各特徴ベクトルの第１コードを取得することができる。さらに、複数の特徴ベクトルを第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得することができる。

なお、第１順序は、左から右への正方向順序であってもよいし、右から左への逆方向順序であってもよい。すなわち、複数の特徴ベクトルを左から右へ第１リカレントニューラルネットワークに順次入力してエンコードしてもよいし、複数の特徴ベクトルを右から左へ第１リカレントニューラルネットワークに順次入力してエンコードしてもよく、本出願ではこれについて限定しない。

同様に、第２順序は、左から右への正方向順序であってもよいし、右から左への逆方向順序であってもよく、本出願ではこれについて限定しない。本出願では、第１順序と第２順序を逆の順序とすることを必要とし、例えば、第１順序が左から右への正方向順序である場合、第２順序は右から左への逆方向順序である。すなわち、第１リカレントニューラルネットワークが複数の特徴ベクトルを正方向にエンコードする場合、第２リカレントニューラルネットワークは複数の特徴ベクトルを逆方向にエンコードする。

なお、上記のステップ１０２とステップ１０３は、上記の順序で実行することに限定されず、ステップ１０３を先に実行してからステップ１０２を実行してもよいし、又は、ステップ１０２とステップ１０３を同時に実行してもよい。本出願では、ステップ１０２とステップ１０３の実行順序について限定しない。

ステップ１０４において、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成する。

ターゲットコードは、各特徴ベクトルをエンコードすることによって最終的に得られたエンコード結果であってもよい。

可能な一実現形態として、各特徴ベクトルの第１コード及び第２コードを得た後、各特徴ベクトルに対応する第１コードと第２コードとの接続関係により、各特徴ベクトルの第１コード及び第２コードを組み合わせて、各特徴ベクトルのターゲットコードを生成することができる。

なお、ナンバープレート画像と画像内の文字は、順序のあるシーケンスに対応し、２つの方向の情報はいずれも有用な情報であることが理解されたい。本出願では、ナンバープレート領域の特徴マップには含まれる複数の特徴ベクトルを、それぞれリカレントニューラルネットワークを用いて正逆方向にエンコードすることで、各特徴に対応するターゲットコードにはコンテキスト情報が含まれるようになり、より有用な情報を抽出することができる。

ステップ１０５において、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。

ナンバープレート内の複数の文字は、中国語、数字及びアルファベットの任意の組み合わせであってもよい。また、複数の文字は、１行に配列されてもよいし、２行に配列されてもよく、ここでは限定しない。

本出願の実施例では、複数の特徴ベクトルの複数のターゲットコードを取得した後、複数のターゲットコードをデコードして、デコード結果に基づいてナンバープレート内の複数の文字を決定することができる。

可能な一実現形態として、複数の特徴ベクトルをエンコードして複数のターゲットコードを取得した後、複数のターゲットコードをリカレントニューラルネットワークに入力してデコードして、複数のデコードベクトルを得てもよい。さらに、複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定する。

本出願の実施例のナンバープレート認識方法は、ナンバープレート領域の特徴マップを取得し、特徴マップには複数の特徴ベクトルが含まれ、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。この方法では、抽出されたナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを、それぞれリカレントニューラルネットワークを用いて正逆方向にエンコードすることで、エンコードされた特徴にはコンテキスト情報が含まれるようになり、ナンバープレート認識の精度が大幅に向上する。

上記の実施例を基にして、１つの可能な場合では、各特徴ベクトルの第１コード及び第２コードを取得した後、各特徴ベクトルの第１コードと第２コードをスプライスして複数のターゲットコードを取得し、ターゲットコードをデコードしてナンバープレート内の複数の文字を得てもよい。次に、図２を参照して、上記の過程を詳しく説明し、図２は、本出願の実施例２に係るナンバープレート認識方法の概略フローチャート図である。

図２に示すように、このナンバープレート認識方法は、以下のステップ２０１〜ステップ２０６と、をさらに含んでもよい。

ステップ２０１において、ナンバープレート領域の特徴マップを取得する。

ステップ２０２において、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得する。

ステップ２０３において、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得する。

本出願の実施例では、ステップ２０１〜ステップ２０３の実現過程は、上記の実施例におけるステップ１０１〜ステップ１０３の実現過程を参照してもよく、ここでその説明が省略される。

なお、上記のステップ２０２とステップ２０３は、上記の順序で実行することに限定されず、ステップ２０３を先に実行してからステップ２０２を実行してもよいし、又は、ステップ２０２とステップ２０３を同時に実行してもよい。本出願では、ステップ２０２とステップ２０３の実行順序について限定しない。

ステップ２０４において、特徴ベクトルごとに、第１コードと第２コードとをスプライスして、複数のターゲットコードを取得する。

本出願の実施例では、複数の特徴ベクトルを、第１リカレントニューラルネットワーク及び第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コード及び第２コードを取得した後、各特徴ベクトルの第１コードと第２コードとをスプライスして、対応するターゲットコードを取得することができる。これにより、コンテキストを含む意味情報を取得することができる。

例えば、ナンバープレート領域の特徴マップＡに複数の特徴ベクトルＡ_ｉ，ｊが含まれ、ここで、ｉ、ｊは特徴マップの各点の座標を表す。第１リカレントニューラルネットワーク及び第２リカレントニューラルネットワークをそれぞれ用いて複数の特徴ベクトルＡ_ｉ，ｊをエンコードして、第１コードＦ_ｉ，ｊ及び第２コードＢ_ｉ，ｊを取得し、第１コードＦ_ｉ，ｊ及び第２コードＢ_ｉ，ｊを位置ごとにスプライスして、ターゲットコードを取得する。第１コードＦ_ｉ，ｊ及び第２コードＢ_ｉ，ｊのサイズはいずれもＣ＊Ｈ＊Ｗであり、すなわち、各位置はＣ次元ベクトルであり、したがって、位置ごとにスプライスすることは、Ｈ＊Ｗ内の位置ごとに２つの特徴マップのＣ次元ベクトルをスプライスすることであり、最終的に得されたターゲットコードは、２Ｃ＊Ｈ＊Ｗの特徴マップである。

ステップ２０５において、複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードして、複数のデコードベクトルを取得する。

本出願の実施例では、複数のターゲットコードをデコードする際に、リカレントニューラルネットワークを用いてもよく、エンコードに用いられるリカレントニューラルネットワークと区別するために、本実施例では、複数のターゲットコードをデコードするリカレントニューラルネットワークを第３のリカレントニューラルネットワークと呼ぶ。

可能な一実現形態として、第３のリカレントニューラルネットワークを用いて、複数のターゲットコードを順次デコードする際に、デコードプロセスを複数回実行してもよい。図３を参照すると、各回のデコードプロセスは、以下のサブステップ２０５１〜サブステップ２０５４、を含んでもよい。

サブステップ２０５１において、今回のデコードのターゲットコードを取得する。

複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードする際に、各回のエンコードは、いずれも対応するターゲットコードを有することが理解されたい。したがって、第３のリカレントニューラルネットワークを用いてデコードを複数回実行する過程において、今回のデコードのターゲットコードを取得する必要がある。

サブステップ２０５２において、前回のデコードにおいて第３のリカレントニューラルネットワークによって出力されたシステム状態ベクトルと、今回のデコードのターゲットコードとの類似度を決定する。

システム状態ベクトルとは、システム状態変数のある時刻における値であり、その時刻におけるシステムの状態と呼ばれる。例えば、ｔ＝０時刻における状態変数の値を、システム初期状態ベクトル、又は、開始状態ベクトルと呼ぶ。

可能な一実現形態として、空間注意メカニズムを使用して、前回のデコードにおいて第３のリカレントニューラルネットワークによって出力されたシステム状態ベクトルと、今回のデコードのターゲットコードとの類似度を算出してもよい。

サブステップ２０５３において、類似度に基づいて、今回のデコードのターゲットコードに重みを付けて、今回の重み付けコードを取得する。

第３のリカレントニューラルネットワークは、前回のデコードにおいて出力したシステム状態ベクトルと今回のデコードのターゲットコードとの類似度が大きい場合、今回のデコードのターゲットコードに重みを付ける際に、高い重みを用いて今回の重み付けデコードを得てもよいことを理解されたい。

サブステップ２０５４において、今回の重み付けコード、前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルを第３のリカレントニューラルネットワークに入力して、今回のデコードのシステム状態ベクトル及び今回のデコードのデコードベクトルを出力する。

本出願では、前回のデコードにおいて第３のリカレントニューラルネットワークｋら出力されたシステム状態ベクトル、と今回のデコードのターゲットコードとの類似度に基づいて、今回の重み付けコードを取得した後、今回の重み付けコード、前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルを第３のリカレントニューラルネットワークに入力して、今回のデコードのシステム状態ベクトル及び今回のデコードのデコードベクトルを出力することができる。

なお、第３のリカレントニューラルネットワークを用いて複数のターゲットコードの初回のデコードを行う際に、前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルが存在しないため、本出願では、デコードの開始識別子を予め設定し、設定された開始識別子を前回のデコードにおいて出力されたデコードベクトルとして決定してもよい。最終回のエンコードにおいて第２リカレントニューラルネットワークによって出力されたシステム状態ベクトルを、前回のデコードにおいて出力されたシステム状態ベクトルとして決定してもよい。

さらに、第３のリカレントニューラルネットワークを用いて複数のターゲットコードの初回のデコードを行う過程において、最終回のエンコードにおいて第２リカレントニューラルネットワークによって出力されたシステム状態ベクトルと初回のデコードのターゲットコードとの類似度を決定し、さらに、類似度に基づいて、今回のデコードのターゲットコードに重みを付けて、今回の重み付けコードを取得し、最後に、今回の重み付けコード、最終回のエンコードにおいて第２リカレントニューラルネットワークによって出力されたシステム状態ベクトル、及び設定された開始識別子を、第３のリカレントニューラルネットワークに入力して、初回のデコードのシステム状態ベクトル及び初回のデコードのデコードベクトルを出力してもよい。

ステップ２０６において、複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定する。

本出願では、複数のターゲットコードを第３のリカレントニューラルネットワークを用いて複数回のデコードを順次行い、複数のデコードベクトルを取得した後、複数のデコードベクトルを統合して、ナンバープレート内の複数の文字を決定することができる。

本出願の実施例に係るナンバープレート認識方法は、ナンバープレート領域の特徴マップを取得し、特徴マップには複数の特徴ベクトルが含まれ、リカレントニューラルネットワークを用いて複数の特徴ベクトルを正逆方向にエンコードした後、各特徴ベクトルの第１コード及び第２コードを取得し、さらに、特徴ベクトルごとに、第１コードと第２コードとをスプライスして、複数のターゲットコードを取得し、複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードして、複数のデコードベクトルを取得し、複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定する。複数のターゲットコードにはコンテキスト情報が含まれているため、特徴の表現力が向上し、１行及び２行ナンバープレートの認識性能が向上する。

いくつかのシーンでは、ナンバープレートの傾斜角度が大きいか、又はナンバープレートのサイズが小さい場合がある。小さいサイズのナンバープレートを認識する場合、従来のナンバープレート認識モデルは、検出認識共有の特徴マップからナンバープレートの特徴を抽出し、小さいサイズのナンバープレートが共有の特徴マップで占める割合が非常に小さいため、認識効果が悪い。このような場合について、上記のいずれかの実施例において、元画像の文字領域及び外周の設定範囲の特徴抽出を行うことで、ナンバープレートのサイズが小さいことによって特徴マップが小さいか、又はナンバープレート領域が容易に認識できないという問題を解決する。それとともに、ステップ１０１又はステップ２０１においてナンバープレート領域の特徴マップを取得する際に、取得された元画像の特徴抽出を行って、元特徴マップを取得し、元特徴マップにおいてナンバープレート領域に対応する元特徴マップを決定し、さらに、ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、ナンバープレート領域に対応するターゲット特徴マップを取得し、透視変換を行うことで、ナンバープレートが大きな角度で傾斜することによる検出誤差を回避することもできる。以下、図４を参照して、上記のプロセスを詳細に説明するが、図４は、本出願の実施例３に係る特徴マップを取得するためのサブフローの概略図である。

図４に示すように、ステップ１０１又は２０１は、以下のサブステップ３０１〜サブステップ３０４と、をさらに含んでもよい。

ステップ３０１において、元画像を取得する。

元画像は、ナンバープレート領域を含む車両全体の画像であってもよい。

本出願では、元画像を取得する際に、一般な撮影機器で撮影して２次元の元画像を取得してもよいし、深度カメラで撮影して３次元の元画像を取得してもよいが、ここでは限定しない。

例えば、交差点や道路脇に設置された撮像機器で、道路を走行している車両を撮像して、元画像を取得してもよい。

ステップ３０２において、元画像の特徴抽出を行って、元特徴マップを取得する。

特徴抽出は、コンピュータビジョン及び画像処理の概念の１つである。これは、コンピュータを用いて画像情報を抽出し、各画像の点が１つの画像特徴に属するか否かを決定することを意味する。特徴抽出の結果、画像上の点は、異なるサブセットに分けられ、これらのサブセットは、孤立している点、連続している曲線、又は連続している領域に属する場合が多い。よく使われる画像特徴には、色特徴、テクスチャ特徴、形状特徴、空間関係特徴がある。

色特徴は、画像又は画像領域に対応する物体の表面特性を記述するグローバルな特徴である。例えば、色ヒストグラム法を用いて、元画像の色特徴を抽出することができる。

テクスチャ特徴も、画像又は画像領域に対応する物体の表面特性を記述するグローバルな特徴である。色特徴とは異なり、テクスチャ特徴は、画素点に基づく特徴ではなく、複数の画素点を含む領域において統計的な計算を行う必要がある。例えば、統計方法を用いて、検出されたオブジェクトの元画像のテクスチャ特徴を抽出することができる。

元画像の形状特徴を抽出するには、幾何学的パラメータ法や形状不変モーメント法などを用いることができる。

画像の空間関係特徴を抽出する方法は２つある。１つは、まず元画像を自動的に分割し、元画像に含まれるオブジェクト又は色領域に分割し、続いてこれらの領域に基づいて画像特徴を抽出し、インデックスを作成することである。もう１つは、単に、元画像をいくつかの規則的なサブブロックに均等に分割し、続いて各画像のサブブロックの特徴を抽出し、インデックスを作成することである。

なお、元画像の画像特徴を抽出する際に、元画像の色特徴、テクスチャ特徴、形状特徴、及び空間関係特徴の少なくとも１つを抽出することができる。

可能な一実現形態として、取得された元画像の文字領域を認識し、元画像内の文字領域、及び文字領域の外周の設定範囲の特徴抽出を行って、元特徴マップを取得するものとしてもよい。これにより、ナンバープレート領域に対応する特徴マップを正確に取得することができる。

例えば、元画像内のナンバープレートは小さいサイズのナンバープレートであり、元画像の文字領域を認識した後、幅又は高さを外側に０．５倍適宜拡張して、元画像の文字領域及び文字領域の外周の設定範囲の特徴抽出を行って、小さいサイズのナンバープレート領域の特徴マップを取得することができる。

ステップ３０３において、元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定する。

元画像には、ナンバープレート領域が含まれるが、車両及び周囲環境などの他の領域も含まれており、ナンバープレートを正確に認識するために、元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定して、ナンバープレート領域に対応する元特徴マップに対してナンバープレート認識を行うことができることを理解されたい。

例えば、小さいサイズのナンバープレートは、元画像に対応する元特徴マップにおいて占める割合が小さい可能性があり、元画像から抽出された元特徴マップに対してナンバープレート認識を直接行うと、小さいサイズのナンバープレートの認識率が低い場合がある。小さいサイズのナンバープレートの認識率を向上させるために、本出願では、元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定し、さらに、ナンバープレート領域に対応する元特徴マップのみを処理することで、小さいサイズのナンバープレートの認識効果の向上を実現する。

可能な一実現形態として、元画像の特徴抽出を行って元特徴マップを取得した後、元特徴マップを完全畳み込みネットワーク（ＦｕｌｌｙＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｔｗｏｒｋｓ，ＦＣＮ）に入力してオブジェクト認識を行って、元特徴マップにおいてナンバープレート候補枠を決定することができる。さらに、ナンバープレート候補枠内にある元特徴マップを、ナンバープレート領域に対応する元特徴マップとする。

ステップ３０４において、ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、ナンバープレート領域に対応するターゲット特徴マップを取得する。

透視変換の本質は、画像を新しい表示面に投影することであり、透視変換の一般的な変換式は以下のとおりである。

ここで、［ｘ^，，ｙ^，，ｗ^，］は透視変換後に出力された特徴マップ上の座標であり、［ｕ，ｖ，ｗ］は、入力された元特徴マップ上の座標であり、

本出願では、ナンバープレート領域に対応する元特徴マップを取得した後、ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、一定の幅及び高さのナンバープレート領域に対応するターゲット特徴マップを取得することができる。

本出願の実施例では、元画像を取得し、元画像の特徴抽出を行って、元特徴マップを取得し、元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定し、ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、ナンバープレート領域に対応するターゲット特徴マップを取得する。これにより、ナンバープレート領域に対応するターゲット特徴マップを正確に取得し、ナンバープレート領域に対応するターゲット特徴マップからナンバープレートの複数の文字を認識することができ、ナンバープレート認識の精度向上に有利である。

ナンバープレート認識モデルの精度を向上させるために、深層学習モデル訓練方法に基づいてナンバープレート認識モデルを訓練することにより、訓練されたナンバープレート認識モデルが様々な種類のナンバープレートを正確に認識できるようにすることができる。このため、本出願は、ナンバープレート認識モデルの訓練方法を提供する。

図５は、本出願の実施例４に係るナンバープレート認識モデルの訓練方法の概略フローチャートである。

図５に示すように、このナンバープレート認識モデルの訓練方法は、以下のステップ４０１と、ステップ４０２と、を含んでもよい。

ステップ４０１において、複数の訓練画像を取得する。

ナンバープレート認識モデルが全ての種類のナンバープレートを認識できることを実現するためには、様々な種類のナンバープレートを訓練サンプルとしてナンバープレート認識モデルを訓練する必要がある。例えば、既存のナンバープレートの種類は、新エネルギー車ナンバープレート、ハイブリッド車ナンバープレート、二層黄色ナンバープレート、普通の青色ナンバープレート、香港とマカオのナンバープレート、警察車両ナンバープレート、１行武装警察車両ナンバープレート、２行武装警察車両ナンバープレート、農業用車両ナンバープレート、民間航空用車両ナンバープレートなどを含んでもよい。

しかし、従来の公開されるナンバープレートのデータセットは、種類が少なすぎて地域が集中しすぎ、よく見られない種類のナンバープレートの収集コストも高い。全ての種類のナンバープレート画像を取得できないことに鑑み、本出願ではデータ合成の方式を採用し、全ての種類、全ての領域をカバーするナンバープレート画像を訓練画像として生成することができる。すなわち、本出願における訓練画像には、撮像された実際のナンバープレート画像だけでなく、合成されたナンバープレート画像も含まれる。

合成されたナンバープレート画像をよりリアルにするために、既存の実際のナンバープレート画像に基づいて、合成されたナンバープレートを実際のナンバープレート領域に置き換えてもよい。可能な一実現形態として、ナンバープレートセット及び車両外観画像を取得し、ナンバープレートセット内の複数のナンバープレートに基づいて、各ナンバープレートに対応するナンバープレート画像を生成し、各ナンバープレートに対応するナンバープレート画像を車両画像とそれぞれ合成して、各ナンバープレートに対応する訓練画像を取得する。

ステップ４０２において、複数の訓練画像を用いて、ナンバープレート認識モデルを訓練する。

ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含む。

特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、特徴マップには、複数の特徴ベクトルが含まれる。

１つの可能な場合として、各訓練画像をナンバープレート認識モデルに入力した後、特徴抽出ネットワークを用いて訓練画像の特徴抽出を行って、ナンバープレート領域の特徴マップを取得してもよい。

認識ネットワークは、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するように構成される。

区別を容易にするために、本出願では、複数の特徴ベクトルを第１順序で順次エンコードするリカレントニューラルネットワークを第１リカレントニューラルネットワークと呼び、複数の特徴ベクトルを第２順序で順次エンコードするリカレントニューラルネットワークを第２リカレントニューラルネットワークと呼ぶ。当然ながら、他の命名方式も可能であり、本出願では単に例示的な表現である。

同様に、区別を容易にするために、本出願では、各特徴ベクトルを第１リカレントニューラルネットワークに入力してエンコードし、エンコードされた特徴ベクトルを第１コードと呼び、各特徴ベクトルを第２リカレントニューラルネットワークに入力してエンコードし、得たエンコードされた特徴ベクトルを第２コードと呼ぶ。当然ながら、他の命名方式も可能であり、本出願では単に例示的な表現である。

本出願では、ナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを取得した後、ナンバープレート認識モデルの認識ネットワークは、複数の特徴ベクトルを第１順序で第１リカレントニューラルネットワークに順次入力してエンコードし、第１リカレントニューラルネットワークのエンコード結果に基づいて、各特徴ベクトルの第１コードを取得することができる。複数の特徴ベクトルを第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得することもできる。

同様に、第２順序は、左から右への正方向順序であってもよいし、右から左への逆方向順序であってもよく、本出願ではこれについて限定しない。本出願では、第１順序と第２順序を逆の順序とすることを必要とし、例えば、第１順序が左から右への正方向順序である場合、第２順序は右から左への逆方向順序である。すなわち、第１リカレントニューラルネットワークが複数の特徴ベクトルを正方向にエンコードする場合、第２リカレントニューラルネットワークは、複数の特徴ベクトルを逆方向にエンコードする。

１行及び２行ナンバープレートに対するナンバープレート認識モデルの認識性能を保証するために、訓練過程における各反復では、１行／２行ナンバープレート、実際／合成のナンバープレートのデータの比率の合理性を確保する必要があり、例えば、１回のモデル訓練過程において採用される１行実際のナンバープレート、１行合成ナンバープレート、２行実際のナンバープレート、２行合成ナンバープレートのサンプル比率は、０．３：０．２：０．２：０．３であってもよい。

本出願の実施例に係る車両認識モデルの訓練方法は、複数の訓練画像を取得し、複数の訓練画像を用いて、ナンバープレート認識モデルを訓練する。これにより、複数の訓練画像により訓練されたナンバープレート認識モデルは、様々な種類のナンバープレートを正確に認識することができ、ナンバープレート認識方法の実用性向上に有利である。

本出願の実施例の可能な一実現形態として、合成されたナンバープレート画像を訓練画像として取得する際に、ナンバープレートセット内の各ナンバープレートと車両外観画像を合成して、各ナンバープレートに対応する訓練画像を取得してもよい。これにより、様々な種類のナンバープレート画像を訓練画像として取得することができる。具体的な実現プロセスを図６に示し、図６は、本出願の実施例５に係るサンプル画像を取得するためのサブフローの概略図である。

図６に示すように、上記のステップ４０１で訓練画像を取得する際、以下のサブステップであるステップ５０１〜ステップ５０４と、をさらに含んでもよい。

ステップ５０１において、ナンバープレートセット及び車両外観画像を取得する。

合成されたナンバープレート画像をよりリアルにするために、既存の実際のナンバープレート画像に基づいて、合成されたナンバープレートを実際のナンバープレート領域に置き換えてもよい。このため、本出願では、全ての種類のナンバープレートを含むナンバープレートセットと車両外観画像とを取得することができる。

ナンバープレートセットには、例えば、新エネルギー車ナンバープレート、ハイブリッド車ナンバープレート、２行黄色ナンバープレート、普通の青色ナンバープレート、香港とマカオのナンバープレート、警察車両ナンバープレート、１行武装警察車両ナンバープレート、２行武装警察車両ナンバープレート、農業用車両ナンバープレート、民間航空用車両ナンバープレートなどの複数種類のナンバープレートが含まれる。

本出願では、車両外観画像は、ナンバープレート領域を含む車両外観画像であり、ナンバープレートの種類に対応する車両であってもよいし、他の種類の車両であってもよいが、ここでは限定しない。

ステップ５０２において、ナンバープレートセット内の複数のナンバープレートに基づいて、各ナンバープレートに対応するナンバープレート画像を生成する。

可能な一実現形態として、ナンバープレートセット内の各ナンバープレートを、当該種類のナンバープレートのナンバープレートテンプレートと融合して、各ナンバープレートに対応するナンバープレートの画像を合成してもよい。

さらに、実際のナンバープレート画像におけるナンバープレート領域Ｒ、Ｇ、Ｂの３つのカラーチャンネルの平均値を統計し、その最大値と２５５との比率に基づいて、合成されたナンバープレート画像の明るさを調整し、且つ、ある程度のガウスぼかしを加えて、合成されたナンバープレートの画像の画像ノイズを低減し、詳細部レベルを低減する。

ステップ５０３において、各ナンバープレートに対応するナンバープレート画像を車両画像とそれぞれ合成して、各ナンバープレートに対応する訓練画像を取得する。

本出願の実施例では、各ナンバープレートに対応するナンバープレート画像を取得した後、各ナンバープレートに対応するナンバープレート画像を車両画像における実際のナンバープレート領域に充填し、車両画像と合成することで、各ナンバープレートに対応する訓練画像を取得する。

可能な一実現形態として、アフィン変換法を用いて、各ナンバープレートに対応するナンバープレート画像を車両画像とそれぞれ合成して、各ナンバープレートに対応する訓練画像を取得してもよい。

ステップ５０４において、各訓練画像に、対応するナンバープレートを用いてラベルを付ける。

各ナンバープレートはいずれも唯一であり、各ナンバープレートに対応する訓練画像を取得した後、対応するナンバープレートを用いて訓練画像にラベルを付けてもよいことを理解されたい。

本出願の実施例では、ナンバープレートセット及び車両外観画像を取得し、ナンバープレートセットにおける複数のナンバープレートに基づいて、各ナンバープレートに対応するナンバープレート画像を生成し、各ナンバープレートに対応するナンバープレート画像を車両画像とそれぞれ合成して、各ナンバープレートに対応する訓練画像を取得し、各訓練画像に、対応するナンバープレートを用いてラベルを付ける。これにより、ナンバープレートセットにおける各ナンバープレート及び車両外観画像により、各ナンバープレートに対応する訓練画像を合成することができ、様々な種類のナンバープレート画像を訓練画像として取得することができる。

上記の実施例を実現するために、本出願は、ナンバープレート認識装置を提供する。

図７は、本出願の実施例６に係るナンバープレート認識装置の概略構成図である。

図７に示すように、このナンバープレート認識装置６００は、取得モジュール６１０と、第１エンコードモジュール６２０と、第２エンコードモジュール６３０と、生成モジュール６４０と、デコードモジュール６５０と、を含んでもよい。

取得モジュール６１０は、ナンバープレート領域の特徴マップを取得するように構成され、特徴マップには複数の特徴ベクトルが含まれる。

第１エンコードモジュール６２０は、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得するように構成される。

第２エンコードモジュール６３０は、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得するように構成される。

生成モジュール６４０は、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成するように構成される。

デコードモジュール６５０は、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するように構成される。

１つの可能な場合として、生成モジュール６４０は、前記特徴ベクトルごとに、前記第１コードと前記第２コードとをスプライスして、前記複数のターゲットコードを取得するように構成されるスプライスユニットを含み取得する。

１つの可能な場合として、デコードモジュール６５０は、複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードして、複数のデコードベクトルを取得するように構成されるデコードユニットと、複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定するように構成される第１決定ユニットと、を含んでもよい。

別の可能な場合として、デコードユニットは、さらに、第３のリカレントニューラルネットワークを用いて複数回のデコードプロセスを実行するように構成され、各回のデコードプロセスは、今回のデコードのターゲットコードを取得するステップと、前回のデコードにおいて第３のリカレントニューラルネットワークによって出力されたシステム状態ベクトルと、今回のデコードのターゲットコードとの類似度を決定するステップと、類似度に基づいて、今回のデコードのターゲットコードに重みを付けて、今回の重み付けコードを取得するステップと、今回の重み付けコード、前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルを、第３のリカレントニューラルネットワークに入力して、今回のデコードのシステム状態ベクトル及び今回のデコードのデコードベクトルを出力するステップと、を含み、初回のデコードプロセスは、さらに、設定された開始識別子を前回のデコードにおいて出力されたデコードベクトルとして決定するステップと、最終回のエンコードにおいて第２リカレントニューラルネットワークによって出力されたシステム状態ベクトルを、前回のデコードにおいて出力されたシステム状態ベクトルとして決定するステップと、を含む。

別の可能な場合として、取得モジュール６１０は、元画像を取得するように構成される取得ユニットと、元画像の特徴抽出を行って、元特徴マップを取得するように構成される抽出ユニットと、元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定するように構成される第２決定ユニットと、ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、ナンバープレート領域に対応するターゲット特徴マップを取得するように構成される変換ユニットと、を含んでもよい。

別の可能な場合として、第２決定ユニットは、さらに、元特徴マップを完全畳み込みネットワークに入力してオブジェクト認識を行って、元特徴マップにおいてナンバープレート候補枠を決定し、ナンバープレート候補枠内にある元特徴マップを、ナンバープレート領域に対応する元特徴マップとするように構成される。

別の可能な場合として、抽出ユニットは、さらに、元画像の文字領域を認識し、元画像内の文字領域、及び文字領域の外周の設定範囲の特徴抽出を行って、元特徴マップを取得するように構成される。

なお、前述したナンバープレート認識方法の実施例の解釈及び説明は、この実施例のナンバープレート認識装置にも適用し、ここでは説明を省略する。

本出願の実施例に係るナンバープレート認識装置は、ナンバープレート領域の特徴マップを取得し、特徴マップには複数の特徴ベクトルが含まれ、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。この方法では、抽出されたナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを、それぞれリカレントニューラルネットワークを用いて正逆方向にエンコードすることで、エンコードされた特徴にはコンテキスト情報が含まれるようになり、ナンバープレート認識の精度が大幅に向上する。

上記の実施例を実現するために、本出願は、ナンバープレート認識モデルの訓練装置を提供する。

図８に示すように、このナンバープレート認識モデルの訓練装置７００は、取得モジュール７１０と、訓練モジュール７２０と、を含んでもよい。

取得モジュール７１０は、複数の訓練画像を取得するように構成される。

訓練モジュール７２０は、複数の訓練画像を用いてナンバープレート認識モデルを訓練するように構成され、ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含み、特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、特徴マップには複数の特徴ベクトルが含まれ、認識ネットワークは、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードしてナンバープレート内の複数の文字を取得するように構成される。

別の可能な場合として、取得モジュール７１０は、さらに、ナンバープレートセット及び車両外観画像を取得するように構成される取得ユニットと、ナンバープレートセット内の複数のナンバープレートに基づいて、各ナンバープレートに対応するナンバープレート画像を生成するように構成される生成ユニットと、各ナンバープレートに対応するナンバープレート画像を車両画像とそれぞれ合成し、各ナンバープレートに対応する訓練画像を取得するように構成される合成ユニットと、各訓練画像に、対応するナンバープレートを用いてラベルを付けるように構成されるラベル付けユニットと、を含んでもよい。

なお、前述したナンバープレート認識モデルの訓練方法の実施例の解釈及び説明は、この実施例のナンバープレート認識モデルの訓練装置にも適用し、ここでは説明を省略する。

本出願の実施例に係る車両認識モデルの訓練装置は、複数の訓練画像を取得し、複数の訓練画像を用いて、ナンバープレート認識モデルを訓練する。これにより、複数の訓練画像により訓練されたナンバープレート認識モデルは、様々な種類のナンバープレートを正確に認識することができ、ナンバープレート認識方法の実用性向上に有利である。

本出願の実施例によれば、本出願は、電子機器及び読み取り可能な記憶媒体をさらに提供する。

図９は、本出願の実施例に係るナンバープレート認識方法を実現する電子機器のブロック図である。電子機器は、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことが意図される。電子機器は、さらに、例えば、パーソナルデジタルプロセッシング、携帯電話、スマートフォン、ウェアラブル機器、及び他の同様のコンピューティング装置などの様々な形態のモバイル装置を表すことができる。本明細書に示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記述及び／又は要求される本出願の実現を限定することを意図しない。

図９に示すように、この電子機器は、１つ又は複数のプロセッサ８０１と、メモリ８０２と、高速インタフェースと低速インタフェースとを含むインタフェースであって、各コンポーネントを接続するためのインタフェースとを含む。各コンポーネントは、異なるバスで接続され、共通のマザーボードに実装されてもよいし、又は必要に応じて他の方式で実装されてもよい。プロセッサは、外部入力／出力装置（例えば、インタフェースに結合されたディスプレイ機器）にＧＵＩのグラフィック情報を表示させるようにメモリ中又はメモリ上に記憶された命令を含む命令であって、電子機器内で実行される命令を処理することができる。他の実施形態では、必要に応じて、複数のプロセッサ及び／又は複数のバスを複数のメモリ及び複数のメモリと共に使用することができる。同様に、それぞれが必要な動作の一部（例えば、サーバアレイ、ブレードサーバ群、又はマルチプロセッサシステムとする）を提供する複数の電子機器を接続することができる。図９では、１つのプロセッサ８０１を例にする。

メモリ８０２は、本出願に係る非一時的コンピュータ読み取り可能な記憶媒体である。前記メモリには、少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記少なくとも１つのプロセッサが本出願に係るナンバープレート認識方法を実行するようにし、又は、本出願に係るナンバープレート認識モデルの訓練方法を実行するようにする。本出願の非一時的コンピュータ読み取り可能な記憶媒体には、本出願に係るナンバープレート認識方法をコンピュータに実行させるコンピュータ命令が記憶されている。

メモリ８０２は、非一時的コンピュータ読み取り可能な記憶媒体として、例えば、本出願の実施例におけるナンバープレート認識方法に対応するプログラム命令／モジュール（例えば、図７に示される取得モジュール６１０、第１エンコードモジュール６２０、第２エンコードモジュール６３０、生成モジュール６４０及びデコードモジュール６５０、又は、図８に示される取得モジュール７１０及び訓練モジュール７２０）のような、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム及びモジュール、を記憶するために用いられる。プロセッサ８０１は、メモリ８０２に記憶された非一時的ソフトウェアプログラム、命令及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち、上記の方法の実施例におけるナンバープレート認識方法、又は、ナンバープレート認識モデルの訓練方法を実現する。

メモリ８０２は、プログラム記憶領域とデータ記憶領域とを含むことができ、プログラム記憶領域は、オペレーティングシステム、少なくとも１つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶領域は、電子機器の使用によって作成されたデータなどを記憶することができる。また、メモリ８０２は、高速ランダムアクセスメモリを含むことができ、非一時的メモリをさらに含むことができ、例えば、少なくとも１つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の非一時的固体記憶デバイスである。いくつかの実施例では、メモリ８０２は、プロセッサ８０１に対して遠隔に配置されたメモリを選択的に含むことができ、これらの遠隔メモリは、ネットワークを介して電子機器に接続することができる。上記のネットワークの例としては、インターネット、イントラネット、ローカルエリアネットワーク、移動通信ネットワーク、及びそれらの組み合わせを含むが、これらに限定されない。

電子機器は、入力装置８０３と出力装置８０４とをさらに含むことができる。プロセッサ８０１、メモリ８０２、入力装置８０３、及び出力装置８０４は、バス又は他の方式で接続することができ、図９では、バスによる接続を例にする。

入力装置８０３は、入力された数字又は文字情報を受信し、電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、１つ又はそれ以上のマウスボタン、トラックボール、ジョイスティックなどの入力装置が挙げられる。出力装置８０４は、表示機器、補助照明装置（例えば、ＬＥＤ）、触覚フィードバック装置（例えば、振動モータ）などを含むことができる。この表示機器は、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、及びプラズマディスプレイを含み取得するが、これらに限定されない。いくつかの実施形態では、表示機器はタッチパネルであってもよい。

ここで説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、１つ又は複数のコンピュータプログラムで実施され、この１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、このプログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置からデータ及び命令を受信し、データ及び命令をこの記憶システム、この少なくとも１つの入力装置、及びこの少なくとも１つの出力装置に伝送することができる。

これらのコンピューティングプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる）は、プログラマブルプロセッサの機械命令を含み、高度プロセス及び／又はオブジェクト指向プログラミング言語、及び／又はアセンブリ／機械言語で実施される。本明細書で使用されるような、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」の用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、機器、及び／又は装置（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」の用語は、機械命令及び／又はデータをプログラマブルプロセッサに提供するために用いられる任意の信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータ上で実施することができ、このコンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、このキーボード及びこのポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形態（音響入力、音声入力、又は触覚入力を含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、このグラフィカルユーザインタフェース又はこのウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、又はフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形態又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットとを含む。

コンピュータシステムは、クライアント及びサーバを含むことができる。クライアント及びサーバは、一般に、互いに離れており、通常、通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、且つ互いにクライアント−サーバの関係を有するコンピュータプログラムによって、クライアントとサーバとの関係が生成される。

本出願の実施例の技術的解決手段によれば、ナンバープレート領域の特徴マップを取得し、特徴マップには複数の特徴ベクトルが含まれ、複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第１コードを取得し、複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各特徴ベクトルの第２コードを取得し、各特徴ベクトルの第１コード及び各特徴ベクトルの第２コードに基づいて、複数の特徴ベクトルの複数のターゲットコードを生成し、複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得する。この方法では、抽出されたナンバープレート領域の特徴マップに含まれる複数の特徴ベクトルを、それぞれリカレントニューラルネットワークを用いて正逆方向にエンコードすることで、エンコードされた特徴にはコンテキスト情報が含まれるようになり、ナンバープレート認識の精度が大幅に向上する。

以上に示される様々な形態のフローを使用して、ステップを並べ替え、追加、又は削除することができることが理解されるであろう。例えば、本出願に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本出願で開示されている技術的解決手段が所望の結果を実現することができれば、本明細書では限定しない。

上記の具体的な実施形態は、本出願の保護範囲を限定するものではない。当業者であれば、設計要件と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。本出願の精神と原則内で行われる任意の修正、同等の置換、及び改善などは、いずれも本出願の保護範囲内に含まれるべきである。

Claims

ナンバープレート認識方法であって、
ナンバープレート領域の特徴マップを取得するステップであって、前記特徴マップには複数の特徴ベクトルが含まれるステップと、
前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得するステップと、
前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得するステップと、
各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成するステップと、
複数の前記ターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するステップと、を含む、ナンバープレート認識方法。
各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成するステップは、
前記特徴ベクトルごとに、前記第１コードと前記第２コードとをスプライスして、前記複数のターゲットコードを取得するステップを含む、請求項１に記載のナンバープレート認識方法。
前記複数のターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するステップは、
前記複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードして、複数のデコードベクトルを取得するステップと、
前記複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定するステップと、を含む、請求項１に記載のナンバープレート認識方法。
前記複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードするステップは、
前記第３のリカレントニューラルネットワークを用いて複数回のデコードプロセスを実行するステップを含み、
各回の前記デコードプロセスは、
今回のデコードのターゲットコードを取得するステップと、
前回のデコードにおいて前記第３のリカレントニューラルネットワークによって出力されたシステム状態ベクトルと、前記今回のデコードのターゲットコードとの類似度を決定するステップと、
前記類似度に基づいて、前記今回のデコードのターゲットコードに重みを付けて、今回の重み付けコードを取得するステップと、
前記今回の重み付けコード、前記前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルを、前記第３のリカレントニューラルネットワークに入力して、今回のデコードのシステム状態ベクトル及び今回のデコードのデコードベクトルを出力するステップと、を含み、
初回の前記デコードプロセスは、
設定された開始識別子を前記前回のデコードにおいて出力されたデコードベクトルとして決定するステップと、
最終回のエンコードにおいて前記第２リカレントニューラルネットワークによって出力されたシステム状態ベクトルを、前記前回のデコードにおいて出力されたシステム状態ベクトルとして決定するステップと、をさらに含む、請求項３に記載のナンバープレート認識方法。
ナンバープレート領域の特徴マップを取得するステップは、
元画像を取得するステップと、
前記元画像の特徴抽出を行って、元特徴マップを取得するステップと、
前記元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定するステップと、
前記ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、前記ナンバープレート領域に対応するターゲット特徴マップを取得するステップと、を含む、請求項１〜４のいずれか１項に記載のナンバープレート認識方法。
前記元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定するステップは、
前記元特徴マップを完全畳み込みネットワークに入力してオブジェクト認識を行って、前記元特徴マップにおいてナンバープレート候補枠を決定するステップと、
前記ナンバープレート候補枠内にある前記元特徴マップを、前記ナンバープレート領域に対応する元特徴マップとするステップと、を含む、請求項５に記載のナンバープレート認識方法。
前記元画像の特徴抽出を行って、元特徴マップを取得するステップは、
前記元画像の文字領域を認識するステップと、
前記元画像内の前記文字領域、及び前記文字領域の外周の設定範囲の特徴抽出を行って、前記元特徴マップを取得するステップと、を含む、請求項５に記載のナンバープレート認識方法。
ナンバープレート認識モデルの訓練方法であって、
複数の訓練画像を取得するステップと、
前記複数の訓練画像を用いてナンバープレート認識モデルを訓練するステップであって、前記ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含むステップと、を含み、
前記特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、前記特徴マップには複数の特徴ベクトルが含まれ、
前記認識ネットワークは、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得し、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得し、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成し、複数の前記ターゲットコードをデコードしてナンバープレート内の複数の文字を取得するように構成される、ナンバープレート認識モデルの訓練方法。
訓練画像を取得するステップは、
ナンバープレートセット及び車両外観画像を取得するステップと、
前記ナンバープレートセット内の複数のナンバープレートに基づいて、各前記ナンバープレートに対応するナンバープレート画像を生成するステップと、
各前記ナンバープレートに対応するナンバープレート画像を、前記車両画像とそれぞれ合成し、各前記ナンバープレートに対応する訓練画像を取得するステップと、
各前記訓練画像に、対応する前記ナンバープレートを用いてラベルを付けるステップと、を含む、請求項８に記載の訓練方法。
ナンバープレート認識装置であって、
ナンバープレート領域の特徴マップを取得するように構成される取得モジュールであって、前記特徴マップには複数の特徴ベクトルが含まれる取得モジュールと、
前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得するように構成される第１エンコードモジュールと、
前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得するように構成される第２エンコードモジュールと、
各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成するように構成される生成モジュールと、
複数の前記ターゲットコードをデコードして、ナンバープレート内の複数の文字を取得するように構成されるデコードモジュールと、を含む、ナンバープレート認識装置。
前記生成モジュールは、
前記特徴ベクトルごとに、前記第１コードと前記第２コードとをスプライスして、前記複数のターゲットコードを取得するように構成されるスプライスユニットを含む、請求項１０に記載のナンバープレート認識装置。
前記デコードモジュールは、
前記複数のターゲットコードを第３のリカレントニューラルネットワークを用いて順次デコードして、複数のデコードベクトルを取得するように構成されるデコードユニットと、
前記複数のデコードベクトルに基づいて、ナンバープレート内の複数の文字を決定するように構成される第１決定ユニットと、を含む、請求項１０に記載のナンバープレート認識装置。
前記デコードユニットは、さらに、
前記第３のリカレントニューラルネットワークを用いて複数回のデコードプロセスを実行するように構成され、
各回の前記デコードプロセスは、
今回のデコードのターゲットコードを取得するステップと、
前回のデコードにおいて前記第３のリカレントニューラルネットワークによって出力されたシステム状態ベクトルと、前記今回のデコードのターゲットコードとの類似度を決定するステップと、
前記類似度に基づいて、前記今回のデコードのターゲットコードに重みを付けて、今回の重み付けコードを取得するステップと、
前記今回の重み付けコード、前記前回のデコードにおいて出力されたシステム状態ベクトル及び前回のデコードにおいて出力されたデコードベクトルを、前記リカレントニューラルネットワークに入力して、今回のデコードのシステム状態ベクトル及び今回のデコードのデコードベクトルを出力するステップと、を含み、
初回の前記デコードプロセスは、
設定された開始識別子を、前記前回のデコードにおいて出力されたデコードベクトルとして決定するステップと、
最終回のエンコードにおいて前記第２リカレントニューラルネットワークによって出力されたシステム状態ベクトルを、前記前回のデコードにおいて出力されたシステム状態ベクトルとして決定するステップと、をさらに含む、請求項１２に記載のナンバープレート認識装置。
前記取得モジュールは、
元画像を取得するように構成される取得ユニットと、
前記元画像の特徴抽出を行って、元特徴マップを取得するように構成される抽出ユニットと、
前記元特徴マップから、ナンバープレート領域に対応する元特徴マップを決定するように構成される第２決定ユニットと、
前記ナンバープレート領域に対応する元特徴マップに対して透視変換を行って、前記ナンバープレート領域に対応するターゲット特徴マップを取得するように構成される変換ユニットと、を含む、請求項１０〜１３のいずれか１項に記載のナンバープレート認識装置。
前記第２決定ユニットは、前記元特徴マップを完全畳み込みネットワークに入力してオブジェクト認識を行って、前記元特徴マップにおいてナンバープレート候補枠を決定し、
前記ナンバープレート候補枠内にある前記元特徴マップを、前記ナンバープレート領域に対応する元特徴マップとするように構成される、請求項１４に記載のナンバープレート認識装置。
前記抽出ユニットは、さらに、
前記元画像の文字領域を認識し、
前記元画像内の前記文字領域、及び前記文字領域の外周の設定範囲の特徴抽出を行って、前記元特徴マップを取得するように構成される、請求項１４に記載のナンバープレート認識装置。
ナンバープレート認識モデルの訓練装置であって、
複数の訓練画像を取得するように構成される取得モジュールと、
前記複数の訓練画像を用いてナンバープレート認識モデルを訓練するように構成される訓練モジュールであって、前記ナンバープレート認識モデルは、特徴抽出ネットワークと認識ネットワークとを含む訓練モジュールと、を含み、
前記特徴抽出ネットワークは、ナンバープレート領域の特徴マップを取得するように構成され、前記特徴マップには複数の特徴ベクトルが含まれ、
前記認識ネットワークは、前記複数の特徴ベクトルを、第１順序で第１リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第１コードを取得し、前記複数の特徴ベクトルを、第２順序で第２リカレントニューラルネットワークに順次入力してエンコードして、各前記特徴ベクトルの第２コードを取得し、各前記特徴ベクトルの第１コード及び各前記特徴ベクトルの第２コードに基づいて、複数の前記特徴ベクトルの複数のターゲットコードを生成し、複数の前記ターゲットコードをデコードしてナンバープレート内の複数の文字を取得するように構成される、ナンバープレート認識モデルの訓練装置。
前記取得モジュールは、
ナンバープレートセット及び車両外観画像を取得するように構成される取得ユニットと、
前記ナンバープレートセット内の複数のナンバープレートに基づいて、各前記ナンバープレートに対応するナンバープレート画像を生成するように構成される生成ユニットと、
各前記ナンバープレートに対応するナンバープレート画像を前記車両画像とそれぞれ合成し、各前記ナンバープレートに対応する訓練画像を取得するように構成される合成ユニットと、
各前記訓練画像に、対応する前記ナンバープレートを用いてラベルを付けるように構成されるラベル付けユニットと、を含む、請求項１７に記載の訓練装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されたメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、前記命令が前記少なくとも１つのプロセッサによって実行される場合、前記少なくとも１つのプロセッサが請求項１〜７のいずれか１項に記載のナンバープレート認識方法、又は、請求項８又は９に記載のナンバープレート認識モデルの訓練方法を実行可能である、電子機器。
コンピュータ命令が記憶された非一時的コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令は、前記コンピュータに請求項１〜７のいずれか１項に記載のナンバープレート認識方法、又は、請求項８又は９に記載のナンバープレート認識モデルの訓練方法を実行させる、非一時的コンピュータ読み取り可能な記憶媒体。
コンピュータに請求項１〜７のいずれか１項に記載のナンバープレート認識方法、又は、請求項８又は９に記載のナンバープレート認識モデルの訓練方法を実行させる、コンピュータプログラム。