JP6400117B2 - 交通標識を認識する方法及び装置 - Google Patents

交通標識を認識する方法及び装置 Download PDF

Info

Publication number
JP6400117B2
JP6400117B2 JP2016559945A JP2016559945A JP6400117B2 JP 6400117 B2 JP6400117 B2 JP 6400117B2 JP 2016559945 A JP2016559945 A JP 2016559945A JP 2016559945 A JP2016559945 A JP 2016559945A JP 6400117 B2 JP6400117 B2 JP 6400117B2
Authority
JP
Japan
Prior art keywords
image
traffic sign
window image
predetermined
scan window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016559945A
Other languages
English (en)
Other versions
JP2017516197A (ja
Inventor
ヂフイ ハオ
ヂフイ ハオ
ニン ワン
ニン ワン
レイミン ゲ
レイミン ゲ
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2017516197A publication Critical patent/JP2017516197A/ja
Application granted granted Critical
Publication of JP6400117B2 publication Critical patent/JP6400117B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Description

優先権要求
本出願は2015年03月31日に提出された、中国特許出願番号が「201510150525.8」である優先権を主張し、当該特許出願の全文を援用するように本願に組み込んだ。
本出願はコンピュータ技術分野に関し、具体的にコンピュータターゲット認識技術分野に関し、特に交通標識を認識する方法及び装置に関する。
正確で全面的なナビゲーションデータを提供するために、交通道路網における交通標識を認識する必要がある。
従来の交通標識を認識する方法は、主に人工処理に依存して、予め特定のプログラムソフトウェアとベースマップデータを収集車に配置し、訓練されたフィールドワーカーにより車に追従して操作し、交通標識を見ると、作業者はタイプと目視距離を手動的にソフトウェアに入力し、フィールドの収集が終了した後に、更に屋内労働者により作業前後のベースマップを比較して、有効な情報を道路網データベースに更新する。この過程は多種のソフトウェアツールのサポートを必要とするが、データ成果の正確さは主に作業者の個人の能力及び集中度によって決められ、同時に、複雑な収集プロセスは道路網データの更新効率を低下させる。
本出願は、以上の背景技術に記載された技術問題を解決するために、交通標識を認識する方法及び装置を提供することを目的とする。
一様態において、本出願は交通標識を認識する方法を提供し、この方法は、全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するステップと、前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するステップと、予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得するステップと、を含んでおり、ここで、前記予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られ、前記予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られる。
他の様態において、本出願は交通標識を認識する装置を提供し、この装置は、全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するための特徴値取得モジュールと、前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するための交通標識検出モジュールと、予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得するための交通標識認識モジュールと、を備えており、ここで、前記予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られ、前記予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られる。
本出願による交通標識を認識する方法及び装置は、全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得して、続いて、前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得し、その後、予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得することによって、予め訓練された検出分類器モデルによって確認しようとする交通標識ウィンドウ画像を検出して、予め訓練された畳み込みニューラルネットワークモデルによって交通標識種類を認識することを実現し、パノラマ画像での交通標識を検出して認識する正確さを向上させるとともに、道路網データの更新効率を向上させる。
以下、図面を参照しながら非限定的な実施例を詳細に説明することにより、本発明の他の特徴、目的、及び利点は、より明らかになる。
本出願の実施例による交通標識を認識する方法を示す例示的なフローチャートである。 本出願の実施例による予め訓練された検出モデルを訓練する方法を示す例示的なフローチャートである。 本出願の実施例による確認しようとする交通標識ウィンドウ画像を取得する方法を示す例示的なフローチャートである。 本出願の実施例による予め訓練された畳み込みニューラルネットワークモデルを訓練する方法を示す例示的なフローチャートである。 本出願の実施例による所定の畳み込みニューラルネットワークモデルを示す例示的な構造図である。 本出願の実施例による交通標識を認識する装置を示す構造模式図である。 本出願の実施例による検出分類器モデル訓練装置を示す例示的な構造図である。 確認しようとする交通標識ウィンドウ画像を取得するための装置を示す例示的な構造図である。 本出願の実施例による予め訓練された畳み込みニューラルネットワークモデルを訓練するための装置を示す例示的な構造図である。 本出願の実施例によるコンピュータシステムを示す構造模式図である。
以下、図面及び実施例を参照しながら、本発明をさらに詳しく説明する。ただし、ここで説明されている具体的な実施例は、係る発明を解釈するためのものに過ぎず、本発明の範囲を制限するものではないと理解されるべきである。また、説明の便宜上、図面に本発明と関連する部分のみが示されている。
ただし、衝突がない限り、本願における実施例、及び実施例における特徴は、互いに組み合せてもよい。以下、図面を参照しながら実施例に基づいて本発明を詳細に説明する。
図1は本出願の実施例による交通標識を認識する方法を示す例示的なフローチャートである。
図1に示すように、交通標識を認識する方法100は、以下のステップを含んでもよい。
ステップ110:全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得する。
ここで、まず交通標識を認識する必要がある全天球画像を取得し、次に、所定のサイズのウィンドウによって全天球画像をスキャンして、それによりスキャンウィンドウ画像を取得し、その後、更にスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得する。
全天球画像とは複数枚の魚眼画像により接合してなるパノラマを表示できる画像である。所定のサイズのウィンドウは一般的に対象物体のサイズに基づいて所定のウィンドウである。
なお、スキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得する際に、所定の積分チャンネルは画像処理分野における従来技術においていずれか1種又は多種の積分チャンネルであってもよく、又は将来の技術において発展する可能性があるいずれか1種又は多種の積分チャンネルであってもよく、所定の特徴アルゴリズムは画像処理分野における従来技術においていずれか1種又は多種の特徴アルゴリズムであってもよく、将来の技術において発展する可能性があるいずれか1種又は多種の特徴アルゴリズムであってもよい。本出願では、具体的な特徴値を取得する方式に制限されなく、ユーザにより実際の使用需要に応じて選択することができる。例えば、グレースケール画像チャネルにハールアルゴリズムによってハール(haar)特徴値を取得することができ、異なる角度パラメータの勾配画像チャンネルにヒストグラム特徴値アルゴリズムによってヒストグラム特徴値を取得し、同時に、赤、緑、青モノクロ画像チャンネルにおいてランダムペア特徴値アルゴリズムによってランダムペア特徴値などを取得する。
スキャンウィンドウ画像の特徴値を取得する速度を更に向上させるために、積分画像によってスキャンウィンドウ画像の特徴値を取得することができ、選択的に、上記実施例において、ステップ110は、全天球画像により所定の積分チャンネルの積分画像で分割して得られたスキャンウィンドウ画像の積分画像を取得するステップ111、及びスキャンウィンドウ画像の積分画像に基づいて、スキャンウィンドウ画像の特徴値を取得するステップ112を含んでもよい。
上記の全天球画像の積分画像を使用してスキャンウィンドウ画像の特徴値を計算することによって、スキャンウィンドウ画像の特徴値の計算を加速して、スキャンウィンドウ画像の特徴値の計算効率を向上させることができる。
選択的に、スキャンウィンドウ画像の特徴値と、予め訓練された監視分類器モデルにおける交通標識ウィンドウ画像のサンプルの特徴値との比較を加速するために、交通標識の種類によって、交通標識ウィンドウ画像のサンプルの特徴値及びスキャンウィンドウ画像の特徴値を取得する所定の積分チャンネル及び所定の特徴アルゴリズムを確定することができる。例えば速度制限などのような禁止類標識に対して、赤色チャンネルにおける説明を強化することができる。好ましくは、所定の積分チャンネルは、グレースケール画像チャネル、赤、緑、青モノクロ画像チャンネル、異なる角度パラメータの勾配画像チャンネル、及びエッジ検出画像チャンネルなどの1項又は複数項を含んでもよく、そして、所定の特徴アルゴリズムは、ハール特徴アルゴリズム、ローカルバイナリパターン特徴アルゴリズム、ヒストグラム特徴アルゴリズム及びランダムペア特徴アルゴリズムなどの1項又は複数項を含んでもよい。スキャンウィンドウ画像を検出することに必要な特徴値を取得するように、上記実施例における所定の積分チャンネルと所定の特徴アルゴリズムを必要に応じて組み合わせてよいことを、当業者が理解すべきである。
上記の交通標識の種類によって確定された交通標識ウィンドウ画像のサンプルの特徴値及びスキャンウィンドウ画像の特徴値を取得する所定の積分チャンネル及び所定の特徴アルゴリズムによれば、複数の異なる角度から対象の特性を説明することができ、それにより対象が異なる角度と光照による変化を吸収する。
ステップ120:スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得し、ここで、予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られる。
ここで、予め訓練された検出分類器モデルは、まず手動マーキングを受信して、スキャンウィンドウ画像において交通標識を含むスキャンウィンドウ画像と交通標識を含まないスキャンウィンドウ画像を交通標識ウィンドウ画像のサンプルとして確定し、その後サンプルの特徴値を取得してから、サンプル及びその特徴値を使用して、実際の需要に応じて設定された分類器モデルのパラメータを訓練して、それにより予め訓練された検出分類器モデルを取得する。
上記ステップ110においてスキャンウィンドウ画像の特徴値が取得された後に、スキャンウィンドウ画像の特徴値と上記予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出し、交通標識と思われるウィンドウ画像を取得して確認しようとする交通標識ウィンドウ画像とすることができる。
ステップS130:予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得し、ここで、予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られる。
ここで、予め訓練された畳み込みニューラルネットワークモデルは、まず手動マーキングを受信して、検出分類器モデルが検出してきた確認しようとする交通標識ウィンドウ画像のサンプルを分類して、具体的な交通標識種類又は非交通種類にマーキングし、その後確認しようとする交通標識ウィンドウ画像のサンプル及びその交通標識種類によって、実際の需要に応じて設定された畳み込みニューラルネットワークモデルを訓練して、それにより予め訓練された畳み込みニューラルネットワークモデルを取得する。
上記のステップ120において確認しようとする交通標識ウィンドウ画像が取得された後に、確認しようとする交通標識ウィンドウ画像と上記予め訓練された畳み込みニューラルネットワークモデルとに基づいて、確認しようとする交通標識ウィンドウ画像を認識することができ、確認しようとする交通標識ウィンドウ画像に対応する確率が最大の交通標識種類を認識された交通標識種類とする。
本出願の上記実施例の交通標識を認識する方法によれば、パノラマ画像に交通標識を検出して認識する正確さを向上させるとともに、道路網データの更新効率を向上させる。
以下、図2を参照して予め訓練された検出モデルを訓練する方法を説明する。
図2は本出願の実施例による予め訓練された検出モデルを訓練する方法を示す例示的なフローチャートである。
図2に示すように、予め訓練された検出分類器モデルを訓練する方法200は以下のステップを含んでもよい。
ステップ201において、スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルを取得し、ここで、陽性サンプルは交通標識のウィンドウ画像を含むか又は交通標識とその周囲に所定の画素が拡張されたウィンドウ画像を含み、陰性サンプルは陽性サンプルを除外したスキャンウィンドウ画像を含む。
ここで、スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルについては、まずスキャンウィンドウ画像からサンプルを取得して、その後に受信した手動マーキングに従って、上記スキャンウィンドウ画像のサンプルにおいて交通標識を含むウィンドウ画像又は交通標識とその周囲に所定の画素が拡張されたウィンドウ画像を陽性サンプルとして、サンプルにおける陽性サンプルを除外したスキャンウィンドウ画像を陰性サンプルとする。
上記陽性サンプルが交通標識のウィンドウ画像のみを含む際に、陽性サンプルの特徴値を計算する効率を向上させることができる。対象物体の周囲の画素も対象物体の自身を効果的に説明することができるのを考慮すれば、陽性サンプルが交通標識及びその周囲に所定の画素を拡張するウィンドウ画像を含む際に、陽性サンプルの特徴値を説明する正確さを向上させることができる。
ステップ202において、陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得する。
ここで、陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得する際に、所定の積分チャンネルは画像処理分野における従来技術においていずれか1種又は多種の積分チャンネルであってもよく、又は将来の技術において発展する可能性があるいずれか1種又は多種の積分チャンネルであってもよく、所定の特徴アルゴリズムは画像処理分野における従来技術においていずれか1種又は多種の特徴アルゴリズムであってもよく、将来の技術において発展する可能性があるいずれか1種又は多種の特徴アルゴリズムであってもよい。本出願では、具体的な特徴値を取得する所定の積分チャンネル及び所定の特徴アルゴリズムに制限されなく、ユーザにより実際の使用需要に応じて選択することができる。例えば、グレースケール画像チャネルにハールアルゴリズムによって取得されたハール(haar)特徴値、異なる角度パラメータの勾配画像チャンネルにヒストグラム特徴値アルゴリズムによって取得されたヒストグラム特徴値、赤、緑、青モノクロ画像チャンネルにランダムペア特徴値アルゴリズムによって取得されたランダムペア特徴値などである。
選択的に、サンプルの特徴値を具体的に計算する際に、陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を迅速で効果的に取得するために、交通標識の種類によって、交通標識ウィンドウ画像のサンプルの所定の積分チャンネル及び所定の特徴アルゴリズムを確定することができる。例えば速度制限などのような禁止類標識に対して、赤色チャンネルに対する説明を強化することができる。好ましくは、所定の積分チャンネルは、グレースケール画像チャネル、赤、緑、青モノクロ画像チャンネル、異なる角度パラメータの勾配画像チャンネル、及びエッジ検出画像チャンネルなどのうちの1項又は複数項を含んでもよく、及び所定の特徴アルゴリズムは、ハール特徴アルゴリズム、ローカルバイナリパターン特徴アルゴリズム、ヒストグラム特徴アルゴリズム及びランダムペア特徴アルゴリズムなどのうちの1項又は複数項を含んでもよい。陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するように、上記実施例における所定の積分チャンネルと所定の特徴アルゴリズムとを必要に応じて組み合わせてもよいことを、当業者が理解すべきである。
ステップ203において、陽性サンプル及び陰性サンプルと、陽性サンプル及び陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値とに基づいて、boostingアルゴリズムによって検出分類器モデルを訓練して、予め訓練された検出分類器モデルを取得する。
ここで、上記ステップ202において陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得した後に、boostingアルゴリズムによって検出分類器モデルを訓練することができ、それにより高い正確さの結果分類器を予め訓練された検出分類器モデルとして取得する。
以下、図3を参照して、上記実施例をもとにして確認しようとする交通標識ウィンドウ画像を取得する方法を説明する。
図3は本出願の実施例による確認しようとする交通標識ウィンドウ画像を取得する方法を示す例示的なフローチャートである。
図3に示すように、確認しようとする交通標識ウィンドウ画像を取得する方法300は、以下のステップを含む。
ステップ301:全天球画像を連続的にダウンサンプリングして、画像ピラミッドを取得する。
ここで、全天球画像に対してピラミッド変換、例えばラプラスピラミッド変換などを行うことができ、全天球画像を元のサイズから異なるサイズに変換し、それにより多段画像を含む画像ピラミッドを取得する。
ステップ302:画像ピラミッドにより所定の積分チャンネルの積分画像で分割して得られた画像ピラミッドにおける各段画像のスキャンウィンドウ画像の積分画像を取得する。
上記ステップ301において画像ピラミッドが取得された後に、まず画像ピラミッドの各段画像を所定の積分チャンネルにおいて積分して、画像ピラミッドの積分画像を取得することができ、その後所定のサイズのウィンドウによって画像ピラミッドの積分画像を分割して、各段画像のスキャンウィンドウ画像の積分画像を取得する。
ステップ303:各段画像のスキャンウィンドウ画像の積分画像に基づいて、各段画像のスキャンウィンドウ画像の特徴値を取得する。
上記ステップ302において各段画像のスキャンウィンドウ画像の積分画像が取得された後に、各段画像のスキャンウィンドウ画像の積分画像に基づいて、各段画像のスキャンウィンドウ画像の積分画像で演算し、各段画像のスキャンウィンドウ画像の特徴値を迅速に取得することができる。
ステップ304:各段画像のスキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、各段画像のスキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得する。
上記ステップ303において各段画像のスキャンウィンドウ画像の特徴値が取得された後に、各段画像のスキャンウィンドウ画像の特徴値に基づいて、予め訓練された検出分類器モデルによって各段画像のスキャンウィンドウ画像を検出することができ、その中の交通標識と思われるウィンドウ画像を取得して確認しようとする交通標識ウィンドウ画像とし、それにより画像ピラミッドにおける全ての確認しようとする交通標識ウィンドウ画像を取得する。
本出願の上記実施例の確認しようとする交通標識ウィンドウ画像を取得する方法によれば、全天球画像においてピラミッド変換によって得られたピラミッド画像からスキャンウィンドウ画像を取得し、その後、確認しようとする交通標識ウィンドウ画像を取得するように、各段画像のスキャンウィンドウ画像を検出して、全天球画像において確認しようとする交通標識ウィンドウを欠落する可能性を減少するため、確認しようとする交通標識ウィンドウを取得する正確さを向上させる。また、積分画像を採用して各段画像のスキャンウィンドウ画像の特徴値を取得するため、特徴値の取得速度を向上させる。
以下、図4を参照して、予め訓練された畳み込みニューラルネットワークモデルを訓練する方法を説明する。
図4は、本出願の実施例による予め訓練された畳み込みニューラルネットワークモデルを訓練する方法を示す例示的なフローチャートである。
図4に示すように、予め訓練された畳み込みニューラルネットワークモデルを訓練する方法400は、以下のステップを含む。
ステップ401:ガウス分布に従って、所定の畳み込みニューラルネットワークモデルの畳み込み層と全結合層の両者の重みを初期化し、所定の畳み込みニューラルネットワークモデルは順次に接続された畳み込み層、抽出層、全結合層及び正規化層を含む。
ここで、順次に接続された畳み込み層、抽出層、全結合層及び正規化層は、1つの畳み込み層、1つの抽出層、1つの全結合層及び1つの正規化層を含んでもよく、複数の畳み込み層及び畳み込み層に一対一対応した抽出層、1つの以上の全結合層及び1つの正規化層を含んでもよい。
ここで、設置された畳み込み層は、畳み込み演算によって、原信号特徴を強化して、且つ雑音を低減することができ、設置された抽出層は、画像局所相関性の原理を利用して、画像をサブサンプリングすることができ、データ処理量を減少するとともに有用な情報を保留する。
以下、図5を例として、所定の畳み込みニューラルネットワークモデルを説明する。
図5は本出願の実施例による所定の畳み込みニューラルネットワークモデルを示す例示的な構造図である。
図5に示すように、所定の畳み込みニューラルネットワークモデル500は、順次に接続された畳み込み層conv1、抽出層pool1、畳み込み層conv2、抽出層pool2、畳み込み層conv3、抽出層pool3、全結合層fc1、全結合層fc2を含む。
ここで、conv1は16個のサイズが5*5*3の畳み込みカーネルを有し、conv2は32個のサイズが5*5*16の畳み込みカーネルを有し、conv3は64個のサイズが5*5*32の畳み込みカーネルを有する。2つの全結合層はそれぞれ512と120個のニューロンを有する。
図4に戻し、ステップ402において、確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて、誤差逆伝搬BPアルゴリズムによって畳み込み層と全結合層の両者の重みを反復する。
ここで、確認された交通標識ウィンドウ画像のサンプルは、確認しようとする交通標識ウィンドウ画像から抽出されたサンプルにおいて、受信された手動マーキングに基づいて確認した後の、交通標識を含むウィンドウ画像のサンプルである。
更に、確認された交通標識ウィンドウ画像のサンプルは、交通標識ウィンドウ画像が確認できたオリジナルサンプル、及び交通標識ウィンドウ画像が確認できたオリジナルサンプルに対して回転、並進及びスケーリングのうちの1項又は複数項の処理を行った後に所定のウィンドウサイズに正規化する画像を含んでもよい。サンプルを拡張することによって、サンプル認識の正確率を向上させることができる。
その後、ステップS403又はステップS404によって最適な重みの畳み込みニューラルネットワークモデルを確定することができる。
ステップS403:現在に反復された重みと前回に反復された重みとの差が所定の値より小さい場合に、現在に反復された重みを最適な重みとして確定する。
ステップS404:誤り率の最低の反復された重みが出現する場合に、誤り率の最低の反復された重みを最適な重みとして確定する。
ステップS405:最適な重みを含む畳み込みニューラルネットワークモデルを予め訓練された畳み込みニューラルネットワークモデルとする。
予め訓練された畳み込みニューラルネットワークモデルが訓練された後に、図1におけるステップ130においては、確認しようとする交通標識ウィンドウ画像を畳み込みニューラルネットワークモデルに入力して、正規化層によって出力された、重みが最大の交通標識種類を取得するステップと、重みが最大の交通標識種類を認識して得られた交通標識種類とするステップとを含んでもよい。
図6は本出願の実施例による交通標識を認識する装置を示す構造模式図である。
図6に示すように、前記交通標識を認識する装置600は、特徴値取得モジュール610、交通標識検出モジュール620及び交通標識認識モジュール630を備えてもよい。
特徴値取得モジュール610は、全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得することに用いられる。
選択的に、特徴値取得モジュール610は、全天球画像により所定の積分チャンネルの積分画像で分割して得られたスキャンウィンドウ画像の積分画像を取得するための第1積分画像取得サブモジュール611と、スキャンウィンドウ画像の積分画像に基づいて、スキャンウィンドウ画像の特徴値を取得するための第1特徴値取得サブモジュール612と、を備えてもよい。
交通標識検出モジュール620は、スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得することに用いられ、ここで、予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られる。
交通標識認識モジュール630は、予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得することに用いられ、ここで、予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られる。
本出願の上記実施例の交通標識を認識する装置によれば、パノラマ画像に交通標識を検出して認識する正確さを向上させるとともに、道路網データの更新効率を向上させる。
選択的に、上記の予め訓練された検出分類器モデルは、以下のような方法によって取得されてもよく、即ち、スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルを取得し、陽性サンプルは交通標識のウィンドウ画像を含むか又は交通標識及びその周囲に所定の画素が拡張されたウィンドウ画像を含み、陰性サンプルは陽性サンプルを除外するスキャンウィンドウ画像を含み、陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得し、陽性サンプル及び陰性サンプルと、陽性サンプル及び陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値とに基づいて、boostingアルゴリズムによって検出分類器モデルを訓練して、予め訓練された検出分類器モデルを取得する。
上記の予め訓練された検出分類器モデルを取得する方法は、図7に示すような検出分類器モデル訓練装置によって実現できる。
図7は本出願の実施例による検出分類器モデル訓練装置の例示的な構造図を示す。
図7に示すように、検出分類器モデル訓練装置700は、サンプル取得モジュール701、サンプル特徴値取得モジュール702及び検出モデル訓練モジュール703を備えてもよい。
サンプル取得モジュール701は、スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルを取得することに用いられ、ここで、陽性サンプルは交通標識のウィンドウ画像を含むか又は交通標識及びその周囲に所定の画素が拡張されたウィンドウ画像を含み、陰性サンプルは陽性サンプルを除外するスキャンウィンドウ画像を含む。
サンプル特徴値取得モジュール702は、陽性サンプルと陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得することに用いられる。
所定の積分チャンネルは、グレースケール画像チャネル、赤、緑、青モノクロ画像チャンネル、異なる角度パラメータの勾配画像チャンネル、及びエッジ検出画像チャンネルのうちの1項又は複数項を含み、及び所定の特徴アルゴリズムは、ハール特徴アルゴリズム、ローカルバイナリパターン特徴アルゴリズム、ヒストグラム特徴アルゴリズム及びランダムペア特徴アルゴリズムのうちの1項又は複数項を含む。
検出モデル訓練モジュール703は、陽性サンプル及び陰性サンプルと、陽性サンプル及び陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値とに基づいて、boostingアルゴリズムによって検出分類器モデルを訓練して、予め訓練された検出分類器モデルを取得することに用いられる。
以下、図8を参照して、上記実施例をもとにして、確認しようとする交通標識ウィンドウ画像を取得する装置を説明する。
図8は確認しようとする交通標識ウィンドウ画像を取得するための装置の例示的な構造図を示す。
図8に示すように、確認しようとする交通標識ウィンドウ画像を取得するための装置800は、ダウンサンプリングサブモジュール801、第2積分画像取得サブモジュール802、第2特徴値取得サブモジュール803及び多段検出サブモジュール804を含んでもよい。
ダウンサンプリングサブモジュール801は、全天球画像を連続的にダウンサンプリングして、画像ピラミッドを取得することに用いられる。
第2積分画像取得サブモジュール802は、画像ピラミッドにより所定の積分チャンネルの積分画像で分割して得られた画像ピラミッドの中で各段画像のスキャンウィンドウ画像の積分画像を取得することに用いられる。
第2特徴値取得サブモジュール803は、各段画像のスキャンウィンドウ画像の積分画像に基づいて、各段画像のスキャンウィンドウ画像の特徴値を取得することに用いられる。
多段検出サブモジュール804は、各段画像のスキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、各段画像のスキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得することに用いられる。
本出願の実施例の上記した確認しようとする交通標識ウィンドウ画像を取得する装置によれば、更に確認しようとする交通標識ウィンドウ画像を取得する正確率を向上させるとともに確認しようとする交通標識ウィンドウ画像を検出する速度を向上させることができる。
選択的に、上記図6における予め訓練された畳み込みニューラルネットワークモデルは以下のような方法によって取得されてもよく、ガウス分布に従って、所定の畳み込みニューラルネットワークモデルの畳み込み層と全結合層の両者の重みを初期化し、ここで、前記所定の畳み込みニューラルネットワークモデルは順次に接続された畳み込み層、抽出層、全結合層及び正規化層を備え、確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて、誤差逆伝搬BPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みを反復し、現在に反復された重みと前回に反復された重みとの差が所定の値より小さい場合に、現在に反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとし、又は誤り率の最低の反復された重みが出現する場合に、誤り率の最低の反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとする。
確認された交通標識ウィンドウ画像のサンプルは、確認しようとする交通標識ウィンドウ画像から抽出されたサンプルにおいて、受信された手動マーキングに基づいて確認した後の、交通標識を含むウィンドウ画像のサンプルである。
更に、確認された交通標識ウィンドウ画像のサンプルは、交通標識ウィンドウ画像が確認できたオリジナルサンプル、及び交通標識ウィンドウ画像が確認できたオリジナルサンプルに対して回転、並進及びスケーリングのうちの1項又は複数項の処理を行った後に所定のウィンドウサイズに正規化する画像を含んでもよい。
ここで、順次に接続された畳み込み層、抽出層、全結合層及び正規化層は複数の畳み込み層及び畳み込み層に一対一対応した抽出層、1つの以上の全結合層及び1つの正規化層を備える。
更に、所定の畳み込みニューラルネットワークモデルは損失関数層を更に備えてもよい。
所定の畳み込みニューラルネットワークモデルに対応して損失関数層を更に含み、誤差逆伝搬BPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みを反復するステップにおいては、損失関数とBPアルゴリズムによって畳み込み層と全結合層の両者の重みをそれぞれ反復するステップを含んでもよい。
上記の予め訓練された畳み込みニューラルネットワークモデルを取得する方法は図9に示した予め訓練された畳み込みニューラルネットワークモデルを訓練する装置によって実現できる。
図9は本出願の実施例による予め訓練された畳み込みニューラルネットワークモデルを訓練するための装置を示す例示的な構造図である。
図9に示すように、予め訓練された畳み込みニューラルネットワークモデルを訓練するための装置900は、以下のモジュールを備える。
初期化モジュール901は、ガウス分布に従って、所定の畳み込みニューラルネットワークモデルの畳み込み層と全結合層の両者の重みを初期化することに用いられ、ここで、所定の畳み込みニューラルネットワークモデルは順次に接続された畳み込み層、抽出層、全結合層及び正規化層を備える。
順次に接続された畳み込み層、抽出層、全結合層及び正規化層は複数の畳み込み層及び畳み込み層に一対一対応した抽出層、1つの以上の全結合層及び1つの正規化層を備える。
選択的に、所定の畳み込みニューラルネットワークモデルは損失関数層を更に備える。
重み反復モジュール902は、確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて、誤差逆伝搬BPアルゴリズムによって畳み込み層と全結合層の両者の重みを反復することに用いられる。
第1最適な重み確定モジュール903は、現在に反復された重みと前回に反復された重みとの差が所定の値より小さい場合に、現在に反復された重みを最適な重みとして確定することに用いられる。
第2最適な重み確定モジュール904は、誤り率の最低の反復された重みが出現する場合に、誤り率の最低の反復された重みを最適な重みとして確定することに用いられる。
モデル設定モジュール905は、最適な重みを含む畳み込みニューラルネットワークモデルを予め訓練された畳み込みニューラルネットワークモデルとすることに用いられる。
所定の畳み込みニューラルネットワークモデルに対応して損失関数層を更に備え、重み確定モジュール902は更に損失関数とBPアルゴリズムによって畳み込み層と全結合層の両者の重みをそれぞれ反復することに用いられる。
予め訓練された畳み込みニューラルネットワークモデルを訓練するための装置900によって予め訓練された畳み込みニューラルネットワークモデルが訓練された後に、図6における交通標識認識モジュール630は、確認しようとする交通標識ウィンドウ画像を畳み込みニューラルネットワークモデルに入力して、正規化層によって出力された、重みが最大の交通標識種類を取得するための最大重み認識モジュール(図示せず)、及び重みが最大の交通標識種類を認識して得られた交通標識類として設定する標識種類設定モジュール(図示せず)を備えてもよい。
装置600に記載の各ユニットは図1を参照しながら説明した方法における各ステップに対応する。装置700に記載の各ユニットは図2を参照しながら説明した方法における各ステップに対応する。装置800に記載の各ユニットは図3を参照しながら説明した方法における各ステップに対応する。装置900に記載の各ユニットは図4を参照しながら説明した方法における各ステップに対応することを理解すべきである。それにより、以上で交通標識を認識する方法に対して説明した操作及び特徴は同様に装置600及びその中に含まれたユニットに適用し、以上で予め訓練された検出モデルを訓練する方法に対して説明した操作及び特徴は同様に装置700及びその中に含まれたユニットに適用し、以上で確認しようとする交通標識ウィンドウ画像を取得する方法に対して説明した操作及び特徴は同様に装置800及びその中に含まれたユニットに適用し、以上で予め訓練された畳み込みニューラルネットワークモデルを訓練する方法に対して説明した操作及び特徴は同様に装置900及びその中に含まれたユニットに適用するので、ここで省略する。本出願の実施例の案を実現するように、装置600、700、800及び900における対応するユニットを端末機器及び/又はサーバーにおけるユニットに互いに合わせてもよい。
本発明の実施例に記載されたモジュールは、ソフトウェアで実現されてもよく、ハードウェアで実現されてもよい。記載されたモジュールは、プロセッサに設定されてもよく、例えば、「特徴値取得モジュール、検出モジュール、及び認識モジュールを備えるプロセッサ」として記載されてもよい。その中でも、これらのモジュールの名称は、ある場合において当該モジュールその自体を限定するものではなく、例えば、特徴値取得モジュールは、「全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するためのモジュール」として記載されてもよい。
図10は本出願の実施例によるコンピュータシステムを示す構造模式図である。
本出願の実施例の機器に適用されるコンピュータシステム1000の構造模式図である図10を参照する。
図10に示すように、コンピュータシステム1000は、読み出し専用メモリ(ROM)1002に記憶されているプログラム又は記憶部1008からランダムアクセスメモリ(RAM)1003にロードされたプログラムに基づいて様々な適当な動作及び処理を実行することができる中央処理装置(CPU)1001を備える。ROM1002に記憶されているプログラム又は記憶部1008からRAM1003にロードされたプログラムがCPU1001により実行される場合に、CPU1001が本出願に記載されている方法を実施する。RAM1003には、システム1000の操作に必要な様々なプログラム及びデータがさらに記憶されている。CPU1001、ROM1002及びRAM1003は、バス1004を介して互いに接続されている。入力/出力(I/O)インターフェース1005もバス1004に接続されている。
キーボード、マウスなどを含む入力部1006、陰極線管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む出力部1007、ハードディスクなどを含む記憶部1008、及びLANカード、モデムなどを含むネットワークインターフェースカードの通信部1009は、I/Oインターフェース1005に接続されている。通信部1009は、例えばインターネットのようなネットワークを介して通信処理を実行する。ドライバ1010は、必要に応じてI/Oインターフェース1005に接続される。リムーバブルメディア1011は、例えば、マグネチックディスク、光ディスク、光磁気ディスク、半導体メモリなどのようなものであり、必要に応じてドライバ1010に取り付けられ、したがって、ドライバ1010から読み出されたコンピュータプログラムが必要に応じて記憶部1008にインストールされる。
特に、本発明の実施例によれば、上記のフローチャートを参照しながら記載されたプロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本発明の実施例は、コンピュータプログラム製品を含み、当該コンピュータプログラム製品は、機械可読媒体に有形に具現化されるコンピュータプログラムを含み、前記コンピュータプログラムは、フローチャートで示される方法を実行するためのプログラムコードを含む。このような実施例では、当該コンピュータプログラムは、通信部1009を介してネットワークからダウンロードされてインストールされてもよく、及び/又はリムーバブルメディア1011からインストールされてもよい。
図面におけるフローチャート及びブロック図は、本発明の各実施例に係るシステム、方法及びコンピュータプログラム製品により実現可能なアーキテクチャ、機能及び操作を示す。ここで、フローチャート又はブロック図における各枠は、1つのモジュール、プログラムセグメント、又はコードの一部を代表してもよく、前記モジュール、プログラムセグメント、又はコードの一部は、規定された論理機能を達成するための1つ以上の実行可能な命令を含む。また、いくつかの代替実施態様として、枠に示された機能は、図面に示された順番と異なる順番で実行されてもよい。例えば、連続して示された2つの枠は、関連する機能に応じて、実際にほぼ並行に実行されてもよく、逆の順番で実行されてもよい。また、ブロック図及び/又はフローチャートにおける各枠と、ブロック図及び/又はフローチャートにおける枠の組合せは、規定された機能又は操作を実行する、ハードウェアに基づく専用システムで実現されてもよく、あるいは、専用ハードウェアとコンピュータの命令との組合せで実行されてもよい。
一方、本発明は、コンピュータ読み取り可能な記憶媒体をさらに提供し、当該コンピュータ読み取り可能な記憶媒体は、上記実施例の前記装置に含まれるコンピュータ読み取り可能な記憶媒体であってもよく、独立に存在して端末に組み立てられていないコンピュータ読み取り可能な記憶媒体であってもよい。前記コンピュータ読み取り可能な記憶媒体には、1つ以上のプログラムが記憶され、前記1つ以上のプログラムが1つ以上のプロセッサで本出願に記載されている交通標識を認識する方法を実行するために用いられている。
以上の記載は、本発明の好ましい実施例、及び使用された技術的原理の説明に過ぎない。本発明に係る特許請求の範囲が、上記した技術的特徴の特定な組合せからなる技術案に限定されることではなく、本発明の趣旨を逸脱しない範囲で、上記の技術的特徴又は同等の特徴の任意の組合せからなる他の技術案も含むべきであることを、当業者は理解すべきである。例えば、上記の特徴と、本発明に開示された類似の機能を持っている技術的特徴(これらに限定されていない)とを互いに置き換えてなる技術案が挙げられる。

Claims (14)

  1. 全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するステップと、
    前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するステップと、
    予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得するステップと、を含んでおり、
    ここで、前記予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られて、前記予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られており、
    以下のような方法によって前記予め訓練された検出分類器モデルを取得し、即ち、
    スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルを取得し、ここで、前記陽性サンプルは交通標識のウィンドウ画像を含むか又は交通標識及びその周囲に所定の画素が拡張されたウィンドウ画像を含み、前記陰性サンプルは前記陽性サンプルを除外するスキャンウィンドウ画像を含み、
    前記陽性サンプルと前記陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得し、
    前記陽性サンプル及び前記陰性サンプルと、前記陽性サンプル及び前記陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値とに基づいて、boostingアルゴリズムよって検出分類器モデルを訓練して、前記予め訓練された検出分類器モデルを取得す
    ことを特徴とする交通標識を認識する方法。
  2. 前記の全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルに所定の特徴アルゴリズムによって得られた特徴値を取得するステップにおいては、
    全天球画像により所定の積分チャンネルの積分画像で分割して得られたスキャンウィンドウ画像の積分画像を取得するステップと、
    前記スキャンウィンドウ画像の積分画像に基づいて、前記スキャンウィンドウ画像の特徴値を取得するステップと、を含む
    ことを特徴とする請求項1に記載の方法。
  3. 前記の全天球画像により所定の積分チャンネルの積分画像で分割して得られたスキャンウィンドウ画像の積分画像を取得するステップにおいては、前記全天球画像を連続的にダウンサンプリングして、画像ピラミッドを取得するステップと、画像ピラミッドにより所定の積分チャンネルの積分画像で分割して得られた画像ピラミッドにおける各段画像のスキャンウィンドウ画像の積分画像を取得するステップと、を含み、
    前記の前記スキャンウィンドウ画像の積分画像に基づいて、前記スキャンウィンドウ画像の特徴値を取得するステップにおいては、前記各段画像のスキャンウィンドウ画像の積分画像に基づいて、各段画像のスキャンウィンドウ画像の特徴値を取得するステップを含み、及び
    前記の前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するステップにおいては、前記各段画像のスキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、前記各段画像のスキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するステップを含む
    ことを特徴とする請求項に記載の方法。
  4. 以下のような方法によって前記予め訓練された畳み込みニューラルネットワークモデルを取得し、即ち、
    ガウス分布に従って、所定の畳み込みニューラルネットワークモデルの畳み込み層と全結合層の両者の重みを初期化し、前記所定の畳み込みニューラルネットワークモデルは順次に接続された畳み込み層、抽出層、全結合層及び正規化層を備え、
    確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて、誤差逆伝搬BPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みを反復し、現在に反復された重みと前回に反復された重みとの差が所定の値より小さい場合に、現在に反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとし、又は誤り率の最低の反復された重みが出現する場合に、誤り率の最低の反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとする
    ことを特徴とする請求項1〜のいずれか1項に記載の方法。
  5. 前記所定の畳み込みニューラルネットワークモデルは損失関数層を更に備え、及び
    前記の誤差逆伝搬BPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みを反復するステップにおいては、損失関数とBPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みをそれぞれ反復するステップ含む
    ことを特徴とする請求項に記載の方法。
  6. 前記の予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得するステップにおいては、
    前記確認しようとする交通標識ウィンドウ画像を前記畳み込みニューラルネットワークモデルに入力して、正規化層によって出力された、重みが最大の交通標識種類を取得するステップと
    前記重みが最大の交通標識種類を認識して得られた交通標識類として設定するステップと、を含む
    ことを特徴とする請求項に記載の方法。
  7. 全天球画像により分割して得られたスキャンウィンドウ画像の、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得するための特徴値取得モジュールと、
    前記スキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、スキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するための交通標識検出モジュールと、
    予め訓練された畳み込みニューラルネットワークモデルに基づいて、確認しようとする交通標識ウィンドウ画像を認識して、交通標識種類を取得するための交通標識認識モジュールと、を備えており、
    ここで、前記予め訓練された検出分類器モデルはスキャンウィンドウ画像のサンプル及びその特徴値に基づいて訓練して得られ、前記予め訓練された畳み込みニューラルネットワークモデルは確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて訓練して得られており、
    前記予め訓練された検出分類器モデルは以下のような方法によって取得し、即ち
    スキャンウィンドウ画像のサンプルにおける陽性サンプルと陰性サンプルを取得し、ここで、前記陽性サンプルは交通標識のウィンドウ画像を含むか又は交通標識及びその周囲に所定の画素が拡張されたウィンドウ画像を含み、前記陰性サンプルは前記陽性サンプルを除外するスキャンウィンドウ画像を含み、
    前記陽性サンプルと前記陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値を取得し、
    前記陽性サンプル及び前記陰性サンプルと、前記陽性サンプル及び前記陰性サンプルの、所定の積分チャンネルにおいて所定の特徴アルゴリズムによって得られた特徴値とに基づいて、boostingアルゴリズムよって検出分類器モデルを訓練して、前記予め訓練された検出分類器モデルを取得す
    ことを特徴とする交通標識を認識する装置。
  8. 前記特徴値取得モジュールは、
    全天球画像により所定の積分チャンネルの積分画像で分割して得られたスキャンウィンドウ画像の積分画像を取得するための第1積分画像取得サブモジュールと、
    前記スキャンウィンドウ画像の積分画像に基づいて、前記スキャンウィンドウ画像の特徴値を取得するための第1特徴値取得サブモジュールと、を備えること
    を特徴とする請求項に記載の装置。
  9. 前記第1積分画像取得サブモジュールは、前記全天球画像を連続的にダウンサンプリングして、画像ピラミッドを取得するためのダウンサンプリングサブモジュールと、画像ピラミッドにより所定の積分チャンネルの積分画像で分割して得られた画像ピラミッドにおける各段画像のスキャンウィンドウ画像の積分画像を取得するための第2積分画像取得サブモジュールと、を備え、
    前記第1特徴値取得サブモジュールは、前記各段画像のスキャンウィンドウ画像の積分画像に基づいて、各段画像のスキャンウィンドウ画像の特徴値を取得するための第2特徴値取得サブモジュールを備え、
    前記検出モジュールは、前記各段画像のスキャンウィンドウ画像の特徴値と予め訓練された検出分類器モデルとに基づいて、前記各段画像のスキャンウィンドウ画像を検出して、確認しようとする交通標識ウィンドウ画像を取得するための多段検出サブモジュールを備える
    ことを特徴とする請求項に記載の装置。
  10. 前記予め訓練された畳み込みニューラルネットワークモデルは以下のような方法によって取得し、即ち、
    ガウス分布に従って、所定の畳み込みニューラルネットワークモデルの畳み込み層と全結合層の両者の重みを初期化し、前記所定の畳み込みニューラルネットワークモデルは順次に接続された畳み込み層、抽出層、全結合層及び正規化層を備え、
    確認された交通標識ウィンドウ画像のサンプル及びその交通標識種類に基づいて、誤差逆伝搬BPアルゴリズムによって前記畳み込み層と前記全結合層の両者の重みを反復し、現在に反復された重みと前回に反復された重みとの差が所定の値より小さい場合に、現在に反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとし、又は誤り率の最低の反復された重みが出現する場合に、誤り率の最低の反復された重みを最適な重みとして確定し、最適な重みを含む畳み込みニューラルネットワークモデルを前記予め訓練された畳み込みニューラルネットワークモデルとする
    ことを特徴とする請求項のいずれか1項に記載の装置。
  11. 前記所定の畳み込みニューラルネットワークモデルは損失関数層を更に備え、
    前記重み確定モジュールは更に損失関数とBPアルゴリズムとによって前記畳み込み層と前記全結合層の両者の重みをそれぞれ反復することに用いられる
    ことを特徴とする請求項10に記載の装置。
  12. 前記交通標識認識モジュールは、
    前記確認しようとする交通標識ウィンドウ画像を前記畳み込みニューラルネットワークモデルに入力して、正規化層によって出力された、重みが最大の交通標識種類を取得するための最大重み認識モジュールと、
    前記重みが最大の交通標識種類を認識して得られた交通標識類として設定するための標識種類設定モジュールと、を備える
    ことを特徴とする請求項10に記載の装置。
  13. プロセッサ、及び
    メモリを備え、
    前記メモリに前記プロセッサによって実行可能なコンピュータ読み取り可能な命令が記憶され、前記コンピュータ読み取り可能な命令が実行される際に、前記プロセッサは請求
    項1〜のいずれか1項に記載の方法を実行する
    ことを特徴とする機器。
  14. プロセッサによって実行可能なコンピュータ読み取り可能な命令が記憶され、前記コンピュータ読み取り可能な命令がプロセッサによって実行される際に、前記プロセッサは請求項1〜のいずれか1項に記載の方法を実行する
    ことを特徴とする不揮発性コンピュータ記憶媒体。
JP2016559945A 2015-03-31 2015-12-25 交通標識を認識する方法及び装置 Active JP6400117B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510150525.8 2015-03-31
CN201510150525.8A CN104700099B (zh) 2015-03-31 2015-03-31 识别交通标志的方法和装置
PCT/CN2015/098903 WO2016155371A1 (zh) 2015-03-31 2015-12-25 识别交通标志的方法和装置

Publications (2)

Publication Number Publication Date
JP2017516197A JP2017516197A (ja) 2017-06-15
JP6400117B2 true JP6400117B2 (ja) 2018-10-03

Family

ID=53347198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016559945A Active JP6400117B2 (ja) 2015-03-31 2015-12-25 交通標識を認識する方法及び装置

Country Status (4)

Country Link
JP (1) JP6400117B2 (ja)
KR (1) KR101856584B1 (ja)
CN (1) CN104700099B (ja)
WO (1) WO2016155371A1 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700099B (zh) * 2015-03-31 2017-08-11 百度在线网络技术(北京)有限公司 识别交通标志的方法和装置
CN105069472B (zh) * 2015-08-03 2018-07-27 电子科技大学 一种基于卷积神经网络自适应的车辆检测方法
CN105335754A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 文字识别方法及装置
CN105678322A (zh) * 2015-12-31 2016-06-15 百度在线网络技术(北京)有限公司 样本标注方法和装置
CN105869016A (zh) * 2016-03-28 2016-08-17 天津中科智能识别产业技术研究院有限公司 一种基于卷积神经网络的点击通过率预估方法
CN105956524A (zh) * 2016-04-22 2016-09-21 北京智芯原动科技有限公司 一种交通标识识别方法及装置
CN106022380A (zh) * 2016-05-25 2016-10-12 中国科学院自动化研究所 基于深度学习的个体身份识别方法
CN106778835B (zh) * 2016-11-29 2020-03-24 武汉大学 融合场景信息和深度特征的遥感图像机场目标识别方法
US11308391B2 (en) * 2017-03-06 2022-04-19 Baidu Usa Llc Offline combination of convolutional/deconvolutional and batch-norm layers of convolutional neural network models for autonomous driving vehicles
US10282999B2 (en) * 2017-03-17 2019-05-07 GM Global Technology Operations LLC Road construction detection systems and methods
CN106886801B (zh) * 2017-04-14 2021-12-17 北京图森智途科技有限公司 一种图像语义分割方法及装置
CN107067043B (zh) * 2017-05-25 2020-07-24 哈尔滨工业大学 一种农作物病虫害检测方法
KR101834778B1 (ko) 2017-05-30 2018-03-07 만도헬라일렉트로닉스(주) 교통 표지판 인식장치 및 방법
US10986356B2 (en) 2017-07-06 2021-04-20 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
WO2019009447A1 (ko) * 2017-07-06 2019-01-10 삼성전자 주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
WO2019009490A1 (ko) 2017-07-06 2019-01-10 삼성전자 주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
CN109255279A (zh) * 2017-07-13 2019-01-22 深圳市凯立德科技股份有限公司 一种交通标志检测识别的方法及系统
US9947103B1 (en) * 2017-10-03 2018-04-17 StradVision, Inc. Learning method and learning device for improving image segmentation and testing method and testing device using the same
CN107679577A (zh) * 2017-10-12 2018-02-09 理光图像技术(上海)有限公司 基于深度学习的图像检测方法
CN109726728B (zh) * 2017-10-31 2020-12-15 阿里巴巴(中国)有限公司 一种训练数据生成方法及装置
CN107944437B (zh) * 2017-12-31 2018-12-14 广州二元科技有限公司 一种基于神经网络和积分图像的人脸定位方法
CN110096937A (zh) * 2018-01-31 2019-08-06 北京四维图新科技股份有限公司 一种用于辅助车辆自动驾驶的图像识别的方法及装置
CN108549927A (zh) * 2018-03-16 2018-09-18 深圳市商汤科技有限公司 物体检测网络的训练方法和特征监督图生成方法
JP6833750B2 (ja) * 2018-03-19 2021-02-24 株式会社東芝 認識装置、車両システム及びプログラム
CN108520212A (zh) * 2018-03-27 2018-09-11 东华大学 基于改进的卷积神经网络的交通标志检测方法
KR102102161B1 (ko) * 2018-05-18 2020-04-20 오드컨셉 주식회사 이미지 내 객체의 대표 특성을 추출하는 방법, 장치 및 컴퓨터 프로그램
CN108960308A (zh) * 2018-06-25 2018-12-07 中国科学院自动化研究所 交通标志识别方法、装置、车载终端及车辆
KR102106029B1 (ko) * 2018-07-19 2020-05-04 네이버랩스 주식회사 간판 검출 성능 향상을 위한 방법 및 시스템
KR102096926B1 (ko) * 2018-07-19 2020-04-06 네이버랩스 주식회사 관심 영역 변화를 검출하는 방법 및 시스템
CN109102017B (zh) * 2018-08-09 2021-08-03 百度在线网络技术(北京)有限公司 神经网络模型处理方法、装置、设备及可读存储介质
CN110879950A (zh) * 2018-09-06 2020-03-13 北京市商汤科技开发有限公司 多级目标分类及交通标志检测方法和装置、设备、介质
CN109492628B (zh) * 2018-10-08 2021-11-16 杭州电子科技大学 一种应用于课堂违纪抓取的球形定位系统的实现方法
WO2020080765A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080665A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10402977B1 (en) * 2019-01-25 2019-09-03 StradVision, Inc. Learning method and learning device for improving segmentation performance in road obstacle detection required to satisfy level 4 and level 5 of autonomous vehicles using laplacian pyramid network and testing method and testing device using the same
CN109919017B (zh) * 2019-01-28 2023-09-01 平安科技(深圳)有限公司 人脸识别优化方法、装置、计算机设备和存储介质
CN110175500B (zh) * 2019-04-03 2024-01-19 平安科技(深圳)有限公司 指静脉比对方法、装置、计算机设备及存储介质
CN113409393B (zh) * 2019-05-17 2023-10-03 百度在线网络技术(北京)有限公司 用于识别交通标志牌的方法及装置
CN110348396B (zh) * 2019-07-15 2022-02-11 南京信息工程大学 一种基于深度学习的道路上方文字交通标志识别方法及装置
KR102436512B1 (ko) 2019-10-29 2022-08-25 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN110796109A (zh) * 2019-11-05 2020-02-14 哈尔滨理工大学 一种基于模型融合的驾驶员分心行为识别方法
CN110889378B (zh) * 2019-11-28 2023-06-09 湖南率为控制科技有限公司 一种多视图融合交通标志检测识别方法及其系统
CN111062885B (zh) * 2019-12-09 2023-09-12 中国科学院自动化研究所 基于多阶段迁移学习的标志检测模型训练及标志检测方法
CN111178153A (zh) * 2019-12-09 2020-05-19 武汉光庭信息技术股份有限公司 一种交通标志检测方法及系统
CN111178371B (zh) * 2019-12-17 2023-12-01 深圳市优必选科技股份有限公司 目标检测方法、装置和计算机存储介质
CN111199217B (zh) * 2020-01-09 2023-03-28 上海应用技术大学 一种基于卷积神经网络的交通标志识别方法和系统
KR102287942B1 (ko) 2020-02-24 2021-08-09 삼성전자주식회사 전처리를 이용한 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
CN111310844B (zh) * 2020-02-26 2022-09-16 广州华工邦元信息技术有限公司 车辆识别模型构建方法及装置、识别方法及装置
KR102189926B1 (ko) * 2020-03-30 2020-12-11 네이버랩스 주식회사 관심 영역 변화를 검출하는 방법 및 시스템
CN111597875A (zh) * 2020-04-01 2020-08-28 吉利汽车研究院(宁波)有限公司 一种交通标志识别方法、装置、设备及存储介质
CN111881944A (zh) * 2020-07-08 2020-11-03 贵州无忧天空科技有限公司 图像鉴别的方法、电子设备和计算机可读介质
CN112085056B (zh) * 2020-08-05 2023-12-29 深圳市优必选科技股份有限公司 目标检测模型生成方法、装置、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221378A (ja) * 1995-02-10 1996-08-30 Ricoh Co Ltd 学習機械
JP2004191339A (ja) * 2002-12-13 2004-07-08 Sharp Corp 位置情報検索方法、位置情報検索装置、位置情報検索端末、及び、位置情報検索システム
JP2005311691A (ja) * 2004-04-21 2005-11-04 Toyota Central Res & Dev Lab Inc 物体検出装置及び方法
EP1924926A4 (en) * 2006-07-12 2016-08-17 Kofax Inc METHOD AND SYSTEMS FOR TRANSDUCTIVE DATA CLASSIFICATION AND DATA CLASSIFICATION METHODS USING MASCHINAL LEARNING TECHNIQUES
CN104025118B (zh) * 2011-11-01 2017-11-07 英特尔公司 使用扩展surf特征的对象检测
JP2013196454A (ja) * 2012-03-21 2013-09-30 Honda Elesys Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
CN103366177B (zh) * 2012-03-28 2016-12-07 佳能株式会社 对象检测分类器生成方法和设备、图像对象检测方法和设备
JP2014010633A (ja) * 2012-06-29 2014-01-20 Honda Elesys Co Ltd 画像認識装置、画像認識方法、及び画像認識プログラム
JP2014071832A (ja) * 2012-10-01 2014-04-21 Toshiba Corp 物体検出装置及びその検出方法
CN104036323B (zh) * 2014-06-26 2016-11-09 叶茂 一种基于卷积神经网络的车辆检测方法
CN104700099B (zh) * 2015-03-31 2017-08-11 百度在线网络技术(北京)有限公司 识别交通标志的方法和装置

Also Published As

Publication number Publication date
KR20160132331A (ko) 2016-11-17
KR101856584B1 (ko) 2018-05-10
CN104700099B (zh) 2017-08-11
CN104700099A (zh) 2015-06-10
JP2017516197A (ja) 2017-06-15
WO2016155371A1 (zh) 2016-10-06

Similar Documents

Publication Publication Date Title
JP6400117B2 (ja) 交通標識を認識する方法及び装置
CN108647585B (zh) 一种基于多尺度循环注意力网络的交通标识符检测方法
CN109410218B (zh) 用于生成车辆损伤信息的方法和装置
CN110569878B (zh) 一种基于卷积神经网络的照片背景相似度聚类方法及计算机
CN108197326B (zh) 一种车辆检索方法及装置、电子设备、存储介质
CN111767882A (zh) 一种基于改进yolo模型的多模态行人检测方法
JP6829575B2 (ja) 画像処理装置、画像処理システム及び画像処理方法
CN111461213B (zh) 一种目标检测模型的训练方法、目标快速检测方法
CN111507908B (zh) 图像矫正处理方法、装置、存储介质及计算机设备
CN113139543B (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN111160114B (zh) 手势识别方法、装置、设备及计算机可读存储介质
CN113052170B (zh) 一种无约束场景下的小目标车牌识别方法
CN113807361B (zh) 神经网络、目标检测方法、神经网络训练方法及相关产品
CN111881944A (zh) 图像鉴别的方法、电子设备和计算机可读介质
US11636608B2 (en) Artificial intelligence using convolutional neural network with Hough transform
CN109345460B (zh) 用于矫正图像的方法和装置
CN112364843A (zh) 插拔式航拍图像目标定位检测方法、系统、设备
CN116579992A (zh) 一种用于无人机巡检的小目标螺栓缺陷检测方法
JP2007025902A (ja) 画像処理装置、画像処理方法
US20220114403A1 (en) Fine-grained classification of retail products
CN114626982A (zh) 场景重构方法及装置、存储介质和计算机设备
CN111046861B (zh) 识别红外影像的方法、构建识别模型的方法及应用
CN114332814A (zh) 一种停车框识别方法、装置、电子设备及存储介质
CN114120056A (zh) 小目标识别方法、装置、电子设备、介质及产品
US20240161304A1 (en) Systems and methods for processing images

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180904

R150 Certificate of patent or registration of utility model

Ref document number: 6400117

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250