JP7101255B2

JP7101255B2 - 目標対象の運動の向きを予測するための方法、車両制御方法及び装置

Info

Publication number: JP7101255B2
Application number: JP2020550616A
Authority: JP
Inventors: シュージャン; ジャオフイヤン; ジアマンリー; シンユーゾン
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2018-03-23
Filing date: 2019-03-20
Publication date: 2022-07-14
Anticipated expiration: 2039-03-20
Also published as: CN108416321A; WO2019179464A1; US11710243B2; US20210001885A1; JP2021516817A

Description

本出願は、２０１８年３月２３日に中国特許局に提出された出願番号がＣＮ２０１８１０２４７９６１．０であり、発明名称が「目標対象の運動の向きを予測するための方法、車両制御方法及び装置」である中国特許出願の優先権を要求し、その全ての内容は引用によって本出願に援用される。

本出願は、コンピュータビジョン技術に関し、特に、目標対象の運動の向きを予測するための方法、目標対象の運動の向きを予測するための装置、車両インテリジェント制御方法、車両インテリジェント制御装置、ニューラルネットワーク訓練方法、ニューラルネットワーク訓練装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムに関する。

自動運転／運転支援は、コンピュータビジョン技術分野における重要な課題の１つである。

車両が自動運転／運転支援状態にある場合、車両走行の安全性を可能な限り向上させるために、車両車両を如何に、より正確に制御するかは、注目に値する技術的課題である。

本出願の実施形態は、目標対象の運動の向きに対する予測、車両インテリジェント制御及びニューラルネットワークの訓練のための技術案を提供する。

本出願の実施形態の一態様によれば、目標対象の運動の向きを予測するための方法を提供する。前記方法は、撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得することと、前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することとを含む。

本出願の実施形態の別の態様によれば、ニューラルネットワーク訓練方法を提供する。前記方法は、人体が含まれるサンプル画像ブロックの画像特徴を取得することと、訓練対象である第１ニューラルネットワークによって、前記画像特徴に基づいて、前記人体の人体輪郭キーポイント予測結果を取得することと、前記人体輪郭キーポイント予測結果と人体輪郭キーポイントアノテーション情報との差異をガイダンス情報として、前記訓練対象である第１ニューラルネットワークに対して教師あり学習を行うこととを含む。

本出願の実施形態の別の態様によれば、車両インテリジェント制御方法を提供する。前記方法は、撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得することと、前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することと、前記撮像装置の進行方向に対する前記目標対象の運動の向きに基づいて、前記撮像装置が搭載されている車両を制御するための命令又は警報アラート情報を生成することとを含む。

本出願の実施形態の別の態様によれば、本出願の実施形態のもう１つの態様による、目標対象の運動の向きを予測するための装置を提供する。前記装置は、撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得するように構成される第１取得モジュールと、前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定するように構成される向き決定モジュールとを備える。

本出願の実施形態のもう１つの態様によれば、ニューラルネットワーク訓練装置を提供する。前記装置は、目標対象を含むサンプル画像ブロックを取得するように構成される第２取得モジュールと、訓練対象である第１ニューラルネットワークによって、前記サンプル画像ブロックに対して外見向きを検出し、前記サンプル画像ブロックにおける目標対象の外見向きを取得するように構成される第３取得モジュールと、前記取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、前記訓練対象である第１ニューラルネットワークに対して、教師あり学習を行うように構成される教師あり学習モジュールとを備える。

本出願の実施形態のもう１つの態様によれば、車両インテリジェント制御装置を提供する。前記装置は、撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得するように構成される第１取得モジュールと、前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定するように構成される向き決定モジュールと、前記撮像装置の進行方向に対する前記目標対象の運動の向きに基づいて、前記撮像装置が搭載されている物体を制御するための命令又は警報アラート情報を生成するように構成されるインテリジェント制御モジュールとを備える。

本出願の実施形態のもう１つの態様によれば、電子機器を提供する。該電子機器は、コンピュータプログラムを記憶するように構成されるメモリと、前記メモリに記憶されているコンピュータプログラムを実行し、前記コンピュータプログラムが実行される場合、本出願のいずれか１つの方法の実施形態を実現させるように構成されるプロセッサと備える。

本出願の実施形態のもう１つの態様によれば、コンピュータプログラムが記憶されているコンピュータ可読記憶媒体を提供する。該コンピュータプログラムがプロセッサにより実行される場合、本出願のいずれか１つの方法の実現形態を実現させる。

本出願の実施形態のもう１つの態様によれば、コンピュータコマンドを含むコンピュータプログラムを提供する。前記コンピュータコマンドが装置のプロセッサにおいて実行される場合、本出願のいずれか１つの方法の実施形態を実現させる。

本出願が提供する目標対象の運動の向きを予測するための方法、目標対象の運動の向きを予測するための装置、ニューラルネットワーク訓練方法、ニューラルネットワーク訓練装置、車両インテリジェント制御方法、車両インテリジェント制御装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラムによれば、本出願は、目標対象の外見向き及び目標対象と撮像装置との三次元空間における相対的位置関係を利用して、撮像装置の進行方向に対する目標対象の運動の向きを決定することで、画像における目標対象の現在の状態をより明確に知ることができる。本出願が提供する技術案を自動運転又は運転支援などの応用に適用する場合、車両の走行方向に対する歩行者などの目標対象の運動の向きを正確に把握するのに利し、車両を制御するための命令又は警報アラート情報を正確に生成するのに利し、更に車両走行の安全性の向上に利する。

以下、図面及び実施形態を参照しながら、本出願の技術案を更に詳しく説明する。

本出願の実施例による目標対象の運動の向きを予測するための方法を示すブローチャートである。本出願の実施例による画像における目標対象Ａ及び目標対象Ｂを示す概略図である。本出願の実施例による目標対象の外見向きの実施形態を示す概略図である。本出願の実施例による目標対象の外見向きの別の実施形態を示す概略図である。本出願の実施例による画像における相互平行な２本の線の実施形態を示す概略図である。図５に示した２本の平行線からなる三次元空間における２本の交線の実施形態を示す概略図である。本出願の実施例による目標対象と撮像装置との相対的位置関係の実施形態を示す概略図である。本出願の実施例による撮像装置の進行方向に対する目標対象の運動の向きの実施形態を示す概略図である。本出願の実施例による撮像装置の進行方向に対する目標対象の運動の向きの別の実施形態を示す概略図である。本出願の実施例によるニューラルネットワーク訓練方法を示すフローチャートである。本出願の実施例による車両インテリジェント制御方法を示すフローチャートである。本出願の実施例による目標対象の運動の向きを予測するための装置の構成を示す概略図である。本出願の実施例によるニューラルネットワーク訓練装置の構成を示す概略図である。本出願の実施例による車両インテリジェント制御装置の構成を示す概略図である。本出願の実施形態を実現させるための例示的な装置を示すブロック図である。

明細書の一部を構成する図面は、本出願の実施例を説明し、その説明とともに、本出願の原理の解釈に用いられる。

図面を参照しながら、下記詳細な記載に基づいて、本出願をより明確に理解することができる。

以下、図面を参照しながら、本出願の様々な例示的な実施例を詳しく説明する。別途明記されない限り、これらの実施例において説明されるモジュール及びステップの相対的構成、数式及び数値が、本出願の範囲を限定しないことは自明である。

また、説明の便宜上、図示の各部分の寸法は実際の比例関係に従って描かれたものではないことが理解すべきである。

以下の少なくとも１つの例示的な実施例の説明は単なる例であり、本願発明及びその適用又は使用に対する限定にならない。

ここで、当分野の既知技術、方法および設備については詳しく説明せず、適宜な状況で、前記技術、方法および設備を明細書の一部として見なすべきである。

類似した符号及びアルファベットは下記図面において類似する要素を表すため、いずれかの要素が図面において定義された場合、後続図面においてそれを更に説明する必要がない。

本出願の実施例は、コンピュータシステム／サーバに適用される。それは、多数の他の汎用又は専用コンピュータシステム環境又は構成とともに動作することができる。コンピュータシステム／サーバ一と共に適用されるのに適する公知のコンピューティングシステム、環境及び／又は構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルド又はラップトップデバイス、車載装置、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル消費者向け電子機器製品、ネットワークパソコン、小型コンピュータシステム、大型コンピュータシステム及び上記任意のシステムを含む分散型クラウドコンピューティング技術環境などを含むが、これらに限定されない。

コンピュータシステム／サーバは、コンピュータシステムにより実行されるコンピュータシステムによる実行可能な命令（例えば、プログラムモジュール）の一般的な内容で説明できる。一般的には、プログラムモジュールは、ルーチン、プログラム、オブジェクトプログラム、ユニット、ロジック、データ構造などを含んでもよいが、これらは、特定のタスクを実行するか又は特定の抽象データ型を実現させる。コンピュータシステム／サーバを、分散型クラウドコンピューティング環境において実行することができる。分散型クラウドコンピューティング環境において、タスクは、通信ネットワークを介してリンクされるリモート処理デバイスにより実行される。分散型クラウドコンピューティング環境において、プログラムモジュールは、記憶装置を備えるローカル又はリモートコンピューティングシステム記憶媒体に位置してもよい。

図１は、本出願の実施例による目標対象の運動の向きを予測するための方法を示すフローチャートである。

図１に示すように、該実施例の方法は、以下を含む。

Ｓ１００において、撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と撮像装置との三次元空間における相対的位置関係を取得する。

任意選択的な例において、該ステップＳ１００は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される第１取得モジュール１２００で実行されてもよい。

Ｓ１１０において、目標対象の外見向き及び上記相対的位置関係に基づいて、撮像装置の進行方向に対する目標対象の運動の向きを決定する。

任意選択的な例において、該ステップＳ１１０は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される向き決定モジュール１２１０で実行されてもよい。

本出願は、目標対象の外見向き及び目標対象と撮像装置との三次元空間における相対的位置関係を利用して、撮像装置の進行方向に対する目標対象の運動の向きを決定することで、画像における目標対象の現在の状態をより明確に知ることができる。例えば、同一の画像における異なる目標対象の外見向きが同じであり、異なる目標対象と撮像装置との三次元空間における相対的位置関係が相違している場合、本出願は、画像における同じ外見向きを有する異なる目標対象の、撮像装置の進行方向（例えば、撮像装置が搭載されている車両などの装置の進行方向）に対する運動の向きが相違していると判定し得る。さらに例えば、異なる画像における同一の目標対象の外見向きが変わり、該目標対象と撮像装置との三次元空間における相対的位置関係も変わった場合、本出願は、異なる画像における異なる外見向きを有する同一の目標対象の、撮像装置の進行方向（例えば、撮像装置が搭載されている車両などの装置の進行方向）に対する運動の向きが同じであると判定し得る。上記から分かるように、本出願が提供する技術案は、画像解読の正確性の向上に利する。本出願が提供する技術案を自動運転又は運転支援などの応用に適用する場合、車両の走行方向に対する歩行者などの目標対象の運動の向きを正確に把握するのに利し、車両を制御するための命令又は警報アラート情報を正確に生成するのに利し、更に車両走行の安全性の向上に利する。

任意選択的な例において、本出願における撮像装置は、物体に設けられた撮像装置であってもよく、該物体は、一般的には、移動可能である。例えば、該物体は、車両、飛行体、船舶又はロボットなどであってもよい。本出願は、物体の具体的な表現形態を限定しない。なお、下記技術案の説明において、車両を例として本出願の技術案を説明するが、本出願における物体が車両でなければならないことを示唆するものではない。本出願における撮像装置が車両に設けられた撮像装置である場合、該撮像装置は、ドライブレコーダにおけるカメラ、車両の運転室に設けられたカメラ又は撮像機能を持つ他の部材であってもよい。勿論、本出願における撮像装置は、視覚障害者向けのナビゲーション装置などのような他の物体に設けられた撮像装置であってもよい。

任意選択的な例において、本出願における画像は、フレームの抽出で、撮像装置により撮像されたビデオから抽出されたビデオフレームであってもよい。勿論、該画像は、撮像装置により撮像されたビデオのうちのいずれか１つのビデオフレーム又は撮像装置により撮像された写真などであってもよい。

任意選択的な例において、本出願における目標対象を実際の需要に応じて予め設けてもよい。例えば、目標対象は、歩行者、動物、軽車両、障害物などのような運動の向きが注目されるべき物体を含んでもよいが、これらに限定されない。なお、下記技術案の説明において、歩行者を例として本出願の技術案を説明するが、本出願における物体が歩行者でなければならないことを示唆するものではない。本出願は、物体の具体的な表現形態を限定しない。

任意選択的な例において、本出願における目標対象の外見向きとは、通常、画像における目標対象の外観の観測可能な情報によって表される目標対象の向きを指す。例えば、目標対象が歩行者である場合、画像における歩行者の目、鼻などの外観の観測可能な情報によって表される歩行者の向きを表す。外見向きの真前方は、一般的には、目標対象に正対する方向である。外見向きの真後方は、一般的には、目標対象に背向する方向である。外見向きの真右方は、一般的には、目標対象の右側に正対する方向である。外見向きの真左方は、一般的には、目標対象の左側に正対する方向である。図２に示した画像において、目標対象Ａ（即ち、歩行者Ａ）及び目標対象Ｂ（歩行者Ｂ）の外観によって表されるそれぞれの外見向きは、いずれも真右方である。

任意選択的な例において、画像に表れる目標対象の外見向きは、一般的には、目標対象の現在の状態及び撮像装置の撮像方向に関わる。例えば、撮像装置の撮像方向が変わった場合、同一の実位置に位置する何の変わりもない目標対象の外見向きを変化させることができる。また、例えば、同一の位置に位置する目標対象が回動した場合、撮像装置の撮像方向が変わっていないが、目標対象の外見向きは変わる。

任意選択的な例において、撮像装置により撮像された画像における目標対象の外見向きを取得することは、
画像における目標対象が含まれる画像ブロックを、第１ニューラルネットワークに提供して外見向きの検出を行い、画像における目標対象の外見向きを取得することを含む。

本出願は、第１ニューラルネットワークを利用して、撮像装置により撮像された画像における目標対象の外見向きを取得することができる。例えば、画像における目標対象が含まれる画像ブロックを、第１ニューラルネットワークに提供して外見向きの検出（例えば、分類処理又は回帰処理等）を行い、該第１ニューラルネットワークから出力される情報に基づいて、画像における目標対象の外見向きを取得することができる。勿論、本出願は、画像全体を、外見向きの検出を行うための第１ニューラルネットワークに提供することもできる。本出願における第１ニューラルネットワークは、訓練画像集合によって予め訓練されたものである。該訓練画像集合は、複数の画像サンプル及び画像サンプルの外見向きのアノテーション情報を含む。該第１ニューラルネットワークを訓練する過程は、図１０に関する下記説明を参照されたい。本出願は、第１ニューラルネットワークを利用して目標対象の外見向きを取得するため、外見向きを迅速に取得するのに利し、外見向きの決定の正確性の向上に利する。

第１ニューラルネットワークに提供する画像ブロックの大きさは、一般的には、第１ニューラルネットワークの入力画像に対する要求によるものである。例えば、第１ニューラルネットワークが、２５６×２５６などの画像ブロックの大きさを要求してもよい。本出願は、画像又は分割して得られた画像ブロックに対して、スケーリング、引き伸ばし又は圧縮処理等を行い、分割して得られた画像ブロックに第１ニューラルネットワークの要件を満たさせることができる。本出願は、第１ニューラルネットワークに提供された画像ブロックの大きさを限定しない。

任意選択的な例において、本出願における第１ニューラルネットワークのネットワーク構造を、外見向きの分類（例えば、４クラス分類、８クラス分類又はより多くの分類など）の実際の需要に応じて柔軟に設計することができる。本出願の実施例は、第１ニューラルネットワークの具体的なネットワーク構造を限定しない。例えば、本出願における第１ニューラルネットワークは、畳み込み層、非線形Ｒｅｌｕ層、プーリング層及び全結合層などを含んでもよいが、これらに限定されない。該第１ニューラルネットワークに含まれる層数が多いほど、ネットワークが深くなる。また、例えば、本出願のニューラルネットワークのネットワーク構造として、ＡＬｅｘＮｅｔ、深層残差ネットワーク（ＤｅｅｐＲｅｓｉｄｕａｌＮｅｔｗｏｒｋ：ＲｅｓＮｅｔ）又は視覚幾何学グループネットワーク（ＶｉｓｕａｌＧｅｏｍｅｔｒｙＧｒｏｕｐＮｅｔｗｏｒｋ：ＶＧＧｎｅｔ）等のニューラルネットワークに用いられるネットワーク構造を用いてもよい。

任意選択的な例において、画像ブロックの生成方式は、
画像を、目標対象の外接枠を検出するための第２ニューラルネットワークに提供し、画像における目標対象の外接枠を取得することと、
取得された目標対象の外接枠に基づいて、画像に対して分割処理を行い、目標対象が含まれる画像ブロックを取得することと、を含む。

本出願は、目標対象の外接枠を検出するための第２ニューラルネットワークにより、画像における目標対象が含まれる画像ブロックを取得することができる。例えば、まず、画像を、第２ニューラルネットワークに提供して目標対象の外接枠を検出することで、本出願は、該第２ニューラルネットワークから出力された目標対象検出結果情報に基づいて、該画像における目標対象の外接枠（例えば、目標対象の外接枠の対角線に位置する２つの頂点の座標）を取得してから、上記取得された目標対象の外接枠を利用して、画像に対して分割処理を行い、目標対象が含まれる画像ブロックを取得することができる。画像に複数の目標対象（例えば、歩行者）が含まれる場合、本出願は、目標対象の外接枠を検出するための第２ニューラルネットワークを利用して、複数の目標対象の外接枠を取得して、分割処理により、複数の画像ブロックを取得することができる。

任意選択的な例において、本出願における目標対象が歩行者である場合、人体の外接枠を検出するための第２ニューラルネットワークから出力された人体検出結果は、一般的には、画像における人体外接枠の中心位置及び人体スケールファクタを含む。本出願における人体外接枠の中心位置は、人体位置又は人体中心点などと呼ばれてもよい。本出願における人体スケールファクタは人体外接枠の大きさを決定するためのものであってもよい。人体スケールファクタは、スケーリングファクタを含んでもよい。例えば、人体スケールファクタｓは、画像における人頭の大きさＨを、標準サイズｈまでスケーリングするためのスケーリングファクタであってもよい。つまり、ｓ＝ｈ／Ｈである。続いて、本出願は、人体外接枠の中心位置及び人体スケールファクタを利用して画像をスケーリング処理し、第１ニューラルネットワークの画像ブロックの大きさに対する要求及び中心位置に基づいて、スケーリング処理された画像をクロッピング処理して、第１ニューラルネットワークの画像ブロックの大きさに対する要求に合致する、人体を含む画像ブロックを取得することができる。

任意選択的な例において、本出願における目標対象の外接枠を検出するための第２ニューラルネットワークは、従来の勾配方向ヒストグラム（ＨｉｓｔｏｇｒａｍｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ：ＨＯＧ）演算子に基づいたカスケード検出器、深層学習ベースの領域畳み込みニューラルネットワーク（ＲｅｇｉｏｎｓｗｉｔｈＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ：ＲＣＮＮ）、ＦａｓｔＲＣＮＮ、ＦａｓｔｅｒＲＣＮＮ、シングルショットマルチボックス検出器（ＳｉｎｇｌｅＳｈｏｔＭｕｌｔｉＢｏｘＤｅｔｅｃｔｏｒ：ＳＳＤ）、見るのは一度きり（ＹｏｕＯｎｌｙＬｏｏｋＯｎｃｅ：ＹＯＬＯ）アルゴリズム等により実現することができる。本出願は、目標対象の外接枠を検出するための第２ニューラルネットワークの具体的な構造及び該第２ニューラルネットワークによる目標対象の外接枠の形成のための具体的な方式などを限定しない。

本出願は、第２ニューラルネットワークを利用して目標対象の外接枠を取得するため、目標対象の外接枠を迅速かつ完全的に取得するのに利し、目標対象の外接枠の正確性の向上に利する。

任意選択的な例において、本出願において、取得された画像ブロックに含まれる目標対象は、完全な目標対象であってもよいし、局所的な目標対象であってもよい。例えば、目標対象が歩行者である場合、該画像ブロックに含まれる目標対象は、完全な人体であってもよいし、局所的な人体（即ち、人の半身像等のような人体の局所）であってもよい。本出願は、画像ブロックに含まれる目標対象の具体的な表現形態を限定しない。

任意選択的に、第１ニューラルネットワークは、目標対象の外見向きのアノテーション情報を含む訓練画像集合によって予め訓練されたものである。

本出願の実施例における訓練画像集合には、複数の画像サンプル及び画像サンプルの外見向きのアノテーション情報が含まれる。該第１ニューラルネットワークを訓練する過程は、図１０に関する下記説明を参照されたい。本出願は、第１ニューラルネットワークを利用して目標対象の外見向きを取得するため、外見向きを迅速に取得するのに利し、外見向きの決定の正確性の向上に利する。

任意選択的に、第１ニューラルネットワークの訓練過程は、
目標対象を含むサンプル画像ブロックを取得することと、
訓練対象である第１ニューラルネットワークによって、サンプル画像ブロックに対して外見向きを検出し、サンプル画像ブロックにおける目標対象の外見向きを取得することと、
取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、訓練対象である第１ニューラルネットワークに対して教師あり学習を行うこととを含む。

任意選択的な例において、本出願は、訓練データ集合から画像サンプルを取得し、画像サンプルにおける目標対象を含むサンプル画像ブロックを取得することができる。例えば、本出願は、画像サンプルを、既に訓練できている、目標対象の外接枠を検出するためのニューラルネットワークに提供し、該ニューラルネットワークから目標対象検出結果情報を出力する。本出願は、該検出結果情報に基づいて、画像サンプルにおける目標対象の外接枠（例えば、目標対象の外接枠の対角線に位置する２つの頂点の座標）を取得してから、上記取得された目標対象外接枠を利用して、画像に対して分割処理を行い、目標対象が含まれる画像ブロックを取得することができる。画像サンプルに複数の目標対象（例えば、歩行者）が含まれる場合、本出願は、目標対象の外接枠を検出するためのニューラルネットワークを利用して、複数の目標対象の外接枠を取得し、分割処理により、複数のサンプル画像ブロックを取得することができる。

任意選択的な例において、外見向きのアノテーション情報は、外見向きの所属角度区間のアノテーション情報又は外見向きの角度のアノテーション情報を含むが、これらに限定されない。

訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの所属角度区間を表す情報、又は、目標対象の外見向きの角度を表す情報を含むが、これらに限定されない。

本出願の実施例における第１ニューラルネットワークから出力される情報は、一般的には、目標対象の外見向きの所属角度区間を表す情報を含んでもよい。例えば、目標対象の外見向きの所属角度区間の２つの角度境界値を含む。また、例えば、目標対象の外見向きの所属角度区間に対応する識別子（例えば、１は、２つの角度区間を表し、２は、別の角度区間を表す）等を含む。

任意選択的な例において、角度区間は、
真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間のうちの少なくとも１つを含むが、これらに限定されない。

任意選択的に、目標対象の外見向きは、一般的には、０度から３６０度という角度範囲に属する。本出願は、該角度範囲を複数の角度区間に分けることができる。例えば、本出願は、０から３６０度という角度範囲を真前方角度区間（３１５度から４５度）、真左方角度区間（３１５度から２２５度）、真後方角度区間（２２５度から＋１３５度）及び真右方角度区間（＋４５度から＋１３５度）という４つの角度区間に分けることができる。この場合、第１ニューラルネットワークは、４クラス分類処理に基づいた第１ニューラルネットワークであってもよい。また、例えば、本出願は、０度から３６０度という角度範囲を、真前方角度区間（３３７．５度から２２．５度）、左前方角度区間（３３７．５度から２９２．５度）、真左方角度区間（２９２．５度から２４７．５度）、左後方角度区間（２４７．５度から２０２．５度）、真後方角度区間（２０２．５度から１５７．５度）、右後后方角度区間（１５７．５度から１１２．５度）、真右方角度区間（１１２．５度から６７．５度）及び右前方角度区間（６７．５度から２２．５度）という８つの角度区間に分けることができる。この場合、第１ニューラルネットワークは、８クラス分類処理に基づいた第１ニューラルネットワークであってもよい。

勿論、本出願は、０度から３６０度という角度範囲をより多くの角度区間に分けることもできる。本出願は、角度区間の数を制限すものではない。なお、隣接する２つの角度区間が共有する角度境界値は、一般的には、該２つの角度区間にそれぞれ属する。

任意選択的に、本出願の実施例における第１ニューラルネットワークから出力される情報は、目標対象の外見向きの角度を表す情報を含んでもよい。例えば、目標対象の外見向きの角度を含んでもよい。また、例えば、目標対象の外見向きの角度に対応する識別子等を含んでもよい。この場合、第１ニューラルネットワークは、回帰処理に基づいた第１ニューラルネットワークであってもよい。

任意選択的な例において、第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間におけるいずれか１つの角度は、目標対象の外見向きとして用いられるか、又は、
第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間の中心角度は、目標対象の外見向きとして用いられる。

本出願の実施例における第１ニューラルネットワークが、入力された画像ブロックに対して、目標対象の外見向きの所属角度区間を出力する場合、本出願は、一般的には、第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間の中心角度を目標対象の外見向きとすることができる。例えば、１１２．５度から６７．５度という角度区間の中心角度９０度を目標対象の外見向きとする。本出願における角度区間の中心角度は、平均角度と呼ばれてもよい。該平均角度は、角度区間の２つの境界値の平均値ではなく、該角度区間における整数角度（例えば、全ての整数角度）の平均値であると考えられる。３６０度を上記８つの角度区間に分ける場合、該８つの角度区間の中心角度はそれぞれ、０度（即ち、３６０度）（図３における真前方を向いている矢印）、４５度（図３における右前方を向いている矢印）、９０度（図３における真右方を向いている矢印）、１３５度（図３における右後方を向いている矢印）、１８０度（図３における真後方を向いている矢印）、３１５度（図３における左前方を向いている矢印）、２７０度（図３における真左方を向いている矢印）及び２２５度（図３における左後方を向いている矢印）である。

なお、図３に示した各方向は、車両に設けられる撮像装置の現在の撮像方向（即ち撮像装置の進行方向）によって決まる。また、本出願は、第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間におけるいずれか１つの角度を目標対象の外見向きとして用いることもできる。本出願は、目標対象の外見向きの所属角度区間に基づいて目標対象の外見向きを決定するための具体的な実現形態を制限するものではない。

任意選択的な例において、本出願は、後続の運動の向きの決定に関する実際の需要に応じて、上記取得された目標対象の外見向きを変換処理することができる。例えば、本出願は、目標対象の外見向きを、目標対象の撮像方向（例えば、目標対象を撮像する装置と目標対象との連結線、即ち、第１ニューラルネットワークから出力された角度区間の中心角の１つの辺）と目標対象の真右方との反時計回り方向の夾角αに変換することができる。例えば、図３において、撮像装置が目標対象（例えば、歩行者）の左後方にあり、即ち、撮像装置が目標対象の左後肩の方向から撮像する。従って、夾角αは、目標対象の左後方と目標対象の真右方との反時計回り方向の夾角である。また、例えば、図４において、撮像装置が同じく目標対象（例えば、歩行者）の左後方にあり、即ち撮像装置が目標対象の左後肩の方向から撮像する。従って、夾角αは同様に、目標対象の左後方と目標対象の真右方との反時計回り方向の夾角である。本出願は、他の変換方式で、目標対象の外見向きを変換することで、目標対象の外見向きを表すこともできる。本出願は、目標対象の外見向きの具体的な表現形態を制限するものではない。

任意選択的な例において、本出願は、画像における目標対象の位置及び撮像装置を同一の三次元空間内に変換することで、画像における目標対象と撮像装置との該三次元空間における相対的位置関係を取得することができる。ここで、相対的位置関係は、目標対象及び撮像装置のうちの１つ（例えば、撮像装置）を基準点とした場合、該基準点に対するもう１つ（例えば、目標対象）の方位であってもよい。本出願における相対的位置関係は、一般的には、目標対象と撮像装置との三次元空間における連結線と、水平線又は垂直線（例えば、三次元空間におけるｙ軸）との夾角で表される。本出願の三次元空間は、一般的には、現実世界における三次元空間である。即ち、ワールド座標系に基づいた三次元空間である。該ワールド座標系の原点は、如何なる位置に位置してもよい。該ワールド座標系のｘ軸及びｙ軸により決められた平面は、地平面と認められてもよいし、地平面に平行なものと認められてもよい。本出願は、三次元空間の具体的な表現形態を限定しない。

任意選択的な例において、本出願は、射影変換行列（ホモグラフィ行列と呼ばれてもよい）を利用して、画像における目標対象の位置及び撮像装置をそれぞれ同一の三次元空間内に変換することができる。本出願は、射影変換行列を利用することで、画像における目標対象の位置及び撮像装置をそれぞれ同一の三次元空間内に迅速かつ正確に変換することができる。

任意選択的な例において、射影変換行列は、撮像装置を予めキャリブレーションして形成される射影変換行列を含む。又は、
射影変換行列は、画像における複数の特徴点の画像における座標に基づいて、ホモグラフィ行列関数を解いて取得される射影変換行列を含む。

任意選択的に、本出願における射影変換行列は、撮像装置を予めキャリブレーションして得られた射影変換行列であってもよい。例えば、予め設けられた碁盤目等のキャリブレーション装置を利用して、撮像装置をキャリブレーション処理して、射影変換行列を得る。本出願は、画像における特徴点の画像における座標に基づいて、射影変換行列を取得するための関数を解いて、射影変換行列を取得することもできる。射影変換行列を取得するための関数は、ｏｐｅｎｃｖにより提供された射影変換行列を取得するための関数等であってもよい。本出願は、射影変換行列を取得するために用いられる射影変換行列取得用関数の具体的な表現形態を限定するものではなく、射影変換行列を取得するための具体的な実現形態を限定するものでもない。

任意選択的な例において、特徴点は、道路区画線における点を含んでもよいが、これに限定されない。本出願は、射影変換行列を取得するために用いられる画像における特徴点は、一般的には、画像における、標準規範を満たす物体（例えば道路区画線等）における点である。任意選択的に、画像における特徴点は、道路区画線における頂点などを含んでもよい。本出願における道路区画線は、白実線、白破線、横断歩道標示線、単一黄色実線、単一黄色破線又は二重黄色実線などを含んでもよいが、これらに限定されない。本出願は、画像における複数本の道路区画線のうちの各道路区画線における少なくとも２つの頂点（例えば、幅方向における２つの頂点又は長手方向における２つの頂点など）を決定し、道路区画線の幅及び長さが一般的には所定の標準規範を満たしているため、道路区画線の実際の幅及び実際の長さが一般的には既知のものである。従って、本出願は、画像における所定の数量の特徴点を利用して、対応する関数を解き、解かれた結果から射影変換行列を取得することができる。該技術案によれば、射影変換の正確度を向上させて複雑さを低減させるのに利する。

本出願は、道路区画線を利用して射影変換行列を得ているため、実施しやすい射影変換行列取得方式を提供し、射影変換行列を動的に随時取得することができ、射影変換行列を予め設ける必要があるという状況の減少に利する。

任意選択的な例において、ステップ１００は、
射影変換行列に基づいて、画像における目標対象の位置を三次元空間における目標対象の位置に変換することと、
三次元空間における撮像装置の位置を決定することと、
三次元空間に位置する目標対象と撮像装置の位置を連結し、位置の連結線と撮像装置の運動の向きの法線との夾角を決定することとを含む。

本出願の実施例において、射影変換行列を利用して、画像における目標対象の位置を三次元空間内に変換する一例としては、射影変換行列に基づいて、目標対象の外接枠の下縁における一点の画像における位置を三次元空間内に変換し、三次元空間における該点の位置が三次元空間における目標対象の位置であると見なす。目標対象の外接枠の下縁における一点として、一般的には、下縁の中点を用いることができる。三次元空間における目標対象の外接枠の下縁の中点の位置が一般的には、三次元空間における地平面への、目標対象の重心の垂直投影点に近い（例えば、最も近い）位置であるため、本出願は、目標対象の外接枠の下縁（例えば、最下縁）の中点の、三次元空間における位置を、三次元空間における目標対象の位置として用い、画像における目標対象の重心に対する投影処理を減少させる上で、三次元空間における目標対象の位置の正確性を最大限確保する。

任意選択的な例において、前記三次元空間における撮像装置の位置を決定することは、
射影変換行列に基づいて、画像における第１線に位置する第１点及び第２点、画像における第２線に位置する第３点及び第４点をそれぞれ三次元空間内に変換することと、
三次元空間における第１点及び第２点で形成される線と、三次元空間における第３点及び第４点で形成される線との交差点を三次元空間における撮像装置の位置として用いることとを含む。

ここで、画像における第１線と第２線は互いに平行し、且つそれぞれ水平方向に垂直する。

本出願において、射影変換行列を利用して三次元空間における撮像装置の位置を決定する一例は、以下のとおりである。画像において、相互平行している２本の線（例えば、相互平行な直線又は線分等）を設ける。以下、第１線及び第２線と呼ばれる。第１線及び第２線はそれぞれ画像の水平方向に垂直する（例えば、図５における矢印付きの２本の平行線）。第１線において、第１点及び第２点（第１線におけるいずれか２つの点）のような２つの点を選択し、第２線において、第３点及び第４点（第２線におけるいずれか２つの点）のような２つの点を選択する。射影変換行列を利用して、第１点、第２点、第３点及び第４点をそれぞれ三次元空間内に変換する。三次元空間における第１点と第２点を連結し、１本の線を構成し、三次元空間における第３点と第４点を連結し、もう１本の線を構成する。該２本の線には、交差点が必ず存在する。本出願は、該交差点を三次元空間における撮像装置の位置とすることができる。図５における矢印付きの２本の平行線は、三次元空間において、図６に示した交差点が有する２本の線になる。本出願における三次元空間における撮像装置の位置を決定する方式によれば、三次元空間における撮像装置の位置を迅速かつ正確に取得するのに利し、且つ該方式は、実施しやすい。

任意選択的な例において、本出願における撮像装置の進行方向は、運動状態にある撮像装置の運動方向と、静止状態にある撮像装置の運動趨勢方向とを含む。撮像装置の進行方向は、一般的には、撮像装置の位置する装置の進行方向と同じである。例えば、車両に設けられた撮像装置と言えば、撮像装置の進行方向は、一般的には車両の進行方向である。車両が運動状態にある場合、車両の車頭が指す方向は、車両の運動趨勢方向であり、即ち、撮像装置の運動趨勢方向である。

任意選択的な例において、画像における目標対象と撮像装置との三次元空間における相対的位置関係は、三次元空間における撮像装置に対する三次元空間における目標対象の方位を含む。

任意選択的な例において、ステップ１１０は、目標対象の外見向き及び撮像装置に対する三次元空間における目標対象の方位に基づいて、撮像装置の進行方向に対する目標対象の運動の向きを決定することを含んでもよい。

任意選択的に、本出願の実施例における目標対象の外見向きは、目標対象の撮像方向と目標対象の真右方との反時計回り方向の夾角（例えば、上記実施例で取得された夾角α）と表現されてもよい。

任意選択的に、三次元空間における撮像装置に対する三次元空間における目標対象の方位は、
三次元空間における目標対象の位置と三次元空間における撮像装置の位置との連結線と、撮像装置の運動の向きの法線との、夾角を含む。

任意選択的な例において、本出願は、三次元空間における目標対象の位置及び三次元空間における撮像装置の位置を取得してから、三次元空間における目標対象と撮像装置を連結し、両者の連結線と撮像装置の運動の向きの法線との夾角（例えば図７に示した夾角β）を、目標対象と撮像装置との相対的位置関係とすることができる。本出願における目標対象と撮像装置との相対的位置関係を決定するための前記方式によれば、目標対象と撮像装置との相対的位置関係を迅速かつ正確に取得するのに利し、且つ該方式は、実施しやすい。勿論、本出願は、他の方式で、目標対象と撮像装置との相対的位置関係を表すこともできる。本出願は、目標対象と撮像装置との相対的位置関係の具体的な方言形態を限定しない。

任意選択的な例において、撮像装置の進行方向に対する目標対象の運動の向きθを式（１）により得ることができる。

θ＝α＋β＋３６０°／４式（１）
ただし、αは、目標対象の外見向きであり、目標対象の撮像方向と目標対象の真右方との反時計回り方向の夾角と表現されてもよく、その単位は、度である。βは、目標対象と撮像装置との三次元空間における相対的位置関係であり、三次元空間における目標対象の位置と三次元空間における撮像装置の位置との連結線と、撮像装置の運動の向きの法線との、夾角と表現されてもよく、その単位は、度である。上記式（１）によれば、撮像装置の進行方向に対する目標対象の運動の向きの角度θを算出することができる。例えば、図７に示すように、歩行者Ｂは、目標対象の撮像方向と目標対象の真右方との反時計回り方向の夾角αが２２５度であり、目標対象と撮像装置との三次元空間における相対的位置関係βが４５度であることが得られ、式（１）に代入して計算すると、θ＝２２５°＋４５°＋９０°＝３６０°を得る。この場合、歩行者Ｂが右へ行くと予測する。

任意選択的な例において、同じ外見向きを有する２つの異なる目標対象については、２つの目標対象と撮像装置との相対的位置関係が異なるため、最終的に決定された、撮像装置の進行方向に対する目標対象の運動の向きが異なる。例えば、図８における歩行者及び図９における歩行者は、両者の外見向きが同じであり、いずれも右向きであるが、図８における歩行者と撮像装置との相対的位置関係が、図９における歩行者と撮像装置との相対的位置関係が異なる。本出願において、最終的に決定された、撮像装置の進行方向に対する図８における歩行者の運動の向きは後向きであり、それに対して撮像装置の進行方向に対する図９における歩行者の運動の向きは右向きである。

任意選択的な例において、本出願の実施例が提供する方法は、
取得された、撮像装置の進行方向に対する目標対象の運動の向きに基づいて、撮像装置が搭載されている物体（例えば、車両、飛行体、船舶又はロボット）を制御するための命令又は警報アラート情報を生成することを更に含み、例えば、増速命令、降速命令、急ブレーキ命令、ある方位に関する注意喚起アラート情報又は衝突回避警報アラート情報などが挙げられる。本出願は、撮像装置の進行方向に対する目標対象の運動の向きに基づいて命令又は警報アラート情報を生成するための具体的実現形態を限定しない。

図１０は、本出願の実施例によるニューラルネットワーク訓練方法を示すフローチャートである。図１０に示すように、該実施例の方法は、ステップＳ１０００、ステップＳ１０１０及びステップＳ１０２０を含む。本出願におけるステップＳ１０００、ステップＳ１０１０及びステップＳ１０２０は、以下を含む。

Ｓ１０００において、目標対象を含むサンプル画像ブロックを取得する。

任意選択的な例において、該ステップＳ１０００は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される第２取得モジュール１３００で実行されてもよい。

Ｓ１０１０において、訓練対象である第１ニューラルネットワークによって、サンプル画像ブロックに対して外見向きを検出し、サンプル画像ブロックにおける目標対象の外見向きを取得する。

任意選択的な例において、該ステップＳ１０１０は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される第３１取得モジュール１３１０で実行されてもよい。

Ｓ１０２０において、取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、訓練対象である第１ニューラルネットワークに対して、教師あり学習を行う。

任意選択的な例において、該ステップＳ１０２０は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される教師あり学習モジュール１３２０で実行されてもよい。

任意選択的な例において、本出願は、訓練データ集合から画像サンプルを取得し、画像サンプルにおける目標対象を含むサンプル画像ブロックを取得することができる。例えば、本出願は、画像サンプルを、既に訓練された、目標対象の外接枠を検出するためのニューラルネットワークに提供し、該ニューラルネットワークから目標対象検出結果情報を出力する。本出願は、該検出結果情報に基づいて、画像サンプルにおける目標対象の外接枠（例えば、目標対象の外接枠の対角線に位置する２つの頂点の座標）を取得してから、上記取得した目標対象外接枠を利用して、画像に対して分割処理を行い、目標対象が含まれる画像ブロックを取得することができる。画像サンプルに複数の目標対象（例えば、歩行者）が含まれる場合、本出願は、目標対象の外接枠を検出するためのニューラルネットワークを利用して、複数の目標対象の外接枠を取得して、分割処理により、複数のサンプル画像ブロックを取得することができる。

任意選択的な例において、外見向きのアノテーション情報は、外見向きの角度区間のアノテーション情報又は外見向きの角度のアノテーション情報を含み、
訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの角度区間を表す情報、又は、目標対象の外見向きの角度を表す情報を含む。

本出願における訓練データ集合は、第１ニューラルネットワークを訓練するための複数の画像サンプルを含む。一般的には、各画像サンプルに、いずれも目標対象の外見向きのアノテーション情報が含まれる。例えば、各画像サンプルに、目標対象の外見向きの属する角度区間のアノテーション情報がいずれもラベル付けられている。また、例えば、各画像サンプルに、目標対象の外見向きの角度のアノテーション情報がいずれもラベル付けられている。上記目標対象の外見向きの属する角度区間のアノテーション情報は、目標対象の外見向きの所属角度区間の２つの角度境界値を含んでもよいし、目標対象の外見向きの所属角度区間に対応する識別子（例えば、１は、２つの角度区間を表し、２は、別の角度区間を表す）等を含んでもよい。

任意選択的な例において、本出願は、ランダム読み取りの方式又は画像サンプルのランキングに応じて順に読み取るという方式で、１つ又は複数の画像サンプルを訓練データ集合から一度に読み取ることができる。

任意選択的な例において、目標対象の外見向きの角度区間は、
真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間のうちの少なくとも１つを含む。

画像サンプルにおける目標対象の外見向きは、一般的には、０度から３６０度という角度範囲内にある。本出願は、該角度範囲を複数の角度区間に分けることができる。例えば、上記方法の実施形態に記載の４つの角度区間又は８つの角度区間に分けることができる。具体的には、上記方法の実施例において記載したとおりであり、ここで、詳細な説明を省略する。

任意選択的な例において、本出願における訓練対象である第１ニューラルネットワークは、入力された各サンプル画像ブロックに対して、外見向きを検出し、外見向きの検出結果情報を出力する。例えば、第１ニューラルネットワークは、各サンプル画像ブロックに対して、目標対象の外見向きの所属角度区間を出力する。また、例えば、第１ニューラルネットワークは、各サンプル画像ブロックに対して、目標対象の外見向きの所属角度区間における１つの角度を出力する。

任意選択的な例において、訓練対象である第１ニューラルネットワークに対する訓練が所定の反復条件を満たした場合、今回の訓練過程が完了する。本出願における所定の反復条件は、訓練対象である第１ニューラルネットワークから出力される情報と画像サンプルの外見向きのアノテーション情報との差異が所定の差異要件を満たすことを含む。相違点が該所定の差異要件を満たした場合、訓練対象である第１ニューラルネットワークに対する今回の訓練に成功することになる。本出願における所定の反復条件は、該訓練対象である第１ニューラルネットワークを訓練し、用いられる画像サンプルの数が所定の数量要件を満たすことを含んでもよい。用いられる画像サンプルの数量が所定の数量要件を満たしており、相違点が所定の差異要件を満たさない場合、訓練対象である第１ニューラルネットワークに対する今回の訓練に成功していないことである。訓練に成功した第１ニューラルネットワークは、画像における目標対象の外見向きの予測に用いられる。

図１１は、本出願の実施例による車両インテリジェント制御方法を示すフローチャートである。

図１１に示すように、該実施例の方法は、ステップＳ１１００、ステップＳ１１１０及びステップＳ１１２０を含む。本出願におけるステップＳ１１００、ステップＳ１１１０及びステップＳ１１２０は以下を含む。

Ｓ１１００において、撮像装置により撮像された画像における目標対象的外見向きを取得し、画像における目標対象と撮像装置との三次元空間における相対的位置関係を取得する。

任意選択的な例において、該ステップＳ１１００は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される第１取得モジュール１２００で実行されてもよい。

Ｓ１１１０において、目標対象の外見向き及び上記相対的位置関係に基づいて、撮像装置の進行方向に対する目標対象の運動の向きを決定する。

任意選択的な例において、該ステップＳ１１１０は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行される向き決定モジュール１２１０で実行されてもよい。

Ｓ１１２０において、撮像装置の進行方向に対する目標対象の運動の向きに基づいて、撮像装置が搭載されている車両を制御するための命令又は警報アラート情報を生成する。

任意選択的な例において、該ステップＳ１１２０は、プロセッサにより、メモリに記憶されている対応する命令を呼出して実行されてもよいし、プロセッサにより実行されるインテリジェント制御モジュール１２４０で実行されてもよい。

任意選択的な例において、本出願におけるＳ１１００の実現過程は、上記図１におけるステップＳ１００に関する説明を参照されたい。本出願におけるＳ１１１０の実現過程は、上記図１におけるステップＳ１１０に関する説明を参照されたい。ここで詳細な説明を省略する。

任意選択的な例において、本出願は、上記取得した、撮像装置の進行方向に対する目標対象の運動の向きに基づいて、撮像装置が搭載されている車両を制御するための命令又は警報アラート情報を生成することができ、例えば、増速命令、降速命令、急ブレーキ命令、ある方位に関する注意喚起アラート情報又は衝突回避警報アラート情報などが挙げられる。本出願は、撮像装置の進行方向に対する目標対象の運動の向きに基づいて命令又は警報アラート情報を生成するための具体的実現形態を限定しない。

本出願の１つの適用シナリオは図６に示される。図６において、目標対象Ｂとしての歩行者Ｂは、横断歩道標示線の左（例えば、最左）から横断歩道標示線の右（例えば、最右）へ歩き、横断歩道標示線の片側に位置する車両に撮像装置が搭載されている。例えば、該撮像装置は、歩行者Ｂが横断歩道標示線の左（例えば、最左）から横断歩道標示線の右（例えば、最右）まで歩いた全過程のビデオフレームを撮像した。歩行者Ｂが横断歩道の左（例えば、最左）に位置する時に、本出願は、画像における該歩行者Ｂの外見向きが右前方であると識別することができ、計算により、歩行者Ｂの運動の向きが右向きであることを知ることができる。歩行者Ｂが横断歩道の中間位置に位置する時に、本出願は、画像における該歩行者Ｂの外見向きが真右方であると識別することができ、計算により、歩行者Ｂの運動の向きが右向きであることを知ることができる。歩行者Ｂが横断歩道の右（例えば、最右）に位置する時に、本出願は、画像における該歩行者Ｂの外見向きが右後方であると識別することができ、計算により、歩行者Ｂの運動の向きが右向きであることを知ることができる。これから分かるように、異なる画像における同一の歩行者の外見向きが変わったが、該目標対象と撮像装置との三次元空間における相対的位置関係が変わった場合、本出願は、異なる画像における異なる外見向きを有する同一の目標対象の、車両の進行方向に対する運動の向きが同じであると判定することができる。従って、本出願が提供する技術案は、画像に対する正確な解読に利し、車両の走行方向に対する歩行者などの目標対象の運動の向きを正確に把握するのに利し、車両を制御するための命令又は警報アラート情報を正確に生成するのに利し、更に車両走行の安全性の向上に利する。

本出願の１つの適用シナリオは、図８及び図９に示される。図８及び図９がいずれも車両における撮像装置により撮像されたビデオにおける１つのビデオフレームであるとする。本出願は、図８に示される画像における該歩行者の外見向きが右前方であると識別することができ、計算により、該歩行者の運動の向きが右後向きであることを知ることができる。本出願は、図９に示した画像における該歩行者の外見向きが右前方であると識別することができ、計算により、該歩行者の運動の向きが右向きであることを知ることができる。これから分かるように、異なる画像における異なる歩行者の外見向きが同じであるが、異なる歩行者と撮像装置との三次元空間における相対的位置関係が異なるため、本出願は、異なる画像における同じ外見向きを有する異なる歩行者の、車両の進行方向に対する運動の向きが異なると判定することができる。従って、本出願が提供する技術案は、画像に対する正確な解読に利し、車両の走行方向に対する歩行者などの目標対象の運動の向きを正確に把握するのに利し、車両を制御するための命令又は警報アラート情報を正確に生成するのに利し、更に車両走行の安全性の向上に利する。

当業者であればわかるように、上記各方法実施例の全て又は一部のステップの実現は、プログラム命令に関するハードウェアにより完成することができる。上述したプログラムは、コンピュータ可読記憶媒体に記憶されてもよい。該プログラムが実行される場合、上記方法実施例におけるステップを実行する。上述した記憶媒体は、ＲＯＭ、ＲＡＭ、磁気ディスク又は光ディスクのような、プログラムコードを記憶できる様々な媒体を含む。

図１２は、本出願の実施例による目標対象の運動の向きを予測するための装置の構造を示す概略図である。図１２に示すように、該実施例の装置は主に、第１取得モジュール１２００と、向き決定モジュール１２１０とを備える。任意選択的な例において、該装置は、画像ブロック生成モジュール１２２０と、ニューラルネットワーク訓練装置１２３０及びインテリジェント制御モジュール１２４０のうちの少なくとも１つを備えてもよい。

第１取得モジュール１２００は主に、撮像装置により撮像された画像における目標対象の外見向きを取得し、画像における目標対象と撮像装置との三次元空間における相対的位置関係を取得するように構成される。例えば、第１取得モジュール１２００は、画像における目標対象が含まれる画像ブロックを、第１ニューラルネットワークに提供して外見向きの検出を行い、画像における目標対象の外見向きを取得する。

向き決定モジュール１２１０は主に、目標対象の外見向き及び相対的位置関係に基づいて、撮像装置の進行方向に対する目標対象の運動の向きを決定するように構成される。

画像ブロック生成モジュール１２２０は主に、画像を、目標対象の外接枠を検出するための第２ニューラルネットワークに提供し、画像における目標対象の外接枠を取得し、取得された目標対象の外接枠に基づいて、画像に対して分割処理を行い、目標対象が含まれる画像ブロックを取得するように構成される。

ニューラルネットワーク訓練装置１２３０は主に、目標対象の外見向きのアノテーション情報を含む訓練画像集合を利用して、訓練対象である第１ニューラルネットワークを訓練するように構成される。

インテリジェント制御モジュール１２４０は主に、撮像装置の進行方向に対する目標対象の運動の向きに基づいて、前記撮像装置が搭載されている物体を制御するための命令又は警報アラート情報を生成するように構成され、ここで、物体は、車両、飛行体、船舶又はロボット等であってもよい。

任意選択的な例において、本出願における撮像装置は、物体に設けられた撮像装置を含んでもよく、撮像装置の進行方向は、物体の進行方向である。該物体は、車両、飛行体、船舶又はロボットを含んでもよい。本出願における画像は、フレームの抽出で、撮像装置により撮像されたビデオから抽出されたビデオフレームを含んでもよい。本出願における目標対象は、歩行者、動物、軽車両又は障害物等を含んでもよい。

任意選択的な例において、本出願における第１取得モジュールは、第１サブモジュール、第２サブモジュール及び第３サブモジュール（図示されず）を備えてもよい。

上記第１サブモジュールは主に、射影変換行列に基づいて、画像における目標対象の位置を三次元空間における目標対象の位置に変換するように構成される。

上記第２サブモジュールは主に、三次元空間における撮像装置の位置を決定するように構成される。例えば、第２サブモジュールは、射影変換行列に基づいて、画像における第１線に位置する第１点及び第２点、画像における第２線に位置する第３点及び第４点をそれぞれ三次元空間内に変換する。第２サブモジュールは、三次元空間における第１点及び第２点で形成される線と、三次元空間における第３点及び第４点で形成される線との交差点を三次元空間における撮像装置の位置として用いる。ここで、画像における第１線と第２線は互いに平行し、且つそれぞれ水平方向に垂直する。本出願における射影変換行列は、撮像装置を予めキャリブレーションして形成される射影変換行列を含んでもよい。本出願における射影変換行列は、画像における複数の特徴点の画像における座標に基づいて、ホモグラフィ行列関数を解いて取得される射影変換行列を含んでもよい。本出願における特徴点は、道路区画線における点を含んでもよい。

上記第３サブモジュールは主に、三次元空間に位置する目標対象と撮像装置の位置を連結し、該位置の連結線と撮像装置の運動の向きの法線との夾角を決定するように構成される。

任意選択的な例において、本出願における第１ニューラルネットワーク訓練装置１２３０は主に、第２取得モジュール１３００、第３取得モジュール１３１０及び教師あり学習モジュール１３２０を備える。

第２取得モジュール１３００は主に、目標対象を含むサンプル画像ブロックを取得するように構成される。

第３取得モジュール１３１０は主に、訓練対象である第１ニューラルネットワークによって、サンプル画像ブロックに対して外見向きを検出し、サンプル画像ブロックにおける目標対象の外見向きを取得するように構成される。

教師あり学習モジュール１３２０は主に、取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、訓練対象である第１ニューラルネットワークに対して、教師あり学習を行うように構成される。

任意選択的な例において、本出願における外見向きのアノテーション情報は、外見向きの所属角度区間のアノテーション情報を含んでもよい。又は、外見向きのアノテーション情報は、外見向きの角度のアノテーション情報を含んでもよい。訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの所属角度区間を表す情報を含んでもよい。又は、訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの角度を表す情報を含んでもよい。

任意選択的な例において、本出願における角度区間は、真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間のうちの少なくとも１つを含む。例えば、本出願における角度区間は、真前方角度区間、真左方角度区間、真後方角度区間及び真右方角度区間を含む。また例えば、本出願における角度区間は、真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間を含む。

任意選択的な例において、第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間におけるいずれか１つの角度は、目標対象の外見向きとして用いられる。

任意選択的な例において、第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間の中心角度は、目標対象の外見向きとして用いられる。

任意選択的な例において、本出願における画像における目標対象と撮像装置との三次元空間における相対的位置関係は、三次元空間における撮像装置に対する三次元空間における目標対象の方位を含む。

任意選択的な例において、本出願における三次元空間における撮像装置に対する三次元空間における目標対象の方位は、三次元空間における目標対象の位置と三次元空間における撮像装置の位置との連結線と、撮像装置の運動の向きの法線との、夾角を含む。

第１取得モジュール１２００及び向き決定モジュール１２１０により実行される操作及びそれにより実現できる技術的効果は、上記方法の実施例形態における図１に示したステップＳ１００及びステップＳ１１０に関する説明を参照されたい。ここで、詳細な説明を省略する。

図１３は、本出願の実施例によるニューラルネットワーク訓練装置の構造を示す概略図である。図１３に示すように、該実施例の装置は主に、第２取得モジュール１３００、第３取得モジュール１３１０及び教師あり学習モジュール１３２０を備える。

第２取得モジュール１３００は主に目標対象を含むサンプル画像ブロックを取得するように構成される。

教師あり学習モジュール１３２０は主に、取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、訓練対象である第１ニューラルネットワークに対して教師あり学習を行うように構成される。

第２取得モジュール１３００、第３取得モジュール１３１０及び教師あり学習モジュール１３２０により実行される操作及びそれにより実現できる技術的効果は、上記方法の実施例形態における図１０に示したステップＳ１０００、Ｓ１０１０及びＳ１０２０に関する説明を参照されたい。ここで、詳細な説明を省略する。

図１４は、本出願の実施例による車両インテリジェント制御装置の構造を示す概略図である。図１４に示した装置は主に、第１取得モジュール１２００、向き決定モジュール１２１０及びインテリジェント制御モジュール１２４０を備える。任意選択的な例において、該装置は、画像ブロック生成モジュール１２２０を更に備えてもよい。

インテリジェント制御モジュール１２４０は主に、撮像装置の進行方向に対する目標対象の運動の向きに基づいて、撮像装置が搭載されている物体を制御するための命令又は警報アラート情報を生成するように構成され、ここで、物体は、車両、飛行体、船舶又はロボット等であってもよい。

第１取得モジュール１２００、向き決定モジュール１２１０、画像ブロック生成モジュール１２２０及びインテリジェント制御モジュール１２４０により実行される操作及びそれにより実現できる技術的効果は、上記方法の実施例形態における図１及び図１１に関する説明を参照されたい。ここで、詳細な説明を省略する。

図１５は、本出願を実現させるための例示的な装置１５００を示す。装置１５００は、車両に配置された制御システム／電子システム、携帯端末（例えばスマートフォン等）、パーソナルコンピュータ（例えば、デスクトップコンピュータ又はノートパソコンなどのようなＰＣ）、タブレット及びサーバ等であってもよい。図１５において、装置１５００は、１つあんたは複数のプロセッサ、通信部等を含む。前記１つ又は複数のプロセッサは、１つ又は複数の中央演算処理ユニット（ＣＰＵ）１５０１、及び／又は、ニューラルネットワークを利用して目標対象の運動の向きを予測するための画像処理装置（ＧＰＵ）１５１３等であってもよい。プロセッサは、読み出し専用メモリ（ＲＯＭ）１５０２に記憶されている実行可能な命令又は記憶部１５０８からランダムアクセスメモリ（ＲＡＭ）１５０３にロードされた実行可能な命令に基づいて、様々な適切な動作及び処理を実行することができる。通信部１５１２は、ネットワークカードを含んでもよいが、これに限定されない。前記ネットワークカードは、ＩＢ（Ｉｎｆｉｎｉｂａｎｄ）ネットワークカードを含んでもよいが、これに限定されない。プロセッサは、読み出し専用メモリ１５０２及び／又はランダムアクセスメモリ１５３０と通信して、実行可能な命令を実行し、バス１５０４を介して通信部１５１２に接続され、通信部１５１２を経由して他のターゲット装置と通信することで、本出願における対応するステップを完了する。

上記各命令により実行される操作は、上記方法実施例における関連説明を参照されたい。ここで詳細な説明を省略する。なお、ＲＡＭ１５０３に、装置の操作に必要な様々なプログラム及びデータが記憶されてもよい。ＣＰＵ１５０１、ＲＯＭ１５０２及びＲＡＭ１５０３は、バス１５０４を介して相互接続される。ＲＡＭ１５０３が存在する場合、ＲＯＭ１５０２は、任意選択的なモジュールである。ＲＡＭ１５０３に実行可能な命令が記憶されている。又は、実行中に、ＲＯＭ１５０２に実行可能な命令を書き込む。実行可能な命令は、中央演算処理ユニット１５０１に上記の方法に含まれるステップを実行させる。１入力／出力（Ｉ／Ｏ）インタフェース１５０５もバス１５０４に接続される。通信部１５１２は、一体的に設けられてもよいし、それぞれバスに接続される複数のサブモジュール（例えば、複数のＩＢネットワークカード）を有するものとして設けられてもよい。

キーボード、マウスなどを含む入力部１５０６、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）及びスピーカー等を含む出力部１５０７、ハードディスク等を含む記憶部１５０８、及びＬＡＮカード、モデム等のようなネットワークインタフェースカードを含む通信部１５０９は、Ｉ／Ｏインタフェース１５０５に接続される。通信部１５０９は、インターネットのようなネットワークを経由して通信処理を実行する。ドライブ１５１０も必要に応じてＩ／Ｏインタフェース１５０５に接続される。磁気ディスク、光ディスク、磁気光ディスク、半導体メモリ等のようなリムーバブル媒体１５１１は、必要に応じてドライブ１５１０に取り付けられ、それから読み出されたコンピュータプログラムを必要に応じて記憶部１５０８にインストールするようになる。

図１５に示したアーキテクチャは、任意選択的な実現形態に過ぎず、実践過程において、実際の需要に応じて、上記図15に示した部材の数及びタイプを選択、削除、増加、置き換えることができることに特に留意されたい。異なる機能部材を設ける場合、分散型配置又は集積型配置などのような実現形態を用いてもよい。例えば、ＧＰＵとＣＰＵを離して設けてもよい。また、例えば、ＧＰＵをＣＰＵに集積してもよい。通信部は、離間するように設けられてもよいし、ＣＰＵ又はＧＰＵに集積して設けられてもよい。これらの置き換え可能な実施形態は、いずれも本出願の保護範囲内に含まれる。

特に、本出願の実施形態によれば、フローチャートを参照しながら記載された下記プロセスは、コンピュータのソフトウェアプログラムとして実現されてもよい。例えば、本出願の実施形態は、機械可読媒体上に有体に具現されたコンピュータプログラムを含むコンピュータプログラム製品を含む。コンピュータプログラムは、フローチャートに示したステップを実行するためのプログラムコードを含む。プログラムコードは、本出願が提供する方法のステップを実行するための命令を含んでもよい。

このような実施形態において、該コンピュータプログラムは、通信部１５０９により、ネットワークからダウンロードされてインストールされか、及び／又はリムーバブル媒体１５１１からインストールされる。該コンピュータプログラムが中央演算処理ユニット（ＣＰＵ）１５０１により実行される場合、本出願に記載の、上記対応するステップを実現させるするための命令を実行する。

１つ又は複数の任意選択的な実施形態において、本出願の実施例は、コンピュータ可読命令を記憶するためのコンピュータプログラム製品を更に提供する。前記命令が実行される場合、コンピュータに上記任意の実施例に記載の目標対象の運動の向きを予測するための方法、ニューラルネットワーク訓練方法又は車両インテリジェント制御方法を実行させる。

該コンピュータプログラム製品は、具体的には、ハードウェア、ソフトウェアまたはその組み合わせにより実現されてもよい。任意選択的な一例において、前記コンピュータプログラム製品は具体的には、コンピュータ記憶媒体として体現される。別の任意選択的な例において、前記コンピュータプログラム製品は、具体的には、ソフトウェア開発キット（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ：ＳＤＫ）等のようなソフトウェア製品として体現される。

１つ又は複数の任意選択的な実施形態において、本出願の実施例は、目標対象の運動の向きを予測するための方法、ニューラルネットワーク訓練方法及び車両インテリジェント制御方法並びにそれに対応する装置及び電子機器、コンピュータ記憶媒体、コンピュータプログラム及びコンピュータプログラム製品を更に提供する。ここで、前記方法は、第１装置が、目標対象の運動の向きを予測するための指示、ニューラルネットワーク訓練指示又は車両インテリジェント制御指示を第２装置に送信し、該指示によれば、第２装置に、上記いずれか１つの実施例における目標対象の運動の向きを予測するための方法、ニューラルネットワーク訓練方法又は車両インテリジェント制御方法を実行させることと、第１装置が、第２装置からの、目標対象の運動の向きの予測結果、ニューラルネットワーク訓練結果又は車両インテリジェント制御結果を受信することとを含む。

幾つかの実施例において、目標対象の運動の向きを予測するための指示、ニューラルネットワーク訓練指示又は車両インテリジェント制御指示は、呼出命令を含んでもよい。第１装置は、呼出の方式により、目標対象の運動の向きを予測するための操作、ニューラルネットワーク訓練の操作又は車両インテリジェント制御の操作を実行するように第２装置に指示することができる。なお、呼び出された命令を受信したことに応答して、第２装置は、上記目標対象の運動の向きを予測するための方法、ニューラルネットワーク訓練方法又は車両インテリジェント制御方法におけるいずれか１つの実施例におけるステップ及び／又はフローを実行することができる。

本出願の実施例における「第１」、「第２」等の用語は、区別するためのものに過ぎず、本出願の実施例を限定するものと解釈されるわけではないことが理解されるべきである。また、本出願において、「複数」とは、２つ又は２つ以上を意味してもよく、「少なくとも１つ」とは、１つ、２つ又は２つ以上を意味してもよいことも理解されるべきである。本出願に記載されているいずれか１つのモジュール、データ又は構造について、明確に限定されないか又は文脈では反対となるものが示唆された場合、一般的には、１つ又は複数と解釈されることも理解されるべきである。また、本出願において、各実施例を説明する場合、各実施例の相違点に重点が置かれており、その同じ又は類似した部分は互いに参照することができる。簡潔化を図るために、詳細な説明を省略する。

本明細書における各実施例は漸進的方式で説明され、各実施例が重点的に説明したのは、その他の実施例との相違点であり、各実施例の同じ又は類似した部分は互いに参照することができる。システムの実施例は、基本的に方法の実施例と類似するので、説明が比較的に簡単であり、関連する部分は方法の実施例の一部の説明を参考すればよい。

本出願の方法及び装置を多くの態様で実行できる。例えば、本出願の方法及び装置をソフトウェア、ハードウェア、ファームウェア又はソフトウェア、ハードウェア、ファームウェアの任意の組み合わせにより実行することができる。前記方法のステップに用いられる上記順番は説明のためのものに過ぎず、本出願の方法のステップは、他の方式で特に説明すること以外、上記具体的に記載した順番に限定されない。なお、幾つかの実施例において、本出願を記録媒体に記録されているプログラムとして実行することもできる。これらのプログラムは、本出願の方法を実現させるための機械可読命令を含む。従って、本出願は、本出願の方法を実行するためのプログラムを記憶するための記録媒体を更に含む。

本出願の記載は、例示および説明のためのものであり、網羅的もしくは本出願を開示された形態に限定するように意図されていない。多くの修正及び変化は当業者には明らかであろう。実施例の選択及び説明は、本出願の原理及び実際の適用をより好適に説明するためのものであり、また当業者が本出願を理解して特定の用途向けの様々な修正を含む様々な実施例を設計するようになる。

Claims

目標対象の運動の向きを予測するための方法であって、
撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得することと、
前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することと、を含むことを特徴とする、目標対象の運動の向きを予測するための方法。
前記撮像装置は、物体に搭載されている撮像装置を含み、前記撮像装置の進行方向は、物体の進行方向であり、前記物体は、移動体を含み、
前記画像は、フレームの抽出で、前記撮像装置により撮像されたビデオから抽出されたビデオフレームを含み、
前記目標対象は、歩行者、動物、軽車両又は障害物を含むことを特徴とする、
請求項１に記載の方法。
撮像装置により撮像された画像における目標対象の外見向きを取得することは、
前記画像における前記目標対象が含まれる画像ブロックを、第１ニューラルネットワークに提供して外見向きの検出を行い、前記画像における目標対象の外見向きを取得することを含むことを特徴とする、
請求項１又は２に記載の方法。
前記画像ブロックの生成方式は、
前記画像を、目標対象の外接枠を検出するための第２ニューラルネットワークに提供し、前記画像における目標対象の外接枠を取得することと、
前記取得された目標対象の外接枠に基づいて、前記画像に対して分割処理を行い、前記目標対象が含まれる画像ブロックを取得することと、を含むことを特徴とする、
請求項３に記載の方法。
前記第１ニューラルネットワークは、訓練画像集合によって予め訓練されたものであり、前記訓練画像集合に目標対象の外見向きのアノテーション情報が含まれ、
前記第１ニューラルネットワークの訓練過程は、
目標対象を含むサンプル画像ブロックを取得することと、
訓練対象である第１ニューラルネットワークによって、前記サンプル画像ブロックに対して外見向きを検出し、前記サンプル画像ブロックにおける目標対象の外見向きを取得することと、
前記取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、前記訓練対象である第１ニューラルネットワークに対して教師あり学習を行うこととを含むことを特徴とする、
請求項３又は４に記載の方法。
前記外見向きのアノテーション情報は、外見向きの所属角度区間のアノテーション情報又は外見向きの角度のアノテーション情報を含み、
前記訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの所属角度区間を表す情報、又は、目標対象の外見向きの角度を表す情報を含むことを特徴とする、
請求項５に記載の方法。
前記角度区間は、
真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間のうちの少なくとも１つを含むことを特徴とする、
請求項６に記載の方法。
前記第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間におけるいずれか１つの角度は、目標対象の外見向きとして用いられるか、又は、
前記第１ニューラルネットワークから出力された目標対象の外見向きの所属角度区間の中心角度は、目標対象の外見向きとして用いられることを特徴とする、
請求項３から７のいずれか一項に記載の方法。
前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得することは、
射影変換行列に基づいて、画像における前記目標対象の位置を三次元空間における前記目標対象の位置に変換することと、
三次元空間における前記撮像装置の位置を決定することと、
前記三次元空間に位置する目標対象と撮像装置の位置を連結し、前記位置の連結線と前記撮像装置の運動の向きの法線との夾角を決定することとを含むことを特徴とする、
請求項１から８のいずれか一項に記載の方法。
前記三次元空間における前記撮像装置の位置を決定することは、
前記射影変換行列に基づいて、前記画像における第１線に位置する第１点及び第２点、前記画像における第２線に位置する第３点及び第４点をそれぞれ前記三次元空間内に変換することと、
前記三次元空間における第１点及び第２点で形成される線と、前記三次元空間における第３点及び第４点で形成される線との交差点を前記三次元空間における前記撮像装置の位置として用いることとを含み、
ここで、前記画像における第１線と第２線は相互平行し、かつそれぞれ水平方向に垂直することを特徴とする、
請求項９に記載の方法。
前記射影変換行列は、撮像装置を予めキャリブレーションして形成される射影変換行列を含むか、又は、
前記射影変換行列は、前記画像における複数の特徴点の画像における座標に基づいて、ホモグラフィ行列関数を解いて取得される射影変換行列を含み、
前記特徴点は、道路区画線における点を含むことを特徴とする、
請求項９又は１０に記載の方法。
前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することは、
前記目標対象の外見向き、及び三次元空間における撮像装置に対する前記目標対象の方位に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することを含むことを特徴とする、
請求項９から１１のいずれか一項に記載の方法。
前記方法は、
前記撮像装置の進行方向に対する前記目標対象の運動の向きに基づいて、前記撮像装置が搭載されている物体を制御するための命令又は警報アラート情報を生成することを更に含み、前記物体は、移動体を含むことを特徴とする、
請求項１から１２のいずれか一項に記載の方法。
ニューラルネットワーク訓練方法であって、
目標対象を含むサンプル画像ブロックを取得することと、
訓練対象である第１ニューラルネットワークによって、前記サンプル画像ブロックに対して外見向きを検出し、前記サンプル画像ブロックにおける目標対象の外見向きを取得することと、
前記取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、前記訓練対象である第１ニューラルネットワークに対して教師あり学習を行うこととを含むことを特徴とする、ニューラルネットワーク訓練方法。
前記外見向きのアノテーション情報は、外見向きの角度区間のアノテーション情報又は外見向きの角度のアノテーション情報を含み、
前記訓練対象である第１ニューラルネットワークから出力される情報は、目標対象の外見向きの角度区間を表す情報、又は、目標対象の外見向きの角度を表す情報を含むことを特徴とする、
請求項１４に記載の方法。
前記角度区間は、
真前方角度区間、左前方角度区間、真左方角度区間、左後方角度区間、真後方角度区間、右後方角度区間、真右方角度区間及び右前方角度区間のうちの少なくとも１つを含むことを特徴とする、
請求項１５に記載の方法。
車両インテリジェント制御方法であって、
撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得することと、
前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定することと、
前記撮像装置の進行方向に対する前記目標対象の運動の向きに基づいて、前記撮像装置が搭載されている車両を制御するための命令又は警報アラート情報を生成することと、を含むことを特徴とする、車両インテリジェント制御方法。
目標対象の運動の向きを予測するための装置であって、
撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得するように構成される第１取得モジュールと、
前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定するように構成される向き決定モジュールと、を備えることを特徴とする、目標対象の運動の向きを予測するための装置。
ニューラルネットワーク訓練装置であって、
目標対象を含むサンプル画像ブロックを取得するように構成される第２取得モジュールと、
訓練対象である第１ニューラルネットワークによって、前記サンプル画像ブロックに対して外見向きを検出し、前記サンプル画像ブロックにおける目標対象の外見向きを取得するように構成される第３取得モジュールと、
前記取得された目標対象の外見向きとサンプル画像ブロックの外見向きのアノテーション情報との差異をガイダンス情報として、前記訓練対象である第１ニューラルネットワークに対して、教師あり学習を行うように構成される教師あり学習モジュールとを備えることを特徴とする、ニューラルネットワーク訓練装置。
車両インテリジェント制御装置であって、
撮像装置により撮像された画像における目標対象の外見向きを取得し、前記画像における目標対象と前記撮像装置との三次元空間における相対的位置関係を取得するように構成される第１取得モジュールと、
前記目標対象の外見向き及び前記相対的位置関係に基づいて、前記撮像装置の進行方向に対する前記目標対象の運動の向きを決定するように構成される向き決定モジュールと、
前記撮像装置の進行方向に対する前記目標対象の運動の向きに基づいて、前記撮像装置が搭載されている車両を制御するための命令又は警報アラート情報を生成するように構成されるインテリジェント制御モジュールと、を備えることを特徴とする、車両インテリジェント制御装置。
電子機器であって、
コンピュータプログラムを記憶するように構成されるメモリと、
前記メモリに記憶されているコンピュータプログラムを実行し、前記コンピュータプログラムが実行される場合、請求項１から１７のいずれか一項に記載の方法を実現するように構成されるプロセッサと備える、電子機器。
コンピュータプログラムが記憶されているコンピュータ可読記憶媒体であって、該コンピュータプログラムがプロセッサにより実行される場合、請求項１から１７のいずれか一項に記載の方法を実現する、コンピュータ可読記憶媒体。
コンピュータプログラムであって、前記コンピュータプログラムが装置のプロセッサにおいて実行される場合、請求項１から１７のいずれか一項に記載の方法を実現する、コンピュータプログラム。