WO2021049062A1

WO2021049062A1 - 認識モデル配信システム及び認識モデルの更新方法

Info

Publication number: WO2021049062A1
Application number: PCT/JP2020/005253
Authority: WO
Inventors: 武央西田; 奥出　真理子
Original assignee: 株式会社日立製作所
Priority date: 2019-09-10
Filing date: 2020-02-12
Publication date: 2021-03-18
Also published as: JP7414434B2; US20220406041A1; JP2021043622A

Abstract

本発明は、未知のシーンなどにおける認識に誤りがあったとしても、そのシーンを早急に認識できるように認識モデルを更新する技術を提供することを目的とする。　本発明は、車両に備えられた外界認識部３２からのデータに基づき、予め記憶された認識モデルの中から前記外界認識部３２で認識された認識モデルに近いモデルを取得し、取得した前記モデルをコンピュータグラフィックス映像で再現するデータ分析部１１を備える。データ分析部１１は、再現されたコンピュータグラフィックス映像と外界認識部３２のデータとを比較して差分を抽出する差分抽出部１１４と、差分抽出部１１４で抽出された差分に関する物体を認識する物体認識部１１６と、物体認識部１１６で認識された物体を反映したコンピュータグラフィックス映像に作成するシーン再構成部１１７とを備える。

Description

認識モデル配信システム及び認識モデルの更新方法

　本発明は、認識モデル配信システム及び認識モデルの更新方法に関する。

　現在、自動車の自動運転走行を実現するための技術開発が進められている。車両には、他の車両や歩行者、信号機などのオブジェクトを検出するために、カメラが備えられている。

　車両に備えた車載カメラ画像の画像認識技術においては、深層学習などの機械学習技術を適用する場合がある。機械学習技術を適用する際には、実際に道路を走行したサンプルが必要であるが、例えば雨天や逆光、霧などの過酷な天候条件などを含めた学習に必要なサンプルを抽出するのが困難であった。

　この問題に対して、例えば特許文献１に記載の技術がある。特許文献１には、位置情報で特定された領域（地図上の緯度・経度、方角、視野に基づく風景）をコンピュータグラフィックスで再現したシミュレーション用画像を生成すること、生成されたシミュレーション用画像の中から特定の対象物を、テスト対象又は機械学習対象である認識機能モジュール２０４ａを用いて認識し検出すること、学習部２０４ｂは、認識機能モジュール２０４ａに対して、カメラ装置による撮影映像又は仮想的なＣＧ画像を入力することにより、実際には撮影が困難であり、また再現が困難である画像の特徴点を抽出させて、抽出パターンの多様化を図り、学習効率を向上させることが記載されている。

ＷＯ２０１８／０６６３５１

　しかしながら、特許文献１に記載の技術においては、認識機能による認識の誤りが想定されていない。例えば、道路を動物の群れが横断するような地域固有の事象や地域固有の標識、これまでに遭遇したことのない未知の事象に対して、認識に誤りがあったとしてもそれをフィードバックする機能を有しておらず、既知のシーンに対する認識性能を向上するという効果に留まるものであった。このため、認識に誤りがあった場合、例えば、交差点、高速走行を行う高速道路、児童や生徒、学生が利用する通学路での安全性を確保するには不十分であった。

　そこで、本発明の目的は、未知のシーンなどにおける認識に誤りがあったとしても、そのシーンを早急に認識できるように認識モデルを更新する技術を提供することにある。

　上記目的を達成するために本発明は、外界を認識する認識モデルを車両に配信する認識モデル配信システムにおいて、複数の認識モデルから前記車両に適した認識モデルを取得し、前記車両に備えられた外界認識部からのデータと比較して取得した前記認識モデルにおける交通シーンの認識失敗箇所を判定し、前記認識モデルに認識失敗箇所を反映して三次元コンピュータグラフィックス映像で作成するデータ分析部と、前記データ分析部で作成された前記三次元コンピュータグラフィックス映像に類似する複数の交通シーンを発生させるためのパラメータを生成するパラメータ生成部と、前記パラメータ生成部で生成したパラメータにより作成した交通流モデルを用いて交通流シミュレーションを実行し、三次元交通オブジェクトを生成する三次元オブジェクト生成部と、前記三次元オブジェクト生成部で生成した三次元交通オブジェクトに基づいて認識モデルの学習に必要な教師データを作成する教師データ生成部と、前記教師データ生成部で生成された教師データに基づいて前記認識モデルの学習を実行する学習部と、前記複数の認識モデルから前記車両に適した認識モデルを配信する認識モデル配信部と、を備えたことを特徴とする。

　本発明によれば、未知のシーンなどにおける認識に誤りがあったとしても、そのシーンを早急に認識できるように認識モデルを更新する技術を提供することができる。

　上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本発明の実施例１に係る構成を示すブロック図である。本発明の実施例１に係るデータ分析部１１の詳細構成を示すブロック図である。本発明の実施例１に係る映像再現部１１３におけるよるコンピュータグラフィックス映像での再現例を示す図である。本発明の実施例１に係る差分抽出部１１４及びシーン再構成部１１７における動作例を示す図である。本発明の実施例１に係る三次元オブジェクト生成部１３の詳細構成を示すブロック図である。本発明の実施例１に係る三次元オブジェクト生成部１３おける交通流シミュレーションの処理を示すフローチャートである。本発明の実施例１に係る交通流シミュレーション実行部１３２で管理される交通オブジェクトと、三次元オブジェクト管理部１３４で管理される三次元交通オブジェクトの例を示す図である。本発明の実施例１に係る三次元シミュレーション空間内での車両に対するカメラの位置の例を示す図である。本発明の実施例１に係る学習部２２０の動作の流れを示すフローチャートである。本発明の実施例２に係る構成を示すブロック図である。

　以下、本発明の実施例について、図面を用いて説明する。

　図１は、本発明の実施例１に係る構成を示すブロック図である。図１では、一例として、車載カメラを搭載した車両において自動運転の認識モデルの学習に適用した例を示している。本実施例の認識モデル配信システムは、映像生成装置１、認識モデル生成装置２から構成されている。そして、認識モデル配信システムで生成された認識モデルは、車両に配信される。

　映像生成装置１、認識モデル生成装置２、車両３は、通信ネットワーク４で接続されており、必要なときに必要な情報を通信を介して送受信する。

　映像生成装置１は、予め設定したパラメータ、またはパラメータ生成部１２により生成されたパラメータに基づいて、交通流シミュレーションを実施し、時々刻々の交通流シミュレーションにおいて、特定の車両周辺を三次元オブジェクトで構成し、その車両の三次元オブジェクトに、車載カメラを模擬したカメラを設置したときの映像を再現する。また、映像生成装置１は、通信インターフェース１０、データ分析部１１、パラメータ生成部１２、三次元オブジェクト生成部１３、及び教師データ生成部１４を備えている。

　データ分析部１１は、車両３から送信された車両データを受信する。ここで、車両３から取得するデータは、車両が備える外界認識部３２のセンサ、すなわち、カメラやLIDAR（Light Detection and RangingまたはLaser Imaging Detection and Rangingの略）、ソナーなどのセンサのセンサデータと、車両の走行制御にかかわる操作、すなわち、操舵やアクセル、ブレーキの操作量に関するデータ、さらに車両の位置及び向きに関するデータである。

　また、データ分析部１１は、認識モデル生成装置２に記憶された複数の認識モデルの中から、車両３の認識モデルと同一のモデルを取得し、認識した結果と同一となるような三次元コンピュータグラフィックス映像を再現し、これを車両３から得た車載カメラ映像と比較して差分を抽出し、差分内に存在する物体を認識して、この映像が影響を受ける国または地域を判定するとともに、再現した三次元コンピュータグラフィクス映像にこの物体を追加して、映像を再構成する。本実施例における再構成とは、差分として抽出された物体を反映して三次元コンピュータグラフィックス映像を作成することを意図するものである。国または地域とは、運転環境を意図するものである。データ分析部１１にて抽出された差分は、認識の失敗箇所（誤り）となる。

　次にデータ分析部１１の構成について説明する。図２は、本発明の実施例１に係るデータ分析部１１の詳細構成を示すブロック図である。

　データ分析部１１は、認識モデル取得部１１０、認識部１１１、地図データベース１１２、映像再現部１１３、差分抽出部１１４、物体認識モデル１１５、物体認識部１１６、シーン再構成部１１７、及び地域判定部１８を備えている。

　認識モデル取得部１１０は、車両３で用いられる認識モデルと同一の認識モデルを、認識モデル生成装置２に記憶された複数の認識モデルの中から取得する。

　認識部１１１は、入力された画像に対して、認識結果を返す。入力される画像は、車両３の車載カメラから得られた実映像における各フレームの画像や、映像再現部１１３で生成される三次元コンピュータグラフィックス映像における各フレームの画像となる。

　地図データベース１１２は、地図情報が記録されたものであり、車両３から得られる位置情報に基づいて、その周辺の地図情報を提供する。

　映像再現部１１３は、地図データベース１１２から提供された車両３の一周辺の地図情報から、三次元の静的な交通オブジェクトを生成し、その中に車両３の向きに合わせて三次元の車両オブジェクトを配置する。さらに、映像再現部１１３は、車両３から得られた車載カメラの映像を認識部１１１で認識した結果と同一の認識結果になるように他車両や歩行者などの三次元の交通オブジェクトを配置し、車両の車載カメラを模擬した三次元シミュレーション空間内のカメラで映像を再現する。この映像を認識部１１１へ入力し、認識結果が車両３の認識結果と近くなるまで三次元交通オブジェクトの配置や、三次元シミュレーション空間内の天候や日差しを調整する。

　映像再現部１１３の再現例について、図３を用いて説明する。図３は、本発明の実施例１に係る映像再現部１１３におけるよる三次元コンピュータグラフィックス映像での再現例を示す図である。

　図３において、１１３ａは、車両３の車載カメラ（外界認識部３２）から得られた映像の一コマである。この画像には、車両ａ１及び車両ａ２が映っており、車両ａ２は塀により一部が隠れている。１１３ｂは、画像１１３ａを認識部１１１で認識した結果である。
１１３ｂにおける枠ｂ１は、車両ａ１を認識したことを示している。一方で、車両ａ２には枠が示されておらず、車両ａ２を認識していないことを意味する。すなわち、車両ａ２は認識の失敗箇所である。この時、映像再現部１１３では、認識部１１１による認識結果が１１３ｂに類似するように三次元の交通オブジェクトを配置する。すなわち、１１３ｄのような認識結果となるように、車両ｃ１が存在するような三次元コンピュータグラフィックス画像１１３ｃが再現される。

　図２に戻り、データ分析部１１を説明する。差分抽出部１１４では、認識部１１１での認識結果に基づいて映像再現部１１３で再現され三次元コンピュータグラフィック画像と、車両３の車載カメラ（外界認識部３２）から得られた映像とを比較し、差分となる部分を抽出する。すなわち、差分抽出部１１４は認識の失敗箇所を判定する。

　物体認識部１１６は、差分抽出部１１４で抽出された車両３による映像とコンピュータグラフィックスで再現された映像における各フレームの差分の画像に対して、物体認識モデル１１５に登録された物体認識モデルを使って物体認識を行う。

　シーン再構成部１１７は、映像再現部１１３で再現された車両３の車載カメラ映像に対する類似交通シーンに対して、物体認識部１１６で認識された物体に相当する三次元オブジェクトを車載カメラ映像に相当する位置へ配置し、三次元シミュレーション空間を再構成する。

　差分抽出部１１４及びシーン再構成部１１７の動作例について、図４を用いて説明する。図４は、本発明の実施例１に係る差分抽出部１１４及びシーン再構成部１１７における動作例を示す図である。

　車両３の車載カメラから得られた映像の一コマである映像１１３ａと、映像再現部１１３で再現されたコンピュータグラフィックス画像１１３ｃの比較により、差分画像１１４ａが抽出される。この差分画像１１４ａから、物体認識モデルにより車両であることを認識し、再現されたコンピュータグラフィックス画像１１３ｃでの三次元交通オブジェクトの配置に、車両ａ２に相当する車両ｃ２を配置して再構成する。その結果、シーン再構成部１１７では、画像１１７ｃに示すような車両ｃ２が配置された再構成後のコンピュータグラフィックス画像が生成される。

　なお、図４では、車載カメラ映像と、再現映像の認識結果が一致するように三次元シミュレーション空間で三次元交通オブジェクトを調整しているが、認識モデルが多層のＣＮＮ（Convolutional Neural Network、畳み込みニューラルネットワーク）として実装されているとき、中間層における特徴マップの結果をさらに比較するようにしても良い。この比較により、車載カメラ映像において認識の誤りの原因箇所をより詳細に特定できる場合がある。

　地域判定部１１８は、物体認識部１１６による物体認識結果に基づいて、車両３の認識モデル登録部３１に登録された認識モデルでは認識できなかった物体が影響を受ける国や地域を判定する。国や地域とは運転環境を意図している。例えば、道路標識を認識できなかった場合に、その道路標識が用いられる国や地域を判定し、その結果を教師データ生成部１４に出力する。

　次に、図１に戻って映像生成装置１の続きを説明する。パラメータ生成部１２は、データ分析部１１により再構成された三次元コンピュータグラフィックス映像と類似する交通シーンを複数（多く）発生させるための教師データ生成のパラメータを生成する。ここで生成するパラメータは、例えば、交通流シミュレーションを実行するエリアのパラメータ、車両の速度分布や発生確率を調整するパラメータ、歩行者の速度分布や発生確率を調整するパラメータのほか、歩行者の道路への飛び出しなどのイベントの発生確率を調整するパラメータである。具体的に、本実施例のパラメータ生成部１２では、先行車両の前に歩行者が飛び出したことを検出できず、先行車両とともに急停止となった時に、車両の発生確率及び人の飛び出しによるイベントの発生確率を高め、類似のシーンを生成しやすくすることができる。

　次に三次元オブジェクト生成部１３の構成について説明する。図５は、本発明の実施例１に係る三次元オブジェクト生成部１３の詳細構成を示すブロック図である。

　三次元オブジェクト生成部１３は、パラメータ登録部１３０、交通流モデル生成部１３１、交通流シミュレーション実行部１３２、イベント管理部１３３、三次元オブジェクト管理部１３４、描画領域管理部１３５を備えている。

　パラメータ登録部１３０は、予め設定したパラメータ、またはパラメータ生成部１２により生成されたパラメータを、映像生成に必要なパラメータとして登録する。

　交通流モデル生成部１３１は、パラメータ生成部１２により生成され、パラメータ登録部１３０に登録されたパラメータに基づいて、交通流シミュレーションに必要な交通流モデルを生成する。ここで、交通流モデルとは、道路ネットワークモデル（道路の長さや幅、種別、車線数方向、接続関係、車種ごとの走行可否などを含めた道路全体のネットワーク情報）、車両モデル（車種毎の平均速度や車両毎の経路、発生時刻などの情報）、歩行者モデル（歩行者種別毎の平均速度や歩行者毎の経路、発生時刻などの情報）、信号モデル（信号と交差点との紐づけや、点灯時間、点灯パターンなどの情報）、その他オブジェクトモデル（建築物や公園の領域や、樹木の位置などの情報）を意味する。

　交通流シミュレーション実行部１３２は、交通流モデル生成部１３１で生成した交通流モデルに基づいて、交通流のミクロシミュレーションを実行する。すなわち、交通流シミュレーションの各シミュレーションステップにおける、シミュレーション空間内の全ての動的な交通オブジェクトについて、生成、更新、消去を行う。例えば、地点１から地点２へ移動する車両Ａが時刻Ｔ１に発生するとき、時刻Ｔ１において地点１で車両Ａを交通オブジェクトとして生成し、地点２へ到着するまでの間、他車両や歩行者、信号の影響を受けながら車両Ａのオブジェクトの位置が更新され、地点２に到着すると車両Ａのオブジェクトは消去される。

　イベント管理部１３３は、パラメータ生成部１２により生成され、パラメータ登録部１３０に登録されたパラメータに基づいて、交通流シミュレーション実行部１３２における交通流シミュレーション中のイベント発生を管理する。ここで管理されるイベントは、例えば、天候を変更する、時刻に応じて日差しの入り方を変更する、時刻Ｔ１に歩行者が横断歩道のない道路を横断する、などがある。

　三次元オブジェクト管理部１３４は、交通流シミュレーション実行部１３２で実行される交通流シミュレーション空間の全ての交通オブジェクト及びイベント管理部１３３で管理される全ての交通オブジェクトを、三次元オブジェクトとして管理する。例えば、交通流モデル生成部１３１で生成された道路モデルから三次元の道路オブジェクト、信号モデルから三次元の信号オブジェクトを生成して管理し、交通流シミュレーション実行部１３２で実行される車両オブジェクトを三次元の車両オブジェクト、歩行者オブジェクトを三次元の歩行者オブジェクトとして管理する。本実施例の三次元オブジェクトにおいて、三次元の道路オブジェクト、三次元の信号オブジェクト、三次元の車両オブジェクト、三次元の歩行者オブジェクトを、三次元交通オブジェクトと称する。

　次に、三次元オブジェクト生成部１３おける交通流シミュレーションの処理について、図６を用いて説明する。図６は、本発明の実施例１に係る三次元オブジェクト生成部１３おける交通流シミュレーションの処理を示すフローチャートである。

　三次元オブジェクト生成部１３では、まずステップＳ１０１において、登録されたパラメータに基づいて交通流モデルを生成する。

　ステップＳ１０２では、ステップＳ１０１で生成された交通流モデルのうち、道路ネットワークモデルやその他オブジェクトモデルなどの静的な交通オブジェクトに関するモデルに基づいて、三次元のシミュレーション空間を構築する。

　ステップＳ１０３では、交通流モデルに基づいて交通流シミュレーションを開始する。

　ステップＳ１０４では、交通流シミュレーションの時刻ステップを進める。

　ステップＳ１０５では、登録されたパラメータに基づくイベントが当該の時刻ステップで発生するか否かを判定し、発生する場合はステップＳ１０６、発生しない場合はステップＳ１０７へ進む。

　ステップＳ１０６では、イベントに対応した三次元交通オブジェクトを生成し、三次元シミュレーション空間に配置する。

　ステップＳ１０７では、交通流シミュレーションにおける動的な交通オブジェクトのリストを取得する。

　ステップＳ１０８では、前の時刻ステップで取得した交通オブジェクトのリストと、当該時刻ステップで取得した交通オブジェクトのリストを比較する。

　ステップＳ１０９では、比較の結果、動的な交通オブジェクトが新規発生したか否かを判定し、発生した場合はＳ１１０へ、発生していない場合はＳ１１１へ進む。

　ステップＳ１１０では、新規に発生した動的な交通オブジェクトに対応する三次元交通オブジェクトを生成し、三次元シミュレーション空間に配置する。

　ステップＳ１１１では、比較の結果、動的交通オブジェクトが消滅したか否かを判定し、消滅した場合はステップＳ１１２、消滅していない場合はステップＳ１１３へ進む。

　ステップＳ１１２では、消滅した動的な交通オブジェクトに対応する三次元交通オブジェクトを、三次元シミュレーション空間から削除する。

　ステップＳ１１３では、前の時刻ステップから存在が継続している交通オブジェクトに対して、対応する三次元交通オブジェクトの位置、向きを、三次元シミュレーション空間で更新する。

　ステップＳ１１４では、交通流シミュレーションが終了したか否かを判定し、終了していない場合はステップＳ１０４に戻り、時刻ステップを進めて上記の処理を繰り返す。ここで、交通流シミュレーションが終了したか否かの判定には、予め設定したシミュレーションステップ数に到達したか否かの判定か、すべての動的な交通オブジェクトが目的地に到達したか否かの判定を用いる。

　上記のフローチャートに従うことにより、本実施例では、交通流シミュレーションで実行される二次元のシミュレーション空間から三次元オブジェクトによる三次元シミュレーション空間で再現することができる。

　次に、三次元交通オブジェクトについて図７を用いて説明する。図７は、本発明の実施例１に係る交通流シミュレーション実行部１３２で管理される交通オブジェクトと、三次元オブジェクト管理部１３４で管理される三次元交通オブジェクトの例を示す図である。

　図７において、５０は交通流シミュレーション実行部１３２で管理する二次元のシミュレーション空間の一部を切り取ったものであり、５１は車両オブジェクト、５２は歩行者オブジェクト、５３は信号機オブジェクト、５４は建築物オブジェクトである。また、５５は道路に引かれたセンターラインや横断歩道、路肩などを示す白線である。

　三次元オブジェクト管理部１３４は、このような二次元の交通オブジェクトから、三次元の交通オブジェクトを生成・更新・消去などの管理を実行する。具体的には車両オブジェクト５１は三次元車両オブジェクト５１ａ、歩行者オブジェクト５２は三次元歩行者オブジェクト５２ａ、信号オブジェクト５３は三次元信号オブジェクト５３ａ、建築物オブジェクト５４は三次元建築物オブジェクト５４ａのように、それぞれの二次元交通オブジェクトに対応する三次元交通オブジェクトを管理する。

　三次元車両オブジェクト５１ａは、車両モデルに記述された車種に応じて三次元オブジェクトを切り替えるようにしても良いし、車両毎に車種や色などをランダムに変更するようにしても良い。

　三次元歩行者オブジェクト５２ａは、歩行者モデルに記述された歩行者種別に応じて、年齢や性別、服装や色の異なる三次元歩行者オブジェクトにするようにしても良い。

　三次元信号オブジェクト５３ａは、交差点における各道路の接続関係に応じて、矢印式の信号の数を変更するようにしても良い。

　三次元建築物オブジェクト５４ａは、高さをランダムに変更したり、外観の色や質感を表現するテクスチャなどを変更しても良い。

　図５において、描画領域管理部１３５は、三次元オブジェクト管理部１３４で管理される三次元の交通オブジェクトが配置される三次元のシミュレーション空間内に、カメラを設置する点を決定する。本実施例では、自動車の車載カメラによる自動運転に適用することを前提としているため、車両を三次元オブジェクト管理部１３４にて管理される三次元車両オブジェクトから選択する。この選択は、ユーザーが任意に選択しても良いし、ランダムに選択しても良い。また、選択されていた車両オブジェクトが目的地への到達などにより削除された場合は、自動的に別の車両を選択するようにしても良い。さらに、特定の条件を満たす三次元車両オブジェクトを選択するようにしても良い。特定の条件とは、例えば、前方車両との相対速度が所定の値を下回る場合や、歩行者が横断歩道を横断中の交差点に直進している場合などである。

　また、描画領域管理部１３５では、三次元車両オブジェクト５１ａに対して相対的なカメラ座標を決定する。

　図８は、本発明の実施例１に係る三次元シミュレーション空間内での車両に対するカメラの位置の例を示す図である。

　描画領域管理部１３５は、車両オブジェクト選択後、図８のように選択した三次元車両オブジェクト５１ａに対して相対的なカメラ５６の座標を決定する。
すなわち、描画領域管理部１３５は三次元シミュレーション空間内の少なくとも一つの視点からのカメラ映像を模擬するようにする。こうすることで、車両の移動に応じて、カメラも移動するため、車両の車載カメラを模擬することができる。

　さらに、描画領域管理部１３５では、選択した車両に対して設置したカメラの視野角、すなわち、映像として描画される描画領域に入る三次元交通オブジェクトを特定する。

　次に、図１に戻り、再び映像生成装置１の構成を説明する。図１において、教師データ生成部１４は三次元オブジェクト生成部１３の描画領域管理部１３５で特定され、出力された描画領域内の三次元交通オブジェクトに基づいて、認識モデル生成装置２の画像認識部２２に記憶される認識モデル２２１の学習に必要な教師データと、認識すべき対象の正解データを生成すると共に、データ分析部１１の地域判定部１１８で判定された、生成された三次元コンピュータグラフィックス映像の対象地域を出力する。

　例えば、映像の各フレームについて、各ピクセル単位でカテゴリ分類するセマンティックセグメンテーションを行うモデルの場合は、通常の三次元コンピュータグラフィックス映像に加えて、三次元交通オブジェクトをその種類に合わせて塗りつぶした三次元コンピュータグラフィックス映像、及び塗りつぶした色に応じた意味づけ情報を生成する。

　また、映像の各フレームについて、物体認識を行うモデルの場合は、通常の三次元コンピュータグラフィックス映像に加えて、各オブジェクトの画像上の領域およびオブジェクトの種類を示す情報を生成する。

　さらに、映像の各フレームについて、画像の意味する交通シーンなどの分類を行うモデルの場合は、通常の三次元コンピュータグラフィックス映像に加えて、三次元オブジェクトで表現されるシーンの分類を示す情報を生成する。

　教師データ生成部１４は、これらの生成した三次元コンピュータグラフィックス映像及び認識すべき対象の正解データを、通信インターフェース１０及び通信ネットワーク４を介して認識モデル生成装置２へ送信する。

　次に、認識モデル生成装置２の構成について説明する。図１において、認識モデル生成装置２は、通信インターフェース２０、教師データ記憶部２１、画像認識部２２、及び認識モデル配信部２３を備えている。

　通信インターフェース２０は、通信ネットワーク４を介して映像生成装置１や車両３と通信する。

　教師データ記憶部２１は、映像生成装置１の教師データ生成部１４で生成された教師データを記憶する。

　画像認識部２２は、学習部２２０、認識モデル２２１、検証部２２２を備え、教師データ記憶部２１に記憶された教師データに基づいて、認識モデル２２１を学習部２２０で学習、及び検証部２２２で検証する。

　次に学習部２２０の動作について、図９を用いて説明する。図９は、本発明の実施例１に係る学習部２２０の動作の流れを示すフローチャートである。

　学習部２２０では、まずステップＳ２０１において、教師データ記憶部２１に記憶された教師データを読み込む。

　ステップＳ２０２では、認識モデルに対応する国または地域を順に読み込む。例えば、国ごとに認識モデルが登録されている場合、登録された国を順に読み込むことになる。国または地域とは、運転環境を意図するものである。

　ステップＳ２０３では、ステップＳ２０２で読み込んだ国または地域と、教師データとして登録された対象の国または地域が一致するか否かを判定し、一致する場合はステップＳ２０４へ進み、一致しない場合はステップＳ２０６へ進む。

　ステップＳ２０４では、教師データの対象国または地域と一致する国または地域の認識モデルを読み込む。

　ステップＳ２０５では、ステップＳ２０４で読み込んだ認識モデルを、ステップＳ２０１で読み込んだ教師データを用いて再学習する。

　ステップＳ２０６では、認識モデル２２１が備えている全ての国または地域について、教師データ記憶部２１の教師データの対象となるかをチェックしたか否かを判定し、チェック済みの場合は終了し、チェック済みでない場合はステップＳ２０２に戻り、未チェックの国または地域についてステップＳ２０２からステップＳ２０５を繰り返す。

　上記のように学習部２２０では、データ分析部１１の地域判定部１１８で判定された教師データの対象国または地域に応じて、認識モデルを再学習させることにより、地域固有の事象に対応可能となるように認識モデルを構築することができる。

　認識モデル配信部２３は、認識モデル２２１のうち車両３に適したものを配信する。

　認識モデル生成装置２において、認識モデル２２１は国や地域によって異なるものであってもよい。この場合、認識モデル配信部２３は、国や地域に応じた認識モデルを配信する。例えば、右側通行の国と左側通行の国で異なるモデルとしたり、道路横断動物の群れが横断するようなことが多いといった地域固有の事象に対して、動物の認識精度が特に高い認識モデルを配信するようにしてもよい。

　次に、車両３にについて説明する。車両３は、図示しない一般的な自動車の機能に加え、通信インターフェース３０、認識モデル登録部３１、外界認識部３２、車両制御部３３、車両データ収集部３４を備えている。なお、本実施例では、この車両は自動運転機能を有しており、車両３の周辺環境に応じて自律的に車両を走行制御する。

　通信インターフェース３０は、通信ネットワーク４を介して映像生成装置１や認識モデル生成装置と通信する。具体的には、車両データ収集部３４で収集した車両データを映像生成装置１へ送信したり、認識モデル生成装置２の認識モデル配信部２３により配信された認識モデルを受信する。

　認識モデル登録部３１は、認識モデル生成装置２の認識モデル配信部２３から受信した認識モデルを、車両の認識モデルとして登録する。

　外界認識部３２は、車両に搭載された図示しない車載カメラに加え、LIDARやソナーといった装置により、車両の周辺環境を認識する。車載カメラによる認識は、認識モデル登録部３１で登録された認識モデルによる認識を行う。

　車両制御部３３は、外界認識部３２による車両３の周辺環境の認識結果に基づいて車両の加減速、停止、操舵といった車両の走行機能を制御する。

　車両データ収集部３４は、予め定めた条件を満たす時に、車両制御部３３による車両の走行制御の操作両情報及び外界認識部３２による外界認識部のセンサ情報、すなわち、車載カメラの映像データや、LIDARの距離情報、ソナーの受信信号等のほか、車両の位置及び向きに関する情報、車体番号などの車両を特定するための情報を収集する。ここで、予め定めた条件は、例えば、先行車両との相対速度や相対加速度、相対距離が特定の値以下となったときや、操舵角速度が特定の値以上となった場合などであり、これは、先行車両との車間距離が急に詰まった場合や路上の歩行者や障害物を急ハンドルで回避した場合を検出するためである。

　本実施例による映像生成装置は、車両が認識に失敗したものと類似の複数（多く）交通シーンが生成されるように交通流シミュレーション、及びイベント発生のパラメータを設定することにより、上記類似の交通シーンが複数（多く）発生し、このシーンを三次元コンピュータグラフィックス映像で再現し、教師データとして画像認識を行うための認識モデルに学習させるため、上記の車両が認識に失敗したシーンに対する認識精度が向上する。このため、これまでに遭遇したことのない未知の事象に対して、認識に誤りがあったとしてもそれをフィードバックして、誤りのあったシーンの類似シーンを複数（多く）生成して学習させるため、このようなシーンを早急に認識できるようなる。

　なお、本実施例では車載カメラを搭載した車両の自動運転に適用しているが、特定のエリアを移動する、カメラを搭載した自律移動ロボットや建設機械にも適用できる。さらに、道路を監視する監視カメラでの認識に適用することができる。

　次に本発明の実施例２について説明する。本実施例は、認識モデル生成装置の画像認識モデルの認識精度を高めるように教師データを効率よく生成するものである。

　図１０は、本発明の実施例２に係る構成を示すブロック図である。図１と同じ名称及び機能のものは、図１と同じ符号とし、個々の詳細な説明を省略する。名称が同じであっても内部の機能が異なるものについては、新たな符号とし、説明する。

　映像生成装置１は、通信インターフェース１０、データ分析部１１、パラメータ生成部１２、三次元オブジェクト生成部１３、教師データ生成部１４、結果比較部１５、誤り特定部１６を備えている。その他の認識モデル生成装置２、車両３、通信ネットワーク４は実施例１と同じ機能を持つ。

　結果比較部１５は、認識モデル生成装置２の画像認識部２２における検証部２２２において、認識に誤りがあったもの、すなわち、認識すべき対象の正解データと、三次元オブジェクト生成部１３から出力される三次元コンピュータグラフィック映像の各フレームに対する認識結果に乖離があるか否かを判定する。

　誤り特定部１６は、結果比較部１５で乖離があると判定されたときに、正解データ、及び認識結果を取得し、正解データと認識結果の比較から、認識できなかった交通オブジェクト（三次元オブジェクト）の種類や三次元シミュレーション空間上の位置を特定する。

　パラメータ生成部１２は、誤り特定部１６で特定された認識の誤りと類似する交通シーンが複数（多く）生成されるように、パラメータを調整する。

　以上の構成により、実施例２によれば、学習モデルの検証時に認識に失敗した画像の交通シーンとの類似の交通シーン映像が教師データとして複数（多く）生成されるため、これらを学習する車両３への認識モデルの配信前に認識モデルの認識精度を高めることができる。

　実施例１及び実施例２において、映像生成装置１及び認識モデル生成装置２は、それぞれの通信インターフェースを介して通信しているが、これらを同じ装置内の二つのプログラムとして実行しても良いし、これらの機能をまとめて一つのプログラムとしてもよい。

　なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。
例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD（Solid State Drive）等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。

１…映像生成装置、２…認識モデル生成装置、１３…三次元オブジェクト生成部、１４…教師データ生成部、１１…データ分析部、１２…パラメータ生成部、２２…画像認識部、１１３…映像再現部、１１４…差分抽出部、１１７…シーン再構成部、１３１…交通流モデル生成部、１３２…交通流シミュレーション実行部、１３３…イベント管理部、１３４…三次元オブジェクト管理部、１３５…描画領域管理部

Claims

　外界を認識する認識モデルを車両に配信する認識モデル配信システムにおいて、
　複数の認識モデルから前記車両に適した認識モデルを取得し、前記車両に備えられた外界認識部からのデータと比較して取得した前記認識モデルにおける交通シーンの認識失敗箇所を判定し、取得した前記認識モデルに認識失敗箇所を反映して三次元コンピュータグラフィックス映像で作成するデータ分析部と、
　前記データ分析部で作成された前記三次元コンピュータグラフィックス映像に類似する複数の交通シーンを発生させるためのパラメータを生成するパラメータ生成部と、
　前記パラメータ生成部で生成したパラメータにより作成した交通流モデルを用いて交通流シミュレーションを実行し、三次元交通オブジェクトを生成する三次元オブジェクト生成部と、
　前記三次元オブジェクト生成部で生成した三次元交通オブジェクトに基づいて認識モデルの学習に必要な教師データを作成する教師データ生成部と、
　前記教師データ生成部で生成された教師データに基づいて認識モデルの学習を実行する学習部と、
　前記複数の認識モデルから前記車両に適した認識モデルを配信する認識モデル配信部と、を備えたことを特徴とする認識モデル配信システム。
　請求項１において、
　前記データ分析部は、
　前記外界認識部で認識された認識モデルに近いモデルを三次元コンピュータグラフィックス映像で再現し、再現された前記三次元コンピュータグラフィックス映像と前記外界認識部のデータとを比較して差分を抽出する差分抽出部と、前記差分抽出部で抽出された差分に関する物体を認識する物体認識部と、前記物体認識部で認識された物体を前記三次元コンピュータグラフィックス映像に作成するシーン再構成部とを備えたことを特徴とする認識モデル配信システム。
　請求項２において、
　前記外界認識部は少なくともカメラを備えていることを特徴とする認識モデル配信システム。
　請求項３において、
　前記パラメータ生成部は、
　前記データ分析部にて作成された前記三次元コンピュータグラフィックス映像に類似する複数の交通シーンを発生させるように、交通流シミュレーションのパラメータ及びイベントのパラメータを生成することを特徴とする認識モデル配信システム。
　請求項４において、
　前記三次元オブジェクト生成部は、
　交通流シミュレーションで実行される二次元の交通流シミュレーション空間から三次元オブジェクトによる三次元シミュレーション空間を再現し、前記三次元シミュレーション空間内の少なくとも一つの視点からのカメラ映像を模擬する際の三次元オブジェクト及び三次元コンピュータグラフィックス映像を生成することを特徴とする認識モデル配信システム。
　請求項５において、
　前記教師データ生成部は、
　認識すべき対象の正解データを生成することを特徴とする認識モデル配信システム。
　請求項６において、
　前記物体認識部で認識された物体が影響を受ける国や地域を判定する地域判定部を備えたことを特徴とする認識モデル配信システム。
　請求項５乃至７の何れか１項において、
　前記三次元オブジェクト生成部は、
　前記パラメータ生成部により生成されたパラメータに基づいて、交通流シミュレーションに必要なモデルを生成する交通流モデル生成部と、
　前記交通流モデル生成部により生成された交通流モデルに基づいて交通流シミュレーションを実行する交通流シミュレーション実行部と、
前記パラメータ生成部により生成されたパラメータに基づいて、交通流シミュレーション中のイベントの発生を管理するイベント管理部と、
　前記交通流シミュレーション実行部で実行される交通流シミュレーション空間における交通オブジェクト及び前記イベント管理部で管理される交通オブジェクトを、三次元オブジェクトとして管理する三次元オブジェクト管理部と、
　前記三次元オブジェクト管理部により管理される前記三次元オブジェクトの中から、三次元シミュレーション内の少なくとも一つの視点からのカメラ映像を模擬する際に必要な三次元オブジェクトを特定する描画領域管理部と、
を備えたことを特徴とする認識モデル配信システム。
　請求項６において、
　認識すべき前記正解データと、前記三次元オブジェクト生成部から出力される前記三次元コンピュータグラフィックス映像の認識結果に乖離があるか否かを判定する結果比較部と、
　前記結果比較部で乖離があると判定されたときに、前記正解データ及び前記認識結果を取得し、認識できなかった三次元オブジェクトの種類を特定する誤り特定部とを備えたことを特徴とする認識モデル配信システム。
　車両に備えられた外界認識部からのデータに基づき、予め記憶された認識モデルの中から前記前記外界認識部で認識された認識モデルに近いモデルを取得し、取得した前記モデルをコンピュータグラフィックス映像で再現する認識モデルの更新方法であって、
　再現された前記コンピュータグラフィックス映像と前記外界認識部のデータとを比較して差分を抽出し、抽出した差分に関する物体を前記コンピュータグラフィックス映像に構成して前記認識モデルの学習を実行し、前記認識モデルを更新することを特徴とする認識モデルの更新方法。