WO2022044210A1

WO2022044210A1 - 運転支援装置、学習装置、運転支援方法、運転支援プログラム、学習済モデルの生成方法、学習済モデル生成プログラム

Info

Publication number: WO2022044210A1
Application number: PCT/JP2020/032397
Authority: WO
Inventors: 瑞保若林; 博彬柴田; 貴之井對; 紳三浦
Original assignee: 三菱電機株式会社
Priority date: 2020-08-27
Filing date: 2020-08-27
Publication date: 2022-03-03
Also published as: JP7350188B2; DE112020007538T5; CN115956041A; JPWO2022044210A1; US20230271621A1

Abstract

物体検知情報に基づいた車両の運転支援をより適切に行うことができる運転支援装置を得る。　本開示に係る運転支援装置は、車両に搭載されたセンサーによる車両周囲の物体の検知結果を示す物体検知情報を取得する取得部と、物体検知情報から車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、取得部から入力された物体検知情報から運転支援情報を出力する推論部と、取得部から入力された物体検知情報について、運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価部と、を備え、推論部は、取得部から入力された物体検知情報のうち、評価部が算出した評価値が所定の閾値より大きな物体検知情報に基づき、運転支援情報を出力することを特徴とする。

Description

運転支援装置、学習装置、運転支援方法、運転支援プログラム、学習済モデルの生成方法、学習済モデル生成プログラム

　本発明は、運転支援装置、学習装置、運転支援方法、運転支援プログラム、学習済モデルの生成方法、学習済モデル生成プログラムに関する。

　車載センサーから出力される物体検知情報に基づき、運転支援を行う技術が開発されている。例えば、自動運転車両においては、車載センサーによる車両周囲の障害物の検知結果に基づき、車両の取るべき行動を決定し、車両制御を行う。その際、車載センサーで検知された全ての物体に基づいて、車両の取るべき行動を決定するのではなく、車両の制御に影響がある物体のみに基づいて車両の行動を決定することにより、より適切な車両制御を行うことができる。

　例えば、特許文献１に記載の自動走行システムは、あらかじめ設定した走行領域の内部にある物体のみを障害物として検知し、検知した障害物との衝突を回避するように車両の制御を行う。

特開２０１９－１６８８８８号公報

　しかしながら、中央車線から左車線に車線変更する際に、右車線を走行している車両等、同じ道路を走行している物体であっても、車両の行動判断に考慮する必要がない物体が存在する。そして、このような物体の検知結果に基づいて行動判断を行うと、不適切な行動判断を行ってしまう可能性がある。

　本開示は、上記のような状況に鑑みなされたものであり、物体検知情報に基づいた車両の運転支援をより適切に行うことができる運転支援装置を得ることを目的とする。

　本開示に係る運転支援装置は、車両に搭載されたセンサーによる車両周囲の物体の検知結果を示す物体検知情報を取得する取得部と、物体検知情報から車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、取得部から入力された物体検知情報から運転支援情報を出力する推論部と、取得部から入力された物体検知情報について、運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価部と、を備え、推論部は、取得部から入力された物体検知情報のうち、評価部が算出した評価値が所定の閾値より大きな物体検知情報に基づき、運転支援情報を出力することを特徴とする。

　本開示に係る運転支援装置は、物体検知情報から車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、取得部から入力された物体検知情報から運転支援情報を出力する推論部と、取得部から入力された物体検知情報について、運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価部と、を備え、推論部は、取得部から入力された物体検知情報のうち、評価部が算出した評価値が所定の閾値より大きな物体検知情報に基づき、運転支援情報を出力するようにしたので、評価値が大きい物体検知情報に基づき運転支援情報を出力することにより、物体検知情報に基づいた車両の運転支援をより適切に行うことができる。

実施の形態１に係る自動運転システム１０００の構成を示す構成図である。実施の形態１に係る運転支援装置１００の構成を示す構成図である。実施の形態１に係る運転支援装置１００のハードウェア構成を示すハードウェア構成図である。実施の形態１に係る運転支援装置１００の動作を示すフローチャートである。第一前処理の具体例を説明するための概念図である。第一前処理の具体例を説明するための概念図である。第二前処理の具体例を説明するための概念図である。評価値の具体例を示す図である。第二前処理の具体例を説明するための概念図である。評価値の具体例を示す図である。第二前処理の具体例を説明するための概念図である。実施の形態１に係る学習装置３００の構成を示す構成図である。実施の形態１に係る学習装置３００のハードウェア構成を示すハードウェア構成図である。実施の形態１に係る学習装置３００の動作を示すフローチャートである。実施の形態１に係る学習装置３００が運転支援用学習モデルの初期学習を行う動作を説明するためのフローチャートである。実施の形態１に係る学習装置３００が評価値算出用学習モデルの学習を行う動作を説明するためのフローチャートである。実施の形態１に係る学習装置３００が運転支援用学習モデルの再学習を行う動作を説明するためのフローチャートである。

　実施の形態１．
　図１は、実施の形態１に係る自動運転システム１０００の構成を示す構成図である。自動運転システム１０００は、運転支援装置１００、車両制御装置２００、及び学習装置３００を備える。また、自動運転システム１０００は１台の車両に備えられているものとする。運転支援装置１００及び車両制御装置２００の詳細については、以下の活用フェーズで説明し、学習装置３００の詳細については、以下の学習フェーズで説明する。活用フェーズは、運転支援装置１００が学習済モデルを用いて車両の運転支援を行い、運転支援装置１００が出力した運転支援情報に基づいて、車両制御装置２００が車両の制御を行うフェーズであり、学習フェーズは、活用フェーズで運転支援装置１００が用いる学習モデルの学習を学習装置３００が行うフェーズである。

　＜活用フェーズ＞
　図２は、実施の形態１に係る運転支援装置１００の構成を示す構成図である。
　運転支援装置１００は、車両周囲の環境に応じた車両の行動判断を行うことにより、車両の運転支援を行うものであり、取得部１１０、認知部１２０、及び判断部１３０を備える。運転支援装置１００は運転支援情報を車両制御装置２００に出力し、車両制御装置２００は入力された運転支援情報に基づいて車両の制御を行う。

　取得部１１０は、各種情報を取得するものであり、物体検知情報取得部１１１、地図情報取得部１１２、車両状態情報取得部１１３、及びナビゲーション情報取得部１１４を備える。取得部１１０は、取得した各種情報を認知部１２０及び判断部１３０に出力する。

　物体検知情報取得部１１１は、車両周囲の物体の検知結果を示す物体検知情報を取得するものである。ここで、物体検知情報とは、車両に搭載されたセンサーによって取得されたセンサーデータである。例えば、物体検知情報取得部１１１は、ＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）により取得された点群データやカメラにより取得された画像データ、レーダーにより取得されたチャープデータを取得する。

　物体検知情報取得部１１１は、取得した物体検知情報を緊急回避判定部１２１、評価部１２４、及び推論部１３２に出力する。ここで、物体検知情報取得部１１１は、物体検知情報に対して前処理を行った後に、前処理後の物体検知情報を評価部１２４及び推論部１３２に出力する。以下では、物体検知情報取得部１１１が物体検知情報に対して行う前処理を第一前処理と呼ぶこととする。また、評価部１２４及び推論部１３２に出力する物体検知情報は第一前処理後の物体検知情報であるが、緊急回避判定部１２１に出力する物体検知情報は、第一前処理後の物体検知情報であっても、第一前処理前の物体検知情報であってもよい。

　また、物体検知情報取得部１１１は、第一前処理を行う際に、車両の位置等の情報が必要な場合、後述する車両状態情報取得部１１３から車両状態情報を取得してから、第一前処理を行う。

　以下で、第一前処理について説明する。
　物体検知情報取得部１１１は、後述する地図情報が取得した地図情報に基づき、予め設定した領域内の物体の検知結果を示す物体検知情報を特定する。そして、後述する推論部１３２は、物体検知情報取得部１１１が特定した物体検知情報に基づいて運転支援情報を出力する。ここで、上記の領域は運転支援装置１００の設計者あるいは、車両の運転手により入力装置（図示せず）を用いて設定されるものとする。

　より具体的に、第一前処理について説明する。
　物体検知情報取得部１１１は、地図情報に基づき、予め設定した領域外の物体の検知結果を示す物体検知情報のセンサー値を所定のセンサー値に置き換える。ここで、所定のセンサー値には、例えば、センサーが物体を検知していないときのセンサー値を用いることができる。また、物体検知情報取得部１１１は、予め設定した領域内の物体の検知結果を示す物体検知情報のセンサー値は元のセンサー値のままとする。

　例えば、車両が走行する道路を検知対象の領域として設定した場合には、物体検知情報取得部１１１は、物体検知情報のうち、車両が走行する道路外の物体の検知結果を示す物体検知情報のセンサー値をセンサーが物体を検知していないときのセンサー値に置き換え、車両が走行する道路内の物体の検知結果を示す物体検知情報の示すセンサー値は元のセンサー値のままとする。

　地図情報取得部１１２は、車両周囲の地物の位置を示す地図情報を取得するものである。ここで、地物とは、例えば、白線、路肩縁、建造物等である。地図情報取得部１１２は、取得した地図情報を物体検知情報取得部１１１、及び運転状況判定部１２２に出力する。

　車両状態情報取得部１１３は、車両の状態を示す車両状態情報を取得するものである。車両の状態とは、例えば、車両の速度、加速度、位置、姿勢等の物理量である。ここで、車両状態情報取得部１１３は、例えば、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）受信機や慣性航法装置により算出された車両の位置や速度を示す車両状態情報を取得する。車両状態情報取得部１１３は、取得した車両状態情報を緊急回避判定部１２１、運転状況判定部１２２、及び推論部１３２に出力する。

　ナビゲーション情報取得部１１４は、カーナビゲーションシステムなどの機器から、目的地までの走行経路や推奨車線といった車両の走行計画を示すナビゲーション情報を取得するものである。ナビゲーション情報取得部１１４は、取得したナビゲーション情報を運転状況判定部１２２に出力する。

　認知部１２０は、取得部１１０から入力された情報に基づき車両周囲の状況の認知を行うものであり、緊急回避判定部１２１、運転状況判定部１２２、モデル選択部１２３、評価部１２４を備える。

　緊急回避判定部１２１は、取得部１１０から入力された物体検知情報に基づき、車両が緊急回避を要する状況にあるかを判定する。ここで、緊急回避を要する状況とは、例えば、他車両や歩行者と衝突する可能性が高い状態であり、緊急回避判定部１２１は、点群データや画像データ等に基づき、障害物との距離を算出し、算出した距離が所定の閾値以下であることにより危険な状態であると判定するようにしてもよい。

　運転状況判定部１２２は、取得部１１０から入力された車両状態情報、及びナビゲーション情報に基づき、車両の運転状況を判定する。ここでの運転状況とは、例えば、車線変更、交差点で左折、赤信号で停止等である。例えば、ナビゲーション情報が左折を指示している交差点に車両が近づいていると、車両状態情報が示す車両の位置、及び地図情報が示す交差点の位置に基づき判定された場合、運転状況判定部１２２は、車両の運転状況は「左折」であると判定する。

　モデル選択部１２３は、運転状況判定部１２２が判定した運転状況に基づき、評価部１２４及び推論部１３２が用いる学習済モデルを選択するものである。例えば、運転状況判定部１２２で判定された運転状況が「車線変更」の場合には、車線変更用の学習済モデルが選択され、運転状況判定部１２２で判定された運転状況が「直進」の場合には、直進用の学習済モデルが選択される。ここで、モデル選択部１２３は、評価値算出用学習済モデル生成部と運転支援用学習済モデルのそれぞれについて、学習済モデルを選択する。

　評価部１２４は、取得部１１０から入力された物体検知情報について、運転支援用学習済モデルの出力への影響度合いを評価値として算出するものである。ここで、評価値は、各物体検知情報の車両の行動判断への重要度としても理解できる。また、運転支援用学習済モデルとは、推論部１３２が運転支援情報を推論するために用いる学習済モデルである。

　また、実施の形態１において、評価部１２４は、物体検知情報から評価値を算出する評価値算出用学習済モデルを用いて、取得部から入力された物体検知情報から評価値を出力する。ここで、評価部１２４が用いる評価値算出用学習済モデルは、モデル選択部１２３により選択された評価値算出用学習済モデルである。

　緊急回避行動判断部１３１は、緊急回避判定部１２１で緊急回避が必要と判定された場合に、車両が緊急回避を行うための運転支援情報を出力するものである。緊急回避行動判断部１３１は、ＡＩを用いて運転支援情報を推論しても、ルールベースで運転支援情報を決定するようにしてもよい。例えば、車両の目の前に歩行者が現れた場合には、緊急ブレーキを行う等である。運転支援情報の詳細については、次の推論部１３２と合わせて説明する。

　推論部１３２は、物体検知情報から車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、取得部１１０から入力された物体検知情報から運転支援情報を出力するものである。ここで、推論部１３２は、取得部１１０から入力された物体検知情報のうち、評価部１２４が算出した評価値が所定の閾値より大きな物体検知情報に基づき、運転支援情報を出力する。言い換えれば、推論部１３２は、評価値が所定の閾値より小さな物体検知情報に基づかずに、運転支援情報を出力する。また、推論部１３２が用いる運転支援用学習済モデルは、モデル選択部１２３により選択された運転支援用学習済モデルである。

　推論部１３２が出力する運転支援情報は、例えば、スロットル値、ブレーキ値、ステアリング値等の車両の制御量、車線変更をするかしないかを示す２値、車線変更を行うタイミング、将来時刻における車両の位置・速度等を示すものである。

　また、運転支援用学習済モデルは、少なくとも物体検知情報を入力に用いるものであり、物体検知情報だけを入力に用いるものに限らない。物体検知情報だけでなく、その他の情報、例えば、車両状態情報を運転支援用学習済モデルの入力に用いるようにしてもよい。より具体的には、車線変更判断を推論するモデル（車線変更するしないを出力する）の場合は、時系列データを入力として用いることで他車との相対的な速度関係がわかるので、車両状態情報を入力に用いなくてもよい。一方で、他車両との前後の距離を保つようにスロットル値を推論するモデルの場合は、自車両の速度により速度を維持するための適切なスロットル値は変化するので、物体検知情報だけでなく、車両状態情報もモデルの入力に用いる。以下では、運転支援用学習済モデルの入力に、物体検知情報と車両状態情報との両方を用いる場合について説明する。

　すなわち、推論部１３２は、車両状態情報及び物体検知情報から運転支援情報を推論する運転支援用学習済モデルを用いて、取得部１１０から入力された車両状態情報及び物体検知情報から運転支援情報を出力する。

　推論部１３２の処理の詳細について説明する。
　推論部１３２は、取得部１１０から入力された物体検知情報に対して前処理を行った後に、前処理後の物体検知情報と車両状態情報とを運転支援用学習済モデルに入力する。以下では、推論部１３２が物体検知情報に対して行う前処理を第二前処理と呼ぶこととする。

　以下で、第二前処理について説明する。
　推論部１３２は、取得部から入力された物体検知情報のうち、評価値が所定の閾値以下の物体検知情報のセンサー値を所定のセンサー値に置き換える。ここで、所定のセンサー値には、例えば、車載センサーが物体を検知していないときのセンサー値を用いることができる。また、推論部１３２は、評価値が所定の閾値以下の物体検知情報のセンサー値を所定のセンサー値に置き換えるとともに、評価値が所定の閾値より大きな物体検知情報の示すセンサー値は元のままとする。

　そして、推論部１３２は、上記の第二前処理を行った後の物体検知情報と車両状態情報とを運転支援用学習済モデルに入力することにより、運転支援情報を出力する。

　車両制御装置２００は、運転支援装置１００が出力した運転支援情報に基づき、車両の制御を行うものである。例えば、車両制御装置２００は、運転支援情報が車両の制御量を示す場合には、その制御量で駆動するように車両を制御し、運転支援情報が将来時刻の車両状態を示す場合には、その車両状態を実現するための車両の制御量を算出し、算出した制御量に基づいて車両の制御を行う。

　次に、実施の形態１における運転支援装置１００のハードウェア構成について説明する。運転支援装置１００の各機能は、コンピュータにより実現される。図３は、運転支援装置１００を実現するコンピュータのハードウェア構成を示す構成図である。

　図３に示したハードウェアには、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等の処理装置１００００と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）やハードディスク等の記憶装置１０００１が備えられる。

　図２に示す、取得部１１０、認知部１２０、及び判断部１３０は、記憶装置１０００１に記憶されたプログラムが処理装置１００００で実行されることにより実現される。また、運転支援装置１００の各機能を実現する方法は、上記したハードウェアとプログラムの組み合わせに限らず、処理装置にプログラムをインプリメントしたＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）のような、ハードウェア単体で実現するようにしてもよいし、一部の機能を専用のハードウェアで実現し、一部を処理装置とプログラムの組み合わせで実現するようにしてもよい。

　以上のように、実施の形態１に係る運転支援装置１００は構成される。

　次に、実施の形態１に係る運転支援装置１００の動作について説明する。
　以下では、推論部１３２及び評価部１２４が学習済モデルの入力に用いる物体検知情報は点群データであり、緊急回避判定部１２１は、画像データ及び点群データに基づき、緊急回避が必要か判定するものとする。

　図４は、実施の形態１に係る運転支援装置１００の動作を示すフローチャートである。運転支援装置１００の動作が運転支援方法に対応し、運転支援装置１００の動作をコンピュータに実行させるプログラムが運転支援プログラムに対応する。また、「部」は「工程」に適宜読み替えてもよい。

　まず、ステップＳ１において、取得部１１０は物体検知情報を含む各種情報を取得する。より具体的には、物体検知情報取得部１１１は物体検知情報を取得し、地図情報取得部１１２は車両周辺の地図情報を取得し、車両状態情報取得部１１３は現在時刻の車両状態情報を取得し、ナビゲーション情報取得部は自車両の走行計画を示すナビゲーション情報を取得する。

　次に、ステップＳ２において、取得部１１０は第一前処理を行う。
　図５及び図６を用いて、第一前処理の具体例について説明する。図５及び図６は、第一前処理の具体例を説明するための概念図である。車両Ａ１が運転支援装置１００を備えた自車両である。図５及び図６において、車両Ａ１中心から放射状に引かれた直線は各物体検知情報を表しており、直線の先端位置がセンサー値を表す。ここで、センサー値は、センサーが物体を検知した場合、車両と物体との距離を示し、センサーが何も検知していない場合のセンサー値は、センサーが検知できる最大距離を示す。また、センサーは、センサーの最大検出距離以内に物体が存在する場合に、その物体を検知するものとする。

　図５において、車両ＡＩは道路Ｒ１を走行しており、車両Ａ１に搭載されたＬｉＤＡＲは道路Ｒ１の外に存在する建造物Ｃ１と、同じ道路Ｒ１を走行する他車両Ｂ１とを検知している。図５において、物体検知情報のうち、何も検知していない物体検知情報は点線で示し、物体を検知した物体検知情報は実線で示している。

　ここで、車両Ａ１は道路Ｒ１を走行しているので、車両Ａ１の制御に必要な物体検知情報は、道路Ｒ１の内側に存在する物体を検知した物体検知情報であり、第一前処理における設定領域として道路Ｒ１が設定されている。この場合、物体検知情報取得部１１１は、道路Ｒ１の外側に存在する物体を検知した物体検知情報のセンサー値を所定の値に置き換え、道路Ｒ１の内側に存在する物体を検知した物体検知情報のセンサー値は元のセンサー値のままとする。すなわち、物体検知情報取得部１１１は、図６に示すように、道路Ｒ１の外に存在する建造物Ｃ１を検知した物体検知情報のセンサー値をセンサーが物体を検知していないときのセンサー値に置き換える。

　次に、ステップＳ３において、緊急回避判定部１２１は、車両が緊急回避が必要な状態にあるかを判定する。緊急回避判定部１２１が、車両が緊急回避が必要な状態にあると判定した場合、ステップＳ４に進み、緊急回避が必要な状態にないと判定した場合、ステップＳ５に進む。

　ステップＳ４に進んだ場合、緊急回避行動判断部１３１は、緊急回避を実行するための運転支援情報を車両制御装置２００に出力する。

　ステップＳ５に進んだ場合、運転状況判定部１２２は車両の運転状況を判定する。

　次に、ステップＳ６において、モデル選択部１２３はステップＳ５で判定された運転状況に基づいて、後のステップで用いる学習済モデルを選択する。

　次に、ステップＳ７において、評価部１２４は、入力された物体検知情報について、運転支援用学習済モデルの出力への影響度合いを評価値として算出する。

　次に、ステップＳ８において、推論部１３２は、現在時刻の車両状態情報と、物体検知情報のうちステップＳ７で算出した評価値が所定の閾値より大きな物体検知情報とに基づき、運転支援情報を出力する。

　図７から図１１を用いて、評価部１２４及び推論部１３２の動作の具体例について説明する。図７、図９、図１１は、評価部１２４及び推論部１３２の動作の具体例を説明するための概念図であり、図８、図１０は評価部１２４が算出した評価値の具体例を示す図である。

　図７において、車両Ａ１に搭載された車載センサーは他車両Ｂ２～Ｂ７を検知している。
　以下では、（１）車両Ａ１が右車線から左車線への車線変更を行う場合と、（２）右車線で直進を続ける場合の２パターンについて説明する。

　（１）車両Ａ１が右車線から左車線への車線変更を行う場合
　この場合に評価部１２４が算出する評価値について、図７及び図８を用いて説明する。他車両Ｂ４及び他車両Ｂ７は同じ車線に存在するので、車線変更における重要度はあまり高くなく、換言すると、運転支援用学習済モデルの出力への影響度合いは中程度であると言えるので、車両Ｂ４を検知した物体検知情報Ｄ５及び車両Ｂ７を検知した物体検知情報についての評価値は中程度の値が算出される。また、他車両Ｂ３及び他車両Ｂ６は左車線に存在するが距離が遠いので、こちらも重要度はあまり高くなく、車両Ｂ３を検知した物体検知情報Ｄ３及び車両Ｂ６を検知した物体検知情報Ｄ６についての評価値は中程度の値が算出される。一方、他車両Ｂ２及び他車両Ｂ５は車線変更先の車線に存在し、かつ、車両との距離が近いので、車両Ｂ２を検知した物体検知情報Ｄ２及び車両Ｂ５を検知した物体検知情報Ｄ５の重要度は高く、評価値として大きな値が算出される。

　そして、推論部１３２は、算出された評価値に基づき、第二前処理を行う。例えば、閾値が図８の中と大の間の値に設定されている場合、図９に示すように、推論部１３２は、評価値が中程度である物体検知情報Ｄ３，Ｄ４，Ｄ６，Ｄ７のセンサー値をセンサーが物体を検知していないときのセンサー値に置き換える。一方で、推論部１３２は、評価値が大きな物体検知情報Ｄ２，Ｄ５のセンサー値は元のセンサー値のままとする。

　（２）右車線で直進を続ける場合
　この場合に評価部１２４が算出した評価値について、図７及び図１０を用いて説明する。他車両Ｂ２，Ｂ５は車両と異なる車線を走行しているため、直進する際の重要度はあまり高くなく、車両Ｂ２を検知した物体検知情報Ｄ２及び車両Ｂ５を検知した物体検知情報Ｄ５の評価値は中程度の値が算出される。また、他車両Ｂ３，Ｂ６は車両と異なる車線を走行しており、かつ、車両との距離が遠いので、直進する際の重要度は低く、車両Ｂ３を検知した物体検知情報Ｄ３及び車両Ｂ６を検知した物体検知情報Ｄ６の評価値は小さな値が算出される。一方で、他車両Ｂ４，Ｂ７は車両と同じ車線を走行しているため、重要度が高く、車両Ｂ４を検知した物体検知情報Ｄ４及び車両Ｂ７を検知した物体検知情報Ｄ７の評価値は大きな値が算出される。

　そして、推論部１３２は、算出された評価値に基づき、第二前処理を行う。例えば、閾値が図１０の中と大の間の値に設定されている場合、図１１に示すように、推論部１３２は、評価値が小・中である物体検知情報Ｄ２，Ｄ３，Ｄ５，Ｄ６のセンサー値をセンサーが物体を検知していないときのセンサー値に置き換える。一方で、推論部１３２は、評価値が大きい物体検知情報Ｄ４，７のセンサー値は元のセンサー値のままとする。
　以上で、評価部１２４及び推論部１３２の処理の説明を終わり、図４のフローチャートの続きについて説明する。

　次に、ステップＳ９において、車両制御装置２００は、ステップＳ８で推論部１３２が出力した行動判断結果に基づいて車両の制御を行う。

　以上のような動作により、実施の形態１に係る運転支援装置１００は、評価値が大きい物体検知情報に基づき運転支援情報を出力することにより、物体検知情報に基づいた車両の運転支援をより適切に行うことができる。すなわち、不要な情報を学習済モデルに入力すると推論精度が低下する可能性があるが、運転支援装置１００は、評価値を算出し、評価値の大きな物体検知情報を学習済モデルに入力し、不要な情報の入力を減らしているので、学習済モデルの推論精度を向上することができる。

　また、現実の道路に存在する障害物には、他車両、建物、歩行者、標識等様々なものが存在し、それらが様々な距離に存在するため、ルールベースで評価値を算出するようにすると、ルールの整備に膨大な手間がかかるが、実施の形態１に係る運転支援装置１００は、評価値算出用学習済モデルを用いて評価値を算出するようにしたので、評価値の算出にかかる労力を低減することができる。

　また、運転支援装置１００は、地図情報に基づき、予め設定した領域内の物体の検知結果を示す物体検知情報を特定し、特定した物体検知情報に基づき、運転支援情報を出力するようにしたので、不要な情報を減らして、運転に必要な情報のみに基づいて推論を行うことにより、推論精度を向上することができる。

　また、運転支援装置１００は、地図情報に基づき、予め設定した領域外の物体の検知結果を示す物体検知情報のセンサー値を所定のセンサー値に置き換える第一前処理を行い、第一前処理後の物体検知情報を評価部１２４及び推論部１３２に出力するようにしたので、予め設定した領域外の物体の検知結果の推論への影響を軽減することができる。さらに、この場合において、所定のセンサー値をセンサーが物体を検知していないときのセンサー値とすることで、領域外の物体の検知結果の推論への影響を無視することができる。また、第一前処理において、領域内の物体の検知結果を示す物体検知情報のセンサー値は元のセンサー値のままにしているので、例えば、同じ道路内に存在する物体の影響は考慮して運転支援の推論を行うことができる。

　また、運転支援装置１００は、取得部１１０から入力された物体検知情報のうち、評価値が所定の閾値以下の物体検知情報のセンサー値を所定のセンサー値に置き換える第二前処理を行い、第二前処理後の物体検知情報を運転支援用学習済モデルに入力することにより、運転支援情報を出力するようにしたので、評価値が所定の閾値以下の物体の検知結果の推論への影響を軽減することができる。さらに、この場合において、所定のセンサー値をセンサーが物体を検知していないときのセンサー値とすることで、評価値が所定の閾値以下の物体の検知結果の推論への影響を無視することができる。また、第二前処理において、評価値が所定の閾値より大きな物体検知情報のセンサー値は元のセンサー値のままにしているので、評価値の大きな物体の影響は考慮して運転支援の推論を行うことができる。

　また、学習モデルの学習については、学習フェーズで説明するが、学習用データをドライビングシミュレータで生成する場合がある。しかしながら、ドライビングシミュレータでは道路外の環境を完全に再現するのは困難なため、ドライビングシミュレータで生成した物体検知情報と実環境の物体検知情報は差異が生じる可能性がある。

　この課題に対して、実施の形態１に係る運転支援装置１００は、地図情報に基づき、予め設定した領域内の物体の検知結果を示す物体検知情報を特定し、特定した物体検知情報に基づき、運転支援情報を出力するようにしたので、道路外の物体の存在は無視することで、シミュレータ環境で得られる物体検知情報と実環境での物体検知情報が同等となる。すなわち、ドライビングシミュレータで生成された学習用データと実環境の物体検知情報との差異を低減することで、学習済モデルの推論精度を向上することができる。

　以上で活用フェーズの説明を終了し、次に、学習フェーズの説明を行う。

＜学習フェーズ＞
　活用フェーズで用いられる学習済モデルを生成する学習フェーズについて説明する。図１２は、実施の形態１に係る学習装置３００の構成を示す構成図である。

　学習装置３００は、学習モデルの学習を行い、運転支援装置１００が用いる学習済モデルを生成するものであり、取得部３１０、認知部３２０、学習用データ生成部３３０、及び学習済モデル生成部３４０を備える。

　取得部３１０は、各種情報を取得するものであり、運転支援装置１００が備える取得部１１０と同様のものである。取得部３１０は、取得部１１０と同様に、物体検知情報取得部３１１、地図情報取得部３１２、車両状態情報取得部３１３、ナビゲーション情報取得部３１４を備える。ただし、取得部３１０が取得する各種情報は、活用フェーズ同様に実際に走行している車両により取得された情報であっても良いが、車両の走行環境を仮想的に実現するドライビングシミュレータによって取得された情報であってもよい。

　認知部３２０は、緊急回避判定部３２１、運転状況判定部３２２、モデル選択部３２３、及び評価部３２４を備える。

　緊急回避判定部３２１は、緊急回避判定部１２１と同様に、緊急回避の要否を判定するものである。緊急回避判定部３２１が、緊急回避を要すると判定した場合、その時刻の車両状態情報及び物体検知情報は学習用データから除外する。

　運転状況判定部３２２は、運転状況判定部１２２と同様に、車両の運転状況を判定するものである。

　モデル選択部３２３は、モデル選択部１２３と同様に、運転状況判定部３２２が判定した運転状況に対応する学習モデルを選択するものである。後述する学習用データ生成部３３０は、モデル選択部３２３が選択した学習モデルの学習用データを生成し、学習済モデル生成部３４０は、モデル選択部３２３が選択した学習モデルの学習を行う。ここで、モデル選択部３２３は、運転支援用学習モデルの学習を行うときは、運転状況に対応する運転支援用学習モデルを選択し、評価値算出用学習モデルの学習を行うときは、運転状況に対応する評価値算出用学習モデルと、初期学習済の運転支援用学習済モデルとを選択する。また、運転支援用学習モデルの再学習を行う場合は、モデル選択部３２３は、再学習を行う運転支援用学習モデルと、評価値算出用学習済モデルとを選択する。

　評価部３２４は、評価部１２４と同様に、評価値算出用学習済モデル生成部３４１が生成した評価値算出用学習済モデルを用いて、取得部３１０から入力された物体検知情報の評価値を算出するものである。

　学習用データ生成部３３０は、学習モデルの学習に用いる学習用データを生成するものであり、第一学習用データ生成部３３１及び第二学習用データ生成部３３２を備える。

　第一学習用データ生成部３３１は、車両に搭載されたセンサーによる車両周囲の物体の検知結果を示す物体検知情報と、車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルの出力への前記物体検知情報の影響度合いを示す評価値とを含む第一学習用データを生成する。ここで、第一学習用データとは、評価値算出用学習モデルの学習に用いる学習用データである。

　第一学習用データ生成部３３１は、物体検知情報と評価値の組を第一学習用データとして生成する。以下で、第一学習用データを生成する方法の詳細について説明する。

　第一学習用データ生成には例えば以下の文献１のように学習モデルが複数の入力値のうち、どの入力値を重視しているか推論できる機械学習手法を適用し、学習モデルの入力値と評価値の組を得る。
文献１
Ｄａｎｉｅｌ　Ｓｍｉｌｋｏｖ，　Ｎｉｋｈｉｌ　Ｔｈｏｒａｔ，　Ｂｅｅｎ　Ｋｉｍ，　Ｆｅｒｎａｎｄａ　Ｖｉｅｇａｓ，　Ｍａｒｔｉｎ　Ｗａｔｔｅｎｂｅｒｇ，　“ＳｍｏｏｔｈＧｒａｄ：　ｒｅｍｏｖｉｎｇ　ｎｏｉｓｅ　ｂｙ　ａｄｄｉｎｇ　ｎｏｉｓｅ”

　本来であれば、これらの手法は学習モデル、すなわちＡＩの判断根拠を人間が解釈できるように可視化するための手法である。例えばニューラルネットワークを使った画像分類では、入力値である画像のピクセル値のうちどの値がニューラルネットワークの判断（画像がどのクラスに属するか）に影響を与えているかを数値化し可視化することで、ＡＩが画像のどの部分を見て判断を決定したのかがわかる。本発明では、これらの手法で得られるＡＩの判断根拠を数値化したものを活用する。ＡＩの判断根拠を数値化したものを入力値の評価値ととらえることで、評価値が低いものはＡＩの判断には不要なものと考えることができる。

　第一学習用データの生成方法の具体例を示す。まず、運転支援用学習済モデルの入出力の関係は数式１で表される。ここで、ｆの関数形は運転支援用学習モデルの設計者により定められており、ｆが含む各パラメータの値は運転支援用学習モデルの学習により既に決定されているものとする。

　ここで、入力に用いられる物体検知情報が示すセンサー値は数式２のベクトルで表され、運転支援用学習済モデルの出力値は数式３のベクトルで表されるものとする。

　この運転支援用学習済モデルから入力値ｘ_ｉ（入力ベクトルの一つの要素）の評価値ｓ（ｘ_ｉ）を数式４のように算出する。

数式４において、右辺の二重線による括弧はノルムを意味する。第一学習用データ生成部３３１は、数式４を用いて入力データｘ^１＝［ｘ_１，ｘ_２，…，ｘ_Ｌ］の評価値をｓ^１＝［ｓ（ｘ_１），ｓ（ｘ_２），…，ｓ（ｘ_Ｌ）)］として得る。ここで、右上の添え字は、べき指数ではなく、入力データを区別するためのラベルである。そして、第一学習用データ生成部３３１は、複数の学習用の入力データｘ^１，ｘ^２，…，ｘ^Ｎを用いて、複数の教師データｓ^１，ｓ^２，…，ｓ^Ｎを生成し、第一学習用データ（入力と教師の組）を｛ｘ^１，ｓ^１｝，｛ｘ^２，ｓ^２｝，…，｛ｘ^Ｎ，ｓ^Ｎ｝として取得する。

　第二学習用データ生成部３３２は、車両に搭載されたセンサーによる車両周囲の物体の検知結果を示す物体検知情報と、車両の運転支援を行うための運転支援情報とを含む第二学習用データを生成する。ここで、第二学習用データとは、行動推定用学習モデルの学習に用いる学習用データである。
　ここで、当然ながら、第二学習用データ生成部３３２は、運転支援用学習モデルが物体検知情報以外の情報も入力に用いる場合には、物体検知情報だけでなく、その他の情報、例えば、車両状態情報も第二学習用データに含める。以下では、推論フェーズで説明した推論部１３２に合わせて、第二学習用データ生成部３３２は、車両状態情報と、物体検知情報と、運転支援情報とを含む第二学習用データを生成するものとする。

　第二学習用データ生成部３３２は、車両状態情報及び物体検知情報と、運転支援情報との組を第二学習用データとして生成する。例えば、第二学習用データ生成部３３２は、時刻ｔの車両状態情報及び物体検知情報と、時刻ｔ＋ΔＴの車両の制御量との組を第二学習用データとして生成するようにしてもよい。

　学習済モデル生成部３４０は、学習モデルの学習を行い、学習済モデルを生成するものであり、評価値算出用学習済モデル生成部３４１及び運転支援用学習済モデル生成部３４２を備える。

　評価値算出用学習済モデル生成部３４１は、第一学習用データを用いて、物体検知情報から評価値を算出する評価値算出用学習済モデルを生成する。実施の形態１において、評価値算出用学習済モデル生成部３４１は、物体検知情報と評価値が組となった第一学習用データを用いて、いわゆる教師あり学習により、評価値算出用学習済モデル生成部を生成する。

　運転支援用学習済モデル生成部３４２は、第二学習用データを用いて、物体検知情報から運転支援情報を推論する運転支援用学習済モデルを生成する。ここで、推論部１３２や第二学習用データ生成部３３２の構成の説明時に述べたように、運転支援用学習済モデルは、少なくとも物体検知情報を入力に用いるものであり、物体検知情報に加え、その他の情報、例えば、車両状態情報も入力に用いてもよい。以下では、運転支援用学習済モデル生成部３４２が、第二学習用データを用いて、車両状態情報及び物体検知情報から運転支援情報を推論する運転支援用学習済モデルを生成する場合について説明する。

　また、運転支援用学習済モデル生成部３４２は、第二学習用データ生成部から入力された第二学習用データのうち、評価部３２４が算出した評価値が所定の閾値より大きな物体検知情報を含む第二学習用データを用いて、運転支援用学習済モデルを生成する。以下では、時刻ｔの車両状態情報及び物体検知情報と、時刻ｔ＋ΔＴの車両の制御量が組となった第二学習用データを用いて、教師あり学習により、運転支援用学習済モデルを生成する場合について説明するが、運転状況毎に報酬を設定し、強化学習により、運転支援用学習済モデルを生成するようにしてもよい。

　次に、実施の形態１における学習装置３００のハードウェア構成について説明する。学習装置３００の各機能は、コンピュータにより実現される。図１３は、学習装置３００を実現するコンピュータのハードウェア構成を示す構成図である。

　図１３に示したハードウェアには、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等の処理装置３００００と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）やハードディスク等の記憶装置３０００１が備えられる。

　図１２に示す、取得部３１０、認知部３２０、学習用データ生成部３３０、及び学習済モデル生成部３４０は、記憶装置３０００１に記憶されたプログラムが処理装置３００００で実行されることにより実現される。また、学習装置３００の各機能を実現する方法は、上記したハードウェアとプログラムの組み合わせに限らず、処理装置にプログラムをインプリメントしたＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）のような、ハードウェア単体で実現するようにしてもよいし、一部の機能を専用のハードウェアで実現し、一部を処理装置とプログラムの組み合わせで実現するようにしてもよい。

　以上のように、実施の形態１に係る学習装置３００は構成される。

　次に、実施の形態１に係る学習装置３００の動作について説明する。

　図１４は、実施の形態１に係る学習装置３００の動作を示すフローチャートである。学習装置３００の動作が学習済モデルの生成方法に対応し、学習装置３００の動作をコンピュータに実行させるプログラムが学習済モデル生成プログラムに対応する。また、「部」は「工程」に適宜読み替えてもよい。

　学習装置３００の動作は、ステップＳ１００の運転支援用学習モデルの初期学習、ステップＳ２００の評価値算出用学習モデルの学習、ステップＳ３００の運転支援用学習モデルの再学習の三段階に分けられる。以下で、各ステップの詳細について説明する。

　最初にステップＳ１００の運転支援用学習モデルの初期学習の詳細について、図１５を用いて説明する。図１５は、評価値算出用学習モデルの初期学習を説明するためのフローチャートである。

　まず、ステップＳ１０１において、取得部３１０は、物体検知情報を含む各種情報を取得する。より具体的には、物体検知情報取得部３１１は物体検知情報を取得し、地図情報取得部１１２は車両周辺の地図情報を取得し、車両状態情報取得部３１３は車両状態情報を取得し、ナビゲーション情報取得部はナビゲーション情報を取得する。

　次に、ステップＳ１０２において、物体検知情報取得部３１１は、物体検知情報に対して第一前処理を実施する。第一前処理は活用フェーズで説明した前処理と同じ処理である。

　次に、ステップＳ１０３において、緊急回避判定部３２１は、物体検知情報を用いて車両が緊急回避が必要な状態にあるか否かを判定する。緊急回避判定部３２１が、車両が緊急回避が必要な状態にあると判定した場合、ステップＳ１０４に進み、緊急回避が必要な状態にないと判定した場合、ステップＳ１０５に進む。

　ステップＳ１０４に進んだ場合、認知部１２０は、緊急回避の判定に用いた物体検知情報と、同時刻の車両状態情報とを学習用データから除外し、ステップＳ１０１に戻る。

　ステップＳ１０５に進んだ場合、運転状況判定部３２２は車両の運転状況を判定する。

　次に、ステップＳ１０６で、モデル選択部３２３は、ステップＳ１０５で運転状況判定部３２２が判定した運転状況に基づいて、後のステップで用いる学習モデルを選択する。

　次に、ステップＳ１０７で、第二学習用データ生成部３３２は、第二学習用データを生成する。ここで生成される第二学習用データは、ステップＳ１０６で選択された学習モデルを学習させるための学習用データである。

　次に、ステップＳ１０８で、運転支援用学習済モデル生成部３４２は、第二学習用データが十分量蓄積されたかを判定する。運転支援用学習済モデル生成部３４２が、第二学習用データが十分量蓄積されていないと判定した場合、ステップＳ１０１に戻り、取得部３１０は、再度各種情報を取得する。一方、運転支援用学習済モデル生成部３４２が、第二学習用データが十分量蓄積されたと判定した場合、ステップＳ１０９に進む。

　ステップＳ１０９で運転支援用学習済モデル生成部３４２は、運転支援用学習モデルの学習を行う。ここで、運転支援用学習済モデル生成部３４２が学習を行うのは、ステップＳ１０６でモデル選択部３２３が選択した学習モデルである。

　最後に、ステップＳ１１０で運転支援用学習済モデル生成部３４２は、全運転状況について学習モデルの学習を行ったか判定する。運転支援用学習済モデル生成部３４２が、まだ学習を行っていない学習モデルが存在すると判定した場合、ステップＳ１０１に戻る。一方、運転支援用学習済モデル生成部３４２が、全運転状況の学習モデルの学習を行ったと判定した場合、図１４におけるステップＳ１００の処理を終了する。

　次に、図１４のステップＳ２００の詳細について説明する。
　ステップＳ２０１からステップＳ２０５までの処理は、ステップＳ１０１からステップＳ１０５までと同様であるので、説明を省略する。また、ステップＳ１０１からステップＳ１０５までの処理結果を記憶装置に記憶しており、同じ物体検知情報を評価値算出用学習モデルの学習に用いる場合、ステップＳ２０１からステップＳ２０５までの処理を省略し、記憶装置から物体検知情報及び運転状況等の処理結果を読み出すだけでもよい。

　ステップＳ２０６で、モデル選択部３２３はステップＳ２０５で運転状況判定部３２２が判定した運転状況に基づいて、後のステップで用いる学習モデルを選択する。

　ステップＳ２０７で、第一学習用データ生成部３３１は、第一学習用データを生成する。ここで生成される第一学習用データは、ステップＳ２０６で選択された学習モデルを学習させるための第一学習用データである。また、第一学習用データ生成部３３１は、第一学習用データに含める教師データをステップＳ１００で生成した運転支援用学習済モデルを用いて生成する。

　次に、ステップＳ２０８で、評価値算出用学習済モデル生成部３４１は、第一学習用データが十分量蓄積されたかを判定する。評価値算出用学習済モデル生成部３４１が、第一学習用データが十分量蓄積されていないと判定した場合、ステップＳ２０１に戻り、取得部３１０は、再度各種情報を取得する。一方、評価値算出用学習済モデル生成部３４１が、第一学習用データが十分量蓄積されたと判定した場合、ステップＳ２０９に進む。

　ステップＳ２０９で評価値算出用学習済モデル生成部３４１は、評価値算出用学習モデルの学習を行う。ここで、評価値算出用学習済モデル生成部３４１が学習を行うのは、ステップＳ２０６でモデル選択部３２３が選択した学習モデルである。

　最後に、ステップＳ２１０で評価値算出用学習済モデル生成部３４１は、全運転状況について学習モデルの学習を行ったか判定する。評価値算出用学習済モデル生成部３４１が、まだ学習を行っていない学習モデルが存在すると判定した場合、ステップＳ２０１に戻る。一方、評価値算出用学習済モデル生成部３４１が、全運転状況の学習モデルの学習を行ったと判定した場合、図１４におけるステップＳ２００の処理を終了する。

　最後に、ステップＳ３００の詳細について説明する。
　ステップＳ３０１からステップＳ３０６までの処理は、ステップＳ１０１からステップＳ１０６までと同様である。また、ステップＳ１０１からステップＳ１０６までの処理結果を記憶装置に記憶しており、同じ車両状態情報及び物体検知情報を運転支援用学習済モデルの学習に用いる場合、ステップＳ３０１からステップＳ３０６までの処理を省略し、記憶装置から記憶している車両状態情報、物体検知情報、及び運転状況等の処理結果を読み出すだけでもよい。

　ステップＳ３０７において、評価部３２４は、ステップＳ２００で生成した評価値算出用学習済モデル生成部を用いて、入力された物体検知情報の評価値を算出する。

　ステップＳ３０８において、第二学習用データ生成部３３２は、入力された物体検知情報に対して第二前処理を実施する。ここでの第二前処理は、活用フェーズで説明した第二前処理と同じ処理である。

　次に、ステップＳ３０９において、第二学習用データ生成部３３２は、第二前処理後の物体検知情報を用いて第二学習用データを生成する。再学習時における第二学習用データは、初期学習時の第二学習用データと区別するために、以下では、再学習用データと呼ぶこととする。

　次に、ステップＳ３１０において、運転支援用学習済モデル生成部３４２は、再学習用データが十分量蓄積されたかを判定する。運転支援用学習済モデル生成部３４２が、再学習用データが十分量蓄積されていないと判定した場合、ステップＳ３０１に戻り、取得部３１０は、再度物体検知情報を取得する。一方、運転支援用学習済モデル生成部３４２が、再学習用データが十分量蓄積されたと判定した場合、ステップＳ３１１に進む。

　ステップＳ３１１において、運転支援用学習済モデル生成部３４２は、再学習用データを用いて行動推定用学習モデルの再学習を行う。

　最後に、ステップＳ３１２で運転支援用学習済モデル生成部３４２は、全運転状況の学習モデルの再学習を行ったか判定する。運転支援用学習済モデル生成部３４２が、まだ再学習を行っていない学習モデルが存在すると判定した場合、ステップＳ３０１に戻る。一方、運転支援用学習済モデル生成部３４２が、全運転状況の学習モデルの再学習を行ったと判定した場合、図１４におけるステップＳ３００の処理を終了する。

　以上のような動作により、実施の形態１に係る学習装置３００は、運転支援用学習済モデルと評価値算出用学習済モデル生成部を生成することができる。

　また、ドライビングシミュレータで生成した物体検知情報を用いて学習用データを生成する場合、現実世界の様々な障害物をドライビングシミュレータでは再現できず、シミュレータ環境と現実の環境に差異が生じてしまい、学習済モデルの推論性能が低下してしまう可能性がある。

　この課題に対して、実施の形態１に係る学習装置３００は、評価値が所定の閾値以下の物体検知情報のセンサー値をセンサーが物体を検知していないときのセンサー値に置き換え、評価値が所定の閾値より大きな物体検知情報の示すセンサー値は元のセンサー値のままとする第二前処理を行い、第二前処理後の再学習用データを用いて、運転支援用学習モデルの再学習を行うようにしたので、ドライビングシミュレータ上でも実環境上でも評価値の大きい物体検知情報のみを学習に用いることにより、シミュレータ環境と実環境との差異を軽減し、学習済モデルの推論精度を向上することができる。

　また、ドライビングシミュレータでは予め設定した領域外、例えば、車両が走行する道路外の環境を再現するのは困難なため、ドライビングシミュレータで生成した学習用データと実環境の物体検知情報は差異が生じる可能性がある。

　この課題に対して、実施の形態１に係る学習装置３００は、地図情報に基づき、物体検知情報のうち、予め設定された領域外の物体を検知した物体検知情報の示すセンサー値をセンサーが物体を検知していないときのセンサー値に置き換え、予め設定された領域内の物体を検知した物体検知情報の示すセンサー値は元のセンサー値のままとする第一前処理を行い、第一前処理後の物体検知情報を学習用データとするようにしたので、予め設定した領域外の物体の存在は無視することで、シミュレータ環境で得られる物体検知情報と実環境での物体検知情報が同等となる。すなわち、学習済モデルの判断に不要な情報を取り除くことにより、学習済モデルの推論性能を向上することができる。

　以下で実施の形態１に係る自動運転システム１０００、運転支援装置１００及び学習装置３００の変形例について説明する。

　運転支援用学習済モデルは、現在時刻ｔの物体検知情報及び車両状態情報に基づき、行動判断を行うようにしたが、過去の時刻ｔ－ΔＴから現在時刻ｔまでの物体検知情報及び車両状態情報に基づき、運転支援情報を推論するようにしてもよい。この場合には、車両状態情報を用いなくても、自車両と他車両との相対的な速度関係を把握することができる。また、評価値算出用学習済モデルについても同様に、現在時刻ｔの物体検知情報だけでなく、過去の時刻ｔ－ΔＴから現在時刻ｔまでの物体検知情報を入力に用いるようにしてもよい。この場合、評価部１２４及び評価部３２４は、過去の時刻ｔ－ΔＴから現在時刻ｔまでの各物体検知情報に対して評価値を算出する。

　また、自動運転システム１０００の各構成は、１台の車両に備えられるものとしたが、運転支援装置１００及び車両制御装置２００のみ車両に備え、学習装置３００は外部のサーバーにより実現されるようにしてもよい。

　また、運転支援装置１００及び学習装置３００が自動運転システム１０００に適用される場合について説明したが、運転支援装置１００及び学習装置３００を手動運転車両に搭載するようにしてもよい。運転支援装置１００及び学習装置３００を手動運転車両に適用した場合には、例えば、運転支援装置１００が出力した運転支援情報と、運転手が実際に行った運転制御とを比較することにより、運転手の状態が正常か、または異常かを検知することができる。

　また、取得部１１０が第一前処理を行う領域について、外部から設定されるようにしたが、ナビゲーション情報に基づき、取得部１１０が自動で設定するようにしてもよい。例えば、ナビゲーション情報が示す走行経路の道路内を当該領域として設定するようにしてもよい。

　また、運転支援装置１００は、運転状況について、緊急回避が必要な状態と通常の運転状態に分けて運転支援情報を出力するようにしたが、これらをまとめて、学習済モデルを用いて運転支援情報を出力するようにしてもよい。すなわち、緊急回避判定部１２１及び緊急回避行動判断部１３１を設けず、緊急回避が必要な状態も運転状況判定部１２２が判定する運転状況の一つとして、緊急回避行動に必要な運転支援情報も運転支援用学習済モデルを用いて推論部１３２が推論するようにしてもよい。

　また、学習装置３００は、各運転状況に応じた学習済モデルを生成し、運転支援装置１００は、各運転状況に応じた学習済モデルを用いて、運転支援情報を出力するようにしたので、各運転状況に応じた適切な運転支援情報を出力できるようになっているが、十分な汎化性能が得られる場合には、複数の状況をまとめた学習済モデルを用いたり、全運転状況をまとめた学習済モデルを用いたりするようにしてもよい。

　また、評価部１２４は、評価値算出用学習済モデルの入力として、さらに、車両状態情報、地図情報、及びナビゲーション情報を用いるようにしてもよい。同様に、推論部１３２は、運転支援用学習済モデルの入力として、さらに、地図情報及びナビゲーション情報を用いるようにしてもよい。

　また、取得部１１０は、各種情報を取得するステップＳ１の直後であるステップＳ２で第一前処理を行うようにしたが、評価部１２４が評価値を算出するステップＳ７より前であれば、いつ第一前処理を行うようにしてもよい。特に緊急回避行動については即座の対応が必要となるため、第一前処理を緊急回避行動の要否判断後に実施することにより、即座に緊急回避行動を実現することができる

　学習装置３００は、運転支援用学習モデルの初期学習と再学習において、同じ関数形のモデルを用いるものとして説明したが、初期学習と再学習とで異なる関数形のモデルを用いても良い。多量の情報から運転支援情報を推論するにはモデルのパラメータを増やしモデルの表現能力を増やして学習する必要があるが、少量の情報から推論する場合は少ないパラメータでも学習可能であり、第二前処理後のデータは、評価値の低いセンサー値を既定の値に置き換えることで不要な情報は取り除いているため、入力データの情報量は減少している。したがって、再学習時には、行動推定用学習モデルは再学習前のモデルよりパラメータの少ない小さなモデルで学習しても、十分な性能が得られるので、再学習時はパラメータの少ないより小さなモデルで学習することが可能である。より小さなモデルで行動推定用学習モデルを学習することで、推論時に車載機器のメモリ使用量削減や処理負荷低減の効果を得ることができる。
　ここで、より小さなモデルとは、モデルがニューラルネットの場合、層やノード数を減らしたモデルである。

　本開示に係る運転支援装置は、例えば、自動運転システムや運転手の異常検知システムに用いられるのに適している。

　１０００　自動運転システム、１００　運転支援装置、２００　車両制御装置、３００　学習装置、１１０，３１０　取得部、１２０，３２０　認知部、１３０　判断部、１１１，３１１　物体検知情報取得部、１１２，３１２　地図情報取得部、１１３，３１３　車両状態情報取得部、１１４，３１４　ナビゲーション情報取得部、１２１，３２１　緊急回避判定部、１２２，３２２　運転状況判定部、１２３，３２３　モデル選択部、１２４，３２４　評価部、１３１　緊急回避行動判断部、１３２　推論部、３３０　学習用データ生成部、３３１　第一学習用データ生成部、３３２　第二学習用データ生成部、３４０　学習済モデル生成部、３４１　評価値算出用学習済モデル生成部、３４２　運転支援用学習済モデル生成部、１００００，３００００　処理装置、１０００１，３０００１　記憶装置。

Claims

　車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報を取得する取得部と、
　前記物体検知情報から前記車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、前記取得部から入力された前記物体検知情報から前記運転支援情報を出力する推論部と、
　前記取得部から入力された前記物体検知情報について、前記運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価部と、
　を備え、
　前記推論部は、前記取得部から入力された前記物体検知情報のうち、前記評価部が算出した前記評価値が所定の閾値より大きな前記物体検知情報に基づき、前記運転支援情報を出力する
　ことを特徴とする運転支援装置。
　前記取得部は、さらに、前記車両の状態を示す車両状態情報を取得し、
　前記推論部は、前記車両状態情報及び前記物体検知情報から前記運転支援情報を推論する前記運転支援用学習済モデルを用いて、前記取得部から入力された前記車両状態情報及び前記物体検知情報から前記運転支援情報を出力する
　ことを特徴とする請求項１に記載の運転支援装置。
　前記評価部は、前記物体検知情報から前記評価値を算出する評価値算出用学習済モデルを用いて、前記取得部から入力された前記物体検知情報から前記評価値を出力する
　ことを特徴とする請求項１または２に記載の運転支援装置。
　前記取得部は、さらに、前記車両周囲の地物の位置を示す地図情報を取得し、前記地図情報に基づき、予め設定した領域内の物体の検知結果を示す前記物体検知情報を特定し、
　前記推論部は、前記取得部が特定した前記物体検知情報に基づき、前記運転支援情報を出力する
　ことを特徴とする請求項１から３のいずれか一項に記載の運転支援装置。
　前記取得部は、前記地図情報に基づき、予め設定した領域外の物体の検知結果を示す前記物体検知情報のセンサー値を所定のセンサー値に置き換える第一前処理を行い、前記第一前処理後の前記物体検知情報を前記評価部及び前記推論部に出力する
　ことを特徴とする請求項４に記載の運転支援装置。
　前記取得部は、前記第一前処理として、予め設定した領域外の物体の検知結果を示す前記物体検知情報のセンサー値を前記センサーが物体を検知していないときのセンサー値とする処理を行う
　ことを特徴とする請求項５に記載の運転支援装置。
　前記取得部は、前記第一前処理として、前記地図情報に基づき、予め設定した領域外の物体の検知結果を示す前記物体検知情報のセンサー値を所定のセンサー値に置き換えるとともに、予め設定した領域内の物体の検知結果を示す前記物体検知情報のセンサー値を元のセンサー値のままとする処理を行う
　ことを特徴とする請求項５に記載の運転支援装置。
　前記推論部は、前記取得部から入力された前記物体検知情報のうち、前記評価値が所定の閾値以下の前記物体検知情報のセンサー値を所定のセンサー値に置き換える第二前処理を行い、前記第二前処理後の前記物体検知情報を前記運転支援用学習済モデルに入力することにより、前記運転支援情報を出力する
　ことを特徴とする請求項１から７のいずれか一項に記載の運転支援装置。
　前記推論部は、前記第二前処理として、前記取得部から入力された前記物体検知情報のうち、前記評価値が所定の閾値以下の前記物体検知情報のセンサー値を前記センサーが物体を検知していないときのセンサー値に置き換える処理を行う
　ことを特徴とする請求項８に記載の運転支援装置。
　前記推論部は、前記第二前処理として、前記評価値が所定の閾値以下の前記物体検知情報のセンサー値を所定のセンサー値に置き換えるとともに、前記評価値が所定の閾値より大きな前記物体検知情報のセンサー値は元のセンサー値のままとする処理を行う
　ことを特徴とする請求項８に記載の運転支援装置。
　車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報と、前記車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルの出力への前記物体検知情報の影響度合いを示す評価値とを含む第一学習用データを生成する第一学習用データ生成部と、
　前記第一学習用データを用いて、前記物体検知情報から前記評価値を算出する評価値算出用学習済モデルを生成する評価値算出用学習済モデル生成部と、
　を備える学習装置。
　車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報と、前記車両の運転支援を行うための運転支援情報とを含む第二学習用データを生成する第二学習用データ生成部と、
　前記第二学習用データを用いて、前記物体検知情報から前記運転支援情報を推論する運転支援用学習済モデルを生成する運転支援用学習済モデル生成部と、
　前記第二学習用データ生成部から入力された前記第二学習用データが含む前記物体検知情報について、前記運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価部と、
　を備え、
　前記運転支援用学習済モデル生成部は、前記第二学習用データ生成部から入力された前記第二学習用データのうち、前記評価部が算出した前記評価値が所定の閾値より大きな前記物体検知情報を含む前記第二学習用データを用いて、前記運転支援用学習済モデルを生成する
　ことを特徴とする学習装置。
　車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報を取得する取得工程と、
　前記物体検知情報から前記車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルを用いて、入力された前記物体検知情報から前記運転支援情報を出力する推論工程と、
　入力された前記物体検知情報について、前記運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価工程と、
　を含み、
　前記推論工程において、入力された前記物体検知情報のうち、前記評価工程で算出した前記評価値が所定の閾値より大きな前記物体検知情報に基づき、前記運転支援情報を出力する
　ことを特徴とする運転支援方法。
　請求項１３に記載の全工程をコンピュータに実行させる運転支援プログラム。
　車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報と、前記車両の運転支援を行うための運転支援情報を推論する運転支援用学習済モデルの出力への前記物体検知情報の影響度合いを示す評価値とを含む第一学習用データを生成する第一学習用データ生成工程と、
　前記第一学習用データを用いて、前記物体検知情報から前記評価値を算出する評価値算出用学習済モデルを生成する評価値算出用学習済モデル生成工程と、
　を含む学習済モデルの生成方法。
　請求項１５に記載の全工程をコンピュータに実行させる学習済モデル生成プログラム。
　前記車両に搭載されたセンサーによる前記車両周囲の物体の検知結果を示す物体検知情報と、前記車両の運転支援を行うための運転支援情報とを含む第二学習用データを生成する第二学習用データ生成工程と、
　前記第二学習用データを用いて、前記物体検知情報から前記運転支援情報を推論する運転支援用学習済モデルを生成する運転支援用学習済モデル生成工程と、
　入力された前記第二学習用データが含む前記物体検知情報について、前記運転支援用学習済モデルの出力への影響度合いを評価値として算出する評価工程と、
　を備え、
　前記運転支援用学習済モデル生成工程において、入力された前記第二学習用データのうち、前記評価工程で算出した前記評価値が所定の閾値より大きな前記物体検知情報を含む前記第二学習用データを用いて、前記運転支援用学習済モデルを生成する
　ことを特徴とする学習済モデルの生成方法。
　請求項１７に記載の全工程をコンピュータに実行させる学習済モデル生成プログラム。