JP2018165693A - Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system - Google Patents
Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system Download PDFInfo
- Publication number
- JP2018165693A JP2018165693A JP2017063659A JP2017063659A JP2018165693A JP 2018165693 A JP2018165693 A JP 2018165693A JP 2017063659 A JP2017063659 A JP 2017063659A JP 2017063659 A JP2017063659 A JP 2017063659A JP 2018165693 A JP2018165693 A JP 2018165693A
- Authority
- JP
- Japan
- Prior art keywords
- driving
- presentation information
- operation signal
- unit
- actions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
本発明は、車両、車両に設けられる運転支援方法およびそれを利用した運転支援装置、自動運転制御装置、プログラム、提示システムに関する。 The present invention relates to a vehicle, a driving support method provided in the vehicle, a driving support device using the same, an automatic driving control device, a program, and a presentation system.
自動運転車両は、車両の周囲の状況を検知し、従来乗員が意図し実行していた運転行動を自動的に実行することによって走行する。このような自動運転車両には、乗員が意図する運転行動と、自動運転車両の運転行動とが乖離しないように、乗員が運転行動を変更するための運転支援装置が搭載される。運転支援装置は、実行可能な運転行動を提示し、乗員に運転行動を選択させる(例えば、特許文献1参照)。 An autonomous driving vehicle travels by detecting a situation around the vehicle and automatically executing a driving action that has been intended and performed by a passenger. Such an automatic driving vehicle is equipped with a driving support device for the occupant to change the driving behavior so that the driving behavior intended by the occupant and the driving behavior of the automatic driving vehicle do not deviate. The driving support device presents an executable driving action and causes the occupant to select the driving action (see, for example, Patent Document 1).
提示した運転行動の中に乗員が希望する運転行動が含まれない場合、乗員は、希望する運転行動を選択できない。そのため、乗員の意図を反映するような運転行動を提示することが望まれる。 If the presented driving behavior does not include the driving behavior desired by the occupant, the occupant cannot select the desired driving behavior. Therefore, it is desirable to present driving behavior that reflects the passenger's intention.
本発明はこうした状況に鑑みなされたものであり、その目的は、乗員の意図を反映するような運転行動を導出する技術を提供することにある。 This invention is made | formed in view of such a condition, The objective is to provide the technique which derives | leads-out the driving action which reflects a passenger | crew's intent.
上記課題を解決するために、本発明のある態様の運転支援装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。 In order to solve the above problems, a driving support device according to an aspect of the present invention selects a predetermined number of driving actions in descending order of reliability of each of a plurality of types of driving actions that are estimation results using a driving action model. A generation unit that generates first presentation information indicating a predetermined number of selected driving actions, a presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device, and a notification device An operation signal input unit to which a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information is input, and one indicated by the first operation signal input to the operation signal input unit A learning unit that updates the driving behavior model by performing learning while performing positive weighting on the driving behavior. The generation unit generates second presentation information including driving behavior with low reliability instead of the first presentation information at a predetermined frequency instead of a part of the predetermined number of driving behaviors to be included in the first presentation information. The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device, and the operation signal input unit outputs one of the second presentation information notified from the notification device by the occupant. The second operation signal indicating the driving action is input, and the learning unit performs positive weighting on the one driving action indicated in the second operation signal input to the operation signal input unit, and uses the second presentation information as the second presentation information. The driving behavior model is updated by performing learning while negatively weighting other driving behaviors included.
本発明の別の態様は、自動運転制御装置である。この装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。 Another aspect of the present invention is an automatic operation control device. This device selects a predetermined number of driving actions in descending order of the reliability of each of a plurality of types of driving actions that are estimation results using the driving action model, and the first predetermined driving action is indicated. A generation unit that generates the presentation information, a presentation information output unit that outputs the first presentation information generated in the generation unit to the notification device, and one driving selected by the occupant with respect to the first presentation information notified from the notification device An operation signal input unit to which a first operation signal indicating an action is input, and learning while executing positive weighting on one driving action indicated in the first operation signal input to the operation signal input unit And a learning unit that updates the driving behavior model and an automatic driving control unit that controls automatic driving of the vehicle based on one driving behavior. The generation unit generates second presentation information including driving behavior with low reliability instead of the first presentation information at a predetermined frequency instead of a part of the predetermined number of driving behaviors to be included in the first presentation information. The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device, and the operation signal input unit outputs one of the second presentation information notified from the notification device by the occupant. The second operation signal indicating the driving action is input, and the learning unit performs positive weighting on the one driving action indicated in the second operation signal input to the operation signal input unit, and uses the second presentation information as the second presentation information. The driving behavior model is updated by performing learning while negatively weighting other driving behaviors included.
本発明のさらに別の態様は、車両である。この車両は、運転支援装置を備える車両であって、運転支援装置は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。 Yet another embodiment of the present invention is a vehicle. The vehicle includes a driving support device, and the driving support device selects a predetermined number of driving behaviors in descending order of reliability of each of a plurality of types of driving behaviors that are estimation results using the driving behavior model. A generation unit that generates first presentation information indicating a predetermined number of selected driving actions, a presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device, and a notification device An operation signal input unit to which a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information is input, and one indicated by the first operation signal input to the operation signal input unit A learning unit that updates the driving behavior model by performing learning while performing positive weighting on the driving behavior. The generation unit generates second presentation information including driving behavior with low reliability instead of the first presentation information at a predetermined frequency instead of a part of the predetermined number of driving behaviors to be included in the first presentation information. The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device, and the operation signal input unit outputs one of the second presentation information notified from the notification device by the occupant. The second operation signal indicating the driving action is input, and the learning unit performs positive weighting on the one driving action indicated in the second operation signal input to the operation signal input unit, and uses the second presentation information as the second presentation information. The driving behavior model is updated by performing learning while negatively weighting other driving behaviors included.
本発明のさらに別の態様は、運転支援方法である。この方法は、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、生成した第1提示情報を報知装置に出力するステップと、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、生成した第2提示情報を報知装置に出力するステップと、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、を備える。 Yet another embodiment of the present invention is a driving support method. This method selects a predetermined number of driving actions in descending order of the reliability of each of a plurality of types of driving actions, which is an estimation result using a driving action model, and the first predetermined driving action is indicated. A step of generating the presentation information; a step of outputting the generated first presentation information to the notification device; and a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device Is input, the step of updating the driving behavior model by executing learning while performing positive weighting on one driving behavior indicated in the input first operation signal, and the first presentation information Generating a second presentation information including a driving action with low reliability instead of a part of the predetermined number of driving actions to be included instead of the first presentation information at a predetermined frequency; A step of outputting the second presentation information to the notification device; a step of inputting a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device; A driving behavior model is performed by performing positive weighting on one driving behavior indicated in the second operation signal and performing learning while performing negative weighting on other driving behaviors included in the second presentation information. Updating.
本発明のさらに別の態様は、提示システムである。この提示システムは、運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、生成部において生成した第1提示情報を出力する提示情報出力部とを備える運転支援装置と、運転支援装置から出力された提示情報を報知する報知装置とを備える。運転支援装置は、報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備える。生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、提示情報出力部は、生成部において生成した第2提示情報を報知装置に出力し、操作信号入力部には、報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、学習部は、操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する。 Yet another embodiment of the present invention is a presentation system. This presentation system selects a predetermined number of driving behaviors in descending order of the reliability of each of a plurality of types of driving behaviors, which is an estimation result using a driving behavior model, and the selected predetermined number of driving behaviors are shown. A driving support device including a generation unit that generates 1 presentation information; a presentation information output unit that outputs first presentation information generated by the generation unit; and a notification device that notifies the presentation information output from the driving support device. Prepare. The driving support device is input to the operation signal input unit that receives the first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device, and the operation signal input unit. And a learning unit that updates the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal. The generation unit generates second presentation information including driving behavior with low reliability instead of the first presentation information at a predetermined frequency instead of a part of the predetermined number of driving behaviors to be included in the first presentation information. The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device, and the operation signal input unit outputs one of the second presentation information notified from the notification device by the occupant. The second operation signal indicating the driving action is input, and the learning unit performs positive weighting on the one driving action indicated in the second operation signal input to the operation signal input unit, and uses the second presentation information as the second presentation information. The driving behavior model is updated by performing learning while negatively weighting other driving behaviors included.
なお、以上の構成要素の任意の組合せ、構成要素の一部、例えば学習部、を通信網を介したコンピュータで逐次あるいは一日など所定時間分をまとめて処理する構成、本発明の表現を装置、システム、方法、プログラム、プログラムを記録した記録媒体、本装置を搭載した車両などの間で変換したものもまた、本発明の態様として有効である。 Arbitrary combinations of the above constituent elements, a part of the constituent elements, for example, a learning unit, are processed sequentially or collectively for a predetermined time such as one day by a computer via a communication network, and the expression of the present invention is an apparatus. A system, a method, a program, a recording medium on which the program is recorded, a vehicle in which the apparatus is mounted, and the like are also effective as an aspect of the present invention.
本発明によれば、乗員の意図を反映するような運転行動を導出できる。 According to the present invention, it is possible to derive a driving action that reflects the intention of the occupant.
(実施の形態1)
本発明を具体的に説明する前に、概要を述べる。本実施の形態は、自動車の自動運転に関する。特に、本実施の形態は、車両の運転行動に関する情報を車両の乗員(例えば運転者)との間でやり取りするためのHMI(Human Machine Interface)を制御する装置(以下「運転支援装置」とも呼ぶ。)に関する。本実施の形態における各種の用語は次のように定義される。「運転行動」は、車両の走行中または停止時の操舵や制動などの作動状態、もしくは自動運転制御に係る制御内容を含んでおり、例えば、定速走行、加速、減速、一時停止、停止、車線変更、進路変更、右左折、駐車などである。また、運転行動は、巡航(車線維持で車速維持)、車線維持、先行車追従、追従時のストップアンドゴー、追越、合流車両への対応、高速道への進入と退出を含めた乗換(インターチェンジ)、合流、工事ゾーンへの対応、緊急車両への対応、割込み車両への対応、右左折専用レーンへの対応、歩行者・自転車とのインタラクション、車両以外の障害物回避、標識への対応、右左折・Uターン制約への対応、車線制約への対応、一方通行への対応、交通標識への対応、交差点・ラウンドアバウトへの対応などであってもよい。
(Embodiment 1)
Before describing the present invention in detail, an outline will be described. The present embodiment relates to an automatic driving of an automobile. In particular, the present embodiment is a device that controls an HMI (Human Machine Interface) for exchanging information related to driving behavior of the vehicle with a vehicle occupant (for example, a driver) (hereinafter also referred to as “driving support device”). .) Various terms in the present embodiment are defined as follows. “Driving behavior” includes the state of operation such as steering and braking during driving or stopping of the vehicle, or control content related to automatic driving control, for example, constant speed driving, acceleration, deceleration, pause, stop, Lane change, course change, left / right turn, parking, etc. In addition, driving behavior includes cruise (maintaining lane keeping, vehicle speed), lane keeping, following vehicle follow-up, stop-and-go during follow-up, overtaking, response to merging vehicles, transfer including highway entry and exit ( Interchange), confluence, response to construction zone, emergency vehicle response, interrupt vehicle response, right / left turn lane response, pedestrian / bicycle interaction, obstacle avoidance other than vehicles, signs response , Right / left turn / U-turn restrictions, lane restrictions, one-way traffic, traffic signs, intersections / roundabouts, etc.
「運転行動推定エンジン」として、DL(Deep Learning:深層学習)、ML(Machine Learning:機械学習)、フィルタ等のいずれか、あるいはそれらの組合せが使用される。Deep Learningは、例えば、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)、RNN(Recurrent Neural Network:リカレント・ニューラル・ネットワーク)である。また、Machine Learningは、例えば、SVM(Support Vector Machine)である。さらに、フィルタは、例えば、協調フィルタリングである。 As the “driving behavior estimation engine”, any of DL (Deep Learning), ML (Machine Learning), a filter, or a combination thereof is used. Deep Learning is, for example, CNN (Convolutional Neural Network) or RNN (Recurrent Neural Network). Also, the Machine Learning is, for example, SVM (Support Vector Machine). Furthermore, the filter is, for example, collaborative filtering.
「運転行動モデル」は、運転行動推定エンジンに応じて一意に定められる。DLの場合の運転行動モデルは学習されたニューラルネットワーク(Neural Network)であり、SVMの場合の運転行動モデルは学習された予測モデルであり、協調フィルタリングの場合の運転行動モデルは走行環境データと運転行動データとを紐付けたデータである。ルールの場合の運転行動モデルは入力と出力とを紐付けたデータである。 The “driving behavior model” is uniquely determined according to the driving behavior estimation engine. The driving behavior model in the case of DL is a learned neural network (Neural Network), the driving behavior model in the case of SVM is a learned prediction model, and the driving behavior model in the case of collaborative filtering includes driving environment data and driving It is data that links behavior data. The driving behavior model in the case of a rule is data in which an input and an output are linked.
このような定義のもと、運転支援装置は、機械学習等により生成した運転行動モデルを用いて複数の運転行動を推定する。さらに、運転支援装置は、信頼度が最も高い運転行動を選択して、選択した運転行動に応じた自動運転を実行させる。信頼度とは、推定された運転行動の確からしさを示しており、DLの場合に推定結果の累積値に相当し、SVMの場合に信頼値(confidence value)に相当し、協調フィルタリングの場合に相関度に相当する。ルールの場合にルールの信頼度に相当する。そのため、信頼度が最も高い運転行動は、安全性の高い運転行動である。しかしながら、当該運転行動が、乗員の意図を反映した運転行動でない場合があり、乗員の意図を反映するような運転行動を導出することが望まれる。 Based on such a definition, the driving support apparatus estimates a plurality of driving behaviors using a driving behavior model generated by machine learning or the like. Further, the driving support device selects the driving action having the highest reliability and causes the driving operation to be performed according to the selected driving action. The reliability indicates the certainty of the estimated driving behavior, corresponds to the cumulative value of the estimation result in the case of DL, corresponds to the confidence value in the case of SVM, and corresponds to the case of collaborative filtering. Corresponds to the degree of correlation. In the case of rules, this corresponds to the reliability of the rules. Therefore, the driving action with the highest reliability is a driving action with high safety. However, the driving behavior may not be a driving behavior that reflects the occupant's intention, and it is desirable to derive a driving behavior that reflects the occupant's intention.
そのため、本実施の形態では、選択された運転行動をもとに強化学習を実行することによって、運転行動モデルを更新する。その際、強化学習における報酬として、運転支援装置によって運転行動が選択された場合に対する報酬よりも、乗員によって運転行動が選択された場合に対する報酬を大きくする。その結果、乗員によって選択された運転行動の信頼度が以後高くなりやすくなり、乗員の意図が反映されやすくなる。以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、以下に説明する各実施の形態は一例であり、本発明はこれらの実施の形態により限定されるものではない。 Therefore, in the present embodiment, the driving behavior model is updated by executing reinforcement learning based on the selected driving behavior. At this time, the reward for the case where the driving action is selected by the occupant is set larger than the reward for the case where the driving action is selected by the driving support device. As a result, the reliability of the driving action selected by the occupant is likely to increase thereafter, and the intention of the occupant is easily reflected. Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Each embodiment described below is an example, and the present invention is not limited to these embodiments.
図1は、実施の形態1に係る車両100の構成を示し、特に自動運転車両に関する構成を示す。車両100は、自動運転モードで走行可能であり、報知装置2、入力装置4、無線装置8、運転操作部10、検出部20、自動運転制御装置30、運転支援装置40を含む。図1に示す各装置の間は、専用線あるいはCAN(Controller Area Network)等の有線通信で接続されてもよい。また、USB(Universal Serial Bus)、Ethernet(登録商標)、Wi−Fi(登録商標)、Bluetooth(登録商標)等の有線通信または無線通信で接続されてもよい。
FIG. 1 shows a configuration of
報知装置2は、車両100の走行に関する情報を乗員に報知する。報知装置2は、例えば、車内に設置されているカーナビゲーションシステム、ヘッドアップディスプレイ、センタディスプレイである。報知装置2は、ステアリングホイール、ピラー、ダッシュボード、メータパネル周りなどに設置されているLED(Light Emitting Diode)などの発光体などのような情報を表示する表示部でもよい。また、報知装置2は、情報を音声に変換して乗員に報知するスピーカであってもよいし、あるいは、乗員が感知できる位置(例えば、乗員の座席、ステアリングホイールなど)に設けられる振動体であってもよい。さらに、報知装置2は、これらの組合せであってもよい。
The
入力装置4は、乗員による操作入力を受けつけるユーザインタフェース装置である。例えば入力装置4は、タッチパネル、レバー、ボタン、スイッチ、ジョイスティックやボリューム等のコントローラ、非接触でジェスチャーを認識するカメラ等のセンサ、音声を認識するマイク等のセンサや、それらの組合せであり、乗員が入力した自車の自動運転に関する情報を受けつける。また、自動運転と手動運転を切りかえるための操作信号を受けつけてもよい。入力装置4は、受けつけた情報を操作信号として運転支援装置40に出力する。
The
図2は、車両100の室内を模式的に示す。報知装置2は、ヘッドアップディスプレイ(HUD、Head−Up Display)2aであってもよく、センタディスプレイ2bであってもよい。入力装置4は、ステアリング11に設けられた第1操作部4aであってもよく、運転席と助手席との間に設けられた第2操作部4bであってもよく、ジェスチャーを認識するカメラ等のセンサである第3操作部4cであってもよい。なお、報知装置2と入力装置4は一体化されてもよく、例えばタッチパネルディスプレイとして実装されてもよい。車両100には、自動運転に関する情報を音声にて乗員へ提示するスピーカ6がさらに設けられてもよい。この場合、運転支援装置40は、自動運転に関する情報を示す画像を報知装置2に表示させ、それとともに、またはそれに代えて、自動運転に関する情報を示す音声をスピーカ6から出力させてもよい。図1に戻る。
FIG. 2 schematically shows the interior of the
無線装置8は、携帯電話通信システム、WMAN(Wireless Metropolitan Area Network)等に対応しており、無線通信を実行する。具体的に説明すると、無線装置8は、ネットワーク302を介してサーバ300と通信する。サーバ300は車両100外部の装置であり、運転行動学習部310を含む。運転行動学習部310については後述する。なお、サーバ300と運転支援装置40は、運転支援システム500に含められる。
The
運転操作部10は、ステアリング11、ブレーキペダル12、アクセルペダル13、ウィンカスイッチ14を備える。ステアリング11、ブレーキペダル12、アクセルペダル13、ウィンカスイッチ14は、ステアリングECU、ブレーキECU、エンジンECUとモータECUおよびウィンカコントローラにより電子制御が可能である。自動運転モードにおいて、ステアリングECU、ブレーキECU、エンジンECU、モータECUは、自動運転制御装置30から供給される制御信号に応じて、アクチュエータを駆動する。またウィンカコントローラは、自動運転制御装置30から供給される制御信号に応じてウィンカランプを点灯あるいは消灯する。
The driving
検出部20は、車両100の周囲状況および走行状態を検出する。検出部20は、例えば、車両100の速度、車両100に対する先行車両の相対速度、車両100と先行車両との距離、車両100に対する側方車線の車両の相対速度、車両100と側方車線の車両との距離、車両100の位置情報を検出する。検出部20は、検出した各種情報(以下、「検出情報」という)を自動運転制御装置30に出力する。また、検出部20は、自動運転制御装置30を介して運転支援装置40に検出情報を出力してもよいし、運転支援装置40に直接出力してもよい。検出部20は、位置情報取得部21、センサ22、速度情報取得部23、地図情報取得部24を含む。
The
位置情報取得部21は、GNSS(Global Navigation Satellite System(s))受信機から車両100の現在位置を取得する。センサ22は、車外の状況および車両100の状態を検出するための各種センサの総称である。車外の状況を検出するためのセンサとして例えばカメラ、ミリ波レーダ、LIDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)、ソナー、気温センサ、気圧センサ、湿度センサ、照度センサ等が搭載される。車外の状況は、車線情報を含む自車の走行する道路状況、天候を含む環境、自車周辺状況、近傍位置にある他車両(隣接車線を走行する他車両等)を含む。なお、センサ22が検出できる車外の情報であれば何でもよい。また車両100の状態を検出するためのセンサ22として例えば、加速度センサ、ジャイロセンサ、地磁気センサ、傾斜センサ等が搭載される。
The position
速度情報取得部23は、車速センサから車両100の現在速度を取得する。地図情報取得部24は、地図データベースから車両100の現在位置周辺の地図情報を取得する。地図データベースは、車両100内の記録媒体に記録されていてもよいし、使用時にネットワークを介して地図サーバからダウンロードしてもよい。なお、地図情報には、道路、交差点に関する情報が含まれている。
The speed
自動運転制御装置30は、自動運転制御機能を実装した自動運転コントローラであり、自動運転における車両100の行動を決定する。自動運転制御装置30は、制御部31、記憶部32、I/O(Input/Output、入出力)部33を備える。制御部31の構成はハードウェア資源とソフトウェア資源の協働、またはハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、その他のLSIを利用でき、ソフトウェア資源としてオペレーティングシステム、アプリケーション、ファームウェア等のプログラムを利用できる。記憶部32は、フラッシュメモリ等の不揮発性記録媒体を備える。I/O部33は、各種の通信フォーマットに応じた通信制御を実行する。例えば、I/O部33は、自動運転に関する情報を運転支援装置40に出力するとともに、制御コマンドを運転支援装置40から入力する。また、I/O部33は、検出情報を検出部20から入力する。
The automatic
制御部31は、運転支援装置40から入力した制御コマンド、検出部20あるいは各種ECUから収集した各種情報を自動運転アルゴリズムに適用して、車両100のアクセルスロットル開度、ステアリング舵角等の自動制御対象を制御するための制御値を算出する。制御部31は算出した制御値を、各制御対象のECUまたはコントローラに伝達する。本実施の形態ではステアリングECU、ブレーキECU、エンジンECU、ウィンカコントローラに伝達する。なお電気自動車あるいはハイブリッドカーの場合、エンジンECUに代えてまたは加えてモータECUに制御値を伝達する。
The
運転支援装置40は、車両100と乗員との間のインタフェース機能を実行するHMIコントローラであり、制御部41、記憶部42、I/O部43を備える。制御部41は、HMI制御等の各種データ処理を実行する。制御部41は、ハードウェア資源とソフトウェア資源の協働、またはハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM、RAM、その他のLSIを利用でき、ソフトウェア資源としてオペレーティングシステム、アプリケーション、ファームウェア等のプログラムを利用できる。
The driving
記憶部42は、制御部41により参照され、または更新されるデータを記憶する記憶領域である。例えばフラッシュメモリ等の不揮発の記録媒体により実現される。I/O部43は、各種の通信フォーマットに応じた各種の通信制御を実行する。I/O部43は、操作信号入力部50、画像・音声出力部51、検出情報入力部52、コマンドIF(Interface、インタフェース)53、通信IF56を備える。
The
操作信号入力部50は、入力装置4に対してなされた乗員もしくは車外にいるユーザの操作による操作信号を入力装置4から受信し、制御部41へ出力する。画像・音声出力部51は、制御部41が生成した画像データあるいは音声メッセージを報知装置2へ出力して表示させる。検出情報入力部52は、検出部20による検出処理の結果であり、車両100の現在の周囲状況および走行状態を示す検出情報を検出部20から受信し、制御部41へ出力する。
The operation
コマンドIF53は、自動運転制御装置30とのインタフェース処理を実行し、行動情報入力部54とコマンド出力部55を含む。行動情報入力部54は、自動運転制御装置30から送信された車両100の自動運転に関する情報を受信し、制御部41へ出力する。コマンド出力部55は、自動運転制御装置30に対して自動運転の態様を指示する制御コマンドを、制御部41から受けつけて自動運転制御装置30へ送信する。
The command IF 53 executes interface processing with the automatic
通信IF56は、無線装置8とのインタフェース処理を実行する。通信IF56は、制御部41から出力されたデータを無線装置8へ送信し、無線装置8から車外の装置へ送信させる。また、通信IF56は、無線装置8により転送された、車外の装置からのデータを受信し、制御部41へ出力する。
The communication IF 56 executes interface processing with the
なお、ここでは、自動運転制御装置30と運転支援装置40は別個の装置として構成される。変形例として、図1の破線で示すように、自動運転制御装置30と運転支援装置40を1つのコントローラに統合してもよい。言い換えれば、1つの自動運転制御装置が、図1の自動運転制御装置30と運転支援装置40の両方の機能を備える構成であってもよい。さらに、報知装置2、運転支援装置40が組み合わされた提示システムとして構成されてもよい。
Here, the automatic
図3は、制御部41の構成を示す。制御部41は、運転行動推定部70、表示制御部72、学習部74を含む。運転行動推定部70は、運転行動モデル80、推定部82、ヒストグラム生成部84を含み、表示制御部72は、生成部90、処理部92を含み、処理部92は選択部94を含む。
FIG. 3 shows the configuration of the
運転行動推定部70は、車両100が実行しうる複数の運転行動の候補のうち、現在の状況において実現可能な運転行動を判定するために、予め学習により構築されたニューラルネットワーク(NN)を使用する。ここで、実現可能な運転行動は複数であってもよく、運転行動を判定することは運転行動を推定することともいえる。
The driving
運転行動推定部70での処理には、図1のサーバ300における運転行動学習部310も関連するので、ここでは、運転行動学習部310の処理をまず説明する。運転行動学習部310は、複数の運転者の運転履歴と走行履歴の少なくとも1つをパラメータとしてニューラルネットワークに入力する。また、運転行動学習部310は、ニューラルネットワークからの出力が、入力したパラメータに対応した教師付けデータに一致するように、ニューラルネットワークの重みを最適化する。運転行動学習部310は、このような処理を繰り返し実行することによって、運転行動モデル80を生成する。つまり、運転行動モデル80は、重みが最適化されたニューラルネットワークである。サーバ300は、運転行動学習部310において生成した運転行動モデル80をネットワーク302、無線装置8を介して運転支援装置40に出力する。なお、運転行動学習部310は、新たなパラメータをもとに運転行動モデル80を更新してもよい。その際、更新された運転行動モデル80は、リアルタイムに運転支援装置40へ出力されてもよいし、遅延をもって運転支援装置40へ出力されてもよい。
Since the processing in the driving
運転行動学習部310によって生成され、かつ運転行動推定部70に入力された運転行動モデル80は、複数の運転者の運転履歴と走行履歴の少なくとも1つから構築したニューラルネットワークである。また、運転行動モデル80は、複数の運転者の走行履歴と走行履歴から構築したニューラルネットワークを、特定の運転者の走行履歴と走行履歴を用いた転移学習により、構築し直したニューラルネットワークであってもよい。ニューラルネットワークの構築には公知の技術が使用されればよいので、ここでは説明を省略する。なお、図3の運転行動推定部70には1つの運転行動モデル80が含まれているが、運転者、乗員、走行シーン、天候、国ごとに複数の運転行動モデル80が運転行動推定部70に含まれていて、状況を自動的に判定するか、手動で変更することにより切りかえてもよい。
The driving
推定部82は、運転行動モデル80を用いて、運転行動を推定する。ここで、運転履歴は、車両100によって過去になされた複数の運転行動のそれぞれに対応した複数の特徴量(以下、「特徴量セット」という)を示す。運転行動に対応した複数の特徴量は、例えば、車両100によって当該運転行動がなされた時点から所定時間前の時点における車両100の走行状態を示す量である。特徴量は、例えば、同乗者数、車両100の速さやその時系列、ハンドルの操舵量やその時系列、ブレーキの度合いやその時系列、アクセルの度合いやその時系列などである。運転履歴は、運転特性モデルといわれてもよい。そのため、特徴量は、例えば、速度に関する特徴量、ステアリングに関する特徴量、操作タイミングに関する特徴量、車外センシングに関する特徴量、または車内センシングに関する特徴量等である。これらの特徴量は、図1の検出部20によって検出されて、I/O部43経由で推定部82に入力される。また、これらの特徴量は、複数の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。さらに、これらの特徴量は、特定の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。
The
走行履歴は、車両100によって過去になされた複数の運転行動のそれぞれに対応した複数の環境パラメータ(以下、「環境パラメータセット」という)を示す。運転行動に対応した複数の環境パラメータは、例えば、車両100によって当該運転行動がなされた時点から所定時間前の時点やその時点以前の所定範囲の時系列における車両100の環境(周囲の状況)を示すパラメータである。環境パラメータは、例えば、自車両の速度、自車両に対する先行車両の相対速度、先行車をセンサがとらえる大きさ、および先行車両と自車両との車間距離などである。また、これらの環境パラメータは、図1の検出部20によって検出されて、I/O部43経由で推定部82に入力される。また、これらの環境パラメータは、複数の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。さらに、これらの環境パラメータは、特定の運転者の走行履歴と走行履歴に加えられ、新たにニューラルネットワークの再構築に用いてもよい。
The travel history indicates a plurality of environmental parameters (hereinafter referred to as “environment parameter set”) corresponding to each of a plurality of driving actions performed by the
推定部82は、運転履歴あるいは走行履歴に含まれる特徴量セットあるいは/および環境パラメータを取得する。推定部82は、運転行動モデル80のニューラルネットワークに特徴量セットあるいは/および環境パラメータを入力し、ニューラルネットワークからの出力を推定結果としてヒストグラム生成部84に出力する。
The
ヒストグラム生成部84は、推定部82から、複数種類の運転行動と、各運転行動に対応する推定結果とを取得し、その運転行動に対する推定結果の累積値を示すヒストグラムを生成する。そのため、ヒストグラムには、複数種類の運転行動と、各運転行動に対応した累積値とが含まれる。ここで、累積値とは、運転行動に対する推定結果が導出された回数を累積した値である。
The
図4は、ヒストグラム生成部84において生成されるヒストグラムを示す。ヒストグラムには、一例として5種類の運転行動である運転行動A〜Eが含まれる。また、運転行動A〜Eのそれぞれに対する累積値が含まれる。ここでは、累積値が大きい順に、運転行動C、運転行動E、運転行動B、運転行動D、運転行動Aであるとする。図3に戻る。ヒストグラム生成部84は、生成したヒストグラムを生成部90に出力する。
FIG. 4 shows a histogram generated by the
生成部90は、ヒストグラム生成部84からヒストグラム、つまり複数種類の運転行動と、各運転行動に対応した累積値とを入力する。生成部90は、複数種類の運転行動のそれぞれの累積値が大きい順に所定数の運転行動を選択する。例えば、生成部90は、「5」の運転行動のうちから「3」の運転行動を選択する。なお、選択される運転行動の数は「3」に限定されない。選択された運転行動は、ヒストグラム生成部84からの複数種類の運転行動のうち、一部の運転行動ともいえる。なお、先行車が減速した場合に、加速して車間距離を詰めるといった危険を及ぼす運転行動を除外するなど、交通安全に沿ったルールベースに基づいて推定された安全な運転行動に限ってもよい。生成部90は、選択した運転行動が示された提示情報を生成する。図4の場合、提示情報には、運転行動C、運転行動E、運転行動Bが含まれており、提示情報では、累積値が大きい順にこれらの運転行動が並べられているものとする。生成部90は、生成した提示情報を処理部92に出力する。
The
処理部92は、生成部90からの提示情報を受けつける。処理部92は、図1の画像・音声出力部51を介して、図2のヘッドアップディスプレイ2aあるいはセンタディスプレイ2bに提示情報を出力する。ヘッドアップディスプレイ2aあるいはセンタディスプレイ2bは、提示情報の画像を表示する。なお、処理部92は、図1の画像・音声出力部51を介して、図2のスピーカ6に提示情報を出力してもよい。その際、スピーカ6は、提示情報の音声メッセージを出力する。
The
図5(a)−(c)は、表示制御部72の処理概要を示す。図5(a)は、センタディスプレイ2bにおいて表示される提示情報の画像を示す。この提示情報の画像は図4をもとに生成されており、累積値が大きい順番に、運転行動C、運転行動E、運転行動Bが上から下に並んで配置される。また、累積値が大きいほど、文字のサイズが大きくされる。つまり、センタディスプレイ2bに表示される画像では、提示情報において前方に配置された運転行動ほど、画面の上方に配置されるとともに、文字のサイズが大きくされる。これらは、累積値である信頼度が高い運転行動ほど、乗員に選択されやすくするためである。
5A to 5C show an outline of processing of the
なお、ヘッドアップディスプレイ2aに提示情報の画像が表示される場合、当該画像は、図5(a)と同様である。図5(b)は、センタディスプレイ2bにおいて表示される提示情報の画像であって、かつ運転行動C、運転行動E、運転行動Bを実際の運転行動に対応付けた場合の提示情報の画像を示す。ここでは、運転行動Cは「直進」に対応し、運転行動Eは「右折」に対応し、運転行動Bは「左側に車線変更」に対応するとする。以下では、説明を明瞭にするために、図5(a)を説明の対象とする。図5(c)の説明は後述し、図3に戻る。
In addition, when the image of presentation information is displayed on the head up
乗員、例えば運転手は、センタディスプレイ2bに表示された提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択する場合、入力装置4に対して選択結果を入力する。例えば、乗員は、第1操作部4aあるいは第2操作部4bを操作して1つの運転行動を選択する。また、センタディスプレイ2bがタッチパネルである場合、乗員は、センタディスプレイ2bに表示された提示情報の画像の中から、1つの運転行動の表示部分をタッチすることによって、1つの運転行動を選択する。さらに、ヘッドアップディスプレイ2aに提示情報の画像が表示されている場合、乗員は、画像の中から、1つの運転行動の表示部分を選択するようなジェスチャーを実行すると、第3操作部4cはジェスチャーに応じた1つの運転行動を選択する。操作信号入力部50には、入力装置4からの操作信号であって、かつ乗員によって選択された1つの運転行動を示す操作信号が入力される。このように操作信号入力部50に操作信号が入力される場合は、「手動選択状態」と呼ばれる。
An occupant, for example, a driver, inputs a selection result to the
乗員は、センタディスプレイ2bに表示された提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択しない場合、入力装置4に対して選択結果を入力しない。そのため、操作信号入力部50には、提示行動を出力してから所定期間において、入力装置4からの操作信号が入力されない。操作信号入力部50に操作信号が入力されない場合、処理部92は、選択部94に対して1つの運転行動の選択の実行を指示する。選択部94は、処理部92からの指示を受けつけた場合、提示情報に含まれた複数種類の運転行動のうちの1つの運転行動を選択する。ここでは、例えば、最も累積値の大きい運動行動が選択される。これは、提示情報に配置された複数種類の運転行動のうち、先頭の運転行動が選択されることに相当する。このように操作信号入力部50に操作信号が入力されない場合は、「自動選択状態」と呼ばれる。
When the occupant does not select one driving action from a plurality of types of driving actions shown in the image of the presentation information displayed on the
処理部92は、自動選択状態の場合、選択した運転行動に対応した制御コマンドをコマンド出力部55経由で自動運転制御装置30に出力する。一方、処理部92は、手動選択状態の場合、操作信号で示された運転行動に対応した制御コマンドをコマンド出力部55経由で自動運転制御装置30に出力する。図1の自動運転制御装置30は、制御コマンドに対応した運転行動をもとに、車両100の自動運転を制御する。
In the automatic selection state, the
学習部74は、自動選択状態の場合、選択部94において選択した1つの運転行動に正の報酬「α」を付与する。一方、学習部74は、手動選択状態の場合、操作信号において示された1つの運転行動に正の報酬「β」を付与する。ここで、自動選択状態の場合において付与する正の報酬「α」の値よりも、手動選択状態の場合において付与される正の報酬「β」の値を大きくする。例えば、前者が「+0.5」とされ、後者が「+0.7」とされる。学習部74は、1つの運転行動に報酬を付与しながら強化学習を実行することによって運転行動モデル80を更新する。強化学習については公知の技術が使用されればよいので、ここでは説明を省略するが、報酬が反映されるように、運転行動モデル80におけるニューラルネットワークの重みが調節されることに相当する。
In the automatic selection state, the
ここで、学習部74は、手動選択状態の場合、提示情報に含まれた複数種類の運転行動のうち、操作信号において示された1つの運転行動以外の運転行動、つまり乗員によって選択されなかった運転行動に負の報酬を付与してもよい。その際、提示情報に含まれなかった運転行動に負の報酬が付与されなくてもよく、付与されてもよい。ここで、負の報酬は「−β」と示されるが、他の値であってもよい。学習部74は、負の報酬も付与しながら強化学習を実行する。一方、自動選択状態の場合、学習部74は、選択部94において選択した1つの運転行動以外の運転行動に負の報酬を付与しない。
Here, in the case of the manual selection state, the
ここでは、学習部74において付与される報酬について、図5(c)を使用しながらさらに詳細に説明する。ここでは、前提として、図5(a)に示すような提示情報の画像が表示されているとする。図5(c)のパターン「1」は、自動選択状態に相当する。乗員が運転行動を選択しなければ、選択部94は運転行動Cを選択する。その結果、学習部74は、運転行動Cに正の報酬「+α」を付与する。一方、図5(c)のパターン「2」から「4」は、手動選択状態に相当する。パターン「2」において、乗員が運転行動Cを選択した場合、学習部74は、運転行動Cに正の報酬「+β」を付与する。パターン「3」において、乗員が運転行動Eを選択した場合、学習部74は、運転行動Eに正の報酬「+β」を付与し、運転行動Cに負の報酬「−β」を付与する。パターン「4」において、乗員が運転行動Bを選択した場合、学習部74は、運転行動Bに正の報酬「+β」を付与し、運転行動C、Eに負の報酬「−β」を付与する。
Here, the reward given in the learning
以上の構成による運転支援装置40の動作を説明する。図6は、制御部41による処理手順を示すフローチャートである。推定部82は、複数の運転行動を推定する(S10)。生成部90は、累積値が大きい順に所定の運転行動を選択する(S12)。報知装置2は、提示情報を表示する(S14)。操作信号入力部50に操作信号が入力された場合(S16のY)、学習部74は、操作信号に示された運転行動に正の報酬「+β」を付与し(S18)、提示情報中の他の運転行動で操作信号に示された運転行動より累積地が大きい運転行動に負の報酬「−β」を付与する(S20)。操作信号入力部50に操作信号が入力されない場合(S16のN)、選択部94は、累積値が最大の運転行動を選択する(S22)。学習部74は、選択した運転行動に正の報酬「+α」を付与する(S24)。
The operation of the driving
本実施の形態によれば、操作信号が入力されない場合の報酬の値よりも、操作信号が入力された場合の報酬の値を大きくするので、乗員が積極的に選択したときの運転行動の信頼性を高くできる。また、乗員が積極的に選択したときの運転行動の信頼性が高くなるので、乗員の意図を反映するような運転行動を導出できる。また、乗員に選択された運転行動以外の運転行動に負の報酬を付与するので、乗員が選択しなかった運転行動の信頼度を低くできる。また、乗員に選択された1つの運転行動より信頼度が高いとシステムが推定していた運転行動に負の報酬を付与するので、システムが信頼度が高いと推定したが乗員が選択した運転行動の信頼性と、乗員が選択しなかった運転行動の信頼性との差を大きくできる。また、乗員が選択した運転行動の信頼性と、システムが信頼度が高いと推定したが乗員が選択しなかった運転行動の信頼性との差が大きくなるので、乗員の意志をさらに反映できる。 According to the present embodiment, since the reward value when the operation signal is input is larger than the reward value when the operation signal is not input, the reliability of the driving behavior when the occupant actively selects Can increase the sex. In addition, since the reliability of the driving action when the occupant actively selects, the driving action that reflects the occupant's intention can be derived. In addition, since a negative reward is given to the driving behavior other than the driving behavior selected by the occupant, the reliability of the driving behavior not selected by the occupant can be lowered. In addition, since the system gives a negative reward to the driving behavior that the system has estimated to be more reliable than the driving behavior selected by the occupant, the driving behavior selected by the occupant is estimated to be highly reliable. The difference between the reliability of the vehicle and the reliability of the driving behavior not selected by the occupant can be increased. In addition, since the difference between the reliability of the driving behavior selected by the occupant and the reliability of the driving behavior that the occupant did not select is estimated that the system is highly reliable, the will of the occupant can be further reflected.
また、提示情報に含まれた一部の運転行動のうち、選択されなかった運転行動に負の報酬を付与するので、提示情報に含まれなかった運転行動に報酬を付与しなくできる。また、提示情報に含まれなかった運転行動に報酬が付与されないので、乗員の意図と関係なく信頼性が変化することを抑制できる。また、操作信号が入力されない場合の正の報酬の値よりも、操作信号入力された場合の正の報酬の値を大きくするので、乗員の意図を反映するような運転行動を実行できる。 Moreover, since a negative reward is given to the driving action which was not selected among some driving actions contained in presentation information, it is not possible to give a reward to the driving action which was not included in presentation information. Moreover, since a reward is not given to the driving | running action which was not contained in presentation information, it can suppress that reliability changes irrespective of a passenger | crew's intent. Further, since the value of the positive reward when the operation signal is input is made larger than the value of the positive reward when the operation signal is not input, it is possible to execute a driving action that reflects the occupant's intention.
(実施の形態2)
次に、実施の形態2を説明する。実施の形態2は、実施の形態1と同様に、提示情報の画像を表示するとともに、選択された運転行動に報酬を与えながら強化学習を実行する運転支援装置に関する。実施の形態1においては、自動選択状態であるか、手動選択状態であるかに応じて報酬の値を変えて、強化学習が実行される。一方、実施の形態2は、手動運転状態である場合を説明の対象とする。前述のごとく、提示情報には、推定された複数種類の運転行動のうち、所定数の運転行動が含まれる。乗員は、提示情報に含まれた運転行動を選択可能であるが、提示情報に含まれていない運転行動を選択できない。このような運転行動の信頼度は向上しないので、当該運転行動は推定されにくくなる。つまり、乗員は、そのような運転行動を意図的に除外していなくても除外されてしまうので、乗員の意図が反映されない。実施の形態2は、乗員の意図を反映させやすくなる提示情報の生成について説明する。実施の形態2に係る車両100は図1、図2と同様のタイプであり、実施の形態2に係る制御部41は図3と同様のタイプである。
(Embodiment 2)
Next, a second embodiment will be described. As in the first embodiment, the second embodiment relates to a driving support device that displays an image of presentation information and performs reinforcement learning while rewarding a selected driving action. In the first embodiment, the reinforcement learning is executed by changing the value of the reward depending on whether the state is the automatic selection state or the manual selection state. On the other hand, in the second embodiment, the case where the vehicle is in the manual operation state will be described. As described above, the presentation information includes a predetermined number of driving actions among the estimated plural kinds of driving actions. The occupant can select a driving action included in the presentation information, but cannot select a driving action not included in the presentation information. Since the reliability of such driving behavior is not improved, the driving behavior is difficult to be estimated. In other words, since the occupant is excluded even if such driving behavior is not intentionally excluded, the intention of the occupant is not reflected.
図3の運転行動推定部70は、実施の形態1と同様に、複数種類の運転行動と、各運転行動に対応した累積値とが含まれたヒストグラムを出力する。生成部90は、ヒストグラムに含まれた複数種類の運転行動のそれぞれの累積値が大きい順に所定数の運転行動を選択する。生成部90は、選択した運転行動が示された提示情報を生成する。この提示情報は実施の形態1と同様であるが、ここでは「第1提示情報」という。第1提示情報では、例えば、「5」の運転行動のうちから、累積値が大きい方から「3」の運転行動を含む。
The driving
一方、生成部90は、所定の頻度、例えば10回に1回の割合で、第1提示情報の代わりに、第2提示情報を生成する。第2提示情報では、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、累積値の小さい運転行動が含められる。具体的に説明すると、所定数が「3」である場合、第1提示情報に含めるべき3つの運転行動は、累積値の大きさが1番目の運転行動、累積値の大きさが2番目の運動行動、累積値の大きさが3番目の運転行動である。生成部90は、これらのうちの1つの運転行動、例えば、累積値の大きさが3番目の運転行動の代わりに、累積値の大きさが4番目の運転行動、あるいは累積値の大きさが5番目の運転行動を含めるように第2提示情報を生成する。例えば、累積値の大きさが4番目の運転行動と、累積値の大きさが5番目の運転行動は、第2提示情報の生成ごとに所定の割合で交互に含められればよい。生成部90は、生成した第1提示情報、あるいは第2提示情報を処理部92に出力する。
On the other hand, the
処理部92は、図1の画像・音声出力部51に第1提示情報あるいは第2提示情報を出力し、画像・音声出力部51は、図2のヘッドアップディスプレイ2aあるいはセンタディスプレイ2bに第1提示情報あるいは第2提示情報を出力する。ヘッドアップディスプレイ2aあるいはセンタディスプレイ2bは、第1提示情報あるいは第2提示情報の画像を表示する。
The
図7(a)−(e)は、実施の形態2に係る表示制御部72の処理概要を示す。図7(a)は、センタディスプレイ2bにおいて表示される第1提示情報の画像を示す。これは、図5(a)と同一である。図7(b)は、センタディスプレイ2bにおいて表示される第2提示情報の画像を示す。第1提示情報との比較を容易にするために、この第2提示情報の画像は図4をもとに生成されている。累積値が大きい順番に、運転行動C、運転行動Eが上から下に並んで配置される。また、累積値が最も小さい運転行動Aが、最も下に配置されるとともに、最も小さい文字のサイズにされる。図7(c)−(e)の説明は後述し、図3に戻る。
FIGS. 7A to 7E show an outline of processing of the
乗員は、センタディスプレイ2bに表示された第1提示情報あるいは第2提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択しない場合、入力装置4に対して選択結果を入力しない。これが前述の自動選択状態であり、操作信号入力部50には入力装置4からの操作信号が入力されない。その場合、選択部94は、第1提示情報あるいは第2提示情報に含まれた複数種類の運転行動のうちの1つの運転行動を選択する。具体的に説明すると、選択部94は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番、例えば、画像において最も上に配置された1つの運転行動を選択する。このような選択部94の処理は実施の形態1と同様である。このような選択部94の動作を考慮すると、生成部90は、第2提示情報を生成する際、選択部94において選択される順番以外の順番に、累積値の小さい運転行動を配置させるといえる。図7(b)においては、累積値の最も小さい運転行動が最も下に配置される。
When the occupant does not select one driving action from a plurality of types of driving actions shown in the image of the first presentation information or the second presentation information displayed on the
一方、乗員は、センタディスプレイ2bに表示された第1提示情報あるいは第2提示情報の画像において示された複数種類の運転行動から1つの運転行動を選択する場合、入力装置4に対して選択結果を入力する。これが前述の手動選択状態であり、操作信号入力部50には入力装置4からの操作信号が入力される。なお、第1提示情報が表示された場合の操作信号を「第1操作信号」といい、第2提示情報が表示された場合の操作信号を「第2操作信号」ということもある。これに続いて、処理部92は、制御コマンドをコマンド出力部55を経由で自動運転制御装置30に出力するが、実施の形態1と同様であるので、ここでは説明を省略する。
On the other hand, when the occupant selects one driving action from a plurality of types of driving actions shown in the image of the first presentation information or the second presentation information displayed on the
学習部74は、自動選択状態において、第1提示情報が出力された場合であるか、あるいは第2提示情報が出力された場合であるかにかかわらず、実施の形態1と同様の処理を実行する。また、学習部74は、手動選択状態において、第1操作信号が入力された場合、乗員に選択された1つの運転行動に報酬を付与する。この報酬の付与も実施の形態1と同様であり、第1操作信号において示された1つの運転行動に正の報酬が付与される。しかしながら、学習部74は、手動選択状態において、第1提示情報に含まれた複数種類の運転行動のうち、選択されなかった運転行動に負の報酬を付与しない。
The
学習部74は、手動選択状態において、第2操作信号が入力された場合、乗員に選択された1つの運転行動に報酬を付与する。この報酬の付与も実施の形態1と同様であり、第2操作信号において示された1つの運転行動に正の報酬が付与される。一方、学習部74は、手動選択状態において、第2提示情報に含まれた複数種類の運転行動のうち、選択されなかった運転行動に負の報酬を付与する。ここで、負の報酬は「−β」と示されるが、他の値であってもよい。
When the second operation signal is input in the manual selection state, the
ここでは、学習部74において付与される報酬について、図7(c)−(d)を使用しながらさらに詳細に説明する。ここでは、手動選択状態のみを説明の対象にする。図7(c)の前提として、図7(a)に示すような第1提示情報の画像が表示されているとする。パターン「1」において、乗員が運転行動Cを選択した場合、学習部74は運転行動Cに正の報酬「+β」を付与する。パターン「2」において、乗員が運転行動Eを選択した場合、学習部74は運転行動Eに正の報酬「+β」を付与する。パターン「3」において、乗員が運転行動Bを選択した場合、学習部74は運転行動Bに正の報酬「+β」を付与する。
Here, the reward given in the learning
また、図7(d)の前提として、図7(b)に示すような第2提示情報の画像が表示されているとする。パターン「4」において、乗員が運転行動Cを選択した場合、学習部74は、運転行動Cに正の報酬「+β」を付与する。パターン「5」において、乗員が運転行動Eを選択した場合、学習部74は、運転行動Eに正の報酬「+β」を付与し、運転行動C、Aに負の報酬「−β」を付与する。パターン「6」において、乗員が運転行動Aを選択した場合、学習部74は、運転行動Aに正の報酬「+β」を付与し、運転行動C、Eに負の報酬「−β」を付与する。図3に戻る。
Further, as an assumption of FIG. 7D, it is assumed that an image of the second presentation information as shown in FIG. 7B is displayed. In the pattern “4”, when the occupant selects the driving action C, the
これまでの生成部90は、第2提示情報を生成する際、選択部94において選択される順番以外の順番に、累積値の小さい運転行動を配置させている。なお、選択部94において選択される順番の一例は、画像において最も上である。しかしながら、生成部90は、第2提示情報を生成する際、選択部94において選択される順番に、累積値の小さい運転行動を配置させてもよい。図7(e)は、このような場合にセンタディスプレイ2bにおいて表示される第2提示情報の画像を示す。これまでとの比較を容易にするために、この第2提示情報の画像は図4をもとに生成されている。累積値が最も小さい運転行動Aが最も上に配置されるとともに、最も大きい文字のサイズにされる。また、これの下に、累積値が大きい順番に、運転行動C、運転行動Eが上から下に並んで配置される。
When generating the second presentation information, the
以上の構成による運転支援装置40の動作を説明する。図8は、実施の形態2に係る制御部41による生成手順を示すフローチャートである。生成部90はi=1と設定する(S100)。i=10でなければ(S102のN)、生成部90は第1提示情報を生成する(S104)。生成部90はiをインクリメントする(S106)。i=10であれば(S102のY)、生成部90は第2提示情報を生成する(S108)。生成部90はi=1と設定する(S110)。終了でなければ(S112のN)、ステップ102に戻る。終了でなければ(S112のY)、終了する。
The operation of the driving
図9は、実施の形態3に係る制御部41による生成手順を示すフローチャートである。操作信号入力部50に第1操作信号あるいは第2操作信号が入力される(S150)。第1操作信号が入力された場合(S152のY)、学習部74は、選択された運転行動に正の報酬「+β」を付与する(S154)。第1提示情報が入力されていない場合(S152のN)、学習部74は、選択された運転行動に正の報酬「+β」を付与し(S156)、他の運転行動のうち選択された運転行動より高い信頼度でシステムが推定した運転行動に負の報酬「−β」を付与する(S158)。
FIG. 9 is a flowchart illustrating a generation procedure by the
本実施の形態によれば、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、信頼度の低い運転行動の選択機会を増加できる。また、信頼度の低い運転行動の選択機会が増加するので、当該運転行動が乗員の意図で選択されなかったか否かを区別できる。また、当該運転行動が乗員の意図で選択されなかったか否かが区別されるので、乗員の意図を認識できる。また、乗員の意図が認識されるので、乗員の意図を反映するような運転行動を導出できる。また、選択部において選択される運転行動として、信頼度の低い運転行動を配置させるので、当該運転行動を乗員が選択するか否かによって、乗員の積極的な意志を認識できる。また、選択部において選択される運転行動以外として、信頼度の低い運転行動を配置させるので、信頼度の高い運転行動を選択部に選択させることができる。また、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を実行できる。 According to the present embodiment, since the second presentation information including the driving behavior with low reliability is output at a predetermined frequency, it is possible to increase the selection opportunities for the driving behavior with low reliability. Moreover, since the selection opportunity of driving behavior with low reliability increases, it can be distinguished whether or not the driving behavior was not selected by the occupant's intention. Further, since it is distinguished whether or not the driving behavior is not selected by the occupant's intention, the occupant's intention can be recognized. In addition, since the occupant's intention is recognized, driving behavior that reflects the occupant's intention can be derived. In addition, since the driving behavior with low reliability is arranged as the driving behavior selected by the selection unit, it is possible to recognize the positive will of the occupant depending on whether the occupant selects the driving behavior. In addition, since the driving behavior with low reliability is arranged other than the driving behavior selected in the selection unit, the driving behavior with high reliability can be selected by the selection unit. In addition, since the second presentation information including the driving behavior with low reliability is output at a predetermined frequency, the driving behavior reflecting the passenger's intention can be executed.
以上、本発明に係る実施の形態について図面を参照して詳述してきたが、上述した装置や各処理部の機能は、コンピュータプログラムにより実現されうる。上述した機能をプログラムにより実現するコンピュータは、キーボードやマウス、タッチパッドなどの入力装置、ディスプレイやスピーカなどの出力装置、CPU(Central Processing Unit)、ROM、RAM、ハードディスク装置やSSD(Solid State Drive)などの記憶装置、DVD−ROM(Digital Versatile Disk Read Only Memory)やUSBメモリなどの記録媒体から情報を読み取る読取装置、ネットワークを介して通信を行うネットワークカードなどを備え、各部はバスにより接続される。 As mentioned above, although embodiment concerning this invention has been explained in full detail with reference to drawings, the function of the apparatus mentioned above and each processing part may be realized by a computer program. A computer that realizes the above-described functions by a program includes an input device such as a keyboard, mouse, and touch pad, an output device such as a display and a speaker, a CPU (Central Processing Unit), a ROM, a RAM, a hard disk device, and an SSD (Solid State Drive). Storage device such as a DVD-ROM (Digital Versatile Disk Read Only Memory), a reading device that reads information from a recording medium such as a USB memory, a network card that communicates via a network, etc., and each part is connected by a bus .
また、読取装置は、上記プログラムを記録した記録媒体からそのプログラムを読み取り、記憶装置に記憶させる。あるいは、ネットワークカードが、ネットワークに接続されたサーバ装置と通信を行い、サーバ装置からダウンロードした上記各装置の機能を実現するためのプログラムを記憶装置に記憶させる。また、CPUが、記憶装置に記憶されたプログラムをRAMにコピーし、そのプログラムに含まれる命令をRAMから順次読み出して実行することにより、上記各装置の機能が実現される。 The reading device reads the program from the recording medium on which the program is recorded, and stores the program in the storage device. Or a network card communicates with the server apparatus connected to the network, and memorize | stores the program for implement | achieving the function of said each apparatus downloaded from the server apparatus in a memory | storage device. Further, the function of each device is realized by the CPU copying the program stored in the storage device to the RAM and sequentially reading out and executing the instructions included in the program from the RAM.
本発明の一態様の概要は、次の通りである。
(項目1−1)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする運転支援装置。
The outline of one embodiment of the present invention is as follows.
(Item 1-1)
A generation unit that generates presentation information indicating a plurality of types of driving behavior, which is an estimation result using the driving behavior model;
A presentation information output unit that outputs the presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives an operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device;
When an operation signal is not input to the operation signal input unit, a selection unit that selects one driving action among a plurality of types of driving actions;
When an operation signal is input to the operation signal input unit, the driving behavior model is updated by performing learning while weighting one driving behavior indicated in the operation signal, and the operation signal input unit A learning unit that updates a driving behavior model by performing learning while weighting one driving behavior selected in the selection unit when an operation signal is not input;
The learning unit increases a weighting value when an operation signal is input to the operation signal input unit, than a weighting value when an operation signal is not input to the operation signal input unit. Driving assistance device.
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を導出できる。 According to this aspect, since the weighting value when the operation signal is input is made larger than the weighting value when the operation signal is not input, it is possible to derive driving behavior that reflects the occupant's intention.
(項目1−2)
前記学習部は、前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動以外の運転行動に負の重み付けを実行しながら学習を実行することを特徴とする項目1−1に記載の運転支援装置。
この場合、乗員に選択された1つの運転行動以外の運転行動に負の重み付けを実行するので、乗員が選択しなかった運転行動の信頼度を低くできる。
(Item 1-2)
When the operation signal is input to the operation signal input unit, the learning unit performs learning while performing negative weighting on a driving action other than one driving action indicated in the operation signal. The driving support device according to item 1-1.
In this case, since negative weighting is performed on driving actions other than one driving action selected by the occupant, the reliability of driving actions not selected by the occupant can be reduced.
(項目1−3)
前記生成部は、複数種類の運転行動のうち、一部の運転行動が示された提示情報を生成し、
前記学習部は、前記操作信号入力部に操作信号が入力された場合、前記生成部において生成した提示情報に含まれた一部の運転行動のうち、当該操作信号において示された1つの運転行動以外の運転行動に負の重み付けを実行することを特徴とする項目1−2に記載の運転支援装置。
この場合、提示情報に含まれた一部の運転行動のうち、選択されなかった運転行動に負の重み付けを実行するので、乗員が選択しなかった運転行動の信頼度を低くできる。
(Item 1-3)
The generation unit generates presentation information indicating some driving behaviors among a plurality of types of driving behaviors,
The learning unit, when an operation signal is input to the operation signal input unit, out of a part of driving behavior included in the presentation information generated in the generation unit, one driving behavior indicated in the operation signal The driving support device according to item 1-2, wherein negative weighting is performed on driving behavior other than the above.
In this case, since the negative weighting is performed on the driving behavior that has not been selected among some of the driving behaviors included in the presentation information, the reliability of the driving behavior not selected by the occupant can be reduced.
(項目1−4)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動をもとに車両の自動運転を制御し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動をもとに車両の自動運転を制御する自動運転制御部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする自動運転制御装置。
(Item 1-4)
A generation unit that generates presentation information indicating a plurality of types of driving behavior, which is an estimation result using the driving behavior model;
A presentation information output unit that outputs the presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives an operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device;
When an operation signal is not input to the operation signal input unit, a selection unit that selects one driving action among a plurality of types of driving actions;
When an operation signal is input to the operation signal input unit, automatic driving of the vehicle is controlled based on one driving action indicated in the operation signal, and no operation signal is input to the operation signal input unit An automatic driving control unit that controls automatic driving of the vehicle based on one driving action selected by the selection unit;
When an operation signal is input to the operation signal input unit, the driving behavior model is updated by performing learning while weighting one driving behavior indicated in the operation signal, and the operation signal input unit A learning unit that updates a driving behavior model by performing learning while weighting one driving behavior selected in the selection unit when an operation signal is not input;
The learning unit increases a weighting value when an operation signal is input to the operation signal input unit, than a weighting value when an operation signal is not input to the operation signal input unit. Automatic operation control device.
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を実行できる。 According to this aspect, since the weighting value when the operation signal is input is made larger than the weighting value when the operation signal is not input, it is possible to execute the driving action that reflects the occupant's intention.
(項目1−5)
運転支援装置を備える車両であって、
前記運転支援装置は、
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、
前記生成部において生成した提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする車両。
(Item 1-5)
A vehicle equipped with a driving support device,
The driving support device includes:
A generation unit that generates presentation information indicating a plurality of types of driving behavior, which is an estimation result using the driving behavior model;
A presentation information output unit that outputs the presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives an operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device;
When an operation signal is not input to the operation signal input unit, a selection unit that selects one driving action among a plurality of types of driving actions;
When an operation signal is input to the operation signal input unit, the driving behavior model is updated by performing learning while weighting one driving behavior indicated in the operation signal, and the operation signal input unit A learning unit that updates a driving behavior model by performing learning while weighting one driving behavior selected in the selection unit when an operation signal is not input;
The learning unit increases a weighting value when an operation signal is input to the operation signal input unit, than a weighting value when an operation signal is not input to the operation signal input unit. Vehicle.
この態様によると、操作信号が入力されない場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくするので、乗員の意図を反映するような運転行動を導出できる。 According to this aspect, since the weighting value when the operation signal is input is made larger than the weighting value when the operation signal is not input, it is possible to derive driving behavior that reflects the occupant's intention.
(項目1−6)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成するステップと、
生成した提示情報を報知装置に出力するステップと、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力されるステップと、
操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択するステップと、
操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
操作信号が未入力である場合、前記選択するステップにおいて選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとを備え、
操作信号が未入力である場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくすることを特徴とする運転支援方法。
(Item 1-6)
Generating presentation information indicating a plurality of types of driving behavior that is an estimation result using the driving behavior model;
Outputting the generated presentation information to a notification device;
An operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device; and
When an operation signal is not input, a step of selecting one driving action among a plurality of types of driving actions;
When an operation signal is input, updating the driving behavior model by performing learning while weighting one driving behavior indicated in the operation signal; and
A step of updating the driving behavior model by performing learning while weighting the one driving behavior selected in the selecting step when the operation signal is not inputted,
A driving support method, wherein a weighting value when an operation signal is input is made larger than a weighting value when an operation signal is not input.
(項目1−7)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成するステップと、
生成した提示情報を報知装置に出力するステップと、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力されるステップと、
操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択するステップと、
操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
操作信号が未入力である場合、前記選択するステップにおいて選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとを備え、
操作信号が未入力である場合の重み付けの値よりも、操作信号が入力された場合の重み付けの値を大きくすることをコンピュータに実行させるためのプログラム。
(Item 1-7)
Generating presentation information indicating a plurality of types of driving behavior that is an estimation result using the driving behavior model;
Outputting the generated presentation information to a notification device;
An operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device; and
When an operation signal is not input, a step of selecting one driving action among a plurality of types of driving actions;
When an operation signal is input, updating the driving behavior model by performing learning while weighting one driving behavior indicated in the operation signal; and
A step of updating the driving behavior model by performing learning while weighting the one driving behavior selected in the selecting step when the operation signal is not inputted,
A program for causing a computer to execute a weighting value when an operation signal is input larger than a weighting value when an operation signal is not input.
(項目1−8)
運転行動モデルを用いた推定結果である複数種類の運転行動が示された提示情報を生成する生成部と、前記生成部において生成した提示情報を出力する提示情報出力部とを備える運転支援装置と、
前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
前記運転支援装置は、
前記報知装置から報知された提示情報に対して乗員が選択した1つの運転行動を示す操作信号が入力される操作信号入力部と、
前記操作信号入力部に操作信号が未入力である場合、複数種類の運転行動のうちの1つの運転行動を選択する選択部と、
前記操作信号入力部に操作信号が入力された場合、当該操作信号において示された1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新し、前記操作信号入力部に操作信号が未入力である場合、前記選択部において選択した1つの運転行動に重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
前記学習部は、前記操作信号入力部に操作信号が未入力である場合の重み付けの値よりも、前記操作信号入力部に操作信号が入力された場合の重み付けの値を大きくすることを特徴とする提示システム。
(Item 1-8)
A driving support apparatus comprising: a generation unit that generates presentation information indicating a plurality of types of driving behaviors that are estimation results using a driving behavior model; and a presentation information output unit that outputs the presentation information generated in the generation unit; ,
A notification device that notifies the presentation information output from the driving support device;
The driving support device includes:
An operation signal input unit that receives an operation signal indicating one driving action selected by the occupant with respect to the presentation information notified from the notification device;
When an operation signal is not input to the operation signal input unit, a selection unit that selects one driving action among a plurality of types of driving actions;
When an operation signal is input to the operation signal input unit, the driving behavior model is updated by performing learning while weighting one driving behavior indicated in the operation signal, and the operation signal input unit A learning unit that updates the driving behavior model by performing learning while weighting one driving behavior selected by the selection unit when the operation signal is not input;
The learning unit increases a weighting value when an operation signal is input to the operation signal input unit, than a weighting value when an operation signal is not input to the operation signal input unit. To present system.
(項目2−1)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする運転支援装置。
(Item 2-1)
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A driving support apparatus that updates a driving behavior model by performing learning while performing weighting.
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を導出できる。 According to this aspect, since the second presentation information including the driving behavior with low reliability is output at a predetermined frequency, it is possible to derive the driving behavior reflecting the passenger's intention.
(項目2−2)
前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番に、信頼度の低い運転行動を配置させることを特徴とする項目2−1に記載の運転支援装置。
この場合、選択部において選択される運転行動として、信頼度の低い運転行動を配置させるので、乗員の積極的な意志を認識できる。
(Item 2-2)
When the first operation signal is not input to the operation signal input unit, one driving action included in the first presentation information is selected, and when the second operation signal is not input to the operation signal input unit, A selection unit for selecting one driving action included in the second presentation information;
The selection unit selects one driving action arranged in a predetermined order from among a predetermined number of driving actions included in the first presentation information or the second presentation information,
The driving support device according to Item 2-1, wherein the generation unit arranges driving actions with low reliability in the predetermined order when generating the second presentation information.
In this case, since the driving behavior with low reliability is arranged as the driving behavior selected by the selection unit, it is possible to recognize the positive will of the occupant.
(項目2−3)
前記操作信号入力部に第1操作信号が未入力である場合、第1提示情報に含まれた1つの運転行動を選択し、前記操作信号入力部に第2操作信号が未入力である場合、第2提示情報に含まれた1つの運転行動を選択する選択部をさらに備え、
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番以外の順番に、信頼度の低い運転行動を配置させることを特徴とする項目2−1に記載の運転支援装置。
この場合、選択部において選択される運転行動以外として、信頼度の低い運転行動を配置させるので、信頼度の高い運転行動を選択部に選択させることができる。
(Item 2-3)
When the first operation signal is not input to the operation signal input unit, one driving action included in the first presentation information is selected, and when the second operation signal is not input to the operation signal input unit, A selection unit for selecting one driving action included in the second presentation information;
The selection unit selects one driving action arranged in a predetermined order from among a predetermined number of driving actions included in the first presentation information or the second presentation information,
The driving support device according to Item 2-1, wherein the generating unit arranges driving behaviors with low reliability in an order other than the predetermined order when generating the second presentation information.
In this case, since the driving behavior with low reliability is arranged in addition to the driving behavior selected by the selection unit, the driving behavior with high reliability can be selected by the selection unit.
(項目2−4)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、
1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする自動運転制御装置。
(Item 2-4)
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
With an automatic driving control unit that controls the automatic driving of the vehicle based on one driving action,
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. An automatic driving control device that updates a driving behavior model by performing learning while executing weighting.
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を実行できる。 According to this aspect, since the second presentation information including the driving action with low reliability is output at a predetermined frequency, the driving action reflecting the passenger's intention can be executed.
(項目2−5)
運転支援装置を備える車両であって、
前記運転支援装置は、
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする車両。
(Item 2-5)
A vehicle equipped with a driving support device,
The driving support device includes:
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A vehicle that updates a driving behavior model by performing learning while performing weighting.
この態様によると、信頼度の低い運転行動を含めた第2提示情報を所定の頻度で出力するので、乗員の意図を反映するような運転行動を導出できる。 According to this aspect, since the second presentation information including the driving behavior with low reliability is output at a predetermined frequency, it is possible to derive the driving behavior reflecting the passenger's intention.
(項目2−6)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
を備えることを特徴とする運転支援方法。
(Item 2-6)
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated And steps to
Outputting the generated first presentation information to a notification device;
A step of inputting a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
Updating the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the input first operation signal;
Generating a second presentation information including a driving action with low reliability instead of a part of the predetermined number of driving actions to be included in the first presentation information at a predetermined frequency instead of the first presentation information;
Outputting the generated second presentation information to the notification device;
A step of inputting a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device;
By performing positive weighting on one driving action indicated in the input second operation signal and performing learning while performing negative weighting on other driving actions included in the second presentation information Updating the driving behavior model;
A driving support method comprising:
(項目2−7)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成するステップと、
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとをコンピュータに実行させるためのプログラム。
(Item 2-7)
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated And steps to
Outputting the generated first presentation information to a notification device;
A step of inputting a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
Updating the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the input first operation signal;
Generating a second presentation information including a driving action with low reliability instead of a part of the predetermined number of driving actions to be included in the first presentation information at a predetermined frequency instead of the first presentation information;
Outputting the generated second presentation information to the notification device;
A step of inputting a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device;
By performing positive weighting on one driving action indicated in the input second operation signal and performing learning while performing negative weighting on other driving actions included in the second presentation information A program for causing a computer to execute the step of updating the driving behavior model.
(項目2−8)
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、前記生成部において生成した第1提示情報を出力する提示情報出力部とを備える運転支援装置と、
前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
前記運転支援装置は、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする提示システム。
(Item 2-8)
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A driving support device comprising: a generating unit that performs the presenting information output unit that outputs the first presentation information generated in the generating unit;
A notification device that notifies the presentation information output from the driving support device;
The driving support device includes:
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A presentation system that updates a driving behavior model by performing learning while performing weighting.
以上、本発明を実施の形態をもとに説明した。これらの実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described based on the embodiments. It is understood by those skilled in the art that these embodiments are exemplifications, and that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are also within the scope of the present invention. By the way.
実施の形態1、2において、運転行動推定部70は運転支援装置40の制御部41に含まれる。しかしながらこれに限らず例えば、運転行動推定部70は、自動運転制御装置30の制御部31に含まれてもよい。本変形例によれば、構成の自由度を向上できる。
In the first and second embodiments, the driving
実施の形態1、2において、運転行動モデル80は、運転行動学習部310において生成され、運転行動推定部70に送信されている。しかしながらこれに限らず例えば、運転行動モデル80は運転行動推定部70にプリインストールされていてもよい。本変形例によれば、構成を簡易にできる。
In the first and second embodiments, the driving
実施の形態1、2において、運転行動学習部310は、運転支援装置40に含まれてもよい。
In the first and second embodiments, the driving
実施の形態1、2において、運転行動推定部70は、推定として、ニューラルネットワークを使用する深層学習により生成した運転行動モデルを用いている。しかしながらこれに限らず例えば、運転行動推定部70は、深層学習以外の機械学習を用いた運転行動モデルを用いてもよい。深層学習以外の機械学習の一例は、SVMである。さらに、運転行動推定部70は、統計処理により生成したフィルタを用いてもよい。フィルタの一例は、協調フィルタリングである。協調フィルタリングでは、各運転行動に対応した運転履歴あるいは走行履歴と、テストデータとの相関値を算出することによって、相関値の高い運転行動が選択される。相関値によって確からしさが示されているので、相関値は尤度ともいえ、信頼度に相当する。学習部74は、信頼度として相関値に対する報酬を付与する。本変形例によれば、構成の自由度を向上できる。
In the first and second embodiments, the driving
実施の形態1において、学習部74は、手動選択状態である場合、選択されなかった運転行動に対して負の報酬を付与している。しかしながらこれに限らず例えば、学習部74は、手動選択状態である場合、選択されなかった運転行動に対して負の報酬を付与しなくてもよい。本変形例によれば、選択された運転行動の信頼度と、選択されなかった運転行動の信頼度との差の増大を抑制できる。
In the first embodiment, the
実施の形態1、2の組合せも有効である。本変形例によれば、実施の形態1、2の組合せによる効果を得ることができる。 The combination of the first and second embodiments is also effective. According to this modification, the effect of the combination of the first and second embodiments can be obtained.
2 報知装置、 2a ヘッドアップディスプレイ、 2b センタディスプレイ、 4 入力装置、 4a 第1操作部、 4b 第2操作部、 4c 第3操作部、 6 スピーカ、 8 無線装置、 10 運転操作部、 11 ステアリング、 12 ブレーキペダル、 13 アクセルペダル、 14 ウィンカスイッチ、 20 検出部、 21 位置情報取得部、 22 センサ、 23 速度情報取得部、 24 地図情報取得部、 30 自動運転制御装置、 31 制御部、 32 記憶部、 33 I/O部、 40 運転支援装置、 41 制御部、 42 記憶部、 43 I/O部、 50 操作信号入力部、 51 画像・音声出力部、 52 検出情報入力部、 53 コマンドIF、 54 行動情報入力部、 55 コマンド出力部、 56 通信IF、 70 運転行動推定部、 72 表示制御部、 74 学習部、 80 運転行動モデル、 82 推定部、 84 ヒストグラム生成部、 90 生成部、 92 処理部、 94 選択部、 100 車両、 300 サーバ、 302 ネットワーク、 310 運転行動学習部、 500 運転支援システム。
2 Informing device, 2a Head-up display, 2b Center display, 4 Input device, 4a 1st operation part, 4b 2nd operation part, 4c 3rd operation part, 6 Speaker, 8 Radio | wireless apparatus, 10 Driving operation part, 11 Steering, 12 brake pedal, 13 accelerator pedal, 14 blinker switch, 20 detection unit, 21 position information acquisition unit, 22 sensor, 23 speed information acquisition unit, 24 map information acquisition unit, 30 automatic operation control device, 31 control unit, 32 storage unit , 33 I / O unit, 40 driving support device, 41 control unit, 42 storage unit, 43 I / O unit, 50 operation signal input unit, 51 image / sound output unit, 52 detection information input unit, 53 command IF, 54 Action information input part, 55 Command output part, 56 Communication I 70 driving behavior estimation unit, 72 display control unit, 74 learning unit, 80 driving behavior model, 82 estimation unit, 84 histogram generation unit, 90 generation unit, 92 processing unit, 94 selection unit, 100 vehicle, 300 server, 302
Claims (8)
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする運転支援装置。 A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A driving support apparatus that updates a driving behavior model by performing learning while performing weighting.
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番に、信頼度の低い運転行動を配置させることを特徴とする請求項1に記載の運転支援装置。 When the first operation signal is not input to the operation signal input unit, one driving action included in the first presentation information is selected, and when the second operation signal is not input to the operation signal input unit, A selection unit for selecting one driving action included in the second presentation information;
The selection unit selects one driving action arranged in a predetermined order from among a predetermined number of driving actions included in the first presentation information or the second presentation information,
The driving support device according to claim 1, wherein when generating the second presentation information, the generating unit arranges driving behaviors with low reliability in the predetermined order.
前記選択部は、第1提示情報あるいは第2提示情報に含まれた所定数の運転行動のうち、予め定められた順番に配置された1つの運転行動を選択し、
前記生成部は、第2提示情報を生成する際、前記予め定められた順番以外の順番に、信頼度の低い運転行動を配置させることを特徴とする請求項1に記載の運転支援装置。 When the first operation signal is not input to the operation signal input unit, one driving action included in the first presentation information is selected, and when the second operation signal is not input to the operation signal input unit, A selection unit for selecting one driving action included in the second presentation information;
The selection unit selects one driving action arranged in a predetermined order from among a predetermined number of driving actions included in the first presentation information or the second presentation information,
The driving support device according to claim 1, wherein when generating the second presentation information, the generation unit arranges driving behaviors with low reliability in an order other than the predetermined order.
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部と、
1つの運転行動をもとに、車両の自動運転を制御する自動運転制御部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする自動運転制御装置。 A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
With an automatic driving control unit that controls the automatic driving of the vehicle based on one driving action,
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. An automatic driving control device that updates a driving behavior model by performing learning while executing weighting.
前記運転支援装置は、
運転行動モデルを用いた推定結果である複数種類の運転行動のそれぞれの信頼度が高い順に所定数の運転行動を選択するとともに、選択した所定数の運転行動が示された第1提示情報を生成する生成部と、
前記生成部において生成した第1提示情報を報知装置に出力する提示情報出力部と、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とを備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする車両。 A vehicle equipped with a driving support device,
The driving support device includes:
A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A generator to
A presentation information output unit that outputs the first presentation information generated in the generation unit to a notification device;
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates a driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A vehicle that updates a driving behavior model by performing learning while performing weighting.
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
を備えることを特徴とする運転支援方法。 A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated And steps to
Outputting the generated first presentation information to a notification device;
A step of inputting a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
Updating the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the input first operation signal;
Generating a second presentation information including a driving action with low reliability instead of a part of the predetermined number of driving actions to be included in the first presentation information at a predetermined frequency instead of the first presentation information;
Outputting the generated second presentation information to the notification device;
A step of inputting a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device;
By performing positive weighting on one driving action indicated in the input second operation signal and performing learning while performing negative weighting on other driving actions included in the second presentation information Updating the driving behavior model;
A driving support method comprising:
生成した第1提示情報を報知装置に出力するステップと、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力されるステップと、
入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップと、
第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成するステップと、
生成した第2提示情報を前記報知装置に出力するステップと、
前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力されるステップと、
入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新するステップとをコンピュータに実行させるためのプログラム。 A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated And steps to
Outputting the generated first presentation information to a notification device;
A step of inputting a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
Updating the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the input first operation signal;
Generating a second presentation information including a driving action with low reliability instead of a part of the predetermined number of driving actions to be included in the first presentation information at a predetermined frequency instead of the first presentation information;
Outputting the generated second presentation information to the notification device;
A step of inputting a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device;
By performing positive weighting on one driving action indicated in the input second operation signal and performing learning while performing negative weighting on other driving actions included in the second presentation information A program for causing a computer to execute the step of updating the driving behavior model.
前記運転支援装置から出力された提示情報を報知する報知装置とを備え、
前記運転支援装置は、
前記報知装置から報知された第1提示情報に対して乗員が選択した1つの運転行動を示す第1操作信号が入力される操作信号入力部と、
前記操作信号入力部に入力された第1操作信号において示された1つの運転行動に正の重み付けを実行しながら学習を実行することによって運転行動モデルを更新する学習部とをさらに備え、
前記生成部は、第1提示情報に含めるべき所定数の運転行動の一部の代わりに、信頼度の低い運転行動を含めた第2提示情報を、所定の頻度で第1提示情報の代わりに生成し、
前記提示情報出力部は、前記生成部において生成した第2提示情報を前記報知装置に出力し、
前記操作信号入力部には、前記報知装置から報知された第2提示情報に対して乗員が選択した1つの運転行動を示す第2操作信号が入力され、
前記学習部は、前記操作信号入力部に入力された第2操作信号において示された1つの運転行動に正の重み付けを実行するとともに、第2提示情報に含まれた他の運転行動に負の重み付けを実行しながら学習を実行することによって運転行動モデルを更新することを特徴とする提示システム。 A predetermined number of driving actions are selected in descending order of the reliability of each of a plurality of types of driving actions, which are estimation results using the driving action model, and first presentation information indicating the selected predetermined number of driving actions is generated A driving support device comprising: a generating unit that performs the presenting information output unit that outputs the first presentation information generated in the generating unit;
A notification device that notifies the presentation information output from the driving support device;
The driving support device includes:
An operation signal input unit that receives a first operation signal indicating one driving action selected by the occupant with respect to the first presentation information notified from the notification device;
A learning unit that updates the driving behavior model by performing learning while performing positive weighting on one driving behavior indicated in the first operation signal input to the operation signal input unit;
The generating unit, instead of a part of the predetermined number of driving actions to be included in the first presentation information, substitutes the second presentation information including driving actions with low reliability in place of the first presentation information at a predetermined frequency. Generate and
The presentation information output unit outputs the second presentation information generated by the generation unit to the notification device,
The operation signal input unit receives a second operation signal indicating one driving action selected by the occupant with respect to the second presentation information notified from the notification device,
The learning unit performs positive weighting on one driving action indicated in the second operation signal input to the operation signal input unit, and is negative with respect to other driving actions included in the second presentation information. A presentation system that updates a driving behavior model by performing learning while performing weighting.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017063659A JP2018165693A (en) | 2017-03-28 | 2017-03-28 | Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017063659A JP2018165693A (en) | 2017-03-28 | 2017-03-28 | Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018165693A true JP2018165693A (en) | 2018-10-25 |
Family
ID=63922862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017063659A Pending JP2018165693A (en) | 2017-03-28 | 2017-03-28 | Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018165693A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020235061A1 (en) * | 2019-05-22 | 2020-11-26 | 日本電気株式会社 | Operation rule determination device, operation rule determination method, and recording medium |
-
2017
- 2017-03-28 JP JP2017063659A patent/JP2018165693A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020235061A1 (en) * | 2019-05-22 | 2020-11-26 | 日本電気株式会社 | Operation rule determination device, operation rule determination method, and recording medium |
JPWO2020235061A1 (en) * | 2019-05-22 | 2020-11-26 | ||
JP7173317B2 (en) | 2019-05-22 | 2022-11-16 | 日本電気株式会社 | Operation rule determination device, operation rule determination method and program |
US12093001B2 (en) | 2019-05-22 | 2024-09-17 | Nec Corporation | Operation rule determination device, method, and recording medium using frequency of a cumulative reward calculated for series of operations |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108885836B (en) | Driving assistance device, driving assistance system, driving assistance method, control device, vehicle, and medium | |
US11072343B2 (en) | Driving assistance method, and driving assistance device, driving control device, vehicle, driving assistance program, and recording medium using said method | |
US11685390B2 (en) | Assistance method and assistance system and assistance device using assistance method that execute processing relating to a behavior model | |
US9828001B2 (en) | Confidence icons for apprising a driver of confidence in an autonomous operation of a vehicle | |
JP2019510677A (en) | Control data creation method for driver's rule-based assistance | |
KR20180063069A (en) | Operation control device, operation control method, and program | |
US10583841B2 (en) | Driving support method, data processor using the same, and driving support system using the same | |
WO2016170764A1 (en) | Driving assistance method and driving assistance device, driving control device, vehicle, and driving assistance program using such method | |
WO2018008488A1 (en) | Driving assistance method and driving assistance device using same, driving assistance system, automatic driving control device, vehicle, and program | |
JP2018165692A (en) | Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system | |
WO2024158465A1 (en) | Alert modality selection for alerting a driver | |
JP2018165693A (en) | Driving support method and driving support device using the same, automatic driving control device, vehicle, program, and presentation system | |
JP2018165086A (en) | Driving support method, driving support device using the same, automated driving control device, vehicle, program, and driving support system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180417 |