JP6477551B2 - 情報提供装置及び情報提供プログラム - Google Patents
情報提供装置及び情報提供プログラム Download PDFInfo
- Publication number
- JP6477551B2 JP6477551B2 JP2016048580A JP2016048580A JP6477551B2 JP 6477551 B2 JP6477551 B2 JP 6477551B2 JP 2016048580 A JP2016048580 A JP 2016048580A JP 2016048580 A JP2016048580 A JP 2016048580A JP 6477551 B2 JP6477551 B2 JP 6477551B2
- Authority
- JP
- Japan
- Prior art keywords
- state
- action
- vehicle
- space
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009471 action Effects 0.000 claims description 265
- 230000006870 function Effects 0.000 claims description 118
- 230000002787 reinforcement Effects 0.000 claims description 76
- 238000009826 distribution Methods 0.000 claims description 56
- 230000004044 response Effects 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 description 95
- 230000007704 transition Effects 0.000 description 35
- 239000011159 matrix material Substances 0.000 description 26
- 230000006399 behavior Effects 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 21
- 230000001186 cumulative effect Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000003860 storage Methods 0.000 description 10
- 238000005315 distribution function Methods 0.000 description 8
- 239000006185 dispersion Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 239000004744 fabric Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 206010041349 Somnolence Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/08—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
- B60W40/09—Driving style or behaviour
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
- B60W50/10—Interpretation of driver requests or demands
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Automation & Control Theory (AREA)
- Mechanical Engineering (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Transportation (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Manipulator (AREA)
Description
上記課題を解決する情報提供装置は、複数の種類の車両データを関連付けすることにより車両の状態を定義して複数の状態の集合である状態空間を構成する状態空間構成部と、車載機器の操作提案に対する運転者からの応答により実行される車載機器の操作内容を示すデータを行動として定義して複数の行動の集合である行動空間を構成する行動空間構成部と、前記車載機器の操作提案に対する運転者からの応答の履歴を蓄積し、該蓄積された履歴を用いつつ前記車載機器の操作提案の適正度合いを表す指標として報酬関数を設定するとともに、当該報酬関数に基づく強化学習により前記状態空間を構成する各状態において前記行動空間を構成する各行動が実行される確率分布を算出する強化学習部と、前記強化学習部により算出される確率分布のばらつき度合いを演算するばらつき度合い演算部と、前記ばらつき度合い演算部により演算される確率分布のばらつき度合いが小さいほど車両の状態に応じた最も前記適正度合いの高い操作提案を行う頻度を高め、前記ばらつき度合い演算部により演算される確率分布のばらつき度合いが大きいほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める情報提供部とを備える。
以下、情報提供装置の第1の実施の形態について説明する。
本実施の形態の情報提供装置は、車両に搭載されて運転者に対する情報提供として車載機器の操作提案を行うエージェントECU(電子制御装置)により構成されている。ここで、エージェントECUの機能は、学習系、情報取得系、ユーザインターフェイス系に大別される。そして、エージェントECUは、情報取得系を通じて取得した各種の情報に基づき車載機器の操作履歴をその都度の車両の状態ごとに分類しつつ学習系において学習の一形態として強化学習を実行するとともに、当該強化学習による学習結果に基づきユーザインターフェース系を通じた車載機器の操作提案を実行する。ここで、強化学習とは、エージェントECUが環境に基づきある行動を選択したとき、当該選択した行動に基づく環境の変化に伴って何らかの報酬をエージェントECUに与えることにより、試行錯誤を通じてエージェントECUを環境に適応させていく学習手法である。なお、本実施の形態では、エージェントECUは、例えば車載機器の操作状況、車両の乗員の特性、車両の走行状況等、各種の車両データを互いに関連付けすることにより状態を定義して複数の状態の集合である状態空間を構成している。また、エージェントECUは、操作提案に対する運転者からの応答に伴ってエージェントECUが代行する可能性のある車載機器の操作の種類を行動として定義して複数の行動の集合である行動空間を構成している。そして、状態空間を構成する各状態において車載機器の操作提案に対する応答として実行された車載機器の操作履歴が強化学習でいうところの報酬に相当する。また、エージェントECUは、上述した強化学習を実行することにより、状態空間を構成する各状態において行動空間を構成する各行動が実行される確率分布を算出する。また、エージェントECUは、こうして算出した確率分布に基づき、その都度の車両の状態から運転者がとる可能性の高い行動を予測し、その予測結果を加味したかたちで車載機器の操作提案を実行する。
図1に示すように、エージェントECU100は、車載機器の操作提案を制御する制御部110と、制御部110が車載機器の操作提案の際に実行する情報提供プログラムや当該情報提供プログラムの実行の際に制御部110が読み書きする各種のデータを格納する記憶部120とを有している。ここで、記憶部120に格納される各種のデータとしては、状態空間を定義した状態空間テーブルT1,T1α、行動空間を定義した行動空間テーブルT2,T2α、及び車載機器の操作履歴RAが含まれる。なお、本実施の形態では、例えば音声の再生、目的地の設定、空調の設定、シートポジションの設定、ミラーの設定、ワイパーの設定等、操作提案の対象となるサービスの種類が複数用意されている。そして、これらサービスの種類ごとに個別の状態空間テーブルT1,T1α及び行動空間テーブルT2,T2αがエージェントECU100の記憶部120に格納されている。
(A1)エンジン、ブレーキ、ステアリング等を制御する車両駆動系の車載ECU
(A2)エアコン、メータ等を制御するボディ系の車載ECU
(A3)カーナビゲーションシステム、オーディオシステム等を制御する情報系の車載ECU
(B1)GPS(グローバル・ポジショニング・システム)センサ
(B2)レーザレーダ
(B3)赤外線センサ
(B4)超音波センサ
(B5)雨滴センサ
(B6)外気温センサ
(B7)車室内温度センサ
(B8)着座センサ
(B9)シートベルト着用状態センサ
(B10)車室内カメラ
(B11)スマートキーセンサ(登録商標:スマートキー)
(B12)侵入監視センサ
(B13)花粉等微粒子センサ
(B14)加速度センサ
(B15)電界強度センサ
(B16)ドライバモニタ
(B17)車速センサ
(B18)操舵角センサ
(B19)ヨーレートセンサ
(B20)生体センサ
(C1)ウインカーレバースイッチ
(C2)ワイパー操作スイッチ
(C3)ライト操作スイッチ
(C4)ステアリングスイッチ
(C5)ナビ・オーディオ操作スイッチ
(C6)窓操作スイッチ
(C7)ドア・トランク開閉・ロックスイッチ
(C8)エアコン操作スイッチ
(C9)シートヒータ・ベンチレーションスイッチ
(C10)シートポジション調整・プリセットメモリスイッチ
(C11)侵入監視システムスイッチ
(C12)ミラー操作スイッチ
(C13)ACC(アダプティブ・クルーズ・コントロール)スイッチ
(C14)エンジンスイッチ
(ステップ1)状態空間を構成する各状態から行動空間を構成する各行動の写像を方策πとするとき、任意の方策πを初期設定する。
(ステップ2)現在の状態stを観測する(tは時間ステップ)。
(ステップ3)任意の行動選択方法により行動atを実行する(tは時間ステップ)。
(ステップ4)報酬rtを受け取る(tは時間ステップ)。
(ステップ5)状態遷移後の状態s(t+1)を観測する(ただし、状態s(t+1)への遷移がそのときの状態stと行動atにのみ依存し、それ以前の状態や行動に影響を受けないことが前提(いわゆる、マルコフ性))。
(ステップ6)行動価値関数Q(st,at)を更新する。
(ステップ7)時間ステップtを(t+1)へ進めて(ステップ1)に戻る。
車載機器の操作提案を実行する際、その都度の車両の状態に応じて運転者が取り得る行動を先回りして予測することの困難さは対象となる操作提案の種類によって異なるのが普通である。例えばラジオの再生や楽曲の再生等、車両の走行時における音声の再生は、一般に車両の状態だけでなくそのときの運転者の気分等によっても影響を受けやすくその選択肢も多岐に亘る。そのため、運転者が取り得る行動を先回りして予測することは困難となることが予想される。その一方で、例えば目的地の設定等は、一般に音声の再生と比較すればその都度の車両の状態から選択肢も絞りやすく運転者が取り得る行動を先回りして予測することは容易となることが予想される。
(1)エージェントECU100は、強化学習により算出した遷移確率行列P(st,at)における各状態ごとの情報エントロピーH(s)の合算値から求めた平均エントロピーH(Ω)が乱数δ未満であるときには、対象となる行動を操作提案の対象として固定して出力する確定的な操作提案を行う。これにより、運転者に行動を選択する手間をかけることなく、運転者の意図に即した車載機器の操作提案が行われる。一方、エージェントECU100は、強化学習により算出した遷移確率行列P(st,at)における各状態ごとの情報エントロピーH(s)の合算値から求めた平均エントロピーH(Ω)が乱数δ以上であるときには、複数の候補の中から対象となる行動を操作提案の対象として選択して出力する試行錯誤的な操作提案を行う。これにより、運転者の意図に即した車載機器の操作提案がより的確に行われる。すなわち、平均エントロピーH(Ω)が大きい場合であれ、小さい場合であれ、操作提案の対象として一度に出力される車載機器の操作内容は一つのみであるため、運転者としてはその都度提案される車載機器の操作内容について同意の有無を意思表示しさえすればよい。そのため、目的地の設定及び音声の再生といった平均エントロピーH(Ω)のばらつき度合いが異なる異種の車載機器の操作提案に対する応答を簡素かつ同一のユーザインターフェースとして操作入力部142を用いつつ一貫して行うことができる。これにより、運転者の負荷を抑えつつ運転者の意図に即した車載機器の操作提案を実行することが可能となる。
次に、情報提供装置の第2の実施の形態について図面を参照して説明する。なお、第2の実施の形態は、各状態ごとの情報エントロピーの値を合算した平均エントロピーの値を求めることに代えて、現在の状態に対応する情報エントロピーの値に基づいて確定的な操作提案及び試行錯誤的な操作提案の選択を行う点が第1の実施の形態と異なる。したがって、以下の説明においては、第1の実施の形態と相違する構成について主に説明し、第1の実施の形態と同一の又は相当する構成については重複する説明を省略する。
(1A)エージェントECU100は、強化学習により算出した遷移確率行列P(st,at)において現在の状態に対応する情報エントロピーH(s)が乱数δ以上であるときには、複数の候補の中から対象となる行動を選択して出力する試行錯誤的な操作提案を車載機器の操作提案として行う。これにより、運転者の意図に即した車載機器の操作提案がより的確に行われる。一方、エージェントECU100は、強化学習により算出した遷移確率行列P(s,a)において現在の状態に対応する情報エントロピーH(s)が乱数δ未満であるときには、対象となる行動を固定して出力する確定的な操作提案を車載機器の操作提案として行う。これにより、運転者に行動を選択する手間をかけることなく、運転者の意図に即した車載機器の操作提案が行われる。すなわち、各状態ごとの情報エントロピーH(s)のばらつき度合いが大きい場合であれ、小さい場合であれ、操作提案の対象として一度に出力される車載機器の操作内容は一つのみであるため、運転者としてはその都度提案される車載機器の操作内容について同意の有無を意思表示しさえすればよい。そのため、目的地の設定及び音声の再生といった各状態ごとの情報エントロピーH(s)のばらつき度合いが異なる異種の車載機器の操作提案に対する応答を簡素かつ同一のユーザインターフェースとして操作入力部142を用いつつ一貫して行うことができる。これにより、運転者の負荷を抑えつつ運転者の意図に即した車載機器の操作提案を実行することが可能となる。また、エージェントECU100は、状態空間全体として見たときの状態空間のばらつき度合いを定義する平均エントロピーH(Ω)の値とは無関係に、現在の状態に対応する情報エントロピーH(s)の値に基づき、試行錯誤的な操作提案及び確定的な操作提案の選択を行う。これにより、エージェントECU100は、現在の状態において運転者の行動の特定のしやすさを個別具体的に考慮することで、より一層実情に合致したかたちで運転者の意図に即した車載機器の操作提案を行うことが可能となる。
なお、上記各実施の形態は、以下のような形態にて実施することもできる。
・上記第1の実施の形態においては、状態空間を定義する全ての状態についての情報エントロピーH(s)を合算することにより、状態空間のばらつき度合いを定義する平均エントロピーH(Ω)を算出するようにした。これに代えて、状態空間を定義する状態のうち一部の状態についての情報エントロピーH(s)を合算して平均エントロピーH(Ω)を算出するようにしてもよい。
Claims (9)
- 複数の種類の車両データを関連付けすることにより車両の状態を定義して複数の状態の集合である状態空間を構成する状態空間構成部と、
車載機器の操作提案に対する運転者からの応答により実行される車載機器の操作内容を示すデータを行動として定義して複数の行動の集合である行動空間を構成する行動空間構成部と、
前記車載機器の操作提案に対する運転者からの応答の履歴を蓄積し、該蓄積された履歴を用いつつ前記車載機器の操作提案の適正度合いを表す指標として報酬関数を設定するとともに、当該報酬関数に基づく強化学習により前記状態空間を構成する各状態において前記行動空間を構成する各行動が実行される確率分布を算出する強化学習部と、
前記強化学習部により算出される確率分布のばらつき度合いを演算するばらつき度合い演算部と、
前記ばらつき度合い演算部により演算される確率分布のばらつき度合いが小さいほど車両の状態に応じた最も前記適正度合いの高い操作提案を行う頻度を高め、前記ばらつき度合い演算部により演算される確率分布のばらつき度合いが大きいほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める情報提供部とを備える
情報提供装置。 - 複数の種類の車両データを関連付けすることにより車両の状態を定義して複数の状態の集合である状態空間を構成する状態空間構成部と、
車載機器の操作提案に対する運転者からの応答により実行される車載機器の操作内容を示すデータを行動として定義して複数の行動の集合である行動空間を構成する行動空間構成部と、
前記車載機器の操作提案に対する運転者からの応答の履歴を蓄積し、該蓄積された履歴を用いつつ前記車載機器の操作提案の適正度合いを表す指標として報酬関数を設定するとともに、当該報酬関数に基づく強化学習により前記状態空間を構成する各状態において前記行動空間を構成する各行動が実行される確率分布を算出する強化学習部と、
前記強化学習部により算出される確率分布のばらつき度合いを前記状態空間を構成する複数の状態について平均することにより前記状態空間のばらつき度合いを演算するばらつき度合い演算部と、
前記ばらつき度合い演算部により演算される前記状態空間のばらつき度合いが小さいほど車両の状態に応じた最も前記適正度合いの高い操作提案を行う頻度を高め、前記ばらつき度合い演算部により演算される前記状態空間のばらつき度合いが大きいほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める情報提供部とを備える
情報提供装置。 - 前記強化学習部は、前記状態空間を構成する各状態から前記行動空間を構成する各行動への写像を方策とするとともに、前記各状態において前記方策に従った場合に得られる累積報酬の期待値を状態価値関数とし、前記状態空間を構成する全ての状態において前記状態価値関数を最大にする前記方策を最適方策としたとき、前記状態空間を構成する各状態において前記行動空間の中から所定の行動を選択した後に常に前記最適方策に従う場合に得られる累積報酬の期待値を最適行動価値関数として推定して、当該推定した最適行動価値関数に基づいて前記確率分布を算出するものであり、
前記情報提供部は、前記ばらつき度合い演算部により演算される前記状態空間のばらつき度合いが小さいほど、現在の状態において前記最適行動価値関数を最大化する行動を対象とする操作提案を行う頻度を高める
請求項2に記載の情報提供装置。 - 前記情報提供部は、複数の行動の中からランダムで選択された操作提案を行うにあたって、現在の状態における前記確率分布の確率密度が高い行動ほど対象として選択する頻度を高める傾向をもって操作提案を行う
請求項3に記載の情報提供装置。 - 前記ばらつき度合い演算部は、前記状態空間を構成する各状態において前記行動空間を構成する各行動が実行される確率分布のばらつき度合いをエントロピーとして定義するとともに、前記状態空間のばらつき度合いを平均エントロピーとして定義し、
前記情報提供部は、前記平均エントロピーの値をε値として設定したε−グリーディ法を用いつつ、ε値が大きくなるほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める
請求項3又は4に記載の情報提供装置。 - 前記強化学習部は、前記車載機器の操作提案に対する運転者の応答により実行される車載機器の操作の頻度を前記報酬関数として設定するものであり、前記車載機器の操作提案に応じて車載機器の操作が行われたときには、その操作履歴の変更に応じて前記報酬関数を更新する
請求項1〜5の何れか一項に記載の情報提供装置。 - 前記状態空間構成部は、前記車載機器の操作状況、前記車両の乗員の特性、及び前記車両の走行状況を関連付けしたデータ群である状態の集合として前記状態空間を構成する
請求項1〜6の何れか一項に記載の情報提供装置。 - コンピュータに、
複数の種類の車両データを関連付けすることにより車両の状態を定義して複数の状態の集合である状態空間を構成する状態空間構成機能と、
車載機器の操作提案に対する運転者からの応答により実行される車載機器の操作内容を示すデータを行動として定義して複数の行動の集合である行動空間を構成する行動空間構成機能と、
前記車載機器の操作提案に対する運転者からの応答の履歴を蓄積し、該蓄積された履歴を用いつつ前記車載機器の操作提案の適正度合いを表す指標として報酬関数を設定するとともに、当該報酬関数に基づく強化学習により前記状態空間を構成する各状態において前記行動空間を構成する各行動が実行される確率分布を算出する強化学習機能と、
前記強化学習機能により算出される確率分布のばらつき度合いを演算するばらつき度合い演算機能と、
前記ばらつき度合い演算機能において演算される確率分布のばらつき度合いが小さいほど車両の状態に応じた最も前記適正度合いの高い操作提案を行う頻度を高め、前記ばらつき度合い演算機能において演算される確率分布のばらつき度合い大きいほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める情報提供機能と
を実現させるための情報提供プログラム。 - コンピュータに、
複数の種類の車両データを関連付けすることにより車両の状態を定義して複数の状態の集合である状態空間を構成する状態空間構成機能と、
車載機器の操作提案に対する運転者からの応答により実行される車載機器の操作内容を示すデータを行動として定義して複数の行動の集合である行動空間を構成する行動空間構成機能と、
前記車載機器の操作提案に対する運転者からの応答の履歴を蓄積し、該蓄積された履歴を用いつつ前記車載機器の操作提案の適正度合いを表す指標として報酬関数を設定するとともに、当該報酬関数に基づく強化学習により状態空間を構成する各状態において行動空間を構成する各行動が実行される確率分布を算出する強化学習機能と、
前記強化学習機能により算出される確率分布のばらつき度合いを前記状態空間を構成する複数の状態について平均することにより前記状態空間のばらつき度合いを演算するばらつき度合い演算機能と、
前記ばらつき度合い演算機能において演算される状態空間のばらつき度合いが小さいほど車両の状態に応じた最も前記適正度合いの高い操作提案を行う頻度を高め、前記ばらつき度合い演算機能において演算される状態空間のばらつき度合いが大きいほど前記行動空間を構成する複数の行動の中からランダムで選択された操作提案を行う頻度を高める情報提供機能と
を実現させるための情報提供プログラム。
Priority Applications (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048580A JP6477551B2 (ja) | 2016-03-11 | 2016-03-11 | 情報提供装置及び情報提供プログラム |
RU2017107178A RU2657179C1 (ru) | 2016-03-11 | 2017-03-06 | Устройство предоставления информации и некратковременный компьютерно-читаемый носитель, сохраняющий программу предоставления информации |
MYPI2017700780A MY179856A (en) | 2016-03-11 | 2017-03-07 | Information providing device and non-transitory computer readable medium storing information providing program |
US15/452,106 US9939791B2 (en) | 2016-03-11 | 2017-03-07 | Information providing device and non-transitory computer readable medium storing information providing program |
TW106107404A TWI626615B (zh) | 2016-03-11 | 2017-03-07 | 資訊提供裝置及儲存提供程式的資訊之非暫態電腦可讀媒體 |
CA2960140A CA2960140C (en) | 2016-03-11 | 2017-03-07 | Information providing device and non-transitory computer readable medium storing information providing program |
EP17159921.0A EP3217333A1 (en) | 2016-03-11 | 2017-03-08 | Information providing device and non-transitory computer readable medium storing information providing program |
KR1020170029963A KR102000132B1 (ko) | 2016-03-11 | 2017-03-09 | 정보 제공 장치 및 정보 제공 프로그램을 저장하는 기록 매체 |
BR102017004763-6A BR102017004763A2 (pt) | 2016-03-11 | 2017-03-09 | Dispositivo de fornecimento de informações e meio legível por computador não transitório armazenando programa de fornecimento de informações |
CN201710138036.XA CN107179870B (zh) | 2016-03-11 | 2017-03-09 | 信息提供装置及存储信息提供程序的存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048580A JP6477551B2 (ja) | 2016-03-11 | 2016-03-11 | 情報提供装置及び情報提供プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162385A JP2017162385A (ja) | 2017-09-14 |
JP6477551B2 true JP6477551B2 (ja) | 2019-03-06 |
Family
ID=58314109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016048580A Active JP6477551B2 (ja) | 2016-03-11 | 2016-03-11 | 情報提供装置及び情報提供プログラム |
Country Status (10)
Country | Link |
---|---|
US (1) | US9939791B2 (ja) |
EP (1) | EP3217333A1 (ja) |
JP (1) | JP6477551B2 (ja) |
KR (1) | KR102000132B1 (ja) |
CN (1) | CN107179870B (ja) |
BR (1) | BR102017004763A2 (ja) |
CA (1) | CA2960140C (ja) |
MY (1) | MY179856A (ja) |
RU (1) | RU2657179C1 (ja) |
TW (1) | TWI626615B (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11084440B2 (en) * | 2017-06-06 | 2021-08-10 | Toyota Motor Engineering & Manufacturing North America, Inc. | Smart vehicle accommodation device adjustment |
US11496506B2 (en) * | 2017-07-03 | 2022-11-08 | Denso Corporation | Program generation method and electronic control unit for changing importance of functions based on detected operation state in a vehicle |
JP6832267B2 (ja) * | 2017-10-30 | 2021-02-24 | 日本電信電話株式会社 | 価値関数パラメタ学習装置、信号情報指示装置、移動経路指示装置、価値関数パラメタ学習方法、信号情報指示方法、移動経路指示方法、およびプログラム |
JP6805112B2 (ja) * | 2017-11-08 | 2020-12-23 | 株式会社東芝 | 対話システム、対話方法および対話プログラム |
CN110196587A (zh) * | 2018-02-27 | 2019-09-03 | 中国科学院深圳先进技术研究院 | 车辆自动驾驶控制策略模型生成方法、装置、设备及介质 |
JP6477943B1 (ja) * | 2018-02-27 | 2019-03-06 | オムロン株式会社 | メタデータ生成装置、メタデータ生成方法及びプログラム |
WO2019170616A1 (en) | 2018-03-05 | 2019-09-12 | British Telecommunications Public Limited Company | Vehicular network security |
JP6955702B2 (ja) | 2018-03-06 | 2021-10-27 | オムロン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP6971187B2 (ja) * | 2018-03-28 | 2021-11-24 | 京セラ株式会社 | 画像処理装置、撮像装置、および移動体 |
DE102018206717A1 (de) * | 2018-05-02 | 2019-11-07 | Audi Ag | Verfahren zum fahrsituationsabhängigen Betreiben eines Kraftfahrzeugsystems eines Kraftfahrzeugs, Personalisierungseinrichtung und Kraftfahrzeug |
JP6710722B2 (ja) * | 2018-06-15 | 2020-06-17 | 本田技研工業株式会社 | 車両制御装置、車両制御方法、およびプログラム |
US11354406B2 (en) * | 2018-06-28 | 2022-06-07 | Intel Corporation | Physics-based approach for attack detection and localization in closed-loop controls for autonomous vehicles |
WO2020010526A1 (en) * | 2018-07-10 | 2020-01-16 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for determining a marketing strategy for an online to offline service |
JP7048893B2 (ja) * | 2018-07-26 | 2022-04-06 | 日本電信電話株式会社 | 学習装置、学習方法及びコンピュータプログラム |
US20200089244A1 (en) * | 2018-09-17 | 2020-03-19 | Great Wall Motor Company Limited | Experiments method and system for autonomous vehicle control |
US10831208B2 (en) | 2018-11-01 | 2020-11-10 | Ford Global Technologies, Llc | Vehicle neural network processing |
CN109435883B (zh) * | 2018-11-19 | 2024-07-19 | 李震成 | 汽车自适应人体智能进入系统和方法 |
JP7119985B2 (ja) * | 2018-12-21 | 2022-08-17 | トヨタ自動車株式会社 | 地図生成装置、地図生成システム、地図生成方法、及び地図生成プログラム |
US11275899B2 (en) | 2019-01-02 | 2022-03-15 | International Business Machines Corporation | Generating game environments from unstructured textual corpus for reinforcement learning |
WO2020161854A1 (ja) * | 2019-02-07 | 2020-08-13 | 三菱電機株式会社 | 車両用機器制御システム、車両用機器制御方法及び車両用機器制御装置 |
KR102323482B1 (ko) * | 2019-03-19 | 2021-11-09 | 한국전자인증 주식회사 | 발화 감정 히스토리를 이용한 대화 에이젼트 시스템 및 방법 |
EP3715608B1 (en) | 2019-03-27 | 2023-07-12 | Siemens Aktiengesellschaft | Machine control based on automated learning of subordinate control skills |
CN110065455A (zh) * | 2019-04-24 | 2019-07-30 | 深圳市麦谷科技有限公司 | 车载功能智能启动方法、装置、计算机设备及存储介质 |
KR102461732B1 (ko) | 2019-07-16 | 2022-11-01 | 한국전자통신연구원 | 강화 학습 방법 및 장치 |
CN110979341A (zh) * | 2019-10-08 | 2020-04-10 | 复变时空(武汉)数据科技有限公司 | 一种司机驾驶行为分析方法及分析系统 |
JP6744597B1 (ja) * | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
WO2021090413A1 (ja) * | 2019-11-06 | 2021-05-14 | 日本電信電話株式会社 | 制御装置、制御システム、制御方法及びプログラム |
KR20210117619A (ko) * | 2020-03-19 | 2021-09-29 | 삼성전자주식회사 | 프로액티브 디지털 비서 |
US11738778B2 (en) * | 2020-10-21 | 2023-08-29 | GM Global Technology Operations LLC | Facilitating transfers of control between a user and a vehicle control system |
CN112801697B (zh) * | 2021-01-25 | 2024-04-19 | 杭州网易云音乐科技有限公司 | 多媒体数据的数据关联窗口的调节方法及装置 |
CN113011761B (zh) * | 2021-03-29 | 2023-06-20 | 北京物资学院 | 一种基于物联网的自由空间分配系统 |
WO2022215233A1 (ja) * | 2021-04-08 | 2022-10-13 | 三菱電機株式会社 | シーケンス自動生成装置、シーケンス自動生成方法およびプログラム |
JPWO2022249335A1 (ja) * | 2021-05-26 | 2022-12-01 | ||
CN114506388B (zh) * | 2021-12-27 | 2023-04-07 | 广东机电职业技术学院 | 一种车辆转向控制方法、装置、计算机设备和存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2138409C1 (ru) * | 1998-06-24 | 1999-09-27 | Вознесенский Александр Николаевич | Способ комплексированного представления визуальной информации для водителя транспортного средства |
US6679702B1 (en) * | 2001-12-18 | 2004-01-20 | Paul S. Rau | Vehicle-based headway distance training system |
JP3999530B2 (ja) | 2002-02-25 | 2007-10-31 | 日本電信電話株式会社 | コンテンツ情報分類装置、プログラム、および同プログラムを記録した記録媒体 |
US20120253823A1 (en) * | 2004-09-10 | 2012-10-04 | Thomas Barton Schalk | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing |
JP2006085351A (ja) * | 2004-09-15 | 2006-03-30 | Fuji Xerox Co Ltd | 画像処理装置およびその制御方法および制御プログラム |
US20080167820A1 (en) * | 2007-01-04 | 2008-07-10 | Kentaro Oguchi | System for predicting driver behavior |
JP4682992B2 (ja) * | 2007-02-08 | 2011-05-11 | 株式会社デンソー | 車両用空調装置、車両用空調装置の制御方法および制御装置 |
WO2009047874A1 (ja) * | 2007-10-12 | 2009-04-16 | Mitsubishi Electric Corporation | 車載情報提供装置 |
JP5180639B2 (ja) | 2008-03-21 | 2013-04-10 | 株式会社デンソーアイティーラボラトリ | コンテンツ提示装置、コンテンツ提示方法、およびプログラム |
JP4656177B2 (ja) * | 2008-04-14 | 2011-03-23 | トヨタ自動車株式会社 | ナビゲーション装置、操作部表示方法 |
JP5272605B2 (ja) * | 2008-09-18 | 2013-08-28 | 日産自動車株式会社 | 運転操作支援装置、及び運転操作支援方法 |
JP2010134714A (ja) * | 2008-12-04 | 2010-06-17 | Nippon Telegr & Teleph Corp <Ntt> | 協調的分類装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 |
US8266091B1 (en) * | 2009-07-21 | 2012-09-11 | Symantec Corporation | Systems and methods for emulating the behavior of a user in a computer-human interaction environment |
JP5633734B2 (ja) * | 2009-11-11 | 2014-12-03 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
TW201122995A (en) * | 2009-12-31 | 2011-07-01 | Tomtom Int Bv | Methods of adaptively determining the accessibility of features provided through a user interface and navigation apparatuses using the same |
CN101840586B (zh) * | 2010-04-02 | 2012-04-11 | 中国科学院计算技术研究所 | 虚拟人运动规划的方法及其系统 |
US9213522B2 (en) * | 2010-07-29 | 2015-12-15 | Ford Global Technologies, Llc | Systems and methods for scheduling driver interface tasks based on driver workload |
JP5552009B2 (ja) * | 2010-09-22 | 2014-07-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | リスクを考慮した最適なアクションを決定するための方法、プログラム、および装置 |
JP5620805B2 (ja) | 2010-12-21 | 2014-11-05 | 株式会社エヌ・ティ・ティ・データ | データベース暗号化装置、データベース暗号化システム、データベース暗号化方法及びプログラム |
WO2013014709A1 (ja) * | 2011-07-27 | 2013-01-31 | 三菱電機株式会社 | ユーザインタフェース装置、車載用情報装置、情報処理方法および情報処理プログラム |
US8758127B2 (en) * | 2012-11-08 | 2014-06-24 | Audible, Inc. | In-vehicle gaming system for a driver |
US9177475B2 (en) * | 2013-11-04 | 2015-11-03 | Volkswagen Ag | Driver behavior based parking availability prediction system and method |
US20170010859A1 (en) | 2014-04-22 | 2017-01-12 | Mitsubishi Electric Corporation | User interface system, user interface control device, user interface control method, and user interface control program |
KR101765635B1 (ko) * | 2016-02-02 | 2017-08-07 | 현대자동차 주식회사 | 하이브리드 차량의 운전 모드 전환 시스템 및 그 방법 |
-
2016
- 2016-03-11 JP JP2016048580A patent/JP6477551B2/ja active Active
-
2017
- 2017-03-06 RU RU2017107178A patent/RU2657179C1/ru active
- 2017-03-07 MY MYPI2017700780A patent/MY179856A/en unknown
- 2017-03-07 TW TW106107404A patent/TWI626615B/zh active
- 2017-03-07 CA CA2960140A patent/CA2960140C/en active Active
- 2017-03-07 US US15/452,106 patent/US9939791B2/en active Active
- 2017-03-08 EP EP17159921.0A patent/EP3217333A1/en not_active Withdrawn
- 2017-03-09 CN CN201710138036.XA patent/CN107179870B/zh not_active Expired - Fee Related
- 2017-03-09 BR BR102017004763-6A patent/BR102017004763A2/pt not_active Application Discontinuation
- 2017-03-09 KR KR1020170029963A patent/KR102000132B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US20170261947A1 (en) | 2017-09-14 |
US9939791B2 (en) | 2018-04-10 |
CN107179870A (zh) | 2017-09-19 |
EP3217333A1 (en) | 2017-09-13 |
KR102000132B1 (ko) | 2019-07-15 |
TWI626615B (zh) | 2018-06-11 |
MY179856A (en) | 2020-11-18 |
BR102017004763A2 (pt) | 2018-03-20 |
RU2657179C1 (ru) | 2018-06-08 |
TW201734926A (zh) | 2017-10-01 |
JP2017162385A (ja) | 2017-09-14 |
CN107179870B (zh) | 2020-07-07 |
KR20170106227A (ko) | 2017-09-20 |
CA2960140C (en) | 2019-06-11 |
CA2960140A1 (en) | 2017-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6477551B2 (ja) | 情報提供装置及び情報提供プログラム | |
JP4728839B2 (ja) | 車載機器制御装置 | |
JP6543460B2 (ja) | 音声認識問い合わせ応答システム | |
EP3050770B1 (en) | Vehicle state prediction system | |
JP2015128988A (ja) | 自動の運転手識別 | |
CN107444402A (zh) | 利用学习用户偏好的车辆模式安排 | |
JP2015129753A (ja) | 車内通知提示のスケジューリング | |
CN104977876B (zh) | 用于情境界面的使用预测 | |
US10106173B2 (en) | Systems and methods of an adaptive interface to improve user experience within a vehicle | |
US20210234932A1 (en) | Dynamic time-based playback of content in a vehicle | |
US11794676B1 (en) | Computing systems and methods for generating user-specific automated vehicle actions using artificial intelligence | |
CN114379579A (zh) | 促进用户和车辆控制系统之间的控制转移 | |
US20170147396A1 (en) | Information presentation device, method, and program | |
CN113895364A (zh) | 基于双异步显示器的车载信息娱乐系统 | |
WO2024126023A1 (en) | Computing systems and methods for generating user-specific automated vehicle actions | |
JP2010033549A (ja) | 情報提供装置、情報提供方法、プログラムおよび情報提供システム | |
CN114503133A (zh) | 信息处理设备、信息处理方法和程序 | |
JP2010070171A (ja) | 車載機器の制御装置及び制御方法 | |
CN116155981A (zh) | 服务推荐方法、系统、设备和计算机程序产品 | |
CN114815676A (zh) | 与自动化控制系统的行为相关的解释的生成和呈现 | |
GB2592217A (en) | Method and system for providing adaptive display content on a display interface of a vehicle | |
US20230174089A1 (en) | System and method for virtual experience as a service with context-based adaptive control | |
WO2023062814A1 (ja) | 音声出力装置、音声出力方法、プログラム及び記憶媒体 | |
JP5142737B2 (ja) | 車両搭載機器の制御装置及び制御方法 | |
CN118537070A (zh) | 车载广告呈现系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190121 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6477551 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |