JP6721121B2 - 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム - Google Patents

制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム Download PDF

Info

Publication number
JP6721121B2
JP6721121B2 JP2019520468A JP2019520468A JP6721121B2 JP 6721121 B2 JP6721121 B2 JP 6721121B2 JP 2019520468 A JP2019520468 A JP 2019520468A JP 2019520468 A JP2019520468 A JP 2019520468A JP 6721121 B2 JP6721121 B2 JP 6721121B2
Authority
JP
Japan
Prior art keywords
control
user
objective function
term
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019520468A
Other languages
English (en)
Other versions
JP2019531971A (ja
Inventor
ウィマー ウィー
ウィマー ウィー
義男 亀田
義男 亀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2019531971A publication Critical patent/JP2019531971A/ja
Application granted granted Critical
Publication of JP6721121B2 publication Critical patent/JP6721121B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/182Selecting between different operative modes, e.g. comfort and performance modes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W40/09Driving style or behaviour
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/082Selecting or switching between different modes of propelling
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • B60W2050/0029Mathematical model of the driver
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • B60W2050/0083Setting, resetting, calibration
    • B60W2050/0088Adaptive recalibration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2540/00Input parameters relating to occupants
    • B60W2540/215Selection or confirmation of options
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/041Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Feedback Control In General (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Description

本発明は、自動化される意思決定、最適化および制御のためにカスタマイズまたは個別化された性能指標または嗜好パラメータ間の学習、適用および切り替えのための制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラムに関する。
近年、制御システムは、最小限のオペレータ入力または介入で単一または複数のタスクを実行することにおいてますます洗練されてきている。例えば、現代の車両では、運転者がスロットルを調整することなく所望の速度を設定し維持することができるようにクルーズコントロールシステムが開発されている。他の先進車両では、希望する速度を維持するだけでなく、先行する車両が自動車のセンサによって検出されたかどうかに応じて自動車の速度を自動的に調整するためのアダプティブ・クルーズ・コントロールシステムも開発されている。完全に自動化された車両は、多くの道路規則や要件を満たしながら、模擬都市交通を運転するためのテストにも成功している。
高度な制御システムが主流になるにつれ、制御システムには、完全自動化および同時にいくつかの目的を追求できることが求められている。ただし、制御システムが広く迅速に受け入れられるようにするために、さまざまなオペレータの要件や好みに合わせてカスタマイズおよび個別化された制御戦略を学習して計算できることも望まれている。
特許文献1に記載されている一例の標準制御システムでは、通常、最適制御入力が、明確に定義された物理量または時間量に基づく一連の固定された目的関数に対する解決策であると考えられている。一般に、目的関数の項は第一の原理に基づいており、制御システムは、同時性を有する非常に多くの目的関数を含むことがある。そして、そのうちの目的関数のいくつかは、非常に複雑な表現を有することがあり、それは高い計算コストにつながることがある。
装置のオペレータの目的は、装置の状態やその他の測定値によって異なる。その時点でどの目的を追求するか、そしてその目的をどれだけ強く達成すべきかは非常に主観的であり、オペレータの要求に左右される。類似しているが異なる目的をオペレータが追求する方法によって計算された制御戦略または入力は、オペレータの好みまたは専門知識に応じて個別化またはカスタマイズされる。
特許文献2には、目標車速に基づいて車両の速度を制御する車速の制御部が記載されている。特許文献2に記載された装置は、推定された運転者の特性と取得した道路形状とに基づいて目標車速を変更する。
なお、特許文献3には、車線推定に対する信頼度に基づいて車両の挙動を変更する方法およびシステムが記載されている。
米国特許出願公開第2010/0228420号明細書 特開2010−083402号公報 米国特許第8948954号明細書
目的の数が増加し、それらを要求する順序および/または強さが現実的かつ個別化された制御戦略を生成するために必要とされるにつれて、特許文献1に記載されているような一般的な手法は、通常、車両の状態や道路および環境の種類に依存することから、多少制限される。
制御部の性能を向上させ、より個別化された戦略を得るためには、目的関数の適切な集合、すなわち追求する目的の選択および各目的が他の項と比較してどのように重要であるかを決定する際に、(特許文献2と同様に)装置のユーザもしくはオペレータの好みまたは行動パターンをコスト関数に含めることが望ましい。
本発明の主題は、上述の問題のうちの1つまたは複数を克服するか、または少なくともその影響を軽減するために、上記の特徴を実現することを目的とする。
すなわち、本発明は、装置および制御部の性能をバランス化、カスタマイズ化、および個別化できる制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラムを提供することを目的とする。
本発明による制御カスタマイズシステムは、装置の制御をカスタマイズする制御カスタマイズシステムであって、装置またはユーザの状況に応じて、そのユーザの行動を予測するプロファイラと、ユーザが所望するタスクを表す適切な目的関数の集合と、その目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、その目的関数の項をプロファイラの予測に基づいて調整する計画部とを備え、プロファイラが、決定木プロファイルまたは回帰木プロファイルを用いてユーザの行動を予測し、計画部が、予測された行動に関係のない目的関数の項について正則化パラメータをゼロに設定することでその目的関数の項を非活性化することを特徴とする。
本発明による制御カスタマイズ方法は、装置の制御をカスタマイズする制御カスタマイズ方法であって、装置またはユーザの状況に応じて、決定木プロファイルまたは回帰木プロファイルを用いてそのユーザの行動を予測し、ユーザが所望するタスクを表す適切な目的関数の集合と、その目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、予測された行動に関係のない目的関数の項について正則化パラメータをゼロに設定することでその目的関数の項を非活性化するように調整することを特徴とする。
本発明による制御カスタマイズプログラムは、装置の制御をカスタマイズするコンピュータに適用される制御カスタマイズプログラムであって、コンピュータに、装置またはユーザの状況に応じて、そのユーザの行動を予測するプロファイル処理、および、ユーザが所望するタスクを表す適切な目的関数の集合と、その目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、その目的関数の項を予測に基づいて調整する計画処理を実現させ、プロファイル処理で、決定木プロファイルまたは回帰木プロファイルを用いてユーザの行動を予測させ、計画処理で、予測された行動に関係のない目的関数の項について正則化パラメータをゼロに設定することで、その目的関数の項を非活性化させることを特徴とする。
本発明によれば、装置のオペレータまたはユーザの嗜好により密接に適合する、カスタマイズされたまたは個別化された目的関数または重みの組に基づく制御入力を得ることができる。
本発明による制御カスタマイズシステムの第一の実施形態の構成例を示すブロック図である。 本発明による制御カスタマイズシステムの第一の実施形態の構成例を示す説明図である。 プロファイルの例を示す説明図である。 制御カスタマイズシステムの動作例を示すフローチャートである。 具体例の動作の例を示す説明図である。 本発明による制御カスタマイズシステムの第二の実施形態の構成例を示すブロック図である。 本発明による制御カスタマイズシステムの概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。本発明は、より現実的または個人的な制御を行うため、カスタマイズされたまたは個別化された目的関数の集合を作成するための方法およびシステムに関する。本開示の主題の好ましい実施形態および代替の実施形態、並びに他の態様は、具体的な実施形態の詳細な説明および添付の図面を参照することで、理解され得る。
カスタマイズされたまたは個別化された制御用の目的関数を作成するための方法およびシステムに関する本開示の実施形態の以下の説明は、本質的内容の単なる例示であり、開示内容や用途または使用を限定することを意図するものではない。以下、図面を参照して本発明の実施の形態について説明する。
実施形態1.
図1は、本発明による制御カスタマイズシステムの第一の実施形態の構成例を示すブロック図である。図2は、本発明による制御カスタマイズシステムの第一の実施形態の構成を示す説明図である。本実施形態の制御カスタマイズシステムは、装置の制御をカスタマイズする。
本実施形態に係る制御カスタマイズシステム100は、制御部101と、装置102と、計画部103と、プロファイラ104とを備える。制御部101は、装置102を制御する。
装置102は、装置の出力110をプロファイラ104に送信する。装置の出力110は、装置102が備えるセンサ(図示せず)によって取得される。装置102は、外乱を装置の出力110として取得してもよい。
プロファイラ104は、装置102および/またはユーザの状況に応じてユーザの行動を予測する。装置102の状況は、例えば、センサによって取得された装置102の状態(具体的には速度、位置、加速度など)、観測対象の環境などである。ユーザの状況は、例えば、ユーザの運転状況、体温、血圧などである。
具体的には、プロファイラ104は、ユーザまたは類似のユーザによる操作中に装置102によって収集されたデータを使用して学習された決定木プロファイルまたは回帰木プロファイルを含む。プロファイラ104は、そのプロファイルを用いてユーザの行動を予測する。決定木または回帰木のプロファイルでは、ノードの予測子として線形モデルが使用されてもよい。結果として、プロファイラ104は、学習されたプロファイルまたはユーザまたはオペレータの好みに基づいて、装置102に対する多数の可能な目的の中から最も重要な行動を選択する。
プロファイラ104は、装置102によって収集されたデータに基づいてプロファイルを更新してもよい。特定のユーザが装置102を操作するとき、装置102がより多くのデータを収集するにしたがって、プロファイルが更新されてもよい。プロファイラ104は、収集したデータにアンサンブル法などの機械学習技法を適用することによって、ユーザに関連する決定木を学習または更新してもよい。ユーザの行動をより正確に記述または予測するために、装置のオペレータまたはユーザのプロファイルは、分類木と回帰木との組み合わせに基づくものであってもよい。
ニューラルネットワークおよびディープラーニングモデルと比較して、学習プロファイルに分類木および回帰木を使用することは、解釈が容易であり、検証およびテストが容易になり得るという利点を有する。さらに、操作に対する特徴の関係を正確に学習することができる場合、そのプロファイルは、特定のオペレータ/運転者の習慣を改善または修正するためのガイドとして使用することが可能になる。
一例として、ネットワーク上で収集された運転者のデータに基づいて、プロファイラ104は、機械学習を使用して、年齢、体調、測定値および他の特徴に基づいてプロファイルまたはカテゴリを作成し、それらを特定の運転操作、例えば、現在の車両の状態に基づいて車線を変更する傾向、環境や交通参加者に基づく何らかの要素など、を行う際の積極性または保守性に関連付けてもよい。
そして、現在のユーザから検出された特徴に基づいて、プロファイラ104は、各ユーザの特徴に関連する木の組み合わせに基づくプロファイルをスタートとして、ユーザのフィードバックまたは装置102のセンサから測定された行動に基づいてプロファイルを継続的に更新してもよい。
さらに、プロファイラ104は、オペレータまたはユーザからの特定の入力または測定値に基づいて使用できるデフォルトプロファイルを含んでいてもよい。プロファイラ104は、装置の出力110を毎回受け取り、オペレータまたはユーザによって行われた制御動作を予測し、装置の最適化に関連する数量の値を予測する。
プロファイラ104は、装置102の制御に関連する異なる数量の間の相対的な重要性を予測してもよい。すなわち、プロファイラ104は、装置の状態に基づいて、数量または動作の相対的な重要性を考慮してもよい。行動の予測と同様に、数量の間の重要性の予測モデルが、データから学習または構築され得る。
図3は、プロファイルの例を示す説明図である。図3に示す例では、プロファイルが決定木により定義され、予測される行動が葉(葉)に設定され、各ノードの分岐条件がセンサ値になる。プロファイラ104は、状況に応じてユーザの行動を特定する図3に例示されるような決定木によって表されるプロファイルを使用することによって、ユーザの行動を予測する。
計画部103は、予測されたユーザの行動に基づいて、ユーザにとって最適な装置102の制御計画を作成する。すなわち、計画部103は、制御部101がユーザの視点から装置102を制御するための最適な計画を作成する。
具体的には、計画部103は、プロファイラ104の出力または予測を使用して、オペレータの個人的な好みまたは特徴を厳密に反映する制御戦略を得るために、適切な目的関数と必要な重みまたは調整パラメータの集合を決定する。そして、計画部103は、装置102に適用されるべき制御入力を計算するために、目的関数の集合を制御部101に出力する。
まず、計画部103は、ユーザが所望する作業を目的関数として決定する。計画部103は、タスク(目的)を実行するため、装置102を制御するための要素(以下、目的関数の項という)を決定する。ユーザが望むタスクの例には、目的地へ行くこと、快適さを最大化すること、燃料を節約することなどが含まれる。言い換えれば、“目的関数”とは、定義から導き出される、または、第一の原理を用いることができる、何らかの数量または式に関連するタスクである。これは、ユーザが最適化したいものである。
そして、計画部103は、決定した目的関数の項を調整して、利用者にとって最適な装置102の制御計画を作成する。制御計画は、例えば、決定された目的関数の項を重み付けすることによって追加されたコスト関数によって表される。計画部103は、目的関数をオンラインで更新してもよい。重みは、目的関数の項の間の相対的な重要性を反映しており、装置の状況を考慮してそのような重みを決定するためのデータから、エキスパートシステムの構築や、モデルの学習をすることができる。
コスト関数は、例えば、望ましい状態を示す値を追跡するためなどの第一の原理に基づく異なる目的関数の項から構成され、いくつかはデータから学習/構築される。例えば、コスト関数は、分析的に構築可能な目的地、速度および加速度追跡、およびジャーク最小化に関する項、および/または、データから学習できる燃料消費および快適性の最大化に関する項をデフォルトで含んでいてもよい。
計画部103は、例えば、デフォルトで、左に移動する、右に移動する、前に移動するなど、与えられた状況で自動車または運転者が行うことができる動作または運転操作の組を含む。ある運転状況が与えられると、プロファイラ104は、運転者が反応したであろう操作および強度を予測する。次に、計画部103は、これらの予測を使用して、オプティマイザで解決されるべき全体の目的関数を確定させるために、予測された操作に関連する特定の数量または式の重要性を活性化または増大させる。
より具体的には、プロファイラ104からのプロファイルは、分類木と回帰木の組み合わせに基づくことができるので、各瞬間について、計画部103は、予測された動き、大きさ、積極性を取得する。そして、計画部103は、例えば、それらの正則化パラメータをゼロに設定することによって、予測された動きに関係のない全ての目的関数の項を非活性化してもよい。残りの項は活性化された項であり、何らかのエキスパートシステムまたは学習されたメカニズムに基づいて、計画部103は、全体のコスト関数を構成するために適切な値の重みまたは正則化パラメータを選択または使用してもよい。
なお、併合操作または他の任意の操作の実行可能性は、第一の原理を用いて評価できる。自動車および他の交通参加者の状態の測定値を取得すると、併合または運転操作を成功させるための空間的および時間的要件、たとえば与えられた状況における各オブジェクトに対するスペース要件およびギャップ要件に関する異なる数量を計算できる。そのような数量に基づくことでエキスパートシステムを構築でき、より多くのデータを収集できると仮定すると、そのエキスパートシステムを更新することができ、そのエキスパートシステムを、各種類の運転操作の実行可能性を評価する学習メカニズムと組み合わせることができる。
次に、計画部103は、装置102に適用される制御入力を計算するために、制御部101に目的関数の集合を出力する。例えば、計画部103の出力は、関連する重みや正則化パラメータ、例えば、燃料消費量の式、重み10など、と共に、目的関数の項または公式の集合を指す。
また、プロファイラ104が異なる数量間の重要度を予測する場合、計画部103は、その重要度を用いて制御計画を決定してもよい。プロファイラ104によって予測された相対的な重要度は、計画部103への入力として使用され、計画部103は、そのような情報を対応する目的関数の項の正規化パラメータで使用される適切な値に変換する。
制御部101は、目的関数の項とそれらの対応する調整対象の重みとの組み合わせを含むコスト関数を最適化することによって、装置102を制御する。
制御部101と、計画部103と、プロファイラ104とは、プログラム(制御カスタマイズプログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、制御カスタマイズシステム内の記憶部(図示せず)に記憶される。CPUは、プログラムを読み取り、プログラムに従って、制御部101、計画部103、および、プロファイラ104として動作してもよい。また、制御部101と、計画部103と、プロファイラ104とは、それぞれが専用ハードウェアによって実現されてもよい。
次に、本実施形態の制御カスタマイズシステムの一例を説明する。図4は、本実施形態の制御カスタマイズシステムの動作例を示すフローチャートである。ここでは、制御変数が前輪の操舵角と縦方向の速度である半自動または全自動運転のシナリオを想定する。
必要に応じて、S201で、オペレータまたはユーザは、異なるプロファイルの中から選択できる。つまり、デフォルトのプロファイルを使用することが可能である。オペレータは、装置のユーザインターフェースを使用して、好みを入力してもよい。
S202で、プロファイラ104は、装置102から収集されたデータを使用してプロファイルを学習してもよい。
S203で、プロファイラ104は、装置の出力110を読み取り、格納されている決定木または回帰木を使用してオペレータが取るべき行動を予測する。プロファイラ104は、また、項と、ユーザによって行われる複数の目的または行動に関連する数量の値との間の相対的重要性を決定する。計画部103は、関連する設定点を決定し、プロファイラ104からの記憶されたまたは学習された値に基づいて調整パラメータを使用する。すなわち、計画部103は、適切な目的関数の集合(例えば、コスト関数)を取得し、その集合を制御部101に送信する。
S204で、制御部101は、前のステップで組み立てられたコスト関数に基づいて制御入力を計算する。
S205において、制御部101は、装置102を作動させるために制御入力を送信する。
S206で、プロファイラ104は、必要に応じて、オペレータからの追加の入力を要求してもよい。
S207で、プロファイラ104は、状態を測定した値およびオペレータまたはユーザからのフィードバックに基づいて、所望のプロファイルを更新してもよい。
以上のように、本実施形態では、プロファイラ104が、装置102またはユーザの状況に応じてユーザの行動を予測し、計画部103が、ユーザが望むタスクを表す適切な目的関数のセット、および、目的関数を実行するように装置を制御するための要素を表わす目的関数の項を決定し、プロファイラ104の予測に基づいて目的関数の項を調整する。
そのような構成により、カスタマイズされた目的関数の組み合わせに基づく制御入力を計算でき、より個人化された制御戦略を実現して、装置に適用できる。
以下に、本実施形態の具体例を説明する。図5は、本具体例の動作例を示す説明図である。
具体例として、乗客が速度の遅い車両を希望する場合を想定する。車両のユーザインターフェースを使用して、乗客は、控えめに運転するプロファイルを選択できる。そのプロファイルは、あるデフォルトの制約に対応するものであってもよく、例えば、ステアリングの操舵速度が3度、加速制限が0.1Gなどである。また、音量制御に使用されるような入力装置を使用して他のパラメータが制御されてもよい。例えば、図5に示すように、プロファイラ104は、運転者からの入力として運転者の特性/好みを受信する。
次に、プロファイラ104は、速度追跡の強度もしくは重要性、または、併合する積極性を含む学習された決定木のプロファイルを計画部103に出力する。プロファイラ104は、また、運転者の特徴に基づいて車線変更または合流する傾向を記憶および学習し、そのような情報を計画部103に送信してもよい。例えば、図5に示すように、プロファイラ104は、予測行動としてユーザの操作を出力する。
次に、計画部103は、併合操作の実現可能性を判断し、必要な縦方向または横方向の目標を選択し、プロファイルに基づいてコスト関数の正則化パラメータに重みを関連付ける。計画部103は、生成されたコスト関数を制御部101に入力する。
制御部101は、コスト関数を最適化することによって得られた結果(例えば、ステアリング/スロットル)を装置102に入力する。制御部101が最適なステアリング/スロットルを計算し、アクチュエータに適用した後、システムは、乗客の反応を推定してもよく、運転用のプロファイルの特定の側面をさらに調整するために乗客からのフィードバックを直接要求してもよい。
実施形態2.
次に、本発明による制御カスタマイズシステムの第二の実施形態を説明する。図6は、本発明による制御カスタマイズシステムの第二の実施形態の構成例を示す説明図である。
本実施形態の制御カスタマイズシステム200は、制御部101と、装置102と、計画部103と、プロファイラ104と、状態観測部105と、状態予測部106とを備えている。
すなわち、本実施形態の制御カスタマイズシステムは、第一の実施形態の制御カスタマイズシステムの構成に加え、状態観測部105および状態予測部106をさらに備える。その他の構成は、第一の実施形態と同様である。
状態観測部105は、装置102から装置の出力110を受け取り、装置102の様々な状態を推定する。状態観測部105は、推定結果を状態予測部106に送信する。
状態予測部106は、状態観測部105から受け取った推定結果に基づいて装置102の状態を予測する。状態予測部106は、予測結果を計画部103に送信する。状態予測部106が装置102の状態を予測する方法は任意であり、広く知られている方法が用いられる。
計画部103は、状態予測部106から受け取った予測結果をさらに用いて、装置102の制御計画を作成する。
以上の構成により、装置102から直接取得できない情報を用いて制御計画を作成できる。
次に、本発明の概要を説明する。図7は、本発明による制御カスタマイズシステムの概要を示すブロック図である。本発明による制御カスタマイズシステム80(例えば、制御カスタマイズシステム100)は、装置(例えば、装置102)の制御をカスタマイズする制御カスタマイズシステムであって、制御カスタマイズシステムは、装置またはユーザの状況に応じて、そのユーザの行動を予測するプロファイラ81(例えば、プロファイラ104)と、ユーザが所望するタスクを表す適切な目的関数の集合と、その目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、その目的関数の項をプロファイラ81の予測に基づいて調整する計画部82(例えば、計画部103)とを備えている。
そのような構成により、カスタマイズされた目的関数の組み合わせに基づく制御入力を計算でき、より個人化された制御戦略を実現して、装置に適用できる。
また、制御カスタマイズシステムは、調整された目的関数の項を最適化することによって装置を制御する制御部(例えば、制御部101)を備えていてもよい。
また、プロファイラ81は、状況に応じてユーザの行動を特定する決定木または分類木で表されるプロファイルを用いて、ユーザの行動を予測してもよい。
また、プロファイラ81は、ユーザの操作により装置が収集したデータに基づいてプロファイルを更新してもよい。
また、プロファイラ81は、装置の制御に関連する異なる数量の間の相対的な重要性を予測し、計画部82は、相対的な重要性に基づいて、適切な目的関数の集合およびその目的関数の項を決定してもよい。
また、計画部82は、ユーザの行動に応じて目的関数の項の内容を決定するエキスパートシステムを用いて、装置の制御の最適化に用いる目的関数を決定してもよい。
また、プロファイラ81は、現在および予測される装置の状況に応じ、学習されたプロファイル、または、ユーザもしくはオペレータの好みに基づいて、装置に対する多数の可能な目的関数の中から最も重要な行動を選択してもよい。
また、計画部82は、学習された決定木または回帰木から予測または取得された線形の目的関数を使用してオンラインでコスト関数を更新してもよい。
好ましい実施形態および代替の実施形態に関する上記説明は、開示する発明の概念の範囲または適用可能性を限定または制限することを意図するものではない。当業者であれば、特許請求の範囲に記載された本開示の精神および範囲から逸脱することなく、そのような検討および添付の図面および特許請求の範囲から様々な変更、修正および変形が可能であることが容易に認識される。
100,200 制御カスタマイズシステム
101 制御部
102 装置
103 計画部
104 プロファイラ
105 状態観測部
106 状態予測部
107 出力

Claims (10)

  1. 装置の制御をカスタマイズする制御カスタマイズシステムであって、
    装置またはユーザの状況に応じて、当該ユーザの行動を予測するプロファイラと、
    前記ユーザが所望するタスクを表す適切な目的関数の集合と、当該目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、当該目的関数の項を前記プロファイラの予測に基づいて調整する計画部とを備え
    前記プロファイラは、決定木プロファイルまたは回帰木プロファイルを用いてユーザの行動を予測し、
    前記計画部は、予測された前記行動に関係のない目的関数の項について正則化パラメータをゼロに設定することで当該目的関数の項を非活性化する
    ことを特徴とする制御カスタマイズシステム。
  2. 調整された目的関数の項を最適化することによって装置を制御するコントローラを備えた
    請求項1記載の制御カスタマイズシステム。
  3. プロファイラは、状況に応じてユーザの行動を特定する決定木または分類木で表されるプロファイルを用いて、ユーザの行動を予測する
    請求項1または請求項2記載の制御カスタマイズシステム。
  4. プロファイラは、ユーザの操作により装置が収集したデータに基づいてプロファイルを更新する
    請求項3記載の制御カスタマイズシステム。
  5. プロファイラは、装置の制御に関連する異なる数量の間の相対的な重要性を予測し、
    計画部は、前記相対的な重要性に基づいて、適切な目的関数の集合および当該目的関数の項を決定する
    請求項1から請求項4のうちのいずれか1項に記載の制御カスタマイズシステム。
  6. 計画部は、ユーザの行動に応じて目的関数の項の内容を決定するエキスパートシステムを用いて、装置の制御の最適化に用いる目的関数を決定する
    請求項1から請求項5のうちのいずれか1項に記載の制御カスタマイズシステム。
  7. プロファイラは、現在および予測される装置の状況に応じ、学習されたプロファイル、または、ユーザもしくはオペレータの好みに基づいて、装置に対する多数の可能な目的関数の中から最も重要な行動を選択する
    請求項1から請求項6のうちのいずれか1項に記載の制御カスタマイズシステム。
  8. 計画部は、学習された決定木または回帰木から予測または取得された線形の目的関数を使用してオンラインでコスト関数を更新する
    請求項1から請求項7のうちのいずれか1項に記載の制御カスタマイズシステム。
  9. 装置の制御をカスタマイズする制御カスタマイズ方法であって、
    装置またはユーザの状況に応じて、決定木プロファイルまたは回帰木プロファイルを用いて当該ユーザの行動を予測し、
    前記ユーザが所望するタスクを表す適切な目的関数の集合と、当該目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、
    予測された前記行動に関係のない目的関数の項について正則化パラメータをゼロに設定することで当該目的関数の項を非活性化するように調整する
    ことを特徴とする制御カスタマイズ方法。
  10. 装置の制御をカスタマイズするコンピュータに適用される制御カスタマイズプログラムであって、
    前記コンピュータに、
    装置またはユーザの状況に応じて、当該ユーザの行動を予測するプロファイル処理、および、
    前記ユーザが所望するタスクを表す適切な目的関数の集合と、当該目的関数を実行するように装置を制御するための要素を表す目的関数の項とを決定し、当該目的関数の項を前記予測に基づいて調整する計画処理を実現させ
    前記プロファイル処理で、決定木プロファイルまたは回帰木プロファイルを用いてユーザの行動を予測させ、
    前記計画処理で、予測された前記行動に関係のない目的関数の項について正則化パラメータをゼロに設定することで当該目的関数の項を非活性化させる
    ための制御カスタマイズプログラム。
JP2019520468A 2017-02-10 2017-02-10 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム Active JP6721121B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/004996 WO2018146802A1 (en) 2017-02-10 2017-02-10 Control customization system, control customization method, and control customization program

Publications (2)

Publication Number Publication Date
JP2019531971A JP2019531971A (ja) 2019-11-07
JP6721121B2 true JP6721121B2 (ja) 2020-07-08

Family

ID=63108085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019520468A Active JP6721121B2 (ja) 2017-02-10 2017-02-10 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム

Country Status (3)

Country Link
US (1) US11579574B2 (ja)
JP (1) JP6721121B2 (ja)
WO (1) WO2018146802A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7213183B2 (ja) * 2016-12-15 2023-01-26 ボレアリス エージー 高温溶液重合プロセスでポリエチレンコポリマーを製造する為の新規な触媒系
US11273836B2 (en) * 2017-12-18 2022-03-15 Plusai, Inc. Method and system for human-like driving lane planning in autonomous driving vehicles
CN109263648B (zh) * 2018-11-16 2021-01-15 深圳市元征科技股份有限公司 一种驾驶行为的评价方法、装置及设备
US20210039664A1 (en) * 2019-08-08 2021-02-11 Toyota Jidosha Kabushiki Kaisha Machine learning system for modifying adas behavior to provide optimum vehicle trajectory in a region
CN113515698B (zh) * 2021-06-11 2024-03-26 广汽本田汽车有限公司 网约车的个性化定制控制方法、系统、装置和存储介质
US20230155387A1 (en) * 2021-11-17 2023-05-18 BluWave Inc. Systems and methods for dynamic tuning of controller in power grids

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2588546B2 (ja) 1987-10-31 1997-03-05 マツダ株式会社 車両の運動特性制御方法
US7797062B2 (en) * 2001-08-10 2010-09-14 Rockwell Automation Technologies, Inc. System and method for dynamic multi-objective optimization of machine selection, integration and utilization
US7292152B2 (en) * 2003-06-12 2007-11-06 Temic Automotive Of North America, Inc. Method and apparatus for classifying vehicle operator activity state
EP1754621B1 (en) * 2005-08-18 2009-10-14 Honda Research Institute Europe GmbH Driver assistance system
US20090216590A1 (en) * 2007-12-12 2009-08-27 Hintz Kenneth J Inferring System Goal Values in An Inverse Goal Lattice
US8725667B2 (en) * 2008-03-08 2014-05-13 Tokyo Electron Limited Method and system for detection of tool performance degradation and mismatch
JP5056707B2 (ja) 2008-10-01 2012-10-24 トヨタ自動車株式会社 車速制御装置
JP2010155528A (ja) 2008-12-26 2010-07-15 Toyota Motor Corp 選択的非線形最適化演算による車輌運転制御方法
US8190330B2 (en) * 2009-03-06 2012-05-29 GM Global Technology Operations LLC Model based predictive control for automated lane centering/changing control systems
US8948954B1 (en) 2012-03-15 2015-02-03 Google Inc. Modifying vehicle behavior based on confidence in lane estimation
DE102013101639A1 (de) * 2013-02-19 2014-09-04 Continental Teves Ag & Co. Ohg Verfahren und Vorrichtung zur Bestimmung eines Fahrbahnzustands
JP6483667B2 (ja) * 2013-05-30 2019-03-13 プレジデント アンド フェローズ オブ ハーバード カレッジ ベイズの最適化を実施するためのシステムおよび方法
US20170177739A1 (en) * 2015-12-22 2017-06-22 Intel Corporation Prediction using a data structure

Also Published As

Publication number Publication date
US20200192307A1 (en) 2020-06-18
JP2019531971A (ja) 2019-11-07
WO2018146802A1 (en) 2018-08-16
US11579574B2 (en) 2023-02-14

Similar Documents

Publication Publication Date Title
JP6721121B2 (ja) 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム
CN112805198B (zh) 用于自主驾驶的个人驾驶风格学习
JP7143250B2 (ja) 自車両の将来挙動および関連する軌道を決定することにより、自車両の操作者が当該自車両を制御するのを支援する方法およびシステム
CN111098852B (zh) 一种基于强化学习的泊车路径规划方法
Ntousakis et al. Optimal vehicle trajectory planning in the context of cooperative merging on highways
CN114326696B (zh) 用于自动驾驶车辆中使用的控制器的自动参数调整框架
JP2023504223A (ja) 自動または半自動運転車両の適応制御
US20180292830A1 (en) Automatic Tuning of Autonomous Vehicle Cost Functions Based on Human Driving Data
KR20200095378A (ko) 사람의 주행 데이터를 트레이닝 데이터로서 사용하여 강화 학습을 지원함으로써 맞춤형 경로 플래닝을 수행하는 학습 방법 및 학습 장치
JP2019502582A5 (ja)
CN110688920B (zh) 一种无人驾驶控制方法、装置及服务器
JP2023502797A (ja) 自動運転車または半自動運転車のアダプティブコントロール
JP2019505889A (ja) コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム
CN111930015A (zh) 一种无人车控制方法及装置
KR20220116319A (ko) 지능형 차량 제어 방법, 장치 및 제어 시스템
CN113791615A (zh) 一种混合车辆队列分布式模型预测控制方法
KR20210107517A (ko) 차량 작동 역학을 해결하기 위한 모델 참조 적응형 제어 알고리즘
CN113655794B (zh) 基于鲁棒模型预测控制的多车协同控制方法
WO2020098226A1 (en) System and methods of efficient, continuous, and safe learning using first principles and constraints
WO2024039866A1 (en) Real time trajectory planning system with dynamic modelling of component level system latency for self driving vehicles
KR102311704B1 (ko) 운전자 감정에 따른 운전자와 차량간의 상호작용 제공 장치 및 그 방법
US20240160548A1 (en) Information processing system, information processing method, and program
JP6299289B2 (ja) パラメータ学習装置、運転支援装置、及びプログラム
Zhao et al. Inverse Reinforcement Learning and Gaussian Process Regression-based Real-Time Framework for Personalized Adaptive Cruise Control
KR20190103017A (ko) 주행 로봇의 제어 방법 및 그 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190415

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200601

R150 Certificate of patent or registration of utility model

Ref document number: 6721121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150