WO2023058382A1

WO2023058382A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2023058382A1
Application number: PCT/JP2022/033339
Authority: WO
Inventors: 遼高橋; 陸也江副
Original assignee: ソニーグループ株式会社
Priority date: 2021-10-04
Filing date: 2022-09-06
Publication date: 2023-04-13

Abstract

［課題］移動装置が具備するアクチュエーション部の駆動制御の最適化に有利な技術を提供する。［解決手段］情報処理装置は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、予測状態情報に基づいて制御指令データを生成する計画部と、を備える。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関する。

　自律的に移動可能な自律移動体は、車輪走行、脚部走行及び飛行などの多様な駆動形態で実現可能であるが、いずれの形態においても通常はセンサーの検出結果に応じてアクチュエータの駆動が制御される。

　すなわち自律移動体では、実際に採用される駆動形態にかかわらず、制御指令値に基づいてアクチュエータが駆動され、当該駆動の結果としての自律移動体の状態がセンサーにより観測値として取得される。

　例えば特許文献１は、距離センサーの検知結果に基づいて移動ロボットの移動を制御する装置を開示する。

国際公開第２０１９／０６９５２４号

　上述のように自律移動体は、制御部から出力される制御指令値に応じて、自らの状態を変えるように駆動する。一方、自律移動体の実際の状態に関する情報は、センサー（観測系）により取得されて、制御部に送られる。

　実世界において、自律移動体の状態の変化は、アクチュエータ（駆動系）を構成する様々なデバイスの動作が連続的に相関して行われることで生じる。そのため「アクチュエータへの駆動信号の入力」から「自律移動体の状態変化の開始」までには、相応の時間を要する。また、制御部からアクチュエータに駆動信号を伝える際にも、レイテンシのため、相応の時間を要する。さらに、センサーから制御部に情報を伝える際のレイテンシや制御部における信号処理に関しても、相応の時間を要する。

　このように「センサーによる情報取得」から「自律移動体の状態変化の開始」までには相応の時間がかかるため、タイムラグが生じる。当該タイムラグに起因し、厳密な意味で「センサーが取得する情報に応じた自律移動体の駆動のリアルタイム制御」を行うことは難しい。

　すなわち「自律移動体の状態を変えるための駆動」は、実際に駆動が行われる時点から見て厳密には過去の情報である「センサーが取得した情報」に基づいて行われる。そのため「センサーが取得した情報」と「自律移動体が駆動される時点での状態」との間には乖離が生じていることがあり、当該乖離によって自律移動体の駆動制御が必ずしも最適な状態では行われない。

　なお「センサーによる情報取得」から「自律移動体の状態変化の開始」までの時間は、状況（例えばシステムの負荷状態や周辺環境の状態）によらずにほぼ一定であったり、状況に応じて大きく変わったりする。

　本開示は上述の事情に鑑みてなされたものであり、移動装置が具備するアクチュエーション部の駆動制御の最適化に有利な技術を提供する。

　本開示の一態様は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、予測状態情報に基づいて制御指令データを生成する計画部と、を備える情報処理装置に関する。

　計画部は、直前に生成した制御指令データを含む１以上の制御指令データに基づいて導出される予測状態情報から、次の制御指令データを生成してもよい。

　初期段階において、計画部は、センシング部から出力される移動装置の状態を表す状態情報に基づいて制御指令データを生成し、初期段階よりも後の段階において、計画部は、状態情報に基づくことなく、予測状態情報に基づいて制御指令データを生成してもよい。

　情報処理装置は、センシング部から出力される移動装置の状態を表す状態情報と、予測状態情報との間の整合性を検証する状態検証部を備えてもよい。

　状態検証部は、状態情報と予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、未来状態予測部は、１以上の制御指令データ及び補正情報に基づいて、予測状態情報を導出してもよい。

　計画部は、状態情報と予測状態情報との間の相違が許容基準よりも大きい場合、アクチュエーション部を安全モードで駆動させる制御指令データを出力してもよい。

　移動装置は、アクチュエーション部及びセンシング部を具備し、センシング部から出力される移動装置の状態を表す状態情報に基づいてアクチュエーション部が制御されて自律的に移動してもよい。

　移動装置は、車両であってもよい。

　本開示の他の態様は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する工程と、予測状態情報に基づいて制御指令データを生成する工程と、を含む情報処理方法に関する。

　本開示の他の態様は、コンピュータに、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する手順と、予測状態情報に基づいて制御指令データを生成する手順と、を実行させるためのプログラムに関する。

図１は、移動装置の機能構成の一例を示すブロック図である。図２は、図１に示す移動装置において生じうる「有利な回転方向」及び「実際の回転状態」の時系列の一例を示す図である。図３Ａは、図２に示す時間「Ｔ１」における移動装置の状態例を示す簡略図である。図３Ｂは、図２に示す時間「Ｔ２」における移動装置の状態例を示す簡略図である。図３Ｃは、図２に示す時間「Ｔ３」における移動装置の状態例を示す簡略図である。図３Ｄは、図２に示す時間「Ｔ４」における移動装置の状態例を示す簡略図である。図４は、第１実施形態に係る移動装置の機能構成の一例を示すブロック図である。図５は、初期段階（特に「制御周期ｔ＝０」）における図４に示す移動装置の機能構成の一例を示すブロック図である。図６は、初期段階の後における図４に示す移動装置の機能構成の一例を示すブロック図である。図７は、第１実施形態に係る移動装置において、初期段階の後に行われる処理フローの一例を示す。図８は、第１実施形態に係る計画部において行われる処理フローの一例を示す。図９は、第２実施形態に係る移動装置の機能構成の一例を示すブロック図である。図１０は、初期段階（特に「制御周期ｔ＝０」）における図９に示す移動装置の機能構成の一例を示すブロック図である。図１１は、初期段階の後における図９に示す移動装置の機能構成の一例を示すブロック図である。図１２は、第２実施形態に係る移動装置において、初期段階の後に行われる処理フローの一例を示す。

　図１は、移動装置１０の機能構成の一例を示すブロック図である。図２は、図１に示す移動装置１０において生じうる「有利な回転方向」及び「実際の回転状態」の時系列の一例を示す図である。図３Ａ～図３Ｄは、図２に示す時間「Ｔ１」～「Ｔ４」における移動装置１０の状態例を示す簡略図である。

　自律移動体等の移動装置１０の全般において、移動装置１０の駆動指示は、移動装置１０の現在の状態（移動装置１０の現在の状況及び周辺環境の現在の状況を含みうる）のセンシング結果に基づいて計画される。

　ただし、指示が駆動に対して実際に反映されるタイミングは、センシング結果の取得及び駆動指示の計画完成の時点から見て厳密には未来となる。

　図１に示す例では、センシング部２１が取得した制御周期ｔでの状態情報Ｓ（ｔ）が計画部２５に送られ、状態情報Ｓ（ｔ）に基づいて導出される制御指令データＣ（ｔ）が計画部２５からアクチュエーション部２２に送られる。その後、制御指令データＣ（ｔ）に基づいてアクチュエーション部２２が駆動される。

　当該駆動制御において、センシング部２１から計画部２５に送られる状態情報Ｓ（ｔ）は第１遅延素子２３により遅延される。また計画部２５からアクチュエーション部２２に送られる制御指令データＣ（ｔ）は第２遅延素子２４により遅延される。

　ここで第１遅延素子２３は、「センシング部２１による状態情報Ｓ（ｔ）の取得」から「計画部２５による制御指令データＣ(ｔ)の導出」までの間に存在する遅延要因全般を集合的に表す機能ブロックである。同様に第２遅延素子２４は、「計画部２５による制御指令データＣ（ｔ）の取得」から「制御指令データＣ（ｔ）に基づくアクチュエーション部２２の駆動」までの間に存在する遅延要因全般を集合的に表す機能ブロックである。

　このように「センシング部２１による状態情報Ｓ（ｔ）の取得」と「制御指令データＣ（ｔ）に基づくアクチュエーション部２２の駆動」との間には相応の時間がかかり、アクチュエーション部２２の駆動は状態情報の取得から遅延して行われる。

　計画部２５がそのようなシステム上の遅延を考慮せずに制御指令データを生成する場合、「センサーが取得した情報」と「センサー情報に基づく移動装置１０の駆動が行われる時点での移動装置１０の状態」との間に乖離が生じることがある。「センサー情報」と「移動装置１０の駆動時の状態」との間の乖離は、振動現象やオーバーシュートなどの不具合を移動装置１０にもたらしうる。

　ここで言う「振動現象」は、センシング結果のわずかな差に基づいてアクチュエーション部２２に求められる駆動内容が切り換わる状況下で、当該駆動内容が短時間で連続的に切り換わって、移動装置１０の状態が不安定になる現象である。

　一例として、図３Ａ～図３Ｄに示すように、移動装置（例えば車両）１０が目標Ｔｇに向けて移動しつつ、装置前部１０Ｆが目標Ｔｇに向けられるように移動装置１０が回転駆動されるケースについて説明する。

　移動装置１０の回転駆動が停止している図３Ａ（図２の時間「Ｔ１」参照）に示す状態では、移動装置１０を左回転させるよりも右回転させる方が、装置前部１０Ｆを最短で目標Ｔｇに向けることができ有利である。そのため時間Ｔ１においてセンシング部２１により取得された状態情報に基づいて、時間Ｔ２において移動装置１０が右回転駆動を開始する（図３Ｂ）。

　その後、移動装置１０が右回転している間に移動装置１０に対する目標Ｔｇの位置が変わって（図３Ｃ：時間Ｔ３）、右回転よりも左回転の方が、装置前部１０Ｆを最短で目標Ｔｇに向けられることになる場合がある。

　ここで言う「移動装置１０に対する目標Ｔｇの位置が変わる場合」には、目標Ｔｇ自体の位置が変わる場合だけではなく、センシング部２１の検出結果の誤差が解消することで移動装置１０の検出位置が変わる場合も該当しうる。

　例えば、センシング部２１が自己位置同定技術に基づいて地図上の自らの位置を検出する場合、センシング部２１の検出結果はある程度の不確かさを有し、センシング部２１は、前触れなく、誤差が解消された自己位置情報を取得することがある。この場合、センシング部２１のセンシング結果は、移動装置１０に対する目標Ｔｇの位置が突然変わったことを示しうる。

　上述のように、移動装置１０が右回転している状態で、時間Ｔ３においてセンシング部２１により取得される状態情報に基づき左回転が有利であることが導出されると、その後の制御指令は左回転を指示する指令に切り替えられる。その結果、移動装置１０は、回転方向を右回転から左回転に切り替えるように動作し、時間Ｔ４において移動装置１０は左回転駆動を開始する。

　しかしながら時間Ｔ４における移動装置１０の実際の状況は、左回転よりも右回転の方が、装置前部１０Ｆを最短で目標Ｔｇに向けられることがある（図３Ｄ）。すなわち、移動装置１０の左回転への切り替えが実際に行われるまでは、先行する右回転駆動が行われ続けるため、移動装置１０の左回転駆動を開始する時点（時間Ｔ４）では右回転の方が有利な状態になることがある。

　この場合、センシング部２１が取得する状態情報に基づいて、制御指令データは右回転を指示する指令に切り替えられる。

　したがって移動装置１０は、上述の図２及び図３Ａ～図３Ｄに示す状況において、右回転及び左回転を短時間に繰り返し行う振動的な挙動を示す。

　このように回転により移動装置１０の姿勢を変更する場合、右回転及び左回転のうちのどちらが有利かは、目標Ｔｇの位置と移動装置１０の状態（回転姿勢）との間の相対関係の微妙な変化によって変わりうる。そのため、移動装置１０は右回転駆動及び左回転駆動を振動的に繰り返し、結果的に移動装置１０の回転挙動が不安定になることがある。

　上述の振動現象は、駆動の切り替えに伴う損傷を移動装置１０にもたらしうるだけではなく、移動装置１０の不自然な挙動が周辺の人間に脅威を感じさせうるとともに、移動装置１０の駆動効率の低下も招く。

　一方、上述の「オーバーシュート」は、移動装置１０が実際には目標状態に達しているにもかかわらず、「センサー情報」と「移動装置１０の駆動時の状態」との間の乖離に起因し、目標状態を超えた状態まで移動装置１０が駆動される現象である。

　オーバーシュートは、移動装置１０を目標状態に到達させるという要求に対し、センサー情報と目標状態との間の差分に基づくアクチュエーション部２２の実際の駆動が、センシング部２１による情報取得タイミングから遅れて行われることに起因する。つまり、実世界のアクチュエーション部２２が目標状態に達した時点でアクチュエーション部２２に送られてくる制御指令データは、アクチュエーション部２２の過去の状態と目標状態との間の差分を低減する指令であることに起因して、オーバーシュートが起きる。

　上述の振動現象やオーバーシュートなどの不具合を防ぐには、アクチュエーション部２２の駆動を指示する制御指令データを、当該制御指令データに基づく駆動が実際に行われる時点での移動装置１０の状態に基づいて生成することが、有効である。

　その一方で「センシング部２１による情報取得」から「アクチュエーション部２２による駆動開始」までに遅延が全くない装置は存在せず、「センシング部２１による情報取得」と「アクチュエーション部２２による駆動開始」との間のタイムラグは不可避である。

　そのため、センシング部２１により検出される情報を用いずに得られる「ある時点における移動装置１０の状態」に基づいて、当該ある時点におけるアクチュエーション部２２の駆動のための制御指令データを生成することが有効である。

　以下に示す実施形態に係る装置及び方法は、アクチュエーション部２２の駆動制御を最適化して、システム上の遅延に起因する上述の振動現象やオーバーシュート等の不具合の発生を抑えるのに有利である。

［第１実施形態］
　図４は、第１実施形態に係る移動装置１０の機能構成の一例を示すブロック図である。

　図４に示す移動装置１０は、センシング部２１、アクチュエーション部２２、第１遅延素子２３、第２遅延素子２４及び計画部２５に加え、未来状態予測部２６を備える。

　センシング部２１は、アクチュエーション部２２の駆動制御のための基礎情報となる各種情報を取得する１以上のセンサー類を含む。例えば、移動装置１０の状況を検出するセンサー、周辺環境の状況を検出するセンサー、及び他の情報を取得可能な任意の機器類が、移動装置１０の状態情報を取得するセンシング部２１に含まれうる。

　典型的には、センシング部２１は、アクチュエーション部２２が有するモータに装着されたエンコーダや移動装置１０に搭載される慣性計測ユニット（ＩＭＵ: Inertial Measurement Unit）を含みうる。またセンシング部２１は、ＴｏＦ（Time-of-Flight）センサーを用いたＳＬＡＭ（Simultaneous Localization and Mapping）などの統合的なサブシステムを含みうる。センシング部２１により取得可能な環境の状態は、実世界における環境の状態であってもよいし、シミュレーション上の環境の状態であってもよい。

　センシング部２１は、各種情報の取得結果を、状態情報として計画部２５に向けて送信する。

　アクチュエーション部２２は、計画部２５から出力される制御指令データに応じた挙動をとるように駆動される。

　アクチュエーション部２２は、制御指令データに基づいて駆動可能な任意のアクチュエータを含みうる。典型的には、車輪やプロペラなどを具備する移動機構が、アクチュエーション部２２に含まれる。

　例えば移動装置１０が自律駆動システムとして構成される場合、センシング部２１から出力される状態情報（例えば位置情報及び／又はマップ情報）に基づき計画部２５で生成される制御指令データに応じて、アクチュエーション部２２は自律的に駆動制御される。その結果、移動装置１０は自律的に移動する。

　第１遅延素子２３は、上述のように「センシング部２１による状態情報の取得」から「計画部２５による制御指令データの導出」までの間に存在する遅延要因全般を集合的に表し、通信遅延要因、物理的遅延要因及びその他の遅延要因を含みうる。

　図４に示す第１遅延素子２３は、便宜的にセンシング部２１及び計画部２５とは別ブロックとして表されているが、実際はセンシング部２１で生じる遅延要因及び計画部２５で生じる遅延要因も含む。

　典型的には、センシング部２１及び／又は計画部２５における情報変換に伴う遅延要因が第１遅延素子２３に含まれる。また光速を超えた情報伝達は難しいので、センシング部２１及び計画部２５が離れて設けられる場合（例えば計画部２５がクラウドシステムとして構成される場合）、センシング部２１から計画部２５への情報の伝達に伴う遅延要因も第１遅延素子２３に含まれる。

　同様に第２遅延素子２４は、「計画部２５による制御指令データの取得」から「制御指令データに基づくアクチュエーション部２２の駆動」までの間に存在する遅延要因全般を集合的に表し、通信遅延要因、物理的遅延要因及びその他の遅延要因を含む。図４に示す第２遅延素子２４は、便宜的に計画部２５及びアクチュエーション部２２とは別ブロックとして表されているが、実際は計画部２５で生じる遅延要因及びアクチュエーション部２２で生じる遅延要因も含む。典型的には、計画部２５及び／又はアクチュエーション部２２における情報変換に伴う遅延が第２遅延素子２４に含まれる。また計画部２５及びアクチュエーション部２２が離れて設けられる場合には、計画部２５からアクチュエーション部２２への情報の伝達に伴う遅延も第２遅延素子２４に含まれる。

　計画部２５は、アクチュエーション部２２を駆動するための制御指令データを生成し、当該制御指令データをアクチュエーション部２２に向けて送る。

　すなわち計画部２５は、アクチュエーション部２２の最適な駆動を実現するための制御指令データを算出する部分であり、任意の構成を有しうる。計画部２５は、例えば単純なＰＩＤ制御器（Proportional-Integral-Differential Controller）を有してもよいし、より複雑なシステムを有していてもよい。

　本実施形態の計画部２５は、初期段階における制御指令データの生成と、初期段階よりも後の段階における制御指令データの生成との間で、異なる生成方法を実施する。

　すなわち初期段階では、計画部２５は、センシング部２１から出力される移動装置１０の状態を表す状態情報に基づいて、アクチュエーション部２２を駆動するための制御指令データを生成する。

　一方、初期段階よりも後の段階では、計画部２５は、センシング部２１からの状態情報に基づくことなく、未来状態予測部２６から出力される予測状態情報に基づいて、アクチュエーション部２２を駆動するための制御指令データを生成する。特に、本例の計画部２５は、直前に生成した制御指令データを含む１以上の過去の制御指令データに基づいて導出される１以上の予測状態情報から、次の制御指令データを生成する。

　そのため計画部２５は、未来状態予測部２６から提供される予測状態情報を保持する記憶保持部（図示省略）を有し、当該記憶保持部に保持される１以上の予測状態情報を適宜読み出して制御指令データの生成に用いることができる。

　未来状態予測部２６は、アクチュエーション部２２の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、移動装置１０の未来の状態（すなわち予測状態）を表す予測状態情報を導出する部分であり、任意の構成を有しうる。

　例えば制御指令データが移動装置１０の移動速度に関する場合、単純な積分器によって未来状態予測部２６が構成されてもよい。すなわち制御指令データが移動装置１０の移動速度を指示するデータを含む場合、未来状態予測部２６は、実際の駆動時点（すなわち遅延時間経過時）の移動装置１０の移動速度の状態を、過去の制御指令データ（例えば加速度の積分値）から導出できる。

　ただし未来状態予測部２６は、より複雑なシステム（例えば摩擦及び慣性などのダイナミクスが考慮された高精度なモデルに基づく運動方程式を解くシステム）を有していてもよい。

　このように未来状態予測部２６は、センシング部２１から出力される状態情報を用いることなく、制御指令データに基づいて、次の制御周期における移動装置１０の状態を予測して予測状態情報を導出する。

　そのため未来状態予測部２６は、計画部２５から提供される制御指令データを保存する保存部（図示省略）を有し、当該保存部に保存される１以上の制御指令データ（履歴情報）を適宜読み出して予測状態情報の導出に用いることができる。

　未来状態予測部２６は、典型的には、直近の過去の制御指令データのみを参照して次の制御指令データを導出するが、複数の過去の制御指令データを参照して次の制御指令データを導出してもよい。

　上述のように図４に示す移動装置１０では、計画部２５及び未来状態予測部２６を含む情報処理装置１５に対し、センシング部２１及びアクチュエーション部２２が接続される。情報処理装置１５の具体的な構成は限定されず、任意のハードウエア及び／又はソフトウエアによって情報処理装置１５を実現することが可能である。

　なお図４に示す例では情報処理装置１５が移動装置１０の一部として設けられるが、情報処理装置１５（計画部２５及び／又は未来状態予測部２６）は移動装置１０とは別体として設けられてもよい。例えば、移動装置１０が具備するセンシング部２１から、クラウドシステムとして構成される情報処理装置１５（計画部２５）に状態情報が送信されてもよい。またクラウドシステムとして構成される情報処理装置１５（計画部２５）から、移動装置１０が具備するアクチュエーション部２２に制御指令データが送信されてもよい。

　次に、上述の移動装置１０を使った情報処理方法の一例について説明する。

　図５は、初期段階（特に「制御周期ｔ＝０」）における図４に示す移動装置１０の機能構成の一例を示すブロック図である。図６は、初期段階の後における図４に示す移動装置１０の機能構成の一例を示すブロック図である。図７は、第１実施形態に係る移動装置１０において、初期段階の後に行われる処理フローの一例を示す。図８は、第１実施形態に係る計画部２５において行われる処理フローの一例を示す。

　まず、アクチュエーション部２２の駆動制御の初期段階における情報処理方法の一例について説明する。

　初期段階（特に最初の制御周期（ｔ＝０））では、図５に示すように、センシング部２１により取得された状態情報Ｓ（０）が第１遅延素子２３を介して計画部２５に送られる。

　そして計画部２５により、状態情報Ｓ（０）に基づいて制御指令データＣ（０）が導出され、当該制御指令データＣ（０）が、第２遅延素子２４を介してアクチュエーション部２２に送られるとともに、未来状態予測部２６に送られる。

　アクチュエーション部２２は、計画部２５から送られてくる制御指令データＣ（０）に応じて駆動される。その結果、移動装置１０は、実世界（周辺環境）とインタラクション（相互作用）して、周辺環境に対する移動装置１０の状態を変化させる。

　一方、未来状態予測部２６は、計画部２５から送られてくる制御指令データＣ（０）を保存部（図示省略）に保存するとともに、制御指令データＣ（０）に基づいて、次の制御周期（すなわち「ｔ＝１」）のための予測状態情報Ｆ（１）を導出する。

　このように初期段階では、第１遅延素子２３及び第２遅延素子２４によりもたらされる遅延の影響が制御指令データＣ（０）に反映される。ただし初期段階において移動装置１０の状態が経時的に変化しない状態（例えばアクチュエーション部２２が静止している状態）であれば、アクチュエーション部２２の駆動は、第１遅延素子２３及び第２遅延素子２４による遅延の影響を実質的には受けない。

　次に、上記初期段階の後における情報処理方法の一例について説明する。

　初期段階の後は、図６に示すように、計画部２５が生成した制御指令データＣ（ｔ）が第２遅延素子２４を介してアクチュエーション部２２に送られ、当該制御指令データＣ（ｔ）に基づいてアクチュエーション部２２が駆動される。

　当該制御指令データＣ（ｔ）は、未来状態予測部２６から出力される予測状態情報Ｆ（ｔ）に基づいて生成されており、第２遅延素子２４による遅延の影響が解消又は低減されている。すなわち予測状態情報Ｆ（ｔ）は、第２遅延素子２４に起因する遅延を考慮して導出されており、第２遅延素子２４に起因する遅延時間の経過時点における移動装置１０の状態に基づいて導出される。

　このように計画部２５が予測状態情報Ｆ（ｔ）に基づいて算出する制御指令データＣ（ｔ）は、当該制御指令データＣ（ｔ）に基づいてアクチュエーション部２２が実際に駆動される時点での移動装置１０の予測状態に基づいている。

　一方、未来状態予測部２６が、計画部２５から出力される制御指令データＣ（ｔ）に基づいて、移動装置１０の未来の状態を表す予測状態情報Ｆ（ｔ＋１）を導出する（図７のＳ１１）。

　上述のように本例では、アクチュエーション部２２の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データ（特に直前に生成した制御指令データＣ（ｔ）を含む１以上の制御指令データ）に基づいて、予測状態情報Ｆ（ｔ＋１）が導出される。また未来状態予測部２６は、センシング部２１から出力される状態情報を用いることなく、制御指令データＣ（ｔ）及び第２遅延素子２４による遅延時間に基づいて、次の制御周期の移動装置１０の状態を予測して、予測状態情報Ｆ（ｔ＋１）を出力する。

　その後、計画部２５が、予測状態情報Ｆ（ｔ＋１）に基づいて、次の制御周期の制御指令データＣ（ｔ＋１）を生成する（Ｓ１２）。

　その後、アクチュエーション部２２が、次の制御周期（すなわち「ｔ＋１」）において、制御指令データＣ（ｔ＋１）に基づき駆動される（Ｓ１３）。

　このように、上記初期段階の後では、上述のステップＳ１１～Ｓ１３が繰り返されることにより、未来状態予測部２６が導出した予測状態情報から生成される制御指令データに基づいて、アクチュエーション部２２の駆動が継続的に制御される。

　なお図６に示す計画部２５は、初期段階の後も、センシング部２１から第１遅延素子２３を介して送られてくる状態情報Ｓ（ｔ）を受信して、記憶保持部に記憶してもよい。ただし上述のように、初期段階の後は、計画部２５における制御指令データの生成に、センシング部２１が取得する状態情報は用いられない。したがって初期段階の後において、センシング部２１は状態情報Ｓ（ｔ）の出力を停止してもよいし、計画部２５はセンシング部２１からの状態情報Ｓ（ｔ）を受信及び／又は記憶保持しなくてもよい。

　上述の情報処理方法を実施するため、計画部２５では、例えば図８に示す処理フローが行われる。

　すなわち計画部２５は、まず停止指示信号を受信したか否かを判定する（図８のＳ２１）。

　停止指示信号は、移動装置１０を停止させるための信号であり、任意の装置によって自発的に発せられてもよいし、図示しないインターフェース装置を介してオペレータにより発せられてもよい。

　計画部２５は、停止指示信号を受信した場合（Ｓ２１のＹ）、アクチュエーション部２２の駆動制御を終了する。

　一方、計画部２５は、停止指示信号を受信しない場合（Ｓ２１のＮ）、現在の状態が、アクチュエーション部２２の制御の初期段階か否か（本例では「ｔ＝０」か否か）を判定する（Ｓ２２）。「現在の状態がアクチュエーション部２２の制御の初期段階か否か」の情報は、任意の方法で計画部２５により取得され、例えば計画部２５自身により導出されてもよいし、センシング部２１からの状態情報に基づいて導出されてもよい。

　現在の状態が制御の初期段階であると判定される場合（Ｓ２２のＹ）、計画部２５は、センシング部２１からの状態情報Ｓ（０）に基づいて制御指令データＣ（０）を生成し（Ｓ２３）、当該制御指令データＣ（０）を出力する（Ｓ２４）。

　そして計画部２５は、当該制御指令データＣ（０）に基づいて未来状態予測部２６により生成される予測状態情報Ｆ（１）を受信し（Ｓ２５）、上述のステップＳ２１に戻って処理を行う。

　一方、現在の状態が制御の初期段階ではないと判定される場合（Ｓ２２のＮ）、計画部２５は、未来状態予測部２６から送られてくる予測状態情報Ｆ（ｔ）に基づいて制御指令データＣ（ｔ）を生成する（Ｓ２６）。

　そして計画部２５は、当該制御指令データＣ（ｔ）を、アクチュエーション部２２及び未来状態予測部２６に出力する（Ｓ２７）。

　そして計画部２５は、当該制御指令データＣ（ｔ）に基づいて未来状態予測部２６が導出する予測状態情報Ｆ（ｔ＋１）を受信し（Ｓ２８）、上述のステップＳ２１に戻って処理を行う。

　計画部２５は、上述のステップＳ２１～Ｓ２８を繰り返し行うことで、アクチュエーション部２２に向けて制御指令データを継続的に出力し、アクチュエーション部２２の駆動は、計画部２５からの制御指令データに基づいて制御される。

　なお上述の図８に示す例では、最初の制御周期（すなわち「ｔ＝０」）のみを初期段階に分類しているが、最初の２以上の任意の数の制御周期を初期段階に分類してもよい。

　以上説明したように本実施形態によれば、初期段階後のアクチュエーション部２２の駆動は、未来状態予測部２６から出力される予測状態情報に基づき生成される制御指令データに応じて、制御される。

　特に、本例の計画部２５は、センシング部２１からの状態情報を用いずに制御指令データを生成するため、第１遅延素子２３による遅延の影響を受けることなく制御指令データを生成することができる。

　また未来状態予測部２６は、第２遅延素子２４による遅延の影響を受けた後の制御周期タイミングに関する予測状態情報を、制御指令データから導出することができる。そのような予測状態情報に基づいて生成される制御指令データには、対象の制御周期における移動装置１０のより正確な状態を反映可能であるため、移動装置１０の状態に応じた最適なアクチュエーション部２２の駆動制御を実現できる。

　その結果、移動装置１０は滑らか且つ安定的に動作し、上述の振動現象やオーバーシュートなどの不具合の発生を効果的に回避しつつ、目標状態を精度良く達成することができる。

　また未来状態予測部２６は、センシング部２１からの状態情報を用いずに予測状態情報を導出するため、第１遅延素子２３による遅延の影響を受けることなく予測状態情報を導出でき、予測状態情報を迅速に計画部２５に提供できる。そのため、計画部２５における制御指令データの生成の間隔（すなわち生成周期）を短縮化でき、アクチュエーション部２２を緻密に駆動することも可能である。

　また本実施形態の情報処理装置１５及び情報処理方法は、計画アルゴリズムの実装の仕方に依存することなくアクチュエーション部２２の駆動を制御でき、遅延要因に起因する移動装置１０の動作品質の低下を効果的に抑えられる。また一般的な計画アルゴリズムではレイテンシを取り扱うような拡張を容易にはシステムに適用できない場合もあるが、本実施形態の情報処理方法は様々なアルゴリズムに対して容易に適用可能である。

［第２実施形態］
　本実施形態において、上述の第１実施形態と同一又は対応の要素には同一の符号を付し、その詳細な説明は省略する。

　上述の第１実施形態において、初期段階の後のアクチュエーション部２２の駆動制御は、センシング部２１が取得する状態情報を用いることなく、予測状態情報に基づいて生成される制御指令データによって行われる。

　このようにして第１実施形態で用いられる予測状態情報は、移動装置１０の未来の予測状態のデータであって、移動装置１０の実際の状態に関するフィードバック情報が反映されていない。

　そのため初期段階の後に何らかの影響が移動装置１０に作用した場合、移動装置１０の実際の状態には適合しないアクチュエーション部２２の駆動制御が行われ、移動装置１０の挙動が不安定になりうることが想定される。

　移動装置１０の挙動を不安定にしうる影響の例として、ハードウェアブレーキによる制動、移動装置１０に対する向かい風、及び移動装置１０に想定外の重量が作用してアクチュエーション部２２が適切に動作できない場合などが挙げられる。

　このような予測不能な影響が移動装置１０に作用する場合、例えば移動装置１０の急発進やアクチュエーション部２２の駆動精度の低下などが生じ、移動装置１０の挙動が不安定になることがある。

　以下に説明する情報処理装置１５及び情報処理方法によれば、センシング部２１が取得する状態情報に基づき、未来状態予測部２６により導出される予測状態情報が検証され、必要に応じて予測状態情報の補正やアクチュエーション部２２の駆動停止が行われる。そのため、移動装置１０の実際の状態に適合した高精度な制御を、アクチュエーション部２２の駆動に対して行うことができる。

　図９は、第２実施形態に係る移動装置１０の機能構成の一例を示すブロック図である。

　図９に示す移動装置１０は、センシング部２１、アクチュエーション部２２、第１遅延素子２３、第２遅延素子２４、計画部２５及び未来状態予測部２６に加え、状態検証部２７を備える。すなわち本実施形態の情報処理装置１５は、計画部２５及び未来状態予測部２６に加え、状態検証部２７を更に含む。

　状態検証部２７は、センシング部２１から出力される状態情報と、未来状態予測部２６から出力される予測状態情報との間の整合性を検証する。

　状態検証部２７は、未来状態予測部２６から送られてくる予測状態情報と、センシング部２１から送られてくる状態情報とを記憶するための記憶部（図示省略）を有する。状態検証部２７は、必要な状態情報及び予測状態情報を当該記憶部から読み出して検証に用いることができる。

　状態検証部２７は、状態情報と予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、当該補正情報を未来状態予測部２６に送る。

　また状態検証部２７は、当該検証の結果、状態情報と予測状態情報との間の相違が許容基準よりも大きい場合、アクチュエーション部２２を安全モードで駆動させる制御指令データを出力する。

　安全モードでのアクチュエーション部２２の駆動の内容は限定されず、移動装置１０の特性や状況に応じて決められる。本例の状態検証部２７は、アクチュエーション部２２の駆動を停止させるための停止指示信号を、「アクチュエーション部２２を安全モードで駆動させる制御指令データ」として計画部２５に送信する。

　このように状態検証部２７は、未来状態予測部２６からの予測状態情報を、センシング部２１からの状態情報に照らし合わせることで、移動装置１０の実際状態（状態情報）に対する予測状態（予測状態情報）の正確さを検証する。

　未来状態予測部２６は、計画部２５から出力される制御指令データに基づいて予測状態情報を導出し、当該予測状態情報を計画部２５に送る。ただし本実施形態の未来状態予測部２６は、計画部２５からの１以上の制御指令データだけではなく、状態検証部２７からの補正情報にも基づいて、予測状態情報を導出する。

　これにより予測状態情報は、状態検証部２７の検証結果を反映した補正情報に基づいて補正された情報として、未来状態予測部２６により導出される。

　計画部２５は、上述の第１実施形態と同様にして制御指令データを生成し、当該制御指令データを第２遅延素子２４を介してアクチュエーション部２２に送信するとともに、未来状態予測部２６に送信する。

　ただし本実施形態の計画部２５は、状態検証部２７からの停止指示信号を受信した場合（すなわち状態情報と予測状態情報との間の相違が許容基準よりも大きい場合）、アクチュエーション部２２を停止させる制御指令データを生成する。そして計画部２５は当該制御指令データをアクチュエーション部２２に向けて出力し、アクチュエーション部２２の駆動が停止される。

　移動装置１０の他の構成は、上述の第１実施形態に係る移動装置１０の構成と同様である。

　図１０は、初期段階（特に「制御周期ｔ＝０」）における図９に示す移動装置１０の機能構成の一例を示すブロック図である。図１１は、初期段階の後における図９に示す移動装置１０の機能構成の一例を示すブロック図である。図１２は、第２実施形態に係る移動装置１０において、初期段階の後に行われる処理フローの一例を示す。

　まずアクチュエーション部２２の制御の初期段階における情報処理方法の一例について説明する。

　初期段階では、図１０に示すように、センシング部２１により取得された状態情報Ｓ（０）が第１遅延素子２３を介して計画部２５に送られ、計画部２５により状態情報Ｓ（０）に基づいて制御指令データＣ（０）が生成される。制御指令データＣ（０）は、計画部２５から第２遅延素子２４を介してアクチュエーション部２２に送られ、アクチュエーション部２２は制御指令データＣ（０）に応じて駆動される。また制御指令データＣ（０）は、計画部２５から未来状態予測部２６にも送られ、未来状態予測部２６は、制御指令データＣ（０）に基づいて、次の制御周期に関する予測状態情報Ｆ（１）を生成する。

　予測状態情報Ｆ（１）は、計画部２５に送られるとともに、状態検証部２７に送られる。

　計画部２５に送られる予測状態情報Ｆ（１）は、上述の第１実施形態と同様に、制御指令データＣ（１）の生成のための基礎情報として用いられる。

　一方、状態検証部２７に送られる予測状態情報Ｆ（１）は、検証のために、センシング部２１から状態検証部２７に送られる状態情報Ｓ（１）との比較に用いられる。

　なお初期段階における状態情報Ｓ（０）（すなわち最初の制御周期に関する状態情報Ｓ（０））は、図１０に示す例ではセンシング部２１から第１遅延素子２３を介して状態検証部２７に送られるが、状態検証部２７に送られなくてもよい。

　次に、初期段階の後における情報処理方法の一例について説明する。

　初期段階の後に行われる情報処理方法では、図１１に示すように、計画部２５が生成した制御指令データＣ（ｔ）が第２遅延素子２４を介してアクチュエーション部２２に送られ、当該制御指令データＣ（ｔ）に基づいてアクチュエーション部２２が駆動される。

　本実施形態の制御指令データＣ（ｔ）も、上述の第１実施形態と同様のやり方で予測状態情報Ｆ（ｔ）に基づいて生成され、第２遅延素子２４による遅延の影響が解消又は低減されている。

　一方、センシング部２１によって状態情報Ｓ（ｔ）が取得され（図１２のＳ３１）、当該状態情報Ｓ（ｔ）がセンシング部２１から第１遅延素子２３を介して状態検証部２７に送られる。

　なお図１１に示す例では、状態情報Ｓ（ｔ）は計画部２５にも送られて計画部２５の記憶保持部（図示省略）に記憶保持されるが、状態情報Ｓ（ｔ）は計画部２５に送られなくてもよい。

　そして状態検証部２７により、状態情報Ｓ（ｔ）及び予測状態情報Ｆ（ｔ）に基づいて補正情報Ｇ（ｔ）が生成され（Ｓ３２）、当該補正情報Ｇ（ｔ）が未来状態予測部２６に送られる。そして、未来状態予測部２６により制御指令データＣ（ｔ）及び補正情報Ｇ（ｔ）に基づいて予測状態情報Ｆ（ｔ＋１）が導出され（Ｓ３３）、当該予測状態情報Ｆ（ｔ＋１）が未来状態予測部２６から計画部２５に送られる。

　補正情報Ｇ（ｔ）は、状態情報Ｓ（ｔ）及び予測状態情報Ｆ（ｔ）の差に基づいて導出される情報であり、予測状態情報を補正して対応の状態情報に近づけるのに必要な補正量を示す。したがって補正情報Ｇ（ｔ）に基づいて導出される予測状態情報Ｆ（ｔ＋１）は、移動装置１０の実際の状態に基づいて補正された情報となる。

　なお状態情報Ｓ（ｔ）及び予測状態情報Ｆ（ｔ）の差が全くない場合又は十分に小さい場合、状態検証部２７は、予測状態情報Ｆ（ｔ＋１）の補正が不要であると判定してもよい。この場合、状態検証部２７から未来状態予測部２６に補正情報Ｇ（ｔ）が送られなくてもよいし、予測状態情報の補正が不要であることを実質的に示す補正情報Ｇ（ｔ）が状態検証部２７から未来状態予測部２６に送られてもよい。

　状態検証部２７から未来状態予測部２６に補正情報Ｇ（ｔ）が送られない場合、未来状態予測部２６は制御指令データＣ（ｔ）に基づいて予測状態情報Ｆ（ｔ＋１）を導出する。補正が不要であることを示す補正情報Ｇ（ｔ）が状態検証部２７から未来状態予測部２６に送られる場合、未来状態予測部２６は、補正情報Ｇ（ｔ）による補正を実質的に受けていない予測状態情報Ｆ（ｔ＋１）を、制御指令データＣ（ｔ）に基づいて導出する。

　そして計画部２５では予測状態情報Ｆ（ｔ＋１）に基づいて制御指令データＣ（ｔ＋１）が生成され（Ｓ３４）、当該制御指令データＣ（ｔ＋１）が計画部２５から第２遅延素子２４を介してアクチュエーション部２２に送られる。

　そして、アクチュエーション部２２は制御指令データＣ（ｔ＋１）に基づいて駆動される（Ｓ３５）。

　このように上記初期段階の後では、上述のステップＳ３１～Ｓ３５が繰り返されることにより、予測状態情報及び補正情報から生成される制御指令データに基づいて、アクチュエーション部２２の駆動が継続的に制御される。

　特に、未来状態予測部２６が生成する予測状態情報は、移動装置１０の現実の状態を示すセンシング部２１からの状態情報に基づいて補正され、計画部２５が生成する制御指令データはそのような補正後の予測状態情報に基づいて導出される。

　そのため、移動装置１０の現実の状態に適合した制御指令データを計画部２５で生成することができ、そのような制御指令データに基づいて、移動装置１０の現実の状態に最適化されたアクチュエーション部２２の駆動制御を行うことができる。

　なお本例では、状態検証部２７における検証の結果、状態情報Ｓ（ｔ）と予測状態情報Ｆ（ｔ）との間の相違が許容基準よりも大きい場合、状態検証部２７は停止指示信号Ｅを計画部２５に送信する。計画部２５は、停止指示信号Ｅを受信した場合、アクチュエーション部２２の駆動制御を終了する制御指令データをアクチュエーション部２２に送り、アクチュエーション部２２の駆動が停止される。

　以上説明したように本実施形態によれば、未来状態予測部２６が導出する予測状態情報の正確さが、センシング部２１のセンシング結果（状態情報）に基づいて検証される。そして当該検証の結果から生成される補正情報に基づいて予測状態情報は補正され、当該補正後の予測状態情報に基づいて制御指令データが生成され、当該制御指令データに基づいてアクチュエーション部２２の駆動が制御される。

　これにより未来状態予測部２６における予測状態情報の予測精度が向上し、移動装置１０の実際の状態に応じた制御指令データが計画部２５で生成され、移動装置１０の実際の状態に最適化された制御によってアクチュエーション部２２が駆動される。

　また検証の結果、予測状態情報と状態情報との間に許容できない乖離があった場合、アクチュエーション部２２が安全モードで駆動され、移動装置１０は緊急停止などの危機回避動作をとって、安全性を確保できる。

　また第１遅延素子２３による遅延の影響を受けるセンシング部２１からの状態情報は、そのような遅延の影響がアクチュエーション部２２の駆動に対して実質的に影響を及ぼさない態様で、駆動精度の向上に役立つように利用される。そのため本実施形態によれば、予測不能な影響が移動装置１０に作用しうる環境下においても、実際の移動装置１０の状態に応じた最適なアクチュエーション部２２の駆動制御を行うことができる。

［変形例］
　本開示の技術は、上述の実施形態には限定されない。

　例えば、上述の情報処理装置１５及び情報処理方法の適用対象は限定されない。装置全体の位置が経時的に変わりうる移動装置（例えば車両）１０に対してだけではなく、装置の一部の位置が経時的に変わりうる装置や、装置の姿勢や他の状態が経時的に変わりうる装置に対しても、上述の情報処理装置１５及び情報処理方法は適用可能である。

　本明細書で開示されている実施形態及び変形例はすべての点で例示に過ぎず限定的には解釈されないことに留意されるべきである。上述の実施形態及び変形例は、添付の特許請求の範囲及びその趣旨を逸脱することなく、様々な形態での省略、置換及び変更が可能である。例えば上述の実施形態及び変形例が全体的に又は部分的に組み合わされてもよく、また上述以外の実施形態が上述の実施形態又は変形例と組み合わされてもよい。また、本明細書に記載された本開示の効果は例示に過ぎず、その他の効果がもたらされてもよい。

　上述の技術的思想を具現化する技術的カテゴリーは限定されない。例えば上述の装置を製造する方法或いは使用する方法に含まれる１又は複数の手順（ステップ）をコンピュータに実行させるためのコンピュータプログラムによって、上述の技術的思想が具現化されてもよい。またそのようなコンピュータプログラムが記録されたコンピュータが読み取り可能な非一時的（non-transitory）な記録媒体によって、上述の技術的思想が具現化されてもよい。

［付記］
　本開示は以下の構成をとることもできる。

［項目１］
　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、
　前記予測状態情報に基づいて前記制御指令データを生成する計画部と、
　を備える情報処理装置。

［項目２］
　前記計画部は、直前に生成した前記制御指令データを含む前記１以上の制御指令データに基づいて導出される前記予測状態情報から、次の前記制御指令データを生成する項目１に記載の情報処理装置。

［項目３］
　初期段階において、前記計画部は、センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記制御指令データを生成し、
　前記初期段階よりも後の段階において、前記計画部は、前記状態情報に基づくことなく、前記予測状態情報に基づいて前記制御指令データを生成する項目１又は２に記載の情報処理装置。

［項目４］
　センシング部から出力される前記移動装置の状態を表す状態情報と、前記予測状態情報との間の整合性を検証する状態検証部を備える項目１～３のいずれかに記載の情報処理装置。

［項目５］
　前記状態検証部は、前記状態情報と前記予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、
　前記未来状態予測部は、前記１以上の制御指令データ及び前記補正情報に基づいて、前記予測状態情報を導出する項目４に記載の情報処理装置。

［項目６］
　前記計画部は、前記状態情報と前記予測状態情報との間の相違が許容基準よりも大きい場合、前記アクチュエーション部を安全モードで駆動させる前記制御指令データを出力する項目４又は５に記載の情報処理装置。

［項目７］
　前記移動装置は、前記アクチュエーション部及びセンシング部を具備し、前記センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記アクチュエーション部が制御されて自律的に移動する項目１～６のいずれかに記載の情報処理装置。

［項目８］
　前記移動装置は、車両である項目１～７のいずれかに記載の情報処理装置。

［項目９］
　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する工程と、
　前記予測状態情報に基づいて前記制御指令データを生成する工程と、
　を含む情報処理方法。

［項目１０］
　コンピュータに、
　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する手順と、
　前記予測状態情報に基づいて前記制御指令データを生成する手順と、
　を実行させるためのプログラム。

１０　移動装置
１０Ｆ　装置前部
１５　情報処理装置
２１　センシング部
２２　アクチュエーション部
２３　第１遅延素子
２４　第２遅延素子
２５　計画部
２６　未来状態予測部
２７　状態検証部
Ｃ　制御指令データ
Ｅ　停止指示信号
Ｆ　予測状態情報
Ｇ　補正情報
Ｓ　状態情報
Ｔｇ　目標

Claims

　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、
　前記予測状態情報に基づいて前記制御指令データを生成する計画部と、
　を備える情報処理装置。
　前記計画部は、直前に生成した前記制御指令データを含む前記１以上の制御指令データに基づいて導出される前記予測状態情報から、次の前記制御指令データを生成する請求項１に記載の情報処理装置。
　初期段階において、前記計画部は、センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記制御指令データを生成し、
　前記初期段階よりも後の段階において、前記計画部は、前記状態情報に基づくことなく、前記予測状態情報に基づいて前記制御指令データを生成する請求項１に記載の情報処理装置。
　センシング部から出力される前記移動装置の状態を表す状態情報と、前記予測状態情報との間の整合性を検証する状態検証部を備える請求項１に記載の情報処理装置。
　前記状態検証部は、前記状態情報と前記予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、
　前記未来状態予測部は、前記１以上の制御指令データ及び前記補正情報に基づいて、前記予測状態情報を導出する請求項４に記載の情報処理装置。
　前記計画部は、前記状態情報と前記予測状態情報との間の相違が許容基準よりも大きい場合、前記アクチュエーション部を安全モードで駆動させる前記制御指令データを出力する請求項４に記載の情報処理装置。
　前記移動装置は、前記アクチュエーション部及びセンシング部を具備し、前記センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記アクチュエーション部が制御されて自律的に移動する請求項１に記載の情報処理装置。
　前記移動装置は、車両である請求項１に記載の情報処理装置。
　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する工程と、
　前記予測状態情報に基づいて前記制御指令データを生成する工程と、
　を含む情報処理方法。
　コンピュータに、
　移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの１以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する手順と、
　前記予測状態情報に基づいて前記制御指令データを生成する手順と、
　を実行させるためのプログラム。