WO2022244329A1

WO2022244329A1 - 情報処理装置、情報処理方法、及び、プログラム

Info

Publication number: WO2022244329A1
Application number: PCT/JP2022/004384
Authority: WO
Inventors: 英祐野村
Original assignee: ソニーグループ株式会社
Priority date: 2021-05-20
Filing date: 2022-02-04
Publication date: 2022-11-24
Also published as: JPWO2022244329A1

Abstract

本技術は、遠隔の操作対象からのセンサ情報に基づいて操作者が操作対象を意図通りに遠隔操作することを容易にすることができるようにする情報処理装置、情報処理方法、及び、プログラムに関する。位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示されるセンサデータの補正が行われる。

Description

情報処理装置、情報処理方法、及び、プログラム

　本技術は、情報処理装置、情報処理方法、及び、プログラムに関し、特に、遠隔の操作対象からのセンサ情報に基づいて操作者が操作対象を意図通りに遠隔操作することを容易にした情報処理装置、情報処理方法、及び、プログラムに関する。

　特許文献１には、ヘッドマウントドディスプレイの姿勢変化に連動して姿勢が変化するカメラの画像を、ヘッドマウントディスプレイの姿勢情報とカメラの撮影時の姿勢情報の差分に基づいて補正してヘッドマウントディスプレイに表示することが開示されている。

国際公開第２０１９／１７６０３５号

　操作対象と、操作対象を遠隔操作する操作者との間では、操作者から操作対象への情報伝達時、及び、操作対象から操作者への情報伝達時に、通信遅延を代表とするシステム遅延が生じる。そのシステム遅延のため、操作対象からのカメラ画像等のセンサ情報に基づいて、操作者が意図通りに操作対象を遠隔操作することが難しい場合があった。

　本技術はこのような状況に鑑みてなされたものであり、遠隔の操作対象からのセンサ情報に基づいて操作者が操作対象を意図通りに遠隔操作することを容易にする。

　本技術の情報処理装置、又は、プログラムは、位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う処理部を有する情報処理装置、又は、そのような情報処理装置として、コンピュータを機能させるためのプログラムである。

　本技術の情報処理方法は、処理部を有する情報処理装置の前記処理部が、位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う情報処理方法である。

　本技術の情報処理装置、情報処理方法、及び、プログラムにおいては、位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示されるセンサデータの補正が行われる。

本技術が適用された遠隔操作システムの実施の形態の構成例を示すブロック図である。操作対象システムの構成例を示したブロック図である。操作者システムの構成例を示したブロック図である。遠隔操作システムの全体処理（表示処理）を例示したフローチャートである。遅延L1により操作者が意図通りに操作対象を遠隔操作することが困難となる状況を説明した図である。第１の仮定の場合において遠隔操作システムが実施するカメラ画像の補正処理の第１形態を表した時系列処理フロー図である。遠隔操作システム１において表示されるカメラ画像（予測画像）における対象画像の位置を表した図である。第１の仮定の場合において遠隔操作システムが実施するカメラ画像の補正処理の第２形態を表した時系列処理フロー図である。遅延L2により操作者が意図通りに操作対象を遠隔操作することが困難となる状況を説明した図である。第２の仮定の場合において遠隔操作システムが実施するカメラ画像の補正処理を表した時系列処理フロー図である。遅延L1と遅延L2の両方が発生する場合（第１及び第２の仮定の場合）において遠隔操作システム１が実施するカメラ画像の補正処理の第１形態を表した時系列処理フロー図である。遅延L1と遅延L2の両方が発生する場合（第１及び第２の仮定の場合）において遠隔操作システムが実施するカメラ画像の補正処理の第２形態を表した時系列処理フロー図である。撮影対象物が移動する場合の撮影対象物の予測位置のディスプレイへの表示例を示した図である。撮影対象物の予測位置の尤度に応じて対象画像の描画時のパラメータを変更する場合を示した図である。ディスプレイに表示するカメラ画像の表示パターンを説明した図である。一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　以下、図面を参照しながら本技術の実施の形態について説明する。

＜遠隔操作システムの実施の形態＞
　図１は、本技術が適用された遠隔操作システムの実施の形態の構成例を示すブロック図である。

　図１の本実施の形態の遠隔操作システム１は、操作対象システム１１と操作者システム１２とを有する。操作対象システム１１と操作者システム１２との間は相互に情報伝達可能に通信により接続（通信接続）される。操作対象システム１１は、操作者システム１２からの操作指令（操作者の操作）に従って動作する被操作装置を含む。操作者システム１２は、被操作装置の動作を操作者（ユーザ）が操作する操作装置を含む。

　例えば、遠隔操作システム１には、次の形態が含まれる。位置及び姿勢のうちの少なくとも一方（位置姿勢という）が遠隔操作される被操作装置（移動装置）にカメラが搭載（支持を含む）される。被操作装置は、例えば、車、ドローン、ロボット、衛星、電車、雲台などのカメラを搭載可能な装置である。操作者は、被操作装置のカメラで撮影されたカメラ画像（撮影画像）をディスプレイで見ながら操作装置により被操作装置の位置姿勢を遠隔操作する。この場合に、操作対象システム１１は、被操作装置及びカメラを含む。操作者システムは、操作装置及びディスプレイを含む。

　ただし、本技術は、操作対象システム１１の被操作装置に搭載される対象がカメラ以外のセンサである場合の遠隔操作システム１に適用され得る。操作対象システム１１の被操作装置に搭載される対象がカメラに限定されないセンサの場合において、センサの位置姿勢が被操作装置の位置姿勢に応じて変化し、センサのセンシング方向等が変化する。操作対象システム１１は、センサで取得されたセンサ情報（センサデータ）を操作者システム１２に伝送する。操作者システム１２は、操作対象システム１１からのセンサ情報を操作者が認識できるようにディスプレイに提示する。本技術は、更に、操作者システム１２からの操作指令により操作される操作対象システム１１の被操作装置がセンサを搭載した装置以外である場合の遠隔操作システム１に対しても適用され得る。

　本技術は、遠隔操作アバターを用いたリモート会議、遠隔操作ロボットによる遠隔医療、ISS（国際宇宙ステーション）や衛星など宇宙空間に配置されたカメラの遠隔操作などの任意の遠隔操作技術において適用され得る。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　以下において、操作対象は、カメラ（撮像部４１）を搭載する被操作装置の位置姿勢やパン角度・チルト角度のようなカメラの位置姿勢にかかわる対象であることとし、操作対象をカメラの位置姿勢ともいう。

＜操作対象システム１１＞
　図２は、図１の操作対象システム１１の構成例を示したブロック図である。以下の説明では、操作対象システム１１は、カメラ及びカメラを搭載（支持）した被操作装置を含むシステムである場合を想定する。例えば、操作対象システム１１として、地球などの惑星を撮影対象物として、衛星に搭載したジンバルカメラ（雲台搭載カメラ）で惑星を撮影するシステム等が該当する。

　操作対象システム１１は、撮像部（カメラ）４１、センサ部４２、記録部４３、制御部４４、通信部４５、及び、画像処理演算部４６を有する。

　撮像部４１は、カメラであり、例えば、被操作装置に対して固定される。撮像部４１で撮像された画像（カメラ画像）は、画像処理演算部４６に供給される。

　センサ部４２は、被操作装置（撮像部４１）の位置姿勢を測定するセンサ等を含む。センサ部４２で取得されたセンサデータは、画像処理演算部４６に供給される。

　記録部４３は、画像処理演算部４６で参照されるデータ、画像処理演算部４６で生成されたデータ、撮像部４１で取得されたカメラ画像等を記憶する。

　制御部４４は、被操作装置（撮像部４１）の位置姿勢を変化させるアクチュエータを制御する。制御部４４は、画像処理演算部４６から供給される制御信号に従って、それらのアクチュエータを制御する。

　通信部４５は、操作者システム１２と間の通信を制御する。通信部４５は、有線若しくは無線によるLAN（Local Area Network）、Bluetooth（登録商標）、又は、WUSB（Wireless USB）等の任意の通信規格に準拠した通信を行う場合であってよい。通信部４５は、操作者システム１２と、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信、又は、衛星通信などの通信回線を介して通信を行う場合であってよい。

　画像処理演算部４６は、センサ部４２から供給されるセンサデータ及び撮像部４１から供給される画像（カメラ画像）に基づいて、被操作装置（撮像部４１）の位置姿勢を算出する処理や、未来における被操作装置（撮像部４１）の位置姿勢を予測する処理などを行う。画像処理演算部４６は、撮像部４１から供給されたカメラ画像、及び、予測した被操作装置（撮像部４１）の位置姿勢（予測位置姿勢）等のデータを通信部４５及び通信回線を介して操作者システム１２に供給する。なお、画像処理演算部４６の詳細な処理内容については後述する。

＜操作者システム１２＞
　図３は、図１の操作者システム１２の構成例を示したブロック図である。以下の説明では、操作者システム１２は、操作対象システム１１の撮像部４１（カメラ）で撮影されたカメラ画像を表示するディスプレイ、及び、操作対象システム１１を遠隔で操作するための操作装置（入力インタフェース）を含むものとする。操作装置は、ゲームパッドの様なコントローラーデバイス，車のハンドル型のコントローラーデバイス、モバイルデバイスに搭載されるタッチパネル、パソコンのキーボードなどの操作対象の操作に適した入力インタフェース群である場合を想定する。

　操作者システム１２は、操作部８１、記録部８２、表示部８３、通信部８４、及び、画像処理演算部８５を有する。

　操作部８１は、操作者の操作をセンサにより検出する。操作部８１で検出された操作者の操作を示す操作データは、画像処理演算部８５に供給される。

　記録部４３は、画像処理演算部８５で参照されるデータや画像処理演算部８５で生成されたデータ等を記憶する。

　表示部８３は、操作者にカメラ画像を提示するディスプレイである。表示部８３は、画像処理演算部８５から供給されるカメラ画像を表示する。

　通信部８４は、操作対象システム１１と間の通信を制御する。通信部８４は、有線若しくは無線によるLAN（Local Area Network）、Bluetooth（登録商標）、又は、WUSB（Wireless USB）等の任意の通信規格に準拠した通信を行う場合であってよい。通信部８４は、操作対象システム１１と、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信、又は、衛星通信などの通信回線を介して通信を行う場合であってよい。

　画像処理演算部８５は、操作対象システム１１から通信部８４を介して供給されるカメラ画像及び予測位置姿勢等のデータに基づいて表示部８３に表示させるカメラ画像の補正処理等を行う。画像処理演算部８５は、補正したカメラ画像を表示部８３に供給して表示部８３に表示させる。画像処理演算部８５は、操作部８１から供給される操作データに基づいて操作者の操作を検出し、操作者の操作に基づく操作指令等のデータを通信部８４及び通信回線を介して操作対象システム１１に供給する。なお、画像処理演算部８５の詳細な処理内容については後述する。

＜遠隔操作システム１の全体処理＞
　図４は、遠隔操作システム１の全体処理（表示処理）を例示したフローチャートである。

　ステップＳ１１では、操作対象システム１１又は操作者システム１２は、操作対象システム１１から操作者システム１２へのデータ通信時の遅延L1を推定する。遅延L1は、遅延時間及び遅延の種類を表す。

　ステップＳ１２では、操作対象システム１１又は操作者システム１２は、操作者システム１２から操作対象システム１１へのデータ通信時の遅延L2を推定する。遅延L2は、遅延時間及び遅延の種類を表す。

　ステップＳ１３では、操作対象システム１１又は操作者システム１２は、操作者システム１２のカメラ（撮像部４１）で各フレームのカメラ画像が撮影された時刻Tとして、時刻T+L1+L2の操作対象の予測位置姿勢に基づき、各フレームのカメラ画像の補正を行う。操作者システム１２は、補正されたカメラ画像のディスプレイ（表示部８３）へのUI（User Interface）表示（操作者への提示）を行う。

　ステップＳ１４では、操作対象システム１１又は操作者システム１２は、操作者システム１２のカメラ（撮像部４１）で各フレームのカメラ画像が撮影された時刻Tとして、時刻T+L1+L2の撮影対象物のカメラ画像内での予測位置に基づき、各フレームのカメラ画像の補正を行う。操作者システム１２は、補正されたカメラ画像のディスプレイ（表示部８３）へのUI表示（操作者への提示）を行う。

　なお、ステップＳ１３及びステップS１４のカメラ画像の補正及びUI表示は、統合的に行われる。

＜カメラ画像の補正処理の詳細＞
　ディスプレイ（表示部８３）に表示するカメラ画像の補正について、以下の３つの場合を仮定して説明する。

第１の仮定：操作対象システム１１から操作者システム１２へのデータ通信時に遅延L1が発生する場合
第２の仮定：操作者システム１２から操作対象システム１１へのデータ通信時に遅延L2が発生する場合
第３の仮定：撮影対象物が移動する場合

＜第１の仮定の場合＞
　第１の仮定の場合には、遠隔操作システム１は、遅延L1に対応した処理として図４のステップＳ１１及びステップＳ１３の処理を実施する。

　遅延L1が発生する代表的な要因としては、撮影遅延、画像処理遅延、通信遅延、及び、表示遅延がある。撮影遅延とは、操作対象システムのカメラ（撮像部４１）によるカメラ画像の撮影開始からカメラ画像のデータ保存（記録）までに要する撮影時間及びそれによる遅延を表す。画像処理遅延とは、操作対象システム１１がカメラ画像に対して画像処理を行う時間及びそれによる遅延を表す。通信遅延とは、操作対象システム１１から操作者システム１２へのデータ通信に要する通信時間及びそれによる遅延を表す。表示遅延とは、操作者システム１２がカメラ画像などを受信してからディスプレイ（表示部８３）に表示するまでに要する表示時間及びそれによる遅延を表す。

　これらの要因により、操作対象システム１１から操作者システム１２へのデータ通信時の遅延L1が発生する場合、操作者が意図通りに操作対象を遠隔操作することが困難となる。

　図５は、遠隔操作システム１において本技術を適用しないと仮定した場合に、遅延L1により操作者が意図通りに操作対象を遠隔操作することが困難となる状況を説明した図である。

　図５の見出し行において、時刻T1は、操作対象システム１１のカメラで所定フレームのカメラ画像が撮影された時刻を表す。時刻T1+L1は、時刻T1で撮影されたカメラ画像が遅延L1により操作者システム１２のディスプレイに表示される時刻を表す。

　第１行目の図は、時刻T1と時刻T1+L1とのそれぞれの時刻での操作対象（カメラ）と撮影対象物Ｍとの位置関係を表す。これによれば、時刻T1では、撮影対象物Ｍがカメラの撮影中心（光軸方向）に対して右側の方向に存在する。時刻T1から時刻T1+L1までの間に、カメラの位置姿勢が変化して、時刻T1+L1では、撮影対象物Ｍがカメラのほぼ撮影中心に存在する。

　第２行目の図は、時刻T1でカメラが撮影したカメラ画像ＳＡにおける撮影対象物Ｍの画像（対象画像）ＭＡの位置を表す。これによれば、時刻T1では、対象画像ＭＡが、カメラ画像ＳＡの中心に対して右寄りに位置に映る。

　第３行目の図は、時刻T1+L1でディスプレイに表示されるカメラ画像ＳＡにおける対象画像ＭＡの位置を表す。これによれば、時刻T1+L1では、遅延L1により時刻T1で撮影されたカメラ画像ＳＡがそのままディスプレイに表示される。即ち、ディスプレイに表示されるカメラ画像ＳＡには、対象画像ＭＡがカメラ画像ＳＡの中心に対して右寄りの位置に映る。したがって、時刻T1+L1でディスプレイに表示されるカメラ画像ＳＡから操作者が把握する撮影対象物Ｍの位置が、第１行目の図の時刻T1+L1でのカメラに対する撮影対象物Ｍの位置と異なる。

　この場合に、時刻T1+L1で操作者が、過去の時刻T1のカメラ画像ＳＡに映る対象画像ＭＡがカメラ画像ＳＡの中心に映るようにカメラを矢印１２１で示された右方向にパンニングする操作を行うと、撮影対象物Ｍがカメラの撮影中心に対して左方向に相対的に移動する。これによって、カメラ画像ＳＡに映る対象画像ＭＡがカメラ画像ＳＡの中心に対して左側に移動し、対象画像ＭＡがカメラ画像ＳＡから外れてしまう事態が生じる場合がある。

　本技術が適用された遠隔操作システム１では、このような事態が解決される。本技術が適用された遠隔操作システム１では、図４のステップＳ１１において、操作対象システム１１又は操作者システム１２が、遅延L1（遅延時間L1）を推定する。遅延時間L1を推定すると、図４のステップＳ１３において、操作対象システム１１又は操作者システム１２が、時刻Tでのカメラの位置姿勢に対して時刻T+L1でのカメラの位置姿勢を予測する。操作対象システム１１又は操作者システム１２は、時刻T+L1でディスプレイに表示されるカメラ画像が、予測した時刻T+L1での位置姿勢でカメラが撮影するカメラ画像となるように時刻Tでカメラが撮影したカメラ画像を補正する。

　なお、ある時刻においてディスプレイに表示されるカメラ画像を、その時刻の表示画像といい、ある時刻においてカメラで実際に撮影されるカメラ画像を、その時刻のカメラ画像といい、予測された所定の時刻の位置姿勢のカメラで撮影されるカメラ画像を、予測画像というものとする。このとき、図４のステップＳ１３における操作対象システム１１又は操作者システム１２のカメラ画像の補正処理は、時刻Tのカメラ画像を補正することにより、時刻T+L1の表示画像である時刻T+L1の予測画像を生成する処理である。

＜第１の仮定の場合の時系列処理＞
（第１形態）
　図６は、第１の仮定の場合において遠隔操作システム１が実施するカメラ画像の補正処理の第１形態を表した時系列処理フロー図である。

　図６において、横軸は時刻を表す。図６のＡは、操作対象システム１１での処理を表し、図６のＢは、操作者システム１２での処理を表す。

　図６のＡにおいて、処理Ｐ１は、操作対象システム１１がカメラによる所定フレームの撮影を開始し、撮影したフレームのカメラ画像を操作者システム１２に送信するまでの一連の処理を表す。処理Ｐ１では、時刻T1から時系列順に、撮影、画像処理、位置姿勢予測、及び、データ送信が行われる。

　処理Ｐ１における撮影は、図２の操作対象システム１１における撮像部４１（カメラ）が撮影範囲の被写体像を撮像してカメラ画像を取得する処理である。画像処理は、図２の画像処理演算部４６が実施する処理であり、例えば、自己位置姿勢推定、撮影対象物の物体検出、及び、撮影対象物のトラッキング等の処理を含む。

　自己位置姿勢推定は、カメラ（被操作装置）の現在（時刻T1）の位置姿勢を推定する処理である。画像処理演算部４６は、例えば、SLAM（Simultaneous Localization and Mapping）の技術を用いてカメラの現在の位置姿勢を自己位置姿勢として推定する。図２の操作対象システム１１において、画像処理演算部４６の位置姿勢推定・環境認識部６１は、センサ部４２からのセンサデータに基づいて、SLAMの処理を実行し、自己位置姿勢（カメラの位置姿勢）の推定と、環境地図の作成とを行う。SLAMに用いられるセンサ部４２のセンサとしては、例えば、単眼カメラ（広角カメラ、魚眼カメラ、全天球カメラ）、複眼カメラ（ステレオカメラ、マルチカメラ）、又は、RGB-Dカメラ（深度カメラやToFカメラ）が被操作装置に搭載される。センサ部４２のカメラは、撮像部４１として示したカメラであってもよい。センサ部４２のセンサとしてIMU（Inertial Measurement Unit）などの物理量（速度、加速度、角速度等）を計測するセンサを被操作装置に搭載してカメラの位置姿勢を推定してもよいし、カメラと物理量を計測するセンサとのフュージョンによりカメラ（撮像部４１）の位置姿勢を推定してもよい。なお、図６の処理Ｐ１の画像処理における自己位置姿勢推定以外の処理については後述する。

　処理Ｐ１における位置姿勢予測は、図２の画像処理演算部４６が実施する処理であり、未来のカメラの位置姿勢を予測する処理である。図２の操作対象システム１１において、画像処理演算部４６の位置姿勢予測部６２は、位置姿勢推定・環境認識部６１での自己位置姿勢推定の結果であるカメラの位置姿勢、速度、及び、加速度に基づいて、時刻T1以降のカメラの位置姿勢を予測する。例えば、位置姿勢予測部６２は、カメラ（被操作装置）の運動方程式を定式化し、自己位置姿勢推定（SLAM）により得られたカメラ（被操作装置）の位置姿勢、速度、及び、加速度を初期値として、時刻T1から時刻T1+Txまでの所定時間おきの時刻におけるカメラ（被操作装置）の位置姿勢を予測する。時間Txは、システム仕様上の発生し得る遅延時間L1の最長値である。予測されたカメラ（被操作装置）の位置姿勢を予測位置姿勢という。

　図６の処理Ｐ１におけるデータ送信は、画像処理演算部４６が、カメラ（撮像部４１）からのカメラ画像、及び、位置姿勢予測部６２で算出された予測位置姿勢等のデータを図２の通信部４５を通じて、操作者システム１２に送信する処理である。

　図６のＢにおいて、処理Ｐ２は、操作者システム１２が操作対象システム１１からのカメラ画像等のデータ受信を開始してカメラ画像をディスプレイ（表示部８３）に表示するまでの一連の処理を表す。処理Ｐ２では、時系列順に、データ受信、遅延L1推定、位置姿勢予測、及び、表示が行われる。表示が終了する時刻が時刻T1+L1である。

　処理Ｐ２におけるデータ受信は、図３の操作者システム１２における画像処理演算部８５が、処理Ｐ１のデータ送信において操作対象システム１１から送信されたカメラ画像及び予測位置姿勢等のデータを図３の通信部８４を通じて受信する処理である。

　処理Ｐ２における遅延L1推定は、図３の画像処理演算部８５が実施する処理であり、遅延時間L1を推定する処理である。遅延時間L1は、図６のように操作対象システム１１の処理Ｐ１における撮影が開始された時刻T1から操作者システム１２の処理Ｐ２における表示が終了する時刻までの時間である。

　図３の操作者システム１２において、画像処理演算部８５の遅延時間推定部１０１は、遅延L1の要因である上述の撮影遅延、画像処理遅延、通信遅延、及び、表示遅延ごとに遅延時間を推定し、それらの遅延要因ごとの遅延時間を足し合わせることで遅延時間L1を推定する。ただし、遅延L1の要因はこれに限らない。各遅延要因の遅延時間が遅延時間L1に占める割合は、遅延要因ごとに異なるため、遅延時間L1の推定の際に、遅延時間推定部１０１は、遅延時間L1に占める割合が十分小さい要因の遅延時間を無視する場合であってもよい。

　撮影遅延、画像処理遅延、及び、表示遅延のようにシステム仕様やスペックに依存する遅延要因の遅延時間は、システム仕様などから事前に見積ることが可能である。遅延時間推定部１０１は、システム仕様等に依存する遅延要因の遅延時間については事前に見積もられた遅延時間を図３の記録部８２から読み出して取得する。

　通信遅延のようにシステム仕様だけでなく通信データ容量、通信環境などの影響も受ける遅延要因の遅延時間については、遅延時間推定部１０１は、実際に発生した遅延時間を測定することで推定する。例えば、操作対象システム１１の画像処理演算部４６と、操作者システム１２の画像処理演算部８５とがNTP（Network Time Protocol）時刻、GPS（Global Positioning System）時刻などの共通の時刻を参照可能とする。操作対象システム１１の画像処理演算部４６は、図６の処理Ｐ１においてデータ送信を開始する際に現在の時刻を送信時刻の情報として操作者システム１２に送信する。操作者システム１２の遅延時間推定部１０１は、処理Ｐ２におけるデータ受信において操作対象システム１１から送信されたデータの受信を終了した際の現在の時刻を受信時刻として取得する。遅延時間推定部１０１は、操作対象システム１１からの送信時刻と受信時刻との差分を通信遅延の遅延時間として算出する。遅延時間推定部１０１は、通信遅延に限らず、他の遅延要因の遅延時間についても時刻情報に基づいて推定することができる。

　図６の処理Ｐ２における位置姿勢予測は、画像処理演算部８５が、操作対象システム１１からの予測位置姿勢と、遅延時間推定部１０１により推定された遅延時間L1とに基づいて、時刻T1+L1でのカメラの位置姿勢を予測する処理である。

　操作対象システム１１からの予測位置姿勢の情報には、上述のように時刻T1から時刻T1+Txまでの所定時間おきの時刻におけるカメラ（被操作装置）の予測位置姿勢の情報が含まれる。図３の画像処理演算部８５における位置姿勢予測部１０２は、それらの時刻の予測位置姿勢のうち、時刻T1+L1に最も近い時刻の予測位置姿勢を時刻T1+L1でのカメラ（被操作装置）の予測位置姿勢として決定する。

　図６の処理Ｐ２における表示は、画像処理演算部８５が、操作対象システム１１からの時刻T1のカメラ画像を、位置姿勢予測部１０２により得られた時刻T1+L1での予測位置姿勢のカメラで撮影されるカメラ画像（予測画像）となるように補正するカメラ画像の補正処理、及び、予測画像を操作者に提示するカメラ画像（表示画像）としてディスプレイ（表示部８３）に表示する処理である。

　図７は、遠隔操作システム１において、時刻T1及び時刻T1+L1でのカメラと撮影対象物との位置関係、カメラ（撮像部４１）が撮影したカメラ画像における対象画像の位置、ディスプレイ（表示部８３）に表示されるカメラ画像（予測画像）における対象画像の位置を表した図である。なお、図７において、図５と同一の構成要素には、図５と同一の符号を付してあり、適宜説明を省略する。

　図７の見出し行において、時刻T1は、操作対象システム１１のカメラで所定フレームのカメラ画像が撮影された時刻を表す。時刻T1+L1は、時刻T1で撮影されたカメラ画像が遅延L1により操作者システム１２のディスプレイに表示される時刻を表す。

　第１行目及び第２行目の図は、図５の矢印１２１が描画されていない点以外は共通するので説明を省略する。

　第３行目の図は、時刻T1+L1でディスプレイに表示されるカメラ画像ＳＡにおける対象画像ＭＡの位置を表す。時刻T1+L1のカメラ画像ＳＡは、図６の処理Ｐ２における表示でのカメラ画像の補正処理により補正された予測画像を表す。時刻T1+L1のカメラ画像ＳＡ（予測画像）に示された対象画像ＭＡ′は、時刻T１でカメラが撮影したカメラ画像（時刻T1のカメラ画像）がそのまま表示画像としてディスプレイに表示された場合の対象画像を表す。これによれば、操作者システム１２の画像処理演算部８５（位置姿勢予測部１０２）により決定された時刻T1+L1でのカメラの予測位置姿勢により、第１行目の時刻T1+L1でのカメラと撮影対象物Ｍとの実際の位置関係が予測される。画像処理演算部８５は、時刻T１のカメラ画像を補正することにより、時刻T1+L1での予測位置姿勢のカメラが撮影するカメラ画像（予測画像）を表示画像として生成する。これによって、時刻T1+L1においてカメラの撮影中心に撮影対象物Ｍが存在する場合には、第３行目の時刻T1+L1でのカメラ画像ＳＡのように、カメラ画像ＳＡ（予測画像）の中心に対象画像ＭＡが表示される。したがって、図５の第１行目の時刻T1+L1の図の矢印１２１のようにカメラの撮影中心を撮影対象物Ｍに向けるようとして操作者がカメラを右方向に向ける操作を行うことが回避される。

　ここで、画像処理演算部８５が、時刻T1+L1でのカメラの予測位置姿勢に応じて時刻T1のカメラ画像を補正する補正処理（時刻T1+L1の予測画像（表示画像）を生成する処理）は、特定の処理に限らない。例えば、カメラ画像の補正処理は、以下のような第１から第４までの処理であってよいし、他の処理であってもよい。

　第１の処理としては、時刻T1+L1でディスプレイに表示する時刻T1のカメラ画像の画面上での表示位置を、時刻T1+L1でのカメラの予測位置姿勢に応じてシフトさせる処理であってよい。第２の処理としては、カメラが撮影したカメラ画像全体の画像範囲に対してディスプレイに表示する画像範囲を小さくし、時刻T1+L1でのカメラの予測位置姿勢に応じて時刻T1+L1でディスプレイに表示する画像範囲をシフトさせる処理であってよい。第３の処理としては、センサ部４２の単眼カメラ（広角カメラ、魚眼カメラ、全天球カメラ）、複眼カメラ（ステレオカメラ、マルチカメラ）、若しくは、RGB-Dカメラ（深度カメラやToFカメラ）、又は、撮像部４１のカメラにより作成した時刻T1+L1での操作対象システム１１の周辺環境の3次元データを用いて、時刻T1+L1でのカメラの予測位置姿勢から撮影した周辺環境の撮影画像を生成する処理であってもよい。

　第４の処理としては、次のような処理であってよい。図２の操作対象システム１１の画像処理演算部８５が実施する図６の処理Ｐ１における画像処理において、撮影対象物Ｍの物体検出、又は、物体検出により検出済みの撮影対象物Ｍのトラッキングを行うことで、時刻T1のカメラ画像における撮影対象物Ｍの画像範囲（対象画像ＭＡの画像範囲）が抽出される。対象画像ＭＡの画像範囲の情報が時刻T1のカメラ画像と共に操作対象システム１１から操作者システム１２に送信されることで、操作者システム１２の画像処理演算部８５は、時刻T1のカメラ画像における対象画像ＭＡの画像範囲を取得し、時刻T1のカメラ画像から対象画像ＭＡを抽出することができる。画像処理演算部８５は、時刻T1+L1でのカメラの予測位置姿勢と撮影対象物Ｍとの位置関係に基づいて、時刻T1のカメラ画像に対して、時刻T1+L1でのカメラの予測位置姿勢で撮影対象物Ｍが映り込む位置（範囲）を特定する。画像処理演算部８５は、時刻T1のカメラ画像に対して、その特定した位置に対象画像ＭＡを合成することで予測画像を生成する。なお、時刻T1のカメラ画像に元々映り込む対象画像ＭＡは消去されてもよいし、そのまま残されてもよい。対象画像以外の背景画像は消去されてもよい。

　以上の第１の仮定の場合におけるカメラ画像の補正処理の第１形態によれば、時刻T+L1でディスプレイに表示される時刻Tのカメラ画像が補正されて、時刻T+L1での予測画像が操作者に提示されるので、操作者が操作対象（カメラの位置姿勢）を意図通りに遠隔操作しやすくなる。

（第２形態）
　図８は、第１の仮定の場合において遠隔操作システム１が実施するカメラ画像の補正処理の第２形態を表した時系列処理フロー図である。第２形態は、図６の第１形態において操作対象システム１１が処理Ｐ１において行った位置姿勢推定を操作者システム１２が行う場合である。

　図８において、横軸は時刻を表す。図８のＡは、操作対象システム１１での処理を表し、図８のＢは、操作者システム１２での処理を表す。

　図８のＡにおいて、処理Ｐ１は、操作対象システム１１がカメラによる所定フレームの撮影を開始し、撮影したフレームのカメラ画像を操作者システム１２に送信するまでの一連の処理を表す。処理Ｐ１では、時刻T1から時系列順に、撮影、画像処理、及び、データ送信が行われる。

　処理Ｐ１における撮影、及び、画像処理は、図６の第１形態の場合と同じであるので説明を省略する。

　図８の処理Ｐ１におけるデータ送信は、画像処理演算部４６が、カメラ（撮像部４１）からのカメラ画像の他に、処理Ｐ１の画像処理における自己位置姿勢推定の結果であるカメラの位置姿勢、速度、及び、加速度等の予測位置姿勢を算出するために必要なデータ等を図２の通信部４５を通じて、操作者システム１２に送信する処理である。

　図８のＢにおいて、処理Ｐ２は、操作者システム１２が操作対象システム１１からのカメラ画像等のデータ受信を開始してから、カメラ画像をディスプレイ（表示部８３）に表示するまでの一連の処理を表す。処理Ｐ２では、時系列順に、データ受信、遅延L1推定、位置姿勢予測、及び、表示が行われる。表示が終了する時刻が時刻T1+L1である。

　処理Ｐ２におけるデータ受信は、図３の操作者システム１２における画像処理演算部８５が、処理Ｐ１のデータ送信において操作対象システム１１から送信されたカメラ画像及び予測位置姿勢の算出に必要なデータ（自己位置姿勢推定の結果であるカメラの位置姿勢、速度、及び、加速度）等を図３の通信部８４を通じて受信する処理である。

　処理Ｐ２における遅延L1推定は、図６の第１形態の場合と同じであるので説明を省略する。

　図６の処理Ｐ２における位置姿勢予測は、画像処理演算部８５が、操作対象システム１１からの予測位置姿勢の算出に必要なデータ（自己位置姿勢推定の結果であるカメラの位置姿勢、速度、及び、加速度）と、遅延時間推定部１０１により推定された遅延時間L1とに基づいて、時刻T1+L1でのカメラの位置姿勢を予測する処理である。

　図３の画像処理演算部８５における位置姿勢予測部１０２は、カメラ（被操作装置）の運動方程式を定式化し、自己位置姿勢推定（SLAM）により得られたカメラ（被操作装置）の位置姿勢、速度、及び、加速度を初期値として、時刻T1+L1でのカメラ（被操作装置）の予測位置姿勢を算出する。

　図６の処理Ｐ２における表示は、図６の第１形態の場合と同じであるので説明を省略する。

　なお、第１形態及び第２形態のように操作対象システム１１の処理Ｐ１における画像処理で、自己位置姿勢推定、撮影対象物の物体検出、及び、撮影対象物のトラッキング等の画像処理を一括して行うことで、システム全体の画像処理時間が短縮される。ただし、撮影対象物の物体検出、及び、撮影対象物のトラッキングの処理は、操作者システム１２において行ってもよい。その他の処理（撮影、データ送信、データ受信、及び、表示を除く）も操作対象システム１１と操作者システム１２のいずれでも実施してもよい。

　以上の第１の仮定の場合におけるカメラ画像の補正処理の第２形態によれば、時刻T+L1でディスプレイに表示される時刻Tのカメラ画像が補正されて、時刻T+L1での予測画像が操作者に提示されるので、操作者が操作対象（カメラの位置姿勢）を意図通りに遠隔操作しやすくなる。

＜第２の仮定の場合＞
　第２の仮定の場合には、遠隔操作システム１は、遅延L2に対応した処理として図４のステップＳ１２及びステップＳ１３の処理を実施する。

　遅延L2が発生する代表的な要因としては、通信遅延、反応遅延、及び、制御遅延がある。通信遅延とは、操作者システム１２から操作対象システム１１へのデータ通信（操作者の操作に関する操作指令等のデータ通信）に要する通信時間及びそれによる遅延を表す。反応遅延とは、操作者システム１２のディスプレイに表示されたカメラ画像をみて操作者が操作対象（カメラ（被操作装置）の位置姿勢）に対する操作を行うまでの反応時間及びそれによる遅延を表す。制御遅延とは、操作者の操作に基づいて操作者システム１２から送信された操作命令を操作対象システム１１が受信してから操作対象が操作命令に従って制御されるまでに要する制御時間及びそれによる遅延を表す。

　これらの要因により、操作者システム１２から操作対象システム１１へのデータ通信時の遅延L2が発生する場合、操作者が意図通りに操作対象を遠隔操作することが困難となる。

　図９は、遠隔操作システム１において本技術を適用しないと仮定した場合に、遅延L2により操作者が意図通りに操作対象を遠隔操作することが困難となる状況を説明した図である。

　図９の見出し行において、時刻T2は、操作対象システム１１のカメラで所定フレームのカメラ画像が撮影された時刻を表す。時刻T2+L2は、時刻T2でディスプレイに表示されたカメラ画像に基づいて操作者が操作を行った後、その操作に基づく操作命令に従って操作対象（カメラの位置姿勢）の制御が終了した時刻を表す。

　第１行目の図は、時刻T2と時刻T2+L2とのそれぞれの時刻での操作対象（カメラ）と撮影対象物Ｍとの位置関係を表す。これによれば、時刻T2では、撮影対象物Ｍがカメラの撮影中心（光軸方向）に対して右側の方向に存在する。時刻T2から時刻T2+L2までの間に、カメラの位置姿勢が変化して、時刻T2+L2では、撮影対象物Ｍがカメラのほぼ撮影中心に存在する。なお、時刻T2から時刻T2+L2までの間のカメラの位置姿勢の変化は、時刻T2以前の操作命令に従ってカメラの位置姿勢が制御されている場合や、時刻T2以前のカメラの位置姿勢の制御によりカメラの位置姿勢が慣性等で変化している場合に生じ得る。

　第２行目の図は、時刻T2でカメラが撮影したカメラ画像ＳＡにおける撮影対象物Ｍの対象画像ＭＡの位置を表す。これによれば、時刻T2では、対象画像ＭＡが、カメラ画像ＳＡの中心に対して右寄りに位置に映る。

　第３行目の図は、時刻T2でディスプレイに表示されるカメラ画像ＳＡにおける対象画像ＭＡの位置を表す。これによれば、時刻T2では、遅延L1が生じない前提であるので時刻T2で撮影されたカメラ画像ＳＡがそのままディスプレイに表示される。即ち、対象画像ＭＡが、カメラ画像ＳＡの中心に対して右寄りの位置に映るカメラ画像ＳＡがディスプレイに表示される。したがって、時刻T2でディスプレイに表示されるカメラ画像ＳＡから操作者が把握する撮影対象物Ｍの位置が、第１行目の図の時刻T2+L2でのカメラに対する撮影対象物Ｍの位置と異なる。

　この場合に、時刻T2で操作者が、時刻T2のカメラ画像ＳＡに映る対象画像ＭＡがカメラ画像ＳＡの中心に映るようにカメラを矢印１２２で示された右方向にパンニングする操作を行うと、その操作に対応した操作命令に基づくカメラの位置姿勢の制御が時刻T2+L2から開始され、撮影対象物Ｍがカメラの撮影中心に対して左方向に相対的に移動する。これによって、カメラ画像ＳＡに映る対象画像ＭＡがカメラ画像ＳＡの中心に対して左側に移動し、対象画像ＭＡがカメラ画像ＳＡから外れてしまう事態が生じる場合がある。

　本技術が適用された遠隔操作システム１では、このような事態が解決される。本技術が適用された遠隔操作システム１では、図４のステップＳ１２において、操作対象システム１１又は操作者システム１２が、遅延L2（遅延時間L2）を推定する。遅延時間L2を推定すると、図４のステップＳ１３において、操作対象システム１１又は操作者システム１２が、時刻Tでのカメラの位置姿勢に対して時刻T+L2でのカメラの位置姿勢を予測する。操作対象システム１１又は操作者システム１２は、時刻Tでディスプレイに表示されるカメラ画像が、予測した時刻T+L2での位置姿勢でカメラが撮影するカメラ画像となるように時刻Tでカメラが撮影したカメラ画像（時刻Tでディスプレイに表示するカメラ画像）を補正する。

　なお、上述の場合と同様に、ある時刻においてディスプレイに表示されるカメラ画像を、その時刻の表示画像といい、ある時刻においてカメラで実際に撮影されるカメラ画像を、その時刻のカメラ画像といい、予測された所定の時刻の位置姿勢のカメラで撮影されるカメラ画像を、予測画像というものとする。このとき、図４のステップＳ１３における操作対象システム１１又は操作者システム１２のカメラ画像の補正処理は、時刻Tのカメラ画像を補正することにより、時刻Tの表示画像である時刻T+L2の予測画像を生成する処理である。

＜第２の仮定の場合の時系列処理＞
　図１０は、第２の仮定の場合において遠隔操作システム１が実施するカメラ画像の補正処理を表した時系列処理フロー図である。図１０において、横軸は時刻を表す。図１０のＡは、操作対象システム１１での処理を表し、図１０のＢは、操作者システム１２での処理を表す。図１０のＢにおいて、処理Ｐ１は、操作者システム１２が遅延L2推定の処理を開始して操作者の操作に基づく操作命令等のデータを操作対象システム１１に送信するまでの一連の処理を表す。処理Ｐ１では、時系列順に、遅延L2推定、位置姿勢予測、表示、操作、及び、データ送信が行われる。表示が終了する時刻が時刻T2である。

　処理Ｐ１における遅延L2推定は、図３の画像処理演算部８５が実施する処理であり、遅延時間L2を推定する処理である。遅延時間L2は、図１０のように操作者システム１２の処理Ｐ１における表示が終了した時刻T2から操作対象システム１１の処理Ｐ２における制御が終了する時刻までの時間である。

　図３の操作者システム１２において、画像処理演算部８５の遅延時間推定部１０１は、遅延L2の要因である上述の通信遅延、反応遅延、及び、制御遅延ごとに遅延時間を推定し、それらの遅延要因ごとの遅延時間を足し合わせることで遅延時間L2を推定する。ただし、遅延L2の要因はこれに限らない。各遅延要因の遅延時間が遅延時間L2に占める割合は、遅延要因ごとに異なるため、遅延時間L2の推定の際に、遅延時間推定部１０１は、遅延時間L2に占める割合が十分小さい要因の遅延時間を無視する場合であってもよい。

　制御遅延のようにシステム仕様やスペックに依存する遅延要因の遅延時間は、システム仕様などから事前に見積ることが可能である。遅延時間推定部１０１は、システム仕様等に依存する遅延要因の遅延時間については事前に見積もられた遅延時間を図３の記録部８２から読み出して取得する。

　通信遅延のようにシステム仕様だけでなく通信データ容量、通信環境などの影響も受ける遅延要因の遅延時間については、遅延時間推定部１０１は、実際に発生した遅延時間を測定することで推定する。例えば、操作対象システム１１の画像処理演算部４６と、操作者システム１２の画像処理演算部８５とがNTP（Network Time Protocol）時刻、GPS（Global Positioning System）時刻などの共通の時刻を参照可能とする。操作者システム１２の画像処理演算部８５は、図１０の処理Ｐ１においてデータ送信を開始する際に現在の時刻を送信時刻の情報として操作対象システム１１に送信する。操作対象システム１１の画像処理演算部４６は、処理Ｐ２におけるデータ受信において操作者システム１２から送信されたデータの受信を終了した際の現在の時刻を受信時刻として取得する。これによって、操作者システム１２からのデータの送信時刻と操作対象システム１１でのデータの受信時刻との差分とから通信遅延の遅延時間が算出される。ただし、操作対象システム１１では、通信遅延の遅延時間が算出できるが、操作者システム１２では、データの受信時刻を把握できない。そのため、例えば、操作者システム１２の画像処理演算部８５は、操作対象システム１１から通信遅延の遅延時間の情報を取得する。画像処理演算部８５は、過去に取得した通信遅延の遅延時間に基づいて、処理Ｐ１における遅延L2推定で推定する通信遅延の遅延時間として、過去に測定された通信遅延の移動平均などをフィルタ処理を適用して算出する。

　反応遅延の遅延時間については、操作者の反応時間の影響を受けるため、遅延時間推定部１０１は、例えば、画面の色が変わったらボタンを押すなどのような単純な画像刺激に対して事前に測定した反応時間を用いる。遅延時間推定部１０１は、過去の認知科学実験などで得られた一般的な人の反応時間を用いてもよい。

　図１０の処理Ｐ１における位置姿勢予測は、画像処理演算部８５（位置姿勢予測部１０２）が、処理Ｐ１における遅延L2推定で推定された遅延時間L2を用いて、時刻T2+L2でのカメラの位置姿勢を予測する（予測位置姿勢を算出する）処理である。時刻T2+L2でのカメラの予測位置姿勢は、第１の仮定の場合における時刻T1+L1でのカメラの予測位置姿勢の算出と同様にして、カメラの運動方程式を定式化し、自己位置姿勢推定（SLAM）により得られた位置姿勢，速度，加速度を初期値として与えることで算出され得る。

　図１０の処理Ｐ１における表示は、画像処理演算部８５が、操作対象システム１１からの時刻T2のカメラ画像を、処理Ｐ１の位置姿勢予測により得られた時刻T2+L2での予測位置姿勢のカメラで撮影されるカメラ画像（予測画像）となるように補正するカメラ画像の補正処理、及び、予測画像を表示画像としてディスプレイ（表示部８３）に表示する処理である。なお、処理Ｐ１における表示は、第１の仮定の場合における図６の処理Ｐ２における表示と同様の処理であるので説明を省略する。

　図１０の処理Ｐ１における操作は、画像処理演算部８５が、操作者の操作対象（カメラの位置姿勢）に対する操作を操作部８１から取得する処理である。

　図１０の処理Ｐ１におけるデータ送信は、画像処理演算部８５が、処理Ｐ１における操作の処理により、操作部８１から取得した操作者の操作に基づいて、カメラ（被操作装置）の位置姿勢に対する操作命令等のデータを、図３の通信部８４を通じて操作対象システム１１に送信する処理である。

　図１０のＡにおいて、処理Ｐ２は、操作対象システム１１が操作者システム１２からの操作命令等のデータ受信を開始してから、カメラの位置姿勢を操作命令に従って制御し終わるまでの一連の処理を表す。処理Ｐ１では、時系列順に、データ受信、及び、制御が行われる。制御が終了する時刻が時刻T2+L2である。

　処理Ｐ２におけるデータ受信は、図２の操作対象システム１１における画像処理演算部４６が、処理Ｐ１のデータ送信において操作対象システム１１から送信された操作命令等のデータを図２の通信部４５を通じて受信する処理である。

　処理Ｐ２における制御は、画像処理演算部４６が、処理Ｐ２のデータ受信において受信した操作命令に従って制御部４４に制御信号を出力してカメラの位置姿勢を変更する処理である。

　以上の処理により、時刻T2のカメラ画像が補正され、時刻T2+L2での予測位置姿勢のカメラと撮影対象物との位置関係に応じたカメラ画像（予測画像）が時刻T2の表示画像としてディスプレイに表示される。これによって、操作者システム１２の画像処理演算部８５（位置姿勢予測部１０２）により決定された時刻T2+L2でのカメラの予測位置姿勢により、第１行目の時刻T2+L2でのカメラと撮影対象物Ｍとの実際の位置関係が予測される。画像処理演算部８５は、時刻T2のカメラ画像を補正することにより、時刻T2+L2での予測位置姿勢のカメラが撮影するカメラ画像（予測画像）を表示画像として生成する。図９において、時刻T2+L2においてカメラの撮影中心に撮影対象物Ｍが存在する場合には、時刻T2でのディスプレイに表示されるカメラ画像（表示画像）において対象画像がカメラ画像の中心に表示される。したがって、図９の第１行目の時刻T2+L2の図の矢印１２２のようにカメラの撮影中心を撮影対象物Ｍに向けるようとして操作者がカメラを右方向に向ける操作を行うことが回避される。

　即ち、第２の仮定の場合におけるカメラ画像の補正処理の第１形態によれば、時刻Tでディスプレイに表示される時刻Tのカメラ画像が補正されて、時刻T+L2での予測画像が操作者に提示されるので、操作者が操作対象（カメラの位置姿勢）を意図通りに遠隔操作しやすくなる。

＜第１及び第２の仮定の組合せ＞
（第１形態）
　遅延L1と遅延L2の両方が発生する場合には、遠隔操作システム１は、第１の仮定の場合の処理と第２の仮定の場合の処理とを組み合わせた処理（第１及び第２の仮定の場合の処理）を実行する。

　図１１は、遅延L1と遅延L2の両方が発生する場合（第１及び第２の仮定の場合）において遠隔操作システム１が実施するカメラ画像の補正処理の第１形態を表した時系列処理フロー図である。

　図１１において、横軸は時刻を表す。図１１のＡは、操作対象システム１１での処理を表し、図１１のＢは、操作者システム１２での処理を表す。

　図１１のＡにおいて、処理Ｐ１は、操作対象システム１１がカメラによる所定フレームの撮影を開始し、撮影したフレームのカメラ画像を操作者システム１２に送信するまでの一連の処理を表す。処理Ｐ１では、時刻Tから時系列順に、撮影、画像処理、及び、データ送信が行われる。処理Ｐ１は、第１の仮定の場合の第２形態の処理を表した図８の処理Ｐ１と同じであるので説明を省略する。

　図１１のＢにおいて、処理Ｐ２は、操作者システム１２が、操作者システム１２が操作対象システム１１からのカメラ画像等のデータ受信を開始してから、操作者の操作に基づく操作命令等のデータを操作対象システム１１に送信するまでの一連の処理を表す。

　処理Ｐ２では、時系列順に、データ受信、遅延L1推定、遅延L2推定、位置姿勢予測、表示、操作、及び、データ送信が行われる。表示が終了する時刻が時刻T+L1である。

　図１１の処理Ｐ２におけるデータ受信、及び、遅延L1推定は、第１の仮定の場合の第２形態の処理を表した図８の処理Ｐ２におけるデータ受信、及び、遅延L1推定と同じであるので説明を省略する。

　図１１の処理Ｐ２における遅延L2推定、操作、及び、データ送信は、第２の仮定の場合の処理を表した図１０の処理Ｐ１における遅延L2推定、操作、及び、データ送信と同じであるので説明を省略する。なお、操作は、時刻T以後の任意の時刻で行われる場合であってもよい。

　図１１の処理Ｐ２における位置姿勢推定、及び、表示は、第１の仮定の場合の第２形態の処理を表した図８の処理Ｐ２おける位置姿勢推定、及び、表示、又は、第２の仮定の場合の処理を表した図１０の処理Ｐ１における位置姿勢推定、及び、表示と、基本的な処理内容は同じであるが、遅延時間L1と遅延時間L2の両方を考慮する点で相違する。

　図１１の処理Ｐ２における位置姿勢推定では、処理Ｐ２の遅延L1推定と遅延L2推定で算出された遅延時間L1と遅延時間L2とに基づいて、時刻T+L1+L2でのカメラの予測位置姿勢が算出される。

　処理Ｐ２における表示では、操作対象システム１１からの時刻Tのカメラ画像が、処理Ｐ１の位置姿勢予測により得られた時刻T+L1+L2での予測位置姿勢のカメラで撮影されるカメラ画像（予測画像）となるように補正され、予測画像が時刻T+L1の表示画像としてディスプレイ（表示部８３）に表示される。

　図１１のＡにおいて、処理Ｐ３は、操作対象システム１１が操作者システム１２からの操作命令等のデータ受信を開始してから、カメラの位置姿勢を操作命令に従って制御し終わるまでの一連の処理を表す。処理Ｐ３では、時系列順に、データ受信、及び、制御が行われる。処理Ｐ３は、第２の仮定の場合の処理を表した図１０の処理Ｐ２と同じであるので説明を省略する。

　以上の処理によれば、遅延L1と遅延L2の両方が発生する場合において、時刻Tのカメラ画像が、時刻T+L1+L2での予測位置姿勢のカメラと撮影対象物との位置関係に応じたカメラ画像（予測画像）に補正され、時刻T+L1の表示画像としてディスプレイに表示される。これにより、遅延L1と遅延L2の両方が発生する場合であっても、操作者が操作対象（カメラの位置姿勢）を意図通りに遠隔操作しやすくなる。

（第２形態）
　図１２は、遅延L1と遅延L2の両方が発生する場合（第１及び第２の仮定の場合）において遠隔操作システム１が実施するカメラ画像の補正処理の第２形態を表した時系列処理フロー図である。

　図１２において、横軸は時刻を表す。図１２のＡは、操作対象システム１１での処理を表し、図１２のＢは、操作者システム１２での処理を表す。

　図１２のＡにおいて、処理Ｐ１は、操作対象システム１１がカメラによる所定フレームの撮影を開始し、撮影したフレームのカメラ画像を操作者システム１２に送信するまでの一連の処理を表す。処理Ｐ１では、時刻Tから時系列順に、時系列順に、撮影、画像処理、位置姿勢予測、及び、データ送信が行われる。処理Ｐ１は、第１の仮定の場合の第１形態の処理を表した図６の処理Ｐ１と同じであるので説明を省略する。

　図１２のＢにおいて、処理Ｐ２は、操作者システム１２が、操作者システム１２が操作対象システム１１からのカメラ画像等のデータ受信を開始してから、操作者の操作に基づく操作命令等のデータを操作対象システム１１に送信するまでの一連の処理を表す。

　処理Ｐ２では、時系列順に、データ受信、遅延L1推定、遅延L2推定、表示、操作、及び、データ送信が行われる。表示が終了する時刻が時刻T+L1である。

　図１２の処理Ｐ２におけるデータ受信、及び、遅延L1推定は、第１の仮定の場合の第１形態の処理を表した図６の処理Ｐ２おけるデータ受信、及び、遅延L1推定と同じであるので説明を省略する。

　図１２の処理Ｐ２における遅延L2推定、操作、及び、データ送信は、第２の仮定の場合の処理を表した図１０の処理Ｐ１における遅延L2推定、操作、及び、データ送信と同じであるので説明を省略する。

　図１２の処理Ｐ２における表示は、第１の仮定の場合の第１形態の処理を表した図６の処理Ｐ２おける表示と、基本的な処理内容は同じであるが、遅延時間L1と遅延時間L2の両方を考慮する点で相違する。なお、図１２の処理Ｐ２では、図６の処理Ｐ２における位置姿勢予測に相当する処理が省略されており、それに相当する処理が表示の処理に含まれることとする。

　図１２の処理Ｐ２における表示では、操作対象システム１１からの予測位置姿勢の情報のうち、時刻T+L1+L2に最も近い時刻の予測位置姿勢が、時刻T+L1+L2でのカメラの予測位置姿勢として決定される。なお、操作対象システム１１からの予測位置姿勢の情報には、時刻Tから時刻T+Txまでの所定時間おきの時刻におけるカメラ（被操作装置）の予測位置姿勢の情報が含まれる。時刻T+L1+L2でのカメラの予測位置姿勢として決定されると、操作対象システム１１からの時刻Tのカメラ画像が、時刻T+L1+L2での予測位置姿勢のカメラで撮影されるカメラ画像（予測画像）となるように補正され、予測画像が時刻T+L1の表示画像としてディスプレイ（表示部８３）に表示される。

　図１２のＡにおいて、処理Ｐ３は、操作対象システム１１が操作者システム１２からの操作命令等のデータ受信を開始してから、カメラの位置姿勢を操作命令に従って制御し終わるまでの一連の処理を表す。処理Ｐ３では、時系列順に、データ受信、及び、制御が行われる。処理Ｐ３は、第２の仮定の場合の処理を表した図１０の処理Ｐ２と同じであるので説明を省略する。

＜第３の仮定の場合の時系列処理＞
　第３の仮定の場合には、遠隔操作システム１は、遅延L1+L2に対応した処理として図４のステップＳ１４の処理を実施する。

　撮影対象物が移動する場合、特に撮影対象物が操作対象と独立して移動する場合に、第１及び第２の仮定と場合と同様に、操作者が意図通りに操作対象を遠隔操作することが困難となる。そこで、時刻T+L1+L2での撮影対象物のカメラ画像内における位置を予測し、カメラ画像の補正、及び、UI表示を行うことで、操作者が意図通りに操作対象を遠隔操作することが容易となる。この場合、図１１及び図１２の操作対象システム１１の処理Ｐ１における画像処理において、画像処理演算部４６は、カメラ画像内における撮影対象物の物体検出とトラッキングにより撮影対象物の軌跡を検出する。カメラ画像内の撮影対象物（対象画像）の位置予測（予測位置の算出）では、撮影対象物の移動を等速直線運動に近似して予測位置を算出する場合であってもよいし、対象画像の軌跡を２次元又は多次元の時系列データとして扱い自己回帰モデルなどでモデル化して予測位置を算出する場合であってもよい。時刻Tのカメラ画像を補正する補正処理（時刻T+L1+L2の予測画像（時刻T+L1の表示画像）を生成する処理）は、算出した撮影対象物の時刻T+L1+L2の3次元位置を予測位置とし、センサ部４２の単眼カメラ（広角カメラ、魚眼カメラ、全天球カメラ）、複眼カメラ（ステレオカメラ、マルチカメラ）、若しくは、RGB-Dカメラ（深度カメラやToFカメラ）、又は、撮像部４１のカメラにより作成した時刻T1+L1+L2での操作対象システム１１の周辺環境の３次元データを用いて、時刻T1+L1+L2でのカメラの予測位置姿勢から撮影した撮影対象物および周辺環境の撮影画像を生成する処理であってもよい。ただし、カメラ画像の補正処理は特定の処理に限らない。

　なお、撮影対象物の位置予測は、操作対象システム１１で行われてもよいし、操作者システム１２で行われてもよい。操作対象システム１１で行われる場合、自己位置推定と共通する画像処理を一度で済ませられるので、システム全体の画像処理時間が短縮される。

　図１１及び図１２の操作者システム１２の処理Ｐ２における表示において、画像処理演算部８５は、撮影対象物（対象画像）の予測位置に基づいて時刻Tのカメラ画像を補正し、時刻T+L1+L2での予測位置を表したカメラ画像をディスプレイに表示する。ここで、カメラの時刻Tから時刻T+L1+L2までの間での位置姿勢の変化を考慮してカメラ画像を補正する場合、時刻Tのカメラ画像が、時刻T+L1+L2での予測位置姿勢のカメラと時刻T+L1+L2での予測位置の撮影対象物との位置関係に応じたカメラ画像（予測画像）に補正され、時刻T+L1の表示画像としてディスプレイに表示される。これにより、遅延L1と遅延L2の両方が発生し、かつ、撮影対象物が移動する場合であっても、操作者が操作対象（カメラの位置姿勢）を意図通りに遠隔操作しやすくなる。

　図１３は、撮影対象物が移動する場合の撮影対象物の予測位置のディスプレイへの表示例を示した図である。

　図１３において、カメラ画像ＳＡは、時刻Tのカメラ画像に基づいて時刻T+L1にディスプレイに表示されるカメラ画像（表示画像）である。対象画像ＭＡは、時刻Tのカメラ画像における撮影対象物の画像である。エッジ１４１は、時刻T+L1+L2での対象画像ＭＡの予測位置を表した画像である。エッジ１４１は、対象画像の輪郭を点線等で表した画像である。これによれば、時刻T+L1+L2での対象画像ＭＡの予測位置を表した画像（エッジ１４１）が時刻Tのカメラ画像に重畳してディスプレイに表示される。なお、対象画像ＭＡの予測位置を表す画像が特定の形態に限定されない。

　図１４は、操作者システム１２の画像処理演算部８５が撮影対象物の予測位置の尤度に応じて対象画像の描画時のパラメータを変更する場合を示した図である。図１４において、状態Ａ、Ｂ、Ｃで表されたカメラ画像ＳＡには、それぞれ、図１３のカメラ画像ＳＡの対応する部分と同一の符号が付されており、カメラ画像ＳＡの説明は省略する。ディスプレイに表示されるカメラ画像ＳＡは、撮影対象物の予測位置の尤度が低い順に、状態Ａ、状態Ｂ、状態Ｃで描画される。即ち、撮影対象物の予測位置の尤度が高くなるほど、時刻T+L1+L2での撮影対象物の対象画像ＭＡの予測位置を表した画像（エッジ１４１）の濃度が濃く描画される。濃度に限らず色などの他のパラメータを撮影対象物の予測位置の尤度に応じて変更する場合であってよい。

　図１５は、操作者システム１２の画像処理演算部８５がディスプレイに表示するカメラ画像の表示パターンを説明した図である。時刻T+L1においてディスプレイに表示される時刻Tのカメラ画像ＳＡにおいて、パターンＡでは、対象画像ＭＡ、ＭＡ－1、ＭＡ－２が重畳して表示される。対象画像ＭＡは、時刻Tのカメラ画像における撮影対象物の位置を表す。対象画像ＭＡ－１は、システム遅延（遅延L1及び遅延L2）の間のカメラの位置姿勢の変化を考慮した場合の撮影対象物（対象画像）の予測位置を表す。対象画像ＭＡ－２は、システム遅延の間のカメラの位置姿勢の変化及び撮影対象物の移動を考慮した場合の撮影対象物の予測位置を表す。パターンＢでは、対象画像ＭＡ－１、ＭＡ－２が重畳して表示される。パターンＣでは、対象画像ＭＡ－２のみが表示される。操作者システム１２の画像処理演算部８５は、時刻Tのカメラ画像を補正して、これらのパターンＡからＣまでのいずれかの形態のカメラ画像（表示画像）を生成してディスプレイに表示させるようにしてもよい、操作者により指示されたパターンのカメラ画像を生成してディスプレイに表示させるようにしてもよい。

＜プログラム＞
　上述した遠隔操作システム１における一連の処理は、ハードウエアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図１６は、遠隔操作システム１が実行する各処理をコンピュータがプログラムにより実行する場合の、コンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）２０１，ROM（Read Only Memory）２０２，RAM（Random Access Memory）２０３は、バス２０４により相互に接続されている。

　バス２０４には、さらに、入出力インタフェース２０５が接続されている。入出力インタフェース２０５には、入力部２０６、出力部２０７、記憶部２０８、通信部２０９、及びドライブ２１０が接続されている。

　入力部２０６は、キーボード、マウス、マイクロフォンなどよりなる。出力部２０７は、ディスプレイ、スピーカなどよりなる。記憶部２０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部２０９は、ネットワークインタフェースなどよりなる。ドライブ２１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア２１１を駆動する。

　以上のように構成されるコンピュータでは、CPU２０１が、例えば、記憶部２０８に記憶されているプログラムを、入出力インタフェース２０５及びバス２０４を介して、RAM２０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU２０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア２１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブルメディア２１１をドライブ２１０に装着することにより、入出力インタフェース２０５を介して、記憶部２０８にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部２０９で受信し、記憶部２０８にインストールすることができる。その他、プログラムは、ROM２０２や記憶部２０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　本技術は以下のような構成も取ることができる。
（１）
　位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う処理部
　を有する情報処理装置。
（２）
　前記処理部は、前記予測位置姿勢の前記センサにより得られるセンサデータをユーザに提示するための前記補正を行う
　前記（１）に記載の情報処理装置。
（３）
　前記処理部は、前記時刻Tにおける前記センサの物理量に基づいて前記予測位置姿勢を算出する
　前記（１）又は（２）に記載の情報処理装置。
（４）
　前記処理部は、前記時刻Tにおける前記センサの位置姿勢、速度、及び、加速度に基づいて前記予測位置姿勢を算出する
　前記（３）に記載の情報処理装置。
（５）
　前記処理部は、前記時刻Tにおける前記センサの位置姿勢をSLAMを用いて推定する
　前記（４）に記載の情報処理装置。
（６）
　前記処理部に対して通信によりデータを送信する予測部を有し、
　前記予測部は、前記時刻Tにおける前記センサの物理量に基づいて前記予測位置姿勢を算出し、算出した前記予測位置姿勢のデータを前記処理部に送信する
　前記（１）に記載の情報処理装置。
（７）
　前記時刻Tと前記時刻T+L1との間の遅延時間L1は、前記センサデータの通信に要する時間を含む
　前記（１）乃至（６）のいずれかに記載の情報処理装置。
（８）
　前記時刻T+L1と前記時刻T+L1+L2との間の遅延時間L2は、前記ユーザの操作に関するデータの通信に要する時間を含む
　前記（１）乃至（７）のいずれかに記載の情報処理装置。
（９）
　前記時刻T+L1と前記時刻T+L1+L2との間の遅延時間L2は、前記センサデータが前記ユーザに提示された後、前記ユーザが前記操作を行うまでの反応時間を含む
　前記（１）乃至（８）のいずれかに記載の情報処理装置。
（１０）
　前記センサはカメラであり、
　前記処理部は、前記時刻Tにおいて前記カメラにより撮影されたカメラ画像の前記補正を行う
　前記（１）乃至（９）のいずれかに記載の情報処理装置。
（１１）
　前記処理部は、前記補正により、前記時刻Tで前記カメラにより撮影された前記時刻Tの前記カメラ画像に対して所定の対象物の画像を重畳した画像を生成し、前記対象物の画像を重畳する位置を、前記時刻T+L1+L2での前記予測位置姿勢の前記カメラにより前記対象物を撮影した場合のカメラ画像における前記対象物の画像の位置とする
　前記（１０）に記載の情報処理装置。
（１２）
　前記処理部は、前記時刻Tと前記時刻T+L1+L2との間の時間における前記対象物の移動に伴い変位する前記対象物の画像の前記時刻T+L1+L2における位置を予測した予測位置に基づいて、前記補正を行う
　前記（１１）に記載の情報処理装置。
（１３）
　前記処理部は、前記センサを有し、前記センサの位置姿勢が遠隔操作される操作対象システムと、前記センサの位置姿勢を遠隔操作し、かつ、前記センサにより得られた前記センサデータを前記ユーザに提示する操作者システムとのから構成される遠隔操作システムに具備される
　前記（１）乃至（１２）のいずれかに記載の情報処理装置。
（１４）
　処理部
　を有する情報処理装置の
　前記処理部が、位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う
　情報処理方法。
（１５）
　コンピュータを
　位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う処理部
　として機能させるためのプログラム。

　１　遠隔操作システム，　１１　操作対象システム，　１２　操作者システム，　４１　撮像部（カメラ），　４２　センサ部，　４３，８２　記録部，　４４　制御部，　４５，８４　通信部，　４６，８５　画像処理演算部，　８１　操作部，　８３　表示部

Claims

　位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う処理部
　を有する情報処理装置。
　前記処理部は、前記予測位置姿勢の前記センサにより得られるセンサデータをユーザに提示するための前記補正を行う
　請求項１に記載の情報処理装置。
　前記処理部は、前記時刻Tにおける前記センサの物理量に基づいて前記予測位置姿勢を算出する
　請求項１に記載の情報処理装置。
　前記処理部は、前記時刻Tにおける前記センサの位置姿勢、速度、及び、加速度に基づいて前記予測位置姿勢を算出する
　請求項３に記載の情報処理装置。
　前記処理部は、前記時刻Tにおける前記センサの位置姿勢をSLAMを用いて推定する
　請求項４に記載の情報処理装置。
　前記処理部に対して通信によりデータを送信する予測部を有し、
　前記予測部は、前記時刻Tにおける前記センサの物理量に基づいて前記予測位置姿勢を算出し、算出した前記予測位置姿勢のデータを前記処理部に送信する
　請求項１に記載の情報処理装置。
　前記時刻Tと前記時刻T+L1との間の遅延時間L1は、前記センサデータの通信に要する時間を含む
　請求項１に記載の情報処理装置。
　前記時刻T+L1と前記時刻T+L1+L2との間の遅延時間L2は、前記ユーザの操作に関するデータの通信に要する時間を含む
　請求項１に記載の情報処理装置。
　前記時刻T+L1と前記時刻T+L1+L2との間の遅延時間L2は、前記センサデータが前記ユーザに提示された後、前記ユーザが前記操作を行うまでの反応時間を含む
　請求項１に記載の情報処理装置。
　前記センサはカメラであり、
　前記処理部は、前記時刻Tにおいて前記カメラにより撮影されたカメラ画像の前記補正を行う
　請求項１に記載の情報処理装置。
　前記処理部は、前記補正により、前記時刻Tで前記カメラにより撮影された前記時刻Tの前記カメラ画像に対して所定の対象物の画像を重畳した画像を生成し、前記対象物の画像を重畳する位置を、前記時刻T+L1+L2での前記予測位置姿勢の前記カメラにより前記対象物を撮影した場合のカメラ画像における前記対象物の画像の位置とする
　請求項１０に記載の情報処理装置。
　前記処理部は、前記時刻Tと前記時刻T+L1+L2との間の時間における前記対象物の移動に伴い変位する前記対象物の画像の前記時刻T+L1+L2における位置を予測した予測位置に基づいて、前記補正を行う
　請求項１１に記載の情報処理装置。
　前記処理部は、前記センサを有し、前記センサの位置姿勢が遠隔操作される操作対象システムと、前記センサの位置姿勢を遠隔操作し、かつ、前記センサにより得られた前記センサデータを前記ユーザに提示する操作者システムとのから構成される遠隔操作システムに具備される
　請求項１の情報処理装置。
　処理部
　を有する情報処理装置の
　前記処理部が、位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う
　情報処理方法。
　コンピュータを
　位置姿勢の変更として位置及び姿勢のうちの少なくとも一方の変更が可能なセンサにより時刻Tで得られたセンサデータがユーザに提示される時刻T+L1と、前記時刻T以後に行われた前記ユーザの操作に従って前記センサの位置姿勢の変更が行われる時刻T+L1+L2と対して、前記時刻Tで得られたセンサデータと、前記時刻T+L1+L2における前記センサの位置姿勢として予測される前記時刻T+L1+L2での前記センサの予測位置姿勢とに基づいて、前記時刻T+L1で前記ユーザに提示するセンサデータの補正を行う処理部
　として機能させるためのプログラム。