WO2020054193A1

WO2020054193A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2020054193A1
Application number: PCT/JP2019/026985
Authority: WO
Inventors: 一ノ瀬　勉
Original assignee: ソニー株式会社
Priority date: 2018-09-11
Filing date: 2019-07-08
Publication date: 2020-03-19
Also published as: CN112655016A; EP3852052A4; JP7230923B2; EP3852052A1; JPWO2020054193A1; US20210321082A1

Abstract

撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、基準点の移動量に応じて視点位置情報を補正する補正部とを有する情報処理装置である。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　近年、ディスプレイに立体画像を表示させる様々な技術が提案されている。その中で眼鏡等のツールを使用しない、所謂、裸眼立体表示に関する提案もなされている。裸眼立体表示の一つとしてレンチキュラレンズを使用したレンチキュラ方式が知られている。レンチキュラ方式では、レンチキュラレンズを有するディスプレイに立体画像を表示する際に、ユーザ（視聴者）の左右それぞれの視点位置を検出し、当該視点位置に最適な光線を集光し、右目用の画像及び左目用の画像を生成する。ユーザの視点位置を検出する技術として、ユーザの動きに合わせ視聴位置を予測する手法（例えば、下記特許文献１）や、画像から特徴点を検出し、この特徴点を追跡することにより視点をトラッキングする手法（例えば、下記非特許文献１）が提案されている。

特開２０１４－１９５１４１号公報

Jean-Yves Bouguet「Pyramidal Implementation of the Lucas Kanade Feature Tracker Description of the algorithm」Intel Corporation Microprocessor Research Labs (2000) OpenCV Documents

　しかしながら、視点位置を予測する手法では、移動量に応じた切り替え時に視点位置の検出結果に誤差が生じてしまうという問題がある。また、非特許文献１に記載のLucas-Kanadeアルゴリズムを利用した手法の場合は、処理時間がかかってしまうという問題がある。

　本開示は、例えば、視点位置の迅速且つ安定したトラッキングを行う情報処理装置、情報処理方法及びプログラムを提供することを目的の一つとする。

　本開示は、例えば、
　撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
　顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
　基準点の移動量に応じて視点位置情報を補正する補正部と
　を有する情報処理装置である。

　本開示は、例えば、
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、基準点の移動量に応じて視点位置情報を補正する
　情報処理方法である。

　本開示は、例えば、
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、基準点の移動量に応じて視点位置情報を補正する
　情報処理方法をコンピュータに実行させるプログラムである。

図１は、実施の形態に係る情報処理装置の外観例を示す図である。図２は、実施の形態に係る情報処理装置のシステム構成例を示すブロック図である。図３は、第１の実施の形態に係る視点検出ユニットの構成例を示すブロック図である。図４Ａ～図４Ｃは、第１の実施の形態に係る顔検出部及び重心算出部の動作例を説明する際に参照される図である。図５Ａ及び図５Ｂは、第１の実施の形態に係る補正部の動作例の概略を説明する際に参照される図である。図６は、第１の実施の形態に係る補正部の動作例を説明する際に参照されるタイミングチャートである。図７は、第１の実施の形態に係る視点検出ユニットで行われる処理の流れを示すフローチャートである。図８は、第１の実施の形態で得られる効果例を説明するための図である。図９Ａ及び図９Ｂは、第１の実施の形態の変形例を説明するため際に参照される図である。図１０は、第２の実施の形態に係る視点検出ユニットの構成例を示すブロック図である。図１１は、第２の実施の形態に係る視点検出ユニットで行われる処理の流れを示すフローチャートである。図１２は、第２の実施の形態に係る視点検出ユニットの構成例を示すブロック図である。図１３は、第３の実施の形態に係る測距部が行う処理の流れを示すフローチャートである。図１４は、第３の実施の形態に係る視点検出ユニットで行われる処理の流れを示すフローチャートである。図１５は、手術室システムの全体構成を概略的に示す図である。図１６は、集中操作パネルにおける操作画面の表示例を示す図である。図１７は、手術室システムが適用された手術の様子の一例を示す図である。図１８は、図１７に示すカメラヘッド及びＣＣＵの機能構成の一例を示すブロック図である。

　以下、本開示の実施の形態等について図面を参照しながら説明する。なお、説明は以下の順序で行う。
＜第１の実施の形態＞
＜第２の実施の形態＞
＜第３の実施の形態＞
＜変形例＞
＜応用例＞
　以下に説明する実施の形態等は本開示の好適な具体例であり、本開示の内容がこれらの実施の形態等に限定されるものではない。

＜第１の実施の形態＞
［情報処理装置の外観例］
　図１は、実施の形態に係る情報処理装置（情報処理装置１）の外観例を示す図である。情報処理装置１は、例えば、ノート型パーソナルコンピュータと同程度の大きさとされているが、より小型化若しくは大型化することも可能である。

　情報処理装置１は、ベース２と、ベース２から上方に向かって立設するディスプレイ３とを有している。情報処理装置１は、ディスプレイ３の上側にカメラ４を有しており、カメラ４によりディスプレイ３の前方に位置するユーザを撮像できるように構成されている。

　情報処理装置１は、例えば、レンチキュラ方式による立体画像をディスプレイ３に表示可能とされている。概略的には、立体表示用の眼鏡等を使用していない裸眼のユーザの視点位置を、カメラ４により撮像された画像（撮像画像）を使用して検出する。左右それぞれの視点位置に集光する光線で右目用及び左目用の画像（視差画像）を生成し、生成した画像をレンチキュラレンズが実装されたディスプレイ３に表示する、これにより、ユーザは、眼鏡やＨＵＤ(Head Up Display)等を用いることなく、立体画像を視聴することが可能となる。

［情報処理装置のシステム構成例］
　図２は、第１の実施の形態に係る情報処理装置１のシステム構成例を示すブロック図である。情報処理装置１は、概略的には、視点検出ユニット１０と、視差画像処理ユニット２０とを有している。視点検出ユニット１０は、ユーザの視点位置を示す情報、例えば、視点位置の２次元的な座標を、後段の視差画像処理ユニット２０に出力する。なお、視点検出ユニット１０の構成、動作例等の詳細については後述する。

　視差画像処理ユニット２０は、空間視点座標取得部２１、視差画像取得部２２及び視差画像表示部２３を有している。空間視点座標取得部２１は、視点検出ユニット１０から出力される視点位置を示す２次元座標を、公知の手法を適用して空間位置における視点座標に変換し、空間上の視点座標を生成する。視差画像取得部２２は、空間上の視点座標に対応する光線（画像）を生成することにより、立体画像を生成する。例えば、空間視点座標取得部２１及び視差画像取得部２２を含む構成が、特許請求の範囲における立体画像取得部に対応している。視差画像表示部２３は、視差画像取得部２２により生成された視差画像を連続的に表示することで立体映像を提示するデバイスであり、上述したディスプレイ３に対応する。

［視点検出ユニットの構成例］
　図３は、第１の実施の形態に係る視点検出ユニット１０の構成例を示すブロック図である。視点検出ユニット１０は、例えば、イメージセンサ１１、顔検出部１２、重心算出部１３及び補正部１４を有している。補正部１４は、移動量算出部１５及び加算部１６を有している。

　撮像部の一例であるイメージセンサ１１は、例えば、ＣＭＯＳ(Complementary Metal Oxide Semiconductor)センサである。イメージセンサ１１として、ＣＣＤ(Charge Coupled Device)等の他のセンサが適用されても良い。イメージセンサ１１は、ディスプレイ３の前方に位置するユーザ、より具体的には、ユーザの顔の周囲を撮像し、撮像画像を取得する。イメージセンサ１１で取得された撮像画像はＡ／Ｄ(Analog to Digital)変換された後、出力される。なお、図示は省略しているが、Ａ／Ｄ変換器等がイメージセンサ１１上に実装されていても構わないし、イメージセンサ１１と顔検出部１２との間に設けられていても良い。なお、実施の形態に係るイメージセンサ１１は、ハイフレームレートの撮像が可能なように構成されている。一例として、イメージセンサ１１により１０００ｆｐｓ(frame per second)以上の撮像が可能とされている。実施の形態では、イメージセンサ１１により１０００ｆｐｓの撮像が可能とされているものとして説明する。

　取得部の一例である顔検出部１２は、イメージセンサ１１により取得された撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報と、撮像画像におけるユーザの視点位置の座標を示す視点位置情報とを含む顔検出情報を生成、取得する。そして、顔検出部１２は、顔検出情報を重心算出部１３及び加算部１６のそれぞれに出力する。

　基準点算出部の一例である重心算出部１３は、顔検出部１２から出力された顔枠情報により示される顔枠内における重心点（基準点の一例）を算出する。本実施の形態では、イメージセンサ１１が重心算出部１３を有している。例えば、イメージセンサ１１と重心算出部１３の機能を実行するチップとが積層されている。これにより装置の小型化を図ることができるものの、重心算出部１３とイメージセンサ１１とが別々とされた構成であっても良い。

　補正部１４は、重心点の移動量に応じて視点位置情報を補正する。例えば、補正部１４の移動量算出部１５が、重心算出部１３により算出された重心点のフレーム間における移動量、換言すれば、重心点の座標の変位を算出する。そして、加算部１６が、顔検出部１２から出力される視点位置情報に重心点の移動量を加算することにより、視点位置情報が補正される。

［情報処理装置の動作例］
（顔検出部及び重心算出部の動作例）
　次に、第１の実施の形態に係る情報処理装置１の動作例について説明する。始めに、図４Ａ～図４Ｃを参照して、顔検出部１２及び重心算出部１３の動作例について説明する。図４Ａは、イメージセンサ１１により撮像された画像の一例である撮像画像ＩＭ１を示している。撮像画像ＩＭ１には、ユーザＵが含まれている。

　顔検出部１２は、撮像画像ＩＭ１を使用してユーザＵの顔を検出する。顔検出の結果、図４Ｂに示すように顔を含む領域に顔枠３１が設定され、顔枠３１の領域を示す顔枠情報が得られる。なお、顔を検出する方法は、画像の特徴を利用して行う方法等、公知の方法を適用することができる。顔検出部１２は、顔枠情報を重心算出部１３に出力する。

　また、顔検出部１２は、撮像画像ＩＭ１を使用してユーザＵの右目Ｅ１及び左目Ｅ２を検出する。顔検出部１２は、テンプレートマッチングや特徴点を用いた方法等、公知の方法を適用することによりユーザＵの右目Ｅ１及び左目Ｅ２を検出する。顔検出部１２は、検出結果に基づいて、右目Ｅ１の画面内における座標である位置情報３２Ａと、左目Ｅ２の画面内における座標である位置情報３２Ｂとを含む視点位置情報を生成する。顔検出部１２は、視点位置情報を加算部１６に出力する。このように、顔検出部１２が行う処理により、顔枠情報及び視点位置情報を含む顔検出情報が得られる。

　重心算出部１３は、顔検出部１２から供給された顔枠情報に対応する所定の顔枠（例えば、顔枠３１）を初期値として、顔枠内の重心点を算出する。重心点の算出範囲は、例えば、顔枠内における肌色成分の領域に設定される。これにより、図４Ｃに模式的に示すように、ユーザＵの顔の重心点３５が検出される。重心点の探索枠は、顔枠内の肌色領域の分布に追従する。従って、顔が右側に移動した場合、その動きに伴って探索枠も右に移動する。

　なお、顔検出部１２が顔検出情報を取得するためには、一定の処理時間が必要とされる。それに対して、重心算出部１３は、予め設定された探索内における所定の色成分（本例では、肌色成分）を対象に重心点を算出すれば良いので、重心算出部１３が重心点を取得するために要する時間は、顔検出部１２が顔検出情報を取得するために要する時間に比べて短くなる。即ち、重心算出部１３により行われる重心点を算出する処理は、処理的な負荷が軽いため入力に対してほぼ遅延なく実行することができる。

（補正部の動作例）
　次に、補正部１４の動作例について説明する。補正部１４の動作例の概略について、図５Ａ及び図５Ｂを参照して説明する。図５Ａに示すように、例えば、Ｘ軸上のｘ１地点でユーザＵが撮像された撮像画像が顔検出部１２に供給された場合を考える。顔検出部１２は、ｘ１地点に存在するユーザＵの顔枠や視点位置を検出し、検出結果に基づいて顔検出情報を生成、取得する。ここで、顔検出部１２が顔検出情報を取得するまでに要する時間（検出時間）をｔとする。検出時間ｔ経過後、顔検出部１２は、取得した顔検出情報を出力する。

　しかしながら、検出時間ｔの間にユーザＵが移動し、出力された顔検出情報に含まれる視点位置情報により示される視点位置と、現在における視点位置との間に乖離が生じる場合もあり得る。例えば、図５Ｂに模式的に示すように、検出時間ｔの間に、ユーザＵがｘ１地点からｘ２地点まで移動した場合、顔検出部１２により検出された両眼の視点位置はt時間前の過去の視点位置になってしまい実際の視点位置（ｘ２地点に居るユーザＵの視点位置）とずれてしまう。このように、顔検出部１２が出力する視点位置情報は、遅延を含んでいる。従って、顔検出部１２が出力する視点位置情報の視点位置のみに基づいて後段の視差画像処理ユニット２０が視差画像を生成してしまうと、過去の視点位置に対応する視差画像が生成されるため、ユーザＵに対して提示される立体画像が不自然になる虞がある。

　一方で、上述したように、重心点を算出する処理は、ハイフレームレート（本例では、１０００ｆｐｓ）に対応する速さでリアルタイムに行うことができる。そこで、図５Ｂに示すように、例えば、ｘ１地点からｘ２地点にユーザＵが移動した際の重心点の移動量ΔＡを算出する。このΔＡを、ｘ１地点における視点位置情報に加算することにより、ｘ２地点における視点位置情報をリアルタイムに取得することができる。なお、図５Ｂでは、重心点が星印により模式的に示されている。

　図６のタイミングチャートを参照して、より具体的な例について説明する。以下に説明する例では、イメージセンサ１１が１０００ｆｐｓで撮像画像を取得する。また、顔検出部１２が顔検出情報を検出するためまでに要する時間は、例えば１６ｍｓ（ミリ秒）とする。顔検出情報を検出するためまでに要する期間内に１６枚のフレームが入力される。なお、重心算出部１３は、１ｍｓ毎に重心点を算出できるものとする。

　図６に示すように、所定のタイミングＴＡにおいて撮像が開始され、ユーザＵの顔を含む撮像画像が顔検出部１２に入力される。タイミングＴＡから１６ｍｓ後のタイミングＴＢで、顔検出部１２の処理により顔検出情報が検出され、顔枠が検出されたタイミングＴＡにおけるユーザの視点位置が検出される。

　顔検出部１２により検出された顔枠情報が重心算出部１３に供給される。重心算出部１３は、顔検出部１２により次の顔検出情報が検出されるまでの間、タイミングＴＢで検出された顔枠内における重心点をリアルタイムに算出する。そして、重心算出部１３は、リアルタイムに算出した重心点の座標を移動量算出部１５に供給する。移動量算出部１５は、重心点の移動量である重心差分を１ｍｓ毎に算出し、蓄積する。

　移動量算出部１５は、例えば、重心点のＸ軸方向の変位及びＹ軸方向の変位をそれぞれ算出する。また、例えば、タイミングＴＢにおける重心点の座標から遠くなる場合は移動量が加算され、反対に、タイミングＴＢにおける重心点の座標に近づく場合は移動量が減算される。なお、図６では、重心差分がリニアに増えているように示されているが、１６ｍｓの間にユーザＵの動きがない場合は、重心差分が０になる。

　具体的には、移動量算出部１５は、フレーム間（フレーム１６と１７の間）の重心差分ｄ０を算出する。また、移動量算出部１５は、フレーム間（フレーム１７と１８の間）の重心差分ｄ１を算出する。同様にして、移動量算出部１５は、重心差分であるｄ２、ｄ３・・ｄ９、ｄａ、ｄｂ・・ｄｆを算出する。移動量算出部１５は、最終的な重心差分ｄｆを加算部１６に供給する。

　フレーム３２が入力されるタイミングであるタイミングＴＣにおいて、顔検出部１２により顔検出情報が検出され、両眼座標に対応する視点位置情報ｐ０が検出される。この視点位置情報ｐ０は、１６フレーム前のタイミングＴＢにおけるユーザＵの視点位置である。即ち、遅延を含む視点位置情報である。そこで、加算部１６は、視点位置情報ｐ０に重心差分ｄｆを加算することにより視点位置情報ｐ０を補正し、現在の視点位置に対応する視点位置情報を取得する。補正後の視点位置情報が加算部１６から視差画像処理ユニット２０に供給される。視差画像処理ユニット２０は、供給された視点位置情報をトラッキングデータとして使用し、当該視点位置情報が示す視点位置に対応する立体画像を生成し、表示する。

　以下の処理が連続的に行われる。例えば、タイミングＴＣから、次の顔検出情報が検出されるタイミングＴＤ（フレーム４８が入力されるタイミング）までの間、フレーム毎の重心座標が算出され、フレーム間の重心差分が蓄積される。タイミングＴＤで検出された視点位置情報ｐ１は、タイミングＴＣの視点位置を示す情報である。そこで、補正部１４は、タイミングＴＣにおける視点位置情報ｐ０に重心差分ｄｆ、ｅｆを加算することにより、遅延が解消された、現在の視点位置に対応する視点位置情報を取得する。

　なお、顔検出情報が検出されたタイミング毎にリセットフラグ（例えば、論理的な値「１」）が設定され、蓄積された重心差分がリセットされる。そして、リセットフラグが設定されたタイミングにおける視点位置情報が、補正対象の視点位置情報として用いられる。

［処理の流れ］
　次に、図７のフローチャートを参照して、第１の実施の形態に係る視点検出ユニット１０で行われる処理の流れについて説明する。

　処理が始まると、イメージセンサ１１を介して撮像画像が取得され、取得された撮像画像が顔検出部１２に供給される（ステップＳＴ１１）。顔検出部１２は、撮像画像に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を生成する。顔枠情報が重心算出部１３に供給される。重心算出部１３は、顔枠情報に対応する顔枠内における肌色成分の重心点を算出する（ステップＳＴ１２）。

　そして、移動量算出部１５が、重心算出部１３により算出された重心点と、前フレームにおいて重心算出部１３により算出された重心点との位置の差分値である重心差分を算出し、重心点の総移動量に加算する（ステップＳＴ１３）。これにより、重心点の移動量が蓄積されていく。

　そして、リセットフラグ＝１であるか否かが判断される（ステップＳＴ１４）。ここでリセットフラグ＝１であれば、新たな顔検出情報が検出され、処理に使用される顔検出情報が検出された顔検出情報に更新される。リセットフラグ＝１が設定されている場合には、蓄積された最終的な重心差分の値、換言すれば、顔検出情報の検出周期における最終的な重心差分の値がリセットされる（ステップＳＴ１５）。

　リセットフラグ＝１でなくリセットフラグ＝０である場合は、最終的な重心差分の値が加算部１６に転送される（ステップＳＴ１６）。

　また、撮像画像の入力タイミングから例えば１６ｍｓ経過して新たな顔検出情報が検出され、顔検出情報が更新された否かが判断される（ステップＳＴ１７）。係る判断は、例えば、１ｍｓ毎に行われる。新たな顔検出情報が検出されない場合には、リセットフラグ＝０が設定される（ステップＳＴ１８）。

　顔検出部１２により新たな顔検出情報が検出された場合は、リセットフラグ＝１が設定される（ステップＳＴ１９）。そして、検出された新たな顔検出情報が以降の処理で使用されるように、顔検出情報に含まれる顔枠情報及び視点位置情報を更新する（ステップＳＴ２０）。そして、更新後の視点位置情報が加算部１６に転送される（ステップＳＴ２１）。

　加算部１６では、視点位置情報に最終的な重心差分の値が加算されることにより、視点位置情報が補正される。補正後の視点位置情報が出力される（ステップＳＴ２２）。なお、図示はしていないが、後段の視差画像処理ユニット２０では、補正後の視点位置情報により示される視点位置に対応する立体画像が生成される。

［第１の実施の形態の効果例］
　第１の実施の形態によれば、ユーザの現時点の視点をリアルタイムに且つ安定的に取得ことが可能になる。
　また、非特許文献１に記載された複雑なアルゴリズムを用いないため、ユーザの現時点の視点を迅速に取得することができる。
　また、眼鏡等を使用することなく立体画像を視聴可能なシステムにおいて、視点位置を適切にトラッキングすることが可能となる。
　また、視聴位置を予測する手法では、外乱要因としてノイズに影響を受けやすく、また、線形移動の場合には効果を奏し得るものの、ユーザの動きは非線形で複雑であり、表示する画像も定常的な更新周期でない場合もあるなど予測が困難になってしまうという問題がある。しかしながら、本実施の形態によれば、視聴位置を予測する処理をしていないため係る問題が生じることはない。

　図８は、第１の実施の形態の効果例を説明するための図である。図８のグラフにおける横軸はフレーム数を示し、縦軸は座標（例えば、Ｘ座標）を示している。図８のグラフにおける点線Ｌ１は、顔検出情報の視点位置情報により示される視点座標を示している。また、一点鎖線Ｌ２は、重心点の移動量を加算した視点座標、即ち、補正後の視点位置情報を示している。また、実線Ｌ３は、顔枠内の重心座標を示している。

　図８のグラフに示すように、顔検出情報を検出するのに要する時間の間、重心座標が移動した距離が顔検出の視点座標に加算される。これにより、重心座標の変化と同様になめらかな変化を示す現在の視点座標をトラッキングデータとして取得することができる。

　なお、重心算出部１３により算出される重心点は、顔の中心点と一致する必要がある。しかしながら、本実施の形態のように、一定周期毎に顔枠が更新される例では、顔枠内における肌色領域が入力画像の顔枠と乖離してしまう可能性がある。この為、顔枠の中心点と重心点との差異が一定以上となった場合に、顔枠の再設定がなされても良い。また、顔枠の定期的な更新がなされても良い。

　例えば、図９Ａに示すように、顔枠４１内における顔中心４２の座標をα（ｘ₁，ｙ₁）とする。座標αは、例えば、顔検出部１２により算出される。また、図９Ｂに示すように、重心算出部１３により算出される重心点４３の座標をβ（ｘ₂，ｙ₂）とする。２点間のユークリッド距離ｄが下記の数式１により求められる。

　ユーグリッド距離ｄが例えばｄ≦５０となった場合、つまり、顔中心４２の座標αと重心点４３の座標βとの間の２次元空間距離が５０ピクセル以下となった場合に顔枠の再設定がなされるようにしても良い。探索枠の再設定を実施することで顔検出と連動した重心算出が可能になる。

＜第２の実施の形態＞
　次に、第２の実施の形態について説明する。なお、第１の実施の形態で説明した事項は、特に断らない限り、第２の実施の形態にも適用することができる。例えば、視差画像処理ユニット２０の構成、動作については、第１の実施の形態で説明した内容を、第２の実施の形態にも適用することができる。また、第１の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。

［視点検出ユニットの構成例］
　図１０は、第２の実施の形態に係る視点検出ユニット（視点検出ユニット１０Ａ）の構成例を示すブロック図である。視点検出ユニット１０Ａは、例えば、イメージセンサ１１、顔検出部１２、重心算出部１３、加速度検出部５１及び座標比率決定部５２を有している。イメージセンサ１１、顔検出部１２及び重心算出部１３については、第１の実施の形態で説明しているため、重複した説明を適宜、省略する。なお、第２の実施の形態では、イメージセンサ１１と重心算出部１３とが別の構成とされているが、第１の実施の形態と同様、イメージセンサ１１が重心算出部１３を有する構成であっても良い。

　顔検出部１２は、撮像画像に基づいて顔検出情報を生成し、顔枠情報を重心算出部１３に、視点位置情報を座標比率決定部５２にそれぞれ出力する。重心算出部１３は、顔枠内における重心点を算出し、算出結果である重心点の座標を加速度検出部５１と座標比率決定部５２とに出力する。

　加速度検出部５１では、例えば前画像の重心点の座標を保持しておき、入力された現画像における重心点の座標との差分を計算する。この差分が加速度に対応する。計算の結果得られる差分値を座標比率決定部５２に出力する。

　座標比率決定部５２は、加速度検出部５１から供給される差分値に応じて、視点位置情報により示される視点位置の座標と、重心点の座標とを加重加算するための比率（それぞれの座標に対して設定される重み）を決定する。座標比率決定部５２は、決定した比率を使用した重み付け加算を行うことにより、視差画像処理ユニット２０に対して出力される視点位置情報を生成する。

　例えば、座標比率決定部５２は、加速度検出部５１から供給される差分値が大きい場合、つまり早い動きを検出した時には、応答性に優れた重心座標の比率を増やすように比率を設定する。一方、差分値が少ない場合は動きが少ないと判断出来るので、安定性の高い顔検出情報に含まれる視点位置情報の比率を増やす。ここでの安定性が高いとは、顔検出情報に含まれる視点位置情報は視点位置そのものであり、予測値である、重心点の移動量を加算した場合の視点位置情報よりも精度が高いという意味である。

［処理の流れ］
　次に、図１１のフローチャートを参照して、第２の実施の形態に係る視点検出ユニット１０Ａが行う処理の流れについて説明する。

　処理が開始されると、イメージセンサ１１を介して得られた撮像画像が、顔検出部１２に入力される（ステップＳＴ３１）。そして、顔検出部１２が、撮像画像に基づいて顔検出情報を取得し、取得した顔検出情報を出力する（ステップＳＴ３２）。

　また、イメージセンサ１１を介して得られた撮像画像が、重心算出部１３に入力される（ステップＳＴ３３）。そして、重心算出部１３は、顔枠情報の更新があるか否かを判断する（ステップＳＴ３４）。重心算出部１３は、例えば、顔検出部１２から新たな顔枠情報が入力された否かによって、顔枠情報の更新があるか否かを判断する。

　顔枠情報の更新がある場合は、重心算出部１３は、更新後の顔枠情報により示される座標を、重心点の探索枠として設定する（ステップＳＴ３５）。そして、重心算出部１３は、設定後の顔枠内における重心点を算出する。なお、顔枠情報の更新がない場合は、重心算出部１３は、それまでの顔枠情報を重心点の探索枠として重心点を算出する（ステップＳＴ３６）。重心算出部１３は、算出した重心点の座標を、加速度検出部５１及び座標比率決定部５２のそれぞれに出力する。

　加速度検出部５１は、例えば、前フレームの重心点の座標と現フレームの重心点の座標との差分値を算出する。そして、加速度検出部５１は、算出した差分値を座標比率決定部５２に出力する（ステップＳＴ３７）。

　座標比率決定部５２は、加速度検出部５１から供給された差分値に応じた重み付け比率を決定する（ステップＳＴ３８）。そして、座標比率決定部５２は、重み付け比率を使用して、視点位置情報により示される視点座標及び重心点の座標に対する重み付け加算を行い、出力対象の視点位置情報を生成する（ステップＳＴ３９）。なお、図示はしていないが、後段の視差画像処理ユニット２０では、座標比率決定部５２から出力された視点位置情報により示される視点位置に対応する立体画像が生成される。

　以上説明した第２の実施の形態によれば、例えば、下記の効果が得られる。加速度を検出する際に使用される重心の差分値では、予測ではなく現在のフレームに対する動きを捉えることができるため、応答誤差の少ないシステムとして構築できる。また、精度の高い現在の視点位置を得ることが可能となる。

＜第３の実施の形態＞
　次に、第３の実施の形態について説明する。なお、第１、第２の実施の形態で説明した事項は、特に断らない限り、第３の実施の形態にも適用することができる。また、第１、第２の実施の形態で説明した構成と同一若しくは同質の構成については、同じ参照符号を付し、重複した説明を適宜、省略する。

［視点検出ユニットの構成例］
　図１２は、第３の実施の形態に係る視点検出ユニット（視点検出ユニット１０Ｂ）の構成例を示すブロック図である。視点検出ユニット１０Ｂは、例えば、イメージセンサ１１、顔検出部１２、重心算出部１３、補正部１４、測距部６１及び切替部６２を有している。第１の実施の形態と同様に、補正部１４は、移動量算出部１５及び加算部１６を有している。なお、第３の実施の形態では、イメージセンサ１１と重心算出部１３が別の構成とされているが、第１の実施の形態と同様、イメージセンサ１１が重心算出部１３を有する構成であっても良い。

　第３の実施の形態に係る視点検出ユニット１０Ｂは、顔検出の対象であるユーザまでの距離を計測する測距部６１の測距結果に応じて、顔検出部１２により生成された顔検出情報に含まれる視点位置情報及び補正部１４により補正された視点位置情報の何れかが、切替部６２から選択的に出力されるように構成されている。より具体的には、測距部６１による測距結果が閾値より小さい場合には、補正部１４により補正された視点位置情報が切替部６２から出力され、測距結果が前記閾値より大きい場合には、顔検出部１２により生成された視点位置情報が出力されるように構成されている。

　イメージセンサ１１、顔検出部１２、重心算出部１３、補正部１４については、第１の実施の形態で説明した動作をそれぞれ行う。これにより、顔検出部１２からは、視点位置情報を含む顔検出情報が出力される。顔検出部１２から出力された顔検出情報（少なくとも視点位置情報）は、測距部６１及び切替部６２のそれぞれに供給される。また、加算部１６から出力される補正後の視点位置情報が、切替部６２に供給される。

　測距部６１は、例えば、顔検出部１２から供給される視点位置情報を使用して、ユーザＵまでの距離を計測する。例えば、測距部６１は、視点位置情報を用いて右目と左目との眼間距離が６．５ｃｍとした場合の推定距離を導き出し、推定距離を示す測距データを切替部６２に出力する。勿論、他の手法を用いて測距部６１が測距を行うようにしても良い。また、測距部６１は、ＴｏＦ(Time of Flight)やＬｉｄａｒ(Light Detection and Ranging)等のセンサであっても構わない。

　切替部６２は、測距結果が閾値より小さい場合、即ち、ユーザＵが情報処理装置１に対して近い位置に居る場合は、補正部１４により補正された視点位置情報を選択して出力する。また、切替部６２は、測距結果が閾値より大きい場合、即ち、ユーザＵが情報処理装置１に対して遠い位置に居る場合は、顔検出部１２により生成された視点位置情報を選択して出力する。

［処理の流れ］
　次に、第３の実施の形態に係る視点検出ユニット１０Ｂが行う処理の流れについて説明する。始めに、図１３に示すフローチャートを参照して、測距部６１が行う処理（測距処理）の流れについて説明する。

　測距部６１は、顔検出部１２から供給される顔検出情報に基づいて、測距データを生成する。そして、生成した測距データを切替部６２に出力する（ステップＳＴ４１）。切替部６２は、測距部６１から供給された測距データを読み込む（ステップＳＴ４２）。これらの処理が、測距部６１に対して顔検出部１２から顔検出情報が供給される度に行われる。

　次に、図１４のフローチャートを参照して、第３の実施の形態に係る視点検出ユニット１０Ｂが行う処理の流れについて説明する。

　処理が開始されると、イメージセンサ１１を介して得られた撮像画像が、顔検出部１２に入力される（ステップＳＴ５１）。そして、顔検出部１２が、撮像画像に基づいて顔検出情報を取得し、取得した顔検出情報を出力する（ステップＳＴ５２）。

　顔検出部１２により生成された顔検出情報が測距部６１に供給される。測距部６１は、上述した測距処理を行う（ステップＳＴ５３）。測距処理により得られた測距データが切替部６２に供給され、切替部６２に読み込まれる（ステップＳＴ５４）。

　また、イメージセンサ１１を介して得られた撮像画像が、重心算出部１３に入力される（ステップＳＴ５５）。そして、重心算出部１３は、顔枠情報の更新があるか否かを判断する（ステップＳＴ５６）。重心算出部１３は、例えば、顔検出部１２から新たな顔枠情報が入力された否かによって、顔枠情報の更新があるか否かを判断する。

　顔枠情報の更新がある場合は、重心算出部１３は、更新後の顔枠情報により示される座標を、重心点の探索枠として設定する（ステップＳＴ５７）。そして、重心算出部１３は、設定後の顔枠内における重心点を算出する。なお、顔枠情報の更新がない場合は、重心算出部１３は、それまでの顔枠情報を重心点の探索枠として重心点を算出する（ステップＳＴ５８）。

　そして、移動量算出部１５が、重心点の差分である重心差分を算出し、蓄積する（ステップＳＴ５９）。そして、加算部１６は、最終的な重心差分を、顔検出部１２から供給される視点位置情報に加算する（ステップＳＴ６０）。なお、上述したステップＳＴ５５～ＳＴ６０までの処理は、第１の実施の形態で説明した処理と同様の処理である。

　切替部６２は、読み込んだ測距データが設定値より大きい（例えば、設定値以上）か否かを判断する（ステップＳＴ６１）。そして、測距データが設定値以上である場合は、切替部６２は、補正されていない視点位置情報、即ち、顔検出部１２から供給される視点位置情報を出力する（ステップＳＴ６２）。一方、測距データが設定値より小さい場合は、切替部６２は、補正された視点位置情報、即ち、移動量算出部１５から供給される視点位置情報を出力する（ステップＳＴ６３）。

　なお、図示はしていないが、後段の視差画像処理ユニット２０では、切替部６２から出力された視点位置情報により示される視点位置に対応する立体画像が生成される。

　以上、説明した第３の実施の形態によれば、例えば、下記の効果が得られる。情報処理装置までのユーザの距離が閾値より小さい近接した距離の場合は、加算部から出力される、応答性に優れた視点位置情報を選択し、出力することができる。また、情報処理装置までのユーザの距離が閾値より大きい遠距離の場合は、顔検出部１２から出力される、安定感のある視点位置情報を選択し、出力することができる。
　情報処理装置までのユーザの距離が遠いほど、画面上における視点位置の変化は小さくなり、顔検出情報が検出されるまでのレイテンシによる立体画像への影響をユーザが感じづらくなる。一方、重心算出部や補正部が処理を行う場合に、入力される画像が多いほど、つまりハイフレームレートであるほどチャタリングが発生し、ノイズ等が発生する虞がある。第３の実施の形態によれば、ユーザが情報処理装置に対して近接した位置に居る時には、過渡応答に優れたトラッキングデータを出力することができ、ユーザが情報処理装置に対して遠距離置に居る時には、ノイズによる微動を抑えたトラッキングデータを出力することができる。これにより迅速かつ安定的な視点位置のトラッキングが可能になる。

＜変形例＞
　以上、本開示の複数の実施の形態について具体的に説明したが、本開示の内容は上述した実施の形態に限定されるものではなく、本開示の技術的思想に基づく各種の変形が可能である。以下、変形例について説明する。

　上述した実施の形態では、基準点として重心点を例に説明したが、これに限定されるものではなく、重心点以外の適宜な箇所が基準点として設定されても良い。

　上述した実施の形態では、隣接したフレーム間における重心点の移動量を算出するようにしたがこれに限定されるものではない。例えば、所定のフレーム数、離れたフレーム間における重心点の移動量を算出するようにしても良い。これにより、ハイフレームレートで画像が入力される場合に、処理の負荷を軽くすることができる。

　上述した実施の形態では、情報処理装置が、視点検出ユニット及び視差画像処理ユニットを有する構成としてが、視差画像処理ユニットを別の装置が有する構成であっても良い。

　上述した実施の形態で説明した構成は一例に過ぎず、これに限定されるものではない。本開示の趣旨を逸脱しない範囲で、構成の追加、削除等が行われて良いことは言うまでもない。各実施の形態及び変形例で説明した内容は、適宜、組み合わせることも可能である。本開示は、装置、方法、プログラム、システム等の任意の形態で実現することもできる。プログラムは、例えば、視点検出ユニットが有するメモリや適宜な記録媒体に記憶され、実行され得る。

　本開示は、以下の構成も採ることができる。
（１）
　撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
　前記顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
　前記基準点の移動量に応じて前記視点位置情報を補正する補正部と
　を有する情報処理装置。
（２）
　前記補正部は、前記顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した基準点の移動量に応じて、前記視点位置情報を補正する
　（１）に記載の情報処理装置。
（３）
　前記補正部は、第１の顔検出情報を取得してから、当該第１の顔検出情報の次の顔検出情報である第２の顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した前記基準点の移動量に応じて、前記第１の顔検出情報に含まれる視点位置情報を補正する
　（１）又は（２）に記載の情報処理装置。
（４）
　前記補正部は、フレーム間における前記基準点の移動量を蓄積する
　（２）に記載の情報処理装置。
（５）
　前記基準点算出部は、前記基準点として、前記顔枠内における所定の色成分の領域内に存在する重心点を算出する
　（１）から（４）までの何れかに記載の情報処理装置。
（６）
　前記所定の色成分は、肌色成分である
　（５）に記載の情報処理装置。
（７）
　前記補正部は、前記基準点の移動量に応じた重み付けを設定し、前記顔検出情報に含まれる前記視点位置情報と、前記基準点の位置情報とを、前記設定した重み付けを使用して重み付け加算する
　（１）に記載の情報処理装置。
（８）
　顔検出の対象であるユーザまでの距離を計測する測距部を有し、
　前記測距部の測距結果に応じて、前記取得部により生成された視点位置情報及び前記補正部により補正された視点位置情報の何れかを選択的に出力するように構成されている
　（１）から（６）までの何れかに記載の情報処理装置。
（９）
　前記測距結果が閾値より小さい場合には、前記補正部により補正された視点位置情報が出力され、
　前記測距結果が前記閾値より大きい場合には、前記取得部により生成された視点位置情報が出力されるように構成されている
　（８）に記載の情報処理装置。
（１０）
　前記撮像画像を取得する撮像部を有する
　（１）から（９）までの何れかに記載の情報処理装置。
（１１）
　前記撮像部が前記基準点算出部を有している
　（１０）に記載の情報処理装置。
（１２）
　前記撮像部は、１０００ｆｐｓ以上の撮像が可能とされている
　（１０）又は（１１）に記載の情報処理装置。
（１３）
　前記補正部により補正された視点位置を使用して立体画像を生成する立体画像取得部を有する
　（１）から（１２）までの何れかに記載の情報処理装置。
（１４）
　前記立体画像が表示されるディスプレイを有する
　（１３）に記載の情報処理装置。
（１５）
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
　情報処理方法。
（１６）
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
　情報処理方法をコンピュータに実行させるプログラム。

＜応用例＞
　本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、手術室システムに適用されてもよい。

　図１５は、本開示に係る技術が適用され得る手術室システム５１００の全体構成を概略的に示す図である。図１５を参照すると、手術室システム５１００は、手術室内に設置される装置群が視聴覚コントローラ（AV　Controller）５１０７及び手術室制御装置５１０９を介して互いに連携可能に接続されることにより構成される。

　手術室には、様々な装置が設置され得る。図１５では、一例として、内視鏡下手術のための各種の装置群５１０１と、手術室の天井に設けられ術者の手元を撮像するシーリングカメラ５１８７と、手術室の天井に設けられ手術室全体の様子を撮像する術場カメラ５１８９と、複数の表示装置５１０３Ａ～５１０３Ｄと、レコーダ５１０５と、患者ベッド５１８３と、照明５１９１と、を図示している。

　ここで、これらの装置のうち、装置群５１０１は、後述する内視鏡手術システム５１１３に属するものであり、内視鏡や当該内視鏡によって撮像された画像を表示する表示装置等からなる。内視鏡手術システム５１１３に属する各装置は医療用機器とも呼称される。一方、表示装置５１０３Ａ～５１０３Ｄ、レコーダ５１０５、患者ベッド５１８３及び照明５１９１は、内視鏡手術システム５１１３とは別個に、例えば手術室に備え付けられている装置である。これらの内視鏡手術システム５１１３に属さない各装置は非医療用機器とも呼称される。視聴覚コントローラ５１０７及び／又は手術室制御装置５１０９は、これら医療機器及び非医療機器の動作を互いに連携して制御する。

　視聴覚コントローラ５１０７は、医療機器及び非医療機器における画像表示に関する処理を、統括的に制御する。具体的には、手術室システム５１００が備える装置のうち、装置群５１０１、シーリングカメラ５１８７及び術場カメラ５１８９は、手術中に表示すべき情報（以下、表示情報ともいう）を発信する機能を有する装置（以下、発信元の装置とも呼称する）であり得る。また、表示装置５１０３Ａ～５１０３Ｄは、表示情報が出力される装置（以下、出力先の装置とも呼称する）であり得る。また、レコーダ５１０５は、発信元の装置及び出力先の装置の双方に該当する装置であり得る。視聴覚コントローラ５１０７は、発信元の装置及び出力先の装置の動作を制御し、発信元の装置から表示情報を取得するとともに、当該表示情報を出力先の装置に送信し、表示又は記録させる機能を有する。なお、表示情報とは、手術中に撮像された各種の画像や、手術に関する各種の情報（例えば、患者の身体情報や、過去の検査結果、術式についての情報等）等である。

　具体的には、視聴覚コントローラ５１０７には、装置群５１０１から、表示情報として、内視鏡によって撮像された患者の体腔内の術部の画像についての情報が送信され得る。また、シーリングカメラ５１８７から、表示情報として、当該シーリングカメラ５１８７によって撮像された術者の手元の画像についての情報が送信され得る。また、術場カメラ５１８９から、表示情報として、当該術場カメラ５１８９によって撮像された手術室全体の様子を示す画像についての情報が送信され得る。なお、手術室システム５１００に撮像機能を有する他の装置が存在する場合には、視聴覚コントローラ５１０７は、表示情報として、当該他の装置からも当該他の装置によって撮像された画像についての情報を取得してもよい。

　あるいは、例えば、レコーダ５１０５には、過去に撮像されたこれらの画像についての情報が視聴覚コントローラ５１０７によって記録されている。視聴覚コントローラ５１０７は、表示情報として、レコーダ５１０５から当該過去に撮像された画像についての情報を取得することができる。なお、レコーダ５１０５には、手術に関する各種の情報も事前に記録されていてもよい。

　視聴覚コントローラ５１０７は、出力先の装置である表示装置５１０３Ａ～５１０３Ｄの少なくともいずれかに、取得した表示情報（すなわち、手術中に撮影された画像や、手術に関する各種の情報）を表示させる。図示する例では、表示装置５１０３Ａは手術室の天井から吊り下げられて設置される表示装置であり、表示装置５１０３Ｂは手術室の壁面に設置される表示装置であり、表示装置５１０３Ｃは手術室内の机上に設置される表示装置であり、表示装置５１０３Ｄは表示機能を有するモバイル機器（例えば、タブレットＰＣ（Personal　Computer））である。

　また、図１５では図示を省略しているが、手術室システム５１００には、手術室の外部の装置が含まれてもよい。手術室の外部の装置は、例えば、病院内外に構築されたネットワークに接続されるサーバや、医療スタッフが用いるＰＣ、病院の会議室に設置されるプロジェクタ等であり得る。このような外部装置が病院外にある場合には、視聴覚コントローラ５１０７は、遠隔医療のために、テレビ会議システム等を介して、他の病院の表示装置に表示情報を表示させることもできる。

　手術室制御装置５１０９は、非医療機器における画像表示に関する処理以外の処理を、統括的に制御する。例えば、手術室制御装置５１０９は、患者ベッド５１８３、シーリングカメラ５１８７、術場カメラ５１８９及び照明５１９１の駆動を制御する。

　手術室システム５１００には、集中操作パネル５１１１が設けられており、ユーザは、当該集中操作パネル５１１１を介して、視聴覚コントローラ５１０７に対して画像表示についての指示を与えたり、手術室制御装置５１０９に対して非医療機器の動作についての指示を与えることができる。集中操作パネル５１１１は、表示装置の表示面上にタッチパネルが設けられて構成される。

　図１６は、集中操作パネル５１１１における操作画面の表示例を示す図である。図１６では、一例として、手術室システム５１００に、出力先の装置として、２つの表示装置が設けられている場合に対応する操作画面を示している。図１６を参照すると、操作画面５１９３には、発信元選択領域５１９５と、プレビュー領域５１９７と、コントロール領域５２０１と、が設けられる。

　発信元選択領域５１９５には、手術室システム５１００に備えられる発信元装置と、当該発信元装置が有する表示情報を表すサムネイル画面と、が紐付けられて表示される。ユーザは、表示装置に表示させたい表示情報を、発信元選択領域５１９５に表示されているいずれかの発信元装置から選択することができる。

　プレビュー領域５１９７には、出力先の装置である２つの表示装置（Monitor1、Monitor2）に表示される画面のプレビューが表示される。図示する例では、１つの表示装置において４つの画像がＰｉｎＰ表示されている。当該４つの画像は、発信元選択領域５１９５において選択された発信元装置から発信された表示情報に対応するものである。４つの画像のうち、１つはメイン画像として比較的大きく表示され、残りの３つはサブ画像として比較的小さく表示される。ユーザは、４つの画像が表示された領域を適宜選択することにより、メイン画像とサブ画像を入れ替えることができる。また、４つの画像が表示される領域の下部には、ステータス表示領域５１９９が設けられており、当該領域に手術に関するステータス（例えば、手術の経過時間や、患者の身体情報等）が適宜表示され得る。

　コントロール領域５２０１には、発信元の装置に対して操作を行うためのＧＵＩ（Graphical　User　Interface）部品が表示される発信元操作領域５２０３と、出力先の装置に対して操作を行うためのＧＵＩ部品が表示される出力先操作領域５２０５と、が設けられる。図示する例では、発信元操作領域５２０３には、撮像機能を有する発信元の装置におけるカメラに対して各種の操作（パン、チルト及びズーム）を行うためのＧＵＩ部品が設けられている。ユーザは、これらのＧＵＩ部品を適宜選択することにより、発信元の装置におけるカメラの動作を操作することができる。なお、図示は省略しているが、発信元選択領域５１９５において選択されている発信元の装置がレコーダである場合（すなわち、プレビュー領域５１９７において、レコーダに過去に記録された画像が表示されている場合）には、発信元操作領域５２０３には、当該画像の再生、再生停止、巻き戻し、早送り等の操作を行うためのＧＵＩ部品が設けられ得る。

　また、出力先操作領域５２０５には、出力先の装置である表示装置における表示に対する各種の操作（スワップ、フリップ、色調整、コントラスト調整、２Ｄ表示と３Ｄ表示の切り替え）を行うためのＧＵＩ部品が設けられている。ユーザは、これらのＧＵＩ部品を適宜選択することにより、表示装置における表示を操作することができる。

　なお、集中操作パネル５１１１に表示される操作画面は図示する例に限定されず、ユーザは、集中操作パネル５１１１を介して、手術室システム５１００に備えられる、視聴覚コントローラ５１０７及び手術室制御装置５１０９によって制御され得る各装置に対する操作入力が可能であってよい。

　図１７は、以上説明した手術室システムが適用された手術の様子の一例を示す図である。シーリングカメラ５１８７及び術場カメラ５１８９は、手術室の天井に設けられ、患者ベッド５１８３上の患者５１８５の患部に対して処置を行う術者（医者）５１８１の手元及び手術室全体の様子を撮影可能である。シーリングカメラ５１８７及び術場カメラ５１８９には、倍率調整機能、焦点距離調整機能、撮影方向調整機能等が設けられ得る。照明５１９１は、手術室の天井に設けられ、少なくとも術者５１８１の手元を照射する。照明５１９１は、その照射光量、照射光の波長（色）及び光の照射方向等を適宜調整可能であってよい。

　内視鏡手術システム５１１３、患者ベッド５１８３、シーリングカメラ５１８７、術場カメラ５１８９及び照明５１９１は、図１５に示すように、視聴覚コントローラ５１０７及び手術室制御装置５１０９（図１７では図示せず）を介して互いに連携可能に接続されている。手術室内には、集中操作パネル５１１１が設けられており、上述したように、ユーザは、当該集中操作パネル５１１１を介して、手術室内に存在するこれらの装置を適宜操作することが可能である。

　以下、内視鏡手術システム５１１３の構成について詳細に説明する。図示するように、内視鏡手術システム５１１３は、内視鏡５１１５と、その他の術具５１３１と、内視鏡５１１５を支持する支持アーム装置５１４１と、内視鏡下手術のための各種の装置が搭載されたカート５１５１と、から構成される。

　内視鏡手術では、腹壁を切って開腹する代わりに、トロッカ５１３９ａ～５１３９ｄと呼ばれる筒状の開孔器具が腹壁に複数穿刺される。そして、トロッカ５１３９ａ～５１３９ｄから、内視鏡５１１５の鏡筒５１１７や、その他の術具５１３１が患者５１８５の体腔内に挿入される。図示する例では、その他の術具５１３１として、気腹チューブ５１３３、エネルギー処置具５１３５及び鉗子５１３７が、患者５１８５の体腔内に挿入されている。また、エネルギー処置具５１３５は、高周波電流や超音波振動により、組織の切開及び剥離、又は血管の封止等を行う処置具である。ただし、図示する術具５１３１はあくまで一例であり、術具５１３１としては、例えば攝子、レトラクタ等、一般的に内視鏡下手術において用いられる各種の術具が用いられてよい。

　内視鏡５１１５によって撮影された患者５１８５の体腔内の術部の画像が、表示装置５１５５に表示される。術者５１８１は、表示装置５１５５に表示された術部の画像をリアルタイムで見ながら、エネルギー処置具５１３５や鉗子５１３７を用いて、例えば患部を切除する等の処置を行う。なお、図示は省略しているが、気腹チューブ５１３３、エネルギー処置具５１３５及び鉗子５１３７は、手術中に、術者５１８１又は助手等によって支持される。

　（支持アーム装置）
　支持アーム装置５１４１は、ベース部５１４３から延伸するアーム部５１４５を備える。図示する例では、アーム部５１４５は、関節部５１４７ａ、５１４７ｂ、５１４７ｃ、及びリンク５１４９ａ、５１４９ｂから構成されており、アーム制御装置５１５９からの制御により駆動される。アーム部５１４５によって内視鏡５１１５が支持され、その位置及び姿勢が制御される。これにより、内視鏡５１１５の安定的な位置の固定が実現され得る。

　（内視鏡）
　内視鏡５１１５は、先端から所定の長さの領域が患者５１８５の体腔内に挿入される鏡筒５１１７と、鏡筒５１１７の基端に接続されるカメラヘッド５１１９と、から構成される。図示する例では、硬性の鏡筒５１１７を有するいわゆる硬性鏡として構成される内視鏡５１１５を図示しているが、内視鏡５１１５は、軟性の鏡筒５１１７を有するいわゆる軟性鏡として構成されてもよい。

　鏡筒５１１７の先端には、対物レンズが嵌め込まれた開口部が設けられている。内視鏡５１１５には光源装置５１５７が接続されており、当該光源装置５１５７によって生成された光が、鏡筒５１１７の内部に延設されるライトガイドによって当該鏡筒の先端まで導光され、対物レンズを介して患者５１８５の体腔内の観察対象に向かって照射される。なお、内視鏡５１１５は、直視鏡であってもよいし、斜視鏡又は側視鏡であってもよい。

　カメラヘッド５１１９の内部には光学系及び撮像素子が設けられており、観察対象からの反射光（観察光）は当該光学系によって当該撮像素子に集光される。当該撮像素子によって観察光が光電変換され、観察光に対応する電気信号、すなわち観察像に対応する画像信号が生成される。当該画像信号は、ＲＡＷデータとしてカメラコントロールユニット（ＣＣＵ：Camera　Control　Unit）５１５３に送信される。なお、カメラヘッド５１１９には、その光学系を適宜駆動させることにより、倍率及び焦点距離を調整する機能が搭載される。

　なお、例えば立体視（３Ｄ表示）等に対応するために、カメラヘッド５１１９には撮像素子が複数設けられてもよい。この場合、鏡筒５１１７の内部には、当該複数の撮像素子のそれぞれに観察光を導光するために、リレー光学系が複数系統設けられる。

　（カートに搭載される各種の装置）
　ＣＣＵ５１５３は、ＣＰＵ（Central　Processing　Unit）やＧＰＵ（Graphics　Processing　Unit）等によって構成され、内視鏡５１１５及び表示装置５１５５の動作を統括的に制御する。具体的には、ＣＣＵ５１５３は、カメラヘッド５１１９から受け取った画像信号に対して、例えば現像処理（デモザイク処理）等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。ＣＣＵ５１５３は、当該画像処理を施した画像信号を表示装置５１５５に提供する。また、ＣＣＵ５１５３には、図１５に示す視聴覚コントローラ５１０７が接続される。ＣＣＵ５１５３は、画像処理を施した画像信号を視聴覚コントローラ５１０７にも提供する。また、ＣＣＵ５１５３は、カメラヘッド５１１９に対して制御信号を送信し、その駆動を制御する。当該制御信号には、倍率や焦点距離等、撮像条件に関する情報が含まれ得る。当該撮像条件に関する情報は、入力装置５１６１を介して入力されてもよいし、上述した集中操作パネル５１１１を介して入力されてもよい。

　表示装置５１５５は、ＣＣＵ５１５３からの制御により、当該ＣＣＵ５１５３によって画像処理が施された画像信号に基づく画像を表示する。内視鏡５１１５が例えば４Ｋ（水平画素数３８４０×垂直画素数２１６０）又は８Ｋ（水平画素数７６８０×垂直画素数４３２０）等の高解像度の撮影に対応したものである場合、及び／又は３Ｄ表示に対応したものである場合には、表示装置５１５５としては、それぞれに対応して、高解像度の表示が可能なもの、及び／又は３Ｄ表示可能なものが用いられ得る。４Ｋ又は８Ｋ等の高解像度の撮影に対応したものである場合、表示装置５１５５として５５インチ以上のサイズのものを用いることで一層の没入感が得られる。また、用途に応じて、解像度、サイズが異なる複数の表示装置５１５５が設けられてもよい。

　光源装置５１５７は、例えばＬＥＤ（light　emitting　diode）等の光源から構成され、術部を撮影する際の照射光を内視鏡５１１５に供給する。

　アーム制御装置５１５９は、例えばＣＰＵ等のプロセッサによって構成され、所定のプログラムに従って動作することにより、所定の制御方式に従って支持アーム装置５１４１のアーム部５１４５の駆動を制御する。

　入力装置５１６１は、内視鏡手術システム５１１３に対する入力インタフェースである。ユーザは、入力装置５１６１を介して、内視鏡手術システム５１１３に対して各種の情報の入力や指示入力を行うことができる。例えば、ユーザは、入力装置５１６１を介して、患者の身体情報や、手術の術式についての情報等、手術に関する各種の情報を入力する。また、例えば、ユーザは、入力装置５１６１を介して、アーム部５１４５を駆動させる旨の指示や、内視鏡５１１５による撮像条件（照射光の種類、倍率及び焦点距離等）を変更する旨の指示、エネルギー処置具５１３５を駆動させる旨の指示等を入力する。

　入力装置５１６１の種類は限定されず、入力装置５１６１は各種の公知の入力装置であってよい。入力装置５１６１としては、例えば、マウス、キーボード、タッチパネル、スイッチ、フットスイッチ５１７１及び／又はレバー等が適用され得る。入力装置５１６１としてタッチパネルが用いられる場合には、当該タッチパネルは表示装置５１５５の表示面上に設けられてもよい。

　あるいは、入力装置５１６１は、例えばメガネ型のウェアラブルデバイスやＨＭＤ（Head　Mounted　Display）等の、ユーザによって装着されるデバイスであり、これらのデバイスによって検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。また、入力装置５１６１は、ユーザの動きを検出可能なカメラを含み、当該カメラによって撮像された映像から検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。更に、入力装置５１６１は、ユーザの声を収音可能なマイクロフォンを含み、当該マイクロフォンを介して音声によって各種の入力が行われる。このように、入力装置５１６１が非接触で各種の情報を入力可能に構成されることにより、特に清潔域に属するユーザ（例えば術者５１８１）が、不潔域に属する機器を非接触で操作することが可能となる。また、ユーザは、所持している術具から手を離すことなく機器を操作することが可能となるため、ユーザの利便性が向上する。

　処置具制御装置５１６３は、組織の焼灼、切開又は血管の封止等のためのエネルギー処置具５１３５の駆動を制御する。気腹装置５１６５は、内視鏡５１１５による視野の確保及び術者の作業空間の確保の目的で、患者５１８５の体腔を膨らめるために、気腹チューブ５１３３を介して当該体腔内にガスを送り込む。レコーダ５１６７は、手術に関する各種の情報を記録可能な装置である。プリンタ５１６９は、手術に関する各種の情報を、テキスト、画像又はグラフ等各種の形式で印刷可能な装置である。

　以下、内視鏡手術システム５１１３において特に特徴的な構成について、更に詳細に説明する。

　（支持アーム装置）
　支持アーム装置５１４１は、基台であるベース部５１４３と、ベース部５１４３から延伸するアーム部５１４５と、を備える。図示する例では、アーム部５１４５は、複数の関節部５１４７ａ、５１４７ｂ、５１４７ｃと、関節部５１４７ｂによって連結される複数のリンク５１４９ａ、５１４９ｂと、から構成されているが、図１７では、簡単のため、アーム部５１４５の構成を簡略化して図示している。実際には、アーム部５１４５が所望の自由度を有するように、関節部５１４７ａ～５１４７ｃ及びリンク５１４９ａ、５１４９ｂの形状、数及び配置、並びに関節部５１４７ａ～５１４７ｃの回転軸の方向等が適宜設定され得る。例えば、アーム部５１４５は、好適に、６自由度以上の自由度を有するように構成され得る。これにより、アーム部５１４５の可動範囲内において内視鏡５１１５を自由に移動させることが可能になるため、所望の方向から内視鏡５１１５の鏡筒５１１７を患者５１８５の体腔内に挿入することが可能になる。

　関節部５１４７ａ～５１４７ｃにはアクチュエータが設けられており、関節部５１４７ａ～５１４７ｃは当該アクチュエータの駆動により所定の回転軸まわりに回転可能に構成されている。当該アクチュエータの駆動がアーム制御装置５１５９によって制御されることにより、各関節部５１４７ａ～５１４７ｃの回転角度が制御され、アーム部５１４５の駆動が制御される。これにより、内視鏡５１１５の位置及び姿勢の制御が実現され得る。この際、アーム制御装置５１５９は、力制御又は位置制御等、各種の公知の制御方式によってアーム部５１４５の駆動を制御することができる。

　例えば、術者５１８１が、入力装置５１６１（フットスイッチ５１７１を含む）を介して適宜操作入力を行うことにより、当該操作入力に応じてアーム制御装置５１５９によってアーム部５１４５の駆動が適宜制御され、内視鏡５１１５の位置及び姿勢が制御されてよい。当該制御により、アーム部５１４５の先端の内視鏡５１１５を任意の位置から任意の位置まで移動させた後、その移動後の位置で固定的に支持することができる。なお、アーム部５１４５は、いわゆるマスタースレイブ方式で操作されてもよい。この場合、アーム部５１４５は、手術室から離れた場所に設置される入力装置５１６１を介してユーザによって遠隔操作され得る。

　また、力制御が適用される場合には、アーム制御装置５１５９は、ユーザからの外力を受け、その外力にならってスムーズにアーム部５１４５が移動するように、各関節部５１４７ａ～５１４７ｃのアクチュエータを駆動させる、いわゆるパワーアシスト制御を行ってもよい。これにより、ユーザが直接アーム部５１４５に触れながらアーム部５１４５を移動させる際に、比較的軽い力で当該アーム部５１４５を移動させることができる。従って、より直感的に、より簡易な操作で内視鏡５１１５を移動させることが可能となり、ユーザの利便性を向上させることができる。

　ここで、一般的に、内視鏡下手術では、スコピストと呼ばれる医師によって内視鏡５１１５が支持されていた。これに対して、支持アーム装置５１４１を用いることにより、人手によらずに内視鏡５１１５の位置をより確実に固定することが可能になるため、術部の画像を安定的に得ることができ、手術を円滑に行うことが可能になる。

　なお、アーム制御装置５１５９は必ずしもカート５１５１に設けられなくてもよい。また、アーム制御装置５１５９は必ずしも１つの装置でなくてもよい。例えば、アーム制御装置５１５９は、支持アーム装置５１４１のアーム部５１４５の各関節部５１４７ａ～５１４７ｃにそれぞれ設けられてもよく、複数のアーム制御装置５１５９が互いに協働することにより、アーム部５１４５の駆動制御が実現されてもよい。

　（光源装置）
　光源装置５１５７は、内視鏡５１１５に術部を撮影する際の照射光を供給する。光源装置５１５７は、例えばＬＥＤ、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成される。このとき、ＲＧＢレーザ光源の組み合わせにより白色光源が構成される場合には、各色（各波長）の出力強度及び出力タイミングを高精度に制御することができるため、光源装置５１５７において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、ＲＧＢレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド５１１９の撮像素子の駆動を制御することにより、ＲＧＢそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。

　また、光源装置５１５７は、出力する光の強度を所定の時間ごとに変更するようにその駆動が制御されてもよい。その光の強度の変更のタイミングに同期してカメラヘッド５１１９の撮像素子の駆動を制御して時分割で画像を取得し、その画像を合成することにより、いわゆる黒つぶれ及び白とびのない高ダイナミックレンジの画像を生成することができる。

　また、光源装置５１５７は、特殊光観察に対応した所定の波長帯域の光を供給可能に構成されてもよい。特殊光観察では、例えば、体組織における光の吸収の波長依存性を利用して、通常の観察時における照射光（すなわち、白色光）に比べて狭帯域の光を照射することにより、粘膜表層の血管等の所定の組織を高コントラストで撮影する、いわゆる狭帯域光観察（Narrow　Band　Imaging）が行われる。あるいは、特殊光観察では、励起光を照射することにより発生する蛍光により画像を得る蛍光観察が行われてもよい。蛍光観察では、体組織に励起光を照射し当該体組織からの蛍光を観察するもの（自家蛍光観察）、又はインドシアニングリーン（ICG）等の試薬を体組織に局注するとともに当該体組織にその試薬の蛍光波長に対応した励起光を照射し蛍光像を得るもの等が行われ得る。光源装置５１５７は、このような特殊光観察に対応した狭帯域光及び／又は励起光を供給可能に構成され得る。

　（カメラヘッド及びＣＣＵ）
　図１８を参照して、内視鏡５１１５のカメラヘッド５１１９及びＣＣＵ５１５３の機能についてより詳細に説明する。図１８は、図１７に示すカメラヘッド５１１９及びＣＣＵ５１５３の機能構成の一例を示すブロック図である。

　図１８を参照すると、カメラヘッド５１１９は、その機能として、レンズユニット５１２１と、撮像部５１２３と、駆動部５１２５と、通信部５１２７と、カメラヘッド制御部５１２９と、を有する。また、ＣＣＵ５１５３は、その機能として、通信部５１７３と、画像処理部５１７５と、制御部５１７７と、を有する。カメラヘッド５１１９とＣＣＵ５１５３とは、伝送ケーブル５１７９によって双方向に通信可能に接続されている。

　まず、カメラヘッド５１１９の機能構成について説明する。レンズユニット５１２１は、鏡筒５１１７との接続部に設けられる光学系である。鏡筒５１１７の先端から取り込まれた観察光は、カメラヘッド５１１９まで導光され、当該レンズユニット５１２１に入射する。レンズユニット５１２１は、ズームレンズ及びフォーカスレンズを含む複数のレンズが組み合わされて構成される。レンズユニット５１２１は、撮像部５１２３の撮像素子の受光面上に観察光を集光するように、その光学特性が調整されている。また、ズームレンズ及びフォーカスレンズは、撮像画像の倍率及び焦点の調整のため、その光軸上の位置が移動可能に構成される。

　撮像部５１２３は撮像素子によって構成され、レンズユニット５１２１の後段に配置される。レンズユニット５１２１を通過した観察光は、当該撮像素子の受光面に集光され、光電変換によって、観察像に対応した画像信号が生成される。撮像部５１２３によって生成された画像信号は、通信部５１２７に提供される。

　撮像部５１２３を構成する撮像素子としては、例えばＣＭＯＳ（Complementary　Metal　Oxide　Semiconductor）タイプのイメージセンサであり、Ｂａｙｅｒ配列を有するカラー撮影可能なものが用いられる。なお、当該撮像素子としては、例えば４Ｋ以上の高解像度の画像の撮影に対応可能なものが用いられてもよい。術部の画像が高解像度で得られることにより、術者５１８１は、当該術部の様子をより詳細に把握することができ、手術をより円滑に進行することが可能となる。

　また、撮像部５１２３を構成する撮像素子は、３Ｄ表示に対応する右目用及び左目用の画像信号をそれぞれ取得するための１対の撮像素子を有するように構成される。３Ｄ表示が行われることにより、術者５１８１は術部における生体組織の奥行きをより正確に把握することが可能になる。なお、撮像部５１２３が多板式で構成される場合には、各撮像素子に対応して、レンズユニット５１２１も複数系統設けられる。

　また、撮像部５１２３は、必ずしもカメラヘッド５１１９に設けられなくてもよい。例えば、撮像部５１２３は、鏡筒５１１７の内部に、対物レンズの直後に設けられてもよい。

　駆動部５１２５は、アクチュエータによって構成され、カメラヘッド制御部５１２９からの制御により、レンズユニット５１２１のズームレンズ及びフォーカスレンズを光軸に沿って所定の距離だけ移動させる。これにより、撮像部５１２３による撮像画像の倍率及び焦点が適宜調整され得る。

　通信部５１２７は、ＣＣＵ５１５３との間で各種の情報を送受信するための通信装置によって構成される。通信部５１２７は、撮像部５１２３から得た画像信号をＲＡＷデータとして伝送ケーブル５１７９を介してＣＣＵ５１５３に送信する。この際、術部の撮像画像を低レイテンシで表示するために、当該画像信号は光通信によって送信されることが好ましい。手術の際には、術者５１８１が撮像画像によって患部の状態を観察しながら手術を行うため、より安全で確実な手術のためには、術部の動画像が可能な限りリアルタイムに表示されることが求められるからである。光通信が行われる場合には、通信部５１２７には、電気信号を光信号に変換する光電変換モジュールが設けられる。画像信号は当該光電変換モジュールによって光信号に変換された後、伝送ケーブル５１７９を介してＣＣＵ５１５３に送信される。

　また、通信部５１２７は、ＣＣＵ５１５３から、カメラヘッド５１１９の駆動を制御するための制御信号を受信する。当該制御信号には、例えば、撮像画像のフレームレートを指定する旨の情報、撮像時の露出値を指定する旨の情報、並びに／又は撮像画像の倍率及び焦点を指定する旨の情報等、撮像条件に関する情報が含まれる。通信部５１２７は、受信した制御信号をカメラヘッド制御部５１２９に提供する。なお、ＣＣＵ５１５３からの制御信号も、光通信によって伝送されてもよい。この場合、通信部５１２７には、光信号を電気信号に変換する光電変換モジュールが設けられ、制御信号は当該光電変換モジュールによって電気信号に変換された後、カメラヘッド制御部５１２９に提供される。

　なお、上記のフレームレートや露出値、倍率、焦点等の撮像条件は、取得された画像信号に基づいてＣＣＵ５１５３の制御部５１７７によって自動的に設定される。つまり、いわゆるＡＥ（Auto　Exposure）機能、ＡＦ（Auto　Focus）機能及びＡＷＢ（Auto　White　Balance）機能が内視鏡５１１５に搭載される。

　カメラヘッド制御部５１２９は、通信部５１２７を介して受信したＣＣＵ５１５３からの制御信号に基づいて、カメラヘッド５１１９の駆動を制御する。例えば、カメラヘッド制御部５１２９は、撮像画像のフレームレートを指定する旨の情報及び／又は撮像時の露光を指定する旨の情報に基づいて、撮像部５１２３の撮像素子の駆動を制御する。また、例えば、カメラヘッド制御部５１２９は、撮像画像の倍率及び焦点を指定する旨の情報に基づいて、駆動部５１２５を介してレンズユニット５１２１のズームレンズ及びフォーカスレンズを適宜移動させる。カメラヘッド制御部５１２９は、更に、鏡筒５１１７やカメラヘッド５１１９を識別するための情報を記憶する機能を備えてもよい。

　なお、レンズユニット５１２１や撮像部５１２３等の構成を、気密性及び防水性が高い密閉構造内に配置することで、カメラヘッド５１１９について、オートクレーブ滅菌処理に対する耐性を持たせることができる。

　次に、ＣＣＵ５１５３の機能構成について説明する。通信部５１７３は、カメラヘッド５１１９との間で各種の情報を送受信するための通信装置によって構成される。通信部５１７３は、カメラヘッド５１１９から、伝送ケーブル５１７９を介して送信される画像信号を受信する。この際、上記のように、当該画像信号は好適に光通信によって送信され得る。この場合、光通信に対応して、通信部５１７３には、光信号を電気信号に変換する光電変換モジュールが設けられる。通信部５１７３は、電気信号に変換した画像信号を画像処理部５１７５に提供する。

　また、通信部５１７３は、カメラヘッド５１１９に対して、カメラヘッド５１１９の駆動を制御するための制御信号を送信する。当該制御信号も光通信によって送信されてよい。

　画像処理部５１７５は、カメラヘッド５１１９から送信されたＲＡＷデータである画像信号に対して各種の画像処理を施す。当該画像処理としては、例えば現像処理、高画質化処理（帯域強調処理、超解像処理、ＮＲ（Noise　reduction）処理及び／又は手ブレ補正処理等）、並びに／又は拡大処理（電子ズーム処理）等、各種の公知の信号処理が含まれる。また、画像処理部５１７５は、ＡＥ、ＡＦ及びＡＷＢを行うための、画像信号に対する検波処理を行う。

　画像処理部５１７５は、ＣＰＵやＧＰＵ等のプロセッサによって構成され、当該プロセッサが所定のプログラムに従って動作することにより、上述した画像処理や検波処理が行われ得る。なお、画像処理部５１７５が複数のＧＰＵによって構成される場合には、画像処理部５１７５は、画像信号に係る情報を適宜分割し、これら複数のＧＰＵによって並列的に画像処理を行う。

　制御部５１７７は、内視鏡５１１５による術部の撮像、及びその撮像画像の表示に関する各種の制御を行う。例えば、制御部５１７７は、カメラヘッド５１１９の駆動を制御するための制御信号を生成する。この際、撮像条件がユーザによって入力されている場合には、制御部５１７７は、当該ユーザによる入力に基づいて制御信号を生成する。あるいは、内視鏡５１１５にＡＥ機能、ＡＦ機能及びＡＷＢ機能が搭載されている場合には、制御部５１７７は、画像処理部５１７５による検波処理の結果に応じて、最適な露出値、焦点距離及びホワイトバランスを適宜算出し、制御信号を生成する。

　また、制御部５１７７は、画像処理部５１７５によって画像処理が施された画像信号に基づいて、術部の画像を表示装置５１５５に表示させる。この際、制御部５１７７は、各種の画像認識技術を用いて術部画像内における各種の物体を認識する。例えば、制御部５１７７は、術部画像に含まれる物体のエッジの形状や色等を検出することにより、鉗子等の術具、特定の生体部位、出血、エネルギー処置具５１３５使用時のミスト等を認識することができる。制御部５１７７は、表示装置５１５５に術部の画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を当該術部の画像に重畳表示させる。手術支援情報が重畳表示され、術者５１８１に提示されることにより、より安全かつ確実に手術を進めることが可能になる。

　カメラヘッド５１１９及びＣＣＵ５１５３を接続する伝送ケーブル５１７９は、電気信号の通信に対応した電気信号ケーブル、光通信に対応した光ファイバ、又はこれらの複合ケーブルである。

　ここで、図示する例では、伝送ケーブル５１７９を用いて有線で通信が行われていたが、カメラヘッド５１１９とＣＣＵ５１５３との間の通信は無線で行われてもよい。両者の間の通信が無線で行われる場合には、伝送ケーブル５１７９を手術室内に敷設する必要がなくなるため、手術室内における医療スタッフの移動が当該伝送ケーブル５１７９によって妨げられる事態が解消され得る。

　以上、本開示に係る技術が適用され得る手術室システム５１００の一例について説明した。なお、ここでは、一例として手術室システム５１００が適用される医療用システムが内視鏡手術システム５１１３である場合について説明したが、手術室システム５１００の構成はかかる例に限定されない。例えば、手術室システム５１００は、内視鏡手術システム５１１３に代えて、検査用軟性内視鏡システムや顕微鏡手術システムに適用されてもよい。

　本開示に係る技術は、以上説明した構成のうち、映像を生成する構成、例えば視聴覚コントローラ５１０７に好適に適用され得る。視聴覚コントローラ５１０７に本開示に係る技術を適用することにより、表示装置５１０３Ｂを医師が見ながら行う医療手術において、医師の視点位置に応じた適切な立体画像を生成することができる。

１・・・情報処理装置、１１・・・イメージセンサ、１２・・・顔検出部、１３・・・重心算出部、１４・・・補正部、１５・・・移動量算出部、１６・・・加算部、２１・・・空間視点座標取得部、２２・・・視差画像取得部、２３・・・視差画像表示部、５１・・・加速度検出部、５２・・・座標比率決定部、６１・・・測距部、６２・・・切替部

Claims

　撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得する取得部と、
　前記顔枠情報により示される顔枠内における基準点を算出する基準点算出部と、
　前記基準点の移動量に応じて前記視点位置情報を補正する補正部と
　を有する情報処理装置。
　前記補正部は、前記顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した基準点の移動量に応じて、前記視点位置情報を補正する
　請求項１に記載の情報処理装置。
　前記補正部は、第１の顔検出情報を取得してから、当該第１の顔検出情報の次の顔検出情報である第２の顔検出情報を取得するまでに要する期間の間、前記基準点の移動量を蓄積し、蓄積した前記基準点の移動量に応じて、前記第１の顔検出情報に含まれる視点位置情報を補正する
　請求項１に記載の情報処理装置。
　前記補正部は、フレーム間における前記基準点の移動量を蓄積する
　請求項２に記載の情報処理装置。
　前記基準点算出部は、前記基準点として、前記顔枠内における所定の色成分の領域内に存在する重心点を算出する
　請求項１に記載の情報処理装置。
　前記所定の色成分は、肌色成分である
　請求項５に記載の情報処理装置。
　前記補正部は、前記基準点の移動量に応じた重み付けを設定し、前記顔検出情報に含まれる前記視点位置情報と、前記基準点の位置情報とを、前記設定した重み付けを使用して重み付け加算する
　請求項１に記載の情報処理装置。
　顔検出の対象であるユーザまでの距離を計測する測距部を有し、
　前記測距部の測距結果に応じて、前記取得部により生成された視点位置情報及び前記補正部により補正された視点位置情報の何れかを選択的に出力するように構成されている
　請求項１に記載の情報処理装置。
　前記測距結果が閾値より小さい場合には、前記補正部により補正された視点位置情報が出力され、
　前記測距結果が前記閾値より大きい場合には、前記取得部により生成された視点位置情報が出力されるように構成されている
　請求項８に記載の情報処理装置。
　前記撮像画像を取得する撮像部を有する
　請求項１に記載の情報処理装置。
　前記撮像部が前記基準点算出部を有している
　請求項１０に記載の情報処理装置。
　前記撮像部は、１０００ｆｐｓ以上の撮像が可能とされている
　請求項１０に記載の情報処理装置。
　前記補正部により補正された視点位置を使用して立体画像を生成する立体画像取得部を有する
　請求項１に記載の情報処理装置。
　前記立体画像が表示されるディスプレイを有する
　請求項１３に記載の情報処理装置。
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
　情報処理方法。
　取得部が、撮像画像に基づいて顔検出を行い、顔検出結果に基づいて、顔枠情報及び視点位置情報を含む顔検出情報を取得し、
　基準点算出部が、前記顔枠情報により示される顔枠内における基準点を算出し、
　補正部が、前記基準点の移動量に応じて前記視点位置情報を補正する
　情報処理方法をコンピュータに実行させるプログラム。