WO2022014362A1

WO2022014362A1 - 医療用表示システム、制御方法、及び制御装置

Info

Publication number: WO2022014362A1
Application number: PCT/JP2021/025079
Authority: WO
Inventors: 加奈松浦; 信二勝木; 毅前田
Original assignee: ソニーグループ株式会社
Priority date: 2020-07-16
Filing date: 2021-07-02
Publication date: 2022-01-20
Also published as: JPWO2022014362A1; US20230248468A1

Abstract

本技術は、意図しない操作の実行を抑制することができるようにする医療用表示システム、制御方法、及び制御装置に関する。医療機器から出力された情報に基づいて表示する表示部と、表示部を少なくとも観察可能な領域の一部を撮像領域として撮像する撮像部と、表示部を少なくとも観察可能な領域の音声を取得する音声取得部と、医療機器から出力された情報に基づいて表示情報を制御する制御部とを備え、制御部は、予め登録されている第１のユーザが撮像領域にて所定の条件を満たしているとき、第１のユーザの音声又は当該音声をトリガにした入力に基づいて表示情報を制御し、第１のユーザが撮像領域にて所定の条件を満たしていないとき、第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて表示情報を制御する医療用表示システムが提供される。

Description

医療用表示システム、制御方法、及び制御装置

　本技術は、医療用表示システム、制御方法、及び制御装置に関し、特に、意図しない操作の実行を抑制することができるようにした医療用表示システム、制御方法、及び制御装置に関する。

　手術室は、清潔領域や不潔領域などにゾーニングがされている。例えば、執刀医等の術者は清潔領域にて手術を行う。このとき、清潔領域にいる術者は、手を清潔に保つために、所定の清潔基準を満たした医療機器しか手を使って操作することができない。

　また、フットペダルなどを用いて足を使った医療機器の操作は細かい操作が難しい。そこで、特許文献１に開示されているように、音声入力をも用いて医療機器を操作することが提案されている。

国際公開第2018/173681号

　しかしながら、手術室においては術者だけでなく、助手や看護師、臨床工学技士など複数の医療従事者が手術参加者として存在する。また、術者が途中で他の医師に交代することがある。そのため、音声入力を用いた機器の操作を行うに際しては、意図しない操作の実行を抑制することが求められる。

　本技術はこのような状況に鑑みてなされたものであり、意図しない操作の実行を抑制することができるようにするものである。

　本技術の一側面の医療用表示システムは、医療機器から出力された情報に基づいて表示する表示部と、前記表示部を少なくとも観察可能な領域の一部を撮像領域として撮像する撮像部と、前記表示部を少なくとも観察可能な領域の音声を取得する音声取得部と、前記医療機器から出力された情報に基づいて表示情報を制御する制御部とを備え、前記制御部は、予め登録されている第１のユーザが前記撮像領域にて所定の条件を満たしているとき、前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する医療用表示システムである。

　本技術の一側面の制御方法は、医療用表示システムが、医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御するに際して、予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する制御方法である。

　本技術の一側面の医療用表示システム、及び制御方法においては、医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御するに際して、予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報が制御され、前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報が制御される。

　本技術の一側面の制御装置は、医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御する制御部を備え、前記制御部は、予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する制御装置である。

　本技術の一側面の制御装置においては、医療機器から出力された情報に基づいて、表示部に表示される表示情報が制御され、予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報が制御され、前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報が制御される。

　本技術の一側面の制御装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

医療用表示システムの一実施の形態の構成例を示す図である。制御装置における入出力と処理の例を示す図である。複数のユーザ候補が存在する場合の音声操作の例を示す図である。音声入力時のユーザ判定処理の流れを説明するフローチャートである。区分ごとの操作権限の例を示す図である。医師テーブルの例を示す図である。術前登録テーブルの例を示す図である。手術時におけるユーザ判定の具体例を示す図である。音声対応処理の流れを説明するフローチャートである。視線対応処理の流れを説明するフローチャートである。ランクに応じたユーザ判定処理の流れを説明するフローチャートである。権限移譲処理の流れを説明するフローチャートである。権限移譲解除処理の流れを説明するフローチャートである。ユーザ除外処理の流れを説明するフローチャートである。

＜１．第１の実施の形態＞

（システム構成）
　図１は、本技術の一実施の形態に係る医療用表示システムを用いた手術の様子を示している。

　図１において、医療用表示システム１は、制御装置１０、顕微鏡装置２０、モニタリング装置３０、及び表示装置４０から構成される。

　図１の例においては、このような各装置により構成される医療用表示システム１を用いて、患者ベッド上の患者Ｐに対して、術者としてのユーザＵ_Ａが手術を行っている様子が示されている。また、患者ベッド上の患者Ｐの周囲には、助手や看護師等としてのユーザ候補Ｕ_Ｂ，Ｕ_Ｃが存在している。

　以下の説明において、「ユーザ」とは、術者などの音声入力に基づいた操作権限を有する者をいう。また、「ユーザ候補」とは、術者、助手、看護師、臨床工学技士などの医療従事者を含み、医療用表示システム１を使用する任意の手術スタッフ（手術参加者）のことを意味する。すなわち、手術スタッフとしてのユーザ候補の中に、音声入力に基づいた操作権限を有するユーザが存在している。

　制御装置１０は、医療機器等の接続された装置を制御したり、接続された装置から出力された情報を統合したりすることが可能な装置であり、例えばCCU(Camera Control Unit)などである。制御装置１０はネットワークに接続され、サーバやPC(Personal Computer)等の外部装置と通信可能に構成されてもよい。

　顕微鏡装置２０は、電子撮像式の顕微鏡装置（いわゆるビデオ式の顕微鏡装置）である。顕微鏡装置２０は、患者Ｐの術部を撮像し、術野が写る術野画像を表す信号を制御装置１０に出力する。なお、術野画像を撮像する装置として、顕微鏡装置２０の代わりに、内視鏡等の医療用撮像装置が用いられてもよい。

　モニタリング装置３０は、患者Ｐの生体情報をモニタリングし、生体情報のモニタリング結果を表すモニタリング情報を生成する。患者Ｐの生体情報には、心拍数、心電図、血中酸素飽和度、動脈圧などが含まれる。モニタリング装置３０は、モニタリング情報を表す信号を制御装置１０に出力する。

　表示装置４０は、制御装置１０から出力された情報を表示する装置であり、例えば液晶ディスプレイ又はEL(Electro Luminescence)ディスプレイなどである。表示装置４０は、手術室の壁面などのユーザ又はユーザ候補の近傍に設けられる。表示装置４０には、顕微鏡装置２０により撮像された術野画像とともに、患者Ｐの生体情報、身体情報、手術の術式の情報などの、手術に関する各種の情報が表示される。

　図２は、図１の制御装置１０における入出力と処理の例を示している。

　図２に示すように、制御装置１０には、マイクロフォン５０、カメラ６０、及び視線検出機７０からの信号が入力される。

　マイクロフォン５０は、術者などのユーザ候補の音声を検出可能な装置であり、例えばアレイマイクである。マイクロフォン５０は、ユーザ候補が発した音声を表す信号（音声信号）を制御装置１０に出力する。

　カメラ６０は、術者などのユーザ候補を撮像する装置であり、例えば手術室カメラである。カメラ６０は、ユーザ候補を含む撮像画像を表した信号（画像信号）を制御装置１０に出力する。

　視線検出機７０は、術者などのユーザ候補の視線を検出する装置であり、例えばIR(infrared)カメラである。視線検出機７０は、ユーザ候補の視線を表した信号（検出信号）を制御装置１０に出力する。

　マイクロフォン５０、カメラ６０、及び視線検出機７０は、表示装置４０に搭載されてもよいし、あるいは単独の装置として構成されて制御装置１０にそれぞれ接続されるようにしてもよい。なお、図２の例では、視線検出用の機器としての視線検出機７０を設けた構成を示したが、カメラ６０により撮像された撮像画像を解析してユーザ候補の視線を検出する構成としても構わない。

　制御装置１０は、マイクロフォン５０、カメラ６０、及び視線検出機７０のそれぞれから出力された信号を取得する。制御装置１０は、取得した信号の分析結果に基づいて、顕微鏡装置２０等の医療機器の制御を行ったり、表示装置４０に表示される表示情報の制御を行ったりする。

　制御装置１０は、認識部１１１、判定部１１２、及び実行部１１３を含む制御部１００を有する。

　認識部１１１は、マイクロフォン５０、カメラ６０、及び視線検出機７０のそれぞれから出力された信号に基づいて、所定の認識処理を行い、その認識結果を判定部１１２に供給する。

　例えば、認識部１１１では、マイクロフォン５０からの音声信号に基づき、ユーザ候補の発話に含まれる音声コマンドが認識される。また、認識部１１１では、マイクロフォン５０からの音声信号、又はカメラ６０からの画像信号に基づき、ユーザ候補が認識される。また、認識部１１１では、カメラ６０からの画像信号、又は視線検出機７０からの検出信号に基づき、ユーザ候補の視線位置が認識される。

　判定部１１２は、認識部１１１からの認識結果に基づいて、ユーザ候補が操作権限を持つユーザであるための所定の条件を満たすか否かを判定し、その判定結果を実行部１１３に供給する。所定の条件は、手術開始前に取得された情報や、手術中に取得された情報などを用いて定められる。

　実行部１１３は、判定部１１２からの判定結果が所定の条件を満たしている場合、ユーザの音声又は当該音声をトリガにした入力に基づいて、所定の処理を実行する。

　例えば、ユーザの音声は、当該ユーザが発した音声コマンドを含む。また、当該音声をトリガにした入力は、ユーザが音声コマンドを発したときの当該ユーザの視線を含む。実行部１１３は、表示装置４０の画面上のユーザの視線位置に基づき、当該ユーザが発した音声コマンドに応じた所定の処理として、表示装置４０に表示される表示情報を制御する。

　なお、制御部１００で実行される処理が、制御装置１０以外の外部装置で実行されても構わない。また、制御部１００において、認識部１１１、判定部１１２、及び実行部１１３で実行される処理のうち、一部の処理が外部装置で実行されても構わない。

　このように、医療用表示システム１においては、手術時に、制御装置１０によって生成された表示情報が表示装置４０に表示される。ユーザは、表示装置１４に表示された表示情報を見て術部の様子を観察しながら、患部の切除などの各種の処置を行う。また、ユーザは、各種の処置を行うに際して、自己の発する音声や視線によって、医療用表示システム１を構成する各装置を操作することができる。

（音声操作の例）
　図３は、手術室において、複数のユーザ候補が存在する場合における音声入力を用いた操作の例を示している。

　図３において、表示装置４０には、手術に必要な情報を含む表示情報が表示されている。図３の例では、表示情報として、術野画像、参照画像、モニタリング情報、操作メニューなどが表示されており、それらの情報を複数のユーザ候補がそれぞれ見ている。図３では、表示装置４０の画面の前方に配置された３つの円が３人のユーザ候補Ｕ_Ａ乃至Ｕ_Ｃをそれぞれ表している。

　また、表示装置４０には、マイクロフォン５０、カメラ６０、及び視線検出機７０が搭載されており、ユーザ候補Ｕ_Ａ乃至Ｕ_Ｃによる音声入力や視線などを検出可能である。図３では、ユーザ候補の発話の方向を一点鎖線で表し、視線の方向を破線で表している。

　このとき、表示装置４０に表示される表示情報（の内容）を変更するための操作は、ユーザ候補による音声入力や視線、又はそれらの組み合わせで行われるが、ユーザ候補Ｕ_Ａが音声操作を行うべき状況において、ユーザ候補Ｕ_Ｂの発話を音声操作として認識した場合、誤動作が引き起こされる。

　また、ユーザ候補Ｕ_Ａが操作を行うべき状況で、音声と視線の組み合わせで操作が実行される場合に、ユーザ候補Ｕ_Ａが音声コマンドを発すると同時に、ユーザ候補Ｕ_Ｂの視線位置を操作として認識したときには、ユーザ候補Ｕ_Ａが意図していない動作が引き起こされる。

　なお、ユーザ候補Ｕ_Ａ乃至Ｕ_Ｃの認識は、操作を検出するための入力機器であるマイクロフォン５０と視線検出機７０に加えて、表示装置４０の画面を観察可能な領域に存在するユーザ候補Ｕ_Ａ乃至Ｕ_Ｃを、画面側から撮像することが可能なカメラ６０を用いて行われる。

　すなわち、マイクロフォン５０と視線検出機７０は、表示装置４０の画面を少なくとも観察可能な領域の音声と視線をそれぞれ検出可能であり、３人のユーザ候補Ｕ_Ａ乃至Ｕ_Ｃが発した音声と視線をそれぞれ検出することができる。また、カメラ６０は、表示装置４０の画面を少なくとも観察可能な領域の一部を撮像領域として撮像可能であり、図３の例では、３人のユーザ候補Ｕ_Ａ乃至Ｕ_Ｃが撮像領域内にそれぞれ存在している。

　このように、手術室においては術者だけでなく、助手や看護師、臨床工学技士など複数の医療従事者がユーザ候補として存在する。そのため、音声操作を行うに際しては、複数のユーザ候補の中から、適切なユーザの音声コマンドの発話を抽出して、意図しない操作の実行を抑制することが求められる。また、術者が途中で他の医師に交代することがあるため、適切なユーザを判定する必要がある。

　そこで、本技術では、手術開始前に取得された情報や、手術中に取得された情報を用いて、ユーザ候補の中から、所定の条件を満たした１人のユーザを特定して、他のユーザ候補の発話や視線位置などによる操作の実行を抑制する。

　そのため、手術に関わる複数のユーザ候補の発話や視線位置を検出可能な状況において、適切なユーザの発話や視線位置などによる操作のみを実行することができる。つまり、手術室において、清潔領域に存在する複数のユーザ候補のうち、適切な１人のユーザが、不潔領域に存在する機器に対して、非接触ユーザインタフェース（UI：User Interface）を用いて操作を行うことが可能となる。

（ユーザ判定処理）
　次に、図４のフローチャートを参照して、手術室において複数のユーザ候補が存在する場合における音声入力時のユーザ判定処理の流れを説明する。

　制御装置１０では、ユーザ候補が発話を行って、マイクロフォン５０によりユーザ候補からの音声入力が受け付けられたとき（Ｓ１１）、制御部１００によって、ステップＳ１２以降の処理が実行される。

　ステップＳ１２において、認識部１１１は、マイクロフォン５０からの音声信号を解析して、音声入力をしたユーザ候補の発話内容に含まれる音声コマンドを認識する。

　ステップＳ１３において、認識部１１１は、マイクロフォン５０からの音声信号やカメラ６０からの画像信号を解析して、音声入力をしたユーザ候補を認識する。例えば、この認識処理では、音声入力をしたユーザ候補がプリセット情報のどのユーザ候補に該当するかが認識される。

　ステップＳ１４において、認識部１１１は、視線検出機７０からの検出信号を解析して、音声入力をしたユーザ候補による表示装置４０の画面上の視線位置を認識する。

　ステップＳ１５において、判定部１１２は、認識結果に基づいて、音声入力をしたユーザ候補が操作権限を持つユーザであるための所定の条件を満たすか否かを判定する。詳細は後述するが、所定の条件は、手術開始前に取得された情報や、手術中に取得された情報などを用いて定められる。

　ステップＳ１５において、所定の条件を満たしていると判定された場合（Ｓ１６の「Yes」）、処理は、ステップＳ１７に進められる。ステップＳ１７において、実行部１１３は、認識結果に基づいて、所定の処理を実行する。

　ここでは、所定の条件を満たすと判定されたユーザ候補、すなわち、複数のユーザ候補の中から特定されたユーザによる音声と視線の組み合わせによる操作が行われる。

　例えば、表示装置４０に表示された術野画像に含まれる特定の術部を注視しているユーザが、所定の音声コマンドを発したとき、実行部１１３は、当該ユーザの視線が向けられた特定の術部の領域を拡大して表示することができる。また、例えば、表示装置４０に表示された複数のサムネイル画像のうちの１つのサムネイル画像を注視しているユーザが、所定の音声コマンドを発したとき、実行部１１３は、当該ユーザの視線が向けられたサムネイル画像に対応する参照画像等の画像を表示することができる。

　なお、この例では、音声と視線の組み合わせによる操作が行われる場合を示したが、ユーザの視線を用いずに、音声のみで操作が行われてもよい。音声のみで操作が行われる場合には、ステップＳ１４の処理をスキップしても構わない。

　一方で、ステップＳ１５において、所定の条件を満たしていないと判定された場合（Ｓ１６の「No」）、処理は、ステップＳ１１に戻り、それ以降の処理が繰り返される。

　以上、音声入力時のユーザ判定処理の流れを説明した。このユーザ判定処理では、手術開始前に取得された情報などを用い、ユーザ候補の中から、所定の条件を満たした１人のユーザが特定され、当該ユーザによって、音声や視線等の非接触ユーザインタフェースを用いた操作が行われる。これにより、ユーザとして特定されたユーザ候補を除いた他のユーザ候補の発話や視線位置などによる操作の実行が抑制されるため、音声入力を用いた機器の操作を行うに際して、意図しない操作の実行を抑制することができる。

　すなわち、医療用表示システム１を用いて手術が行われる場合に、予め登録されている第１のユーザが撮像領域にて所定の条件を満たしているとき、当該第１のユーザの音声又は当該音声をトリガにした入力に基づき、表示装置４０に表示された表示情報が制御される。また、第１のユーザが撮像領域にて所定の条件を満たしていないときには、第２のユーザの音声又は当該音声をトリガにした入力に基づいて表示情報が制御される。これにより、ユーザの音声と視線等を利用して表示部を見ながら操作を行うUI装置において、ただ一人のユーザを定めて、そのユーザの音声と視線等による操作のみが実行される。

　ここで、撮像領域は、カメラ６０により撮像された撮像画像に含まれるユーザ候補の顔を判定可能な領域（判定領域）を含んでいる。つまり、上記の「第１のユーザが撮像領域にて所定の条件を満たしていないとき」には、「第１のユーザが撮像領域に存在していない」ことと、「第１のユーザが撮像領域に存在しているが判定領域に存在しない」ことの両方の意味が含まれる。

＜２．第２の実施の形態＞

　上述した判定処理（図４のＳ１５，Ｓ１６）で用いられる所定の条件として、手術開始前に取得された情報や、手術中に取得された情報などが用いられるのは先に述べた通りである。より具体的には、手術開始前に登録された情報、手術開始前の確認動作に関する情報、及び手術中の特定の状況に関する情報のうち、少なくともいずれか１つの情報に基づき、所定の条件を定めることができる。

　このようにして所定の条件を定めることで、例えば、手術開始前に登録した情報と手術中に音声操作を行うユーザ候補の認識結果とが一致するかを判定したり、ユーザ候補の音声操作時の状況が操作権限を持つユーザとして適切であるかを判定したり、あるいは音声操作時にユーザ候補が所定の位置に存在するかを判定したりすることができる。

　ユーザ候補は、操作権限に応じた区分に分けることができる。図５は、ユーザ候補を、Ａ乃至Ｃの３つの区分の操作権限に分けた場合の例を示している。

　区分Ａは、手術室において手術スタッフのうち、執刀医である術者（指示術者）が該当する。区分Ａの権限に振り分けられたユーザ候補（Ａ権限のユーザ）の発話のみが、有効な音声コマンドとなり得るため、基本的にはＡ権限のユーザが操作権限を持つ。ただし、一時的に操作権限を移譲することが可能であり、Ａ権限のユーザのみが、自己のＢ権限順位に指定されたユーザ候補（Ｂ権限ユーザ）と入れ替わることができる。

　区分Ｂは、他の手術スタッフのうち、助手等の術者やスコピストなど、手術手技に直接関与し、表示装置４０に対する操作を行う可能性のある者が該当する。区分Ｂの権限に振り分けられたユーザ候補（Ｂ権限のユーザ）は、権限Ａのユーザが不在又は操作不可の場合などに操作権限を有する。

　Ｂ権限のユーザには、Ｂ１，Ｂ２，・・・，Ｂｎ（ｎ：１以上の整数）などのように、「Ｂ」に付加された数字に応じたＢ権限順位を割り当てることができる。この例では、より数字が小さいほど権限が強いことを表し、Ｂ１権限が最も強い権限となる。例えば、一時的に操作権限を移譲するに際しては、撮像領域の範囲内にいるユーザ候補のうち、最高位のＢ権限のユーザがＡ権限を持つことができる。

　区分Ｃは、他の手術スタッフのうち、看護師や臨床工学技士などの非術者が該当する。区分Ｃの権限に振り分けられたユーザ候補（Ｃ権限のユーザ）が、音声コマンドによる操作権限を持つことはない。

　また、所定の条件として、手術開始前に登録したユーザであるかどうかを含める場合、手術スタッフの声紋や顔特徴等の情報をデータベース化しておき、それらの情報を手術開始前にそれぞれの区分にアサインする。具体的には、図６に示した医師テーブルと、図７に示した術前登録テーブルなどのデータベースが用いられる。

　図６において、医師テーブルには、医師を識別する情報ごとに、声紋と顔特徴に関する情報が格納されている。例えば、Dr.1である医師の声紋と顔特徴として、SDr1とFDr1が登録されている。また、Dr.2乃至Dr.10である医師についても、SDrxとFDrxである声紋と顔特徴がそれぞれ登録されている。

　図７において、術前登録テーブルには、手術開始前に登録される術者（ユーザ候補）に関する情報ごとに、声紋と顔特徴に関する情報が格納されている。すなわち、術前登録テーブル（図７）では、術者データに対して、医師テーブル（図６）に格納された医師データがアサインされている。

　例えば、Ｂ１権限の術者として、医師Dr.3がアサインされる場合、術者データとしての声紋S(B1)とF(B1)には、医師データとしてのSDr3とFDr3が割り当てられる。

　また、Ｂ２権限の術者に医師Dr.1がアサインされる場合には、声紋S(B2)とF(B2)としてSDr1とFDr1が割り当てられ、Ｂ３権限の術者に医師Dr.5がアサインされる場合には、声紋S(B3)とF(B3)としてSDr5とFDr5が割り当てられる。

　さらに、Ｂ４権限の術者に医師Dr.6がアサインされる場合には、声紋S(B4)とF(B4)としてSDr6とFDr6が割り当てられ、Ｂ５権限の術者に医師Dr.9がアサインされる場合には、声紋S(B5)とF(B5)としてSDr9とFDr9が割り当てられる。

　このように、手術開始前に、医師テーブル（図６）に格納された医師データを、術前登録テーブル（図７）に格納される術者データ（Ｂ権限のユーザのデータ）にアサインしておくことで、Ｂ権限順位の特定と顔認識に用いられる顔情報と、話者識別に用いられる声紋情報を登録することができる。

　なお、ユーザの誤認識を抑制するために、Ｃ権限のユーザの顔情報と声紋情報を登録しても構わない。これらの情報を、Ａ権限のユーザの判定基準を決定するための情報として用いることができる。

　さらに、所定の条件として、手術開始前に確認動作（音声確認等）を行ったユーザ候補であるかどうかを含める場合、手術開始前に確認動作を行った時点でデータベースの情報と照会し、手術室において、ユーザ候補となる手術スタッフを、Ａ乃至Ｃの区分に振り分ける。これにより、ユーザ候補は、Ａ権限、Ｂ権限、又はＣ権限のユーザとされる。この確認動作は、最初の手術室への入室時のほか、例えば、タイムアウト時や機器操作時などの所定のタイミングで実施される。

　また、所定の条件は、ユーザ候補の位置（立ち位置等）に関する情報を用いてもよい。この位置に関する情報としては、表示装置４０の画面の中央部（例えば画面の横幅における略中央部）に対応した位置や、表示装置４０に搭載されたカメラ６０の画角の中央部に対応した位置などが含まれる。すなわち、実際の手術中には、表示装置４０の画面の真正面の位置に、執刀医である術者（指示術者）が立ち、その周囲に助手などが立つ場合が多いため、その位置関係を利用することができる。

　なお、上述した所定の条件は、一例であり、手術開始前に取得された情報や、手術中に取得された情報などを用いて定められる条件であれば、他の条件を定めても構わない。例えば、ユーザ候補の手技の内容（ハンドリングしている手術器械の種類等）が所定の手技の内容に該当するかなどを所定の条件として定めて判定を行うことができる。

　また、上述したユーザ候補の認識方法としては、カメラ６０からの画像信号を用いて、顔認識やボーン認識などの画像処理を行ったり、あるいは、マイクロフォン５０からの音声信号を用いて、声紋認識や音声到来方向認識などの音声処理を行ったりすることができる。顔認識やボーン認識に関する技術や、声紋認識や音声到来方向認識に関する技術については、公知の技術を用いることができる。

（ユーザ判定の具体例）
　図８は、手術時におけるユーザ判定の具体例を示している。

　図８においては、表示装置４０の画面付近を囲むように配置された６つの円がユーザ候補を表しており、各円内に記載された文字により医師などの手術スタッフを識別している。また、各円の下側の円柱に記載された文字により各ユーザ候補の権限を表している。

　図８においては、Ｂ１権限がアサインされた医師Dr.3と、Ｂ３権限がアサインされた医師Dr.5と、Ｂ５権限がアサインされた医師Dr.9は、撮像領域外に存在している。一方で、Ｂ２権限がアサインされた医師Dr.1と、Ｂ４権限がアサインされた医師Dr.6は、撮像領域内に存在している。また、看護師等の他の手術スタッフSTは、撮像領域内に存在するが、Ｃ権限がアサインされている。

　このとき、医師Dr.1が音声コマンドを発話する場合を想定する。この場合において、撮像領域内にいる手術スタッフは、カメラ６０により撮像されている。この撮像で得られる画像信号を解析することで、顔特徴から、医師Dr.1，医師Dr.6，他の手術スタッフSTの３人が特定される。

　このように、撮像領域において、Ａ権限の医師（ユーザ）が存在せず、さらにＢ１権限がアサインされた医師Dr.3が存在しないとき、撮像領域に存在しているＢ２権限がアサインされた医師Dr.1がＡ権限を有する。つまり、この例では、Ａ権限の医師が、自己のＢ権限順位に指定された医師のうち、撮像領域の範囲内で最高位のＢ権限の医師となる医師Dr.1と入れ替わっている。

　医師Dr.1による発話は、図中の一点鎖線Ｌ１１，Ｌ１２で示すように、マイクロフォン５０－１，５０－２により集音される。この音声信号を解析することで得られる音声コマンドの声紋S(IN_Dr1)は、術前登録テーブルに登録された声紋S(B2)と一致する。

　また、音声到来方向にいる手術スタッフSTの顔特徴F(IN_ST)は、術前登録テーブルに登録された顔特徴F(B2)とは一致しないが、医師Dr.1の顔特徴F(IN_Dr1)は、術前登録テーブルに登録された顔特徴F(B2)と一致する。

　これらの判定結果から、医師Dr.1により発話された音声コマンドに応じた所定の処理が、視線検出機７０により検出された医師Dr.1の視線情報に基づいて実行される。例えば、図中の破線Ｌ２１乃至Ｌ２３で示した撮像領域内のユーザ候補の視線のうち、破線Ｌ２２が医師Dr.1の視線となるので、医師Dr.1の視線が向けられた視野画像に含まれる特定の術部に関して、医師Dr.1が発した音声コマンドに応じた所定の処理が実行される。

（音声対応処理）
　ここで、図９のフローチャートを参照して、図８に示したユーザ判定で適用可能な音声対応処理の流れを説明する。

　認識部１１１は、撮像領域に存在するユーザ候補の中から最高位のＢ権限のユーザを認識し（Ｓ３１）、認識されたＢ権限のユーザがＡ権限を持つとみなす（Ｓ３２）。図８の例では、撮像領域に存在するＢ２権限がアサインされた医師Dr.1がＡ権限を有している。

　判定部１１２は、入力された音声コマンドの声紋S(IN)を、認識されたＢ権限のユーザの声紋S(Bx)と比較する（Ｓ３３）。

　声紋の比較結果が、S(IN) = S(Bx)であると判定された場合（Ｓ３４の「Yes」）、処理は、ステップＳ３５に進められる。そして、実行部１１３は、Ａ権限のユーザによる音声コマンドであると認定し（Ｓ３５）、当該音声コマンドに応じた所定の処理を実行する。図８の例では、医師Dr.1が発した音声コマンドが、Ａ権限のユーザからの音声コマンドであると認定され、所定の処理が実行される。

　また、声紋の比較結果が、S(IN) = S(Bx)ではないと判定された場合（Ｓ３４の「No」）、処理は、ステップＳ３６に進められる。この場合、実行部１１３は、Ａ権限のユーザによる音声コマンドではないと認定し（Ｓ３６）、当該音声コマンドを未実行とする。図８の例では、医師Dr.6又は他の手術スタッフSTによる発話（音声コマンド）は、Ａ権限のユーザからの音声コマンドではないと認定される。

　ステップＳ３５，又はＳ３６の処理が終了すると、処理は終了される。

（視線対応処理）
　次に、図１０のフローチャートを参照して、図８に示したユーザ判定で適用可能な視線対応処理の流れを説明する。

　認識部１１１は、音声到来方向に存在する第１ユーザ候補の顔の特徴を認識する（Ｓ５１）。判定部１１２は、第１ユーザ候補の顔特徴F(IN1)を、認識されたＢ権限のユーザの顔特徴F(Bx)と比較する（Ｓ５２）。

　なお、ステップＳ５２における認識されたＢ権限のユーザとは、図９のステップＳ３１の処理で撮像領域の範囲内で最高位のＢ権限のユーザであると認識されるＢ権限のユーザと同様である。

　ステップＳ５２の処理で顔特徴の比較結果が、F(IN1) = F(Bx)であると判定された場合（Ｓ５３の「Yes」）、処理は、ステップＳ５４に進められる。そして、実行部１１３は、ユーザとして特定された第１ユーザ候補の視線を採用し（Ｓ５４）、当該第１ユーザ候補の音声と視線を用いた所定の処理を実行する。

　また、ステップＳ５２の処理で顔特徴の比較結果が、F(IN1) = F(Bx)ではないと判定された場合（Ｓ５３の「No」）、処理は、ステップＳ５５に進められる。この場合、認識部１１１は、音声到来方向に存在する第２ユーザ候補の顔の特徴を認識する（Ｓ５５）。

　判定部１１２は、第２ユーザ候補の顔特徴F(IN2)を、認識されたＢ権限のユーザの顔特徴F(Bx)と比較する（Ｓ５６）。なお、ここでも、認識されたＢ権限のユーザとは、撮像領域の範囲内で最高位となるＢ権限のユーザを意味する。

　ステップＳ５７の処理で顔特徴の比較結果が、F(IN2) = F(Bx)であると判定された場合（Ｓ５７の「Yes」）、処理は、ステップＳ５８に進められる。そして、実行部１１３は、ユーザとして特定された第２ユーザ候補の視線を採用し（Ｓ５８）、当該第２ユーザ候補の音声と視線を用いた所定の処理を実行する。

　また、ステップＳ５７の処理で顔特徴の比較結果が、F(IN2) = F(Bx)ではないと判定された場合（Ｓ５７の「No」）、処理は、ステップＳ５９に進められる。この場合、実行部１１３は、Ａ権限のユーザによる音声コマンドではないと認定し（Ｓ５９）、音声と視線を用いた所定の処理はスキップされる。

　ステップＳ５４，Ｓ５８，又はＳ５９の処理が終了すると、処理は終了される。

　なお、この例では、説明の都合上、音声到来方向に第１ユーザ候補と第２ユーザ候補の２人のユーザ候補の顔がある場合を例示したが、さらに他のユーザ候補の顔が存在する場合には、すべてのユーザ候補の顔の特徴について比較すればよい。

＜３．第３の実施の形態＞

　所定の条件を満たすユーザ候補が複数存在する場合に、当該ユーザ候補ごとに操作権限の優先順位（ランク）を定めておくことで、当該ランクに応じて操作可能なユーザを特定することができる。ランク付けの方法としては、様々な方法を用いることができる。ランクに関するランク情報は、手術開始前に設定するほか、手術中の状況に応じて変更したり、特定の権限を持つユーザ（例えば看護師）が指定することにより変更したりすることができる。

（ランクに応じたユーザ判定処理）
　図１１のフローチャートを参照して、ランクに応じたユーザ判定処理の流れを説明する。

　ステップＳ７１乃至Ｓ７４においては、図４のステップＳ１１乃至Ｓ１４と同様に、音声コマンドの認識結果、ユーザ候補の認識結果、及び視線位置の認識結果が得られる。また、ステップＳ７８では、判定部１１２は、ランク情報に基づいて、ユーザ候補のランクを判定する。ランク判定処理の詳細は後述する。

　ステップＳ７５において、判定部１１２は、認識結果及びランク判定結果に基づいて、操作権限を持つユーザであるための所定の条件を満たすかどうかを判定する。

　ステップＳ７５において、所定の条件を満たしていると判定された場合（Ｓ７６の「Yes」）、処理は、ステップＳ７７に進められる。ステップＳ７７において、実行部１１３は、認識結果に基づいて、所定の処理を実行する。

　また、ステップＳ７５において、所定の条件を満たしていないと判定された場合（Ｓ７６の「No」）、処理は、ステップＳ７１に戻り、それ以降の処理が繰り返される。

　以上、ランクを用いたユーザ判定処理の流れを説明した。ここで、上述したランク判定処理（図１１のＳ７８）では、判定部１１２によって、ランク情報を用いたユーザ候補のランク判定が行われるが、例えば、次のような処理が行われる。

　すなわち、判定部１１２では、各ユーザ候補に対して設定されたランク情報が取得され、各ユーザ候補のランクに基づいて、撮像領域に存在するユーザ候補のうち、最もランクの高いユーザ候補をユーザとして判定する。

　そして、実行部１１３では、判定結果に応じた最もランクが高いユーザによる音声と視線に基づき、表示装置４０に表示される表示情報を制御する。例えば、第１ユーザ候補が撮像領域に存在し、かつ、第１ユーザ候補のランクが最も高いという条件を満たしたとき、ユーザとしての第１ユーザ候補の音声と視線による操作が受け付けられる。

　また、判定部１１２では、予めユーザ候補ごとに割り振られているランクに関するランク情報が取得され、手術開始前の確認動作やユーザ候補の位置などの情報に基づき、ユーザ候補ごとに割り振られたランクを調整してユーザ判定を行う。

　例えば、手術開始前の確認動作に関する音声を発したユーザ候補を、最も高いランクに設定することができる。また、現時点で最もランクの高いユーザ候補の事前ランク（予め設定されていたランク）よりも高いランクのユーザ候補が撮像領域に現れたとき、当該ユーザ候補の位置情報に基づき、ランクを調整することができる。すなわち、手術開始前に登録された情報の内容を初期状態として、手術の状況に応じて操作権限のランクを更新することができる。

　なお、リセットボタンの押下など、特定のユーザにより所定の操作が行われた場合に、調整されたユーザ候補のランク設定を、予め設定された値に戻すようにしても構わない。

　また、判定部１１２では、表示装置４０の画面の中央部（例えば画面の横幅における略中央部）に対応した位置、又はカメラ６０の画角の中央部に対応した位置から、第１ユーザ候補がずれて、第２ユーザ候補が中央部付近に位置した場合に、第１ユーザ候補よりも第２ユーザ候補の事前ランクが高いときには、第２ユーザ候補の音声操作を受け付けるようにユーザ判定を行う。また、この場合において、第１ユーザ候補よりも第２ユーザ候補の事前ランクが低いときには、第１ユーザ候補の音声操作を受け付けるようにユーザ判定を行う。

　なお、登録されているユーザ候補が撮像領域に存在しない場合には、表示装置４０の画面の中央部又はカメラ６０の画角の中央部に対応した位置にいるユーザ候補の音声操作を受け付けるようにユーザ判定を行うようにしても構わない。

　また、判定部１１２では、看護師等の特定のユーザにより指定されたユーザ候補を最も高いランクとしてユーザ判定を行う。また、事前登録により術者が誰であるかを予め登録しておくことで、判定部１１２では、術者が誰であるかのユーザ判定を行うことができる。例えば、術者がいる間は、ランクの調整を制限して、ランクが切り替えられないようにする。

　また、判定部１１２では、カメラ６０からの画像信号を用いた画像認識結果や、視線検出機７０からの検出信号を用いて、術具を持っているユーザ候補、電気メスを持っているユーザ候補、又は表示装置４０の画面を見ている時間が所定の時間よりも長いユーザ候補を、最も高いランクに設定することができる。

　以上のように、所定の条件を満たすユーザ候補が複数存在する場合にであっても、操作権限の優先順位（ランク）を定めておくことで、適切なユーザの発話や視線などによる操作を実行することが可能となる。また、操作権限の優先順位（ランク）は、あらかじめ設定された情報に基づき決定されるが、手術の状況に合わせて変更される場合があるため、より状況に適したユーザによる音声操作が実行可能となる。

＜４．第４の実施の形態＞

　Ａ権限のユーザが、Ｂ権限のユーザに対して一時的に権限を移譲可能であることは、先に述べた通りである。このような権限移譲が行われる場合としては、Ａ権限のユーザが、ユーザ交代のための音声コマンド（以下、スワップコマンドという）を発したときに、指定したユーザ候補（例えばＢ権限のユーザ）に対して権限が移譲されるようにしてもよい。

　また、権限移譲の解除を行うに際しては、Ａ権限のユーザが、ユーザ交代の解除のためのコマンド（以下、スワップ解除コマンドという）を発したときに権限移譲が解除され、指定したユーザ候補（例えばＢ権限のユーザ）からＡ権限のユーザに操作権限が戻される。

（権限移譲処理）
　まず、図１２のフローチャートを参照して、権限移譲処理の流れを説明する。

　制御装置１０では、ユーザ候補による音声入力が受け付けられたとき（Ｓ９１）、制御部１００によって、ステップＳ９２以降の処理が実行される。

　ステップＳ９２において、認識部１１１は、音声入力をしたユーザ候補の発話に応じた音声信号を解析して、ユーザ候補の発話内容に含まれるスワップコマンドを認識する。ここでは、権限を移譲するユーザ候補（Ｂ権限のユーザ）も指定されるため、それも認識される。

　ステップＳ９３において、認識部１１１は、音声入力をしたユーザ候補を撮影して得られる画像信号を解析して、発話したユーザ候補を認識する。

　ステップＳ９４において、判定部１１２は、認識結果に基づいて、音声入力をしたユーザ候補がＡ権限を持つユーザであるための所定の条件を満たすか否かを判定する。

　ステップＳ９４において、所定の条件を満たしていると判定された場合（Ｓ９５の「Yes」）、処理は、ステップＳ９６に進められる。ステップＳ９６において、実行部１１３は、Ａ権限のユーザ（音声入力をしたユーザ候補）にアサインされた自己のＢ権限順位に基づいて、指定されたＢ権限のユーザ（権限を移譲するユーザ候補）と入れ替える。これにより、指定されたＢ権限のユーザに対し、一時的に権限が譲渡される。

　また、ステップＳ９４において、所定の条件を満たしていないと判定された場合（Ｓ９５の「No」）、処理は、ステップＳ９１に戻り、それ以降の処理が繰り返される。

　ステップＳ９６の処理が終了すると、処理は終了される。以上、権限移譲処理の流れを説明した。

（権限移譲解除処理）
　次に、図１３のフローチャートを参照して、権限移譲解除処理の流れを説明する。ただし、図１３に示した権限移譲解除処理が実行されるに先立って、上述した権限移譲処理（図１２）が実行され、Ａ権限のユーザからＢ権限のユーザ（権限を移譲したユーザ候補）に対して権限が移譲されているものとする。

　制御装置１０では、ユーザ候補の発話による音声入力が受け付けられたとき（Ｓ１１１）、制御部１００によって、ステップＳ１１２以降の処理が実行される。

　ステップＳ１１２において、認識部１１１は、音声入力をしたユーザ候補の発話に応じた音声信号を解析して、ユーザ候補の発話内容に含まれるスワップ解除コマンドを認識する。

　ステップＳ１１３において、認識部１１１は、音声入力をしたユーザ候補を撮影して得られる画像信号を解析して、発話したユーザ候補を認識する。

　ステップＳ１１４において、判定部１１２は、認識結果に基づいて、音声入力をしたユーザ候補がＡ権限を持つユーザであるための所定の条件を満たすか否かを判定する。

　ステップＳ１１４において、所定の条件を満たしていると判定された場合（Ｓ１１５の「Yes」）、処理は、ステップＳ１１６に進められる。ステップＳ１１６において、実行部１１３は、指定されたＢ権限のユーザ（権限を移譲したユーザ候補）に対して、一時的にスワップしていたＢ権限順位を元に戻す。これにより、権限移譲が解除され、指定されたＢ権限のユーザ（権限を移譲したユーザ候補）からＡ権限のユーザに操作権限が戻される。

　また、ステップＳ１１４において、所定の条件を満たしていないと判定された場合（Ｓ１１５の「No」）、処理は、ステップＳ１１１に戻り、それ以降の処理が繰り返される。

　ステップＳ１１６の処理が終了すると、処理は終了される。以上、権限移譲解除処理の流れを説明した。

　以上のように、所定の条件に関わらず、Ｂ権限のユーザ等のユーザ候補に対して一時的に操作権限を移譲することができるため、より柔軟な運用を行うことができる。

＜５．第５の実施の形態＞

　Ｃ権限のユーザは、音声コマンドによる操作権限を持たない者であることは先に述べた通りである。このような確実にユーザとなり得ない者に対して、ユーザ判定処理を行って、ユーザ候補から除外することができる。

（ユーザ除外処理）
　図１４は、ユーザ除外処理の流れを説明するフローチャートである。

　このユーザ除外処理は、上述した音声対応処理（図９）において、ステップＳ３３，Ｓ３４にて、音声コマンドの声紋S(IN)を比較して判定する際に、Ｂ権限のユーザの声紋S(Bx)だけでなく、Ｃ権限のユーザの声紋S(C)をも加味して、Ｃ権限のユーザがユーザ候補から除外されるようにすることで、ユーザ判定の精度を高めるものである。

　ステップＳ１３１において、判定部１１２は、音声コマンドの声紋S(IN)がＢ権限のユーザの声紋S(Bx)である確率P(Bx)を算出する。

　ステップＳ１３２において、判定部１１２は、音声コマンドの声紋S(IN)がＣ権限のユーザの声紋S(C)である確率P(C)を算出する。

　ステップＳ１３３において、判定部１１２は、算出した確率P(Bx)の値と確率P(C)の値とを比較して、確率P(Bx)の値が確率P(C)の値以上となるかどうかを判定する。

　ステップＳ１３３の判定処理で、P(Bx) ≧ P(C)であると判定された場合、処理は、ステップＳ１３４に進められる。そして、実行部１１３は、Ａ権限のユーザによる音声コマンドであると認定し（Ｓ１３４）、当該音声コマンドに応じた所定の処理を実行する。

　また、ステップＳ１３３の判定処理で、P(Bx) < P(C)であると判定された場合、処理は、ステップＳ１３５に進められる。この場合、実行部１１３は、Ａ権限のユーザによる音声コマンドではないと認定し（Ｓ１３５）、当該音声コマンドを未実行とする。

　ステップＳ１３４，又はＳ１３５の処理が終了すると、処理は終了される。以上、ユーザ除外処理の流れを説明した。

　なお、上述したユーザ除外処理では、上述した音声対応処理（図９）において、ステップＳ３３，Ｓ３４にて、音声コマンドの声紋S(IN)を比較して判定する際に、Ｃ権限のユーザの声紋S(C)をも加味する場合を説明したが、他の処理でも適用可能である。

　例えば、上述した視線対応処理（図１０）において、ステップＳ５２，Ｓ５２、又はステップＳ５６，Ｓ５７にて、顔特徴F(IN1)，F(IN2)を比較して判定する際に、Ｂ権限のユーザの顔特徴F(Bx)だけでなく、Ｃ権限のユーザの顔特徴F(C)をも加味して、Ｃ権限のユーザがユーザ候補から除外されるようにしてもよい。

　以上のように、音声対応処理（図９）における音声コマンドの声紋S(IN)の判定時や、視線対応処理（図１０）における顔特徴F(IN)の判定時などで、Ｂ権限のユーザのデータだけでなく、Ｃ権限のユーザのデータをも比較することで、確実にユーザとなり得ない者を、ユーザ候補から除外することができる。その結果として、ユーザ判定の精度をさらに高めることができ、ユーザを特定する際の確実性を高めることができる。

（コンピュータの構成）
　制御装置１０（の制御部１００）が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであってもよいし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであってもよい。

　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、又は、汎用のパーソナルコンピュータなどにインストールされる。

　インストールされるプログラムは、光ディスク（CD-ROM(Compact Disc-Read Only Memory)，DVD(Digital Versatile Disc)等）や半導体メモリなどよりなるリムーバブル記録媒体に記録して提供される。また、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線又は無線の伝送媒体を介して提供されるようにしてもよい。プログラムは、ROMや記録部に、予めインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであってもよいし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであってもよい。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本技術は、以下のような構成をとることができる。

（１）
　医療機器から出力された情報に基づいて表示する表示部と、
　前記表示部を少なくとも観察可能な領域の一部を撮像領域として撮像する撮像部と、
　前記表示部を少なくとも観察可能な領域の音声を取得する音声取得部と、
　前記医療機器から出力された情報に基づいて表示情報を制御する制御部と
　を備え、
　前記制御部は、
　　予め登録されている第１のユーザが前記撮像領域にて所定の条件を満たしているとき、前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　医療用表示システム。
（２）
　前記制御部は、手術開始前に登録された情報、手術開始前の確認動作に関する情報、及び手術中の特定の状況に関する情報のうち、少なくともいずれか１つの情報に基づいて、前記所定の条件を定める
　前記（１）に記載の医療用表示システム。
（３）
　前記制御部は、
　　前記撮像部により撮像された画像及び前記音声取得部により取得された音声の少なくとも一方に基づいて、前記第１のユーザ及び前記第２のユーザを含むユーザ候補を認識し、
　　認識された前記ユーザ候補が、前記所定の条件を満たすか否かを判定する
　前記（２）に記載の医療用表示システム。
（４）
　前記手術開始前に登録された情報は、前記ユーザ候補に関する情報を含む
　前記（３）に記載の医療用表示システム。
（５）
　前記ユーザ候補に関する情報は、術者の特徴に関する情報と、医者の特徴に関する情報とを対応付けた対応情報を含む
　前記（４）に記載の医療用表示システム。
（６）
　前記手術開始前の確認動作に関する情報は、複数の区分からなる操作権限に関する情報を含み、
　前記制御部は、前記手術開始前の確認動作を行った前記ユーザ候補を、前記操作権限の区分に振り分ける
　前記（３）又は（４）に記載の医療用表示システム。
（７）
　前記操作権限の区分は、前記操作権限を有して音声コマンドが有効になる第１の区分、前記操作権限が移譲された場合に音声コマンドが有効になる第２の区分、及び前記操作権限を有さない第３の区分を含む
　前記（６）に記載の医療用表示システム。
（８）
　前記手術中の特定の状況に関する情報は、前記ユーザ候補の位置に関する情報を含む
　前記（３）、（４）、又は（６）に記載の医療用表示システム。
（９）
　前記ユーザ候補の位置に関する情報は、前記表示部の横幅における略中央部に応じた位置を含む
　前記（８）に記載の医療用表示システム。
（１０）
　前記制御部は、前記所定の条件を満たすユーザ候補が複数存在する場合、当該ユーザ候補ごとに操作権限の優先順位を設定する
　前記（３）、（４）、（６）、又は（８）に記載の医療用表示システム。
（１１）
　前記制御部は、前記手術開始前に登録された情報の内容を初期状態として、手術の状況に応じて操作権限の優先順位を更新する
　前記（１０）に記載の医療用表示システム。
（１２）
　前記制御部は、特定の権限を有するユーザの操作に応じて、操作権限の優先順位を更新する
　前記（１０）又は（１１）に記載の医療用表示システム。
（１３）
　前記制御部は、前記第１のユーザが前記所定の条件を満たしている場合に、当該第１のユーザが、ユーザ交代のための音声コマンドを発したとき、指定されたユーザ候補に操作権限を一時的に移譲する
　前記（３）乃至（１２）のいずれかに記載の医療用表示システム。
（１４）
　前記制御部は、前記第１のユーザが前記所定の条件を満たしている場合に、当該第１のユーザが、ユーザ交代の解除のための音声コマンドを発したとき、指定された前記ユーザ候補から、前記第１のユーザに操作権限を戻す
　前記（１３）に記載の医療用表示システム。
（１５）
　前記制御部は、前記第１のユーザ及び前記第２のユーザとなり得ないユーザ候補についての認識処理を行い、ユーザ候補から除外する
　前記（３）乃至（１２）のいずれかに記載の医療用表示システム。
（１６）
　前記音声をトリガにした入力は、前記第１のユーザ又は前記第２のユーザが音声コマンドを発したときの前記第１のユーザ又は前記第２のユーザの視線を含む
　前記（１）乃至（１５）のいずれかに記載の医療用表示システム。
（１７）
　前記制御部は、前記表示部上の前記第１のユーザ又は前記第２のユーザの視線位置に基づいて、前記音声コマンドに応じた所定の処理を実行する
　前記（１６）に記載の医療用表示システム。
（１８）
　前記撮像領域に存在する前記第１のユーザ又は前記第２のユーザの視線を検出する視線検出部をさらに備える
　前記（１７）に記載の医療用表示システム。
（１９）
　医療用表示システムが、
　医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御するに際して、
　　予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　制御方法。
（２０）
　医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御する制御部を備え、
　前記制御部は、
　　予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　制御装置。

　１　医療用表示システム，　１０　制御装置，　２０　顕微鏡装置，　３０　モニタリング装置，　４０　表示装置（表示部），　５０，５０－１，５０－２　マイクロフォン（音声取得部），　６０　カメラ（撮像部），　７０　視線検出機（視線検出部），　１００　制御部，　１１１　認識部，　１１２　判定部，　１１３　実行部

Claims

　医療機器から出力された情報に基づいて表示する表示部と、
　前記表示部を少なくとも観察可能な領域の一部を撮像領域として撮像する撮像部と、
　前記表示部を少なくとも観察可能な領域の音声を取得する音声取得部と、
　前記医療機器から出力された情報に基づいて表示情報を制御する制御部と
　を備え、
　前記制御部は、
　　予め登録されている第１のユーザが前記撮像領域にて所定の条件を満たしているとき、前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　医療用表示システム。
　前記制御部は、手術開始前に登録された情報、手術開始前の確認動作に関する情報、及び手術中の特定の状況に関する情報のうち、少なくともいずれか１つの情報に基づいて、前記所定の条件を定める
　請求項１に記載の医療用表示システム。
　前記制御部は、
　　前記撮像部により撮像された画像及び前記音声取得部により取得された音声の少なくとも一方に基づいて、前記第１のユーザ及び前記第２のユーザを含むユーザ候補を認識し、
　　認識された前記ユーザ候補が、前記所定の条件を満たすか否かを判定する
　請求項２に記載の医療用表示システム。
　前記手術開始前に登録された情報は、前記ユーザ候補に関する情報を含む
　請求項３に記載の医療用表示システム。
　前記ユーザ候補に関する情報は、術者の特徴に関する情報と、医者の特徴に関する情報とを対応付けた対応情報を含む
　請求項４に記載の医療用表示システム。
　前記手術開始前の確認動作に関する情報は、複数の区分からなる操作権限に関する情報を含み、
　前記制御部は、前記手術開始前の確認動作を行った前記ユーザ候補を、前記操作権限の区分に振り分ける
　請求項３に記載の医療用表示システム。
　前記操作権限の区分は、前記操作権限を有して音声コマンドが有効になる第１の区分、前記操作権限が移譲された場合に音声コマンドが有効になる第２の区分、及び前記操作権限を有さない第３の区分を含む
　請求項６に記載の医療用表示システム。
　前記手術中の特定の状況に関する情報は、前記ユーザ候補の位置に関する情報を含む
　請求項３に記載の医療用表示システム。
　前記ユーザ候補の位置に関する情報は、前記表示部の横幅における略中央部に応じた位置を含む
　請求項８に記載の医療用表示システム。
　前記制御部は、前記所定の条件を満たすユーザ候補が複数存在する場合、当該ユーザ候補ごとに操作権限の優先順位を設定する
　請求項３に記載の医療用表示システム。
　前記制御部は、前記手術開始前に登録された情報の内容を初期状態として、手術の状況に応じて操作権限の優先順位を更新する
　請求項１０に記載の医療用表示システム。
　前記制御部は、特定の権限を有するユーザの操作に応じて、操作権限の優先順位を更新する
　請求項１０に記載の医療用表示システム。
　前記制御部は、前記第１のユーザが前記所定の条件を満たしている場合に、当該第１のユーザが、ユーザ交代のための音声コマンドを発したとき、指定されたユーザ候補に操作権限を一時的に移譲する
　請求項３に記載の医療用表示システム。
　前記制御部は、前記第１のユーザが前記所定の条件を満たしている場合に、当該第１のユーザが、ユーザ交代の解除のための音声コマンドを発したとき、指定された前記ユーザ候補から、前記第１のユーザに操作権限を戻す
　請求項１３に記載の医療用表示システム。
　前記制御部は、前記第１のユーザ及び前記第２のユーザとなり得ないユーザ候補についての認識処理を行い、ユーザ候補から除外する
　請求項３に記載の医療用表示システム。
　前記音声をトリガにした入力は、前記第１のユーザ又は前記第２のユーザが音声コマンドを発したときの前記第１のユーザ又は前記第２のユーザの視線を含む
　請求項１に記載の医療用表示システム。
　前記制御部は、前記表示部上の前記第１のユーザ又は前記第２のユーザの視線位置に基づいて、前記音声コマンドに応じた所定の処理を実行する
　請求項１６に記載の医療用表示システム。
　前記撮像領域に存在する前記第１のユーザ又は前記第２のユーザの視線を検出する視線検出部をさらに備える
　請求項１７に記載の医療用表示システム。
　医療用表示システムが、
　医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御するに際して、
　　予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　制御方法。
　医療機器から出力された情報に基づいて、表示部に表示される表示情報を制御する制御部を備え、
　前記制御部は、
　　予め登録されている第１のユーザが、前記表示部を少なくとも観察可能な領域の一部として撮像された撮像領域にて所定の条件を満たしているとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御し、
　　前記第１のユーザが前記撮像領域にて前記所定の条件を満たしていないとき、前記表示部を少なくとも観察可能な領域で取得された前記第１のユーザと異なる第２のユーザの音声又は当該音声をトリガにした入力に基づいて前記表示情報を制御する
　制御装置。