WO2022054498A1 - 医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム - Google Patents

医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム Download PDF

Info

Publication number
WO2022054498A1
WO2022054498A1 PCT/JP2021/029898 JP2021029898W WO2022054498A1 WO 2022054498 A1 WO2022054498 A1 WO 2022054498A1 JP 2021029898 W JP2021029898 W JP 2021029898W WO 2022054498 A1 WO2022054498 A1 WO 2022054498A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
medical
medical arm
unit
model
Prior art date
Application number
PCT/JP2021/029898
Other languages
English (en)
French (fr)
Inventor
大輔 長尾
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Priority to DE112021004722.1T priority Critical patent/DE112021004722T5/de
Priority to US18/043,623 priority patent/US20230355332A1/en
Publication of WO2022054498A1 publication Critical patent/WO2022054498A1/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B34/00Computer-aided surgery; Manipulators or robots specially adapted for use in surgery
    • A61B34/30Surgical robots
    • A61B34/32Surgical robots operating autonomously
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00006Operational features of endoscopes characterised by electronic signal processing of control signals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00147Holding or positioning arrangements
    • A61B1/00149Holding or positioning arrangements using articulated arms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B34/00Computer-aided surgery; Manipulators or robots specially adapted for use in surgery
    • A61B34/70Manipulators specially adapted for use in surgery
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/161Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1689Teleoperation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B34/00Computer-aided surgery; Manipulators or robots specially adapted for use in surgery
    • A61B34/30Surgical robots
    • A61B2034/301Surgical robots for introducing or steering flexible instruments inserted into the body, e.g. catheters or endoscopes
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45117Medical, radio surgery manipulator

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Surgery (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Optics & Photonics (AREA)
  • Pathology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Signal Processing (AREA)
  • Endoscopes (AREA)

Abstract

第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部(222)と、第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部(224)と、第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部(230)とを備える、医療用アーム制御システムを提供する。

Description

医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム
 本開示は、医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラムに関する。
 近年、内視鏡手術においては、内視鏡を用いて患者の腹腔内を撮像し、内視鏡が撮像する撮像画像をディスプレイに表示しながら手術が行われている。例えば、下記特許文献1には、内視鏡を支持するアームの制御と、内視鏡の電子ズームの制御とを連動させる技術が開示されている。
国際公開第2018/159328号
 近年、内視鏡を支持するロボットアーム装置を自律的に動作させるための開発が進められている。例えば、学習器に、手術内容等とそれに対応する執刀医やスコピストの動作に関する情報を機械学習させ、学習モデルを生成させる。そして、このようにして得られた学習モデルや、制御ルール等を参照して、ロボットアーム装置を自律制御するための制御情報を生成する。
 しかしながら、ロボットアーム装置の動作の良し悪しは、人の感性に依存するため、理想的なロボットアーム装置の動作をモデル化することは難しい。そこで、多量のロボットアーム装置の動作に関する情報(臨床データ)を取得し、当該情報を機械学習することによって、理想的なロボットアーム装置の動作のモデルを獲得することが考えられる。しかし、臨床の現場において上記動作に関する情報を大量に収集することが難しいことから、より広い範囲の状況に対して対応可能な動作モデルを効率的に構築することは困難である。
 そこで、本開示では、少ない臨床データしか得られない場合であっても、より広い範囲の状況を網羅しつつ、人の感性をも考慮した動作を自律的に行うための学習モデルを効率的に取得することができる、医療用アーム制御システム、医療用アーム装置、医療用アーム制御方法及びプログラムを提案する。
 本開示によれば、第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、を備える、医療用アーム制御システムが提供される。
 また、本開示によれば、第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための制御モデルを、第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化して得られた自律動作制御モデルを格納する、医療用アーム装置が提供される。
 また、本開示によれば、医療用アーム制御システムにより、第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための自律動作制御モデルを、第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化することと、強化した前記自律動作制御モデルを用いて、前記医療用アームを制御することと、を含む、医療用アームの制御方法が提供される。
 さらに、本開示によれば、コンピュータを、第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、として機能させる、プログラムが提供される。
本開示に係る技術が適用され得る内視鏡手術システムの概略的な構成の一例を示す図である。 図1に示すカメラヘッド及びCCU(Camera Control Unit)の機能構成の一例を示すブロック図である。 本開示の実施形態に係る斜視鏡の構成を示す模式図である。 本開示の実施形態に係る医療用観察システム10の構成の一例を示す図である。 本開示の実施形態に係る学習装置200の構成の一例を示すブロック図である。 本開示の実施形態に係るモデルの生成方法の一例を示すフローチャートである。 本開示の実施形態に係る自律動作制御モデルの生成方法の一例を説明するための説明図である。 本開示の実施形態に係る報酬モデルの生成方法の一例を説明するための説明図である。 本開示の実施形態に係る強化学習の一例を示すフローチャートである。 本開示の実施形態に係る強化学習の一例を説明するための説明図である。 本開示の実施形態に係る制御装置300の構成の一例を示すブロック図である。 本開示の実施形態に係る制御方法の一例を示すフローチャートである。 本開示の実施形態に係る制御方法を説明するための説明図である。 本開示の実施形態に係る学習装置200を実現するコンピュータの一例を示すハードウェア構成図である。
 以下に、添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。また、本明細書及び図面において、実質的に同一又は類似の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、実質的に同一又は類似の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。
 なお、説明は以下の順序で行うものとする。
  1. 内視鏡手術システム5000の構成例
     1.1 内視鏡手術システム5000の概略的な構成
     1.2 支持アーム装置5027の詳細構成例
     1.3 光源装置5043の詳細構成例
     1.4 カメラヘッド5005及びCCU5039の詳細構成例
     1.5 内視鏡5001の構成例
  2. 医療用観察システム10の構成例
  3. 本開示の実施形態を創作するに至る背景
  4. 実施形態
     4.1 学習装置200の詳細構成
     4.2 自律動作制御モデルの生成方法
     4.3 報酬モデルの生成方法
     4.4 自律動作制御モデルの強化方法
     4.5 制御装置300の詳細構成
     4.6 制御方法
  5. まとめ
  6. ハードウェア構成
  7. 補足
 <<1. 内視鏡手術システム5000の構成例>>
 <1.1 内視鏡手術システム5000の概略的な構成>
 まず、本開示の実施形態の詳細を説明する前に、図1を参照して、本開示に係る技術が適用され得る内視鏡手術システム5000の概略的な構成について説明する。図1は、本開示に係る技術が適用され得る内視鏡手術システム5000の概略的な構成の一例を示す図である。図1では、執刀医5067が、内視鏡手術システム5000を用いて、患者ベッド5069上の患者5071に手術を行っている様子が図示されている。図1に示すように、内視鏡手術システム5000は、内視鏡5001と、その他の術具(医療用器具)5017と、内視鏡(医療用観察装置)5001を支持する支持アーム装置(医療用アーム)5027と、内視鏡下手術のための各種の装置が搭載されたカート5037とを有する。以下、内視鏡手術システム5000の詳細について、順次説明する。
 (術具5017)
 内視鏡手術では、腹壁を切って開腹する代わりに、例えば、トロッカ5025a~5025dと呼ばれる筒状の開孔器具が腹壁に複数穿刺される。そして、トロッカ5025a~5025dから、内視鏡5001の鏡筒5003や、その他の術具5017が患者5071の体腔内に挿入される。図1に示す例では、その他の術具5017として、気腹チューブ5019、エネルギー処置具5021及び鉗子5023が、患者5071の体腔内に挿入されている。また、エネルギー処置具5021は、高周波電流や超音波振動により、組織の切開及び剥離、又は血管の封止等を行う処置具である。ただし、図1に示す術具5017はあくまで一例であり、術具5017としては、例えば攝子、レトラクタ等、一般的に内視鏡下手術において用いられる各種の術具を挙げることができる。
 (支持アーム装置5027)
 支持アーム装置5027は、ベース部5029から延伸するアーム部5031を有する。図1に示す例では、アーム部5031は、関節部5033a、5033b、5033c、及びリンク5035a、5035bから構成されており、アーム制御装置5045からの制御により駆動される。そして、アーム部5031によって内視鏡5001が支持され、内視鏡5001の位置及び姿勢が制御される。これにより、内視鏡5001の安定的な位置の固定が実現され得る。
 (内視鏡5001)
 内視鏡5001は、先端から所定の長さの領域が患者5071の体腔内に挿入される鏡筒5003と、鏡筒5003の基端に接続されるカメラヘッド5005とから構成される。図1に示す例では、硬性の鏡筒5003を有するいわゆる硬性鏡として構成される内視鏡5001を図示しているが、内視鏡5001は、軟性の鏡筒5003を有するいわゆる軟性鏡として構成されてもよく、本開示の実施形態においては、特に限定されるものではない。
 鏡筒5003の先端には、対物レンズが嵌め込まれた開口部が設けられている。内視鏡5001には光源装置5043が接続されており、当該光源装置5043によって生成された光が、鏡筒5003の内部に延設されるライトガイドによって当該鏡筒の先端まで導かれ、対物レンズを介して患者5071の体腔内の観察対象に向かって照射される。なお、本開示の実施形態においては、内視鏡5001は、前方直視鏡であってもよいし、斜視鏡であってもよく、特に限定されるものではない。
 カメラヘッド5005の内部には光学系及び撮像素子が設けられており、観察対象からの反射光(観察光)は当該光学系によって当該撮像素子に集光される。当該撮像素子によって観察光が光電変換され、観察光に対応する電気信号、すなわち観察像に対応する画像信号が生成される。当該画像信号は、RAWデータとしてカメラコントロールユニット(CCU:Camera Control Unit)5039に送信される。なお、カメラヘッド5005には、その光学系を適宜駆動させることにより、倍率及び焦点距離を調整する機能が搭載される。
 なお、例えば立体視(3D表示)等に対応するために、カメラヘッド5005には撮像素子が複数設けられてもよい。この場合、鏡筒5003の内部には、当該複数の撮像素子のそれぞれに観察光を導光するために、リレー光学系が複数系統設けられることとなる。
 (カートに搭載される各種の装置について)
 まず、表示装置5041は、CCU5039からの制御により、当該CCU5039によって画像処理が施された画像信号に基づく画像を表示する。内視鏡5001が、例えば4K(水平画素数3840×垂直画素数2160)又は8K(水平画素数7680×垂直画素数4320)等の高解像度の撮影に対応したものである場合、及び/又は、3D表示に対応したものである場合には、表示装置5041として、それぞれに対応する、高解像度の表示が可能なもの、及び/又は、3D表示可能なものが用いられる。また、用途に応じて、解像度、サイズが異なる複数の表示装置5041が設けられていてもよい。
 また、内視鏡5001によって撮影された患者5071の体腔内の術部の画像は、当該表示装置5041に表示される。執刀医5067は、表示装置5041に表示された術部の画像をリアルタイムで見ながら、エネルギー処置具5021や鉗子5023を用いて、例えば患部を切除する等の処置を行うことができる。なお、図示を省略しているが、気腹チューブ5019、エネルギー処置具5021及び鉗子5023は、手術中に、執刀医5067又は助手等によって支持されてもよい。
 また、CCU5039は、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等によって構成され、内視鏡5001及び表示装置5041の動作を統括的に制御することができる。具体的には、CCU5039は、カメラヘッド5005から受け取った画像信号に対して、例えば現像処理(デモザイク処理)等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。さらに、CCU5039は、当該画像処理を施した画像信号を表示装置5041に提供する。また、CCU5039は、カメラヘッド5005に対して制御信号を送信し、その駆動を制御する。当該制御信号は、倍率や焦点距離等、撮像条件に関する情報を含むことができる。
 光源装置5043は、例えばLED(Light Emitting Diode)等の光源から構成され、術部を撮影する際の照射光を内視鏡5001に供給する。
 アーム制御装置5045は、例えばCPU等のプロセッサによって構成され、所定のプログラムに従って動作することにより、所定の制御方式に従って支持アーム装置5027のアーム部5031の駆動を制御する。
 入力装置5047は、内視鏡手術システム5000に対する入力インターフェイスである。執刀医5067は、入力装置5047を介して、内視鏡手術システム5000に対して各種の情報の入力や指示入力を行うことができる。例えば、執刀医5067は、入力装置5047を介して、患者の身体情報や、手術の術式についての情報等、手術に関する各種の情報を入力する。また、例えば、執刀医5067は、入力装置5047を介して、アーム部5031を駆動させる旨の指示や、内視鏡5001による撮像条件(照射光の種類、倍率及び焦点距離等)を変更する旨の指示、エネルギー処置具5021を駆動させる旨の指示等を入力することができる。なお、入力装置5047の種類は限定されず、入力装置5047は各種の公知の入力装置であってよい。入力装置5047としては、例えば、マウス、キーボード、タッチパネル、スイッチ、フットスイッチ5057、及び/又は、レバー等が適用され得る。例えば、入力装置5047としてタッチパネルが用いられる場合には、当該タッチパネルは表示装置5041の表示面上に設けられていてもよい。
 あるいは、入力装置5047は、例えば、メガネ型のウェアラブルデバイスやHMD(Head Mounted Display)等の、執刀医5067の身体の一部に装着されるデバイスであってもよい。この場合、これらのデバイスによって検出される執刀医5067のジェスチャや視線に応じて、各種の入力が行われることとなる。また、入力装置5047は、執刀医5067の動きを検出可能なカメラを含むことができ、当該カメラによって撮像された画像から検出される執刀医5067のジェスチャや視線に応じて、各種の入力が行われてもよい。さらに、入力装置5047は、執刀医5067の声を収音可能なマイクロフォンを含むことができ、当該マイクロフォンを介して音声によって各種の入力が行われてもよい。このように、入力装置5047が非接触で各種の情報を入力可能に構成されることにより、特に清潔域に属するユーザ(例えば執刀医5067)が、不潔域に属する機器を非接触で操作することが可能となる。また、執刀医5067は、所持している術具から手を離すことなく機器を操作することが可能となるため、執刀医5067の利便性が向上する。
 処置具制御装置5049は、組織の焼灼、切開又は血管の封止等のためのエネルギー処置具5021の駆動を制御する。気腹装置5051は、内視鏡5001による視野の確保及び執刀医5067の作業空間の確保の目的で、患者5071の体腔を膨らめるために、気腹チューブ5019を介して当該体腔内にガスを送り込む。レコーダ5053は、手術に関する各種の情報を記録可能な装置である。プリンタ5055は、手術に関する各種の情報を、テキスト、画像又はグラフ等各種の形式で印刷可能な装置である。
 <1.2 支持アーム装置5027の詳細構成例>
 さらに、支持アーム装置5027の詳細構成の一例について説明する。支持アーム装置5027は、基台であるベース部5029と、ベース部5029から延伸するアーム部5031とを有する。図1に示す例では、アーム部5031は、複数の関節部5033a、5033b、5033cと、関節部5033bによって連結される複数のリンク5035a、5035bとから構成されているが、図1では、簡単のため、アーム部5031の構成を簡略化して図示している。具体的には、アーム部5031が所望の自由度を有するように、関節部5033a~5033c及びリンク5035a、5035bの形状、数及び配置、並びに関節部5033a~5033cの回転軸の方向等が適宜設定され得る。例えば、アーム部5031は、好適に、6自由度以上の自由度を有するように構成され得る。これにより、アーム部5031の可動範囲内において内視鏡5001を自由に移動させることが可能になるため、所望の方向から内視鏡5001の鏡筒5003を患者5071の体腔内に挿入することが可能になる。
 関節部5033a~5033cにはアクチュエータが設けられており、関節部5033a~5033cは当該アクチュエータの駆動により所定の回転軸まわりに回転可能に構成されている。当該アクチュエータの駆動がアーム制御装置5045によって制御されることにより、各関節部5033a~5033cの回転角度が制御され、アーム部5031の駆動が制御される。これにより、内視鏡5001の位置及び姿勢の制御が実現され得る。この際、アーム制御装置5045は、力制御又は位置制御等、各種の公知の制御方式によってアーム部5031の駆動を制御することができる。
 例えば、執刀医5067が、入力装置5047(フットスイッチ5057を含む)を介して適宜操作入力を行うことにより、当該操作入力に応じてアーム制御装置5045によってアーム部5031の駆動が適宜制御され、内視鏡5001の位置及び姿勢が制御されてよい。なお、アーム部5031は、いわゆるプライマリ・レプリカ(マスタースレイブ)方式で操作されてもよい。この場合、アーム部5031(ペイシェントカートに含まれるアーム)は、手術室から離れた場所または手術室内に設置される入力装置5047(術者コンソール)を介して執刀医5067によって遠隔操作され得る。
 ここで、一般的には、内視鏡下手術では、スコピストと呼ばれる医師によって内視鏡5001が支持されていた。これに対して、本開示の実施形態においては、支持アーム装置5027を用いることにより、人手によらずに内視鏡5001の位置をより確実に固定することが可能になるため、術部の画像を安定的に得ることができ、手術を円滑に行うことが可能になる。
 なお、アーム制御装置5045は必ずしもカート5037に設けられなくてもよい。また、アーム制御装置5045は必ずしも1つの装置でなくてもよい。例えば、アーム制御装置5045は、支持アーム装置5027のアーム部5031の各関節部5033a~5033cにそれぞれ設けられてもよく、複数のアーム制御装置5045が互いに協働することにより、アーム部5031の駆動制御が実現されてもよい。
 <1.3 光源装置5043の詳細構成例>
 次に、光源装置5043の詳細構成の一例について説明する。光源装置5043は、内視鏡5001に術部を撮影する際の照射光を供給する。光源装置5043は、例えばLED、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成される。このとき、RGBレーザ光源の組み合わせにより白色光源が構成される場合には、各色(各波長)の出力強度及び出力タイミングを高精度に制御することができるため、光源装置5043において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、RGBレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド5005の撮像素子の駆動を制御することにより、RGBそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。
 また、光源装置5043は、出力する光の強度を所定の時間ごとに変更するようにその駆動が制御されてもよい。その光の強度の変更のタイミングに同期してカメラヘッド5005の撮像素子の駆動を制御して時分割で画像を取得し、その画像を合成することにより、いわゆる黒つぶれ及び白とびのない高ダイナミックレンジの画像を生成することができる。
 また、光源装置5043は、特殊光観察に対応した所定の波長帯域の光を供給可能に構成されてもよい。特殊光観察では、例えば、体組織における光の吸収の波長依存性を利用して、通常の観察時における照射光(すなわち、白色光)に比べて狭帯域の光を照射することにより、粘膜表層の血管等の所定の組織を高コントラストで撮影する、いわゆる狭帯域光観察(Narrow Band Imaging)が行われる。あるいは、特殊光観察では、励起光を照射することにより発生する蛍光により画像を得る蛍光観察が行われてもよい。蛍光観察では、体組織に励起光を照射し当該体組織からの蛍光を観察するもの(自家蛍光観察)、又は、インドシアニングリーン(ICG)等の試薬を体組織に局注するとともに当該体組織にその試薬の蛍光波長に対応した励起光を照射し蛍光像を得るもの等が行われ得る。光源装置5043は、このような特殊光観察に対応した狭帯域光、及び/又は、励起光を供給可能に構成され得る。
 <1.4 カメラヘッド5005及びCCU5039の詳細構成例>
 次に、図2を参照して、カメラヘッド5005及びCCU5039の詳細構成の一例について説明する。図2は、図1に示すカメラヘッド5005及びCCU5039の機能構成の一例を示すブロック図である。
 詳細には、図2に示すように、カメラヘッド5005は、その機能として、レンズユニット5007と、撮像部5009と、駆動部5011と、通信部5013と、カメラヘッド制御部5015とを有する。また、CCU5039は、その機能として、通信部5059と、画像処理部5061と、制御部5063とを有する。そして、カメラヘッド5005とCCU5039とは、伝送ケーブル5065によって双方向に通信可能に接続されている。
 まず、カメラヘッド5005の機能構成について説明する。レンズユニット5007は、鏡筒5003との接続部に設けられる光学系である。鏡筒5003の先端から取り込まれた観察光は、カメラヘッド5005まで導光され、当該レンズユニット5007に入射する。レンズユニット5007は、ズームレンズ及びフォーカスレンズを含む複数のレンズが組み合わされて構成される。レンズユニット5007は、撮像部5009の撮像素子の受光面上に観察光を集光するように、その光学特性が調整されている。また、ズームレンズ及びフォーカスレンズは、撮像画像の倍率及び焦点の調整のため、その光軸上の位置が移動可能に構成される。
 撮像部5009は撮像素子によって構成され、レンズユニット5007の後段に配置される。レンズユニット5007を通過した観察光は、当該撮像素子の受光面に集光され、光電変換によって、観察像に対応した画像信号が生成される。撮像部5009によって生成された画像信号は、通信部5013に提供される。
 撮像部5009を構成する撮像素子としては、例えばCMOS(Complementary Metal Oxide Semiconductor)タイプのイメージセンサであり、Bayer配列を有するカラー撮影可能なものが用いられる。なお、当該撮像素子としては、例えば4K以上の高解像度の画像の撮影に対応可能なものが用いられてもよい。術部の画像が高解像度で得られることにより、執刀医5067は、当該術部の様子をより詳細に把握することができ、手術をより円滑に進行することが可能となる。
 また、撮像部5009を構成する撮像素子は、3D表示に対応する右目用及び左目用の画像信号をそれぞれ取得するための1対の撮像素子を有するように構成されてもよい(ステレオ方式)。3D表示が行われることにより、執刀医5067は術部における生体組織(臓器)の奥行きをより正確に把握することや、生体組織までの距離を把握することが可能になる。なお、撮像部5009が多板式で構成される場合には、各撮像素子に対応して、レンズユニット5007も複数系統設けられてもよい。
 また、撮像部5009は、必ずしもカメラヘッド5005に設けられなくてもよい。例えば、撮像部5009は、鏡筒5003の内部に、対物レンズの直後に設けられてもよい。
 駆動部5011は、アクチュエータによって構成され、カメラヘッド制御部5015からの制御により、レンズユニット5007のズームレンズ及びフォーカスレンズを光軸に沿って所定の距離だけ移動させる。これにより、撮像部5009による撮像画像の倍率及び焦点が適宜調整され得る。
 通信部5013は、CCU5039との間で各種の情報を送受信するための通信装置によって構成される。通信部5013は、撮像部5009から得た画像信号をRAWデータとして伝送ケーブル5065を介してCCU5039に送信する。この際、術部の撮像画像を低レイテンシで表示するために、当該画像信号は光通信によって送信されることが好ましい。手術の際には、執刀医5067が撮像画像によって患部の状態を観察しながら手術を行うため、より安全で確実な手術のためには、術部の動画像が可能な限りリアルタイムに表示されることが求められるからである。光通信が行われる場合には、通信部5013には、電気信号を光信号に変換する光電変換モジュールが設けられる。画像信号は当該光電変換モジュールによって光信号に変換された後、伝送ケーブル5065を介してCCU5039に送信される。
 また、通信部5013は、CCU5039から、カメラヘッド5005の駆動を制御するための制御信号を受信する。当該制御信号には、例えば、撮像画像のフレームレートを指定する旨の情報、撮像時の露出値を指定する旨の情報、及び/又は、撮像画像の倍率及び焦点を指定する旨の情報等、撮像条件に関する情報が含まれる。通信部5013は、受信した制御信号をカメラヘッド制御部5015に提供する。なお、CCU5039からの制御信号も、光通信によって伝送されてもよい。この場合、通信部5013には、光信号を電気信号に変換する光電変換モジュールが設けられ、制御信号は当該光電変換モジュールによって電気信号に変換された後、カメラヘッド制御部5015に提供される。
 なお、上記のフレームレートや露出値、倍率、焦点等の撮像条件は、取得された画像信号に基づいてCCU5039の制御部5063によって自動的に設定される。つまり、いわゆるAE(Auto Exposure)機能、AF(Auto Focus)機能及びAWB(Auto White Balance)機能が内視鏡5001に搭載される。
 カメラヘッド制御部5015は、通信部5013を介して受信したCCU5039からの制御信号に基づいて、カメラヘッド5005の駆動を制御する。例えば、カメラヘッド制御部5015は、撮像画像のフレームレートを指定する旨の情報、及び/又は、撮像時の露光を指定する旨の情報に基づいて、撮像部5009の撮像素子の駆動を制御する。また、例えば、カメラヘッド制御部5015は、撮像画像の倍率及び焦点を指定する旨の情報に基づいて、駆動部5011を介してレンズユニット5007のズームレンズ及びフォーカスレンズを適宜移動させる。カメラヘッド制御部5015は、さらに、鏡筒5003やカメラヘッド5005を識別するための情報を記憶する機能を有していてもよい。
 なお、レンズユニット5007や撮像部5009等の構成を、気密性及び防水性が高い密閉構造内に配置することで、カメラヘッド5005について、オートクレーブ滅菌処理に対する耐性を持たせることができる。
 次に、CCU5039の機能構成について説明する。通信部5059は、カメラヘッド5005との間で各種の情報を送受信するための通信装置によって構成される。通信部5059は、カメラヘッド5005から、伝送ケーブル5065を介して送信される画像信号を受信する。この際、上記のように、当該画像信号は好適に光通信によって送信され得る。この場合、光通信に対応して、通信部5059には、光信号を電気信号に変換する光電変換モジュールが設けられる。通信部5059は、電気信号に変換した画像信号を画像処理部5061に提供する。
 また、通信部5059は、カメラヘッド5005に対して、カメラヘッド5005の駆動を制御するための制御信号を送信する。当該制御信号も光通信によって送信されてよい。
 画像処理部5061は、カメラヘッド5005から送信されたRAWデータである画像信号に対して各種の画像処理を施す。当該画像処理としては、例えば現像処理、高画質化処理(帯域強調処理、超解像処理、NR(Noise Reduction)処理、及び/又は、手ブレ補正処理等)、及び/又は、拡大処理(電子ズーム処理)等、各種の公知の信号処理が含まれる。また、画像処理部5061は、AE、AF及びAWBを行うための、画像信号に対する検波処理を行う。
 画像処理部5061は、CPUやGPU等のプロセッサによって構成され、当該プロセッサが所定のプログラムに従って動作することにより、上述した画像処理や検波処理が行われ得る。なお、画像処理部5061が複数のGPUによって構成される場合には、画像処理部5061は、画像信号に係る情報を適宜分割し、これら複数のGPUによって並列的に画像処理を行う。
 制御部5063は、内視鏡5001による術部の撮像、及びその撮像画像の表示に関する各種の制御を行う。例えば、制御部5063は、カメラヘッド5005の駆動を制御するための制御信号を生成する。この際、撮像条件が執刀医5067によって入力されている場合には、制御部5063は、当該執刀医5067による入力に基づいて制御信号を生成する。あるいは、内視鏡5001にAE機能、AF機能及びAWB機能が搭載されている場合には、制御部5063は、画像処理部5061による検波処理の結果に応じて、最適な露出値、焦点距離及びホワイトバランスを適宜算出し、制御信号を生成する。
 また、制御部5063は、画像処理部5061によって画像処理が施された画像信号に基づいて、術部の画像を表示装置5041に表示させる。この際、制御部5063は、各種の画像認識技術を用いて術部画像内における各種の物体を認識する。例えば、制御部5063は、術部画像に含まれる物体のエッジの形状や色等を検出することにより、鉗子等の術具、特定の生体部位、出血、エネルギー処置具5021使用時のミスト等を認識することができる。制御部5063は、表示装置5041に術部の画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を当該術部の画像に重畳表示させる。手術支援情報が重畳表示され、執刀医5067に提示されることにより、より安全かつ確実に手術を進めることが可能になる。
 カメラヘッド5005及びCCU5039を接続する伝送ケーブル5065は、電気信号の通信に対応した電気信号ケーブル、光通信に対応した光ファイバ、又は、これらの複合ケーブルである。
 ここで、図示する例においては、伝送ケーブル5065を用いて有線で通信が行われているものとしていたが、本開示においては、カメラヘッド5005とCCU5039との間の通信は無線で行われてもよい。両者の間の通信が無線で行われる場合には、伝送ケーブル5065を手術室内に敷設する必要がなくなるため、手術室内における医療スタッフ(例えば、執刀医5067)の移動が当該伝送ケーブル5065によって妨げられる事態が解消され得る。
 <1.5 内視鏡5001の構成例>
 続いて、図3を参照して、内視鏡5001の一例として斜視鏡の基本的構成について説明する。図3は、本開示の一実施形態に係る斜視鏡4100の構成を示す模式図である。
 詳細には、図3に示すように、斜視鏡4100は、カメラヘッド4200の先端に装着されている。斜視鏡4100は図1及び図2で説明した鏡筒5003に対応し、カメラヘッド4200は、図1及び図2で説明したカメラヘッド5005に対応する。斜視鏡4100とカメラヘッド4200は互いに独立して回動可能とされている。斜視鏡4100とカメラヘッド4200の間には、各関節部5033a,5033b,5033cと同様にアクチュエータが設けられており、斜視鏡4100はアクチュエータの駆動によってカメラヘッド4200に対して回転する。
 斜視鏡4100は、支持アーム装置5027によって支持される。支持アーム装置5027は、スコピストの代わりに斜視鏡4100を保持し、また執刀医5067や助手の操作によって斜視鏡4100を所望の部位が観察できるように移動させる機能を有する。
 なお、本開示の実施形態においては、内視鏡5001は、斜視鏡4100に限定されるものではない。例えば、内視鏡5001は、内視鏡の先端部の前方を捉える前方直視鏡(図示省略)であってもよく、さらには、内視鏡で捉えた広角画像から画像を切り出す機能(広角/切り出し機能)を有していてもよい。また、例えば、内視鏡5001は、内視鏡の先端部が執刀医5067の操作に従って自由に湾曲することにより視野を可変することができる先端湾曲機能付きの内視鏡(図示省略)であってもよい。また、例えば、内視鏡5001は、内視鏡の先端部に、視野の異なる複数のカメラユニットを内蔵させて、それぞれのカメラによって異なる画像を得ることができる他方向同時撮影機能付きの内視鏡(図示省略)であってもよい。
 以上、本開示に係る技術が適用され得る内視鏡手術システム5000の一例について説明した。なお、ここでは、一例として内視鏡手術システム5000について説明したが、本開示に係る技術が適用され得るシステムはかかる例に限定されない。例えば、本開示に係る技術は、顕微鏡手術システムに適用されてもよい。
 <<2. 医療用観察システム10の構成例>>
 さらに、図4を参照して、上述した内視鏡手術システム5000と組み合わせることが可能な、本開示の実施形態に係る医療用観察システム10の構成の一例について説明する。図4は、本開示の実施形態に係る医療用観察システム10の構成の一例を示す図である。図4に示すように、医療用観察システム10は、内視鏡ロボットアームシステム100と、学習装置200と、制御装置300と、提示装置500と、執刀医側装置600と、患者側装置610とを主に含む。以下、医療用観察システム10に含まれる各装置について説明する。
 まず、医療用観察システム10の構成の詳細を説明する前に、医療用観察システム10の動作の概要について説明する。当該医療用観察システム10においては、内視鏡ロボットアームシステム100を用いて、アーム部102(上述した支持アーム装置5027に対応する)を制御することにより、人手によらずに、アーム部102に支持された撮像部104(上述した内視鏡5001に対応する)の位置を好適な位置に固定することができる。従って、当該医療用観察システム10によれば、術部の画像を安定的に得ることができることから、執刀医5067は、手術を円滑に行うことを可能にする。なお、以下に説明においては、内視鏡の位置を移動させたり、固定させたりする人をスコピストと呼び、人手又は機械での制御に関係なく、内視鏡5001の動作(移動、停止、姿勢の変化を含む)をスコープワークと呼ぶ。
 (内視鏡ロボットアームシステム100)
 内視鏡ロボットアームシステム100は、撮像部104(内視鏡5001)を支持するアーム部102(支持アーム装置5027)であって、詳細には、図4に示すように、アーム部(医療用アーム)102と、撮像部(医療用観察装置)104と、光源部106とを主に有する。以下に、内視鏡ロボットアームシステム100に含まれる各機能部について説明する。
 アーム部102は、複数の関節部と複数のリンクから構成される多リンク構造体である多関節アーム(図1に示すアーム部5031に対応する)を有し、当該アーム部102を可動範囲内で駆動させることにより、当該アーム部102の先端に設けられる撮像部104(内視鏡5001)の位置及び姿勢の制御することができる。また、アーム部102は、アーム部102の位置や姿勢のデータを得るために、加速度センサ、ジャイロセンサ、地磁気センサ等を含むモーションセンサ(図示省略)を有していてもよい。
 撮像部104は、例えばアーム部102の先端に設けられ、各種の撮像対象物の画像を撮像する。この場合、アーム部102は、撮像部104を支持している。なお、本実施形態においては、アーム部102の先端には、被写体からの光をイメージセンサまで導くリレーレンズが設けられ、当該リレーレンズによりCCU5039内のイメージセンサに光を導くような構成であってもよい。また、撮像部104は、先に説明したように、例えば、斜視鏡4100、広角/切り出し機能付きの前方直視鏡(図示省略)、先端湾曲機能付きの内視鏡(図示省略)、他方向同時撮影機能付きの内視鏡(図示省略)であってもよく、もしくは、顕微鏡であってもよく、特に限定されるものではない。
 さらに、撮像部104は、例えば、患者の腹腔内の各種の医療用器具(術具)、臓器等を含む術野画像を撮像することができる。具体的には、撮像部104は、撮影対象を動画や静止画の形式で撮影することのできるカメラであり、広角光学系で構成された広角カメラであることが好ましい。例えば、通常の内視鏡の画角が80°程度であることに対し、本実施形態に係る撮像部104の画角は140°であってもよい。なお、撮像部104の画角は80°を超えていれば140°よりも小さくてもよいし、140°以上であってもよい。また、撮像部104は、撮像した画像に対応する電気信号(画像信号)を制御装置300等に送信することができる。なお、図4において、撮像部104は内視鏡ロボットアームシステム100に含まれる必要はなく、アーム部102に支持されていればその態様は限定されない。さらに、アーム部102は、鉗子5023等の医療用器具を支持していてもよい。
 また、本開示の実施形態においては、撮像部104は、測距することが可能なステレオ方式の内視鏡であってもよい。もしくは、本開示の実施形態においては、撮像部104とは別個に、パルス光の反射を用いて測距を行うToF(Time of Flight)方式や、格子状のパターン光を照射して測距を行うストラクチャードライト方式のdepthセンサが設けられていてもよい。
 さらに、光源部106は、撮像部104が撮像対象物に光を照射する。光源部106は、例えば、広角レンズ用のLED(Light Emitting Diode)で実現することができる。光源部106は、例えば、通常のLEDと、レンズとを組み合わせて構成し、光を拡散させてもよい。また、光源部106は、光ファイバ(ライトガイド)で伝達された光をレンズで拡散させる(広角化させる)構成であってもよい。また、光源部106は、光ファイバ自体を複数の方向に向けて光を照射することで照射範囲を広げてもよい。なお、図4において、光源部106は必ずしも内視鏡ロボットアームシステム100に含まれる必要はなく、被写体に照射光を与えることができればその態様は限定されるものではない。
 (学習装置200)
 学習装置200は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、上記内視鏡ロボットアームシステム100を自律動作させるための自律動作制御情報を生成する際に用いられる学習モデルを生成する装置である。また、本開示の実施形態で使用する学習モデルは、各種の入力情報が有する特徴に基づいて、入力情報の分類や分類結果に応じた処理を行う学習済みモデルの学習を行うことで生成される。学習モデルは、入力層と、複数の中間層(隠れ層)と、出力層とを含む複数のノードを有する多層のニューラルネットワークであるDNN(Deep Neural Network)等により実現されてもよい。例えば、学習モデルの生成は、まず、入力層を介して各種の入力情報が入力され、直列に接続された複数の中間層において入力情報が有する特徴の抽出処理等を行う。次に、出力層を介して、中間層が出力した情報に基づく分類結果等の各種処理結果を入力された入力情報に対応する出力情報として出力することによって、学習モデルを生成することができる。しかしながら、本開示の実施形態においては、これに限定されるものではない。
 なお、学習装置200の詳細構成については後述する。また、学習装置200は、上述した、図4に示す内視鏡ロボットアームシステム100、制御装置300、提示装置500、執刀医側装置600、患者側装置610のうちの少なくともいずれか1つと一体の装置であってもよく、別体の装置であってもよい。もしくは、学習装置200は、クラウド上に設けられ、内視鏡ロボットアームシステム100、制御装置300、提示装置500、執刀医側装置600、患者側装置610と通信可能に接続された装置であってもよい。
 (制御装置300)
 制御装置300は、上述した学習装置200で生成した学習モデルに基づいて、内視鏡ロボットアームシステム100の駆動を制御する。制御装置300は、例えば、CPUやMPU等によって、後述する記憶部に記憶されたプログラム(例えば、本開示の実施形態に係るプログラム)がRAM(Random Access Memory)等を作業領域として実行されることにより実現される。また、制御装置300は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
 なお、制御装置300の詳細構成については後述する。また、制御装置300は、上述した、図4に示す内視鏡ロボットアームシステム100、学習装置200、提示装置500、執刀医側装置600、患者側装置610のうちの少なくともいずれか1つと一体の装置であってもよく、別体の装置であってもよい。もしくは、制御装置300は、クラウド上に設けられ、内視鏡ロボットアームシステム100、学習装置200、提示装置500、執刀医側装置600、患者側装置610と通信可能に接続された装置であってもよい。
 (提示装置500)
 提示装置500は、各種の画像を表示する。提示装置500は、例えば、撮像部104によって撮像された画像を表示する。提示装置500は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)または有機EL(Organic Electro-Luminescence)ディスプレイ等を含むディスプレイであることができる。なお、提示装置500は、上述した、図4に示す内視鏡ロボットアームシステム100、学習装置200、制御装置300、執刀医側装置600、患者側装置610のうちの少なくともいずれか1つと一体の装置であってもよい。もしくは、提示装置500は、内視鏡ロボットアームシステム100、学習装置200、制御装置300、執刀医側装置600、患者側装置610のうちの少なくともいずれか1つと、有線又は無線で通信可能に接続された、別体の装置であってもよい。
 (執刀医側装置600)
 執刀医側装置600は、執刀医5067の近傍に設置される装置であって、詳細には、例えば、ユーザーインタフェース(UI)602であることができる。詳細には、UI602は、執刀医の入力を受け付ける入力装置である。より具体的には、UI602は、執刀医5067からのテキスト入力を受け付ける操作スティック(図示省略)、ボタン(図示省略)、キーボード(図示省略)、フットスイッチ(図示省略)、タッチパネル(図示省略)、マスターコンソール(図示省略)や、執刀医5067からの音声入力を受け付ける収音装置(図示省略)であることができる。また、UI602は、執刀医5067の視線を検出する視線センサ(図示省略)、執刀医5067の動作を検出するモーションセンサ(図示省略)等を含み、執刀医5067の視線の動きや動作による入力を受け付けてもよい。
 (患者側装置610)
 患者側装置610は、例えば、患者(図示省略)の身体に装着された装置(ウェアラブルデバイス)であって、詳細には、例えば、センサ612であることができる。詳細には、センサ612は、患者の生体情報を検出するセンサであり、例えば、患者の身体の一部に直接的に装着され、患者の、心拍、脈拍、血圧、血中酸素濃度、脳波、呼吸、発汗、筋電位、皮膚温度、皮膚電気抵抗等を測定する各種センサであることができる。また、センサ612は、撮像装置(図示省略)を含んでもよく、この場合、当該撮像装置によって、患者の脈拍、表情筋の動き(表情)、眼球運動、瞳孔径の大きさ、視線等の情報を含むセンシングデータを取得してもよい。さらに、センサ612は、モーションセンサ(図示省略)を含んでもよく、例えば、患者の、頭の動きや姿勢、身体の揺れ等の情報を含むセンシングデータを取得することができる。
 <<3. 本開示の実施形態を創作するに至る背景>>
 ところで、先に説明したように、上述した医療用観察システム10においては、内視鏡ロボットアームシステム100を自律的に動作させるための開発が進められている。詳細には、医療用観察システム10における内視鏡ロボットアームシステム100の自律的動作は、様々な段階にレベル分けすることができる。例えば、執刀医(術者)5067をシステムによってガイドするレベル、システムによって、撮像部104の位置を移動させる、術部の縫合を行う等といった手術における一部の動作(タスク)を自律的に実行するレベルを挙げることができる。さらには、システムによって手術における動作内容を自動生成し、自動生成した動作から医師が選択した動作を内視鏡ロボットアームシステム100が行うレベル等を挙げることができる。そして、将来的には、医師の監視下、もしくは、医師の監視なしに、内視鏡ロボットアームシステム100が手術における全てのタスクを実行するレベルも考えられる。
 以下に説明する本開示の実施形態においては、内視鏡ロボットアームシステム100が、スコピストの代わりに、撮像部104の撮影位置を移動させるタスク(スコープワーク)を自律的に実行し、執刀医5067が、移動させた撮像部104による画像を参照して、直接的に手術、又は、遠隔操作により手術を行う場合での利用を想定している。例えば、内視鏡手術においては、適切でないスコープワークは、執刀医5067の疲労や画面酔い等、執刀医5067への負担増加につながる。さらに、スコープワークのスキル自体の難しさや熟練者不足の問題もあることから、内視鏡ロボットアームシステム100によって適切にスコープワークを自律的に行うことが求められている。そのため、内視鏡ロボットアームシステム100の自律的動作のために、適切なスコープワーク(動作)のモデルを獲得することが求められる。
 しかしながら、スコープワークは、執刀医5067等によって好みや程度感が異なるため、スコープワークの正解がわかり難い。言い換えると、スコープワークの良し悪しは、人(執刀医5067やスコピスト等)の感性に関わるため、スコープワークの良さを定量的に評価して、適切なスコープワークをモデル化することが難しい。そこで、学習器に、手術内容等とそれに対応する執刀医5067の手術動作やスコピストのスコープワーク等の動作に関するデータを大量に入力し、機械学習させることにより、適切なスコープワークの学習モデルを生成することが考えられる。
 しかしながら、患者ごとに体型、臓器形態、臓器位置等が異なることから、臨床において、より広い範囲の状況を網羅するスコープワークの動作データ(ただし、当該動作データには、アーム部102の動作や、患者の臓器計上、臓器位置等を示す情報が含まれる)を取得することは現実的には難しい。加えて、医療現場においては、使用することができる機器や時間に制約があり、さらに、患者のプライバシーを保護する必要があることから、スコープワークの動作データを大量に取得することは難しい。
 そこで、上述のような状況を鑑みて、本発明者は、より広い範囲の状況を網羅する学習モデルを獲得するために、機械学習の1つの手法である強化学習を用いることを着想した。ここで、機械学習の各手法について、説明する。
 機械学習の手法としては、例えば、教師あり学習、教師なし学習、強化学習等、複数の異なる手法を挙げることができる。
 詳細には、教師あり学習では、予め、入力データと、入力データに対する望ましい出力データ(正解となるデータ)(教師データ)との組み合わせを複数用意して、当該組み合わせを再現することができるような入力データと教師データとの関係を導き出すように、これらデータについて、学習器(判定部)は、機械学習を行う。例えば、教師あり学習は、所定の期間におけるアーム部102の動作や状態を入力データとして、次の動作(望ましい出力データ)を予測するための学習モデルを獲得するために用いられる。
 次に、教師なし学習によって生成されたモデルでは、望ましい出力データ(正解となるデータ)を定義することなく、入力データ間の類似する特徴量を抽出することができる。当該教師なし学習は、データ群から類似するデータをクラスタリングしたり、データ構造を抽出したりする際に用いられる。
 また、強化学習は、入力データに対する望ましい出力データ(正解となるデータ)を獲得するために用いられるという点では、上述の教師あり学習と類似する。しかしながら、強化学習においては、教師あり学習のように、入力データと、入力データに対する望ましい出力データ(教師データ)との組み合わせを用いて学習を行うのではなく、代わりに3つの要素(状態(state)、行動(action)、報酬(reward))を用いて試行錯誤による学習を行う。詳細には、強化学習においては、エージェント(例えば、アーム部102)が、ある「状態」において、ある「行動」を行ったときに、その行動が正解であれば「報酬」を与えるといった処理を繰り返す。そして、強化学習においては、与えられる報酬が多くなるように試行錯誤を繰り返すことにより、様々な「状態」における適切な「行動」を決定することができる学習モデルを獲得することができる。
 より具体的な例を挙げて、強化学習を説明する。ここで、例として、回転一自由度を持つ倒立振子が搭載された台車型ロボットが、当該倒立振り子が倒立状態を保つような動作を行うことを可能にする学習モデルの獲得を考える。上記台車型ロボットには、当該台車型ロボット自身の速度、加速度、及び倒立振子の角度をリアルタイムで取得できるセンサが備わっているものとする。このような場合、強化学習を行う学習器には、台車型ロボットの速度、加速度、及び倒立振子の角度の3つのセンシングデータが「状態」として入力される。そして、当該学習器は、入力された「状態」に基づいて、台車型ロボットの次なる加速度を「行動」として出力する。この際、行動の決定は、確率に基づいた選択によって行われる。すなわち、同じ「状態」が入力された場合であっても、学習器により、毎回同じ「行動」が選択されるとは限らないことになり、これによって試行錯誤が発生することになる。さらに、学習器によって選択された「行動」は、上記台車型ロボットによって実行され、「状態」はさらに変化することになる。
 また、この例においては、望ましい「状態」、すなわち倒立振り子が倒立した状態になると「報酬」(価値)が高くなるように、「状態」に与えられる「報酬」が設計されている。例えば、倒立振り子が倒立状態であれば報酬値が100となり、倒立振り子が倒立状態から1度ずれる毎に20ずつ報酬値が減じられていくように、「報酬」が設計されている。そこで、現在の「状態」において選択可能な様々な「行動」によって生じる「状態」に与えられる「(即時)報酬」がわかっていることから、学習器は、現在の「状態」において選択可能な「行動」によって得られると期待される将来に渡る報酬の総量を最大化するように、次の「行動」を選択する。そして、学習器は、このような試行錯誤を繰り返すことにより、将来に得らえる報酬の総量を最大化する「行動」が選択されやすくなるように強化する学習を行うこととなる。
 このように、強化学習では、正解となるデータを教師データとして予め準備するのではなく、「行動」の結果によって将来的に与えられる「報酬」の総量を最大にするような「行動」を出力する学習モデルを獲得する点が、教師あり学習と異なる点である。
 本発明者が創作した本開示の実施形態においては、上述のような強化学習を用いることにより、より広い範囲の状況を網羅する学習モデルを獲得することができる。しかしながら、倒立振子が搭載された台車型ロボットの例においては、その正解の「状態」が明確であることから、「報酬」を定義することは容易である。一方、スコープワークは、先に説明したように、執刀医5067等によって好みや程度感が異なるため、その正解の「状態」がわかり難い。従って、適切なスコープワークのための「報酬」を定義することは容易ではない。従って、単に、強化学習を用いるだけでは、適切なスコープワークの自律動作のための学習モデルを獲得することができない。
 そこで、本発明者は、強化学習のための「報酬」の定義を機械学習によって獲得することを独自に着想した。本発明者の創作した本開示の実施形態においては、まずは、学習器に、例えば、臨床におけるスコープワークにおける動作のデータと、その際に得られる内視鏡の位置等の状態データとを、それぞれ入力データ(第1の入力データ)と教師データ(第1の教師データ)として入力し、教師あり学習を行うことで、適切なスコープワークの自律動作のための学習モデルを生成する。次に、本実施形態においては、学習器に、臨床におけるスコープワークにおける動作のデータと、それに対する評価スコアとを、それぞれ入力データ(第2の入力データ)と教師データ(第2の教師データ)として入力し、教師あり学習を行うことで、スコープワークに与えられる「報酬」を定義する学習モデルを生成する。さらに、本実施形態においては、例えば仮想臨床データである入力データ(第3の入力データ)を入力された「報酬」を定義する学習モデルによって得られる「報酬」を用いて、適切なスコープワークの自律動作のための学習モデルを強化する強化学習を行う。すなわち、本実施形態によれば、教師あり学習と強化学習とを組み合わせることにより、少ない臨床データしか得られない場合であっても、より広い範囲の状況を網羅しつつ、人の感性をも考慮したスコープワークを自律的に行うための学習モデルを効率的に取得することができる。以下、本発明者が創作した本開示の実施形態の詳細を順次説明する。
 なお、本明細書においては、実際に、医師が患者の術部を手術した際に取得される臨床データに対して、仮想臨床データとは、様々な症例や臓器の位置、形状等の条件の下で手術シミュレーションを実施した際に取得されるデータを意味する。
 <<4. 実施形態>>
 <4.1 学習装置200の詳細構成>
 まずは、図5を参照して、本開示の実施形態に係る学習装置200の詳細構成例について説明する。図5は、本実施形態に係る学習装置200の構成の一例を示すブロック図である。当該学習装置200は、内視鏡ロボットアームシステム100を自律動作させるための制御に用いられる学習モデルを生成、強化することができる。詳細には、図5に示すように、学習装置200は、情報取得部210と、機械学習部(第1の判定部)222と、機械学習部(第2の判定部)224と、強化学習部230と、記憶部240と、出力部250とを主に有する。以下に、学習装置200の各機能部の詳細について順次説明する。
 (情報取得部210)
 情報取得部210は、上述した、内視鏡ロボットアームシステム100や、UI602及びセンサ612から、内視鏡ロボットアームシステム100の状態、執刀医5067等からの入力情報、患者(図示省略)の状態等に関する各種データを取得することができる。さらに、情報取得部210は、後述する機械学習部222及び機械学習部224に取得したデータを出力する。
 本実施形態においては、データとしては、例えば、撮像部104で取得した画像等の画像データを挙げることができる。本実施形態においては、情報取得部212が取得するデータには、少なくとも画像データが含まれていることが好ましい。なお、本実施形態においては、画像データは、実際の手術した際に取得した画像のデータ(臨床データ)であることが好ましいが、これに限定されるものではなく、例えば、医療用ファントム(模型)を用いた模擬手術に際に取得した画像データ(疑似臨床データ)でもよく、もしくは、3次元グラフィックス等で表現される手術シミュレータで取得した画像データ(仮想臨床データ)であってもよい。さらに、本実施形態においては、画像データには、必ずしも医療用器具(図示省略)又は臓器の画像が含まれていることに限定されるものではなく、例えば、医療用器具の画像だけ、もしくは、臓器の画像だけが含まれていてもよい。また、本実施形態においては、画像データは、撮像部104が取得した生データに限定されるものではなく、例えば、撮像部104が取得した生データに対して処理(輝度や彩度の調整処理や、画像から医療用器具又は臓器の位置・姿勢・種類の情報(術部情報)を抽出する処理や、セマンティックセグメンテーション等)を施すことで得られたデータであってもよい。加えて、本実施形態においては、画像データに、認識又は推定した手術のシーケンスやコンテキスト等の情報(例えば、メタデータ)を紐づけてもよい。さらに、本実施形態においては、データには、撮像部104で取得した画像に対応する撮像条件(例えば、フォーカス、撮像エリア、撮像方向等)の情報が含まれていてもよい。
 なお、本明細書においては、上記臨床データとは、実際に、医師が患者の術部を手術した際に取得されたデータを意味する。また、上記疑似臨床データとは、医療用ファントム(模型)等を用いて医師等が模擬手術を行った際に取得されるデータを意味する。また、上記仮想臨床データとは、先に説明したように、様々な症例や臓器の位置、形状等の条件の下で手術シミュレーションを実施した際に取得されるデータを意味する。
 また、本実施形態においては、データとしては、例えば、アーム部102の先端部や関節部(図示省略)、撮像部104の撮影位置、姿勢等の情報であってもよい。本実施形態においては、このようなデータは、スコピストによる手動操作又は自律動作の際に内視鏡ロボットアームシステム100のアーム部102に含まれる関節部5033やリンク5035(複数の要素)による関節角やリンク長に基づいて、取得することができる。もしくは、本実施形態においては、上記データは、内視鏡ロボットアームシステム100に設けられたモーションセンサから取得してもよい。なお、内視鏡ロボットアームシステム100の手動操作としては、スコピストがUI602に対して操作を行う方法でもよく、もしくは、スコピストがアーム部102の一部を直接的に物理的に把持して力を加えることで、アーム部102がその力にしたがって受動的に動作する方法であってもよい。さらに、本実施形態においては、データとしては、アーム部102に支持された医療用器具(図示省略)の種類、位置、姿勢等であってもよい。なお、本実施形態においては、上述のデータは、実際の手術した際に取得したデータ(臨床データ)であることが好ましいが、当該データには、疑似臨床データや、仮想臨床データも含まれていてもよい。
 さらに、本実施形態においては、データとしては、術部となる臓器の位置、姿勢等の情報や、術部全体の位置情報(例えば、Depth情報)、より具体的には、術部である臓器と医療用器具の位置関係を示す情報であってもよい。
 また、本実施形態においては、データとしては、例えば、患者(図示省略)の生体情報(患者情報)であってもよい。より具体的には、生体情報としては、患者の、視線、瞬き、心拍、脈拍、血圧、毛中酸素量、脳波、呼吸、発汗、筋電位、皮膚温度、皮膚電気抵抗、発話音声、姿勢、動作(例えば、頭や体の揺れ)等を挙げることができる。これら生体情報は、内視鏡下手術において記録されることが一般的な臨床データであることが好ましい。
 さらに、本実施形態においては、データとしては、例えば、スコープワークに対する評価スコアであってもよい。より具体的には、評価スコアは、執刀医5067、スコピスト等の医療従事者(ユーザ)がUI602を介して入力した、スコープワークに対する主観評価スコアであってもよい。例えば、医師等の専門家が、スコープワーク(例えば、撮像部104による画像)を精査して、Nilssonスコアのような、医療分野においてスコピストのスコープワークや能力をスコア付けする際に用いられる評価尺度(例えば、段階的数値によって評価を表現する)に基づいて、スコープワークに対する評価を入力することにより、主観評価スコアを取得することができる。本実施形態においては、このような評価尺度を用いることにより、医療従事者の感性に基づく評価(主観評価)の情報を取得することができる。なお、本実施形態においては、評価尺度は、Nilssonスコアといった従来から存在する評価尺度に限定されるものではなく、新たに独自に定めた評価尺度であってもよく、特に限定されるものではない。
 (機械学習部222、機械学習部224)
 機械学習部222及び機械学習部224は、上述した情報取得部210から出力されたデータを用いて機械学習を行うことにより、内視鏡ロボットアームシステム100を自律動作させるための、自律動作制御モデル及び報酬モデルを生成することができる。そして、機械学習部222及び機械学習部224は、生成した自律動作制御モデル及び報酬モデルを後述する強化学習部230へ出力する。生成された報酬モデルは、強化学習部230において、生成された自律動作制御モデルを強化学習する際に用いられる。
 機械学習部222及び機械学習部224は、例えば、サポートベクターレグレッションやディープニューラルネットワーク(DNN)等の教師あり学習を行う学習器であるものとする。また、本実施形態においては、機械学習部222及び機械学習部224は、より解析的な扱いが可能なガウス過程回帰(Gaussian Process Regression)モデル、決定木(decision tree)、ファジィルール等の構造を用いた回帰的手法のアルゴリズムを用いてもよく、特に限定されるものではない。
 詳細には、機械学習部222は、アーム部102の先端部や関節部(図示省略)、撮像部(内視鏡)104の撮影位置、姿勢、アーム部102に支持された医療用器具の種類、位置、姿勢、臓器の位置・姿勢、撮像部104で取得した画像(例えば、内視鏡画像)、臓器と医療器具の位置関係を示す情報(Depth情報)、患者の生体情報(バイタルサイン)等を入力データ(第1の入力データ)として取得する。さらに、機械学習部222は、撮像部(内視鏡)104の撮影位置、姿勢、撮像部104の撮像エリア、撮像方向等を教師データとして取得する。機械学習部222に入力されるデータは、臨床において取得される臨床データであることが好ましいが、当該データには、疑似臨床データや、仮想臨床データも含まれていてもよい。そして、機械学習部222は、このような入力データと教師データとを機械学習することにより、内視鏡ロボットアームシステム100を自律動作させるための自律動作制御モデルを生成する。当該自律動作制御モデルは、入力データに応じて、内視鏡ロボットアームシステム100の動作に係る情報(アーム部102の先端、又は、撮像部104の位置、姿勢、速度、角速度、加速度、各加速度及び画像の撮像条件(例えば、被写体(例えば、医療用器具)、撮像エリア、撮像方向等)等に関する情報)を出力することができる。
 例えば、機械学習部222は、撮像部(内視鏡)104の撮影位置、姿勢を入力データとして用いることにより、現在の撮像部104の状態に基づく、次の撮像部104の撮影位置等を決定するための学習モデルを獲得することができる。また、機械学習部222は、医療用器具の種類、位置、姿勢を入力データとして用いることにより、処置(例えば、術式)に応じた、撮像部104の撮像エリア等を決定するための学習モデルを獲得することができる。また、機械学習部222は、臓器の位置を入力データとして用いることにより、臓器に応じた撮像部104の撮像エリア等を決定するための学習モデルを獲得することができる。また、機械学習部222は、臓器と医療器具の位置関係を示す情報を入力データとして用いることにより、当該位置関係の違いによる次の処置を予測し、適切な撮影距離等を決定するための学習モデルを獲得することができる。さらに、機械学習部222は、患者の生体情報の入力データとして用いることにより、患者の状態に応じて処置を決定するための学習モデルを獲得することができる。
 機械学習部224は、撮像部104で取得した画像データ(例えば、内視鏡画像)、患者の生体情報(バイタルサイン)等を入力データ(第2の入力データ)として取得する。さらに、機械学習部224は、スコープワークに対する主観評価結果(スコア)(評価スコア)を教師データとして取得する。そして、機械学習部224は、このような入力データと教師データとを機械学習することにより、内視鏡ロボットアームシステム100の動作(スコープワーク)に対して評価(スコア)を与える報酬モデルを生成する。本実施形態においては、機械学習部224に入力される入力データは、内視鏡下手術であれば一般的に記録のために取得される臨床データであることから、入力されるデータの収集は容易であり、医療現場の負担になることはない。また、本実施形態においては、機械学習部224に入力される教師データである評価スコアについても、スコピストの評価を行うために内視鏡下手術であれば一般的に記録される臨床データであり、評価する立場の医師等も慣れている指標を用いることにより、データの収集を容易にし、医療現場の負担の増加を抑えることができる。従って、本実施形態に係る報酬モデルを生成するための機械学習においては、収集が容易であることから、多量のデータを用いての学習を実現することが可能である。
 (強化学習部230)
 強化学習部230は、上記報酬モデルを用いて、強化学習部230において上記自律動作制御モデルを強化学習する。強化学習は、先に説明したように、状態、動作(行動)、報酬の3つの要素を用いた学習手法であり、ある状態において、ある動作を実行した場合に、当該動作が正解であれば報酬を与えるといった処理を繰り返すことで、様々な状態における最適な動作を学習させる手法である。
 詳細には、図5に示すように、強化学習部230は、シミュレータ部232と、評価部234と、更新部236とを有する。具体的には、シミュレータ部232は、機械学習部222から出力された自律動作制御モデルを用いて、様々なシミュレーション条件(例えば、様々な症例における術部の情報や患者の生体情報)における、内視鏡ロボットアームシステム100の動作に係る情報(自律動作)(例えば、アーム部102の先端、又は、撮像部104の位置、姿勢、速度、角速度、加速度、各加速度及び画像の撮像条件(例えば、被写体(例えば、医療用器具)、撮像エリア、撮像方向等)を決定する(仮想臨床データを取得する)。そして、シミュレータ部232は、決定に係る情報を、評価部234へ出力する。次に、評価部234は、機械学習部224から出力された報酬モデルを用いて、ある条件(状態)における内視鏡ロボットアームシステム100の動作(第3の入力データ)に対する報酬を決定する。さらに、更新部236は、将来に渡る報酬の総量を最大化するように、次の内視鏡ロボットアームシステム100の動作を決定(更新)し、シミュレータ部232に出力する。さらに、シミュレータ部232は、更新された動作の結果である状態の情報(例えば、アーム部102の先端、又は、撮像部104の位置、姿勢、及び画像データ等)を評価部234へ出力する。さらに、評価部234は、出力された状態に基づき、内視鏡ロボットアームシステム100の動作に対する報酬を決定する。
 すなわち、本実施形態においては、強化学習部230は、初期状態として、機械学習部222から取得した自律動作制御モデルを用いて、内視鏡ロボットアームシステム100の動作を決定するものの、その後、報酬モデルを用いることにより、内視鏡ロボットアームシステム100の動作を更新する。
 本実施形態においては、機械学習部224によって得られた「報酬」を定義する報酬モデルによって得られる「報酬」を用いて、適切なスコープワークの自律動作のための学習モデルを強化する強化学習を行うことができる。すなわち、本実施形態によれば、教師あり学習と強化学習とを組み合わせることにより、少ない臨床データしか得られない場合であっても、より広い範囲の状況を網羅しつつ、人の感性をも考慮したスコープワークを自律的に行うための学習モデルを効率的に取得することができる。
 なお、本実施形態においては、強化学習部230は、例えば、ディープニューラルネットワーク(DNN)等の強化学習手法に限定されるものではなく、既知の他の強化学習手法(Q学習、Sarsa、モンテカルロ法、Actor-Critic)を用いてもよい。
 (記憶部240)
 記憶部240は、各種の情報を格納することができる。記憶部240は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
 (出力部250)
 出力部250は、強化学習部230から出力された学習モデル(自律動作制御モデル)を後述する制御装置300へ出力することができる。
 なお、本実施形態においては、学習装置200の詳細構成は、図5に示す構成に限定されるものではない。本実施形態においては、学習装置200は、例えば、情報取得部212から出力された複数のデータから、例えば、画像解析等を用いることにより、執刀医5067が使用する医療用器具(図示省略)の、種類、位置、姿勢等を認識する認識部(図示省略)を有していてもよい。さらに、学習装置200は、例えば、情報取得部212から出力された複数のデータから、例えば、画像解析等を用いることにより、執刀医5067が処置する術部の、臓器の種類、位置、姿勢等を認識する認識部(図示省略)を有していてもよい。
 <4.2 自律動作制御モデルの生成方法>
 次に、図6及び図7を参照して、本実施形態に係る自律動作制御モデルの生成方法について説明する。図6は、本実施形態に係るモデルの生成方法の一例を示すフローチャートであり、図7は、本実施形態に係る自律動作制御モデルの生成方法の一例を説明するための説明図である。詳細には、図6に示すように、本実施形態に係る自律動作制御モデルの生成方法は、ステップS101からステップS103までの複数のステップを含む。以下に、これら各ステップの詳細について説明する。
 まずは、学習装置200は、図7に示すように、内視鏡ロボットアームシステム100や、センサ612から、内視鏡ロボットアームシステム100の状態や患者(図示省略)の状態等に関する各種データを取得する(ステップS101)。
 そして、学習装置200は、図7に示すように、上記ステップS101で取得したデータのうち、例えば、撮像部(内視鏡)104の撮影位置、姿勢、医療用器具の位置、姿勢、臓器の位置・姿勢、撮像部104で取得した画像データ(例えば、内視鏡画像)、患者の生体情報(バイタルサイン)等を入力データ(第1の入力データ)として、撮像部(内視鏡)104の撮影位置、姿勢、撮像エリア、撮像方向等を教師データとして、機械学習を行う(ステップS102)。詳細には、学習装置200は、例えば、複数の臨床データにおける撮像部(内視鏡)104の3次元位置(x,y,z)の情報と、それぞれの確からしさを示す分散(σ 、σ 、σ )とを取得し、上記分散が微小な(ほぼゼロに近い)3次元位置の情報を教師データとして、当該教師データに紐づけられた入力データとを用いて機械学習を行う。
 そして、学習装置200は、自律動作制御モデルを出力する(ステップS103)。自律動作制御モデルは、例えば、撮像部(内視鏡)104の撮影位置、姿勢、撮像エリア、撮像方向等に関する情報を出力することができる。詳細には、自律動作制御モデルは、例えば、撮像部(内視鏡)104の3次元位置(x,y,z)の情報と、その確からしさを示す分散(σ 、σ 、σ )とを出力することができる。
 なお、本実施形態においては、撮像部(内視鏡)104の姿勢については、撮像部104が前方直視鏡である場合には、患部周辺の体内によって拘束されるため、考慮しなくてもよい。撮像部104が、一方先端部が自由に湾曲することにより視野を可変することができる先端湾曲機能付きの内視鏡(図示省略)である場合には、撮像部(内視鏡)104の姿勢の情報を追加することが好ましい。
 また、本実施形態においては、自律動作制御モデルの生成の際の入力データ及び教師データは、上述したデータに限定されるものではなく、それぞれ複数のデータを組み合わせて用いてもよい。また、自律動作制御モデルからの出力されるデータも上述したデータに限定されるものではない。
 <4.3 報酬モデルの生成方法>
 次に、本実施形態に係る報酬モデルの生成方法を説明する。なお、報酬モデルを生成する学習装置200は、図5を用いて説明した本実施形態に係る学習装置200と同様であるため、ここではその説明を省略する。
 まずは、図6及び図8を参照して、本実施形態に係る報酬モデルの生成方法について説明する。図8は、本実施形態に係る報酬モデルの生成方法の一例を説明するための説明図である。詳細には、図6に示すように、本実施形態に係る報酬モデルの生成方法は、自律動作制御モデルの生成と同様に、ステップS101からステップS103までの複数のステップを含む。以下に、本実施形態に係るこれら各ステップの詳細について説明する。
 まずは、学習装置200は、図8に示すように、内視鏡ロボットアームシステム100や、UI602及びセンサ612から、撮像部104で取得した画像データ(例えば、内視鏡画像)等を入力データ(第2の入力データ)と、スコープワークに対する評価スコアとを、例えば数百件分、取得する(ステップS101)。なお、本実施形態においては、撮像部104で取得した画像データと、それに紐づけられたニルソンスコア等の評価スコアとの組を少なくとも取得することが好ましい。当該画像データは、内視鏡下手術において、比較的取得しやすいデータであり、自律動作制御モデルの生成の際にも取得することから、本実施形態においては、画像データを用いて報酬モデルを生成することが好ましい。また、ニルソンスコア等も、比較的よく用いられている指標であるため、医師の負担を低減することができる。
 そして、学習装置200は、図8に示すように、上記ステップS101で取得したデータのうち、撮像部104で取得した画像データ(例えば、内視鏡画像)、患者の生体情報(バイタルサイン)等を入力データ(第2の入力データ)として、スコープワークに対する評価スコアを教師データとして、機械学習を行う(ステップS102)。
 そして、学習装置200は、報酬モデルを出力する(ステップS103)。詳細には、当該報酬モデルは、図8に示すように、スコープワークに対する評価スコアを出力することができる。
 なお、本実施形態においては、報酬モデルの生成の際の入力データは、上述したデータに限定されるものではなく、複数のデータを組み合わせて用いてもよい。
 以上のように、本実施形態においては、比較的取得が容易な臨床データを用いて、人の感性を反映させた「報酬」モデルを教師あり学習により生成することができる。従って、本実施形態によれば、以下に説明するように、当該報酬モデルを用いて強化学習を行うことが可能になることから、人の感性が反映された自律動作を可能にする学習モデルを獲得することができる。
 <4.4 自律動作制御モデルの強化方法>
 次に、本実施形態に係る自律動作制御モデルの強化方法を説明する。なお、自律動作制御モデルの強化を行う学習装置200は、図5を用いて説明した本実施形態に係る学習装置200と同様であるため、ここではその説明を省略する。
 まずは、図9及び図10を参照して、本実施形態に係る自律動作制御モデルの強化方法について説明する。図9は、本実施形態に係る強化学習の一例を示すフローチャートであり、図10は、本実施形態に係る強化学習の一例を説明するための説明図である。詳細には、図9に示すように、本実施形態に係る自律動作制御モデルの強化方法は、ステップS201からステップS204までの複数のステップを含む。以下に、これら各ステップの詳細について説明する。
 まずは、学習装置200は、シミュレーションを実行するにあたり、シミュレーション条件として、様々な症例のデータを取得する(ステップS201)。例えば、学習装置200は、患者の体形や臓器の大きさ、硬さ、内臓脂肪の量等の違いを考慮したデータを取得する。
 次に、学習装置200は、自律動作制御モデルを用いて、シミュレーションを行う(ステップS202)。詳細には、学習装置200は、上述のステップS201で取得したデータによるシミュレーション条件における、内視鏡ロボットアームシステム100の動作に係る情報(自律動作)(例えば、撮像部(内視鏡)104の撮像位置、姿勢、医療用器具(図示省略)の位置、姿勢等)を決定する。そして、学習装置200は、シミュレーションにより、内視鏡ロボットアームシステム100の動作の結果である状態の情報(例えば、撮像部(内視鏡)104の撮像位置、姿勢、医療用器具(図示省略)の位置、姿勢、臓器の位置、撮像部(内視鏡)による画像データ、患者のバイタルサイン)を取得する。
 次に、学習装置200は、報酬モデルを用いて、内視鏡ロボットアームシステム100の動作(仮想臨床データ)に対して評価(報酬)を決定する(ステップS203)。
 そして、学習装置200は、将来に渡る報酬の総量を最大化するように、次の内視鏡ロボットアームシステム100の動作を決定(更新)する(ステップS204)。
 学習装置200は、例えば、方策勾配法を用いて、ニューラルネットワークによる強化学習を行うことができる。詳細には、本実施形態においては、方策勾配法を用いることで、ある時点での、内視鏡ロボットアームシステム100の動作を定義することができる。具体的には、内視鏡ロボットアームシステム100の動作の確率を示す方策関数π(a|s)とした場合、状態sを入力として、選択し得る次の行動確率をaとする(自由度が3である場合には、3つの自由度のそれぞれに対する確率が示される)。従って、方策関数自体がニューラルネットワーク構造を有していることから、ニューラルネットワークのパラメータθ(重みやバイアス)とした場合、パラメータθは、方策勾配法を用いて以下の数式(1)により更新することができる。
Figure JPOXMLDOC01-appb-M000001
 なお、αは学習率を示し、J(θ)は、最適化したい目的関数となり、累積報酬(報酬の総量)の期待値に相当する。Qπθ(s,a)は、状態sで選択することができる行動aの価値を示す。なお、方策関数π(a|s)は、平均と分散とで表現される正規分布関数として扱うことが可能である。
 なお、数式(1)を用いた更新においては、微分値∇θJ(θ)が必要とされるが、方策勾配定理を用いて、以下の数式(2)で近似することができる。なお、ここでrは、上述した報酬モデルによって得られるスコアであるものとする。
Figure JPOXMLDOC01-appb-M000002
 以上のように、本実施形態においては、強化学習を用いることにより、臨床にて得られるデータが少ない場合であっても、より広い範囲の状況を網羅する学習モデルを獲得することができる。さらに、本実施形態においては、評価スコアを用いた教師あり学習によって得られた当該報酬モデルを使用して強化学習を行うことが可能になることから、人の感性が反映された自律動作を可能にする学習モデルを獲得することができる。すなわち、本実施形態によれば、教師あり学習と強化学習とを組み合わせることにより、少ない臨床データしか得られない場合であっても、より広い範囲の状況を網羅しつつ、人の感性をも考慮したスコープワークを自律的に行うための学習モデルを効率的に取得することができる。
 <4.5 制御装置300の詳細構成>
 次に、図11を参照して、本開示の実施形態に係る制御装置300の詳細構成例について説明する。図11は、本実施形態に係る制御装置300の構成の一例を示すブロック図である。当該制御装置300は、強化された自律動作制御モデルを用いて、内視鏡ロボットアームシステム100を自律制御することができる。詳細には、図11に示すように、制御装置300は、処理部310と、記憶部340とを主に有する。以下に、制御装置300の各機能部の詳細について順次説明する。
 (処理部310)
 処理部310は、図11に示すように、情報取得部312と、画像処理部314と、モデル取得部316と、制御部318と、出力部320とを主に有する。
 情報取得部312は、上述した、内視鏡ロボットアームシステム100や、UI202及びセンサ612から、内視鏡ロボットアームシステム100の状態(アーム部102や撮像部104の位置、姿勢、撮像部104の位置、姿勢等)や、医療用器具(図示省略)の位置、姿勢、臓器の位置、術部全体の位置情報(Depth情報)、患者(図示省略)の状態(バイタルサイン)等に関する各種データをリアルタイムで取得することができる。さらに、情報取得部312は、後述する画像処理部314及び制御部318に取得したデータを出力する。
 画像処理部314は、撮像部104によって撮像された画像に対して種々の処理を実行することができる。具体的には、例えば、画像処理部314は、撮像部104によって撮像された画像のうち表示対象領域を切り出して拡大することで新たな画像を生成してもよい。そして、生成された画像は、後述する出力部320を介して、提示装置500へ出力される。
 モデル取得部316は、学習装置200から強化された自律動作制御モデルを取得、格納して、後述する制御部318へ出力することができる。
 制御部318は、情報取得部312からのデータに基づき、取得した強化された自律動作制御モデルを用いて、アーム部102の駆動や撮像部104を制御したり(制御部318は、例えば、関節部のアクチュエータにおけるモータに対して供給される電流量を制御することにより、当該モータの回転数を制御し、関節部における回転角度及び発生トルクを制御する)、撮像部104の撮像条件(例えば、撮像エリア、方向、フォーカス、拡大率等)を制御したりするための、内視鏡ロボットアームシステム100に与える制御指令uを生成する。決定した制御指令は、後述する出力部320を介して、内視鏡ロボットアームシステム100に出力される。
 この際、制御部318は、例えば、強化された自律動作制御モデルにより分散値等の値が得られる場合には、分散値等に応じて、自律動作制御モデルにより得られた目標値を調整してもよい(例えば、安全のために動作速度を落とす等)。
 出力部326は、画像処理部314で処理された画像を提示装置500へ出力したり、制御部318から出力された制御指令を内視鏡ロボットアームシステム100に出力したりすることができる。
 (記憶部340)
 記憶部340は、各種の情報を格納することができる。記憶部340は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
 なお、本実施形態においては、制御装置300の詳細構成は、図11に示す構成に限定されるものではない。本実施形態においては、制御装置300は、例えば、情報取得部312から出力された複数のデータから、例えば、画像解析等を用いることにより、執刀医5067が使用する医療用器具(図示省略)の、種類、位置、姿勢等を認識する認識部(図示省略)を有していてもよい。さらに、制御装置300は、例えば、情報取得部312から出力された複数のデータから、例えば、画像解析等を用いることにより、執刀医5067が処置する術部の、臓器の種類、位置、姿勢等を認識する認識部(図示省略)を有していてもよい。なお、先に説明したように、本実施形態においては、制御装置300は、上述した、図4に示す内視鏡ロボットアームシステム100等と一体の装置であってもよく、別体の装置であってもよく、特に限定されるものではない。
 <4.6 制御方法>
 次に、図12及び図13を参照して、本実施形態に係る制御方法について説明する。図12は、本実施形態に係る制御方法の一例を示すフローチャートであり、図13は、本実施形態に係る制御方法を説明するための説明図である。詳細には、図12に示すように、本実施形態に係る制御方法は、ステップS301からステップS303までの複数のステップを含むことができる。以下に、これら各ステップの詳細について説明する。
 制御装置300は、内視鏡ロボットアームシステム100や、センサ612及びUI602を含む執刀医側装置600から、内視鏡ロボットアームシステム100の状態等に関する各種データをリアルタイムで取得する(ステップS301)。制御装置300は、ステップS301で取得されたデータに基づき、制御指令を算出、出力する(ステップS302)。次に、制御装置300は、ステップS302で出力された制御指令に基づき、内視鏡ロボットアームシステム100の制御を行う(ステップS303)。
 以上のように、本実施形態に係る制御方法においては、強化された自律動作制御モデルのみを用いて、内視鏡ロボットアームシステム100を制御することができる。
 <<5. まとめ>>
 以上のように、本開示の実施形態においては学習器に、臨床におけるスコープワークの動作と、その際に得られる状態のデータとを入力データと教師データとして入力し、教師あり学習を行うことで、自律的スコープワークのための学習モデルを生成する。次に、本実施形態においては、学習器に、スコープワークの動作に関するデータ(入力データ)と、それに対する評価データを教師データとして入力し、教師あり学習させることにより、適切なスコープワークに与えられる「報酬」を出力するための学習モデルを生成する。さらに、本実施形態においては、自律的スコープワークのための学習モデルと、「報酬」を出力させるための学習モデルとを用いて、強化学習を行う。すなわち、本実施形態においては、教師あり学習と強化学習とを組み合わせることにより、少ない臨床データしか得られない場合であっても、より広い範囲の状況を網羅しつつ、人の感性をも考慮したスコープワークを自律的に行うための学習モデルを効率的に取得することができる。
 なお、本開示の実施形態に係る「報酬」に係る学習モデルは、スコピストのスキルを認定する試験や内視鏡下手術におけるアセスメントに適用することも可能である。また、本開示の実施形態は、スコープワークに適用することに限定されるものではなく、例えば、アーム部102によって支持された医療用器具によって術部の縫合を行う等といった手術における一部の動作(タスク)を自律的に実行するような場合にも適用することができる。
 <<6. ハードウェア構成>>
 上述してきた各実施形態に係る学習装置200等の情報処理装置は、例えば図14に示すような構成のコンピュータ1000によって実現される。以下、本開示の実施形態に係る学習装置200を例に挙げて説明する。図14は、本開示の実施形態に係る学習装置200を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス1500、及び、入出力インターフェイス1600を有する。コンピュータ1000の各部は、バス1050によって接続される。
 CPU1100は、ROM1300又はHDD1400に保存されたプログラムに基づいて動作し、各部の制御を行う。例えば、CPU1100は、ROM1300又はHDD1400に保存されたプログラムをRAM1200に展開し、各種プログラムに対応した処理を実行する。
 ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるBIOS(Basic Input Output System)等のブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を保存する。
 HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、HDD1400は、プログラムデータ1450の一例である本開示に係る医療用アーム制御方法のためのプログラムを記録する記録媒体である。
 通信インターフェイス1500は、コンピュータ1000が外部ネットワーク1550(例えばインターネット)と接続するためのインターフェイスである。例えば、CPU1100は、通信インターフェイス1500を介して、他の機器からデータを受信したり、CPU1100が生成したデータを他の機器へ送信したりする。
 入出力インターフェイス1600は、入出力デバイス1650とコンピュータ1000とを接続するためのインターフェイスである。例えば、CPU1100は、入出力インターフェイス1600を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、CPU1100は、入出力インターフェイス1600を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス1600は、コンピュータ読み取り可能な所定の記録媒体(メディア)に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
 例えば、コンピュータ1000が本開示の実施形態に係る学習装置200として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされた、モデルを生成するためのプログラムを実行する。また、HDD1400には、本開示に実施形態に係るモデルを生成するためのプログラムが格納されてもよい。なお、CPU1100は、プログラムデータ1450をHDD1400から読み取って実行するが、他の例として、外部ネットワーク1550を介して、他の装置から情報処理プログラムを取得してもよい。
 また、本実施形態に係る学習装置200は、例えばクラウドコンピューティング等のように、ネットワークへの接続(または各装置間の通信)を前提とした、複数の装置からなるシステムに適用されてもよい。
 以上、学習装置200のハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。かかる構成は、実施する時々の技術レベルに応じて適宜変更され得る。
 <<7. 補足>>
 なお、先に説明した本開示の実施形態は、例えば、上記で説明したような制御装置又は制御システムで実行される制御方法、制御装置を機能させるためのプログラム、及びプログラムが記録された一時的でない有形の媒体を含みうる。また、当該プログラムをインターネット等の通信回線(無線通信も含む)を介して頒布してもよい。
 また、上述した本開示の実施形態の制御方法における各ステップは、必ずしも記載された順序に沿って処理されなくてもよい。例えば、各ステップは、適宜順序が変更されて処理されてもよい。また、各ステップは、時系列的に処理される代わりに、一部並列的に又は個別的に処理されてもよい。さらに、各ステップの処理についても、必ずしも記載された方法に沿って処理されなくてもよく、例えば、他の機能部によって他の方法により処理されていてもよい。
 上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
 また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
 以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
 また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
 なお、本技術は以下のような構成も取ることができる。
(1)
 第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、
 第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、
 第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、
 を備える、
 医療用アーム制御システム。
(2)
 前記医療用アームは、医療用観察装置を支持する、上記(1)に記載の医療用アーム制御システム。
(3)
 前記医療用観察装置は、内視鏡である、上記(2)に記載の医療用アーム制御システム。
(4)
 前記医療用アームは、医療用器具を支持する、上記(1)に記載の医療用アーム制御システム。
(5)
 前記第1の入力データは、前記医療用アームの位置、姿勢、医療用器具の位置、姿勢、術部情報、患者情報及び画像のうちの少なくともいずれか1つの情報を含む、上記(1)~(3)のいずれか1つに記載の医療用アーム制御システム。
(6)
 前記第1の入力データ及び前記第1の教師データは、臨床データ、疑似臨床データ又は仮想臨床データである、上記(5)に記載の医療用アーム制御システム。
(7)
 前記第1の教師データは、前記医療用アームの位置、姿勢、画像情報のうちの少なくともいずれか1つの情報を含む、上記(5)又は(6)に記載の医療用アーム制御システム。
(8)
 前記自律動作制御モデルは、前記医療用アームの位置、姿勢、速度、加速度、及び画像の撮像条件のうちの少なくともいずれか1つに関する情報を出力する、上記(7)に記載の医療用アーム制御システム。
(9)
 前記第2の入力データは、患者情報及び画像のうちの少なくともいずれか1つの情報を含む、上記(5)~(8)のいずれか1つに記載の医療用アーム制御システム。
(10)
 前記第2の入力データは、臨床データ、疑似臨床データ又は仮想臨床データである、上記(9)に記載の医療用アーム制御システム。
(11)
 前記患者情報は、患者の、心拍、脈拍、血圧、血流酸素濃度、脳波、呼吸、発汗、筋電位、皮膚温度、皮膚電気抵抗のうちの少なくともいずれか1つの情報を含む、上記(5)~(10)のいずれか1つに記載の医療用アーム制御システム。
(12)
 前記術部情報は、臓器の種類、位置、姿勢、前記医療用器具と前記臓器との位置関係を示す情報のうちの少なくともいずれか1つの情報を含む、上記(5)~(11)のいずれか1つに記載の医療用アーム制御システム。
(13)
 強化された前記自律動作制御モデルに基づき、前記医療用アームを制御する制御部をさらに備える、上記(1)~(12)のいずれか1つに記載の医療用アーム制御システム。
(14)
 前記第2の教師データは、前記医療用アームの状態の評価スコアを含む、上記(1)~(13)のいずれか1つに記載の医療用アーム制御システム。
(15)
 前記評価スコアは、医師による主観評価による評価スコアである、上記(14)に記載の医療用アーム制御システム。
(16)
 前記第3の入力データは、仮想臨床データである、上記(1)~(15)のいずれか1つに記載の医療用アーム制御システム。
(17)
 第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための制御モデルを、第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化して得られた自律動作制御モデルを格納する、医療用アーム装置。
(18)
 医療用アーム制御システムにより、
 第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための自律動作制御モデルを、
 第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化することと、
 強化した前記自律動作制御モデルを用いて、前記医療用アームを制御することと、
 を含む、
 医療用アームの制御方法。
(19)
 コンピュータを、
 第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、
 第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、
 第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、
 として機能させる、プログラム。
 10  医療用観察システム
 100  内視鏡ロボットアームシステム
 102  アーム部
 104  撮像部
 106  光源部
 200  学習装置
 210、312  情報取得部
 222、224  機械学習部
 230  強化学習部
 232  シミュレータ部
 234  評価部
 236  更新部
 240、340  記憶部
 250、320  出力部
 300  制御装置
 310  処理部
 314  画像処理部
 316  モデル取得部
 318  制御部
 500  提示装置
 600  執刀医側装置
 602  UI
 610  患者側装置
 612  センサ

Claims (19)

  1.  第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、
     第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、
     第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、
     を備える、
     医療用アーム制御システム。
  2.  前記医療用アームは、医療用観察装置を支持する、請求項1に記載の医療用アーム制御システム。
  3.  前記医療用観察装置は、内視鏡である、請求項2に記載の医療用アーム制御システム。
  4.  前記医療用アームは、医療用器具を支持する、請求項1に記載の医療用アーム制御システム。
  5.  前記第1の入力データは、前記医療用アームの位置、姿勢、医療用器具の位置、姿勢、術部情報、患者情報及び画像のうちの少なくともいずれか1つの情報を含む、請求項1に記載の医療用アーム制御システム。
  6.  前記第1の入力データ及び前記第1の教師データは、臨床データ、疑似臨床データ又は仮想臨床データである、請求項5に記載の医療用アーム制御システム。
  7.  前記第1の教師データは、前記医療用アームの位置、姿勢、画像情報のうちの少なくともいずれか1つの情報を含む、請求項5に記載の医療用アーム制御システム。
  8.  前記自律動作制御モデルは、前記医療用アームの位置、姿勢、速度、加速度、及び画像の撮像条件のうちの少なくともいずれか1つに関する情報を出力する、請求項7に記載の医療用アーム制御システム。
  9.  前記第2の入力データは、患者情報及び画像のうちの少なくともいずれか1つの情報を含む、請求項5に記載の医療用アーム制御システム。
  10.  前記第2の入力データは、臨床データ、疑似臨床データ又は仮想臨床データである、請求項9に記載の医療用アーム制御システム。
  11.  前記患者情報は、患者の、心拍、脈拍、血圧、血流酸素濃度、脳波、呼吸、発汗、筋電位、皮膚温度、皮膚電気抵抗のうちの少なくともいずれか1つの情報を含む、請求項5に記載の医療用アーム制御システム。
  12.  前記術部情報は、臓器の種類、位置、姿勢、前記医療用器具と前記臓器との位置関係を示す情報のうちの少なくともいずれか1つの情報を含む、請求項5に記載の医療用アーム制御システム。
  13.  強化された前記自律動作制御モデルに基づき、前記医療用アームを制御する制御部をさらに備える、請求項1に記載の医療用アーム制御システム。
  14.  前記第2の教師データは、前記医療用アームの状態の評価スコアを含む、請求項1に記載の医療用アーム制御システム。
  15.  前記評価スコアは、医師による主観評価による評価スコアである、請求項14に記載の医療用アーム制御システム。
  16.  前記第3の入力データは、仮想臨床データである、請求項1に記載の医療用アーム制御システム。
  17.  第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための制御モデルを、第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化して得られた自律動作制御モデルを格納する、医療用アーム装置。
  18.  医療用アーム制御システムにより、
     第1の入力データと第1の教師データとを用いて教師あり学習を行って生成された、医療用アームの自律動作のための自律動作制御モデルを、
     第2の入力データと第2の教師データとを用いて教師あり学習を行って生成された、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルに第3の入力データを入力して得られた報酬を用いて、強化することと、
     強化した前記自律動作制御モデルを用いて、前記医療用アームを制御することと、
     を含む、
     医療用アームの制御方法。
  19.  コンピュータを、
     第1の入力データと第1の教師データとを用いて教師あり学習を行い、医療用アームの自律動作のための自律動作制御モデルを生成する第1の判定部と、
     第2の入力データと第2の教師データとを用いて教師あり学習を行い、前記医療用アームの動作に与えられる報酬を算出するための報酬モデルを生成する第2の判定部と、
     第3の入力データを用いて前記報酬モデルを実行し、前記報酬モデルによって算出された報酬を用いて、前記自律動作制御モデルを強化する強化学習部と、
     として機能させる、プログラム。
PCT/JP2021/029898 2020-09-11 2021-08-16 医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム WO2022054498A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE112021004722.1T DE112021004722T5 (de) 2020-09-11 2021-08-16 Steuersystem für einen medizinischen arm, medizinische armvorrichtung, steuerungsverfahren für einen medizinischen arm und programm
US18/043,623 US20230355332A1 (en) 2020-09-11 2021-08-16 Medical arm control system, medical arm device, medical arm control method, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-152575 2020-09-11
JP2020152575 2020-09-11

Publications (1)

Publication Number Publication Date
WO2022054498A1 true WO2022054498A1 (ja) 2022-03-17

Family

ID=80632217

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/029898 WO2022054498A1 (ja) 2020-09-11 2021-08-16 医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム

Country Status (3)

Country Link
US (1) US20230355332A1 (ja)
DE (1) DE112021004722T5 (ja)
WO (1) WO2022054498A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102755A (ja) * 2015-12-02 2017-06-08 池上通信機株式会社 機械学習支援装置
US20180296281A1 (en) * 2017-04-12 2018-10-18 Bio-Medical Engineering (HK) Limited Automated steering systems and methods for a robotic endoscope
WO2018225132A1 (ja) * 2017-06-05 2018-12-13 オリンパス株式会社 医療システムおよび医療システムの作動方法
JP2021061911A (ja) * 2019-10-10 2021-04-22 Hoya株式会社 学習モデルの生成方法、コンピュータプログラム、内視鏡支援システム、及び操作支援装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017102755A (ja) * 2015-12-02 2017-06-08 池上通信機株式会社 機械学習支援装置
US20180296281A1 (en) * 2017-04-12 2018-10-18 Bio-Medical Engineering (HK) Limited Automated steering systems and methods for a robotic endoscope
WO2018225132A1 (ja) * 2017-06-05 2018-12-13 オリンパス株式会社 医療システムおよび医療システムの作動方法
JP2021061911A (ja) * 2019-10-10 2021-04-22 Hoya株式会社 学習モデルの生成方法、コンピュータプログラム、内視鏡支援システム、及び操作支援装置

Also Published As

Publication number Publication date
DE112021004722T5 (de) 2023-09-07
US20230355332A1 (en) 2023-11-09

Similar Documents

Publication Publication Date Title
JP7003985B2 (ja) 医療用支持アームシステムおよび制御装置
WO2020196338A1 (en) Medical arm system, control device, and control method
CN106456148A (zh) 使用眼球凝视跟踪的医疗装置、系统和方法
WO2018168261A1 (ja) 制御装置、制御方法、及びプログラム
WO2021124716A1 (en) Method, apparatus and system for controlling an image capture device during surgery
US20230172438A1 (en) Medical arm control system, medical arm control method, medical arm simulator, medical arm learning model, and associated programs
US20220218427A1 (en) Medical tool control system, controller, and non-transitory computer readable storage
JPWO2019073814A1 (ja) 焦点検出装置および方法、並びにプログラム
WO2021111879A1 (ja) 学習モデルの生成方法、プログラム、手技支援システム、情報処理装置、情報処理方法及び内視鏡用プロセッサ
JPWO2019092950A1 (ja) 画像処理装置、画像処理方法および画像処理システム
US20230142404A1 (en) Medical imaging apparatus, learning model generation method, and learning model generation program
EP4191606A1 (en) Medical assistance system, medical assistance method, and computer program
US20220096164A1 (en) Systems and methods for facilitating optimization of an imaging device viewpoint during an operating session of a computer-assisted operation system
WO2022054498A1 (ja) 医療用アーム制御システム、医療用アーム装置、医療用アームの制御方法及びプログラム
WO2022030142A1 (ja) 情報処理装置、プログラム、学習モデル及び学習モデルの生成方法
WO2021125056A1 (en) Method, apparatus and system for controlling an image capture device during surgery
WO2020203164A1 (ja) 医療システム、情報処理装置及び情報処理方法
WO2021044900A1 (ja) 施術システム、画像処理装置、画像処理方法、及びプログラム
JP2021074095A (ja) 眼科画像処理装置および眼科画像処理プログラム
WO2022172733A1 (ja) 医療用観察装置、観察装置、観察方法及びアダプタ
WO2022249593A1 (ja) 情報処理装置、情報処理システム及び情報処理方法
WO2022014246A1 (en) Device, computer program and method for predicting post-surgical performance of a patient
WO2022019057A1 (ja) 医療用アーム制御システム、医療用アーム制御方法及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21866458

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 21866458

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP