JP7311936B1 - コンピュータプログラム、学習モデルの生成方法、及び情報処理装置 - Google Patents

コンピュータプログラム、学習モデルの生成方法、及び情報処理装置 Download PDF

Info

Publication number
JP7311936B1
JP7311936B1 JP2022568486A JP2022568486A JP7311936B1 JP 7311936 B1 JP7311936 B1 JP 7311936B1 JP 2022568486 A JP2022568486 A JP 2022568486A JP 2022568486 A JP2022568486 A JP 2022568486A JP 7311936 B1 JP7311936 B1 JP 7311936B1
Authority
JP
Japan
Prior art keywords
pancreas
field image
learning model
operative field
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022568486A
Other languages
English (en)
Other versions
JPWO2023080170A1 (ja
Inventor
直 小林
勇太 熊頭
成昊 銭谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANAUT INC.
Original Assignee
ANAUT INC.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANAUT INC. filed Critical ANAUT INC.
Publication of JPWO2023080170A1 publication Critical patent/JPWO2023080170A1/ja
Application granted granted Critical
Publication of JP7311936B1 publication Critical patent/JP7311936B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/045Control thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B34/00Computer-aided surgery; Manipulators or robots specially adapted for use in surgery
    • A61B34/10Computer-aided planning, simulation or modelling of surgical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Abstract

コンピュータプログラム、学習モデルの生成方法、及び情報処理装置の提供。コンピュータに、鏡視下手術の術野を撮像して得られる術野画像を取得し、術野画像の入力に応じて術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、術野画像に含まれる膵臓部分を認識する処理を実行させる。

Description

本発明は、コンピュータプログラム、学習モデルの生成方法、及び情報処理装置に関する。
腹腔鏡手術では、例えば患者の体内に形成された悪性腫瘍などの病変部を取り除く手術を行う。このとき、患者の体内を腹腔鏡により撮像し、得られた術野画像をモニタに表示させる(例えば、特許文献1を参照)。
特開2005-287839号公報
従来、膵臓部分を術野画像から認識し、術者に報知することは困難であった。
本発明は、膵臓部分の認識結果を出力できるコンピュータプログラム、学習モデルの生成方法、及び情報処理装置を提供することを目的とする。
本発明の一態様におけるコンピュータプログラムは、コンピュータに、鏡視下手術の術野を撮像して得られる術野画像を取得し、術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識する処理を実行させるためのコンピュータプログラムである。
本発明の一態様における学習モデルの生成方法は、コンピュータが、鏡視下手術の術野を撮像して得られる術野画像と、該術野画像内の膵臓部分を示す正解データとを含む訓練データを取得し、取得した訓練データのセットに基づき、術野画像を入力した場合、膵臓部分に関する情報を出力する学習モデルを生成する。
本発明の一態様における情報処理装置は、鏡視下手術の術野を撮像して得られる術野画像を取得する取得部と、術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識する認識部と、該認識部による認識結果に基づく情報を出力する出力部とを備える。
本願によれば、膵臓部分の認識結果を出力できる。
実施の形態1に係る腹腔鏡手術支援システムの概略構成を説明する模式図である。 情報処理装置の内部構成を説明するブロック図である。 術野画像の一例を示す模式図である。 学習モデルの構成例を示す模式図である。 学習モデルの生成手順を説明するフローチャートである。 手術支援の実行手順を説明するフローチャートである。 実施の形態1に係る認識画像の表示例を示す模式図である。 従来手法による表示例を示す模式図である。 実施の形態2における認識画像の表示例を示す模式図である。 実施の形態4に係る情報処理装置の内部構成を説明するブロック図である。 実施の形態4に係る情報処理装置が実行する処理の手順を説明するフローチャートである。 演算結果の解析手法を説明する説明図である。 評価係数テーブルの一例を示す図である。 スコアの算出結果の一例を示す図である。 実施の形態5に係る情報処理装置が実行する処理の手順を示すフローチャートである。 実施の形態6に係る情報処理装置が実行する処理の手順を示すフローチャートである。 確信度に応じた認識結果の表示例を示す模式図である。 実施の形態7における表示切替手順を示すフローチャートである。 実施の形態8における表示例を説明する説明図である。 実施の形態8に係る情報処理装置が実行する処理の手順を示すフローチャートである。 実施の形態9における第1表示例を説明する説明図である。 実施の形態9における第2表示例を説明する説明図である。 情報処理装置が備えるユーザインタフェースの構成例を示す模式図である。
以下、本発明を腹腔鏡手術の支援システムに適用した形態について、図面を用いて具体的に説明する。なお、本発明は、腹腔鏡手術に限らず、胸腔鏡、消化管内視鏡、膀胱鏡、関節鏡、ロボット支援下内視鏡、脊椎内視鏡、手術顕微鏡、神経内視鏡、外視鏡など撮像装置を用いた鏡視下手術全般に適用可能である。
(実施の形態1)
図1は実施の形態1に係る腹腔鏡手術支援システムの概略構成を説明する模式図である。腹腔鏡手術では、開腹手術を実施する代わりに、トロッカ10と呼ばれる開孔器具を患者の腹壁に複数個取り付け、トロッカ10に設けられた開孔から、腹腔鏡11、エネルギ処置具12、鉗子13などの器具を患者の体内に挿入する。術者は、腹腔鏡11によって撮像された患者体内の画像(術野画像)をリアルタイムに見ながら、エネルギ処置具12を用いて患部を切除するなどの処置を行う。腹腔鏡11、エネルギ処置具12、鉗子13などの術具は、術者又はロボットなどにより保持される。術者とは、腹腔鏡手術に関わる医療従事者であり、執刀医、助手、看護師、手術をモニタしている医師などを含む。
腹腔鏡11は、患者の体内に挿入される挿入部11A、挿入部11Aの先端部分に内蔵される撮像装置11B、挿入部11Aの後端部分に設けられる操作部11C、及びカメラコントロールユニット(CCU)110や光源装置120に接続するためのユニバーサルコード11Dを備える。
腹腔鏡11の挿入部11Aは、硬性管により形成されている。硬性管の先端部分には湾曲部が設けられている。湾曲部における湾曲機構は一般的な腹腔鏡に組み込まれている周知の機構であり、操作部11Cの操作に連動した操作ワイヤの牽引によって例えば上下左右の4方向に湾曲するように構成されている。なお、腹腔鏡11は、上述したような湾曲部を有する軟性鏡に限らず、湾曲部を持たない硬性鏡であってもよく、湾曲部や硬性管を持たない撮像装置であってもよい。さらに、腹腔鏡11は、360度の範囲を撮像する全方位カメラであってもよい。
撮像装置11Bは、CMOS(Complementary Metal Oxide Semiconductor)などの固体撮像素子、タイミングジェネレータ(TG)やアナログ信号処理回路(AFE)などを備えたドライバ回路を備える。撮像装置11Bのドライバ回路は、TGから出力されるクロック信号に同期して固体撮像素子から出力されるRGB各色の信号を取り込み、AFEにおいて、ノイズ除去、増幅、AD変換などの必要な処理を施し、デジタル形式の画像データを生成する。撮像装置11Bのドライバ回路は、生成した画像データを、ユニバーサルコード11Dを介して、CCU110へ伝送する。
操作部11Cは、術者によって操作されるアングルレバーやリモートスイッチなどを備える。アングルレバーは、湾曲部を湾曲させるための操作を受付ける操作具である。アングルレバーに代えて、湾曲操作ノブ、ジョイスティックなどが設けられてもよい。リモートスイッチは、例えば、観察画像を動画表示又は静止画表示に切り替える切替スイッチ、観察画像を拡大又は縮小させるズームスイッチなどを含む。リモートスイッチには、予め定められた特定の機能が割り当てられてもよく、術者によって設定された機能が割り当てられてもよい。
また、操作部11Cには、リニア共振アクチュエータやピエゾアクチュエータなどにより構成される振動子が内蔵されてもよい。腹腔鏡11を操作する術者に対して報知すべき事象が発生した場合、CCU110は、操作部11Cに内蔵された振動子を作動させることによって操作部11Cを振動させ、前記事象の発生を術者に知らせてもよい。
腹腔鏡11の挿入部11A、操作部11C、及びユニバーサルコード11Dの内部には、CCU110から撮像装置11Bへ出力される制御信号や撮像装置11Bから出力される画像データを伝送するための伝送ケーブル、光源装置120から出射される照明光を挿入部11Aの先端部分まで導くライトガイドなどが配されている。光源装置120から出射される照明光は、ライトガイドを通じて挿入部11Aの先端部分まで導かれ、挿入部11Aの先端部分に設けられた照明レンズを介して術野に照射される。なお、本実施の形態では、光源装置120を独立した装置として記載したが、光源装置120はCCU110に内蔵される構成であってもよい。
CCU110は、腹腔鏡11が備える撮像装置11Bの動作を制御する制御回路、ユニバーサルコード11Dを通じて入力される撮像装置11Bからの画像データを処理する画像処理回路等を備える。制御回路は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備え、CCU110が備える各種スイッチの操作や腹腔鏡11が備える操作部11Cの操作に応じて、撮像装置11Bへ制御信号を出力し、撮像開始、撮像停止、ズームなどの制御を行う。制御回路は、CPU、ROM、RAMに限らず、GPU(Graphics Processing Unit)やFPGA(Field Programmable Gate Array)などを備えてもよい。画像処理回路は、DSP(Digital Signal Processor)や画像メモリなどを備え、ユニバーサルコード11Dを通じて入力される画像データに対して、色分離、色補間、ゲイン補正、ホワイトバランス調整、ガンマ補正等の適宜の処理を施す。CCU110は、処理後の画像データから動画用のフレーム画像を生成し、生成した各フレーム画像を後述する情報処理装置200へ順次出力する。フレーム画像のフレームレートは、例えば30FPS(Frames Per Second)である。
CCU110は、NTSC(National Television System Committee)、PAL(Phase Alternating Line)、DICOM(Digital Imaging and COmmunication in Medicine)などの所定の規格に準拠した映像データを生成してもよい。CCU110は、生成した映像データを表示装置130へ出力することにより、表示装置130の表示画面に術野画像(映像)をリアルタイムに表示させることができる。表示装置130は、液晶パネルや有機EL(Electro-Luminescence)パネルなどを備えたモニタである。また、CCU110は、生成した映像データを録画装置140へ出力し、録画装置140に映像データを記録させてもよい。録画装置140は、CCU110から出力される映像データを、各手術を識別する識別子、手術日時、手術場所、患者名、術者名などと共に記録するHDD(Hard Disk Drive)などの記録装置を備える。
情報処理装置200は、CCU110から入力される画像データ(すなわち、術野を撮像して得られる術野画像の画像データ)に基づき、腹腔鏡手術に関する支援情報を生成する。具体的には、情報処理装置200は、術野画像に含まれる膵臓の外縁により定まる領域から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた正味の膵臓部分を認識し、前記部分を除いて認識した膵臓部分を術野画像上に重畳して表示装置130に表示させる処理を行う。ここで、情報処理装置200により認識される膵臓部分は、術野画像において膵臓に相当する画素の集合により表される。なお、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分とは、血管、脂肪、小葉間の溝、及び小葉間の影のうち、何れか1つの部分であってもよく、2つ以上の部分であってもよい。
本実施の形態では、情報処理装置200において膵臓部分の認識処理を実行する構成について説明するが、情報処理装置200と同等の機能をCCU110に設け、CCU110において膵臓部分の認識処理を実行する構成としてもよい。
以下、情報処理装置200の内部構成、情報処理装置200が実行する認識処理及び表示処理について説明する。
図2は情報処理装置200の内部構成を説明するブロック図である。情報処理装置200は、制御部201、記憶部202、操作部203、入力部204、出力部205、通信部206などを備える専用又は汎用のコンピュータである。情報処理装置200は、手術室内に設置されるコンピュータであってもよく、手術室の外部に設置されるコンピュータであってもよい。また、情報処理装置200は、腹腔鏡手術を行う病院内に設置されるサーバであってもよく、病院外に設置されるサーバであってもよい。情報処理装置200は、遠隔手術の支援用に用いられてもよい。
制御部201は、例えば、CPU、ROM、及びRAMなどを備える。制御部201が備えるROMには、情報処理装置200が備えるハードウェア各部の動作を制御する制御プログラム等が記憶される。制御部201内のCPUは、ROMに記憶された制御プログラムや後述する記憶部202に記憶された各種コンピュータプログラムを実行し、ハードウェア各部の動作を制御することによって、装置全体を本願における情報処理装置として機能させる。制御部201が備えるRAMには、演算の実行中に利用されるデータ等が一時的に記憶される。
本実施の形態では、制御部201がCPU、ROM、及びRAMを備える構成としたが、制御部201の構成は任意であり、例えば、GPU、FPGA、量子プロセッサ、揮発性又は不揮発性のメモリ等を1又は複数備えた演算回路や制御回路であってもよい。また、制御部201は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を有するものであってもよい。
記憶部202は、ハードディスク、フラッシュメモリなどを用いた記憶装置を備える。記憶部202には、制御部201によって実行されるコンピュータプログラム、外部から取得した各種データ、装置内部で生成した各種データ等が記憶される。
記憶部202に記憶されるコンピュータプログラムは、術野画像に含まれる膵臓部分の認識処理を制御部201に実行させる認識処理プログラムPG1、認識結果に基づく支援情報を表示装置130に表示させるための処理を制御部201に実行させる表示処理プログラムPG2、学習モデル300を生成するための学習処理プログラムPG3を含む。なお、認識処理プログラムPG1及び表示処理プログラムPG2は、それぞれ独立したコンピュータプログラムである必要はなく、1つのコンピュータプログラムとして実装されてもよい。これらのプログラムは、例えば、コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体Mにより提供される。記録媒体Mは、CD-ROM、USBメモリ、SD(Secure Digital)カードなどの可搬型メモリである。制御部201は、図に示していない読取装置を用いて、記録媒体Mから所望のコンピュータプログラムを読み取り、読み取ったコンピュータプログラムを記憶部202に記憶させる。代替的に、上記コンピュータプログラムは、通信部206を用いた通信により提供されてもよい。
また、記憶部202には、上述した認識処理プログラムPG1において用いられる学習モデル300が記憶される。学習モデル300は、術野画像の入力に対して、術野画像に含まれる膵臓部分に関する情報を出力するように学習された学習モデルである。学習モデル300はその定義情報によって記述される。学習モデル300の定義情報は、学習モデル300が備える層の情報、各層を構成するノードの情報、ノード間の重み付け及びバイアスなどのパラメータを含む。これらのパラメータは、術野を撮像して得られる術野画像と、術野画像内の膵臓部分を示す正解データとを含む訓練データを用いて、所定の学習アルゴリズムを実行することによって学習される。学習モデル300の構成及び生成手順については後に詳述する。
操作部203は、キーボード、マウス、タッチパネル、非接触パネル、スタイラスペン、マイクロフォンによる音声入力などの操作デバイスを備える。操作部203は、術者などによる操作を受付け、受付けた操作に関する情報を制御部201へ出力する。制御部201は、操作部203から入力される操作情報に応じて適宜の処理を実行する。なお、本実施の形態では、情報処理装置200が操作部203を備える構成としたが、外部に接続されたCCU110などの各種機器を通じて操作を受付ける構成であってもよい。
入力部204は、入力機器を接続する接続インタフェースを備える。本実施の形態において、入力部204に接続される入力機器はCCU110である。入力部204には、腹腔鏡11によって撮像され、CCU110によって処理が施された術野画像の画像データが入力される。入力部204は、入力された画像データを制御部201へ出力する。また、制御部201は、入力部204から取得した画像データを記憶部202に記憶させてもよい。
出力部205は、出力機器を接続する接続インタフェースを備える。本実施の形態において、出力部205に接続される出力機器は表示装置130である。制御部201は、学習モデル300による認識結果など、術者等に報知すべき情報を生成した場合、生成した情報を出力部205より表示装置130へ出力することにより、表示装置130に情報を表示させる。本実施の形態では、出力機器として表示装置130を出力部205に接続する構成としたが、音を出力するスピーカなどの出力機器が出力部205に接続されてもよい。
通信部206は、各種のデータを送受信する通信インタフェースを備える。通信部206が備える通信インタフェースは、イーサネット(登録商標)やWiFi(登録商標)において用いられる有線又は無線の通信規格に準じた通信インタフェースである。通信部206は、送信すべきデータが制御部201から入力された場合、指定された宛先へ送信すべきデータを送信する。また、通信部206は、外部装置から送信されたデータを受信した場合、受信したデータを制御部201へ出力する。
情報処理装置200は、単一のコンピュータである必要はなく、複数のコンピュータや周辺機器からなるコンピュータシステムであってもよい。更に、情報処理装置200は、ソフトウェアによって仮想的に構築される仮想マシンであってもよい。
次に、情報処理装置200に入力される術野画像について説明する。
図3は術野画像の一例を示す模式図である。本実施の形態における術野画像は、患者の腹腔内を腹腔鏡11により撮像して得られる画像である。術野画像は、腹腔鏡11の撮像装置11Bが出力する生の画像である必要はなく、CCU110などによって処理が施された画像(フレーム画像)であってもよい。また、術野画像は、CCU110から表示装置130に出力される画像であってもよく、腹腔鏡11に着脱可能に装着される画像処理装置(不図示)によって処理が施された画像であってもよい。更に、術野画像は、録画装置140に記録済みの録画映像であってもよい。
図3に一例として示す術野画像は、鉗子13を用いて膵臓30を被う膜を牽引し、エネルギ処置具12を用いて膜や結合組織を剥離しようとしている場面を示している。この術野画像には、膵臓30を含む各種臓器、各種臓器を被う膜、臓器間の間に存在する結合組織の他、臓器表面に現れる血管31や脂肪32などが含まれている。図3において、膵臓30の外縁は破線によって示されている。術野画像には、これらの組織以外に、腫瘍などの病変部、組織間に存在する脂肪などの組織が含まれる場合もある。術者は、各組織の位置関係(解剖学的構造)を把握しながら、鉗子13やエネルギ処置具12などの器具を用いて、膜や結合組織の剥離を進め、病変部を含む組織の剥離を行う。
術者が膵臓を被う膜や組織間を結合する結合組織を剥離したり、病変部を含む組織を剥離するためには、膵臓の位置を明確に把握する必要がある。しかしながら、一般には、膵臓は胃、十二指腸、脾臓などの他の臓器と隣接しており、膵臓と他の臓器との境界を特定することは困難である。人工知能を用いた従来手法により、膵臓を含んだ領域を認識し、認識した領域全体に色を付して提示した場合、膵臓と他の臓器との境界を特定することが容易となる。しかしながら、認識した領域全体に色を付して提示した場合、膵臓表面に現れる血管、脂肪、小葉間の溝や影までも隠してしまうことになるため、手術を行う術者にとって必要な情報がかえって失われる可能性がある。
そこで、本実施の形態に係る情報処理装置200は、学習モデル300を用いて、膵臓の外縁により囲まれる領域(膵臓領域)から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた正味の膵臓部分を認識し、前記部分を除いて認識した膵臓部分を認識画像として術野画像上に表示することにより、術者に対する手術支援を行う。
以下、学習モデル300について説明する。
図4は学習モデル300の構成例を示す模式図である。学習モデル300は、画像セグメンテーションを行うための学習モデルであり、例えばSegNetなどの畳み込み層を備えたニューラルネットワークにより構築される。学習モデル300は、SegNetに限らず、FCN(Fully Convolutional Network)、U-Net(U-Shaped Network)、PSPNet(Pyramid Scene Parsing Network)など、画像セグメンテーションが行える任意のニューラルネットワークを用いて構築されてもよい。また、学習モデル300は、画像セグメンテーション用のニューラルネットワークに代えて、YOLO(You Only Look Once)、SSD(Single Shot Multi-Box Detector)など物体検出用のニューラルネットワークを用いて構築されてもよい。
本実施の形態において、学習モデル300への入力画像は、腹腔鏡11から得られる術野画像である。学習モデル300は、術野画像の入力に対し、術野画像に含まれる膵臓部分に関する情報を出力するように学習される。
学習モデル300は、例えば、エンコーダ310、デコーダ320、及びソフトマックス層330を備える。エンコーダ310は、畳み込み層とプーリング層とを交互に配置して構成される。畳み込み層は2~3層に多層化されている。図4の例では、畳み込み層にはハッチングを付さずに示し、プーリング層にはハッチングを付して示している。
畳み込み層では、入力されるデータと、それぞれにおいて定められたサイズ(例えば、3×3や5×5など)のフィルタとの畳み込み演算を行う。すなわち、フィルタの各要素に対応する位置に入力された入力値と、フィルタに予め設定された重み係数とを各要素毎に乗算し、これら要素毎の乗算値の線形和を算出する。算出した線形和に、設定されたバイアスを加算することによって、畳み込み層における出力が得られる。なお、畳み込み演算の結果は活性化関数によって変換されてもよい。活性化関数として、例えばReLU(Rectified Linear Unit)を用いることができる。畳み込み層の出力は、入力データの特徴を抽出した特徴マップを表している。
プーリング層では、入力側に接続された上位層である畳み込み層から出力された特徴マップの局所的な統計量を算出する。具体的には、上位層の位置に対応する所定サイズ(例えば、2×2、3×3)のウインドウを設定し、ウインドウ内の入力値から局所の統計量を算出する。統計量としては、例えば最大値を採用できる。プーリング層から出力される特徴マップのサイズは、ウインドウのサイズに応じて縮小(ダウンサンプリング)される。図4の例は、エンコーダ310において畳み込み層における演算とプーリング層における演算とを順次繰り返すことによって、224画素×224画素の入力画像を、112×112、56×56、28×28、…、1×1の特徴マップに順次ダウンサンプリングしていることを示している。
エンコーダ310の出力(図4の例では1×1の特徴マップ)は、デコーダ320に入力される。デコーダ320は、逆畳み込み層と逆プーリング層とを交互に配置して構成される。逆畳み込み層は2~3層に多層化されている。図4の例では、逆畳み込み層にはハッチングを付さずに示し、逆プーリング層にはハッチングを付して示している。
逆畳み込み層では、入力された特徴マップに対して、逆畳み込み演算を行う。逆畳み込み演算とは、入力された特徴マップが特定のフィルタを用いて畳み込み演算された結果であるという推定の下、畳み込み演算される前の特徴マップを復元する演算である。この演算では、特定のフィルタを行列で表したとき、この行列に対する転置行列と、入力された特徴マップとの積を算出することで、出力用の特徴マップを生成する。なお、逆畳み込み層の演算結果は、上述したReLUなどの活性化関数によって変換されてもよい。
デコーダ320が備える逆プーリング層は、エンコーダ310が備えるプーリング層に1対1で個別に対応付けられており、対応付けられている対は実質的に同一のサイズを有する。逆プーリング層は、エンコーダ310のプーリング層においてダウンサンプリングされた特徴マップのサイズを再び拡大(アップサンプリング)する。図4の例は、デコーダ320において畳み込み層における演算とプーリング層における演算とを順次繰り返すことによって、1×1、7×7、14×14、…、224×224の特徴マップに順次アップサンプリングしていることを示している。
デコーダ320の出力(図4の例では224×224の特徴マップ)は、ソフトマックス層330に入力される。ソフトマックス層330は、入力側に接続された逆畳み込み層からの入力値にソフトマックス関数を適用することにより、各位置(画素)における部位を識別するラベルの確率を出力する。本実施の形態では、膵臓部分を識別するラベルを設定し、膵臓部分に該当するか否かを画素単位で識別すればよい。ソフトマックス層330から出力されるラベルの確率が閾値以上(例えば70%以上)の画素を抽出することによって、膵臓部分の認識結果を示す画像(以下、認識画像という)が得られる。
なお、図4の例では、224画素×224画素の画像を学習モデル300への入力画像としているが、入力画像のサイズは上記に限定されるものではなく、情報処理装置200の処理能力、腹腔鏡11から得られる術野画像のサイズ等に応じて、適宜設定することが可能である。また、学習モデル300への入力画像は、腹腔鏡11より得られる術野画像の全体である必要はなく、術野画像の注目領域を切り出して生成される部分画像であってもよい。処置対象を含むような注目領域は術野画像の中央付近に位置することが多いので、例えば、元の半分程度のサイズとなるように術野画像の中央付近を矩形状に切り出した部分画像を用いてもよい。学習モデル300に入力する画像のサイズを小さくすることにより、処理速度を上げつつ、認識精度を高めることができる。
本実施の形態では、術野画像に含まれる膵臓部分と、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分とを区別して認識するために、画素単位で膵臓部分に該当するか否かを認識する学習モデル300を生成する。学習モデル300を生成する準備段階として、撮像済みの術野画像に対してアノテーションが実施される。
学習モデル300を生成する準備段階において、作業者(医師などの専門家)は、録画装置140に録画された術野画像を表示装置130に表示させ、操作部203として備えるマウスやスタイラスペンなどを用いて、膵臓部分に該当する画素を画素単位で指定することによりアノテーションを行う。このとき、作業者は、膵臓表面に現れる血管等の部分を除外して、正味の膵臓部分に該当する画素を画素単位で指定することが好ましい。アノテーションに用いられた多数の術野画像と、各術野画像において指定された膵臓部分に該当する画素の位置を示すデータ(正解データ)とのセットは、学習モデル300を生成するための訓練データとして情報処理装置200の記憶部202に記憶される。訓練データの数を増やすために、透視変換や鏡映処理などを適用して生成した術野画像と、当該術野画像に対する正解データとのセットを訓練データに含めてもよい。更に、学習が進めば、術野画像と、術野画像を入力して得られる学習モデル300の認識結果(正解データ)とのセットを訓練データに含めてもよい。
更に、アノテーションを行う際に、作業者は、除外すべき血管等の部分に該当する画素を不正解データとしてラベル付けしてもよい。アノテーションに用いられた術野画像と、各術野画像において指定された膵臓に該当する画素の位置を示すデータ(正解データ)と、指定された血管、脂肪、小葉間の溝、又は小葉間の影に該当する画素の位置を示すデータ(不正解データ)とのセットを、学習モデル300を生成するための訓練データとして情報処理装置200の記憶部202に記憶させてもよい。
情報処理装置200は、上述した訓練データを用いて、学習モデル300を生成する。図5は学習モデル300の生成手順を説明するフローチャートである。情報処理装置200の制御部201は、記憶部202から学習処理プログラムPG3を読み出し、以下の手順を実行することにより、学習モデル300を生成する。なお、学習を開始する前の段階では、学習モデル300を記述する定義情報には、初期値が与えられているものとする。
制御部201は、記憶部202にアクセスし、学習モデル300を生成するために事前に準備された訓練データから、一組の訓練データを選択する(ステップS101)。制御部201は、選択した訓練データに含まれる術野画像を学習モデル300へ入力し(ステップS102)、学習モデル300による演算を実行する(ステップS103)。すなわち、制御部201は、入力した術野画像から特徴マップを生成し、生成した特徴マップを順次ダウンサンプリングするエンコーダ310による演算、エンコーダ310から入力される特徴マップを順次アップサンプリングするデコーダ320による演算、及びデコーダ320より最終的に得られる特徴マップの各画素を識別するソフトマックス層330による演算を実行する。
制御部201は、学習モデル300から演算結果を取得し、取得した演算結果を評価する(ステップS104)。例えば、制御部201は、演算結果として得られる膵臓部分の画像データと、訓練データに含まれる正解データとの類似度を算出することによって、演算結果を評価すればよい。類似度は、例えばJaccard係数により算出される。Jaccard係数は、学習モデル300によって抽出した膵臓部分をA、正解データに含まれる膵臓部分をBとしたとき、A∩B/A∪B×100(%)により与えられる。Jaccard係数に代えて、Dice係数やSimpson係数を算出してもよく、その他の既存の手法を用いて類似度を算出してもよい。訓練データに不正解データが含まれている場合、制御部201は、不正解データを参照して学習を進めてもよい。例えば、学習モデル300によって抽出した膵臓部分が不正解データに含まれる血管等の他の部分に該当する場合、制御部201は、類似度を減算する処理を行えばよい。
制御部201は、演算結果の評価に基づき、学習が完了したか否かを判断する(ステップS105)。制御部201は、予め設定した閾値以上の類似度が得られた場合に、学習が完了したと判断することができる。
学習が完了していないと判断した場合(S105:NO)、制御部201は、逆誤差伝搬法を用いて、学習モデル300の各層における重み係数及びバイアスを学習モデル300の出力側から入力側に向かって順次的に更新する(ステップS106)。制御部201は、各層の重み係数及びバイアスを更新した後、処理をステップS101へ戻し、ステップS101からステップS105までの処理を再度実行する。
ステップS105において学習が完了したと判断した場合(S105:YES)、学習済みの学習モデル300が得られるので、制御部201は、本フローチャートによる処理を終了する。
本実施の形態では、情報処理装置200において学習モデル300を生成する構成としたが、サーバ装置などの外部コンピュータを用いて学習モデル300を生成してもよい。この場合、情報処理装置200は、外部コンピュータにて生成された学習モデル300を通信等の手段を用いて取得し、取得した学習モデル300を記憶部202に記憶させればよい。
情報処理装置200は、学習モデル300が生成された後の運用フェーズにおいて手術支援を行う。図6は手術支援の実行手順を説明するフローチャートである。情報処理装置200の制御部201は、記憶部202から認識処理プログラムPG1及び表示処理プログラムPG2を読み出して実行することにより、以下の手順を実行する。腹腔鏡手術が開始されると、腹腔鏡11の撮像装置11Bにより術野を撮像して得られる術野画像はユニバーサルコード11Dを介してCCU110へ随時出力される。情報処理装置200の制御部201は、CCU110から出力される術野画像を入力部204より取得する(ステップS121)。制御部201は、術野画像を取得する都度、以下の処理を実行する。
制御部201は、取得した術野画像を学習モデル300に入力し、学習モデル300を用いた演算を実行し(ステップS122)、術野画像に含まれる膵臓部分を認識する(ステップS123)。すなわち、制御部201は、入力された術野画像から特徴マップを生成し、生成した特徴マップを順次ダウンサンプリングするエンコーダ310による演算、エンコーダ310から入力された特徴マップを順次アップサンプリングするデコーダ320による演算、及びデコーダ320より最終的に得られる特徴マップの各画素を識別するソフトマックス層330による演算を実行する。また、制御部201は、ソフトマックス層330から出力されるラベルの確率が閾値以上(例えば70%以上)の画素を膵臓部分として認識する。
学習モデル300を生成する際に、術者の中心視野にある膵臓部分を認識するようにアノテーションを行い、ステップS123において、術者の中心視野に存在する膵臓部分を認識するようにしてもよい。また、術者の中心視野にない膵臓部分を認識するようにアノテーションが行い、ステップS123において、術者の中心視野にない膵臓部分を認識するようにしてもよい。更に、術野に露出し始めた膵臓部分を認識するようにアノテーションを行い、膵臓を覆う膜や層を牽引又は切除して、膵臓が露出し始めた段階で膵臓部分として認識するように構成してもよい。
制御部201は、学習モデル300を用いて認識した膵臓部分を判別可能に表示するために、膵臓部分の認識画像を生成する(ステップS124)。生成される認識画像は、術野画像と同一のサイズを有し、膵臓部分として認識された画素に特定の色を割り当てた画像である。膵臓部分に割り当てる色は任意に設定される。例えば、膵臓部分に割り当てる色は白色系の色であってもよく、人体内部には存在しない青系の色であってもよい。また、認識画像を構成する各画素には透過度を表す情報が付加される。例えば、膵臓部分として認識された画素には不透過の値、それ以外の画素(すなわち、膵臓部分の外縁よりも外側の領域に属する画素、並びに、血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分に属する画素)は透過の値が設定される。
制御部201は、ステップS121で取得した術野画像と共に、ステップS124で生成した膵臓部分の認識画像を出力部205より表示装置130へ出力し、術野画像上に認識画像を重畳して表示させる(ステップS125)。これにより、学習モデル300を用いて認識した膵臓部分は特定の色を有する構造として術野画像上に表示される。
図7は実施の形態1に係る認識画像の表示例を示す模式図である。図面作成の都合上、図7の表示例では、学習モデル300を用いて認識された膵臓部分101はハッチングを付した領域として示されている。実際には膵臓部分101は画素単位で白色系や青系などの特定の色で塗られるため、術者は、表示画面を閲覧することにより、膵臓部分101を血管等の部分と区別して認識することができる。
図8は従来手法による表示例を示す模式図である。従来手法では、膵臓を含んだ領域を人工知能により認識し、認識した領域全体102に色を付して術野画像上に重畳表示する。この場合、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を視認することは困難となり、手術を行う術者にとって必要な情報が失われている可能性がある。
これに対し、本実施の形態に係る認識方法では、膵臓領域から、血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた正味の膵臓部分を認識し、図7に示すように、血管等の部分を除いて認識した膵臓部分の認識画像を術野画像上に重畳表示する。これにより、膵臓表面に現れる各種組織の情報を失うことなく、膵臓の外縁の位置(膵臓と他の臓器との境界)を術者に提示することができる。
本実施の形態では、術野画像に含まれる膵臓部分を認識した場合、膵臓部分の認識画像を術野画像に重畳表示する構成としたが、表示指示が与えられた場合にのみ重畳表示する構成としてもよい。表示指示は、情報処理装置200の操作部203により与えられてもよく、腹腔鏡11の操作部11Cにより与えられてもよい。また、表示指示は、図に示してないフットスイッチ等により与えられてもよい。
また、本実施の形態では、膵臓部分の認識画像を術野画像に重畳表示する構成としたが、膵臓部分の検出を音又は音声により術者に報知してもよい。
更に、情報処理装置200の制御部201は、膵臓部分の認識結果に基づき、エネルギ処置具12や手術用ロボット(不図示)などの医療デバイスを制御するための制御信号を生成し、生成した制御信号を医療デバイスへ出力する構成としてもよい。
以上のように、本実施の形態では、学習モデル300を用いて膵臓部分を認識し、認識した膵臓部分を画素単位で判別可能に表示することができるので、腹腔鏡手術における視覚支援を行うことができる。
なお、情報処理装置200から生成される画像は、手術支援に用いられるだけでなく、研修医等の教育支援のために用いられてもよく、腹腔鏡手術の評価のために用いられてもよい。例えば、手術中に録画装置140に録画された画像と情報処理装置200が生成した画像とを比較して、腹腔鏡手術における牽引操作や剥離操作が適切であったか否かを判断することにより、腹腔鏡手術を評価することができる。
(実施の形態2)
実施の形態2では、膵臓を認識したときの確信度に応じて表示態様を変更する構成について説明する。
なお、腹腔鏡手術支援システムの全体構成、情報処理装置200の内部構成等については実施の形態1と同様であるため、その説明を省略することとする。
前述の実施の形態1に係る情報処理装置200は、学習モデル300のソフトマックス層330から出力される確率を参照し、確率が閾値以上(例えば50%以上)である画素に対して特定の色(例えば白色系の色)と透過度1(不透過)とを割り当て、確率が閾値未満である画素に対して透過度0(完全透過)を割り当てることにより、膵臓部分を示す認識画像を生成する。情報処理装置200は、このような認識画像を出力し、術野画像上に重畳して表示することにより、膵臓部分を一様に表示(オーバーレイ表示)することができる。
これに対し、実施の形態2に係る情報処理装置200は、認識画像の各画素に対して特定の色(例えば白色系の色)を設定すると共に、学習モデル300のソフトマックス層330から出力される確率(確信度)に応じて各画素に透過度を設定し、膵臓部分の認識画像を生成する。具体的には、情報処理装置200は、確信度が高い程、透過度が低く、確信度が低い程、透過度が高くなるように、各画素の透過度を設定する。例えば、確信度がX%である場合の透過度をX/100に設定することができる。情報処理装置200は、生成した認識画像を出力し、術野画像上に重畳して表示することにより、確信度に応じた表示(ソフトマップ表示)を実現することができる。
図9は実施の形態2における認識画像の表示例を示す模式図である。図面作成の都合上、図9の例では、透過度の高低を濃度の高低により示している。すなわち、図9の例では、確信度が高い膵臓部分の濃度を高く、確信度が低い膵臓部分の濃度を低くして認識画像を示している。
実施の形態2では、相対的に確信度が高い膵臓部分を明瞭に表示することができるので、牽引操作や剥離操作などを行う際に有用な情報を術者に対して的確に提示できる。
実施の形態2では、確信度に応じて透過度を変更する構成としたが、確信度に応じて色、色相、彩度、明度などを変更する構成としてもよい。
(実施の形態3)
実施の形態3では、膵臓部分について設定された表示色と、術野画像における膵臓部分の表示色とを平均化し、平均化した色により膵臓部分を着色して表示する構成について説明する。
なお、腹腔鏡手術支援システムの全体構成、情報処理装置200の内部構成等については実施の形態1と同様であるため、その説明を省略することとする。
実施の形態3に係る情報処理装置200は、膵臓部分の認識画像が得られた場合、この認識画像について予め設定されている表示色と、背景の術野画像の表示色とを平均化し、平均化した色を膵臓部分の表示色として表示させる。例えば、膵臓部分について設定されている表示色を(R1,G1,B1)、背景の術野画像における膵臓部分の表示色を(R2,G2,B2)とした場合、制御部201は、当該膵臓部分を((R1+R2)/2,(G1+G2)/2,(B1+B2)/2)の色で着色して表示すればよい。代替的に、重み係数W1,W2を導入し、認識した膵臓部分を(W1×R1+W2×R2,W1×G1+W2×G2,W1×B1+W2×B2)の色で着色して表示してもよい。
実施の形態3では、膵臓部分について設定された表示色と、術野画像における膵臓部分の表示色とを平均化して着色するので、術野画像に馴染ませることができ、違和感が少ない画像を術者に提供できる。
(実施の形態4)
実施の形態4では、情報処理装置200が複数種の学習モデルを備える構成について説明する。
図10は実施の形態4に係る情報処理装置200の内部構成を説明するブロック図である。実施の形態4に係る情報処理装置200は、第1学習モデル410及び第2学習モデル420を備える。情報処理装置200のその他の構成、及び情報処理装置200を含むシステムの全体構成は、実施の形態1~3と同様であるため、その説明を省略する。なお、本実施の形態では、情報処理装置200が2種類の学習モデルを備える構成について説明するが、3種類以上の学習モデルを備える構成であってもよい。
実施の形態4において、第1学習モデル410は、患者が第1属性(例えば男性)である場合に選択されるべき学習モデルであり、第2学習モデル420は、患者が第2属性(例えば女性)である場合に選択されるべき学習モデルである。
第1学習モデル410及び第2学習モデル420は、実施の形態1において説明した学習モデル300と同様のものであり、SegNetなどの画像セグメンテーションを行うための学習モデルやYOLOなどの物体検出用の学習モデルなどが用いられる。第1学習モデル410は、第1属性を有する患者について撮像された術野画像と、当該術野画像において膵臓部分に該当する画素を画素単位で選択することにより得られる正解データとを複数組含むデータセットを訓練データに用いることにより生成される。同様に、第2学習モデル420は、第2属性を有する患者について撮像された術野画像と、当該術野画像において膵臓部分に該当する画素を画素単位で選択することにより得られる正解データとを複数組含むデータセットを訓練データに用いることにより生成される。学習手順については、実施の形態1と同様であるため、その説明を省略することとする。
図11は実施の形態4に係る情報処理装置200が実行する処理の手順を説明するフローチャートである。情報処理装置200の制御部201は、操作部203を通じて、患者の属性についての情報を受付ける(ステップS401)。
制御部201は、ステップS401で受付けた患者の属性に応じて、学習モデルを選択する(ステップS402)。制御部201は、ステップS401で受付けた属性が第1属性である場合、第1学習モデル410を選択し、ステップS401で受付けた属性が第2属性である場合、第2学習モデル420を選択すればよい。
制御部201は、実施の形態1と同様のステップS403~S407の手順を実行することにより、選択した学習モデル(第1学習モデル410又は第2学習モデル420)を用いて膵臓部分を認識し、膵臓部分の認識画像を術野画像に重畳して表示装置130に表示させる。
なお、第1学習モデル410は、化学療法を受けた患者について選択される学習モデル、第2学習モデル420は、肥満患者について選択される学習モデルであってもよい。患者の年齢、身長、体重などの属性に応じて選択される他の学習モデルを含んでもよい。情報処理装置200は、電子カルテなど外部から入力される術前の事前情報、手術方式、膵臓の部位(膵鉤部、膵頭部、膵体部、膵尾部など)、術野を撮像する撮像装置11Bの種別などの情報を参照して、適宜の学習モデル(例えば第1学習モデル410、第2学習モデル420など)を選択してもよい。
また、第1学習モデル410は、例えばSegNetにより構築された学習モデル、第2学習モデル420は、例えばU-Netにより構築された学習モデルといったように、異なるアルゴリズムで学習された学習モデルであってもよい。この場合、情報処理装置200は、操作部203又は通信部206を通じて、術者による学習モデルの選択を受付けてもよい。
(実施の形態5)
実施の形態5では、入力される術野画像に応じて最適な学習モデルを選択する構成について説明する。
実施の形態5に係る情報処理装置200は、実施の形態4と同様に、第1学習モデル410及び第2学習モデル420を備える。第1学習モデル410は、例えばSegNetにより構築された学習モデル、第2学習モデル420は、例えばU-Netにより構築された学習モデルである。第1学習モデル410及び第2学習モデル420を構築するニューラルネットワークの組み合わせは上記に限らず、任意のニューラルネットワークを用いればよい。
代替的に、第1学習モデル410及び第2学習モデル420は、内部構成が異なる学習モデルであってもよい。例えば、第1学習モデル410及び第2学習モデル420は、同一のニューラルネットワークを用いて構築される学習モデルであるが、層の種類や層の数、ノードの数やノードの接続関係などが異なるものであってもよい。
また、第1学習モデル410及び第2学習モデル420は、異なる訓練データを用いて学習された学習モデルであってもよい。例えば、第1学習モデル410は、第1の専門家がアノテーションした正解データを含む訓練データを用いて学習した学習モデルであり、第2学習モデル420は、第1の専門家とは異なる第2の専門家がアノテーションした正解データを含む訓練データを用いて学習した学習モデルであってもよい。また、第1学習モデル410は、ある医療機関で撮像された術野画像と当該術野画像に対するアノテーションデータ(正解データ)とを含む訓練データを用いて学習した学習モデルであり、第2学習モデル420は別の医療機関で撮像された術野画像と当該術野画像に対するアノテーションデータ(正解データ)とを含む訓練データを用いて学習した学習モデルであってもよい。
情報処理装置200は、術野画像が入力された場合、制御部201において、第1学習モデル410による演算と、第2学習モデル420による演算とを実行する。これらの演算を並行して実行するために、制御部201は、複数の演算部(例えば、複数のGPU)を備えてもよい。制御部201は、第1学習モデル410による演算結果と、第2学習モデル420による演算結果とを解析し、解析結果に基づき膵臓部分の認識に最適な学習モデル(第1学習モデル410又は第2学習モデル420)を選択する。
図12は演算結果の解析手法を説明する説明図である。膵臓部分を認識する各学習モデルからは、各画素が膵臓部分に該当するか否かを示す確率(確信度)が演算結果として出力される。確信度毎に画素数を集計すると、例えば、図12A~図12Cに示すような分布が得られる。図12A~図12Cに示す各グラフの横軸は確信度を表し、縦軸は画素数(画像全体に占める割合)を表している。理想的には、各画素は確信度が1(膵臓部分である確率が100%の場合)又は確信度が0(膵臓部分である確率が0である場合)に分類されるので、理想的な学習モデルから得られる演算結果に基づき確信度の分布を調べると、図12Aに示すような二極化した分布が得られる。
情報処理装置200の制御部201は、第1学習モデル410及び第2学習モデル420から演算結果を取得した場合、確信度毎に画素数を集計し、理想的な分布に近い分布を有する学習モデルを選択する。例えば、第1学習モデル410の演算結果から得られる分布が図12Bに示す分布となり、第2学習モデル420の演算結果から得られる分布が図12Cに示す分布となった場合、後者の方が理想的な分布に近いので、制御部201は、第2学習モデル420を選択する。
制御部201は、例えば、確信度が1又は0に近づくにつれて評価値が高くなるような評価係数を用いて各分布を評価することにより、理想的な分布に近いか否かを判断する。図13は評価係数テーブルの一例を示す図である。このような評価係数テーブルは記憶部202に予め用意される。図13の例では確信度が1又は0に近づくにつれて高い値をとるように評価係数が設定されている。
制御部201は、確信度毎の画素数の集計結果が得られた場合、評価係数を乗じることにより、分布の良否を示すスコアを算出する。図14はスコアの算出結果の一例を示す図である。図14A~図14Cは、図12A~図12Cに示すそれぞれの分布についてスコアを算出した結果を示している。理想的な分布から算出したスコアは最も高くなる。第1学習モデル410の演算結果から求めた分布についてスコアを算出した場合、トータルのスコアは84となり、第2学習モデル420の演算結果から求めた分布についてスコアを算出した場合、トータルのスコアは188となる。この場合、第1学習モデル410よりも第2学習モデル420の方が高いスコアを出せているので、制御部201は、適切な学習モデルとして、第2学習モデル420を選択する。
図15は実施の形態5に係る情報処理装置200が実行する処理の手順を示すフローチャートである。制御部201は、術野画像を取得した場合(ステップS501)、第1学習モデル410による演算を実行し(ステップS502)、第1学習モデル410による演算結果を取得する(ステップS503)。制御部201は、第1学習モデル410について確信度毎の画素数を集計し(ステップS504)、それぞれに評価係数を乗じて分布のスコア(第1スコア)を算出する(ステップS505)。
同様に、制御部201は、ステップS501で取得した術野画像について、第2学習モデル420による演算を実行し(ステップS506)、第2学習モデル420による演算結果を取得する(ステップS507)。制御部201は、第2学習モデル420について確信度毎の画素数を集計し(ステップS508)、それぞれに評価係数を乗じて分布のスコア(第2スコア)を算出する(ステップS509)。
本フローチャートでは、便宜的に、第1学習モデル410についての演算(S502~S505)を実行した後に、第2学習モデル420についての演算(S506~S509)を実行する手順としたが、これらの手順は前後してもよく、同時並行的に実行されてもよい。
制御部201は、第1スコアと第2スコアとを比較し、第1スコアが第2スコア以上であるか否かを判断する(ステップS510)。
第1スコアが第2スコア以上であると判断した場合(S510:YES)、制御部201は、適切な学習モデルとして、第1学習モデル410を選択する(ステップS511)。以後、制御部201は、選択した第1学習モデル410を用いて膵臓部分の認識処理を実行する。
第1スコアが第2スコア未満であると判断した場合(S510:NO)、制御部201は、適切な学習モデルとして、第2学習モデル420を選択する(ステップS512)。以後、制御部201は、選択した第2学習モデル420を用いて膵臓部分の認識処理を実行する。
以上のように、実施の形態5では、より適切な学習モデルを選択して膵臓部分の認識処理を実行することができる。
情報処理装置200は、フォアグラウンドで第1学習モデル410の演算結果を用いた膵臓部分の認識処理を実行し、バックグラウンドで第2学習モデル420による演算を実行してもよい。制御部201は、第1学習モデル410及び第2学習モデル420の評価を定期的なタイミングで行い、評価結果に応じて膵臓部分の認識に用いる学習モデルを切り替えてもよい。また、制御部201は、術者等により指示が与えられたタイミングで、第1学習モデル410及び第2学習モデル420の評価を行い、評価結果に応じて膵臓部分の認識に用いる学習モデルを切り替えてもよい。
実施の形態5では、第1学習モデル410及び第2学習モデル420の評価手法として、評価係数を用いた手法について説明したが、評価係数を用いた手法に限らず、様々な統計学の指標を用いて評価することが可能である。例えば、制御部201は、分布に関して分散や標準偏差を求め、分散や標準偏差が高い場合、分布が二極化していると判断してもよい。また、制御部201は、グラフの縦軸の値として100-画素の割合(%)の値を取り、グラフの尖度や歪度を求めることにより、各モデルの演算結果を評価してもよい。更に、制御部201は、最頻値やパーセンタイル等を使用して各モデルの演算結果を評価してもよい。
(実施の形態6)
実施の形態6では、第1学習モデル410により膵臓部分を認識し、第2学習モデル420により膵臓部分とは区別すべき他の部分を認識する構成について説明する。
図16は実施の形態6に係る情報処理装置200が実行する処理の手順を示すフローチャートである。情報処理装置200の制御部201は、記憶部202から認識処理プログラムPG1及び表示処理プログラムPG2を読み出して実行することにより、以下の手順に従って処理を行う。腹腔鏡手術が開始されると、腹腔鏡11の撮像装置11Bにより術野を撮像して得られる術野画像は、ユニバーサルコード11Dを介してCCU110へ随時出力される。情報処理装置200の制御部201は、CCU110から出力されるフレーム単位の術野画像を入力部204より取得する(ステップS601)。
制御部201は、取得した術野画像を第1学習モデル410に入力し、第1学習モデル410による演算を実行する(ステップS602)。制御部201は、第1学習モデル410による演算結果を参照し、膵臓部分の認識処理を実行する(ステップS603)。制御部201は、第1学習モデル410のソフトマックス層から出力されるラベルの確率が閾値以上(例えば60%以上)の画素を抽出することによって、術野画像に含まれる膵臓部分を認識することができる。
同様に、制御部201は、取得した術野画像を第2学習モデル420に入力し、第2学習モデル420による演算を実行する(ステップS604)。実施の形態6における第2学習モデル420は、膵臓部分とは区別すべき他の部分を認識するために学習された学習モデルであるとする。制御部201は、第2学習モデル420による演算結果を参照し、膵臓部分とは区別すべき他の部分の認識処理を実行する(ステップS605)。制御部201は、第2学習モデル420のソフトマックス層から出力されるラベルの確率が閾値以上(例えば60%以上)の画素を抽出することによって、術野画像に含まれ、膵臓部分とは区別すべき他の部分を認識することができる。制御部201は、第2学習モデル420を用いて、血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を認識してもよく、膵臓に隣接する胃、十二指腸、脾臓などの臓器を認識してもよい。
図16のフローチャートでは、便宜的に、第1学習モデル410による演算を実行した後に、第2学習モデル420による演算を実行する手順としたが、第1学習モデル410による演算と第2学習モデル420による演算とは同時並行的に実施されてもよい。また、第1学習モデル410による演算を実行する演算部(制御部201)とは別に、第2学習モデル420による演算を実行する演算部を別途設けてもよい。
制御部201は、膵臓部分の認識結果と、他の部分の認識結果とが重複したか否かを判断する(ステップS606)。このステップでは、術野画像に含まれる特定の領域が、一方では膵臓部分と認識され、他方では他の部分と認識されたか否かを確認する。具体的には、制御部201は、術野画像内の1つの画素において一方では膵臓部分と認識され、他方では他の部分と認識された場合、認識結果が重複していると判断する。また、膵臓部分と認識された術野画像内の領域と、他の部分と認識された術野画像内の領域とを比較し、認識結果の重複と判断しても良い。例えば両者の重なりが面積比で所定割合以上(例えば40%以上)である場合、認識結果が重複していると判断し、所定割合未満である場合、認識結果は重複していないと判断すればよい。
認識結果が重複していないと判断した場合(S606:NO)、制御部201は、膵臓部分の認識結果を出力する(ステップS607)。具体的には、制御部201は、膵臓部分の認識画像を術野画像上に重畳表示させる。
本実施の形態では、認識結果が重複していないと判断した場合、膵臓部分の認識結果を出力する構成としたが、他の部分の認識結果を併せて出力し、他の部分の認識画像も術野画像上に表示してもよい。
認識結果が重複したと判断した場合(S606:YES)、制御部201は、確信度に応じた表示態様にて認識画像を表示する(ステップS608)。例えば、制御部201は、第1学習モデル410による膵臓部分の認識結果と、第2学習モデル420による他の部分の認識結果とが重複する場合、確信度が高い方の認識結果を選択し、選択した認識結果に基づく認識画像を表示してもよい。
制御部201は、第1学習モデル410による膵臓部分の認識結果と、第2学習モデル420による他の部分の認識結果とが重複する場合、確信度に応じた認識結果を導出し、確信度に応じた表示態様にて認識結果を表示してもよい。図17は確信度に応じた認識結果の表示例を示す模式図である。例えば、術野画像に含まれる特定の領域を第1学習モデル410により認識した結果、95%の確信度で膵臓部分と認識し、同じ領域を第2学習モデル420により認識した結果、他の部分として認識しなかった場合、制御部201は、この領域を例えば白色系の色で着色して術者に提示する。同様に、術野画像に含まれる別の領域を第2学習モデル420により認識した結果、90%の確信度で他の部分と認識し、同じ領域を第1学習モデル410により認識した結果、膵臓部分として認識しなかった場合、制御部201は、この領域を例えば赤色系の色(図面上では黒色)で着色して術者に提示する。一方、術野画像に含まれる更に別の領域を第1学習モデル410により認識した結果、60%の確信度で膵臓部分と認識し、同じ領域を第2学習モデル420により認識した結果、60%の確信度で他の部分と認識した場合、制御部201は、この領域を例えば白色系の色と赤色系の色との中間色(図面上では灰色)で着色して術者に提示する。確信度に応じて色を変更する構成に代えて、彩度、透過度などを変更する構成を採用してもよい。
(実施の形態7)
実施の形態7では、術野画像の動的状態に応じて、膵臓部分の表示及び非表示を切り替える構成について説明する。
情報処理装置200の演算速度によっては、膵臓の認識処理にタイムラグが発生する可能性がある。このため、例えば、鉗子13を用いて病変部を含む部位などを展開させている間やエネルギ処置具12を動かしている間に学習モデル300を用いて認識した膵臓部分を表示させた場合、表示させた膵臓部分の位置と、実際の膵臓の位置との間にズレが生じる可能性がある。そこで、実施の形態7に係る情報処理装置200は、術野画像の動的状態を解析し、動的状態に応じて、認識結果である膵臓部分の表示及び非表示を切り替える。
図18は実施の形態7における表示切替手順を示すフローチャートである。情報処理装置200の制御部201は、例えば、入力部204よりフレーム単位の術野画像を取得する都度、以下の処理を実行する。
情報処理装置200の制御部201は、入力部204より順次入力される術野画像を用いて術野の動的状態を解析する(ステップS701)。制御部201は、例えば、時刻t-1のフレーム画像と時刻tのフレーム画像とに基づいて、オプティカルフローを生成することにより、術野の動的状態を解析することができる。具体的には、制御部201は、術野の動的状態として、術野画像内の特定部位が静止しているか否か、術野画像内に含まれる術具が静止しているか否かを解析する。なお、オプティカルフローの生成には公知の手法が用いられる。
制御部201は、ステップS701の解析結果に基づき、特定部位が静止しているか否かを判断する(ステップS702)。例えば、制御部201は、膵臓部分が静止しているか否かを判断する。代替的に、制御部201は、膵臓部分を含む領域が静止しているか否かを判断してもよく、膵臓部分の周辺の部位が静止しているか否かを判断してもよい。なお、ステップS702では、特定部位が完全に静止していることを要件にする必要はなく、実質的に静止しているとみなせる場合(オプティカルフローより算出される速度又は加速度が設定値未満の場合)、特定部位が静止していると判断すればよい。
制御部201は、ステップS701の解析結果に基づき、術具が静止しているか否かを判断する(ステップS703)。ステップS703では、術具が完全に静止していることを要件にする必要はなく、実質的に静止しているとみなせる場合(速度が設定値未満の場合や加速度が設定値未満の場合)、術具が静止していると判断すればよい。
術野画像内で特定部位が静止しており(S702:YES)、かつ、術具が静止していると判断した場合(S703:YES)、制御部201は、認識した膵臓部分を術野画像上で判別可能に表示する(ステップS704)。具体的には、制御部201は、学習モデル300を用いて認識した膵臓部分を判別可能に表示するために、該当部分の画素に特定の色を割り当て、膵臓以外の画素には背景が透過するような透過度を設定した認識画像を生成する。制御部201は、術野画像と共に、生成した認識画像を表示装置130へ出力し、術野画像上に認識画像を重ねて表示させることにより、膵臓部分を表示させる。
術野画像内で特定部位が静止していないと判断した場合(S702:NO)、又は、術野画像内で術具が静止していないと判断した場合(S703:NO)、制御部201は、認識した膵臓部分を非表示にして(ステップS705)、本フローチャートによる処理を終了する。制御部201は、認識した膵臓部分の画素についても背景が透過するような透過度を設定すればよい。制御部201は、術野画像と共に、生成した認識画像を表示装置130へ出力し、術野画像上に認識画像を重ねて表示させることにより、膵臓部分を非表示することができる。透過度を変更して膵臓部分を非表示にする構成に代えて、認識画像の出力を停止する構成としてもよい。
なお、実施の形態7では、特定部位及び術具の双方が静止していると判断した場合に、認識した膵臓部分を表示する構成としたが、特定部位及び術具の何れか一方が静止していると判断した場合、認識した膵臓部分を表示する構成としてもよい。
以上のように、実施の形態7では、特定部位及び術具が静止している場合に、膵臓部分を表示させるので、タイムラグによる違和感を生じさせないような画像を術者に提供できる。
(実施の形態8)
実施の形態8では、膵臓部分の表示及び非表示を周期的に切り替える構成について説明する。
図19は実施の形態8における表示例を説明する説明図である。実施の形態8に係る情報処理装置200は、術野画像より膵臓部分を認識した場合、認識した膵臓部分の表示と、膵臓部分の非表示とを周期的に切り替える。一例として、図19の上図には膵臓部分を表示した状態を示し、図19の下図には膵臓部分を非表示とした状態を示している。実施の形態8では、図19の上図に示すような表示状態と、図19の下図に示すような非表示状態とを周期的に切り替える。
図20は実施の形態8に係る情報処理装置200が実行する処理の手順を示すフローチャートである。情報処理装置200の制御部201は、学習モデル300を用いて膵臓部分を認識した場合、術野画像上に膵臓部分を重畳して表示する(ステップS801)。制御部201は、内蔵クロックにより膵臓部分の表示時間を計時し、第1設定時間が経過したか否かを判断する(ステップS802)。第1設定時間は、装置内で予め設定された値(例えば2秒間)であってもよく、操作部203を通じて術者により設定された値であってもよい。第1設定時間が経過していないと判断した場合(S802:NO)、制御部201は、処理をS801へ戻し、膵臓部分の表示を継続する。
第1設定時間が経過したと判断した場合(S802:YES)、制御部201は、認識した膵臓部分を非表示にする(ステップS803)。制御部201は、膵臓部分の透過度を変更することによって非表示にしてもよく、膵臓部分の認識画像の出力を停止することによって非表示にしてもよい。
制御部201は、膵臓部分を非表示とした時間を内蔵クロックにより計時し、第2設定時間が経過したか否かを判断する(ステップS804)。第2設定時間は、装置内で予め設定された値(例えば2秒間)であってもよく、操作部203を通じて術者により設定された値であってもよい。なお、第2設定時間は、第1設定時間と同じ値であってもよく、第1設定時間と異なる値であってもよい。第2設定時間が経過していないと判断した場合(S804:NO)、制御部201は、処理をS803へ戻し、膵臓部分の非表示を継続する。
第2設定時間が経過したと判断した場合(S804:YES)、制御部201は、学習モデル300による認識結果の表示を終了するか否かを判断する(ステップS805)。術野画像の表示を停止する場合、若しくは、取得した術野画像に膵臓部分が含まれていない場合、制御部201は、認識結果の表示を終了すると判断する。制御部201は、表示を終了しない場合(S805:NO)、処理をステップS801へ戻し、表示を終了する場合(S805:YES)、本フローチャートによる処理を終了する。
以上のように、実施の形態8では、膵臓部分の表示状態及び非表示状態を周期的に切り替えるので、術者に対して視覚支援を行えると共に、術者自身の目視により膵臓の状態を確認することが可能となり、手術時の安全性が向上する。
なお、実施の形態8では、膵臓部分の表示状態及び非表示状態の2つの状態を切り替える構成としたが、表示状態から非表示状態への切り替え、及び非表示状態から表示状態への切り替えを段階的に行ってもよい。例えば、制御部201は、膵臓部分の表示期間において、膵臓部分の透過度を徐々に高くしていくことにより、表示状態から非表示状態へ段階的に切り替えてもよく、膵臓部分の非表示期間において、膵臓部分の透過度を徐々に低くしていくことにより、非表示状態から表示状態へ段階的に切り替えてもよい。
(実施の形態9)
実施の形態9では、膵臓部分の表示に対してエフェクトを施す構成について説明する。
図21は実施の形態9における第1表示例を説明する説明図である。第1表示例は、膵臓部分の表示サイズが徐々に大きくなるようにエフェクトを施した例を示している。制御部201は、膵臓部分を認識した場合、本来表示されるべきサイズよりも小さなサイズの表示領域(図21の例では楕円領域)を設定し、その表示領域に収まる膵臓部分を表示する。制御部201は、表示領域内の膵臓部分の透過度を1(=不透過)に設定し、表示領域外の膵臓部分の透過度を0(=完全透過)に設定することにより、表示領域内にのみ膵臓部分を表示することができる。制御部201は、時間の経過と共に表示領域のサイズを徐々に拡大していくことにより、最終的に認識した膵臓部分の全体を表示する。制御部201は、表示領域の縮小及び拡大を繰り返し実行してもよい。また、制御部201は、患者の脈拍と同期するように、表示領域の縮小及び拡大を繰り返してもよい。
図22は実施の形態9における第2表示例を説明する説明図である。第2表示例は、左端から順に膵臓部分が表示されるようにエフェクトを施した例を示している。制御部201は、膵臓部分を認識した場合、膵臓部分の左端に矩形状の表示領域を設定し、その表示領域に収まる膵臓部分を表示する。制御部201は、表示領域内の膵臓部分の透過度を1(=不透過)に設定し、表示領域外の膵臓部分の透過度を0(=完全透過)に設定することにより、表示領域内にのみ膵臓部分を表示することができる。制御部201は、時間の経過と共に表示領域のサイズを右方向に拡大していくことにより、最終的に認識した膵臓部分の全体を表示する。制御部201は、表示領域の縮小及び拡大を繰り返し実行してもよい。また、制御部201は、患者の脈拍と同期するように、表示領域の縮小及び拡大を繰り返してもよい。第2表示例では、膵臓部分の左端から右方向に表示するエフェクトについて説明したが、右端から左方向に表示するエフェクトを施してもよく、下端(上端)から上方向(下方向)に表示するエフェクトを施してもよい。
実施の形態9では、膵臓部分の表示の際にエフェクトを施すので、膵臓部分が視認され易くなり、良好に視覚支援を行うことができる。
なお、実施の形態9では、表示サイズを徐々に拡大するエフェクトについて説明したが、認識した膵臓部分の輪郭(境界)を強調するエフェクトを施してもよく、膵臓部分の輪郭(境界)を強調すると共に、輪郭(境界)の内部を表示状態から非表示状態に徐々に遷移させ、輪郭(境界)のみを残像として残すエフェクトを施してもよい。
(実施の形態10)
実施の形態10では、情報処理装置200が備えるユーザインタフェースについて説明する。
図23は情報処理装置200が備えるユーザインタフェースの構成例を示す模式図である。図23は、膵臓部分の認識画像を表示する表示領域131と、認識画像の表示態様を制御するためのユーザインタフェースとを並置した例を示している。図23に示すユーザインタフェースは、モデル選択部132、表示方法選択部133、閾値設定部134、透過度設定部135、平均化指示部136、及び表示色選択部137を備える。これらのユーザインタフェースが備える各種ボタンやスライダは、情報処理装置200が備える操作部203によって操作される。
モデル選択部132は、学習モデル300を構築するニューラルネットワークを選択するための選択ボタンを備える。図23の例は「U-Net」が選択された状態を示している。また、モデル選択部132は、実施の形態6において説明した第1学習モデル410及び第2学習モデル420の何れか一方の選択を受付けるための選択ボタンを備えるものであってもよい。更に、モデル選択部132は、患者の属性、術前の事前情報、手術方式、膵臓の部位、術野を撮像する撮像装置の種類などに応じて、推奨するモデルをハイライト表示してもよい。
表示方法選択部133は、オーバーレイ表示及びソフトマップ表示の何れか一方の選択を受付けるための選択ボタンを備える。実施の形態2において説明したように、オーバーレイ表示は、膵臓部分を同一色で一様に表示する表示方法であり、ソフトマップ表示は、確信度に応じて透過度を変更する表示方法である。図23の例は「オーバーレイ」表示が選択された状態を示している。
閾値設定部134は、注目画素が膵臓に該当するか否かを判定するための閾値を設定するスライダを備える。スライダは、左側へスライドさせると閾値が小さく(膵臓と認識され易く)なり、右側へスライドさせると閾値が大きく(膵臓と認識されにくく)なるように構成される。
透過度設定部135は、認識画像の透過度を変更するためのスライダを備える。スライダは、左側へスライドさせると透過度が低くなり、右側へスライドさせると透過度が高くなるように構成される。
平均化指示部136は、表示色の平均化をオン又はオフするための指示ボタンを備える。表示色の平均化がオンされた場合、制御部201は、認識画像(膵臓部分)について設定された表示色と、背景の術野画像の表示色とを平均化し、平均化した色を膵臓部分の表示色として表示させる。例えば、膵臓部分について設定されている表示色を(R1,G1,B1)、背景の術野画像における膵臓部分の表示色を(R2,G2,B2)とした場合、制御部201は、当該膵臓部分を((R1+R2)/2,(G1+G2)/2,(B1+B2)/2)の色で着色して表示すればよい。代替的に、重み係数W1,W2を導入し、認識した膵臓部分を(W1×R1+W2×R2,W1×G1+W2×G2,W1×B1+W2×B2)の色で着色して表示してもよい。
表示色選択部137は、膵臓部分の表示色を変更するためのスライダ及びカラーパレットを備える。表示色選択部137は、スライダによって指定された色を膵臓部分の表示色として設定してもよく、カラーパレットにより選択された色を膵臓部分の表示色として設定してもよい。また、表示色選択部137は、ユーザによって変更された表示色をデフォルトの表示色(例えば、白色系の色)に戻すデフォルトボタンを備えてもよい。
情報処理装置200の制御部201は、モデル選択部132、表示方法選択部133、閾値設定部134、透過度設定部135、平均化指示部136、及び表示色選択部137を通じて、表示態様の変更指示を受付けた場合、変更指示に応じて、表示領域131に表示している膵臓部分の認識画像の表示態様を変更すればよい。
図23の例では、モデル選択部132、表示方法選択部133、閾値設定部134、透過度設定部135、平均化指示部136、及び表示色選択部137を備える構成としたが、認識画像の表示態様を制御するためのユーザインタフェースはこれらに限定されない。例えば、ユーザインタフェースとして、学習モデル300(又は学習モデル410,420)による推論の可否を受付ける選択部を備えてもよい。更に、ユーザインタフェースとして、推論の開始時間を設定する設定部を備えてもよい。また、実施の形態8において説明した第1設定時間及び第2設定時間を設定する設定部を備えてもよい。
また、制御部201は、図23に示すようなユーザインタフェースを通じて、表示態様の変更を受付け、デフォルトの設定から変更が生じている場合、適宜のタイミングで、表示態様が変更されている旨を術者に通知してもよい。例えば、制御部201は、情報処理装置200の起動時や手術の開始時において、表示態様のデフォルトの設定値と、表示態様の現在の設定値とを比較し、両者に差異がある場合、その旨を表示装置130に表示させたり、術者が携帯する携帯端末に通知したりすればよい。
今回開示された実施形態は、全ての点において例示であって、制限的なものではないと考えられるべきである。また、本発明は、上述した各実施の形態に限定されるものではなく、複数の実施の形態を組み合わせて構成したり、異なる実施の形態に示される複数の構成を組み合わせて構成したりすることも可能である。本発明の範囲は、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
10 トロッカ
11 腹腔鏡
12 エネルギ処置具
13 鉗子
110 カメラコントロールユニット(CCU)
120 光源装置
130 表示装置
140 録画装置
200 情報処理装置
201 制御部
202 記憶部
203 操作部
204 入力部
205 出力部
206 通信部
300 学習モデル
PG1 認識処理プログラム
PG2 表示処理プログラム
PG3 学習処理プログラム

Claims (14)

  1. コンピュータに、
    鏡視下手術の術野を撮像して得られる術野画像を取得し、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力し、
    前記学習モデルより出力される情報に基づき、前記術野画像に含まれる膵臓部分として、膵臓の外縁により定まる領域から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた膵臓部分を認識し、
    前記部分を除いて認識した膵臓部分を前記術野画像上に表示する
    処理を実行させるためのコンピュータプログラム。
  2. コンピュータに、
    鏡視下手術の術野を撮像して得られる術野画像を取得し、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識し、
    前記術野画像内の特定部位の動的状態に応じて、前記膵臓部分の表示及び非表示を切り替える
    処理を実行させるためのコンピュータプログラム。
  3. コンピュータに、
    鏡視下手術の術野を撮像して得られる術野画像を取得し、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識し、
    前記術野画像内に含まれる術具の動的状態に応じて、前記膵臓部分の表示及び非表示を切り替える
    処理を実行させるためのコンピュータプログラム。
  4. 前記コンピュータに、
    前記膵臓部分の認識結果の確信度に応じて、前記膵臓部分の表示態様を変更する
    処理を実行させるための請求項1から請求項の何れか1つに記載のコンピュータプログラム。
  5. 前記コンピュータに、
    前記膵臓部分について設定された表示色と、前記術野画像における膵臓部分の表示色とを平均化し、
    認識した膵臓部分を、平均化した色により着色して表示する
    処理を実行させるための請求項1から請求項の何れか1つに記載のコンピュータプログラム。
  6. 前記学習モデルは、膵臓部分を認識するための複数種の学習モデルを含み、
    前記コンピュータに、
    前記術野画像を入力した場合に各学習モデルから出力される情報に基づいて、各学習モデルを評価し、
    評価結果に基づいて選択した学習モデルを用いて、前記術野画像に含まれる膵臓部分を認識する
    処理を実行させるための請求項1から請求項3の何れか1つに記載のコンピュータプログラム。
  7. 前記コンピュータに、
    前記膵臓部分の表示及び非表示を周期的に切り替える
    処理を実行させるための請求項1から請求項の何れか1つに記載のコンピュータプログラム。
  8. 前記コンピュータに、
    前記膵臓部分の表示に対して所定のエフェクトを施す
    処理を実行させるための請求項1から請求項の何れか1つに記載のコンピュータプログラム。
  9. コンピュータに、
    鏡視下手術の術野を撮像して得られる術野画像を取得し、
    術野画像の入力に応じて、前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された第1学習モデル、及び前記術野画像に含まれる前記膵臓部分とは区別すべき他の部分に関する情報を出力するよう学習された第2学習モデルに、取得した術野画像を各別に入力して、該術野画像に含まれる膵臓部分及び他の部分を認識し、
    前記第1学習モデルによる認識結果の確信度と、前記第2学習モデルによる認識結果の確信度との高低に応じて、前記術野画像上での前記膵臓部分及び前記他の部分の表示態様を設定し、
    設定した表示態様にて前記膵臓部分及び前記他の部分を前記術野画像上に表示すると共に、前記第1学習モデルを用いて膵臓部分と認識した領域と、前記第2学習モデルを用いて他の部分と認識した領域とが重複する場合、確信度が高い方の認識結果を採用し、前記膵臓部分及び前記他の部分の何れか一方を選択的に表示する
    処理を実行させるためのコンピュータプログラム。
  10. コンピュータに、
    鏡視下手術の術野を撮像して得られる術野画像を取得し、
    術野画像の入力に応じて、前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された第1学習モデル、及び前記術野画像に含まれる前記膵臓部分とは区別すべき他の部分に関する情報を出力するよう学習された第2学習モデルに、取得した術野画像を各別に入力して、該術野画像に含まれる膵臓部分及び他の部分を認識し、
    前記第1学習モデルによる認識結果の確信度と、前記第2学習モデルによる認識結果の確信度との高低に応じて、前記術野画像上での前記膵臓部分及び前記他の部分の表示態様を設定し、
    設定した表示態様にて前記膵臓部分及び前記他の部分を前記術野画像上に表示すると共に、前記第1学習モデルを用いて膵臓部分と認識した領域と、前記第2学習モデルを用いて他の部分と認識した領域とが重複する場合、夫々の確信度に応じて表示色を混合し、混合した表示色にて前記領域を着色して表示する
    処理を実行させるためのコンピュータプログラム。
  11. コンピュータが、
    鏡視下手術の術野を撮像して得られる術野画像と、該術野画像内の膵臓の外縁により定まる領域から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた膵臓部分を示す正解データとを含む訓練データを取得し、
    取得した訓練データのセットに基づき、術野画像を入力した場合、膵臓の外縁により定まる領域から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた膵臓部分に関する情報を出力する学習モデルを生成する
    学習モデルの生成方法。
  12. 鏡視下手術の術野を撮像して得られる術野画像を取得する取得部と、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分として、膵臓の外縁により定まる領域から、膵臓表面に現れる血管、脂肪、小葉間の溝、又は小葉間の影に該当する部分を除いた膵臓部分を認識する認識部と、
    前記部分を除いて認識した膵臓部分を前記術野画像上に表示する表示部と
    を備える情報処理装置。
  13. 鏡視下手術の術野を撮像して得られる術野画像を取得する取得部と、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識する認識部と、
    該認識部により認識した膵臓部分を表示する表示部と
    を備え、
    前記術野画像内の特定部位の動的状態に応じて、前記膵臓部分の表示及び非表示を切り替える、情報処理装置。
  14. 鏡視下手術の術野を撮像して得られる術野画像を取得する取得部と、
    術野画像の入力に応じて前記術野画像に含まれる膵臓部分に関する情報を出力するよう学習された学習モデルに、取得した術野画像を入力して、該術野画像に含まれる膵臓部分を認識する認識部と、
    該認識部により認識した膵臓部分を表示する表示部と
    を備え、
    前記術野画像内に含まれる術具の動的状態に応じて、前記膵臓部分の表示及び非表示を切り替える、情報処理装置。
JP2022568486A 2021-11-04 2022-11-02 コンピュータプログラム、学習モデルの生成方法、及び情報処理装置 Active JP7311936B1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021180519 2021-11-04
JP2021180519 2021-11-04
PCT/JP2022/041056 WO2023080170A1 (ja) 2021-11-04 2022-11-02 コンピュータプログラム、学習モデルの生成方法、及び情報処理装置

Publications (2)

Publication Number Publication Date
JPWO2023080170A1 JPWO2023080170A1 (ja) 2023-05-11
JP7311936B1 true JP7311936B1 (ja) 2023-07-20

Family

ID=86241574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022568486A Active JP7311936B1 (ja) 2021-11-04 2022-11-02 コンピュータプログラム、学習モデルの生成方法、及び情報処理装置

Country Status (2)

Country Link
JP (1) JP7311936B1 (ja)
WO (1) WO2023080170A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011000173A (ja) * 2009-06-16 2011-01-06 Toshiba Corp 内視鏡検査支援システム
WO2019054045A1 (ja) * 2017-09-15 2019-03-21 富士フイルム株式会社 医療画像処理装置、医療画像処理方法及び医療画像処理プログラム
JP2020509455A (ja) * 2017-02-28 2020-03-26 ヴェリリー ライフ サイエンシズ エルエルシー プログラム可能光源を使用する画像のマルチクラス分類のシステムおよび方法
WO2020110278A1 (ja) * 2018-11-30 2020-06-04 オリンパス株式会社 情報処理システム、内視鏡システム、学習済みモデル、情報記憶媒体及び情報処理方法
WO2020174778A1 (ja) * 2019-02-28 2020-09-03 富士フイルム株式会社 超音波内視鏡システムおよび超音波内視鏡システムの作動方法
JP2020156903A (ja) * 2019-03-27 2020-10-01 Hoya株式会社 内視鏡用プロセッサ、情報処理装置、プログラム、情報処理方法および学習モデルの生成方法
WO2021153797A1 (ja) * 2020-01-30 2021-08-05 アナウト株式会社 コンピュータプログラム、学習モデルの生成方法、画像処理装置、及び手術支援システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011000173A (ja) * 2009-06-16 2011-01-06 Toshiba Corp 内視鏡検査支援システム
JP2020509455A (ja) * 2017-02-28 2020-03-26 ヴェリリー ライフ サイエンシズ エルエルシー プログラム可能光源を使用する画像のマルチクラス分類のシステムおよび方法
WO2019054045A1 (ja) * 2017-09-15 2019-03-21 富士フイルム株式会社 医療画像処理装置、医療画像処理方法及び医療画像処理プログラム
WO2020110278A1 (ja) * 2018-11-30 2020-06-04 オリンパス株式会社 情報処理システム、内視鏡システム、学習済みモデル、情報記憶媒体及び情報処理方法
WO2020174778A1 (ja) * 2019-02-28 2020-09-03 富士フイルム株式会社 超音波内視鏡システムおよび超音波内視鏡システムの作動方法
JP2020156903A (ja) * 2019-03-27 2020-10-01 Hoya株式会社 内視鏡用プロセッサ、情報処理装置、プログラム、情報処理方法および学習モデルの生成方法
WO2021153797A1 (ja) * 2020-01-30 2021-08-05 アナウト株式会社 コンピュータプログラム、学習モデルの生成方法、画像処理装置、及び手術支援システム

Also Published As

Publication number Publication date
JPWO2023080170A1 (ja) 2023-05-11
WO2023080170A1 (ja) 2023-05-11

Similar Documents

Publication Publication Date Title
US20220334787A1 (en) Customization of overlaid data and configuration
EP3463032B1 (en) Image-based fusion of endoscopic image and ultrasound images
JP7166430B2 (ja) 医用画像処理装置、プロセッサ装置、内視鏡システム、医用画像処理装置の作動方法及びプログラム
JP7194889B2 (ja) コンピュータプログラム、学習モデルの生成方法、手術支援装置、及び情報処理方法
JP7457415B2 (ja) コンピュータプログラム、学習モデルの生成方法、及び支援装置
JP7153974B2 (ja) コンピュータプログラム、学習モデルの生成方法、及び画像処理装置
KR101595962B1 (ko) 대장내시경 수술 시뮬레이션시스템
JP7289373B2 (ja) 医療画像処理装置、内視鏡システム、診断支援方法及びプログラム
US20220215539A1 (en) Composite medical imaging systems and methods
JP2010069208A (ja) 画像処理装置、画像処理方法および画像処理用プログラム
JP7146318B1 (ja) コンピュータプログラム、学習モデルの生成方法、及び手術支援装置
US20220096164A1 (en) Systems and methods for facilitating optimization of an imaging device viewpoint during an operating session of a computer-assisted operation system
JP7311936B1 (ja) コンピュータプログラム、学習モデルの生成方法、及び情報処理装置
CN117956939A (en) Computer program, learning model generation method, and information processing device
JP7368922B2 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
US20210378748A1 (en) Anatomical structure visualization systems and methods
JP2021045337A (ja) 医用画像処理装置、プロセッサ装置、内視鏡システム、医用画像処理方法、及びプログラム
US20230395250A1 (en) Customization, troubleshooting, and wireless pairing techniques for surgical instruments
US20230306592A1 (en) Image processing device, medical diagnosis device, endoscope device, and image processing method
CN115023171A (zh) 学习用医疗图像数据生成装置、学习用医疗图像数据生成方法以及程序
EP4356396A1 (en) Customization, troubleshooting, and wireless pairing techniques for surgical instruments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221109

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230526

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230630

R150 Certificate of patent or registration of utility model

Ref document number: 7311936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150