WO2022249572A1

WO2022249572A1 - 画像処理装置、画像処理方法及び記録媒体

Info

Publication number: WO2022249572A1
Application number: PCT/JP2022/005246
Authority: WO
Inventors: 翔稲吉; 創太正満; 悟士尾崎
Original assignee: ソニーグループ株式会社
Priority date: 2021-05-26
Filing date: 2022-02-10
Publication date: 2022-12-01

Abstract

本開示に係る一形態の画像処理装置（４０）は、体内の画像である入力画像から機械学習に関する中間特徴量を抽出する特徴量抽出部（４２ａ）と、前記中間特徴量に基づいて前記入力画像の画像重要度を算出する重要度算出部（４２ｂ）と、前記画像重要度に基づいて前記入力画像を保存する画像蓄積部（４２ｃ）と、を備える。

Description

画像処理装置、画像処理方法及び記録媒体

　本開示は、画像処理装置、画像処理方法及び記録媒体に関する。

　腹腔鏡下内視鏡等の手術環境において、機械学習によって学習された、術具等を認識する認識器が手術の補助をする状況が想定される。一般に、機械学習によって学習された認識器は、照明条件や使用している術具の違いといった、学習環境と推論環境との差異によって認識性能が低下する傾向がある。推論環境下では、現在撮影中の画像が認識器の学習にとって有用なデータなのか否か（重要度）を判断することはできない。このため、認識性能の向上に寄与するデータを効率的に得ることは難しい。一方で、機械学習においては、ラベルなしデータの学習に対する有用性を利用し、能動学習を行う際のラベリングの優先順位付けをする技術が提案されている（例えば、特許文献１参照）。

特開２０２０－１５４６０２号公報

　しかしながら、前述の技術では、リアルタイムでデータ（画像）の重要度を得ることができず、認識性能の向上に寄与するデータを効率的に得ることは難しい。例えば、前述の技術では、学習モデルの出力が信頼できることが前提とされ、追加のラベル付けが必要になるため、認識性能の向上に寄与するデータを効率的に得ることは困難である。

　そこで、本開示では、認識性能の向上に寄与するデータを効率的に得ることが可能な画像処理装置、画像処理方法及び記録媒体を提案する。

　本開示の実施形態に係る画像処理装置は、体内の画像である入力画像から機械学習に関する中間特徴量を抽出する特徴量抽出部と、前記中間特徴量に基づいて前記入力画像の画像重要度を算出する重要度算出部と、前記画像重要度に基づいて前記入力画像を保存する画像蓄積部と、を備える。

　本開示の実施形態に係る画像処理方法は、体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、前記画像重要度に基づいて前記入力画像を保存することと、を含む。

　本開示の実施形態に係る記録媒体は、コンピュータに、体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、前記画像重要度に基づいて前記入力画像を保存することと、を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。

実施形態に係る画像処理システムの概略構成の一例を示す図である。実施形態に係る事前学習処理の一例を説明するための図である。実施形態に係る推論処理の一例を説明するための図である。実施形態に係る学習処理の流れの一例を示すフローチャートである。実施形態に係る推論処理の流れの一例を示すフローチャートである。実施形態に係る学習済データ及び入力画像の個々の中間特徴量の比較の一例を説明するための図である。実施形態に係る画像の表示の一例を説明するための図である。実施形態に係る学習モデル適用処理の一例を説明するための第１の図である。実施形態に係る学習モデル適用処理の一例を説明するための第２の図である。コンピュータの概略構成の一例を示す図である。内視鏡システムの概略的な構成の一例を示す図である。図１１に示すカメラ及びＣＣＵの機能構成の一例を示すブロック図である。顕微鏡手術システムの概略的な構成の一例を示す図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本開示に係る装置やシステム、方法、記録媒体等が限定されるものではない。また、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、基本的に同一の符号を付することにより重複説明を省略する。

　以下に説明される１又は複数の実施形態（実施例、変形例を含む）は、各々が独立に実施されることが可能である。一方で、以下に説明される複数の実施形態は少なくとも一部が他の実施形態の少なくとも一部と適宜組み合わせて実施されてもよい。これら複数の実施形態は、互いに異なる新規な特徴を含み得る。したがって、これら複数の実施形態は、互いに異なる目的又は課題を解決することに寄与し得、互いに異なる効果を奏し得る。

　以下に示す項目順序に従って本開示を説明する。
　１．実施形態
　１－１．画像処理システムの構成例
　１－２．学習処理の一例
　１－３．推論処理の一例
　１－４．学習済データ及び入力画像の個々の中間特徴量の比較例
　１－５．画像の表示例
　１－６．学習モデル適用処理の一例
　１－７．作用・効果
　２．他の実施形態
　３．コンピュータの構成例
　４．応用例
　５．付記

　＜１．実施形態＞
　＜１－１．画像処理システムの構成例＞
　本実施形態に係る画像処理システム１０の構成例について図１から図３を参照して説明する。図１は、本実施形態に係る画像処理システム１０の概略構成の一例を示す図である。図２は、本実施形態に係る事前学習処理の一例を説明するための図である。図３は、本実施形態に係る推論処理の一例を説明するための図である。

　図１に示すように、画像処理システム１０は、内視鏡２０と、学習装置３０と、画像処理装置４０と、ストレージ装置５０と、表示装置６０とを備える。この画像処理システム１０は、患者等の被写体Ａの画像（例えば、体内の画像）を処理するシステムである。

　（内視鏡）
　内視鏡２０は、ＲＧＢカメラ２１を有する。ＲＧＢカメラ２１は、例えば、マトリクス状に配列する複数の画素と、複数の画素のそれぞれへ入射した光に基づく像を画素信号として出力する周辺回路部とを主に有する（いずれも図示省略）。このＲＧＢカメラ２１は、被写体Ａの体内の撮影対象を動画や静止画の形式で撮影する撮像部として機能する。例えば、ＲＧＢカメラ２１は、被写体Ａの腹腔内環境の画像（一例として、腹腔内の各種の術具や臓器を含む術野画像）を得ることができる。また、ＲＧＢカメラ２１は、撮像した画像（例えば、画像に対応する画素信号）を画像処理装置４０に送信する。

　詳細には、ＲＧＢカメラ２１は、カラー撮影可能なイメージセンサであり、例えば、青色光、緑色光及び赤色光を検出することが可能なＢａｙｅｒ配列を有するイメージセンサである。また、ＲＧＢカメラ２１は、例えば、４Ｋ以上の高解像度の画像の撮影に対応可能なイメージセンサであることが好ましい。このようなイメージセンサを用いることで、術部の画像が高解像度で得られるので、執刀医等の術者は、その術部の様子をより詳細に把握することができ、手術を円滑に進行することができる。

　なお、内視鏡２０は、例えば、斜視鏡、広角／切り出し機能付きの前方直視鏡、先端湾曲機能付きの内視鏡、他方向同時撮影機能付きの内視鏡であってもよく、また、軟性鏡や硬性鏡であってもよく、特に限定されるものではない。また、ＲＧＢカメラ２１は、３Ｄ表示に対応する右目用及び左目用の画像をそれぞれ取得するための１対のイメージセンサから構成されてもよい（ステレオ方式）。３Ｄ表示を行う場合、執刀医等の術者は術部における生体組織（臓器）の奥行きをより正確に把握することや、生体組織までの距離を把握することが可能になる。

　（学習装置）
　学習装置３０は、入出力部３１と、学習部３２と、制御部３３とを備える。

　入出力部３１は、事前学習用のラベル付きデータ（画像データ）やストレージ装置５０内のデータ（画像データ）を受けて学習部３２に入力する。また、入出力部３１は、学習部３２による学習に関する各種データをストレージ装置５０に対して出力する。

　学習部３２は、事前学習用のラベル付きデータでＤＮＮ（ディープニューラルネットワーク）等の機械学習により事前学習を行い、学習済モデルを構築して中間特徴量等と共に入出力部３１を介してストレージ装置５０に保存する。

　例えば、図２に示すように、学習部３２は、事前学習時、環境Ａにおけるラベル付きデータ（画像データ）をＤＮＮに入力し、推論結果及び中間特徴量を求め、求めた推論結果及び中間特徴量をストレージ装置５０に保存する。推論結果の取得では、例えば、正解ラベルとの誤差を逆伝播して学習を行う。中間特徴量の取得では、例えば、学習完了後、各データに対する中間特徴量（画像毎の中間特徴量）を保存する。なお、各データにおいて、中間特徴量の平均や分散（例えば、平均ベクトル）、あるいは、代表値等が保存されてもよい。また、推論を行う問題設定としては、例えば、画像内の術具検出や臓器のセグメンテーション等がある。

　図１に戻り、学習部３２は、特徴量抽出部３２ａと、更新部３２ｂとを有する。特徴量抽出部３２ａは、ラベル付きデータやラベルなしデータ等の画像データの中間特徴量を抽出する。更新部３２ｂは、画像取得の環境（例えば、環境Ａや環境Ｂ等）の違いに応じて、ストレージ装置５０に保存された学習済モデル及び中間特徴量を更新する。環境の違いとしては、例えば、病院の違いや手術室の違い等がある。例えば、病院又は手術室毎に照明条件や術具等が異なる。

　制御部３３は、学習装置３０の各部（例えば、入出力部３１や学習部３２等）を制御する。例えば、制御部３３は、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等のコンピュータによって構成され、学習装置３０の各部の動作を統括的に制御することが可能である。

　（画像処理装置）
　画像処理装置４０は、入出力部４１と、認識部４２と、制御部４３とを備える。

　入出力部４１は、内視鏡２０から画像データ（画素信号）を受けて認識部４２に入力し、認識部４２による認識に関する各種データをストレージ装置５０に出力し、また、表示装置６０に画像データ等を出力する。

　認識部４２は、ラベルなしデータ（画像データ）でＤＮＮ等の機械学習により学習を行い、推定結果及び中間特徴量を求め、入出力部４１を介してストレージ装置５０に保存する。これらの推定結果や中間特徴量等は、ドメイン適応学習等の追加学習に用いられる。

　例えば、図３に示すように、認識部４２は、環境Ｂにおけるラベルなしデータ（画像データ）をＤＮＮに入力し、推定結果及び中間特徴量を求め、求めた推定結果及び中間特徴量をストレージ装置５０に保存する。また、認識部４２は、求めた環境Ｂにおけるラベルなしデータの中間特徴量と、環境Ａにおけるラベル付けデータの中間特徴量との差分を計算し、その中間特徴量同士の差分を所定の変換式により変換して画像重要度を求める。変換式は、例えば、画像重要度＝差分／定数である。この関数のような各種関数を変換式として適用することが可能である。なお、推論結果の取得や中間特徴量の取得の方法、推論を行う問題設定等は、前述の学習装置３０の学習部３２と同じである。

　図１に戻り、認識部４２は、特徴量抽出部４２ａと、重要度算出部４２ｂと、画像蓄積部４２ｃとを有する。特徴量抽出部４２ａは、ラベルなしデータ等の画像データ（例えば、体内の画像である入力画像）から中間特徴量を抽出する。重要度算出部４２ｂは、画像データの中間特徴量に基づいて画像（例えば、ＲＧＢ画像）の画像重要度を算出する。画像蓄積部４２ｃは、画像重要度に基づいて画像をストレージ装置５０に保存する。例えば、画像蓄積部４２ｃは、画像重要度が高い画像を保存して蓄積する。

　制御部４３は、画像処理装置４０内の各部（例えば、入出力部４１や認識部４２等）を制御する。例えば、制御部４３は、ＣＰＵやＭＰＵ等のコンピュータによって構成され、画像処理装置４０の各部の動作を統括的に制御することが可能である。また、制御部４３は、内視鏡２０や表示装置６０等を制御する。例えば、制御部４３は、内視鏡２０や表示装置６０に対してそれぞれ制御信号を送信し、それらの駆動を制御することが可能である。内視鏡２０に対する制御信号は、倍率や焦点距離等、撮像条件に関する情報を含んでもよい。

　（ストレージ装置）
　ストレージ装置５０は、各種データ、例えば、ＲＧＢカメラ２１によって撮像された画像（例えば、ＲＧＢ画像等）、学習済モデル、画像毎の中間特徴量等を保存する。このストレージ装置５０は、例えば、ＨＤＤ（ハードディスクドライブ）やＳＤＤ（ソリッドステートドライブ）等の記憶装置により実現される。

　（表示装置）
　表示装置６０は、各種画像、例えば、ＲＧＢカメラ２１によって得られた画像を表示する。この表示装置６０は、例えば、液晶ディスプレイ（ＬＣＤ：Liquid　Crystal　Display）又は有機ＥＬ（Organic　Electro-Luminescence）ディスプレイ等を含むディスプレイにより実現される。なお、表示装置６０は、画像処理装置４０と一体の装置であってもよく、もしくは、画像処理装置４０と有線又は無線で通信可能に接続された別体の装置であってもよい。

　＜１－２．学習処理の一例＞
　本実施形態に係る学習処理の一例について図４を参照して説明する。図４は、本実施形態に係る学習処理の流れの一例を示すフローチャートである。学習処理は学習装置３０により実行される。例えば、学習部３２が学習処理を実行する。

　図４に示すように、ステップＳ１１において、環境Ａにおけるラベル付きデータで事前学習が実行される。ステップＳ１２において、環境Ｂにおけるラベルなしデータが収集される。このラベルなしデータは、後述する推論処理（図５参照）によりストレージ装置５０に保存されており、ストレージ装置５０から読み出されて用いられる。ステップＳ１３において、環境Ａにおけるラベル付きデータと環境Ｂにおけるラベルなしデータでドメイン適応学習が実行される。ステップＳ１４において、ドメイン適応学習に応じ、学習済モデル及び中間特徴量が更新される。

　その後、ステップＳ１５において、認識性能が十分であるか否かが判断される。認識性能が十分でないと判断されると（ステップＳ１５のＮｏ）、処理がステップＳ１２に戻り、ステップＳ１２からＳ１５が繰り返される。一方、認識性能が十分であると判断されると（ステップＳ１５のＹｅｓ）、処理が終了する。認識性能が十分であるか否かは、例えば、ユーザにより判断されてもよく、また、学習装置３０により自動的に判断されてもよい。なお、ユーザによる判断では、例えば、キーボードやマウス、タッチパネル等の入力部がユーザにより操作され、認識性能が十分又は不十分であることが入力される。学習装置３０による判断では、例えば、認識性能が数値化され、その数値が閾値より大きいか否かにより認識性能が十分又は不十分であることが判断される。

　＜１－３．推論処理の一例＞
　本実施形態に係る推論処理の一例について図５を参照して説明する。図５は、本実施形態に係る推論処理の流れの一例を示すフローチャートである。推論処理は画像処理装置４０により実行される。例えば、認識部４２が推論処理を実行する。

　図５に示すように、ステップＳ２１において、ＲＧＢ画像（入力画像）が認識部４２に入力される。ステップＳ２２において、現在シーン（入力画像）の画像重要度が計算される。ステップＳ２３において、画像重要度が所定の閾値より高いか否かが判断される。画像重要度が閾値より高いと判断されると（ステップＳ２３のＹｅｓ）、ステップＳ２４において、ＲＧＢ画像がストレージ装置５０に記憶され、ステップＳ２５において、ＲＧＢ画像と画像重要度が表示装置６０により重畳表示される。一方、画像重要度が閾値より高くないと判断されると（ステップＳ２３のＮｏ）、そのままステップＳ２５において、ＲＧＢ画像と画像重要度が表示装置６０により重畳表示される。なお、ステップＳ２４では、例えば、ＲＧＢ画像及び画像重要度が関連付けられてストレージ装置５０に保存されてもよい。

　その後、ステップＳ２６において、撮影が終了であるか否かが判断される。撮影が終了でないと判断されると（ステップＳ２６のＮｏ）、処理がステップＳ２１に戻り、ステップＳ２１からＳ２６が繰り返される。一方、撮影が終了であると判断されると（ステップＳ２６のＹｅｓ）、処理が終了する。撮影が終了であるか否かは、例えば、ユーザにより判断される。このユーザによる判断では、前述と同様、例えば、キーボードやマウス、タッチパネル等の入力部がユーザにより操作され、撮影が終了又は未終了であることが入力される。

　＜１－４．学習済データ及び入力画像の個々の中間特徴量の比較例＞
　本実施形態に係る学習済データ及び入力画像の個々の中間特徴量の比較例について図６を参照して説明する。図６は、本実施形態に係る学習済データ及び入力画像の個々の中間特徴量の比較の一例を説明するための図である。

　図６に示すように、学習済データの中間特徴量と入力画像の中間特徴量とを比較することによって、現在撮影中の画像が追加学習に必要なデータであるか否かを判別することが可能である。つまり、入力画像の中間特徴量が学習済データの中間特徴量の分布（図６中の点線領域参照）から近い場合、入力画像の画像重要度は低いと判断される。図６の例では、画像重要度が低い入力画像の中間特徴量は点線領域内に位置する。一方、入力画像の中間特徴量が学習済データの中間特徴量の分布（図６中の点線領域参照）から遠い場合、入力画像の画像重要度は高いと判断される。

　このような画像重要度は、具体的には、学習済データ及び入力画像の中間特徴量同士の差分から算出される正規化された値である。この画像重要度は、０に近いほど重要度が低く、１に近いほど重要度が高いものである。

　ただし、画像重要度の値は、学習モデルの更新を繰り返すごとに小さくなることが想定される。例えば、図６の例では、学習モデルの更新を繰り返すごとに学習済データの中間特徴量が増加し、学習済データの中間特徴量の分布領域（図６中の点線領域参照）が広くなるため、入力画像の中間特徴量が学習済データの中間特徴量の分布に近づき、画像重要度の値が小さくなる傾向（画像重要度が低くなる傾向）がある。このように学習モデルの更新を繰り返すごとに画像重要度の値は小さくなることが想定されるため、例えば、学習モデルの更新ごとに閾値（図５のステップＳ２３参照）を更新することが望ましい。

　この画像重要度の閾値は、変更可能であり、例えば、ユーザにより変更されてもよく、また、画像処理装置４０により自動的に変更されてもよい。ユーザによる変更では、前述と同様、例えば、キーボードやマウス、タッチパネル等の入力部がユーザにより操作され、閾値が変更される。画像処理装置４０による変更では、定期的に閾値が変更されもよく、また、学習モデルの更新タイミングや更新回数に応じて閾値が変更されてもよい。例えば、更新回数が所定回数となると、閾値が変更される。この変更処理は、例えば、画像蓄積部４２ｃにより実行される。

　＜１－５．画像の表示例＞
　本実施形態に係る画像の表示例について図７を参照して説明する。図７は、本実施形態に係る画像の表示の一例を説明するための図である。

　図７に示すように、撮像中のＲＧＢ画像（入力画像）と画像重要度が重畳されて表示装置６０により表示される（重畳表示）。画像重要度は、前述のように、０に近いほど重要度が低く、１に近いほど重要度が高いものである。図７の例では、ＲＧＢ画像の画像重要度は０．７３である（importance：０．７３）。この画像重要度が表示されることで、ユーザは画像重要度を把握することが可能となる。

　また、画像重要度が閾値より高い場合には、ＲＧＢ画像の外枠（図７中の太い黒枠参照）の色が変えられる。これにより、ユーザは画像重要度が閾値より高いことを把握することが可能となる。例えば、画像重要度が閾値以下である場合、外枠の色は青色であり、画像重要度が閾値より高い場合、外枠の色は赤色に変えられる。このように、外枠を示す画像の表示態様は画像重要度に応じて変更される。ただし、外枠の色（色の組み合わせ）は、青色と赤色に限定されるものではなく、他の色が用いられてもよい。

　なお、外枠を示す画像の表示態様の変更としては、外枠の色を変える以外にも、例えば、外枠を点滅させてもよく、また、外枠の太さ（線幅）やサイズを変更してもよい。すなわち、画像重要度が閾値より高いことを示す画像の色や線幅、サイズを変更したり、その画像を点滅させたりしてもよい。また、画像重要度が閾値より高いことを示す画像としては、外枠を用いる以外にも、文字や記号、図形等を示す画像が用いられてもよい。また、画像重要度が閾値より高いことを示す画像及び画像重要度の両方又は一方は、ＲＧＢ画像に重ねされていてもよく、また、重ねられなくてもよい。

　前述のように、撮像中の画像データの画像重要度を表示することにより、術者や助手等のユーザ（撮影者）は撮像中の画像データの画像重要度を把握し、効率的に認識性能向上に寄与する画像データを撮影することができる。例えば、術者や助手等のユーザは、撮像中の画像データの画像重要度が高い場合、そのシーンを重点的に撮像し、撮像中の画像データの画像重要度が低い場合、違うシーンを撮像する。このようにして、ユーザの裁量に任される撮像を補足し、ユーザに撮像を続けてもらうことが可能である。

　＜１－６．学習モデル適用処理の一例＞
　本実施形態に係る環境に対する学習モデル適用処理の一例について図８及び図９を参照して説明する。図８及び図９は、それぞれ本実施形態に係る学習モデル適用処理の一例を説明するための図である。

　図８に示すように、１．事前学習では、学習装置３０の学習部３２は、ＣＧデータセットをＤＮＮに入力し、推論結果及び中間特徴量を求め、求めた推論結果及び中間特徴量をストレージ装置５０に保存する。この事前学習により、学習モデルが構築される。図８の例では、ＣＧデータセットが事前学習用のラベル付きデータとして用いられる。このＣＧデータセットは、ＣＧ（コンピュータグラフィックス）により生成された複数の画像（手術中の画像）を含むデータセットである。

　２．データ撮影では、画像処理装置４０の認識部４２は、撮影画像（撮像画像）群（画像データ）をＤＮＮに入力し、推定結果及び中間特徴量を求め、求めた推定結果及び中間特徴量をストレージ装置５０に保存する。また、認識部４２は、撮影画像ごとに、撮影画像の中間特徴量と、ＣＧデータセットに含まれる画像の中間特徴量（例えば、各データの平均値や代表値等）との差分を計算し、その中間特徴量同士の差分を変換式により変換して画像重要度を求める。認識部４２は、求めた画像重要度を撮影画像に重ねて、画像重要度を含む撮影画像を生成し、表示画像として表示装置６０に送信する。

　表示装置６０は、認識部４２から送信された表示画像を表示する。図８の例では、上方の表示画像の画像重要度は０．１２であり（importance：０．１２）、画像重要度が閾値（例えば、０．５０）以下であるため、外枠の色は青色である。また、下方の表示画像の画像重要度は０．８７であり（importance：０．８７）、画像重要度が閾値（例えば、０．５０）より高いため、外枠の色は赤色である。なお、画像重要度は撮影画像に重ねられず、撮影画像を避けてその撮影画像の上方（図８中）に示されている。

　術者や助手等のユーザ（撮影者）は、表示装置６０により表示された表示画像を視認し、画像重要度を把握することができる。ユーザは、画像重要度を見て、現在のシーンを重点的に撮影したり、もしくは、現在のシーンの撮影をやめて異なるシーンの撮影に移ったりするという対応を取る。このように、ユーザは撮像中の画像データの画像重要度を把握し、画像重要度が高い画像データを効率的に撮影することが可能となる。これにより、認識性能向上に寄与する画像データが順次撮像されて蓄積されるので、効率的に認識性能向上に寄与する画像データを得ることができる。また、画像重要度が閾値よりも高いか低いかに応じて、画像の外枠の色を変えることによって、画像重要度が高いのか低いのかをユーザに分かりやすくすることができる。例えば、画像重要度が高い場合には、画像の外枠を赤色にしてアラートを示し、画像重要度が低い場合には、画像の外枠を青色にする。これにより、ユーザは画像重要度の高低を容易に把握することができる。

　図９に示すように、３．ドメイン適応学習では、学習装置３０の学習部３２は、ＣＧデータセット及び画像重要度が閾値より高い画像群をＤＮＮに入力し、推論結果、中間特徴量及び入力画像のドメインを求め、求めた推論結果、中間特徴量及び入力画像のドメインをストレージ装置５０に保存する。具体例として、学習部３２は、学習済モデル（学習済ＤＮＮモデル）と保存済の中間特徴量を更新する。

　なお、推論結果の取得では、例えば、ラベル付きデータのみ、正解ラベルとの誤差を逆伝播し学習を行う。また、入力画像のドメインの判断では、ＤＮＮが入力画像のドメインの判断を誤るように学習（敵対的学習）を行う。中間特徴量の取得では、例えば、学習完了後、各データに対する中間特徴量を保存する。

　このような２．データ撮影及び３．ドメイン適応学習は、十分な認識性能が得られるまで繰り返される。なお、画像重要度が閾値を超えた画像を蓄積し、ラベル付けを行わない場合にドメイン適応学習を行っているが、これに限るものではなく、例えば、ラベル付け（ラベリング）を行い教師あり学習を行ってもよい。

　また、１．事前学習では、ＣＧデータセットが用いられる。これにより、自動でラベリング可能で、低コストで大量のラベル付きデータが得られる。この学習モデルを、画像重要度を用いたドメイン適応学習により各病院の環境に適応させることで、高コストなラベル付けを行うことなく、各病院の環境において認識性能の高い学習モデルを得ることができる。なお、通常、学習モデルを導入する環境（病院）ごとに大量のデータを撮影し、ラベル付けをする必要があり、コストを考えると非現実的であるが、１～３の処理によれば、各病院の環境において認識性能の高い学習モデルを低コストで得ることができる。

　このような学習モデル適用処理において、ある環境で撮影したデータにラベル付けを行い、ＤＮＮを事前学習しておき、各画像に対するＤＮＮの中間出力である中間特徴量を保存する。導入環境でデータを撮影時にＤＮＮを用いて中間特徴量を計算し、保存済みの中間特徴量との差分を計算し、その差分をデータの画像重要度として算出し、データ撮影者にフィードバックする。なお、本実施形態では、追加のラベル付けを前提としていないため、追加のラベル付けを前提とする学習モデルと異なる。また、本実施形態では、ＤＮＮ学習モデルの出力ではなく、中間特徴量に注目することで、追加学習に必要なデータ収集を行う。

　このように、撮影中にリアルタイムに現在撮影中の画像の画像重要度をフィードバックすることで、データ撮影時においても効率的にデータ収集を行うことができる。例えば、推論環境下で、現在撮影中のシーン（画像）が認識部４２の学習にとって有用なデータなのか否か（画像重要度）をリアルタイムで出力する。これにより、画像重要度が高いデータを効率的に撮像し、認識部４２の認識性能向上に寄与するデータを順次保存することが可能になるので、効率的に認識性能向上に寄与するデータを得ることができる。実施例として、前述のように、ラベル付きデータと画像重要度の高いラベルなしデータを用いてドメイン適応学習を行うことにより、高コストなラベル付けを行うことなく認識部４２の認識性能を向上させることができる。

　＜１－７．作用・効果＞
　以上説明したように、実施形態によれば、体内の画像である入力画像から機械学習に関する中間特徴量を抽出する特徴量抽出部４２ａと、中間特徴量に基づいて入力画像の画像重要度を算出する重要度算出部４２ｂと、画像重要度に基づいて入力画像を保存する画像蓄積部４２ｃとが設けられる。これにより、入力画像の画像重要度に応じてその入力画像を保存することができ、認識性能向上に寄与する入力画像を確実に保存することが可能になるので、効率的に認識性能向上に寄与する入力画像（データ）を得ることができる。

　また、重要度算出部４２ｂは、第１の環境（例えば、病院Ａ）における体内の画像の中間特徴量と、第１の環境と異なる第２の環境（例えば、病院Ｂ）における入力画像の中間特徴量との差分に基づいて、画像重要度を算出してもよい。これにより、環境に関する画像重要度を確実に算出することができる。

　また、重要度算出部４２ｂは、上記差分を所定の変換式により変換して画像重要度を算出してもよい。これにより、環境に関する画像重要度を容易な処理で確実に算出することができる。

　また、第１の環境は第１の病院であり、第２の環境は、第１の病院と異なる第２の病院であってもよい。これにより、環境としての病院に関する画像重要度を算出することができる。

　また、画像蓄積部４２ｃは、画像重要度が所定の閾値を超える場合、入力画像を蓄積してもよい。これにより、画像重要度に応じて入力画像を容易な処理で確実に保存することができる。

　また、画像蓄積部４２ｃは、学習済モデルの更新タイミングで所定の閾値を変更してもよい。これにより、学習済モデルが更新される適切なタイミングで閾値が変更されるので、学習済モデルが繰り返し更新されても、画像重要度に応じて入力画像を保存することができる。

　また、画像蓄積部４２ｃは、学習済モデルの更新回数に応じて所定の閾値を変更してもよい。これにより、学習済モデルが更新される回数に応じて閾値が変更されるので、学習済モデルが繰り返し更新されても、画像重要度に応じて入力画像を保存することができる。

　また、画像蓄積部４２ｃは、更新回数が所定回数となったタイミングで所定の閾値を小さくしてもよい。これにより、学習済モデルが更新される回数が所定回数となると閾値が小さく変更されるので、学習済モデルが繰り返し更新されても、画像重要度に応じて入力画像を保存することができる。

　また、画像蓄積部４２ｃは、入力画像及び画像重要度を関連付けて保存してもよい。これにより、入力画像及び画像重要度を読み出して用いることが可能となるので、それらのデータとしての利便性を向上させることができる。

　また、画像重要度を表示する表示装置６０が設けられる。これにより、ユーザは入力画像の画像重要度を把握して画像重要度が高い画像を効率的に撮影し、認識性能向上に寄与する入力画像を保存することが可能となるので、効率的に認識性能向上に寄与する入力画像（データ）を得ることができる。

　また、表示装置６０は、入力画像及び画像重要度を表示してもよい。これにより、ユーザは、入力画像及び画像重要度を視認することが可能になるので、その入力画像に対応する画像重要度を容易に把握することができる。

　また、表示装置６０は、入力画像に画像重要度を重ねて表示してもよい。これにより、ユーザは、入力画像を視認しつつ、画像重要度を視認することが容易になるので、その入力画像に対応する画像重要度を確実に把握することができる。

　また、表示装置６０は、画像重要度が所定の閾値を超えたことを示す画像（例えば、外枠、文字、記号又は図形等を示す画像）を表示してもよい。これにより、ユーザは、画像重要度が所定の閾値を超えたことを示す画像を視認することが可能になるので、画像重要度が所定の閾値を超えたことを容易に把握することができる。

　また、表示装置６０は、画像重要度に応じて、画像重要度が所定の閾値を超えたことを示す画像の表示態様を変えてもよい。これにより、ユーザは、画像重要度が変化したことを容易及び確実に把握することができる。

　また、表示装置６０は、入力画像に、画像重要度が所定の閾値を超えたことを示す画像を重ねて表示してもよい。これにより、ユーザは、入力画像を視認しつつ、画像重要度が所定の閾値を超えたことを示す画像を視認することが容易になるので、画像重要度が所定の閾値を超えたことを確実に把握することができる。

　また、表示装置６０は、入力画像、画像重要度、及び、画像重要度が所定の閾値を超えたことを示す画像を表示してもよい。これにより、ユーザは、入力画像及び画像重要度と、画像重要度が所定の閾値を超えたことを示す画像とを視認することが可能になるので、その入力画像に対応する画像重要度と、画像重要度が所定の閾値を超えたこととを容易に把握することができる。

　また、表示装置６０は、入力画像に、画像重要度、及び、画像重要度が所定の閾値を超えたことを示す画像を重ねて表示してもよい。これにより、ユーザは、入力画像を視認しつつ、画像重要度と、画像重要度が所定の閾値を超えたことを示す画像とを視認することが容易になるので、その入力画像に対応する画像重要度と、画像重要度が所定の閾値を超えたこととを確実に把握することができる。

　＜２．他の実施形態＞
　上述した実施形態（又は変形例）に係る処理は、上記実施形態以外にも種々の異なる形態（変形例）にて実施されてよい。例えば、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述した実施形態（又は変形例）は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　また、上述した実施形態（又は変形例）において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、実施形態（又は変形例）において、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。また、上述の処理の流れ（例えば、フローチャート）で説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　また、内視鏡２０は、測距することが可能なステレオ方式の内視鏡であってもよい。もしくは、内視鏡２０は、ＲＧＢカメラ２１とは別個に、ｄｅｐｔｈセンサ（測距装置）を有してもよい。ｄｅｐｔｈセンサは、例えば、被写体からのパルス光の反射の戻り時間を用いて測距を行うＴｏＦ（Time　of　Flight）方式や、格子状のパターン光を照射して、パターンの歪みにより測距を行うストラクチャードライト方式を用いて測距を行うセンサである。

　＜３．コンピュータの構成例＞
　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

　図１０は、上述した一連の処理をプログラムにより実行するコンピュータ５００の概略構成の一例を示す図である。

　図１０に示すように、コンピュータ５００は、ＣＰＵ（Central　Processing　Unit）５１０と、ＲＯＭ（Read　Only　Memory）５２０と、ＲＡＭ（Random　Access　Memory）５３０とを有している。

　ＣＰＵ５１０、ＲＯＭ５２０及びＲＡＭ５３０は、バス５４０により相互に接続されている。このバス５４０には、さらに、入出力インターフェース５５０が接続されている。この入出力インターフェース５５０には、入力部５６０、出力部５７０、記録部５８０、通信部５９０及びドライブ６００が接続されている。

　入力部５６０は、キーボードやマウス、マイクロフォン、撮像素子等により構成されている。出力部５７０は、ディスプレイやスピーカ等により構成されている。記録部５８０は、ハードディスクや不揮発性のメモリ等により構成されている。通信部５９０は、ネットワークインターフェース等により構成されている。ドライブ６００は、磁気ディスクや光ディスク、光磁気ディスク又は半導体メモリ等のリムーバブル記録媒体６１０を駆動する。

　以上のように構成されるコンピュータ５００では、ＣＰＵ５１０が、例えば、記録部５８０に記録されているプログラムを、入出力インターフェース５５０及びバス５４０を介して、ＲＡＭ５３０にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ５００、すなわちＣＰＵ５１０が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体６１０に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータ５００では、プログラムは、リムーバブル記録媒体６１０をドライブ６００に装着することにより、入出力インターフェース５５０を介して、記録部５８０にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５９０で受信し、記録部５８０にインストールすることができる。その他、プログラムは、ＲＯＭ５２０や記録部５８０に、あらかじめインストールしておくことができる。

　なお、コンピュータ５００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　＜４．応用例＞
　本開示に係る技術は、医療イメージングシステムに適用することができる。医療イメージングシステムは、イメージング技術を用いた医療システムであり、例えば、内視鏡システムや顕微鏡システムである。本開示に係る画像処理システム１０において、内視鏡２０を内視鏡５００１や顕微鏡装置５３０１に適用し、学習装置３０や画像処理装置４０等をＣＣＵ５０３９に適用し、ストレージ装置５０を記録装置５０５３に適用し、表示装置６０を表示装置５０４１に適用することができる。

　［内視鏡システム］
　内視鏡システムの例を図１１、図１２を用いて説明する。図１１は、本開示に係る技術が適用可能な内視鏡システム５０００の概略的な構成の一例を示す図である。図１２は、内視鏡５００１およびＣＣＵ（Camera　Control　Unit）５０３９の構成の一例を示す図である。図１１では、手術参加者である術者（例えば、医師）５０６７が、内視鏡システム５０００を用いて、患者ベッド５０６９上の患者５０７１に手術を行っている様子が図示されている。図１１に示すように、内視鏡システム５０００は、医療イメージング装置である内視鏡５００１と、ＣＣＵ５０３９と、光源装置５０４３と、記録装置５０５３と、出力装置５０５５と、内視鏡５００１を支持する支持装置５０２７と、から構成される。

　内視鏡手術では、トロッカ５０２５と呼ばれる挿入補助具が患者５０７１に穿刺される。そして、トロッカ５０２５を介して、内視鏡５００１に接続されたスコープ５００３や術具５０２１が患者５０７１の体内に挿入される。術具５０２１は例えば、電気メス等のエネルギーデバイスや、鉗子などである。

　内視鏡５００１によって撮影された患者５０７１の体内を映した医療画像である手術画像が、表示装置５０４１に表示される。術者５０６７は、表示装置５０４１に表示された手術画像を見ながら術具５０２１を用いて手術対象に処置を行う。なお、医療画像は手術画像に限らず、診断中に撮像された診断画像であってもよい。

　［内視鏡］
　内視鏡５００１は、患者５０７１の体内を撮像する撮像部であり、例えば、図１２に示すように、入射した光を集光する集光光学系５００５１と、撮像部の焦点距離を変更して光学ズームを可能とするズーム光学系５００５２と、撮像部の焦点距離を変更してフォーカス調整を可能とするフォーカス光学系５００５３と、受光素子５００５４と、を含むカメラ５００５である。内視鏡５００１は、接続されたスコープ５００３を介して光を受光素子５００５４に集光することで画素信号を生成し、ＣＣＵ５０３９に伝送系を通じて画素信号を出力する。なお、スコープ５００３は、対物レンズを先端に有し、接続された光源装置５０４３からの光を患者５０７１の体内に導光する挿入部である。スコープ５００３は、例えば硬性鏡では硬性スコープ、軟性鏡では軟性スコープである。スコープ５００３は直視鏡や斜視鏡であってもよい。また、画素信号は画素から出力された信号に基づいた信号であればよく、例えば、ＲＡＷ信号や画像信号である。また、内視鏡５００１とＣＣＵ５０３９とを接続する伝送系にメモリを搭載し、メモリに内視鏡５００１やＣＣＵ５０３９に関するパラメータを記憶する構成にしてもよい。メモリは、例えば、伝送系の接続部分やケーブル上に配置されてもよい。例えば、内視鏡５００１の出荷時のパラメータや通電時に変化したパラメータを伝送系のメモリに記憶し、メモリから読みだしたパラメータに基づいて内視鏡の動作を変更してもよい。また、内視鏡と伝送系をセットにして内視鏡と称してもよい。受光素子５００５４は、受光した光を画素信号に変換するセンサであり、例えばＣＭＯＳ（Complementary　Metal　Oxide　Semiconductor）タイプの撮像素子である。受光素子５００５４は、Ｂａｙｅｒ配列を有するカラー撮影可能な撮像素子であることが好ましい。また、受光素子５００５４は、例えば４Ｋ（水平画素数３８４０×垂直画素数２１６０）、８Ｋ（水平画素数７６８０×垂直画素数４３２０）または正方形４Ｋ（水平画素数３８４０以上×垂直画素数３８４０以上）の解像度に対応した画素数を有する撮像素子であることが好ましい。受光素子５００５４は、１枚のセンサチップであってもよいし、複数のセンサチップでもよい。例えば、入射光を所定の波長帯域ごとに分離するプリズムを設けて、各波長帯域を異なる受光素子で撮像する構成であってもよい。また、立体視のために受光素子を複数設けてもよい。また、受光素子５００５４は、チップ構造の中に画像処理用の演算処理回路を含んでいるセンサであってもよいし、ＴｏＦ（Time　of　Flight）用センサであってもよい。なお、伝送系は例えば光ファイバケーブルや無線伝送である。無線伝送は、内視鏡５００１で生成された画素信号が伝送可能であればよく、例えば、内視鏡５００１とＣＣＵ５０３９が無線接続されてもよいし、手術室内の基地局を経由して内視鏡５００１とＣＣＵ５０３９が接続されてもよい。このとき、内視鏡５００１は画素信号だけでなく、画素信号に関連する情報（例えば、画素信号の処理優先度や同期信号等）を同時に送信してもよい。なお、内視鏡はスコープとカメラを一体化してもよく、スコープの先端部に受光素子を設ける構成としてもよい。

　［ＣＣＵ（Camera　Control　Unit）］
　ＣＣＵ５０３９は、接続された内視鏡５００１や光源装置５０４３を統括的に制御する制御装置であり、例えば、図１２に示すように、ＦＰＧＡ５０３９１、ＣＰＵ５０３９２、ＲＡＭ５０３９３、ＲＯＭ５０３９４、ＧＰＵ５０３９５、Ｉ／Ｆ５０３９６を有する情報処理装置である。また、ＣＣＵ５０３９は、接続された表示装置５０４１や記録装置５０５３、出力装置５０５５を統括的に制御してもよい。例えば、ＣＣＵ５０３９は、光源装置５０４３の照射タイミングや照射強度、照射光源の種類を制御する。また、ＣＣＵ５０３９は、内視鏡５００１から出力された画素信号に対して現像処理（例えばデモザイク処理）や補正処理といった画像処理を行い、表示装置５０４１等の外部装置に処理後の画素信号（例えば画像）を出力する。また、ＣＣＵ５０３９は、内視鏡５００１に対して制御信号を送信し、内視鏡５００１の駆動を制御する。制御信号は、例えば、撮像部の倍率や焦点距離などの撮像条件に関する情報である。なお、ＣＣＵ５０３９は画像のダウンコンバート機能を有し、表示装置５０４１に高解像度（例えば４Ｋ）の画像を、記録装置５０５３に低解像度（例えばＨＤ）の画像を同時に出力可能な構成としてもよい。

　また、ＣＣＵ５０３９は、信号を所定の通信プロトコル（例えば、ＩＰ（Internet　Protocol））に変換するＩＰコンバータを経由して外部機器（例えば、記録装置や表示装置、出力装置、支持装置）と接続されてもよい。ＩＰコンバータと外部機器との接続は、有線ネットワークで構成されてもよいし、一部または全てのネットワークが無線ネットワークで構築されてもよい。例えば、ＣＣＵ５０３９側のＩＰコンバータは無線通信機能を有し、受信した映像を第５世代移動通信システム（５Ｇ）、第６世代移動通信システム（６Ｇ）等の無線通信ネットワークを介してＩＰスイッチャーや出力側ＩＰコンバータに送信してもよい。

　［光源装置］
　光源装置５０４３は、所定の波長帯域の光を照射可能な装置であり、例えば、複数の光源と、複数の光源の光を導光する光源光学系と、を備える。光源は、例えばキセノンランプ、ＬＥＤ光源やＬＤ光源である。光源装置５０４３は、例えば三原色Ｒ、Ｇ、Ｂのそれぞれに対応するＬＥＤ光源を有し、各光源の出力強度や出力タイミングを制御することで白色光を出射する。また、光源装置５０４３は、通常光観察に用いられる通常光を照射する光源とは別に、特殊光観察に用いられる特殊光を照射可能な光源を有していてもよい。特殊光は、通常光観察用の光である通常光とは異なる所定の波長帯域の光であり、例えば、近赤外光（波長が７６０ｎｍ以上の光）や赤外光、青色光、紫外光である。通常光は、例えば白色光や緑色光である。特殊光観察の一種である狭帯域光観察では、青色光と緑色光を交互に照射することにより、体組織における光の吸収の波長依存性を利用して、粘膜表層の血管等の所定の組織を高コントラストで撮影することができる。また、特殊光観察の一種である蛍光観察では、体組織に注入された薬剤を励起する励起光を照射し、体組織または標識である薬剤が発する蛍光を受光して蛍光画像を得ることで、通常光では術者が視認しづらい体組織等を、術者が視認しやすくすることができる。例えば、赤外光を用いる蛍光観察では、体組織に注入されたインドシアニングリーン（ＩＣＧ）等の薬剤に励起波長帯域を有する赤外光を照射し、薬剤の蛍光を受光することで、体組織の構造や患部を視認しやすくすることができる。また、蛍光観察では、青色波長帯域の特殊光で励起され、赤色波長帯域の蛍光を発する薬剤（例えば５－ＡＬＡ）を用いてもよい。なお、光源装置５０４３は、ＣＣＵ５０３９の制御により照射光の種類を設定される。ＣＣＵ５０３９は、光源装置５０４３と内視鏡５００１を制御することにより、通常光観察と特殊光観察が交互に行われるモードを有してもよい。このとき、通常光観察で得られた画素信号に特殊光観察で得られた画素信号に基づく情報を重畳されることが好ましい。また、特殊光観察は、赤外光を照射して臓器表面より奥を見る赤外光観察や、ハイパースペクトル分光を活用したマルチスペクトル観察であってもよい。さらに、光線力学療法を組み合わせてもよい。

　［記録装置］
　記録装置５０５３は、ＣＣＵ５０３９から取得した画素信号（例えば画像）を記録する装置であり、例えばレコーダーである。記録装置５０５３は、ＣＣＵ５０３９から取得した画像をＨＤＤやＳＤＤ、光ディスクに記録する。記録装置５０５３は、病院内のネットワークに接続され、手術室外の機器からアクセス可能にしてもよい。また、記録装置５０５３は画像のダウンコンバート機能またはアップコンバート機能を有していてもよい。

　［表示装置］
　表示装置５０４１は、画像を表示可能な装置であり、例えば表示モニタである。表示装置５０４１は、ＣＣＵ５０３９から取得した画素信号に基づく表示画像を表示する。なお、表示装置５０４１はカメラやマイクを備えることで、視線認識や音声認識、ジェスチャによる指示入力を可能にする入力デバイスとしても機能してよい。

　［出力装置］
　出力装置５０５５は、ＣＣＵ５０３９から取得した情報を出力する装置であり、例えばプリンタである。出力装置５０５５は、例えば、ＣＣＵ５０３９から取得した画素信号に基づく印刷画像を紙に印刷する。

　［支持装置］
　支持装置５０２７は、アーム制御装置５０４５を有するベース部５０２９と、ベース部５０２９から延伸するアーム部５０３１と、アーム部５０３１の先端に取り付けられた保持部５０３２とを備える多関節アームである。アーム制御装置５０４５は、ＣＰＵ等のプロセッサによって構成され、所定のプログラムに従って動作することにより、アーム部５０３１の駆動を制御する。支持装置５０２７は、アーム制御装置５０４５によってアーム部５０３１を構成する各リンク５０３５の長さや各関節５０３３の回転角やトルク等のパラメータを制御することで、例えば保持部５０３２が保持する内視鏡５００１の位置や姿勢を制御する。これにより、内視鏡５００１を所望の位置または姿勢に変更し、スコープ５００３を患者５０７１に挿入でき、また、体内での観察領域を変更できる。支持装置５０２７は、術中に内視鏡５００１を支持する内視鏡支持アームとして機能する。これにより、支持装置５０２７は、内視鏡５００１を持つ助手であるスコピストの代わりを担うことができる。また、支持装置５０２７は、後述する顕微鏡装置５３０１を支持する装置であってもよく、医療用支持アームと呼ぶこともできる。なお、支持装置５０２７の制御は、アーム制御装置５０４５による自律制御方式であってもよいし、ユーザの入力に基づいてアーム制御装置５０４５が制御する制御方式であってもよい。例えば、制御方式は、ユーザの手元の術者コンソールであるマスター装置（プライマリ装置）の動きに基づいて、患者カートであるスレイブ装置（レプリカ装置）としての支持装置５０２７が制御されるマスタ・スレイブ方式でもよい。また、支持装置５０２７の制御は、手術室の外から遠隔制御が可能であってもよい。

　以上、本開示に係る技術が適用され得る内視鏡システム５０００の一例について説明した。例えば、本開示に係る技術は、顕微鏡システムに適用されてもよい。

　［顕微鏡システム］
　図１３は、本開示に係る技術が適用され得る顕微鏡手術システムの概略的な構成の一例を示す図である。なお、以下の説明において、内視鏡システム５０００と同様の構成については、同一の符号を付し、その重複する説明を省略する。

　図１３では、術者５０６７が、顕微鏡手術システム５３００を用いて、患者ベッド５０６９上の患者５０７１に対して手術を行っている様子を概略的に示している。なお、図１３では、簡単のため、顕微鏡手術システム５３００の構成のうちカート５０３７の図示を省略するとともに、内視鏡５００１に代わる顕微鏡装置５３０１を簡略化して図示している。ただし、本説明における顕微鏡装置５３０１は、リンク５０３５の先端に設けられた顕微鏡部５３０３を指していてもよいし、顕微鏡部５３０３及び支持装置５０２７を含む構成全体を指していてもよい。

　図１３に示すように、手術時には、顕微鏡手術システム５３００を用いて、顕微鏡装置５３０１によって撮影された術部の画像が、手術室に設置される表示装置５０４１に拡大表示される。表示装置５０４１は、術者５０６７と対向する位置に設置されており、術者５０６７は、表示装置５０４１に映し出された映像によって術部の様子を観察しながら、例えば患部の切除等、当該術部に対して各種の処置を行う。顕微鏡手術システムは、例えば眼科手術や脳外科手術に使用される。

　以上、本開示に係る技術が適用され得る内視鏡システム５０００及び顕微鏡手術システム５３００の例についてそれぞれ説明した。なお、本開示に係る技術が適用され得るシステムはかかる例に限定されない。例えば、支持装置５０２７は、その先端に内視鏡５００１又は顕微鏡部５３０３に代えて他の観察装置や他の術具を支持し得る。当該他の観察装置としては、例えば、鉗子、攝子、気腹のための気腹チューブ、又は焼灼によって組織の切開や血管の封止を行うエネルギー処置具等が適用され得る。これらの観察装置や術具を支持装置によって支持することにより、医療スタッフが人手で支持する場合に比べて、より安定的に位置を固定することが可能となるとともに、医療スタッフの負担を軽減することが可能となる。本開示に係る技術は、このような顕微鏡部以外の構成を支持する支持装置に適用されてもよい。

　本開示に係る技術は、以上説明した構成のうち、内視鏡５００１や顕微鏡装置５３０１、ＣＣＵ５０３９、表示装置５０４１、光源装置５０４３等に好適に適用され得る。具体的には、内視鏡システム５０００及び顕微鏡手術システム５３００等において、各実施形態に係る動作や処理を実行することが可能になっている。内視鏡システム５０００及び顕微鏡手術システム５３００等に本開示に係る技術を適用することにより、認識性能の向上に寄与するデータを効率的に得ることができる。

　＜５．付記＞
　なお、本技術は以下のような構成も取ることができる。
（１）
　体内の画像である入力画像から機械学習に関する中間特徴量を抽出する特徴量抽出部と、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出する重要度算出部と、
　前記画像重要度に基づいて前記入力画像を保存する画像蓄積部と、
を備える画像処理装置。
（２）
　前記重要度算出部は、第１の環境における体内の画像の前記中間特徴量と、前記第１の環境と異なる第２の環境における前記入力画像の前記中間特徴量との差分に基づいて、前記画像重要度を算出する、
　上記（１）に記載の画像処理装置。
（３）
　前記重要度算出部は、前記差分を所定の変換式により変換して前記画像重要度を算出する、
　上記（２）に記載の画像処理装置。
（４）
　前記第１の環境は、第１の病院であり、
　前記第２の環境は、前記第１の病院と異なる第２の病院である、
　上記（２）又は（３）に記載の画像処理装置。
（５）
　前記画像蓄積部は、前記画像重要度が所定の閾値を超える場合、前記入力画像を保存する、
　上記（１）から（４）のいずれか一つに記載の画像処理装置。
（６）
　前記画像蓄積部は、学習済モデルの更新タイミングで前記所定の閾値を変更する、
　上記（５）に記載の画像処理装置。
（７）
　前記画像蓄積部は、学習済モデルの更新回数に応じて前記所定の閾値を変更する、
　上記（５）に記載の画像処理装置。
（８）
　前記画像蓄積部は、前記更新回数が所定回数となったタイミングで前記所定の閾値を小さくする、
　上記（７）に記載の画像処理装置。
（９）
　前記画像蓄積部は、前記入力画像及び前記画像重要度を関連付けて保存する、
　上記（１）から（８）のいずれか一つに記載の画像処理装置。
（１０）
　前記画像重要度を表示する表示装置をさらに備える、
　上記（１）から（９）のいずれか一つに記載の画像処理装置。
（１１）
　前記表示装置は、前記入力画像及び前記画像重要度を表示する、
　上記（１０）に記載の画像処理装置。
（１２）
　前記表示装置は、前記入力画像に前記画像重要度を重ねて表示する、
　上記（１１）に記載の画像処理装置。
（１３）
　前記表示装置は、前記画像重要度が所定の閾値を超えたことを示す画像を表示する、
　上記（１０）から（１２）のいずれか一つに記載の画像処理装置。
（１４）
　前記表示装置は、前記画像重要度に応じて前記画像の表示態様を変える、
　上記（１３）に記載の画像処理装置。
（１５）
　前記表示装置は、前記入力画像に前記画像を重ねて表示する、
　上記（１３）又は（１４）に記載の画像処理装置。
（１６）
　前記表示装置は、前記入力画像、前記画像重要度、及び、前記画像重要度が所定の閾値を超えたことを示す画像を表示する、
　上記（１０）に記載の画像処理装置。
（１７）
　前記表示装置は、前記画像重要度に応じて前記画像の表示態様を変える、
　上記（１６）に記載の画像処理装置。
（１８）
　前記表示装置は、前記入力画像に、前記画像重要度及び前記画像を重ねて表示する、
　上記（１６）又は（１７）に記載の画像処理装置。
（１９）
　体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、
　前記画像重要度に基づいて前記入力画像を保存することと、
を含む画像処理方法。
（２０）
　コンピュータに、
　体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、
　前記画像重要度に基づいて前記入力画像を保存することと、
を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
（２１）
　上記（１）から（１８）のいずれか一つに記載の画像処理装置により画像処理を行う画像処理方法。
（２２）
　上記（２１）に記載の画像処理方法に含まれるステップをコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
（２３）
　上記（１）から（１８）のいずれか一つに記載の画像処理装置を備える画像処理システム。

　１０　　画像処理システム
　２０　　内視鏡
　２１　　ＲＧＢカメラ
　３０　　学習装置
　３１　　入出力部
　３２　　学習部
　３２ａ　特徴量抽出部
　３２ｂ　更新部
　３３　　制御部
　４０　　画像処理装置
　４１　　入出力部
　４２　　認識部
　４２ａ　特徴量抽出部
　４２ｂ　重要度算出部
　４２ｃ　画像蓄積部
　４３　　制御部
　５０　　ストレージ装置
　６０　　表示装置

Claims

　体内の画像である入力画像から機械学習に関する中間特徴量を抽出する特徴量抽出部と、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出する重要度算出部と、
　前記画像重要度に基づいて前記入力画像を保存する画像蓄積部と、
を備える画像処理装置。
　前記重要度算出部は、第１の環境における体内の画像の前記中間特徴量と、前記第１の環境と異なる第２の環境における前記入力画像の前記中間特徴量との差分に基づいて、前記画像重要度を算出する、
　請求項１に記載の画像処理装置。
　前記重要度算出部は、前記差分を所定の変換式により変換して前記画像重要度を算出する、
　請求項２に記載の画像処理装置。
　前記第１の環境は、第１の病院であり、
　前記第２の環境は、前記第１の病院と異なる第２の病院である、
　請求項２に記載の画像処理装置。
　前記画像蓄積部は、前記画像重要度が所定の閾値を超える場合、前記入力画像を保存する、
　請求項１に記載の画像処理装置。
　前記画像蓄積部は、学習済モデルの更新タイミングで前記所定の閾値を変更する、
　請求項５に記載の画像処理装置。
　前記画像蓄積部は、学習済モデルの更新回数に応じて前記所定の閾値を変更する、
　請求項５に記載の画像処理装置。
　前記画像蓄積部は、前記更新回数が所定回数となったタイミングで前記所定の閾値を小さくする、
　請求項７に記載の画像処理装置。
　前記画像蓄積部は、前記入力画像及び前記画像重要度を関連付けて保存する、
　請求項１に記載の画像処理装置。
　前記画像重要度を表示する表示装置をさらに備える、
　請求項１に記載の画像処理装置。
　前記表示装置は、前記入力画像及び前記画像重要度を表示する、
　請求項１０に記載の画像処理装置。
　前記表示装置は、前記入力画像に前記画像重要度を重ねて表示する、
　請求項１１に記載の画像処理装置。
　前記表示装置は、前記画像重要度が所定の閾値を超えたことを示す画像を表示する、
　請求項１０に記載の画像処理装置。
　前記表示装置は、前記画像重要度に応じて前記画像の表示態様を変える、
　請求項１３に記載の画像処理装置。
　前記表示装置は、前記入力画像に前記画像を重ねて表示する、
　請求項１３に記載の画像処理装置。
　前記表示装置は、前記入力画像、前記画像重要度、及び、前記画像重要度が所定の閾値を超えたことを示す画像を表示する、
　請求項１０に記載の画像処理装置。
　前記表示装置は、前記画像重要度に応じて前記画像の表示態様を変える、
　請求項１６に記載の画像処理装置。
　前記表示装置は、前記入力画像に、前記画像重要度及び前記画像を重ねて表示する、
　請求項１６に記載の画像処理装置。
　体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、
　前記画像重要度に基づいて前記入力画像を保存することと、
を含む画像処理方法。
　コンピュータに、
　体内の画像である入力画像から機械学習に関する中間特徴量を抽出することと、
　前記中間特徴量に基づいて前記入力画像の画像重要度を算出することと、
　前記画像重要度に基づいて前記入力画像を保存することと、
を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。