WO2022190386A1

WO2022190386A1 - 推論用学習装置および推論用学習方法

Info

Publication number: WO2022190386A1
Application number: PCT/JP2021/010204
Authority: WO
Inventors: 浩一新谷; 憲谷; 学市川; 健世伊藤; 智子後町; 修野中
Original assignee: オリンパス株式会社
Priority date: 2021-03-12
Filing date: 2021-03-12
Publication date: 2022-09-15
Also published as: CN115428011A

Abstract

予め想定していたカテゴリのデータに限らず未知のカテゴリにおいて、それまで蓄積したデータに対してデータの特性が変わった場合であっても、適切な推論を行うことができる推論用学習装置および推論用学習方法を提供する。第１の画像取得装置からの画像データを入力し（Ｓ１ａ、Ｓ５ａ）第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、推論モデルを再学習する際に、第１の画像取得装置から得た画像データを画像入力特性の差異に応じた加工を行って教師データとし（Ｓ３ａ、Ｓ７ａ）、画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る（Ｓ９）。

Description

推論用学習装置および推論用学習方法

　本発明は、ユーザからデータを収集し、このデータを用いて推論モデルを生成する推論用学習装置および推論用学習方法に関する。

　深層学習等の機械学習は、教師データを作成し、この教師データを用いて行う。教師データの作成には人手を必要とし、大きなコストが掛かってしまう。そこで、質の高い教師データを低コストで収集する方法が提案されている。例えば、特許文献１には、特定の分野に関する参照データの中から第１の特徴ベクトルを用いてその特定分野に関するデータを収集するための検索条件を生成する。そして、この検索条件を用いてデータを収集し、この収集したデータの第２の特徴ベクトルを算出し、第１の特徴ベクトルと第２の特徴ベクトルの類似度が所定範囲にあれば、検索条件を用いて収集したデータを教師データとして抽出するようにしている。

特開２０１８－１２４６１７号公報

　上述した特許文献１に記載のデータ収集方法によれば、教師データを低コストで収集することが可能となる。しかし、特許文献１のデータ収集方法は、特定分野のデータを収集することを前提としている。一方、教師データを用いて生成された推論モデルは、予め想定していた特定分野（特定カテゴリ）におけるデータに限らず、未知のカテゴリ（未知の分野）にも適用範囲が広がり、推論しなければならないことがある。

　そこで、未知のカテゴリにおいて、従来のデータと異なる特性のデータを用いて推論モデルを生成すれば、この未知のカテゴリのデータに対しても推論を行うことができる。しかし、未知のカテゴリに対応できる推論モデルを生成するには、その特性に合ったデータを収集しなければならず、時間やコストが掛かってしまう。

　本発明は、このような事情を鑑みてなされたものであり、予め想定していたカテゴリのデータに限らず未知のカテゴリにおいて、それまで蓄積したデータに対してデータの特性が変わった場合であっても、適切な推論を行うことができる推論用学習装置および推論用学習方法を提供することを目的とする。

　上記目的を達成するため第１の発明に係る推論用学習装置は、第１の画像取得装置からの画像データを入力する入力部と、上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る学習部と、を有する推論用学習装置において、上記第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、上記推論モデルを再学習する際に、第１の画像取得装置から得た画像データを上記画像入力特性の差異に応じた加工を行って上記教師データとする画像加工部と、を具備する。

　第２の発明に係る推論用学習装置は、上記第１の発明において、上記画像加工部は、第１の画像取得装置から得た画像データに含まれる第１の対象物画像データが、上記第２の画像取得装置から得た画像データに含まれる第２の対象物画像データに適合するように加工する。
　第３の発明に係る推論用学習装置は、上記第１の発明において、上記画像入力特性は、撮像センサの仕様、性能、撮像用光学特性、画像処理仕様、性能、および照明光の種別の少なくとも１つの差異に起因する。

　第４の発明に係る推論用学習装置は、上記第１の発明において、上記画像加工部は、上記教師データのうち第１の画像取得装置から得た画像データを上記画像入力特性の差異に応じた教師データとなるように、同一画像へのアノテーションを変更する。
　第５の発明に係る推論用学習装置は、上記第１の発明において、上記第１の画像取得装置から得た画像データは、既存の教師データであり、上記画像加工部は、上記第２の画像取得装置からの画像データの特性に応じて、上記既存の教師データを画像処理する。

　第６の発明に係る推論用学習装置は、上記第１の発明において、上記第１の画像取得装置から得た画像データは、既存の教師データであり、上記画像加工部は、上記第２の画像取得装置からの画像データの特性に応じて、上記既存の教師データの取捨選択を行う。
　第７の発明に係る推論用学習装置は、上記第５の発明において、上記画像加工部は、上記教師データのうち第１の画像取得装置から得た画像データを、上記第２の画像取得装置からの画像データと適合するように加工する。

　第８の発明に係る推論用学習装置は、上記第１の発明において、上記第２の画像取得装置からの画像データは未知のカテゴリに属する。
　第９の発明に係る推論用学習装置は、上記第８の発明において、上記未知のカテゴリに属するか否かは、人工知能によって自動判断し、または上記第２の画像取得装置の使用者が手動で設定する。
　第１０の発明に係る推論用学習装置は、上記第８の発明において、上記未知のカテゴリに属するか否かは、上記第２の画像取得装置の機種情報、および／または上記第２の画像取得装置からの画像データの中から基準画像と推定した画像に基づいて、判定する。

　第１１の発明に係る推論用学習装置は、上記第１の発明において、上記第１の画像取得装置から得た画像データは、既存の教師データであり、上記画像加工部は、推論モデルの用途が異なる場合に、該用途に応じて、上記既存の教師データを画像処理し、または上記既存の教師データの取捨選択を行う。
　第１２の発明に係る推論用学習装置は、上記第１ないし第１１の発明において、上記第１の画像取得装置からの画像データ、および上記第２の画像取得装置からの画像データは、内視鏡画像データである。

　第１３の発明に係る推論用学習方法は、第１の画像取得装置からの画像データを入力し、　上記第１の画像取得装置とは異なる特性の第２の画像取得装置用に、推論モデルを学習する際に、上記教師データのうち第１の画像取得装置から得た画像データを加工して教師データとし、上記画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る。

　第１４の発明に係る推論用学習装置は、第１の画像取得装置からの画像データを入力する入力部と、上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る学習部と、を有する推論用学習装置において、上記第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、上記推論モデルをカスタマイズする際に、第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って上記教師データとする画像加工部と、を具備する。

　第１５の発明に係る推論用学習方法は、第１の画像取得装置からの画像データを入力し、　上記第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、推論モデルをカスタマイズする際に、上記第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って上記教師データとし、上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る。

　本発明によれば、予め想定していたカテゴリのデータに限らず未知のカテゴリにおいて、それまで蓄積したデータに対してデータの特性が変わった場合であっても、適切な推論を行うことができる推論用学習装置および推論用学習方法を提供することができる。

本発明の一実施形態に係る学習用推論装置の主として電気的構成を示すブロック図である。本発明の一実施形態に係る学習用推論装置において、推論モデルを用いてガイド表示を行う例を示す図である。本発明の一実施形態に係る学習用推論装置において、推論モデル生成の動作を示すフローチャートである。本発明の一実施形態に係る推論用学習装置と協働する撮像装置において、この撮像装置の動作を示すフローチャートである。本発明の一実施形態に係る学習用推論装置において、補正した推論モデル生成の動作を示すフローチャートである。本発明の一実施形態に係る学習用推論装置において、今までと異なる画像データを入力したときを説明する図である。本発明の一実施形態に係る学習用推論装置において、ＡＩ修正必要かを判断する動作を示すフローチャートである。

　本発明の一実施形態に係る推論用学習装置は、画像データを収集し、この画像データにアノテーションすることによって教師データを作成している。この教師データから成る母集合を用いて、推論モデルを生成する。この推論データを生成する際に基となった教師データの母集合が、例えば高画質の画像データを使用していたとすると、低画質の画像データをこの推論モデルに入力した場合に、信頼性の高い推論を行うことができないおそれがある。また、技量の高い者（熟練者）が画像取得装置を使用して取得した画像データを基にして、ガイド表示用の推論モデルを生成したとする。この場合、技量の低い者（低熟練者）が画像取得装置を使用する際に、この推論モデルによる推論によって操作のガイド表示を得ようとしても、適切なガイド表示がなされないおそれがある。

　このように、推論モデルを生成する際に基にしたデータの特性が、実際に推論する際に入力されるデータの特性と異なっている場合には、信頼性の高い推論を行うことができない可能性がある。このような場合には、実際に推論する際に入力されるデータと同程度の特性を有するデータをすでに実績がある上記推論モデル生成時と同様に収集すればよいが、時間と費用がかかってしまう。そこで、本実施形態においては、使用機器が異なるとか、使用者の技量が異なる等、すでに実績がある上記推論モデル生成時と差異がある未知のカテゴリのデータを入力して推論する推論モデルを生成する場合には、それまでに蓄積している既存教師データを、未知のカテゴリのデータの特性に合わせて、データを加工して推論モデルを生成するようにしている。

　ここで、カテゴリと記載したのは、最もわかりやすい例を挙げるとすると、画像データを取得して推論することによって、画像内に特定の対象物を検出するための推論モデルであれば、異なる仕様の画像取得機器から取得した画像データは、類似の画像を取得したとしても画像の質などが異なるので未知のカテゴリとして扱われる。さらには、取得画像に写ったものが異なる場合もあり、見つけようとする対象物が異なる場合もあり、画像取得をする時の操作者やロボットの差異や、また画像に写り込んだ対象物を処置する人や機械の差異によっても画像の変化の仕方などが異なるので、データが想定とは異なる未知のカテゴリとなったと言える。

　上述のデータ加工は、画像処理による加工の場合やアノテーションの修正加工の場合や、データの取捨選択、推論モデルの仕様にまで影響を及ぼす場合がある。推論モデル仕様と記載したのは、熟練度などを考慮した場合、専門家とそれ以外では、期待する推論結果が異なる場合があるからである。ただし、こうした場合でも本実施形態における技術を利用することによって、従来から実績のある推論モデル生成時に使った貴重な教師データを、簡単に流用することが可能となる。

　ここで、データが画像データである場合には、データの加工は既存の教師データの画像処理を含んでいる。画像処理としては、例えば、画素数を増減や、また明暗（輝度値）の変更や、波長（色信号）の変更や、画角の変更等、種々の画像処理がある。また、データの加工としては、既存の教師データの中から母集合に含める教師データの選択がある。すなわち、不適当な画像データを排除し、画像データの中から新たに選択して追加してもよい。例えば、教師データとしては、推論モデルの出来栄えを判定するテストデータなども含んでいる。このテストデータは、既存の推論モデル生成の際には有効でも、未知のカテゴリ対応の推論モデルを生成する場合には、テストデータ以外に使用する場合もある。このような措置も含めて取捨選択とした。また、画像情報に基づいて何らかの作業の様子や道具の扱い方等が検出できる場合があれば、例えば、熟練者の操作によって取得した教師データを除き、低熟練者の操作によって取得した教師データを追加してもよい。

　また、監視カメラを用いて画像を収集している場合、同じ監視カメラの画像が、ある時は犯罪者の特定（顔の特徴が重要）に使われることがあり、またある時は、混雑状況の調査（顔の特徴は重要でなく、むしろ個人情報の観点から顔の特徴が分からない方が良い場合もある）に使われることもある。このことから分かるように、使用用途によって同じ画像であっても、求められる推論によって、教師データに求められる品質や仕様や扱いが変わることがある。同様に、医療用の画像でも、病変見逃し防止と厳密な診断では、画像の取り扱いが異なる場合がある。つまり、もともとの推論モデルが入力データに対して適正に推論することができたとしても、推論モデルの用途や対象が違ってしまうと、その入力データは未知のカテゴリのデータとなり、異なる教師データの扱いや、異なる学習が求められることになる。

　また、未知のカテゴリとしては、推論モデルの使用対象を考慮してもよい。例えば、癌の診断のために使用される医療機器では、地域、人種、性別、年齢等のプロフィールの差異によって、罹患する癌の発生する患部や、癌の種類が異なっている。また、地域差については、病院のシステムや医療機器の違い、医師の技量、流派、あるいは患者プロフィールの傾向などが異なる事を想定するのが望ましく、こうした要因の差異で、想定していたカテゴリが異なってしまい、未知のカテゴリに属する場合もある。そこで、推論モデルの生成に使用する教師データについても、推論モデルの用途を考慮して、既存教師データを適宜変更して加工するようにしてもよい。

　以下、図を用いて、本発明の一実施形態として画像推論用学習システムに本発明を適用した例について説明する。図１に示す画像推論用学習システムは、画像推論用学習装置１と撮像装置６とから構成される。

　画像推論用学習装置１は、スタンドアロンのコンピュータ等の機器であってもよく、また、サーバ内等に配置されていてもよい。画像推論用学習装置１がスタンドアロンのコンピュータ等の場合には、撮像装置６は有線または無線等によって接続可能であればよい。また画像推論用学習装置１がサーバ等内に配置されている場合には、撮像装置６とはインターネット等の情報通信網によって接続可能であればよい。

　また、撮像装置６は、内視鏡等の医療機器等に設けられ患部等の撮影対象を撮影する装置であってもよく、顕微鏡等の科学機器等に設けられ細胞等の撮影対象を撮影する装置であってもよく、デジタルカメラ等、画像の撮影を主目的とする装置であってもよい。いずれにしても、本実施形態においては、撮像装置６は撮像機能が主たる機能である装置であってもよく、また他の主機能を実行するために、撮像機能も併せて有する装置であってもよい。以下、撮像装置６が内視鏡であり、画像取得装置が内視鏡画像データを出力する場合を主に説明する。

　撮像装置６内には、画像推論装置２、画像取得装置３、ガイド部５、制御部７が設けられている。なお、図１に示す撮像装置６は、上述の種々の装置が一体に構成されている例について説明している。しかし、別々の装置に分かれて配置され、インターネット等の情報通信網や、専用の通信網で接続するよう構成しても勿論かまわない。例えば、画像推論装置２は、撮像装置６とは別体に構成され、インターネット等で接続されていてもよい。また、図１には、図示しないが、操作部（入力インターフェース）や通信部（通信回路）、記録部（例えば、画像取得装置３において取得された画像データの記録）、情報取得装置等、撮像装置６を機能させるための種々の部材・回路・機器等が設けられている。

　画像取得部３は、光学レンズや、撮像素子や、撮像制御回路および撮像信号処理回路等の種々の撮像回路を有し、対象物の画像データを取得し、出力する。なお、撮像にあたっての露光制御用部材（例えば、シャッタや絞り）や露光制御回路を有していてもよく、また光学レンズのピント合わせを行うためのレンズ駆動装置や、焦点検出回路・焦点調節回路等を有していてもよい。さらに、光学レンズはズームレンズであってもよい。

　画像取得装置３内には、画像取得装置３ａおよび画像取得装置３ｂの内のいずれか一方が配置されている。図１においては、画像取得装置３ａと画像取得装置３ｂの両方が記載されているが、これは、いずれも機能的には略同様のものであるため、後段の部分が共用できることを想定して、説明を容易にするためであって、上述したように、いずれか一方が撮像装置６に搭載されている。画像取得装置３は、画像取得装置３ａ（例えば、リユースの内視鏡）および画像取得装置３ｂ（例えば、ディスポーザブルの内視鏡）のいずれかを指すものとして使用する。つまり、画像取得装置３は、地域や施設、あるいは症例（対象物）によって使い分けられるもので、使用者が異なることも想定している。ただし、いずれも、同様のガイド機能などが有効利用できることを想定しているので、推論モデルなどのシステムは共用できる可能性がある。また、ユーザーインターフェースや求められるガイドなども含め、推論モデル自身はカスタマイズされることを想定している。

　なお、本実施形態においては、画像取得装置３内には、画像取得装置３ａおよび画像取得装置３ｂの内のいずれか一方が配置されているとして説明しているが、画像取得装置３が、画像取得装置３ａと画像取得装置３ｂの両方を備えことを妨げるものではない。これは、状況に応じて複数の装置を利用するケースがあるからである。画像取得装置３ａからの画像データは既知のカテゴリに属し、画像取得装置３ｂからの画像データは未知のカテゴリに属しているとして説明する。そして、画像取得装置３ａと画像取得装置３ｂから出力される画像データは、特性が異なっている。この特性としては、画質、光源、画角等がある。例えば、画像取得装置３ａに比較し、画像取得装置３ｂの方が、画素数が少ない場合があり、また光学レンズの解像度が粗い場合がある等の場合には、画像の画質が異なっている。その他、使用者や対象物や使用環境が異なっても、データのカテゴリが未知になる。そのカテゴリに合わせて、ユーザーインターフェースや求められるガイドなども含め、推論モデル自身はカスタマイズされる。

　上述の違いを判別する情報は、例えば、各画像処理装置の機種の情報（その他、後述の光源など周辺システムの情報や処置具情報なども含んでもよく、また、別途、利用してもよい）とデータベース等を照合することによって取得できる。この情報は、装置内蔵のメモリ、あるいは装置の使用環境におけるシステム等に記録されているデータを画像推論用学習装置１に送信してもらうことによって、取得してもよいし、またユーザが手動で入力したものを使用してもよい。機種情報ではなく、画像処理装置の検出性能、処理性能を表す記号や数値等を使用してもよい。さらに、使用環境の情報、患者など対象物の情報（データ）に関しても同様に各装置からの通信によって取得して判定するようにしてもよいし、また手動入力された情報を、通信等を通じて取得し、使用してもよい。これらの取得した補足データの差異から、教師データの取捨選択や加工などを行ってもよい。また、使用されるツールや装置や、またこれらを扱う人やロボットの技量や性能、制約によっても、期待される推論モデルは変わってくる。このため、これらの情報も、メモリに記録された情報や、マニュアル入力やセンサ情報などから取得可能にする。メモリ情報の取得以外にも、画像データそのもの、あるいは、動画としての状況（画面）推移からも、それを分析すれば、想定していた推論モデルでは扱えない未知のカテゴリであると判定することも可能である。

　また、撮像装置６が光源を有し、この光源で照らされた対象物を撮影する場合にも、光源の波長特性や、配光特性によって得られる画像が異なってくる。また、画像取得装置３ａ、３ｂのいずれかが、狭帯域光法（ＮＢＩ(Narrow Band Imaging)）による観察が可能な場合でもよく、この場合には、画像取得装置３ａと画像取得装置３ｂの特性が異なっている。

　また、画像取得装置３の光学系の焦点距離が異なると画角が異なる。長焦点レンズの場合には、狭角ではあるが対象物が拡大された画像を得ることができる。一方、短焦点レンズの場合には、広角であるが対象物が縮小された画像を得ることができる。光学系がズームレンズの場合には、設定された焦点距離によって、画像が大きく異なる。

　また、画像取得装置３ａは、距離（分布）検出機能３Ｄ（３Ｄａａ）を有していてもよい。この３Ｄを有していれば、この点で画像取得装置３ａと画像取得装置３ｂは特性が異なっている。３Ｄ等３ａａは、対象物を３次元で撮像し、３次元画像データ等を取得するが、３次元画像以外にも、反射光や超音波等を取得して奥行情報を得るようにしてもよい。３次元画像データは、撮像装置３からの対象物の奥行等、対象物の空間内における位置を検出する際に使用できる。例えば、撮像装置６が内視鏡である場合に、医師が内視鏡を体内に挿入し、操作している際に、撮像部が３Ｄであれば、体内の部位と処置具の位置関係を把握することができ、また部位の３次元的な形状も把握することができ、３次元表示が可能となる。また、厳密に奥行き情報を取得せずとも、背景と手前にあるものの大きさの関係から、奥行き情報を算出することも可能である。

　画像取得装置３（画像取得装置３ａ、または画像取得装置３ｂ）において取得された画像データ等のデータであって、教師データ候補群とされたデータは、画像推論用学習装置１内の記録部４に出力され、教師データＡ群４ａとして記録される。この場合、撮像装置６内にメモリを設け、画像取得装置３において取得された画像データ等を記憶してもよい。

　なお、画像取得装置３内には、情報取得装置を配置していてもよい。情報取得装置は、画像データに限らず、対象物に関する情報、例えば、電子カルテ等と接続し、この電子カルテから患者に関する情報や、診断や処置に使用した機器に関する情報等を入手するようにしてもよい。例えば、医師が内視鏡を用いて処置している場合には、情報取得装置は、この患者の氏名、性別等や、内視鏡を挿入した体内の部位等の情報を得る。また、情報取得装置は、電子カルテからの情報以外にも、診断や処置時における音声データを取得してもよく、また医療関係のデータ、例えば体温データ、血圧データ、心拍データ等を取得しても良い。これらのデータも画像推論用学習装置１に出力するようにしてもよい。

　処置のリスク等を推論する場合には、上述の要素も加味して信頼性を向上することが可能である。本実施形態においては、主に画像の例で説明しているが、上述の数値データからも推論は可能である。また、特定の前提で集められた教師データが、異なる環境ではカスタマイズ必要である点は、画像を用いた推論と同様である。したがって、本実施形態における手法は画像に関わらず、データ一般に対して有効な提案であることが分かる。動画像による状況推移が重要なように、これらのデータの時間推移も同様の考え方で、本実施形態の手法を適用することが可能となる。以下の実施形態では、このような時間遷移を考慮した、推論モデルをあえて例にして説明する。静止画とか単体データを使った推論は、これより単純なのであえて例示していないが、以上、説明した内容で、大筋、理解がなされるはずである。

　画像推論装置２は、画像取得装置３が取得した画像データ等を入力し、画像推論用学習装置１が生成した推論モデルを用いて、推論を行って、推論結果に基づいてガイド部５にガイド表示を出力する。画像推論装置２は、画像入力部２ＩＮと、推論変更部２ＳＬと、推論部２ＡＩと、推論結果出力部２ＯＵＴを有する。なお、ユーザにどのようなガイド（表示であったり音声であったり）を出力するかも含めて、「推論モデル」と記載している場合がある。

　画像入力部２ＩＮは、画像取得装置３が出力した画像データを入力する。これらのデータは、複数のコマから成る時系列的なデータであり、時々刻々画像入力部２ＩＮに入力される。また、音声やその他のセンサで得られるデータなど、画像でない情報を必要に応じて合わせて参照してもよい。また、画像入力に限らず、データ入力部としてもよい。また、入力部に入力する画像は、連続して得られる画像の一コマずつでも良いし、複数コマをまとめて扱うようにしてもよい。複数コマで推論する推論エンジンを前提にする場合は、そのような学習をすればよい。

　推論部２ＡＩは、推論エンジンを有し、画像推論用学習装置１が生成した推論モデルを、この推論エンジンに設定する。推論エンジンは、後述する学習部１ｃと同様に、ニューラル・ネットワークを有し、このニューラル・ネットワークに推論モデルが設定される。推論部２ＡＩは、画像入力部２ＩＮが入力した画像データを、推論エンジンの入力層に入力し、推論エンジンの中間層において、推論を行う。この推論結果は、推論結果出力部２ＯＵＴがガイド部５に出力する。

　推論変更部２ＳＬは、推論部２ＡＩにおいて使用する推論モデルを変更する。撮像取得装置３Ａ、３Ｂは、前述したように、特性が異なっている。撮像取得部３Ａからのデータに基づいて作成した推論モデルが推論部２ＡＩに設定されている場合に、例えば、別の環境下で、上述の推論モデルのような機能を期待して、推論部２ＡＩに対し画像取得装置３Ｂからのデータを入力しても、適切な推論を行い、ガイド表示できない可能性がある。このように特性の異なるデータが画像入力部２ＩＮに入力した場合には、制御部７は、画像取得装置３Ｂが出力するデータに適合する、補正した推論モデルの作成を依頼する。推論変更部２ＳＬは、推論部２ＡＩにおいて、この補正した推論モデルに変更させる。

　上述の補正した推論モデルは、補正した教師データによって学習されたものと言い換えてもよい。つまり、画像データ等、データとしては同一であっても、このデータを基にした教師データを作成する際に、加工のやり方（教師データの加工、補正）や、取捨選択のやり方を変えることによって、異なる仕様、性能の推論モデル（補正した推論モデル）を作成することが出来るからである。

　ガイド部５は、表示用のディスプレイ等を有し、画像取得装置３が取得した対象物の画像を表示する。また、推論結果出力部２ＯＵＴが出力した推論結果に基づくガイド表示を行う。

　制御部７は、ＣＰＵ（Central Processing Unit）７ａ、メモリ７ｂ、および周辺回路を有するプロセッサである。制御部７は、メモリ７ａに記憶されているプログラムに従って、撮像装置６内の各装置や各部を制御する。

　画像推論用学習装置１は、画像取得装置３が取得した画像データを用いて、機械学習（深層学習を含む）を行って、推論モデルを生成する。画像推論用学習装置１は、画像入力部１ｂ、学習部１ｃ、画像加工部１ｄ、学習結果利用部１ｅ、教師データ選択部１ｆ、記録部４を有する。

　記録部４は、撮像装置６内の画像取得装置３から出力された画像データや各種情報データを記録するための電気的に書き換え可能な不揮発性メモリである。記録部４に記録されている各種データは、画像入力部１ｂに出力される。記録部４は、教師データＡ群４ａと教師データＢ群４ｂが記憶可能である。また、記録部４には、推論モデルの実力を検証するようなテストデータを記録してもよい。このテストデータ自体を記録しておかなくても、記録部４に記録してある教師データの一部を取り出してテストデータとして利用してもよい。

　教師データＡ群４ａは、画像取得装置３ａが取得した時系列データに基づく教師データ群である。教師データＢ群４ｂは、後述するように、未知のカテゴリ用に推論モデルを生成する際に、既に記録されている教師データＡ群４ａを加工して作成した教師データである。記録部４としては、画像取得装置の特性が異なると、それぞれ異なる教師データ群として記録するようにする。記録部４には、画像取得装置３から送信されてきた教師データの候補群と、後述するアノテーションが付与された教師データ群の両方が記録される。また、教師データ選択部１ｆによって採用された教師データに限らず、不採用の教師データも、未知のカテゴリ用の教師データを作成する際に使用できる可能性もあることが、記録部４に記録しておいてもよい。

　教師データ群は、画像取得装置３において取得した時系列データ（後述する図４のＳ３５において、画像推論用学習装置１に送信されてくる）に対して、制御部１ａがアノテーションを施すことによって生成する。例えば、後述する図２においては、内視鏡を体内に挿入した際に出血した場合を示し、図２（ａ）においては出血が拡大し、一方、図２（ｂ）においては出血が縮小している。このような場合に、出血がどのように変化したかを、時系列データＩＤ１、ＩＤ２にアノテーションすることによって、教師データを作成することができる。ここでのアノテーションは、自動で出来るものであっても、必要に応じて、手動で行うものであってもよい。また、カスタマイズ時に、手動によるアノテーションの結果を考慮・反映して自動で行ってもよい。自動でアノテーションを行った場合に、マニュアルでチェックを行い、チェック結果によっては、やり直しを促すようなステップを入れてもよい。

　アノテーションを付与するにあたって、「教師データの加工、補正」、「教師データの取捨選択」を変えることによって行うこともある。例えば、図２に示す出血と同じであっても、出血した際に即応できる処置具や人員やスキル（こうした情報も取得できるようにする）があるかないかによって、出血後の状況の挽回の度合いが変わってくるからである。つまり、スキルや器具類を含めた体制が万全の体制で得た教師データであって、「出血なし」とアノテーションするよう判断した画像であっても、スキルや器具類で劣る体制においてガイドするための推論ガイドを作成する際には、厳しめの判断によってアノテーションを付与する方が良い。

　こうしたスキルの情報などをランク分けするような情報を持ってもよい。スキル情報を手動入力した結果や、予め登録した記録結果や、これまでの来歴で判定して、カスタマイズ時の情報としてもよく、取得画像の傾向から判定してもよい。わかりやすい例で言えば、プロカメラマンの撮影した写真と、初心者の撮影した写真では、機材の差異以外に構図や露出、ピントなどで違いが分かるので、それでスキル判定してもよい。動画になるとさらにその傾向は強く、機材の取り扱いの慣れ方が、その画像に残る。音声などを同時に取得して参考にする方法もある。また、画像のゆがみやボケなどから使用機材を判定することもできる。

　つまり、本実施形態における推論用学習装置は、第１の画像取得装置からの画像データを入力する入力部と、上記画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る学習部と、を有する画像推論用学習装置において、上記第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、上記推論モデルをカスタマイズ学習（または再カスタマイズ学習）する際に、上記教師データのうち第１の画像取得装置から得た画像データを上記画像取得特性の差異に応じた教師データ化の加工（アノテーションの変更を含む）を行って教師データとする画像加工部とを具備している。

　一例を挙げると、止血機能が付いたメスとその機能がないメスでは、出血後の対処結果が異なるので、この差異を推論モデルに入れ込んだ方がよい。この器具の仕様や性能の差異は、予め入力されている情報によって判定してもよいし、撮像された結果に映り込んだ処置具の画像の特徴によって判定してもよい。例えば、止血機能なしの処置具使用での処置画像と止血機能ありの処置具使用での処置画像は区別した方がよく、その差異を織り込んで学習すれば、一方の画像を他方の画像として、いわば加工、補正した形で教師データを作成できる。つまり、止血機能ありの画像から、加工、補正を行うことによって、止血機能なしの処置時のガイド用の推論モデルを作成することが可能となる。手術等は、個人の体質や患部などによって、千差万別の態様を呈するので、必ずしも、理想的な教師データが集めやすいわけではないので、こうした工夫によって信頼性の高い推論モデルを作ることが容易になる。

　画像入力部１ｂは、画像取得装置３ａが取得し、記録部４に記録されている教師データＡ群４ａを入力する。この画像入力部１ｂに入力する教師データ群４ａには、アノテーションが付与されている。入力した教師データＡ群４ａは学習部１ｃと画像加工部１ｄに出力する。学習にあたっては、画像データに限らず、画像取得装置３ａが取得した画像以外のデータを用いるようにしても勿論かまわない。なお、学習装置が再学習し、補正した推論モデルを生成した場合には、教師データＡ群４ａを加工した教師データＢ群４ｂを、画像入力部１ｂに入力する。画像入力部１ｂは、第１の画像取得装置から画像データを入力する入力部（入力用インターフェース）として機能する（例えば、図３のＳ１、Ｓ５、図５のＳ１ａ、Ｓ５ａ参照）。

　画像加工部１ｄは、画像加工回路等またはプログラムによって、画像入力部１ｂが入力した教師データの加工を行う。前述したように、画像取得装置３ａと画像取得装置３ｂでは、画像取得装置の特性が異なっている。このため、画像取得装置３ａで取得した画像データに基づいて教師データを生成し、学習部１ｃが推論モデルを生成した場合に、画像取得装置３ｂで取得した画像データで推論モデルを作成したとしても、適切な推論を行うことができない。そこで、画像加工部１ｄが画像入力部１ｂにおいて入力した画像データに対して画像加工を行い、あたかも画像取得装置３Ａによって取得した画像データと同様に変換する。画像加工部１ｄが加工した画像データは、学習部１ｃに出力される。なお、画像の加工の詳細については、図６を用いて後述し、また補正した推論モデルの生成については、図５を用いて後述する。

　画像加工部１ｄは、第１の画像取得装置とは異なる特性の第２の画像取得装置用に、推論モデルを再学習する際に、教師データのうち第１の画像取得装置から得た画像データを加工して教師データとする画像加工部（画像加工用プロセッサ）として機能する（例えば、図５のＳ１ａ～Ｓ７ａ、図６（ｂ）参照）。上述の画像入力特性は、撮像センサの仕様、性能、撮像用光学特性、画像処理仕様、性能、および照明光の種別の少なくとも１つの差異に起因する。

　画像加工部は、教師データのうち第１の画像取得装置から得た画像データに含まれる第１の対象物画像データが、第２の画像取得装置から得た画像データに含まれる第２の対象物画像データに適合するように加工する（例えば、図５のＳ１ａ～Ｓ７ａ、図６（ｂ）参照）。画像加工部は、教師データのうち第１の画像取得装置から得た画像データを画像入力特性の差異に応じた教師データとなるように、同一画像へのアノテーションを変更することを含む。

　また、画像入力装置は、何らかの操作を伴って使用されるものであり、環境の変化や対象物の変化やさらには併用するツールによって画像の内容や得られた画像に変化が生じる場合がある。この場合は、画像入力特性が変化したと考えられ、画像入力特性の差異に応じた「加工」を行う。この画像入力特性の差異に応じた「加工」は、画像処理の種別、あるいは補正の仕方のみならず、教師データの一部でもあるアノテーションの内容や、加工した教師データを用いた学習結果の仕様方法に関する推論開始のトリガタイミングなどの補正などをも含んでいる。これは、実際にこの推論モデルを利用する第２の仕様の画像取得装置の使用環境、条件（装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む）の変化にも対応できるような「加工」処理をも想定しているからである。

　ここで、第１の画像取得装置から得た画像データは、既存の教師データである。すなわち、記録部４には、教師データ選択部１ｆによって採用された教師データが蓄積されている。画像加工部は、第２の画像取得装置（すなわち、第１の画像取得装置とは特性が異なる）からの画像データの特性に応じて、既存の教師データを画像処理する（例えば、図５のＳ１ａ、Ｓ５ａ参照）。また、画像加工部は、第２の画像取得装置からの画像データの特性に応じて、既存の教師データの取捨選択を行う（図５のＳ１３参照）。画像加工部は、教師データのうち第１の画像取得装置から得た画像データを、第２の画像取得装置からの画像データと適合するように加工する（例えば、図５のＳ１ａ、Ｓ５ａ、Ｓ１３参照）。

　また、画像加工部は、推論モデルの用途が異なる場合に、該用途に応じて、既存の教師データを画像処理し、または既存の教師データの取捨選択を行うようにしてもよい。画像加工部は、第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、推論モデルをカスタマイズする際に、第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って教師データとしてもよい。例えば、熟練した使用者が撮像装置６を操作して取得した画像データに基づく教師データを用いて推論モデルを生成した場合、この非熟練者がこの推論モデルを用いて操作ガイドを行っても適切なガイドが難しい場合がある。このような場合には、画像加工部１ｄや画像選択部１ｆによって、不適当な画像データを排除し、画像データの中から新たに選択して追加してもよく、適宜、画像を修正してもよい。これらは連携してもよいので、画像加工部１ｄや画像選択部１ｆ間で通信を行ってもよい。また、画像加工部は、推論モデルの使用用途を考慮して、画像データや教師データを加工、選択してもよい。例えば、癌の診断のために使用される推論モデルとして、人種、性別、年齢等を考慮して、画像データの選択や、また加工を行ってもよい。

　また、学習を行い、推論モデルを生成した際には、学習部１ｃが学習結果の信頼性を判定する、この判定は、テストデータを用意し、このテストデータを推論モデルに入力した際の出力が、予め分かっている正解であったか否かによって、判定することができる（例えば、図３および図５のＳ１１参照）。このためのテストデータは記録部４の中から選択してもよく、また学習装置の外部から取得する際に、画像選択部１ｆが適正なテストデータを選択し、必要に応じて画像加工部１ｄが加工してもよい。適正に加工できるテストデータを選択するには、画像加工部１ｄと画像選択部１ｆが連携して行うのがよい。なお、テストデータは、使用される実機の実際のパフォーマンスを検証するものであるから、実機で実際に取得された画像を選択する方が良い。画像選択部１ｆが相応しい画像を選択し、画像加工部１ｄが加工する場合も、画像選択部１ｆが選択した適切な画像を加工してもよい。

　学習部１ｃは、推論部２ＡＩと同様に推論エンジンを備え、推論モデルを生成する。学習部１ｃは、画像入力部１ｂが入力した画像データ、または画像加工部１ｄが加工した画像データを用いて、深層学習等の機械学習によって推論モデルを生成する。深層学習については、後述する。学習部１ｃは、画像データにアノテーションを行って得た教師データを用いた学習によって推論モデルを得る学習部（学習用エンジン）として機能する（例えば、図３および図５のＳ９参照）。

　教師データ選択部１ｆは、学習部１ｃにおいて生成された推論モデルの信頼性を判定し、この判定結果に基づいて教師データとして採用するか否かを判定する。すなわち、信頼性が低い場合には、推論モデルを生成するにあたって使用した教師データとして採用せず、信頼性が高い場合の教師データのみを採用する。学習部１ｃは、教師データ選択部１ｆによって採用された教師データによって推論モデルを最終的に生成する。また、教師データ選択部１ｆによって採用された教師データは、記録部４の教師データＡ群４ａとして記録しておく。場合によっては、教師データ選択部１ｆがメモリを有し、このメモリに採用された教師データを記録しておいてもよい。

　学習部１ｃにおいて生成された推論モデルは、学習結果利用部１ｅに出力される。学習結果利用部１ｅは、生成された推論モデルを画像推論部２ＡＩ等の推論エンジンに送信する。

　ここで、深層学習について、説明する。「深層学習（ディープ・ラーニング）」は、ニューラル・ネットワークを用いた「機械学習」の過程を多層構造化したものである。情報を前から後ろに送って判定を行う「順伝搬型ニューラル・ネットワーク」が代表的なものである。順伝搬型ニューラル・ネットワークは、最も単純なものでは、Ｎ１個のニューロンで構成される入力層、パラメータで与えられるＮ２個のニューロンで構成される中間層、判別するクラスの数に対応するＮ３個のニューロンで構成される出力層の３層があればよい。入力層と中間層、中間層と出力層の各ニューロンはそれぞれが結合加重で結ばれ、中間層と出力層はバイアス値が加えられることによって、論理ゲートを容易に形成できる。

　ニューラル・ネットワークは、簡単な判別を行うのであれば３層でもよいが、中間層を多数にすることによって、機械学習の過程において複数の特徴量の組み合わせ方を学習することも可能となる。近年では、９層～１５２層のものが、学習にかかる時間や判定精度、消費エネルギーの観点から実用的になっている。また、画像の特徴量を圧縮する、「畳み込み」と呼ばれる処理を行い、最小限の処理で動作し、パターン認識に強い「畳み込み型ニューラル・ネットワーク」を利用してもよい。また、より複雑な情報を扱え、順番や順序によって意味合いが変わる情報分析に対応して、情報を双方向に流れる「再帰型ニューラル・ネットワーク」（全結合リカレントニューラルネット）を利用してもよい。

　これらの技術を実現するために、ＣＰＵやＦＰＧＡ（Field Programmable Gate Array）等の従来からある汎用的な演算処理回路を使用してもよい。しかし、これに限らず、ニューラル・ネットワークの処理の多くが行列の掛け算であることから、行列計算に特化したＧＰＵ（Graphic Processing Unit）やTensor Processing Unit（TPU）と呼ばれるプロセッサを利用してもよい。近年ではこのような人工知能（ＡＩ）専用ハードの「ニューラル・ネットワーク・プロセッシング・ユニット（ＮＰＵ）」がＣＰＵ等その他の回路とともに集積して組み込み可能に設計され、処理回路の一部になっている場合もある。

　その他、機械学習の方法としては、例えば、サポートベクトルマシン、サポートベクトル回帰という手法もある。ここでの学習は、識別器の重み、フィルター係数、オフセットを算出するものあり、これ以外にも、ロジスティック回帰処理を利用する手法もある。機械に何かを判定させる場合、人間が機械に判定の仕方を教える必要がある。本実施形態においては、画像の判定を、機械学習によって導出する手法を採用したが、そのほか、教師データに対してアノテーション結果が導き出せる手法であれば、人間が経験則・ヒューリスティクスによって獲得したルールを適応するルールベースの手法を用いてもよい。

　制御部１ａは、ＣＰＵ（Central Processing Unit）１ａａ、メモリ１ａｂ、および周辺回路を有するプロセッサである。制御部１ａは、メモリ１ａｂに記憶されているプログラムに従って、画像推論用学習装置１内の各部を制御する。例えば、制御部１ａは、画像取得装置３が出力した画像データ等に対して、アノテーションを付与する（図３のＳ３、Ｓ７、図５のＳ３ａ、Ｓ７ａ参照）。

　次に、図２（ａ）（ｂ）を用いて、画像収集の例と、この画像に基づくガイド表示の例として、内視鏡を用いて処置を行っている場合について説明する。この内視鏡は、図１に示した撮像装置６を有しており、従って、画像取得装置３、画像推論装置２、およびガイド部５を有している。

　図２（ａ）は、内視鏡で処置している際に、体内で出血ＢＬが生じ、その出血が拡大し拡大出血ＢＬＬとなってしまった例を示す。内視鏡の画像取得装置３は、医師が処置をしている間、所定時間間隔で、常時、画像データを収集し、この画像データを制御部１ａが撮像装置６内のメモリに教師データ候補群として記録している。図２（ａ）の例は、時刻Ｔ＝０において出血が生じ、時刻Ｔ＝Ｔ１ａにおいて、出血が拡大したと認識できる。この場合には、この時刻Ｔ＝０から時間を遡り５秒前の時刻からの画像データＩＤ１を、出血拡大時画像として記録する。画像推論用学習装置１が、この収集した画像データＩＤ１に対して、時刻Ｔ＝Ｔ１ａ以降において拡大出血ＢＬＬとなる旨のアノテーションを付与すれば、出血拡大時の教師データとなる。本実施形態においては、アノテーションは画像推論用学習装置１において行うが（図３のＳ３、図６のＳ３ａ参照）、撮像装置６において実行し、アノテーションを施した教師データを画像推論用学習装置１に送信してもよい。

　図２（ｂ）は、内視鏡で処置している際に、体内で出血が生じたが、その出血はその後、縮小した例を示す。内視鏡の画像取得装置３は、図２（ａ）の例と同様に、処置をしている間、所定時間間隔で、常時、画像データを収集し、この画像データを制御部１ａが撮像装置６内のメモリに教師データ候補群として記録している。図２（ｂ）の例は、時刻Ｔ＝０において出血が生じ、時刻Ｔ＝Ｔ１ｂにおいて、出血が縮小したと認識できる。この場合にも、この時刻Ｔ＝０から時間を遡り５秒前の時刻からの画像データＩＤ２を、出血拡大時画像として収集する。画像推論用学習装置１が、この収集した画像データＩＤ２に対して、時刻Ｔ＝Ｔ１ｂ以降において縮小出血ＢＬＳとなる旨のアノテーションを付与すれば、出血縮小時の教師データとなる。本実施形態においては、アノテーションは画像推論用学習装置１において行うが（図３のＳ７、図６のＳ７ａ参照）、撮像装置６において実行し、アノテーションを施した教師データを画像推論用学習装置１に送信してもよい。このように時系列に連続した画像取得（動画）を分析することによって、様々な有効情報を得ることができる。

　図２（ａ）（ｂ）において、時刻Ｔ＝０は、ユーザが出血に気付くタイミングであるが、出血の原因となる行為や現象は、時刻Ｔ＝０よりも前のタイミングに発生していることが多い。そこで、本実施形態においては、イベント（例えば、出血拡大、出血縮小等）があると、トリガ情報を発生させ、その特定タイミングよりも時間を遡って、データを収集し、因果関係を整理するようにしている。このように時系列に連続した画像取得（動画）を分析することによって、様々な有効情報を得ることができる。

　図２（ａ）（ｂ）のような例を多数収集し、アノテーションすることによって、多数の教師データを作成することができ、ビックデータとして扱うことができる。学習部１ｃはこれらの多数の教師データを用いて、推論モデルを生成する。この推論モデルは、時刻Ｔ＝０において、出血が生じた場合に、所定時間経過後（図２（ａ）（ｂ）の例では、Ｔ１ａまたはＴ１ｂに）に出血が拡大するか縮小するかを推論することができる。

　このような推論モデルが作成され、撮像装置６の推論部２ＡＩにこの推論モデルを設定しておけば、画像取得部３によって取得した画像に基づいて、将来を予測することができる。すなわち、撮像装置６は、時刻Ｔ＝１にならない時刻Ｔ＝０のタイミングにおいて、出血を認識すると、図２（ａ）（ｂ）に示すように、そのタイミングから所定時間遡った時刻（Ｔ＝－５sec）までの画像データに基づく教師データ（あるいは教師データ候補）を、推論モデルに入力することによって、出血が拡大するか、縮小するかを予測できる。この予測（推論）結果が出血拡大の場合には、撮像装置６のガイド部５に、注意表示Ｇａを表示する。一方、予測（推論）結果が出血縮小の場合には、出血していても大丈夫である旨のガイドＧｏを表示する。

　次に、図２（ａ）（ｂ）で使用する推論モデルの作成について、図３に示すフローチャートを用いて説明する。このフローは、画像推論用学習装置１内の制御部１ａのＣＰＵ１ａａがメモリ１ａｂに記憶されたプログラムに従って実現する。

　図３に示す推論モデル作成のフローが開始すると、まず、出血拡大時過程画像を収集する（Ｓ１）。前述したように、撮像装置６は、画像取得装置３が取得した連続画像の中で、図２（ａ）に示すような、時刻Ｔ＝－５からＴ＝Ｔ１ａの間で、出血している部分の面積が増加している画像を収集する。具体的には、前述した図２（ａ）において、制御部７が画像データの画像解析を行い、出血が拡大していると判断した場合には、トリガ情報を発生し（図４のＳ２７参照）、出血拡大画像を遡り記録する（図４のＳ２９参照）。この遡り記録された画像は、撮像装置６内のメモリに、一旦、記録される。このステップＳ１では、画像推論用学習装置１の制御部１ａが、出血拡大時の過程画像を撮像装置６等から収集し、記録部４に一旦記憶する。

　ステップＳ１において、出血拡大時の過程画像を収集すると、その画像データに「出血拡大」をアノテーションする（Ｓ３）。ここでは、制御部１ａが、収集した個々の画像データに「出血拡大」のアノテーションを施し、アノテーションを施した画像データは記録部４に教師データＡ群４ａとして記録する。

　次に、出血縮小時過程画像を収集する（Ｓ５）。前述したように、撮像装置６は、画像取得装置３が取得した連続画像の中で、図２（ｂ）に示すような、時刻Ｔ＝－５からＴ＝Ｔ１ｂの間で、出血している部分の面積が減少している画像を収集する。具体的には、前述した図２（ｂ）において、制御部７が画像データの解析を行い、出血が縮小していると判断した場合には、トリガが発生し（図４のＳ２７参照）、出血縮小画像を遡り記録する（図４のＳ２９参照）。この遡り記録された画像は、撮像装置６内のメモリに、一旦、記録される。このステップＳ５では、画像推論用学習装置１の制御部１ａが、出血縮小時の過程画像を撮像装置６等から収集し、記録部４に一旦記憶する。

　ステップＳ５において、出血縮小時の過程画像を収集すると、その画像データに「出血縮小」をアノテーションする（Ｓ７）。ここでは、制御部１ａが、収集した個々の画像データに「出血縮小」のアノテーションを施し、アノテーションを施した画像データは記録部４に教師データＡ群４ａとして記録する。

　図３に示すフローでは、出血拡大の後に出血縮小の画像を収集している。しかし、実際には、画像取得装置３によって収集した画像中に出血が生じているか否か、また出血が生じている場合には、その範囲が拡大しているか縮小しているかに応じて、ステップＳ１からＳ７を適宜選択して実行する。

　次に、推論モデルを作成する（Ｓ９）。ここでは、ステップＳ３、Ｓ７において撮像装置６が生成したアノテーションを施した教師データは、教師データＡ群４ａとして記録され、この教師データは画像入力部１ｂに入力される。この教師データを用いて、画像推論用学習装置１内の学習部１ｃが推論モデルを作成する。この推論モデルは、画像を入力した場合に、「〇秒後、出血が拡大」を出力するような予測できるようにする。

　推論モデルを作成すると、信頼性がＯＫか否かを判定する（Ｓ１１）。ここでは、学習部１ｃが、予め回答が分かっている信頼性確認用の画像データを、その推論モデルに入力した場合の出力が、回答と同じであるか否かに基づいて信頼性を判定する。作成された推論モデルの信頼性が低い場合には、回答が一致する割合が低い。

　このような処置に対する予測の推論では、処置する医師などの技量や処置具の違いなどが推論に反映されることが望ましい。しかし、多くの場合、推論モデル作成時に意図して収集する画像データとしては、文字通り教師データとするために、優れた医師の処置の優れた道具での処置過程の画像データが集めやすい。しかし、想定外の道具を使っての熟練していない者によって行われる状況での処置の方が、ガイド表示する意味があり、こうしたいわば、想定外事例に対応できるようにすることが望ましい。さらには、まったく新奇な処置具などが上市されたような場合も想定外となり得るし、こうした道具に関しては、多くの場合、始めは未熟なユーザが多くなる。また、熟練していない手技の程度は千差万別であり、多くの場合、想定外となりうる。つまり、極論すれば、見たこともない道具で、熟練していない手技に対しても、信頼性の高いガイドを提示するのが望ましく、こうしたケースに本実施形態における推論用学習システムは対応可能である。

　このように、学習によって、信頼性の高い推論モデルを生成することによって、もっぱら、第１の画像取得装置（例えば、画像取得装置３ａ）からの画像データにアノテーションを行って得た教師データを用いて学習を行い、この学習によって推論モデルを得る学習部を有する推論用学習装置が提供できる。また、第１の画像取得装置用に収集された教師データを、第１画像取得装置とは特性が異なる第２画像取得装置（例えば、画像取得装置３ｂ）用の推論モデル作成にも有効利用することも出来る。

　つまり、第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、教師データを有効利用して学習する際に、画像加工部が教師データのうち第１の画像取得装置から得た画像データを画像取得特性の差異に応じた加工をして教師データとする画像加工をしながら、異なる画像入力特性の第２の画像取得装置用の推論モデルを作成してもよい。画像入力特性の差異の要因としては、撮像センサの仕様、性能、撮像用光学特性、画像処理仕様、性能、照明光の種別の差異に起因するものがある。

　また、画像取得装置に差異がある場合、その他の装置にも差異があることが考えられる。例えば、そのような環境における撮像対象はおのずと、異なる外観を呈している可能性がある。したがって、上述の画像加工部は、教師データのうち第１の画像取得装置から得た画像データに含まれる第１の対象物の画像データと、第２の画像取得装置から得た画像データに含まれる第２対象物の画像データと適合するように加工するようにしてもよい。

　例えば、第２の画像取得装置で検出された類似の対象物の画像の特徴を、すべて、第１の画像取得装置で得た画像に写っている対象物に付与して、新しい教師データを作成することが考えられる。例えば、学会発表等では、シマウマの画像がない場合、馬の画像に縞を付けて代用するなどの例がある。これは色や模様を変更するだけであるが、その他形状の特徴などの差異を補正して利用してもよい。また、例えば、先端の形状が丸い処置具に対して、先端の形状が四角い処置部の教師データを利用する場合、処置具の先端が比較的丸いものを選んで教師データにしてもよいし、その先端形状の特徴の差異の補正を行って形状を変えた画像で学習すればよい。

　ただし、画像を処理することによって、対象物の応用範囲は広がるが、必ずしも期待する仕様（例えばそのユーザのスキルに合わせたガイド機能）が満たせない場合がある。そこで、この場合には、画像処理だけではなく、教師データの取捨選択やアノテーションの内容や方法の加工（調整や変更）を行うとよい。また、推論結果の表示の仕方に加工を加えてもよい。あるいは、熟練者には、特定の信頼性がある画像取得タイミングで警告を出すが、そうでない場合には、信頼性が低くても、信頼性が向上したタイミングで、安全を見て警告を出すといったカスタマイズが可能となる。

　つまり、本実施形態における推論用学習装置は、第１の画像取得装置からの画像データを入力する入力部と、この画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る学習部と、を有し、さらに第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、上記推論モデルを再学習する際に、第１の画像取得装置から得た画像データをユーザのスキルによって生じる画像入力特性の差異に応じた、信頼性判定レベルの変更などの加工を行って上記教師データとする画像加工部を有している。手振れやもたつき、特定のシーン変化の対応の速さ等において、使用者のスキルが分かれる。このスキルの相違に基づいて、画像入力特性の差異（あるいは時間的な画像データ変化の差異）が生じる。ここでは時間的な画像データ変化の仕方の差異を上位概念的に画像入力特性の差異と表現している。

　また、補正や加工によって作成した教師データを用いて、第２の画像取得装置用に生成した推論モデルに対して、信頼性を判定する時に使うテストデータとしては、第２の画像取得装置の推論モデル用であるので、第２の画像取得装置からのデータを利用してもよい。

　また、見たこともない道具に対する学習では、類似形状の道具を複数組み合わせて確率を上げたり、見た事のない部分の形状に類似な道具を使って学習を行えばよく、従来の教師データにて撮像された処置具画像を置き換えたり、一部形状変更して学習させればよい。安全サイドにたって学習するためには、従来の処置具教師データの出血タイミングを時間的に前倒しにして使用したり、出血の広がりを厳しく設定したりする等の方法が考えられる。

　未熟練者の手技に対して学習する場合について、先に、信頼性レベルを変える方策を説明したが、この方法以外にも、従来の教師データにて得られた道具の動きのぶれを強調したり、時間推移を早めたりする方法が考えられる。従来の手技教師データの出血タイミングを、同様に、時間的に前倒しにして使用したり、ガイドを出すタイミングを前倒したりする等の工夫を行ってもよい。

　ステップＳ１１における判定の結果、信頼性が所定値より低い場合には、教師データを取捨選択する（Ｓ１３）。信頼性が低い場合には、教師データを取捨選択することによって、信頼性が向上する場合がある。そこで、このステップでは、教師データ選択部１ｆが、因果関係がないような画像データを除くようにする。例えば、出血拡大・縮小の原因と結果の間に因果関係がないような教師データを除く。この処理は、因果関係を推論する推論モデルを用意しておき、因果関係が低い教師データを自動的に排除するようにしてもよい。また、教師データの母集団の条件を変更するようにしてもよい。教師データを取捨選択すると、ステップＳ９に戻り、再度、推論モデルを作成する。

　一方、ステップＳ１１における判定の結果、例えば、想定するシステムで得たデータなどを優先的に利用して信頼性を検証し、信頼性がＯＫとなった場合には、推論モデルを送信する（Ｓ１５）。ここでは、生成された推論モデルが信頼性の基準を満たしたことから、教師データ選択部１ｆは、このとき使用した教師データ候補を、教師データとして確定する。また、学習結果利用部１ｅは、撮像装置６に生成された推論モデルを送信する。撮像装置６は推論モデルを受信すると、推論部２ＡＩに推論モデルを設定する。推論モデルを送信すると、推論モデル作成のフローを終了する。なお、この送信した推論モデルは、その仕様などの情報も併せて送信すれば、撮像装置における推論時に単体画像で推論するとか、複数画像で判定するとか、その時間差がどれくらいあるか（フレームレートなど）等についても反映した制御が出来るようになる。その他の情報を扱えるようにしてもよい

　このように、本フローにおいては、学習装置は、画像取得装置３からの画像データを入力し（Ｓ１、Ｓ５）、この画像データにアノテーションを行って教師データを作成し（Ｓ３、Ｓ７）、この作成した教師データを用いた学習によって推論モデルを得ている（Ｓ９）。特に、画像取得装置３から時系列で連続的に得た画像において、特定タイミングから遡ったタイミングの画像データに対してアノテーションを行い（Ｓ３、Ｓ７、Ｓ１３）、教師データとしている（Ｓ１１、Ｓ１３）。このように、常時出力されている画像データの内、何らかのイベントが生じた特定タイミング（例えば、出血が拡大した、出血が縮小した）から時間を遡り、時系列的な画像データを取得し、この画像データにアノテーションを行って教師データ候補としている。この教師データ候補を用いて学習を行うことによって推論モデルを生成し、生成した推論モデルの信頼性が高くなれば、教師データ候補を教師データとしている。

　つまり、本フローにおいては、何らかのイベントが発生した特定タイミングから遡ったデータを用いて推論モデルを生成している。すなわち、特定タイミング時における結果に対応する原因となる事象に基づいて、すなわち因果関係に基づいて、将来を予測することのできる推論モデルを生成することができる。この推論モデルを利用すれば、ユーザが気づかないような小さな行為や現象があった場合であっても、見逃さず、将来を予測でき、例えば事故が起きるような場合に注意や警告を行うことができる。また、ユーザが気づいた心配事があっても、それが大事に至らない場合には、その旨を告知することができる。

　本フローにおける画像推論用学習装置１は、多数の撮像装置６から教師データ群４Ａを収集できるので、極めて多くのデータを用いて、教師データを作成でき、信頼性の高い推論モデルを生成することが可能である。またに、本実施形態においては、イベントが発生した場合に、これと関係する範囲に絞ったデータを収集するようにしているので、効率よく推論モデルを生成することができる。

　なお、本フローにおいては、画像推論用学習装置１が、撮像装置６から教師データの候補となり得る画像データ群を収集し、この画像データ群に出血拡大等のアノテーションを行っていた（Ｓ３、Ｓ７参照）。しかし、撮像装置６が、これらのアノテーションを行って教師データ群を生成し、学習部１ｃがこの教師データ群を用いて、推論モデルを生成するようにしてもよい。この場合には、画像推論用学習装置１において、アノテーションを行う工程を省略することができる。この場合には、本フローは、画像推論用学習装置１内の制御部１ａと、撮像装置６内の制御部７が、協働して実現することになる。

　次に、図４に示すフローチャートを用いて、撮像装置６の動作について説明する。この動作は、撮像装置６内の制御部７が撮像装置６内の各装置や各部を制御することによって実行する。なお、この撮像装置６は、内視鏡装置内に備えられている例として説明する。また、このフローでは、電源のオフ・オフ等、一般的に行われる操作は省略している。

　図４に示すフローが開始すると、まず、撮像および表示を行う（Ｓ２１）。ここでは、画像取得装置３が、所定時間間隔（フレームレートで決まる）で、画像データを取得すると、この画像データに基づいて、ガイド部５に表示を行う。例えば、撮像装置６が内視鏡装置内に備えてられていれば、内視鏡の先端部に設けられた撮像素子によって取得された体内の画像が、ガイド部５に表示される。この表示は、フレームレートで決まる所定時間毎に、更新される。このガイドの態様を、本明細書に記載に技術によって、初心者と熟練者で分けるなど、ユーザによって変えてもよい。対象物や使用環境で変える場合も想定している。

　次に、ＡＩ修正が必要か否かを判定する（Ｓ２３）。使用している機器（撮像装置６Ａを備えている）が、画像取得装置６Ｂに変更されたり、またバージョンアップされたりして画像データの特性が変更されることによって、推論部２ＡＩに搭載されている推論モデルが適切でなくなる場合がある。また、これらの理由以外にも、他の理由等によって、適切でなくなる場合がある。このような場合には、推論部２ＡＩに設定されている推論モデルを修正するのが好ましい。そこで、このステップでは、制御部７が推論モデルを修正することが必要か否かを判定する。

　上述したような使用機器が変更される等の理由によって、推論モデルが不適切となった場合には、この機器からの画像データを用いて推論モデルを生成するのが好ましい。しかし、この機器のデータが少ない場合には、相当数のデータを収集するまで、推論モデルを生成することができない。そこで、本実施形態においては、今まで収集した画像データを加工することによって、補正した推論モデルを生成するようにする。ＡＩ修正必要か否かの詳しい動作について、図７を用いて後述する。

　ステップＳ２３における判定の結果、ＡＩが修正必要と判定されると、次に、補正した推論モデルの生成を依頼し、取得する（Ｓ２５）。ここでは、撮像装置６は、画像推論用学習装置１に、補正した推論モデルの生成を依頼し、推論モデルが生成されると、これを取得する。補正した推論モデルの依頼の際には、修正が必要な箇所等の情報も送信するとよい。すなわち、前述したように、本実施形態においては、既に使用したことのある教師データを、新しい機器等に適用するように加工し、この加工した教師データを用いて、補正した推論モデルを生成する。この補正した推論モデルの生成の詳しい動作については、図５を用いて後述する。

　補正した推論モデルを取得すると、またはステップＳ２３における判定の結果、ＡＩ修正が必要でなかった場合には、次に、トリガ情報か否かを判定する（Ｓ２７）。例えば、図２（ａ）（ｂ）を用いて説明したように、イベントが発生した場合、例えば、処置の最中に出血が発生し、この出血が拡大しているような場合には、トリガ情報が発生する。トリガ情報の出力は、この例では、制御部７が、画像取得装置３が取得した画像データを解析し、出血が拡大していると判断した場合に行えばよい。また、この画像解析は、推論モデルを利用したＡＩによって行っても良く、また、医師が手動で特定の釦等を操作する等によって、トリガ情報を出力するようにしてもよい。

　ステップＳ２７における判定の結果、トリガ情報が発生した場合には、所定時間遡り記録を行う（Ｓ２９）。ここでは、画像取得装置３が取得した画像データを、所定時間遡って撮像装置６内の画像データ記憶用のメモリに記録する。通常は、画像取得装置３が取得したすべての画像データをメモリに記録しておき、トリガ情報の発生から決まる特定タイミングから所定時間遡った時間の間の画像データに対して所定のメタデータを付して、教師データ候補群として一時記録しておく。トリガ情報がなければ、制御部７は、適宜、画像データ候補群を消去してもよい。図２（ａ）（ｂ）に示す例では、特定タイミングは出血が拡大した時点であり、遡り時間は、所定時刻（例えば、Ｔ＝－１ｓｅｃ）からＴ＝－５ｓｅｃの時間である。なお、画像データ群に、Ｔ＝０～Ｔ＝Ｔ１ａの画像データを加えておけば、出血の拡大の経過も含めて学習することができる。遡り記録の始点はトリガ情報が発生した時点からでもよく、またトリガ情報が発生した時点よりも更に遡った時点を遡り記録の始点としてもよい。因果関係の原因を探し出すことができる範囲が含まれるように、適宜遡り時間を決めればよい。この原因となるタイミングは、信頼性によって変わり、遡り時間が長くなるほど、信頼性が下がるが、初心者用には、安全を考慮して、信頼性が低いタイミングを使ってもよい。こうしたものも画像加工と表現している。

　ステップＳ２９において遡り記録を行うと、またはステップＳ２７における判定の結果、トリガ情報がなかった場合には、次に、画像推論を行う（Ｓ３１）。ここでは、画像取得装置３によって取得された画像データを画像推論装置２の画像入力部２ＩＮに入力し、推論部２ＡＩが推論を行う。推論結果出力部２ＯＵＴが推論結果を出力すると、ガイド部５が出力結果に基づくガイドを行う。例えば、図２（ａ）（ｂ）に示すように、時刻Ｔ＝―５secにおいて、推論を行い、５秒後（Ｔ＝０）に出血が開始しそうとの表示を行うことができる。また時刻Ｔ＝０において、出血があった場合には、出血が拡大するか縮小するかの推論結果に基づいて、表示Ｇａまたは表示Ｇｏを行う。なお、画像推論装置２以外にも、画像推論装置２ａ等、複数の画像推論装置を有する場合には、複数の推論を行うことができる。例えば、出血の予想用以外にも他の予想を行うことが可能となる。

　また、画像の推論を行う際に、画像データのみならず、診断や処置時における医師の声で推論を補足するようにしてもよい。また、診断や処置に使用している機器について、信頼性を推論し、信頼性が所定値より低い場合には、信頼性の高い機器を薦めてもよい。また、処置に使用している処置具がノイズ（画面で観察する際に邪魔になる）となる場合もあることがあることから、画像推論によって処置具の部分の画像を加工してもよい。

　画像推論を行うと、次に、教師データ候補を出力するか否かを判定する（Ｓ３３）。ここでは、制御部７が、ステップＳ２９において遡り記録を行っていたか否かを判定する。遡り記録を行っていた場合には、このときの画像データが教師データ候補として、撮像装置６内のメモリに記憶されている。この判定の結果、遡り記録を行っていなかった場合には、ステップＳ２１に戻る。

　ステップＳ３３における判定の結果、Ｙｅｓの場合には、教師データ候補を出力する（Ｓ３５）。ここでは、制御部７が撮像装置６内のメモリに記憶された教師データ候補群を画像推論用学習装置１に出力する。なお、画像推論学習装置１は教師データ候補群を受信すると、記録部４に記録しておく。ステップＳ３５において、教師データ候補を出力すると、ステップＳ２１に戻る。

　なお、本実施形態においては、撮像装置６において、出血が拡大した、あるかは出血が縮小したという判定を行っている（図４のＳ２７参照）。しかし、この判定を画像推論用学習装置１の制御部１ａにおいて行ってもよい。すなわち、出血の拡大・縮小は、画面内に占める血の色の形状や大きさの変化によって判定することができ、ロジックベースでも推論によっても検出が可能である。また、拡大・縮小の判定は、教師データのカスタマイズに応じて、敢えて、変更してもよい。初心者用には、安全を考慮して、拡大しない場合でも拡大するアノテーションを行った画像として教師データ化してもよい。こうしたものも画像加工と表現している。

　また、ステップＳ２７におけるトリガ情報は、内視鏡を使用した際に体内で出血した例について説明した。しかし、出血以外にも、本実施形態を適用することができる。例えば、ウエラブルのセンサによって体温や体重を計測できる場合に、体温が急上昇した場合にはトリガ情報を発生し、それまでの体温データや体重データや他のデータ（画像データを含む）を遡り記録してもよい。これらのデータを教師データとして、推論用学習装置に送信すれば、推論モデルを生成することが可能となる。

　また、ステップＳ３５において、遡り記録に基づいて作成した教師データ候補群を推論用学習装置に送信していた。このときの教師データ候補群は、同一の機器（撮像装置６）に記録されていた画像データ群を遡るだけではなく、他の機器の検出データを遡って、因果関係を調べるようにしてもよい。

　また、ステップＳ２３において、撮像装置において、ＡＩ修正が必要か否かを判定していた。しかし、ＡＩの修正が必要か否かを、画像推論用学習装置１において行ってもよい。画像推論用学習装置１の画像入力部１ｂにおいて入力した教師データ群が、それまで蓄積している教師データ群の特性（用途も含む）と異なっていることを、画像加工部１ｄ（または制御部１ａ）が検知した場合に、ＡＩの修正が必要と判定すればよい。

　また、初めて見たものでも、正常である場合の画像に対して、正常とアノテーションを行って教師データを作成し、この教師データを用いて学習することによって、正常でないことを判定する推論が出来る。例えば、胃の画像から病変や色や形状などの異常判定する判定部を用意すればよく、異常と認識した場合に、それがどう異常かを判別するＡＩが必要であるとしてもよい。

　また、現在保有しているＡＩによる「正常」判定の信頼性（あるいは「異常」判定の信頼性でもよい）を用いて、ＡＩの修正が必要であるかを判断し、この判断結果が、一定以下の信頼性の場合には、初見であると判断し、ＡＩの修正を実施するようにしてもよい。

　また、ここでは、推論モデル生成の学習例として、極めて先進的な医療分野における因果関係ガイド推論を例にして説明した。しかし、本実施形態は医療分野に限らず、ガイド用の推論に応用してもよい。実際によく用いられる推論モデルは、画像の中に見えるものを同定する用途のものが多く、監視カメラの様々な人物検知、行動検知や車載カメラの障害物検知等は、こうした画像検出型である。本実施形態を用いて説明したような、入力画像データの態様の差異をキャンセルさせて推論の性能を向上させる技術は、検出同定タイプでも有効であることは言うまでもない。

　つまり、第１の画像取得装置からの画像データを入力する入力部と、この画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る学習部とを有する画像推論用学習装置において、その適用範囲を広げて、有用な推論モデルについては効率的に、様々な制約を超えて、様々な分野で利用できる可能性がある。しかし、制約等によって、すぐには、有用な教師データを集めることは困難な場合がある。そこで、本実施形態における推論用学習装置は、第１の画像取得装置とは異なる条件で使われる第２の画像取得装置用に、推論モデルをカスタマイズ（これは、完全に違うものを作るのではなく、すでに実績がある同様の仕様を期待しているイメージ）する際に、教師データのうち第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工をして教師データとする画像加工部とを具備するようにしている。この工夫によって、直ぐに有用な教師データを集めることができなくても、有用な推論モデルを作成することが可能となる。

　また、第１の画像取得部から得られた教師データのみ、或いは教師データをそのままを使うことに限る必要はない。例えば、第１の画像取得部では得られていなくても、論文などに掲載された、或いはその他で報告された、対象物の異常情報等を用いてもよい。例えば、対象物の異常として腫瘍等の情報がある場合には、この腫瘍の画像の大きさを変形したり、拡大・縮小したりして教師データを補正してもよい。必要に応じて、色の修正や類似画像部位の変形などを行って、新たに教師データ化してもよい。こうした加工は、第２の画像取得部の使用環境で得られた情報に応じて、そこで起こり得る状況を参考にして行えば、さらに信頼度が向上する。

　次に、図５に示す補正した推論モデル作成のフローを説明するに先立って、図６を用いて、画像データの加工について説明する。図６（ａ）は、図２（ａ）と同様に、内視鏡による処置を行っていた際に出血し、この出血が拡大した場合を示す。

　図６（ｂ）は、図６（ａ）の場合と同様に、出血が拡大した場合を示している。この例では、撮像装置６は、画像取得装置３ａとは異なる特性の画像取得装置（例えば、画像取得装置３ｂ）を使用している。この画像取得装置３ｂの撮像素子の画素数が小さいために、取得できる画像データＩＤ３は、画像データＩＤ１とは大きく異なっている。このため、画像データＩＤ１と同等の特性を有する画像データを蓄積して作成した推論モデルに、図６（ｂ）のような画像データを入力しても、信頼性の低い推論しかできない。また、画像データＩＤ３を、それまでに蓄積した画像データと混合した母集合を用いて、推論モデルを作成しても、信頼性の低い推論モデルしか生成できない。

　ここでの特性とは、画像読み取り装置の仕様や性能に基づいているものであり、そこで扱う対象物、アクセサリ等の周辺装置、関連連携装置の仕様や性能に基づいているものであり、さらにはこれらの使用環境によって変化しうるものである。画像入力特性は、撮像センサの仕様、性能、撮像用光学特性、画像処理仕様、性能、照明光の種別の差異に起因するという言い方も出来る。もちろん、ユーザのモード設定によって、こうした要素が変化する場合もあり、その場合には、それらの要素も考慮するとよい。

　そこで、本実施形態においては、画像加工部１ｄが、画像入力特性の差異に基づいて、それまでに使用した画像データの加工（補正）を行って、図６（ｂ）と同様の画像データのレベルに調整している（図５のＳ１ａ、Ｓ５ａ参照）。そして、この補正した画像データにアノテーションを行って（図５のＳ３ａ、Ｓ７ａ参照）、推論モデルを作成している（図５のＳ９参照）。なお、それまでに使用した教師データについて、画像入力特性の差異に基づいて、画像データの加工（補正）を行っている場合に、教師データのアノテーションを変更する必要がなければ、画像データの加工（補正）のみを行う。

　次に、図５に示すフローチャートを用いて、補正した推論モデル作成の動作について説明する。このフローは、ステップＳ２５（図４参照）において、撮像装置６から画像推論用学習装置１に補正した推論モデルの作成の依頼がなされた際に実行される。このフローは、画像推論用学習装置１の制御部１ａが、画像推論用学習装置１内の各部を制御することによって実現する。このフローは、画像推論用学習装置１が、出血が拡大した場合や縮小した場合の画像に基づいて、補正した推論モデルを作成する例である。

　図５に示す補正した推論モデル作成のフローが開始すると、まず、出血拡大時過程画像を収集する（Ｓ１ａ）。図２（ａ）を用いて説明したように、処置時に出血が拡大した場合であり、画像加工部１ｄは、画像推論用学習装置１内の記録部や撮像装置６から、このときの画像データを収集し、この画像データを補正する。図２（ａ）に示す例では、Ｔ＝－５秒～Ｔ＝－１秒の間の画像データを収集する。そして、この収集した画像データに対して、図６（ｂ）に示すような画像データＩＤ３（例えば、画像取得装置３ｂの出力する画像データ）と同レベルの画像データとなるように、画像加工部１ｄは補正を行う。

　また、前述したように、ユーザが装置を利用する状況、環境、対象物などに従った、カスタマイズによって、より信頼性の推論モデルを得たいので、このステップＳ１ａでは、希望仕様を把握するようなこと（カスタマイズ要求）も行ってもよい。このカスタマイズ要求に合わせて、画像の取捨選択や画像補正、アノテーションの修正等を行い、適切な教師データの再構成（加工、編集、処理）を行う。

　例えば、第１の仕様（以下に列挙する要因も含めている）の画像取得装置から取得した画像データは、装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリ等の周辺機器、処置具、操作者等についても、第２の仕様の画像取得装置から取得した画像データとは一致するものが少ない状況であることが多い。このため、第１の仕様の画像取得装置からの画像データにアノテーションを行って得た教師データを用いて学習し、この学習によって得た推論モデルのままでは、そのまま第２の仕様の画像取得装置において利用することが困難な状況になりがちである。そこで、本実施形態の推論用学習装置は、第１の（仕様の）画像取得装置とは異なる画像入力特性を有する、第２の（仕様の）画像取得装置用に、推論モデルをカスタマイズして学習する際に、教師データのうち第１の画像取得装置から得た画像データを画像取得特性（装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む）の差異に応じた加工をして教師データとする画像加工部を備えるようにしている。この画像加工部によって、教師データを最適化することで、第２の仕様の画像取得装置においても利用できる推論モデルが生成できる。

　処置具等を使用する場合における補正の一例として、処置具形状が変化したと判断できる場合には、最も形状が近い処置具の教師データセットを用い、画像の幾何学変換や一部引き延ばし・縮小等の非線形変換などを行うとともに、その変換に合わせて処置具部分を示すアノテーション情報も変換する方法がある。幾何学変換で先端部形状が尖り方向である場合、アノテーションも出血しやすい方向に重みづけしたり、重みづけ判定した結果、「出血」となるようにアノテーションしたりする。形状の変化がどのような影響を及ぼすかを、形状差異別教師データで学習した他のＡＩ（形状変化効果予測ＡＩ）で判定して、その結果を反映する方法を利用、併用してもよい。

　上述の画像加工部は、教師データのうち第１の画像取得装置から得た画像データに含まれる第１の対象物画像データ（これは実績があるものが多いとしている）を極力、有効に使用したい場合も多いので、第２の画像取得装置から得た画像データに含まれる第２対象物の画像データと適合するように装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む画像取得特性に応じて加工するようにしている。

　また、画像加工部１ｄ（または画像選択部１ｆと協働して）は、検出性能に劣る画像センサや操作性に劣る処置具を使用する場合や、使用者の熟練度、対象となる患者や患部に応じて、安全サイドに振って早めに警告を出すような工夫や、極力、類似の要因の教師データを優先して利用したり集めたりする。

　ステップＳ１ａにおいて、画像を収集し補正すると、次に、「出血拡大」とタイミングをアノテーションする（Ｓ３ａ）。ここでは、制御部１ａは、教師データとして使用するために、画像データに、「出血拡大」である旨と、その画像データを取得したタイミングを、アノテーションする。具体的には、制御部１ａは、教師データとして使用するために、画像データを選択し直したり、重みづけを変えたりし、あるいは、従来の画像データ、あるいはそれを加工したものに、「出血拡大」等である旨と、その画像データを取得したタイミングを、カスタマイズ措置を行ってアノテーションする。このカスタマイズ措置を加工と言う言い方で表してもよい。また、「出血縮小」とされていた画像でも、特定の時間以上、出血部面積が縮小しなかったものは、「出血拡大」としてアノテーションし直して、熟練者の処置で得た画像を、初心者用の教師データ化するといった変更も「加工」と言える。なお、画像データが補正（加工）され、アノテーションが付された教師データは、教師データＢ群４ｂとして、記録部４に記録しておいてもよい。

　次に、出血縮小時過程画像を収集する（Ｓ５ａ）。図２（ｂ）を用いて説明したように、処置時の出血が縮小した場合であり、画像加工部１ｄは、画像推論用学習装置１内の記録部や撮像装置６から、このときの画像を収集する。図２（ｂ）に示す例では、Ｔ＝－５秒～Ｔ＝－１秒の間の画像を収集する。そして、この収集した画像データに対して、図６（ｂ）に示すような画像データＩＤ３（例えば、画像取得装置３ｂの出力する画像データ）と同レベルの画像データとなるように、画像加工部１ｄは補正を行う。

　ステップＳ５ａにおいて、画像を収集し、補正すると、次に、「出血縮小」とタイミングをアノテーションする（Ｓ７ａ）。ここでは、制御部１ａは、教師データ候補として使用するために、画像データに、「出血縮小」である旨と、その画像データを取得したタイミングを、アノテーションする。なお、画像データが補正（加工）され、アノテーションが付された教師データは、教師データＢ群４ｂとして、記録部４に記録しておいてもよい。

　ステップＳ３ａおよび７ａにおいて、画像データに対してアノテーションを付与し、教師データを作成すると、図３と同様に、推論モデルを作成する（Ｓ９）。ここでは、ステップＳ３ａ、Ｓ７ａにおいてアノテーションを施した教師データを用いて、学習部１ｃが推論モデルを作成する。この推論モデルは、図６（ｂ）に示すような画像データＩＤ３Ｓを入力した場合に、「〇秒後、出血が拡大」を出力するというような予測ができるようにする。

　推論モデルを作成すると、信頼性がＯＫか否かを判定する（Ｓ１１）。ここでは、図３と同様に、学習部１ｃが、予め回答が分かっている信頼性確認用の画像データを、その推論モデルに入力した場合の出力が、回答と同じであるか否かに基づいて信頼性を判定する。作成された推論モデルの信頼性が低い場合には、回答が一致する割合が低い。

　このステップでは、テストデータを入力し、期待するような推論結果を出力するかを判定する。このテストデータは、実際にこの推論モデルを利用する第２の仕様の画像取得装置の仕様環境、条件（装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む）に合わせたものであることが好ましく、ここでは、第２の仕様の画像取得装置の仕様環境、条件で得られたデータを優先的に使いのが望ましい。ただし、そのようなデータがすぐに揃わない場合も多いことから、第２の画像取得装置から得た画像データに含まれる第２対象物の画像データと適合するように、第１の画像取得装置から得ていたデータを、装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物もアクセサリなど周辺機器、処置具、操作者なども含む画像取得特性の差異に応じて加工して利用する。もちろん、利用者がどのような判定をして欲しいかをマニュアル入力できるようにして、それを採用してもよい。

　ステップＳ１１における判定の結果、信頼性が所定値よりも低い場合には、図３と同様に、教師データを取捨選択する（Ｓ１３）。信頼性が低い場合には、教師データを取捨選択することによって、信頼性が向上する場合がある。そこで、このステップでは、因果関係がないような画像データを除くようにする。教師データを取捨選択すると、ステップＳ９に戻り、再度、推論モデルを作成する。

　一方、ステップＳ１１における判定の結果、信頼性がＯＫとなった場合には、図３と同様に、推論モデルを送信する（Ｓ１５）。ここでは、生成された推論モデルが信頼性の基準を満たしたことから、教師データ選択部１ｆは、推論の際に使用した教師データ候補を、教師データとして確定する。また、学習結果利用部１ｅは、撮像装置６に生成された推論モデルを送信する。撮像装置６は推論モデルを受信すると、推論部２ＡＩに推論モデルを設定する。推論モデルを送信すると、推論モデル作成のフローを終了する。

　このように、図５に示す補正した推論モデル作成のフローでは、教師データとして使用する画像データを収集し（Ｓ１ａ、Ｓ５ａ）、収集した画像データに対して画像加工部１ｄｄが補正（加工）している（Ｓ３ａ、Ｓ７ａ）。推論の対象となる画像データ等のデータの特性が変わったことから、推論モデルの補正が依頼されている。そこで、このフローでは、新たなデータの特性に応じた推論モデルが生成されるように、蓄積されているデータを、新たなデータの特性に適合するように補正している。このため、新たな特性を有するデータを、収集し直すことが必要なく、迅速かつ安価に推論モデルを作成することができる。

　次に、図７に示すフローチャートを用いて、ステップＳ２３（図４参照）のＡＩ修正必要かの判断の動作について説明する。このフローは、撮像装置６内のＣＰＵ７ａがメモリ７ｂに記憶されたプログラムに従って撮像装置６内の各部を制御することによって実行する。

　図７に示すＡＩ修正必要かの動作を開始すると、まず、画像取得装置の機種情報が有るか否かを判定する（Ｓ４１）。ここでは、画像取得装置３について、機種の詳しい情報があるか否かを判定する。機種情報としては、例えば、画素数、フレームレート、解像度、焦点距離情報、対象物までの距離情報等がある。なお、撮像装置６内に、画像取得装置３が一体に構成されている場合には、機種情報を取得することは容易であるが、別体に構成されている場合には、インターネット等の情報通信網を通じて取得して、必要に応じてデータベース等も参照しても良い。

　ここでは、単純化して、画像取得装置の仕様、性能の差異について例示している。しかし、実際には、前述したように、ユーザが装置を利用する状況、環境、対象物などに従った、カスタマイズを目的とするものであるから、より信頼性の推論モデルを得るために、希望仕様を把握するようなこと（カスタマイズ要求）の判定等もここで行ってもよい。例えば、機種は同じでも、併用する機材や使用者の力量や対象物の差異なども、マニュアル入力結果や記録部に記録されている情報等をもとに、この機種情報と同様の扱いが可能となる。

　ステップＳ４１における判定の結果、画像取得装置の機種情報が有る場合には、次に、機種情報に基づく画質情報ＤＢによって、補正方法を取得し、補正方法を決定する（Ｓ４３）。ここでは、制御部７は、ステップＳ１ａ、Ｓ５ａにおいて行う補正方法を決定する。例えば、撮像素子の画素数が少ない場合には、画素数比に応じて、取得した画像データの画素数を乗除（間引き、水増し等）すればよい。こうした処理も加工と表現したが、その他、教師データとしての画像の扱い方も加工と表現している場合がある。

　ここで、画質差について、特に詳しく判定する方法の説明を続ける。ステップＳ４１における判定の結果、機種情報がない場合には、基準シーン画像があるか否かを判定する（Ｓ４５）。基準シーン画像は、画像データ等の特性が異なっているか否かを判定するために対象物を撮像して得た時の画像である。すなわち、ＡＩが修正か否かを判断するには、現在の推論モデルを作成するに使用した画像データと、今、入力した画像データが同じであるか否かを判定するのがよい。このためには、同じ対象物を撮影した画像を比較すれば分かり易い。ただ、一般には、全く同じ対象物を撮影するのは困難であることから、同じような対象物を撮影すれば十分である。内視鏡であれば、例えば、口腔から食道に挿入する際に取得できる画像は、機器や被検者が異なっても、大体同じような画像となるので、この時の画像を基準シーンとすればよい。内視鏡以外の例としては、カメラのノウハウとして青空が基準になるという場合もあり、白チャート、グレーチャートの他、性能判定用の基準チャートなどもある。特別なチャートを用意しなくとも、文字やパターンで既知のものや、標準化されたものを撮像すれば、本来の形状などからの差異から周辺光量の変化や収差情報などが得られる。

　ステップＳ４５における判定の結果、基準シーン画像でなかった場合には、基準シーンの画像を推定する（Ｓ４７）。基準シーンとなる画像がないことから、画像取得装置３が取得した画像の中から代替画像を探さなければならない。この基準シーンの代替となる画像としては、基準シーン程ではないにしても、２つの画像を比較して、画像データの特性が相違しているかどうかを判定できる程度に類似していることが望ましい。例えば、内視鏡検査では、処置具を使用することがあり、処置具の形状は、類似しているものが多い。この場合には、取得した画像の中で、処置具の形状が分かる画像を基準シーンと推定する。また、単に処置具の形状のみならず、処置具が画面内への現れ方（現れた位置等）についても、基準シーンの画像を推定する際に判断基準として使用してもよい。内視鏡に限らず、顕微鏡やカメラ等でも、併用する機材は似たような形状や色のものが多いので、これらの機材等の映り込みを判定して比較可能にしてもよい。

　ステップＳ４７において基準シーンの画像を推定すると、またはステップＳ４５における判定の結果、基準シーン画像があった場合には、次に、基準画像との差異が許容可能か否かを判定する（Ｓ４９）。前述したように、２つの画像を比較して、画像データの特性が相違していなければ、推論モデルを修正する必要がない。ここでは、推論モデルを修正しなければならないほど、画像取得装置３から取得した画像データの特性が異なっているかどうかを判定する。また、同じような箇所の画像でありながら、差異が大きいかい否かを判定する。

　ステップＳ４９における判定の結果、基準画像との差異が許容範囲であれば、Ｎｏに分岐する（Ｓ５５）。今、画像取得装置３が取得した画像が、基準シーンとの差異が大きくなければ、推論モデルを修正しなくても済むことから、Ｎｏに分岐し、図４のステップＳ２７に進む。

　一方、ステップＳ４９における判定の結果、基準画像との差異が許容範囲になければ、次に、画像の特徴に基づいて補正方法を決定する（Ｓ５１）。今、画像取得装置３が取得した画像と、基準シーンとの差異の程度によって、補正方法が異なるので、制御部１ａは差異の程度等に応じて補正方法を決定すればよい。例えば、画素数が異なる場合には、今、取得した画像取得装置３の画像と同程度の画素数となるように、蓄積されている画像の画素数を増減する方法を決定すればよい。光学系の性能や撮像センサ、画像処理の差異以外にもフレームレートの差異や画角の差異、照明光の差異等についても、同様の方法で対処可能である。

　ステップＳ４３またはＳ５１において補正方法を決定すると、Ｙｅｓに分岐する（Ｓ５３）。今、画像取得装置３が取得した画像が、基準シーンとの差異が大きいので、推論モデルを修正する必要があり、Ｙｅｓに分岐し、図４のステップＳ２５に進む。

　このように、図７に示すＡＩ修正必要かのフローにおいては、画像取得装置の機種情報があれば、機種に応じて画像データを補正するための補正を決定している（Ｓ４１、Ｓ４３参照）。一方、画像取得装置の機種情報がなければ、基準シーン画像または基準シーンと推定された画像を用いて、推論モデルの修正が必要か否かを判定し（Ｓ４９参照）、必要と判定された場合には、画像の特徴から補正方法を決定している（Ｓ５１）。本フローにおいては、画像取得装置の機種情報や、基準シーン画像等に基づいて、補正が必要か否か、また補正するとすれば補正方法をどうするかについて決定していた。しかし、ＡＩ修正が必要か否かは、多種多様は判断要素があることから、これらの情報を追加してもよく、またこの判断そのものをＡＩによって行ってもよい。

　前述したように、ここでは、機器使用環境に差異があるケースにおけるカスタマイズのうち、主に撮像部の性能、機能、仕様の差異に対するカスタマイズ、それに合わせた教師データの加工について説明した。しかし、カスタマイズ要求に合わせて、画像品質、特徴の加工（画像補正）を行うだけではなく、画像の取捨選択そのものや、アノテーションの修正等を行いながら、適切な教師データの再構成（加工、編集、処理）を行うことが可能なシステム、装置、方法を提供することができる。

　繰り返しになるが、第１の仕様（以下に列挙する要因も含めている）の画像取得装置からの画像データは、装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなどの周辺機器、処置具、操作者なども第２の仕様の画像取得装置とは一致するものが少ない状況であることが多い。この場合には、第１の仕様の画像取得装置からの画像データにアノテーションを行って得た教師データによる学習によって得た推論モデルのままでは、そのまま利用することが困難な状況になりがちになってしまう。本実施形態は、このような状況を解決することができる。

　上述した状況を解決するために、本実施形態は、第１の（仕様の）画像取得装置とは異なる画像入力特性を有する第２の（仕様の）画像取得装置用に、推論モデルをカスタマイズして学習する際に、第１の画像取得装置から得た画像データを画像取得特性（装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物もアクセサリなど周辺機器、処置具、操作者なども含む）の差異に応じた加工をして教師データとする画像加工部を備えている。この画像加工部によって教師データを最適化することで、第２の画像取得装置にも対応する推論モデルを生成することができる。この画像加工のもととなる情報の取得や、その加工の一例については、図７を用いて説明した。

　つまり、画像加工部は、教師データのうち第１の画像取得装置から得た画像データに含まれる第１の対象物画像データ（これは実績があるものが多いとしている）を極力、有効に使用したい場合も多いので、第２の画像取得装置から得た画像データに含まれる第２対象物の画像データと適合するように装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物もアクセサリなど周辺機器、処置具、操作者なども含む画像取得特性に応じて加工している。上述したような工夫を行うことにより、例えば、画像の中から、特定の対象物を、その装置の性能に合わせ、最適な検出を行うことが可能となる。画像推論モデルの重要なカテゴリである、画像内対象物検出やセグメンテーションなどには有効な技術となる。

　さらに、「出血拡大」や「出血縮小」といったアクシデントを推論するべく、タイミングを予測アノテーションする場合では、単に、画質の差異に留まらない加工を行うことが好ましい。検出性能に劣る画像センサに関しては、上述の補正（加工）方法で対処可能だが、操作性に劣る処置具を使う場合や、使用者の熟練度が低い場合や、対象となる患者や患部に応じて、安全サイドに振って早めに警告を出すような工夫や、極力、類似の要因の教師データを優先して利用したり集めたりしてもよい。

　上述のような場合には、制御部１ａは、教師データとして使用するために、選択し直した画像データに、重みづけを変えたりした画像データに、或いは従来の画像データ若しくはそれを加工した画像データに、「出血拡大」等である旨と、その画像データを取得したタイミングについて、カスタマイズ措置を行ってアノテーションする。このカスタマイズ措置を加工と言う言い方で表してもよい。また、「出血縮小」とされていた画像でも、特定の時間以上、出血部面積が縮小しなかったものは、「出血拡大」としてアノテーションし直して、熟練者の処置で得た画像を、初心者用の推論モデル作成用に教師データ化するといった変更も「加工」と言える。

　なお、このＡＩの修正が必要か否かの判定は、図７においては、撮像装置６において行っている。しかし、撮像装置６に限らず、画像推論用学習装置１において、この判定を行ってもよい。この場合には、撮像装置６からの画像データを取得する際に、機種情報等の情報を取得し利用してもよい。また、基準シーン画像等のデータベースを用意しておき、撮像装置６からの画像データと比較することによって、基準シーン画像が含まれているか否かを判定してもよい。もちろん、マニュアル入力その他のカスタマイズ要求に合わせて、画像品質、特徴の加工（画像補正）のみならず、画像の取捨選択そのものや、アノテーションの修正等に反映してもよく、適切な教師データの再構成（加工、編集、処理）を行ってもよい。ＡＩの修正という書き方であれば、装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含んでの修正である。これらも画像推論エンジンの場合、入力データの基本が画像であるので、広義には画像取得特性と考えることが出来る。

　また、ＡＩの修正が必要なのは、画像取得装置３からのデータが未知のカテゴリに属する場合であり、未知のカテゴリに属するか否かは、人工知能によって自動判断し、または第２の画像取得装置（例えば、画像取得装置３ｂ）の使用者が手動で設定してもよい。また、未知のカテゴリに属するか否かは、第２の画像取得装置（例えば、画像取得装置３ｂ）の機種情報、および／または第２の画像取得装置からの画像データの中から基準画像と推定した画像に基づいて、判定するようにしてもよい。

　以上説明したように、本発明の一実施形態においては、第１の画像取得装置からの画像データを入力し（例えば、図５のＳ１ａ、Ｓ５ａ参照）、第１の画像取得装置とは異なる特性の第２の画像取得装置用に、推論モデルを再学習する際に、教師データのうち第１の画像取得装置から得た画像データを加工して教師データとし（例えば、図５のＳ３ａ、Ｓ７ａ参照）、画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る（例えば、図５のＳ９参照）。このため、予め想定していたカテゴリのデータに限らず未知のカテゴリにおいて、それまで蓄積したデータに対してデータの特性が変わった場合であっても、適切な推論を行うことができる。つまり、想定外のデータを扱う場合であっても、それまでに蓄積してあるデータを加工することによって、想定外のデータに対しても推論することができる推論モデルを生成することができる。

　また、本発明の一実施形態においては、第１の画像取得装置からの画像データを入力し（例えば、図５のＳ１ａ、Ｓ５ａ参照）、第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、推論モデルをカスタマイズする際に、第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って教師データとし（例えば、図５のＳ３ａ、Ｓ７ａ参照）、画像データにアノテーションを行って得た上記教師データを使用した学習によって推論モデルを得ている。このため、予め想定していたカテゴリのデータに限らず未知のカテゴリにおいて、それまで蓄積したデータについて、データの特性が変わった場合であっても、適切な推論を行うことができる。つまり、想定外のデータを扱う場合であっても、それまでに蓄積してある第１の画像取得装置からのデータの取捨選択や加工することによって、想定外のデータに対しても推論することができる推論モデルを生成することができる。

　ここでは、「想定外のデータ」と書いたが、この想定外のデータは、十分な教師データを収集できない「想定外の装置」からのデータであったり、「想定外の環境」からのデータであったりする。つまり、装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む画像取得特性の結果としての「想定外のデータ」である。そこで、想定外とする要因に対応して、教師データの取捨選択や画像処理等の加工を行うことによって、既知のデータを最大限有効活用することができ、ＡＩの解決すべき期待領域を拡張して、機材や使用者の制約を少なくして安心、安全な世界を切り開くことが可能となる。

　上述したように、本発明の一実施形態では、貴重な教師データを状況に応じて加工して利用することができる。このため、必要とされる状況に対して、即座に対応できるシステムを構築し、世界中の様々な状況下で、高度なＡＩの活用が可能となり、人々の安全と安心を約束する社会の実現が可能となる。もちろん、コンシューマユース、エンタメユースにおいても、失敗のないアウトプットを補助し、高品質なコンテンツや創造物の後押しに有効利用が出来る。このようにＡＩの補助で後押しされてオープンになった多様なデータや、高品質化されたデータがまた、有効な教師データとなって、こうした世界の実現を後押しすることができる。

　なお、本発明の一実施形態においては、撮像装置６は画像取得装置６が取得した画像データを画像推論用学習装置１に送信するだけであったが、撮像装置６においてアノテーションを行って教師データを作成し、この教師データを画像推論用学習装置１に送信するようにしてもよい。この場合には、ＡＩの修正が必要な場合には、画像推論用学習装置１において、教師データに対して加工を行い、推論モデルを補正すればよい。また、撮影装置６がＡＩの修正が必要か否かを判定していたが（図４のＳ２３参照）、ＡＩの修正が必要か否かは、撮像装置６に限らず、画像推論用学習装置１において判定してもよい。例えば、画像推論用学習装置１は、種々の撮像装置６から送信されてくる画像データ等を解析し、既知のデータと比較し、特性（装置の性能、仕様、環境、周辺システムのみならず、そこで扱う対象物、アクセサリなど周辺機器、処置具、操作者なども含む要因によって差異が出るもの）が異なっていると判定した場合には、ＡＩの修正を行ってもよい。

　また、本発明の一実施形態においては、画像データから作成した教師データを用いての学習し、推論モデルを生成していた。しかし、教師データは、画像データに限らず、他のデータ、たとえば、体温や血圧等の時系列バイタルデータ等に基づいて作成しても勿論かまわない。

　また、本発明の一実施形態においては、ロジックベースの判定を主として説明したが、これに限らず、機械学習を使用した推論による判定を行ってもよい。これらは、本実施形態においてはどちらを使用してもよい。また、判定の過程で、部分的にそれぞれの良さを利用してハイブリッド式の判定をしてもよい。

　また、本発明の一実施形態においては、制御部７や制御部１ａは、ＣＰＵやメモリ等から構成されている機器として説明した。しかし、ＣＰＵとプログラムによってソフトウエア的に構成する以外にも、各部の一部または全部をハードウエア回路で構成してもよく、ヴェリログ（Verilog）によって記述されたプログラム言語に基づいて生成されたゲート回路等のハードウエア構成でもよく、またＤＳＰ（Digital Signal Processor）等のソフトを利用したハードウエア構成を利用してもよい。これらは適宜組み合わせてもよいことは勿論である。

　また、制御部は、ＣＰＵに限らず、コントローラとしての機能を果たす素子であればよく、上述した各部の処理は、ハードウエアとして構成された１つ以上のプロセッサが行ってもよい。例えば、各部は、それぞれが電子回路として構成されたプロセッサであっても構わないし、ＦＰＧＡ（Field Programmable Gate Array）等の集積回路で構成されたプロセッサにおける各回路部であってもよい。または、１つ以上のＣＰＵで構成されるプロセッサが、記録媒体に記録されたコンピュータプログラムを読み込んで実行することによって、各部としての機能を実行しても構わない。

　また、本発明の一実施形態においては、画像推論用学習装置１は、制御部１ａ、画像入力部１ｂ、学習部１ｃ、画像加工部１ｄ、学習結果利用部１ｅ、教師データ選択部１ｆ、記録部４を有しているものとして説明した。しかし、これらは一体の装置内に設けられている必要はなく、例えば、インターネット等の通信網によって接続されていれば、上述の各部は分散されていても構わない。同様に、撮像装置６は、画像推論部２、画像取得装置３、ガイド部５を有しているものとして説明した。しかし、これらは一体の装置内に設けられている必要はなく、例えば、インターネット等の通信網によって接続されていれば、上述の各部は分散されていても構わない。

　また、近年は、様々な判断基準を一括して判定できるような人工知能が用いられる事が多く、ここで示したフローチャートの各分岐などを一括して行うような改良もまた、本発明の範疇に入るものであることは言うまでもない。そうした制御に対して、ユーザが善し悪しを入力可能であれば、ユーザの嗜好を学習して、そのユーザにふさわしい方向に、本願で示した実施形態はカスタマイズすることが可能である。

　また、本明細書において説明した技術のうち、主にフローチャートで説明した制御に関しては、プログラムで設定可能であることが多く、記録媒体や記録部に収められる場合もある。この記録媒体、記録部への記録の仕方は、製品出荷時に記録してもよく、配布された記録媒体を利用してもよく、インターネットを通じてダウンロードしたものでもよい。

　また、本発明の一実施形態においては、フローチャートを用いて、本実施形態における動作を説明したが、処理手順は、順番を変えてもよく、また、いずれかのステップを省略してもよく、ステップを追加してもよく、さらに各ステップ内における具体的な処理内容を変更してもよい。

　また、特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず」、「次に」等の順番を表現する言葉を用いて説明したとしても、特に説明していない箇所では、この順で実施することが必須であることを意味するものではない。

　本発明は、上記実施形態にそのまま限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせによって、種々の発明を形成できる。例えば、実施形態に示される全構成要素の幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

１・・・画像推論用学習装置、１ａ・・・制御部、１ａａ・・・ＣＰＵ、１ａｂ・・・メモリ、１ｂ・・・画像入力部、１ｃ・・・学習部、１ｄ・・・画像加工部、１ｅ・・・学習結果利用部、１ｆ・・・教師データ選択部、２・・・画像推論装置、２ＩＮ・・・画像入力部、２ＳＮ・・・推論変更部、２ＡＩ・・・推論部、２ＯＵＴ・・・推論結果出力部、３・・・画像取得装置、３ａ・・・画像取得装置、３ａａ・・・３Ｄ等、３ｂ・・・画像取得装置、４・・・記録部、４ａ・・・教師データＡ群、４ｂ・・・教師データＢ群、　５・・・ガイド部

Claims

　第１の画像取得装置からの画像データを入力する入力部と、
　上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る学習部と、
　を有する推論用学習装置において、
　上記第１の画像取得装置とは異なる画像入力特性の第２の画像取得装置用に、上記推論モデルを再学習する際に、第１の画像取得装置から得た画像データを上記画像入力特性の差異に応じた加工を行って上記教師データとする画像加工部と、
　を具備することを特徴とする推論用学習装置。
　上記画像加工部は、第１の画像取得装置から得た画像データに含まれる第１の対象物画像データが、上記第２の画像取得装置から得た画像データに含まれる第２の対象物画像データに適合するように加工することを特徴とする請求項１に記載の推論用学習装置。
　上記画像入力特性は、撮像センサの仕様、性能、撮像用光学特性、画像処理仕様、性能、および照明光の種別の少なくとも１つの差異に起因することを特徴とする請求項１に記載の推論用学習装置。
　上記画像加工部は、上記教師データのうち第１の画像取得装置から得た画像データを上記画像入力特性の差異に応じた教師データとなるように、同一画像へのアノテーションを変更することを含むことを特徴とする請求項１に記載の推論用学習装置。
　上記第１の画像取得装置から得た画像データは、既存の教師データであり、
　上記画像加工部は、上記第２の画像取得装置からの画像データの特性に応じて、上記既存の教師データを画像処理することを特徴とする請求項１に記載の推論用学習装置。
　上記第１の画像取得装置から得た画像データは、既存の教師データであり、
　上記画像加工部は、上記第２の画像取得装置からの画像データの特性に応じて、上記既存の教師データの取捨選択を行うことを特徴とする請求項１に記載の推論用学習装置。
　上記画像加工部は、上記教師データのうち第１の画像取得装置から得た画像データを、上記第２の画像取得装置からの画像データと適合するように加工することを特徴とする請求項１に記載の推論用学習装置。
　上記第２の画像取得装置からの画像データは未知のカテゴリに属することを特徴とする請求項１に記載の推論用学習装置。
　上記未知のカテゴリに属するか否かは、人工知能によって自動判断し、または上記第２の画像取得装置の使用者が手動で設定することを特徴とする請求項８に記載の推論用学習装置。
　上記未知のカテゴリに属するか否かは、上記第２の画像取得装置の機種情報、および／または上記第２の画像取得装置からの画像データの中から基準画像と推定した画像に基づいて、判定することを特徴とする請求項５に記載の推論用学習装置。
　上記第１の画像取得装置から得た画像データは、既存の教師データであり、
　上記画像加工部は、推論モデルの用途が異なる場合に、該用途に応じて、上記既存の教師データを画像処理し、または上記既存の教師データの取捨選択を行うことを特徴とする請求項１に記載の推論用学習装置。
　上記第１の画像取得装置からの画像データ、および上記第２の画像取得装置からの画像データは、内視鏡画像データであることを特徴とする請求項１ないし請求項１１に記載の推論用学習装置。
　第１の画像取得装置からの画像データを入力し、
　上記第１の画像取得装置とは異なる特性の第２の画像取得装置用に、推論モデルを学習する際に、上記教師データのうち第１の画像取得装置から得た画像データを加工して教師データとし、
　上記画像データにアノテーションを行って得た教師データによる学習によって推論モデルを得る、
　ことを特徴とする推論用学習方法。
　第１の画像取得装置からの画像データを入力する入力部と、
　上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る学習部と、
　を有する推論用学習装置において、
　上記第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、上記推論モデルをカスタマイズする際に、第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って上記教師データとする画像加工部と、
　を具備することを特徴とする推論用学習装置。
　第１の画像取得装置からの画像データを入力し、
　上記第１の画像取得装置とは異なる条件で使用される第２の画像取得装置用に、推論モデルをカスタマイズする際に、上記第１の画像取得装置から得た画像データに対して、画像取得特性の差異に応じた取捨選択もしくはアノテーションを含む加工を行って上記教師データとし、
　上記画像データにアノテーションを行って得た教師データを使用した学習によって推論モデルを得る、
　ことを特徴とする推論用学習方法。