WO2024004850A1

WO2024004850A1 - 画像処理システム、画像処理方法及び情報記憶媒体

Info

Publication number: WO2024004850A1
Application number: PCT/JP2023/023293
Authority: WO
Inventors: 駿平西田; 良寛友田; 美紀長谷山; 貴弘小川; 廉藤後
Original assignee: オリンパスメディカルシステムズ株式会社; 国立大学法人北海道大学
Priority date: 2022-06-28
Filing date: 2023-06-23
Publication date: 2024-01-04

Abstract

画像処理システム（１００）は、学習済みモデル（１３０）を記憶するメモリ（１２０）と、プロセッサ（１１０）とを含む。プロセッサ（１１０）は、１つの症例に紐付く複数の内視鏡画像を学習済みモデル（１３０）へ入力することで複数の推論結果を取得する。各内視鏡画像に対して、消化管の部位に関する部位情報が付されている。プロセッサ（１１０）は、取得された複数の推論結果と、部位情報とを用いて複数の推論結果を集計し、その集計結果に基づいて複数の推論結果を統合することで、症例単位のピロリ菌感染状態を判断する。

Description

画像処理システム、画像処理方法及び情報記憶媒体

　本発明は、画像処理システム、画像処理方法及び情報記憶媒体等に関する。

　近年では医療分野においても人工知能（以下、ＡＩとも呼ぶ）が活用されている。特許文献１には、ＡＩが消化器官の内視鏡画像から疾患の診断支援を行う技術が、開示されている。この技術では、ＡＩは、入力された単一の画像に対して、その画像の診断結果を出力する。

　消化器官の疾患の例として、上部消化管における胃癌がある。胃癌は、早期発見により治癒が可能な癌とされているのにもかかわらず、依然として羅患率及び死亡率が非常に高い。このため、上部消化管の内視鏡検査の重要性及び正確性に対して、注目が集まっている。また、近年の研究によりピロリ菌感染が胃癌の原因となることが明らかになり、感染の有無又は萎縮の程度により胃癌リスクが異なることも明確になっている。

国際公開第２０１８／２２５４４８号

　患部全体の情報から総合的に診断される疾患においては、局所的な情報のみで疾患を判断する特許文献１のＡＩ技術を用いても、高い判断精度が得られない可能性がある。例えば、医師が、ピロリ菌の感染状態を判断するとき、患者の消化管内全体の情報から総合的に疾患を診断する。仮に特許文献１のＡＩ技術をピロリ菌感染の診断に用いたとすると、個々の画像に対して診断結果が出力されるので、患者の消化管内の局所的な領域の情報のみで疾患を判断することになる。このため、仮に特許文献１のＡＩ技術をピロリ菌感染の診断に用いたとしても、熟練医の診断に比べて判断精度が下がる可能性が高い。

　本開示の一態様は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを記憶するメモリと、１つの症例に紐付く複数の内視鏡画像を前記学習済みモデルへ入力することで複数の推論結果を取得し、取得された前記複数の推論結果を統合することで症例単位のピロリ菌感染状態を判断する統合処理を行うプロセッサと、を含み、前記プロセッサは、消化管の部位に関する部位情報が各内視鏡画像に対して付された前記複数の内視鏡画像を、前記学習済みモデルへ入力することで、前記複数の推論結果を取得し、取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、前記症例単位のピロリ菌感染状態を判断する画像処理システムに関係する。

　また本開示の他の態様は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを用いて、ピロリ菌感染状態を判断する画像処理方法であって、前記学習済みモデルに対して、消化管の部位に関する部位情報が各内視鏡画像に対して付され且つ１つの症例に紐付く前記複数の内視鏡画像を入力することで、複数の推論結果を取得することと、取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、症例単位の前記ピロリ菌感染状態を判断する統合処理を行うことと、を含む画像処理方法に関係する。

　また本開示の更に他の態様は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを用いて、ピロリ菌感染状態を判断することを、コンピュータに実行させるプログラムを記憶した、コンピュータにより読み取り可能な非一時的な情報記憶媒体であって、前記学習済みモデルに対して、消化管の部位に関する部位情報が各内視鏡画像に対して付され且つ１つの症例に紐付く複数の内視鏡画像を入力することで、複数の推論結果を取得することと、取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、症例単位の前記ピロリ菌感染状態を判断する統合処理を行うことと、をコンピュータに実行させるプログラムを記憶した情報記憶媒体に関係する。

内視鏡システムの構成例。胃の部位の位置、及び、その部位の名称の例。画像処理システムが行う処理の説明図。画像処理システムが行う処理の説明図。ピロリ菌感染状態の推論結果を表示する画像例。臨床的視点の例。ピロリ菌感染による炎症が及んでいない粘膜に現れる、ＲＡＣと呼ばれる内視鏡像。臨床的視点を重視した統合処理のフロー例。モデルの判断精度を重視した統合処理のフロー例。複数のモデルの例と、その学習手法の説明図。メインモデル及び特化モデルの出力を統合する処理のフロー例。統合処理フローに組み込み可能な処理の一覧。統合処理フローに組み込み可能な処理の一覧。統合処理フローに組み込み可能な処理の一覧。統合処理フローに組み込み可能な処理の一覧。選定手法の一覧。臨床的視点の一例である京都分類。「関連するモジュール」の具体例。「関連するモジュール」の具体例。モジュールを用いた統合処理のフロー例。ステップＳ６３の第１詳細フロー例。ステップＳ６３の第２詳細フロー例。

　以下、本実施形態について説明する。なお、以下に説明する本実施形態は、請求の範囲に記載された内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。

　図１は、内視鏡システムの構成例である。内視鏡システム１は、内視鏡２００とビデオプロセッサ２５０とディスプレイ２９０と画像処理システム１００とディスプレイ１９０とを含む。なお、以下では、上部消化管用の内視鏡を用いてピロリ菌感染の診断を行う例を説明する。但し、本開示における複数の画像から症例単位の疾患診断を行う手法は、上部消化管用の内視鏡に限らず様々な内視鏡を用いた診断に適用可能である。

　内視鏡２００は、消化管に挿入され、消化管内を撮影する軟性鏡である。内視鏡２００は、体腔に挿入される挿入部と、挿入部の基端に接続される操作部と、操作部の基端に接続されるユニバーサルコードと、ユニバーサルコードの基端に接続されるコネクタ部とを含む。挿入部の先端には、体腔内を撮影するための撮像装置と、体腔内を照明するための照明光学系と、が設けられる。撮像装置は、対物光学系と、対物光学系が結像した被写体を撮像するイメージセンサと、を含む。コネクタ部は、伝送ケーブルをビデオプロセッサ２５０に着脱可能に接続する。内視鏡２００により撮像された画像を、内視鏡画像と呼ぶこととする。

　ビデオプロセッサ２５０は、内視鏡の制御、内視鏡画像の画像処理及び内視鏡画像の表示処理を行う処理装置である。ビデオプロセッサ２５０は、ＣＰＵ等のプロセッサにより構成され、内視鏡２００から送信される画像信号を画像処理して内視鏡画像を生成し、その内視鏡画像をディスプレイ２９０と画像処理システム１００に出力する。内視鏡システム１は、照明光の生成及び照明光の制御を行う不図示の光源装置を含む。光源装置はビデオプロセッサ２５０と同じ筐体に収納されてもよいし、別筐体であってもよい。光源装置が出射した照明光は、ライトガイドにより内視鏡２００の照明光学系へ導光され、照明光学系から体腔内へ出射される。

　画像処理システム１００は、内視鏡画像からピロリ菌感染状態を判断し、その判断結果等を医師に提示することで診断支援を行う。画像処理システム１００は、プロセッサ１１０とメモリ１２０とを含む。

　プロセッサ１１０はハードウェアを含む。プロセッサ１１０は、例えばＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、マイクロコンピューター又はＤＳＰ（Digital Signal Processor）等である。或いは、プロセッサ１１０は、ＡＳＩＣ（Application Specific Integrated Circuit）又はＦＰＧＡ（Field Programmable Gate Array）等であってもよい。プロセッサ１１０は、ＣＰＵ、ＧＰＵ、マイクロコンピューター、ＤＳＰ、ＡＳＩＣ及びＦＰＧＡ等のうち１又は複数で構成されてもよい。メモリ１２０は、例えば、揮発性メモリ又は不揮発性メモリである半導体メモリである。或いは、メモリ１２０は、ハードディスク装置等である磁気記憶装置、或いは、光学ディスク装置等である光学式記憶装置等であってもよい。

　メモリ１２０は、機械学習により得られた学習済みモデル１３０を含む。学習済みモデル１３０は、例えばディープラーニングにより学習されるニューラルネットワークである。このとき、学習済みモデル１３０は、ニューラルネットワークのアルゴリズムが記述されたプログラム、及びニューラルネットワークのノード間の重みパラメータ等を含む。ニューラルネットワークは、入力データが入力される入力層と、入力層を通じて入力されたデータに対し演算処理を行う中間層と、中間層から出力される演算結果に基づいて推論結果を出力する出力層と、を含む。学習段階においては、情報処理装置又はクラウドシステムで構成される学習システムが機械学習処理を実行する。学習システムは、プロセッサと、モデル及び教師データを記憶するメモリとを含む。学習システムのプロセッサは、教師データを用いてモデルをトレーニングすることで学習済みモデル１３０を生成する。なお、画像処理システム１００が学習システムを兼ねていてもよい。

　メモリ１２０は、ピロリ菌感染状態を判断する処理の内容が記述されたプログラム１４０を記憶する。プロセッサ１１０は、プログラム１４０を実行することで、ピロリ菌感染状態を判断する。詳細は後述するが、プロセッサ１１０は、学習済みモデル１３０から各画像のピロリ菌感染状態の推論結果を取得する処理と、その各画像の推論結果を統合することで症例単位のピロリ菌感染状態を判断する統合処理と、を行う。プログラム１４０は、各処理が記述されたプログラムモジュールを含み、プロセッサ１１０は、プログラムモジュールを実行することで各処理を実行する。

　なお、コンピュータにより読み取り可能な媒体である非一時的な情報記憶媒体が、学習済みモデル１３０又はプログラム１４０を格納してもよい。情報記憶媒体は、例えば光ディスク、メモリカード、ハードディスクドライブ、或いは半導体メモリ等である。半導体メモリは例えばＲＯＭ又は不揮発性メモリである。

　なお、画像処理システム１００は、ビデオプロセッサ２５０とは別筐体の情報処理装置であってもよいし、ビデオプロセッサ２５０と同一筐体に組み込まれてもよい。画像処理システム１００は、複数の情報処理装置で構成されてもよい。即ち、複数のプロセッサ及び複数のメモリが用いられてよい。例えば、画像処理システム１００は複数のＡＩモデルを利用するが、各モデルに１つずつ情報処理装置が割り当てられ、それら複数の情報処理装置が通信接続されてもよい。或いは、画像処理システム１００は、複数の情報処理装置がネットワークを介して接続されたクラウドシステムによって実現されてもよい。

　図２に、胃の部位の位置、及び、その部位の名称の例を示す。同じ丸付き数字が付された位置と名称が対応する。部位の位置を胃の外側に示しているが、内視鏡画像は、胃の内側から各部位が撮影された画像である。部位の位置は、数字が付された箇所だけでなく、その周辺を含んでよく、ある程度の拡がりがあってよい。なお、図２は部位の一例であって、更に部位を追加してピロリ菌感染診断が行われてもよいし、図２に示す部位の一部が省略されてピロリ菌感染診断が行われてもよい。

　図３と図４は、画像処理システムが行う処理の説明図である。学習済みモデル１３０は、画像チェックモデル４１０と部位認識モデル４２０とピロリ菌感染識別モデル４３０とを含む。プログラム１４０は、図３と図４に示す処理を記述したプログラムと、統合処理４４０を記述したプログラムとを含む。

　図３に示すように、プロセッサ１１０は、内視鏡２００により撮影された画像群１２を取得する。画像群１２は、１つの症例に紐付けられた複数の内視鏡画像ＩＭ１～ＩＭ９である。図３には、１つの症例に紐付けられた画像群１２を９枚として図示したが、一例として画像群１２は５０枚程度である。但し、画像群１２を構成する内視鏡画像の数は任意であってよい。各内視鏡画像は、いわゆるレリーズ画像であり、内視鏡２００に設けられたレリーズボタンの押下により撮影された画像である。なお、各内視鏡画像はレリーズ画像に限定されず、動画のフレーム画像であってよい。

　プロセッサ１１０は、画像群１２を画像チェックモデル４１０へ入力する。画像チェックモデル４１０は、ピロリ菌感染状態の診断に適さない内視鏡画像を画像群１２から除外する。診断に適さない画像は、ボケ、ブラー又は粘液等によって胃粘膜の視認性が悪い画像である。ボケ及びブラーは、フォーカスが合っていないこと、又は被写体が動きブレしていることである。画像群１４は、除外後の複数の内視鏡画像を含む。図３には、内視鏡画像ＩＭ２、ＩＭ５、ＩＭ９が除外された例を示す。

　画像チェックモデル４１０は、機械学習による学習済みモデルであり、入力された内視鏡画像がピロリ菌感染状態の診断に適するか否かを判断するように学習されている。なお、画像チェックモデル４１０は、ルールベースのアルゴリズムを用いたプログラムであってもよいし、画像チェックは人員による手作業で実行されてもよい。

　プロセッサ１１０は、画像群１２を部位認識モデル４２０へ入力する。部位認識モデル４２０は、画像群１２に含まれる各内視鏡画像に対して、その内視鏡画像に写る部位の情報を付与する。部位の情報は、部位の名称、又は部位を示すタグ等である。画像群１４に含まれる各内視鏡画像には、部位の情報が付されている。図３には、内視鏡画像ＩＭ１、ＩＭ３に「部位Ａ」と付され、内視鏡画像ＩＭ４、ＩＭ６に「部位Ｂ」と付され、内視鏡画像ＩＭ７、ＩＭ８に「部位Ｃ」と付された例を示す。部位Ａ～Ｃの各々は、図２に示す７部位のいずれかである。また、図３では３部位のみであるが、図２に示す７部位の各々について内視鏡画像が撮影されている。

　部位認識モデル４２０は、機械学習による学習済みモデルであり、入力された内視鏡画像に写る部位の情報を出力するように学習されている。なお、部位認識モデル４２０は、ルールベースのアルゴリズムを用いたプログラムであってもよいし、部位認識は人員による手作業で実行されてもよい。

　図４に示すように、プロセッサ１１０は、画像群１４をピロリ菌感染識別モデル４３０へ入力する。ピロリ菌感染識別モデル４３０は、画像群１４に含まれる各内視鏡画像から、そのピロリ菌感染状態を識別し、その結果を出力する。識別結果は、例えば、未感染、既感染、及び現感染の３分類である。未感染は、今までに一度も感染していない状態である。既感染は、過去に感染した後に除菌され、現在は感染していない状態である。現感染は、現在感染している状態である。或いは、識別結果は、未感染であるか否か、既感染であるか否か、又は現感染であるか否か、であってもよい。或いは、識別結果は、ピロリ菌感染に特有の所見が有るか否か、であってもよい。

　識別結果群１６は、部位認識モデル４２０により各内視鏡画像に付された部位情報と、その各内視鏡画像に対するピロリ菌感染の識別結果と、を含む。識別結果群１６は、内視鏡画像のＩＤ、部位情報、及び識別結果が対応付けられた情報群であればよく、内視鏡画像そのものを含む必要はない。図４では、例えば内視鏡画像ＩＭ１のＩＤに対して、部位Ａと結果ａが対応付けられている。

　プロセッサ１１０は、識別結果群１６に含まれる複数画像の推論結果を統合する統合処理４４０を実行し、症例単位のピロリ菌感染状態４５０を出力する。プロセッサ１１０は、複数画像の推論結果に対して、感染状態特定に重要な部位又は所見に基づく重み付けを行った上で、それらの推論結果を統合する。プロセッサ１１０は、推論結果をディスプレイ１９０に表示する。なお、推論結果はディスプレイ２９０に表示されてもよい。その場合、ディスプレイ１９０は省略されてもよい。

　ピロリ菌感染による炎症は、例えば胃の下部から始まって徐々に他の部分に拡大してゆく。このため、各部位で内視鏡画像の所見が異なり、ＡＩにより１枚の内視鏡画像からピロリ菌感染状態を識別しても、症例全体としてのピロリ菌感染状態を判断しにくいという課題がある。この点、本実施形態によれば、１つの症例に紐付く複数の内視鏡画像の各内視鏡画像からピロリ菌感染状態が推論され、その複数の推論結果が統合されることで、症例単位のピロリ菌感染状態が判断される。これにより、患者の消化管内の全体の情報を総合的に考慮した高精度なピロリ菌感染状態の推定が可能となる。また、医師が多数の画像を１つ１つチェックする必要がなくなるため、医師の画像閲覧の負担を軽減できる。また、ピロリ菌感染状態の推論結果を、研修医等の教育に活用できる。

　図５は、ピロリ菌感染状態の推論結果を表示する画像例である。画像３０は、統合処理フローのイメージが表示される領域３１と、推論結果が表示される領域３２と、を含む。

　領域３１には、図１１等で後述するようなフロー図が表示される。医師は、そのフロー図を見ることで、どのようなアルゴリズムで推論結果が得られたのかを知ることができる。

　領域３２には、推論結果３３と、画像一覧３４とが表示される。推論結果３３の一例は「推論結果統合時のＸＸＸという要因により未感染でした。」である。ＸＸＸは、例えば統合処理において重視された所見、或いはフローのどのステップでどのように判断されたか、である。画像一覧３４は、ピロリ菌感染識別モデル４３０に入力された画像群１４のうち、症例単位の推論結果である未感染と同じ感染状態と判断された内視鏡画像である。図５では、画像一覧３４は、画像単位で未感染と判断された内視鏡画像の一覧である。

　本実施形態によれば、医師が、自身が判断した診断結果と画像３０とを見比べることで、診断結果の再確認又は教育効果を期待できる。例えば、医師は、画像３０を見ることで、「自身が判断した感染状態とシステムが推論した感染状態が異なっていた。この経験を次回以降の診断に活かしたい。」等と思考することができる。

　各内視鏡画像に対する推論結果を統合する手法として、臨床的視点を重視した統合方法と、モデルの判断精度を重視した統合方法がある。まず、臨床的視点を重視した統合方法について説明する。

　図６は、臨床的視点の例である。ここでは、京都分類、医師の見解及び書籍情報を組み合わせた例を示すが、統合方法に反映させる臨床的視点は図６に限定されるものでない。

　図６に示す「Ｎｏ．」の欄は、ピロリ菌感染の診断において医師が部位を見ていく順番である。「ピロリ菌感染状態に対する重要度」の欄は、医師がどの部位に現れる所見を重視して各感染状態を判断するか、を意味する。例えば、医師は、ＥＧ　ｊｕｎｃｔｉｏｎ、前庭部、及び胃角小彎に現れる所見を重視して、未感染であるか否かを判断する。「所見に基づくピロリ菌感染状態の判断」の欄は、医師が部位の所見に基づいて感染状態をどのように判断できるか、を意味する。

　このように、未感染、既感染及び現感染の各感染状態には、臨床でそれを特定するために重要な粘膜状態又は部位が存在する。Ｎｏ．５に示す胃角小彎を例にとる。図７は、ピロリ菌感染による炎症が及んでいない粘膜に現れる、ＲＡＣと呼ばれる内視鏡像である。点線５０内に示すように、ＲＡＣは、粘膜の粒のようなテクスチャである。医師は、胃角小彎におけるＲＡＣの有無を判断材料の１つとして、未感染か否かを判断する。

　図８は、臨床的視点を重視した統合処理のフロー例である。プロセッサ１１０は、ピロリ菌感染識別モデル４３０が出力した識別結果群１６を、統合処理４４０に入力する。

　ステップＳ１において、プロセッサ１１０は、識別結果群１６において未感染の判断に重要な部位が未感染判断であるか、の真偽を判断する。図６を参照すると、例えば、プロセッサ１１０は、ＥＧ　ｊｕｎｃｔｉｏｎ、前庭部、又は胃角小彎の内視鏡画像が未感染判断であるか、の真偽を判断する。

　ステップＳ１において真である場合、ステップＳ２において、プロセッサ１１０は、症例が未感染であると判断する。ステップＳ１において偽である場合、ステップＳ３において、プロセッサ１１０は、識別結果群１６において現感染の判断に重要な部位の結果を用いて多数決を行い、現感染が多いか、の真偽を判断する。図６を参照すると、例えば、プロセッサ１１０は、体部大彎見下ろし　体上部、体中部、及び体上部の内視鏡画像の枚数のうち、現感染と判定された内視鏡画像の枚数が、半数より多いか、の真偽を判断する。

　ステップＳ３において真である場合、ステップＳ４において、プロセッサ１１０は、症例が現感染であると判断する。ステップＳ３において偽である場合、ステップＳ５において、プロセッサ１１０は、症例が既感染であると判断する。

　図９は、モデルの判断精度を重視した統合処理のフロー例である。プロセッサ１１０は、ピロリ菌感染識別モデル４３０が出力した識別結果群１６を、統合処理４４０に入力する。

　ステップＳ１１において、プロセッサ１１０は、識別結果群１６の中から、予め決められた部位に関する識別結果を選定する。選定される部位の数は１以上であればよい。図９には、部位Ａ～Ｃのうち部位Ａ、Ｂに関する識別結果が残される例を示す。予め決められた部位は、モデルの判定精度が高い部位であり、事前にモデルを評価することで決定される。例えば、部位Ａ、Ｂの内視鏡画像をモデルＸに入力したときの判定精度と、部位Ｃの内視鏡画像をモデルＸに入力したときの判定精度とが比較され、部位Ａ、Ｂの判定精度が高い場合に部位Ａ、Ｂが選定される。或いは、部位Ａ、Ｂの内視鏡画像をモデルＸに入力したときの判定精度と、部位Ｃの内視鏡画像をモデルＸとは異なるモデルＹに入力したときの判定精度とが比較され、モデルＸの判定精度が高い場合に、モデルＸが採用されると共に部位Ａ、Ｂが選定されてもよい。

　ステップＳ１２において、プロセッサ１１０は、選定された識別結果群において未感染の枚数が所定の閾値（ここでは、６０％）以上であるか、の真偽を判断する。なお、当該所定の閾値は６０％に限られるものではなく、ピロリ菌感染識別モデル４３０の特性等を考慮して適宜ユーザにより決定されてもよい。

　ステップＳ１２において真である場合、ステップＳ１３において、プロセッサ１１０は、症例が未感染であると判断する。ステップＳ１２において偽である場合、ステップＳ１４において、プロセッサ１１０は、選定された識別結果群において多数決を行い、現感染が多いか、の真偽を判断する。

　ステップＳ１４において真である場合、ステップＳ１５において、プロセッサ１１０は、症例が現感染であると判断する。ステップＳ１４において偽である場合、ステップＳ１６において、プロセッサ１１０は、症例が既感染であると判断する。

　なお、部位の選定はステップＳ１２、Ｓ１４の各々に対して実施されてもよい。即ち、ステップＳ１２の前に第１選定が実施され、ステップＳ１４の前に第２選定が実施され、第２選定で選定される部位は、第１選定で選定される部位と異なってもよい。

　本実施形態によれば、臨床的視点又はモデル判定精度に基づいて複数の推論結果を統合することで、医師が行うような総合的な判断を自動化できる。臨床的視点又はモデル判定精度を用いることで、精度よくピロリ菌感染状態を判定可能である。また、モデル判定精度を重視した統合方法を用いることで、実際の判定精度の評価に基づき統合処理が組まれるため、より精度の向上を期待できる。

　なお、統合処理のフローは図８、図９に限定されない。例えば、臨床的視点を重視した統合方法と、モデル判定精度を重視した統合方法とを組み合わせて統合処理のフローを構成してもよい。或いは、図１２～図１５で後述するように、様々な処理又は判定を用意しておき、それらを組み合わせて統合処理のフローを構成してもよい。

　図４では、ピロリ菌感染識別モデル４３０の出力結果を統合する例を示したが、複数のモデルの出力を統合してもよい。図１０は、複数のモデルの例と、その学習手法の説明図である。

　複数のモデルは、様々な部位の感染状態を識別するメインモデルと、特定の部位の感染状態又は感染状態に関わる特定の所見を識別する特化モデルとを含む。メインモデルは、感染状態、部位及び所見に特化せずにピロリ菌感染状態を識別可能なモデルである。メインモデルは、ピロリ菌感染識別モデル４３０であり、各内視鏡画像を現感染、既感染及び未感染の３分類に分類する。特化モデルは、特定の感染状態、特定の部位、又は特定の所見に特化して判断するモデルである。特化モデルは、一例としては、前庭部特化モデル５２０と、ＲＡＣ特化モデル５３０と、現感染特化モデル５４０とを含む。前庭部特化モデル５２０は、前庭部の内視鏡画像から萎縮の有無を判断する。ＲＡＣ特化モデル５３０は、胃角小彎の内視鏡画像からＲＡＣの有無を判断する。現感染特化モデル５４０は、大彎体中部及び大彎体上部の内視鏡画像から、びまん性発赤の有無又は皺襞腫大の有無を判断する。

　学習においては、学習システムは、自己教師有り学習により自己教師有り学習後のモデル５５０を生成する。自己教師有り学習においては、胃の様々な部位の内視鏡画像がモデルに入力され、その内視鏡画像の表現が学習される。次に、学習システムは、自己教師有り学習後のモデル５５０を用いてファインチューニング学習を行うことでメインモデル及び特化モデルを生成する。ファインチューニング学習の一例は、いわゆる知識蒸留である。知識蒸留において、自己教師有り学習後のモデル５５０が教師モデルであり、メインモデル及び特化モデルが生徒モデルである。具体的には、教師データは、内視鏡画像と、その内視鏡画像に付された正解ラベルとを含む。学習システムは、教師データの内視鏡画像を自己教師有り学習後のモデル５５０に入力し、その出力をソフトターゲットとし、教師データの正解ラベルをハードターゲットとする。学習システムは、教師データの内視鏡画像を生徒モデルに入力し、その出力とソフトターゲットとハードターゲットから演算される評価関数に基づいて生徒モデルの学習を行う。

　なお、メインモデル及び特化モデルの学習手法は上記に限定されず、いわゆる教師有り学習によって各モデルが生成されてもよい。現感染特化モデル５４０は、大彎体下部の萎縮とびまん性発赤を判定対象としてもよい。メインモデルは、例えばＷＬＩ（ホワイトライト）の照明によって観察した画像を対象とする。但し、メインモデルは、ＷＬＩ以外の照明によって観察した画像、又は染色された組織を観察した画像を対象としてもよい。

　図１１は、メインモデル及び特化モデルの出力を統合する処理のフロー例である。ステップＳ２１において、プロセッサ１１０は、メインモデルに複数の内視鏡画像を入力し、メインモデルは、各内視鏡画像についての推論結果を出力する。ここでは全ての部位が用いられてもよいし、或いは未感染の判断精度が高い一部の部位が用いられてもよい。

　ステップＳ２２において、プロセッサ１１０は、メインモデルにより未感染と判断された画像枚数が、閾値以上であるか否かを判断する。プロセッサ１１０は、メインモデルに入力される画像枚数に対して、メインモデルにより未感染と判断された画像枚数の割合が、閾値以上であるか否かを判断してもよい。

　ステップＳ２２において枚数が閾値以上である場合、ステップＳ２３において、プロセッサ１１０は、メインモデルにより既感染と判断された画像枚数と、メインモデルにより未感染と判断された画像枚数との差が、閾値以下であるか否かを判断する。

　ステップＳ２３において差が閾値より大きい場合、ステップＳ２４において、プロセッサ１１０は、症例のピロリ菌感染状態を未感染に確定する。ステップＳ２３において差が閾値以下である場合、ステップＳ２５において、プロセッサ１１０は、特化モデル１の判断対象となる部位の内視鏡画像を、選定する。特化モデル１は、前庭部特化モデル５２０とＲＡＣ特化モデル５３０である。即ち、選定される部位は、前庭部と胃角小彎である。

　ステップＳ２６において、プロセッサ１１０は、選定された部位の内視鏡画像を特化モデル１へ入力し、特化モデル１は、各内視鏡画像についての推論結果を出力する。ステップＳ２７、Ｓ２８において、プロセッサ１１０は、特化モデル１の出力に基づいて症例のピロリ菌感染状態を未感染又は既感染に確定する。具体的には、プロセッサ１１０は、前提部の内視鏡画像を前庭部特化モデル５２０へ入力し、前庭部特化モデル５２０は、各内視鏡画像に対して萎縮の有無を出力する。プロセッサ１１０は、胃角小彎の内視鏡画像をＲＡＣ特化モデル５３０へ入力し、ＲＡＣ特化モデル５３０は、各内視鏡画像に対してＲＡＣの有無を出力する。プロセッサ１１０は、これらの識別結果から症例が未感染か既感染かを判断する。

　ステップＳ２２において枚数が閾値より小さい場合、ステップＳ２９において、プロセッサ１１０は、メインモデルにより既感染と判断された画像枚数と、メインモデルにより現感染と判断された画像枚数との差が、閾値以上であるか否かを判断する。

　ステップＳ２９において差が閾値より小さい場合、ステップＳ３０において、プロセッサ１１０は、メインモデルにより既感染と判断された画像枚数と、メインモデルにより未感染と判断された画像枚数との差が、閾値以下であるか否かを判断する。

　ステップＳ３０において差が閾値より大きい場合、ステップＳ３１において、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。ステップＳ３０において差が閾値以下である場合、ステップＳ３２において、プロセッサ１１０は、特化モデル１の判断対象となる部位の内視鏡画像を、選定する。ステップＳ３２～Ｓ３５は、ステップＳ２５～Ｓ２８と同様である。

　ステップＳ２９において差が閾値以上である場合、ステップＳ３６において、プロセッサ１１０は、特化モデル２の判断対象となる部位の内視鏡画像を、選定する。特化モデル２は、現感染特化モデル５４０である。即ち、選定される部位は、大彎体中部と大彎体上部である。

　ステップＳ３７において、プロセッサ１１０は、選定された部位の内視鏡画像を特化モデル２へ入力し、特化モデル２は、各内視鏡画像についての推論結果を出力する。ステップＳ３８、Ｓ３９において、プロセッサ１１０は、特化モデル２の出力に基づいて症例のピロリ菌感染状態を既感染又は現感染に確定する。具体的には、プロセッサ１１０は、大彎体中部と大彎体上部の内視鏡画像を現感染特化モデル５４０へ入力し、現感染特化モデル５４０は、各内視鏡画像に対してびまん性発赤又は皺襞腫大の有無を出力する。プロセッサ１１０は、その識別結果から症例が既感染か現感染かを判断する。

　図８、図９、図１１で説明した統合処理フローは一例であって、以下に説明するように様々な処理を組み合わせて統合処理フローが構成されてよい。図１２～図１５は、統合処理フローに組み込み可能な処理の一覧である。統合処理フローは、図１２～図１５に示す処理１～１１を組み合わせることで構成される。処理１～１１の全てが用いられる必要はない。またフローの中で同じ処理が複数回用いられてもよい。

　図１２～図１５には、各処理の内容として、「関連するモジュール」「処理への入力」「処理の内容」「処理からの出力」を示す。「関連するモジュール」は、そのモジュールの出力が統合処理に入力されることを、意味する。処理１～１０に関連するモジュールは、機械学習による学習済みモデルであり、処理１１に関連するモジュールはルールベースのアルゴリズムを用いたプログラムである。「処理への入力」は、統合処理へ入力されるデータの内容である、即ち「関連するモジュール」の出力である。「処理の内容」は、「処理への入力」を用いて、どのような処理が実行されるか、を意味する。「処理からの出力」は、その処理の結果として、どのような出力が得られるか、を意味する。

　処理２を例にとると、プロセッサ１１０は、メインモデルの出力を処理２へ入力する。その入力は、精度により選定された部位の各内視鏡画像に対する未感染、既感染及び現感染の識別結果である。プロセッサ１１０は、入力された識別結果の全画像枚数の中で、特定感染状態Ａと判断された画像枚数の割合が、閾値ｔｈａ以上存在するか否か、を判断する。入力された識別結果の全画像枚数は、ここでは、精度により選定された部位の内視鏡画像の枚数である。一例として、特定感染状態Ａが未感染であり、閾値ｔｈａが６０％であるとする。このとき、プロセッサ１１０は、入力された識別結果の全画像枚数の中で、未感染と判断された画像枚数の割合が、閾値６０％以上存在するか否か、を判断する。プロセッサ１１０は、割合が閾値ｔｈａ以上である場合、症例が特定感染状態Ａであると判断する。そして、プロセッサ１１０は、症例が特定感染状態Ａであると確定してもよいし、又は、判断結果に基づいて次の処理に進んでもよい。後者において、例えば、プロセッサ１１０は、処理２において症例が特定感染状態Ａであると判断された結果と、その後の処理において得られた判断結果とを用いて、感染状態を確定してもよい。割合が閾値ｔｈａより小さい場合の処理は、様々である。プロセッサ１１０は、症例が特定感染状態Ａでないと確定しつつ、特定感染状態Ａ以外の２分類の可能性があるものとして、次の処理に進んでもよい。或いは、既感染、未感染及び現感染のいずれの可能性も残しつつ、処理２において症例が特定感染状態Ａであると判断された結果と、その後の処理において得られた判断結果とを用いて、感染状態を確定してもよい。

　図１２～図１５に示す特定感染状態Ａ～Ｄの各々は、未感染、既感染又は現感染のいずれかである。閾値ｔｈａ～ｔｈｄは、互いに異なる値であってもよいし、それらのうち任意の２以上の閾値が同じ値であってもよい。処理１～処理１１の実行順は任意であってよいが、一例としては、処理１、２、３又は４の後に処理５又は６が実行される。又は、処理１、２、３又は４の後に処理７又は８が実行される。又は、処理７又は８の後に処理８又は１０が実行される。

　図１２～図１５において、「処理への入力」に「胃内部の部位」の項目がある。この項目は、選定される部位のことである。具体的には、「胃内部の部位」の項目は、「関連するモジュール」にどの部位の内視鏡画像を入力するか、或いは「関連するモジュール」が出力した識別結果のうち、どの部位の識別結果を用いるか、を意味する。図１６は、選定手法の一覧である。モデルの精度により部位を選定する方法２については、図９においても上述した。また、臨床的視点により部位を選定する方法３については、図６～図９においても上述した。

　図１７に、方法３に用いられる臨床的視点の一例である京都分類を示す。「局在」は胃内部の部位に相当する。「感染」は現感染に相当し、「除菌後」は既感染に相当する。「感染」「未感染」「除菌後」に示す〇×△は、その感染状態において、「局在」に示す部位に「内視鏡的所見」が観察されやすいか、を意味する。例えば、胃粘膜全体におけるびまん性発赤の所見は、「感染」において観察されることが多く、「未感染」及び「除菌後」において観察されない。

　なお、臨床的視点としては、図１７の京都分類だけでなく、医師の見解又は書籍情報等が用いられてもよい。例えば、図６で説明したように、京都分類、医師の見解及び書籍情報を組み合わせた臨床的視点が用いられてもよい。

　図１８及び図１９は、図１２～図１５の「関連するモジュール」の具体例である。「特徴」及び「何の役に立つか」は、モジュールの目的又は性質などを示す。「学習」には、モジュールの学習段階において用いられる「教師データ」を示す。「推論」には、推論段階におけるモジュールへの「入力」とモジュールからの「出力」とを示す。

　メインモデルは、図１２～図１５の処理１、２、５、６又は７のメインモデルとして用いられる。図１８のメインモデルは、全ての部位の内視鏡画像を入力として現感染、既感染及び未感染を識別できる。このとき、一部の部位の内視鏡画像をメインモデルに入力する、或いはメインモデルの出力のうち一部の部位の識別結果を統合処理に入力することで、図１２～図１５の処理２、４，６、７を実現できる。現感染特化モデル、前庭部特化モデル及びＲＡＣ特化モデルは、図１２～図１５の処理４又は８として用いられる。萎縮モデルは、図１２～図１５の処理１０として用いられる。

　「教師データ」は、学習段階におけるモデルへの入力と、その入力に付された正解ラベルである。この「教師データ」は、例えば教師有り学習における教師データとして用いられる。或いは、上述した知識蒸留のファインチューニングにおいては、教師モデルの出力がソフトターゲットであり、「教師データ」の正解ラベルがハードターゲットとなる。

　図２０は、図１８及び図１９のモジュールを用いた統合処理のフロー例である。フローにおいて丸付き数字で示す部位は、図２の丸付き数字で示す部位に対応している。

　ステップＳ５１において、プロセッサ１１０は、体下部から胃角大彎、体部大彎見下ろし（体中部）及び体部大彎見下ろし（体上部）の内視鏡画像を、現感染特化モデルへ入力し、現感染特化モデルは、各内視鏡画像について現感染であるか否かの推論結果を出力する。

　ステップＳ６１において、プロセッサ１１０は、現感染特化モデルが出力した推論結果の全画像枚数に対して、現感染と判断された画像枚数の割合が、閾値ｔｈ１以上であるか否かを判断する。

　ステップＳ６１において、割合が閾値ｔｈ１以上である場合、ステップＳ８１において、プロセッサ１１０は、症例のピロリ菌感染状態を現感染に確定する。

　ステップＳ６１において、割合が閾値ｔｈ１より小さい場合、ステップＳ５２において、プロセッサ１１０は、過去の問診情報を取得する。例えば、メモリ１２０が、症例に関する過去の問診情報を記憶しており、プロセッサ１１０は、メモリ１２０から過去の問診情報を読み出す。或いは、プロセッサ１１０は、内視鏡システム１の外部データベースから、症例に関する過去の問診情報を取得してもよい。

　ステップＳ６２において、プロセッサ１１０は、過去の問診情報に「除菌成功」の記録が有るか否かを判断する。

　ステップＳ６２において「除菌成功」の記録が有った場合、ステップＳ８２において、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ６２において「除菌成功」の記録が無かった場合、ステップＳ６３において、プロセッサ１１０は、症例のピロリ菌感染状態が既感染か未感染かを判断し、プロセッサ１１０は、ステップＳ８３において既感染に確定し、又はステップＳ８４において未感染に確定する。

　図２１は、ステップＳ６３の第１詳細フロー例である。ステップＳ５３において、プロセッサ１１０は、体下部から胃角大彎、前庭部、胃角小彎及び体部小彎見上げの内視鏡画像を、メインモデルへ入力し、メインモデルは、各内視鏡画像を現感染、既感染又は未感染に分類する。

　ステップＳ７１において、プロセッサ１１０は、メインモデルが出力した推論結果の全画像枚数に対して、未感染と判断された画像枚数の割合が、閾値ｔｈ２以上であるか否かを判断する。

　ステップＳ７１において、割合が閾値ｔｈ２より小さい場合、ステップＳ８３ａにおいて、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ７１において、割合が閾値ｔｈ２以上である場合、ステップＳ５４において、プロセッサ１１０は、胃角小彎の内視鏡画像を萎縮モデルへ入力し、萎縮モデルは、各内視鏡画像から萎縮の有無を判断する。

　ステップＳ７２において、プロセッサ１１０は、萎縮モデルが出力した推論結果の全画像枚数に対して、萎縮有りと判断された画像枚数の割合が、閾値ｔｈ３以上であるか否かを判断する。

　ステップＳ７２において、割合が閾値ｔｈ３以上である場合、ステップＳ８３ｂにおいて、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ７３において、割合が閾値ｔｈ３より小さい場合、ステップＳ８４において、プロセッサ１１０は、症例のピロリ菌感染状態を未感染に確定する。

　図２２は、ステップＳ６３の第２詳細フロー例である。ステップＳ５３において、プロセッサ１１０は、体下部から胃角大彎、前庭部、胃角小彎及び体部小彎見上げの内視鏡画像を、メインモデルへ入力し、メインモデルは、各内視鏡画像を現感染、既感染又は未感染に分類する。

　ステップＳ７３において、プロセッサ１１０は、メインモデルが出力した推論結果の全画像枚数に対して、未感染と判断された画像枚数の割合が、閾値ｔｈ４以上であるか否かを判断する。

　ステップＳ７３において、割合が閾値ｔｈ４より小さい場合、ステップＳ８３ｃにおいて、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ７３において、割合が閾値ｔｈ４以上である場合、ステップＳ５５において、プロセッサ１１０は、胃角小彎の内視鏡画像をＲＡＣ特化モデルへ入力し、ＲＡＣ特化モデルは、各内視鏡画像からＲＡＣの有無を判断する。

　ステップＳ７４において、プロセッサ１１０は、ＲＡＣ特化モデルが出力した推論結果の全画像枚数に対して、萎縮有りと判断された画像枚数の割合が、閾値ｔｈ５以上であるか否かを判断する。

　ステップＳ７４において、割合が閾値ｔｈ５以上である場合、ステップＳ８３ｄにおいて、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ７４において、割合が閾値ｔｈ４より小さい場合、ステップＳ５６において、プロセッサ１１０は、前庭部の内視鏡画像を前庭部特化モデルへ入力し、前庭部特化モデルは、各内視鏡画像から前庭部における萎縮の有無を判断する。

　ステップＳ７５において、プロセッサ１１０は、前庭部特化モデルが出力した推論結果の全画像枚数に対して、萎縮有り、つまり既感染と判断された画像枚数の割合が、閾値ｔｈ６以上であるか否かを判断する。

　ステップＳ７５において、割合が閾値ｔｈ６以上である場合、ステップＳ８３ｅにおいて、プロセッサ１１０は、症例のピロリ菌感染状態を既感染に確定する。

　ステップＳ７５において、割合が閾値ｔｈ６より小さい場合、ステップＳ８４において、プロセッサ１１０は、症例のピロリ菌感染状態を未感染に確定する。

　以上に説明した本実施形態の画像処理システム１００は、メモリ１２０とプロセッサ１１０とを含む。メモリ１２０は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、内視鏡画像毎の感染状態を示す推論結果を出力する学習済みモデル１３０を、記憶する。プロセッサ１１０は、１つの症例に紐付く複数の内視鏡画像を学習済みモデル１３０へ入力することで複数の推論結果を取得し、その取得された複数の推論結果を統合することで症例単位のピロリ菌感染状態を判断する統合処理を行う。プロセッサ１１０は、消化管の部位に関する部位情報が各内視鏡画像に対して付された複数の内視鏡画像を、学習済みモデル１３０へ入力することで、複数の推論結果を取得する。プロセッサ１１０は、取得された複数の推論結果と、部位情報とを用いて複数の推論結果を集計し、その集計結果に基づいて複数の推論結果を統合することで、症例単位のピロリ菌感染状態を判断する。

　本実施形態によれば、学習済みモデル１３０が１症例に紐付く複数の内視鏡画像から内視鏡画像毎にピロリ菌感染状態を推論することで、複数の推論結果が得られる。そして、プロセッサ１１０が、複数の推論結果を統合することで、症例のピロリ菌感染状態を判断できる。内視鏡画像毎にピロリ菌感染状態の推論結果は異なると想定されるが、それらを統合することで、画像単位ではなく症例全体としてのピロリ菌感染状態を総合的に判断できるようになる。また、画像単位でピロリ菌感染状態を判断する場合に比べて、医師が行う総合的な判断に近い判断が可能になるため、精度良く症例全体としてのピロリ菌感染状態を判断できる。

　なお、学習済みモデル１３０は、メインモデルであってもよいし、特化モデルであってもよいし、メインモデル及び特化モデルを含んでもよい。「内視鏡画像毎の感染状態を示す推論結果」は、メインモデルの推論結果、又は特化モデルの推論結果のいずれであってもよい。即ち、「内視鏡画像毎の感染状態を示す推論結果」は、である既感染、未感染及び現感染の３分類、既感染であるか否か、未感染であるか否か、現感染であるか否か、又は特定所見の有無であってよい。「複数の推論結果を集計」は、推論結果に基づいて画像枚数を計算すること、である。一例として、集計は、推論結果として未感染と判断された画像の枚数を合計する、推論結果として特定の所見が有ると判断された画像の枚数を合計する、又は、ある部位に関する推論に用いられた画像の枚数を合計する、等である。

　また本実施形態では、統合処理は、第１処理と第２処理の少なくとも一方を含んでもよい。第１処理は、第１画像枚数に対する第２画像枚数の割合が、特定の閾値以上である場合に、特定部位のピロリ菌感染状態が第１感染状態であると判断する処理であってもよい。第２処理は、第１画像枚数に対する第２画像枚数の割合が、特定の閾値以下である場合に、特定部位のピロリ菌感染状態が、現感染、既感染及び未感染のうち第１感染状態以外であると判断する処理であってもよい。第１画像枚数は、複数の内視鏡画像のうち特定部位の部位情報が付された内視鏡画像の枚数であってもよい。第２画像枚数は、学習済みモデル１３０により第１感染状態と判断された内視鏡画像の枚数であってもよい。第１感染状態は、現感染、既感染及び未感染のうちのいずれかであってもよい。

　本実施形態によれば、第１処理及び第２処理の少なくとも一方により、特定部位のピロリ菌感染状態が第１感染状態であるか否かを判断できる。即ち、特定部位のピロリ菌感染状態が、未感染であるか否か、既感染であるか否か、又は現感染であるか否か、を判断できる。そして、このような判断を統合処理に組み込むことで、症例単位のピロリ菌感染状態を統合判断できるようになる。

　なお、ここでの「統合処理」は、図１２～図１５の処理２、４、６、７、８又は１０に対応する。処理２を例にとると、「特定部位」は、精度により選定された部位であり、「第１画像枚数」は、１症例に紐付く複数の内視鏡画像のうち、精度により選定された部位が写る内視鏡画像の枚数である。また、「第１感染状態」は特定感染状態Ａであり、「第２画像枚数」は、精度により選定された部位が写る内視鏡画像のうち特定感染状態Ａと判断された内視鏡画像の枚数である。また、「特定の閾値」は閾値ｔｈａである。

　また本実施形態では、特定部位は、消化管の部位のうち、第１感染状態に対する重要所見が発生する部位であってもよい。

　本実施形態によれば、第１感染状態に対する重要所見が表れる部位を特定部位として選定しておくことで、その特定部位の内視鏡画像に対する推論結果を、症例が第１感染状態か否かの判断材料にできる。このような判断を統合処理に組み込むことで、症例単位のピロリ菌感染状態を精度良く統合判断できるようになる。

　なお、ここでの「特定部位」は、図１４の「臨床により選定された部位」に相当する。即ち、ここでの「統合処理」は、図１４の処理７又は８に対応する。特定所見とは、臨床的視点において特定部位に現れるピロリ菌の感染状態に特有な（特徴的な）所見のことである。例えば図６の例において、前庭部の萎縮、又は胃角小彎のＲＡＣ等が、特定所見である。

　また本実施形態では、特定部位は、消化管の部位のうち、学習済みモデル１３０により第１感染状態が最も高精度に識別される部位を含んでもよい。

　本実施形態によれば、学習済みモデル１３０により第１感染状態が最も高精度に識別される部位を特定部位として選定しておくことで、その特定部位の内視鏡画像に対する推論結果を、症例が第１感染状態か否かの判断材料にできる。このような判断を統合処理に組み込むことで、症例単位のピロリ菌感染状態を精度良く統合判断できるようになる。

　なお、ここでの「特定部位」は、図１２、図１３及び図１５の「精度により選定された部位」に相当する。即ち、ここでの「統合処理」は、図１４の処理２、４、６又は１０に対応する。

　また本実施形態では、学習済みモデル１３０は、入力された内視鏡画像を、現感染、既感染及び未感染のうちのいずれに該当するかを分類し、分類結果を推論結果として出力してもよい。

　本実施形態によれば、内視鏡画像毎に推論された現感染、既感染及び未感染の分類結果を統合することで、症例のピロリ菌感染状態を判断できる。内視鏡画像毎に現感染、既感染及び未感染の分類結果は異なると想定されるが、それらを統合することで、画像単位ではなく症例全体としてのピロリ菌感染状態を総合的に判断できるようになる。

　なお、ここでの「学習済みモデル」は、図１２～図１４のメインモデルに対応する。即ち、ここでの「統合処理」は、図１２～図１４の処理１、２、５、６又は７に対応する。但し、学習済みモデル１３０が、メインモデル以外のモデルを更に含んでいてもよい。

　また本実施形態では、学習済みモデル１３０は、入力された内視鏡画像が、現感染、既感染及び未感染のうちの特定の感染状態に該当するか否かを判断し、その判断結果を推論結果として出力する。

　本実施形態によれば、内視鏡画像毎に推論された特定の感染状態に該当するかの判断結果を統合することで、症例のピロリ菌感染状態を判断できる。内視鏡画像毎に特定の感染状態に該当するかの判断結果は異なると想定されるが、それらを統合することで、画像単位ではなく症例全体としてのピロリ菌感染状態を総合的に判断できるようになる。

　なお、ここでの「学習済みモデル」は、図１２及び図１４の特化モデルに対応する。即ち、ここでの「統合処理」は、図１２及び図１４の処理３、４又は８に対応する。但し、学習済みモデル１３０が、特化モデル以外のモデルを更に含んでいてもよい。「特定の感染状態に該当するか否か」は、未感染であるか否か、現感染であるか否か、又は既感染であるか否か、である。

　また本実施形態では、学習済みモデル１３０は、入力された内視鏡画像に写る萎縮の有無を判断し、その判断結果を推論結果として出力してもよい。

　本実施形態によれば、内視鏡画像毎に推論された萎縮有無の判断結果を統合することで、症例のピロリ菌感染状態を判断できる。内視鏡画像毎に萎縮有無の判断結果は異なると想定されるが、それらを統合することで、画像単位ではなく症例全体としてのピロリ菌感染状態を総合的に判断できるようになる。

　なお、「萎縮」とは、慢性的に続いた炎症により胃の粘膜が薄くなった状態のことである。「萎縮」は、炎症を伴っていてもよいし、炎症が消失した後に残る萎縮であってもよい。「萎縮」は、例えば萎縮性胃炎又は腸上皮化生を含んでもよい。ここでの「学習済みモデル」は、図１５の萎縮モデルに対応する。即ち、ここでの「統合処理」は、図１５の処理９又は１０に対応する。但し、学習済みモデル１３０が、萎縮モデル以外のモデルを更に含んでいてもよい。

　また本実施形態では、学習済みモデル１３０は、現感染、既感染及び未感染のうちの特定の感染状態に紐付く特定所見の有無を、入力された内視鏡画像から判断し、その判断結果を推論結果として出力してもよい。

　本実施形態によれば、内視鏡画像毎に推論された特定所見の有無の判断結果を統合することで、症例のピロリ菌感染状態を判断できる。内視鏡画像毎に特定所見の有無の判断結果は異なると想定されるが、それらを統合することで、画像単位ではなく症例全体としてのピロリ菌感染状態を総合的に判断できるようになる。

　なお、ここでの「学習済みモデル」は、図１８及び図１９の現感染特化モデル、前庭部特化モデル、ＲＡＣ特化モデル又は萎縮モデルに対応する。即ち、ここでの「統合処理」は、上記モデルの出力の集計結果に基づく。但し、学習済みモデル１３０が、上記モデル以外のモデルを更に含んでいてもよい。

　また本実施形態では、学習済みモデル１３０は、第１部位群に属する部位が写る内視鏡画像から推論結果を出力する第１学習済みモデルと、第２部位群に属する部位が写る内視鏡画像から推論結果を出力する第２学習済みモデルと、を含んでもよい。プロセッサ１１０は、第１部位群に属する部位が写る複数の内視鏡画像を第１学習済みモデルへ入力することで第１の複数の推論結果を取得してもよい。プロセッサ１１０は、第２部位群に属する部位が写る複数の内視鏡画像を第２学習済みモデルへ入力することで第２の複数の推論結果を取得してもよい。プロセッサ１１０は、取得された第１の複数の推論結果及び第２の複数の推論結果に基づいて、症例単位のピロリ菌感染状態を判断してもよい。

　本実施形態によれば、様々な学習済みモデルを組み合わせて、その各学習済みモデルが出力した推論結果を統合することで、症例単位のピロリ菌感染状態を判断できる。例えば部位又は所見に応じてモデルを用意し、それらのモデルを組み合わせることが可能となるため、症例単位のピロリ菌感染状態を精度良く判断できるようになる。

　なお、第１部位群及び第２部位群の各々は、胃の部位のうち全部又は一部である。第２部位群は、第１部位群と同じであってもよいし、異なってもよい。第２部位群に含まれる部位は、第１部位群に含まれる部位と重複してもよい。第１学習済みモデル及び第２学習済みモデルの各々は、図１２～図１５のメインモデル又は特化型モデルである。或いは、「第１学習済みモデル」及び「第２学習済みモデル」の各々は、図１８及び図１９に示すメインモデル、現感染特化型モデル、前庭部特化モデル、ＲＡＣ特化モデル及び萎縮モデルのいずれかである。「第２学習済みモデル」は「第１学習済みモデル」と異なるモデルでもよいし、同じモデルでもよい。「第２学習済みモデル」が「第１学習済みモデル」と同じモデルであるとき、第２部位群が第１部位群と異なればよい。

　また本実施形態では、プロセッサ１１０は、第１の複数の推論結果を集計した集計結果と、第２の複数の推論結果を集計した集計結果とに基づいて、症例単位のピロリ菌感染状態を判断してもよい。

　本実施形態によれば、第１の複数の推論結果を集計した結果に基づいて判断されるピロリ菌感染状態と、第２の複数の推論結果を集計した結果に基づいて判断されるピロリ菌感染状態と、を統合することで、症例単位のピロリ菌感染状態を判断できる。

　例えば図２０及び図２１のフローにおいて、ステップＳ６１において現感染特化型モデルの推論結果に基づいて現感染か否かが判断され、ステップＳ７１においてメインモデルの推論結果に基づいて未感染か否かが判断され、それらを統合して未感染、既感染及び現感染のいずれであるかが判断されている。この例では、現感染特化型モデル及びメインモデルの一方が第１学習済みモデルに対応し、他方が第２学習済みモデルに対応する。

　また本実施形態では、第１学習済みモデルは、入力された内視鏡画像が、現感染、既感染及び未感染のうちのいずれに該当するかを分類し、分類結果を前記推論結果として出力してもよい。

　また本実施形態では、第２学習済みモデルは、入力された内視鏡画像が、現感染、既感染及び未感染のうちの特定の感染状態に該当するか否かを判断し、その判断結果を推論結果として出力してもよい。

　また本実施形態では、第２学習済みモデルは、入力された内視鏡画像に写る萎縮の有無を判断し、その判断結果を推論結果として出力してもよい。

　また本実施形態では、第２学習済みモデルは、現感染、既感染及び未感染のうちの特定の感染状態に紐付く特定所見の有無を、入力された内視鏡画像から判断し、その判断結果を推論結果として出力してもよい。

　これらの学習済みモデルを用いる作用効果、用語の意味、実施例との対応は、上述した通りである。

　また本実施形態では、図５で説明したように、プロセッサ１１０は、統合処理によるピロリ菌感染状態の判断結果と、複数の内視鏡画像のうち判断結果と同じ感染状態の内視鏡画像の一覧と、をディスプレイ１９０に表示する処理を行う。

　本実施形態によれば、学習済みモデル及びプログラムによって自動判断された症例のピロリ菌感染状態と、その判断結果と同じ感染状態の内視鏡画像の一覧とを、医師に提示できる。医師が、自身が判断した診断結果と提示内容とを見比べることで、診断結果の再確認又は教育効果を期待できる。

　以上に説明した本実施形態は、画像処理方法として実施されてもよい。即ち、画像処理方法は、学習済みモデル１３０を用いてピロリ菌感染状態を判断する。学習済みモデル１３０は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、内視鏡画像毎の感染状態を示す推論結果を出力する。画像処理方法は、学習済みモデル１３０に対して、複数の内視鏡画像を入力することで複数の推論結果を取得すること、を含む。複数の内視鏡画像の各内視鏡画像に対して、消化管の部位に関する部位情報が付され、且つ複数の内視鏡画像は１つの症例に紐付いている。画像処理方法は、統合処理を行うこと、を含む。統合処理は、取得された複数の推論結果と、部位情報とを用いて複数の推論結果を集計する。統合処理は、その集計結果に基づいて複数の推論結果を統合することで、症例単位のピロリ菌感染状態を判断する。

　また本実施形態は、プログラム又は情報記憶媒体として実施されてもよい。即ち、プログラムは、学習済みモデル１３０を用いてピロリ菌感染状態を判断することを、コンピュータに実行させる。学習済みモデル１３０は、入力された内視鏡画像毎にピロリ菌感染状態を識別することで、内視鏡画像毎の感染状態を示す推論結果を出力する。プログラムは、学習済みモデル１３０に対して、複数の内視鏡画像を入力することで複数の推論結果を取得すること、をコンピュータに実行させる。複数の内視鏡画像の各内視鏡画像に対して、消化管の部位に関する部位情報が付され、且つ複数の内視鏡画像は１つの症例に紐付いている。プログラムは、統合処理を行うこと、をコンピュータに実行させる。統合処理は、取得された複数の推論結果と、部位情報とを用いて複数の推論結果を集計する。統合処理は、その集計結果に基づいて複数の推論結果を統合することで、症例単位のピロリ菌感染状態を判断する。プログラムは、コンピュータにより読み取り可能な非一時的な情報記憶媒体に記憶されてもよい。

　以上、本実施形態およびその変形例について説明したが、本開示は、各実施形態やその変形例そのままに限定されるものではなく、実施段階では、要旨を逸脱しない範囲内で構成要素を変形して具体化することができる。また、上記した各実施形態や変形例に開示されている複数の構成要素を適宜組み合わせることができる。例えば、各実施形態や変形例に記載した全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態や変形例で説明した構成要素を適宜組み合わせてもよい。このように、本開示の主旨を逸脱しない範囲内において種々の変形や応用が可能である。また、明細書又は図面において、少なくとも一度、より広義または同義な異なる用語と共に記載された用語は、明細書又は図面のいかなる箇所においても、その異なる用語に置き換えることができる。

１…内視鏡システム、１００…画像処理システム、１１０…プロセッサ、１２０…メモリ、１３０…学習済みモデル、１４０…プログラム、１９０…ディスプレイ、２００…内視鏡、２５０…ビデオプロセッサ、２９０…ディスプレイ、４１０…画像チェックモデル、４２０…部位認識モデル、４３０…ピロリ菌感染識別モデル、４４０…統合処理、４５０…ピロリ菌感染状態、５２０…前庭部特化モデル、５３０…ＲＡＣ特化モデル、５４０…現感染特化モデル、ＩＭ１～ＩＭ９…内視鏡画像

Claims

　入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを記憶するメモリと、
　１つの症例に紐付く複数の内視鏡画像を前記学習済みモデルへ入力することで複数の推論結果を取得し、取得された前記複数の推論結果を統合することで症例単位のピロリ菌感染状態を判断する統合処理を行うプロセッサと、
　を含み、
　前記プロセッサは、
　消化管の部位に関する部位情報が各内視鏡画像に対して付された前記複数の内視鏡画像を、前記学習済みモデルへ入力することで、前記複数の推論結果を取得し、
　取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、前記症例単位のピロリ菌感染状態を判断することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記統合処理は、
　前記複数の内視鏡画像のうち特定部位の前記部位情報が付された内視鏡画像の枚数である第１画像枚数に対する、前記学習済みモデルにより現感染、既感染及び未感染のうちのいずれかである第１感染状態と判断された内視鏡画像の枚数である第２画像枚数の割合が、特定の閾値以上である場合に、前記特定部位のピロリ菌感染状態が前記第１感染状態であると判断する第１処理と、
　前記第１画像枚数に対する前記第２画像枚数の割合が、前記特定の閾値以下である場合に、前記特定部位のピロリ菌感染状態が、前記現感染、前記既感染及び前記未感染のうち前記第１感染状態以外であると判断する第２処理と、
　の少なくとも一方を含むことを特徴とする画像処理システム。
　請求項２に記載された画像処理システムにおいて、
　前記特定部位は、
　前記消化管の部位のうち、前記第１感染状態に対する重要所見が発生する部位であることを特徴とする画像処理システム。
　請求項２に記載された画像処理システムにおいて、
　前記特定部位は、
　前記消化管の部位のうち、前記学習済みモデルにより前記第１感染状態が最も高精度に識別される部位を含むことを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記学習済みモデルは、
　入力された内視鏡画像が、現感染、既感染及び未感染のうちのいずれに該当するかを分類し、分類結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記学習済みモデルは、
　入力された内視鏡画像が、現感染、既感染及び未感染のうちの特定の感染状態に該当するか否かを判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記学習済みモデルは、
　入力された内視鏡画像に写る萎縮の有無を判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記学習済みモデルは、
　現感染、既感染及び未感染のうちの特定の感染状態に紐付く特定所見の有無を、入力された内視鏡画像から判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記学習済みモデルは、
　第１部位群に属する部位が写る内視鏡画像から前記推論結果を出力する第１学習済みモデルと、
　第２部位群に属する部位が写る内視鏡画像から前記推論結果を出力する第２学習済みモデルと、
　を含み、
　前記プロセッサは、
　前記第１部位群に属する部位が写る複数の内視鏡画像を前記第１学習済みモデルへ入力することで第１の複数の推論結果を取得し、前記第２部位群に属する部位が写る複数の内視鏡画像を前記第２学習済みモデルへ入力することで第２の複数の推論結果を取得し、
　取得された前記第１の複数の推論結果及び前記第２の複数の推論結果に基づいて、前記症例単位のピロリ菌感染状態を判断することを特徴とする画像処理システム。
　請求項９に記載された画像処理システムにおいて、
　前記プロセッサは、
　前記第１の複数の推論結果を集計した集計結果と、前記第２の複数の推論結果を集計した集計結果とに基づいて、前記症例単位のピロリ菌感染状態を判断することを特徴とする画像処理システム。
　請求項９に記載された画像処理システムにおいて、
　前記第１学習済みモデルは、
　入力された内視鏡画像が、現感染、既感染及び未感染のうちのいずれに該当するかを分類し、分類結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項９に記載された画像処理システムにおいて、
　前記第２学習済みモデルは、
　入力された内視鏡画像が、現感染、既感染及び未感染のうちの特定の感染状態に該当するか否かを判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項９に記載された画像処理システムにおいて、
　前記第２学習済みモデルは、
　入力された内視鏡画像に写る萎縮の有無を判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項９に記載された画像処理システムにおいて、
　前記第２学習済みモデルは、
　現感染、既感染及び未感染のうちの特定の感染状態に紐付く特定所見の有無を、入力された内視鏡画像から判断し、判断結果を前記推論結果として出力することを特徴とする画像処理システム。
　請求項１に記載された画像処理システムにおいて、
　前記プロセッサは、
　前記統合処理による前記ピロリ菌感染状態の判断結果と、前記複数の内視鏡画像のうち前記判断結果と同じ感染状態の内視鏡画像の一覧と、をディスプレイに表示する処理を行うことを特徴とする画像処理システム。
　入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを用いて、ピロリ菌感染状態を判断する画像処理方法であって、
　前記学習済みモデルに対して、消化管の部位に関する部位情報が各内視鏡画像に対して付され且つ１つの症例に紐付く前記複数の内視鏡画像を入力することで、複数の推論結果を取得することと、
　取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、症例単位の前記ピロリ菌感染状態を判断する統合処理を行うことと、
　を含むことを特徴とする画像処理方法。
　入力された内視鏡画像毎にピロリ菌感染状態を識別することで、前記内視鏡画像毎の前記感染状態を示す推論結果を出力する学習済みモデルを用いて、ピロリ菌感染状態を判断することを、コンピュータに実行させるプログラムを記憶した、コンピュータにより読み取り可能な非一時的な情報記憶媒体であって、
　前記学習済みモデルに対して、消化管の部位に関する部位情報が各内視鏡画像に対して付され且つ１つの症例に紐付く複数の内視鏡画像を入力することで、複数の推論結果を取得することと、
　取得された前記複数の推論結果と、前記部位情報とを用いて前記複数の推論結果を集計し、集計結果に基づいて前記複数の推論結果を統合することで、症例単位の前記ピロリ菌感染状態を判断する統合処理を行うことと、
　をコンピュータに実行させるプログラムを記憶した情報記憶媒体。