WO2022186109A1 - 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム - Google Patents

医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム Download PDF

Info

Publication number
WO2022186109A1
WO2022186109A1 PCT/JP2022/008166 JP2022008166W WO2022186109A1 WO 2022186109 A1 WO2022186109 A1 WO 2022186109A1 JP 2022008166 W JP2022008166 W JP 2022008166W WO 2022186109 A1 WO2022186109 A1 WO 2022186109A1
Authority
WO
WIPO (PCT)
Prior art keywords
medical image
image processing
attention area
interest
region
Prior art date
Application number
PCT/JP2022/008166
Other languages
English (en)
French (fr)
Inventor
駿平 加門
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2023503802A priority Critical patent/JPWO2022186109A1/ja
Priority to EP22763165.2A priority patent/EP4302680A1/en
Priority to CN202280016305.4A priority patent/CN116887745A/zh
Publication of WO2022186109A1 publication Critical patent/WO2022186109A1/ja
Priority to US18/458,121 priority patent/US20230410303A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000094Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope extracting biological structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000095Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope for image enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/377Details of the operation on graphic patterns for mixing or overlaying two or more graphic patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10068Endoscopic image
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/12Overlay of images, i.e. displayed pixel being the result of switching between the corresponding input pixels
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2380/00Specific applications
    • G09G2380/08Biomedical applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Multimedia (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computer Hardware Design (AREA)
  • Optics & Photonics (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Signal Processing (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Endoscopes (AREA)

Abstract

本発明は、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラムを提供することを目的とする。本発明の一の態様に係る医療画像処理装置は、プロセッサを備える医療画像処理装置であって、プロセッサは、時系列の医療画像を取得する画像取得処理と、取得した医療画像から注目領域を検出する注目領域検出処理と、医療画像を表示装置に表示させる表示制御処理と、注目領域検出処理で注目領域が検出された場合に、表示装置に医療画像と検出された注目領域に関する情報を重畳表示させる第1の報知処理と、注目領域検出処理で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知処理と、を実行し、第2の報知処理を第1の報知処理よりも後に実行する。

Description

医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム
 本発明は医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラムに関し、特に注目領域の検出結果を報知する技術に関する。
 医師等のユーザが医療画像の観察や診断を行う際の支援として、医療画像処理装置による注目領域の検出結果を報知することが知られている。例えば、特許文献1には、複数の注目領域検出部の内から選択した注目領域検出部によって注目領域を検出してその結果を報知(表示)することが記載されている。また、特許文献2には、検出結果や鑑別結果を音声で報知することが記載されている。
WO17/081976号公報 特開2020-69300号公報
 内視鏡画像や超音波画像のような医療画像から病変をはじめとした注目領域をAI(Artificial Intelligence:人工知能)等により検出してユーザに報知する場合、病変の見落としを防ぐために、検出対象を即座に報知することが求められる。しかしながら、AIによる自動検出では偽陽性が発生する可能性があり、その場合誤った報知をしてしまいユーザが煩わしさを感じる、という問題がある。特に、音声による報知が頻繁に誤って出力されてしまうと、ユーザは表示による報知の場合よりもより煩わしさを感じる傾向がある。しかしながら、上述した特許文献1,2のような従来の技術では、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することが困難であった。
 本発明はこのような事情に鑑みてなされたもので、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラムを提供することを目的とする。
 上述した目的を達成するため、本発明の第1の態様に係る医療画像処理装置は、プロセッサを備える医療画像処理装置であって、プロセッサは、時系列の医療画像を取得する画像取得処理と、取得した医療画像から注目領域を検出する注目領域検出処理と、医療画像を表示装置に表示させる表示制御処理と、注目領域検出処理で注目領域が検出された場合に、表示装置に医療画像と検出された注目領域に関する情報を重畳表示させる第1の報知処理と、注目領域検出処理で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知処理と、を実行し、第2の報知処理を第1の報知処理よりも後に実行する。
 第1の態様に係る医療画像処理装置では、プロセッサは、注目領域が検出された場合に第1の報知処理(表示装置への表示)を行う。これにより、注目領域の見逃し防止の効果が得られる。なお、見落とし防止の観点からは、プロセッサは注目領域を検出した場合に即座に(できるだけ短い遅延で)第1の報知処理を行うことが好ましいが、装置での処理に伴う必然的な遅延や、医療画像の取得が間欠的であることによる遅延は許容される。
 注目領域の検出において、偽陽性は瞬時的に発生することが多く継続的に発生することは少ない傾向にある。そのため、注目領域が瞬時的に検出された場合の音声出力を抑制すれば、偽陽性に起因する音声出力によりユーザが煩わしさを感じる度合いを低減することができる。第1の実施形態では、このような観点から、プロセッサは音声を出力する第2の報知処理を第1の報知処理よりも後に実行する。すなわち、プロセッサは、第1の報知処理(画面表示)の直後の期間においては注目領域が検出されていても音声出力しないので、この期間における瞬時的な偽陽性による音声出力が抑制される。
 プロセッサ(医療画像処理装置)は、「第2の報知をどの程度遅らせるか(遅延時間あるいは待機時間)」をユーザの指定に応じて設定してもよいし、ユーザの指定によらずに設定してもよい。ユーザは、偽陽性による音声出力の抑制度合いと音声による報知力のバランスを考慮して、遅延時間を指定することができる。
 第1の態様に係る医療画像処理装置によれば、このような第1,第2の報知処理により、注目領域の見落としの可能性を低減しつつ、不要な音声出力(瞬時的な偽陽性による音声出力)を抑制することができる。
 なお、第1の態様及び以下の各態様において、「時系列の医療画像の取得」は決められたフレームレートで撮影された複数の医療画像を順次取得することを含む。取得はリアルタイムでもよいし、リアルタイムでなくてもよい。
 第1の態様に係る医療画像処理装置は、例えば医療画像処理システムのプロセッサ部分として実現することができるが、このような態様に限定されるものではない。なお、「医療画像」とは診断、治療、計測等を目的として人体等の生体を撮影、計測等した結果として得られた画像をいい、例えば内視鏡画像、超音波画像、CT画像(CT:Computed Tomography)、MRI画像(MRI:Magnetic Resonance Imaging)を挙げることができる。医療画像は医用画像ともいう。また、第1の態様及び以下の各態様において、「注目領域(ROI:Region of Interest)」は医療画像における病変領域または病変候補領域、臓器や脈管、処置が施された領域、処置具等が写った領域であってよい。「注目領域」は「関心領域」と呼ばれることがある。
 第2の態様に係る医療画像処理装置は第1の態様において、プロセッサは、注目領域検出処理において注目領域が検出されてから第1期間が経過した後にも注目領域を検出した場合は第2の報知処理を実行し、第1期間が経過した後に注目領域を検出しなかった場合は第2の報知処理を実行しない。注目領域が検出されてから第1期間が経過した後にも注目領域が検出された場合は、継続的な検出であり瞬時的な偽陽性の可能性は低いと考えられるので、第2の報知処理(音声出力)を行うことができる。なお、第2の態様において、プロセッサは観察の目的や対象、あるいはユーザの指定に応じて「第1期間」の値を設定することができる。
 第3の態様に係る医療画像処理装置は第1または第2の態様において、プロセッサは、第1の報知処理において、医療画像における注目領域の位置に対応して情報を重畳表示する。第3の態様は、第1の報知処理の態様を具体的に規定するものである。プロセッサは、情報を医療画像における注目領域内に表示してもよいし、注目領域の周辺に表示してもよい。また、プロセッサは、表示装置の表示画面における医療画像表示領域外に情報を表示してもよい。
 第4の態様に係る医療画像処理装置は第1から第3の態様のいずれか1つにおいて、プロセッサは、注目領域検出処理で検出された注目領域に対して連続検出回数を算出する検出回数算出処理を実行し、連続検出回数があらかじめ決められた回数を超えた場合に第2の報知処理を実行する。連続検出回数があらかじめ決められた回数を超えた場合、「継続的な検出であり瞬時的な偽陽性の可能性は低い」と考えられるため、第4の態様のように第2の報知処理を実行することができる。プロセッサは「あらかじめ決められた回数」をユーザの指定に応じて設定してもよいし、ユーザの指定によらずに設定してもよい。
 第5の態様に係る医療画像処理装置は第4の態様において、プロセッサは、検出された注目領域の特徴量を保持する特徴量保持処理と、第1の時刻において撮像された医療画像から検出された第1の注目領域の特徴量と、保持されている第1の時刻より前の時刻である第2の時刻において撮像された第2の医療画像から検出された第2の注目領域の特徴量と、を比較することにより第1の注目領域と第2の注目領域との同一性を判定する同一性判定処理と、をさらに実行し、検出回数算出処理では、同一性判定処理での判定結果に応じて第1の注目領域に対する連続検出回数を算出する。第5の態様のように、注目領域の同一性を考慮して連続検出回数を算出することにより、第2の報知処理をより適切に行うことができる。なお、「保持」は一時的記録(記憶)でもよいし、非一時的記録でもよい。また、第1,第2の注目領域について、「特徴量」は例えば種類、位置、形状、大きさ、色彩であるが、これらの例には限定されない。
 第6の態様に係る医療画像処理装置は第5の態様において、プロセッサは、同一性判定処理において第1の注目領域と第2の注目領域が同一であると判断された場合、検出回数算出処理において、第2の注目領域に対して記録されていた連続検出回数を増加させた上で第1の注目領域の連続検出回数として算出する。第6の態様は、連続検出回数算出の具体的態様を規定するものである。
 第7の態様に係る医療画像処理装置は第5または第6の態様において、プロセッサは、同一性判定処理において、特徴量保持処理で保持された特徴量のうちで第1の時刻より決められた期間前までの時刻についての特徴量を第1の注目領域の特徴量と比較することにより同一性の判定を行う。第7の態様において、「第1の時刻より決められた期間前までの時刻」は第5の態様における「第2の時刻」に対応するものである。この「決められた期間」は、計算コストの増大や同一性判定の精度低下の問題を考慮して設定することができる。
 第8の態様に係る医療画像処理装置は第1から第7の態様のいずれか1つにおいて、プロセッサは、第2の報知処理において、音声出力装置に音声を出力させた後、決められた期間は音声を出力させない。第8の態様は、音声が頻繁に出力されたり長時間出力が継続したりするとユーザが煩わしさを感じる場合があることを考慮して、音声出力の停止期間を設けたものである。プロセッサは、「決められた期間」をユーザの指定に応じて設定してもよいし、ユーザの指定によらずに設定してもよい。
 第9の態様に係る医療画像処理装置は第1から第8の態様のいずれか1つにおいて、プロセッサは、第1の報知処理において、第2の報知処理における音声出力状態に応じて第1の報知処理の態様を変更する。第9の態様において、プロセッサは、例えば、第2の報知処理がなされる場合(すなわち、注目領域が継続的に検出され瞬時的な偽陽性の可能性が低い場合)に、第1の報知処理で重畳表示される情報の識別力を増加させることができ、このような第1の報知処理の態様変更により、継続的検出であることを報知できる。また、プロセッサは、第1の報知処理の態様を第2の報知処理(音声出力)と同時に変更してもよいし、タイミングを前後させて変更してもよい。
 第10の態様に係る医療画像処理装置は第1から第9の態様のいずれか1つにおいて、プロセッサは、第1の報知処理において、文字、図形、記号のうち少なくとも1つを情報(検出された注目領域に関する情報)として重畳表示を行う。第10の態様は、医療画像に重畳する情報の具体的態様を規定するものである。プロセッサは、注目領域の特徴量に応じた情報を重畳表示してよい。
 上述した目的を達成するため、本発明の第11の態様に係る内視鏡システムは、第1から第10の態様のいずれか1つに記載の医療画像処理装置と、被検体に挿入される内視鏡スコープであって、医療画像を撮像する撮像部を有する内視鏡スコープと、表示装置と、音声出力装置と、を備える。第11の態様に係る内視鏡システムは、第1から第10の態様のいずれか1つに係る医療画像処理装置を備えるので、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる。なお、第11の態様に係る内視鏡システムは光源装置を備えていてもよい。その光源装置は、通常光(白色光)、特殊光(狭帯域光等)、及びそれらの組み合わせを観察光とすることができる。光源装置は、臓器や部位、観察目的や観察対象の種類等に応じて波長帯域の異なる観察光を照射することが好ましい。
 上述した目的を達成するため、本発明の第12の態様に係る医療画像処理方法はプロセッサを備える医療画像処理装置により実行される医療画像処理方法であって、プロセッサは、時系列の医療画像を取得する画像取得工程と、取得した医療画像から注目領域を検出する注目領域検出工程と、医療画像を表示装置に表示させる表示制御工程と、注目領域検出工程で注目領域が検出された場合に、表示装置に医療画像と検出された注目領域に関する情報を重畳表示させる第1の報知工程と、注目領域検出工程で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知工程と、を実行し、第2の報知工程を第1の報知工程よりも後に行う。第12の態様によれば、第1の態様と同様に、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる。第12の態様に係る医療画像処理方法は、第2から第10の態様と同様の構成をさらに含んでいてもよい。
 上述した目的を達成するため、本発明の第13の態様に係る医療画像処理プログラムはプロセッサを備える医療画像処理装置に医療画像処理方法を実行させる医療画像処理プログラムであって、医療画像処理方法は、時系列の医療画像を取得する画像取得工程と、取得した医療画像から注目領域を検出する注目領域検出工程と、医療画像を表示装置に表示させる表示制御工程と、注目領域検出工程で注目領域が検出された場合に、表示装置に、医療画像と検出された注目領域に関する情報を重畳表示させる第1の報知工程と、注目領域検出工程で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知工程と、を含み、第2の報知工程は第1の報知工程よりも後に行われる。第13の態様によれば、第1の態様、第12の態様と同様に、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる。また、第13の態様に係る医療画像処理プログラムは、第2から第10の態様と同様の処理をさらに実行させるプログラムでもよい。なお、これら態様のプログラムのコンピュータ読み取り可能なコードを記録した非一時的記録媒体も本発明の態様として挙げることができる。
 以上説明したように、本発明に係る医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラムによれば、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる。
図1は、第1の実施形態に係る内視鏡システムの外観図である。 図2は、内視鏡システムの要部構成を示す図である。 図3は、プロセッサの機能構成を示すブロック図である。 図4は、注目領域検出部の構成を示す図である。 図5は、検出器の層構成の例を示す図である。 図6は、フィルタによる畳み込み処理の様子を示す図である。 図7は、第1の実施形態に係る医療画像処理方法の手順を示すフローチャートである。 図8は、処理条件の設定画面の例を示す図である。 図9は、重畳表示(第1の報知処理)の例を示す図である。 図10は、音声による報知(第2の報知処理)の詳細を示すフローチャートである。 図11は、音声出力の具体例(その1)を示す図である。 図12は、音声出力の具体例(その2)を示す図である。 図13は、音声出力の具体例(その3)を示す図である。 図14は、音声出力の具体例(その4)を示す図である。 図15は、音声出力の具体例(その5)を示す図である。 図16は、音声出力の具体例(その6)を示す図である。
 以下、添付図面を参照しつつ、本発明に係る医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラムの実施形態について詳細に説明する。
 <第1の実施形態>
 <内視鏡システムの構成>
 図1は、第1の実施形態に係る内視鏡システム10(医療画像処理装置、内視鏡システム)の外観図であり、図2は内視鏡システム10の要部構成を示すブロック図である。図1,2に示すように、内視鏡システム10は、内視鏡スコープ100(内視鏡スコープ、撮像装置)、医療画像処理部200(医療画像処理装置、プロセッサ)、光源装置300(光源装置)、及びモニタ400(表示装置)から構成される。電磁波や超音波、あるいは磁気を利用して内視鏡スコープ100の状態を判定する外部デバイス(判定装置)を内視鏡システム10に接続してもよい。
 <内視鏡スコープの構成>
 内視鏡スコープ100は、手元操作部102と、この手元操作部102に連設される挿入部104とを備える。術者(ユーザ)は手元操作部102を把持して操作し、挿入部104を被検体の体内に挿入して観察する。また、手元操作部102には送気送水ボタン141、吸引ボタン142、及び各種の機能を割り付けられる機能ボタン143、及び撮影指示操作(静止画像、動画像)を受け付ける撮影ボタン144が設けられている。挿入部104は、手元操作部102側から順に、軟性部112、湾曲部114、先端硬質部116で構成されている。すなわち、先端硬質部116の基端側に湾曲部114が接続され、湾曲部114の基端側に軟性部112が接続される。挿入部104の基端側に手元操作部102が接続される。ユーザは、手元操作部102を操作することにより湾曲部114を湾曲させて先端硬質部116の向きを上下左右に変えることができる。先端硬質部116には、撮影光学系130、照明部123、鉗子口126等が設けられる(図1,2参照)。
 観察、処置の際には、操作部208(図2参照)の操作により、照明部123の照明用レンズ123A,123Bから白色光(通常光)及び/または狭帯域光(特殊光:例えば赤色狭帯域光、緑色狭帯域光、青色狭帯域光、及び紫色狭帯域光のうち1つ以上)を照射することができる。また、送気送水ボタン141の操作により図示せぬ送水ノズルから洗浄水が放出されて、撮影光学系130の撮影レンズ132(撮影レンズ、撮影部)、及び照明用レンズ123A,123Bを洗浄することができる。先端硬質部116で開口する鉗子口126には不図示の管路が連通しており、この管路に腫瘍摘出等のための図示せぬ処置具が挿通されて、適宜進退して被検体に必要な処置を施せるようになっている。
 図1,2に示すように、先端硬質部116の先端側端面116Aには撮影レンズ132(撮像部)が配設されている。撮影レンズ132の奥にはCMOS(Complementary Metal-Oxide Semiconductor)型の撮像素子134(撮像素子、撮像部)、駆動回路136、
AFE138(AFE:Analog Front End、撮影部)が配設されて、これらの要素により画像信号を出力する。撮像素子134はカラー撮像素子であり、特定のパターン配列(ベイヤー配列、X-Trans(登録商標)配列、ハニカム配列等)でマトリクス状に配置(2次元配列)された複数の受光素子により構成される複数の画素を備える。撮像素子134の各画素はマイクロレンズ、赤(R)、緑(G)、または青(B)のカラーフィルタ及び光電変換部(フォトダイオード等)を含んでいる。撮影光学系130は、赤,緑,青の3色の画素信号からカラー画像を生成することもできるし、赤,緑,青のうち任意の1色または2色の画素信号から画像を生成することもできる。なお、第1の実施形態では撮像素子134がCMOS型の撮像素子である場合について説明するが、撮像素子134はCCD(Charge Coupled Device)型でもよい。なお、撮像素子134の各画素は紫色光源310Vに対応した紫色カラーフィルタ、及び/または赤外光源に対応した赤外用フィルタをさらに備えていてもよい。
 被検体の光学像は撮影レンズ132により撮像素子134の受光面(撮像面)に結像されて電気信号に変換され、不図示の信号ケーブルを介して医療画像処理部200に出力されて映像信号に変換される。これにより、医療画像処理部200に接続されたモニタ400に内視鏡画像が表示される。
 また、先端硬質部116の先端側端面116Aには、撮影レンズ132に隣接して照明部123の照明用レンズ123A、123Bが設けられている。照明用レンズ123A,123Bの奥には、後述するライトガイド170の射出端が配設され、このライトガイド170が挿入部104、手元操作部102、及びユニバーサルケーブル106に挿通され、ライトガイド170の入射端がライトガイドコネクタ108内に配置される。
 手元操作部102は、内視鏡スコープ100の個体情報(個体情報、スコープ情報)を記録する不図示のスコープ情報記録部を備えていてもよい。個体情報は、例えば内視鏡スコープ100のタイプ(直視か側視か、等)、機種、個体識別番号、光学系の特性(視野角、歪み等)等である。プロセッサ210(スコープ情報取得部、個体情報取得部)は、この個体情報を取得して医療画像処理に用いることができる。なお、スコープ情報記録部はライトガイドコネクタ108に設けられていてもよい。
 内視鏡システム10では、上述した構成の内視鏡スコープ100を用いて決められたフレームレートで被検体を順次撮像する(撮像部及び画像取得部220(図3参照)の制御により行うことができる)ことにより、時系列の医療画像を順次取得することができる。ユーザは、内視鏡スコープ100(挿入部104)を被検体である生体内に挿入または抜去しながら観察を行う。
 <光源装置の構成>
 図2に示すように、光源装置300は、照明用の光源310、絞り330、集光レンズ340、及び光源制御部350等から構成されており、観察光をライトガイド170に入射させる。光源310は、それぞれ赤色、緑色、青色、紫色の狭帯域光を照射する赤色光源310R、緑色光源310G、青色光源310B、及び紫色光源310Vを備えており、赤色、緑色、青色、及び紫色の狭帯域光を照射することができる。光源310による観察光の照度は光源制御部350により制御され、必要に応じて観察光の照度を変更する(上げる、または下げる)こと、及び照明を停止することができる。
 光源310は赤色、緑色、青色、及び紫色の狭帯域光を任意の組合せで発光させることができる。例えば、赤色、緑色、青色、及び紫色の狭帯域光を同時に発光させて白色光(通常光)を観察光として照射することもできるし、いずれか1つもしくは2つを発光させることで狭帯域光(特殊光)を照射することもできる。光源310は、赤外光(狭帯域光の一例)を照射する赤外光源をさらに備えていてもよい。また、白色光を照射する光源と、白色光及び各狭帯域光を透過させるフィルタとにより、白色光または狭帯域光を観察光として照射してもよい。
 <光源の波長帯域>
 光源310は白色帯域の光、または白色帯域の光として複数の波長帯域の光を発生する光源でもよいし、白色の波長帯域よりも狭い特定の波長帯域の光を発生する光源でもよい。特定の波長帯域は、可視域の青色帯域もしくは緑色帯域、あるいは可視域の赤色帯域であってもよい。特定の波長帯域が可視域の青色帯域もしくは緑色帯域である場合、390nm以上450nm以下、または530nm以上550nm以下の波長帯域を含み、かつ、390nm以上450nm以下または530nm以上550nm以下の波長帯域内にピーク波長を有していてもよい。また、特定の波長帯域が可視域の赤色帯域である場合、585nm以上615nm以下、または610nm以上730nm以下、の波長帯域を含み、かつ、特定の波長帯域の光は、585nm以上615nm以下または610nm以上730nm以下の波長帯域内にピーク波長を有していてもよい。
 上述した特定の波長帯域は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域を含み、かつ、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域にピーク波長を有していてもよい。この場合、特定の波長帯域は、400±10nm、440±10nm、470±10nm、または、600nm以上750nm以下の波長帯域を含み、かつ、400±10nm、440±10nm、470±10nm、または600nm以上750nm以下の波長帯域にピーク波長を有していてもよい。
 また、光源310が発生する光は790nm以上820nm以下、または905nm以上970nm以下の波長帯域を含み、かつ、790nm以上820nm以下または905nm以上970nm以下の波長帯域にピーク波長を有していてもよい。
 また、光源310は、ピークが390nm以上470nm以下である励起光を照射する光源を備えていてもよい。この場合、被検体(生体)内の蛍光物質が発する蛍光の情報を有する医療画像(医用画像、生体内画像)を取得することができる。蛍光画像を取得する場合は、蛍光法用色素剤(フルオレスチン、アクリジンオレンジ等)を使用してもよい。
 光源310の光源種類(レーザ光源、キセノン光源、LED光源(LED:Light-Emitting Diode)等)、波長、フィルタの有無等は被写体の種類、部位、臓器、観察の目的等に応じて構成することが好ましく、また観察の際は被写体の種類、部位、臓器、観察の目的等に応じて観察光の波長を組合せ及び/または切り替えることが好ましい。波長を切り替える場合、例えば光源の前方に配置され特定波長の光を透過または遮光するフィルタが設けられた円板状のフィルタ(ロータリカラーフィルタ)を回転させることにより、照射する光の波長を切り替えてもよい。
 また、本発明を実施する際に用いる撮像素子は撮像素子134のように各画素に対しカラーフィルタが配設されたカラー撮像素子に限定されるものではなく、モノクロ撮像素子でもよい。モノクロ撮像素子を用いる場合、観察光の波長を順次切り替えて面順次(色順次)で撮像することができる。例えば出射する観察光の波長を(紫色、青色、緑色、赤色)の間で順次切り替えてもよいし、広帯域光(白色光)を照射してロータリカラーフィルタ(赤色、緑色、青色、紫色等)により出射する観察光の波長を切り替えてもよい。また、1または複数の狭帯域光(緑色、青色、紫色等)を照射してロータリカラーフィルタ(緑色、青色、紫色等)により出射する観察光の波長を切り替えてもよい。狭帯域光は波長の異なる2波長以上の赤外光でもよい。
 ライトガイドコネクタ108(図1,2参照)を光源装置300に連結することにより、光源装置300から照射された観察光がライトガイド170を介して照明用レンズ123A、123Bに伝送され、照明用レンズ123A、123Bから観察範囲に照射される。
 <医療画像処理部の構成>
 図2に基づき医療画像処理部200の構成を説明する。医療画像処理部200は、内視鏡スコープ100から出力される画像信号を画像入力コントローラ202を介して入力し、プロセッサ210(画像取得部220:プロセッサ、コンピュータ、医療画像処理装置)で必要な画像処理を行ってビデオ出力部206を介して出力する。これによりモニタ400(表示装置)に観察画像(医療画像、医用画像)が表示される。通信制御部205は、図示せぬ病院内システム(HIS:Hospital Information System)や病院内LAN(Local Area Network)、及び/または外部のシステムやネットワークとの間で通信制御を行う。記録部207(記録装置)には、被検体の画像(内視鏡画像、医療画像、医用画像)、部位情報、検出結果を示す情報等が記録される。音声処理部209は、プロセッサ210の制御により、検出結果や報知処理(第2の報知処理)に関するメッセージ(音声)をスピーカー209A(音声出力装置)から出力することができる。
 また、ROM211(ROM:Read Only Memory)は不揮発性の記憶素子(非一時的記録媒体)であり、各種の画像処理方法をプロセッサ210に実行させるプログラムのコンピュータ読み取り可能なコードが記憶されている。RAM212(RAM:Random Access Memory)は各種処理の際の一時記憶用の記憶素子であり、また画像取得時のバッファとしても使用することができる。
 なお、ユーザは操作部208を介して医療画像処理の実行指示や実行に必要な条件の指定を行うことができ、表示制御部232(図3参照)はこれら指示の際の画面(例えば、図8参照)や注目領域の検出結果等をモニタ400に表示させることができる。
 <プロセッサの機能>
 図3はプロセッサ210の機能構成を示すブロック図である。プロセッサ210は、画像取得部220(画像取得部)と、注目領域検出部222(注目領域検出部)と、検出回数算出部226(検出回数算出部)と、特徴量算出部228(特徴量算出部)と、同一性判定部230(同一性判定部)と、表示制御部232(表示制御部)と、第1の報知部234(第1の報知部)と、第2の報知部236(第2の報知部)と、記録制御部238(記録制御部)と、通信制御部240と、を備える。また、図4に示すように、注目領域検出部222は検出器223と切替制御部224とを備える。検出器223は観察部位や臓器、検出アルゴリズム等が異なる複数の検出器により構成することができ、図4に示す態様では咽頭用検出器223A、食道用検出器223B、胃用検出器223C、及び十二指腸用検出器223Dを備える。切替制御部224は、モニタ400(表示装置)に検出結果を表示させる検出器を内視鏡画像の解析結果(部位や臓器、視線方向等)に基づいて切り替えてもよいし、上述した外部デバイス(判定装置)により取得した撮像情報(撮像装置の位置及び/または方向を示す情報)に基づいて切り替えてもよい。なお、プロセッサ210は、複数の検出器を動作させておいて一部の検出器による検出結果を表示させてもよいし、検出結果を表示させる検出器のみ動作させてもよい。
 プロセッサ210は、上述した機能により、医療画像の特徴量の算出、特定の周波数帯域の成分を強調または低減する処理、特定の対象(注目領域、所望の深さの血管等)を強調または目立たなくする処理を行うことができる。プロセッサ210は、白色帯域の光、または白色帯域の光としての複数の波長帯域の光を照射して得る通常光画像に基づいて特定の波長帯域の情報を有する特殊光画像を取得する特殊光画像取得部を備えていてもよい。この場合、特定の波長帯域の信号は、通常光画像に含まれるRGB(R:赤、G:緑、B:青)あるいはCMY(C:シアン、M:マゼンタ、Y:イエロー)の色情報に基づく演算により得ることができる。また、プロセッサ210は、白色帯域の光、または白色帯域の光としての複数の波長帯域の光を照射して得る通常光画像と、特定の波長帯域の光を照射して得る特殊光画像との少なくとも一方に基づく演算によって特徴量画像を生成する特徴量画像生成部を備え、医療画像(医用画像)としての特徴量画像を取得及び表示してもよい。
 また、画像取得部220(プロセッサ)は、部位情報が示す部位に応じた波長帯域の観察光で撮影された内視鏡画像(医療画像)を医療画像として取得し、表示制御部232はその波長帯域の観察光で撮影された医療画像に対する認識の結果をモニタ400(表示装置)に表示させてもよい。例えば、胃の場合は白色光(通常光)で撮影された画像を、食道の場合はBLI(Blue Laser Imaging:登録商標)等の特殊光(青色狭帯域光)で撮影された画像を検出(認識)に供することができる。画像取得部220は、部位に応じ、LCI(Linked Color Imaging:登録商標)等の特殊光で撮影され画像処理(LCIの場合、粘膜色に近い色の彩度差や色相差を拡張する)が施された画像を取得してもよい。
 上述した機能を用いた医療画像処理については、詳細を後述する。
 <学習済みモデルを用いた検出器>
 上述した検出器は、CNN(Convolutional Neural Network)、SVM(Support Vector Machine)等の、機械学習により構成された学習済みモデル(生体を撮影した画像から構成される画像セットを用いて学習したモデル)を用いて構成することができる。以下、CNNにより検出器223(咽頭用検出器223A~十二指腸用検出器223D)を構成する場合の層構成について説明する。
 <CNNの層構成の例>
 図5は検出器223の層構成の例を示す図である。図5の(a)部分に示す例では、検出器223は入力層250と、中間層252と、出力層254とを含む。入力層250は画像取得部220が取得した内視鏡画像(医療画像)を入力して特徴量を出力する。中間層252は畳み込み層256及びプーリング層258を含み、入力層250が出力する特徴量を入力して他の特徴量を算出する。これらの層は複数の「ノード」が「エッジ」で結ばれた構造となっており、複数の重みパラメータを保持している。重みパラメータの値は、学習が進むにつれて変化していく。検出器223は、図5の(b)部分に示す例のように全結合層260を含んでいてもよい。検出器223の層構成は畳み込み層256とプーリング層258とが1つずつ繰り返される場合に限らず、いずれかの層(例えば、畳み込み層256)が複数連続して含まれていてもよい。また、全結合層260が複数連続して含まれていてもよい。
 <中間層における処理>
 中間層252は、畳み込み演算及びプーリング処理によって特徴量を算出する。畳み込み層256で行われる畳み込み演算はフィルタを使用した畳み込み演算により特徴マップを取得する処理であり、画像からのエッジ抽出等の特徴抽出の役割を担う。このフィルタを用いた畳み込み演算により、1つのフィルタに対して1チャンネル(1枚)の「特徴マップ」が生成される。「特徴マップ」のサイズは、畳み込みによりダウンスケーリングされ、各層で畳み込みが行われるにつれて小さくなって行く。プーリング層258で行われるプーリング処理は畳み込み演算により出力された特徴マップを縮小(または拡大)して新たな特徴マップとする処理であり、抽出された特徴が、平行移動などによる影響を受けないようにロバスト性を与える役割を担う。中間層252は、これらの処理を行う1または複数の層により構成することができる。
 図6は、フィルタによる畳み込み処理の様子を示す図である。中間層252の最初(1番目)の畳み込み層では、複数の医療画像により構成される画像セット(学習時は学習用画像セット、検出等の認識時は認識用画像セット)とフィルタFとの畳み込み演算が行われる。画像セットは、縦がH、横がWの画像サイズを有するN枚(Nチャンネル)の画像により構成される。通常光画像を入力する場合、画像セットを構成する画像はR(赤色),G(緑色),B(青色)の3チャンネルの画像である。この画像セットと畳み込み演算されるフィルタFは、画像セットがNチャンネル(N枚)であるため、例えばサイズ5(5×5)のフィルタの場合、フィルタサイズは5×5×Nのフィルタになる。このフィルタFを用いた畳み込み演算により、1つのフィルタFに対して1チャンネル(1枚)の「特徴マップ」が生成される。2番目の畳み込み層で使用されるフィルタFは、例えばサイズ3(3×3)のフィルタの場合、フィルタサイズは3×3×Mになる。
 1番目の畳み込み層と同様に、2番目からn番目の畳み込み層ではフィルタF~Fを用いた畳み込み演算が行われる。n番目の畳み込み層における「特徴マップ」のサイズが、2番目の畳み込み層における「特徴マップ」のサイズよりも小さくなっているのは、前段までの畳み込み層またはプーリング層によりダウンスケーリングされているからである。
 中間層252の層のうち、入力側に近い畳み込み層では低次の特徴抽出(エッジの抽出等)が行われ、出力側に近づくにつれて高次の特徴抽出(対象物の形状、構造等に関する特徴の抽出)が行われる。なお、計測等を目的としてセグメンテーションを行う場合は後半部分の畳み込み層でアップスケーリングされ、最後の畳み込み層では、入力した画像セットと同じサイズの「特徴マップ」が得られる。一方、物体検出を行う場合は、位置情報を出力すればよいのでアップスケーリングは必須ではない。
 なお、中間層252は畳み込み層256及びプーリング層258の他にバッチノーマライゼーションを行う層を含んでいてもよい。バッチノーマライゼーション処理は学習を行う際のミニバッチを単位としてデータの分布を正規化する処理であり、学習を速く進行させる、初期値への依存性を下げる、過学習を抑制する等の役割を担う。
 <出力層における処理>
 出力層254は、中間層252から出力された特徴量に基づき、入力された医療画像(通常光画像、特殊光画像)に映っている注目領域の位置検出を行ってその結果を出力する層である。セグメンテーションを行う場合、出力層254は、中間層252から得られる「特徴マップ」により、画像に写っている注目領域の位置を画素レベルで把握する。すなわち、内視鏡画像の画素ごとに注目領域に属するか否かを検出し、その検出結果を出力することができる。一方、物体検出を行う場合は画素レベルでの判断は必要なく、出力層254が対象物の位置情報を出力する。
 出力層254は病変に関する鑑別(分類)を実行して鑑別結果を出力するものでもよい。例えば、出力層254は内視鏡画像を「腫瘍性」、「非腫瘍性」、「その他」の3つのカテゴリに分類し、鑑別結果として「腫瘍性」、「非腫瘍性」及び「その他」に対応する3つのスコア(3つのスコアの合計は100%)として出力してもよいし、3つのスコアから明確に分類できる場合には分類結果を出力してもよい。なお鑑別結果を出力する場合、中間層252あるいは出力層254が最後の1層または複数の層として全結合層を含んでいてもよいし(図5の(b)部分を参照)、含んでいなくてもよい。
 出力層254は注目領域の計測結果を出力するものでもよい。CNNによって計測を行う場合は、対象となる注目領域を例えば上述のようにセグメンテーションしてからその結果を基にプロセッサ210等で計測することができる。また、対象となる注目領域の計測値を検出器223から直接出力することもできる。計測値を直接出力させる場合、画像に対し計測値そのものを学習させるので、計測値の回帰問題となる。
 上述した構成のCNNを用いる場合、学習の過程において、出力層254が出力する結果と画像セットに対する認識の正解とを比較して損失(誤差)を計算し、損失が小さくなるように中間層252における重みパラメータを出力側の層から入力側の層に向けて更新していく処理(誤差逆伝播)を行うことが好ましい。
 <CNN以外の手法による認識>
 検出器223は、CNN以外の手法により検出を行ってもよい。例えば、取得した医療画像の画素の特徴量に基づいて注目領域を検出することができる。この場合、検出器223は検出対象画像を例えば複数の矩形領域に分割し、分割した各矩形領域を局所領域として設定し、検出対象画像の局所領域ごとに局所領域内の画素の特徴量(例えば色相)を算出し、各局所領域の中から特定の色相を有する局所領域を注目領域として決定する。同様に、検出器223は特徴量に基づく分類や計測を行ってもよい。
 <検出器の構成の変形例>
 検出器223を構成する各検出器(咽頭用検出器223A~十二指腸用検出器223D)は、異なる波長帯域の観察光に対応した複数の検出器(例えば、通常光用検出器と特殊光用検出器)から構成されていてもよい。この場合、通常光用検出器及び特殊光用検出器は、それぞれ通常光画像、特殊光画像を用いた機械学習により構成された学習済みモデルであることが好ましい。
 図5,6では主として検出器の構成について説明したが、本発明において、検出器に代えて、またはこれに加えて分類器や計測器を設けてもよい。また、検出器や分類器、あるいは計測器が通常光用と特殊光用に別れていてもよい。
 <各種のプロセッサによる機能の実現>
 上述したプロセッサ210の機能は、各種のプロセッサ(processor)及び記録媒体を用いて実現できる。各種のプロセッサには、例えばソフトウェア(プログラム)を実行して各種の機能を実現する汎用的なプロセッサであるCPU(Central Processing Unit)が含まれる。また、上述した各種のプロセッサには、画像処理に特化したプロセッサであるGPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)も含まれる。本発明のように画像の処理を行う場合は、GPUを用いた構成が効果的である。さらに、ASIC(Application Specific Integrated Circuit)等の、特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路なども、上述した「各種のプロセッサ」に含まれる。
 各部の機能は1つのプロセッサにより実現されてもよいし、同種または異種の複数のプロセッサ(例えば、複数のFPGA、あるいはCPUとFPGAの組み合わせ、またはCPUとGPUの組み合わせ)で実現されてもよい。また、複数の機能を1つのプロセッサで実現してもよい。複数の機能を1つのプロセッサで構成する例としては、第1に、コンピュータに代表されるように、1つ以上のCPUとソフトウェアの組合せで1つのプロセッサを構成し、このプロセッサが複数の機能として実現する形態がある。第2に、システムオンチップ(System On Chip:SoC)などに代表されるように、システム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の機能は、ハードウェア的な構造として、上述した各種のプロセッサを1つ以上用いて構成される。さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)である。これらの電気回路は、論理和、論理積、論理否定、排他的論理和、及びこれらを組み合わせた論理演算を用いて上述した機能を実現する電気回路であってもよい。
 上述したプロセッサあるいは電気回路がソフトウェア(プログラム)を実行する際は、実行するソフトウェアのコンピュータ(例えば、プロセッサ210を構成する各種のプロセッサや電気回路、及び/またはそれらの組み合わせ)で読み取り可能なコードをROM211(ROM:Read Only Memory)等の非一時的記録媒体に記憶しておき、コンピュータがそのソフトウェアを参照する。非一時的記録媒体に記憶しておくソフトウェアは、本発明に係る医療画像処理方法を実行するための医療画像処理プログラム及び実行に際して用いられるデータ(表示態様や報知態様の設定に用いられるデータ、検出器223で用いられる重みパラメータ等)を含む。ROM211ではなく各種の光磁気記録装置、半導体メモリ等の非一時的記録媒体にコードを記録してもよい。ソフトウェアを用いた処理の際には例えばRAM212(RAM:Random Access Memory、メモリ)が一時的記憶領域として用いられ、また例えば不図示のEEPROM(Electronically Erasable and Programmable Read Only Memory)に記憶されたデータを参照することもできる。「非一時的記録媒体」として記録部207を用いてもよい。
 <記録部に記録される情報>
 記録部207には、内視鏡画像(医療画像)、画像処理を施した処理後内視鏡画像(医療画像)、撮像情報(内視鏡画像の撮像位置及び/または撮像方向を示す情報)、検出結果、及び処理条件(検出や報知を行う際の条件)等が記録される。他の情報を併せて記録してもよい。記録制御部238は、これらの情報を関連付けて記録する。
 <医療画像処理>
 上述した構成の内視鏡システム10における医療画像処理(本発明に係る医療画像処理方法及び医療画像処理プログラムの実行)について説明する。図7は第1の実施形態に係る医療画像処理方法の手順を示すフローチャートである。以下、検出器223により注目領域を検出する場合について説明するが、分類や計測を行う場合も同様に処理を行うことができる。なお、以下説明する手順は、必要に応じ順序を入れ替えて実行してもよい。
 <初期設定>
 プロセッサ210は、操作部208を介したユーザの操作、及び/またはあらかじめ設定された処理条件(例えば、デフォルトの処理条件)に基づいて、医療画像処理方法/プログラムの実行に必要な条件を設定する(ステップS100:初期設定工程)。例えば、動作させる検出器の指定、検出器の切り替えあるいは選択の条件、検出結果の表示や報知の態様(表示または非表示の設定、表示する文字、図形、記号やその色彩、音声出力の条件等)を設定する。プロセッサ210は、検出器223を構成する複数の検出器を全て動作させてもよいし(この場合、検出結果の表示は一部の検出器について行ってもよい)、一部の検出器を動作させモニタ400(表示装置)に検出結果を表示させない検出器(検出処理)を停止させてもよい。ユーザは、例えば図8のような画面を介して処理条件の設定を行うことができる。図8の例では、ユーザは操作部208を介したラジオボタンのオン/オフ操作や数値入力欄への数値入力操作により、処理条件を設定することができる。なお、プロセッサ210は、処理開始時だけでなく以下のステップの実行中に処理条件の設定を行うこともできる。
 <内視鏡画像の取得>
 画像取得部220(プロセッサ、画像取得部)は、被検体の生体内で撮影された内視鏡画像(医療画像)を取得する(ステップS110:画像取得処理、画像取得工程)。画像取得部220は、内視鏡スコープ100の撮影部(撮影レンズ132、撮像素子134、AFE138等)により、被検体である生体の内部をあらかじめ決められたフレームレートで順次撮影して時系列の内視鏡画像(医療画像)をリアルタイムに取得することができる。また、画像取得部220は、既に撮影され記録された内視鏡画像を非リアルタイムで取得してもよい。例えば、記録部207に記録された内視鏡画像や処理後内視鏡画像を取得してもよいし、通信制御部205を介して外部の装置やシステムから画像を取得してもよい。表示制御部232(プロセッサ、表示制御部)は、取得した内視鏡画像をモニタ400(表示装置)に表示させる(ステップS120:表示制御処理、表示制御工程)。
 <注目領域の検出>
 検出器223(プロセッサ)は、検出器223を用いて内視鏡画像(医療画像)から注目領域を検出する(ステップS130:注目領域検出処理、注目領域検出工程)。検出器223は、検出器223を構成する検出器のうち複数の検出器を用いることにより、複数の検出処理を行うことができる。注目領域の検出において、検出器223は、上述した「特徴マップ」により画像に映っている注目領域の位置を画素レベルで把握(すなわち、内視鏡画像の画素ごとに注目領域に属するか否かを検出)し、その検出結果を出力することができる。なお、内視鏡システム10で検出する注目領域(関心領域)の例として、ポリープ、癌、大腸憩室、炎症、治療痕(EMR瘢痕(EMR:Endoscopic Mucosal Resection)、ESD瘢痕(ESD:Endoscopic Submucosal Dissection)、クリップ箇所等)、出血点、穿孔、血管異型性、あるいは各種の処置具を挙げることができる。超音波内視鏡等の超音波装置の場合、注目領域として臓器や脈管を検出してもよい。
 なお、プロセッサ210は、取得する内視鏡画像の全フレームについて注目領域の検出や報知を行ってもよいし、間欠的に(決められたフレーム間隔で)行ってもよい。
 また、切替制御部224(プロセッサ)は、検出結果をモニタ400(表示装置)に表示させる検出器を、観察対象の臓器や部位、あるいは撮像情報等に応じて切り替えることが好ましい(切替処理、切替工程)。切替制御部224は、切り替え先の検出器が動作を停止している状態である場合は、その検出器による検出処理を開始させる。また、切替制御部224は、モニタ400(表示装置)に検出結果を表示させない検出器の動作(検出処理)を停止させてもよい。このように検出器(認識器)を切り替えることにより、適切な診断支援機能(検出器による検出結果)をユーザに提供することができる。
 <注目領域を検出した場合の報知>
 検出器223が注目領域を検出した場合(ステップS140でYES)、第1の報知部234(プロセッサ)は、モニタ400(表示装置)に、検出された注目領域に関する情報と内視鏡画像(医療画像)とを重畳表示させる(ステップS150:第1の報知処理、第1の報知工程)。また、第2の報知部236(プロセッサ)は、重畳表示(第1の報知処理)より後に、スピーカー209A(音声出力装置)から音声を出力させる(ステップS160:第2の報知処理、第2の報知工程)。報知の詳細及び具体的態様は後述する。プロセッサ210は、内視鏡画像の取得終了やユーザの操作により「処理を終了する」と判断する(ステップS170でYES)までステップS110~S160の処理を繰り返す。
 <重畳表示の具体的態様>
 図9は重畳表示(第1の報知処理)の例を示す図である。同図では、モニタ400の画面500において、内視鏡画像502が表示されている。内視鏡画像502から注目領域504が検出された場合、第1の報知部234(プロセッサ)は、「注目領域に関する情報」として文字、図形、記号のうち少なくとも1つを内視鏡画像502に重畳表示させる。第1の報知部234は、例えば、図9の(a)部分に示すように、内視鏡画像502の領域外にアイコン506(旗状の図形あるいは記号)を重畳表示することができる。また、第1の報知部234は、図9の(b)部分に示すように注目領域504の位置(内視鏡画像502の領域内)で重畳表示(同部分ではバウンディングボックス508(図形))を行ってもよいし、同図の(c)部分に示すように注目領域504と離れた位置で重畳表示(同部分では矢印510(図形、記号))を行ってもよい。
 第1の報知部234は、注目領域504の位置に依存しない位置で重畳表示を行ってもよいし、注目領域504の位置に対応した位置で重畳表示を行ってもよい。例えば図9の(d)部分に示す例では、第1の報知部234は、注目領域504が内視鏡画像502の右下部分に写っていることに対応して、画面500の右下部分の領域512を着色している。第1の報知部234は、注目領域504の位置に対応した位置で重畳表示を行う場合、内視鏡画像における注目領域の位置等が変化したら、情報を重畳表示する位置をそれに合わせて移動させることが好ましい。なお、第1の報知部234は、重畳表示を行う際に色彩や明度の変更を組み合わせてもよい。
 <音声による報知の詳細>
 注目領域等、何らかの対象物が連続して検出されていたとしても、同一の対象物が継続して検出されていなければ偽陽性の可能性が高いため、音声出力をすべきではないと考えられる。そこで、第1の態様では、以下に説明するように注目領域の同一性を判定し、判定結果に基づいて音声出力を行う。
 図10は、ステップS160における音声による報知(第2の報知処理、第2の報知工程)の詳細を示すフローチャートである。ステップS150で第1の報知処理がなされると、特徴量算出部228(プロセッサ)は、注目領域の特徴量を算出及び保持する(ステップS200:特徴量算出処理/特徴量算出工程、特徴量保持処理/特徴量保持工程)。「特徴量」とは例えば種類、位置、大きさ、形状、色彩等である。特徴量算出部228は、内視鏡画像の解析や、検出器223の出力に基づいて特徴量を算出することができる。また、特徴量算出部228は、算出した特徴量をRAM212等の一時的記録媒体に保持してもよいし、記録部207等の非一時的記録媒体に保持(記録)してもよい。ここで「一時的な保持」には、例えば処理が終了したら順次消去する、電源をオフする際に消去する、等の態様が含まれる。
 同一性判定部230(プロセッサ)は、算出した特徴量を保持している特徴量と比較して、注目領域の同一性を判定する(ステップS210:同一性判定処理、同一性判定工程)。同一性の判定は、注目領域に対する連続検出回数に基づいて行うことができる。具体的には、同一性判定部230は、第1の時刻において撮像された内視鏡画像(医療画像)から検出された注目領域(第1の注目領域)の特徴量と、第2の時刻(第1の時刻より前の時刻)において撮像された内視鏡画像(第2の医療画像)から検出された注目領域(第2の注目領域)の特徴量(特徴量算出部228が保持している特徴量)とを比較することにより、第1の注目領域と第2の注目領域との同一性を判定する。第2の時刻は第1の時刻より決められた期間前とすることができ、ユーザは図8のような処理条件の設定画面を介して、この「決められた期間」の値を指定することができる。
 第2の報知部236は、同一性判定処理での判定結果に応じて、第1の注目領域に対する連続検出回数を算出する。具体的には、第2の報知部236は、第1の注目領域と第2の注目領域とが同一である場合(ステップS220でYES)は、第2の注目領域に対する連続検出回数を増加させた上で第1の注目領域の連続検出回数として算出する(ステップS230:検出回数算出処理、検出回数算出工程)。一方、第1の注目領域と第2の注目領域とが同一でない場合(ステップS220でNO)、第2の報知部236は、第1の注目領域を新たな注目領域として連続回数を算出する(ステップS240:検出回数算出処理、検出回数算出工程)。第2の報知部236は、上述した特徴量の場合と同様に、算出した連続検出回数をRAM212等の一時的記録媒体に保持してもよいし、記録部207等の非一時的記録媒体に保持(記録)してもよい。ここで「一時的な保持」には、例えば処理が終了したら順次消去する、電源をオフする際に消去する、等の態様が含まれる。
 なお、同一性判定部230は、検出器223によるトラッキングや注目領域の位置の重なり、あるいは内視鏡画像から算出したoptical flowに基づいて注目領域の同一性を判断してもよい。“optical flow”とは、画像間の対応点等を手がかりにして、画像に写っている部分や被写体全体の動きを推定してベクトル化したものである。
 また、同一性判定部230及び第2の報知部236(プロセッサ)は、同一性の判定及び連続検出回数の算出を内視鏡画像の全フレームに対して行ってもよいし、間欠的に行ってもよい。例えば、内視鏡画像のフレームレートが30fps(frames per second)の場合、同一性の判定は30fpsでもよいし、30fps未満(例えば、10fps)でもよい。同一性の判定は、検出器223のフレームレートに合わせることができる。
 第2の報知部236は、このようにして算出した連続検出回数がしきい値を超えたら(ステップS250でYES)、スピーカー209A(音声出力装置)から音声を出力させる(ステップS260:第2の報知処理、第2の報知工程)。
 <音声出力の具体例(その1):連続検出回数がしきい値を超えた場合>
 図11は音声出力の具体例(その1)を示す図である。同図の例では、時刻t1では注目領域が検出されておらず、時刻t1で注目領域504が検出されてバウンディングボックス508の重畳表示(第1の報知処理)が開始されている。また、時刻t2,t3,t4でも同一の注目領域504が検出されて重畳表示がなされている。このような状況で、連続検出回数のしきい値が3回であるとすると、時刻t4では連続検出回数が4回となってしきい値を超える(すなわち、時刻t1において注目領域504が検出されてから第1期間(=t2-t1)が経過した後にも同一の注目領域504が検出されている)ので、第2の報知部236がスピーカー209Aから音声を出力させる。なお図11では、スピーカーのアイコン520により、音声が出力されることを示している(アイコン自体は画面500に表示しなくてもよい;以下の例でも同じ)。このように、第2の報知部236(プロセッサ)は、音声出力を重畳表示よりも後に実行する。
 <音声出力の具体例(その2):連続検出回数がしきい値を超えない場合>
 図12は音声出力の具体例(その2)を示す図である。図12に示す例では、時刻t1~t3までは同一の注目領域504が検出されてバウンディングボックス508が重畳表示されているが(第1の報知処理)、時刻t4では注目領域504が検出されていない(すなわち、時刻t1において注目領域504が検出されてから第1期間が経過した後に同一の注目領域504が検出されていない)ので、連続検出回数(3回)がしきい値(3回)を超えておらず(ステップS250でNO)、第2の報知部236は音声出力を行わない。図12では、バツ印が付されたアイコン522により、音声が出力されないことを示している。
 上述のように、偽陽性(検出器223が注目領域でないものを注目領域と判断すること)は瞬時的に発生することが多く、継続的に発生することは少ない傾向にある。そのため、図12の例のように瞬時的(時刻t1~t3)に注目領域が検出された場合には音声出力をしないようにすれば、偽陽性に起因する音声出力によりユーザが煩わしさを感じる可能性を低減することができる。その一方で、画面表示(第1の報知処理)では注目領域を強調しているため、ユーザに対する注意喚起につながり、病変などの見逃し防止の効果が期待できる。
 <音声出力の具体例(その3):注目領域の同一性を判断する場合>
 図13は注目領域の同一性を判断する場合の音声出力の具体例(その3)を示す図である。図13の例では、時刻t1~t4において注目領域(注目領域504,507)が検出されており、バウンディングボックス508,509が重畳表示されているが(第1の報知処理)、注目領域504の検出回数は3回(時刻t1~t3)であり注目領域507の検出回数は2回(時刻t3,t4)なので、第2の報知部236は時刻t4では音声出力を行わない。これにより、瞬時的な偽陽性に起因する不要な音声出力を抑制することができる。
 <音声出力の具体例(その4):同一性の判断期間に関する例>
 検出器223等のAIを用いた注目領域の検出では、偽陽性同様に偽陰性(内視鏡画像に注目領域が存在するにも関わらず、AIが「注目領域は存在しない」と判断すること)も避け難い問題となる。例えば、図14に示す例のように、「時刻t1,t2,t4において内視鏡画像から注目領域(注目領域504A,504B)が検出されても、時刻t3では検出器223の判断ミスにより注目領域(注目領域504A)が検出されない」という状況が発生しうる。この場合、「連続検出回数が適切に算出できず、音声を出力すべきなのに出力されない」という問題が生じうる。そこで、検出回数算出部226、同一性判定部230、及び第2の報知部236(プロセッサ)は、注目領域の同一性の判断対象を、直前のフレームのみでなくより前のフレームでの注目領域まで含める。
 図14の例では、同一性判定部230が時刻t4で検出された注目領域504Bと時刻t2で検出された注目領域504Aとで検出結果(注目領域の有無、特徴量)を比較して「同一」と判定できた場合を想定しており、この場合、検出回数算出部226は注目領域504Aの連続検出回数を増加させる。すると時刻t4での連続検出回数は4回となり、しきい値(3回)を超えるので、第2の報知部236は時刻t4でスピーカー209Aから音声を出力させる(図14では、時刻t4におけるアイコン520で示す)。このような同一性の判定により、偽陰性により連続検出回数が適切に算出できない問題を回避することができる。なお、比較対象となる過去のフレームは、あまりにも遡って算出しても計算コストの増大や同一性判定の精度低下が問題になり得るため、現フレーム(図14の例では時刻t4(第1の時刻))の近傍時間(決められた期間前まで;時刻t2(第2の時刻))に限定することが好ましい。
 なお、図14の例において、検出回数算出部226及び同一性判定部230は、連続検出回数を「4回」と数えるのではなく、「連続検出回数は3回のまま維持するが、同一の注目領域が継続して検出されているとの判断は継続する」として制御してもよい。このように連続検出回数を増加させずに維持する場合、時刻t4の次のフレームで同一の注目領域504Aが検出されたら連続検出回数が4回となって音声出力による報知が行われる。
 <音声出力の具体例(その5):音声出力を制限する例>
 内視鏡システム10では、音声出力による報知(第2の報知処理)において、連続検出回数が決められた回数を超えてからは音声出力が発生しないように制御してもよい。例えば、図15の例では時刻t4で連続検出回数が4回となって音声が出力されるが、連続検出回数が5回となる時刻t5以降の決められた期間(時刻t7までの3フレーム)は、第2の報知部236(プロセッサ)は音声を出力させない。これにより音声出力が頻繁に発生してユーザが煩わしさを感じる問題を回避することができる。なお、図15の例では決められた期間が経過した時刻t8において音声の非出力は解除されるが、解除した後も同一の対象(注目領域)が検出されている場合は再度音声出力をしないように制御してもよい(この場合、時刻t8以降も音声出力をしない)。そうすることで、同一の対象を観察している間に何度も音声出力が頻繁に発生してユーザが煩わしさを感じる問題を回避することができる。
 <音声出力の具体例(その6):重畳表示の態様を音声出力状態に連動させる例>
 内視鏡システム10では、第2の報知処理における音声出力状態に応じて画面表示(重畳表示:第1の報知処理)の態様を変更してもよい。例えば、図16の例では、連続検出回数が4回となってしきい値を超える時刻t4以降に音声が出力されるが、第1の報知部234(プロセッサ)は、注目領域504に重畳表示するバウンディングボックス511の枠線を、時刻t1~t3までのバウンディングボックス508よりも太くしている。音声出力状態に応じた画面表示の態様の変更としては、このように重畳表示する図形等の色や大きさ、あるいは形状を変更してもよいし、図9の例のような他の図形等の重畳表示を組み合わせてもよい。このような画面表示の態様変更により、内視鏡システム10がより確信を持って検出対象を報知していることをユーザに直感的に伝えることができる。なお、第1の報知部234は、画面表示の態様変更を音声出力状態の変化(音声出力開始/停止等)と同時(図9の例では時刻t4)に行ってもよいし、前後の近傍時間に行ってもよい。
 以上説明したように、第1の実施形態によれば、注目領域の見逃しの可能性を低減しつつ不要な音声出力を抑制することができる。
 <他の医療画像への適用>
 上述した第1の実施形態では医療画像(医用画像)の一態様である内視鏡画像(光学的内視鏡の画像)を用いて認識を行う場合について説明したが、本発明に係る医療画像処理装置、医療画像処理方法、及び医療画像処理プログラムは、超音波内視鏡装置(超音波内視鏡システム)、超音波画像診断装置等の、内視鏡画像以外の医療画像を用いる場合にも適用することができる。
 (付記)
 上述した実施形態及び変形例に加えて、以下に記載の構成も本発明の範囲に含まれる。
 (付記1)
 医療画像解析処理部は、医療画像の画素の特徴量に基づいて、注目すべき領域である注目領域を検出し、
 医療画像解析結果取得部は、医療画像解析処理部の解析結果を取得する医療画像処理装置。
 (付記2)
 医療画像解析処理部は、医療画像の画素の特徴量に基づいて、注目すべき対象の有無を検出し、
 医療画像解析結果取得部は、医療画像解析処理部の解析結果を取得する医療画像処理装置。
 (付記3)
 医療画像解析結果取得部は、
 医療画像の解析結果を記録する記録装置から取得し、
 解析結果は、医療画像に含まれる注目すべき領域である注目領域と、注目すべき対象の有無のいずれか、もしくは両方である医療画像処理装置。
 (付記4)
 医療画像は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得た通常光画像である医療画像処理装置。
 (付記5)
 医療画像は、特定の波長帯域の光を照射して得た画像であり、
 特定の波長帯域は、白色の波長帯域よりも狭い帯域である医療画像処理装置。
 (付記6)
 特定の波長帯域は、可視域の青色もしくは、緑色帯域である医療画像処理装置。
 (付記7)
 特定の波長帯域は、390nm以上450nm以下または530nm以上550nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、390nm以上450nm以下または530nm以上550nm以下の波長帯域内にピーク波長を有する医療画像処理装置。
 (付記8)
 特定の波長帯域は、可視域の赤色帯域である医療画像処理装置。
 (付記9)
 特定の波長帯域は、585nm以上615nm以下または610nm以上730nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、585nm以上615nm以下または610nm以上730nm以下の波長帯域内にピーク波長を有する医療画像処理装置。
 (付記10)
 特定の波長帯域は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域を含み、かつ、特定の波長帯域の光は、酸化ヘモグロビンと還元ヘモグロビンとで吸光係数が異なる波長帯域にピーク波長を有する医療画像処理装置。
 (付記11)
 特定の波長帯域は、400±10nm、440±10nm、470±10nm、または、600nm以上750nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、400±10nm、440±10nm、470±10nm、または、600nm以上750nm以下の波長帯域にピーク波長を有する医療画像処理装置。
 (付記12)
 医療画像は生体内を写した生体内画像であり、
 生体内画像は、生体内の蛍光物質が発する蛍光の情報を有する医療画像処理装置。
 (付記13)
 蛍光は、ピークが390以上470nm以下である励起光を生体内に照射して得る医療画像処理装置。
 (付記14)
 医療画像は生体内を写した生体内画像であり、
 特定の波長帯域は、赤外光の波長帯域である医療画像処理装置。
 (付記15)
 特定の波長帯域は、790nm以上820nm以下または905nm以上970nm以下の波長帯域を含み、かつ、特定の波長帯域の光は、790nm以上820nm以下または905nm以上970nm以下の波長帯域にピーク波長を有する医療画像処理装置。
 (付記16)
 医療画像取得部は、白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像に基づいて、特定の波長帯域の情報を有する特殊光画像を取得する特殊光画像取得部を備え、
 医療画像は特殊光画像である医療画像処理装置。
 (付記17)
 特定の波長帯域の信号は、通常光画像に含まれるRGBあるいはCMYの色情報に基づく演算により得る医療画像処理装置。
 (付記18)
 白色帯域の光、または白色帯域の光として複数の波長帯域の光を照射して得る通常光画像と、特定の波長帯域の光を照射して得る特殊光画像との少なくとも一方に基づく演算によって、特徴量画像を生成する特徴量画像生成部を備え、
 医療画像は特徴量画像である医療画像処理装置。
 (付記19)
 付記1から18のいずれか1つに記載の医療画像処理装置と、
 白色の波長帯域の光、または、特定の波長帯域の光の少なくともいずれかを照射して画像を取得する内視鏡と、
 を備える内視鏡装置。
 (付記20)
 付記1から18のいずれか1つに記載の医療画像処理装置を備える診断支援装置。
 (付記21)
 付記1から18のいずれか1つに記載の医療画像処理装置を備える医療業務支援装置。
 以上で本発明の実施形態及び他の例に関して説明してきたが、本発明は上述した態様に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能である。
10   内視鏡システム
100  内視鏡スコープ
102  手元操作部
104  挿入部
106  ユニバーサルケーブル
108  ライトガイドコネクタ
112  軟性部
114  湾曲部
116  先端硬質部
116A 先端側端面
123  照明部
123A 照明用レンズ
123B 照明用レンズ
126  鉗子口
130  撮影光学系
132  撮影レンズ
134  撮像素子
136  駆動回路
141  送気送水ボタン
142  吸引ボタン
143  機能ボタン
144  撮影ボタン
170  ライトガイド
200  医療画像処理部
202  画像入力コントローラ
205  通信制御部
206  ビデオ出力部
207  記録部
208  操作部
209  音声処理部
209A スピーカー
210  プロセッサ
211  ROM
212  RAM
220  画像取得部
222  注目領域検出部
223  検出器
223A 咽頭用検出器
223B 食道用検出器
223C 胃用検出器
223D 十二指腸用検出器
224  切替制御部
226  検出回数算出部
228  特徴量算出部
230  同一性判定部
232  表示制御部
234  第1の報知部
236  第2の報知部
238  記録制御部
240  通信制御部
250  入力層
252  中間層
254  出力層
256  畳み込み層
258  プーリング層
260  全結合層
300  光源装置
310  光源
310B 青色光源
310G 緑色光源
310R 赤色光源
310V 紫色光源
330  絞り
340  集光レンズ
350  光源制御部
400  モニタ
500  画面
502  内視鏡画像
504  注目領域
504A 注目領域
504B 注目領域
506  アイコン
507  注目領域
508  バウンディングボックス
509  バウンディングボックス
510  矢印
511  バウンディングボックス
512  領域
520  アイコン
522  アイコン
F1   フィルタ
F2   フィルタ
S100~S260 医療画像処理方法の各ステップ

Claims (14)

  1.  プロセッサを備える医療画像処理装置であって、
     前記プロセッサは、
     時系列の医療画像を取得する画像取得処理と、
     前記取得した医療画像から注目領域を検出する注目領域検出処理と、
     前記医療画像を表示装置に表示させる表示制御処理と、
     前記注目領域検出処理で注目領域が検出された場合に、前記表示装置に前記医療画像と前記検出された注目領域に関する情報を重畳表示させる第1の報知処理と、
     前記注目領域検出処理で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知処理と、
     を実行し、
     前記第2の報知処理を前記第1の報知処理よりも後に実行する医療画像処理装置。
  2.  前記プロセッサは、前記注目領域検出処理において注目領域が検出されてから第1期間が経過した後にも前記注目領域を検出した場合は前記第2の報知処理を実行し、前記第1期間が経過した後に前記注目領域を検出しなかった場合は前記第2の報知処理を実行しない請求項1に記載の医療画像処理装置。
  3.  前記プロセッサは、前記第1の報知処理において、前記医療画像における前記注目領域の位置に対応して前記情報を重畳表示する請求項1または2に記載の医療画像処理装置。
  4.  前記プロセッサは、
     前記注目領域検出処理で検出された前記注目領域に対して連続検出回数を算出する検出回数算出処理を実行し、
     前記連続検出回数があらかじめ決められた回数を超えた場合に前記第2の報知処理を実行する請求項1から3のいずれか1項に記載の医療画像処理装置。
  5.  前記プロセッサは、
     前記検出された注目領域の特徴量を保持する特徴量保持処理と、
     第1の時刻において撮像された医療画像から検出された第1の注目領域の特徴量と、前記保持されている前記第1の時刻より前の時刻である第2の時刻において撮像された第2の医療画像から検出された第2の注目領域の特徴量と、を比較することにより前記第1の注目領域と前記第2の注目領域との同一性を判定する同一性判定処理と、
     をさらに実行し、
     前記検出回数算出処理では、前記同一性判定処理での判定結果に応じて前記第1の注目領域に対する前記連続検出回数を算出する請求項4に記載の医療画像処理装置。
  6.  前記プロセッサは、
     前記同一性判定処理において前記第1の注目領域と前記第2の注目領域が同一であると判断された場合、前記検出回数算出処理において、前記第2の注目領域に対して記録されていた連続検出回数を増加させた上で前記第1の注目領域の連続検出回数として算出する請求項5に記載の医療画像処理装置。
  7.  前記プロセッサは、
     前記同一性判定処理において、前記特徴量保持処理で保持された前記特徴量のうちで前記第1の時刻より決められた期間前までの時刻についての特徴量を前記第1の注目領域の特徴量と比較することにより前記同一性の判定を行う請求項5または6に記載の医療画像処理装置。
  8.  前記プロセッサは、
     前記第2の報知処理において、前記音声出力装置に音声を出力させた後、決められた期間は音声を出力させない請求項1から7のいずれか1項に記載の医療画像処理装置。
  9.  前記プロセッサは、
     前記第1の報知処理において、前記第2の報知処理における音声出力状態に応じて前記第1の報知処理の態様を変更する請求項1から8のいずれか1項に記載の医療画像処理装置。
  10.  前記プロセッサは、前記第1の報知処理において、文字、図形、記号のうち少なくとも1つを前記情報として前記重畳表示を行う請求項1から9のいずれか1項に記載の医療画像処理装置。
  11.  請求項1から10のいずれか1項に記載の医療画像処理装置と、
     被検体に挿入される内視鏡スコープであって、前記医療画像を撮像する撮像部を有する内視鏡スコープと、
     前記表示装置と、
     前記音声出力装置と、
     を備える内視鏡システム。
  12.  プロセッサを備える医療画像処理装置により実行される医療画像処理方法であって、
     前記プロセッサは、
     時系列の医療画像を取得する画像取得工程と、
     前記取得した医療画像から注目領域を検出する注目領域検出工程と、
     前記医療画像を表示装置に表示させる表示制御工程と、
     前記注目領域検出工程で注目領域が検出された場合に、前記表示装置に、前記医療画像と前記検出された注目領域に関する情報を重畳表示させる第1の報知工程と、
     前記注目領域検出工程で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知工程と、
     を実行し、
     前記第2の報知工程を前記第1の報知工程よりも後に行う医療画像処理方法。
  13.  プロセッサを備える医療画像処理装置に医療画像処理方法を実行させる医療画像処理プログラムであって、
     前記医療画像処理方法は、
     時系列の医療画像を取得する画像取得工程と、
     前記取得した医療画像から注目領域を検出する注目領域検出工程と、
     前記医療画像を表示装置に表示させる表示制御工程と、
     前記注目領域検出工程で注目領域が検出された場合に、前記表示装置に、前記医療画像と前記検出された注目領域に関する情報を重畳表示させる第1の報知工程と、
     前記注目領域検出工程で注目領域が検出された場合に音声出力装置から音声を出力する第2の報知工程と、
     を含み、
     前記第2の報知工程は前記第1の報知工程よりも後に行われる医療画像処理プログラム。
  14.  非一時的かつコンピュータ読取可能な記録媒体であって、請求項13に記載のプログラムが記録された記録媒体。
PCT/JP2022/008166 2021-03-01 2022-02-28 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム WO2022186109A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2023503802A JPWO2022186109A1 (ja) 2021-03-01 2022-02-28
EP22763165.2A EP4302680A1 (en) 2021-03-01 2022-02-28 Medical image processing device, endoscope system, medical image processing method, and medical image processing program
CN202280016305.4A CN116887745A (zh) 2021-03-01 2022-02-28 医疗图像处理装置、内窥镜系统、医疗图像处理方法及医疗图像处理程序
US18/458,121 US20230410303A1 (en) 2021-03-01 2023-08-29 Medical image processing apparatus, endoscope system, medical image processing method, and medical image processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-031698 2021-03-01
JP2021031698 2021-03-01

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/458,121 Continuation US20230410303A1 (en) 2021-03-01 2023-08-29 Medical image processing apparatus, endoscope system, medical image processing method, and medical image processing program

Publications (1)

Publication Number Publication Date
WO2022186109A1 true WO2022186109A1 (ja) 2022-09-09

Family

ID=83153752

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/008166 WO2022186109A1 (ja) 2021-03-01 2022-02-28 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム

Country Status (5)

Country Link
US (1) US20230410303A1 (ja)
EP (1) EP4302680A1 (ja)
JP (1) JPWO2022186109A1 (ja)
CN (1) CN116887745A (ja)
WO (1) WO2022186109A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017081976A1 (ja) 2015-11-10 2017-05-18 オリンパス株式会社 内視鏡装置
WO2020036109A1 (ja) * 2018-08-17 2020-02-20 富士フイルム株式会社 医用画像処理装置及び内視鏡システム並びに医用画像処理装置の作動方法
WO2020040086A1 (ja) * 2018-08-20 2020-02-27 富士フイルム株式会社 医療画像処理システム
WO2020067105A1 (ja) * 2018-09-28 2020-04-02 富士フイルム株式会社 医用画像処理装置、医用画像処理方法、及びプログラム、診断支援装置並びに内視鏡システム
JP2020069300A (ja) 2018-11-02 2020-05-07 富士フイルム株式会社 医療診断支援装置、内視鏡システム、及び医療診断支援方法
WO2021029292A1 (ja) * 2019-08-13 2021-02-18 富士フイルム株式会社 画像診断支援装置、内視鏡システム、画像診断支援方法、及び画像診断支援プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017081976A1 (ja) 2015-11-10 2017-05-18 オリンパス株式会社 内視鏡装置
WO2020036109A1 (ja) * 2018-08-17 2020-02-20 富士フイルム株式会社 医用画像処理装置及び内視鏡システム並びに医用画像処理装置の作動方法
WO2020040086A1 (ja) * 2018-08-20 2020-02-27 富士フイルム株式会社 医療画像処理システム
WO2020067105A1 (ja) * 2018-09-28 2020-04-02 富士フイルム株式会社 医用画像処理装置、医用画像処理方法、及びプログラム、診断支援装置並びに内視鏡システム
JP2020069300A (ja) 2018-11-02 2020-05-07 富士フイルム株式会社 医療診断支援装置、内視鏡システム、及び医療診断支援方法
WO2021029292A1 (ja) * 2019-08-13 2021-02-18 富士フイルム株式会社 画像診断支援装置、内視鏡システム、画像診断支援方法、及び画像診断支援プログラム

Also Published As

Publication number Publication date
CN116887745A (zh) 2023-10-13
US20230410303A1 (en) 2023-12-21
JPWO2022186109A1 (ja) 2022-09-09
EP4302680A1 (en) 2024-01-10

Similar Documents

Publication Publication Date Title
US20210343011A1 (en) Medical image processing apparatus, endoscope system, and medical image processing method
US20210235980A1 (en) Medical-use image processing device, endoscope system, and medical-use image processing method
JP7038641B2 (ja) 医療診断支援装置、内視鏡システム、及び作動方法
JP7048732B2 (ja) 画像処理装置、内視鏡システム、及び画像処理方法
JP7278202B2 (ja) 画像学習装置、画像学習方法、ニューラルネットワーク、及び画像分類装置
US11948080B2 (en) Image processing method and image processing apparatus
JP7333805B2 (ja) 画像処理装置、内視鏡システム、及び画像処理装置の作動方法
US20220151462A1 (en) Image diagnosis assistance apparatus, endoscope system, image diagnosis assistance method , and image diagnosis assistance program
JP2023026480A (ja) 医療画像処理装置、内視鏡システム、及び医療画像処理装置の作動方法
EP4094673A1 (en) Medical image processing device, method for operating medical image processing device, and endoscope system
US20220285010A1 (en) Medical image processing apparatus, medical image processing method, and program
JP7125499B2 (ja) 画像処理装置及び画像処理方法
US20220383533A1 (en) Medical image processing apparatus, endoscope system, medical image processing method, and program
WO2022186109A1 (ja) 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム
JP2023014288A (ja) 医用画像処理装置、プロセッサ装置、内視鏡システム、医用画像処理装置の作動方法及びプログラム
WO2022181748A1 (ja) 医療画像処理装置、内視鏡システム、医療画像処理方法、及び医療画像処理プログラム
WO2021029293A1 (ja) 医用画像処理装置、内視鏡システム、及び医用画像処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22763165

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 202280016305.4

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2023503802

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2022763165

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022763165

Country of ref document: EP

Effective date: 20231002