JP7309035B2 - 教師データ作成システム、教師データ作成方法及び教師データ作成プログラム - Google Patents

教師データ作成システム、教師データ作成方法及び教師データ作成プログラム Download PDF

Info

Publication number
JP7309035B2
JP7309035B2 JP2022506986A JP2022506986A JP7309035B2 JP 7309035 B2 JP7309035 B2 JP 7309035B2 JP 2022506986 A JP2022506986 A JP 2022506986A JP 2022506986 A JP2022506986 A JP 2022506986A JP 7309035 B2 JP7309035 B2 JP 7309035B2
Authority
JP
Japan
Prior art keywords
image
information
unit
teacher
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022506986A
Other languages
English (en)
Other versions
JPWO2021181439A1 (ja
JPWO2021181439A5 (ja
Inventor
健人 速水
誠 北村
大和 神田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Publication of JPWO2021181439A1 publication Critical patent/JPWO2021181439A1/ja
Publication of JPWO2021181439A5 publication Critical patent/JPWO2021181439A5/ja
Application granted granted Critical
Publication of JP7309035B2 publication Critical patent/JP7309035B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/045Control thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Surgery (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Quality & Reliability (AREA)
  • Optics & Photonics (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Description

本発明は、教師データ作成システム、教師データ作成方法及び教師データ作成プログラム等に関する。
画像認識技術として、ディープラーニング等の機械学習が広く利用されている。機械学習では、学習に適した教師画像を大量に入力する必要があるが、その大量の教師画像を用意する手法の1つにデータオーギュメンテーションがある。データオーギュメンテーションは、実際に撮影されたオリジナル画像を加工して新たな画像を生成することで、教師画像の枚数を増やす手法である。しかし、機械学習の認識精度を高める点からは、オリジナル画像を大量に用意し、そのオリジナル画像に教師ラベルを付与することが望ましい。特許文献1には、超音波診断装置の機械学習用の画像を生成する医療用画像生成装置が開示されている。特許文献1では、医療用画像生成装置は、ユーザが画像保存操作やフリーズ操作を行ったときに表示されていた医用画像を注目画像として設定し、時系列画像から当該注目画像と類似した複数画像を機械的に抽出する。ユーザは、注目画像にラベル情報を付与する。医療用画像生成装置は、注目画像に付されたラベル情報に基づいて、注目画像と類似した複数画像に対してラベル情報を付与する。
特開2019-118694号公報
上記特許文献1では、ユーザが画像保存操作やフリーズ操作を行ったときの画像が注目画像となるため、時系列画像に対して類似性が低い、又は時系列画像の中で類似性が高い画像数が少ない画像が、注目画像となる可能性がある。この場合、注目画像に付与されたラベル情報を用いて、医療用画像生成装置が時系列画像にラベル情報を付与できない、又は医療用画像生成装置がラベル情報を付与できる画像数が少ないという課題がある。例えば、内視鏡等においてカメラのアングルを一時的に大きく変えたときに撮影された画像が注目画像となった場合、そのアングル以外で撮影された画像に対しては類似性に基づくラベル情報の付与ができない可能性がある。
本開示の一態様は、複数の医療画像を取得する画像取得部と、前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成する画像対応付け部と、前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力する画像出力部と、前記代表教師情報の入力を受け付ける入力受付部と、前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して教師情報を付与する教師情報付与部と、を含む教師データ作成システムに関係する。
本開示の他の態様は、複数の医療画像を取得することと、前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成することと、前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力することと、前記代表教師情報の入力を受け付けることと、前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して教師情報を付与することと、を含む教師データ作成方法に関係する。
本開示の更に他の態様は、複数の医療画像を取得することと、前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成することと、前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力することと、前記代表教師情報の入力を受け付けることと、前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して教師情報を付与することと、をコンピュータに実行させる教師データ作成プログラムに関係する。
教師データ作成システムの第1構成例。 第1構成例における処理のフローチャート。 画像対応付け部の動作を説明する図。 対応付け画像群の決定手法を説明する図。 画像出力部、入力受付部及び教師情報付与部の動作を説明する図。 第1構成例の第1変形例における処理のフローチャート。 第1構成例の第2変形例において表示部に表示される画像の例。 第1構成例の第3変形例における教師データ作成システムの構成例。 第1構成例の第3変形例における処理のフローチャート。 第1構成例の第4変形例における教師データ作成システムの構成例。 入力調整部の第1動作例を説明する図。 入力調整部の第2動作例を説明する図。 第2構成例における処理のフローチャート。 画像対応付け部の動作を説明する図。 画像出力部、入力受付部及び教師情報付与部の動作を説明する図。 第2構成例の第2変形例を説明する図。 第2構成例の第3変形例における処理のフローチャート。 第2構成例の第3変形例を説明する図。
以下、本実施形態について説明する。なお、以下に説明する本実施形態は、請求の範囲に記載された内容を不当に限定するものではない。また本実施形態で説明される構成の全てが、本開示の必須構成要件であるとは限らない。
1.第1構成例
図1は、教師データ作成システム10の第1構成例である。教師データ作成システム10は、処理部100と記憶部200と表示部300と操作部400とを含む。なお図1には内視鏡600及び学習装置500も図示するが、教師データ作成システム10が教師データを作成する際に、内視鏡600と学習装置500が教師データ作成システム10に接続されている必要はない。
処理部100は、画像取得部110と画像対応付け部120と画像出力部130入力受付部140と教師情報付与部150とを含む。画像取得部110は、複数の医療画像を取得する。画像対応付け部120は、複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付け画像群を作成する。対応付け画像群は、上記対応付けにおいて対応付けできた医療画像同士で構成した群である。画像出力部130は、対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部300に出力する。入力受付部140は、操作部400から代表教師情報の入力を受け付ける。教師情報付与部150は、付与対象画像に対して入力された代表教師情報に基づいて、対応付け画像群に含まれる医療画像に対して教師情報を付与する。
このようにすれば、ユーザに教師情報を付与してもらうために表示部300に表示される付与対象画像は、撮影対象の類似性に基づく対応付けがされた対応付け画像群に基づいて表示される。即ち、ユーザに提示する前に類似性が判断されているため、付与対象画像は対応付け画像群の各医療画像に対して類似性を有する画像となっている。これにより、類似性が高い画像に多く対応付けられた医療画像に対して代表教師情報が付されるので、教師情報付与部150が1つの代表教師情報から、より多くの医療画像に教師情報を自動的に付与できる。結果として、ユーザが代表教師情報を入力すべき付与対象画像の枚数を削減でき、ユーザは少ない作業工数で教師画像を作成できる。
以下、図1の教師データ作成システム10の詳細を説明する。
教師データ作成システム10は、例えばPC(Personal Computer)等の情報処理装置である。或いは、教師データ作成システム10は、端末装置と情報処理装置とがネットワークで接続されたシステムであってもよい。例えば、端末装置が表示部300と操作部400と記憶部200とを含み、情報処理装置が処理部100を含む。或いは、教師データ作成システム10は、複数の情報処理装置がネットワークで接続されたクラウドシステムであってもよい。
記憶部200は、内視鏡600により撮像された複数の医療画像を記憶する。医療画像は、医療用内視鏡により撮影された体内画像である。医療用内視鏡は、消化管用内視鏡等のビデオスコープ、或いは外科手術用の硬性鏡等である。複数の医療画像は、時系列画像である。例えば、内視鏡600は体内の動画を撮影し、その動画の各フレームの画像が個々の医療画像に相当する。記憶部200は、半導体メモリ又はハードディスクドライブ等の記憶装置である。半導体メモリは、例えば、RAM等の揮発性メモリ、或いはEEPROM等の不揮発性メモリである。
処理部100はプロセッサである。プロセッサは、CPU、マイクロコンピュータ、DSP、ASIC(Application Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)等の集積回路装置であってもよい。処理部100は、1又は複数のプロセッサを含んでもよい。また、プロセッサである処理部100は、例えば1又は複数の回路部品により構成された処理回路又は処理装置であってもよいし、或いは、1又は複数の回路部品が基板に実装された回路装置であってもよい。
処理部100の動作はソフトウェア処理により実現されてもよい。即ち、処理部100に含まれる画像取得部110、画像対応付け部120、画像出力部130、入力受付部140及び教師情報付与部150の全部又は一部の動作を記述したプログラムが、記憶部200に記憶される。その記憶部200に記憶されたプログラムをプロセッサが実行することで、処理部100の動作が実現される。なお、プログラムは、図8で後述する検出部160を更に記述したものであってよい。上記プログラムは、コンピュータにより読み取り可能な媒体である情報記憶媒体に格納されてもよい。情報記憶媒体は、例えば光ディスク、メモリカード、HDD、或いは半導体メモリなどにより実現できる。コンピュータは、入力装置、処理部、記憶部、及び出力部を備える装置である。
図2は、第1構成例における処理のフローチャートである。ステップS1において、画像取得部110は複数の医療画像を取得する。具体的には、画像取得部110は、記憶部200からデータを読み出すアクセス制御部であり、記憶部200から複数の医療画像を取得し、その複数の医療画像を画像対応付け部120に出力する。
ステップS2において、画像対応付け部120は、複数の医療画像の特徴点を抽出し、各特徴点について画像間におけるマッチングを行う。ステップS3において、画像対応付け部120は、マッチングされた特徴点数が多い医療画像を選択し、画像出力部130は、その選択された医療画像を付与対象画像として表示部300に出力する。表示部300は、付与対象画像を表示する。表示部300は、例えば液晶表示装置又はEL(Electro Luminescence)表示装置等のディスプレイである。
ステップS4において、入力受付部140は、表示された付与対象画像に対する教師情報入力を受け付ける。即ち、ユーザは、表示部300に表示された付与対象画像に対して、操作部400を用いて教師情報を付与し、その付与された教師情報が入力受付部140に入力される。入力受付部140は、例えば操作部400と処理部100の間の通信インターフェースである。操作部400は、ユーザが教師データ作成システム10に対して操作入力又は情報入力を行うための装置であり、例えばポインティングデバイス、キーボード、又はタッチパネル等である。
ステップS5において、教師情報付与部150は、付与対象画像に付与された教師情報に基づいて、画像対応付け部120により対応付けられた各医療画像に対して教師情報を付与し、その教師情報を記憶部200に記憶させる。教師情報が付与された医療画像を教師画像と呼ぶこととする。
記憶部200に記憶された教師画像は、学習装置500に入力される。学習装置500は記憶部520とプロセッサ510とを含む。記憶部200から入力された教師画像は教師データ521として記憶部520に記憶される。記憶部520には、機械学習の学習モデル522が記憶されている。プロセッサ510は、教師データ521を用いて学習モデル522に対する機械学習を行う。機械学習された学習モデル522は、学習済みモデルとして内視鏡に転送され、内視鏡における画像認識に用いられる。
図3は、画像対応付け部120の動作を説明する図である。図3において、IA1~IAmは、画像取得部110によって取得された複数の医療画像である。mは3以上の整数である。ここではm=5、即ちIAm=IA5とする。
図3では、IA1に特徴点が検出されず、IA2~IA5から共通の特徴点FPaが検出され、IA2~IA4から共通の特徴点FPbが検出され、IA4、IA5から共通の特徴点FPcが検出されている。特徴点とは、画像の特徴を示す点であり、画像から検出された特徴量によって特徴付けられた点である。特徴量として種々想定できるが、例えば画像のエッジ、勾配、又はそれらの統計量等である。画像対応付け部120は、例えばSIFT(Scale Invariant Feature Transform)、SURF(Speeded-Up Robust Features)、HOG(Histograms of Oriented Gradients)等の手法を用いて特徴点を抽出する。
画像対応付け部120は、特徴点FPa~FPcに基づいて、撮影対象の類似性が高い画像群を対応付け画像群GIMとする。「撮影対象の類似性」とは、医療画像に写る対象が類似している度合いであり、類似性が高いほど対象が同一である可能性が高い。特徴点を用いた場合には、共通する特徴点の数が多いほど撮影対象の類似性が高いと判断できる。画像対応付け部120は、例えば共通する特徴点の数がしきい値以上である医療画像を対応付けする。図3の例では、画像対応付け部120は、2以上の特徴点が共通する医療画像を対応付けしており、IA4がIA2、IA3及びIAmの各々に対して2以上の特徴点が共通することから、IA2~IA4、IAmを対応付け画像群GIMとしている。
図4は、対応付け画像群の決定手法を説明する図である。ここでは、複数の医療画像としてIX1~IX5が取得されたとする。画像対応付け部120は、IX1~IX5の各医療画像について、他の医療画像との類似性を判断する。〇は類似性が高いと判断されたことを示し、×は類似性が低いと判断されたことを示す。IX1、IX2、IX3、IX4、IX5は、それぞれ2つ、3つ、3つ、2つ、2つの医療画像に対して類似性が高いと判断されている。
画像対応付け部120は、類似性が高い医療画像を多くもつ医療画像を付与対象画像として選択し、その付与対象画像に対して類似性が高い医療画像を対応付け画像群とする。図4の例では、IX2が付与対象画像として選択され、IX1~IX3、IX5が対応付け画像群に設定される。或いは、IX3が付与対象画像として選択され、IX1~IX4が対応付け画像群に設定される。画像対応付け部120は、例えばIX2、IX3のうち番号が小さい、即ち時系列において前の画像を、付与対象画像として選択してもよい。或いは、画像対応付け部120は、IX4が他の対応付け画像群に含まれる場合に、IX1~IX3、IX5を対応付け画像群とする等、他の対応付け画像群を考慮して対応付け画像群を選択してもよい。
図5は、画像出力部130、入力受付部140及び教師情報付与部150の動作を説明する図である。図5において、IB1~IBnは図3のIA2~IAmに相当する。図4で説明した手法により、対応付け画像群GIMである医療画像IB1~IBnのうちIB3が付与対象画像RIMとして選択されている。nは2以上の整数である。
画像出力部130は、画像対応付け部120により選択された付与対象画像RIMを表示部300に表示させる。ユーザは、操作部400を介して代表教師情報ATINを付与対象画像RIMに付与する。代表教師情報ATINは、付与対象画像RIMに付与される教師情報のことである。図5には、教師情報が、機械学習における検出対象を囲む輪郭情報である例を図示するが、教師情報は、テキスト、矩形、輪郭、又は領域であってもよい。テキストは、分類処理を行うAIの教師データとして用いられる情報である。テキストは、撮影対象の内容又は状態等を示す情報であり、例えば病変の種類、或いは病変の悪性度等を示す。矩形は、ディテクションを行うAIの教師データとして用いられる情報である。矩形は、病変等の撮影対象に外接する矩形であり、病変等の存在及びその位置を示す。輪郭又は領域は、セグメンテーションを行うAIの教師データとして用いられる情報である。輪郭は、病変等の撮影対象と、正常粘膜等の撮影対象以外の領域との境界を示す情報である。領域は、病変等の撮影対象が占める領域を示す情報であり、輪郭の情報を包含する。
教師情報付与部150は、入力受付部140が受け付けた代表教師情報ATINに基づいて、対応付け画像群GIMに含まれる医療画像IB1~IBnに対して教師情報AT1~ATnを付与する。図5では、付与対象画像RIMであるIB3には、教師情報AT3として代表教師情報ATINがそのまま付与される。教師情報付与部150は、IB3以外の医療画像に対して、特徴点に基づいて代表教師情報ATINを幾何学変換することで教師情報を付与する。即ち、2以上の特徴点が共通する2つの画像間において、その特徴点の位置及び対応関係から、画像間の平行移動量、回転量及び拡縮率が分かる。教師情報付与部150は、この平行移動量、回転量及び拡縮率を用いた幾何学変換によって代表教師情報ATINを教師情報AT1、AT2、AT4~ATnに変換する。
本実施形態によれば、画像出力部130は、対応付け画像群GIMの中から選択される医療画像を、付与対象画像RIMとして表示部300に出力する。
このようにすれば、対応付け画像群GIMに含まれる医療画像のいずれかが付与対象画像RIMとして表示部300に表示される。この付与対象画像RIMは、対応付け画像群GIM内の他の医療画像と対応付けられているので、その対応関係を用いることで代表教師情報ATINから各医療画像の教師情報を付与できる。
また本実施形態では、撮影対象の類似性に基づく対応付けにおいて各医療画像に対応づけられる医療画像の数を対応付け画像数としたとする。例えば図4においてIX1~IX5の対応付け画像数は、それぞれ2、3、3、2、2である。画像出力部130は、対応付け画像数に基づいて選択される医療画像を、付与対象画像RIMとして表示部300に出力する。
具体的には、画像対応付け部120は、対応付け画像数に基づいて複数の医療画像の中から付与対象画像RIMを選択し、複数の医療画像のうち付与対象画像RIMに対応付けられた医療画像を対応付け画像群GIMとする。より具体的には、画像対応付け部120は、対応付け画像数を算出した複数の医療画像のうち、対応付け画像数が最も多い医療画像が付与対象画像RIMとして選択する。
このようにすれば、1つの付与対象画像RIMに対応付けられる画像数が多くなるので、ユーザが代表教師情報ATINを付すべき付与対象画像RIMの数を減らすことができる。これにより、教師画像作成におけるユーザ負担を軽減できる。なお、上記構成例では画像対応付け部120が付与対象画像RIMを選択したが、画像出力部130が付与対象画像RIMを選択してもよい。例えば図4のIX2、IX3のように、類似性が高い画像数が同数となっている候補が複数あるとき、画像出力部130が、その複数の候補のいずれかを付与対象画像として選択してもよい。画像出力部130は、例えば候補画像に含まれる特徴点の数が多いものを付与対象画像として選択してもよい。
また本実施形態では、入力受付部140は、付与対象画像RIMの特定領域の輪郭を示す代表輪郭情報を代表教師情報ATINとして受け付ける。教師情報付与部150は、対応付け画像群GIMに含まれる医療画像に対して輪郭情報を教師情報AT1~ATnとして付与する。
特定領域とは、教師データ作成システム10により生成された教師画像に基づいて機械学習されるAIが検出対象とする領域のことである。本実施形態によれば、特定領域の輪郭を示す輪郭情報が教師情報AT1~ATnとして医療画像に付与されるので、その教師情報に基づいて機械学習を行うことで、セグメンテーションによる特定領域の検出が可能となる。
また本実施形態では、画像対応付け部120は、複数の医療画像IA1~IAmの各医療画像から、画像の特徴を示す特徴点FPa~FPcを抽出し、複数の医療画像IA1~IAmのうち共通の特徴点を持つ医療画像IB1~IBnの対応付けを行うことで対応付け画像群GIMを作成する。教師情報付与部150は、共通の特徴点FPa~FPcを利用して、対応付け画像群GIMに含まれる医療画像IB1~IBnに対して、特定領域の輪郭を示す輪郭情報を教師情報AT1~ATnとして付与する。
このようにすれば、対応付け画像群GIMを作成する際にマッチングされた特徴点の情報を用いて、各医療画像に輪郭情報を付与できる。上述したように、共通する特徴点を有する画像間において、幾何学変換により代表輪郭情報を各医療画像の輪郭情報に変換できる。
2.第1構成例の変形例
第1変形例では、撮影対象の類似性が画像類似度に基づいて判断される。教師データ作成システム10のハードウェア構成は図1と同様である。図6は、第1変形例における処理のフローチャートである。ステップS11、S15は図2のステップS1、S5と同様であるため説明を省略する。
ステップS12において、画像対応付け部120は、複数の医療画像に含まれる医療画像間の画像類似度を算出する。画像類似度は、2つの画像がどの程度類似しているかを示す指標、即ち画像そのものの類似性を示す指標である。画像が類似している場合、その画像に写る撮影対象の類似性も高いと判断できる。画像類似度は、例えばSSD(Sum of Squared Difference)、SAD(Sum of Absolute Difference)、NCC(Normalized Cross Correlation)、ZNCC(Zero-mean Normalized Cross Correlation)等である。
ステップS13において、画像対応付け部120は、複数の医療画像のうち高い画像類似度を多く持つ画像を付与対象画像として選択する。例えば画像対応付け部120は、画像類似度としきい値を比較することで、類似度の高低を判断する。付与対象画像の選択と、対応付け画像群の設定については、図4等で説明した手法と同様である。画像出力部130は、選択された付与対象画像を表示部300に出力する。
ステップS14において、入力受付部140は、表示された付与対象画像に対する教師情報入力を受け付ける。画像類似度を用いた場合の教師情報としては、例えばテキストが想定されるが、これに限定されない。
第2変形例では、対応付け状況を表示する。図7は、第2変形例において表示部300に表示される画像の例である。
画像出力部130は、付与対象画像RIMと、複数の医療画像のうち付与対象画像RIMを除く医療画像302との間の対応付け情報303を、表示部300に出力する。図において、301は、時間の流れを示す矢印である。即ち、矢印301に沿って医療画像302が時系列に表示されている。対応付け情報303は、付与対象画像RIMと医療画像302を接続する線である。線で接続された画像は、撮影対象の類似性が高いと判断されて対応付けされた画像であり、線で接続されない画像は、撮影対象の類似性が低いと判断されて対応付けられなかった画像である。
このようにすれば、ユーザは付与対象画像RIMと各医療画像の対応付け状況を知ることができる。例えば、ユーザは、付与対象画像RIMとして適切な医療画像が選択されているか否かを判断できる。
入力受付部140は、付与対象画像RIMを除く医療画像302のいずれかを、新たな付与対象画像に指定する入力を、受け付ける。入力受付部140は、受け付けた入力に基づいて付与対象画像を変更する。即ち、ユーザは、表示部300に表示された対応付け情報303を見て、現在の付与対象画像RIMよりも適切な付与対象画像があると判断した場合に、その医療画像を選択する。入力受付部140は、ユーザにより選択された医療画像を新たな付与対象画像とする。
このようにすれば、ユーザが代表教師情報を付与する医療画像として適切と判断した医療画像を付与対象画像として新たに選択し、その付与対象画像に対してユーザが代表教師情報を付与できる。これにより、より高精度な機械学習を実現できる教師画像を作成可能である。
なお、ユーザが新たな付与対象画像を選択した後、画像対応付け部120は対応付け画像群を再設定し、その対応付け情報を画像出力部130が表示部300に表示させてもよい。即ち、画像対応付け部120は、ユーザにより新たに選択された付与対象画像と類似性が高い医療画像を新たな対応付け画像群に設定し、その対応付け情報を画像出力部130に出力してもよい。
第3変形例では、特定領域の表示調整を行う。図8は、第3変形例における教師データ作成システム10の構成例である。図8では、処理部100は検出部160を更に含む。また画像出力部130は表示調整部131を含む。なお、既に説明した構成要素については適宜に説明を省略する。
図9は、第3変形例における処理のフローチャートである。ステップS21、S26、S27は図2のステップS1、S4、S5と同様であるため説明を省略する。
ステップS22において、検出部160は複数の医療画像の各医療画像から特定領域を検出する。特定領域は、教師情報を付与する対象となる領域である。ステップS23において、画像対応付け部120は、複数の医療画像の各医療画像から特徴点を抽出し、画像間において特徴点のマッチングを行う。このとき、画像対応付け部120は、検出部160により検出された特定領域に基づいて特徴点を抽出してもよい。例えば、画像対応付け部120は、特定領域を特徴付ける特徴点を抽出してもよい。
ステップS24において、表示調整部131は、対応付けられた画像の状況に応じて、付与対象画像を拡縮して表示部300に表示させる。例えば対応付け画像群において、画像に写る特定領域のサイズが大きい又は小さい場合に、表示調整部131は、特定領域のサイズが適切となるように付与対象画像を拡縮する。ステップS25において、表示調整部131は、検出された特定領域が見えやすいように調整して、付与対象画像を表示部300に表示させる。例えば、表示調整部131は、特定領域が画面中央となるように平行移動したり、特定領域が見やすいように回転処理又は射影変換したりする。射影変換は、特定領域が存在する面の傾きを変える変換、即ち特定領域が存在する面とカメラ視線のなす角度を変える変換である。なお、ステップS25又はS24の両方が実施されてもよいし、いずれか一方が実施されてもよい。
本実施形態によれば、表示調整部131は、付与対象画像に幾何学変換を加えた後に表示部300に出力する。幾何学変換は、例えば平行移動、回転、拡縮、射影変換又はそれらの組み合わせである。
このようにすれば、ユーザにより代表教師情報が付与される特定領域が見やすくなるように、幾何学変換できる。これにより、特定領域を見やすくユーザに提示でき、ユーザの作業負担を低減できる、或いはユーザが正確に代表教師情報を付与できるようになる。
また本実施形態によれば、検出部160は、複数の医療画像から画像処理により特定領域の情報を検出する。表示調整部131は、検出された特定領域の情報に基づいて幾何学変換を行うことで特定領域の表示調整を行う。画像処理は、画像から特定領域の位置又は領域等を認識する画像認識処理である。画像認識処理としては種々の技術を採用できるが、一例としては機械学習を用いた画像認識技術、或いは特徴量抽出を用いた画像認識技術である。検出される特定領域の情報は、特定領域の位置、サイズ、輪郭、領域、又はそれらの組み合わせである。これらの情報を用いることで、特定領域が適切に表示されるように平行移動、回転又は拡縮等を行うことが可能である。
このようにすれば、教師情報が付与されるべき特定領域が予め検出部160によって検出され、その特定領域が適切に表示されるように表示調整部131が付与対象画像を幾何学変換できる。
第4変形例では、入力された代表教師情報の調整を行う。図10は、第4変形例における教師データ作成システム10の構成例である。図10では、入力受付部140は入力調整部141を含む。なお、既に説明した構成要素については適宜に説明を省略する。
図11は、入力調整部141の第1動作例を説明する図である。入力調整部141は、付与対象画像から画像処理により特定領域の推定輪郭情報ATESを検出する。入力受付部140は、付与対象画像の特定領域の輪郭を示す代表輪郭情報ATINbを代表教師情報として受け付ける。入力調整部141は、推定輪郭情報ATESが所定以上の確からしさを持っている場合に、代表輪郭情報ATINbを推定輪郭情報ATESに基づいて補正する。
入力調整部141は、AI処理による画像認識処理を行うことで、推定輪郭情報ATESと、その推定の確からしさとを出力する。例えば、輪郭に沿った各位置に対して確からしさが出力される。入力調整部141は、確からしさが所定以上の部分について、代表輪郭情報ATINbを推定輪郭情報ATESに基づいて補正する。例えば、入力調整部141は、確からしさが所定以上の部分について、代表輪郭情報ATINbを推定輪郭情報ATESで置き換える。入力調整部141は、補正後の代表輪郭情報を最終的な代表教師情報ATFとして教師情報付与部150に出力する。
本実施形態によれば、画像処理による推定輪郭情報が確からしい場合に、その推定輪郭情報に基づいて、ユーザが入力した代表輪郭情報が補正される。例えば、ユーザが入力した輪郭情報が不正確な場合等が想定されるが、そのような場合であっても、正確な輪郭情報に補正できる。このとき、推定輪郭情報が確からしい場合にのみ補正されるので、確度の高い補正が可能である。
図12は、入力調整部141の第2動作例を説明する図である。入力調整部141は、付与対象画像から画像処理により特定領域の推定輪郭情報ATESを検出する。入力受付部140は、付与対象画像の特定領域の輪郭を示す代表輪郭情報ATINbを代表教師情報として受け付ける。入力調整部141は、推定輪郭情報ATESが所定以上の確からしさを持っている場合に、推定輪郭情報ATESに基づいて代表教師情報を出力し、推定輪郭情報ATESが所定未満の確からしさを持っている場合に、代表輪郭情報ATINbに基づいて代表教師情報を出力する。
入力調整部141は、AI処理による画像認識処理を行うことで、推定輪郭情報ATESと、その推定の確からしさとを出力する。例えば、輪郭全体についての確からしさが出力される。入力調整部141は、確からしさが所定以上の場合に、推定輪郭情報ATESを最終的な代表教師情報ATFとして教師情報付与部150に出力する。また、入力調整部141は、確からしさが所定未満の場合に、代表輪郭情報ATINbを最終的な代表教師情報ATFとして教師情報付与部150に出力する。図12には、推定輪郭情報ATESが選択される場合を図示している。
第5変形例では、入力された代表教師情報に基づいて特徴点を再抽出する。教師データ作成システム10のハードウェア構成は図1と同様である。
画像対応付け部120は、複数の医療画像の各医療画像から、画像の特徴を示す特徴点を抽出し、複数の医療画像のうち共通の特徴点を持つ医療画像の対応付けを行うことで対応付け画像群を作成する。入力受付部140は、付与対象画像の特定領域の輪郭を示す代表輪郭情報を代表教師情報として受け付ける。画像対応付け部120は、代表輪郭情報の輪郭が特徴点から所定以上離れているとき、代表輪郭情報の輪郭の位置に基づいて、再度、特徴点の抽出と対応付けとを行う。
具体的には、画像対応付け部120は、代表輪郭情報の輪郭と付与対象画像の特徴点との距離を算出する。距離は、例えば輪郭のうち特徴点に最も近い点と特徴点との間の距離である。付与対象画像に複数の特徴点がある場合、各特徴点について距離が求められ、そのうちの最短距離又は平均距離等が最終的な距離として求められる。画像対応付け部120は、求めた距離が所定以上である場合、各医療画像の特徴点を再抽出する。このとき、画像対応付け部120は、ユーザにより入力された代表輪郭情報の輪郭付近に存在する特徴点を抽出し、その特徴点を用いて対応付け画像群の再構成を行う。
本実施形態によれば、ユーザにより入力された代表輪郭情報の輪郭に基づいて特徴点が再抽出されるので、ユーザが認識した特定領域に関する特徴点が再抽出される。その特徴点を用いて対応付け画像群が再構成されることで、特定領域の特徴点によって適切に対応付けられた対応付け画像群が得られる。これにより、教師情報付与部150が、代表輪郭情報に基づいて各医療画像に対して精度良く輪郭情報を付与できる。
3.第2構成例
教師データ作成システム10の第2構成例を説明する。教師データ作成システム10のハードウェア構成は図1と同様である。図13は、第2構成例における処理のフローチャートである。ステップS31、S32は、図2のステップS1、S2と同様であるため説明を省略する。
ステップS33において、画像対応付け部120は、ステップS32における対応付け結果に基づいて複数の医療画像を合成することで、3次元モデルを構築する。ステップS34において、画像出力部130は、対応付けられた医療画像における対応点が多く写るように、3次元モデルの姿勢を調整し、その姿勢の2次元画像を付与対象画像として表示部300に出力する。ステップS35において、入力受付部140は、付与対象画像に対する代表教師情報の入力を受け付ける。教師情報としては、例えば矩形、輪郭又は領域等が想定されるが、これらに限定されない。
ステップS36において、入力受付部140は、入力された代表教師情報を3次元モデルにおける近くの輪郭に合わせて自動的に調整する、又は入力された代表教師情報を3次元モデルの奥行きに応じて自動的に調整する。ステップS37において、教師情報付与部150は、3次元モデルに付与された代表教師情報に基づいて、3次元モデルに対応付けられた医療画像又は領域に教師情報を付与する。
図14は、画像対応付け部120の動作を説明する図である。図14では省略しているが、図3と同様に医療画像IB1~IBnから特徴点が抽出されており、撮影対象の類似性が高い医療画像が対応付け画像群GIMとして対応付けられている。
画像対応付け部120は、対応付け画像群GIMに含まれる医療画像IB1~IBnの対応付けを用いて、医療画像IB1~IBnから3次元モデルMDLを合成する。具体的には、画像対応付け部120は、各医療画像における特徴点と、医療画像間における特徴点の対応とに基づいて、各医療画像がどのようなカメラ位置及び視線方向で撮影されたかを推定し、その推定結果に基づいて3次元モデルMDLを推定する。3次元モデルMDLの合成手法として、例えばSfM(Structure from Motion)を採用できる。
図15は、画像出力部130、入力受付部140及び教師情報付与部150の動作を説明する図である。画像出力部130は、3次元モデルMDLから付与対象画像RIM1、RIM2を生成する。付与対象画像RIM1、RIM2は、3次元モデルMDLを視線VL1、VL2で見たときの2次元画像である。例えば、視線VL2は、視線VL1に対して見る方向が反対になっている。即ち、付与対象画像RIM1における3次元モデルMDLの見え方を表と呼んだとすると、付与対象画像RIM2における3次元モデルMDLの見え方は裏ということになる。
ユーザは、付与対象画像RIM1、RIM2の各々に対して代表教師情報ATIN1、ATIN2を付与する。図15には、教師情報が輪郭情報である場合を図示している。入力受付部140は、代表教師情報ATIN1、ATIN2に基づいて、3次元モデルMDLに代表教師情報を付与する。即ち、入力受付部140は、3次元モデルMDLにおける特定領域の輪郭を、代表教師情報ATIN1、ATIN2の輪郭から生成する。例えば特定領域が凸部である場合、その凸部と、凸部以外の面との境界が、3次元モデルMDLにおける特定領域の輪郭となる。
教師情報付与部150は、3次元モデルMDLに付与された代表教師情報に基づいて、対応付け画像群GIMの医療画像IB1~IBnに対して教師情報AT1~ATnを付与する。3次元モデルMDLが生成される際に、各医療画像に対応したカメラ位置及び視線方向が推定されている。また、3次元モデルが生成されていれば、モデル上の各点とカメラ間の距離も推定されている。教師情報付与部150は、そのカメラ位置及び視線方向を用いて3次元モデルMDLにおける代表教師情報を、医療画像IB1~IBnにおける教師情報AT1~ATnに変換する。
本実施形態によれば、画像出力部130は、対応付け画像群GIMを用いて生成された画像を、付与対象画像として表示部300に出力する。
対応付け画像群GIMは、撮影対象の類似性に基づいて対応付けられているので、その対応付け画像群GIMを用いて生成された画像は、撮影対象に関する画像となっている。このような画像を付与対象画像として表示部300に表示することで、撮影対象が適切にユーザに提示される。
また本実施形態では、画像出力部130は、対応付け画像群GIMに基づいて撮影対象の3次元モデルMDLを生成し、3次元モデルMDLに基づく画像RIM1、RIM2を付与対象画像として表示部300に出力する。
このようにすれば、撮影対象の3次元モデルMDLがユーザに提示される。3次元モデルMDLを用いることで、3次元構造が重要な病変部等に対して教師情報が適切に付与されることが期待できる。また、各医療画像における撮影対象の写り方に左右されることなく、任意のカメラ視線で見た3次元モデルMDLをユーザに提示することが可能となり、代表教師情報を付与するのに適した付与対象画像を表示できる。
具体的には、画像出力部130は、対応点がより多く写るカメラ視線で3次元モデルMDLを見たときの付与対象画像を表示する。対応点は、3次元モデルMDLの構築に用いられた医療画像間において共通する特徴点のことである。3次元モデルMDLを構築する際に特徴点の対応を用いているため、3次元モデルMDL上における特徴点の位置が分かっている。このため、3次元モデルMDLをどのカメラ視線で見たときに多くの対応点が写るのかを知ることができ、そのカメラ視線で見た付与対象画像が表示される。図15には2つの付与対象画像RIM1、RIM2が図示されているが、例えば、対応点の数が最大となるカメラ視線で見た画像を、RIM1、RIM2のいずれか一方にする。
対応点が多く写る画像が表示されるということは、対応付け画像群GIMから3次元モデルMDLを構築する際に対応付けの精度が高い部分が表示されるということである。このような付与対象画像は、対応付け画像群GIMの各医療画像に対して対応付けの精度が高いと考えられる。このため、付与対象画像に付与された代表教師情報に基づいて各医療画像に教師情報を付与する際に、高精度な教師情報を生成できる。
また本実施形態では、画像出力部130は、3次元モデルMDLに対する視線方向が異なる複数の2次元画像RIM1、RIM2を、複数の付与対象画像として表示部300に出力する。入力受付部140は、複数の2次元画像の各々について、付与対象画像の特定領域の輪郭を示す代表輪郭情報を代表教師情報ATIN1、ATIN2として受け付ける。教師情報付与部150は、対応付け画像群GIMに含まれる医療画像IB1~IBnに対して輪郭情報を教師情報AT1~ATnとして付与する。
3次元モデルMDLを1つの視線方向に見たとき、凸部等の裏になって見えない部分が存在する可能性がある。本実施形態によれば、視線方向が異なる複数の2次元画像を表示することで、3次元モデルMDLを様々な方向から見た2次元画像が表示され、その各2次元画像に対して代表輪郭情報が付与される。これにより、輪郭情報が欠けることなく3次元モデルMDLに付与される。なお、図15では、2つの2次元画像が付与対象画像として表示されるが、表示される2次元画像は2つに限定されず、複数であればよい。
なお、以上では「対応付け画像群を用いて生成された画像」が3次元モデルMDLに基づく画像である場合を例に説明したが、これに限定されず、後述する変形例のように、対応付け画像群GIMから生成された消化管等の展開図であってもよい。
4.第2構成例の変形例
第1変形例では、代表輪郭情報の入力調整を行う。教師データ作成システム10のハードウェア構成は図10と同様である。
入力受付部140は、付与対象画像RIM1、RIM2の特定領域の輪郭を示す代表輪郭情報を代表教師情報ATIN1、ATIN2として受け付ける。入力調整部141は、入力された代表輪郭情報を、3次元モデルMDLの輪郭と奥行とに基づいて調整する。
奥行きは、付与対象画像として表示される2次元画像で見たときの3次元モデルMDLの奥行であり、2次元画像を生成するときのカメラ視線に相当する。例えば3次元モデルMDLの凸部に輪郭が付されるような場合に、ユーザが付与した輪郭を奥行方向に見たとき、その奥行き方向に3次元モデルMDLの複数の表面が存在している場合がある。このような場合、入力調整部141は、最も手前の表面に輪郭が付されるように、代表輪郭情報を調整する。また、ユーザが付与した代表輪郭情報が、付与対象画像における3次元モデルMDLの輪郭から離れている場合には、その代表輪郭情報に近い3次元モデルMDLの輪郭に合わせるように、代表輪郭情報を調整する。
本実施形態によれば、2次元画像である付与対象画像に付与された代表輪郭情報に基づいて、3次元モデルMDLにおける代表輪郭情報を適切に付与できる。即ち、3次元モデルMDLの奥行を考慮することで、ユーザが意図した輪郭に代表輪郭情報が付与される。また、3次元モデルMDLの輪郭を考慮することで、ユーザが入力した輪郭情報が不正確な場合等であっても、正確な輪郭情報に補正できる。
第2変形例では、代表輪郭情報の入力エラーを検出する。教師データ作成システム10のハードウェア構成は図1と同様である。図16は、第2変形例を説明する図である。図16には1つの付与対象画像を示すが、上述したように複数の付与対象画像が表示されてもよい。
画像出力部130は、3次元モデルMDLから2次元画像を生成し、その2次元画像を付与対象画像RIMとして出力する。入力受付部140は、付与対象画像RIMの特定領域の輪郭を示す代表輪郭情報ATINcを代表教師情報として受け付ける。入力受付部140は、3次元モデルMDLから2次元画像が生成されるときの視線方向において代表輪郭情報ATINcの輪郭の奥行上に3次元モデルMDLが無いとき、視線方向の変更を指示するエラー情報を出力する。
図16は、付与対象画像RIMに表示される3次元モデルMDLと代表輪郭情報ATINcが重なっていない。即ち、視線方向において代表輪郭情報ATINcの輪郭の奥行上に3次元モデルMDLが無い。この場合、入力受付部140はエラー情報を出力する。例えば、エラー情報は画像出力部130に入力され、画像出力部130は、エラー情報に基づいて、ユーザに視線方向の変更を促す表示を表示部300に表示させる。或いは、エラー情報は画像対応付け部120に入力され、画像対応付け部120は、エラー情報に基づいて、医療画像の対応付けを再実行することで対応付け画像群と3次元モデルを再生成し、画像出力部130が付与対象画像を再表示する。
本実施形態によれば、3次元モデルMDLに適切でない代表輪郭情報ATINcが入力されたとき、エラー情報が出力されるので、その適切でない代表輪郭情報が用いられることを防止できる。例えば、適切な3次元モデルが生成されなかった場合、或いは3次元モデルをユーザに提示する際のカメラ視線が適切でない場合等が想定される。本実施形態によれば、これらの場合であっても、適切でない代表輪郭情報が用いられることを防止できる。
第3変形例では、対応付け画像群から展開図を生成し、その展開図に基づく付与対象画像を表示する。つまり、第3変形例では、「対応付け画像群を用いて生成された画像」は、展開図である。図17は、第3変形例における処理のフローチャートである。ステップS41、S42は、図2のステップS1、S2と同様であるため説明を省略する。図18は、第3変形例を説明する図である。
ステップS43において、画像対応付け部120は、対応付け画像群GIMにおける医療画像IB1~IBnの対応付けに基づいて医療画像IB1~IBnを合成することで、展開図TKZを作成する。具体的には、画像対応付け部120は、医療画像間における特徴点の対応関係に基づいて、対応する特徴点の位置が一致するように医療画像IB1~IBnを貼り合わせることで、展開図TKZを作成する。図18には、IB1~IBnのうちIB1~IB3の貼り合わせの様子を図示しているが、IB4~IBnについても同様に貼り合わせる。
画像出力部130は、展開図TKZに基づいて付与対象画像を表示部300に出力する。画像出力部130は、例えば展開図TKZの全体を表示部300に表示させてもよいし、或いは展開図TKZのうち特定領域が写った一部を表示部300に表示させてもよい。
ステップS44において、入力受付部140は、ユーザが入力した代表教師情報ATINを受け付ける。図18には、教師情報が輪郭情報である場合を図示している。入力受付部140は、入力された代表教師情報を展開図における近くの輪郭に合わせて自動的に調整する。
ステップS46において、教師情報付与部150は、展開図に付与された代表教師情報に基づいて、展開図に対応付けられた医療画像又は領域に教師情報を付与する。ステップS43において医療画像IB1~IBnを貼り合わせることで展開図TKZを作成しているので、展開図TKZにおける各医療画像の位置は分かっている。教師情報付与部150は、この展開図TKZにおける各医療画像の位置を用いて、代表教師情報ATINを各医療画像の教師情報に変換する。
以上、本実施形態およびその変形例について説明したが、本開示は、各実施形態やその変形例そのままに限定されるものではなく、実施段階では、要旨を逸脱しない範囲内で構成要素を変形して具体化することができる。また、上記した各実施形態や変形例に開示されている複数の構成要素を適宜組み合わせることができる。例えば、各実施形態や変形例に記載した全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態や変形例で説明した構成要素を適宜組み合わせてもよい。このように、本開示の主旨を逸脱しない範囲内において種々の変形や応用が可能である。また、明細書又は図面において、少なくとも一度、より広義または同義な異なる用語と共に記載された用語は、明細書又は図面のいかなる箇所においても、その異なる用語に置き換えることができる。
10 教師データ作成システム、100 処理部、110 画像取得部、120 画像対応付け部、130 画像出力部、131 表示調整部、140 入力受付部、141 入力調整部、150 教師情報付与部、160 検出部、200 記憶部、300 表示部、301 矢印、302 医療画像、303 対応付け情報、400 操作部、500 学習装置、510 プロセッサ、520 記憶部、521 教師データ、522 学習モデル、600 内視鏡、AT1~ATn 教師情報、ATES 推定輪郭情報、ATIN 代表教師情報、ATINb 代表輪郭情報、FPa~FPc 特徴点、GIM 対応付け画像群、IA1~IAm 医療画像、IB1~IBn 医療画像、MDL 3次元モデル、RIM 付与対象画像、TKZ 展開図

Claims (19)

  1. 複数の医療画像を取得する画像取得部と、
    前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成する画像対応付け部と、
    前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力する画像出力部と、
    前記付与対象画像の特定領域の輪郭を示す代表輪郭情報を前記代表教師情報として受け付ける入力受付部と、
    前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して輪郭情報を教師情報として付与する教師情報付与部と、
    を含むことを特徴とする教師データ作成システム。
  2. 請求項1において、
    前記画像出力部は、
    前記対応付け画像群の中から選択される医療画像を、前記付与対象画像として前記表示部に出力することを特徴とする教師データ作成システム。
  3. 請求項2において、
    前記類似性に基づく前記対応付けにおいて各医療画像に対応づけられる医療画像の数を対応付け画像数としたとき、
    前記画像出力部は、
    前記対応付け画像数に基づいて選択される医療画像を、前記付与対象画像として前記表示部に出力することを特徴とする教師データ作成システム。
  4. 請求項2において、
    前記画像対応付け部は、
    前記対応付けにおいて各医療画像に対応づけられる医療画像の数に基づいて、前記複数の医療画像の中から前記付与対象画像を選択し、前記複数の医療画像のうち前記付与対象画像に対応付けられた医療画像を前記対応付け画像群とすることを特徴とする教師データ作成システム。
  5. 請求項において、
    前記画像対応付け部は、
    前記複数の医療画像の各医療画像から、画像の特徴を示す特徴点を抽出し、前記複数の医療画像のうち共通の前記特徴点を持つ医療画像の前記対応付けを行うことで前記対応付け画像群を作成し、
    前記教師情報付与部は、
    前記共通の前記特徴点を利用して、前記対応付け画像群に含まれる医療画像に対して、特定領域の輪郭を示す輪郭情報を前記教師情報として付与することを特徴とする教師データ作成システム。
  6. 請求項2において、
    前記画像出力部は、
    前記付与対象画像に幾何学変換を加えた後に前記表示部に出力する表示調整部を有することを特徴とする教師データ作成システム。
  7. 請求項において、
    前記複数の医療画像から画像処理により特定領域の情報を検出する検出部を含み、
    前記表示調整部は、
    前記特定領域の情報に基づいて前記幾何学変換を行うことで前記特定領域の表示調整を行うことを特徴とする教師データ作成システム。
  8. 請求項2において、
    前記入力受付部は、入力調整部を有し、
    記入力調整部は、
    前記付与対象画像から画像処理により特定領域の推定輪郭情報を検出し、前記推定輪郭情報が所定以上の確からしさを持っている場合に、前記代表輪郭情報を前記推定輪郭情報に基づいて補正することを特徴とする教師データ作成システム。
  9. 請求項2において、
    前記入力受付部は、入力調整部を有し、
    記入力調整部は、
    前記付与対象画像から画像処理により特定領域の推定輪郭情報を検出し、前記推定輪郭情報が所定以上の確からしさを持っている場合に、前記推定輪郭情報に基づいて前記代表教師情報を出力し、前記推定輪郭情報が所定未満の確からしさを持っている場合に、前記代表輪郭情報に基づいて前記代表教師情報を出力することを特徴とする教師データ作成システム。
  10. 請求項1において、
    前記画像対応付け部は、
    前記複数の医療画像の各医療画像から、画像の特徴を示す特徴点を抽出し、前記複数の医療画像のうち共通の前記特徴点を持つ医療画像の前記対応付けを行うことで前記対応付け画像群を作成し、
    記画像対応付け部は、
    前記代表輪郭情報の前記輪郭が前記特徴点から所定以上離れているとき、前記代表輪郭情報の前記輪郭の位置に基づいて、再度、前記特徴点の抽出と前記対応付けとを行うことを特徴とする教師データ作成システム。
  11. 請求項1において、
    前記画像出力部は、
    前記付与対象画像と、前記複数の医療画像のうち前記付与対象画像を除く医療画像との間の対応付け情報を、前記表示部に出力することを特徴とする教師データ作成システム。
  12. 請求項11において、
    前記入力受付部は、
    前記複数の医療画像のうち前記付与対象画像を除く医療画像のいずれかを、新たな前記付与対象画像に指定する入力を、受け付け、前記受け付けた入力に基づいて前記付与対象画像を変更することを特徴とする教師データ作成システム。
  13. 請求項1において、
    前記画像出力部は、
    前記対応付け画像群を用いて生成された画像を、前記付与対象画像として前記表示部に出力することを特徴とする教師データ作成システム。
  14. 請求項13において、
    前記画像出力部は、
    前記対応付け画像群に基づいて前記撮影対象の3次元モデルを生成し、前記3次元モデルに基づく画像を前記付与対象画像として前記表示部に出力することを特徴とする教師データ作成システム。
  15. 請求項14において、
    前記画像出力部は、
    前記3次元モデルに対する視線方向が異なる複数の2次元画像を、複数の前記付与対象画像として前記表示部に出力し、
    前記入力受付部は、
    前記複数の2次元画像の各々について、前記代表輪郭情報を前記代表教師情報として受け付け、
    前記教師情報付与部は、
    前記対応付け画像群に含まれる医療画像に対して輪郭情報を前記教師情報として付与することを特徴とする教師データ作成システム。
  16. 請求項14において、
    前記入力受付部は、入力調整部を有し、
    記入力調整部は、
    入力された前記代表輪郭情報を、前記3次元モデルの輪郭と奥行とに基づいて調整することを特徴とする教師データ作成システム。
  17. 請求項14において、
    前記画像出力部は、
    前記3次元モデルから2次元画像を生成し、前記2次元画像を前記付与対象画像として出力し、
    記入力受付部は、
    前記3次元モデルから前記2次元画像が生成されるときの視線方向において前記代表輪郭情報の前記輪郭の奥行上に前記3次元モデルが無いとき、前記視線方向の変更を指示するエラー情報を出力することを特徴とする教師データ作成システム。
  18. 複数の医療画像を取得することと、
    前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成することと、
    前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力することと、
    前記付与対象画像の特定領域の輪郭を示す代表輪郭情報を前記代表教師情報として受け付けることと、
    前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して輪郭情報を教師情報として付与することと、
    を含むことを特徴とする教師データ作成方法。
  19. 複数の医療画像を取得することと、
    前記複数の医療画像に含まれる医療画像間で撮影対象の類似性に基づく対応付けを行い、対応付けできた医療画像同士で群を構成した対応付け画像群を作成することと、
    前記対応付け画像群に基づいて、代表教師情報の付与対象となる画像である付与対象画像を表示部に出力することと、
    前記付与対象画像の特定領域の輪郭を示す代表輪郭情報を前記代表教師情報として受け付けることと、
    前記付与対象画像に対して入力された前記代表教師情報に基づいて、前記対応付け画像群に含まれる医療画像に対して輪郭情報を教師情報として付与することと、
    をコンピュータに実行させる教師データ作成プログラム。
JP2022506986A 2020-03-09 2020-03-09 教師データ作成システム、教師データ作成方法及び教師データ作成プログラム Active JP7309035B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/009909 WO2021181439A1 (ja) 2020-03-09 2020-03-09 教師データ作成システム、教師データ作成方法及び教師データ作成プログラム

Publications (3)

Publication Number Publication Date
JPWO2021181439A1 JPWO2021181439A1 (ja) 2021-09-16
JPWO2021181439A5 JPWO2021181439A5 (ja) 2022-11-04
JP7309035B2 true JP7309035B2 (ja) 2023-07-14

Family

ID=77670480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022506986A Active JP7309035B2 (ja) 2020-03-09 2020-03-09 教師データ作成システム、教師データ作成方法及び教師データ作成プログラム

Country Status (4)

Country Link
US (1) US20230005245A1 (ja)
JP (1) JP7309035B2 (ja)
CN (1) CN115243601A (ja)
WO (1) WO2021181439A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009297365A (ja) 2008-06-16 2009-12-24 Olympus Corp 画像処理装置、画像処理方法および画像処理プログラム
US20100165088A1 (en) 2008-12-29 2010-07-01 Intromedic Apparatus and Method for Displaying Capsule Endoscope Image, and Record Media Storing Program for Carrying out that Method
JP2013254286A (ja) 2012-06-06 2013-12-19 Dainippon Screen Mfg Co Ltd 欠陥画像の提示方法
WO2018142664A1 (ja) 2017-02-02 2018-08-09 オリンパス株式会社 内視鏡画像観察支援システム
JP2019087012A (ja) 2017-11-07 2019-06-06 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム、及び記憶媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009297365A (ja) 2008-06-16 2009-12-24 Olympus Corp 画像処理装置、画像処理方法および画像処理プログラム
US20100165088A1 (en) 2008-12-29 2010-07-01 Intromedic Apparatus and Method for Displaying Capsule Endoscope Image, and Record Media Storing Program for Carrying out that Method
JP2013254286A (ja) 2012-06-06 2013-12-19 Dainippon Screen Mfg Co Ltd 欠陥画像の提示方法
WO2018142664A1 (ja) 2017-02-02 2018-08-09 オリンパス株式会社 内視鏡画像観察支援システム
JP2019087012A (ja) 2017-11-07 2019-06-06 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム、及び記憶媒体

Also Published As

Publication number Publication date
US20230005245A1 (en) 2023-01-05
CN115243601A (zh) 2022-10-25
JPWO2021181439A1 (ja) 2021-09-16
WO2021181439A1 (ja) 2021-09-16

Similar Documents

Publication Publication Date Title
JP6644833B2 (ja) アルベドモデルにより拡張現実コンテンツをレンダリングするシステムおよび方法
Sharp et al. Accurate, robust, and flexible real-time hand tracking
CN109191369B (zh) 2d图片集转3d模型的方法、存储介质和装置
KR102609477B1 (ko) 파노라마 이미지 또는 동영상을 생성하는 전자 장치 및 그 방법
US10383602B2 (en) Apparatus and method for visualizing anatomical elements in a medical image
US20180108138A1 (en) Method and system for semantic segmentation in laparoscopic and endoscopic 2d/2.5d image data
JP5399502B2 (ja) 追尾対象選択装置、方法、プログラム及び回路
JP5117452B2 (ja) 動的閾値を用いたマーカ認識方法及びこれを活用した増強現実に基づく学習システム
KR101227255B1 (ko) 마커 크기 기반 인터렉션 방법 및 이를 구현하기 위한 증강 현실 시스템
Turan et al. Sparse-then-dense alignment-based 3D map reconstruction method for endoscopic capsule robots
CN106896925A (zh) 一种虚拟现实与真实场景融合的装置
CN110998659A (zh) 图像处理系统、图像处理方法、及程序
KR20150082379A (ko) 단안 시각 slam 을 위한 고속 초기화
CN106997618A (zh) 一种虚拟现实与真实场景融合的方法
EP2489033A1 (en) Systems and methods for tracking natural planar shapes for augmented reality applications
KR20210113100A (ko) 멀티-카메라 또는 기타 환경을 위한 슈퍼-해상도 뎁스 맵 생성
KR102450236B1 (ko) 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
KR102433473B1 (ko) 환자의 증강 현실 기반의 의료 정보를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN115298706A (zh) 用于在将合成元素应用于原始图像期间掩蔽所识别的对象的系统和方法
KR20210067864A (ko) 적응적 포커스 범위 및 계층화 스캐터링을 이용한 보케 이미지들의 생성
JP7309035B2 (ja) 教師データ作成システム、教師データ作成方法及び教師データ作成プログラム
Hsieh et al. Markerless Augmented Reality via Stereo Video See‐Through Head‐Mounted Display Device
CN111783497B (zh) 视频中目标的特征确定方法、装置和计算机可读存储介质
CN113805824A (zh) 电子装置以及在显示设备上显示图像的方法
KR20180017897A (ko) 스티커 영상을 위한 오브젝트 추출 방법 및 그 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230704

R151 Written notification of patent or utility model registration

Ref document number: 7309035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151