JP6988926B2 - 画像処理装置、画像処理方法および画像処理プログラム - Google Patents

画像処理装置、画像処理方法および画像処理プログラム Download PDF

Info

Publication number
JP6988926B2
JP6988926B2 JP2019570260A JP2019570260A JP6988926B2 JP 6988926 B2 JP6988926 B2 JP 6988926B2 JP 2019570260 A JP2019570260 A JP 2019570260A JP 2019570260 A JP2019570260 A JP 2019570260A JP 6988926 B2 JP6988926 B2 JP 6988926B2
Authority
JP
Japan
Prior art keywords
heat map
object area
generated
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019570260A
Other languages
English (en)
Other versions
JPWO2019155628A1 (ja
Inventor
雅弘 西光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019155628A1 publication Critical patent/JPWO2019155628A1/ja
Application granted granted Critical
Publication of JP6988926B2 publication Critical patent/JP6988926B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • A61B1/045Control thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Surgery (AREA)
  • Pathology (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Optics & Photonics (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Image Analysis (AREA)
  • Endoscopes (AREA)

Description

本発明は、画像中における検知対象物体の確認を容易にするための画像処理装置等に関する。
動画像中における検知対象物体の発見を補助するための画像処理方法がある。非特許文献1および非特許文献2は、この画像処理方法の例を開示する。例えば、この画像処理方法は、物体領域候補生成手段および物体領域候補出力手段を備える装置において、以下のように動作する。即ち、物体領域候補生成手段は、画像(動画の場合、動画を構成する各フレーム画像)が入力されると、その画像中に含まれる検知対象の物体が存在すると思われる領域に複数の候補(物体領域候補)を生成する。物体領域候補とは、検知対象の物体を外接する矩形もしくは円であり、これらは物体の形状を示す変数(たとえば中心座標(x, y)、高さ(h)および幅(w))、更に、物体領域候補における検知対象物体の含有率等を示す信頼度等によって表現される。物体領域候補出力手段は、物体領域候補生成手段で生成された物体領域候補の中から、各物体領域候補の重なり具合又は信頼度等に基づいて、検知対象の物体に外接する矩形もしくは円を出力する。
その他、特許文献1は、本願に関連する技術を開示する。
特開2016−206995号公報
S. Ren, K. He, R. Girshick, and J. Sun, "Faster R-CNN: Towards real-time object detection with region proposal networks", Advances in neural information processing systems 28 (NIPS 2015). http://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf J. Hosang, R. Benenson, and B. Schiele, "A convnet for non-maximum suppression", Max-Planck Institute for Informatics, Saarbrucken, Germany, Dec 2015.https://arxiv.org/pdf/1511.06437v2.pdf
非特許文献1および非特許文献2に開示される画像処理方法においては、検知対象物体は、規則的形状であり、ある程度予測可能な物体である。例えば、人の顔等のように、検知対象物体の大きさ、形状等がある程度規則的に予測され、画像内の中心座標(x, y)から所定の高さ(h)および幅(w)に収まる物体である。しかしながら、検知対象物体には、その大きさ、形状等が不規則で予測できず、画像内の中心座標から予め設定される所定の高さおよび幅に収まらない可能性のある物体(以下、これを不規則物体と称呼する)もある。例えば、臓器内外の病変(腫瘍など)のように、一定の形状に収まらず、病状進行のステージに伴い、様々な形状に不規則に変形可能な非剛体などである。この場合、非特許文献1および非特許文献2に開示される画像処理方法を用いて、物体全体に外接する物体領域を判定し、出力することは困難となる。これは、非特許文献1および非特許文献2に開示される画像処理方法においては、不規則物体の形状では、物体と少なくとも一部が外接する物体領域候補が多数生成されるからである。この理由は、一般的に、ひとつの物体領域候補は、その領域内においてできるだけ検知対象物体を含み、かつ、できるだけ検知対象物体以外のものを含まないように設定されるからであり、この結果、1つの不規則物体に対し、複数の物体領域候補はその一部が重なり、連なって生成されることとなる。例えば、検知対象物体が丸型であれば、その重心を中心とする1つの物体領域候補で足りることが多いが、検知対象物体がヒトデ型であれば、複数の物体領域候補(その重心を中心とする中心近辺をカバーする物体領域候補と、当該ヒトデ型に含まれる複数の足部をカバーする複数の物体領域候補)にて表わされることが多い。更に、後者の物体領域候補は、上記設定により検知対象物体を高い比率にて含んでいるため、信頼度が高くなる傾向がある。これらの理由により、検知対象が不規則物体の場合は、非特許文献1および非特許文献2に開示される画像処理方法においては、不規則物体の全体にて外接する(又は、検知対象物体の全体を含む)矩形もしくは円の領域候補は出力されにくい。
これに伴う問題として、非特許文献1および非特許文献2に開示される画像処理方法において、1つの不規則な検知対象物体に対し、複数の物体領域候補の一部が重なり連なって生成されると、この検知対象物体を観察するオペレータ(例えば、病変の場合は「医師」)にとって、物体領域候補を表わす複数重なった枠によって検知対象物体の視認が困難となり、当該検知対象物体の一部または全体の形状の判断がしづらいという問題がある。または、物体領域候補を表わす枠が何らかの理由により適切に検知対象物体を表わしていない場合に、オペレータによる観察が当該枠にミスリードされ、発見されるべき検知対象物体を見過ごす等の問題がある。
非特許文献1に示された技術では、各領域候補の重なりおよび信頼度に基づき領域候補が出力されるため、検知対象物体と外接する物体領域候補が他の物体領域候補よりも高い信頼度になる。しかしながら、不規則な物体と外接する物体領域候補内では、物体ではない領域を多く含むこととなるから、一般的に部分的に外接する矩形と比べて信頼度が低くなってしまい、ひいては正確な物体領域候補が抽出できないという問題が生じる。
非特許文献2に開示される画像処理方法においては、多大な計算量を必要とするニューラルネットワークを用いて画像の物体領域を生成または再生成するため、高速な画像処理が困難であるという問題がある。
そこで、本発明は、上述した課題に鑑み、不規則物体の全体を示す枠を高速に表示する画像処理装置等を提供することを目的とする。
上記問題点を鑑みて、本発明の第1の観点である画像処理装置は、
画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成する物体領域候補生成部と、
生成された物体領域候補を用いて、画像中における位置に対応するヒートマップを生成するヒートマップ生成部と、
生成されたヒートマップを用いて、1つ以上の物体領域候補から成る、検知対象物体の全体を囲う物体領域を出力する物体領域出力部
とを備える。
本発明の第2の観点である画像処理方法は、
画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成し、
生成された物体領域候補を用いて、画像中における位置に対応するヒートマップを生成し、
生成されたヒートマップを用いて、1つ以上の物体領域候補から成る、検知対象物体の全体を囲う物体領域を出力する
ことを備える。
本発明の第3の観点である画像処理プログラムは、
画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成し、
生成された物体領域候補を用いて、画像中における位置に対応するヒートマップを生成し、
生成されたヒートマップを用いて、1つ以上の物体領域候補から成る、検知対象物体の全体を囲う物体領域を出力する
ことをコンピュータに実現させるための画像処理プログラムである。
画像処理プログラムは、非一時的なコンピュータ可読の記憶媒体に格納されていてもよい。
本発明によれば、不規則物体の全体を示す枠を高速に表示する画像処理装置等を提供することができる。
本発明の第1の実施形態にかかる画像処理装置の構成例を示すブロック図である。 本発明の第1の実施形態にかかる画像処理装置における動作を示すフローチャートである。 画像内における物体領域候補を示す図である。 画像に対応するヒートマップを示す図である。 画像内における物体領域を示す図である。 画像内における物体領域を検知対象物体と共に示す図である。 本発明の第2の実施形態にかかる画像処理装置の構成例を示すブロック図である。 本発明の第2の実施形態にかかる画像処理装置における動作を示すフローチャートである。 画像に対応するヒートマップおよび物体領域候補を示す図である。 画像内における物体領域を検知対象物体と共に示す図である。 本発明の第3の実施形態にかかる画像処理装置の構成例を示すブロック図である。 本発明の第3の実施形態にかかる画像処理装置における動作を示すフローチャートである。 各実施形態において適用可能な情報処理装置の構成例を示すブロック図である。
以下の実施形態においては、主に、形状が不規則的で物体領域が予測不可能な検知対象物体を対象とする画像処理装置等について説明する。尚、この画像処理装置は、形状が規則的で物体領域が予測可能な物体も検知対象とできることは勿論である。以下の説明において、不規則な検知対象物体とは、非剛体、一例として、臓器内外に発生する病変(腫瘍)とする。この場合、画像処理装置の使用者は医師等の医療関係者となる。
この画像処理装置は、例えば、内視鏡動画像におけるリアルタイム腫瘍検知システム等に組み込まれる。当該内視鏡を介し撮影される動画または静止画(以下単に画像と記載)において検知された病変がある場合、医師は当該病変が発生している臓器内外の全部又は一部の形状が正常時と比して変異しているかを観察することで、腫瘍の変異タイプ、悪性度および進行度等を判断する。又、医師が、腫瘍の摘出(切除)を行うにあたり、ある臓器における腫瘍部分と正常な部分の境界を正確に認識する必要がある。このため、本発明の実施形態における画像処理装置は、腫瘍の位置を示す情報として、腫瘍全体に外接する枠を的確かつ高速に表示する。これにより医師による診断および処置が素早く正確になるよう補助することができる。
以下、図面を参照して、本発明の各実施形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。ただし、図面は本発明の実施形態における構成を概略的に表している。更に以下に記載される本発明の実施形態は一例であり、その本質を同一とする範囲において適宜変更可能である。
<第1の実施形態>
(画像処理装置)
本発明の第1の実施形態に係る画像処理装置100は、図1に示すように、物体領域候補生成部11、ヒートマップ生成部12、および、物体領域出力部13を備える。
物体領域候補生成部11は、画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成する。具体的に、物体領域候補生成部11は、外部カメラ(図1には不図示)、例えば内視鏡カメラ等にて撮影された画像を入力し、入力された画像内における検知対象物体が存在する領域の候補(物体領域候補)を複数生成する。画像中に含まれる検知対象の物体が存在すると思われる領域に複数の物体領域候補を生成する手法としては、非特許文献1および非特許文献2等に記載の既存の手法を用いてよい。物体領域候補の数が多すぎる場合、物体領域候補生成部11は、当該物体領域候補としてふさわしい幾つかの当該物体領域候補の組み合わせを生成し、その1つを物体領域候補(群)として出力してもよい。
ヒートマップ生成部12は、生成された物体領域候補を用いて、画像中における位置に対応するヒートマップを生成する。具体的に、ヒートマップ生成部12は、物体領域候補を含む画像を1つ以上入力し、各物体領域候補の信頼度に基づき、当該画像に関するヒートマップを生成する。ここで、信頼度とは、物体領域候補内に検知対象物体が存在する確率を示す値であり、例えば、各物体領域候補の重なり具合、又は、ある物体領域候補における検知対象物体の含有率等を示す度合いを基に算出される。また、ヒートマップとは、画像内の区画(例えばピクセル)の各々の値を示すデータ行列等を、色として可視的に二次元で表現した図のことを指す。ヒートマップでは、物体が存在する領域においては信頼度のスコアが高くなるように設定される。
物体領域出力部13は、生成されたヒートマップを入力し、当該ヒートマップを基に、当該画像内における、不規則な検知対象物体の全体を示す物体領域(矩形枠)を出力する。具体的に、物体領域出力部13は、ヒートマップを区分した複数の区画毎(例えばピクセル毎)において、当該区画に紐付けられた前記信頼度が所定の閾値以上である区画の集合を含む物体領域候補を、前記物体領域として出力する。
(画像処理装置の動作)
図2に示すフローチャートを参照して、画像処理装置100の具体的な動作について説明する。
先ずステップS101において、画像処理装置100は、画像を物体領域候補生成部11に入力し、物体領域候補を生成する。このステップの具体的な一動作例を、以下に説明する。
画像処理装置100が、例えば、内視鏡画像中の病変(腫瘍)を認識するための装置であるとすると、物体領域候補生成部11は、腫瘍を含む画像を受け付け、この画像に対して、腫瘍が含まれている領域を示す物体領域候補を生成する。高速な物体認識を実現する一手法として、物体領域として検知対象の物体を外接する矩形を用いる手法を採用するとする。この場合、描画関数(Rectangle)において、矩形を表現する変数として、中心座標(x、y)、幅(w)、高さ(h)、矩形内に物体を含む確からしさを示す信頼度(conf)を用いるものとする。この場合、あるn番目(nは正の整数)の物体領域候補(Rectangle)は式1の関数で表すことができる。
Rectangle = [x, y, w, h, conf] …(式1)
本例では、物体領域は、検知対象物体の全体の外縁(外周)と接するように囲った(以下、この状態を外接とも称呼する)矩形を例とするが、これは矩形に限られず、例えば円でもよい。また物体領域の外接ではなく、検知対象物体の全体の内周と接するように囲ったものでもよい。また物体の重心を中心座標としてもよい。また、回転を表わす変数を加えて用いてもよい。
図3は、複数の変数(n個)を式(1)の関数に入力し得られた、複数の物体領域候補を、ヒートマップ上に表わした例を示す。図3中の太線枠が検知対象物体(腫瘍)の全体と接するように囲った(以下、この状態を外接とも称呼する)矩形領域候補であり、それ以外の矩形は検知対象物体の一部を示す矩形領域候補となっている。矩形領域候補は、その領域内においてできるだけ検知対象物体を含み、かつ、できるだけ検知対象物体以外のものを含まないように設定される。
ステップS102においては、生成された複数の物体領域候補を受け取り、ヒートマップ生成部12は、これらの複数の物体領域候補を基にヒートマップを生成する。このステップの具体的な一動作例を、以下に説明する。
入力されたn個の各物体領域候補、即ち、Rectangle = [x, y, w, h, conf]、Rectangle = [x, y, w, h, conf]、…、Rectangle = [x, y, w, h, conf]は、領域候補内に物体が存在する確からしさを示す信頼度conf、conf、…、confを備える。この信頼度を、画像中の物体領域候補内のヒートマップの各ピクセルの値と紐付ける。即ち、ヒートマップの各ピクセルの値を conf = heatmapscore(i,j)と設定する。ここで(i,j)はヒートマップにおけるピクセルの座標位置を表す。これにより、画像を構成する各ピクセルにおいて信頼度を持つヒートマップが生成される。
図4は、ヒートマップ生成部12で生成したヒートマップの例を示す。本例においては、ヒートマップの各物体領域候補に含まれる複数のピクセルの各々の信頼度confの値を用いて、その物体領域候補の値を設定する。例えば、ある物体領域候補の信頼度confの値を、当該物体領域候補内に存在するピクセルの値とする。尚、複数の物体領域候補、例えば、物体領域候補AとBとが一部重なり合った部分(例えばこの部分をCとする)がある場合、Cの部分の信頼度の値は、物体領域候補AおよびBの信頼度を加算した値であってもよい。
ヒートマップが、ピクセル値が高いほど色が白くなるように設定されている場合、図3にて多数の物体領域候補が確認される画像の左下側の物体領域候補のピクセルの値が大きくなり、その結果、図4に示すように画像が白っぽくなる。
最後にステップS103において、生成されたヒートマップを取得した物体領域出力部13は、複数の物体領域候補の中から検知対象物体の全体と外接する物体領域候補を選択し、物体領域として出力する。
物体領域出力部13の動作について詳細に説明する。入力されたヒートマップ画像(図4)は各ピクセルにおいて物体が存在する確からしさ(信頼度)を示す値を持つ。ここで、その値が所定の閾値以上のピクセルには物体が存在するとし、当該閾値より小さいピクセルには物体が存在しないと判断する。閾値は設計者によって予め設定されていても良いし、オペレータにより変更可能に設定されていてもよい。この場合、検知対象物体が存在すると判断されたヒートマップは図5に示すもののようになる。尚、検知対象物体(腫瘍)は図6に示すように存在しているものとする。このとき、物体領域出力部13は、この物体が存在する領域の全てを囲う枠(図5、図6の枠1)を物体領域の枠として出力する。出力された画像は、外部のモニタ等に映し出され、医師等のオペレータに閲覧される。尚、出力される物体領域は、検知対象物体の形状に沿った枠(矩形枠)として出力する。
(第1の実施形態の効果)
本発明の第1の実施形態における画像処理装置100は、不規則物体の全体を示す枠を高速に表示することができる。ひいてはオペレータによる不規則物体の発見および判断を容易にすることができる。この理由は、画像処理装置100が、各物体領域候補の信頼度に基づくヒートマップを用いて各物体領域を出力するため、検知対象物体の全体に外接する物体領域を正しく出力するからである。また、物体領域候補生成部11で生成される物体領域候補の信頼度から生成されるヒートマップ内のピクセルの値と予め設定される閾値とを比較して物体領域を出力するため、ニューラルネットワーク計算量と比して、遥かに少ない計算量で、高速に物体領域を出力するからである。
<第2の実施形態>
本発明の第1の実施形態においては、画像処理装置100はヒートマップを基に検知対象物体の物体領域を出力したが、当該物体領域の出力にはヒートマップとこれに対応する物体領域候補とを同時に用いても良い。また、第1の実施形態の物体領域候補生成部11が物体領域候補を生成する処理において、当該物体領域候補の数が多すぎる場合、当該物体領域候補の組み合わせの計算に多くの処理時間を要していた。そこで本発明の第2の実施形態においては、上記の生成する処理を簡略化して、ヒートマップおよびその物体領域候補を用いて検知対象物体の物体領域を出力する手法について説明する。
(画像処理装置)
本発明の第2の実施形態に係る画像処理装置200は、図7に示すように、物体領域候補生成部21、ヒートマップ生成部22、および、物体領域出力部23を備える。
物体領域出力部23は、物体領域候補生成部21が生成した物体領域候補およびそれに対応するヒートマップ生成部22が生成したヒートマップ(生成された物体領域候補が重畳されたヒートマップ)を用いて、複数の物体領域候補の中から検知対象物体の全体と外接する物体領域候補を選択し、物体領域として出力する。
物体領域候補生成部21は、物体領域候補を生成するが、第1の実施形態(物体領域候補生成部11)と異なる点は、当該物体領域候補の数が多すぎる場合に、当該物体領域候補の組み合わせを生成しないことである。生成された物体領域候補は、当該物体領域候補をヒートマップ生成部22および物体領域出力部23に出力する。
ヒートマップ生成部22は第1の実施形態(ヒートマップ生成部12)と同様である。
(画像処理装置の動作)
図8に示すフローチャートを参照して、画像処理装置200の具体的な動作について説明する。
ステップS201およびS202については、夫々、図2のステップS101およびS102と同様である。
ステップS203において、物体領域出力部23は、物体領域候補生成部21から物体領域候補を、ヒートマップ生成部22からヒートマップを取得し、これらを基に、物体領域を出力する。このステップの具体的な一動作例を、以下に説明する。
まず、物体領域候補生成部21で生成された物体領域候補(Rectangle = [x, y, w, h, conf])と、ヒートマップ生成部22で生成されたヒートマップ(図4参照)が、物体領域出力部23に入力される。図9は、ヒートマップ(図4参照)上に描かれた複数の物体領域候補(枠)を示す。物体領域出力部23は、各物体領域候補(Rectangle = [x, y, w, h, conf]、Rectangle = [x, y, w, h, conf]、…、Rectangle = [x, y, w, h, conf])の物体領域内のピクセルに対応する、ヒートマップの各ピクセルの値(信頼度)を基に、各物体領域候補のスコアを、集計のための関数を用いて計算する。例えば、入力された物体領域候補(Rectangle)のスコアを、当該物体領域内に対応するヒートマップの各ピクセルの信頼度の和とする場合、Rectangleを変数とする関数を用いて、Score(Rectangle)=Σ(w,h)heatmapscore(i,j)とする。この後、物体領域出力部23は、物体領域候補のスコア(物体領域候補内の全ピクセルの信頼度の和)と予め設定された閾値とを比較し、当該閾値以上のスコアとなる物体領域候補を物体領域として出力する。物体領域出力部23は、物体領域候補の中から、物体領域候補のスコアが閾値以上となる物体領域候補を抽出し、それらの外縁で囲われた領域を物体領域として出力する。例えば、図10は、抽出された2つの物体領域候補2a、2bから構成される物体領域2cを表わしている。尚、物体領域候補2a、2bは、必ず1つにまとめずとも、オペレータが容易に視認可能な数であれば(例えば図10では2つ)、そのまま表示しても良い。又、閾値は設計者によって予め設定されていても良いし、オペレータによって変更可能に設定されていても良い。
(第2の実施形態の効果)
本発明の第2の実施形態に係る画像処理装置200は、不規則物体の全体を示す枠を高速に表示することができる。ひいてはオペレータによる不規則物体の発見および判断を容易にすることができる。この理由は、画像処理装置200が、各物体領域候補の信頼度に基づくヒートマップのスコアを用いて各物体領域を出力するため、検知対象物体の全体に外接する物体領域を正しく出力するからである。また、物体領域候補生成部21で生成される物体領域候補の信頼度から生成されるヒートマップ内のピクセルの値と予め設定される閾値とを比較して物体領域を出力するため、ニューラルネットワーク計算量と比して、遥かに少ない計算量で、高速に物体領域を出力するからである。
尚、第1の実施形態と比して第2の実施形態では、物体領域候補生成部21の処理が簡略化されたため、全体の処理時間を早めることができる。第2の実施形態ではヒートマップ生成部22がヒートマップからスコアを算出する集計処理が必要となるが、物体領域出力部23が、ヒートマップを用いて物体領域候補の中から物体領域を構成する物体領域候補の選択を行うことにより、物体領域候補生成部11における処理が簡略化される。このため、物体領域候補数が多い場合でも、物体領域候補生成部11の処理時間が長期化することを避けられ、ひいては、全体としての処理時間を短縮することができる。
<第3の実施形態>
第1および第2の実施形態においては、主に、検知中に検知対象物体が静止している場合を想定しているが、検知対象物体は動くこともある。例えば検知対象物体が腫瘍の場合、腫瘍そのものは動かなくても周囲の不随意筋の動きに連動して動く場合もある。また、本発明の一利用例となる内視鏡動画像におけるリアルタイム腫瘍検知システムでは、医師による内視鏡操作に伴いカメラが動くことによって、画像中の腫瘍位置が動く。よって、第3の実施形態においては、検知中に検知対象物体が動く場合であっても高速に物体領域を出力可能な画像処理装置について説明する。
(画像処理装置)
本発明の第3の実施形態に係る画像処理装置300は、図11に示すように、物体領域候補生成部31、ヒートマップ生成部32、および、物体領域出力部33を備える。尚、本実施形態においては、画像処理装置300が処理する画像は動画像(時間的に連続した一連の画像)であることを前提とする。
ヒートマップ生成部32の基本動作は第2の実施形態と同様であるが、異なる点は、図11の点線矢印に表わされるように、ヒートマップ生成部32の出力が、ヒートマップ生成部32の入力となることである。本実施形態においては、動画像を処理するため、ヒートマップ生成部32で生成された過去の画像のヒートマップを、現在の画像のヒートマップ生成に利用する。ヒートマップ生成部32は、ある腫瘍を映す画像において、過去の時刻に生成されたヒートマップと、物体領域候補生成部31が生成する現在の時刻に対応する物体領域候補を用いて、現在の時刻に対応するヒートマップを生成する。
物体領域候補生成部31および物体領域出力部33は第2の実施形態の物体領域候補生成部21および物体領域出力部23と同様である。
(画像処理装置の動作)
図12に示すフローチャートを参照して、上記画像処理装置300の具体的な動作について説明する。
ステップS301については、図8のステップS201とほぼ同じ動作であるが、物体領域候補生成部31は、所定の間隔(例えば1秒)毎に、画像を物体領域候補生成部31に入力する。または動画像中に変化があった場合に画像を入力しても良い。
ステップS302において、物体領域候補生成部31で生成した物体領域候補と過去の画像のヒートマップと受け取ると、ヒートマップ生成部32はこれらを基に、ヒートマップを生成する。このステップの具体的な一動作例を、以下に説明する。
本実施形態では、ヒートマップ生成部32は、時刻tの入力画像に対して物体領域候補生成部31およびヒートマップ生成部32によって得られた過去のヒートマップを、Score(Rectanglet,n) =Σt,i,j heatmapscore(t,i,j)とする。
ここで、例えば、時刻t+1の画像に対して物体領域候補生成部31が生成する各物体領域候補を
Rectanglet,n = [xt,n, yt,n, wt,n, ht,n, conft,n] …(式2)
とし、上記時刻tにおけるヒートマップを
Score(Rectanglet,n)=Σt,w,hheatmapscore(t,i,j) …(式3)
とした場合、式(2)および式(3)を用いて、時刻t+1におけるヒートマップを、
Score(Rectanglet+1,n)=Σt,w,hheatmapscore(t,i,j)t+1,i,jheatmapscore(t+1,i,j)…式(4)
と表わすことができる。
即ち、物体領域候補生成部31は、現時刻の画像に対する物体領域候補と過去の時刻の画像で生成されたヒートマップとを基に、現時刻のヒートマップを生成する。
尚、本例では、時刻が1つ前の画像のヒートマップを単純に加算する場合を示したが、これに限らない。例えば過去の時刻n(例えば、秒)前までの時刻のヒートマップを利用してもよい。また加算する場合、過去の時刻の各ヒートマップを等価に加算する必要はなく、各時刻に重みを与えてもよい。すなわち、
Score(Rectanglet+1,n)=wtΣt,w,hheatmapscore(t,i,j)+wt+1Σt+1,i,jheatmapscore(t+1,i,j)…(式6)
としてもよい。この各時刻の重みwtは、たとえばwt=1/tと設定してもよいし、各時刻tのヒートマップに応じて決定してもよい。例えばヒートマップ画像の類似度をwtとしてもよい。重み付けの一例として、過去に生成されたヒートマップと現在生成されたヒートマップとの一致度合いを示す類似度を算出して、重みとして利用してもよい。この場合、過去と現在において動きがない程一致度合いは高くなる。
ステップS303については、図8のステップS203と同様である。
(第3の実施形態の効果)
本発明の第3の実施形態における画像処理装置300は、検知対象物体が動き、且つ、動画像で撮影された場合であっても、不規則物体の全体を示す枠を高速に表示することができる。ひいてはオペレータによる不規則物体の発見および判断を容易にすることができる。この理由は、ヒートマップ生成部32が、現時刻の物体領域候補に加え、過去の時刻にヒートマップ生成部32にて生成されたヒートマップも用いて、ヒートマップを生成し、物体領域出力部33が、このヒートマップを用いて、物体領域候補の中から物体領域を選択するからである。更に、各時刻に重みを与え、現時刻の類似度の基づき重みづけを行うことで、検知対象物体の動きに対して安定的に不規則物体の全体を示す枠を高速に表示することができる。ひいてはオペレータによる不規則物体の発見および判断を容易にすることができる。
上述した本発明の各実施形態において、画像処理装置100、200、300、400は、画像を撮影するカメラ等の装置と一体であってもよいし、カメラ等と情報処理装置(パーソナルコンピュータなど)とを接続し、画像処理の全体動作の制御を情報処理装置側で行っても良い。即ち、情報処理装置側の画像処理用のアプリケーションプログラムを以下のような構成の下で使用してもよい。
(情報処理装置)
上述した本発明の各実施形態において、図1、7、11等に示す画像処理装置における各構成要素の一部又は全部は、例えば図13に示すような情報処理装置500とプログラムとの任意の組み合わせを用いて実現することも可能である。情報処理装置500は、一例として、以下のような構成を含む。
・CPU(Central Processing Unit)501
・ROM(Read Only Memory)502
・RAM(Random Access Memory)503
・プログラム504および他のデータを格納する記憶装置505
・記録媒体506の読み書きを行うドライブ装置507
・通信ネットワーク509と接続する通信インターフェース508
・データの入出力を行う入出力インターフェース510
・各構成要素を接続するバス511
本願の各実施形態における画像処理装置の各構成要素は、これらの機能を実現するプログラム504をCPU501が取得して実行することで実現される。画像処理装置の各構成要素(例えば、物体領域候補生成部11、ヒートマップ生成部12、物体領域出力部13)の機能を実現するプログラム504は、例えば、予め記憶装置505やRAM503に格納されており、必要に応じてCPU501が読み出す。なお、プログラム504は、通信ネットワーク509を介してCPU501に供給されてもよいし、予め記録媒体506に格納されており、ドライブ装置507が当該プログラムを読み出してCPU501に供給してもよい。
各装置の実現方法には、様々な変形例がある。例えば、画像処理装置は、構成要素毎にそれぞれ別個の情報処理装置とプログラムとの任意の組み合わせにより実現されてもよい。また、画像処理装置が備える複数の構成要素が、一つの情報処理装置500とプログラムとの任意の組み合わせにより実現されてもよい。
また、画像処理装置の各構成要素の一部又は全部は、その他の汎用または専用の回路、プロセッサ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。
画像処理装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
画像処理装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
以上、本実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、画像中に含まれる不規則かつ予測不能な形状を伴う非剛体の物体を認識する画像処理装置や、その装置をコンピュータに実現するためのプログラムといった用途に適用可能である。
100、200、300 画像処理装置
11、21、31 物体領域候補生成部
12、22、32 ヒートマップ生成部
13、23、33 物体領域出力部
500 情報処理装置
501 CPU
503 RAM
504 プログラム
505 記憶装置
506 記録媒体
507 ドライブ装置
508 通信インターフェース
509 通信ネットワーク
510 入出力インターフェース
511 バス

Claims (7)

  1. 画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成する物体領域候補生成手段と、
    前記物体領域候補を用いて前記画像中における前記位置に対応するヒートマップを生成し、過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとの一致度合いを示す類似度を用いて前記過去に生成されたヒートマップを重みづけ重みづけされた前記過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとを用いてヒートマップを再生成するヒートマップ生成手段と、
    再生成された前記ヒートマップを用いて、1つ以上の前記物体領域候補から成る、前記検知対象物体の全体を囲う物体領域を出力する物体領域出力手段
    とを備える画像処理装置。
  2. 前記ヒートマップ生成手段は、各物体領域候補が前記検知対象物体を含む確からしさを表わす信頼度を用いて、前記ヒートマップを生成する
    請求項1に記載の画像処理装置。
  3. 前記物体領域出力手段は、前記ヒートマップを区分した複数の区画毎において、当該区画に紐付けられた前記信頼度が所定の閾値以上である区画の集合を含む物体領域候補を、前記物体領域として出力する
    請求項2に記載の画像処理装置。
  4. 前記物体領域出力手段は、生成された前記物体領域候補が重畳された前記ヒートマップを用いて、前記物体領域を出力する
    請求項1または請求項3のいずれかに記載の画像処理装置。
  5. 前記検知対象物体が、内視鏡画像に映る病変である
    請求項1から請求項3のいずれかに記載の画像処理装置。
  6. 画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成し、
    前記物体領域候補を用いて前記画像中における前記位置に対応するヒートマップを生成し、
    過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとの一致度合いを示す類似度を用いて前記過去に生成されたヒートマップを重みづけ重みづけされた前記過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとを用いてヒートマップを再生成し、
    再生成された前記ヒートマップを用いて、1つ以上の前記物体領域候補から成る、前記検知対象物体の全体を囲う物体領域を出力する
    画像処理方法。
  7. 画像中における検知対象物体の少なくとも一部が存在する位置を示す物体領域候補を複数生成し、
    前記物体領域候補を用いて前記画像中における前記位置に対応するヒートマップを生成し、
    過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとの一致度合いを示す類似度を用いて前記過去に生成されたヒートマップを重みづけ重みづけされた前記過去に生成されたヒートマップと、前記生成された前記位置に対応するヒートマップとを用いてヒートマップを再生成し、
    再生成された前記ヒートマップを用いて、1つ以上の前記物体領域候補から成る、前記検知対象物体の全体を囲う物体領域を出力する
    ことをコンピュータに実現させるための画像処理プログラム。
JP2019570260A 2018-02-09 2018-02-09 画像処理装置、画像処理方法および画像処理プログラム Active JP6988926B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/004691 WO2019155628A1 (ja) 2018-02-09 2018-02-09 画像処理装置、画像処理方法および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019155628A1 JPWO2019155628A1 (ja) 2021-01-28
JP6988926B2 true JP6988926B2 (ja) 2022-01-05

Family

ID=67548244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019570260A Active JP6988926B2 (ja) 2018-02-09 2018-02-09 画像処理装置、画像処理方法および画像処理プログラム

Country Status (2)

Country Link
JP (1) JP6988926B2 (ja)
WO (1) WO2019155628A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022162766A1 (ja) * 2021-01-27 2022-08-04
WO2023181353A1 (ja) * 2022-03-25 2023-09-28 日本電気株式会社 画像処理装置、画像処理方法及び記憶媒体
WO2024024022A1 (ja) * 2022-07-28 2024-02-01 日本電気株式会社 内視鏡検査支援装置、内視鏡検査支援方法、及び、記録媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5489340B2 (ja) * 2010-03-12 2014-05-14 パナソニック株式会社 顔マスキング装置及び方法
JP6030457B2 (ja) * 2013-01-23 2016-11-24 株式会社メガチップス 画像検出装置及び制御プログラム並びに画像検出方法
JP6110174B2 (ja) * 2013-03-26 2017-04-05 株式会社メガチップス 画像検出装置及び制御プログラム並びに画像検出方法
JP6147056B2 (ja) * 2013-03-29 2017-06-14 株式会社メガチップス 画像検出装置及び制御プログラム並びに画像検出方法
JP6303090B2 (ja) * 2014-03-24 2018-04-04 アルパイン株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
WO2019155628A1 (ja) 2019-08-15
JPWO2019155628A1 (ja) 2021-01-28

Similar Documents

Publication Publication Date Title
US10860930B2 (en) Learning method, image recognition device, and computer-readable storage medium
KR102046134B1 (ko) 복수의 이미지 간 차이점을 활용한 신경망 학습 방법
Wang et al. Afp-net: Realtime anchor-free polyp detection in colonoscopy
CN112543941A (zh) 用于训练生成式对抗网络和使用经训练的生成式对抗网络的系统和方法
CN112567381A (zh) 用于处理来自医学成像设备的实时视频并检测视频中的对象的系统和方法
JP6988926B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2021513435A (ja) 胃腸腫瘍を診断するシステム及び方法
US9898819B2 (en) System and method for detecting region of interest
CN110415792B (zh) 图像检测方法、装置、计算机设备和存储介质
JP2015154918A (ja) 病変検出装置及び方法
KR102530010B1 (ko) 의료 영상 기반 질환 중증도 결정 장치 및 방법
EP2810217B1 (en) Graph cuts-based interactive segmentation of teeth in 3-d ct volumetric data
EP3981012A1 (en) Systems and methods to process images for skin analysis and to visualize skin analysis
US20220301159A1 (en) Artificial intelligence-based colonoscopic image diagnosis assisting system and method
CN108697310B (zh) 图像处理装置、图像处理方法和记录了程序的介质
Barnett et al. Interpretable mammographic image classification using case-based reasoning and deep learning
Dijkstra et al. Towards a Single Solution for Polyp Detection, Localization and Segmentation in Colonoscopy Images.
US11475568B2 (en) Method for controlling display of abnormality in chest x-ray image, storage medium, abnormality display control apparatus, and server apparatus
KR102542016B1 (ko) 의료 영상의 가명화 방법 및 장치
JP5365408B2 (ja) 移動体認識装置、移動体認識方法及びプログラム
JP6996303B2 (ja) 医用画像生成装置
US20220277445A1 (en) Artificial intelligence-based gastroscopic image diagnosis assisting system and method
WO2020194664A1 (ja) トラッキング装置、学習済モデル、内視鏡システム及びトラッキング方法
Saeed et al. MSFF: An automated multi-scale feature fusion deep learning model for spine fracture segmentation using MRI
Strümke et al. Artificial Intelligence in Medicine: Gastroenterology

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200708

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210910

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988926

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150