JP2004536367A - コンピュータ利用画像分析 - Google Patents
コンピュータ利用画像分析 Download PDFInfo
- Publication number
- JP2004536367A JP2004536367A JP2002560082A JP2002560082A JP2004536367A JP 2004536367 A JP2004536367 A JP 2004536367A JP 2002560082 A JP2002560082 A JP 2002560082A JP 2002560082 A JP2002560082 A JP 2002560082A JP 2004536367 A JP2004536367 A JP 2004536367A
- Authority
- JP
- Japan
- Prior art keywords
- interest
- feature
- data
- image data
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010191 image analysis Methods 0.000 title description 24
- 238000012706 support-vector machine Methods 0.000 claims abstract description 189
- 238000007781 pre-processing Methods 0.000 claims abstract description 48
- 238000001514 detection method Methods 0.000 claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 165
- 238000012360 testing method Methods 0.000 claims description 83
- 230000002308 calcification Effects 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 26
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 claims description 15
- 229910052704 radon Inorganic materials 0.000 claims description 14
- 230000005484 gravity Effects 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000000105 evaporative light scattering detection Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 abstract description 24
- 238000010586 diagram Methods 0.000 abstract description 13
- 238000000844 transformation Methods 0.000 abstract description 11
- 238000000605 extraction Methods 0.000 abstract description 10
- 208000004434 Calcinosis Diseases 0.000 description 52
- 230000008569 process Effects 0.000 description 25
- 238000012805 post-processing Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 15
- 206010028980 Neoplasm Diseases 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 13
- 201000011510 cancer Diseases 0.000 description 13
- 230000003211 malignant effect Effects 0.000 description 9
- 210000004204 blood vessel Anatomy 0.000 description 8
- 210000001165 lymph node Anatomy 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 238000003909 pattern recognition Methods 0.000 description 7
- 206010006187 Breast cancer Diseases 0.000 description 6
- 208000026310 Breast neoplasm Diseases 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 238000003709 image segmentation Methods 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 210000000481 breast Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 238000002059 diagnostic imaging Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000003902 lesion Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000002980 postoperative effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 208000032544 Cicatrix Diseases 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000015694 estrogen receptors Human genes 0.000 description 2
- 108010038795 estrogen receptors Proteins 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 238000009607 mammography Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000002600 positron emission tomography Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 102000003998 progesterone receptors Human genes 0.000 description 2
- 108090000468 progesterone receptors Proteins 0.000 description 2
- 231100000241 scar Toxicity 0.000 description 2
- 230000037387 scars Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 208000005475 Vascular calcification Diseases 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000004624 confocal microscopy Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003352 fibrogenic effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 244000144980 herd Species 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004256 retinal image Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002603 single-photon emission computed tomography Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Processing (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
【選択図】図11
Description
【0001】
関連出願
本出願は、2001年1月23日付け米国仮出願第60/263,381号の優先権利益を主張する。本出願はまた、2000年8月7日付け出願第09/633,410号の一部継続出願であり、当該第09/633,410号出願は2000年5月24日付け出願第09/578,011号の一部継続出願であり、当該第09/578,011号出願は2000年5月9日付け出願第09/568,301号の一部継続出願であり、当該第09/568,301号出願は現在特許第________号として発行されていて1999年5月1日付け出願第09/303,387号の継続出願であり、当該第09/303,387号出願は現在特許第6,128,608号として発行されていて1998年5月1日付け米国仮特許出願第60/083,961号の優先権を主張している。本出願は、2000年8月7日付け同時継続出願第09/633,615号、第09/633,616号、および第09/633,850号に関係し、これら出願はまた出願第09/578,011号の一部継続出願である。本出願はさらに、1999年5月1日付け出願第09/303,386号および第09/305,345号に関係し、後者は現在特許第6,157,921号として発行されており、さらに本出願は2000年11月14日付け出願第09/715,832号にも関係しており、これら全ては仮出願第60/083,961号への優先権を主張する。
【0002】
技術分野
本発明は、広く画像のコンピュータ利用分析に関し、詳しくはサポートベクトルマシンを使用するコンピュータ利用画像分析に関する。
【0003】
背景技術
電子画像信号が含むデータを最適に抽出するには、その信号の重要要素を特定する機能が必要であり、信号源および信号検出に使用する機器のノイズおよび制限の中でそれを行わねばならない。データの最適抽出および再構築が必要な主分野は画像分析分野であり、この分野におけるノイズ等の発生源は、画像から効率的にデータを抽出する機能に悪影響を与え、画像処理の本来の利用効果を悪化させる。画像分析に問題をはらんでいる分野は、例えば天文観測および惑星探査であり、この分野での発信源は微弱で、大気干渉によるノイズおよびひずみがある。また例えば軍事および防衛偵察の分野では、光が弱く、目標の動きが早いため、コントラストが低く、不鮮明である。また例えば医療画像分野では、コントラストが低く、不鮮明およびゆがみを伴うことが多いが、これらは信号源および機器の限界によるものである。画像分析の困難さに加え、デジタル化画像は大量のデータを含んでいるため、所定データ点の値を確立するには、全画像を処理しなければならない。
【0004】
デジタル画像の自動分析方法の発展は、過去数十年間に渡って多大の関心を集めており、注目分野の1つは医療分野である。応用例としては、病理画像の分析がある。病理画像は、可視、超音波、エックス線、陽電子放射、磁気共鳴等の描画方法によって作成する。医療画像を人が解釈する場合のように、自動画像分析装置は、画像中の不鮮明な特徴を認識し分類できねばならない。これは、領域間のかすかな境界であってわずか数レベルの階調または色の濃淡でしか区別できないような境界を見分けることを必要とする。
【0005】
近年、画像分析用のマシン学習方法がパターン認識に広く研究されてきた。これは、画像内の無関係な背景詳細から意味のある特徴を抽出することを可能にする。学習マシンを構成するアルゴリズムは、既知結果を有するデータを使い、一般化の教育を行える。教育した学習マシンアルゴリズムは、未知の結果を予測することに応用できる。マシン学習方法は、神経回路網、隠れマルコフモデル、信念ネットワーク、およびサポートベクトルマシンを含み、理想的な応用分野は、大量データの存在、ノイズを含むパターンの存在、および一般理論の欠如によって特徴付けられる分野である。このような方法のうち特に注目すべきは、人工神経回路網を生物医学画像分析に応用することであり、その応用結果は、神経回路網を細胞試料および乳房エックス線写真の視覚画像分析に利用して乳癌を診断すること、糖尿病患者の網膜画像の分類、染色体分析(染色体画像の視覚分析)による遺伝子異常の特定、および超音波画像における腫瘍検出等に報告されている。
【0006】
画像分析に適用されている学習マシンの大多数は、逆行性伝搬を用いて教育した神経回路網である。これは勾配法であり、教育データの分類における誤りを回路網を逆行して伝搬することにより回路網要素のバイアス重みを調整し、これを平均2乗誤差が最小になるまで行う。逆行性伝搬神経回路網の大きな欠点は、経験リスク関数が多くの局所的最小を持ちうるため、発見からの最適解があいまいになりやすいことである。逆行性伝搬神経回路網が使用する標準最適化手順は、最小に収束するであろうが、この神経回路網法は、局所的最小を得たとしても、必要とする全域的最小を保証できない。神経回路網から得る解の品質は、多くの因子に依存する。特にその神経回路網を実施する実施者の熟練度が最終結果を決定する。しかしながら、初期重みの任意選択など問題ないと思える因子も、不良結果を招くことがある。さらに神経回路網学習に使用する勾配法の収束は、本質的に遅い。別の欠点は、シグモイド関数がスケーリング因子を有するため、近似品質に影響することである。知識発見に関して神経回路網の最も大きな制限要素は、「次元の弊害」であろう。これは、教育データ中の各追加特徴または次元に必要な計算時間および性能における不均衡成長に関係する。
【0007】
神経回路網の欠点は、別タイプの学習マシンであるサポートベクトルマシンを使うことにより克服できる。一般にサポートベクトルマシンは、演繹的に選んだ非線形マッピング関数を介して高次元特徴空間に入力ベクトルをマップする。この高次元特徴空間において、最適分離超平面を構築する。次にこの最適超平面を用いて分類、回帰適合、密度予測等の実行動作を決定する。
【0008】
サポートベクトルマシン内において、特徴空間の次元数は極めて高いと思われる。例えば4次多項式マッピング関数は200次元入力空間を発生し、これを16億次元特徴空間にマップしなければならない。カーネル技術およびバプニク・チェルボネンキス(VC)次元により、サポートベクトルマシンは「次元の弊害」を避けられる。この「次元の弊害」は一般に他の方法を制限するので、それを避けることにより、前記極めて高次の特徴空間から一般化可能解を効果的に得ることができる。
【0009】
最適超平面(または一般化した最適超平面)によって教育ベクトルを分離すれば、テスト例のエラー発生確率の期待値は、教育セット例によって拘束できる。この拘束は、特徴空間の次元数に依存せず、係数ベクトルの基準にも依存せず、入力ベクトル数の制限にも依存しない。従って、最適超平面を教育セットサイズに比べて少数のサポートベクトルから構築できれば、一般化能力は無限次元空間においても高くなる。
【0010】
このようにサポートベクトルマシンは、大量の入力データからデジタル画像を分析する問題に対し、好ましい解を提供する。しかしながらサポートベクトルマシンがデータセットからデジタル化画像を分析する能力は、教育データセットが含む情報に比例して制限される。従って求められるのは、データを前処理し、教育データを強化し、サポートベクトルマシンによる画像のコンピュータ分析を最大にするようなシステムおよび方法である。
【0011】
発明の開示
デジタル化画像を分析するためのシステムおよび方法は、広く学習マシンを使用し、さらに詳しくはサポートベクトルマシンを使用する。既知の結果を有する生物学あるいは医学対象を画像化したデジタル画像データから教育データセットを構成し、それを前処理することによって学習マシンの適用を最も有効にする。本発明の目的のため、画像は生体外で取得しても良い。例えば顕微鏡を通して観察した組織試料でも良い。あるいは生体内で取得しても良い。例えばエックス線投影画像である。各教育データ点は、1つ以上の座標を有するベクトルから成る。教育データセットの前処理は、失われたまたは誤ったデータ点を特定し、適切なステップを実行してその欠陥データを修正し、あるいは必要に応じて問題範囲から観察フィールドまたは全フィールドを削除する。教育データセットの前処理はまた、各教育データ点に次元を追加するため、前記ベクトルに1つ以上の新しい座標を追加する。前記ベクトルに追加した新しい座標は、1つ以上の元座標に変換を施すことによって得ることができる。この変換は、専門知識に基づくか計算によって行える。教育データセットが連続変数から成る場合、前記変換は教育データセットの連続変数を最適分類することから成ることができる。
【0012】
サポートベクトルマシンは、前処理した教育データセットを用いて教育する。この方法において、前処理が提供する教育データの追加表現は、そのデータを分析する学習マシンの能力を強化する。サポートベクトルマシンの特定状況において、教育セットの次元数が大きいほど、そこから得られる一般化品質が高くなる。そのデータから実行する分析が回帰または密度予測に関係する場合、あるいは教育出力が連続変数から成る場合、教育出力は、その教育出力を最適分類することによって後処理し、前記連続変数をカテゴリ化できる。
【0013】
テストデータセットは、教育データセットと同様の方法で前処理する。次に、教育した学習マシンは、前処理したテストデータセットを用いてテストする。教育した学習マシンのテスト出力は、後処理し、そのテスト出力が最適解であるかを決定する。テスト出力の後処理は、前記テスト出力をフォーマットに翻訳し、そのフォーマットをテストデータセットと比較しても良い。あるいは後処理ステップは、出力データの追加処理として、人による解釈性または人への適切性を強化しても良い。
【0014】
サポートベクトルマシンの関係において、サポートベクトルマシンを教育する前に、カーネルを選択する方法を提供する。カーネル選択は、処理しようとする特定問題のあらかじめの知識、または学習マシンと共に使用する利用可能データの特性分析に基づくことができ、一般に前記データに対して行う分析の性質に依存する。最適には、後処理した教育出力またはテスト出力を比較する繰り返し処理を適用し、どの構成が最適解を提供するかの決定を行う。テスト出力が最適解でなければ、カーネル選択を調整し、サポートベクトルマシンを再教育および再テストする。最適解を特定したことが判明すれば、実データセット、すなわち結果が未知のデータセットを収集し、教育データセットと同様の方法で前処理する。前処理した実データセットは、学習マシンに入力して処理する。学習マシンの実出力は、後処理のため、計算で得た英数字分類子に翻訳する。
【0015】
一実施例において、画像データのデジタル化画像をサポートベクトルマシンによって分析するシステムを提供する。この実施例システムは、データベースを格納する記憶装置を備える。このデータベースは、教育データセットとテストデータセットとを含む。これらデータセットの各々は、画像データから成る。前記システムはさらに1つ以上のサポートベクトルマシンを実行するためのプロセッサを備える。このプロセッサは、前記データベースから前記教育データセットを収集し、前記教育データセットを前処理して複数の教育データ点の各々を強化し、前記前処理した教育データセットを用いて前記サポートベクトルマシンを教育し、前記データベースから前記テストデータセットを収集し、前記教育データセットと同じ方法で前記テストデータセットを前処理し、前記前処理したテストデータセットを用いて前記教育したサポートベクトルマシンをテストし、前記教育したサポートベクトルマシンのテスト出力を受け取り、当該テスト出力を後処理してそのテスト出力が最適解であるかを決定する。一実施例システムはまた、通信装置を備え、前記テストデータセットと教育データセットとを遠隔ソースから受け取ることができる。この場合、前記プロセッサは、前記教育データセットを前記記憶装置に格納して前処理に備え、前記テストデータセットを前記記憶装置に格納して前処理に備える。前記一実施例のシステムはまた、前記後処理したテストデータを表示するための表示装置を備える。前記一実施例システムのプロセッサは、前記追加機能の各々を実行するように動作する。前記通信装置はさらに、計算によって得られる英数字分類子を遠隔ソースへ送るように動作することもできる。
【0016】
カーネルに基づく学習マシン、特にサポートベクトルマシンを使用した画像分析手順の一実施例において、デジタル化画像データを前記プロセッサに入力し、検出部は当該画像内に注目領域(対象)を特定し区切ることによって、それら対象を背景から分離する。特徴抽出部は、前記区切った対象から分類タスクに関係する数値を作成する。前の分析ステップの結果は、サポートベクトルマシン識別器に入力し、この識別器の生成する出力は2つの可能な診断を区別するインデックスから成るか、あるいは所望の出力フォーマットにおける出力である。追加のサポートベクトルマシンを含めることにより、区切り部または特徴抽出部を支援できる。
【0017】
一好適実施例において、デジタル化画像データを複数のサブシステムに入力する。各サブシステムは、1つ以上のカーネルに基づく学習マシンを有する。各サブシステムは、画像内に発見する異なる特徴または特性に関するデータを分析する。例えば乳房エックス線写真分析の場合、あるサブシステムは石灰沈着に注目して分類し、他のサブシステムは塊に注目して分類し、第3のサブシステムは構造的変形に注目して分類する。各サブシステムがその分析および分類を完了すると、全サブシステムの出力はカーネル利用全体分析器、例えばサポートベクトルマシン利用全体分析器へ入力する。この全体分析器は、データを結合して診断、決定等の動作を行う。この動作は、画像から得た知識を利用する。
【0018】
データの前処理およびサポートベクトルマシンの教育のための特定手順は、米国特許第6,157,921号および第6,128,608号が説明しており、これらの全てを参照によりここに組み込む。画像データ処理に関し、前処理は、有用データの抽出を助けるため、既知の変換を利用することを含む。この変換は、フーリエ変換、ウエーブレット変換、ラドン変換、ハフ変換を含むことができるが、これらに限定するものではない。
【0019】
発明を実施するための最良の形態
以下の詳細説明は、多くの頭字語を使用するが、これらは当業者に広く知られているものである。それらの定義は代表的に各頭字語が最初に現れた時に提供するものの、便宜を図るため、以下の表1に、ここで使用する頭字語および略語とそれらの定義とを一覧にして提供する
【表1】
本発明は、学習マシンを使用して画像を分析する改良された方法を提供する。ここで使用する「画像」という用語は、あらゆる撮影法の生成物を意味し、従来の例えば写真撮影等の視覚方法によって得られる画像、あるいは例えば赤外線検出器への赤外線放射等、記録媒体または装置への電磁気信号放射を検出する方法によって得られる画像等を含む。ここに説明する各例において特に注目するのは、医療撮影法であり、エックス線、PET(陽電子放射断層撮影法)、MRI(磁気共鳴映像法)、CT(コンピュータ断層撮影法)、SPECT(単光子放射型コンピュータ断層撮影法)、ガンマカメラ、共焦点顕微鏡法(「視覚」とも呼ぶ)、電気インピーダンス撮影法、超音波等を含むが、これらに限定するものではない。本発明の目的に関し、画像は生体外から得ても良い。例えば顕微鏡で見た組織試料である。あるいは生体内から得ても良い。例えばエックス線投影画像である。アナログ出力を発生する撮影法に関しては、アナログ出力をデジタル化する。これは、デジタル走査によりまたはアナログ信号をデジタル信号に変換することにより、本発明に基づき分析する入力画像をデジタル形式にする。
【0020】
学習マシンにはいくつかの例が存在し、この分野における発展が期待されている。本発明の実施例は、サポートベクトルマシンに焦点を当てる。
【0021】
本発明の第1態様は、データを任意に前処理し、前処理したデータを使って学習マシンを教育し、そして/または任意に学習マシンからの出力を後処理することによる画像分析を提供する。広義に述べると、データの前処理は、データを再フォーマットまたは拡張し、学習マシンへの適用を最も好適にすることを含む。例えば画像内の1つ以上の重要特徴を評価する場合、元のグレースケール画像を前処理してビットマップを作成し、あるいは各種サイズの特徴を変換、すなわち正規化して固定次元形式にしてから処理することにより、輪郭、形状、密度等の品質を比較できるようにする必要がある。
【0022】
前処理と同様の方法で、後処理は、学習マシンの出力を翻訳し、意味のある特徴を発見する必要がある。前記出力からの意味のある特徴は、問題あるいはデータに固有であろう。後処理は、出力を翻訳して例えば人間の観察者に理解可能なあるいは有用な形式にするか、出力を変換して容易に他の保管装置または送信装置が受け取れるような形式にすることを含む。
【0023】
図1は、学習マシンを使用してデータを分析するための一般方法100を示すフローチャートである。方法100は、開始ブロック101で始まり、ステップ102へ進む。このステップにおいて、特定問題を定式化し、マシン学習を通した分析を適用できるようにする。特に重要なことは、学習マシンの所望出力の適切な定式化である。例えば、個別出資契約または市場インデックスの将来の動向を予測する場合、学習マシンは、将来の価格レベルを予測するよりも、将来の変化を予測する方がより良い動作をする。将来の価格予測は、後処理段階において得ることが可能であり、これについては後述する。
【0024】
問題の定式化後、ステップ103は教育データ収集を行う。教育データは、既知の特徴を持ったデータ点セットから成る。教育データは、1つ以上の局所および/または遠隔ソースから収集できる。教育データの収集は、手動で行うか、または既知の電子データ転送方法等の自動処理方法で行える。従って本発明に関連して使用する学習マシンの実施例は、ネットワーク化したコンピュータ環境において実施できる。学習マシンの各種実施例の動作環境例は、図10および図11に関連して詳細に説明する。
【0025】
ステップ104において、収集した教育データを任意に前処理し、学習マシンへの適用を最適にし、教育データに固有の知識を抽出できるようにする。この前処理段階中、教育データは、そのレコード内における個別または複数の測定値を変換、組合せ、操作することにより、任意に拡張できる。ここで使用する「データ拡張」とは、各入力点の決定に利用可能な観測数を変化することによって入力データの次元数を変えることを意味する(あるいはデータベーステーブル内の列を追加あるいは削除すること、と説明できる)。例えばデータ点が座標(1,4,9)から成るとすれば、このデータ点の拡張版は座標(1,1,4,2,9,3)である。この例において、拡張データ点に追加した座標は、元座標の平方根変換に基づくことが分かるであろう。データ点に次元を追加することにより、この拡張データ点は、入力データの変更表現であり、学習マシンによる分析にとってより意味がある可能性が高い。このようなデータ拡張は、学習マシンにとって、未拡張教育データには容易に現れないデータを分析する機会を与える。
【0026】
データ拡張は、何らかの意味ある変換をデータに適用することであり、かかる変換を元データに加えることである。変換が有意義であるかを決定するための基準は、入力データ自体および/またはそのデータから得られる知識のタイプに依存するであろう。データ変換の例は、専門情報の追加;ラベリング;ビットマップ等の2値変換;フーリエ、ウエーブレット、ラドン、主成分分析およびカーネル主成分分析、クラスタリング等の変換;スケーリング;正規化;確率的および統計的分析;意味テスト;強度テスト;2次元規則性の探索;隠れマルコフモデリング;等価関係の特定;分割表の適用;グラフ理論原理の適用;ベクトルマップの作成;加算、減算、乗算、除算、多項式の適用、その他代数的変換;比例関係の特定;識別力の決定等である。医療データの範囲において、潜在的意味のある変換は、既知の標準医療参照範囲との連係;生理学的切断;生理学的結合;生化学的結合;発見的規則の適用;診断基準決定;臨床的重み付けシステム;診断的変換;臨床的変換;専門知識の適用;ラベリング技術;他領域の知識の応用;ベイズのネットワーク知識等を含む。特に医療映像に関して、変換は区切り技術を含み、画像中に均一領域を認識し、それを別個の異なる対象に属するものとして認識する。画像区切り技術は、ヒストグラム閾値処理、エッジに基づく区切り、ツリー/グラフに基づく方法、領域成長、塊収縮、クラスタリング、確率またはベイズの方法、区切りのための神経回路網等を含む。これらおよびその他変換は、それらの組合せも含め、当業者には明らかであろう。
【0027】
さらに当業者には明らかな通り、データ変換は、データ点に次元を追加することなく行っても良い。例えば、1つのデータ点は、座標(A,B,C)から成ることができる。このデータ点の変換形は、座標(1,2,3)という結果でも良い。ここで座標「1」は座標「A」とのある既知の関係を有し、座標「2」は座標「B」とのある既知の関係を有し、座標「3」は座標「C」とのある既知の関係を有する。文字から数字への変換が必要になる場合もあろう。これは例えば学習マシンが文字を理解しない場合である。他のタイプの変換もデータ点に次元を追加することなく可能であり、これは元データが数字形式の場合もそうである。さらにデータを前処理してそこに意味を付加することは、不完全データ、破損データ、または「汚れた」データを分析することも含む。学習マシンは「汚れた」データを意味のある方法で処理できない。そのため前処理ステップは、データセットをクリーニングまたはフィルタリングし、汚れたデータ点を除去、補修、または置換する。
【0028】
図1に戻り、方法例100は次にステップ106へ進み、前記前処理したデータを使って学習マシンを教育する。当業者には明らかな通り、学習マシンの教育は、その動作パラメータを調整し、要求教育出力を実現する。教育出力が要求したものであるかの決定は、手動または自動で教育出力と前記教育データの既知特徴とを比較することによって行う。学習マシンは、その教育出力が教育データの既知特徴から所定誤差閾値内にある時、教育されたと見なす。ある状況においては、ステップ107において学習マシンの教育出力を後処理することが好ましいが、これは必ずしも必要ではない。前記した通り、学習マシンの出力を後処理することは、その出力を意味のある形式に翻訳することを含む。回帰問題に関しては、例えば学習マシンの出力の範囲カテゴリ化を決定し、入力データ点が正しくカテゴリ化されたかを決定する必要がある。パターン認識問題の例では、学習マシンの教育結果を後処理する必要がないことが多い。
【0029】
ステップ108において、テストデータを任意に収集し、教育した学習マシンのテスト準備をする。テストデータは、1つ以上の局所および/または遠隔ソースから収集できる。実際の場合、テストデータおよび教育データは、同一ソースから同時に収集すればよい。従ってテストデータおよび教育データセットは、共通データセットから分割し、局所記憶媒体に格納し、学習マシン用の異なる入力データセットとして使用できる。テストデータをどのように集めるかにかかわらず、使用するテストデータはいずれもステップ110において、教育データと同じ方法で前処理する必要がある。当業者には明らかな通り、学習の適切なテストは、教育データと同一フォーマットのテストデータを使用してのみ行える。次にステップ112において、前処理したテストデータがあればそれを使って学習マシンをテストする。学習マシンのテスト出力は、ステップ114において任意に後処理し、結果が好ましいものであるかを決定する。ここでも後処理ステップは、テスト出力を意味のある形式に翻訳することを含む。この意味のある形式とは、人が容易に理解できるものか、あるいは他のプロセッサと互換性のあるものである。それとは無関係に、テスト出力は後処理によってテストデータと比較できる形式にし、結果が好ましいものであるかを決定する必要がある。後処理ステップは、例えば次のようなものを含むが、これらに限定するものではない。すなわち最適カテゴリ化決定、スケーリング技術(線形および非線形)、変換(線形および非線形)、確率予測である。方法100は、ステップ116で終了する。
【0030】
図2は、知識を強化するための方法例200を示すフローチャートである。この知識は、サポートベクトルマシン(SVM)として知られている特定タイプの学習マシンを用いてデータから発見したもので良い。SVMは、一般化を提供するために特化したアルゴリズムを実行し、限られた収集データから複次元関数を予測する。SVMが特に有用であるのは、依存性予測問題を解決することである。さらに詳しくは、SVMを使用することにより、インジケータ関数(例えばパターン認識問題)および実数値関数(例えば関数近似問題、回帰予測問題、密度予測問題、および反転問題解決)を正確に予測できる。SVMを最初に開発したのはウラジミル・エヌ・バプニクである。SVMの基本概念の詳細は、彼の書籍「統計的学習理論」(ジョン・ウイリー・アンド・サンズ社、1998年)に説明されており、その全てを参照によりここに組み込む。従ってSVMの知識およびそれに関する用語の知識は、本明細書を通して前提となる。
【0031】
方法例200は、開始ブロック201で始まり、ステップ202へ進んで問題を定式化する。次にステップ203において教育データセットを収集する。図1に関連して説明した通り、教育データは1つ以上の局所および/または遠隔ソースから手動または自動処理を介して収集できる。ステップ204において教育データを任意で前処理する。ここでもデータの前処理は、当該教育データをクリーニングすることによってそのデータ内の意味を鮮明にすること、データを変換および/または拡張することを含む。当業者には明らかな通り、SVMは極めて大きな次元数を有する入力データを処理できる。実際、入力データの次元数が大きいほど、SVMが計算できる一般化は良好になる。従って、教育データを拡張しない教育データ変換も可能であるが、SVMの特定状況においては意味のある情報を追加することによって教育データを拡張することが好ましい。
【0032】
ステップ206においてSVM用カーネルを選択する。当業者には明らかな通り、カーネルを異ならせれば、SVMは所定入力データセットに対し、異なる品質の出力を生成する。従って適切なカーネルを選択することは、SVMの出力を要求品質にするために重要である。学習マシンの一実施例において、カーネルの選択は、以前の性能知識に基づいて行うことができる。当業者には明らかな通り、カーネルの例として、多項式カーネル、ラジアルベース識別子カーネル、線形カーネル等がある。別の実施例において、特定問題または特定タイプのデータセットに特化した専用カーネルを作成しても良い。さらに別の実施例において、各々が異なるカーネルを使う複数のSVMを同時に教育しテストしても良い。同時に教育しテストしたSVMの各出力の品質は、様々な選択可能測定基準または重み付けした測定基準を用いて比較し(ステップ222参照)、最も好ましいカーネルを決定する。画像処理の好適実施例は、フーリエカーネルを選択し、幾何学形状認識問題を解く。このフーリエカーネルは、詳細を後述するように、平行移動および回転において不変である。
【0033】
次にステップ208において、前処理した教育データをSVMに入力する。ステップ210において、前処理した教育データを用いてSVMを教育し、最適超平面を発生する。オプションとしてSVMの教育出力は、ステップ211において後処理しても良い。ここでも、この時点における教育出力の後処理は、好ましいあるいは必要でさえある。これは出力の範囲またはカテゴリを適切に計算するためである。ステップ212において、前記データ収集と同様に、テストデータを収集する。このテストデータは、ステップ214において、前記教育データと同様の方法で前処理する。次にステップ216において、前処理したテストデータをSVMに入力して処理し、SVMが好ましい方法で教育されたかを決定する。ステップ218においてSVMからテスト出力を受け取り、ステップ220において任意に後処理する。
【0034】
後処理したテスト出力に基づきステップ222は、SVMが最適最小値を実現したかを決定する。当業者には明らかな通り、SVMは大域的最小誤差を有する出力を確認するように動作する。しかしながら前記した通り、所定データセットに関するSVM出力結果は、一般にカーネル選択により変化する。従って所定データセットに関してSVMが確認する大域的最小値は、実際には複数存在する。ここで使用する「最適最小値」または「最適解」の用語は、SVMが確認した他の大域的最小値との比較において、最適であるとして選択した大域的最小値(例えば問題に固有であってあらかじめ確立した基準の所定セットに対する最適解)を意味する。従ってステップ222において、最適最小値を確認したかを決定することは、SVMの出力とこれまでの値あるいは所定値とを比較することを含む。このような所定値は、テストデータセットに依存する。例えばパターン認識問題に関しては、SVMによるデータ点分類は、ある特徴を持っているかあるいはそれを持っていないかであるため、50%の大域的最小誤差は最適ではない。この例における50%の大域的最小値は、コインを投げてデータ点が当該特徴を持っているかを決定する時の結果と同じである。別の例として、複数のSVMを異なるカーネルによって同時に教育およびテストする場合、各SVMの出力を互いに比較し、その特定セットのカーネルに関する実際的最適解を決定する。最適解を確認したかの決定は、手動または自動の比較処理によって行うことができる。
【0035】
教育したSVMが最適最小値を実現していないと決定されれば、ステップ224へ進み、カーネル選択を調整する。カーネル選択の調整は、1つ以上の新しいカーネルを選択すること、またはカーネルパラメータを調整することから成る。さらに、複数のSVMを同時に教育しテストした場合は、選択カーネルを交換または変更すると共に、他のカーネルを制御目的に再使用しても良い。カーネル選択を調整した後、方法200をステップ208から繰り返し、前処理した教育データをSVMに入力して教育する。ステップ222において最適最小値が実現したと決定した場合、方法はステップ226へ進み、前記したように実データを収集する。当然ながら実データはまだ評価されていないため、教育データおよびテストデータにおいて既知であった所望の出力特徴は、未知である。
【0036】
ステップ228において、教育データおよびテストデータと同様の方法で、実データを前処理する。ステップ230において、前処理した実データをSVMに入力して処理する。SVMの実出力をステップ232において受け取り、それをステップ234において後処理する。学習マシンの一実施例において、後処理は、前記SVMの出力を計算によって得られる英数字識別子に変換し、人またはコンピュータが解釈できるようにすることから成る。前記英数字識別子は、人またはコンピュータが容易に理解できる単一値から成ることが好ましい。方法200は、ステップ236で終了する。
【0037】
図3は、最適カテゴリ化方法の一例300を示すフローチャートである。この方法300は、データの前処理、または学習マシンからの出力の後処理に使用できる。また後述するように、本例の最適カテゴリ化方法は、学習マシンから離れ、スタンドアロンカテゴリ化技術として使用しても良い。最適カテゴリ化方法例300は、開始ブロック301で始まり、ステップ302へ進んで入力データセットを受け取る。この入力データセットは、連続変数からの一連のデータサンプルから成る。このデータサンプルは、2つ以上の分類カテゴリに入る。次にステップ304において、ビン変数およびクラス追跡変数を初期化する。当業者には明らかな通り、ビン変数は解像度に関係し、クラス追跡変数はデータセット内の分類数に関係する。ビン変数およびクラス追跡変数の初期値を決定することは、手動であるい自動処理で実行できる。この自動処理は、例えば入力データセットを分析するためのコンピュータプログラムである。ステップ306において、各ビン用のデータエントロピを計算する。エントロピは数学的量であり、無作為分布の不確実さを測定するものである。方法例300において、エントロピを使用して入力変数の傾斜を測定し、最大分類能力を実現する。
【0038】
方法300は、連続変数上に一連の「切れ目」を作成し、連続変数を独立したカテゴリに分割する。方法例300が選択する切れ目は、結果としての各独立カテゴリの平均エントロピが最小になることにおいて最適である。ステップ308において、連続変数から成る入力データセットに全ての切れ目を配置したかを決定する。全ての切れ目が置かれていなければ、ステップ310において、順次ビン組合せを切断決定に関してテストする。方法例300は、ステップ310からステップ306を経由してステップ308へ戻り、連続変数から成る入力データセット内に全ての切れ目が置かれたかを再び決定する。全切れ目が置かれていれば、システム全体のエントロピをステップ309において評価し、より多くのまたはより少ない切れ目をテストした以前の結果と比較する。最小エントロピ状態が決定されたと結論できなければ、別の可能な切れ目選択を評価する必要があり、方法はステップ311へ進む。ステップ311から、まだテストしていない切れ目を選択し、ステップ304からの前記処理を繰り返す。ビン幅によって決まる解像度限界までテストを行うか、あるいは最小解への収束を確認すれば、ステップ312において最適分類基準を出力し、ステップ314において最適カテゴリ化方法例300を終了する。
【0039】
最適カテゴリ化方法300は、ダイナミックプログラミング技術を利用する。当業者には明らかな通り、ダイナミックプログラミング技術を使用することにより、複雑問題の解決効率を著しく向上できる。これは慎重にアルゴリズムを構成して冗長計算を減らすことにより実現する。最適カテゴリ化問題において、直接的な方法により多大な努力で可能な切れ目の全てを連続変数中に探すことは、アルゴリズムを指数関数的に複雑にし、中程度サイズの入力に対してさえ問題を追跡不能にする恐れがある。目的関数の追加特性、すなわち本問題における平均エントロピを利用することにより、問題を一連のサブ問題に分割できる。各サブ問題を解決するためのアルゴリズム的サブ構造を適切に構築し、サブ問題の解を格納すれば、極めて多量の冗長計算を特定しそれを避けることができる。ダイナミックプログラミング方法を使用する結果、最適カテゴリ化方法例300は、1つの多項式の複雑さを有するアルゴリズムとして実現でき、これを使用して大型サイズの問題を解決できる。
【0040】
前記した通り、最適カテゴリ化方法例300を使用してデータの前処理および/または学習マシン出力の後処理を行える。例えば、前処理変換ステップとして最適カテゴリ化方法例300を使用し、実データから分類情報を抽出できる。後処理技術として最適カテゴリ化方法例300を使用し、データに客観的に基づいたマーカ用最適カットオフ値を決定できる。これを特別な方法に頼らずに行える。明らかな通り、最適カテゴリ化方法例300は、パターン認識、分類、回帰問題等に応用できる。最適カテゴリ化方法例300はまた、スタンドアロンカテゴリ化技術として、SVMや他の学習マシンから独立して使用できる。最適カテゴリ化方法300のスタンドアロン提供の例は、図7を参照して説明する。
【0041】
画像分析に使用するデータの前処理例において、画像区切ることは、背景から対象を分離し、元画像の顕著な特徴を強調する手段を提供する。医療分野においては特に頻繁であるが、2つ以上の対象が重なりあるいは群れていることがある。例えば2次元ゲル画像分析において、いくつかの点が群れていることがある。細胞画像において、各細胞が重なっていることがある。乳房エックス線写真において、石灰沈着および塊が重なることがある。このような場合、対象物の分離は効果的な分析システムにとって重要である。
【0042】
図5aを参照すると、2つの部分的に重なった塊502および504がグレイスケール画像として示されている。一実施例において、「重力」モデルを反復的にそのグレイスケール画像に適用し、前記塊を収縮する。デジタル画像においては、画素値は「塊」値と見なし、塊中の重力を収縮動作に使用する。この処理は、星および惑星形成過程に似ている。最初広く拡散している塊502および504は、重力モデルの下で収縮し、それぞれの質量中心へ向かい、2つの密集し良好に形成した物体を図5bの502’および504’のように形成する。この方法は、画像自体における自然パターンによって実行する。画像の特徴に関する事前情報は必要ない。重力モデルは、ノイズおよび異常値の影響を受けない。しかも汎用的であり、画素動作に関する閾値を調整するだけで、異なるタイプの画像に適用できる。一般原理において、重力モデルは、画像区切りにおいて知られている領域成長アルゴリズムの反転と考えても良い。すなわち、「種」から拡張する代わりに、対象物を「種」へと収縮し、はっきりした種を特定できる。あるいは他の既知の画像区切りアルゴリズムを使用し、画像データを前処理し、画像分析処理を強化しても良い。
【0043】
図4は、未拡張データセット400の一例を示す。このデータセットは、サポートベクトルマシンの入力として使用できる。このデータセット400を「未拡張」と呼ぶ理由は、そこに何の追加情報も加えていないからである。図示の通り、この未拡張データセットは、教育データセット402と、テストデータセット404とから成る。未拡張教育データセット402と未拡張テストデータセット404とは、共に例えばデータ点406等のデータ点からなり、医療被験者からの臨床履歴データに関係している。本例において、データセット400を使用し、SVMを教育し、乳癌患者が再発を経験するか否かを決定する。
【0044】
各データ点は、406a〜fで示す通り、5つの入力座標または次元と、出力分類とを含む。これらは、各患者について集めた医療データである。特に第1座標406aは「年齢」を表し、第2座標406bは「エストロゲンレセプタレベル」を表し、第3座標406cは「プロゲステロンレセプタレベル」を表し、第4座標406dは「総抽出リンパ節」を表し、第5座標406eは「陽性(癌性)抽出リンパ節」を表し、出力分類406fは「再発分類」を表す。データ400の重要既知特徴は、出力分類406f(再発分類)であり、本例においては、医療被験者が治療に対して肯定的に応答し癌の再発が無かった(−1)か、あるいは否定的に応答し癌の再発があった(1)かを示す。この既知特徴は、教育データを処理しながらのSVM学習に使われ、SVMにテストデータを入力して評価する「ブラインド」テストに使われ、医療患者の実データにおいては明らかに未知である。
【0045】
表2は、図4に示した未拡張教育データセット402によって教育し未拡張データセット404によってテストしたSVMのテスト出力例を示す。
【表2】
テスト出力は後処理し、人またはコンピュータが理解できるようにした。この表に依れば、テスト出力が示していることは、SVMによって合計24サンプル(データ点)を検査し、SVMは8の陽性サンプルの内4(50%)を不正確に識別した。すなわち陽性サンプルを陰性と認めた。そして16の陰性サンプルの内6(37.5%)を不正確に識別した。すなわち陰性サンプルを陽性と認めた。
【0046】
図6は、拡張データセット例600を示す。これはサポートベクトルマシンの入力として使用できる。このデータセット600を「拡張」と呼ぶ理由は、追加情報がそこに加わっているからである。追加情報を別にすれば、拡張データセット600は図4に示した未拡張データセット400と同一である。拡張データセットに加えた追加情報は、図3に関連して説明した最適カテゴリ化方法例300を用いて供給した。図示のように、拡張データセットは教育データセット602とテストデータセット604とを備える。拡張教育データセット602と拡張テストデータセット604とは共に、例えばデータ点606のようなデータ点からなり、医療被験者の履歴データに関係する。ここにおいてもデータセット600を使用してSVMを教育し、乳癌患者が疾病の再発を経験するかを学習させる。
【0047】
最適カテゴリ化方法例300の適用において、各拡張データ点は、20の座標(または次元)606a1〜3から606e1〜3までと出力分類606fとを含み、これらは包括的に各患者の医療データとそのカテゴリ化変換を表す。特に第1座標606aは「年齢」を表し、第2座標から第4座標606a1〜606a3は変数であり、その組み合わせによって年齢のカテゴリを表す。例えば、年齢範囲のカテゴリ化は「若年」、「中年」、および「老年」のカテゴリであり、データ中の年齢範囲に対応している。図示のように、変数列「0」(606a1)、「0」(606a2)、「1」(606a3)を使って、ある年齢の値が「老年」にカテゴリ化されることを示す。同様に変数列「0」(606a1)、「1」(606a2)、「0」(606a3)を使って、ある年齢の値が「中年」にカテゴリ化されることを示す。また変数列「1」(606a1)、「0」(606a2)、「0」(606a3)を使って、ある年齢の値が「若年」にカテゴリ化されることを示す。図6を調べると、606aの「年齢」範囲の値の最適カテゴリ化は、方法例300を使用すると、31〜33=「若年」、34=「中年」、35〜49=「老年」と決定したことが分かる。他の座標、すなわち座標606b「エストロゲンレセプタレベル」、座標606c「プロゲステロンレセプタレベル」、座標606d「総抽出リンパ節」、座標606e「陽性(癌性)抽出リンパ節」も、各々同様の方法で最適にカテゴリ化する。
【0048】
表3は、図6の拡張教育データセット602で教育し拡張データセット604でテストしたSVMからの拡張テスト出力例を示す。
【表3】
テスト出力は後処理し、人またはコンピュータが理解できるようにした。ここに示す通り、拡張テスト出力が示していることは、SVMによって合計24サンプル(データ点)を検査し、SVMは8の陽性サンプルの内4(50%)を不正確に識別し、16の陰性サンプルの内4(25%)を不正確に識別した。従って、この拡張テスト出力と表2の未拡張テスト出力とを比較すれば、データ点の拡張は結果を向上させる(すなわち大域的最小誤差が低くなる)ことが分かる。特に不必要に継続癌治療を受ける患者の事例を減らせる。
【0049】
図7は、図3で説明した最適カテゴリ化方法300のスタンドアロンアプリケーションに対する入力例および出力例を示す。図8の例において、入力データセット801は、「陽性リンパ節数」802と対応する「再発分類」804とから成る。この例において、最適カテゴリ化方法300を入力データセット801に適用し、最適カットオフ点の位置を決め、癌再発用治療を決定する。これは術後組織サンプルから集めた陽性リンパ節数のみに基づいて行う。良く知られている臨床基準は、少なくとも3つの陽性節を持つ全ての患者に対し治療を処方することである。しかしながら最適カテゴリ化方法300は、入力データ801に基づく最適カットオフが、表4に示すように、より高い値の5.5個のリンパ節であるべきことを示す。この数字は、少なくとも6個の陽性リンパ節を有する患者に追跡治療を処方する臨床規則に対応する。
【表4】
下記の表5に示す通り、臨床カットオフ点(≧3.0)を受け入れた従来技術は、正しく分類した再発47%、正しく分類した非再発71%であった。
【表5】
すなわち、再発の53%を間違って分類し(さらなる治療を不適切に推奨しなかった)、非再発の29%を間違って分類した(さらなる治療を誤って推奨した)。これに反し、最適カテゴリ化方法300が決定したカットオフ点(≧5.5)は、正しく分類した再発33%、正しく分類した非再発97%であった。すなわち、再発の67%を誤って分類し(さらなる治療を不適切に推奨しなかった)、非再発の3%を誤って分類した(さらなる治療を誤って推奨した)。
【0050】
この例が示すように、最適カテゴリ化方法例300を使うことにより、術後癌治療法を避けることができる患者を正しく特定する事例を高くできるであろう。最適カテゴリ化方法300が決定したカットオフ点は、再発について誤って分類したパーセントがやや高いものの、誤って非再発に分類したパーセントが極めて低い。相殺して考えれば、また最適化問題の目標は不必要な治療を避けることであることを考えれば、最適カテゴリ化方法300が決定したカットオフ点の結果は、従来技術の臨床カットオフ点よりも数学的に優れている。この種の情報は、化学療法等の治療を行うか、あるいは乳癌再発の危険を犯すかを選択する患者に対し、追加の識見を与える上で極めて有用である。
【0051】
表6は、線形カーネルから成る第1サポートベクトルマシンと多項式カーネルから成る第2サポートベクトルマシンとからの後処理出力例を比較して示す。
【表6】
表6は、カーネル選択における変動がSVM出力の品質レベルに影響を与えることを示している。ここに示す通り、第1SVMの後処理出力(列I)は、線形内積カーネルから成り、24サンプルの所定テストセットについて、8の陽性サンプル中6を誤って識別し、16の陰性サンプル中3を誤って識別した。これと比較し第2SVMの後処理出力(列II)は、多項式カーネルから成り、同一テストセットについて、8の陽性サンプル中わずか2を誤って識別し、16の陰性サンプル中4を誤って識別した。この比較によれば、多項式カーネルは、陽性サンプルの識別に関して極めて向上した結果を提供し、陰性サンプルの識別においてわずかに悪い結果を提供した。このように、当業者には明らかな通り、このデータセットについては、多項式カーネルに関する大域的最小誤差は線形カーネルに関する大域的最小誤差よりも低い。
【0052】
図8および以下の説明は、本発明のコンピュータ利用画像分析を実施するための適切なコンピューティング環境を簡単に全体的に示す。図8に示すシステムは、従来のパーソナルコンピュータ1000であるが、当業者には明らかな通り、本発明は他のタイプのコンピュータシステム構成を用いても実施できる。コンピュータ1000は、中央処理装置1022と、システムメモリ1020と、入出力(I/O)バス1026とを含む。システムバス1021は、中央処理装置1022をシステムメモリ1020へ接続する。バスコントローラ1023は、I/Oバス1026上のデータフローと、中央処理装置1022と各種内部および外部I/O装置との間のデータフローとを制御する。I/Oバス1026に接続したI/O装置は、ダイレクトメモリアクセス(DMA)コントローラ1024を用いて、システムメモリ1020への直接アクセスを有しても良い。
【0053】
I/O装置は、装置インタフェースセットを介してI/Oバス1026に接続する。この装置インタフェースは、ハードウエア部品とソフトウエア部品とを共に含むことができる。例えばハードディスク装置1030や、取り出し可能媒体1050を読み書きするためのフロッピーディスク装置1032を、ディスク装置コントローラ1040を介してI/Oバス1026に接続しても良い。光学媒体1052を読み書きするための光学ディスク装置1034を小型コンピュータシステムインタフェース(SCSI)1041を用いてI/Oバス1026に接続しても良い。あるいはIDE(インテグレーテッド・ドライブ・エレクトロニクス、すなわちPC用ハードディスク装置インタフェース)、ATAPI(アタッチメント・パケット・インタフェース、すなわちCD−ROMおよびテープ装置インタフェース)、またはEIDE(強化IDE)インタフェースを、例えばCD−ROM装置等の光学装置に関連させても良い。これら装置および関係するコンピュータ読み取り可能媒体は、コンピュータ1000に不揮発性記憶を提供する。前記したコンピュータ読み取り可能媒体に加え、例えばZIP装置等の他のタイプのコンピュータ読み取り可能媒体を使用することもできる。
【0054】
表示装置1053は、例えばモニタであり、ビデオアダプタ1042等の他のインタフェースを介してI/Oバス1026に接続する。パラレルインタフェース1043は、レーザプリンタ1056等の同期周辺装置をI/Oバス1026に接続する。シリアルインタフェース1044は、通信装置をI/Oバス1026に接続する。ユーザは、コンピュータ1000にコマンドや情報を入力する際、シリアルインタフェース1044を経由するか、キーボード1038、マウス1036、モデム1057等の入力装置を使用する。他の周辺装置(図示せず)、例えば音声入出力装置や画像キャプチャ装置をコンピュータ1000に接続することもできる。
【0055】
多数のプログラムモジュールを前記装置やシステムメモリ1020に格納できる。システムメモリ1020は、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)を含むことができる。プログラムモジュールは、コンピュータ1000の機能方法、ユーザ、I/O装置、または他のコンピュータとの相互作用方法を制御する。プログラムモジュールは、ルーチン、オペレーティングシステム1065、アプリケーションプログラム、データ構造、および他のソフトウエアまたはファームウエア部品を含む。一実施例において、学習マシンは1つ以上の前処理プログラムモジュール1075A、1つ以上の後処理プログラムモジュール1075B、および/または1つ以上の最適カテゴリ化プログラムモジュール1077および1つ以上のSVMプログラムモジュール1070から成ることができ、これらは駆動装置またはコンピュータ1000のシステムメモリ1020に格納する。特に前処理プログラムモジュール1075A、後処理プログラムモジュール1075B、SVMプログラムモジュール1070は、コンピュータ実行可能命令から成ることができ、データを前処理し、学習マシンからの出力を後処理し、図1および2を参照して説明した方法例に基づく学習アルゴリズムを実行する。さらに最適カテゴリ化プログラムモジュール1077は、コンピュータ実行可能命令から成ることができ、図3を参照して説明した方法例に基づいてデータセットを最適にカテゴリ化する。
【0056】
コンピュータ1000は、遠隔コンピュータ1060等の1つ以上の遠隔コンピュータへの論理接続を使用するネットワーク環境で動作できる。遠隔コンピュータ1060は、サーバ、ルータ、ピア装置、あるいは他の共通ネットワークノードで良く、代表的にコンピュータ1000に関連して説明した要素の多くまたは全てを含む。ネットワーク環境において、プログラムモジュールおよびデータは、遠隔コンピュータ1060に格納しても良い。図8に示す論理接続は、ローカルエリアネットワーク(LAN)1054およびワイドエリアネットワーク(WAN)1055を含む。LAN環境において、ネットワークインタフェース1045は、例えばイーサネットアダプタカードであり、コンピュータ1000を遠隔コンピュータ1060に接続するために使える。WAN環境において、コンピュータ1000は、モデム1057等の電話通信装置を用いて接続を確立できる。明らかな通り、図示のネットワーク接続は一例であり、他の装置を使ってコンピュータ間の通信リンクを確立しても良い。
【0057】
他の実施例において、複数のSVMを使い、複数のデータセットを階層的に平行または順次処理するように構成しても良い。特に1つ以上の第1レベルSVMを教育およびテストして第1タイプのデータを処理し、1つ以上の第1レベルSVMを教育およびテストして第2タイプのデータを処理することができる。さらに別のタイプのデータを他の第1レベルSVMで処理することもできる。これら第1レベルSVMのいくつかあるいは全ての出力は、論理方法において結合し、1つ以上の第2レベルSVM用入力データセットを作成する。同様の方法において、複数の第2レベルSVMの出力は、論理方法において結合し、1つ以上の第3レベルSVM用入力データを作成する。SVMの階層は、適切な範囲においていかなる数のレベルにでも拡張できる。このように、低階層レベルSVMを使用して高レベルSVMへ入力するデータを前処理する。また高階層レベルSVMを使用して、低階層レベルSVMからの出力データを後処理する。
【0058】
階層内の各SVMあるいはSVMの各階層レベルは、別個のカーネルで構成しても良い。例えば第1タイプのデータを処理するためのSVMは、第1タイプのカーネルで構成し、第2タイプのデータを処理するためのSVMは第2の別タイプのカーネルを使用しても良い。さらに同一または異なる階層レベル内の複数のSVMは、別個のカーネルを使って同一タイプのデータを処理するように構成しても良い。
【0059】
図9は、SVMの階層システムの例を示す。図示のように、1つ以上の第1レベルSVM1302aおよび1302bを教育およびテストして第1タイプの入力データ1304aを処理する。このデータは、例えば乳房エックス線写真データであり医療被験者に関係する。1つ以上のこれらSVMは、別個のカーネルから成り、カーネル1およびカーネル2と示す。また1つ以上の追加の第1レベルSVM1302cおよび1302dを教育およびテストして第2タイプのデータ1304bを処理する。このデータは、例えば細胞学試料のゲノムデータまたは画像であり、同一または異なる医療被験者のものである。またこれら1つ以上の追加SVMは、個別カーネルから成り、カーネル1およびカーネル3と示す。各第1レベルSVMからの出力は、互いに比較する。例えば1306aと1306bを比較し、1306cと1306dを比較し、最適出力1308aおよび1308bを決定する。次に2グループの第1レベルSVMからの最適出力1308aおよび1308bを結合し、新しい多次元入力データセット1310を形成する。これは例えば乳房エックス線写真とゲノムデータに関係する。新しいデータセットは、1つ以上の適切に教育しテストした第2レベルSVM1312aおよび1312bによって処理する。第2レベルSVM1312aおよび1312bからの結果出力を比較し、最適出力1316を決定する。最適出力1316は、乳房エックス線写真とゲノムデータ点間の原因関係を識別するであろう。当業者には明らかな通り、他の組合せの階層SVMを使用し、データ分析を必要とする分野あるいは業界における異なるタイプのデータを平行にあるいは連続に処理することもできる。
【0060】
画像分析への応用において、複数SVMを使用し、デジタル化画像から抽出する異なるタイプのデータを処理する。異なるタイプのデータは、画像から見つかる対象の異なる特徴あるいは品質であり、例えばサイズ、形状、密度、量、方位等である。以下の例は、複数SVMを画像分析、特に乳房エックス線写真を分析して乳癌を診断する応用例である。
【0061】
乳房組織における石灰沈着は懸念材料である。なぜならそれは、ある構成において癌腫に関係するからである。乳房エックス線写真によって識別した微小石灰沈着のコンピュータ利用検出および分類は、画像分析分野において重要な関心領域である。(例えばIWDM2000、第5回デジタル乳房エックス線写真国際研究会の概要参照)。乳房エックス線写真の通常選別では、かなりのパーセントにおいて何らかの石灰沈着を示すので、全ての石灰沈着を単に検出することはほとんど利益がない。なぜなら全てのタイプの石灰沈着が同一の臨床的意味を持っているわけではないからである。一般に、微小石灰沈着は悪性経過に関係し、巨大石灰沈着は良性経過に関係している。しかしながら石灰沈着の他の特徴は、良性または悪性の形状、数、および分布等に関係していることを示すことがある。従って、良性石灰沈着と癌に関係するものとを区別する性能は、乳房エックス線写真のコンピュータ利用画像分析において成功の鍵である。
【0062】
疑わしい異常に関する2つの追加カテゴリは塊と構造的変形とであり、これらが乳房エックス線写真に見られた場合、悪性腫瘍の存在の可能性がある。塊は、3次元病変であり、癌の局所的指標である。塊は、その位置、サイズ、形状、縁特徴、エックス線減衰(放射線濃度)、周囲組織への影響によって説明する。構造的変形は、通常組織パターンの病巣崩壊である。放射線写真において、崩壊は、周囲組織が病巣中心内へ「内側に引っ張られる」ように現れる。
【0063】
図10は、本発明に基づくSVMを使った乳房エックス線写真分析用基本分析手順を示すフローチャートである。デジタル化した乳房エックス線写真画像1102をプロセッサに入力し、検出部1104は画像1102内の注目領域(対象)を発見し、区切ることによってこれら対象を背景から分離する。特徴抽出部1106は、区切った対象から、分類タスクに関係する数値を作成する。SVM分類器1108は、良性と悪性とを区別するインデックスを作成する。
【0064】
乳房エックス線写真に関する本発明の画像分析システムおよび方法の実施例の実行は、3つのSVM利用検出サブシステムを石灰沈着1202、塊1204,および構造的変形1206に使用する。これらの各々は、図11に示すように、デジタル化した乳房エックス線写真画像1201を入力として受け取る。3つのサブシステムの各々は別々に開発するが、各サブシステムの基本構造は同様である。3つのサブシステムの出力は、別のSVM1250に入力し、全体分析を行い、最終出力を提供する。この最終出力は、本例の場合、悪性腫瘍の存在あるいは不在を示す診断である。
【0065】
3つのサブシステムの各々において、検出部は画像中に注目領域を発見し、対象を背景から分離する。特徴抽出部は、区切った対象から分類タスクに関係する数値を作成する。SVM分類器は、良性と悪性とを区別するインデックスを作成する。
【0066】
各部はモジュール構造であるため、平行して開発できる。(例えば図8のモジュール1070参照)。例えば、石灰沈着区切り部1202を開発する場合、広範囲の画像を代表する悪性、良性、および通常状態の選択セットを使い、設計を行い、テストし、汎用で堅固正確なアルゴリズムを作成する。同時に、SVM分類器1242は、手動で準備した入力データによって開発およびテストする。300画像(良性150、悪性150)のセットを使ってSVMを教育した。328画像の独立セットを使ってテストした。高次元入力特徴を用い、自動抽出した特徴について十分な性能を確認した。各部は、統合し調整して最適性能を出すようにする。
【0067】
石灰沈着検出サブシステム1202において、石灰沈着を発見する第1ステップは、画像データを処理し、乳房エックス線写真上に輝点を見つけることである。すなわち石灰沈着を区切ることである(ステップ1212)。好適実施例において、この方法は2次元離散関数F(x,y)の極値を見つけることを含む。乳房エックス線写真がグレイスケール画像から成るとすれば、問題は画像中の白点と黒点とを区別することを含む。この問題を解決する従来方法は、各点(x,y)例えばピクセルに関して、ある点の値F(x,y)が全ての隣接点における値より低くないかを決定することである。コンピュータ内の画像は、各点(ピクセル)について8個の隣接点を有する。極小および極大を特定するための他の従来方法は、関数F(x,y)が決定した全点(x,y)にガウスフィルタを適用することを含む。本問題を解決する他の方法は、極値を見つけることを含むが、既知方法の全ては、1)各点において多くの計算を行うことを求め、2)画像中の全点(ピクセル)に適用しなければならない。その結果、これらアルゴリズムは、非常に時間が掛かる。
【0068】
本発明の一態様において、2次元離散関数の極値を見つける方法は、全点(x,y)の検査を避けることにより、処理時間を劇的に減らす。特に極大および極小は、画像中の点を用いて決定し、輝度のピクセル毎の評価を行わない。画像中の点は、一連の輝度閾値と比較し、複数のビットマップを発生する。この方法のグレイスケール画像の一例を図12に示す。当然ながら、コンピュータ内の画像の輝度F(xi,yj)は、離散関数である。輝度は、輝度のレベル数をN(例えばN=32または16または他の値)に減少することによりさらに区別できる。次にグレイ画像をN個の2値(黒(1)および白(0))画像(ビットマップ)のセットに変換する。ビットマップL(L=1,2,...N)において、ピクセルは、初期画像Fの対応するピクセルの輝度がFLより大きければ、黒である。ここでFL=(L−1)・(Fmax−Fmin)/Nである。そうでなければピクセルは白である。図12を参照すると、右の画像の黒い中心は、最高レベルビットマップ(レベルN)にマップされ、極大に対応する。次に低いレベルのビットマップ(レベルN−1)は、別の閾値を定義し、レベルN−1を越える曲線上の値は、N−1レベルビットマップに関して黒である。この結果、2タイプの点が識別される。これら点は、レベルNを越える値を持つものと、レベルN−1を越える値を持つものである。レベルNを越える輝度レベルを持つ点は、レベルN−1ビットマップにも含まれることになる。これら点を区別するため、2つのビットマップ(レベルNとレベルN−1)を重ねる。第1タイプの点はレベルN−1上の点であり、「ボトム点」と呼ぶ。レベルN−1ビットマップ上の残りの点は、図12に示す通り、「トップ点」を表す。ボトム点は、トップ点の極大の曲線の傾斜を表す。この処理は、レベルN−2からのビットマップとレベルN−1からのビットマップとを重ねることによって繰り返し、これらレベルにおいて新しいトップ点とボトム点、例えば(N−1)トップ点と(N−2)ボトム点を識別する。この処理をさらに繰り返し、全極大すなわちトップ点と、ボトム点とをNレベルの各々について見つける。これによって画像のピクセル毎の分析を実行する必要がなくなる。
【0069】
石灰沈着は、輝点の幾何学的配置を説明することによって分類できる。点の幾何学的配置を分析する方法は、連続特徴の高速計算について説明した前記ビットマップに基づく。例えば、点に対応する傾斜を分析し、ある背景特徴を区別できる。低傾斜を有する点は、血管の交点または接続する組織によって生成されることが分かっている。一方、極めて急な傾斜を有する点は、主に人工物(エマルジョンの障害)によって発生する。傾斜を予測するため、極大に対応する点の境界または外周、すなわち「上縁」を使用する。そして傾斜を表す点の境界または外周、すなわち「下縁」を使用する。上縁と下縁との間の輝度差は分かっている((Fmax−Fmin)/N)ため、これら縁間の距離(例えばピクセル数)は、傾斜の値に比例する。このため、傾斜の決定は、極めて低い計算コストで行える。なぜなら、輝点(極大)を探すための前記ステップにおいて既に準備した2値ビットマップを使うからであり、追加で必要となるのは、境界間のピクセル数を数えることだけである。ここで注意すべきは、点は非対称であって形状が不規則であることが多いため(特に悪性腫瘍に関係しているものは)、この距離は方向が異なると異なる。従って傾斜は、方向毎に異なることがある。
【0070】
石灰沈着検出サブシステム1202の他の側面は、各点を石灰沈着あるいは非石灰沈着に分類することである。この目的のため、点のいくつかの特徴を計算する。例えば、1)トップ点の面積、2)ボトム点の面積、3)上縁の長さ、4)下縁の長さ、5)トップ点に関する面積対境界比率、6)ボトム点に関する面積対境界比率である。ただしこれらに限定するものではない。石灰沈着を他の輝点から分けるため、SVMマシンに基づくパターン認識技術を使用する。
【0071】
画像解釈のほとんどの問題において、画像の各部の状況を考慮する必要がある。これは、乳房エックス線写真中に石灰沈着を識別する問題においても当てはまる。与えられたレベルLの輝点の周囲領域の少なくとも3つの特徴を考慮しなければならない。すなわち1)トップ点を中心として半径RIの円に入るレベルL−1の点の合計面積、2)石灰沈着のより明白な特徴と他の対象との近接性、3)その点は血管上に位置しているか、である。(血管石灰沈着は、血管に沿って走る平行軌跡または線形管状石灰沈着として見ることができ、代表的に良性と分類される)。このような非局所的方法の結果、次のような石灰沈着探索手順を使用する。
【0072】
A.輝点を探す。
【0073】
B.幾何学的特徴を計算する。
【0074】
C.SVMを使って顕著な石灰沈着を認識する。
【0075】
D.石灰沈着認識用基準を緩和し、これら基準を顕著な石灰沈着の近辺に適用する。
【0076】
E.「石灰沈着」が血管上に位置しているかを決定し、そうであればそれを削除する。
【0077】
以下は、ステップEにおいて血管を識別するための方法を提供する。この目的のため、各2値ビットマップ上の各点を次のように分析する。
【0078】
E1 境界ピクセルを探す。
【0079】
E2 対向する境界(左右境界、または上下境界)に共通なカーネルピクセルを保持する。
【0080】
E3 上境界に属するカーネルピクセルを削除する。
【0081】
E4 境界ピクセルを探す。
【0082】
E5 右境界に属する境界ピクセルを削除する。
【0083】
E6 境界ピクセルを探す。
【0084】
E7 下境界に属する境界ピクセルを削除する。
【0085】
E8 境界ピクセルを探す。
【0086】
E9 左境界に属する境界ピクセルを削除する。
【0087】
E10 E1に戻って全ステップを繰り返すことにより、ビットマップ上の全ピクセルをカーネルピクセルにする。
【0088】
ステップE1〜E10の手順は、血管を識別するものであり、全体に帯状の各点、すなわち血管のように長い点を、中心線(接続したピクセルのセット)に見えるように変換する。すなわち図13の上図に示すように、帯の「骨格」のようにする。帯状でない点については、すなわち血管でないものについては、ステップE1〜E10に基づいて決定したカーネルピクセルのセットが適切な長さの接続線を形成しないので、そのような点は血管ではないことを示す。例えば図13の下図である。
【0089】
微小石灰沈着の群れは、比較的小サイズであり高密度であるという特徴がある。アルゴリズムは、回帰ピーク探索技術と形態的動作とを組合せ、極めて正確な石灰沈着検出と区切りとを実現する。
【0090】
好適実施例に基づく区切りは、重なったあるいは接近した対象を区別するために行うもので、図5を参照して説明した通りであるため、説明を繰り返さない。しかしながら簡単に説明すれば、重なった石灰沈着を特定した場合、重力モデルを適用し、それら対象を縮小し、判別できるようにする。
【0091】
石灰沈着の区切り(ステップ1212)の後、局所SVM分析器1222は、区切りアルゴリズムが検出した各石灰沈着の特徴を分析する。石灰沈着が悪性腫瘍に関係しているかを定量的に測定することは、SVMが行う。第1段階局所SVM分析器1222からの全評価を第2段階SVM1242が使用し、より大域的な群れの評価を行う。
【0092】
あるSVMに関して、入力データは同一次元数を有さねばならない。区切った石灰沈着はサイズが異なるため、適切な変換を行って様々なサイズの画像部分を固定次元形式に変換する必要があり、これを重要情報を失わずに行わねばならない。以下の変換手順は、石灰沈着の輪郭を固定次元ベクトルに変換する。これを図14に示す。
【0093】
1.石灰沈着900の質量中心902を計算する。
【0094】
2.質量中心902を極座標系の原点として使用し、石灰沈着の輪郭をn個の等間隔角度でサンプル抽出する。これにより、n個の半径測定904が得られ、これらはn個の次元ベクトル[r1,r2,K,rn]を形成する。
【0095】
3.ステップ2で得たベクトルに離散フーリエ変換を適用する。その結果としてのn次元複素ベクトルをSVMへの入力として使用する。
【0096】
nは、半径線をサンプルする所定数であるため、結果ベクトルの次元数は、入力石灰沈着サイズにかかわらず固定である。この方法は、不自然な再サンプリングまたは穴埋めを回避する。フーリエ変換は、サンプリング構成の周期的性質を利用し、回転不変式等の基本特徴を強化する。
【0097】
図11に戻り、局所SVM分析ステップ1222の結果を処理し、特徴抽出(ステップ1232)を行う。悪性および良性の石灰沈着を区別することに関係することが知られている特徴を抽出し、その結果を大域SVM分類器1242へ送る。有用な特徴は、石灰沈着数、面積、外周、位置、方位、および石灰沈着の偏心を含む。
【0098】
SVMは、一般化を犠牲にすることなく高次元入力データを処理する能力を持つため、多数の特徴を入力に追加できる。分類器に対する各特徴の貢献は小さいものの、特徴の全セットは、集合的にSVMに十分な情報を提供し、適切な分類を遂行できる。
【0099】
SVMまたは他のカーネル利用方法において重要な構成部品は、特徴空間において内積を定義するために使用するカーネルである。このカーネルは、入力ベクトル間の類似性を非線形方法で記述する。カーネル利用システムの性能は、与えられた問題の基本特徴を把握するカーネルを適切に設計することに掛かっている。好適実施例において、幾何学的形状認識および分類問題を特に処理するためのフーリエカーネルを使用する。明らかに必要なことは、カーネルが平行移動および回転の変換において不変なことである。画像から検出した輪郭は、サイズも異なる。カーネルは、広範囲の形状パターンを扱えるように堅固でなければならず、同時に分類のための重要情報を維持できるように繊細でなければならない。輪郭が与えられると、フーリエカーネルを次のように計算する。
【0100】
1.平面におけるジョルダン(単純連続閉じた)曲線である輪郭が与えられると、その輪郭を複素数値関数z(s)、0≦s≦1として表す。輪郭の質量中心を複素平面の原点と見なし、輪郭上の点を前記関数の複素数に関連付ける。
【0101】
2.z(s)のフーリエ係数を次数Nまで計算する。
【数1】
3.フーリエ係数fnおよびgnを有する2つの輪郭z(s)およびw(s)について次のようにカーネルを定義する。
【数2】
フーリエカーネルは、他のカーネルに比べ、形状分類問題を扱う上で多くの利点を持っている。すなわち、1)フーリエカーネルは、平行移動および回転に不変である。平行移動あるいは回転した形状は、元の形状と正確に同じであるとカーネルは見なす。この不変性は、カーネル設計において完全に自動的におよび透明に実現する。コストのかかる整列や探索を必要としない。2)フーリエカーネルは、形状分類に関する重要情報を忠実に保持する。フーリエ級数は、元の輪郭の正確な代表である。有限な項目数により、オリジナルの正確な近似である。回転特徴は、自然的な方法で除去され、他の基本特徴に影響を与えない。3)フーリエカーネルは、計算効率が良い。少数の項目(例えばN=10)があれば、一般にほとんどの実際的適用に十分である。また高速フーリエ変換(FFT)等の既存高速アルゴリズムを利用し、さらに効率を高められる。
【0102】
当業界で良く知られている他のタイプの変換を使用しても、画像データを直接分析せずに、元の画像データから有用なデータを抽出できよう。そのような変換の1つは「ウエーブレット変換」であり、画像の多重解像度分析用の強力なツールを提供する。ウエーブレット変換は、空間およびスケーリングの両方において関数を局所化する。ウエーブレット変換における係数は、あるスケールにおける特徴としてSVM分類器用に使用できる。
【0103】
他のタイプの変換である「ラドン変換」は、空間ドメイン中の画像点をラドン変換ドメイン中の正弦曲線にマップし、当該点が存在するであろう全可能曲線のパラメータを提供する。ラドン変換の重要な特性は、極めてノイズの多い画像から線(曲線)を抽出することである。2次元ラドン変換は、対象の形状および裂片の数に関する多くの有用な特徴の数値表現を発生できる。対象の形状は、凸状、延伸状、および角度状を含む。(形状分析のための2次元ラドン変換の使用については、リーバース・ブイ・エフによる「2次元ラドン変換を使用した研磨粉末粒子の特徴決定用形状分類発生」電気電子学会、パターン分析および機械知能会報、第22巻、第23号、2000年12月を参照でき、それを参照によりここに組み込む)。ハフ変換は、ラドン変換の特別な場合であり、画像分析における標準的ツールであり、変換したパラメータ空間における局所パターン(理想的には点)の認識によって、画像空間における大域パターン認識を可能とする。これが特に有用であるのは、探索するパターンがまばらにデジタル化されていたり、穴を持っていたり、画像にノイズが多い場合である。(市販のマトラブ(登録商標)ソフトウエア(マサチューセッツ州ナティックのマスワークス社)の画像処理ツールボックスにおいて利用可能なラドン関数も、ハフ変換の実行に使用できる)。
【0104】
大域SVM分類器1242内のSVMを教育し、選択した特徴および局所SVM分析器1222の結果に基づき、悪性と良性の石灰沈着を分類する。ほぼ同数の良性および癌性石灰沈着の教育データセットを使用し、大域SVM分析器1242を教育する。その結果のSVMを独立したテストデータセットでテストし、その性能および一般化能力を評価する。この教育課程を繰り返し、SVM用の最適カーネルおよび構造を選択する。図9に示した例のような複数SVM構成を使用し、複数のSVMによって同一教育およびテストデータセットを処理し、実データを処理するために最適の出力を提供するSVMを選択しても良い。
【0105】
ソフトマージンSVMの強化版を大域SVM分類器1242の好適実施例に使用する。従来のソフトマージンSVMは、次の汎関数を最大にすることによって構成する。
【数3】
次の制限を課す。
【数4】
定数Cは、誤分類した点にペナルティを課すために選択する。
【0106】
強化ソフトマージンSVMにおいて、定数Cは、全入力ベクトルについて必ずしも同一でなくて良い。特に、良性および悪性に異なるCを選択し、見過ごした癌および偽警告に異なるペナルティを関連付けても良い。強化SVMは、次の汎関数を最大にして構成する。
【数5】
次の制限を課す。
【数6】
塊検出サブシステム1204は、石灰沈着サブシステム1202と類似である。しかしながら、石灰沈着に代えて、サブシステム1204の前処理ステップは、塊を検出して区切り、その塊に関する特徴を抽出するように特に設計する。SVM教育手順は、石灰沈着サブシステム1202と同じである。
【0107】
異常を示す重要な指標となるのは、左右画像間の非対称密度パターンと、異なる時間において撮影した乳房エックス線写真画像における変化とである。非対称密度領域を検出することは、全システムの性能を著しく向上できる。対称においてさえ完全な一致を期待するのは現実的でないため、非対称検出(ステップ1214)に使用する一致および位置合わせアルゴリズムは、密度パターンにおける通常の小さな変動を許容する。このアルゴリズムの主眼は、2つの画像間における比較的高密度の領域における位相幾何学的差異である。非対称検出1214の手順は次の通りである。
【0108】
1.比較対象の2つの画像における密度の高い領域を代表する2つのグラフを形成する。
【0109】
2.2つのグラフの頂点間の最適一致を探す。
【0110】
3.一致しない頂点を評価し、許容変動内において隣接頂点に融合できる頂点を削除する。
【0111】
4.残る不一致頂点は、非対称密度を表す。
【0112】
乳房エックス線写真画像における塊の外見は、一般に石灰沈着よりもかなり微妙である。塊区切りステップ1224において、幾何学的変換技術を使用し、不明確な境界を検出する。ハフ変換は、前記した通り、線または円等の特定形状を画像内に検出するために適用できる。ラドン変換は、不規則形状を扱う上で有用である。
【0113】
特徴抽出ステップ1234は、石灰沈着サブシステム1202の特徴抽出ステップ1232と同様の方法で実行する。抽出すべき重要な特徴は、位置、サイズ、形状、縁、およびエックス線減衰である。塊領域のテクスチャ等の追加品質の評価も、塊検出サブシステム1204における特徴抽出に有用である。
【0114】
SVM分類器1244は、石灰沈着サブシステムにおける大域SVM分類器1242と同様の手順を用いて教育およびテストする。SVM分類器1244は、1つ以上のSVMから成り、特徴抽出ステップ1234の出力を受け取り、そのデータを各抽出した特徴の適切なカテゴリに分類する。例えば、塊形状は、次の特徴の1つを有するであろう。丸、楕円、裂片、あるいは不規則である。SVM分類器1244は、データを形状特徴の4つのカテゴリの1つに分配する。同様に、5タイプの縁がある。すなわち、外接、不明瞭、極小裂片、あいまい、針状である。SVM分類器は、この5つの縁カテゴリの1つにデータを分配する。悪性腫瘍の診断に関係する多くの異なる塊の特徴を考えた場合、SVM分類器1244を階層構成にし、各特徴に少なくとも1レベルのSVMを割り当て、最適出力を結合し、より高いレベルのSVMに処理させ、最終的に1つの出力をSVM分類器1244から発生するようにすることが好ましい。この出力は、全体SVM分析器1250への入力とし、この全体分析器は塊検出結果と石灰沈着および構造変形サブシステムの結果とを結合し、診断を作成する。
【0115】
構造変形検出サブシステム1206は、石灰沈着サブシステム1202に似る。前処理ステップ、針状縁検出器1216、および特徴抽出1226は、疑わしい領域を検出し、構造変形に関する特徴を抽出すべく特別設計である。針状縁は、放射線として代表的に現れ、あるいは「日輪」パターンとして現れ、浸潤する腫瘍の可能性と関連する線維形成過程を表しうる。一方、以前の生体検査からの術後傷跡、放射傷跡、外傷、感染も、針状縁を有する病変を生成する。従って他の検出サブシステムの結果に関連して針状縁が存在することは、良好な診断ツールを提供する。SVM分類器1236用SVM教育手順は、他の検出サブシステムについて既に説明した分類器と同一である。SVM分類器1236の出力は、代表的に針状変形の存在または不在を示す出力を提供する。この出力は、他の検出サブシステムの出力と結合し、全体SVM分析器1250への入力とし、悪性腫瘍の存在あるいは不在の診断に使用する。
【0116】
先の例は、乳房エックス線写真を分析して乳癌を診断する手順を説明したが、本発明に基づくコンピュータ利用画像分析の適用は、それに限定するものではなく、デジタル映像自体の適用と同じように広範囲である。一般に、デジタル画像を分析して決定を補助する例えば医療、工業、地質学、宇宙探索、空中または宇宙偵察等の状況において、あるいは単純に画像の主対象に関する情報を提供することにおいて、画像が多くのデータ点を含み多くの解釈を伴う場合、本発明に基づく画像分析を使用することで利益を得られる。
【0117】
本発明の他の実施例は、当業者には明らかであろう。このような他の実施例も、本発明の要旨び範囲に入ると考える。従って、本発明の範囲は、請求の範囲によって明らかにするものであり、前記説明によって補助するものである。
【図面の簡単な説明】
【0118】
本発明の実施例を以下に列挙する図面を参照して説明する。これら図面において、同一番号は同等要素を示す。
【図1】学習マシンを使用してデータ分析を行うための一般方法の一例を示すフローチャートである。
【図2】サポートベクトルマシンを使用してデータを分析するための方法の一例を示すフローチャートである。
【図3】スタンドアロン構成、あるいは前処理または後処理技術用学習マシンとの連係で使用できる最適カテゴリ化方法の一例を示すフローチャートである。
【図4】サポートベクトルマシンへ入力可能な非拡張データセットの一例を示す図である。
【図5a.5b】画像における階調特性を示す図であり、図5aは未処理画像を示し、図5bは区切り前処理を行った後の画像を示す。
【図6】サポートベクトルマシンへ入力可能な拡張データセットの一例を示す図である。
【図7】図3の最適カテゴリ化方法のスタンドアロン適用における入力および出力の一例を示す図である。
【図8】本発明の一実施例の動作環境の一例を示す機能ブロック図である。
【図9】複数のサポートベクトルマシンの階層システムを示す機能ブロック図である。
【図10】サポートベクトルマシンを使用した画像分析の基本処理流れを示す機能ブロック図である。
【図11】乳房エックス線写真の分析に使用する複数の検出サブシステムを有する画像分析システムの一例を示す機能ブロック図である。
【図12】階調から階調曲線へのマッピングを示す結合曲線とビットマップ画像とを示す図である。
【図13】乳房エックス線写真に含まれる石灰沈着画像の特徴抽出処理後のビットマップ画像を示す図である。
【図14】画像セグメントを固定次元形式に変換するための前処理変換を示す図である。
Claims (54)
- (a)教育用画像データセットとテスト用画像セットとをプロセッサに入力し、
(b)各画像データセットを前処理することにより、当該画像データから少なくとも1つの注目特徴の存在を検出し抽出できるようにし、
(c)前記前処理した画像データセットを使用して、少なくとも1つのカーネルを有する少なくとも1つの学習マシンを教育してテストすることにより、少なくとも1つの注目特徴を複数の推定し得る特性クラスの少なくとも1つに分類し、
(d)前記テスト用画像データセットから分類した特徴と前記テスト用画像データセットの既知結果とを比較し、最適解が得られたか決定し、
(e)最適解が得られなければステップ(c)および(d)を繰り返し、
(f)最適解が得られれば、実画像データセットを前記プロセッサに入力し、
(g)前記実画像データセットを前処理することにより、当該画像データから注目特徴の存在を抽出できるようにし、
(h)前記少なくとも1つの特徴を分類し、
(i)前記実画像データセットから分類した少なくとも1つの注目特徴から成る出力を発生する、デジタル化した画像を分析するためのコンピュータ実行方法。 - ステップ(a)および(f)はさらに、前記教育用、テスト用、および実データセットの各々を複数の検出サブシステムの各々に入力し、各検出サブシステムは複数の注目特徴の1つを検出し分類すべく適応しており、各注目特徴は複数の推定し得る特性を持っており、各サブシステムは対応する注目特徴についての出力を発生する、請求項1の方法。
- さらに(j)複数のサブシステム各々からの出力を結合し、
(k)少なくとも1つのカーネルを有する少なくとも1つの全体学習マシンに前記結合した出力を入力し、
(l)前記デジタル化画像の分類から成る全体出力を発生する、請求項2の方法。 - 前記全体学習マシンは、ソフトマージンサポートベクトルマシンである、請求項3の方法。
- 前記ソフトマージンサポートベクトルマシンは、分類誤りに対する可変ペナルティを適用して強化する、請求項4の方法。
- 前記デジタル化画像は乳房エックス線写真から成り、前記複数のサブシステムは石灰沈着検出サブシステムと塊検出サブシステムと構造変形サブシステムとから成る、請求項3の方法。
- 前処理ステップ(b)および(g)は、注目特徴を区切って当該注目特徴を背景から分離し、区切った注目特徴に関する数値を発生する、請求項1の方法。
- 区切ることは、前記画像データにおいて各区切った注目特徴に対応する極値を特定することから成る、請求項7の方法。
- 前記注目特徴は輝度を有する点から成り、極値を特定することは前記点の輝度を複数の輝度レベルの1つ以上に分類することから成る、請求項8の方法。
- 幾何学的配置は1つの推定し得る特性であり、幾何学的配置は2つの異なる輝度レベルにおける点の境界間の傾斜変化を測定して決定する、請求項9の方法。
- 前処理ステップ(b)および(g)は、注目特徴を区切り、区切った特徴を固定次元ベクトルに変換することから成る、請求項1の方法。
- 変換することは、
注目特徴の質量中心を計算し、
前記質量中心に原点を有する極座標系を用いて注目特徴の輪郭をサンプリングし、複数の半径測定を提供し、
前記複数の半径測定を用いてベクトルを形成し、
前記ベクトルにフーリエ変換を適用して固定次元ベクトルを提供することから成る、請求項11の方法。 - 前記少なくとも1つの注目特徴は複数の注目特徴から成り、前記前処理ステップ(b)および(g)は、各注目特徴に重力モデルを適用して各特徴を別体に収縮することにより、第1の注目特徴を少なくとも部分的に重なっている第2の注目特徴から区分することから成る、請求項1の方法。
- 前処理ステップ(b)および(g)は前記画像データに変換を適用し、当該変換は、ウエーブレット変換とラドン変換とハフ変換とからなるグループから選択する、請求項1の方法。
- 前記少なくとも1つのカーネルはフーリエカーネルである、請求項1の方法。
- (a)教育用画像データセットとテスト用画像セットとを複数の処理モジュールから成るプロセッサに入力し、
(b)各注目特徴に1つの処理モジュールを割り当て、
(c)各注目特徴について、各画像データセットを前処理することにより、当該画像データから前記注目特徴の存在を検出し抽出できるようにし、
(d)各注目特徴について、前記前処理した画像データセットを使用して少なくとも1つの第1レベルサポートベクトルマシンを教育してテストすることにより、前記対応する注目特徴を複数の推定し得る特性の少なくとも1つに分類し、
(e)前記テスト用画像データセットから分類した特徴と前記テスト用画像データセットの既知結果とを比較し、最適解が得られたか決定し、
(f)最適解が得られなければステップ(d)および(e)を繰り返し、
(g)最適解が得られれば、実画像データセットを前記プロセッサに入力し、
(h)前記実画像データセットを前処理することにより、当該画像データから注目特徴の存在を検出し抽出できるようにし、
(i)各注目特徴をその推定し得る特性に基づいて分類して出力を発生し、
(j)前記複数の注目特徴についての出力を結合し、
(k)前記結合した出力を少なくとも1つの第2レベルサポートベクトルマシンに入力し、
(l)前記デジタル化画像の分類から成る全体出力を発生する、複数の注目特徴を有するデジタル化画像のコンピュータ利用分析を行う方法。 - 前記第2レベルサポートベクトルマシンは、ソフトマージンサポートベクトルマシンである、請求項16の方法。
- 前記ソフトマージンサポートベクトルマシンは、分類誤りに対する可変ペナルティを適用して強化する、請求項17の方法。
- 各第1レベルサポートベクトルマシンは、フーリエカーネルを使用する、請求項16の方法。
- 前記デジタル化画像は乳房エックス線写真から成り、前記複数の処理モジュールは石灰沈着検出サブシステムと塊検出サブシステムと構造変形サブシステムとから成る、請求項16の方法。
- 前処理ステップ(c)および(h)は、注目特徴を区切って当該注目特徴を背景から分離し、区切った注目特徴に関する数値を発生する、請求項16の方法。
- 区切ることは、前記画像データにおいて各区切った注目特徴に対応する極値を特定することから成る、請求項21の方法。
- 前記注目特徴は輝度を有する点から成り、極値を特定することは前記点の輝度を複数の輝度レベルの1つ以上に分類することから成る、請求項22の方法。
- 幾何学的配置は1つの推定し得る特性であり、幾何学的配置は2つの異なる輝度レベルにおける点の境界間の傾斜変化を測定して決定する、請求項23の方法。
- 前処理ステップ(c)および(h)は、注目特徴を区切り、区切った特徴を固定次元ベクトルに変換することから成る、請求項16の方法。
- 変換することは、
注目特徴の質量中心を計算し、
前記質量中心に原点を有する極座標系を用いて注目特徴の輪郭をサンプリングし、複数の半径測定を提供し、
前記複数の半径測定を用いてベクトルを形成し、
前記ベクトルにフーリエ変換を適用して固定次元ベクトルを提供することから成る、請求項25の方法。 - 各デジタル化画像は複数の単一注目特徴を含み、前処理ステップ(c)および(h)は、各注目特徴に重力モデルを適用して各特徴を別体に収縮することにより、第1の注目特徴を少なくとも部分的に重なっている第2の注目特徴から区分することから成る、請求項16の方法。
- 前処理ステップ(c)および(h)は前記画像データに変換を適用し、当該変換は、ウエーブレット変換とラドン変換とハフ変換とからなるグループから選択する、請求項16の方法。
- (a)教育用乳房エックス線写真データセットとテスト用乳房エックス線写真セットとを複数の検出サブシステムから成るプロセッサに入力し、各検出サブシステムは複数の注目特徴の1つを分析し、
(b)複数の検出サブシステムの各々に1つの処理モジュールを割り当て、
(c)各検出サブシステムにおいて、各乳房エックス線写真データセットを前処理することにより、当該検出サブシステムに対応する注目特徴の存在を検出し抽出できるようにし、
(d)各検出サブシステムにおいて、前記前処理した乳房エックス線写真データセットを使用して少なくとも1つの第1レベルサポートベクトルマシンを教育しテストすることにより、前記対応する注目特徴を複数の推定し得る特性の少なくとも1つに分類し、
(e)前記テスト用乳房エックス線写真データセットから分類した特徴と前記テスト用乳房エックス線写真データセットの既知分析とを比較し、最適解が得られたか決定し、
(f)最適解が得られなければステップ(d)および(e)を繰り返し、
(g)最適解が得られれば、乳房エックス線写真実データセットを前記プロセッサに入力し、
(h)前記乳房エックス線写真実データセットを前処理することにより、当該乳房エックス線写真データから注目特徴の存在を検出し抽出できるようにし、
(i)各注目特徴をその推定し得る特性に基づいて分類して出力を発生し、
(j)前記複数の注目特徴についての出力を結合し、
(k)前記結合した出力を少なくとも1つの第2レベルサポートベクトルマシンに入力し、
(l)デジタル化乳房エックス線写真の分析から成る全体出力を発生する、デジタル化乳房エックス線写真のコンピュータ利用分析を行う方法。 - 前記注目特徴は、石灰沈着と塊と構造変形とである、請求項29の方法。
- 前記第2レベルサポートベクトルマシンは、ソフトマージンサポートベクトルマシンである、請求項29の方法。
- 前記ソフトマージンサポートベクトルマシンは、分類誤りに対する可変ペナルティを適用して強化する、請求項31の方法。
- 各第1レベルサポートベクトルマシンは、フーリエカーネルを使用する、請求項29の方法。
- 前処理ステップ(c)および(h)は、注目特徴を区切って当該注目特徴を背景から分離し、区切った注目特徴に関する数値を発生する、請求項29の方法。
- 区切ることは、前記画像データにおいて各区切った注目特徴に対応する極値を特定することから成る、請求項34の方法。
- 前記注目特徴は輝度を有する点から成り、極値を特定することは前記点の輝度を複数の輝度レベルの1つ以上に分類することから成る、請求項35の方法。
- 幾何学的配置は1つの推定し得る特性であり、幾何学的配置は2つの異なる輝度レベルにおける点の境界間の傾斜変化を測定して決定する、請求項36の方法。
- 前処理ステップ(c)および(h)は、注目特徴を区切り、区切った特徴を固定次元ベクトルに変換することから成る、請求項29の方法。
- 変換することは、
注目特徴の質量中心を計算し、
前記質量中心に原点を有する極座標系を用いて注目特徴の輪郭をサンプリングし、複数の半径測定を提供し、
前記複数の半径測定を用いてベクトルを形成し、
前記ベクトルにフーリエ変換を適用して固定次元ベクトルを提供することから成る、請求項38の方法。 - 各デジタル化画像は複数の単一注目特徴を含み、前処理ステップ(c)および(h)は、各注目特徴に重力モデルを適用して各特徴を別体に収縮することにより、第1の注目特徴を少なくとも部分的に重なっている第2の注目特徴から区分することから成る、請求項29の方法。
- 前処理ステップ(c)および(h)は前記画像データに変換を適用し、当該変換は、ウエーブレット変換とラドン変換とハフ変換とからなるグループから選択する、請求項29の方法。
- プロセッサと、
処理すべき画像データを受け取る入力装置と、
前記プロセッサと通信するメモリ装置と、前記プロセッサは複数の検出サブシステムを格納し、当該複数の検出サブシステムの各々は、
前記画像データ中の注目特徴の1つを検出して抽出する前処理部と、
前記注目特徴を複数の推定し得る特性の少なくとも1つに分類する少なくとも1つの第1レベルサポートベクトルマシンから成る分類部と、
前記分類した注目特徴を出力する出力部とを備え、
第2レベルサポートベクトルマシンを有し、前記複数の検出サブシステムの出力を結合して前記デジタル化画像の分析を発生する全体分析装置とを備える、複数の注目特徴を有するデジタル化画像の分析を行うコンピュータシステム。 - 前記少なくとも1つの第1レベルサポートベクトルマシンは、フーリエカーネルを使用する、請求項42のコンピュータシステム。
- 前記第2レベルサポートベクトルマシンは、ソフトマージンサポートベクトルマシンである、請求項42のコンピュータシステム。
- 前記ソフトマージンサポートベクトルマシンは、分類誤りに対する可変ペナルティを適用して強化する、請求項44のコンピュータシステム。
- 前記デジタル化画像は乳房エックス線写真から成り、前記複数の検出サブシステムは石灰沈着検出サブシステムと塊検出サブシステムと構造変形サブシステムとから成る、請求項42のコンピュータシステム。
- 前処理部は、注目特徴を背景から分離する区切りルーチンを適用し、当該区切った注目特徴に関する数値を発生する、請求項42のコンピュータシステム。
- 区切りルーチンは、前記画像データにおいて各区切った注目特徴に対応する極値を特定する、請求項47のコンピュータシステム。
- 前記注目特徴は輝度を有する点から成り、極値は前記点の輝度を複数の輝度レベルの1つ以上に分類することによって特定する、請求項48のコンピュータシステム。
- 幾何学的配置は1つの推定し得る特性であり、幾何学的配置は2つの異なる輝度レベルにおける点の境界間の傾斜変化を測定して決定する、請求項49のコンピュータシステム。
- 前記前処理部は、注目特徴を区切り、当該区切った特徴に固定次元ベクトルへの変換を適用する、請求項42のコンピュータシステム。
- 変換は、
注目特徴の質量中心を計算し、
前記質量中心に原点を有する極座標系を用いて注目特徴の輪郭をサンプリングし、複数の半径測定を提供し、
前記複数の半径測定を用いてベクトルを形成し、
前記ベクトルにフーリエ変換を適用して固定次元ベクトルを提供することから成る、請求項51のコンピュータシステム。 - 各デジタル化画像は複数の単一注目特徴を含み、前記前処理部は、各注目特徴に重力モデルを適用して各特徴を別体に収縮することにより、第1の注目特徴を少なくとも部分的に重なっている第2の注目特徴から区分する、請求項42のコンピュータシステム。
- 前記前処理部は前記画像データに変換を適用し、当該変換は、ウエーブレット変換とラドン変換とハフ変換とからなるグループから選択する、請求項42のコンピュータシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26338101P | 2001-01-23 | 2001-01-23 | |
PCT/US2002/003070 WO2002059828A2 (en) | 2001-01-23 | 2002-01-23 | Computer-aided image analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004536367A true JP2004536367A (ja) | 2004-12-02 |
JP3947109B2 JP3947109B2 (ja) | 2007-07-18 |
Family
ID=23001553
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002560082A Expired - Fee Related JP3947109B2 (ja) | 2001-01-23 | 2002-01-23 | コンピュータ利用画像分析 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1356421B1 (ja) |
JP (1) | JP3947109B2 (ja) |
AT (1) | ATE450834T1 (ja) |
AU (1) | AU2002243783B2 (ja) |
CA (1) | CA2435290C (ja) |
DE (1) | DE60234571D1 (ja) |
ES (1) | ES2337556T3 (ja) |
WO (1) | WO2002059828A2 (ja) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006221607A (ja) * | 2005-01-13 | 2006-08-24 | Univ Chuo | 判別分析を行う方法、プログラム及び装置 |
JP2007098143A (ja) * | 2005-10-07 | 2007-04-19 | Medison Co Ltd | 超音波映像システム及び超音波映像処理方法 |
JP2008533486A (ja) * | 2005-03-16 | 2008-08-21 | エルジー・ケム・リミテッド | バッテリーの充電状態を推定する装置及び方法 |
JP2008535566A (ja) * | 2005-04-05 | 2008-09-04 | ボストン サイエンティフィック リミテッド | 多段分類器を用いた画像分割のためのシステム及び方法 |
JP2009061253A (ja) * | 2007-08-15 | 2009-03-26 | Fujifilm Corp | 画像成分分離装置、方法、およびプログラム |
JP2009186243A (ja) * | 2008-02-04 | 2009-08-20 | Nippon Steel Corp | 判別装置、判別方法及びプログラム |
JP2010262360A (ja) * | 2009-04-30 | 2010-11-18 | Ntt Docomo Inc | レコメンド情報配信装置およびレコメンド情報配信方法 |
WO2015069087A1 (ko) * | 2013-11-11 | 2015-05-14 | 삼성전자주식회사 | 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치 |
KR101864412B1 (ko) * | 2017-12-28 | 2018-06-04 | (주)휴톰 | 학습용 데이터 관리방법, 장치 및 프로그램 |
WO2018216623A1 (ja) * | 2017-05-25 | 2018-11-29 | 日本電気株式会社 | 地球科学データ解析装置、地球科学データ解析方法、及びコンピュータ読み取り可能な記録媒体 |
KR20190014912A (ko) * | 2017-08-04 | 2019-02-13 | 동국대학교 산학협력단 | 지정맥 인식 장치 및 방법 |
JP2019535424A (ja) * | 2016-11-22 | 2019-12-12 | ハイパーファイン リサーチ,インコーポレイテッド | 磁気共鳴画像における自動検出のためのシステムおよび方法 |
JP2020014799A (ja) * | 2018-07-27 | 2020-01-30 | コニカミノルタ株式会社 | X線画像物体認識システム |
JP2020042757A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
WO2022239896A1 (ko) * | 2021-05-10 | 2022-11-17 | 주식회사 씨앤에이아이 | 유방 이미지 변환 장치 및 방법 |
US11841408B2 (en) | 2016-11-22 | 2023-12-12 | Hyperfine Operations, Inc. | Electromagnetic shielding for magnetic resonance imaging methods and apparatus |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7313268B2 (en) | 2002-10-31 | 2007-12-25 | Eastman Kodak Company | Method for using effective spatio-temporal image recomposition to improve scene classification |
CN100455267C (zh) * | 2005-08-17 | 2009-01-28 | 北京天惠华数字技术有限公司 | 一种对b超胎儿性别鉴别进行记录的方法 |
CN101947113B (zh) | 2005-12-28 | 2011-12-07 | 奥林巴斯医疗株式会社 | 图像处理装置和该图像处理装置中的图像处理方法 |
US7640105B2 (en) | 2007-03-13 | 2009-12-29 | Certus View Technologies, LLC | Marking system and method with location and/or time tracking |
US9659268B2 (en) | 2008-02-12 | 2017-05-23 | CertusVies Technologies, LLC | Ticket approval system for and method of performing quality control in field service applications |
US8612271B2 (en) | 2008-10-02 | 2013-12-17 | Certusview Technologies, Llc | Methods and apparatus for analyzing locate and marking operations with respect to environmental landmarks |
US9208458B2 (en) | 2008-10-02 | 2015-12-08 | Certusview Technologies, Llc | Methods and apparatus for analyzing locate and marking operations with respect to facilities maps |
US20090327024A1 (en) | 2008-06-27 | 2009-12-31 | Certusview Technologies, Llc | Methods and apparatus for quality assessment of a field service operation |
US9473626B2 (en) | 2008-06-27 | 2016-10-18 | Certusview Technologies, Llc | Apparatus and methods for evaluating a quality of a locate operation for underground utility |
US9208464B2 (en) | 2008-10-02 | 2015-12-08 | Certusview Technologies, Llc | Methods and apparatus for analyzing locate and marking operations with respect to historical information |
US9123095B2 (en) | 2008-09-29 | 2015-09-01 | Koninklijke Philips N.V. | Method for increasing the robustness of computer-aided diagnosis to image processing uncertainties |
US8644965B2 (en) | 2008-10-02 | 2014-02-04 | Certusview Technologies, Llc | Marking device docking stations having security features and methods of using same |
US8620726B2 (en) | 2008-10-02 | 2013-12-31 | Certusview Technologies, Llc | Methods and apparatus for analyzing locate and marking operations by comparing locate information and marking information |
CA2897462A1 (en) | 2009-02-11 | 2010-05-04 | Certusview Technologies, Llc | Management system, and associated methods and apparatus, for providing automatic assessment of a locate operation |
TWI405147B (zh) | 2010-03-16 | 2013-08-11 | Novatek Microelectronics Corp | 單張影像的階層式去動態模糊方法 |
US9658987B2 (en) | 2014-05-15 | 2017-05-23 | International Business Machines Corporation | Regression using M-estimators and polynomial kernel support vector machines and principal component regression |
EP3259737B1 (en) | 2015-02-18 | 2020-04-15 | Siemens Healthcare Diagnostics Inc. | Locality-based detection of tray slot types and tube types in a vision system |
CO2018006503A1 (es) * | 2018-06-25 | 2018-07-10 | Univ Antonio Narino | Método para el diagnóstico, desarrollo e incremento acelerado de la inteligencia deportiva o de juego |
CN109086822B (zh) * | 2018-08-01 | 2021-04-06 | 广州虎牙信息科技有限公司 | 一种主播用户分类方法、装置、设备及存储介质 |
CN112116005B (zh) * | 2020-09-18 | 2024-01-23 | 推想医疗科技股份有限公司 | 影像分类模型的训练方法及装置、存储介质和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03204783A (ja) * | 1990-01-08 | 1991-09-06 | Mitsubishi Electric Corp | 画像追尾装置 |
JPH05101028A (ja) * | 1991-10-04 | 1993-04-23 | Nippon Telegr & Teleph Corp <Ntt> | 複数特徴量の統合判定方法 |
JPH07215606A (ja) * | 1994-01-12 | 1995-08-15 | Inventio Ag | エレベータ用のインテリジェント分散制御装置 |
JPH0836643A (ja) * | 1994-07-26 | 1996-02-06 | Matsushita Electric Works Ltd | 画像認識におけるニューラルネットによる学習方法 |
JPH10503961A (ja) * | 1995-02-24 | 1998-04-14 | アーチ ディヴェロプメント コーポレイション | 医療画像において腫瘤や実質組織変形をコンピュータを用いて検出する自動化した方法と装置 |
JPH10155746A (ja) * | 1996-11-29 | 1998-06-16 | Arch Dev Corp | 医療用画像表示方法及びシステム |
JPH1173406A (ja) * | 1997-06-26 | 1999-03-16 | Lucent Technol Inc | サポートベクトル機械を使用する方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2254182T3 (es) * | 1999-05-25 | 2006-06-16 | Health Discovery Corporation | Mejora del descubrimiento de conocimientos desde multiples conjuntos de datos utilizando multiples maquinas de soporte vectorial. |
-
2002
- 2002-01-23 ES ES02709291T patent/ES2337556T3/es not_active Expired - Lifetime
- 2002-01-23 EP EP02709291A patent/EP1356421B1/en not_active Expired - Lifetime
- 2002-01-23 DE DE60234571T patent/DE60234571D1/de not_active Expired - Lifetime
- 2002-01-23 CA CA2435290A patent/CA2435290C/en not_active Expired - Fee Related
- 2002-01-23 AT AT02709291T patent/ATE450834T1/de not_active IP Right Cessation
- 2002-01-23 WO PCT/US2002/003070 patent/WO2002059828A2/en active IP Right Grant
- 2002-01-23 AU AU2002243783A patent/AU2002243783B2/en not_active Ceased
- 2002-01-23 JP JP2002560082A patent/JP3947109B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03204783A (ja) * | 1990-01-08 | 1991-09-06 | Mitsubishi Electric Corp | 画像追尾装置 |
JPH05101028A (ja) * | 1991-10-04 | 1993-04-23 | Nippon Telegr & Teleph Corp <Ntt> | 複数特徴量の統合判定方法 |
JPH07215606A (ja) * | 1994-01-12 | 1995-08-15 | Inventio Ag | エレベータ用のインテリジェント分散制御装置 |
JPH0836643A (ja) * | 1994-07-26 | 1996-02-06 | Matsushita Electric Works Ltd | 画像認識におけるニューラルネットによる学習方法 |
JPH10503961A (ja) * | 1995-02-24 | 1998-04-14 | アーチ ディヴェロプメント コーポレイション | 医療画像において腫瘤や実質組織変形をコンピュータを用いて検出する自動化した方法と装置 |
JPH10155746A (ja) * | 1996-11-29 | 1998-06-16 | Arch Dev Corp | 医療用画像表示方法及びシステム |
JPH1173406A (ja) * | 1997-06-26 | 1999-03-16 | Lucent Technol Inc | サポートベクトル機械を使用する方法 |
Non-Patent Citations (1)
Title |
---|
浦浜喜一,日高享助: "非線形引力によるドットパターンの群化モデル", 電子情報通信学会技術研究報告, vol. 第94巻,第294号, CSNG199900043011, 21 October 1994 (1994-10-21), JP, pages 75 - 82, ISSN: 0000767808 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006221607A (ja) * | 2005-01-13 | 2006-08-24 | Univ Chuo | 判別分析を行う方法、プログラム及び装置 |
JP2008533486A (ja) * | 2005-03-16 | 2008-08-21 | エルジー・ケム・リミテッド | バッテリーの充電状態を推定する装置及び方法 |
JP2008535566A (ja) * | 2005-04-05 | 2008-09-04 | ボストン サイエンティフィック リミテッド | 多段分類器を用いた画像分割のためのシステム及び方法 |
JP2007098143A (ja) * | 2005-10-07 | 2007-04-19 | Medison Co Ltd | 超音波映像システム及び超音波映像処理方法 |
JP2009061253A (ja) * | 2007-08-15 | 2009-03-26 | Fujifilm Corp | 画像成分分離装置、方法、およびプログラム |
JP2009186243A (ja) * | 2008-02-04 | 2009-08-20 | Nippon Steel Corp | 判別装置、判別方法及びプログラム |
JP2010262360A (ja) * | 2009-04-30 | 2010-11-18 | Ntt Docomo Inc | レコメンド情報配信装置およびレコメンド情報配信方法 |
WO2015069087A1 (ko) * | 2013-11-11 | 2015-05-14 | 삼성전자주식회사 | 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치 |
KR20150054258A (ko) * | 2013-11-11 | 2015-05-20 | 삼성전자주식회사 | 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치 |
KR102190484B1 (ko) | 2013-11-11 | 2020-12-11 | 삼성전자주식회사 | 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치 |
US12050256B2 (en) | 2016-11-22 | 2024-07-30 | Hyperfine Operations, Inc. | Systems and methods for automated detection in magnetic resonance images |
JP2019535424A (ja) * | 2016-11-22 | 2019-12-12 | ハイパーファイン リサーチ,インコーポレイテッド | 磁気共鳴画像における自動検出のためのシステムおよび方法 |
US11841408B2 (en) | 2016-11-22 | 2023-12-12 | Hyperfine Operations, Inc. | Electromagnetic shielding for magnetic resonance imaging methods and apparatus |
WO2018216623A1 (ja) * | 2017-05-25 | 2018-11-29 | 日本電気株式会社 | 地球科学データ解析装置、地球科学データ解析方法、及びコンピュータ読み取り可能な記録媒体 |
KR101991028B1 (ko) * | 2017-08-04 | 2019-10-01 | 동국대학교 산학협력단 | 지정맥 인식 장치 및 방법 |
KR20190014912A (ko) * | 2017-08-04 | 2019-02-13 | 동국대학교 산학협력단 | 지정맥 인식 장치 및 방법 |
KR101864412B1 (ko) * | 2017-12-28 | 2018-06-04 | (주)휴톰 | 학습용 데이터 관리방법, 장치 및 프로그램 |
JP2020014799A (ja) * | 2018-07-27 | 2020-01-30 | コニカミノルタ株式会社 | X線画像物体認識システム |
JP7115114B2 (ja) | 2018-07-27 | 2022-08-09 | コニカミノルタ株式会社 | X線画像物体認識システム |
JP2020042757A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
JP7213701B2 (ja) | 2018-09-07 | 2023-01-27 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
WO2022239896A1 (ko) * | 2021-05-10 | 2022-11-17 | 주식회사 씨앤에이아이 | 유방 이미지 변환 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
ATE450834T1 (de) | 2009-12-15 |
JP3947109B2 (ja) | 2007-07-18 |
CA2435290A1 (en) | 2002-08-01 |
DE60234571D1 (de) | 2010-01-14 |
EP1356421A2 (en) | 2003-10-29 |
EP1356421B1 (en) | 2009-12-02 |
CA2435290C (en) | 2012-05-01 |
WO2002059828A3 (en) | 2003-08-14 |
AU2002243783B2 (en) | 2007-07-19 |
ES2337556T3 (es) | 2010-04-27 |
WO2002059828A2 (en) | 2002-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3947109B2 (ja) | コンピュータ利用画像分析 | |
US6996549B2 (en) | Computer-aided image analysis | |
Suresh et al. | ROI-based feature learning for efficient true positive prediction using convolutional neural network for lung cancer diagnosis | |
Hariraj et al. | Fuzzy multi-layer SVM classification of breast cancer mammogram images | |
AU2002243783A1 (en) | Computer-aided image analysis | |
Doyle et al. | Cascaded discrimination of normal, abnormal, and confounder classes in histopathology: Gleason grading of prostate cancer | |
Bhattacharjee et al. | Review on histopathological slide analysis using digital microscopy | |
Bakkouri et al. | Multi-scale CNN based on region proposals for efficient breast abnormality recognition | |
Wu et al. | An ensemble learning and slice fusion strategy for three-dimensional nuclei instance segmentation | |
Yu et al. | Convolutional neural network design for breast cancer medical image classification | |
Manikandan et al. | Automated classification of emphysema using data augmentation and effective pixel location estimation with multi-scale residual network | |
Singh et al. | Detection of Brain Tumors Through the Application of Deep Learning and Machine Learning Models | |
Kumari et al. | Role of Computed Tomography Imaging for the Diagnosis and Classification of Lung Cancer using Machine Learning | |
Keerthi et al. | A Review on Brain Tumor Prediction using Deep Learning | |
Saabia et al. | Classification of lung cancer histology using CT images based on convolutional neural network-CNN | |
Ghani | On forecasting lung cancer patients’ survival rates using 3D feature engineering | |
Chalie et al. | Pulmonary Disease Identification and Classification Using Deep Learning Approach | |
Ponlatha et al. | Deep learning based classification of bone tumors using image segmentation | |
Syed | Color and morphological features extraction and nuclei classification in tissue samples of colorectal cancer | |
Wu et al. | Segmentation of images of abdominal organs | |
Sriramm et al. | Cross Organ Bridge Transfer Learning for Lung Cancer Detection | |
Ameen et al. | Breast cancer diagnosis based on support vector machine techniques | |
Kim et al. | Predictive Analysis of Breast Cancer from Full-Field Digital Mammography Images using Residual Network | |
Jyash et al. | EFFICIENT MACHINE LEARNING ALGORITHM FOR CANCER DETECTION USING BIOMEDICAL IMAGE | |
Ghasemi et al. | Improving the Accuracy of Detecting Cancerous Tumors Based on Deep Learning on MRI Images. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060829 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070327 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070412 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110420 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120420 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120420 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130420 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130420 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140420 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |