JP2008501486A - 規則抽出に基づいてディジタル画像における特徴を識別するためのシステムおよび方法 - Google Patents

規則抽出に基づいてディジタル画像における特徴を識別するためのシステムおよび方法 Download PDF

Info

Publication number
JP2008501486A
JP2008501486A JP2007527674A JP2007527674A JP2008501486A JP 2008501486 A JP2008501486 A JP 2008501486A JP 2007527674 A JP2007527674 A JP 2007527674A JP 2007527674 A JP2007527674 A JP 2007527674A JP 2008501486 A JP2008501486 A JP 2008501486A
Authority
JP
Japan
Prior art keywords
feature points
sets
rule
hypercube
upper bound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007527674A
Other languages
English (en)
Inventor
フング、グレン
サンディルヤ、サスヤカマ
バラート ラオ、アール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Medical Solutions USA Inc
Original Assignee
Siemens Medical Solutions USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Medical Solutions USA Inc filed Critical Siemens Medical Solutions USA Inc
Publication of JP2008501486A publication Critical patent/JP2008501486A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/24765Rule-based classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

ディジタル医用画像における特徴を分類するための方法は、N次元空間における複数の特徴点を提供するステップであり、それぞれの特徴点は、2つの集合の一方に含まれる要素である、前記提供するステップと、2つの集合の中の第1の集合内に存在する特徴点を2つの集合の中の第2の集合内に存在する特徴点から分離する分類平面を決定するステップと、分類平面を変換するステップ(32)であり、前記変換された分類平面までの法線ベクトルは、正の成分を有し、一方の集合に含まれる1つ以上の特徴点のための特徴領域は、n個の軸を有する変換された空間内における単位超立方体である、前記変換するステップと、単位超立方体のn個の軸のそれぞれに沿って上界を得るステップ(33)と、前記上界を逆変換し、前記一方の集合に含まれる1つ以上の特徴点を含む新しい規則を得るステップ(34)と、前記新しい規則によって包含される特徴点を、前記一方の集合から除去するステップ(35)とを備える。

Description

関連米国出願の相互参照
本出願は、発明の名称が「Rule extraction from Hyperplane−based Classifiers」である2004年6月8日に出願されたGlenn Fungらの米国特許仮出願第60/577,792号に基づいて優先権を主張するものであり、その内容は参照により本明細書に組み込まれる。
本発明は、ディジタルデータを分類するための、特に、ディジタル医用画像における特徴および対象物を識別するための規則抽出器に関する。
医者および科学者は、長い間、人工知能システムを医療において使用することを探求してきた。研究の1つの分野においては、データセットにおいて正常な特徴および異常な特徴を分類および識別するために、医用画像を自動的に解釈および解析するためのコンピュータ支援診断(CAD)システムが、構築されてきた。例えば、そのようなシステムは、患者のディジタル医用画像において、ポリープ、腫瘍、および、正常な組織からのその他の異常な成長を分類および識別するのに使用されてもよい。研究室および臨床環境における多くのそのようなシステムの実証された成功にもかかわらず、これらのシステムは、実際の臨床において、広く使用されることはなく、それどころか、役に立つことさえなかった。
米国においてこれらのシステムを使用するのを妨げる1つの障壁は、米国政府関係機関が患者の治療に影響を及ぼすかもしれない「ブラックボックス」システムの使用を許可することにあまり乗り気がないことである。米国食品医薬品局(FDA)は、最近、「ブラックボックス」分類器に基づいたCADシステムを承認したが、参入障壁は、依然として、極めて高いままである。これらのシステムは、現在、最初の医者の診断の後に助言を提供するための「二次的な検査装置」としてしか使用することができない。さらに、これらのCADシステムは、市販前承認(PMA)を受けなければならない。PMAは、総合臨床試験と同等のものであり、新薬に使用されるものに類似し、CADシステムは、医者によって多数の全く新しい症例に使用されたときの診断能における統計的に顕著な改善を実証しなければならない。FDAは、CADシステムの成果を釈明することのできるシステムに対しては参入障壁を相当に低くすることができることを表明した。しかしながら、これは、初見の症例に対する汎化能力に関する障壁を低くしようとするものではなく、FDAは、潜在的に、既往の症例に対する能力を使用することを考えさせようとするものであり、そして、将来の臨床試験に必要とされる多くの症例を相当に減少させようとするものである。これは、それらのシステムを承認するのを助ける。なぜなら、本格的な臨床試験は、CADシステムを医療全般に導入するのを数年も遅らせることがあるからである。
人工知能、知識発見、および、データマイニングの分野における多くの研究は、助言をユーザがより受け入れることのできるものにするために、かつ、システムが到達した何らかの結論に存在する誤差を人間の専門家がより容易に識別するのを助けるために、システムにそれらの推論を説明する能力を持たせることに専念してきた。他方において、医学データセットから分類器を構築する場合、最良の能力は、多くの場合、サポートベクターマシン(SVM)のような「ブラックボックス」システムによって達成される。
サポートベクターマシン(SVM)およびその他の線形分類器は、データセットから超平面ベース分類器を構築するための一般的な方法であり、様々な用途において優れた汎化能力を有することが証明されている。しかしながら、これらの分類器は、人間が解釈するのが難しい。例えば、分類されていないサンプルが、線形分類器によって正または負として分類される場合、提供されるかもしれない説明は、そのサンプルの変数の線形加重和が閾値よりも小さい(または、大きい)ということだけであり、そのような説明は、人間の専門家には全く非直観的なものである。人間は、変数空間における軸平行面を備えた超立方体として表現することのできる規則のほうがより取り扱いやすい。最近の研究は、ニューラルネットワークのための規則抽出を含むが、SVMまたはその他の超平面ベース分類器から規則を抽出するための研究は、ほとんどなされてこなかった。
「ブラックボックス」分類器が到達した判断を説明する能力は、医者が受け入れるために重要であるばかりでなく、そのような分類器に基づいた医学的判断支援システムを医療に導入するための法的要件を潜在的に減少させる際の重要なステップでもある。
本明細書で説明される本発明の例示的な実施形態は、一般的には、線形サポートベクターマシンおよび何らかのその他の任意の超平面ベース線形分類器を、元々の分類器とは違って人間が容易に解釈することのできる非重複規則の集合に変換するための方法およびシステムを含む。この規則集合は、元々の線形分類器に(漸近的に)等しく、超平面の半空間内に存在するほとんどのトレーニングサンプルを被覆することができる。規則抽出のそれぞれの反復は、様々な「最適」規則判定条件に基づいて、2つの可能な最適化問題の中の1つとして定式化される。それぞれの規則によって被覆される体積を最大化しようとする第1の定式化は、条件つきの非線形最適化問題であり、それの解は、緩和された対応する条件のない問題の閉形式解を得ることによって見つけ出すことができる。それぞれの規則によって被覆されるサンプルの数を最大化する第2の定式化は、線形プログラミング問題の解を必要とする。本発明の実施形態による規則抽出技術は、2n個の変数における線形プログラミング問題を解くことを含み、ここで、nは、入力された特徴の数(特徴選択の後に)である。SVM分類器およびその他の「ブラックボックス」分類器を人間が理解できる規則の集合に変換する能力は、医者に受け入れられるのを助け、また、そのような分類器に基づいた医学的判断支援システムの法的障壁を低くするのを助ける。
本発明の一態様によれば、ディジタル医用画像における特徴を分類するための方法が、提供され、その方法は、N次元空間における複数の特徴点を提供するステップであり、前記特徴点は、ディジタル医用画像から抽出されたものであり、それぞれの特徴点は、2つの集合の一方に含まれる要素である、前記提供するステップと、2つの集合の中の第1の集合内に存在する特徴点を2つの集合の中の第2の集合内に存在する特徴点から分離する近似分類平面を決定するステップと、分類平面を変換するステップであり、前記変換された分類平面までの法線ベクトルは、正の成分を有し、前記2つの集合の一方に含まれる1つ以上の特徴点のための特徴領域は、n個の軸を有する変換された空間内における単位超立方体である、前記変換するステップと、単位超立方体のn個の軸のそれぞれに沿って上界を得るステップと、前記上界を逆変換し、前記2つの集合の前記一方に含まれる1つ以上の特徴点を含む新しい規則を得るステップと、前記新しい規則によって包含される特徴点を、2つの集合の前記一方から除去するステップとを含む。
本発明のさらなる態様によれば、前記方法は、規則の集合を空集合に初期化し、前記新しい規則を備えた前記規則集合の和集合を形成するステップをさらに備える。
本発明のさらなる態様によれば、2つの集合の前記一方が、前記特徴点を除去した後に空でなければ、前記新しい規則によって被覆されないn個の部分領域ごとに、前記部分領域を逆変換するステップと、2つの集合の前記一方が、空になるまで、分類平面を変換する前記ステップ、上界を得る前記ステップ、前記上界を逆変換して新しい規則を得る前記ステップ、前記新しい規則によって包含される特徴点を除去する前記ステップを反復するステップと、それぞれの前記新しい規則を備えた前記規則集合の和集合を形成するステップとをさらに備える。
本発明のさらなる態様によれば、前記ステップは、前記n個の部分領域のうち、2つの集合の前記一方における特徴点を含む部分領域に対して反復され、2つの集合の前記一方に存在する特徴点をそれぞれの部分領域から探索するステップをさらに備える。
本発明のさらなる態様によれば、前記ステップを反復することによって得られたそれぞれの新しい規則は、前記規則集合内に存在するそれぞれの規則と0個の交点を有する。
本発明のさらなる態様によれば、それぞれの部分領域は、深さ優先探索に基づいて探索される。
本発明のさらなる態様によれば、単位超立方体のn個の軸のそれぞれに沿って上界を得るステップは、できるだけ大きな体積を備えた前記単位超立方体の部分超立方体を決定するステップを備える。
本発明のさらなる態様によれば、単位超立方体のn個の軸のそれぞれに沿って上界を得るステップは、2つの集合の前記一方に存在する最大数の特徴点を備えた前記単位超立方体の部分超立方体を決定するステップを備える。
本発明のさらなる態様によれば、前記新しい規則によって定義される超立方体は、前記分類平面上に存在する頂点を有する。
本発明のさらなる態様によれば、前記変換された空間における前記単位超立方体は、前記変換された空間の座標系の原点に頂点を有する。
本発明のさらなる態様によれば、前記方法は、新しい特徴点を提供するステップと、前記新しい特徴点から前記分類平面までの法線を定義するステップと、超立方体の中心に前記新しい特徴点を含む前記超立方体の頂点として前記分類平面と前記法線との交点を定義するステップとをさらに備える。
本発明の別の態様によれば、ディジタル医用画像における特徴を分類するための方法ステップを実行するためにコンピュータが実行することのできる命令からなるプログラムを具体的に実施するコンピュータ可読プログラム記憶装置が、提供される。
本明細書で説明される本発明の例示的な実施形態は、一般的には、対応する点を見つけ出すために、レイキャスティングを用いた医用画像における画像レジストレーションのための多角形面を実現するためのシステムおよび方法を含む。
注:A∈Rm×nは、実m×n行列を表す。そのような行列に対して、A’は、Aの転置を表現し、Aiは、Aのi番目の行を表現する。全てのベクトルは、列ベクトルである。x∈Rnの場合、‖x‖pは、p−ノルムを表現し、p=1,2,∞である。任意の次元の実空間における1のベクトルは、eによって表現される。したがって、e∈Rm、かつ、y∈Rmである場合、e’yは、yの成分の和である。任意の次元の実空間における0のベクトルは、0によって表現される。分離超平面は、所与の2つの点集合AおよびBに関して、Rnを2つの超平面に分離しようとする平面であり、そのために、それぞれの開いた半空間は、AまたはBのほとんどの点を含む。集合Aに対する境界平面は、その平面が生成する2つの閉じた半空間の一方にAを配置する平面である。記号□は、論理的な「AND」を表現し、記号□は、論理的な「OR」を表現する。略語「s.t.」は、「such that(以下のことが成り立つような)」を意味する。ベクトルx∈Rnの場合、符号関数sign(X)は、i=1,...,nに対して、xi>0であれば、sign(x)i=1、xi≦0であれば、sign(x)i=−1として定義される。
ディジタルデータセットにおける特徴分類は、n次元の入力空間Rnにおけるm個の点を1つの類の要素として分類する例を考えることができる。点の集合は、m×n行列Aによって表現されてもよく、i番目の点は、行Aiによって表現される。それぞれの点Aiは、類A+かまたは類A−の要素であり、この分類は、それの対角線に沿って+1かまたは−1を備えたm×m対角行列Dによって表現されてもよい。類が、線形に分離できるものであれば、平面w’x=yは、2つの類を分離し、xは、分離平面上の任意の点であり、wは、その平面に垂直であり、yは、原点からその平面までの距離である。類が、線形に分離できないものであれば、現実の世界のデータセットでは多くの場合にそうであるが、分離平面は、負でない誤差変数εによって決定される「ソフトマージン」(すなわち、何らかの誤差によっておおまかに境界を画定される)を定義する2つの平面によって境界を画定されてもよく、εは、
ii=1に対して、Aiw+εi≧γ+1
ii=−1に対して、Aiw−εi≦γ−1
である。誤差変数εを最小化することは、近似分離平面をもたらす。この平面は、x∈Aに対して、データを以下のように分類する。
Figure 2008501486
sign(・)は、上で定義された符号関数である。
このシステムは、重みパラメータv>0を備えた次の線形プログラムによって表現されてもよい。
Figure 2008501486
Figure 2008501486
これは、次の線形プログラミングサポートベクターマシン(LP−SVM)と等価である。
Figure 2008501486
Figure 2008501486
‖‖1は、上で定義された1−ノルムを表現する。1−ノルムの誤差変数εは、当分野において既知の方法に基づいて、重みuをパラメータとして最小化されてもよく、それによって、近似分離平面をもたらす。
図1は、wを含むRnに存在する平面における本発明の実施形態による限定するものではない例示的なLP−SVM分類器を示す。A+に存在する点をA−に存在する点からおおまかに分離する「ソフトマージン」は、実線によって示され、A+の点をA−の点から分離する上述した式によって表現される平面は、ソフトマージン内の破線によって示される。
上で使用された1−ノルム定式化は、典型的には、極めてスパースな解を生成し、それは、多くのゼロ成分を有する分離平面x’w=yに垂直なwをもたらす。wのこの特性は、多くの入力空間特徴は線形分類器を決定する際に役割を果たさないことを意味する。本発明の実施形態による規則抽出技術は、超平面分類器によって使用される特徴に依存するので、よりスパースな法線ベクトルwは、より少ない数の特徴に依存する規則をもたらすことになる。
式(1)の解は、形式、
Figure 2008501486
の形式を有する規則によって近似されてもよく、lおよびuは、それぞれ、下界および上界である。この形式の規則を探し出す際には、近似下界lおよび近似上界uを探し出す。この形式の規則は、軸に平行な辺を備えたn次元の超立方体領域l={x s.t.w’x<γ,li≦xi≦ui,1≦i≦n}を定義する。分類超平面w’x=yに基づいてこの領域lの分類規則を構築するためのシステムは、P−(w,y,l)によって表現されてもよい。i番目の次元の下辺および上辺は、それぞれ、liおよびuiである。この形式の規則は、極めて直観的なものであり、人間によって容易に解釈されることが可能である。P+(w,y,l’)によって表現されてもよい補集合l’={x s.t.w’x>γ,li≦xi≦ui,1≦i≦n}から規則を抽出するためのシステムは、P−(−w,−y,l)と等価であることに注意されたい。
本発明の実施形態によれば、この定式化は、正の超平面成分y=1を備えた定式化に変換されてもよく、特徴領域は、線形変換y=T(x−b)に基づいて、単位超立方体l0=[0,1]nである。この変換された定式化においては、変換された下限l’は、原点であり、1は、1よりも小さい変換された上限を近似することに関与する。変換の行列Tは、
Figure 2008501486
および、次の成分を備えたベクトルb、
b={ui if wi<0, li if wi>0}
によって定義される対角行列である。Tiiおよびbの定義において使用されるuiおよびliは、データ点自身の境界から近似されてもよい。逆数は、アフィン変換x=T1y+bである。関心のある超平面は、
w’T-1y=γ−w’b となり、これは、
Figure 2008501486
に等しい。さらに、
Figure 2008501486
および
Figure 2008501486
となり、超立方体lは、l0=[0,1]nに変換され、システムは、新しい領域、
Figure 2008501486
において、
Figure 2008501486
となる。
Figure 2008501486
であるので、
Figure 2008501486
の成分は、正であることに注意されたい。
生成するのが容易な分離規則の集合を得るために、抽出された規則、
Figure 2008501486
によって定義される超立方体は、境界を画定された領域l={x s.t.w’x<y}の部分集合でなければならない。さらに、抽出された規則によって定義される結果として得られた超立方体部分集合は、分離超平面w’x−y=0に存在する1つの頂点を含まなければならない。領域lを所与として、異なる「最適」規則集合が、異なる判定条件に基づいて定義されてもよい。
図2は、本発明による実施形態による非重複規則の例示的な2次元LP−SVMの例を示す。半空間A+は、平面の右側を占め、半空間A−は、左側を占める。A+に存在する点は、白丸によって表現され、A−に存在する点は、ドットによって表現される。半空間A−({x s.t.w’x<y})を被覆する非重複規則は、長方形として表現され、その長方形は、境界を画定された領域である。図2に示されるそれぞれの長方形は、分離超平面w’x−y=0に存在する1つの頂点を含むことに注意されたい。半空間w’x<yは、超平面w’x−y=0に存在する頂点を備えた長方形によって表現される規則によってほぼ完全に被覆される。長方形は、分類されるべき集合内に存在する全てのデータ点を含む。
最適規則集合の定義を所与として、反復法が、関心のある領域を適切に説明するのに必要なだけ規則を抽出するのに使用されてもよい。n次元の特徴空間の規則が、抽出されると、解くべきn個の新しい類似するシステムが、存在する。変換されたシステム、
Figure 2008501486
から抽出された最初の規則が、
Figure 2008501486
であれば、規則によって被覆されない超平面の側に存在する残りの体積は、元々の領域に類似するn個の非交差領域の和集合であり、
Figure 2008501486
によって定義される。すなわち、xの最初のi−1成分に対する規則不等式は、満たされ、i番目の成分に関する不等式は、満たされず、残りの不等式は、不定である。これらの部分体積liは、交差せず、それぞれの部分体積に対応する規則は、独立している。次に、最適規則が、データ点を含むこれらの領域ごとに抽出されてもよい。データ点を含む領域を見つけ出す例示的な方法は、深さ優先探索であるが、幅優先探索のような当分野において既知のその他の探索アルゴリズムが、使用されてもよい。liに対するシステムは、
Figure 2008501486
によって表現されてもよく、上述したものと同じ線形変換が、n個のサブシステム、
Figure 2008501486
のそれぞれを元々のシステム、
Figure 2008501486
と等価なシステムに変換するのに使用されてもよい。
本発明の一実施形態によれば、最適規則は、できるだけ大きな体積を備えた軸平行面を備えた超立方体l0を被覆する規則として定義されてもよい。対数関数は、狭義増加関数であるので、最適規則は、体積の代わりに、それが取り囲む領域の体積の対数を最大化する規則である。この規則は、
Figure 2008501486
を解くことによって見つけ出すことができる。この式の解に対する第1近似は、xに対する条件を緩和することを含む。すなわち、
Figure 2008501486
この緩和された等式定式化のための最適性条件は、
Figure 2008501486
であり、λは、ラグランジュ乗数である。これらの最適性条件は、次の閉形式解をもたらす。すなわち、
Figure 2008501486
元々の最適化問題の解x*は、x*を、
Figure 2008501486
と定義することによって、近似解から得ることができる。
Figure 2008501486
であれば、x*は、式(2)の最適解であり、そうでなければ、
Figure 2008501486
を定義し、
Figure 2008501486
となるまで、x*を再計算してもよい。この方法によって見つけ出されたx*は、変換された超立方体l0の次元に対する上界を定義する。逆線形変換T1を施すことは、[0,x*]を[li,ui]に変換する。
本発明の別の実施形態によれば、最適規則は、軸平行面を備えた超立方体を被覆する規則として定義されてもよく、それによって、できるだけ多くの数のトレーニング点を半空間内に含む。そのような規則は、
w’x*−y=0であり、かつ、/C/(Cの濃度)が最大となるようなx*を見つけ出すことによって、見つけ出すことができ、
C=(A−∩{x/w’x<1})∩{x/0≦x≦x*
である。次の線形プログラミング定式化は、このシステムの近似である。
Figure 2008501486
変数y≧0は、規則ができるだけ多くの数の点を被覆するために最小化されるスラック変数または誤差変数として作用する。繰り返すと、本方法によって見つけ出されたx*は、変換された超立方体l0の次元に対する上界を定義する。逆線形変換T1を施すことは、[0,x*]を[li,ui]に変換する。
図3は、w’x<yとなるようなA−に属する全てのトレーニング点を被覆する規則Rの集合を得るための本発明の実施形態による手順のフローチャートを示す。以下においては、Rは、抽出された規則を含む集合であり、Uは、R内の規則によって被覆されるべき点の指標を含む集合である。手順を開始する前に、RおよびUは、⇔およびA−にそれぞれ初期化されてもよく、wおよびyの初期値は、上述したLP−SVMを解くことによって得られてもよい。
まず最初に、ステップ31において、システムP−(w,y,l)が、上述した線形変換Tを用いて、
Figure 2008501486
に変換される。次に、ステップ33において、システム
Figure 2008501486
を解くことによって、解y*が、得られる。例として、システム
Figure 2008501486
を解くための限定するものではない方法は、判定条件を最大化する体積および上述した判定条件を最大化する点被覆率を含む。そして、ステップ34において、xが、x*=T1*+bから計算され、そのxから、新しい規則
Figure 2008501486
が、得られる。そして、規則集合は、
Figure 2008501486
に基づいて更新される。ステップ35において、
Figure 2008501486
を計算し、集合は、新しく得られた規則によって被覆されるU内に存在する点の指標を含む。Uは、U←U−Cに、すなわち、新しい規則によって被覆される点を残りのデータ点の集合から引き算することによって、更新される。ステップ36において、U=⇔であれば、全てのデータ点が、被覆されたことになり、処理は、終了する。
そうでなければ、ステップ38において、
Figure 2008501486
によって上で定義された規則Rによって被覆されないn個の残りの部分領域が、解かれる。これらの部分領域は、上述されたように深さ優先探索アルゴリズムに基づいて探索されてもよい。これらの領域liごとに、逆変換T1が、施される。すなわち、
Figure 2008501486
そして、ステップ39において、
Figure 2008501486
であれば、部分領域内に存在する全てのデータ点が、被覆されたわけではなく、先
行するステップが、再帰的にシステム
Figure 2008501486
に施される。そうでなければ、規則抽出処理は、全てのデータ点を被覆したことになり、処理を終了する。
本発明の別の実施形態によれば、ステップ38におけるトレーニング点を含む部分領域の探索は、深さパラメータの使用によって制限されてもよい。dによって表現されるこの深さパラメータは、1に初期化されてもよく、また、深さパラメータの最大値dmaxが、定められる。この深さ最大値は、典型的には、20より小さい。深さパラメータは、ステップ36の後に、集合Uが空でなければ、インクリメントされ、そして、システム
Figure 2008501486
を解くために処理が再帰的に呼び出されるたびに、最大値と比較される。深さパラメータが、最大値を超えると、処理は、終了する。
いくつかの現実世界のデータセットに関する実験的な結果は、本発明の実施形態による方法の効果および速度を実証した。
本発明の別の実施形態によれば、分類されていない新しいテストサンプルに対する分類の説明を提供することができる。規則が、特定のテストサンプルを被覆しなければ、規則抽出手順は、被覆規則が見つけ出されるまで、テストサンプルを含む領域lに対して実行されてもよい。しかしながら、結果として得られた規則は、テストサンプルの周囲の極めて小さな体積を被覆することがあり、それは、説明の有効性を制限する。その代わりとして、体積最大化判定条件が、ただ1つの規則、すなわち、テストサンプルを含むできるだけ大きな超立方体(規則)を抽出するように修正されてもよい。しかしながら、そのような規則は、説明値が乏しいことがある。なぜなら、多くの場合、テストサンプルは、超立方体の1つの表面上に存在するからである。
本発明の別の実施形態によれば、テストサンプルに対する説明は、サンプルが境界を画定する空間から遠く離れて規則の十分に内側に存在する規則によって提供されてもよい。「最適な」説明を提供する規則は、テストサンプルから超平面まで法線を引き、そして、テストサンプルを中心に含む境界を画定する固有に定義された超立方体(規則)の角として、超平面と法線との交点を定義することによって、生成されてもよい。さらに、A+(A−)内に存在するトレーニングサンプルの被覆率、規則が全ての正(負)のトレーニングサンプルだけを含むかどうかということ、新しく定義された超立方体の寸法、および、超平面からのテストサンプルの距離、のような重み係数によって、信頼度が、説明(規則)に対応づけられてもよい。一般的には、これらの判定条件は、本明細書で定義されるように生成された「最適な」説明規則だけでなく、どのような説明規則にも適用されてよい。
本発明の別の実施形態によれば、本明細書に開示された規則抽出技術は、膨大な量のデータをハンドリングするためのインクリメンタルアルゴリズムを設計するために、知識ベースSVMと組み合わせられてもよい。このアルゴリズムは、様々な「チャンク」から得られた規則の形でトレーニングデータを「圧縮」し、そして、得られた規則を知識ベースSVMに組み込んでもよい。
本発明の別の実施形態によれば、本明細書に開示された規則抽出技術は、特徴選択を含んでもよく、それによって、特徴の予め選択された同じ部分集合の代わりに様々な特徴に依存する規則が、生成されてもよい。
本発明は、ハードウェア、ソフトウェア、ファームウェア、専用プロセス、または、それらを組み合わせたものからなる様々な形で実施されてもよいことを理解すべきである。一実施形態においては、本発明は、コンピュータ可読プログラム記憶装置上に具体的に実現されたアプリケーションプログラムとして、ソフトウェアで実施されてもよい。そのアプリケーションプログラムは、何らかの適切なアーキテクチャーを備えたマシンにアップロードされ、そして、そのマシンによって実行されてもよい。
ここで、図4を参照すると、本発明の一実施形態によれば、本発明を実施するためのコンピュータシステム41は、特に、中央処理装置(CPU)42、メモリー43、および、入力/出力(I/O)インタフェース44を備えてもよい。コンピュータシステム41は、一般的には、I/Oインタフェース44を介してディスプレイ45、および、マウスおよびキーボードのような様々な入力装置46に結合される。支援回路は、キャッシュ、電源、クロック回路、および、通信バスのような回路を含んでもよい。メモリー43は、ランダムアクセスメモリー(RAM)、リードオンリーメモリー(ROM)、ディスクドライブ、テープドライブ、など、または、それらを組み合わせたものを含んでもよい。本発明は、信号源48からの信号を処理するためにメモリー43に記憶されかつCPU42によって実行されるルーチン47として実施されてもよい。そのようなものとして、コンピュータシステム41は、本発明のルーチン47を実行するときに特殊用途コンピュータシステムとなる汎用コンピュータシステムである。
また、コンピュータシステム41は、オペレーティングシステムおよびマイクロ命令コードを含む。本明細書に説明された様々な処理および機能は、マイクロ命令コードの一部かまたはオペレーティングシステムを介して実行されるアプリケーションプログラムの一部(または、それらを組み合わせたもの)であってもよい。さらに、さらなるデータ記憶装置および印刷装置のようなその他の様々な周辺装置が、コンピュータプラットフォームに接続されてもよい。
さらに、添付の図面に示される構成要素をなすシステムコンポーネントおよび方法ステップのいくつかは、ソフトウェアで実施されてもよいので、システムコンポーネント(または、処理ステップ)間の実際の接続は、本発明がどのようにプログラムされるかに応じて異なってもよいことを理解すべきである。本明細書に提供された本発明の教示によって、当業者は、本発明のこれらのおよび類似する形態または構成を実施することができる。
本明細書で説明された教示から利益を得ることのできる当業者には明らかなように、本発明は、異なるが等価な形で、変更および実施されてもよいので、上で開示された特定の実施形態は、ただ単に説明のためのものである。さらに、特許請求の範囲に記載される請求項を除けば、本明細書に示される構造または設計の細部は、本発明を限定することを意図したものではない。したがって、上で開示された特定の実施形態は、変更または変形されてもよく、そのような変更または変形は、本発明の範囲および精神内であることは明らかなことである。このために、本明細書で要求される権利は、特許請求の範囲に記載される。
本発明の実施形態によるRnからなるw空間における限定するものではない例示的なLP−SVM分類器を示す。 本発明の実施形態による非重複規則の例示的な2次元LP−SVMを示す。 本発明の実施形態による規則抽出方法のフローチャートである。 本発明の実施形態による規則抽出方法を実施するための例示的なコンピュータシステムのブロック図である。

Claims (27)

  1. ディジタル医用画像における特徴を分類するための方法であって、前記方法は、
    n次元空間における複数の特徴点を提供するステップであり、前記特徴点が、ディジタル医用画像から抽出されたものであり、それぞれの特徴点が、2つの集合の一方に含まれる要素である、前記提供するステップと、
    2つの集合の中の第1の集合内に存在する特徴点を2つの集合の中の第2の集合内に存在する特徴点から分離する近似分類平面を決定するステップと、
    分類平面を変換するステップであり、前記変換された分類平面までの法線ベクトルが、正の成分を有し、前記2つの集合の一方に含まれる1つ以上の特徴点のための特徴領域が、n個の軸を有する変換された空間内における単位超立方体である、前記変換するステップと、
    単位超立方体のn個の軸のそれぞれに沿って上界を得るステップと、
    前記上界を逆変換し、前記2つの集合の前記一方に含まれる1つ以上の特徴点を含む新しい規則を得るステップと、
    前記新しい規則によって包含される特徴点を、2つの集合の前記一方から除去するステップと、
    を備える方法。
  2. 規則の集合を空集合に初期化し、前記新しい規則を備えた前記規則集合の和集合を形成するステップをさらに備える請求項1に記載の方法。
  3. 2つの集合の前記一方が、前記特徴点を除去した後に空でなければ、
    前記新しい規則によって被覆されないn個の部分領域ごとに、前記部分領域を逆変換するステップと、
    2つの集合の前記一方が空になるまで、分類平面を変換する前記ステップ、上界を得る前記ステップ、前記上界を逆変換して新しい規則を得る前記ステップ、前記新しい規則によって包含される特徴点を除去する前記ステップを反復するステップと、
    それぞれの前記新しい規則を備えた前記規則集合の和集合を形成するステップと、
    をさらに備える請求項2に記載の方法。
  4. 前記ステップが、前記n個の部分領域のうち、2つの集合の前記一方における特徴点を含む部分領域に対して反復され、2つの集合の前記一方に存在する特徴点をそれぞれの部分領域から探索するステップをさらに備える請求項3に記載の方法。
  5. 前記ステップを反復することによって得られたそれぞれの新しい規則が、前記規則集合内に存在するそれぞれの規則と0個の交点を有する請求項3に記載の方法。
  6. それぞれの部分領域が、深さ優先探索に基づいて探索される請求項4に記載の方法。
  7. 単位超立方体のn個の軸のそれぞれに沿って上界を得るステップが、できるだけ大きな体積を備えた前記単位超立方体の部分超立方体を決定するステップを備える請求項1に記載の方法。
  8. 単位超立方体のn個の軸のそれぞれに沿って上界を得るステップが、2つの集合の前記一方に存在する最大数の特徴点を備えた前記単位超立方体の部分超立方体を決定するステップを備える請求項1に記載の方法。
  9. 前記新しい規則によって定義される超立方体が、前記分類平面上に存在する頂点を有する請求項1に記載の方法。
  10. 前記変換された空間における前記単位超立方体が、前記変換された空間の座標系の原点に頂点を有する請求項1に記載の方法。
  11. 画像における特徴を分類するための方法であって、前記方法は、
    n次元空間における複数の特徴点を提供するステップであり、それぞれの特徴点が、2つの集合の一方に含まれる要素である、前記提供するステップと、
    2つの集合の中の第1の集合内に存在する特徴点を2つの集合の中の第2の集合内に存在する特徴点から分離する近似分類平面を決定するステップと、
    分類平面をn次元の変換された空間に変換するステップと、
    前記変換された空間における特徴領域のn個の軸のそれぞれに沿って上界を得るステップと、
    前記上界を逆変換し、第1の集合内に存在する1つ以上の特徴点を含む新しい規則を得るステップと、
    前記新しい規則によって包含される特徴点を前記第1の集合から除去するステップと、
    前記新しい規則によって被覆されないn個の部分領域のそれぞれを逆変換するステップと、
    前記第1の集合が、前記特徴点を除去した後に空でなければ、前記第1の集合の特徴点を含みかつ前記新しい規則によって被覆されない前記n個の部分領域ごとに、前記第1の集合が空になるまで、分類平面を変換する前記ステップ、上界を得る前記ステップ、前記上界を逆変換して新しい規則を得る前記ステップ、前記新しい規則によって包含される特徴点を除去する前記ステップを反復するステップと、
    を備える方法。
  12. 新しい特徴点を提供するステップと、
    前記新しい特徴点から前記分類平面までの法線を定義するステップと、
    超立方体の中心に前記新しい特徴点を含む前記超立方体の頂点として前記分類平面と前記法線との交点を定義するステップと、
    をさらに備える請求項11に記載の方法。
  13. 前記特徴点が、画像から抽出されたものである請求項11に記載の方法。
  14. 前記画像が、ディジタル医用画像である請求項13に記載の方法。
  15. 前記変換された空間が、正の成分を備えた前記変換された分類平面までの法線ベクトルを含む請求項11に記載の方法。
  16. 前記変換された空間が、前記2つの集合の中の第1の集合に含まれる1つ以上の特徴点のための特徴領域を含み、その特徴領域が、n個の軸を有する単位超立方体である請求項11に記載の方法。
  17. それぞれの前記新しい規則を備えた前記規則集合の和集合を形成するステップをさらに備え、前記ステップを反復することによって得られたそれぞれの新しい規則が、前記規則集合内のそれぞれの規則と0個の交点を有する請求項11に記載の方法。
  18. ディジタル医用画像における特徴を分類するための方法ステップを実行するためにコンピュータが実行することのできる命令からなるプログラムを具体的に実施するコンピュータ可読プログラム記憶装置であって、前記方法は、
    N次元空間における複数の特徴点を提供するステップであり、前記特徴点が、ディジタル医用画像から抽出されたものであり、それぞれの特徴点が、2つの集合の一方に含まれる要素である、前記提供するステップと、
    2つの集合の中の第1の集合内に存在する特徴点を2つの集合の中の第2の集合内に存在する特徴点から分離する近似分類平面を決定するステップと、
    分類平面を変換するステップであり、前記変換された分類平面までの法線ベクトルが、正の成分を有し、前記2つの集合の一方に含まれる1つ以上の特徴点のための特徴領域が、n個の軸を有する変換された空間内における単位超立方体である、前記変換するステップと、
    単位超立方体のn個の軸のそれぞれに沿って上界を得るステップと、
    前記上界を逆変換し、前記2つの集合の前記一方に含まれる1つ以上の特徴点を含む新しい規則を得るステップと、
    前記新しい規則によって包含される特徴点を、2つの集合の前記一方から除去するステップと、
    を備えるコンピュータ可読プログラム記憶装置。
  19. 前記方法が、規則の集合を空集合に初期化し、前記新しい規則を備えた前記規則集合の和集合を形成するステップをさらに備える請求項18に記載のコンピュータ可読プログラム記憶装置。
  20. 2つの集合の前記一方が、前記特徴点を除去した後に空でなければ、
    前記新しい規則によって被覆されないn個の部分領域ごとに、前記部分領域を逆変換するステップと、
    2つの集合の前記一方が空になるまで、分類平面を変換する前記ステップ、上界を得る前記ステップ、前記上界を逆変換して新しい規則を得る前記ステップ、前記新しい規則によって包含される特徴点を除去する前記ステップを反復するステップと、
    それぞれの前記新しい規則を備えた前記規則集合の和集合を形成するステップと、
    をさらに備える請求項19に記載のコンピュータ可読プログラム記憶装置。
  21. 前記ステップが、前記n個の部分領域のうち、2つの集合の前記一方における特徴点を含む部分領域に対して反復され、2つの集合の前記一方に存在する特徴点をそれぞれの部分領域から探索するステップをさらに備える請求項20に記載のコンピュータ可読プログラム記憶装置。
  22. 前記ステップを反復することによって得られたそれぞれの新しい規則が、前記規則集合内に存在するそれぞれの規則と0個の交点を有する請求項20に記載のコンピュータ可読プログラム記憶装置。
  23. それぞれの部分領域が、深さ優先探索に基づいて探索される請求項21に記載のコンピュータ可読プログラム記憶装置。
  24. 単位超立方体のn個の軸のそれぞれに沿って上界を得るステップが、できるだけ大きな体積を備えた前記単位超立方体の部分超立方体を決定するステップを備える請求項18に記載のコンピュータ可読プログラム記憶装置。
  25. 単位超立方体のn個の軸のそれぞれに沿って上界を得るステップが、2つの集合の前記一方に存在する最大数の特徴点を備えた前記単位超立方体の部分超立方体を決定するステップを備える請求項18に記載のコンピュータ可読プログラム記憶装置。
  26. 前記新しい規則によって定義される超立方体が、前記分類平面上に存在する頂点を有する請求項18に記載のコンピュータ可読プログラム記憶装置。
  27. 前記変換された空間における前記単位超立方体が、前記変換された空間の座標系の原点に頂点を有する請求項18に記載のコンピュータ可読プログラム記憶装置。
JP2007527674A 2004-06-08 2005-06-07 規則抽出に基づいてディジタル画像における特徴を識別するためのシステムおよび方法 Pending JP2008501486A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US57779204P 2004-06-08 2004-06-08
US11/145,886 US7512276B2 (en) 2004-06-08 2005-06-06 System and method for feature identification in digital images based on rule extraction
PCT/US2005/020067 WO2005124665A1 (en) 2004-06-08 2005-06-07 System and method for feature identification in digital images based on rule extraction

Publications (1)

Publication Number Publication Date
JP2008501486A true JP2008501486A (ja) 2008-01-24

Family

ID=34972013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007527674A Pending JP2008501486A (ja) 2004-06-08 2005-06-07 規則抽出に基づいてディジタル画像における特徴を識別するためのシステムおよび方法

Country Status (6)

Country Link
US (1) US7512276B2 (ja)
EP (1) EP1756753A1 (ja)
JP (1) JP2008501486A (ja)
AU (1) AU2005255410B2 (ja)
CA (1) CA2569658A1 (ja)
WO (1) WO2005124665A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019522299A (ja) * 2016-08-02 2019-08-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ロバスト肺葉セグメンテーション

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340441B1 (en) * 2004-12-17 2008-03-04 The Mathworks, Inc. Search directions in pattern search via rotation
US20150138078A1 (en) * 2013-11-18 2015-05-21 Eyal Krupka Hand pose recognition using boosted look up tables
JP2018534703A (ja) * 2015-09-10 2018-11-22 エスワイエヌシー−アールエックス、リミテッド 自動画像特徴除去

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019522299A (ja) * 2016-08-02 2019-08-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ロバスト肺葉セグメンテーション

Also Published As

Publication number Publication date
US7512276B2 (en) 2009-03-31
CA2569658A1 (en) 2005-12-29
AU2005255410A1 (en) 2005-12-29
AU2005255410B2 (en) 2009-02-26
EP1756753A1 (en) 2007-02-28
US20050286773A1 (en) 2005-12-29
WO2005124665A1 (en) 2005-12-29

Similar Documents

Publication Publication Date Title
Özyurt et al. A novel liver image classification method using perceptual hash-based convolutional neural network
Öztürk Stacked auto-encoder based tagging with deep features for content-based medical image retrieval
Liu et al. Generic perceptual loss for modeling structured output dependencies
Raza et al. Lung-EffNet: Lung cancer classification using EfficientNet from CT-scan images
Sharma et al. [Retracted] Lung Disease Classification in CXR Images Using Hybrid Inception‐ResNet‐v2 Model and Edge Computing
Li et al. Neural-response-based extreme learning machine for image classification
Bozkurt A deep and handcrafted features‐based framework for diagnosis of COVID‐19 from chest x‐ray images
Pawar et al. Two‐Stage Hybrid Approach of Deep Learning Networks for Interstitial Lung Disease Classification
Alfifi et al. Enhanced artificial intelligence system for diagnosing and predicting breast cancer using deep learning
Tripathy et al. Brain MRI segmentation techniques based on CNN and its variants
EP4318322A1 (en) Data processing method and related device
Saraf et al. Deep learning challenges in medical imaging
JP2008501486A (ja) 規則抽出に基づいてディジタル画像における特徴を識別するためのシステムおよび方法
Hao et al. Performance optimization of hunger games search for multi-threshold COVID-19 image segmentation
CN116805534A (zh) 基于弱监督学习的疾病分型方法、系统、介质及设备
CN115731412A (zh) 一种基于群等变注意力神经网络的图像分类方法及其装置
Zhang et al. Classification of biomedical images using content based image retrieval systems
CN112465118A (zh) 一种面向医学影像生成的低秩生成式对抗网络构建方法
Rotemberg et al. Towards' interpretable'artificial intelligence for dermatology.
Dilmi Automatic COVID-19 diagnosis using deep learning features and support vector machines based on Bayesian optimization
Hassanien et al. Rough set approach for classification of breast cancer mammogram images
Rajeashwari et al. Enhancing pneumonia diagnosis with ensemble-modified classifier and transfer learning in deep-CNN based classification of chest radiographs
Fung et al. Rule extraction from linear support vector machines via mathematical programming
Hosseini Covid-19 detection using chest x-ray images based on machine learning and deep learning models: Further evidence from data augmentation
Nessipkhanov et al. Deep CNN for the Identification of Pneumonia Respiratory Disease in Chest X-Ray Imagery

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100818

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100825

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100921

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100929

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101018

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110810

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110810

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110817

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110817

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110912

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111007

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111017

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120207