JP2008544766A - デジタル画像のピクセルまたはボクセルをコーディングするための方法、およびデジタル画像を処理するための方法 - Google Patents

デジタル画像のピクセルまたはボクセルをコーディングするための方法、およびデジタル画像を処理するための方法 Download PDF

Info

Publication number
JP2008544766A
JP2008544766A JP2008510570A JP2008510570A JP2008544766A JP 2008544766 A JP2008544766 A JP 2008544766A JP 2008510570 A JP2008510570 A JP 2008510570A JP 2008510570 A JP2008510570 A JP 2008510570A JP 2008544766 A JP2008544766 A JP 2008544766A
Authority
JP
Japan
Prior art keywords
pixel
voxel
image
pixels
voxels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008510570A
Other languages
English (en)
Inventor
イラリア ゴリ
マルコ マッテュージ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bracco Imaging SpA
Original Assignee
Bracco Imaging SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bracco Imaging SpA filed Critical Bracco Imaging SpA
Publication of JP2008544766A publication Critical patent/JP2008544766A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Processing (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Generation (AREA)

Abstract

デジタルまたはデジタル化された二次元もしくは三次元の画像のピクセルまたはボクセルをコーディングするための方法であって;ピクセルの二次元配列またはボクセルの三次元配列で構成されるデジタル画像を用意するステップであって、各ピクセルまたはボクセルが、グレースケール画像における強度またはカラー画像におけるHSV(色相、彩度、および明度)値またはRGB値としての少なくとも1つの変数によって定義されるステップ;画像の各ピクセルまたはボクセルをターゲット・ピクセルまたはボクセルとみなし、各ターゲット・ピクセルまたはボクセルについて、前記ターゲット・ピクセルまたはボクセルと周囲の或る数のピクセルまたはボクセルとを含むピクセル・ウインドウまたはボクセル・ウインドウによってネイバーフッドを形成するステップ;各ターゲット・ピクセルまたはボクセルについて、前記ターゲット・ピクセルまたはボクセルに一意に関連付けられるベクトルを生成するステップであって、前記ベクトルの成分が、前記ターゲット・ピクセルまたはボクセルならびに前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値として生成されるステップ;を含む。前記ターゲット・ピクセルもしくはボクセルならびに前記ピクセル・ウインドウもしくはボクセル・ウインドウのピクセルもしくはボクセルの各々の関数の値は、前記ウインドウのピクセルもしくはボクセルを表す数値行列の特徴パラメータまたは前記数値行列の変換の特徴パラメータに対応する。さらに本発明は、上記方法に従ってコーディングされた画像データが、例えば人工ニューラル・ネットワークのような予測アルゴリズムによって処理される画像処理方法に関する。
【選択図】図1

Description

デジタルまたはデジタル化画像のピクセルまたはボクセルをコーディングする方法。ならびに特に画像化された物体の特徴を認識する方法に関する。特に、本発明に係る物体の特徴を認識する方法は、前記ピクセルまたはボクセルをコーディングするための方法を適用して、デジタルまたはデジタル化画像を処理するのに好適に用いられる。
本発明は、二次元もしくは三次元のデジタル画像またはデジタル化された二次元もしくは三次元画像のピクセルまたはボクセルをコーディングするための方法であって、以下のステップを備える。
a)前記方法は、デジタル画像を提供するステップを備え、前記デジタル画像はピクセルの二次元配列またはボクセルの三次元配列で構成され、各ピクセルまたはボクセルは少なくとも1つの変数によって定義され、前記変数はグレースケール画像における強度、またはカラー画像におけるHSV(色相、彩度、および明度)値またはRGB値である。
b)前記方法は、さらに、前記画像の各ピクセルまたはボクセルをターゲット・ピクセルまたはボクセルと判断するステップを備える。各ターゲット・ピクセルまたはボクセルにおいて、前記ターゲット・ピクセルまたはボクセルと周囲の特定数のピクセルまたはボクセルが隣接部を形成し、該隣接部及び前記ターゲット・ピクセルがピクセル・ウインドウまたはボクセル・ウインドウを形成する。
c)前記方法はさらに、各ターゲット・ピクセルまたはボクセルにおいて、前記ターゲット・ピクセルまたはボクセルに一意に関連付けられるベクトルを生成するステップを備え、前記ベクトルの成分は、前記ターゲット・ピクセルまたはボクセルの関数の値として生成されるとともに、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値として生成される。
デジタルまたはデジタル化画像は、小さな二次元または三次元のドットの形態であり、これらドットは、表示装置の画面上または印刷コピー上で特定の外観をもたらす。
各デジタルまたはデジタル化画像は、多くのドットによって形成されている。これら多くのドットは、二次元画像においてはピクセルと称され、三次元画像においてはボクセルと称される。
各ピクセルまたはボクセルの外観は、物理的な変数によって記述することができる。該物理的な変数は、表示画面によって、または紙面に印刷されたときにおいて、特定の視覚的効果に変換される値である。
グレースケール画像などの黒色および白色の画像においては、灰色のさまざまな濃淡程度が、一意的に光強度値と関連付けられる。このビーム強度値は画像化される対象の一部分によって反射または生成され、デジタルまたはデジタル化画像のピクセルが取得される。グレースケールの異なる灰色レベルの各々の強度は、光の物理的なパラメータ、特に強度と一意に関連付けられる。なお、この光は、画像化される対象よって反射または放射される。光の物理的な種類は、任意の性質であってよい。例えば、光の物理的種類としては、任意のスペクトル場での電磁放射、もしくは音響放射、または画像化される対象によって生成または反射または拡散され得る他の種類の光などがあげられる。
カラー画像においては、通常、ピクセルの外観を一意に定めるために3つの異なる値が使用される。例えば、いわゆるHSV(色相、彩度、明度)システムまたはRGB(赤色、緑色、青色)システムなど、種々のシステムが知られている。これらのシステムは対等であり、ピクセルまたはボクセルの外観を値によって一意に記述するために異なって使用することができる。
したがって、デジタルまたはデジタル化画像を定めるピクセルまたはボクセルの配置は、二次元または三次元の数値行列を用いて表すことができる。この数値行列は、画像を一意に数値として示す。
二次元または三次元の画像のピクセルまたはボクセルをベクトルの形態にコーディングする方法は、よく知られており、前記二次元または三次元の数値表現を使用する。
欧州特許文献EP1,345,154号では、デジタルまたはデジタル化画像のピクセルまたはボクセルをコーディングする方法を開示している。該方法は、画像の各ピクセルまたはボクセルを表すベクトルを生成するために、デジタルまたはデジタル化画像のピクセルまたはボクセルを表す前記数値行列を使用する。
この文献において、デジタル画像の各ピクセルまたはボクセルは、コーディングの対象となるターゲット・ピクセルまたはボクセルであるとみなされる。このターゲット・ピクセルまたはボクセルの特定の周囲は、以下のように定められている。特定の周囲とは、ターゲット・ピクセル又はボクセルの周囲を取り囲む特定数のピクセル又はボクセルを意味する。このウインドウ(特定の周囲)は、ピクセルまたはボクセルの部分配列であり、この部分配列は、デジタル画像の前記ピクセルまたはボクセルを一意に表現する数値の行列と対応する部分行列によって表わされる。
ベクトルは、成分として、前記ウインドウのターゲット・ピクセルまたはボクセルと、周囲のピクセルまたはボクセルを記述する数値を備える。
したがって、例えば、画像の各ピクセルを表現する値が各ピクセルの強度である、グレースケール画像の場合、また、3×3のピクセルを有するピクセル部分配列または3×3×3のボクセルを有するボクセル部分配列に相当するウインドウを定めると、ベクトルは、それぞれ9個または27個の成分を備えることになる。カラー画像の場合、ベクトルは、少なくとも3つの値を有し、この3つの値は、各ピクセルまたはボクセルを記述する。したがってベクトルの数値成分は、二次元の画像については3×3×3=27個の成分であり、三次元の画像については3×3×3×3=81個の成分である。
より大きなピクセル・ウインドウまたはボクセル・ウインドウが使用される場合、ベクトルの数値成分の数は急激に増加する。
ここで、一定の画像領域の場合、デジタル画像の解像度は、画像領域単位のピクセルまたはボクセルの数によって与えられる。したがって、解像度を高めると、特定の画像がより多数のピクセルを備えるようになる。
よって、例えば画像のデジタル処理のために前述のコーディング方法を使用すると、多数の数値データを処理しなければならず、高い演算能力および長い演算時間が必要になる。
いずれの場合も、前述のコーディングの方法は、特に例えば画像の強調または画像のパターン認識の分野において、驚くべき結果をもたらしている。上述のコーディングの方法は、以下の考えに基づいて行なわれている。この考えとは、画像化される対象は前記ピクセルあるいはボクセルによって表現されるのだが、前記画像化される対象の部分の質または特徴についての各ピクセルまたはボクセルは、主として前記ピクセルまたはボクセルの数値データと周囲のピクセルまたはボクセルとの空間的関係に依存することを意味する。
デジタル画像処理の分野において、この原理が、いくつかの異なる結果を得るのに適用されている。
例えば、画像のターゲット・ピクセルまたはターゲット・ボクセルを含むターゲット・ピクセルまたはボクセルのウインドウを表す数値データの行列の固有値が、使用されていることが知られている。この数値データは、このターゲット・ピクセルもしくはボクセル・ウインドウを表現している。また、このターゲット・ピクセルもしくはボクセル・ウインドウは、画像のターゲット・ピクセルもしくはターゲット・ボクセルを備えていて、何らかの形で、前記ウインドウの他のピクセルもしくはボクセルに対するこのターゲット・ピクセルもしくはボクセルの特定の関係を表現している。
さらに、いくつかの画像処理演算子が、いわゆる画像パターン認識方法においてデジタル画像のエッジまたはコーナーを認識するために開発されている。
これらの演算子は、一般的に上述した通り機能する。デジタル画像の各ピクセルまたはボクセルをターゲット・ピクセルまたはボクセルとして定め、さらに一般的なサイズn×m(一般的には、n=m)のピクセルまたはボクセル・ウインドウを定め、各ピクセルまたはボクセル・ウインドウを表わす数値の行列に特定の変換を加えることによって、この演算子は機能する。なお、一般的なサイズn×m(一般的には、n=m)のピクセルまたはボクセル・ウインドウは、ターゲット・ピクセルまたはボクセルと特定の数の周囲のピクセルまたはボクセルを備える。
Sharma V.R. Madirajuらによる文献「Neural Network for robot image feature classification, A comparative study」、NEURAL NETWORK FOR SIGNAL PROCESSING Y1994 IV Proceedings of the 1994 IEEE Workshop Ermioni Greece、1994年9月6〜8日、New York,NY,USA,IEEEにおいては、特徴抽出器が開示されている。この特徴抽出器は、画像内の直線、曲線、分岐、または他の幾何学形状などの特徴を識別できるよう、その能力を備えている。
この特徴抽出器は、特定数の特徴モデルを基礎として構築されている。この特徴モデルは、多種多様なエッジの各種類にモデルが定められている。これは、形状および画像化された物体のロボットによる認識が必要であるという技術目的に合致する。
モデルは、中心ピクセルを中心とする3×3のピクセル・ウインドウであり、該中心ピクセルは、デジタル画像の対象のピクセルである。特徴を回転不変の方法で記述するには、3×3のピクセル・ウインドウに対応する共分散行列の固有空間である特徴記述子が使用される。
明らかに見て取れるように、この種のモデルは、一種のフィルタである。そして、画像に存在する幾何学的構造を、画像のピクセルがこの幾何学的構造の一部を構成するか否かをモデルが判断することによって識別する。そのようにして識別された幾何学的構造は、画像内で識別された形状によって画像化された物体を認識するのに使用できる。ピクセルがエッジ、コーナー、曲線などの幾何学的構造または形状の一部を構成するか否かの判断は、人工ニューラル・ネットワークを使用して行われる。ニューラル・ネットワークによって与えられる結果は、ピクセルの前述の特徴を提示していて、その特徴は、ピクセルがエッジの一部を構成すること、ピクセルがコーナーの一部を構成すること、またはピクセルが直線もしくは曲線もしくは他の幾何学的構造の一部を構成するという事実を提示することに限定されている。画像のピクセルによって表わされる画像化された実際の物体の一部分の質または特徴については、何ら情報は得られない。上述の文献に記載の処理は、単なる「絵のような」特徴の提出に限定されている。
したがって、例えばエッジ検出へのこれらの方法の適用は、以下の説明でさらに詳しく定義されるいわゆる勾配行列を使用する。勾配行列の使用は、例えば「Introductory techniques for 3-D Computer Vision」、E.TruccoおよびA.Verri、Prentice Hall、1998年において知られている。
ヘシアン行列と呼ばれる、他の演算子は、前記ピクセルまたはボクセル・ウインドウを記述する数値データからなる元の行列の二次導関数に相当する。この演算子は、その固有値の記述によって、画像処理演算子として使用される。例えば、画像の細部の主要な特徴を強調する画像処理演算子があげられる(Jiri Hladuvka、Andreas Koenig、およびEduard Groeller、「Exploiting Eigenvalues of the Hessian Matrix for Volume Decimation、In Vaclav Skala、editor、9th International Conference in Central Europe on Computer Graphics,Visualization,and Computer Vision(WSCG 2001)」、124〜129頁、2001年)。
欧州特許文献EP1345154号に開示されている画像処理方法は、画像のピクセルの特別なエンコーディング方法であるために、画像内のピクセルによって表わされた画像化された物体の一部分の特徴の分類することができる。これと異なり、エッジ検出方法の機能は、ピクセルが属する特定の幾何学的構造に関する画像のピクセルの分類、及び、ピクセルが画像において表わしている特定の幾何学的構造に関する画像のピクセルの分類に限定されている。したがって、エッジ検出方法および類似の方法を考えると、これらは、画像のピクセルの分類ができず、またはそのような分類を対象としていない。従って、画像内でピクセルにより表わされている画像化された、実際の物体の一部分の質または特徴について情報または予測を得ることができない。共分散行列の固有値またはウインドウのピクセルに関するパラメータの行列の他の関数の他のパラメータの使用は、ピクセルの属する幾何学的構造の特定のモデルのみを記述する。代わりに文献EP1345154号に開示の方法を考えると、目的は、明らかに実際の物体の一部分の質または特徴についての情報を得ることである。この一部分は、前記物体を示している画像の前記ピクセルの外観を記述するパラメータを処理することにより、前記実際の物体の画像の特定のピクセルによって表わされるものである。現行のエッジ検出技法は、この技術的課題を解決していないばかりか、これらの方法によって使用されるモデルが、上述の分類を実行する上で役立つかどうかさえ疑わしい。
対角化可能な(2次元の)行列の場合には、固有値は、行列およびその特性を代表している。例えば、(2次元の)行列の最も重要な特性の1つである階数は、固有値によって特徴付けられている。実際、対角化可能な(2次元の)行列においては、ゼロでない固有値の数が階数に等しい。
特に、勾配行列およびヘシアン行列は、対角化可能な(2次元の)行列であり、したがってそれらをそれらの固有値によって特徴付けることができる。
これは、一般に、他の(2次元の)行列においてはあてはまらない。本発明によれば、(2次元の)行列の特異値を考慮することによって、この問題を克服することができる(D.Bini、M.Capovani、O.Menchi、「Metodi numerici per l'algebra lineare」、Zanichelli)。実際、特異値は、たとえ行列が対角化可能でなくても、(2次元の)行列の代表である。例えば、ゼロでない特異値の数は、すべての(2次元の)行列の階数に等しい。
一般化は、3次元の行列においては存在する。実際、一般的なM×N×Kの3次元行列について、行列を特徴付けるN+M+Kの一般化された特異値を見つけることができる。(「A multilinear singular value decomposition」、Lieven De Lathauwer、Bart De Moor、Joos Vandewalle、SIAM Journal on Matrix Analysis and Applications Volume 21,Number 4 1253〜1278頁)。
他の処理方法が、画像データを処理するために使用されている。とりわけ、ウェーブレット変換、自己相関変換、および共起行列変換などの方法が思い出される。
ウェーブレット変換は、一般的に、画像の圧縮に使用されている。ウェーブレット変換についてのさらに詳しい説明は、参考資料1を参照のこと。
ウェーブレット変換によれば、画像データ・配列を一式の基底関数で表すことができる。基底関数の部分集合を使用することで、該当の画像情報に関するパラメータを減らすことができる。したがって、主要な特徴を大きく失うことなく、画像データの圧縮を達成することができる。
ウェーブレット変換は、一般的には、2n×2nの大きさを有するウインドウについて計算される。任意のサイズのウインドウのウェーブレット変換は、ウインドウの境界における情報を喪失することになるが、計算することは可能である。ウェーブレット変換によって1つのピクセルを特徴付けるために、ターゲット・ピクセルの周囲に4つのウインドウを構築することができる。これら4つのウインドウは、それぞれターゲット・ピクセルの左下の角、右下の角、左上の角、および右上の角に有する。各ウインドウは、2n×2nの大きさを有する。従って、これら4つの数値行列のウェーブレット変換の1つ以上の係数を使用することによって、ターゲット・ピクセルのコーディングを行うことができる。
画像データの自己相関変換および共起行列変換は、画像テクスチャ情報について或る程度意味のある一式のパラメータを提供する。
しかしながら、既知のコーディングの方法はすべて、隣接部のピクセルまたはボクセルの数値を使用することによって、常にコーディングがなされている。この隣接部のピクセルあるいはボクセルは、コーディング対象のターゲット・ピクセルまたはボクセルを備えるピクセルまたはボクセル・ウインドウによって、定められる。
欧州特許文献EP1,345,154号 「Neural Network for robot image feature classification, A comparative study」 「Introductory techniques for 3-D Computer Vision」 「Exploiting Eigenvalues of the Hessian Matrix for Volume Decimation、In Vaclav Skala、editor、9th International Conference in Central Europe on Computer Graphics,Visualization,and Computer Vision(WSCG 2001)」 「Metodi numerici per l'algebra lineare」 「A multilinear singular value decomposition」
本発明の目的は、デジタルまたはデジタル化された二次元画像のピクセルまたは三次元画像のピクセルまたはボクセルを上述したステップに従ってエンコードするための方法を提供することである。該方法は、特にデジタル画像処理において、より少ない数値データでターゲット・ピクセルまたはボクセルを一意に表す方法である。特に、本発明は、ターゲット・ピクセルまたはボクセルによって表される画像化された物体の一部分の質または特徴を自動認識する方法を提供する。
本発明によれば、上記目的は、デジタルまたはデジタル化された二次元もしくは三次元の画像のピクセルまたはボクセルをエンコードする方法によって達成される。該方法は、
a)ピクセルの二次元配列またはボクセルの三次元配列で構成されるデジタル画像を提供し、前記各ピクセルまたはボクセルは、グレースケール画像における強度またはカラー画像におけるHSV(色相、彩度、および明度)値もしくはRGB値としての少なくとも1つの変数によって定義されるステップと、
b)画像の各ピクセルまたはボクセルを、ターゲット・ピクセルまたはボクセルとみなし、各ターゲット・ピクセルまたはボクセルにおいて、隣接部がピクセル・ウインドウまたはボクセル・ウインドウによって形成され、前記ピクセル・ウインドウまたはボクセル・ウインドウは、前記ターゲット・ピクセルまたはボクセルと周囲の特定数のピクセルまたはボクセルを備えるステップと、
c)各ターゲット・ピクセルまたはボクセルはベクトルを生成し、前記ベクトルは、前記ターゲット・ピクセルまたはボクセルに一意に関連付けられ、前記ベクトルの成分は、前記ターゲット・ピクセルまたはボクセルの値、そして、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々または一部の関数の値として、生成されるステップを備える。
該方法は最初に説明されており、該方法において、前記ターゲット・ピクセルまたはボクセルの値、そして、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす数値行列の特徴パラメータ、または前記数値行列の変換の特徴パラメータのいずれかに対応している。
すでに強調したように、この方法は、あらかじめ構成された種々の幾何学的構造の一連のモデルの中で、画像のピクセルが、特定のあらかじめ定められた幾何学的構造に属するか否かを判断することに限られるわけでも、そのような判断を対象とするものでもない。この方法は、実際の画像化された対象の少なくとも前記一部分の特定の特徴または質についての情報を得ることを対象としている。この情報は、ピクセルの外観を記述するパラメータを処理することによって、得られる情報である。なお、このピクセルの外観は、画像内の実際の画像化された対象の少なくとも一部分を表している。本発明によれば、画像のピクセル間のトポロジ的関係(位相幾何学的関係)が、この処理方法によってより広範に分析される。そして驚くべきことに、パラメータのトポロジ的情報および数値表現は、特定の周囲のピクセルの関係を考慮に入れて、ピクセルの外観を一意に定める。そして、パラメータのトポロジ的情報および数値表現は、出発データを提供することができる。この出発データを用いることで、画像ではなく画像化された実際の物体の一部分の質または特徴を予測することが可能である。
この画像処理方法は、現時点で既知の画像処理方法と大きく異なっている。なぜなら、単に画像化された物体の形状を認識するのではなく、実世界をその画像における表現によって解釈することを目的としているためである。
本明細書および特許請求の範囲において、コーディングまたはエンコーディングという用語は、スカラー・パラメータのn次元空間を使用して画像内のピクセルの外観を数値的に表現することを意味し、それによって、各ピクセルが一意に記述され、画像の他のピクセルから区別される。
一般的な行列に関して、多数の種類の特徴パラメータを、選択的または組み合わせにおいて使用することができる。
考えられる第1組のパラメータは、選択されたウインドウのピクセルまたはボクセルの画像データを備える数値行列の特異値によって形成される。すでに述べたように、特異値は、一般的な行列を示す。
パラメータを変更するもしくは組み合わせることで、前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす前記数値行列の勾配行列の固有値に対応する。
パラメータを変更するもしくは組み合わせることで、前記ターゲット・ピクセルまたはボクセルならびに前記ピクセル・ウインドウの関数の値と、ボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす前記数値行列のヘシアン行列の固有値に対応する。
上述のパラメータの選択肢の代替として提供でき、または上述の選択肢に組み合わせて提供できるさらなる選択肢として、前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす前記数値行列のウェーブレット変換の係数の1つ以上に対応する。
この場合、複数のウェーブレット基底関数を選択して、選択的または組み合わせにて使用することができる。
ウェーブレット変換のさらなる詳細な説明が、参考資料1に提示されている。この参考資料は、インターネットから入手できるのだが、Duke UniversityのBrani VidakovicおよびPeter Muellerによる「Wavelet for Kids,A tutorial introduction」という名称の刊行物である。この文献において、ウェーブレットの理論が概説および検討され、画像処理へのいくつかの応用が開示されている。
画像処理におけるウェーブレットを開示している段落から判断すると、ウェーブレット分解を実行することで、パラメータを得ることができる。分解の各レベルにおいて、ウェーブレット変換は、平均を表す1つの行列およびいわゆる詳細を表す3つの行列を生成する。上記行列の1つ以上から、いくつかのパラメータを抽出することが可能である。このパラメータの抽出は、限定するわけではないが、例えば、行列の要素の平均を取ることによって、または第2の例では行列の特異値を取ることによって行われる。これらのパラメータのすべてまたはいくつかを使用することで、ベクトルの成分を形成することができる。このベクトルは、各ターゲット・ピクセルまたはボクセルを、選択されたウインドウを備える周囲のピクセルまたはボクセルとの関係によって表現される。
さらに、パラメータを変更するもしくは組み合わせることで、前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす前記数値行列の自己相関変換の係数の1つ以上と対応する。
画像処理における自己相関は、一般的に、画像のテクスチャを特徴付けるためのツールとして使用され、2つの画像の数学的評価で構成される。この2つの画像は、異なる時点において取得することが可能である。もしくは、第1の画像を空間においてずらして、その結果を第2の画像として取得することによってこの2つの画像は生成される。自己相関は、これら2つの画像間の関係を決定する。この数学的評価は、ターゲット・ピクセルまたはボクセルをコーディングする際に、考慮すべきパラメータの数を削減する可能性を提供する。
さらに、ピクセルを変更もしくは組み合わせることで、前記ターゲット・ピクセルまたはボクセルの関数と、前記ピクセル・ウインドウのピクセルまたはボクセル・ウインドウのボクセルの各々の関数の値は、前記ウインドウのピクセルまたはボクセルを表わす前記数値行列の共起行列(または、その特異値)と対応する。
共起行列は、一定の空間的関係で離間した、一対のピクセルについての灰色レベルの二次元のヒストグラムである。この行列は、一対のピクセルの同時確率分布に近似する。一般的に、この行列は、コントラストおよびエントロピーといったテクスチャの指標を計算するのに使用される。
上述の既知のコーディングの方法で提示したように、同じ数のピクセルを有するピクセル・ウインドウ、またはボクセルを有するボクセル・ウインドウを考えた場合、以上の場合のいずれにおいても、各ターゲット・ピクセルまたはターゲット・ボクセルをコーディングするベクトルの成分の数は少なくなる。なお、上述の既知のコーディングの方法において、選択されたウインドウを構成する各ピクセルまたはボクセルを記述する数値は前記ベクトルのパラメータとみなされている。
この場合、以下に示す組み合わせを用いることで、各ピクセルまたはボクセルをコーディングすることが可能であり、かつ好都合である。この組み合わせとしては、ウインドウのピクセルもしくはボクセルを表す数値の行列の固有値もしくは特異値の組み合わせ、及び/または前記ウインドウのピクセルもしくはボクセルを表す前記数値行列の勾配行列もしくはヘシアン行列の固有値の組み合わせ、及び/またはウェーブレット変換の係数の1つ以上の組み合わせ、及び/または自己相関変換の係数の1つ以上の組み合わせ、及び/または共起行列のエントリもしくは特異値の1つ以上の組み合わせが提示される。
したがって、各ターゲット・ピクセルまたはボクセルを記述する数値と、選択された、隣接部のピクセルまたはボクセルを記述する数値との関係は、以下に示す要素よって集約することができる。なお、この選択された、隣接部のピクセルまたはボクセルは、ピクセル・ウインドウまたはボクセル・ウインドウによって定められている。上記要素としては、各ピクセルまたはボクセルの外観を単に表現している値を有する、元の数値行列の前記種々の変換の前記特異値および/または固有値、及び/またはウェーブレット変換の1つ以上の係数、及び/または自己相関変換の係数の1以上の係数、及び/または共起行列のエントリもしくは特異値の1以上のエントリもしくは特異値が提示される。そして、各ベクトルにおいて、各ターゲット・ピクセルまたはボクセルを記述する数値と、選択された、隣接部のピクセルまたはボクセルを記述する数値との関係は種々の数値によって定められ、該種々の数値は、選択されたウインドウ内の画像のピクセルまたはボクセル間の特定の種類の関係を強調するのに特に適している、またはそのような種類の関係に対して影響を受ける。
さらなる改善として、画像のピクセルまたはボクセルを表す行列の数値データは、コーディングに先立って、1つ以上の前処理ステップに供することができる。該前処理ステップは、本明細書において前処理(フィルタ処理)ステップとして定めることができる。
例えば、前処理ステップを実行することで、コントラストを強調できる。または、他の既知の画像の前処理ステップは、変更または組み合わせることで、使用することができる。
比較的複雑または高度に発展した前処理ステップは、本発明によるコーディングを実行する前のデジタル画像について実行することができる。
前処理方法の1つは、米国特許公報5,140,670号に記載された、画像処理する方法である。そして、この方法は、いわゆるCNNセルラー・ニューラル・ネットワークを利用する。他の前処理方法は、国際公開公報WO2005/020132号に記載されており、ACMと称される。
これらの両方の場合において、画像データ、すなわち画像のピクセルまたはボクセルの配列の各々のピクセルまたはボクセルの外観を表わす数値の配列は、ニューラル・ネットワークのノットに等しく設定される。そして、前記画像データは、ニューラル・ネットワークのノットを掃引する演算子を適用することによって、または単にネットワークを進化させることによって処理される。
第1の場合は、一般的に、いわゆるネットワークが使用され、ネットワークの単一のノットを順次掃引する演算子が定められる。
第2の場合には、ネットワークについて、学習関数および/または活性関数が定められる。この学習関数および/または活性関数は、ノットの内部状態を変更させる。前記ノットの内部値または接続の重み付けが、画像データを変化させるのに使用される。
画像データを何らかの形態でフィルタ処理することで、このような種類の前処理が実行できる。その結果、ノイズの影響を軽減または抑制し、および/または、画像データのコントラストまたは他の特徴を強調する。
さらに、この種の前処理によって、画像のピクセルまたはボクセルの外観に応じた変更が行なわれる。そして、この種の前処理は、ピクセルまたはボクセルの外観とピクセルまたはボクセルによって表される物体との特定の関係を何らかの方法で強調する。このように、該当の特徴を表す画像または画像化された物体の特定の部分は、前処理された画像においてより良好に認識できる。したがって、本発明のコーディングの方法が、予測アルゴリズムとの組み合わせにおいて適用される時、この種の前処理は画像データのさらなる分類プロセスに役に立つ。この予測アルゴリズムは、画像化された物体の質を自動的に認識するのに用いられる。なお、入力データは、本発明による方法に従ってコーディングされた画像のピクセルもしくはボクセルによって、構成される。
さらに、本発明は、デジタルまたはデジタル化画像を処理するための方法に関する。該方法は、以下のステップを備える。前記方法は、
a)既知の物体のデジタル画像の一式を提供するステップを備える。前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列によって構成され、各ピクセルまたはボクセルは、少なくとも1つの変数によって定められる。前記変数は、そのグレースケール画像においては強度、カラー画像においてはHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルが、画像化された物体の対応領域または対応部分を表現する。前記対応領域または対応部分において、所望の質または特徴は既知であり、前記既知の質または特徴が、デジタル画像の対応ピクセルまたは対応ボクセルに一意に関連付けられる。
b)前記方法は、さらに、前記デジタル画像の各ピクセルあるいはボクセルを、または、前記デジタル画像の部分集合の各ピクセルまたはボクセルを、上述した本発明の方法の考えられる変形の1つに従ってコーディングし、各ベクトルと一意に関連付けするステップを備える。前記画像のピクセルまたはボクセルは、画像化された物体の領域または部分における既知の質または特徴と対応し、前記ボクセルまたはピクセルは前記ベクトルによって表わされる。
c)前記方法は、さらに、ニューラル・ネットワークなどの予測アルゴリズムを提供するステップを備える。
d)前記方法は、さらに、前記予測アルゴリズムの学習およびテストを実行するステップを備える。前記実行は、既知の物体の前記画像の各ピクセルまたはボクセルへと一意に関連付けられたベクトルを入力データとして使用するとともに、画像化された物体の領域または部分の既知の質または特徴を出力データとして使用することによって行われる。前記画像のピクセルまたはボクセルは前記画像化された物体と対応し、前記ベクトルの各々は前記画像化された物体と一意に関連付けられる。
e)前記方法は、さらに、物体のデジタル画像を提供するステップを備え、前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列によって構成され、各ピクセルあるいはボクセルは少なくとも1つの変数によって定められる。前記少なくとも1つの変数はグレースケール画像においては強度であり、カラー画像においてはHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルは、質または特徴を判断する必要がある画像化された物体の対応領域または対応部分を示す。
f)前記方法は、さらに、前記デジタル画像のピクセルまたはボクセルを、あるいは、前記デジタル画像のピクセルまたはボクセルの部分集合の各ピクセルまたはボクセルを、上述した本発明の方法の考えられる変形の1つに従って、コーディングするステップを備える。コーディングされた各ピクセルまたはボクセルは、ベクトルとして表現され、前記ベクトルは、前記ピクセルまたはボクセルへと一意に関連付けられる。
g)前記方法は、さらに、デジタル画像のピクセルまたはボクセルの各々または一部について、対応ベクトルの成分を、学習およびテストを行った後の予測アルゴリズムの入力データとして使用するステップを備える。
h)前記方法は、さらに、前記画像化された物体の領域または部分の質または特徴を決定し、前記領域または部分の質または特徴は一意にコーディングされたピクセルまたはボクセルに一意に対応し、前記成分は予測アルゴリズムへの入力として供給され、前記供給は予測アルゴリズムの出力応答によって行なわれるステップを備える。(図9を参照)。
とくに効果的なアルゴリズムは、周知の人工ニューラル・ネットワークである。それらのアルゴリズムのさらに深い理解のためには、HAYKIN S.の「Neural Networks:A Comprehensive Foundation」、Prentice Hall、Upper Saddle River,NJ、1999年を参照されたい。他の予測アルゴリズムも、変更または組み合わせることで使用可能である。そして、画像化された物体の領域または部分の質または特徴は、前記異なる種類の予測アルゴリズムの出力の組み合わせとして決定することができる。なお、前記画像化された物体は各ピクセルまたはボクセルと対応する。
以上から明らかであるように、本発明によるコーディングの方法は、より少ない関連データを用いることで、デジタル画像のピクセルまたはボクセルの外観の関連のある特徴を記述する。
これは、画像処理を考えた場合、特に画像パターン認識の分野または画像化された物体の領域または部分の質または特徴の自動認識の分野における画像処理を考えた場合、大いなる利点である。
この種の画像処理は、いわゆるCAD(コンピュータ支援診断)の分野にきわめて関係がある。この場合、画像は、例えば磁気共鳴画像、超音波画像、X線画像、またはCT画像など、任意の種類の診断画像であってよい。
画像がアナログ画像である場合、画像のデジタル・サンプリングのステップが必要とされるが、そのステップは公知の方法および装置によって簡単に実行できるステップである。
この場合、診断画像のピクセルまたはボクセルによって表わされる画像化された物体の領域または部分の質または特徴は、例えば健常な組織、悪性腫瘍の組織、または良性腫瘍の組織など、ピクセルが表わす組織の種類であってよい。
この方法は、必要とされる演算能力を低減させ、画像データの処理に要する時間を短縮する。加えて、この方法は、デジタル画像の各ピクセルまたはボクセルをコーディングする際に役立つ。このコーディングを行なうことにより、ピクセルがコーディングされているベクトルの成分は、処理された各ピクセルまたはボクセルの所与の隣接部のピクセルまたはボクセルの種々の強度に関する情報だけでなく、使用されたコーディング方法の変形に応じた異なる種類の情報も備えるようになる。隣接部の前記ピクセルの画像データの特異値は、コーディングの対象となる各ターゲット・ピクセルまたはボクセルの隣接部のピクセルまたはボクセルの強度値間の関係についての情報を圧縮された形で提供する。画像データの行列における、勾配行列の固有値とヘシアン行列の固有値は、前記隣接部のピクセルまたはボクセル間の関係の他の特徴についての集約情報または凝縮情報を提供する。前記他の特徴としては、例えば、前記隣接部のピクセルまたはボクセル間の強度変化の指標、すなわち選択されたウインドウ内のピクセルまたはボクセル間の強度変化の指標、および前記隣接部のピクセルまたはボクセルにおける強度関数の曲率などがあげられる。ウェーブレット変換および自己相関変換は、さらに、前記隣接部のピクセルまたはボクセル画像データの関係について異なる種類の情報を提供する。この異なる種類の情報は、少なくともダイバーシティ原理に基づいていて、この原理により、ベクトル成分を形成するパラメータを決定する。したがって、ウェーブレット変換および自己相関変換は何らかの形態で精度を向上させる。
さらに、このコーディングの方法は、少なくとも均等だが通常は予測精度を向上させる。現在、コンピュータ支援診断において、偽陽性診断は大きな問題となっている。従って、予測精度を向上させることは重要な項目である。陽性であると診断された結果の中から、すなわち画像において悪性の腫瘍組織を表すと判断されたピクセルまたはボクセルの中から、例えば、腫瘍の悪性組織の存在を判断するための予測アルゴリズムにて画像データを処理する時、前記得定数のピクセルまたはボクセルは、実際には悪性腫瘍組織に対応していない。悪性の腫瘍組織の発見において、この種の組織が存在する場合に予測アルゴリズムが悪性腫瘍を識別できるという意味で、予測アルゴリズムが高い精度を有していることは、公知の結果である。他方で、前記いわゆる真に陽性の悪性腫瘍組織の下方に存在する、健常な組織に対応するいくつかのピクセルまたはボクセルは、悪性の腫瘍組織として分類される。ユーザの注意を健康な領域へと引きつけるため、評価に要する時間が増加し、おそらくは誤って強調された領域において不必要な生体組織検査をユーザに実行させることになる。このことが欠点である。
診断画像の予測処理のための精度の向上により、いくつかの生体検査の必要性および診断時間を減少させるので、最も重要である。
上述の方法のさらなる改善として、二次元および三次元の画像に、時間という次元が追加されてもよい。
例えば、物体の1つの静止画像を処理する代わりに、所定の期間にわたる同じ物体の一連の画像を考慮する。この場合、前記一連の画像は、異なる瞬間t1、t2、・・・、tk(kは整数)において取得される単一の画像であってよい。この場合、上述の関数を
選択するまたは組み合わせることで、各画像がコーディングされる。上述の関数としては、画像行列の固有値および/もしくは特異値、および/もしくは勾配列の固有値および/もしくは特異値、および/もしくはヘシアン列の固有値および/もしくは特異値、および/もしくは共生起行列の固有値および/もしくは特異値、ならびに/またはウェーブレット変換パラメータが提示される。従って、コーディングされたベクトルは、この関数の少なくとも1つの一連の画像の対応画像の各瞬間値を、成分として含むことができる。
サイズがN×MであるK個の連続画像の時間変化をコーディングする第2の方法は、3次元行列を生成し、本明細書で既に述べたように2次元よりも高い次元の特異値の定義を使用する。
本発明による方法は、時間変化をパラメータのきわめて限られた組でコーディングし、リアルタイムのコンピュータ支援診断を実現可能にするという独自の利点を提供する。
本発明によるコーディング方法の簡略化した例を、従来技術によるコーディング方法との比較において、以下で添付の図面を参照しつつ説明する。
デジタルまたはデジタル化画像は、ピクセルP(n,m)(n,m=1、・・・、N)の配列によって形成される。各ピクセルは、モニタまたは画面上、または紙印刷物上の小さなドットであり、このドットが、特定の外観を有する。ドットの外観は、数値データによって表すことができる。いわゆるグレースケール画像においては、各ドットが、特定の強度を有していて、この強度は、前記グレースケールにおける灰色の特定のレベルと対応する。カラー画像においては、ピクセルの外観を数値データによって完全に記述するには、より多くのパラメータが通常必要となる。カラー画像のピクセルの外観を一意に表すために、いくつかのシステムが定義されている。考えられる1つのシステムは、周知のいわゆるHVS(色相、明度、彩度)システムであり、またはいわゆるRGB(赤色、緑色、青色)システムである。ここでの簡略化した例として、強度I(n,m)のみを提示する。
この例を提示することにより、当業者は、カラー画像が処理される場合において、これらの値が対応の数値データによって置き換えなければならないことを、当然ながら理解できるであろう。
したがって、図2に示されるような数値データI(n,m)(n,m=1、・・・、10)の配列は、以下に示す画像と対応する。その画像は、図1で概略的なピクセルの配列として例示しているが、ピクセルP(n,m)(n,m=1、・・・、10)を備える画像である。そして、この数値データの配列は行列である。
各ピクセルP(n,m)は、ピクセルの外観を数値的に記述する数値データI(n,m)へと一意に関連付けられている。例えば、この数値データとしては、グレースケール・デジタル画像におけるピクセルの灰色のレベルなどがあげられる。
従来技術によれば、画像のターゲット・ピクセルのコーディングは、以下に示すベクトルを用いて行なわれることが知られている。このベクトルは、成分として、前記ターゲット・ピクセルの周囲のピクセルについての情報が含まれている。通常、この周囲の領域は、ターゲット・ピクセルを中心とする(2S+1)×(2S+1)ピクセルの大きさを有するウインドウで構成される。ここで、Sは、ユーザによって任意に定められる整数(S=0、1、2、・・・、N)であり、ここでは「ステップ」と称される。
周囲のピクセルによって形成される上述のウインドウの定義は、勾配xの周囲のピクセルの定義と同等である。ここでxは整数であって、この整数は、ターゲット・ピクセルから隣接するピクセルまでの距離を、ステップを単位として表す。前記ウインドウの中心のピクセルをターゲット・ピクセルとみなすと、勾配1の周囲のピクセルを備えるウインドウは、ターゲット・ピクセルに直に隣接するピクセルのシェル(shell)である。また、勾配2の周囲のピクセルは、2つの最も近いシェルのピクセルを備え、この最も近いシェルのピクセルは、ターゲット・ピクセルを囲んでいる。また、この最も近いシェルのピクセルは、画像を形成するピクセルの配列の各方向において、ターゲット・ピクセルからの1つの距離ステップおよびターゲット・ピクセルからの2つの距離ステップに対応するピクセルである。この定義は、ボクセルの配列によって形成される3次元画像にも同様に当てはまる。
前記ウインドウの最小サイズは、3×3の大きさを有するピクセルの配列である。その中央のピクセルが、ターゲット・ピクセルであり、ステップSは1に等しい。例えばステップがそれぞれS=2およびS=3である、5×5もしくは7×7など、より大きなウインドウも選択可能である。簡単にするため、この例では、ターゲット・ピクセルを中心とする3×3ピクセルの配列に相当するウインドウを選択する。
このウインドウが、図2に提示されていて、画像のピクセルを表す数値データの行列を示している。
ウインドウWは、9個のピクセルを備え、その1つはターゲット・ピクセルである。図2に示すウインドウは、ターゲット・ピクセルP(2,2)を中心とし、ピクセルP(1,1)、P(1,2)、P(1,3)、P(2,1)、P(2,2)、P(2,3)、P(3,1)、P(3,2)、P(3,3)を備える。これらのピクセルは、対応する数値、すなわちこれらのピクセルの強度I(1,1)、I(1,2)、I(1,3)、I(2,1)、I(2,2)、I(2,3)、I(3,1)、I(3,2)、I(3,3)によって表される。
ウインドウW内の隣接するピクセルについての情報も使用するターゲット・ピクセルP(2,2)の公知のコーディング方法によれば、前記ピクセルの強度は、ターゲット・ピクセルP(2,2)の強度と一緒に、取り入れられる。なお、これらの強度は、このターゲット・ピクセルP(2,2)および上述のような周囲のピクセルの関係を表すベクトルの成分として取り入れられる。
このベクトルを、図3に概略的に示す。明らかであるように、ターゲット・ピクセルを表す各ベクトルは、9個の成分を有している。
図4は、従来技術にしたがってターゲット・ピクセルをコーディングするための前記ベクトルの一般的な表現を示す。この場合、ターゲット・ピクセルは、その強度によって表されており、強度I(n,m)を有するピクセルP(n,m)として定められている。
図5に、図4のベクトルに関するウインドウWが示されており、いわゆる勾配行列におけるその変換も示されている。
当業者にとって明らかだが、数値の配列はピクセルを表わしている。この場合、ウインドウW内のピクセルの強度データI(m−1,n−1)、I(m−1,n)、I(m−1,n+1)、I(m,n−1)、I(m,n)、I(m,n+1)、I(m+1,n−1)、I(m+1,n)、I(m+1,n+1)の配列は、二次元のオブジェクトである。したがって、考えられるウインドウ内の各ピクセルにおいて、2つの方向を定めることができ、2つの方向における勾配を評価することができる。
勾配行列は、対角化可能である。したがってその固有値?(この場合には、p=1,2)、および?? ?によって表すことができる。
選択されたウインドウWのピクセルの強度Iの元の行列を、さらに処理することができる。いわゆる前記元の行列について、ヘシアン行列を計算することができる。やはりこの場合にも、ヘシアン行列は、その固有値?によって表わすことができる。
選択されたウインドウの強度値Iの3×3の行列を考えるとき、通常は、上述のように、この行列が対角化可能ではなく、固有値は意味がない。したがって、このより一般的な場合を考えると、図5に示されるような選択されたウインドウWのピクセルの強度Iの元の行列は、いわゆる特異値σによって表わすことができる。
選択されたウインドウに対応する強度行列の特異値を、選択されたウインドウに対応する強度行列の勾配行列およびヘシアン行列の固有値に代えて使用しまたは組み合わせて使用し、対応するターゲット・ピクセルを一意にコーディングするためのベクトルを生成することが可能である。このベクトルの成分は、強度値の行列の前記特異値、勾配行列およびヘシアン行列の固有値で構成されている。前記強度値の行列の特異値は、選択されたウインドウのピクセルに対応していて、前記勾配行列およびヘシアン行列の固有値は、選択されたウインドウのピクセルに対応する強度値の前記行列を処理することによって得られる。
したがって、本発明の目的は、提案される方法の全体の予測関数における性能の喪失を伴うことなく、周囲のピクセルに対するターゲット・ピクセルの関係を、コーディングされたベクトルにきわめて凝縮した形態で表すことができるようにすることである。なお、周囲のピクセルは、選択されたウインドウを備えている。
この差は、選択されるウインドウが周囲のピクセルをより多く含むほど、ますます大きくなる。
上述の通り、ここに示される例は、選択されたウインドウのピクセルに対応する、強度値の元の行列の変換の特定の選択に限定されている。強度値の元の行列に代え、または組み合わせることで、さらなる変換を適用することができる。したがって、例えばウェーブレット分解を実行でき、平均および詳細値のすべてまたは少なくとも一部を、ターゲット・ピクセルのコーディングベクトルの成分として使用することができる。
強度値の元の行列を代替し、または組み合わせることで、選択されたウインドウのピクセルに対応する強度値の元の行列の自己相関変換を使用することが可能であり、得られたパラメータのすべてまたは少なくとも一部を、ターゲット・ピクセルのコーディングのためのベクトルの成分として使用することができる。
ウェーブレット変換を、前処理ステップとして使用することも可能である。次いで、得られた数値データの行列を、対応する勾配行列および/または対応するヘシアン行列で処理し、それらの特異値および/または固有値を変更または組み合わせることによって、決定することができる。
さらに他の改善によれば、デジタル画像に、最初にいわゆるセルオートマトンによる処理を加えることができる。米国特許文献US5,140,670号、ならびにLeon o.ChunaおよびLing Yangによる文献「Cellular Neural Networks:Application」、I.E.E.E.Trans.On Circuit & Systema vol.35(1988年)10月、No.10、New York,NY,USが、いわゆるセルオートマトンおよびニューラル・ネットワークの組み合わせを開示している。この新種の情報処理システムは、ニューラル・ネットワークのような大規模非線形アナログ回路であり、その回路が、信号をリアルタイムで処理する。セルオートマトンと同様、この新種の情報処理システムは、セルと呼ばれる規則的に離間した回路クローンの巨大な集合で作られており、セルは、隣接するセルを通じてのみ互いに直接的に連絡する。直接に接続されないセルは、セルラー・ニューラル・ネットワークの連続時間ダイナミクスの伝搬効果のため、互いに間接的に影響し合う。セルラー・ニューラル・ネットワークは、フィードバックおよびフィードフォワード動作を実行できる。セル間の接続は、一様かつ局所的である。これは、セルラー・ニューラル・ネットワークを、そのフィードバックおよびフィードフォワード演算子のテンプレートによって特徴付けることができることを意味する。これらの演算子が、セルラー・ニューラル・ネットワークの動的挙動を定める。これらの演算子は、有限の定数または係数からなる正方行列であり、セルラー・ニューラル・ネットワークの動的なルールを定めるいわゆるクローニング・テンプレートである。このように、セルラー・ニューラル・ネットワークにおいて、異なる種類の演算子を使用することができる。この演算子は、あらかじめ定められるとともに、処理対象のデータの配列のデータの特定の値から独立している。各々の演算子は、データについて特定の操作を実行するために、具体的に定められる。このことで、データからの特徴またはデータ間の関係の抽出または強調が行なわれる。通常は、そのような演算子テンプレート、いわゆる遺伝子のライブラリが用意され、そこから1つ以上の演算子テンプレートが選択され、所望のデータ処理の実行に使用される。したがって、例えば二次元の画像を考えるとき、或る演算子または遺伝子を、エッジの検出および強調のために用意することができる。また、さらなる演算子または遺伝子を、鮮鋭化のために用意することなどができる。演算子を、それらの効果の組み合わせを出力画像において得るべく、データを処理するために順に使用することができる。
別の手法も、ニューラル・ネットワークのノットに対応するセル(K)のn次元配列からなる人工ニューラル・ネットワークを使用する。各セルは隣接セル(K)と直接接続しており、該隣接セルはセル(K)の隣接部を形成する。図8および図9を参照されたい。
各セル(K)には、周囲を覆うセル(K)に隣接するセルと直接接続するための入力がそれぞれある。さらに、各セル(K)には、ひとつ以上の隣接セル(K)へ直接接続するための出力部がある。各セル(K)と直接的に隣接するセルとの間の接続は、ニューラル・ネットワークにおいて通常、重み付け(wij)によって決定される。各セルは内部値によってさらに特徴付けられる。該内部値はセル(K)の活性(化)値または関数(A)として定められる。また、信号処理関数(いわゆる伝達関数)によると、各セル(K)は信号処理を実行でき、セル出力信号(u)を生成する。伝達関数は
セル(K)の出力信号(u)を、セル(K)の活性(化)値の関数もしくはセル(K)の関数(A)として決定する。該伝達関数は恒等関数からなっており、前記恒等関数はセル(K)の活性(化)値または関数(A)をセル(K)の出力信号(u)と等しくする。
ニューラル・ネットワークによる演算へと送信されなければならない入力データ・レコード(P)のn次元のデータベースを用意する。このデータベースは対応するn次元空間に投影されたときのデータ・レコード(P)の相対位置がデータ・レコード(P)の該当する特徴であるn次元のデータベースを用意する。これにより、データベースのデータ・レコード(P)を、前記n次元空間における点の配列によって表すことができる。各々の点は、前記点配列において所定の位置を有するとともに、前記データベースのデータ記録(P)に関連付けられている。前記データベースの各データ・レコード(P)は、さらに少なくとも1つの変数か、またはそれぞれが特定の値(U)を持つ1以上の変数を有している。
各データ・レコード(P)は、ニューラル・ネットワークを形成するセルのn次元配列のセル(K)に関連付けられる。ニューラル・ネットワークのセル(K)がセル(K)のn次元配列上に有している位置は、対応するデータ・レコード(P)の位置と同じである。このデータ・レコード(P)は前記点のn次元点配列のひとつの点によって表わされている。各データ・レコード(P)の変数値(U)は、ネットワークの初期化値と考えられる。各データ・レコード(P)の変数値(U)は、該当するセル(K)の初期の活性値(A)または初期の出力値(u)として考えられる。
ニューラル・ネットワークが一定回数の反復処理ステップを踏んだ後、各セル(K)の活性(化)値(A)または出力値(u)は、前記該当するデータ・レコード(P)のための新たな値(U)と考えられる。
この手法によれば、前記特定の数の反復処理ステップの各処理ステップにおいて、重み付け(wij)は、各セル(K)と隣接セル(K)との間の直接的な接続を定めている。この重み付け(wij)は、各データ・レコード(P)の変数の現在値(U)の関数として決定される。なお、各データ・レコード(P)は前記セル(K)に直接、隣接するセル(K)と関連付けられている。この関数が、いわゆる学習関数またはルールである。各セル(K)の最新の活性値(A)または出力値(u)は、ニューラル・ネットワークの処理ステップを経た後においては、前記該当するデータ・レコード(P)の最新値(U)とみなされるものである。その各セル(K)の最新の活性値(A)または出力値(u)は、隣接セル(K)の最新の出力値(u)の関数として決定される。該隣接セルは、隣接セル(K)とセル(K)との接続を定めている対応する重み付け(wij)によって、重み付けがなされる。
ひとつの変形として、上述の人工ニューラル・ネットワークは、ニューラル・ネットワークの処理を経て、最新の活性化値(U)又は出力値(u)を重み付け関数として決定することにより修正可能である。この最新の活性化値(U)又は出力値(u)とは前記該当するデータ・レコード(P)にとっての最新値と考えられていて、重み付け関数とは隣接セル(K)とセル(K)との直接的接続を定めるものである。この関数が、いわゆる活性(化)関数、又はルールである。
ニューラル・ネットワークの処理ステップを経た各セル(K)の最新の活性(化)値(A)または出力値(u)は、前記該データ・レコードに対する最新値(U)とみなされており、隣接セル(K)の最新の出力値(u)及び、対応する重み付けの関数として決定される。この対応する重み付けは、隣接セル(K)とセル(K)との直接的な接続を定めている。前記のような関数は、いわゆる活性(化)関数またはルールである。
さらに、前記特定の数の反復する処理ステップの各処理ステップにおいて、重み付けは各セル(K)と隣接セル(K)との直接的な接続を定めるものであり、各データ・レコードの変数の最新値(U)の関数、及びデータ・レコード(P)の変数の最新値(U)の関数として決定される。この変数の最新値(U)は前記セル(K)に隣接するセル(K)に関連付けられ、データ・レコード(P)の変数の最新値(U)はセル(K)に関連付けられる。
データベースが二次元画像のピクセルによって形成されている場合、本発明によれば、上述のニューラル・ネットワークは画像処理のための装置を構成する。
したがって、図面の概略図に示された例を参照すると、ニューラル・ネットワークの各ノットの初期の内部値が、対応するピクセルPm,nの強度値I(n,m)に等しく設定されると考えると、使用される活性(化)関数または学習関数の種類に応じて、各ノットの内部状態が各処理ステップにおいて変化する。これが、対応するピクセルの新しい強度値に相当する。このようにして、活性関数または学習関数によって定められた特定のルールに従い、画像に外観の変化が加えられる。
例えばクラスタ化アルゴリズムによる画像データの処理など、画像データを前処理するためのさらなる方法および対応するアルゴリズムを使用することもできる。
画像化された物体の組織の質または特徴を処理する場合には、上述の前処理を、画像のフィルタ処理と解釈することができる。この画像のフィルタ処理は画像に含まれた何らかの情報を強調し、その一方で予測出力に関して意味を持たない他の情報を抑制することができる。
本発明において、デジタルまたはデジタル化された画像のピクセルをコーディングするための数値データの低減は、演算能力および前記画像の処理にかかる時間を減らすために、きわめて有用である。特定の分野は、いわゆるCAD(コンピュータ支援診断)である。この技術分野において、きわめて重要な項目は、画像から(一般的な例としては、グレースケールのMRI画像または超音波、またはX線画像から)画像の1つ以上のピクセルに対応する、画像化された物体の一部分の質または特徴を自動的に認識することである。特別な場合としては、生体組織の質または特徴が、健常な組織または腫瘍性の組織に属するものとして分類するのに適した自動分類が提示される。
人工ニューラル・ネットワークなどの予測アルゴリズムが、この自動分類を実行するために使用される。
人工ニューラル・ネットワークは、周知である。例えば、Kishan Mehrotra, Chilukuri K. Mohan, Sanjay Rankaの「Elements of Artificial Neural Networks」(A Bradford Book, The MIT Press Cambridge, Massachusetts, 1977年)を参照されたい。
現在の技術水準においては、例えば国際公開公報の文献WO03077182号を参照されたい。診断画像から生物学的物体の組織(健常組織または腫瘍性組織)の質または特徴の自動認識を実行するために、図3および図4に示されているように、前記画像の各ピクセルまたは前記ピクセルの一部分の各ピクセルはベクトルによりコーディングされる。該ベクトルは、コーディングされるピクセルの強度に対応する数値、及びコーディングされる前記ピクセル(ターゲット・ピクセル)の周囲を囲うピクセルの強度に対応する数値を、成分として含む。このターゲット・ピクセルは、指定されたウインドウの一部、すなわち、コーディングされるピクセルの周囲を囲うピクセルの部分配列を形成する。
人工ニューラル・ネットワークを以下の手順で用意する。人工ニューラル・ネットワークには、各ベクトル成分の少なくとも1つの入力ノット、及び、2つの数値に対応する2つの出力ノットを持たせる。後者の場合とは、例えば、健常な組織についての値(0,1)及び腫瘍性の組織についての値(1,0)のように、組織の特徴に一意に関連付けられている。いくつかの隠れ層(several hidden layer)も用意する。ニューラル・ネットワークについては学習が行われ、次いで繰り返しテストが行われる。学習とテストには、既知の生物学的物体の診断画像のデータベースが用いられる。前記の画像化された物体の各領域における特徴(健常組織または腫瘍性組織)は、画像の各ピクセルに対応しており、この画像の各ピクセルは公然でありかつ対応するピクセルと一意に関連付けられている。
データベースのデータの或る割合(典型的には、1/2)は、人工ニューラル・ネットワークの学習に使用され、データベースのデータの別の割合が、予測アルゴリズムのテストに使用される。
本発明により、他の種類の予測アルゴリズムを、ピクセルのコーディング方法と組み合わせて使用することができる。2つ以上の異なる予測アルゴリズムの結果を組み合わせることも可能である。あるいは、例えば、異なるデータセットか、もしくは学習用及びテスト用セットのデータベースの異なった配分に従えば、学習しその後テストを行った2つ以上の人工ニューラル・ネットワークの結果を組み合わせることも可能である。
図9は、デジタルまたはデジタル化画像の処理のための方法の一般化に関するフロー図を示す。
第一段階は、既知の事例のデータベースを生成すること、ならびに人工ニューラル・ネットワークなどの予測アルゴリズムの学習およびテストを行うことからなる。この第一段階は、
a)既知の物体のデジタル画像の一式を提供するステップを備える。前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列によって構成され、各ピクセルまたはボクセルは、少なくとも1つの変数によって定められる。前記変数は、そのグレースケール画像においては強度、カラー画像においてはHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルが、画像化された物体の対応領域または対応部分を表現する。前記対応領域または対応部分において、所望の質または特徴は既知であり、前記既知の質または特徴が、デジタル画像の対応ピクセルまたは対応ボクセルに一意に関連付けられる。
b)前記段階は、さらに、前記デジタル画像の各ピクセルあるいはボクセルを、または、前記デジタル画像の部分集合の各ピクセルまたはボクセルを、上述した本発明の方法の考えられる変形の1つに従ってコーディングし、各ベクトルと一意に関連付けするステップを備える。前記画像のピクセルまたはボクセルは、画像化された物体の領域または部分における既知の質または特徴と対応し、前記ボクセルまたはピクセルは前記ベクトルによって表わされる。
c)前記段階は、さらに、ニューラル・ネットワークなどの予測アルゴリズムを提供するステップを備える。
d)前記段階は、さらに、前記予測アルゴリズムの学習およびテストを実行するステップを備える。前記実行は、既知の物体の前記画像の各ピクセルまたはボクセルへと一意に関連付けられたベクトルを入力データとして使用するとともに、画像化された物体の領域または部分の既知の質または特徴を出力データとして使用することによって行われる。前記画像のピクセルまたはボクセルは前記画像化された物体と対応し、前記ベクトルの各々は前記画像化された物体と一意に関連付けられる。
第2の段階は、デジタル画像の取得または画像のデジタル化を行うこと、画像または画像のピクセルまたはボクセルの一部あるいは前記画像の一部のピクセルまたはボクセルをコーディングすること、該コーディングしたピクセルまたはボクセルを、学習およびテストを行った予測アルゴリズムへ供給することからなる。この第2の段階は、
e)前記段階は、さらに、物体のデジタル画像を提供するステップを備え、前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列によって構成され、各ピクセルあるいはボクセルは少なくとも1つの変数によって定められる。前記少なくとも1つの変数はグレースケール画像においては強度であり、カラー画像においてはHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルは、質または特徴を判断する必要がある画像化された物体の対応領域または対応部分を示す。
f)前記段階は、さらに、前記デジタル画像のピクセルまたはボクセルを、あるいは、前記デジタル画像のピクセルまたはボクセルの部分集合の各ピクセルまたはボクセルを、上述した本発明の方法の考えられる変形の1つに従って、コーディングするステップを備える。コーディングされた各ピクセルまたはボクセルは、ベクトルとして表現され、前記ベクトルは、前記ピクセルまたはボクセルへと一意に関連付けられる。
g)前記段階は、さらに、デジタル画像のピクセルまたはボクセルの各々または一部について、対応ベクトルの成分を、学習およびテストを行った後の予測アルゴリズムの入力データとして使用するステップを備える。
したがって、このアルゴリズムを使用して、最後のステップは、以下の通り示される。
h)前記段階は、さらに、前記画像化された物体の領域または部分の質または特徴を決定し、前記領域または部分の質または特徴は一意にコーディングされたピクセルまたはボクセルに一意に対応し、前記成分は予測アルゴリズムへの入力として供給され、前記供給は予測アルゴリズムの出力応答によって行なわれるステップを備える。
本発明に従い、コーディング方法、および上記のようにコーディングされた画像データの処理方法をいくつかの実験にてテストを行なった。テストには、様々な組織のデジタル化画像を使用し、予測アルゴリズムによって組織の種類を分類した。本発明において、ピクセルのコーディング方法によって得られた結果を、上述した古典的なピクセル・ベクトルのコーディング方法を用いて同じデジタル化画像から得られた結果と比較した。比較の結果、本発明に従いコーディングされたピクセルは、フィットネス・スコアが改善され、演算速度が早くなったことが実証されている。
デジタルまたはデジタル化画像の処理方法のさらなる改善が、本発明に従って提供され、以下に開示される。この改善は特に画像化された物体の特徴を認識するためで、ピクセルまたはボクセルの前記符号方法を適用するものである。
図11を参照すると、この改善は、以下に示すステップを備える。
ピクセルまたはボクセルのコーディングを実行するための第1のウインドウを定めるステップを備え、前記ウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成され、前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する第1の寸法を有する。
前記改善は、さらに、ピクセルまたはボクセルのコーディングを実行するステップを備える。
前記改善は、さらに、学習済みの予測アルゴリズムを提供し、前記定めた第1のウインドウに従ってコーディングしたピクセルまたはボクセルによって画像の第1の処理を実行することにより、画像内の各ピクセルまたはボクセルの特徴または質を判断するステップを備える。
前記改善は、さらに、前記画像内のピクセルまたはボクセルを特定するステップを備え、前記画像は特定の質を有し、前記画像内で前記ピクセルまたはボクセルの位置を特定する。
前記改善は、さらに、ピクセルまたはボクセルの部分配列を定めるステップを備え、前記ピクセルまたはボクセルの部分配列は元の画像の領域または部分に対応し、前記元の画像内において、前記特定の質を有するピクセルまたはボクセルが存在する。
前記改善は、さらに、ピクセルまたはボクセルのコーディングを実行するための第2のウインドウを定めるステップを備え、該第2のウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成される。前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する第2の寸法を有し、該寸法およびピクセルまたはボクセルの数が第1のウインドウの寸法およびピクセルまたはボクセルの数よりも大である。
前記改善は、さらに、ピクセルまたはボクセルの前記定めた部分配列のピクセルまたはボクセルについてのみ、ピクセルまたはボクセルのコーディングを実行するステップを備える。前記定めた部分配列のピクセルまたはボクセルは、前記特定の質を有するピクセルまたはボクセルが存在する元の画像の領域または部分に対応する。
前記改善は、さらに、予測アルゴリズムによる第1の処理ステップに従って、前記コーディングされたピクセルまたはボクセルの第2の処理を実行するステップを備える。前記ピクセルまたはボクセルは、学習およびテストを行ったアルゴリズムにて第2のウインドウを使用することによって、コーディングされる。前記実行により、前記部分配列のピクセルまたはボクセルの特徴または質を判断し、前記ピクセルまたはボクセルの前記部分配列は元の画像の領域または部分に対応し、前記元の画像において前記特定の質を有するピクセルまたはボクセルが存在する。
この改善は、さらに以下のステップを備える。
前記画像は予測アルゴリズムを用い先の処理ステップに従って、画像内のピクセルまたはボクセルを特定するステップを備える。前記画像は特定の質または特徴を有していて、前記画像内で前記ピクセルまたはボクセルの位置を特定する。
前記改善は、さらに、ピクセルまたはボクセルの部分配列を定めるステップを備える。前記ピクセルまたはボクセルの部分配列は元の画像の領域または部分に対応し、前記元の画像内において、前記特定の質を有するピクセルまたはボクセルが存在する。
前記改善は、さらに、ピクセルまたはボクセルのコーディングを実行するための新たなウインドウを定めるステップを備える。前記新たなウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成され、前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する寸法を有する。該寸法およびピクセルまたはボクセルの数は、前記先の処理ステップにおいて定められた、前記ウインドウの寸法およびピクセルまたはボクセルの数とは異なる。
前記改善は、さらに、ピクセルまたはボクセルの前記定められた部分配列のピクセルまたはボクセルについてのみ、ピクセルまたはボクセルのコーディングを実行するステップを備える。前記定められた部分配列のピクセルまたはボクセルは、前記特定の質を有するピクセルまたはボクセルが存在する元の画像の領域または部分に対応する。
前記改善は、さらに、予測アルゴリズムによる先の処理ステップに従って、前記コーディングされたピクセルまたはボクセルのさらなる処理を実行するステップを備える。前記ピクセルまたはボクセルは学習およびテストを行ったアルゴリズムにて新たなウインドウを使用することによって、コーディングされる。前記実行により、ピクセルまたはボクセルの前記部分配列のピクセルまたはボクセルの特徴または質を判断し、前記ピクセルまたはボクセルの前記部分配列は元の画像の領域または部分に対応し、前記元の画像において前記特定の質を有するピクセルまたはボクセルが存在する。
ピクセルまたはボクセルのコーディングのための異なるウインドウは、前記予測アルゴリズムの学習およびテスト用のデータセットのピクセルまたはボクセルをコーディングするためにも使用される。該予測アルゴリズムは、前記アルゴリズムにより特定の対応処理ステップのためのものである。その結果、学習およびテスト用データセットの画像のピクセルまたはボクセルのコーディングに使用されるウインドウと、処理対象の画像のピクセルまたはボクセルの間に、ひとつの一致点が存在する。
上述のものの変更、または上述のものとの組み合わせにおいて適用できるさらなる改善によれば、処理対象画像のピクセルまたはボクセルの各コーディングステップ、あるいは前記特定の質または特徴を有する元の画像の領域や部分に対応するピクセルまたはボクセルの各コーディングステップにおいて、予測アルゴリズムを用いた先の処理ステップに従えば、以下のことが言える。上記ステップにおいては、さらなる変換によって得られるパラメータのすべてまたは一部のみが、ピクセルまたはボクセルの前記部分配列のピクセルまたはボクセルの数値データ(すなわち、強度)からなる元の行列に適用される。該パラメータのすべてまたは一部のみは、ピクセルまたはボクセルをコーディングするベクトルの成分へと加えることが可能である。
例えば、第1の予測処理ステップにおいて、処理対象のピクセルまたはボクセルは以下のようにコーディングされる。その際に使用されるのは、強度値の行列の特異値、選択されたウインドウのピクセルまたはボクセル強度の前記行列である、ヘシアン行列の固有値、および勾配行列の固有値である。一方で、予測アルゴリズムの次の処理ステップにおいては、該予測アルゴリズム内でピクセルまたはボクセルのひとつ以上の部分配列のピクセルまたはボクセルのみが処理され、前記部分配列が前記特定の質を有するピクセルまたはボクセルが存在する元の画像の領域または部分に対応している。予測アルゴリズムによる第一の処理ステップによれば、前記ピクセル及びボクセルはパラメータのすべてもしくは部分に対応する更なる数値データで表される。その際、該パラメータは所定のウインドウのピクセルもしくはボクセルの強度行列のひとつ以上の変換によって提供される。このような前記強度の行列のさらなる変換は、例えば自己相関変換またはウェーブレット変換である。
この変形は、ウインドウの寸法の変更の代替として適用でき、あるいは前記ウインドウの寸法の変更を組み合わせて適用できる。
上述の方法との組み合わせにおいて、第1のステップで、画像全体が予測アルゴリズムによってコーディングおよび処理されて、それにより所望の質を備える画像化された物体の一部分を表すピクセルまたはボクセルが得られる場合、1つ以上の画像領域を、パノラマ画像として示すことが可能な元の画像の一部にのみ対応して定めることができる。この場合、上述のように、パノラマ画像の前記部分または領域の解像度は、パノラマ画像の1つの解像度と同じ解像度であってよい。あるいは、少なくとも前記部分もしくは領域のみの新たな画像、または全体の新しいパノラマ画像を、より高い解像度で取得することができる。パノラマ画像の前記部分または領域がパノラマ画像よりも小さく、すなわちより小さな視野に対応しているという事実ゆえ、たとえ解像度が高められたとしても、パノラマ画像の前記領域または部分に関連する画像データを処理することは、処理対象の変数の数が多くなりすぎることにはならない。
各ターゲット・ピクセルの周囲のピクセルを定めるウインドウの寸法を変化させることもできる。その際には、各ターゲット・ピクセルまたはボクセルをコーディングするとみなされている周囲のピクセルまたはボクセルの数を減少または増加させる。
図11は、この原理を説明するため、きわめて簡単な例を示している。本発明によれば、第1のパノラマ画像は、ピクセルまたはボクセルのコーディング方法および画像処理方法によって取得され、処理される。この場合、ウインドウWは3×3ピクセルと定められている。この画像の処理は、画像化された物体の調査対象の質が2つの領域1および2で発見されたことを示している。
上述の変形によれば、パノラマ画像に比べて小さな寸法を有し、パノラマ画像の領域1および領域2の全体または少なくとも一部を含む2つの画像を定めることができる。図11において、この2つの画像は、画像領域1および画像領域2として示されている。
第1の変形においては、2つの画像の寸法は小さくなっていて、パノラマ画像の2つの領域、1および2を含んでいる。前記2つの画像は単純な切り抜きで、その解像度はパノラマ画像の解像度と同じである。唯一の変化は、以下の事実に関連する。その事実とは、各ターゲット・ピクセルの周囲を覆うピクセルのウインドウは、それぞれ、各ターゲット・ピクセルを中心とする5×5ピクセルの寸法および9×9ピクセルの寸法へと拡大されているというものである。
この場合、ターゲット・ピクセルの周囲を覆うピクセルのウインドウの寸法が拡大したという事実は、各画像領域ではピクセルの数が減っていて、パノラマ画像の単純な切り抜きであるという事実により相殺される。
さらに、図11に示す代案は、2つの画像領域の解像度が向上したという以下の事実を示している。該解像度は、パノラマ画像に実行された第1の処理ステップで使用されたウインドウに関連して、寸法が大きくなった周囲のピクセルのウインドウの定義に組み合わせて適用される。この場合では、高められた解像度が、両方の画像領域1および2について同一であるが、これは決して必須ではない。画像領域1および2が、パノラマ画像よりも高められた異なる解像度を有するように選択されてもよい。いずれの場合も以下のことを考慮しなければならない。一般的に解像度の向上は望ましいと考えられるが、ここに開示される方法が解像度の向上に限定されると考えてはならない。なぜなら、少なくとも1つの画像領域1または2をパノラマ画像よりも低い解像度を有するように選択することもあり得るからである。
画像領域1および2として図2に示した画像の少なくとも一方の新しい解像度を考えると、前記画像領域のピクセルのコーディングのため、および画像の処理のために、パノラマ画像の処理において使用されたものと同じ寸法を有する周囲のピクセルのウインドウを定めることは可能である。あるいは、パノラマ画像に関して、画像領域1および2の解像度の変化は、周囲を囲うピクセルのウインドウの寸法の変化と組み合わせて提供されることも可能である。その際には、該寸法は各画像領域について同一であっても、あるいは相違していてもよい。
当然ながら、パノラマ画像の切り抜きに対応する画像の解像度が高められなければならなかった場合には、前記切り抜きに対応する画像化対象の物体の各領域に関連して狭められた視野を持った新しい画像が取得されるか、新しいデジタル化が実行されなければならない。
図12は、撮像装置のブロック図を示している。前記撮像装置には、取得した画像を処理するための手段が備え付けられており、画像化された物体の質を識別することができる。また、開示された変形のいずれかにおいて、上述の方法のステップを実行することもできる。
撮像装置は、例えば画像化される物体の励起(excitation)、反射、または透過により、画像化されたデータを取得するためのスキャナ10を備える。スキャナによって受信された信号は、画像プロセッサ11へ送られる。画像プロセッサ11は、受信した信号の処理を行い、モニタ12上にピクセルの配列として表すことが可能な画像化データを得る。
さらにユニット13が設けられる。本発明によれば、ユニット13は、パラメータという形態で画像データを処理し、画像ピクセルの外観を識別する。また、以下の方法の組み合わせることで得た前記の一つ以上の変数に従っても同じことである。この組み合わせとは、先のひとつ以上の変数によれば、画像ピクセルをコーディングする方法と、及び画像ピクセルによって表現される物体の領域の質を特定するための方法との組み合わせのことである。画像のピクセルによって表される物体の画像化された部分の質は、モニタ上に表示された画像で強調することが可能である。その際、モニタ上のピクセルの或る特定の態様が特定の質または特定の調査された質へと一意に関連付けられる。
次いで、ユーザは表示画像の切り抜きを定めることができる。表示画像の切り抜きは調査された質を含む表示画像のピクセルからなる。次いで、この表示画像の切り抜きを構成する小さな画像は、手段13により処理されることが可能である。すなわち、各ピクセルをコーディングするために使用される周囲のピクセルのウインドウの新たなウインドウ寸法を定めることで、該画像を処理することができる。あるいは、定められた切り抜きのみの画像を取得するためにスキャナを自動的に設定することができる。その際には、視野を前記切り抜きの各々の視野の寸法へと制限することが必要である。さらに、視野を狭めることで取得された新しい画像に対する新しい解像度も定めることができる。
受信信号から画像データを生成するために使用される画像プロセッサ12が、コンピュータによって形成されることが往々にしてあるということを考慮すれば、前記処理ユニット13は画像のピクセルをコーディングし、各ピクセルによって表される画像化された物体の一部分の質を自動的に認識する。さらに言えば、前記コンピュータによって実行されるソフトウェア手段の形態であってよい。また、手段14は、切り抜きの定義、ならびに/あるいは周囲のピクセルのウインドウの新たな解像度、ならびに/あるいは新たな寸法の設定を可能にするもので、それに応じてスキャナ10のパラメータを調節する。該手段14は、前記コンピュータによって実行されるソフトウェア手段の形態からなることもあってよい。
上述の例では、処理ユニット13は画像のピクセルをコーディングし、各ピクセルによって表わされる画像化された物体の部分の質を認識するものである。該処理ユニット13およびユニット14は、画像化装置の内部ユニットである。画像化装置がコンピュータからなる場合、画像化装置の該内部ユニットは電子ユニットおよびソフトウェア手段あるいは実行可能なソフトウェア手段からのみ構成されている。あるいは、前記ユニット13および14は、外部の画像処理システムの形態をとってよい。該画像処理システムは、コンピュータ・ハードウェアならびにコンピュータ・ハードウェアによって実行可能なソフトウェア手段を備えており、ユニット13及び(あるいは)ユニット14の処理機能を実行する。また、該画像処理システムは画像装置の対応インターフェイスと交信するインターフェイスを備えている。
この説明および例は二次元の場合についてのみ対象となっているが、画像がボクセルの三次元配列である場合にも上述のステップを適用できることは、当業者にとって明らかである。
画像のピクセルまたはボクセルをコーディングするための方法のさらなる変形に従えば、前記ピクセルまたは前記ボクセルをコーディングするベクトルの成分を定めることも可能である。その際には、前記ピクセルまたは前記ボクセルの外観を定めるパラメータ値を使用するが、そのパラメータ値は、画像の2つ、3つ、またはそれ以上のフィルタ処理ステップの結果として得られるものである。
この場合、2つ、3つ、またはそれ以上のフィルタ処理アルゴリズムが、画像データに適用される。すなわち、フィルタ処理アルゴリズムが画像のピクセルまたはボクセルの配列を表し、それらの外観を定めるデータの配列に適用される。
各々のフィルタ処理アルゴリズムはデータ変換を行う、すなわち各ピクセルまたはボクセルの外観を定めるパラメータの値の変換を実行する。それゆえ、元の画像データについて実行されるm個の異なるフィルタ処理アルゴリズム、または前処理アルゴリズムを考慮すると、m個の変換f1、f2、・・・、fmも、各ピクセルまたはボクセルの外観を定めるパラメータの元の値について実行される。この場合、コーディングするピクセルを定める方法を変更することが可能である。例えば、画像の一般的なピクセルP(i,j)及び、上述のm個の変換f1、f2、・・・、fmを考慮する。そうすると、前記ピクセルの外観を表すパラメータの変更値、すなわちフィルタ処理された値に対応する組は、前記ピクセルP(i,j)を変換することによって得られ、f1(P(i,j))、f2(P(i,j))、・・・、fm(P(i,j))として定めることができる。本発明にしたがって、変換に掛かるピクセルP(i,j)に限定されたピクセル・ウインドウを定めることにより、この方法を適用すれば、ピクセルの外観を定めるパラメータの修正値により上記に定められた組、f1(P(i,j))、f2(P(i,j))、・・・、fm(P(i,j))を、前記ピクセルP(i,j)をコーディングするためのベクトルの成分として使用することが可能である。
また、以下のことを考慮することが重要である。例えば、上記の説明に記載あるいは引用されているような多くのフィルタ処理方法においても、変換や処理に掛かる各ターゲット・ピクセルの周囲のピクセルを定めるウインドウが使用されている。それゆえ、ターゲット・ピクセルと周囲のピクセルとの関係はこの変数を用いても失われることはない。
さらなる変形として、下記の記載は以下の事実に基づくものである。その事実とは、画像のピクセルをフィルタ処理する方法、もしくは前処理する方法のほとんどか一般的にはすべてが、各ターゲット・ピクセルを扱うために、ターゲット・ピクセルを含むウインドウを使用していること、及び周囲を囲う所定の数のピクセルを使用しているということである。
また、上述の方法はそのようにして前記ウインドウに対応する画像データ行列を定めているが、ターゲット・ピクセルの外観を定めるパラメータの修正値を、前記ターゲット・ピクセルをコーディングするベクトルの一成分としては用いていない。本発明によると、上記事実に基づき、コーディング方法の変換の任意のひとつ、あるいは任意のひとつの組み合わせを使用することが可能であり、該コーディング方法はフィルタ処理ステップもしくは前処理ステップで定められるウインドウに対応する上記行列に適用される。すなわち、ピクセルP(i,j)の外観を定める、フィルタ処理アルゴリズムや前処理アルゴリズムにより変更されたパラメータ値を、該ピクセルP(i,j)をコーディングするベクトルの一成分として使用する代わりに、上記値のひとつもしくは上記値の組み合わせを用いることも可能である。
数値行列の特異値は、選択されたウインドウのピクセルまたはボクセルの画像データを備え、フィルタ処理または前処理ステップのそれぞれを実行する。
勾配行列の固有値は、前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。
前記数値行列のヘシアン行列の固有値は、前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。
前記数値行列のウェーブレット変換の係数の1つ以上の組み合わせは前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。いくつかのウェーブレット基底関数は、選択的に使用可能である、または前記基底関数は組み合わせて使用可能である。
いわゆる共起変換行列は、前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。
前記数値行列の自己相関変換の1つ以上の係数は、前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。
数値の行列の固有値または特異値を組み合わせることで、ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。及び/または、前記数値行列の勾配行列またはヘシアン行列の固有値を組み合わせることで、前記ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。及び/または、前記数値行列のウェーブレット変換の係数の1つ以上、および/または自己相関変換の係数の1つ以上、および/または共起行列の特異値を組み合わせることで、ウインドウのピクセルまたはボクセルを表し、フィルタ処理または前処理ステップのそれぞれを実行する。
また、ピクセルをコーディングする方法の上述の変形は、二次元および三次元の画像への適用が可能である。さらには、この場合にも、主たる実施形態について述べた方法と同様の方法で、四次元を考慮することができる。そのような四次元は時間で構成され、画像の時間変化を考慮に入れることができるようにする。
選択肢として、元の画像の各ピクセルまたはボクセルについてm個の異なるフィルタ処理または処理アルゴリズムを実行した後で、元の画像の各ピクセルまたはボクセルは、ベクトル形式にコーディングすることができる。このベクトル成分は、画像データの行列のピクセルまたはボクセル・ウインドウの特異値で構成される。この画像データは、それぞれ対応するフィルタ処理または処理アルゴリズムによって得られる。これによれば、この方法は、元の画像のピクセルまたはボクセルについて特定の数の異なるフィルタ処理アルゴリズムを用意するステップと、元の画像のピクセルまたはボクセルを前記異なるフィルタ処理アルゴリズムのそれぞれによって処理し、得られるフィルタ処理後のピクセルまたはボクセルの配列を保存するステップを備える。前記方法は、さらに、ターゲット・ピクセルまたはボクセルを中心とし、あるいはターゲット・ピクセルまたはボクセルを含むウインドウであって、前記ターゲット・ピクセルまたはボクセルの周囲の特定の数のピクセルまたはボクセルを有するウインドウを定めるステップと、フィルタ処理後のピクセルまたはボクセルの配列のそれぞれの各ピクセルまたはボクセルのウインドウに対応する画像データ行列について特異値を計算するステップを備える。前記方法は、さらに、ベクトルによって、各ピクセルまたはボクセルをコーディングするステップを備え、前記ベクトルの成分は、画像データ行列の特異値と対応し、前記画像データ行列はウインドウと対応する。前記ウインドウは、フィルタ処理アルゴリズムのそれぞれによって得られたフィルタ処理後のピクセルまたはボクセルの配列の各々の前記ピクセルまたはボクセルを中心とし、あるいは前記ピクセルまたはボクセルを備える。
ウインドウが定められた上述の例に関して、該上述の例はただひとつのピクセルまたはボクセル、すなわち、今回の場合にはターゲット・ピクセルまたはボクセルP(i,j)へと限定されたのだが、定められたウインドウが、前記ターゲット・ピクセルまたはボクセルを囲う特定の数のピクセルまたはボクセルを含んでいる。そのため、前記ターゲット・ピクセルまたはボクセルをコーディングするためのベクトルの成分は、フィルタ処理されたピクセルまたはボクセル自身の値ではなく、前記ウインドウの一部であるピクセルまたはボクセルの値の行列の特異値である。
10×10ピクセルの配列によって形成されたデジタルまたはデジタル化画像の概略図である。 図1の画像に対応する画像データ・配列の概略図であり、この配列において、各ピクセルの視覚的外観が数値(例えば、グレースケール・デジタル画像におけるピクセルの強度)によって記述されている。 従来技術に従って、使用されるベクトルを概略的に示している。なお、この従来技術は、選択されたウインドウ(図2に示す)のピクセルを表す数値を用いて、ターゲット・ピクセルをコーディングする技術である。 従来技術に従って、ピクセルの方法を概略的に示し、ベクトルの成分がより一般化された様式で表現されている。 座標m,nのターゲット・ピクセルを中心とする一般的な3×3のウインドウ、一般的な勾配行列、および偏導関数を計算するための考えられる1つの方法を示す。導関数を、Sobel演算子またはFrei‐Chen演算子などのいくつかのより複雑な演算子を使用することによって計算することも可能である(Digital Image Processing、W.K.Pratt、John Wiley & Sons,Inc.、New York,NY,USA、1991年)。 一般的なヘシアン行列、および2階偏導関数を計算するための考えられる1つの方法を示す。 本発明によるターゲット・ピクセルを表すベクトルを概略的に示す。 ピクセルPi,jの配列の形態の画像を示している。 ニューラル・ネットワークにおける前記ピクセルの配列の対応の変換を表す。ここで、各ノットKi,jが画像のピクセルに対応する一方で、ノットKi,jの内部値Ui,jが、ピクセルPi,jを表す数値データと対応している。このネットワークが、本発明のコーディング方法および画像処理方法との組み合わせにおいて画像の前処理を実行する。 本発明によるコーディングの方法と、画像のピクセルまたはボクセルの1つ以上に対応する画像化された物体の一部分の質の自動認識のための予測アルゴリズムとの一般的な組み合わせのフロー図を示す。 画像のピクセルまたはボクセルの1つ以上に対応する画像化された物体の一部分の質の自動予測する方法について、本発明による画像化されたデータのコーディングの方法との組み合わせにおけるさらなる改良を示す。 スキャナが物体の画像を取得することを示す、ブロック図を提示する。この画像取得は、画像化された物体の一部分の質を自動的に予測する手段と組み合わせることで行なわれる。なお、この画像化された物体は、取得した画像のピクセルまたはボクセルの1つ以上に対応している。

Claims (42)

  1. デジタル画像またはデジタル化された二次元または三次元の画像のピクセルまたはボクセルをコーディングする方法であって、
    a)前記方法は、デジタル画像を提供するステップを備え、前記デジタル画像はピクセルの二次元配列またはボクセルの三次元配列で構成され、各ピクセルまたはボクセルは少なくとも1つの変数によって定義され、前記変数はグレースケール画像における強度、またはカラー画像におけるHSV(色相、彩度、および明度)値またはRGB値であり、
    b)前記方法は、さらに、前記画像の各ピクセルまたはボクセルをターゲット・ピクセルまたはボクセルと判断するステップを備え、各ターゲット・ピクセルまたはボクセルにおいて、前記ターゲット・ピクセルまたはボクセルと周囲の特定数のピクセルまたはボクセルが隣接部を形成し、該隣接部及び前記ターゲット・ピクセルがピクセル・ウインドウまたはボクセル・ウインドウを形成し、
    c)前記方法はさらに、各ターゲット・ピクセルまたはボクセルにおいて、前記ターゲット・ピクセルまたはボクセルに一意に関連付けられるベクトルを生成するステップを備え、前記ベクトルの成分は、前記ターゲット・ピクセルまたはボクセルの関数の値として生成されるとともに、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値として生成され、
    前記ターゲット・ピクセルもしくはボクセルの関数の値と、前記ピクセル・ウインドウもしくはボクセル・ウインドウのピクセルもしくはボクセルの各々の関数の値は、前記ウインドウのピクセルもしくはボクセルを表す数値行列の特徴パラメータまたは前記数値行列の変換の特徴パラメータに対応することを特徴とする方法。
  2. 前記特徴パラメータは、数値行列の特異値によって形成され、
    前記特異値は、選択されたウインドウのピクセルまたはボクセルの画像データを供えることを特徴とする、請求項1記載の方法。
  3. 前記ターゲット・ピクセルまたはボクセルの関数の値と前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記数値行列の勾配行列の固有値と対応し、
    前記数値行列は前記ウインドウのピクセルまたはボクセルを表すことを特徴とする、請求項1または2記載の方法。
  4. 前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値は、前記数値行列のヘシアン行列の固有値に対応し、
    前記数値行列は、前記ウインドウのピクセルまたはボクセルを表すことを特徴とする、請求項1乃至3いずれか記載の方法。
  5. 前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値が、さらに、前記数値行列のウェーブレット変換の係数の1つ以上または組み合わせに対応し、
    前記数値行列は、前記ウインドウのピクセルまたはボクセルを表すことを特徴とする、請求項1乃至4いずれか記載の方法。
  6. 複数のウェーブレット基底関数は、選択的に使用可能であること、または前記基底関数は組み合わせて使用可能であることを特徴とする、請求項5記載の方法。
  7. 前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値が、さらに、いわゆる共起行列変換の値に対応していることを特徴とする、請求項1乃至6いずれか記載の方法。
  8. 前記ターゲット・ピクセルまたはボクセルの関数の値と、前記ピクセル・ウインドウまたはボクセル・ウインドウのピクセルまたはボクセルの各々の関数の値が、前記数値行列の自己相関変換の係数の1つ以上に対応し、
    前記数値行列は前記ウインドウのピクセルまたはボクセルを表すことを特徴とする、請求項1乃至7いずれか記載の方法。
  9. 各ピクセルまたはボクセルは、
    数値の行列の固有値または特異値、及び/または、
    前記数値行列の勾配行列またはヘシアン行列の固有値、及び/または、
    前記数値行列のウェーブレット変換の係数の1つ以上、及び/または、
    自己相関変換の係数の1つ以上及び/または
    共起行列の特異値の組み合わせを用いて、コーディングされ、
    前記数値の行列はウインドウのピクセルまたはボクセルを表し、
    前記数値行列の勾配行列またはヘシアン行列は前記ウインドウのピクセルまたはボクセルを表し、
    前記共起行列は前記ウインドウのピクセルまたはボクセルを表すことを特徴とする、請求項1乃至8いずれか記載の方法。
  10. 前記二次元および三次元画像は、さらに、時間で構成される次元を有していることを特徴とする、請求項1乃至9いずれか記載の方法。
  11. 前記行列の数値データは、画像のピクセルまたはボクセルを表し、
    前記行列の数値データは、ピクセルまたはボクセルのコーディングに先立って、1以上の前処理ステップを加えられることを特徴とする、請求項1乃至10いずれか記載の方法。
  12. 前記前処理ステップが、フィルタ処理ステップであることを特徴とする、請求項11記載の方法。
  13. 1以上の前記前処理ステップは、選択または組み合わされて実行されることを特徴とする、請求項11または12記載の方法。
  14. 前記前処理ステップは、セルラー・ニューラル・ネットワークを用いて、前記数値データを処理することで実行され、
    前記数値データは、デジタルまたはデジタル化画像の各ピクセルまたはボクセルを表すことを特徴とする、請求項11乃至13いずれか記載の方法。
  15. 前記前処理ステップは、
    セル(K)のn次元の配列を有する人工ニューラル・ネットワークを提供するステップを備え、
    前記セル(K)はニューラル・ネットワークのノットに対応し、各セルは、直接隣接するセル(K)に接続し、直接隣接するセル(K)はセル(K)の隣接部を形成し(図9および10を参照)、
    各セル(K)は、周囲のセル(K)の中で、直接的に隣接するセルへ接続を行なう入力を有していて、
    各セル(K)は、直接的に隣接するセル(K)の1つ以上へ接続を行なう出力を有していて、
    各セル(K)と直接的に隣接するセルとの間の接続は、重み付け(wij)によって決定され、
    各セルは、内部値によってさらに特徴付けられ、前記内部値はセル(K)の活性値または関数(A)として定められ、各セル(K)は、セル出力信号(u)を生成するために、信号処理関数、すなわち伝達関数に従って信号処理を実行でき、
    前記伝達関数はセル(K)の出力信号(u)をセル(K)の活性値の関数または関数(A)として決定し、前記伝達関数は恒等関数も備え、該恒等関数は、セル(K)の活性値または関数(A)をセル(K)の出力信号(u)と等しくし、
    前記前処理ステップは、さらに、
    入力データ・レコード(P)のn次元のデータベースを提供するステップを備え、
    前記入力データ・レコード(P)は、ニューラル・ネットワークによる演算へと提出されなければならないレコードであり、対応するn次元空間に投影された時、n次元のデータベースにおいて、データ・レコード(P)の相対位置がデータ・レコード(P)に該当し、前記データベースのデータ・レコード(P)は、前記n次元空間における点の配列によって表すことができ、各々の点は、前記点の配列において所定の位置を有するとともに、前記データベースのデータ・レコード(P)に関連付けられており、
    前記データベースの各データ・レコード(P)は、さらに、1つもしくはそれ以上の変数を有し、該変数のそれぞれが特定の値(U)を有し、
    各データ・レコード(P)は、前記ニューラル・ネットワークを形成するn次元の配列のセル(K)に関連付けられ、該セル(K)は、セル(K)のn次元の配列において、対応するデータ・レコード(P)と同じ位置を有し、前記対応するデータ・レコード(P)は、前記点のn次元の配列の点によって表され、
    各データ・レコード(P)の変数の値(U)は、ネットワークの初期化値としてみなされ、前記変数の値(U)は、前記関連付けられたセル(K)の初期の活性値(A)または初期の出力値(u)として取り扱われ、
    前記ニューラル・ネットワークの特定数の反復の処理ステップの後、各セル(K)の活性値(A)または出力値(u)が、前記該当のデータ・レコード(P)のための新たな値(U)としてみなされていることを特徴とする、請求項11乃至14いずれか記載の方法。
  16. 前記特定数の反復の処理ステップの各処理ステップにおいて、各セル(K)と直接的に隣接するセル(K)との間の接続を定める重み付け(wij)は、各データ・レコード(P)の変数の現在の値(U)の関数として決定され、
    前記データ・レコード(P)は前記セル(K)に直接的に隣接するセル(K)へと関連付けられ、
    前記関数は、いわゆる学習関数またはルールであることを特徴とする、請求項15記載の方法。
  17. 前記人工ニューラル・ネットワークは、ニューラル・ネットワークの処理ステップ後、各セル(K)の現在の活性値(A)または出力値(u)を重み付け(wij)の関数として決定することによって変更され、
    前記人工ニューラル・ネットワークは、前記関連付けされたデータ・レコード(P)について、現在の新しい値(U)としてみなされ、
    前記重み付け(wij)は、直接的に隣接するセル(K)とセル(K)との接続を定めていて、
    前記関数が、いわゆる活性関数またはルールであることを特徴とする、請求項15記載の方法。
  18. 前記関連付けられたデータ・レコード(P)について、各セル(K)の現在の活性値(A)または出力値(u)は、ニューラル・ネットワークの処理ステップ後、直接的に隣接するセル(K)の現在の出力(u)の関数として決定されるとともに、対応する重み付け(wij)の関数として決定され、
    前記ニューラル・ネットワークは、現在の新しい値(U)と見なされ、
    前記対応する重み付け(wij)は、直接的に隣接するセル(K)のセル(K)との接続を定めていて、
    前記関数が、いわゆる活性関数またはルールであることを特徴とする、請求項17に記載の方法。
  19. 前記特定数の反復処理ステップの各処理ステップにおいて、前記重み付け(wij)は、各データ・レコード(P)の変数の現在の値(U)の関数として決定されるとともに、データ・レコード(P)の変数の現在の値(U)の関数として決定され、
    前記重み付け(wij)は、各セル(K)と直接的に隣接するセル(K)との間の接続を定め、
    前記各データ・レコード(P)は、前記セル(K)に直接的に隣接するセル(K)に関連付けられ、
    前記データ・レコード(P)は、セル(K)に関連付けられていることを特徴とする、請求項15乃至18いずれか記載の方法。
  20. 前処理ステップは、数値データの行列をクラスタ化アルゴリズムによって処理するステップからなり、
    前記数値データの行列は、画像のピクセルまたはボクセルを表すことを特徴とする、請求項11に記載の方法。
  21. 2、3、またはそれ以上のフィルタ処理アルゴリズムに基づく2、3、またはそれ以上のフィルタ処理ステップを実行し、
    各フィルタ処理アルゴリズム(A1、A2、・・・、Am)は、パラメータの値の変換(f1、f2、・・・、fm)を決定し、
    前記パラメータの値は、画像のピクセルまたはボクセルの外観を定め、
    二または三次元画像を形成している各ピクセル(P(i,j))について、前記ピクセル(P(i,j))または前記ボクセルのみを含むウインドウを定め、
    画像の各ピクセル(P(i,j))または各ボクセルあるいは選択された数のピクセル(P(i,j))またはボクセルを、ベクトルによってコーディングし、
    前記ベクトルの成分は、各ピクセルまたは各ボクセルのパラメータの値として定められ、
    前記各ピクセルまたは各ボクセルのパラメータの値は、ピクセル(P(i,j))またはボクセルを定めるパラメータの元の値の前記2、3、またはそれ以上の変換(f1、f2、・・・、fm)によって決定されることを特徴とする、請求項11乃至20いずれか記載の方法。
  22. 各ピクセルまたは各ボクセルのパラメータの値は、パラメータの元の値の前記2、3、またはそれ以上の変換(f1、f2、・・・、fm)によって決定され、
    前記パラメータの値は、ピクセル(P(i,j))またはボクセルを定め、
    前記各ピクセルまたは各ボクセルのパラメータの値は、パラメータの配列の座標(i,j)または(i,j,z)において決定されるピクセルまたはボクセルの値として定められ、
    前記パラメータの配列は、二または三次元画像のピクセルまたはボクセルの外観を記述することを特徴とする、請求項21記載の方法。
  23. 二または三次元画像を形成している各ピクセル(P(i,j))について、ウインドウが定められ、
    前記ウインドウは、前記ピクセル(P(i,j))または前記ボクセルならびに特定数の周囲のピクセルまたはボクセルを備え、
    画像の各ピクセル(P(i,j))または各ボクセルあるいは選択された数のピクセル(P(i,j))またはボクセルを、ベクトルによってコーディングし、
    前記ベクトルの成分は、前記定めたウインドウの内側において、各ピクセルまたは各ボクセルのパラメータの行列の特異値として、その成分が定められ、
    前記ベクトルの成分は、パラメータの元の値の前記2つ、3つ、またはそれ以上の変換(f1、f2、・・・、fm)によって決定され、
    前記パラメータの元の値が、前記ピクセル(P(i,j))またはボクセルを定めることを特徴とする、請求項21または23に記載の方法。
  24. デジタルまたはデジタル化画像を処理するための方法であって、
    前記方法は、
    a)既知の物体のデジタル画像の一式を用意するステップを備え、前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列で構成され、各ピクセルまたはボクセルは少なくとも1つの変数によって定められ、前記変数はグレースケール画像における強度、またはカラー画像におけるHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルが、画像化された物体の対応領域または対応部分を表現し、前記対応領域または対応部分において、所望の質または特徴は既知であり、前記既知の質または特徴が、デジタル画像の対応ピクセルまたは対応ボクセルに一意に関連付けられ、
    b)前記方法は、さらに、前記デジタル画像の各ピクセルあるいはボクセルを、または、前記デジタル画像の部分集合の各ピクセルまたはボクセルを、請求項1乃至22のいずれかに従ってコーディングするステップを備え、前記デジタル画像の各ピクセルあるいはボクセルは各ベクトルと一意に関連付けされ、前記画像のピクセルまたはボクセルは、画像化された物体の領域または部分における既知の質または特徴と対応し、前記ボクセルまたはピクセルは前記ベクトルによって表わされ、
    c)前記方法は、さらに、ニューラル・ネットワークなどの予測アルゴリズムを提供するステップを備え、
    d)前記方法は、さらに、前記予測アルゴリズムの学習およびテストを実行するステップを備え、前記実行は、既知の物体の前記画像の各ピクセルまたはボクセルへと一意に関連付けられたベクトルを入力データとして使用するとともに、画像化された物体の領域または部分の既知の質または特徴を出力データとして使用することによって行われ、前記画像のピクセルまたはボクセルは前記画像化された物体と対応し、前記ベクトルの各々は前記画像化された物体と一意に関連付けられ、
    e)前記方法は、さらに、物体のデジタル画像を提供するステップを備え、前記デジタル画像はピクセルの二次元の配列またはボクセルの三次元の配列によって構成され、各ピクセルあるいはボクセルは少なくとも1つの変数によって定められ、前記少なくとも1つの変数はグレースケール画像においては強度であり、カラー画像においてはHSV(色相、彩度、および明度)値またはRGB値であり、前記デジタル画像の各ピクセルまたはボクセルは、質または特徴を判断する必要がある画像化された物体の対応領域または対応部分を示し、
    f)前記方法は、さらに、前記デジタル画像のピクセルまたはボクセルを、あるいは、前記デジタル画像のピクセルまたはボクセルの部分集合の各ピクセルまたはボクセルを、請求項1乃至22のいずれかに従ってコーディングするステップを備え、コーディングされた各ピクセルまたはボクセルは、ベクトルとして表現され、前記ベクトルは、前記ピクセルまたはボクセルへと一意に関連付けられ、
    g)前記方法は、さらに、デジタル画像のピクセルまたはボクセルの各々または一部について、対応ベクトルの成分を、学習およびテストを行った後の予測アルゴリズムの入力データとして使用するステップを備え、
    h)前記方法は、さらに、前記画像化された物体の領域または部分の質または特徴は、一意にピクセルまたはボクセルに対応し、前記ピクセルまたはボクセルは前記ベクトルによって一意にコーディングされるステップを備え、前記ベクトルの成分は、予測アルゴリズムへの入力として供給され、前記予測アルゴリズムは前記予測アルゴリズムの出力データによって決定されることを特徴とする、デジタルまたはデジタル化画像を処理するための方法。
  25. 前記予測アルゴリズムが、人工ニューラル・ネットワークであることを特徴とする、請求項24に記載の画像処理方法。
  26. 2つ以上の異なる予測アルゴリズムが提供され、
    前記コーディングされたピクセルまたはボクセルは、2つ以上の予測アルゴリズムのそれぞれによって処理され、
    前記出力データは、2つ以上の予測アルゴリズムの各出力データの組み合わせとして定められることを特徴とする、請求項24または25に記載の画像処理方法。
  27. 画像を処理する方法であって、該方法は、
    ピクセルまたはボクセルのコーディングを実行するための第1のウインドウを定めるステップを備え、前記ウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成され、前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する第1の寸法を有し、
    前記方法は、さらに
    ピクセルまたはボクセルのコーディングを実行するステップを備え、
    前記方法は、さらに、
    学習済みの予測アルゴリズムを提供し、前記定めた第1のウインドウに従ってコーディングしたピクセルまたはボクセルによって画像の第1の処理を実行することにより、画像内の各ピクセルまたはボクセルの特徴または質を判断するステップを備え、
    前記方法は、さらに、
    前記画像内のピクセルまたはボクセルを特定するステップを備え、前記画像は特定の質を有し、前記画像内で前記ピクセルまたはボクセルの位置を特定し、
    前記方法は、さらに、
    ピクセルまたはボクセルの部分配列を定めるステップを備え、前記ピクセルまたはボクセルの部分配列は元の画像の領域または部分に対応し、前記元の画像内において、前記特定の質を有するピクセルまたはボクセルが存在し、
    前記方法は、さらに、
    ピクセルまたはボクセルのコーディングを実行するための第2のウインドウを定めるステップを備え、該第2のウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成され、前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する第2の寸法を有し、該寸法およびピクセルまたはボクセルの数が第1のウインドウの寸法およびピクセルまたはボクセルの数よりも大であり、
    前記方法は、さらに、
    ピクセルまたはボクセルの前記定めた部分配列のピクセルまたはボクセルについてのみ、ピクセルまたはボクセルのコーディングを実行するステップを備え、前記定めた部分配列のピクセルまたはボクセルは、前記特定の質を有するピクセルまたはボクセルが存在する元の画像の領域または部分に対応し、
    前記方法は、さらに、
    予測アルゴリズムによる第1の処理ステップに従って、前記コーディングされたピクセルまたはボクセルの第2の処理を実行するステップを備え、前記ピクセルまたはボクセルは、学習およびテストを行ったアルゴリズムにて第2のウインドウを使用することによって、コーディングされ、前記実行により、前記部分配列のピクセルまたはボクセルの特徴または質を判断し、前記ピクセルまたはボクセルの前記部分配列は元の画像の領域または部分に対応し、前記元の画像において前記特定の質を有するピクセルまたはボクセルが存在し、
    前記方法は、さらに、
    前記画像は予測アルゴリズムを用い先の処理ステップに従って、画像内のピクセルまたはボクセルを特定するステップを備え、前記画像は特定の質または特徴を有していて、前記画像内で前記ピクセルまたはボクセルの位置を特定し、
    前記方法は、さらに、
    ピクセルまたはボクセルの部分配列を定めるステップを備え、前記ピクセルまたはボクセルの部分配列は元の画像の領域または部分に対応し、前記元の画像内において、前記特定の質を有するピクセルまたはボクセルが存在し、
    前記方法は、さらに、
    ピクセルまたはボクセルのコーディングを実行するための新たなウインドウを定めるステップを備え、前記新たなウインドウは、コーディング対象であるターゲット・ピクセルまたはボクセルを囲んでいるピクセルまたはボクセルの配列によって形成され、前記ピクセルまたはボクセルの配列は前記ウインドウのピクセルの数に関係する寸法を有し、該寸法およびピクセルまたはボクセルの数は、前記先の処理ステップにおいて定められた、前記ウインドウの寸法およびピクセルまたはボクセルの数とは異なり、
    前記方法は、さらに、
    ピクセルまたはボクセルの前記定められた部分配列のピクセルまたはボクセルについてのみ、ピクセルまたはボクセルのコーディングを実行するステップを備え、前記定められた部分配列のピクセルまたはボクセルは、前記特定の質を有するピクセルまたはボクセルが存在する元の画像の領域または部分に対応し、
    前記方法は、さらに、
    予測アルゴリズムによる先の処理ステップに従って、前記コーディングされたピクセルまたはボクセルのさらなる処理を実行するステップを備え、前記ピクセルまたはボクセルは学習およびテストを行ったアルゴリズムにて新たなウインドウを使用することによって、コーディングされ、前記実行により、ピクセルまたはボクセルの前記部分配列のピクセルまたはボクセルの特徴または質を判断し、前記ピクセルまたはボクセルの前記部分配列は元の画像の領域または部分に対応し、前記元の画像において前記特定の質を有するピクセルまたはボクセルが存在することを特徴とする、請求項24乃至26いずれか記載の画像処理方法。
  28. ピクセルまたはボクセルのコーディングに用いられる異なるウインドウは、データセットのピクセルまたはボクセルのコーディングにも使用され、
    前記データセットは、予測アルゴリズムの学習およびテストに用いられ、
    前記予測アルゴリズムは、特定の対応する処理ステップに用いられ、
    前記コーディングに使用することにより、学習およびテスト用データセットの画像のピクセルまたはボクセルのコーディングに使用する前記ウインドウと、処理されるべき画像のピクセルまたはボクセルとの間に、対応が存在することを特徴とする、請求項27記載の画像処理方法。
  29. 該ピクセルあるいはボクセルは予測アルゴリズムによる先の処理ステップに従って、処理対象の画像のピクセルまたはボクセルの各コーディングステップ、あるいは、元の画像の領域または部分に対応するピクセルまたはボクセルの各コーディングステップにおいて、パラメータの全てまたは一部のみが、ピクセルまたはボクセルのコーディングベクトルの成分へと加えられ、
    前記元の画像において、前記ピクセルあるいはボクセルは存在するとともに、前記特定の質または特徴を有し、
    前記パラメータの全てまたは一部は、さらなる変換によって獲得され、
    前記変換は、ピクセルまたはボクセルの前記部分配列のピクセルまたはボクセルの数値データ、すなわち、強度値を備える元の行列へと加えられることを特徴とする、請求項24乃至28いずれか記載の画像処理方法。
  30. 第1の予測処理ステップにおいては、前記処理対象のピクセルまたはボクセルは、選択されたウインドウのピクセルまたはボクセルの強度値の行列の特異値、前記強度値の行列の勾配行列の固有値、およびヘシアン行列の固有値を使用してコーディングされ、
    ピクセルまたはボクセルの1以上の部分配列のピクセルまたはボクセルのみが処理される予測アルゴリズムの後の処理ステップにおいては、前記ピクセルまたはボクセルは、パラメータの全てまたは一部に対応するさらなる数値データによって表わされ、
    前記予測アルゴリズムによる第1の処理ステップに従って、前記部分配列は、元の画像の領域または部分に対応し、
    前記元の画像において、前記特定の質を有するピクセルまたはボクセルが存在し、
    前記パラメータの全てまたは一部は、所定のウインドウのピクセルまたはボクセルの強度値の行列の1以上のさらなる変換によって提供され、
    前記強度値の行列のさらなる変換が、例えば自己相関変換またはウェーブレット変換であることを特徴とする、請求項24乃至28いずれか記載の画像処理方法。
  31. 各処理ステップにおいて、前記ウインドウの寸法が変更されることを特徴とする、請求項29記載の画像処理方法。
  32. 各処理ステップにおいて、処理対象の画像の解像度が変更されることを特徴とする画像処理方法。
  33. 画像が、MRI、超音波、X線、またはCT放射線画像などの二または三次元の診断画像であることを特徴とする、請求項1乃至32いずれか記載の画像処理方法。
  34. 画像化された物体の領域または部分の質または特徴は、診断画像中のピクセルまたはボクセルによって表わされ、
    前記診断画像は、健常な組織、悪性腫瘍の組織、または良性腫瘍の組織などといったピクセルが表わす組織の種類、あるいは他の種類の病的状態の組織または病巣を表すことを特徴とする、請求項33記載の画像処理方法。
  35. コンピュータ支援診断で利用する方法であることを特徴とする、請求項1乃至34いずれか記載の画像処理方法。
  36. 画像化装置との組み合わせにて用意される画像処理システムであって、
    前記画像処理システムは、
    コンピュータ・ハードウェアとソフトウェア手段を備え、
    前記ソフトウェア手段は、前記コンピュータ・ハードウェアへロード可能であるとともに、前記コンピュータ・ハードウェアによって、請求項1乃至35いずれか記載の方法を実行可能であることを特徴とする画像処理システム。
  37. 前記コンピュータ・ハードウェアは、インターフェイスを備え、
    前記インターフェイスは、前記画像化装置の対応するインターフェイスとのやり取りを行なうとともに、前記画像化装置から画像データを受信し、画像データによって表される物体の部分の質についての情報を画像化装置へ送信し、画像化装置のスキャナの画像解像度の変更の指令および/または視野の変更の指令を画像化装置へと送信することを特徴とする、請求項36記載の画像処理システム。
  38. 画像化装置とは別体に設けられた装置であることを特徴とする、請求項36または37記載の画像処理システム。
  39. 画像化装置に組み込まれた装置であることを特徴とする、請求項36または37記載の画像処理システム。
  40. コンピュータ・ハードウェアは、画像化装置のコンピュータ・ハードウェアによって形成され、
    前記ソフトウェア手段は、前記画像化装置のコンピュータ・ハードウェアへと保存またはロード可能であるとともに、前記コンピュータ・ハードウェアによって実行可能であることを特徴とする、請求項39記載の画像処理システム。
  41. 画像化対象の物体から信号を受信するためのスキャン・ユニット(10)と、
    スキャナ(10)によって受信した信号を画像データに変換するための画像データ・プロセッサ(11)を備える画像化装置であって、
    前記画像データは、モニタ(12)上に表示され、
    前記装置は、さらに、
    処理ユニット(13、14)をさらに備え、該ユニットは、請求項1乃至35いずれか記載の方法を実行するとともに、グラフィック手段によって限定された視野の画像を定め、かつ/またはスキャナの解像度を変更し、かつ/または各ターゲット・ピクセルの周囲のピクセルからなるウインドウの寸法を変更し、
    前記処理ユニット(13、14)は、メモリを有していて、
    前記メモリにおいて、ソフトウェア手段がロードできるとともに、請求項1乃至33いずれか記載の方法によってコーディングが行なわれ、
    前記処理ユニット(13、14)は前記ソフトウェア手段を実行することが可能であることを特徴とする、画像化装置。
  42. エコグラフィック画像化装置、MRI装置、または放射線装置、などであることを特徴とする、請求項36乃至41いずれか記載の画像化装置。
JP2008510570A 2005-05-12 2006-05-09 デジタル画像のピクセルまたはボクセルをコーディングするための方法、およびデジタル画像を処理するための方法 Pending JP2008544766A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05425316 2005-05-12
PCT/EP2006/062168 WO2006120195A1 (en) 2005-05-12 2006-05-09 Method for coding pixels or voxels of a digital image and a method for processing digital images

Publications (1)

Publication Number Publication Date
JP2008544766A true JP2008544766A (ja) 2008-12-11

Family

ID=34981419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008510570A Pending JP2008544766A (ja) 2005-05-12 2006-05-09 デジタル画像のピクセルまたはボクセルをコーディングするための方法、およびデジタル画像を処理するための方法

Country Status (5)

Country Link
US (1) US8150151B2 (ja)
EP (1) EP1880364A1 (ja)
JP (1) JP2008544766A (ja)
CN (1) CN101189641B (ja)
WO (1) WO2006120195A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019530925A (ja) * 2016-09-15 2019-10-24 グーグル エルエルシー ロボットエージェントのための制御ポリシー
JP2021013737A (ja) * 2019-07-11 2021-02-12 キヤノンメディカルシステムズ株式会社 X線システム及び撮像プログラム

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8355595B2 (en) * 2007-05-15 2013-01-15 Xerox Corporation Contrast enhancement methods and apparatuses
US8014030B2 (en) * 2007-09-14 2011-09-06 Kabushiki Kaisha Toshiba Image processing and formation with line thininng by reducing intensity of target pixel based on extracted contour pixel and area connectedness information
JP5002397B2 (ja) * 2007-09-28 2012-08-15 株式会社東芝 超音波診断装置及びプログラム
JP5680283B2 (ja) * 2008-09-19 2015-03-04 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、及び動画像復号プログラム
JP5310130B2 (ja) * 2009-03-11 2013-10-09 オムロン株式会社 3次元視覚センサによる認識結果の表示方法および3次元視覚センサ
JP5714232B2 (ja) * 2009-03-12 2015-05-07 オムロン株式会社 キャリブレーション装置および3次元計測のためのパラメータの精度の確認支援方法
JP5245937B2 (ja) * 2009-03-12 2013-07-24 オムロン株式会社 3次元計測処理のパラメータの導出方法および3次元視覚センサ
JP2010210585A (ja) * 2009-03-12 2010-09-24 Omron Corp 3次元視覚センサにおけるモデル表示方法および3次元視覚センサ
JP5316118B2 (ja) 2009-03-12 2013-10-16 オムロン株式会社 3次元視覚センサ
JP5245938B2 (ja) 2009-03-12 2013-07-24 オムロン株式会社 3次元認識結果の表示方法および3次元視覚センサ
JP5282614B2 (ja) * 2009-03-13 2013-09-04 オムロン株式会社 視覚認識処理用のモデルデータの登録方法および視覚センサ
WO2011033657A1 (ja) * 2009-09-18 2011-03-24 株式会社東芝 特徴抽出装置
US9173629B2 (en) * 2009-11-18 2015-11-03 Kabushiki Kaisha Toshiba Ultrasonic diagnostic apparatus and ultrasonic image processing apparatus
KR20110103182A (ko) * 2010-03-12 2011-09-20 삼성전자주식회사 입체 영상 표시 장치
CN105120287B (zh) 2010-04-13 2019-05-17 Ge 视频压缩有限责任公司 解码器、编码器以及用于解码和编码的方法
CN106162171B (zh) 2010-04-13 2020-09-11 Ge视频压缩有限责任公司 解码器及方法、编码方法
HUE045579T2 (hu) 2010-04-13 2020-01-28 Ge Video Compression Llc Síkközi predikció
CN105915919B (zh) * 2010-04-13 2019-12-06 Ge视频压缩有限责任公司 用于解码、生成及存储数据流的方法
BR112012026391B1 (pt) 2010-04-13 2020-12-15 Ge Video Compression, Llc Herança em amostra de arranjo em subdivisão multitree
KR101335724B1 (ko) * 2010-08-09 2013-12-04 삼성전자주식회사 초음파 진단기 및 그 제어방법
CN102082895A (zh) * 2010-10-26 2011-06-01 娄定风 一种远距离昆虫图像检测系统及其检测方法
US9019399B2 (en) * 2011-01-28 2015-04-28 Nec Corporation Two-dimensional signal encoding device
CN102646187B (zh) * 2011-02-20 2016-08-03 深圳市心艺来文化有限公司 彩色图形编码及识别方法
US9341729B2 (en) * 2011-04-06 2016-05-17 Schlumberger Technology Corporation Amplitude contrast seismic attribute
US9002080B2 (en) * 2011-10-12 2015-04-07 University Of Virginia Patent Foundation Singular value filter for imaging or detection
WO2013109192A1 (en) * 2012-01-18 2013-07-25 Agency For Science, Technology And Research Method and device for image processing
MX366972B (es) * 2012-01-20 2019-08-01 Ananth Annapragada Metodos y composiciones para caracterizar imagenes medicas en forma objetiva.
CN102750771B (zh) * 2012-07-13 2014-10-01 中山大学 一种应用于智能手机的第五套人民币面额识别方法
RU2638012C2 (ru) * 2012-08-06 2017-12-08 Конинклейке Филипс Н.В. Уменьшение шума изображения и/или повышение разрешения изображения
US9141885B2 (en) * 2013-07-29 2015-09-22 Adobe Systems Incorporated Visual pattern recognition in an image
CN105765622B (zh) 2013-09-13 2021-04-09 斯特拉克斯私人有限公司 用于给图像分配颜色的方法和系统、计算机可读存储介质
US9569464B1 (en) * 2014-05-28 2017-02-14 Pivotal Software, Inc. Element identification in database
CN104101909B (zh) * 2014-06-18 2018-03-09 公安部第一研究所 一种hsl彩色空间下双能x射线图像显示方法
US10118436B2 (en) 2015-01-26 2018-11-06 Crayola, Llc Pixel art crayon and marker photo array assembly and kit
US10471617B2 (en) 2015-01-26 2019-11-12 Crayola Llc Pixel art crayon and marker photo array assembly and kit
CN107736027B (zh) * 2015-06-12 2021-06-01 松下知识产权经营株式会社 图像编码方法、图像解码方法、图像编码装置及图像解码装置
CN106683160A (zh) * 2015-11-06 2017-05-17 中国科学院深圳先进技术研究院 一种基于二维直方图的传递函数设计方法及装置
CN106372719B (zh) * 2016-08-31 2018-10-23 浙江莱达信息技术有限公司 一种医学x光影像处理控制参量的智能优选方法
US10778412B2 (en) 2017-12-28 2020-09-15 Intel Corporation Multi-domain convolutional neural network
US20190220699A1 (en) * 2018-01-15 2019-07-18 Gyrfalcon Technology Inc. System and method for encoding data in an image/video recognition integrated circuit solution
US10452955B2 (en) * 2018-01-15 2019-10-22 Gyrfalcon Technology Inc. System and method for encoding data in an image/video recognition integrated circuit solution
IT201800001148A1 (it) * 2018-01-17 2019-07-17 Semeion Centro Ricerche Metodo di elaborazione di immagini e sistema per l’elaborazione di immagini
CN110135227B (zh) * 2018-02-09 2022-06-03 电子科技大学 一种基于机器学习的激光点云室外场景自动分割方法
US10586129B2 (en) * 2018-02-21 2020-03-10 International Business Machines Corporation Generating artificial images for use in neural networks
WO2020107156A1 (zh) * 2018-11-26 2020-06-04 深圳先进技术研究院 乳腺医学超声图像的自动化分类方法及装置
CN110645917B (zh) * 2019-09-24 2021-03-09 东南大学 基于阵列式相机的高空间分辨率三维数字图像测量方法
KR20210073282A (ko) 2019-12-10 2021-06-18 한국전자통신연구원 영상 처리 장치 및 이를 포함하는 석회화 분석 시스템
US11551116B2 (en) * 2020-01-29 2023-01-10 Rohde & Schwarz Gmbh & Co. Kg Signal analysis method and signal analysis module
US11436761B2 (en) 2020-03-18 2022-09-06 International Business Machines Corporation Preventing feature loss when compressing images
CN112750174B (zh) * 2021-01-05 2023-09-22 东北大学 基于空间编码的目标智能感知及识别系统及方法
CN116778195B (zh) * 2023-08-16 2023-11-24 北京华源技术有限公司 一种基于颜色码的设备识别方法和系统
CN117854138B (zh) * 2024-03-07 2024-05-10 深圳航天信息有限公司 基于大数据的信息采集分析方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005519685A (ja) * 2002-03-11 2005-07-07 ブラッコ イメージング ソチエタ ペル アチオニ 画素の符号化法、画像処理法と、1以上の画素により再現されるオブジェクトの定性的な認識を目的とする画像処理法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1217290C (zh) * 2003-07-07 2005-08-31 西安理工大学 二维条码身份证件防伪系统自动识读方法
CN1234056C (zh) * 2003-09-11 2005-12-28 中国科学技术大学 非线性时变自适应控制器及其控制方法
US7346208B2 (en) * 2003-10-25 2008-03-18 Hewlett-Packard Development Company, L.P. Image artifact reduction using a neural network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005519685A (ja) * 2002-03-11 2005-07-07 ブラッコ イメージング ソチエタ ペル アチオニ 画素の符号化法、画像処理法と、1以上の画素により再現されるオブジェクトの定性的な認識を目的とする画像処理法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019530925A (ja) * 2016-09-15 2019-10-24 グーグル エルエルシー ロボットエージェントのための制御ポリシー
US11853876B2 (en) 2016-09-15 2023-12-26 Google Llc Control policies for robotic agents
JP2021013737A (ja) * 2019-07-11 2021-02-12 キヤノンメディカルシステムズ株式会社 X線システム及び撮像プログラム
JP7475979B2 (ja) 2019-07-11 2024-04-30 キヤノンメディカルシステムズ株式会社 X線システム及び撮像プログラム

Also Published As

Publication number Publication date
EP1880364A1 (en) 2008-01-23
WO2006120195A1 (en) 2006-11-16
US20080212887A1 (en) 2008-09-04
CN101189641A (zh) 2008-05-28
CN101189641B (zh) 2012-05-02
US8150151B2 (en) 2012-04-03

Similar Documents

Publication Publication Date Title
JP2008544766A (ja) デジタル画像のピクセルまたはボクセルをコーディングするための方法、およびデジタル画像を処理するための方法
Li et al. Using wavelet transform and multi-class least square support vector machine in multi-spectral imaging classification of Chinese famous tea
EP1922999B1 (en) Image processing method and image processing device
CN109461495A (zh) 一种医学图像的识别方法、模型训练的方法及服务器
JPH07284090A (ja) 画像分類装置
US20060280348A1 (en) Method of screening cellular tissue
CN112288645B (zh) 一种颅骨面貌复原模型构建方法及复原方法与系统
CN108875741B (zh) 一种基于多尺度模糊的声学图像纹理特征提取方法
JP2022000777A (ja) 分類装置、分類方法、プログラム、ならびに、情報記録媒体
Piella et al. Multiresolution image fusion guided by a multimodal segmentation
Singh et al. A review of image fusion: Methods, applications and performance metrics
CN110910339A (zh) Logo缺陷检测方法及装置
Purkait et al. Image upscaling using multiple dictionaries of natural image patches
CN107944497A (zh) 基于主成分分析的图像块相似性度量方法
CN115471675A (zh) 一种基于频域增强的伪装对象检测方法
Nagaraja Kumar et al. An intelligent multimodal medical image fusion model based on improved fast discrete curvelet transform and type-2 fuzzy entropy
CN116052831B (zh) 骨科脊柱用数据信息处理方法及其装置
Arshaghi et al. Denoising medical images using machine learning, deep learning approaches: a survey
CN115205308A (zh) 一种基于线状滤波和深度学习的眼底图像血管分割方法
CN111429436B (zh) 一种基于多尺度注意力和标签损失的本质图像分析方法
CN113361422A (zh) 一种基于角度空间损失承数的人脸识别方法
JP2022522429A (ja) ユーザのバイオメトリック特性を有する画像中の物体を識別して、画像のうちバイオメトリック特性を含む部分を他の部分から分離することにより当該ユーザのidを検証するための方法
Wang et al. Thresholding binary coding for image forensics of weak sharpening
Dubey et al. Implementation of Autoencoder for Super Resolution of 3D MRI Imaging using Convolution Neural Network
Liu et al. Vessel segmentation using principal component based threshold algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111128