JP3850040B2 - 文脈上の相関関係を使用するパターン認識方法及び装置 - Google Patents
文脈上の相関関係を使用するパターン認識方法及び装置 Download PDFInfo
- Publication number
- JP3850040B2 JP3850040B2 JP50143899A JP50143899A JP3850040B2 JP 3850040 B2 JP3850040 B2 JP 3850040B2 JP 50143899 A JP50143899 A JP 50143899A JP 50143899 A JP50143899 A JP 50143899A JP 3850040 B2 JP3850040 B2 JP 3850040B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- information
- pattern recognition
- recognition method
- merging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
- Image Processing (AREA)
Description
データセットは、そのそれぞれがここで情報値あるいは符号と呼ばれる多数の値を採用できる、イメージのピクセルまたは画素のような要素配列を含むことができる。データセットのパターンを認識することの重要性は大きい。もしデータセットが例えばタイプまたは手書きのテキストのピクセルを含んでいるなら、このテキストの別々の文字はパターン認識によって認識可能である。ノイズが認識イメージの中に存在したとしても、オリジナルパターンを認識することは、なおしばしば可能である。もしデータセットが例えば医療用写真であれば、細胞異常あるいは細胞腫瘍がパターン認識によって早い段階で認識できる。
従来技術においては、多様な方法がデータセットのパターン認識に関して知られている。しかしながら複雑なパターンにおけるつながり(リンク)に関する構造的な情報をあまりうまく処理することができない統計手法がある。例えば、認識パターンの特徴を定義する試みが成される記述的な方法も存在する。しかし、認識パターンが複雑なときには、これらの方法は問題をもたらす。パターンを認識するために、ニューラルネットワークを使用することも可能である。しかしながら、大きなデータセットにおいてこのニューラルネットワークを使用すると、ニューラルネットワークが計算される現在のコンピュータの容量の限界に直面する。
本発明の方法は、トレーニング段階の間に本発明の装置に与えられる既に知られた(アプリオリな;先験的な)パターンのトレーニングセットに存在する統計特性から評価される内部情報コンテクストに基づいて、データセットから関連する情報を抽出する。関連しない、または余分な情報は、本発明の方法によれば無視される。データセットのサイズは、関連する情報の損失を最小としながらも、減じられる。
本発明は、パターン認識の目的のために、データセットにおけるデジタル情報量を減少させる方法および装置に関するものである。その方法は、次のようなステップ、すなわち、
少なくとも一つの既知パターンに関連するデジタルのアプリオリ(先験的)な情報値を決定する決定ステップと、
認識パターンに関連する第1の要素のデジタル情報値を決定する決定ステップと、
二つまたはそれ以上の第1の要素をグループに分けるグループ化ステップと、
前記第1の要素を二つ以上ペアリングさせて第2の要素とし、それによってそれぞれの第2の要素に対するデジタル情報値の数が少なくとも2倍となるようにするペアリング・ステップと、
トレーニング段階で形成されたトレーニングセットからのパターン情報に基づいて、前記第2の要素の各々に対して最低二つのデジタル情報値を併合させて、その情報値の数が削減された、削減された第2の要素にする併合ステップと、を含むことを特徴とする。これらのアプリオリな情報値はパターン認識のその後のステップで使用されるトレーニングセットを形成する。第1の要素は例えば、認識しなければならないイメージのピクセルであり得る。デジタル情報値はそのときは例えばピクセルのグレー階調値またはカラー値である。パターン情報はデジタル情報値が特定のパターンと結び付けられるという確率の統計上の見積もりをベースにして計算される。この統計的評価はトレーニングセットのデータから計算される。
可能な限りほとんどパターン情報が失われないような方法で、最終ステップにおいて関連する情報値の併合が行われる。アプリオリな既知のパターンをベースにして、決められた情報値と決められたパターンが生じる確率の最も良い評価を計算できる。情報値とパターンのすべての可能な組み合わせについて確率の計算された評価をベースにして、併合されるときにパターン情報の最小損失を実現するパターン及び情報の組み合わせをそれによって決定することができる判断基準が定式化される。
以下、本発明の好ましい実施の態様を詳細に説明する。実施態様は、下記の図面を参照して説明される。
図1は、本発明による装置の概略図である。
図2は、認識パターンのイメージの一部を示した図である。
図3は、パターン及びピクセル値の組み合わせが生じる回数のリストを示した図である。
図4は、ピクセルの併合を概略的に示した図である。
図5は、ペアリング後の情報値の符号化の変換を示した図である。
図6は、ペアリングと併合のステップの関数として、全情報の発展をグラフで示した図である。
図1は、本発明に係る装置を示した図である。この装置は、特に、
以下において説明される本発明による方法を実行することができるコンピュータ1と、
デジタル情報値をキーボードを使ってコンピュータ1に入力するための入力端末2と、
コンピュータ1と入力端末2との間、及びコンピュータ1と出力端末4との間をそれぞれ接続して、これらの間におけるデータ伝送を可能ならしめる接続ライン3と、
本発明による方法の結果を出力するための出力端末4と、
を備えている。しかしながら、一般に、入力は、ビデオカメラ、スキャナ等からのピクセルのようなものであり、ビデオカメラ、スキャナ等の如き外部電子装置が発信源である。
図2は、値「1」(=黒)または値「0」(=白)を採用することができる9つのピクセルから成るイメージの一例を示している。単純化のために、グレー階調またはグレー色なしの白黒イメージが出発点として採用される。この図では、3つのピクセルがそれぞれR、SおよびTで指定される。また、2つのパターン、すなわち「/」と「\」、がシステムによって見分けられると想定する。まず最初に、いわゆるトレーニング(訓練)段階または準備段階において、ピクセルがパターン「/」を表示するとき、及びピクセルがパターン「\」を表示するときの、その両方のときに、パターンのすべての値が決定される。トレーニング段階の結果は、ピクセルのパターンαと値iのすべての組み合わせを含むリストがピクセル毎に完成されたトレーニングセットを形成する。
図3は、三つのピクセルR、SおよびTに対するリストを示している。このリストをベースにして、認識のためのピクセル値及びパターンの組み合わせがトレーニングセットの関連するピクセルに生じる頻度が決定される。
本例では、それぞれのパターンはピクセル値の同じ組み合わせを有する。しかしながら、これは一般に当てはまらない。例えば文字認識では、文字は異なった方法で表現できるために、決定された文字は様々な変形を持つ。それ故に同じパターン(「文字」)を生じさせるピクセル値の異なった組み合わせが可能である。文字は複数の表現を持つことができるけれども、大きな度合いの相互類似性がしかしながら存在する。
図3に示されたリストから、特定のパターンとピクセル値の組み合わせが生じる頻度が決定される。このような組み合わせが生じる回数は「nR iα」で記される。ここで、Rは関連するピクセル、iはデジタルのピクセル値、αは問題のパターンを表す。表1はピクセルR、SおよびTに関して、niαの対応する値を示す。
すべてのピクセルおよびすべての可能なピクセル値に対して、特定のパターンにこれらが生じる確率Pが計算される。この確率は、いわゆるラプラス・サンプルサイズ・コレクタ(Laplace Samplesize Corrector)を使って計算される。
上記表現の仕方を使用すると、3つのピクセルR、SおよびTに対して、ピクセル値及びパターン毎の確率が表2で示される。他のピクセルの確率は類似の方法で計算できる。
続いて、ピクセルは、2つのピクセルのグループにグループ化(grouping)される。隣接したピクセルの間の相関は一般に互いに遠くに引き離されたピクセルの間の相関よりも大きいので、隣接するピクセルがグループ化されるのが好ましい。グループ化された1対のピクセルは、その後に、一つの新しいピクセルとして組み合わされる。従って、ピクセルの合計数は半減する。可能なピクセル値の数量は、しかしながら、2倍になる。情報はこれによって失われない。ピクセルのグループ化はこの他多くの異なった方法で挙行できる。例えば、最初は水平線上に配置されたピクセルの間でグループ化され、続いて垂直線上に配置されたピクセルの間でグループ化される。本例では、水平線上に配置されたピクセルRとSとが対(ペアリング)にされる。
図4は、ピクセルをペアリングする過程を示している。この図では、番号付けされた平行四辺形はピクセルを表す。一つの層から他の層への各ステップにおいて、この場合には4回のペアリングによって単一のピクセルが残るまで、ピクセル数が半減する。
新しい符号化(coding)がピクセルの可能な組み合わせに使用できる。図5はピクセルRとSの異なった組み合わせに対して新しい符号化を与える。2つのピクセルRとSを併合した結果、この場合にはピクセル値0,1,2または3の単一ピクセルが得られる。ピクセルRがピクセル値iを持ち、ピクセルSがピクセル値jを持ち、かつパターンがαに等しい確率Pijαは逐次代入で決定、または次式で近似できる。
これにより、そして図3からの情報を使って、新しいピクセル値とパターンのそれぞれの組み合わせに対する確率が決定できる。表3は、その結果を示している。
ピクセル数が毎回半減する一方で、ピクセル値の数が2倍になる上記過程は繰り返しができる。
可能なピクセル値の数は、ピクセル対の組み合わせの数と共に増大するため、この数を減らすことが必要である。これは、「枝打ち(pruning)」とも呼ばれる、ピクセル値を一つの新たなピクセル値に併合することによって達成され得る。その結果、初期のピクセル値はもはや区別できず、ピクセル値に含まれる情報が失われることは不可避である。しかし、ピクセル値の数は減少された。ピクセル値の併合による情報の損失を最小にするために、どのピクセル値が併合されるのが好ましいかを決定するための一つの基準が設けられた。
本発明のこの好ましい実施態様の目的はパターン認識であるので、ピクセル値の併合によるパターンに関する情報損失は最小でなければならない。パターン情報は次式のように記述できる。
それ故に情報値iとi’を併合することによるパターン情報の損失は、結局、以下の式になる。
この情報損失は、特定のピクセルに対する情報値iおよびi’のすべての組み合わせに対して決定される。表4では、上記例に関して、ピクセルVのピクセル値のすべての組み合わせに対して決定された情報損失が示されている。
情報の最小損失を持つ情報値の組み合わせのピクセル値は併合のために選択される。この場合、0と1の組み合わせ、または2と3の組み合わせは情報の最小損失をもたらす。0と1の組み合わせが選択されると、その結果、各0は1に、または各1は0になる。2と3の組み合わせが選択されると、その結果、各2は3に、または各3は2になる。
ピクセル値iおよびi’を併合することによって併合されたピクセルの確率は、Pi+i',α=Piα+Pi'αになる。
イメージ認識の間に最後の段階における併合に関する情報を使用できるようになるために、どのピクセル値が併合されたかを、コードリストまたはコードブックに記録することが必要である。ピクセル値を併合する方法は、一般に、すべてのピクセルに対して個別に実行されなければならない。従って、上記の計算はそれぞれのピクセルに対して実行されなくてはならない。ただし、そこでの結果は、コードブックにピクセル毎に記憶される。
もしピクセル値の数が併合の後もまだ大きすぎるなら、この方法は、ピクセル値の数が十分に減らされるまで、繰り返し可能である。その結果、ピクセルをペアリングして、ピクセル値を可能な限り併合する過程は、やり直しができる。
ピクセルをペアリングして、ピクセル値を併合する方法は、すべてのピクセルが対にされ、ピクセル値の数が受容可能な水準まで減少するまで、必要なだけ繰り返しできる。
図6は、イメージの全パターン情報がピクセルをペアリングし(Cで指摘)、ピクセル値を併合または枝打ちする(Sで指摘)ステップに対してプロットされたグラフを示している。ピクセルをペアリングする各ステップにおいて、パターン情報は、認識イメージのピクセルの間の強い相関のために増大する。ピクセル値を併合または枝打ちする各ステップにおいて、(僅かな量の)パターン情報が失われる。イメージ全体が処理されるほど頻繁にペアリングと併合が実行された後、認識はほとんど完璧なので、パターン情報の値はゼロに近い値に収束する。パターン情報の最終値(すなわちゼロ値との差)は認識誤差である。この値は、ピクセル値の併合と、トレーニングセットの制限された統計的特徴の結果である固有の曖昧さが原因となったすべての情報損失の累積作用である。
上記好ましい実施態様におけるピクセルのペアリングとピクセル値の併合は、ニューラルネットワークに適した入力が結果として生じるまで、必要なだけ繰り返すことができる。パターン認識は、その後、ニューラルネットワークに引き継がれる。ニューラルネットワークが直に(それ故に上記方法に依ることなく)ピクセルに適用できない理由は、現在のコンピュータ技術では、ニューラルネットワークのノード数があまりにも大きくなるので迅速な方法でパターンを認識できなくなるためである。
イメージのパターンは、ピクセルをペアリングして、ピクセル値を併合することによっても直に認識できる。本発明による方法及び装置の上記好ましい実施態様においては、隣接的かつ近接的に配置された要素の間で各層の相関だけが調べられたが、遠く離れた要素との相関はその後、「もっと深い」層で生じる。本発明によるデータ減少によって階層構造が形成され、そこでは、環境(状況)に応じて要素が組み合わされ、あるいは状況に応じた相関を使用したパターン認識がもたらされる。
Claims (15)
- パターン認識の目的のために、データセットにおけるデジタル情報量を減少させるための方法であって、
(a) 少なくとも一つのアプリオリな既知のパターンに関連し、トレーニング段階の間に前記少なくとも一つのアプリオリな既知のパターンから決定されるデジタルのアプリオリな情報値を提供する提供ステップと、
(b) 認識用のパターンに関連する第1の要素のデジタル情報値を決定する決定ステップと、
(c) 前記第1の要素を二つ以上ペアリングさせて第2の要素とし、それによってそれぞれの第2の要素に対するデジタル情報値の数が少なくとも2倍とするペアリング・ステップと、
(d) 前記第2の要素の各々に対して最低二つのデジタル情報値を併合させて、その情報値の数が削減された、削減された第2の要素とする併合ステップであって、情報値の併合の範囲は前記アプリオリな情報値に基づくことを特徴とする併合ステップと、
を含むことを特徴とするパターン認識方法。 - 前記併合ステップ(d)が、
少なくとも1つのアプリオリな既知のパターンの情報値から、認識パターンの情報値がアプリオリな既知のパターンに属する確率を決定するステップと、
前記確率から、認識されるべきパターンに含まれる情報を表すパターン情報値を決定するステップと、
情報値の併合の前後のパターン情報値の差異を情報値のすべてのペアリングに対して決定するステップと、
パターン情報内の前記決定された差異に基づいて情報値を併合するステップと、を含むことを特徴とする請求項1に記載のパターン認識方法。 - 前記併合ステップ(d)において、パターン情報値の最小損失を与えるデジタル情報値が併合されることを特徴とする請求項2に記載のパターン認識方法。
- 前記ペアリング・ステップ(c)と前記併合ステップ(d)は繰り返されることを特徴とする請求項1に記載のパターン認識方法。
- 第1の要素のペアリングは隣接する第1の要素に対して行われることを特徴とする請求項1に記載のパターン認識方法。
- 前記第1の要素は、一緒にイメージを形成するピクセルによって形成されることを特徴とする請求項1に記載のパターン認識方法。
- 前記情報値は、前記ピクセルが採用することができるデジタル値によって形成されることを特徴とする請求項1に記載のパターン認識方法。
- 前記第1の要素はスペクトラムを形成することを特徴とする請求項1に記載のパターン認識方法。
- デジタル情報値の併合の後に、残存するデジタル情報値が再編成されることを特徴とする請求項1に記載のパターン認識方法。
- 前記第2の要素のデジタル情報値がニューラルネットワークの入力値として使用されることを特徴とする請求項1乃至11の何れか1項に記載のパターン認識方法。
- パターン認識の目的のために、データセットにおけるデジタル情報量を減少させるための装置であって、
デジタル情報を記憶するための電子メモリ手段と、
前記電子メモリ手段にデジタル情報値を入力するための入力手段と、
前記第1の要素を二つ以上ペアリングさせて第2の要素とし、それによってそれぞれの第2の要素に対するデジタル情報値の数を少なくとも2倍とするペアリング手段、および、前記第2の要素の各々に対して最低二つのデジタル情報値を併合させて、その情報値の数が削減された、削減された第2の要素とする併合手段であって、情報値の併合の範囲は前記アプリオリな情報値に基づくことを特徴とする併合手段と、をそれぞれ含む計算手段と、
前記計算手段と前記メモリ手段とを接続する接続手段、および、前記計算手段と前記入力手段とを接続する接続手段と、
をそれぞれ備えるパターン認識装置において、
少なくとも一つのアプリオリな既知のパターンに関連し、トレーニング段階の間に前記少なくとも一つのアプリオリな既知のパターンから決定されるデジタルのアプリオリな情報値を決定するための決定手段が備えられ、かつ、前記併合手段は前記デジタルのアプリオリな情報値に基づいて情報値を併合することを特徴とするパターン認識装置。 - 前記決定手段、前記グループ化手段、前記ペアリング手段、そして前記併合手段は、前記計算手段のソフトウェア制御によって実現されることを特徴とする請求項13に記載のパターン認識方法。
- 前記1乃至11の何れか1項に記載された方法を実行する手段を備えたことを特徴とする請求項13または14に記載のパターン認識方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
BE9700482 | 1997-06-04 | ||
BE9700482A BE1011191A4 (nl) | 1997-06-04 | 1997-06-04 | Patroonherkenning met behulp van contextuele correlatie. |
PCT/EP1998/003166 WO1998055959A1 (en) | 1997-06-04 | 1998-05-20 | Pattern recognition using contextual correlation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002502525A JP2002502525A (ja) | 2002-01-22 |
JP3850040B2 true JP3850040B2 (ja) | 2006-11-29 |
Family
ID=3890550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50143899A Expired - Fee Related JP3850040B2 (ja) | 1997-06-04 | 1998-05-20 | 文脈上の相関関係を使用するパターン認識方法及び装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6707941B1 (ja) |
EP (1) | EP0986794B8 (ja) |
JP (1) | JP3850040B2 (ja) |
AU (1) | AU8107598A (ja) |
BE (1) | BE1011191A4 (ja) |
DE (1) | DE69803850T2 (ja) |
ES (1) | ES2169529T3 (ja) |
WO (1) | WO1998055959A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3301477A1 (en) * | 2016-10-03 | 2018-04-04 | Xenomatix NV | System for determining a distance to an object |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5046120A (en) * | 1989-04-10 | 1991-09-03 | Beltronics, Inc. | Method of and apparatus for increasing the processing speed in the scanning inspection of circuit boards and other objects |
EP0455898A1 (en) * | 1990-05-09 | 1991-11-13 | Robert Bishop | Image scanning inspection system |
-
1997
- 1997-06-04 BE BE9700482A patent/BE1011191A4/nl not_active IP Right Cessation
-
1998
- 1998-05-20 ES ES98930748T patent/ES2169529T3/es not_active Expired - Lifetime
- 1998-05-20 EP EP98930748A patent/EP0986794B8/en not_active Expired - Lifetime
- 1998-05-20 US US09/445,158 patent/US6707941B1/en not_active Expired - Fee Related
- 1998-05-20 JP JP50143899A patent/JP3850040B2/ja not_active Expired - Fee Related
- 1998-05-20 DE DE69803850T patent/DE69803850T2/de not_active Expired - Fee Related
- 1998-05-20 WO PCT/EP1998/003166 patent/WO1998055959A1/en active IP Right Grant
- 1998-05-20 AU AU81075/98A patent/AU8107598A/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
DE69803850T2 (de) | 2002-09-19 |
US6707941B1 (en) | 2004-03-16 |
EP0986794B8 (en) | 2002-08-28 |
ES2169529T3 (es) | 2002-07-01 |
DE69803850D1 (de) | 2002-03-21 |
AU8107598A (en) | 1998-12-21 |
WO1998055959A1 (en) | 1998-12-10 |
EP0986794B1 (en) | 2002-02-13 |
EP0986794A1 (en) | 2000-03-22 |
JP2002502525A (ja) | 2002-01-22 |
BE1011191A4 (nl) | 1999-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101183391B1 (ko) | 메트릭 임베딩에 의한 이미지 비교 | |
KR100422943B1 (ko) | 화상 부호화장치, 화상 복호화장치, 화상 부호화방법,화상 복호화방법 및 매체 | |
WO2022242122A1 (zh) | 一种视频优化方法、装置、终端设备及存储介质 | |
CN111080591A (zh) | 基于编码解码结构结合残差模块的医学图像分割方法 | |
CN111353956A (zh) | 图像修复方法、装置、计算机设备及存储介质 | |
CN107220934A (zh) | 图像重建方法及装置 | |
AU704529B2 (en) | Method of data reduction by means of fractal image coding | |
JP3850040B2 (ja) | 文脈上の相関関係を使用するパターン認識方法及び装置 | |
CN115100050A (zh) | Ct图像环状伪影的去除方法、装置、设备及存储介质 | |
Tigora et al. | Image Color Reduction Using Iterative Refinement | |
Aadil et al. | Improving super resolution methods via incremental residual learning | |
JP3783815B2 (ja) | 画像処理装置 | |
CN111899161A (zh) | 一种超分辨率重建方法 | |
CN113487624B (zh) | 一种人体实例分割方法、终端设备及存储介质 | |
CN117196972B (zh) | 一种基于改进的Transformer的文档伪影去除方法 | |
JP3030126B2 (ja) | 画像処理方法 | |
JP2002290763A (ja) | 画像処理方法及び画像処理装置 | |
KR20240101333A (ko) | 딥러닝 기반의 암 진단 보조를 위한 전자 장치 및 그 동작 방법 | |
JPH09282466A (ja) | パターン認識方法 | |
JP3100044B2 (ja) | 画像領域特定方法 | |
CN111126270A (zh) | 人脸检测方法、装置、存储介质及设备 | |
CN115471659A (zh) | 语义分割模型的训练方法、分割方法和电子设备 | |
CN114399435A (zh) | 一种文化遗产图像特征提取装置及其提取方法 | |
CN117671264A (zh) | 一种心脏图像的分割方法 | |
JPS61125293A (ja) | モザイクコ−ド化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060313 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060829 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |