JP3890099B2 - パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体 - Google Patents

パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体 Download PDF

Info

Publication number
JP3890099B2
JP3890099B2 JP25874396A JP25874396A JP3890099B2 JP 3890099 B2 JP3890099 B2 JP 3890099B2 JP 25874396 A JP25874396 A JP 25874396A JP 25874396 A JP25874396 A JP 25874396A JP 3890099 B2 JP3890099 B2 JP 3890099B2
Authority
JP
Japan
Prior art keywords
probability distribution
cell
resolution
input
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25874396A
Other languages
English (en)
Other versions
JPH10105208A (ja
Inventor
輝芳 鷲澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP25874396A priority Critical patent/JP3890099B2/ja
Priority to US08/938,789 priority patent/US6198847B1/en
Priority to DE69720630T priority patent/DE69720630T2/de
Priority to CA002216883A priority patent/CA2216883C/en
Priority to EP97307628A priority patent/EP0833275B1/en
Publication of JPH10105208A publication Critical patent/JPH10105208A/ja
Application granted granted Critical
Publication of JP3890099B2 publication Critical patent/JP3890099B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/147Details of sensors, e.g. sensor lenses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition

Description

【0001】
【発明の属する技術分野】
本発明は、パターン認識装置に関するものであり、特に、パターン認識装置に含まれる入力装置が、ある種の制約を受け、その制約をパラメタによって変化させることが可能であるようなときに、効率的にパターンを認識するためにパラメタを制御するパターン認識装置に関する。
【0002】
【従来の技術】
例えば、3次元空間を移動するロボットに設けられた画像認識装置では、認識すべき画像信号が周囲のどの方位に存在するかが予め分かっていないので、できるだけ広い範囲の信号を入力することが要求される。しかし同時に、あるパターンを認識するために十分なだけの空間解像度をも備えていなければならない。これらを同時に満足するような画像入力装置として、人間の網膜特性を参考にして、光軸の中心付近が高解像度で、光軸から離れるに従って低解像度になるような非一様サンプリングが考案された。
【0003】
このような非一様サンプリングでは、周辺の低解像度でサンプリングされたパターンを正確に認識するためには、そのパターンが光軸付近の高解像度領域でサンプリングされるように光軸を変更しなければならない。即ち、非一様サンプリングは光軸制御を伴って初めて効果的な入力方式となる。
【0004】
そのための光軸制御方式としては、非一様サンプリングによって入力された入力画像の特徴量に基づいて制御するものが考案されている。この特徴量としては、例えば画像強度の傾きの絶対値、ある2次元フィルタを施したあとの出力値、等が用いられている。また、知識データベースに基づく光軸制御方式も考案されている。この知識データベース方式では、システムが遂行すべきタスクや、認識対象の画像或いはパターンの集合を、ベイズネットワークで表現し、この確率構造に基づいて、与えれたタスクを効率よく遂行するために次に行うべき動作を決定している。
【0005】
【発明が解決しようとする課題】
上述したように、従来における光軸制御の殆どは、画像信号に基づく方式であり、従ってエッジ強度が強い個所やフィルタ出力の強い個所という画像の幾何学的性質のみで光軸が制御されてしまう。このような制御方式では、タスクに必要でない個所でも、傾きの絶対値が大きければそこに光軸を移動させてしまう。
【0006】
また、上述の知識データベース方式では、ベイズネットワークを用いているために、表現できるデータの構造が限定されてしまう。
【0007】
【課題を解決するための手段】
上記の課題を解決するために、本発明によれば、パターン認識装置に、認識対象のパターンを表わす2次元画像信号を入力する入力手段と、該入力手段より入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング手段と、該サンプリング手段のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出手段と、該確率分布算出手段により算出された確率分布に基づいて、前記2次元画像信号の表わすパターンを認識する認識手段と、前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出手段と、前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更手段とを備える。
【0008】
また、本発明の他の態様によれば、パターン認識方法に、認識対象のパターンを表わす2次元画像信号を入力する入力工程と、該入力工程により入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング工程と、該サンプリング工程のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出工程と、該確率分布算出工程により算出された確率分布に基づいて、前記第1の信号の表わすパターンを認識する認識工程と、前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出工程と、前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更工程とを備える。
【0009】
また、本発明の他の態様によれば、コンピュータに、認識対象のパターンを表わす2次元画像信号を入力する入力手順と、該入力工程により入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング手順と、該サンプリング工程のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出手順と、該確率分布算出手順により算出された確率分布に基づいて、前記第1の信号の表わすパターンを認識する認識手順と、前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出手順と、前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更手順とを実行させるためのパターン認識プログラムをコンピュータ読み取り可能な記憶媒体に記録したことを特徴とする。
【0010】
【発明の実施の形態】
(実施形態1)
図1は、本発明の1実施形態であるパターン認識装置の機能構成を表す図である。実施形態1は、オフラインパターン認識への応用例である。装置の各部は、以下に説明する機能を実現するものであれば、それぞれが専用のプログラムメモリやプロセッサを含む機器であってもよいし、複数の機能部を、同一のCPUがROMやディスクメモリ等に記憶された各機能プログラムを実行することにより、あるいは各機能に対応する特定のハードウェアを制御する制御プログラムを実行することにより実現してもよい。
【0011】
ここで、以下の記述を簡単にするため次のような記述を採用する。
【0012】
まず、インデクスにうちの1つに*が現れたときには、その全てのインデクスに対する値を要素とするベクトルを表し、2つに*が現れたときには、それら全てのインデクスに対する値を要素とする行列を表すものとする。
【0013】
例えば:
A(l,m,n,*) = (A(l,m,n,1), A(l,m,n,2), ... ,A(l,m,n,W))T (1)
【0014】
【外1】
Figure 0003890099
【0015】
更に、インデクスに~が現れたときには、その全てのインデクスに渡る値の集合を表すものとする。例えば:
A(l,m,n,〜) = { A(l,m,n,1), A(l,m,n,2), ... , A(l,m,n,W) } (3)
なお、〜は複数個のインデクスに現れてもよい。
【0016】
また確率理論に基づいて説明を行うので、有限個の非負の要素で構成される有限次元ベクトル( z(1), z(2) , ... , z(N))T に対して、総和が1になるように正規化したベクトルを出力する関数λを次式で定義する:
【0017】
【外2】
Figure 0003890099
ただし、Zはベクトルの要素の総和である:
【0018】
【外3】
Figure 0003890099
【0019】
以下に、図1のパターン認識装置の各部を説明する。
【0020】
<入出力装置101>
入出力装置101は、認識の対象とする信号を受信し、それを信号処理装置102に送信する。また、信号処理装置102による処理により得られた認識結果を外部装置に対して送信する。
【0021】
外部装置から入力される信号は、認識対象としての信号であり、この信号は、音声信号のような1次元信号でも、画像のような2次元信号でもよい。本実施形態では、入力信号を2次元信号I(*,*)とする。
【0022】
<信号処理装置102>
信号処理装置102は、通常のモードでは、入出力装置101から送信された2次元信号を認識し、学習モードのときには、入出力装置101から送信された2次元信号と教師信号とを基に、認識のための知識データを、後述する量子化コードブックなどの形式で記憶装置103に格納する。
【0023】
図2に、信号処理装置102の処理のフローチャートを示す。
【0024】
ステップS201では、入出力装置101から入力があったかどうかを検査する。入力がなければ、ステップS201を繰り返し、入力があった場合には、ステップS202に進む。ステップS202では、学習モードかどうかを検査し、学習モードであればステップS204へ、そうでなければステップS203へ進む。
【0025】
ステップS203では、認識処理を実行する。この認識処理は図3及び図4につき後述する。ステップS204では、教師信号が入力されたかどうかを検査し、入力されたならばステップS205へ進み、学習処理を行なう。入力されなければステップS204の処理を繰り返す。ステップS205で実行される学習処理は図26につき後述する。
【0026】
次に、上述したステップS203で実行される認識処理の流れを、図3〜4のフローチャートに沿って説明する。
【0027】
まず、ステップS301で確率セルオートマトンAを初期化する。ここで、確率セルオートマトンAは、セル空間Zd、各セルの状態の集合Ωの上に定義された確率空間Q、近傍系X、写像φの4つ組で表される:
A = { Zd, Q, X,φ} (6)
【0028】
本実施形態では階層構造を考えているので、セル空間Zdは、d=3、即ち (l,m,n) ∈ Z3 、ここで、lは階層レベル、(m,n)は2次元画像に対応する2次元空間位置を表している。セルの状態の集合は、状態値が可算個の場合には、一般に自然数の集合と考えてよい。更に状態値を有限個に制限すれば、その上の確率分布Pは状態値1に対する確率、2に対する確率、…というように与えられ、これらを1まとまりにして、有限次元ベクトルとして表現できる。
【0029】
また、セル空間での座標(l,m,n)に位置するセルに対する近傍系X(l,m,n)は、例えば
Figure 0003890099
のように定義する。例えば、座標(2,1,1)のセル803に対する近傍系X(2,1,1)は、
Figure 0003890099
となる。
【0030】
写像φは、セル空間上で(l,m,n)に位置するセルの状態値μがvとなる確率Pl,m,n(μ=v)、(7)式で定義されている近傍系に含まれるセル(i,j,k)の状態値ωi,j, kがwとなる確率Pi,j,k(ω=w)、及びこれらの間の条件付き確率πi,j,k(μ=v|ω=w)を用いて次式で与えられる:
【0031】
【外4】
Figure 0003890099
【0032】
図8に、l={1,2,3}、m={-1,0,1}、n={-1,0,1}の場合の確率セルオートマトンAの構造を示す。図中、鉛直上向きに階層レベルl、水平右方向に空間座標m、右斜め上方に空間座標nが取られている。図中、セル801のセル空間での座標は(3,1,1)、セル802の座標は(2,1,0)である。また近傍系は実線で示しており、例えばセル(3,0,0)の近傍系X(3,0,0)は
Figure 0003890099
である。
【0033】
以下の説明では、解像度レベルl、2次元空間位置m及びn、更にそれぞれのセルの状態値ωに対するインデクスwの範囲をそれぞれ
Figure 0003890099
とする。
【0034】
(11)式のインデクスを用いれば、階層レベルl、2次元空間位置(m,n)に位置するセルの状態値ωがwを取る確率Pl,m,n(ω=w)は
Pl,m,n(ω=w) = A(l,m,n,w) (12)
【0035】
更に、セル(l,m,n)の状態値の確率分布は、W次元ベクトルA(l,m,n,*)として記述できる。また写像φは次のように定義し直せる:
A(l,m,n,*) = λ( (A(l,m,n,1),A(l,m,n,2),...,A(l,m,n,W))T ),
【0036】
【外5】
Figure 0003890099
ここで、<a|b>はベクトルaとbの内積、ψ(l,m,n,w|i,j,k,*)は次式
Figure 0003890099
で定義されるW次元ベクトルである。ここで、ψ(l,m,n,w|i,j,k,v)は、セル(i,j,k)の状態値がvのときにセル(l,m,n)の状態値がwとなる条件付き確率である。
【0037】
図20に、写像ψ(l,m,n,w|l-1,j,k,v)の例を示す。図中、縦横それぞれ3個のマス目で表現されているのが、セル(l,m,n)に対する近傍系X(l,m,n)である。それぞれのマス目の下に書かれているのが、セル(l,m,n)の状態値wである。それぞれのマス目の中の数字が、近傍系X(l,m,n)に含まれるそれぞれのセルの状態値vを示している。例えば11という数字の上に位置するマス目は、セル(l,m,n)の状態値11に対応する近傍系の状態値の空間的配置であり、左上のセルの状態値が8であることを要求する。
【0038】
ここで、左上のセルの座標を(l-1,1,1)とすれば、(13)式中のψ(l,m,n,w|l-1,1,1,*)は、8番目の要素のみが1でそれ以外が0であるW次元ベクトル:
ψ(l,m,n,w|l-1,1,1,*) = (0,0,0,0,0,0,0,1,0,0,...,0)T (15)
となる。マス目のインデクスを通常の行列の表記に従えば、(13)式は実際に以下のように計算できる:
Figure 0003890099
【0039】
図3に戻り、ステップS302で、入力画像Iにおける注視点座標g=(gx,gy)をgint=(gxint,gyint)に初期化する。
【0040】
ここで、注視点とは、入力画像Iから後述する多重解像度画像Dを抽出する窓の中心点である。注視点は、多重解像度画像と対応付けるため、多重解像度表現で表される。本実施形態で用いる多重解像度画像は、スケールが3のべき乗で変化するようになっているので、注視点の座標も3のべき乗、即ち3進数で記述する:
【0041】
【外6】
Figure 0003890099
【0042】
ここで、 gxj及びgyjの取り得る値は {1,2,3} 或いは {-1,0 1}である。多重解像度画像のスケール変換が2のべき乗に基づいている場合には、注視点の座標は2進数で記述することになる。図25に、(17)式による記述と、入力画像上の座標との関係を示す。
【0043】
次に、ステップS303では、入力画像から注視点座標近傍の多重解像度画像Dを抽出する。この処理は、図5から図7につき後述する。多重解像度画像Dの要素は、解像度レベルを表す添え字lと、注視点座標に対して相対的な空間位置を表す2つの添え字(m,n)を用いてD(l,m,n)と表される。図9の黒く塗られた部分が、l={0,1,2}、m={-1,0,1}、n={-1,0,1}のときの多重解像度画像Dの例である。以下の説明では、確率セルオートマトンの場合と同様、解像度レベルl、2次元空間位置m及びnの範囲をそれぞれ、
l = {0,1, ... , L-1}
m = { -MD, -MD+1, ... , 0 , ... , MD-1 , MD} n = { -ND, -ND+1, ... , 0 , ... , ND-1 , ND} (18)とする。
【0044】
上式及び図9からわかるように、本実施形態で述べている多重解像度画像は、通常の多重解像度画像の部分画像となっている。図中、901が解像度レベル2に属する画像、902が解像度レベル1に属する画像、903が解像度レベル0に属する画像である。またレベルlの9画素から成る画像の占める空間領域と、レベルl+1の画像のうち中心に位置する画素の占める空間領域とは一致する。
【0045】
多重解像度画像の構成方法はいくつかあって、例えば、入力画像に対して各画素の占める空間領域に渡る平均値を画素値とするもの、ウェーブレット変換のように空間スケールの異なる積分核を用いて得られた積分変換係数を画素値とするもの等を利用することができる。図9では、積分核904及び905を用いる。
【0046】
ステップS304では、多重解像度データB及びCを初期化する。ここでB及びCの要素は上記Dと同様、 B(l,m,n)及びC(l,m,n)のように3つの添え字で表され、添え字の範囲はそれぞれ、
l = {1, ... , L-1}
m = { -MB, -MB+1, ... , 0 , ... , MB-1 , MB} n = { -NB, -NB+1, ... , 0 , ... , NB-1 , NB} (19)
である。以下、場合によって、MD及びNDを1、またMB 及びNBを2として説明する。
【0047】
次に、ステップS305で、lを1に設定する。
【0048】
ステップS306では、確率セルオートマトンAのセルのうち、レベルがlに属するセルA(l,〜,〜,〜)(本実施形態では9個)の状態値の確率分布(W次元ベクトル)A(l,〜,〜,*)を更新する。この確率分布A(l,〜,〜,*)の更新処理は図10から図12につき後述する。
【0049】
ステップS307では、確率セルオートマトンAのレベルlのセルとレベルl+1のセルの間の相互情報量を算出しBに格納する。相互情報量算出処理は図14から図16につき後述する。
【0050】
ステップS308では、lをl+1に更新する。ステップS309では、レベルlがLを超えたかどうかを検査し、超えていたらステップS310に進む。そうでなければステップS305に進む。
【0051】
ステップS310では、認識したいセルの状態値ωの確率分布のエントロピεを以下の式により算出する。
【0052】
【外7】
Figure 0003890099
【0053】
ステップS311では、(20)式で計算したεが予め定めた値εCより小さいかどうかを検査し、小さくなければステップS312へ進む。小さければ認識処理を終了し、この時の状態値の確率分布から、認識したいセルの状態値を確率が最大となる状態値に決定する。この状態値から、後述する対応表または量子化コードブックの対応関係を参照して、対応する画像を認識結果として出力する。
【0054】
ステップS312では、多重解像度データBを用いて抽出画像の入力画像における注視点座標を更新する。この処理は図18につき後述する。
【0055】
次に、ステップS303で実行する処理を図5から図7に沿って説明する。
【0056】
まず、ステップS501でlを1に設定する。
【0057】
続いて、ステップS502では、注視点g=(gx,gy)における解像度レベルlの画像
D(l,m,n), −MD≦m≦MD , −ND≦n≦ND
を入力画像から抽出する。この処理は図6及び図7につき後述する。
【0058】
ステップS503ではlをl+1に更新する。ステップS504でlがLを超えたかどうかを検査し、超えていれば処理を終了し、そうでなければステップS502に戻る。
【0059】
以上により、注視点における解像度レベルlから解像度レベルLまでの画像を入力画像から抽出する。
【0060】
次に、ステップS502で実行する、入力画像から注視点における解像度レベルlの画像を抽出する処理を図6及び図7に沿って説明する。
【0061】
ステップS601で、解像度レベルの値から、抽出画像の1画素D(l,m,n)に対する入力画像Iにおける受容野の大きさを算出する。
【0062】
ここで受容野とは、抽出画像の1画素の値を計算するために利用する入力画像の画素の範囲のことであり、本実施形態では縦横3l画素の正方格子を用いている。即ち、レベルl=0のときは縦横1画素、レベルl=1のときには縦横3画素というようになる。以下、受容野の範囲を縦横それぞれ、−ΔxからΔx、−ΔyからΔyと書く。
【0063】
ステップS602でyを−NDに設定する。ステップS603でxを−MDに設定する。
【0064】
ステップS604で、抽出画像のレベルl、2次元格子位置が(x,y)の1画素の値を次式で算出する:
【0065】
【外8】
Figure 0003890099
上式は受容野に渡る重み付き平均値の計算式である。
【0066】
ステップS605でxをx+1に更新する。ステップS606でxがMDを超えたかどうかを検査し、超えていればステップS607へ進み、そうでなければステップS604へ戻る。
【0067】
ステップS607でyをy+1に更新する。ステップS608でyがNDを超えたかどうかを検査し、超えていれば処理を終了し、そうでなければステップS603へ戻る。
【0068】
ステップS306での確率分布の更新処理を、図10から図12のフローチャート、及び図13に沿って説明する。
【0069】
図13で、1301が入力画像I、1302が多重解像度画像D、1303が確率セルオートマトンAである。図は簡単のために1次元的に表現している。
【0070】
多重解像度画像Dは解像度レベルが下から0、1、2、それぞれの解像度レベルに縦横3画素、合計9画素よりなる画像がある。
【0071】
確率セルオートマトンAの階層レベルは、1、2、3の3階層であり、それぞれの階層レベルに縦横3個、合計9個のセルが存在する。多重解像度画像Dは、注視点を中心として入力画像から抽出される。解像度レベル0の9個の画素値は入力画像と一致する。解像度レベル1に属する9個の画素値は、入力画像の縦横3個、合計9個の画素を適当な積分核1304、例えば図9の905を施して、積分変換することによって得られる。同様に、解像度レベル2に属する9個の画素値は、入力画像の縦横9個、合計81個の画素を適当な積分核1305、例えば図9の904を施して、積分変換することによって得られる。
【0072】
次に、確率分布の更新処理手順を説明する。
【0073】
まず、ステップS1001で、階層レベルlが0かどうかを検査し、そうであればステップS1002に、そうでなければステップS1005へ進む。
【0074】
ステップS1002では、解像度レベル0の画像D(0,*,*)1302と第1の対応関係1308を用いて、次式によりαを算出する:
α = λ(( α1, α2, ... , αW )T) (22)
【0075】
第1の対応関係1308がベクトル量子化のコードブックのときには、入力画像D(0,*,*)と、コードブックに格納されている代表ベクトルとの内積を計算し、符号語jに対する内積の値をαjとする。
【0076】
ステップS1003では、αの要素に最大値が存在するかどうかを検査し、存在すればステップS1004へ、存在しなければステップS1006へ進む。
【0077】
ステップS1004では、αの要素のうち最大値を取る要素をkmaxとすると、次式で確率セルオートマトンの状態値の確率分布を更新する:
A(l,gxl,gyl,kmax) = 1, (23)
A(l,gxl,gyl,k) = 0, k ≠ kmax (24)
【0078】
ステップS1005で、後述する確率分布ベクトルβの値を階層レベルlの注視点に対応するセルの状態値の確率分布として代入する:
A(l,gxl,gyl,*) = β (25)
【0079】
ステップS1006でmを−MDに設定する。ステップS1007でnを−NDに設定する。
【0080】
ステップS1008では、次式により、多重解像度画像D(l,gxl+m,gyl+n)の値に対する条件付き確率分布ベクトルdPを算出する:
dP = (dP1, dP2, .. , dPW)T (26)
D(l, gxl+m,gyl+n)が離散値 {1,2,...,N} を取るとき、上式は変換行列Fを用いて次のように書き直せる:
【0081】
【外9】
Figure 0003890099
ただし、Pr(D(l, gxl+m,gyl+n)=N)は、D(l, gxl+m,gyl+n)がNである確率である。従って、 D(l, gxl+m,gyl+n)が2のときには、dPは(f(1,2),f(2,2),...,f(W,2))Tとなる。
【0082】
ステップS1009で、上記dPを用いてセルの確率分布ベクトルを以下のように修正する:
ANEW(l, gxl+m,gyl+n,*) = λ((ANEW(1), ANEW(2),..., ANEW(W))T),
ANEW(j) = AOLD(l,gxl+m,gyl+n,j) dPj, ∀j∈ { 1,2,...,W} (27)
【0083】
ステップS1010でnをn+1に更新する。ステップS1011でnがNDを超えているかどうかを検査し、超えていればステップS1012へ、そうでなければステップS1008へ進む。
【0084】
ステップS1012ではmをm+1に更新する。ステップS1013でmがMDを超えているかどうかを検査し、超えていれば処理を終了し、そうでなければステップS1007へ戻る。
【0085】
次に、図4のステップS307で実行される相互情報量の算出処理を、図14から図16のフローチャートを参照しながら説明する。また、図17に、この処理における各データ間の関係を図示する。
【0086】
まず、ステップS1401で、確率分布ベクトルβを零ベクトルに初期化する。この確率分布ベクトルβは、例えば図17の中で、確率セルオートマトンの階層レベル1のセル1705に対して、階層レベル2のセル1707の状態値の確率分布を表している。
【0087】
更に、ステップS1402でmを−dMに初期化する。ここでdM = MB−MDである。そして、ステップS1403でnを−dNに初期化する。ここでdN = NB−NDである。
【0088】
これらm及びnは、図17中のセル1707を構成する階層レベル1のセルの集合として、1704、1705、及び1706のように、現在の注視点を中心にして、縦横それぞれに沿って1セル分ずつの平行移動を考慮するために設けられた操作である。
【0089】
ステップS1404では、セル空間で以下の位置にあるセル、即ち図17において1704、1705、或いは1706で示されているセル、即ち以下の近傍
Figure 0003890099
に属するセルの確率分布ベクトルA(l,j,k,*)を用いて、次式で算出されるγ(v|w)を要素とするW次元ベクトルγ=λ(γ(1|w),γ(2|w),...,γ(W|w))T) を計算する:
【0090】
【外10】
Figure 0003890099
ただし、wはセル(l,j,k)の状態値の一つであり、右辺の乗積は近傍系X(l+1,gxl+m,gyl+n)に属するセルのうち、(l,j,k)以外のセルに渡って計算される。
【0091】
ステップS1405では、セル(l+1, gxl+m,gyl+n)と、その近傍系X(l+1,gxl+m,gyl+n)に属するセル(l,j,k)との間の相互情報量σ(l,j,k)を次式で算出する:
【0092】
【外11】
Figure 0003890099
【0093】
ステップS1406では、上記相互情報量を用いてBを更新する:
B(l,j,k) = B(l,j,k) +σ(l,j,k) (31)
【0094】
ステップS1407では、(30)式で計算した相互情報量σ(l,j,k) , (l,j,k)∈X(l+1,gxl+m,gyl+n)のうち、零でないものが存在するかどうかを検査し、存在すればステップS1408へ、そうでなければステップS1410へ進む。
【0095】
ステップS1408では、βをγで更新する:
β = β + γ (32)
【0096】
ステップS1409で、Cの値を更新する:
C(l,j,k) = C(l,j,k) + 1, (l,j,k) ∈ X(l+1,m,n) (33)
ステップS1410では、nをn+1に更新する。ステップS1411では、nがdNを超えたかどうかを検査し、超えていればステップS1412へ進み、超えていなければステップS1404へ戻る。
【0097】
ステップS1412では、mをm+1に更新する。ステップS1413では、mがdMを超えたかどうかを検査し、超えていればステップS1414へ進み、超えていなければステップS1403へ戻る。
【0098】
ステップS1414では、多重解像度データCを用いて多重解像度データBを更新する:
Figure 0003890099
【0099】
ステップS1415では、関数λを用いて確率分布ベクトルβを正規化する。
【0100】
次に、ステップS311で実行される注視点座標の更新処理を、図18に沿って説明する。
【0101】
まず、ステップS1801では、lを1に設定する。
【0102】
ステップS1802では、注視点移動量を計算する。この処理を、図19のフローチャートに沿って説明する。
【0103】
ステップS1901では、lがLを超えるかどうかを検査し、超えていれば処理を終了し、そうでなければステップS1902へ進む。
【0104】
ステップS1902では、B(l,〜,〜)のなかに最大値を取る零でない要素が存在するかどうかを検査し、存在すればステップS1903へ、そうでなければステップS1907へ進む。
【0105】
ステップS1903では、最大値に対応するインデクスをもとにして注視点位置を変更する。最大値を取る要素の、2次元空間に対応する2つのインデクスをmmax及びnmaxとすると、(17)式によって3進数で記述されている注視点位置のうち、レベルlに対応する要素のみが次式で変更される:
gxl = gxl + mmax, gyl = gyl + nmax, (35)
【0106】
ステップS1904では、lが1かどうかを検査し、1でなければステップS1905へ進み、1であれば処理を終了する。
【0107】
ステップS1905では、mmax及びnmaxをもとに、階層レベルl-1に属する確率セルオートマトンのセルのセル空間における位置を平行移動させる。即ち、
A(l, m, n, *) = A(l, m-mmax, n-nmax, *) (36)
【0108】
ステップS1906では、(gxl-1 ,gyl-1)を(0,0)にリセットする。
【0109】
ステップS1907は、ステップS1902においてB(l,〜,〜)の中に最大値を取る零でない要素が存在しなかった場合に実行され、lをl+1に更新する。
【0110】
ステップS1908では、図18のステップS1802の注視点移動量の計算を実行する。このように図19で説明されている処理は再帰的である。
【0111】
上記認識処理のソフトウェアによる実現例を図28から図41に示す。これらはMATLABという高級言語で書かれている。
【0112】
図41は、このソフトウェアを実行するためのハードウェア構成の一例を示す図である。
【0113】
同図において、4101は、入力部であり、認識対象となる画像信号を外部から受信するためのインターフェースや、ユーザが命令等を入力するためのキーボードやマウスを備えている。4102は、装置各部を制御し、プログラムの処理を実行するCPUである。4103は、出力部であり、認識結果を表示あるいは印刷したり、外部装置に対して、認識結果や制御信号を送信する。
【0114】
4104は、ROMであり、固定データやプログラムを記憶する。4105は、RAMであり、多重解像度画像や確率オートマトンのセルの状態値の確率分布、量子化コードブックなど、認識処理に必要なデータを記憶するためのワークエリアを有し、補助記憶装置4106からロードされるプログラムを記憶するためのプログラムエリアを有する。4106は、補助記憶装置であり、フロッピーディスクやハードディスクなどの記憶媒体を用いてプログラムやデータを記憶する。
【0115】
図28から図36はsaccade6(・)という名称の主プログラムであり、与えられた2次元デジタル画像を認識する機能を持つ。確率オートマトンの構造そのものは予め与えられている。セル空間の構造は図8、多重解像度部分画像は図9に示すとおりである。
【0116】
図20はコードブック及びセル間の状態値の対応表を示している。
【0117】
同図において、縦横3個のマスで書かれているのが代表ベクトル、或いはセルの状態値の空間的配置、その下に書かれている番号が、それぞれ代表ベクトルに対応する符号語、或いは対応するセルの状態値である。
【0118】
図13の1310で示されるコードブックが、図20の2から9までの番号を割り当てられている縦横3画素のパターンに対応する。また図17の1707で示されているセル間の写像は、図20の10から15の番号が割り当てられているパターンに対応する。
【0119】
図21は、図20で番号10から13が割り当てられている状態ベクトルを2次元画像として表現したものである。また図22は同様に14と15が割り当てられている状態ベクトルを2次元画像として表現したものである。
【0120】
図37から図38にはsaccade6(・)で呼び出されているサブルーチン、mutinf(・)である。mutinf(・)は相互情報量を計算するプログラムである。
【0121】
図39に示されているextract2(・)と図40に示されているsubsampl(・)は、入力画像から多重解像度部分画像を抽出するサブルーチンである。
【0122】
図22の状態ベクトル15を入力画像とし、画像の左上の画素の座標を(1,1)として縦の座標系を下方向に、横の座標系を右方向に取って、注視点を(2,2)で初期化してsaccade6(・)を実行すると、図23に示すように、注視点の位置は(2,2)から(20,20)へ移動して停止する。
【0123】
これら注視点に対して、状態値14及び15に対する確率Pr(14)及びPr(15)は、注視点(2,2)のときにはPr(14)=0.5,、Pr(15)=0.5であり、注視点が(20,20)に移動すると、Pr(14)=0.0058、Pr(15)=0.9942となる。このように、一度の注視点移動で認識が完了したことになる。
【0124】
本実施形態による注視点移動方式のかわりに画像の特徴量のみに基づく方式を用いたとすれば、少なくとも10回の注視点移動が必要となる。
【0125】
図2のステップS205で実行される学習処理について、図24、図25及び図26に沿って説明する。図24に示すように、学習処理はステップS2401の符号化処理とステップS2402の対応付け処理の2段階より構成される。
【0126】
図25は符号化処理の流れ図である。
【0127】
まず、ステップS2501では入力画像Iを多重解像度画像に変換する。ただし入力画像Iの縦横の画素数は、3の(L+1)乗であるとする。
【0128】
ステップS2502では、lを0に設定する。
【0129】
ステップS2503では、多重解像度画像のうちの解像度レベルlの画像を部分画像に分割する。本実施例では、縦横3画素で互いに重なり合わない部分画像に分割する。
【0130】
以下、部分画像を、行列の表記に従い、2次元のインデクス(m,n)で表現する。
【0131】
ステップS2504では、nを1に設定する。ステップS2505では、mを1に設定する。
【0132】
ステップS2506では、部分画像(m,n)がベクトル量子化のコードブックに代表ベクトルとして登録されているかどうかを検査し、登録されていればステップS2508へ、未登録ならばステップS2507へ進む。
【0133】
ステップS2507では、上記部分画像に適当な符号語を割り当ててコードブックに登録する。
【0134】
ステップS2508では、それぞれの部分画像を、対応する符号語で置き換える。この置き換え操作によって部分画像の画素数は、縦横それぞれ1/3に縮小する。
【0135】
ステップS2509では、mをm+1に更新する。ステップS2510では、mが3を超えているかどうかを検査し、超えていればステップS2711へ、そうでなければステップS2506へ進む。
【0136】
ステップS2511では、nをn+1に更新する。ステップS2512では、nが3を超えているかどうかを検査し、超えていればステップS2513へ、そうでなければステップS2505へ進む。
【0137】
ステップS2513では、lをl+1に更新する。ステップS2514では、lがLを超えていないかを検査し、超えていれば終了し、そうでなければステップS2503へ戻る。
【0138】
以上の処理によって、多重解像度画像は、各解像度レベルでの画素数が縦横それぞれ1/3に縮小された多重解像度符号語データに変換される。
【0139】
また、コードブックに登録されていない代表ベクトルを登録することによって、新しいデータに対応することができる。
【0140】
上記処理で得られるコードブックは、前述した本実施形態の認識処理において利用される。
【0141】
図26は、上記多重解像度符号語データを用いて、レベル間の対応関係の抽出と登録を行う処理のフローチャートである。
【0142】
以下、多重解像度符号語データを解像度レベルl、2次元離散座標(m,n)の3つのインデクスを用いて、Y(l,m,n)で表現する。
【0143】
ステップS2601では、lを1に設定する。ステップS2602では、nを1に設定する。ステップS2603では、mを1に設定する。
【0144】
ステップS2604では、符号語Y(l,m,n)と、以下の符号語の組:
{Y(l-1,3m-1,3n-1), Y(l-1,3m-1,3n), Y(l-1,3m-1,3n+1)
Y(l-1,3m,3n-1), Y(l-1,3m,3n), Y(l-1,3m,3n+1) Y(l-1,3m+1,3n-1), Y(l-1,3m+1,3n), Y(l-1,3m+1,3n+1)}との対応関係を抽出する。
【0145】
ステップS2605では、上記対応関係が、コードブック或いは対応表に登録されているかどうかを検査し、登録されていればステップS2607へ、そうでなければステップS2606へ進む。
【0146】
ステップS2606では、対応表に、上記対応関係を登録する。
【0147】
ステップS2607では、mをm+1に更新する。ステップS2608では、mが3を超えているかどうかを検査し、超えていればステップS2609へ、そうでなければステップS2604へ進む。
【0148】
ステップS2609では、nをn+1に更新する。ステップS2610では、nが3を超えているかどうかを検査し、超えていればステップS2611へ、そうでなければステップS2603へ進む。
【0149】
ステップS2611では、lをl+1に更新する。ステップS2612では、lがLを超えていないかを検査し、超えていれば終了し、そうでなければステップS2602へ戻る。
【0150】
上記処理によって得られる対応表は、前述した本実施形態の認識処理において利用される。
【0151】
(実施形態2)
図27に実施形態2の構成図を示す。
【0152】
実施形態2は、監視システム、ロボットの画像入力システム等への本発明の応用例であり、図中、2701は信号処理装置、2702は記憶装置、2703は出力装置、2704は光学系、2705は2次元アレイセンサ、2706は第1の筐体、2707は第2の筐体、2708は移動装置である。
【0153】
信号処理装置2701は、光学系2704を経て、2次元アレイセンサ2705でサンプリングされた入力信号を受信し、記憶装置2702に格納されたデータを用いて入力信号を処理し、所望の出力を出力装置2703へ送信し、光学系2704の入力パラメタ(光軸の方位や位置など)を制御するための信号を移動装置2708に送信する。
【0154】
実施形態2で想定している応用例では、入力すべき画像が入力システムのどの方向に存在するかは、予め与えられていない。従って、システムが遂行すべきタスクに必要な情報が存在する方位を推定し、その方向に入力装置の光軸を一致させ、その情報を取得するために必要な解像度で撮像するように、入力パラメタを制御することが要求される。
【0155】
また、撮像系に対しては、高解像度で信号を取得し、更に広範囲な領域をも見渡せることが要求される。限られたセンサ数で、この相反する仕様を満足するために、撮像系の空間解像度は非一様とする。実施形態1で説明した多重解像度部分画像Dは、このような非一様サンプリングによって得られる入力画像の1例である。
【0156】
実施形態2は、このような入力装置を想定するものである。
【0157】
<光学系2704>
光学系2704は、外部から入射してくる光線を屈折させて、後述の2次元アレイセンサ2705上に結像させるためのものである。高解像度と広範囲を両立させるレンズとして、例えば魚眼レンズがある。魚眼レンズは、その写像関数によって4種類に分類される。
【0158】
<2次元アレイセンサ2705>
2次元アレイセンサ2705は、前記光学系2704によって結像した画像を2次元デジタル画像としてサンプリングする。ここで、2次元デジタル画像とは、2次元空間座標を離散化し、更にそれぞれのサンプリング点での画素値を量子化したものをいう。
【0159】
光学系2704として魚眼レンズを採用し、その像を2次元アレイセンサでサンプリングして得られたデジタル画像は、擬似的に多重解像度部分画像になる。そこで、以下の説明では、このデジタル画像を実施形態1での記述と同様にDと書く。Dは解像度レベルl、2次元離散空間座標(m,n)の3つのインデクスで画素位置を表す。例えば解像度レベルl、2次元離散空間座標(m,n)に位置する画素値はD(l,m,n)と書く。
【0160】
<第1の筐体2706>
第1の筐体2706は前記光学系2704と前記2次元アレイセンサ2705とを固定する。
【0161】
<第2の筐体2707>
第2の筐体2707は、後述の移動装置2708を介して、第1の筐体2706を支持するものである。
【0162】
<移動装置2708>
移動装置2708は、第1の筐体2706を、第2の筐体2707に対して2次元的に相対移動させるものである。2次元移動量は、後述の信号処理装置2701からの制御信号で制御される。
【0163】
<記憶装置2702>
記憶装置2702は、後述する信号処理装置2701の処理に利用される信号を記憶しておく装置であり、信号処理装置2701によって信号が書き込まれ、或いは読み出される。
【0164】
<出力装置2703>
出力装置2703は、後述する信号処理装置2701からの出力を表示或いは印刷するものである。
【0165】
<原稿置き台2709>
原稿置き台2709は、後述する信号処理装置2701で認識する画像或いはパターンが描かれている原稿2710を支持するための台である。原稿に描かれている画像或いはパターンが、原稿置き台2709を通して光学系に入力される配置になっているときには、原稿置き台2709は透明でなければならない。
【0166】
<原稿2710>
後述する信号処理装置2701で認識される対象となる画像或いはパターンが描かれている原稿である。
【0167】
<信号処理装置2701>
信号処理装置2701は、2次元アレイセンサ2705から送信されてきたデジタル画像を認識する装置であり、認識処理を実行するために記憶装置2702に格納された信号を読み出し、或いは信号を書き込み、また移動装置2708に2次元移動量を制御するための制御信号を送信する。また認識結果や、何らかのエラーが発生した場合のメッセージを出力装置2703に出力する。
【0168】
信号処理装置2701の処理は、実施形態1で説明した全ての処理を含み、実施形態1の説明文中の注視点位置が、実施形態2における光学系の光軸に相当する。また、実施形態1の説明文中の入力画像Iは、実施形態2における原稿2710に相当する。
【0169】
【発明の効果】
以上説明したように、本発明によれば、非一様サンプリングによりサンプリングした信号を用いてパターン認識を行なう際に、パターンをより正確に認識するために、サンプリング位置を高速に修正することができる。
【0170】
また、本発明によれば、認識対象パターンの存在する方位が不明な場合でも、パターンを高速に捕捉することができるので、移動物体に設置するために好適なパターン認識装置を容易に構成することができる。
【0171】
また、本発明によれば、従来の装置に比べて、比較にならないほど少ないセンサ数で構成されたアレイセンサで、パターン認識処理が達成できる。例えば、実施形態1で説明した例では、従来方式で32L個のセンサが必要なのに対して、実施形態1では、(3L)2個のセンサで十分である。
【図面の簡単な説明】
【図1】実施形態1のパターン認識装置のブロック構成図である。
【図2】信号処理装置の処理のフローチャートである。
【図3】認識処理のフローチャートである。
【図4】認識処理のフローチャートである。
【図5】多重解像度部分画像の抽出処理のフローチャートである。
【図6】解像度レベルlの画像の抽出処理のフローチャートである。
【図7】解像度レベルlの画像の抽出処理のフローチャートである。
【図8】確率セルオートマトンのセル空間の説明図である。
【図9】多重解像度部分画像の説明図である。
【図10】確率分布の更新処理のフローチャートである。
【図11】確率分布の更新処理のフローチャートである。
【図12】確率分布の更新処理のフローチャートである。
【図13】確率分布の更新処理の説明図である。
【図14】相互情報量の算出処理のフローチャートである。
【図15】相互情報量の算出処理のフローチャートである。
【図16】相互情報量の算出処理のフローチャートである。
【図17】相互情報量の算出処理におけるデータ間の関係を示す図である。
【図18】注視点座標の更新処理のフローチャートである。
【図19】注視点移動の計算処理のフローチャートである。
【図20】符号化処理のコードブック及びセルの状態間の写像関係の例を示す図である。
【図21】代表ベクトルに対する2次元画像である。
【図22】代表ベクトルに対する2次元画像である。
【図23】注視点移動を示した図である。
【図24】コードブックやセル間写像の学習のフローチャートである。
【図25】符号化処理のフローチャートである。
【図26】対応づけ処理のフローチャートである。
【図27】実施形態2のブロック構成図である。
【図28】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図29】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図30】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図31】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図32】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図33】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図34】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図35】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図36】2次元デジタル画像認識処理ソフトウェアの主プログラムを表わす図である。
【図37】相互情報量を計算するプログラムを表わす図である。
【図38】相互情報量を計算するプログラムを表わす図である。
【図39】多重解像度部分画像を抽出するプログラムを表わす図である。
【図40】多重解像度部分画像を抽出するプログラムを表わす図である。
【図41】ハードウエア構成の例を示す図である。
【符号の説明】
101 入出力装置
102、2701 信号処理装置
103、2702 記憶装置
2703 出力装置
2704 光学系
2705 2次元アレイセンサ
2706 第1の筐体
2707 第2の筐体
2708 移動装置
2709 原稿置き台
2710 原稿
4101 入力部
4102 CPU
4103 出力部
4104 ROM
4105 RAM
4106 補助記憶装置

Claims (17)

  1. 認識対象のパターンを表わす2次元画像信号を入力する入力手段と、
    該入力手段より入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング手段と、
    該サンプリング手段のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出手段と、
    該確率分布算出手段により算出された確率分布に基づいて、前記2次元画像信号の表わすパターンを認識する認識手段と、
    前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出手段と、
    前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更手段とを有することを特徴とするパターン認識装置。
  2. 前記サンプリング手段は、前記多重解像度画像の各解像度の各画素の値を、各解像度に対応した大きさの範囲の入力画像を用いて算出することを特徴とする請求項1に記載のパターン認識装置。
  3. 前記サンプリング手段において、前記範囲の大きさを高解像度ほど大きな範囲とすることを特徴とする請求項2に記載のパターン認識装置。
  4. 前記確率分布算出手段は、前記確率セルオートマトンにおける注目するセルの状態値の確率分布を、該注目するセルより低解像度の近傍のセルの状態値の確率分布に基づいて算出することを特徴とする請求項1に記載のパターン認識装置。
  5. 複数のセルの状態値の空間的配置に符号語を対応づけたコードブックを記憶するコードブック記憶手段を具え、当該コードブックを参照して前記認識手段がパターンを認識することを特徴とする請求項1に記載のパターン認識装置。
  6. 前記コードブック記憶手段に対して、複数のセルの状態値の空間的配置に符号語を割り当てて登録する学習手段を備えることを特徴とする請求項5に記載のパターン認識装置。
  7. 注目するセルの状態値の確率分布のエントロピーを算出するエントロピー算出手段を備え、
    該エントロピー算出手段により算出されたエントロピーが所定の条件を満たした場合に前記認識手段による処理を実行することを特徴とする請求項1に記載のパターン認識装置。
  8. 前記入力手段が画像信号を光学的に入力する光学的入力手段を備え、前記変更手段が当該光学的入力手段の光軸を移動させる移動手段を備えることを特徴とする請求項1に記載のパターン認識装置。
  9. 認識対象のパターンを表わす2次元画像信号を入力する入力工程と、
    該入力工程により入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング工程と、
    該サンプリング工程のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出工程と、
    該確率分布算出工程により算出された確率分布に基づいて、前記第1の信号の表わすパターンを認識する認識工程と、
    前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出工程と、
    前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更工程とを有することを特徴とするパターン認識方法。
  10. 前記サンプリング工程は、前記多重解像度画像の各解像度の各画素の値を、各解像度に対応した大きさの範囲の入力画像を用いて算出することを特徴とする請求項9に記載のパターン認識方法。
  11. 前記サンプリング工程において、前記範囲の大きさを高解像度ほど大きな範囲とすることを特徴とする請求項9に記載のパターン認識方法。
  12. 前記確率分布算出工程では、前記確率セルオートマトンにおける注目するセルの状態値の確率分布を、該注目するセルより低解像度の近傍のセルの状態値の確率分布に基づいて算出することを特徴とする請求項9に記載のパターン認識方法。
  13. 前記認識工程では、複数のセルの状態値の空間的配置に符号語を対応づけたコードブックメモリを参照して、パターンを認識することを特徴とする請求項9に記載のパターン認識方法。
  14. 前記コードブックメモリに対して、複数のセルの状態値の空間的配置に符号語を割り当てて登録する学習工程を備えることを特徴とする請求項13に記載のパターン認識方法。
  15. 注目するセルの状態値の確率分布のエントロピーを算出するエントロピー算出工程を備え、
    該エントロピー算出工程により算出されたエントロピーが所定の条件を満たした場合に前記同定工程の処理を実行することを特徴とする請求項9に記載のパターン認識方法。
  16. 前記入力工程では、光学的入力部を用いて画像信号を光学的に入力し、前記変更工程が当該光学的入力部の光軸を移動させる移動工程を備えることを特徴とする請求項9に記載のパターン認識方法
  17. コンピュータに、
    認識対象のパターンを表わす2次元画像信号を入力する入力手順と、
    該入力工程により入力された2次元画像信号を非一様にサンプリングして、ある注視点近傍の多重解像度画像を抽出するサンプリング手順と、
    該サンプリング工程のサンプリングによって得られた多重解像度画像に対応する確率セルオートマトンにおいて、各セルの状態値の確率分布を算出する確率分布算出手順と、
    該確率分布算出手順により算出された確率分布に基づいて、前記第1の信号の表わすパターンを認識する認識手順と、
    前記多重解像度画像に対応する確率セルオートマトンにおいて、注目する解像度レベルのセルの状態値の確率分布と該注目する解像度レベルより上位レベルのセルの状態値の確率分布との相互情報量を算出する相互情報量算出手順と、
    前記相互情報量の最大値を与えるセルの位置に基づいて前記注視点の位置を変更する変更手順とを実行させるためのパターン認識プログラムを記録したコンピュータ読み取り可能な記憶媒体。
JP25874396A 1996-09-30 1996-09-30 パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体 Expired - Fee Related JP3890099B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP25874396A JP3890099B2 (ja) 1996-09-30 1996-09-30 パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体
US08/938,789 US6198847B1 (en) 1996-09-30 1997-09-26 Apparatus and method for recognizing a nonuniformly sampled pattern
DE69720630T DE69720630T2 (de) 1996-09-30 1997-09-29 Gerät und Verfahren zur Erkennung eines ungleichmässig abgetasten Musters
CA002216883A CA2216883C (en) 1996-09-30 1997-09-29 Apparatus and method for recognizing a nonuniformly sampled pattern
EP97307628A EP0833275B1 (en) 1996-09-30 1997-09-29 Apparatus and method for recognizing a nonuniformly sampled pattern

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25874396A JP3890099B2 (ja) 1996-09-30 1996-09-30 パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体

Publications (2)

Publication Number Publication Date
JPH10105208A JPH10105208A (ja) 1998-04-24
JP3890099B2 true JP3890099B2 (ja) 2007-03-07

Family

ID=17324474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25874396A Expired - Fee Related JP3890099B2 (ja) 1996-09-30 1996-09-30 パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体

Country Status (5)

Country Link
US (1) US6198847B1 (ja)
EP (1) EP0833275B1 (ja)
JP (1) JP3890099B2 (ja)
CA (1) CA2216883C (ja)
DE (1) DE69720630T2 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6750848B1 (en) * 1998-11-09 2004-06-15 Timothy R. Pryor More useful man machine interfaces and applications
US9006175B2 (en) 1999-06-29 2015-04-14 Mannkind Corporation Potentiation of glucose elimination
US20030067476A1 (en) * 2001-10-04 2003-04-10 Eastman Kodak Company Method and system for displaying an image
EP1494732B1 (en) * 2002-03-20 2008-01-30 MannKind Corporation Inhalation apparatus
JP4612280B2 (ja) 2003-02-25 2011-01-12 本田技研工業株式会社 自動作業装置及び自動作業装置制御プログラム
CN1930587B (zh) * 2004-03-15 2011-05-25 皇家飞利浦电子股份有限公司 图像可视化
DK1786784T3 (da) 2004-08-20 2011-02-14 Mannkind Corp Katalyse af diketopiperazinsyntese
PL2322180T3 (pl) 2004-08-23 2015-10-30 Mannkind Corp Sole diketopiperazyny do dostarczania leków
CN104324366B (zh) 2005-09-14 2016-10-05 曼金德公司 以提高活性试剂对结晶微粒表面的亲和力为基础的药物配制方法
MX360812B (es) 2006-02-22 2018-11-16 Mannkind Corp Un método para mejorar las propiedades farmacéuticas de micropartículas que contienen dicetopiperazina y un agente activo.
US7873220B2 (en) * 2007-01-03 2011-01-18 Collins Dennis G Algorithm to measure symmetry and positional entropy of a data set
JP4516592B2 (ja) * 2007-12-06 2010-08-04 本田技研工業株式会社 移動型ロボット
DE202009018480U1 (de) 2008-06-13 2012-01-26 Mannkind Corp. Trockenpulverinhalator und System zur Medikamentenabgabe
US8485180B2 (en) 2008-06-13 2013-07-16 Mannkind Corporation Dry powder drug delivery system
MX2010014240A (es) 2008-06-20 2011-03-25 Mankind Corp Un metodo y aparato interactivo para perfilar en tiempo real esfuerzos de inhalacion.
TWI532497B (zh) 2008-08-11 2016-05-11 曼凱公司 超快起作用胰島素之用途
US8314106B2 (en) 2008-12-29 2012-11-20 Mannkind Corporation Substituted diketopiperazine analogs for use as drug delivery agents
US8538707B2 (en) 2009-03-11 2013-09-17 Mannkind Corporation Apparatus, system and method for measuring resistance of an inhaler
KR101875969B1 (ko) 2009-06-12 2018-07-06 맨카인드 코포레이션 한정된 비표면적을 갖는 디케토피페라진 마이크로입자
CA2778698A1 (en) 2009-11-03 2011-05-12 Mannkind Corporation An apparatus and method for simulating inhalation efforts
RU2571331C1 (ru) 2010-06-21 2015-12-20 Маннкайнд Корпорейшн Системы и способы доставки сухих порошковых лекарств
BR122020008875B8 (pt) 2011-04-01 2022-12-06 Mannkind Corp Embalagem de bolha e método de fabricação de uma embalagem de bolhas
WO2012174472A1 (en) 2011-06-17 2012-12-20 Mannkind Corporation High capacity diketopiperazine microparticles
CA2852536A1 (en) 2011-10-24 2013-05-02 Mannkind Corporation Methods and compositions for treating pain
KR102264177B1 (ko) 2012-07-12 2021-06-11 맨카인드 코포레이션 건조 분말 약물 전달 시스템 및 방법
US10159644B2 (en) 2012-10-26 2018-12-25 Mannkind Corporation Inhalable vaccine compositions and methods
BR112015023168B1 (pt) 2013-03-15 2021-08-10 Mannkind Corporation Composição de 3,6-bis(n-fumaril-4-aminobutil)-2,5-dicetopiperazina cristalina, método de produção de partículas de 3,6-bis(n-fumaril-4-aminobutil)-2,5-dicetopiperazina e uso de uma composição de dicetopiperazina cristalina
CN114848614A (zh) 2013-07-18 2022-08-05 曼金德公司 热稳定性干粉药物组合物和方法
EP3030294B1 (en) 2013-08-05 2020-10-07 MannKind Corporation Insufflation apparatus
US10307464B2 (en) 2014-03-28 2019-06-04 Mannkind Corporation Use of ultrarapid acting insulin
US10561806B2 (en) 2014-10-02 2020-02-18 Mannkind Corporation Mouthpiece cover for an inhaler
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
US11055590B2 (en) * 2019-09-17 2021-07-06 International Business Machines Corporation Multiresolution optical code
CN114675380A (zh) * 2021-12-23 2022-06-28 国网江西省电力有限公司信息通信分公司 一种能信共传光纤的激光供能方法及其系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835641A (en) * 1992-10-14 1998-11-10 Mitsubishi Denki Kabushiki Kaisha Image pick-up apparatus for detecting and enlarging registered objects
US5555102A (en) * 1995-01-30 1996-09-10 Apple Computer, Inc. System and method for generating images with improved visual quality using local correlation, ordered dither
US5649021A (en) * 1995-06-07 1997-07-15 David Sarnoff Research Center, Inc. Method and system for object detection for instrument control

Also Published As

Publication number Publication date
DE69720630D1 (de) 2003-05-15
JPH10105208A (ja) 1998-04-24
EP0833275B1 (en) 2003-04-09
DE69720630T2 (de) 2003-11-27
EP0833275A2 (en) 1998-04-01
US6198847B1 (en) 2001-03-06
CA2216883C (en) 2001-11-27
EP0833275A3 (en) 1998-04-08
CA2216883A1 (en) 1998-03-30

Similar Documents

Publication Publication Date Title
JP3890099B2 (ja) パターン認識装置及びその方法、及びそのプログラムを記憶した記憶媒体
EP3340106B1 (en) Method and system for assigning particular classes of interest within measurement data
CN108009559B (zh) 一种基于空谱联合信息的高光谱数据分类方法
US8780195B1 (en) Fusion of multi-sensor information with operator-learned behavior for automatic and efficient recognition of objects and control of remote vehicles
Yu et al. Vehicle detection from high-resolution remote sensing imagery using convolutional capsule networks
CN113435253B (zh) 一种多源影像联合城区地表覆盖分类方法
CN113838064B (zh) 一种基于分支gan使用多时相遥感数据的云去除方法
CN111833353B (zh) 一种基于图像分割的高光谱目标检测方法
JPH05290221A (ja) オンライン手書文字認識装置
CN113705331A (zh) 一种基于四元特征金字塔网络的sar船只检测方法
CN113139979A (zh) 一种基于深度学习的边缘识别方法
US6151414A (en) Method for signal encoding and feature extraction
CN111242228A (zh) 高光谱图像分类方法、装置、设备及存储介质
CN111291712B (zh) 基于插值的cn和胶囊网络的森林火灾识别方法及装置
CN116561536B (zh) 一种滑坡隐患的识别方法、终端设备及介质
CN116663388A (zh) 粮堆温度预测方法、装置、设备及存储介质
CN114445716B (zh) 关键点检测方法、装置、计算机设备、介质及程序产品
CN115856874A (zh) 毫米波雷达点云降噪方法、装置、设备及存储介质
CN115984886A (zh) 表格信息抽取方法、装置、设备及存储介质
CN108629733B (zh) 获取高分辨率图像的方法与装置
Hui et al. Robust deflated canonical correlation analysis via feature factoring for multi-view image classification
CN114862952A (zh) 无人机检测与防御方法及系统
CN114140664A (zh) 图像处理模型的训练方法、图像相似度确定方法和装置
JP7077998B2 (ja) 情報処理装置
CN112883898A (zh) 一种基于sar影像的地物分类方法及装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061204

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121208

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131208

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees