JP5231839B2 - パターン認識装置及びその方法 - Google Patents

パターン認識装置及びその方法 Download PDF

Info

Publication number
JP5231839B2
JP5231839B2 JP2008060990A JP2008060990A JP5231839B2 JP 5231839 B2 JP5231839 B2 JP 5231839B2 JP 2008060990 A JP2008060990 A JP 2008060990A JP 2008060990 A JP2008060990 A JP 2008060990A JP 5231839 B2 JP5231839 B2 JP 5231839B2
Authority
JP
Japan
Prior art keywords
quantization
feature vector
dictionary
input
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008060990A
Other languages
English (en)
Other versions
JP2009217583A (ja
Inventor
智一 河原
修 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008060990A priority Critical patent/JP5231839B2/ja
Priority to US12/401,300 priority patent/US8077979B2/en
Publication of JP2009217583A publication Critical patent/JP2009217583A/ja
Application granted granted Critical
Publication of JP5231839B2 publication Critical patent/JP5231839B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、認識性能の低下を抑えながら、特徴量のメモリを削減するパターン認識装置及びその方法に関する。
パターン認識において、認識性能の低下を抑えながら、特徴量ベクトルのメモリを削減する方法として、主成分分析(Principal Component Analysis、非特許文献1参照)がある。
この削減方法を特徴ベクトルの分布に対して適用すると、射影による特徴ベクトル近似の2乗誤差の総和が最小となる部分空間が得られる。その部分空間に射影することで、特徴ベクトル全体の2乗誤差を小さく保ったまま、特徴ベクトルの次元を減らし、メモリを削減する。また、データ圧縮とは異なり、元の状態に戻す必要なく、近似した状態で特徴ベクトル間の距離や角度を計算できる。
「パターン識別」、Richard O.Duda, Peter, E. Hart, David G. Stork著、尾上守夫監訳、新技術コミュニケ−ションズ
しかし、上記削減方法では、認識性能を維持するためには、射影する部分空間の次元をある程度残す必要があるため、認識性能の低下を抑えたまま、特徴ベクトルのメモリ量を大幅に削減することはできないという問題点がある。
そこで、本発明は、上記問題点を解決するために、認識性能の低下を抑えつつ、元の状態に戻さずに認識でき、メモリ量を削減するように特徴ベクトルの圧縮を行うパターン認識装置及びその方法を提供する。
本発明は、認識対象のパターン入力する入力部と、前記入力部に入力した入力パターンから特徴抽出を行い、特徴ベクトルを生成する特徴抽出部と、前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成部と、前記量子化関数を用いて前記入力パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される入力量子化特徴ベクトルを生成する量子化部と、前記認識対象の辞書特徴ベクトル、または、前記辞書特徴ベクトルの各成分を量子化した辞書量子化特徴ベクトルを格納している辞書部と、前記入力量子化特徴ベクトルと、前記辞書特徴ベクトル、または、前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算部と、前記類似度から前記認識対象を認識する判定部と、を有するパターン認識装置である。
また、本発明は、認識対象のパターン入力する入力部と、前記入力部に入力した入力パターンから特徴抽出を行い、入力特徴ベクトルを生成する特徴抽出部と、認識対象の辞書量子化特徴ベクトルを保持する辞書部と、前記入力特徴ベクトルと前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算部と、前記類似度から前記認識対象を認識する判定部と、を有し、前記辞書部は、前記認識対象の辞書パターン入力する辞書入力部と、前記辞書パターンから特徴抽出を行い、特徴ベクトルを生成する辞書特徴抽出部と、前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成部と、前記量子化関数を用いて前記辞書パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される辞書量子化特徴ベクトルを生成する量子化部と、前記辞書量子化特徴ベクトルを格納する格納部と、を有するパターン認識装置である。
本発明によれば、認識性能の低下を抑えながら、量子化によって特徴ベクトルのメモリを削減できる。
本発明の一実施形態のパターン認識装置について図面に基づいて説明する。本実施形態のパターン認識装置は、画像のパターン認識に限らず、音声など、特徴量をベクトルとして扱う様々な分野のパターン認識に適用できる。
(第1の実施形態)
本発明の第1の実施形態のパターン認識装置10について図1〜図3に基づいて説明する。
本実施形態のパターン認識装置10は、入力パターンに対応した入力特徴ベクトルと、比較対象である辞書特徴ベクトルの両方を量子化してから、類似度を求め、この類似度からパターン認識を行う。
(1)パターン認識装置10
本実施形態のパターン認識装置10の構成について図1に基づいて説明する。図1はパターン認識装置10の概略を示すブロック図である。
パターン認識装置10は、パターン入力部101、特徴抽出部102、特徴ベクトル量子化部103、類似度計算部104、辞書特徴格納部105、判定部106からなる。各部101〜106の機能は、コンピュータに格納されたプログラムによっても実現可能である。
以下、各部101〜106の機能について説明する。
(2)パターン入力部101
パターン入力部101は、認識対象となるパターンの入力を行う。
パターンが画像の場合は、例えば予めデジタルカメラ等で撮影した画像をパソコンに取り込んだものや、パソコンに接続したカメラなどで実現できる。パターンが音声の場合は、例えば予め録音した音声をパソコンに取り込んだものや、パソコンに接続したマイクなどで実現できる。
(3)特徴抽出部102
特徴抽出部102は、パターン入力部101から送られてきたパターンをベクトルに変換する処理を行う。以下、特徴抽出部102で変換されたベクトルを「特徴ベクトル」と呼ぶ。
入力されたパターンが画像の場合は、例えば、ラスタスキャンによりベクトルに変換する。
入力されたパターンが音声の場合は、例えば、一定時間内の音声の周波数成分を並べたベクトルを使用する。
また、ベクトルに変換した後、入力されたパターンの変動を抑制する処理を行ってもよい。例えば、予め大量に用意したパターンから主成分分析によって得られた固有値の小さいノイズ成分を除く処理などを行ってもよい。
(4)特徴ベクトル量子化部103
特徴ベクトル量子化部103は、特徴抽出部102で生成された特徴ベクトル(入力特徴ベクトルと辞書特徴ベクトル)に対して、量子化関数を生成し、その量子化関数に基づいて特徴ベクトルの各成分の量子化処理を行う。
「量子化関数」とは、実数の集合を有限個または加算無限個に分割した区間の集合と、前記区間と一対一に対応する値の集合から定義される関数で、入力された実数に対して、前記入力された実数を含む前記区間に対応する前記値を出力する関数をいう。
「量子化区間」とは、前記区間をいう。
「量子化値」とは、量子化区間に一対一に対応する前記値であって、前記量子化区間に含まれる値をいう。
「量子化特徴ベクトル」とは、特徴ベクトル量子化部103で量子化された特徴ベクトルをいう。
図2に、特徴ベクトル量子化部103で行われる量子化処理20の詳細を示したフローチャートを示す。量子化処理20の説明は後述する。また、顔画像から生成した特徴ベクトルに対して、量子化処理20の処理を施した画像を図7に示す。
(5)辞書特徴格納部104
辞書特徴格納部104は、認識対象の各クラスのパターンに対して、特徴抽出部102で辞書特徴ベクトルを抽出し、その後に特徴ベクトル量子化部103で処理を行い、生成した辞書の量子化特徴ベクトル(以下、「辞書量子化特徴ベクトル」という)を記憶領域に格納する。
(6)類似度計算部105
類似度計算部105は、特徴ベクトル量子化部103で出力された入力パターンの量子化特徴ベクトル(以下、「入力量子化特徴ベクトル」という)と辞書特徴格納部104に格納された各クラスの辞書量子化特徴ベクトルの間の類似性を表現した値(以下、「類似度」という)を計算する。ここでは、ベクトル間の距離を計算する。
図3に、類似度計算部105で行われる類似度計算処理30の詳細を示したフローチャートを示す。類似度計算処理30の説明は後述する。
(7)判定部106
判定部106は、登録されたクラスの中で類似性に関する条件を満たした中でも最も類似性が高いクラスを入力された認識対象のクラスと同定する。
条件を満たしたものがない場合は、属するクラスなしと同定する。
類似度としてベクトル間の距離を使用した場合、前記距離が予め設定した閾値より小さいとし、距離が小さいほど類似性が高いとする。
(8)量子化処理20
量子化処理20は、特徴ベクトル量子化部103で行う量子化処理である。図2に量子化処理20のフローチャートを示す。
量子化処理20は、特徴ベクトル入力処理201、並べ替え処理202、初期化処理203、量子化区間探索処理204、誤差・量子化数量化処理205、再探索準備処理206、量子化特徴ベクトル出力処理207からなる。
各処理201〜207の説明は以下の通りである。
(8−1)特徴ベクトル入力処理201
特徴ベクトル入力処理201は、特徴抽出部102から出力された特徴ベクトル(すなわち、入力特徴ベクトル、または、辞書特徴ベクトルである)を入力する処理である。以下、特徴ベクトルの特徴空間の次元をDとする。
(8−2)並べ替え処理202
並べ替え処理202は、特徴ベクトルの各成分の値の大きさを昇順に並べ替える処理である。以下、並べ替え処理202後の特徴ベクトルを(v,・・・,v)とする。但し、v≦・・・≦vである。
図8は、D=6のときに並べ替え後のベクトル(v,・・・,v)を図示したものである。ここで、図8のグラフについて説明すると、縦軸が特徴ベクトルの各成分の値の大きさであり、横軸が各成分の次元数である。
(8−3)初期化処理203
初期化処理203は、量子化処理20で行うために、量子化数によるループ処理の初期化を行う処理である。
初期化処理の説明の前に、まず記号の定義を行う。但し、1≦i≦j≦Dとする。
(8−3−1)ei,jの定義
「ei,j」は、v,・・・vを量子化数1で量子化したときの最小誤差である。つまり全てqに置き換えたときの誤差の最小値である。但し、qは、ある実数であるが、後述するようにv,・・・vの平均mとした値となる。また、誤差は、下記の式(1)において説明するように、各成分の差の二乗和で計算する。
次に、ei,jの求め方について述べる。v,・・・vを全てqに置き換えたときの量子化誤差は以下の通りになる。
但し、mはv,・・・vの平均値、σはv,・・・vの分散とする。
式(1)から、qをv,・・・vの平均mとしたときの、量子化誤差が最小となり、その値は(j−i)σである。
図9は、図8のベクトルのei,jを図示したものである。
(8−3−2)Ei,Mの定義
「Ei,M」は、v,・・・vを量子化数Mで量子化したときの量子化誤差の最小値である。
図10は、図8のベクトルEi,Mを図示したものである。
(8−3−3)Ti,Mの定義
「Ti,M」は、v,・・・vを量子化数Mで量子化したときの量子化誤差の最小となる量子化区間の仕切り値の集合である。
但し、仕切り値集合Ti,M={t,・・・,t(M−1)}のとき、値aの量子化番号は以下のように定義する。
a<tのとき、量子化番号を1とする、
(i−1)≦a<tのとき、量子化番号をiとする、
(M−1)≦aのとき、量子化番号をMとする。
図10は、図8のベクトルEi,M及びTi,Mを図示したものである。すなわち、T22,・・・,T62は図10に示すように2値量子化誤差が最小となる仕切り値の集合であり、E22,・・・,E62は図10に示すように、そのときの2値量子化誤差である。ここで図10に各グラフにおいて、縦軸の「特徴ベクトルの各成分の値の大きさ」を、仕切り値tで分割し、この分割した各区間が量子化区間となる。例えば、量子化数N=3のときは、仕切り値が2つあり、量子化区間は3区画存在する。
(8−3−4)Nの定義
「N」は、処理中の量子化関数の量子化数である。
(8−3−5)処理の内容
初期化処理203は、以下の処理を各i=1,・・・,Dについて行う。
第1の処理は、Ti,1に空集合を代入する、
第2の処理は、Ei,1にe1,iの値を代入する、
第3の処理は、Nに1を代入する。
なお、上記の処理を省略し、後述する量子化区間探索処理204のN=2の処理を初期化処理203としてもよい。
(8−4)量子化区間探索処理204
量子化区間探索処理204は、まず、Nの値を1増やし、Ti,(N−1)及びEi,(N−1)、(但し、i=N−1,・・・,Dである)を使用して、ED,N及びTD,Nを求める処理である。具体的には以下の処理を行う。
図11は、図8のベクトルについて、N=3のときの量子化区間探索処理204を図示したものである。すなわち、最大の仕切り値をv,・・・vまで動かし、各仕切り値で量子化結果を求めて、それぞれの量子化誤差を計算する。そして、3値量子化の量子化誤差を最小にする仕切り値として、t61=t41、t62=vとする。
(8−5)誤差・量子化数量化処理205
誤差・量子化数量化処理205は、量子化誤差ED,N及び量子化数Nを評価し、量子化誤差や量子化数が基準を満たす場合は、量子化特徴ベクトル出力処理207に処理を進める。一方、基準を満たさない場合は、量子化区間再探索準備処理206に進める処理である。
前記基準については、「量子化誤差が予め定めた値以下である」でよい。また、希望する圧縮率から量子化数を計算し、「量子化数が予め定めた値と一致する」としてもよい。
(8−6)量子化区間再探索準備処理206
量子化区間再探索準備処理206は、Ti,(N−1)及びEi,(N−1)、(但し、i=N−1,・・・,Dである)を使用して、Ej,N及びTj,N、(但し、j=N,・・・,(D−1)である)を求める処理である。具体的には、以下の処理を各j=N,・・・,(D−1)について行う。
図12は、図8のベクトルについて、N=3、i=5のときの量子化区間再探索準備処理206を図示したものであり、T53={t51,t52}、E53を求める図である。すなわち、最大の仕切り値をv,・・・vを動かし、各仕切り値で量子化結果を求め、それぞれの量子化誤差を計算する。そして、v,・・・vの3値量子化の量子化誤差を最小にする仕切り値として、t51=t31、t52=v、その最小値をE53=E32+e45とする。
(8−7)量子化特徴ベクトル出力処理207
量子化特徴ベクトル出力処理207は、量子化誤差の最小となる量子化区間の仕切り値の集合TD,N={t,・・・,t(N−1)}と式(1)から決まる各量子化区間での量子化誤差を最小とする量子化値m,・・・,m、(但し、添え字は量子化番号である)から定まる量子化関数を用い、特徴ベクトルの各成分をN個の値に量子化し、量子化特徴ベクトルを出力する処理である。
但し、この量子化関数は実数xの入力に対して以下の値を出力する関数とする。
x<tのときはmを出力する、
(i−1)≦x<tのときはmを出力する、
(N−1)≦xのときはmを出力する。
(9)類似度計算処理30
類似度計算処理30は、類似度計算部105で行う類似度計算処理である。図3に類似度計算処理30のフローチャートを示す。
類似度計算処理30は、量子化特徴ベクトル入力処理301、係数テーブル生成処理302、係数加算処理303、出力処理304からなる。各処理の説明は以下の通りである。
(9−1)量子化特徴ベクトル入力処理301
量子化特徴ベクトル入力処理301は、入力量子化特徴ベクトルと辞書量子化特徴ベクトルの入力を行う処理である。
「量子化特徴ベクトル」は、量子化値の配列及び各成分の量子化番号の配列の組で与えられる。
(9−2)係数テーブル生成処理302
係数テーブル生成処理302は、入力量子化特徴ベクトルと辞書量子化特徴ベクトルのそれぞれの量子化値の配列から係数テーブルを生成する処理である。
各量子化特徴ベクトルの量子化数をM、N、2つの量子化値の配列をそれぞれ(q,・・・,q)、(r,・・・,r)とすると、入力量子化特徴ベクトルと辞書量子化特徴ベクトルの距離を求める係数テーブルは次のM×N行列C=(cij)で与えられる。
(9−3)係数加算処理303
係数加算処理303は、入力量子化特徴ベクトルと辞書量子化特徴ベクトルの量子化番号の配列から、各成分に対応する組を求め、その組に対応する係数テーブルの値の合計を求める処理である。
特徴空間の次元をD、2つの量子化番号の配列をそれぞれ(m,・・・,m)、(n,・・・,n)とすると、以下の値を計算する。
計算後、上記の値はベクトル間距離を二乗した値なので、最後にこの二乗根を施して、この値を類似度とする。
(9−4)出力処理304
出力処理304は、係数加算処理303で得られ類似度を出力する処理である。
(10)効果
本実施形態によれば、入力特徴ベクトルと辞書特徴ベクトルの量子化によって、圧縮による誤差を抑え、データ量を圧縮することが可能となる。
これにより、圧縮前後の入力量子化特徴ベクトルと辞書量子化特徴ベクトルとの間で定義される値の誤差を小さくできるため、圧縮による認識性能の低下も抑えることができる。
また、前記類似度計算処理30では、解凍せずに圧縮された状態で特徴ベクトル間の距離である類似度を計算している。
(第2の実施形態)
本発明の第2の実施形態のパターン認識装置40について図4〜図5に基づいて説明する。
本実施形態のパターン認識装置40は、入力パターンに対応した入力特徴ベクトルと、比較対象である辞書特徴ベクトルを量子化した辞書量子化特徴ベクトルとから類似度を求め、この類似度からパターン認識を行う。
(1)パターン認識装置40
以下、本実施形態のパターン認識装置40について図4に基づいて説明する。図4はパターン認識装置40の概略を示すブロック図である。
パターン認識装置40は、パターン入力部401、特徴抽出部402、類似度計算部403、辞書特徴格納部404、判定部405からなる。各部の説明は以下の通りである。各部401〜405の機能は、コンピュータに格納されたプログラムによっても実現可能である。
以下、各部401〜405の機能について説明する。
(2)パターン入力部401
パターン入力部401は、認識対象となるパターンの入力を行う。
パターンが画像の場合は、例えば予めデジタルカメラ等で撮影した画像をパソコンに取り込んだものやパソコンに接続したカメラなどで実現できる。
パターンが音声の場合は、例えば予め録音した音声をパソコンに取り込んだものやパソコンに接続したマイクなどで実現できる。
(3)特徴抽出部402
特徴抽出部402は、パターン入力部401から送られてきたパターンをベクトルに変換する処理を行う。
以下、特徴抽出部402で変換されたベクトルを「特徴ベクトル」と呼ぶ。
入力されたパターンが画像の場合は、例えば、ラスタスキャンによりベクトルに変換する。
入力されたパターンが音声の場合は、例えば、一定時間内の音声の周波数成分を並べたベクトルを使用する。
また、ベクトルに変換した後、入力されたパターンの変動を抑制する処理を行ってもよい。例えば、予め大量に用意したパターンから主成分分析によって得られた固有値の小さいノイズ成分を除く処理などを行ってもよい。
(4)辞書特徴格納部403
辞書特徴格納部403は、認識対象の各クラスのパターンに対して、特徴抽出部402の処理及び量子化処理20を行い、得られた量子化特徴ベクトル(以下、「辞書量子化特徴ベクトル」という)を記憶領域に格納する。
(5)類似度計算部404
類似度計算部404は、特徴抽出部402で出力された入力パターンの特徴ベクトル(以下、入力特徴ベクトル」という)と辞書特徴格納部403に格納された各クラスの辞書量子化特徴ベクトルの間の類似性を表現した値を計算する。
ここでは、ベクトル間の類似度として、ベクトル間の距離を使用する。図5に、類似度計算部404で行われる類似度計算処理50の詳細を示したフローチャートを示す。類似度計算処理50の説明は後述する。
(6)判定部405
判定部405は、登録されたクラスの中で類似性に関する条件を満たした中でも最も類似性が高いクラスを入力された認識対象のクラスと同定する。
条件を満たしたものがない場合は属するクラスなしと同定する。
類似性を表現する値としてベクトル間の距離を使用した場合、類似性に関する条件を距離が予め設定した閾値より小さいとし、距離が小さいほど類似性が高いとする。
(7)類似度計算処理50
類似度計算処理50は、類似度計算部405で行う類似度計算処理である。図5に類似度計算処理50のフローチャートを示す。
類似度計算処理50は、量子化特徴ベクトル入力処理501、特徴ベクトル入力処理502、量子化番号別加算処理503、加算結果統合処理504、出力処理505からなる。各処理の説明は以下の通りである。
(7−1)量子化特徴ベクトル入力処理501
量子化特徴ベクトル入力処理501は、辞書量子化特徴ベクトルの入力を行う処理である。ここでは、辞書特徴格納部403に格納された辞書量子化特徴ベクトルを入力する。「量子化特徴ベクトル」は、量子化値の配列及び各成分の量子化番号の配列の組で与えられる。
(7−2)特徴ベクトル入力処理502
特徴ベクトル入力処理502は、入力特徴ベクトルの入力を行う処理である。
ここでは、特徴抽出部402で生成された入力特徴ベクトルを入力する。
(7−3)量子化番号別加算処理503
量子化番号別加算処理503は、量子化特徴ベクトル入力処理501で入力した辞書量子化特徴ベクトルの量子化数N、量子化値の配列を(q,・・・,q)、各成分の量子化番号の配列を(n,・・・,n)とし、特徴ベクトル入力処理502で入力した入力特徴ベクトルを(a,・・・,a)としたとき、以下で定義するfを各i=1,・・・,Nで計算する処理である。
但し、A={j|n=i}とする。
(7−4)加算結果統合処理504
加算結果統合処理504は、以下の値を計算する処理である。
計算後、上記の値はベクトル間距離を二乗した値なので、最後に二乗根を施す。
(7−5)出力処理505
出力処理505は、加算結果統合処理504で得られた値を出力する処理である。
(8)効果
本実施形態によれば、上記の辞書特徴ベクトルの量子化によって、圧縮による誤差を抑え、データ量を圧縮した状態で辞書特徴格納部403へ格納が可能となる。
これにより、圧縮前後の入力特徴ベクトルと辞書特徴ベクトル間で定義される値の誤差を小さくできるため、圧縮による認識性能の低下も抑えることができる。
また、前記類似度計算処理30では、解凍せずに圧縮された状態で特徴ベクトル間の距離を計算している。
(第3の実施形態)
本発明の第3の実施形態のパターン認識装置60について図6〜図7に基づいて説明する。
本実施形態のパターン認識装置60は、入力パターンに対応した入力特徴ベクトルを量子化した入力量子化特徴ベクトルと、比較対象である辞書特徴ベクトルとから類似度を求め、この類似度からパターン認識を行う。
(1)パターン認識装置60
本実施形態のパターン認識装置60を図6に基づいて説明する。図6はパターン認識装置60の概略を示すブロック図である。
パターン認識装置60は、パターン入力部601、特徴抽出部602、特徴ベクトル量子化部603、類似度計算部604、辞書特徴格納部605、判定部606からなる。各部601〜606の機能は、コンピュータに格納されたプログラムによっても実現可能である。
各部601〜606の説明は以下の通りである。
(1)パターン入力部601
パターン入力部601は、認識対象となるパターンの入力を行う。
パターンが画像の場合は、例えば予めデジタルカメラ等で撮影した画像をパソコンに取り込んだものやパソコンに接続したカメラなどで実現できる。
パターンが音声の場合は、例えば予め録音した音声をパソコンに取り込んだものやパソコンに接続したマイクなどで実現できる。
(2)特徴抽出部602
特徴抽出部602は、パターン入力部601から送られてきた入力パターンをベクトルに変換する処理を行う。以下、特徴抽出部602で変換されたベクトルを「入力特徴ベクトル」と呼ぶ。
入力されたパターンが画像の場合は、例えば、ラスタスキャンによりベクトルに変換する。
入力されたパターンが音声の場合は、例えば、一定時間内の音声の周波数成分を並べたベクトルを使用する。
また、ベクトルに変換した後、入力されたパターンの変動を抑制する処理を行ってもよい。例えば、予め大量に用意したパターンから主成分分析によって得られた固有値の小さいノイズ成分を除く処理などを行ってもよい。
(3)特徴ベクトル量子化部603
特徴ベクトル量子化部603は、特徴抽出部602で生成された入力特徴ベクトルに対して、量子化処理20の特徴ベクトルの各成分の量子化処理を行う。以下、量子化した入力特徴ベクトルを「入力量子化特徴ベクトル」という。
(4)辞書特徴格納部604
辞書特徴格納部604は、認識対象の各クラスのパターンに対して、特徴抽出部602で行われる処理を行い、生成した辞書特徴ベクトル(以下、「辞書特徴ベクトル」という)を記憶領域に格納する。
(5)類似度計算部605
類似度計算部605は、特徴ベクトル量子化部603で出力された入力パターンの入力量子化特徴ベクトルと辞書特徴格納部604に格納された各クラスの辞書特徴ベクトルの間の類似性を表現した値を計算する。
ここでは、ベクトル間の類似度として、ベクトル間の距離を使用する。類似度計算部605では、類似度計算処理50を使用する。
(6)判定部606
判定部606は、登録されたクラスの中で類似性に関する条件を満たした中でも最も類似性が高いクラスを入力された認識対象のクラスと同定する。
条件を満たしたものがない場合は属するクラスなしと同定する。
類似性を表現する値としてベクトル間の距離を使用した場合、類似性に関する条件を距離が予め設定した閾値より小さいとし、距離が小さいほど類似性が高いとする。
(7)効果
本実施形態によれば、上記の入力特徴ベクトルの量子化によって、圧縮による誤差を抑え、データ量を圧縮することが可能となる。
これにより、圧縮前後の入力特徴ベクトルと辞書特徴ベクトル間の類似度の差を小さくできるため、圧縮による認識性能の低下も抑えることができる。
また、上記の量子化特徴ベクトルの類似度計算によって、解凍せずに圧縮された状態で特徴ベクトル間の類似度を計算することが可能となる。
(変更例)
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
(1)変更例1
初期化処理203、量子化区間探索処理204及び探索準備処理205で使用する量子化誤差ei,jを各成分の差の絶対値の和で計算してもよい。その場合は、成分v,・・・vを全てqに置き換えたときの量子化誤差は以下の式(7)で与えられる。
但し、v≦q<vl+1とする。式(2)から、i+jが偶数のときは、p=(i+j)/2とすると、q=vとしたとき、量子化誤差が最小となり、その値は、
となる。i+jが奇数のときは、p=(i+j−1)/2とすると、v≦q<vp+1の任意の値で、量子化誤差が最小となり、その値は、
となる。量子化特徴ベクトル出力処理207で、使用する各量子化区間の量子化誤差を最少にする量子化値は上記のものを使用する。
(2)変更例2
類似度計算部105で計算するベクトル間の類似度として、2つのベクトル間の距離を用いたガウシアンカーネル式(8)の値を計算してもよい。
(3)変更例3
類似度計算部105で計算するベクトル間の類似度として、2つのベクトルの内積やその2乗を計算してもよい。
量子化特徴ベクトル間の内積を計算する場合、係数テーブル生成処理302で式(2)の代わりに式(9)で定義される係数テーブルを生成すると、ベクトル間の内積を計算することができる。
また、この内積を用いた多項式カーネル式(10)、式(11)などの値をベクトル間の類似度としてもよい。但し、(u,u’)はベクトルu,u’の内積、pは1以上の整数とし、pの値は実験により適切な値を設定する。
(4)変更例4
類似度計算部105で計算するベクトル間の類似度として、2つの各成分の差の絶対値の和を計算してもよい。以後、この値をベクトル間のL1距離と呼ぶ。
量子化特徴ベクトル間のL1距離を計算する場合、係数テーブル生成処理302で式(2)の代わりに式(12)で定義される係数テーブルを生成すると、ベクトル間のL1距離を計算することができる。但し、||は絶対値とする。
(5)変更例5
類似度計算部404で計算するベクトル間の類似度として、2つのベクトルの内積やその2乗を計算してもよい。量子化特徴ベクトル間の内積を計算する場合、量子化番号別加算処理503で式(5)のgを計算し、加算結果統合処理504で式(13)を計算することで、ベクトル間の内積を得ることができる。
また、この内積を用いた多項式カーネルの式(10)、式(11)の値をベクトル間の類似度としてもよい。
(6)変更例6
類似度計算部404で計算するベクトル間の類似度として、L1距離で計算しても良い。量子化特徴ベクトル間のL1距離を計算する場合、量子化番号別加算処理503で以下に定義するbを計算する。但し、||は絶対値とする。
次に、加算結果統合処理504で式(14)を計算することで、ベクトル間のL1距離を計算することができる。
(7)変更例7
辞書特徴格納部104及び辞書特徴格納部403で量子化特徴ベクトルを記憶領域に格納する際、可逆圧縮を施してもよい。可逆圧縮した場合は、格納した量子化特徴ベクトルを復元して類似度計算部105で使用する。
可逆圧縮は、例えば、ハフマン符号化(T.M.Cover and J.A.Thomas, Elements of information Theory. NewYork: Willey. 2006 参照)などでよい。
本発明の第1の実施形態のパターン認識装置のブロック図である。 量子化処理のフローチャートである。 類似度計算処理のフローチャートである。 第2の実施形態のパターン認識装置のブロック図である。 類似度計算処理のフローチャートである。 第3の実施形態のパターン認識装置のブロック図である。 顔画像から生成した特徴ベクトルに各成分の量子化処理を施した例の図である。 D=6のときに並べ替え後のベクトル(v,・・・,v)を図示したものである。 図8のベクトルのei,jを図示したものである。 図8のベクトルEi,M及びTi,Mを図示したものである。 図8のベクトルについて、N=3のときの量子化区間探索処理204を図示したものである。 図8のベクトルについて、N=3、i=5のときの探索準備処理206を図示したものである。
符号の説明
10 パターン認識装置
101 パターン入力部
102 特徴抽出部
103 特徴ベクトル量子化部
104 類似度計算部
105 辞書特徴格納部
106 判定部

Claims (14)

  1. 認識対象のパターン入力する入力部と、
    前記入力部に入力した入力パターンから特徴抽出を行い、特徴ベクトルを生成する特徴抽出部と、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成部と、
    前記量子化関数を用いて前記入力パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される入力量子化特徴ベクトルを生成する量子化部と、
    前記認識対象の辞書特徴ベクトル、または、前記辞書特徴ベクトルの各成分を量子化した辞書量子化特徴ベクトルを格納している辞書部と、
    前記入力量子化特徴ベクトルと、前記辞書特徴ベクトル、または、前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算部と、
    前記類似度から前記認識対象を認識する判定部と、
    を有するパターン認識装置。
  2. 認識対象のパターン入力する入力部と、
    前記入力部に入力した入力パターンから特徴抽出を行い、入力特徴ベクトルを生成する特徴抽出部と、
    認識対象の辞書量子化特徴ベクトルを保持する辞書部と、
    前記入力特徴ベクトルと前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算部と、
    前記類似度から前記認識対象を認識する判定部と、
    を有し、
    前記辞書部は、
    前記認識対象の辞書パターン入力する辞書入力部と、
    前記辞書パターンから特徴抽出を行い、特徴ベクトルを生成する辞書特徴抽出部と、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成部と、
    前記量子化関数を用いて前記辞書パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される辞書量子化特徴ベクトルを生成する量子化部と、
    前記辞書量子化特徴ベクトルを格納する格納部と、
    を有するパターン認識装置。
  3. 前記関数生成部は、
    前記特徴ベクトルの複数の成分の集合から一つの成分を選択する選択部と、
    前記選択した成分を境界として、前記複数の成分の集合を2つに分割する分割部と、
    分割した一方の前記成分の集合を量子化数1で量子化したときにおける、任意の値より小さい第1量子化誤差を求める第1演算部と、
    分割した他方の前記成分の集合を量子化数(n−1)で量子化したときにおける、任意の値より小さい第2量子化誤差を、量子化数(n−2)で求めた前記量子化区間と前記第1量子化誤差に基づいて計算する第2演算部と、
    前記第1量子化誤差と前記第2量子化誤差を足して、前記量子化数nの量子化誤差を求める第3演算部と、
    前記量子化数nの量子化誤差に対応した前記量子化区間の仕切り値を求める第4演算部と、
    を有する請求項1または2記載のパターン認識装置。
  4. 前記関数生成部は、
    前記第1量子化誤差とは、前記分割した一方の前記成分の集合を量子化数1で量子化したときにおける最小の量子化誤差であり、
    前記第2量子化誤差とは、前記分割した他方の前記成分の集合を量子化数(n−1)で量子化したときにおける最小の量子化誤差である、
    請求項3記載のパターン認識装置。
  5. 前記関数生成部は、
    前記特徴ベクトルの各成分の値を、前記各値の大きさに基づいて昇順に並べてから前記量子化関数を生成する、
    請求項3記載のパターン認識装置。
  6. 前記関数生成部は、前記量子化誤差が予め定めた値より小さいとき、または、前記量子化数Sが予め定めた値と一致したときの量子化関数を前記量子化部へ出力する、
    請求項3記載のパターン認識装置。
  7. 前記類似度計算部は、
    量子化値と各成分の量子化番号で構成される前記入力量子化特徴ベクトルと、量子化値と各成分の量子化番号で構成される前記辞書量子化特徴ベクトルを用いて前記類似度を計算する、
    請求項1記載のパターン認識装置。
  8. 前記類似度計算部は、
    量子化値と各成分の量子化番号で構成される前記入力量子化特徴ベクトルと、前記辞書特徴ベクトルを用いて前記類似度を計算する、
    請求項1記載のパターン認識装置。
  9. 前記類似度計算部は、
    量子化値と各成分の量子化番号で構成される前記辞書量子化特徴ベクトルと、前記入力特徴ベクトルを用いて前記類似度を計算する、
    請求項2記載のパターン認識装置。
  10. 前記辞書部は、前記辞書量子化特徴ベクトルを可逆圧縮して格納している、
    請求項1または2記載のパターン認識装置。
  11. 認識対象のパターン入力する入力ステップと、
    前記入力ステップにおいて入力した入力パターンから特徴抽出を行い、特徴ベクトルを生成する特徴抽出ステップと、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成ステップと、
    前記量子化関数を用いて前記入力パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される入力量子化特徴ベクトルを生成する量子化ステップと、
    前記認識対象の辞書特徴ベクトル、または、前記辞書特徴ベクトルの各成分を量子化した辞書量子化特徴ベクトルを格納している辞書ステップと、
    前記入力量子化特徴ベクトルと、前記辞書特徴ベクトル、または、前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算ステップと、
    前記類似度から前記認識対象を認識する判定ステップと、
    を有するパターン認識方法。
  12. 認識対象のパターン入力する入力ステップと、
    前記入力ステップにおいて入力した入力パターンから特徴抽出を行い、入力特徴ベクトルを生成する特徴抽出ステップと、
    認識対象の辞書量子化特徴ベクトルを保持する辞書ステップと、
    前記入力特徴ベクトルと前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算ステップと、
    前記類似度から前記認識対象を認識する判定ステップと、
    を有し、
    前記辞書ステップは、
    前記認識対象の辞書パターン入力する辞書入力ステップと、
    前記辞書パターンから特徴抽出を行い、特徴ベクトルを生成する辞書特徴抽出ステップと、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成ステップと、
    前記量子化関数を用いて前記辞書パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される辞書量子化特徴ベクトルを生成する量子化ステップと、
    前記辞書量子化特徴ベクトルを格納する格納ステップと、
    を有するパターン認識方法。
  13. 認識対象のパターン入力する入力機能と、
    前記入力機能において入力した入力パターンから特徴抽出を行い、特徴ベクトルを生成する特徴抽出機能と、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成機能と、
    前記量子化関数を用いて前記入力パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される入力量子化特徴ベクトルを生成する量子化機能と、
    前記認識対象の辞書特徴ベクトル、または、前記辞書特徴ベクトルの各成分を量子化した辞書量子化特徴ベクトルを格納している辞書機能と、
    前記入力量子化特徴ベクトルと、前記辞書特徴ベクトル、または、前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算機能と、
    前記類似度から前記認識対象を認識する判定機能と、
    をコンピュータに実現させるためのパターン認識プログラム。
  14. 認識対象のパターン入力する入力機能と、
    前記入力機能において入力した入力パターンから特徴抽出を行い、入力特徴ベクトルを生成する特徴抽出機能と、
    認識対象の辞書量子化特徴ベクトルを保持する辞書機能と、
    前記入力特徴ベクトルと前記辞書量子化特徴ベクトルとの類似度を計算する類似度計算機能と、
    前記類似度から前記認識対象を認識する判定機能と、
    を実現し、
    前記辞書機能は、
    前記認識対象の辞書パターン入力する辞書入力機能と、
    前記辞書パターンから特徴抽出を行い、特徴ベクトルを生成する辞書特徴抽出機能と、
    前記特徴ベクトルに関して、量子化数1または量子化数2から順番に量子化数を増加させて、前記各量子数で量子化区間を求めるものであって、量子化数n(但し、n>2である)の量子化区間を用いて量子化数(n+1)の量子化区間を求め、量子化数S(但し、S>nである)に対応した量子化区間を有する量子化関数を生成する関数生成機能と、
    前記量子化関数を用いて前記辞書パターンの前記特徴ベクトルの各成分をそれぞれ量子化して、前記量子化された各成分から構成される辞書量子化特徴ベクトルを生成する量子化機能と、
    前記辞書量子化特徴ベクトルを格納する格納機能と、
    をコンピュータに実現させるためのパターン認識プログラム。
JP2008060990A 2008-03-11 2008-03-11 パターン認識装置及びその方法 Expired - Fee Related JP5231839B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008060990A JP5231839B2 (ja) 2008-03-11 2008-03-11 パターン認識装置及びその方法
US12/401,300 US8077979B2 (en) 2008-03-11 2009-03-10 Apparatus and method for pattern recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008060990A JP5231839B2 (ja) 2008-03-11 2008-03-11 パターン認識装置及びその方法

Publications (2)

Publication Number Publication Date
JP2009217583A JP2009217583A (ja) 2009-09-24
JP5231839B2 true JP5231839B2 (ja) 2013-07-10

Family

ID=41063095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008060990A Expired - Fee Related JP5231839B2 (ja) 2008-03-11 2008-03-11 パターン認識装置及びその方法

Country Status (2)

Country Link
US (1) US8077979B2 (ja)
JP (1) JP5231839B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2333718B1 (en) * 2009-01-29 2013-08-28 Nec Corporation Feature amount selecting device
US9053562B1 (en) 2010-06-24 2015-06-09 Gregory S. Rabin Two dimensional to three dimensional moving image converter
JP6017335B2 (ja) * 2013-02-06 2016-10-26 株式会社東芝 パターン認識装置、その方法、及び、そのプログラム
US9992021B1 (en) 2013-03-14 2018-06-05 GoTenna, Inc. System and method for private and point-to-point communication between computing devices
KR102350235B1 (ko) * 2014-11-25 2022-01-13 삼성전자주식회사 영상 처리 방법 및 장치
JP6460926B2 (ja) * 2015-06-25 2019-01-30 Kddi株式会社 撮影画像に写る物体を検索するシステム及び方法
CN111758025B (zh) * 2018-02-22 2024-08-13 松下知识产权经营株式会社 检查装置及检查方法
JP7294017B2 (ja) 2019-09-13 2023-06-20 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JP3346679B2 (ja) * 1994-06-14 2002-11-18 日本電信電話株式会社 画像検査/認識方法、これに用いる参照データ作成方法およびこれらの装置
JP2001142867A (ja) * 1999-11-17 2001-05-25 Matsushita Electric Ind Co Ltd 学習型認識判断装置
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
JP4462411B2 (ja) * 2004-06-23 2010-05-12 オムロン株式会社 教師データの登録支援装置
JP2007233873A (ja) * 2006-03-02 2007-09-13 Toshiba Corp パターン認識装置及びその方法

Also Published As

Publication number Publication date
US20090232399A1 (en) 2009-09-17
JP2009217583A (ja) 2009-09-24
US8077979B2 (en) 2011-12-13

Similar Documents

Publication Publication Date Title
JP5231839B2 (ja) パターン認識装置及びその方法
EP3276540B1 (en) Neural network method and apparatus
JP4966669B2 (ja) マッチング追跡を用いたデータ圧縮
JP4695706B2 (ja) エントロピー符号化及び復号のための方法及び装置
US11983906B2 (en) Systems and methods for image compression at multiple, different bitrates
WO2017183448A1 (ja) データ処理装置、データ処理方法、プログラム
JP3959039B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム
TWI738048B (zh) 算數框架系統及操作浮點至定點算數框架的方法
Pal et al. An efficient codebook initialization approach for LBG algorithm
JP2019028746A (ja) ネットワーク係数圧縮装置、ネットワーク係数圧縮方法およびプログラム
CN113747163A (zh) 基于上下文重组建模的图像编码、解码方法及压缩方法
WO2011097963A1 (zh) 编码方法、解码方法、编码器和解码器
WO2011064073A1 (en) Method, device and system for image compression and decompression using support vector regression
JP6748022B2 (ja) 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム
JP2006270737A (ja) 復号化装置、分布推定方法、復号化方法及びこれらのプログラム
JP2005124001A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
Iwasokun Lossless JPEG-Huffman model for digital image compression
JP2015035788A (ja) 画像符号化装置、画像符号化方法及びプログラム
JP6502869B2 (ja) 辞書生成方法、辞書生成装置及び辞書生成プログラム
JP4871246B2 (ja) ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体
KR102016125B1 (ko) 데이터 압축 및 압축해제방법
JP6581045B2 (ja) 画像符号化方法、画像符号化装置及び画像符号化プログラム
JP2001016588A (ja) 信号処理システム
JP4234018B2 (ja) デジタル映像音声信号可逆符号化復号方法、装置およびこの方法を実行するためのコンピュータプログラムを記録した記録媒体
Jabeen et al. Predictive Coding Based Lossless Image Compression Model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130322

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160329

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees