JP3450522B2 - 情報処理方法及び装置 - Google Patents

情報処理方法及び装置

Info

Publication number
JP3450522B2
JP3450522B2 JP15466195A JP15466195A JP3450522B2 JP 3450522 B2 JP3450522 B2 JP 3450522B2 JP 15466195 A JP15466195 A JP 15466195A JP 15466195 A JP15466195 A JP 15466195A JP 3450522 B2 JP3450522 B2 JP 3450522B2
Authority
JP
Japan
Prior art keywords
reference pattern
pattern
output
information processing
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15466195A
Other languages
English (en)
Other versions
JPH096382A (ja
Inventor
雅章 山田
康弘 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP15466195A priority Critical patent/JP3450522B2/ja
Priority to US08/666,219 priority patent/US5706391A/en
Priority to EP96304580A priority patent/EP0750273B1/en
Priority to DE69615288T priority patent/DE69615288T2/de
Publication of JPH096382A publication Critical patent/JPH096382A/ja
Application granted granted Critical
Publication of JP3450522B2 publication Critical patent/JP3450522B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、パターン認識に用いる
情報処理方法及び装置に関するものである。
【0002】
【従来の技術】従来より、パターン認識の手法として、
参照パターンをあらかじめ用意し、用意されたパターン
のうち入力されたパターンに最も良く適合するものを認
識結果とする方法がある。
【0003】通常、入力されるパターンは、複数の特徴
量を組み合わせた特徴ベクトルである。
【0004】一方、参照パターンは、認識結果を代表す
る特徴ベクトル、あるいは、特徴ベクトルを入力とする
関数として表現される。
【0005】前者においては、参照パターンと入力され
たパターンとの適合度は、参照パターンの特徴ベクトル
と入力パターンの特徴ベクトルとの間の距離として表現
される。後者においては、参照パターンと入力されたパ
ターンとの適合度は、参照パターンである関数に入力パ
ターンの特徴ベクトルを入力して得られる値として表現
される。
【0006】また、後者における参照パターン関数とし
て、多次元確率密度関数が用いられることが多い。すな
わち、入力された特徴ベクトルをx,s番目の参照パタ
ーンである確率密度関数をbs (・)とすると、s番目
の参照パターンと入力されたパターンとの適合度は、 bs (x) (1) となる。
【0007】前記の確率密度関数としては、ガウス分布
関数などの関数が用いられる。また、複数の確率密度関
数の重み付け和である混合密度関数が用いられることも
ある。混合密度関数を用いた場合、前記適合度は、s番
目の参照パターンの混合数をMs ,m番目の確率密度関
数をbs,m (・),s番目の参照パターンのm番目の確
率密度関数の重みをws,m として
【0008】
【外1】 となる。
【0009】さらに、式(2)において、特徴ベクトル
の各次元間の無相関を仮定して、
【0010】
【外2】 を参照パターン関数とすることもある。ここで、xi
入力ベクトルxのi次元目の特徴量、bs,m,i (・)
は、s番目の参照パターンのm番目の確率分布のi次元
目に対応する確率密度関数である。Nは特徴ベクトル空
間の次元数である。
【0011】また、実際のパターン認識において、bs
(・)は入力ベクトルと参照パターンとの適合度でしか
ないため、bs (・)は厳密な意味での確率密度関数で
ある必要はない。特に、bs (・)を、入力ベクトルと
参照パターンベクトルとの距離と解釈することもでき
る。さらに、bs (・)は距離関数以外の一般の関数で
もよい。従って、以上の説明では、確率密度関数という
用語を用いる代わりに、参照パターン関数、あるいは、
適合度関数と呼ぶことにする。
【0012】また、音声認識などにおいては、HMM
(隠れマルコフモデル)がよく用いられる。この場合に
は、参照パターンはHMMの各状態に対応し、前記適合
度は、HMMの各状態が入力されたパターンを出力する
出力確率となる。
【0013】ところで、入力xに対して式(3)の計算
を高速に行う方法として、入力ベクトルの各次元の値を
スカラ量子化する方法がある。
【0014】これは、以下のような処理を行うものであ
る。
【0015】第1に、パターン認識を行う前に次の処理
を行っておく。 1.各次元iに関して、入力値の代表値集合{ξi,q
q=1,2,…Qi }を用意しておく。ここで、Qi
i次元目における代表値の個数である。 2.すべてのξi,q に対して、bs,m,i (ξi,q )を計
算し、テーブルT(s,m,i,q)を作成する。
【0016】第2にパターン認識時に次の処理を行う。 3.入力xの各次元の値xi のそれぞれについて、入力
【0017】
【外3】 が最小となるような数qi を求める(スカラ量子化)。
【0018】
【外4】 についてテーブル参照を行い、
【0019】
【外5】 を求める。
【0020】
【外6】
【0021】以上の処理により、bs (x)の計算を簡
易高速化できる。
【0022】また、実際のパターン認識においては、計
算の簡易さなどの点から、bs (・)の代りにlog
s (・)を用いる場合も多い。この場合、式(3)は
次のように表される。
【0023】
【外7】 ここで、演算addlogは、次のものである。
【0024】
【外8】
【0025】この、対数を用いた場合にも上記のスラカ
量子化を用いた高速化を適用できる(式(7))。
【0026】
【外9】 (s,m,i,q)=logbs,m,i(ξi,q) (8) また、演算addlogに関して、以下のような高速化
方法がある。 ・addlogの代わりに最大値をとる演算maxを用
いる方法 ・式(9)およびlog(1+x)のテーブルを用いる
方法
【0027】
【外10】
【0028】
【発明が解決しようとしている問題点】しかし、上記従
来例では、次の問題点があった。
【0029】入力パターンの適合度を式(4)により求
めるには、1つの参照パターンsについて、Ms ・N回
のテーブル参照とMs ・(N+1)回の乗算、(Ms
1)回の足し算が必要であり、参照パターンの数が多け
ればそれだけ更に計算量が増加する。すなわち、式
(4)の方法では計算量がMS にほぼ正比例して増加す
る。
【0030】また、式(7)においても、1つの参照パ
ターンsについて、Ms ・N回のテーブル参照とMs
(N+1)回の足し算、およびaddlog演算が必要
である。特に、addlog演算については、1つの参
照パターンについて、Ms 回の指数計算と(Ms −1)
回の足し算および1回の対数計算が必要となる。add
logの簡易計算法の場合でも、条件判断・指数計算が
必要となる。
【0031】式(4)・式(7)のいずれにおいても、
より高速に処理するには、Ms が大きくなっても計算量
があまり増加しない手法が望まれる。
【0032】
【課題を解決するための手段】上記従来の課題を解決す
る為に、本発明は入力値の各次元の値の代表値集合であ
る量子化コードブックを設計して記憶し、特徴ベクトル
空間の次元を、混合密度型の参照パターンの関数を構成
する個々の関数が大きく異なる値を出力する次元と混合
密度型の参照パターンの関数を構成する個々の関数がい
ずれも近い値を出力する次元とに分類し、前記分類され
た混合密度が他の参照パターンの関数を構成する個々の
関数が大きく異なる値を出力する次元について、前記量
子化コードブックに記憶されている代表値について出力
値を計算し、単一出力テーブルとして記憶し、前記分類
された混合密度型の参照パターンの関数を構成する個々
の関数が近い値を出力する次元について、前記量子化コ
ードブックに記憶されている代表値について出力値を計
算し、混合出力テーブルとして記憶する情報処理方法及
び装置を提供する。
【0033】上記従来の課題を解決するために、本発明
は好ましくは入力された特徴ベクトルの各次元の値を、
前記量子化コードブックを用いて量子化し、前記参照パ
ターンの関数を構成する個々の関数が大きく異なる値を
出力する各次元について、前記単一出力テーブルを参照
して得た値を単一出力データとして累積し、前記参照パ
ターンの関数を構成する個々の関数がいずれも近い値を
出力する各次元について、前記混合出力テーブルを参照
して得た値を混合出力データとして累積し、前記単一出
力データと前記混合出力データとから入力された特徴ベ
クトルと前記参照パターンとの適合度を決定する。
【0034】上記従来の課題を解決する為に、本発明は
好ましくは前記決定された適合度に応じて、適合度の再
計算を行う参照パターンを判別し、該判別された参照パ
ターンの適合度を再計算する。
【0035】上記従来の課題を解決する為に、本発明は
好ましくは前記適合度の再計算は、より精密な計算によ
り行う。
【0036】上記従来の課題を解決する為に、本発明は
好ましくは前記適合度の再計算は、全次元にわたり混合
密度型の参照パターンの関数を構成する各関数が大きく
異なる値を出力するものとして行う。
【0037】上記従来の課題を解決する為に、本発明は
好ましくは参照パターンを構成する各関数がいずれも近
い値を出力すると判定される次元については参照パター
ンを構成する各関数の出力値の代表値を用いて、該参照
パターンと学習用データとの適合度を計算し、前記計算
された適合度により該参照パターンが適当と判断される
場合には、該参照パターンを認識用に記憶する。
【0038】上記従来の課題を解決する為に、本発明は
好ましくは前記記憶された参照パターンを用いて入力パ
ターンの認識を行う。
【0039】
【実施例】
(実施例1)以下、図面を参照しながら本発明の一実施
例を説明する。
【0040】尚、本発明は音声、画像等のパターン認識
に利用し得る。
【0041】図1は本発明の一実施例における情報処理
装置の構成を示すブロック図である。
【0042】図1において、H1はパターン認識の結果
あるいはパターン認識の結果得られた応答を出力する出
力装置であり、CRTや液晶表示器等の表示手段や、L
BPやインクジェット方式のプリンタである。
【0043】H2は音声や画像といった認識すべき対象
を入力する入力装置であり、音声はマイクから、画像は
スキャナから、また、音声・画像共外部装置により入力
されたものを通信手段を介して入力しても良い。
【0044】H3は数値演算・制御等の処理を行う中央
処理処置であり、記憶装置H4に記憶されている制御プ
ログラムに従って各種制御、演算を行う。
【0045】H4はディスク装置等の外部メモリ装置や
RAM・ROM等の内部メモリといった記憶装置であ
り、後述するフローチャートの制御プログラムを格納
し、また、本発明の手順および処理に必要な一時的デー
タ、参照パターン関数、スカラ量子化のための量子化コ
ードブック、参照パターンの関数の出力値のテーブルで
ある単一出力テーブルおよび混合出力テーブルが格納さ
れる。
【0046】以上のハードウェア構成を踏まえて本発明
の一実施例を説明する。
【0047】図2及び図3は本発明の一実施例を示すフ
ローチャートである。
【0048】まず、パターン認識を行う前に、以下の処
理を行う。
【0049】まず、量子化コードブック設計ステップS
1において、各次元iに関して、入力値の代表値集合
{ξi,q |q=1,2,…Qi }を用意しておく。ここ
で、Q i はi次元目における代表値の個数である。
【0050】次に、次元判定ステップS2において、各
sについて、特徴ベクトル空間の次元をCs
【0051】
【外11】 の2種類に分類する。すなわち、
【0052】
【外12】 ここで、Cs は、混合密度関数を構成する個々の関数が
入力
【0053】
【外13】 に対して、大きく異なる値を出力する次元の集合であ
り、
【0054】
【外14】 は、混合密度関数を構成する個々の関数が入力
【0055】
【外15】 に対して、いずれも同程度の値を出力する集合である。
また、Cs の要素数を
【0056】
【外16】 の要素数を
【0057】
【外17】 とする
【0058】
【外18】
【0059】例えば、図4〜図7の混合数3の参照パタ
ーン関数の適当な次元を4種類示した図である。図4お
よび図5では、入力に対して3つの関数が大きく異なる
値を出力することがわかる。これに対して、図6および
図7では、入力に対して3つの関数が出力する値はあま
り異ならない。従って、図4および図5で示した次元は
s に属し、図6および図7で示された次元は
【0060】
【外19】 に属す。
【0061】次に、単一出力テーブル作成ステップS3
において、Cs に属する次元iのすべてのξi,q につい
て、bs,m,i (ξi,q )を計算するステップS3を繰り
返し、単一出力テーブル
【0062】
【外20】 を作成する。作成された単一テーブルは記憶装置H4内
の単一出力テーブル記憶エリアに記憶する。
【0063】次に、混合出力テーブル作成ステップS4
において、
【0064】
【外21】 に属する次元iのすべてのξi,q について、mに関して
s,m,i (ξi,q )を代表する値
【0065】
【外22】 を計算するステップS4を繰り返し、混合出力テーブル
【0066】
【外23】 を作成する。作成された混合出力テーブルは記憶装置H
4内の混合出力テーブル記憶エリアに記憶する。
【0067】ここで、bs,m,i (ξi,q )のmに関する
代表値
【0068】
【外24】 として、平均値(式(12))、加重平均値(式(1
3))、最大値(式(14))などが考えられる。
【0069】
【外25】
【0070】次にパターン認識の処理を図3のフローチ
ャートに従って説明する。
【0071】まず、スカラ量子化ステップS5におい
て、入力xの各次元の値xi のそれぞれについて、入力
【0072】
【外26】 が最小となるような数
【0073】
【外27】 を求める。
【0074】次に、単一出力テーブル参照ステップS6
において、Cs に属するiについて記憶装置H4に記憶
された単一出力テーブルを参照し、
【0075】
【外28】 を得る(S7)。
【0076】次に、S6におけるテーブル参照と、その
テーブル参照によって得られた
【0077】
【外29】 のS7における累積をi∈Cs ,mについて繰り返し、
式(15)で表される
【0078】
【外30】 を得る。この得られた
【0079】
【外31】 は記憶装置H4に記憶される。
【0080】
【外32】
【0081】次に、混合出力テーブル参照ステップS8
において、
【0082】
【外33】 に属するiについて記憶装置H4に記憶された混合出力
テーブルを参照し、
【0083】
【外34】 を得る(S9)。
【0084】次に、S8におけるテーブル参照と、その
テーブル参照によって得られた
【0085】
【外35】 のS8における累積を
【0086】
【外36】 について繰り返し、式(16)で表される
【0087】
【外37】 を得る。この得られた
【0088】
【外38】 は、記憶装置H4に記憶される。
【0089】
【外39】
【0090】次に、適合度計算ステップS10におい
て、前記S7及びS9で記憶装置H4に記憶された
【0091】
【外40】 の積を計算し、参照パターンsと入力xとの適合度bs
(x)の近似値を得る。
【0092】以上の処理を、記憶装置H4に記憶されて
いるパターン認識プログラムで用いる辞書に格納されて
いる参照パターンについて行い、最大の適合度bs
(x)の近似値を得ることができた参照パターンを認識
結果として出力する。
【0093】(実施例2)従来技術で説明したように、
適合度としてbs (x)の対数をとった関数log b
s (x)を用いることがある。
【0094】この場合、実施例1のステップは以下のよ
うになる。
【0095】まず、単一出力テーブル作成ステップS3
において作成されるテーブルTcs(s,m,i,q)
の内容はlog bs,m,i (ξi,q )となる。
【0096】次に、混合出力テーブル作成ステップS4
において作成されるテーブルの内容は、
【0097】
【外41】 となる。ここで、log bs,m,i (ξi,q )のmに関
する代表値は、式(12)に対応して式(17)、式
(13)に対応して式(18)、式(14)に対応して
式(19)のようになる。
【0098】
【外42】
【0099】次に、単一出力累積ステップS7において
は、
【0100】
【外43】 を得る(式(20)。
【0101】
【外44】 ここで、従来技術で述べられた、addlogに関する
高速化手法を適用しても良い。
【0102】次に、混合出力累積ステップS9における
累積計算は、式(21)のようになる。
【0103】
【外45】
【0104】次に、適合度計算ステップS10では、
【0105】
【外46】 の和が計算される。
【0106】(実施例3)実施例2では、まず、単一出
力テーブル作成ステップS3において作成される単一出
力テーブルTcs (s,m,i,q)の内容をlog
s,m,i (ξi,q)としたが、これはbs,m,i (ξ
i,q )であっても良い。この場合、単一出力累積ステッ
プS7において、和が積になる代わりにaddlogの
計算がなくなる。
【0107】単一出力累積ステップS7における計算は
式(22)となる。
【0108】
【外47】
【0109】(実施例4)前記各実施例の特殊な例とし
て、Cs =0の場合がある。この場合、次元判定ステッ
プS2、単一出力テーブル作成ステップS3、単一出力
テーブル参照ステップS6、単一出力累積ステップS
7、適合度計算ステップS10が省略される。そして、
混合出力累積ステップS9の結果が参照パターンsと入
力xとの適合度となる。
【0110】さらに、Cs の要素数が1で、かつ、混合
出力テーブル作成ステップS4において代表値として加
重平均値を用いた場合には、Cs =0の場合と全く等価
になる。
【0111】(実施例5)前記各実施例によって、全参
照パターンsと入力xとの適合度を求めた後、次の再計
算処理によって、より適正な適合度を計算しても良い。
この場合の処理を図8のフローチャートに示すが、図3
のフローチャートと同様の処理ステップについては同一
のステップ番号を付加し、ここでの説明は省略する。よ
って、ステップS11から説明する。再計算対象判別S
11において、認識辞書の各参照パターンについてS5
〜S10により求められた適合度に従って、適合度の再
計算の対象となる参照パターンを求める。求める方法
は、参照パターンのうち、入力xとの適合度の大きい順
に適当な個数を再計算の対象とする。この、対象として
選択する個数は、予めパラメータとして、記憶装置H4
に記憶されているものとする。
【0112】次に、再計算ステップS12において、前
記再計算対象判別ステップS11で選ばれた参照パター
ンについて、適合度を再計算する。適合度の再計算のた
めに、従来例で述べた式(3)あるいは式(5)を用い
る。
【0113】(実施例6)前記実施例5の再計算ステッ
プS12において、従来法であるスカラ量子化を用いた
方法を用いることができる。
【0114】これは
【0115】
【外48】 として前記実施例1〜4で述べた高速計算法を行い、そ
の結果を再計算の結果とみなす方法である。
【0116】すなわち、適合度を再計算すべき参照パタ
ーンについて、すべての次元iおよび混合mについて単
一出力テーブルを参照し累積する。
【0117】(実施例7)パターン認識用の参照パター
ンの作成方法として、あらかじめ用意された学習用デー
タを用いる方法がある。
【0118】すなわち、用意された学習用データに対し
て、最も適当になるように参照パターンを作成する方法
である。この「適当さ」の基準として、学習用データと
参照パターンとの適合度を用いる。
【0119】この処理を、図9のフローチャートに示
す。
【0120】記憶装置H4に記憶された学習用データと
参照パターンの適合度をS14で計算し、この計算され
た適合度が予め定められた基準値以上であれば終了条件
を満たすと判定し(S15)参照パターンの作成処理を
終了する。S15で終了条件を満たさないと判定される
場合は参照パターンを更新し(S13)、終了条件を満
たすと判定されるまでS13とS14の処理を繰り返
す。
【0121】また、S15における終了条件は、単に適
合度が基準値以上であるか否かだけではなく、適合度の
向上率が上がらなくなったと判定されることを終了条件
とすれば、より適切な判断となるし、また、繰り返し回
数を予め定めておくことにより、より簡便な判断とする
ことができる。
【0122】また、最も適当な参照パターンを得るため
の方法として、適合度関数から直接参照パターンを求め
る方法と、「EMアルゴリズム」のような反復的アルゴ
リズムによって逐次的に参照パターンを更新する方法が
ある。
【0123】この、参照パターンを作成する際における
適合度の計算において、前記実施例1の適合度計算を用
いても良い。
【0124】すなわち、参照パターンを作成する際に次
元判定ステップS15を設け、「適当さ」の基準として
用いる適合度を、
【0125】
【外49】 として、最も適当な参照パターンを求める。
【0126】次元判定ステップS16は、図10のフロ
ーチャートに示すように、反復アルゴリズムの反復の過
程で毎回行っても良いし、図11のフローチャートに示
すように、反復の前に1度だけ行っても良い。
【0127】このようにして求められた参照パターンに
対して、前記実施例1〜4で述べたパターン認識方法を
適用しても良い。
【0128】(実施例8)前記実施例7において、b
s,m,i (xi )のmに関する代表値
【0129】
【外50】 として、次元毎に重みの異なる加重平均値(式(2
4))を用いても良い。
【0130】
【外51】
【0131】
【発明の効果】以上説明したように、本発明によればパ
ターン認識を行う為に必要な参照パターン関数に対する
適合度の計算を容易にする為の情報を用意することがで
きる。
【0132】また、以上説明したように、本発明によれ
ばパターン認識を行う為に必要な、参照パターン関数に
対する適合度の計算に必要な計算量を減少させるので、
装置の負担を軽くし、処理効率を向上させることができ
る。
【0133】また、以上説明したように、本発明によれ
ば前記決定された適合度に応じて、適合度の再計算を行
う参照パターンを判別し、該判別された参照パターンの
適合度を再計算するので、より正確に適合度を得ること
ができる。
【0134】また、以上説明したように、本発明によれ
ば、前記適合度の再計算は、より精密な計算により行う
ことにより、より正確に適合度を得ることができる。
【0135】また、以上説明したように、本発明によれ
ば、前記適合度の再計算は、全次元にわたり混合密度型
の参照パターンの関数を構成する各関数が大きく異なる
値を出力するものとして行うことにより、より参照パタ
ーンに適した処理を行うことができる。
【0136】また、以上説明したように、本発明によれ
ば、参照パターンを構成する各関数がいずれも近い値を
出力すると判定される次元については参照パターンを構
成する各関数の出力値の代表値を用いて、該参照パター
ンと学習用データとの適合度を計算し、前記計算された
適合度により該参照パターンが適当と判断される場合に
は、該参照パターンを認識用に記憶することにより、学
習データを提供することでその学習データに適した参照
パターン作成することができる。
【0137】また、以上説明したように、本発明によれ
ば、前記記憶された参照パターンを用いて入力パターン
の認識を行うことにより、所望の状態になった参照パタ
ーンを用いて高認識率の認識を行うことができる。
【図面の簡単な説明】
【図1】実施例における情報処理装置の構成を示すブロ
ック図。
【図2】本発明の一実施例における、パターン認識前の
処理を示したフローチャート。
【図3】本発明の一実施例における、パターン認識時の
処理を示したフローチャート。
【図4】混合数3の参照パターン関数の例であり、入力
に対して3つの関数が大きく異なる値を出力する次元を
示した図。
【図5】混合数3の参照パターン関数の例であり、入力
に対して3つの関数が大きく異なる値を出力する次元を
示した図。
【図6】混合数3の参照パターン関数の例であり、入力
に対して3つの関数があまり異ならない値を出力する次
元を示した図。
【図7】混合数3の参照パターン関数の例であり、入力
に対して3つの関数があまり異ならない値を出力する次
元を示した図。
【図8】再計算処理の一実施例を示したフローチャー
ト。
【図9】参照パターンの作成過程を示したフローチャー
ト。
【図10】参照パターンの作成過程において本発明で用
いた適合度計算法を適用した実施例を示したフローチャ
ート。
【図11】参照パターンの作成過程において本発明で用
いた適合度計算法を適用した実施例を示したフローチャ
ート。
フロントページの続き (56)参考文献 特開 平6−214591(JP,A) 特表 平10−505687(JP,A) 特許2845018(JP,B2) 小坂,嵯峨山,混合連続分布HMM音 素モデルの構造自動決定法の検討,日本 音響学会平成4年度秋季研究発表会講演 論文集,日本,1992年10月 5日,2− 1−1,Pages 79−80 渡辺,篠田,高木,山田,服部,磯, 木構造確率分布を用いた音声認識,日本 音響学会平成5年度秋季研究発表会講演 論文集,日本,1993年10月 5日,1− 8−7,Pages 13−14 小森,山田,山本,大洞,少数分布H MMによる出力確率推定に基づいた効率 的な混合連続分布HMM音声認識,電子 情報通信学会技術研究報告[音声],日 本,1994年10月13日,Vol.94,N o.271,SP94−52,Pages 31 −38 山田,山本,小坂,小森,大洞,パラ メータのスカラ量子化と混合分布HMM の次元独立演算による高速出力確率計 算,電子情報通信学会技術研究報告[音 声],日本,1995年 6月22日,Vo l.95,No.122,SP95−22,Pa ges 31−38 (58)調査した分野(Int.Cl.7,DB名) G10L 15/14 G06T 7/00 JICSTファイル(JOIS)

Claims (23)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力値の各次元の値の代表値集合である
    量子化コードブックを設計して記憶し、 特徴ベクトル空間の次元を、混合密度型の参照パターン
    の関数を構成する個々の関数が大きく異なる値を出力す
    る次元と混合密度型の参照パターンの関数を構成する個
    々の関数がいずれも近い値を出力する次元とに分類し、 前記分類された混合密度型の参照パターンの関数を構成
    する個々の関数が大きく異なる値を出力する次元につい
    て、前記量子化コードブックに記憶されている代表値に
    ついて出力値を計算し、単一出力テーブルとして記憶
    し、 前記分類された混合密度型の参照パターンの関数を構成
    する個々の関数が近い値を出力する次元について、前記
    量子化コードブックに記憶されている代表値について出
    力値を計算し、混合出力テーブルとして記憶することを
    特徴とする情報処理方法。
  2. 【請求項2】 入力された特徴ベクトルの各次元の値
    と、前記量子化コードブックを用いて量子化し、 前記参照パターンの関数を構成する個々の関数が大きく
    異なる値を出力する各次元について、前記単一出力テー
    ブルを参照して得た値を単一出力データとして累積し、 前記参照パターンの関数を構成する個々の関数がいずれ
    も近い値を出力する各次元について、前記混合出力テー
    ブルを参照して得た値を混合出力データとして累積し、 前記単一出力データと前記混合出力データとから入力さ
    れたベクトルと前記参照パターンとの適合度を決定する
    ことを特徴とする請求項1に記載の情報処理方法。
  3. 【請求項3】 前記決定された適合度に応じて、適合度
    の再計算を行う参照パターンを判別し、 該判別された参照パターンの適合度を再計算することを
    特徴とする請求項2に記載の情報処理方法。
  4. 【請求項4】 前記適合度の再計算は、より精密な計算
    により行うことを特徴とする請求項3に記載の情報処理
    方法。
  5. 【請求項5】 前記適合度の再計算は、全次元にわたり
    混合密度型の参照パターンの関数を構成する各関数が大
    きく異なる値を出力するものとして行うことを特徴とす
    る請求項2に記載の情報処理方法。
  6. 【請求項6】 参照パターンを構成する各関数がいずれ
    も近い値を出力すると判定される次元については参照パ
    ターンを構成する各関数の出力値の代表値を用いて、該
    参照パターンと学習用データとの適合度を計算し、 前記計算された適合度により該参照パターンが適当と判
    断される場合には、該参照パターンを認識用に記憶する
    ことを特徴とする請求項1に記載の情報処理方法。
  7. 【請求項7】 前記記憶された参照パターンを用いて入
    力パターンの認識を行うことを特徴とする請求項6に記
    載の情報処理方法。
  8. 【請求項8】 前記パターンは音声データを表すパター
    ンとすることを特徴とする請求項7に記載の情報処理方
    法。
  9. 【請求項9】 前記パターンは画像データを表すパター
    ンとすることを特徴とする請求項7に記載の情報処理方
    法。
  10. 【請求項10】 前記入力パターンは通信手段を介して
    入力したパターンとすることを特徴とする請求項7に記
    載の情報処理方法。
  11. 【請求項11】 前記認識の結果を出力することを特徴
    とする請求項7に記載の情報処理方法。
  12. 【請求項12】 入力値の各次元の値の代表値集合であ
    る量子化コードブックを設計する量子化コードブック設
    計手段と、 特徴ベクトル空間の次元を、混合密度型の参照パターン
    の関数を構成する個々の関数が大きく異なる値を出力す
    る次元と混合密度型の参照パターンの関数を構成する個
    々の関数がいずれも近い値を出力する次元とに分類する
    分類手段と、 前記分類された混合密度型の参照パターンの関数を構成
    する個々の関数が大きく異なる値を出力する次元につい
    て、前記量子化コードブックに記憶されている代表値に
    ついて出力値を計算し、単一出力テーブルとして記憶す
    る単一出力テーブル記憶手段と、 前記分類された混合密度型の参照パターンの関数を構成
    する個々の関数が近い値を出力する次元について、前記
    量子化コードブックに記憶されている代表値について出
    力値を計算し、混合出力テーブルとして記憶する混合出
    力テーブル記憶手段とを有することを特徴とする情報処
    理装置。
  13. 【請求項13】 入力された特徴ベクトルの各次元の値
    を、前記量子化コードブックを用いて量子化する量子化
    手段と、 前記参照パターンの関数を構成する個々の関数が大きく
    異なる値を出力する各次元について、前記単一出力テー
    ブルを参照して得た値を単一出力データとして累積する
    単一出力データ累積手段と、 前記参照パターンの関数を構成する個々の関数がいずれ
    も近い値を出力する各次元について、前記混合出力テー
    ブルを参照して得た値を混合出力データとして累積する
    混合出力データ累積手段と、 前記単一出力データと前記混合出力データとから入力さ
    れた特徴ベクトルと前記参照パターンとの適合度を決定
    する混合度決定手段とを有することを特徴とする請求項
    12に記載の情報処理装置。
  14. 【請求項14】 前記決定された適合度に応じて、適合
    度の再計算を行う参照パターンを判別する再計算参照パ
    ターン判別手段と、 該判別された参照パターンの適合度を再計算する歳計蚕
    種談とを有することを特徴とする請求項13に記載の情
    報処理装置。
  15. 【請求項15】 前記適合度の再計算は、より精密な計
    算により行うことを特徴とする請求項14に記載の情報
    処理装置。
  16. 【請求項16】 前記適合度の再計算は、全次元にわた
    り混合密度型の参照パターンの関数を構成する各関数が
    大きく異なる値を出力するものとして行うことを特徴と
    する請求項13に記載の情報処理装置。
  17. 【請求項17】 参照パターンを構成する各関数がいず
    れも近い値を出力すると判定される次元については参照
    パターンを構成する各関数の出力値の代表値を用いて、
    該参照パターンと学習用データとの適合度を計算する適
    合度計算手段と、 前記計算された適合度により該参照パターンが適当と判
    断される場合には、該参照パターンを認識用に記憶する
    参照パターン記憶手段とを有することを特徴とする請求
    項12に記載の情報処理装置。
  18. 【請求項18】 前記記憶された参照パターンを用いて
    入力パターンの認識を行う認識手段を有することを特徴
    とする請求項17に記載の情報処理装置。
  19. 【請求項19】 前記記憶された参照パターンを用いて
    入力パターンの認識を行う認識手段を有することを特徴
    とする請求項18に記載の情報処理装置方法。
  20. 【請求項20】 前記パターンは音声データを表すパタ
    ーンとすることを特徴とする請求項18に記載の情報処
    理装置。
  21. 【請求項21】 前記パターンは画像データを表すパタ
    ーンとすることを特徴とする請求項18に記載の情報処
    理装置。
  22. 【請求項22】 前記入力パターンを入力する通信手段
    を有することを特徴とする請求項18に記載の情報処理
    装置。
  23. 【請求項23】 前記認識の結果を出力する出力手段を
    有することを特徴とする請求項19に記載の情報処理装
    置。
JP15466195A 1995-06-21 1995-06-21 情報処理方法及び装置 Expired - Fee Related JP3450522B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP15466195A JP3450522B2 (ja) 1995-06-21 1995-06-21 情報処理方法及び装置
US08/666,219 US5706391A (en) 1995-06-21 1996-06-20 Method and an apparatus for processing information
EP96304580A EP0750273B1 (en) 1995-06-21 1996-06-20 Pattern recognition with a quantization codebook
DE69615288T DE69615288T2 (de) 1995-06-21 1996-06-20 Mustererkennung mit einem Quantisierungskodebuch

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15466195A JP3450522B2 (ja) 1995-06-21 1995-06-21 情報処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH096382A JPH096382A (ja) 1997-01-10
JP3450522B2 true JP3450522B2 (ja) 2003-09-29

Family

ID=15589130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15466195A Expired - Fee Related JP3450522B2 (ja) 1995-06-21 1995-06-21 情報処理方法及び装置

Country Status (4)

Country Link
US (1) US5706391A (ja)
EP (1) EP0750273B1 (ja)
JP (1) JP3450522B2 (ja)
DE (1) DE69615288T2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09258771A (ja) * 1996-03-25 1997-10-03 Canon Inc 音声処理方法及び装置
US6466894B2 (en) * 1998-06-18 2002-10-15 Nec Corporation Device, method, and medium for predicting a probability of an occurrence of a data
AU2186599A (en) * 1999-02-05 2000-08-25 Hitachi Limited Data processing system
US6424960B1 (en) 1999-10-14 2002-07-23 The Salk Institute For Biological Studies Unsupervised adaptation and classification of multiple classes and sources in blind signal separation
JP3814459B2 (ja) * 2000-03-31 2006-08-30 キヤノン株式会社 音声認識方法及び装置と記憶媒体
US6993452B2 (en) * 2000-05-04 2006-01-31 At&T Corp. Distance measure for probability distribution function of mixture type
JP4080236B2 (ja) * 2002-05-15 2008-04-23 株式会社リコー 射出成形の見積りシステム及び見積りプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2845018B2 (ja) 1992-03-31 1999-01-13 三菱電機株式会社 類似度演算装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5535305A (en) * 1992-12-31 1996-07-09 Apple Computer, Inc. Sub-partitioned vector quantization of probability density functions
US5592227A (en) * 1994-09-15 1997-01-07 Vcom, Inc. Method and apparatus for compressing a digital signal using vector quantization

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2845018B2 (ja) 1992-03-31 1999-01-13 三菱電機株式会社 類似度演算装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
小坂,嵯峨山,混合連続分布HMM音素モデルの構造自動決定法の検討,日本音響学会平成4年度秋季研究発表会講演論文集,日本,1992年10月 5日,2−1−1,Pages 79−80
小森,山田,山本,大洞,少数分布HMMによる出力確率推定に基づいた効率的な混合連続分布HMM音声認識,電子情報通信学会技術研究報告[音声],日本,1994年10月13日,Vol.94,No.271,SP94−52,Pages 31−38
山田,山本,小坂,小森,大洞,パラメータのスカラ量子化と混合分布HMMの次元独立演算による高速出力確率計算,電子情報通信学会技術研究報告[音声],日本,1995年 6月22日,Vol.95,No.122,SP95−22,Pages 31−38
渡辺,篠田,高木,山田,服部,磯,木構造確率分布を用いた音声認識,日本音響学会平成5年度秋季研究発表会講演論文集,日本,1993年10月 5日,1−8−7,Pages 13−14

Also Published As

Publication number Publication date
DE69615288T2 (de) 2002-06-27
JPH096382A (ja) 1997-01-10
EP0750273B1 (en) 2001-09-19
EP0750273A3 (en) 1997-06-18
DE69615288D1 (de) 2001-10-25
EP0750273A2 (en) 1996-12-27
US5706391A (en) 1998-01-06

Similar Documents

Publication Publication Date Title
US5812975A (en) State transition model design method and voice recognition method and apparatus using same
AU702903B2 (en) Speech recognition
CN111916111B (zh) 带情感的智能语音外呼方法及装置、服务器、存储介质
EP0847041B1 (en) Method and apparatus for speech recognition performing noise adaptation
JP2996926B2 (ja) 音素シンボルの事後確率演算装置及び音声認識装置
US7127393B2 (en) Dynamic semantic control of a speech recognition system
EP0706171B1 (en) Speech recognition method and apparatus
US6108628A (en) Speech recognition method and apparatus using coarse and fine output probabilities utilizing an unspecified speaker model
JP3412496B2 (ja) 話者適応化装置と音声認識装置
US6725196B2 (en) Pattern matching method and apparatus
EP1209659B1 (en) Method and apparatus for text input utilizing speech recognition
EP0617827A4 (en) Composite expert.
JP3450522B2 (ja) 情報処理方法及び装置
US6243695B1 (en) Access control system and method therefor
US6226610B1 (en) DP Pattern matching which determines current path propagation using the amount of path overlap to the subsequent time point
JPH11338491A (ja) 固有声に基いた最尤法を含む話者と環境適合化
EP1771841B1 (en) Method for generating and using a vector codebook, method and device for compressing data, and distributed speech recognition system
JPH08211889A (ja) 木構造を用いたパターン適応化方式
EP0688012B1 (en) A speech recognizer
JP3088357B2 (ja) 不特定話者音響モデル生成装置及び音声認識装置
JP3467556B2 (ja) 音声認識装置
JP2003535376A (ja) 分類システムの反復訓練用の方法と装置
JP2973805B2 (ja) 標準パターン作成装置
EP0731447A2 (en) Reference pattern training system and speech recognition system using the same
CN110782879A (zh) 基于样本量的声纹聚类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030624

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070711

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080711

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080711

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090711

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100711

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110711

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120711

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130711

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees