JPS63187376A

JPS63187376A - パタ−ン認識装置

Info

Publication number: JPS63187376A
Application number: JP62019861A
Authority: JP
Inventors: Toru Shimizu; 透清水
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1987-01-29
Filing date: 1987-01-29
Publication date: 1988-08-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業−■−の利用分野）本発明は、音声、文字等のパターンを認識する装置に関
する。

（従来の技術）従来、パターン認識装置では、認識すべき対象の特徴を
示すパターンを認識に先立ち予め作成、記憶しておき（
以下、このパターンを標準パターンと称する）、認識時
に入力されたパターン（以下、このパターンを入力パタ
ーンと称する）と比較処理（以下、マツチングと称する
）を行い、その差（以下、距離と称する）の最も小さい
標準パターンのカテゴリ名を認識結果とする方法が、多
く取られている。

音声信号を例にあげると、音声の特徴を示すパターンは
、バンドパス・フィルタ法、ケプストラム法、ヌルケプ
ストラム法、ＬＰＣ法等の分析方法で得られるベクトル
列の形で表されている（以下、このベクトル列を特徴ベ
クトル時系列と称する）。これらの分析法に関しては、
昭和５４年１０月、共立出版から出版された「音声認識
」の第１０７頁より第１０８頁に記載されている。

また、まえもって、多量の音声データにクラスタリング
を行って作成した代表的なベクトル（以下、そのベクト
ルをコードベクトル、コードベクトルの集合をコードフ
ックと称する）で、標準パターンの特徴ベクトル時系列
の各ベクトルを、代表させるというベクトル量子化法が
ある。このベクトル量子化法を用いると、標準パターン
の各ベクトルを、コードベクトルに対応した一次元の値
（以下、コードと称する）で表せるので、認識率をあま
り損なわずに記憶量を削減することができるのか知られ
ている。クラスタリングに関しては、昭和５８年３月、
コロナ社より出版されたｒノ（ターン情報処理」の第１
１３頁より第１２４頁に記載されている。

さらに、コードベクトルが作成されたクラスタ内のベク
トルから、各ベクトルの分布の状態を反映させて距離に
重み付けを行う重み行列（例えば、共分散行列）を求め
、各コードベクトルに対応させて記憶しておき、認識の
際の距離計算で距離に重み付けを行うことで、コードブ
ック作成の際の大量の音声データを有効に活用するとい
う方法が、昭和６１年特許願２５５４７８号に記載され
ている。

（発明が解決しようとする問題点）しかしながら、上記方法で求めた重み行列は、コードベ
クトルに対して最適なものであり、標準パターンの各ベ
クトルとコードベタ１〜ルの距離が大きい場合は、重み
行列が不適当で、かえって認識率の低下を招くおそれが
あった。

本発明の目的は、上記問題点に着目してなされたもので
、不適当な重み行列が用いられることをなくし、高い認
識率の得られるパターン認識装置を提供することにある
。

（問題点を解決するための手段）本願の第１の発明のパターン認識装置は、代表的なベク
トルであるコードベクトルを複数個記憶しておくコード
フック記憶部と、前記コードベクトルに対応した重み行
列を記憶しておく重み行列記憶部と、ベクトルの系列の
形で表される標準パターンを記憶する標準パターン記憶
部と、前記標準パターンの各ベクトルを前記コードブッ
ク記憶部に記憶されているコードベクトルでベタ１−ル
量子化した結果の量子化誤差とコードベクトルに対応し
たコードを出力するベクトル量子化部と、前記コードの
系列を記憶しておくコード系列記憶部と、前記標準パタ
ーンの各ベクトルにおける量子化誤差を記憶する童子化
誤差記憶部と、ベクトルの系列の形で表される入力パタ
ーンを記憶する入力パターン記憶部と、前記重み行列記
憶部におけるコードベクトルに対応した重み行列を用い
かつ前記量子化誤差記憶部の量子化誤差の大きなベクト
ルには重み付けの度合いを小さくするように前記入力パ
ターンのベクトルと前記標準パターンのベクトルとの重
み付け距離を計算する重み付け距離計算部と、前記入力
パターンと前記標準パターンとの系列を対応付けて前記
重み付け距離の累積和を計算する重み付け距離累積和計
算部と、前記重み付け距離累積和が最小となる標準パタ
ーンのカテゴリ名を認識結果とする判定部とから構成さ
れる。

また、本願の第２の発明のパターン認識装置は、代表的
なベクトルであるコードベクトルを複数個記憶しておく
コードブック記憶部と、前記コードベクトルに対応した
重み行列を記憶しておく重み行列記憶部と、ベクトル量
子化されて前記コードベクトルの系列の形で表された標
準パターンを記憶する標準パターン記憶部と、前記標準
パターンがベクトル量子化された際の量子化誤差を記憶
しておく量子化誤差記憶部と、ベクトルの系列の形で表
される入力パターンを記憶する入力パターン記憶部と、
前記重み行列記憶部におけるコードベクトルに対応した
重み行列を用いかつ前記量子化誤差記憶部の量子化誤差
の大きなベクトルには重み付けの度合いを小さくするよ
うに前記入力パターンのベクトルと前記標準パターンの
コードに対応するコードベクトルとの重み付け距離を計
算する重み付け距離計算部と、前記入力パターンと前記
標準パターンとの系列を対応付けて前記重み付け距離の
累積和を計算する重み付け距離累積和計算部と、前記重
み付け距離累積和か最小となる標準パターンのカテゴリ
名を認識結果とする判定部とから構成される。

（作用）本願発明の詳細な説明する。

コードブック作成時は、まず、多数のベクトル＝　７− の系列パターンをひとつひとつのベクトルに分解し、ベ
クトルごとにクラスタリングを行い、いくつかのクラス
タに分類する。そして、各クラスタの要素を代表するベ
クトルをコードベクトルとして記憶する。同時に、コー
ドベクトルが作成されたクラスタ内のベクトルから、各
ベクトルの分布の状態を反映させて距離に重み付けを行
う重み行列を求め、各コードベクトルに対応させて記憶
しておく。重み行列として考えられるものとしては、た
とえば、共分散行列があげられる。

そして、登録時は、標準パターンの特徴ベクトル系列の
各ベクトルにおいて、そのベクトルと最も似ている（距
離が小さい）コードベクトルを見付ける。そして、その
２つのベクトルの距離つまり量子化誤差を求める。

認識時は、入力パターンのベクトルと標準パターンのベ
クトルとの距離計算に際し、コードブック作成時に求め
たコードベクトルに対応した重み行列を用いて、距離に
重み付けをする。ただし、標準パターンの、各ベクトル
における量子化誤差の大きさに応じて、重み行列の用い
方を変える。つまり、量子化誤差の大きなベクトルには
、重み行列の影響が小さくなるような距離計算を行う。

その重み付けされた距離を用いて認識を行う。

標準パターンをそのまま用いるのが第１の発明、標準パ
ターンの各ベクトルをコードベクトルで置き換えるつま
りベクトル量子化を行うのが第２の発明である。

以上か、本願発明の作用である。

（実施例）以下、本Ｍ発明の実施例について図面を参照して説明す
る。

第１図は本願の第１の発明の一実施例である音声認識装
置のブロック図である。

マイクロホン１より入力された音声信号は、音声分析部
２において、たとえば特願昭５２−１４４２０５号明細
書及びその第３図に示された如き周波数分析器によって
、音声分析がなされ、ベクトルの時系列の形に変換され
る。

本装置は、コードブックと重み行列の作成を行う学習モ
ードと、標準パターンの登録を行う登録モードと、入力
パターンの認識を行う認識モードとで、動作が異なり、
スイッチ回路３で切り替える。

学習モードにおいて、スイッチ回路３は、音声分析部２
の出力が供給される端子りを接点Ａに接続する。学習用
の音声データのベクトル時系列は、学習部４に送られる
。第２図は、学習部４の詳細ブロック図である。ベクト
ル時系列は、ベクトル分解部４１に送られ、ひとつひと
つのベクトルに分解された後、クラスタリング部４２に
送られる。クラスタリング部４２では、各ベクトル間の
距離を基に、Ｋ平均アルゴリズムを用いて、おのおのベ
クトルをクラスタリンクする。クラスタリングやに平均
アルゴリズムに関しては、昭和５８年３月、コロナ社よ
り出版された「パターン情報処理」の第１１３頁から第
１２０頁に記載されている。クラスタリングか終了する
と、各クラスタごとに、逐次、そのクラスタに属するベ
クトルは、クラスタ内ベクトル記憶部４３に記憶される
。また、そのクラスタを代表するベクトルは、コードベ
クトルとしてコードブック記憶部５に記憶される。本実
施例においては、重み行列は、共分散行列とする。クラ
スタ内ベクトル記憶部４３のベクトルは、重み行列計算
部４４に送られ共分散行列が計算され、重み行列記憶部
６に記憶される。以上の動作かずべてのクラスタについ
て行われ、各クラスタを代表するベクトルがコードベク
トルとしてコードブック記憶部５に、それに対応する共
分散行列か重み行列記憶部６に、それぞれ記憶される。

登録モードにおいて、スイッチ回路３は端子りを接点Ｂ
に接続する。標準パターンのベクトル時系列は、標準パ
ターン記憶部７に記憶される。そして、ベクトル量子化
部８に送られ、そこでコードブック記憶部５のコードベ
クトルにベクトル量子化される。その結果であるコード
ベクトルに対応したコードの系列と量子化誤差か、量子
化誤差記憶部９に記憶される。なお、ベクトル量子化部
８における動作は、パターン処理の分野では、ベクトル
量子化法として周知の技術で、本発明の本質ではないの
で、詳細な説明は省く。

認識モードにおいて、スイッチ回路３は端子りを接点Ｃ
に接続する。入力パターンの特徴ベクトル時系列は、入
力パターン記憶部１０に記憶される。

そして、重み付け距離計算部１１において、標準パター
ン記憶部７に記憶されている特徴ベクトル時系列の各ベ
クトルと、入力パターン記憶部１０に記憶されている特
徴ベクトル時系列の各ベクトルとの重み付け距離を、量
子化誤差記憶部９に記憶されているコードの系列とそれ
に対応した量子化誤差と、重み行列記憶部６に記憶され
ている各コードに対応した共分散行列とを用いて計算す
る。たとえば、標準パターンの第ｊフレームにおける量
子化誤差Ωｊがある閾値０以上であるなら、従来どおり
のベクトル間距離を計算する。θ以下であるなら、重み
行列で重み付けした距離、本実施例においてはマハラノ
ビス距離を計算する。つまり、標準パターンの第ｊフレ
ームと入力パターンの第ｉフレームにおける重み付け距
！ｄ（ｉ、ｊ）は、となる。ただし、標準パターンの第
ｊフレームにおけるベクトルをＳｊ、そのベクトルの量
子化結果のコードベクトルに対応した重み行列記憶部６
の共分散行列を■ｊ、入力パターンの第ｉフレームのベ
クトルをＸｉとする。なお、記号Ｔは転置を示す。

各フレームにおける重み付け距離は、ＤＰ実行部１２に
送られる。ＤＰ実行部１２では、重み付け距離の全フレ
ームの和が最小（以下、この距離の和の最小値をＤＰ距
離と称する）となるような時間軸の正規化を、特願昭４
９−２４１８号記載の如く、動的計画法を利用して行う
。このアルゴリズムは、パターン認識の分野では、ＤＰ
マツチングとして周知の技術なので、詳細な説明は省く
。

各標準パターンに対するＤＰ距離は、逐次、判定部１３
に送られる。判定部１３では、それらＤＰ距離の最小値
を求め、その最小となった標準パターンのカテゴリ名を
認識結果として出力する。

本願の第２の発明の一実施例である音声認識装置をブロ
ック図で第３図に示す。第１図に示した本願の第１の発
明の実施例と異なる部分のみを説明する。

登録モードにおいて、登録される標準パターンは、まず
ベクトル量子化部８に送られ、ベクトル量子化される。

そして、標準パターンは、コードベクトルに対応したコ
ードの系列として、標準パターン記憶部７に記憶される
。また、量子化誤差は、量子化誤差記憶部９．に記憶さ
れる。

認識モードにおいて、重み付け距離計算部１１に送られ
る標準パターンの特徴ベクトル時系列の各ベクトルは、
標準パターン記憶部７に記憶されているコードの系列に
対応するコードブック記憶部５のコードベクトルとなる
。

その他の部分は、第１図を参照して説明した本願の第１
の発明の実施例と同じであるので、詳細は省く。

以上本願の各発明の原理を実施例に基づいて説明したが
、これらの記載は本願発明を限定するものではない。特
に、ＤＰ実行部１２で、時間軸の正規化を行う際、ＤＰ
マツチングを用いたか、特徴ベクトルの変化量を線形正
規化する方法、特徴抽出によりセグメンテーションを行
い時間軸正規化する方法等、その他の時間軸正規化法を
用いてもかまわない。

また、この実施例では、コードベクトルに対応する重み
行列を、クラスタ内のベクトルの共分散行列の逆行列と
していた。しかし、重み行列を、他にも、コードベクト
ルが作成されるクラスタの板肉分散を小さく板間分散を
大きくするような変換行列としても良いし、クラスタ内
のベクトルの分散もしくは標準偏差の逆数としても良い
。分散もしくは標準偏差の逆数とした場合は、重み行列
は、対角項以外は０となり、計算か簡単になる。

また、重み付け距離計算部１１で、重み付けの度合いを
、量子化誤差か閾値以上の場合のみ重み付け距離を用い
る方法をとったが、他にも、量子化誤差が大きくなるほ
ど重み行列の各要素が１に近づくような変換をおこなっ
ても良い。

さらに、この実施例では、重み付け距離を計算する際の
重み行列を標準パターンのコードに対応したものを用い
たか、入力パターンについても同様にベクトル量子化を
行い、入力パターンのコードに対応した重み行列を用い
ても良い。

なお、本願発明は、音声以外のパターン、つまり文字、
図形等のパターンを扱うパターン認識装置においても、
有効に適用できるのは明白である。

（発明の効果）以上に述べたとおり、本願発明によれば、コードブック
作成時のデータを有効に活用し、高い認識率の得られる
パターン認識装置を提供することができる。

【図面の簡単な説明】

第１図は本願の第１の発明の一実施例である音声認識装
置のブロック図、第３図は本願の第２の発明の一実施例
である音声認識装置のブロック図、第２図はこれら再実
施例で用いる学習部４の詳細ブロック図である。１・・・マイクロホン、２・・・音声分析部、３・・・
スイッチ回路、４・・・学習部、４１・・・ベクトル分
解部、４２・・・クラスタリング部、４３・・・クラス
タ内ベクトル記憶部、４４・・・重み行列計算部、５・
・・コードブック記憶部、６・・・重み行列記憶部、７
・・・標準パターン記憶部、８・・・ベクトル量子化部
、９・・・量子化誤差記憶部、１０・・・入力パターン
記憶部、１１・・・重み付け距離計算部、１２・・・Ｄ
Ｐ実行部、１３・・・判定部。

Claims

【特許請求の範囲】

（１）代表的なベクトルであるコードベクトルを複数個
記憶しておくコードブック記憶部と、前記コードベクト
ルに対応した重み行列を記憶しておく重み行列記憶部と
、ベクトルの系列の形で表される標準パターンを記憶す
る標準パターン記憶部と、前記標準パターンの各ベクト
ルを前記コードブック記憶部に記憶されているコードベ
クトルでベクトル量子化した結果の量子化誤差とコード
ベクトルに対応したコードを出力するベクトル量子化部
と、前記コードの系列を記憶しておくコード系列記憶部
と、前記標準パターンの各ベクトルにおける量子化誤差
を記憶する量子化誤差記憶部と、ベクトルの系列の形で
表される入力パターンを記憶する入力パターン記憶部と
、前記重み行列記憶部におけるコードベクトルに対応し
た重み行列を用いかつ前記量子化誤差記憶部の量子化誤
差の大きなベクトルには重み付けの度合いを小さくする
ように前記入力パターンのベクトルと前記標準パターン
のベクトルとの重み付け距離を計算する重み付け距離計
算部と、前記入力パターンと前記標準パターンとの系列
を対応付けて前記重み付け距離の累積和を計算する重み
付け距離累積和計算部と、前記重み付け距離累積和が最
小となる標準パターンのカテゴリ名を認識結果とする判
定部を有することを特徴とするパターン認識装置。
（２）代表的なベクトルであるコードベクトルを複数個
記憶しておくコードブック記憶部と、前記コードベクト
ルに対応した重み行列を記憶しておく重み行列記憶部と
、ベクトル量子化されて前記コードベクトルの系列の形
で表された標準パターンを記憶する標準パターン記憶部
と、前記標準パターンがベクトル量子化された際の量子
化誤差を記憶しておく量子化誤差記憶部と、ベクトルの
系列の形で表される入力パターンを記憶する入力パター
ン記憶部と、前記重み行列記憶部におけるコードベクト
ルに対応した重み行列を用いかつ前記量子化誤差記憶部
の量子化誤差の大きなベクトルには重み付けの度合いを
小さくするように前記入力パターンのベクトルと前記標
準パターンのコードに対応するコードベクトルとの重み
付け距離を計算する重み付け距離計算部と、前記入力パ
ターンと前記標準パターンとの系列を対応付けて前記重
み付け距離の累積和を計算する重み付け距離累積和計算
部と、前記重み付け距離累積和が最小となる標準パター
ンのカテゴリ名を認識結果とする判定部を有することを
特徴とするパターン認識装置。