JPS613200A

JPS613200A - 音声認識装置

Info

Publication number: JPS613200A
Application number: JP59123443A
Authority: JP
Inventors: 曜一郎佐古; 雅男渡; 誠赤羽; 平岩　篤信
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1984-06-15
Filing date: 1984-06-15
Publication date: 1986-01-09
Anticipated expiration: 2009-04-27
Also published as: JPH0632022B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は音声をｇ＆１Ｉｌｉする音声認識装置に関する
。

背景技術とその問題点従来、音声の発声速度変動に対処した音声認識装置とし
て例えば特開昭５０−“９６１０４号公報に示されるよ
うなりＰマツチング処理を行なうようにしたものが提案
されている。

先ず、このＤＰマツクチグ処理にて音声認識を行なうよ
うにした音声認識装置について説明する。

第１図において、（１）は音声信号人力部としてのマイ
クロホンを示し、このマイクロホン（１）からの音声信
号が音響分析部（２）に供給され、この音響分析部（２
）にて音響パラメータ時系列Ｐｉ（ｎｌが得られる。

この音響分析部（２１において例えばバンドパスフィル
タバンクの整流平滑化出力が音響パラメータ時Ｍ列Ｐｉ
（ｎｌ　（ｉ　＝　ｌ、・・・・＋Ｉ；　Ｉはバンドパ
スフィルタバンクのチャンネル数、ｎ−１，・・・・、
Ｎ、Ｎは音声区間判定により切り出されたフレーム数で
ある。）として得られる。

この音響分析部（２）の音響パラメータ時系列Ｐｉ（ｎ
ｌがモード切換スイッチ（３）により、登録モードにお
いては認識対象語毎に標準パターンメモリ（４）に格納
され、認識モードにおいてはＤＰマツチング距距離針部
部５）の一端に供給される。又、この認識モードにおい
ては標準パターンメモ■月荀に格納されている標準パタ
ーンがＤＰマツチング距距離針部部５）の他端に供給さ
れる。

このＤＰマツクチグ距離計算部（５）にてその時入力さ
れている音声の音響パラメータ時系列Ｐｉ（ｎ）よりな
る入力パターンと標準パターンメモリ（４）の標準パタ
ーンとのＤＰマツクチグ距離計算処理がなされ、このＤ
Ｐマツクチグ距離計算部（５）のＤＰマツクチグ距離を
示す距離信号が最小距離判定部（６）に供給され、この
最小距離判定部（６）にて入力パターンに対してＤＰマ
ツクチグ距離が最小となる標準パターンが判定され、こ
の判定結果より入力音声を示す認識結果が出力端子（７
）に得られる。

ところで、一般に標準パターンメモリ（４＋に格納され
る標準パターンのフレーム数Ｎは発声速度変動や単語長
の違いにより異なっている。ＤＰマツクチグ処理により
この発声速度変動や単語長の違いに対処する為の時間軸
正規化がなされる。

以下、このＤＰマツクチグ処理について説明する。ここ
で、簡単の為に音響パラメータ時系列Ｐｉ（ｎｌの周波
数軸方向ｌに対応する次元を省略して標準パターンのパ
ラメータ時系列をｂ１＋　　・・・・。

ｂＮ・入力パターンのパラメータ時系列をａｌｔ・・・
・、ａＭとして、端点固定のＤＰ−パスの場合のＤＰマ
ツクチグ処理について説明スる。

第２図はＤＰマツクチグ処理の概念図を示し、横軸に人
力パラメータＣＭ　−１９）が並べられ、縦軸に標準パ
ラメータ（Ｎ−１２）が並べられ、この第２図に示す（
Ｍ、　Ｎ）格子状平面に於ける・点はＭＸＮ個であり、
この各・点に１つの距離が対応する。例えばａ３とｂ５
との距離がａ３から縦に伸した直線と、ｂ５から横に伸
した直線との交点に位置する・に対応する。この場合、
距離として例えばチェビシェフ距離を取れば、ａ３とｂ
５とのチェビシェフ距ｆ＠ｄ　（３，５）はとなる（こ
の場合、周波数軸方向五に対応する次元を省略している
ので１−１である。）、そして、端点固定のＤＰ−バス
として、格子点（ｍ、ｎ）に対してこの格子点（ｍ、ｎ
）に結びつける前の状態として左側の格子点（ｍ−１，
ｎ）、斜め左下側の格子点（ｍ−１，ｎ−１）及び下側
の格子点（ｍ、ｎ−１）の３つ乃だけを許した場合、始
点、即ちａｌとｂｌとのチェビシェフ距離Ｄ　ｓ’ｓを
ボす点■から出発し、パス（経路）として３方向力を選
び、終点、即ちａＭとｂＮとのチェビシェフ距［ｄ　（
Ｍ、Ｎ）を示す点■に至るバスで、通過する各格子点の
距離の総和が最小になるものを求め、この距離の総和を
人力パラメータ数Ｍと標準パラメータ数Ｎとの和より値
１を減算した（Ｍ＋Ｎ−１）にて除算して得られた結果
が入力パターンのパラメータ時系列ａｌ＋　・・・・、
ａＭと標準パターンのパラメータ時系列ｂｘ、　・・・
・ｒｂＮとのＤＰマツクチグ距離となされる。この様な
処理を不す初期条件及び漸化式は初期条件ｇ　（１，１）＝ｄ　（１，１）漸化式と表され、これよりＤＰマツクチグ距離Ｄ　（Ａ、Ｂ）
Ｄ　　（Ａ、Ｂ）＝ｇ　　（Ｍ、Ｎ）／　　（Ｍ＋Ｎ−
１）と表される（（Ｍ十Ｎ−１）でｇ　（Ｍ、Ｎ）を割
っているのは標準パターンのフレーム数Ｎの違いによる
距離の値の差を補正するためである。）。

この様な処理により標準パターンの数がＬ個ある場合に
は入力パターンに対するＤＰマツクチグ距離がＬ個求め
られ、このＬ個のＤＰマツクチグ距離中最小の距離とな
る標準パターンが認識結果となされる。

この様なりＰマツチング処理による音声認識装置によれ
ば発声速度変動や単語長の違いに対処、即ち時間軸正規
化のなされた音声ｇ織を行なうことができる。

然し乍ら、この様なりＰマツチング処理により音声認識
を行なうものにおいては、音声の定常部がＤＰマツクチ
グに！＋Ｊに大きく反映し、部分的に類似しているよう
な語い間に於いて誤認識し易いということが明らかとな
った。

即ち、音響パラメータ時系列Ｐｉ（ｎ）はそのパラメ−
夕空間で軌跡を描くと考えることができる。実際には各
フレームｎのパラメータがパラメータ空間内の１点に対
応することから、点列ではあるが時系列方向に曲線で結
んでいくと始点から終点迄の１つの軌跡が考えられる。

例えば２棟類の単語“ＳＡＮ”と“ＨＡＩ″とを登録し
た場合、夫々の標準パターンＡ’、Ｂ’は８３図に示す
如く１Ｓ”、′Ａ”、“Ｎ″、６Ｈ”、′Ａ″、１１゛
の各音韻領域を通過する軌跡を描く。そして、認識モー
ドで“ＳＡＮ”と発声した場合、全体的にみれば入力パ
ターンＡに対する標準パターンＢ′の類似する部分は非
常に少ないが、この入力パターンＡの“ＳＡＮ”の“Ａ
”の部分が標準パターンＡ′の“ＳＡＮ″のＡ”の部分
より標準パターンＢ′の’　Ｉ　Ａ　Ｉ”のａＡｌの部
分により類似し、且つその部分（準定常部）に点数が多
い場合がある。

ここで、第３図に示す如く入力パターンＡのパラメータ
が全体的には檜準パターンＡ′のパラメータに類似し、
部分的には標準パターンＢ′のパラメータに類似する場
合にＤＰマツクチグ処理により誤認識を招く場合を１次
元パラメータを例に説明する。この場合、第３図に承ず
状況、即ち部分的に類似している語い間の関係と同様の
１次元パラメータ時系列として第４図に示す如き入力パ
ターンＡ　ｉ　２．４．６．８．８．８．８．６．４．
４．４．６゜８と、第５図に不ず如き標準パターンＡ’
ｉ３，５゜７、９．９．９．９．７．５．５．７．９と
、第６図に示す如き標準パターンＢ’　　ｉ　７．６．
６．８．８．８．８．６゜４、４．４とを考える。これ
ら第４図乃至第６図のパターンより明らかな如く入力パ
ターンＡは標準パターンＡ′と判定されて欲しいパター
ンである。

ところが、入力パターンＡに対する標準パターンＡ′及
びＢ′のＤＰマツクチグ距離を針部すると、入力パター
ンＡは標準パターンＢ′に近いことが示される。

即ち、入力パターンＡに対する標準パターンＡ′のＤＰ
マツクチグ処理として第２図と同様、第７図に示す如く
横軸に入力パターンへのパラメータ時系列ｉ　２．４．
６．８．８．８．８．６．４．４．４．６゜８を並べ、
縦軸に標準パターンＡ′のパラメータ時系列；　３．５
．７．９．９．９．９．７．５．５．７．９を並べ、格
子状平面に於ける交点に対応して入力パターンＡの個々
のパラメータに対する標準パターンＡ′の個々のパラメ
ータのチェビシェフ距離を求める。そして、入力パラメ
ータＡのパラメータ時系列の第１番目のパラメータ２と
、標準パラメータＡ′のパラメータ時系列の第１番目の
パラメータ３とのチェビシェフ化［ｄ　（１，１）＝１
の点を始点とし、入力パターンＡのパラメータ時系列の
第１３番目のパラメータ８と、標準パターンＡ′のパラ
メータ時系列の第１２番目のパラメータ９とのチェビシ
ェフ化Ｍｄ　（１３，１２）　−１の点を終点とし、Ｄ
Ｐ−バスとして第２図の場合と同様、任意の点に対する
前の状態としてその任意の点の左側の点、下側の点及び
斜めノＬ下側の点を取ることを許した場合（このバスを
実線矢印にて示す。）、バス上の点はｄ　　（１，１）
−ｄ　　（２，２）　−ｄ（３，３）−ｄ　（４，４）
−ｄ　（５，５）−ｄ（６，６）−ｄ　（７，７）−ｄ
　（８，８）−ｄ（９，９）　　−ｄ　　（１０，１０
）　　−ｄ　　（１１，１０）　　−ｄ（１２，１０）
　　−ｄ　　（１３，１１）　　−ｄ　　（１３，１２
）の１４点であり、その距離の総和は２４であり、この
ＤＰマンチング距離Ｄ　（Ａ、Ａ’）は１である。

一方、人カバターンＡに対する標準パターンＢ′のＤＰ
マツクチグ処理を上述第７図に示す場合と同様、第８図
に小才如く行なう。即ち、入力パターンＡの個１／のパ
ラメータ；　２．４．６．８．８．８゜８、６．４．４
．４．６．８に対する標準パターンＢ′の個個のパラメ
ータ；　７．６．６．８．８．８．８．６゜４、４．４
のチェビシェフ距離を求め、ＤＰ−バスとして任意の点
に対する前の状態としてその任意の点の左側の点、Ｆ側
の点及び斜め左下側の点を取ることを許した場合（この
バスを実線矢印にてボす。）、パス上の点はｄ　（１，
１）　−ｄ　（２，２＞−ｄ　（３，３）　−ｄ　（４
，４）−ｄ　（５，５）−ｄ　（６，６）−ｄ　（７，
７）−ｄ　（８，８）−ｄ（９，９）　−ｄ　（１０，
１０）　−ｄ　（１１，１１）　−ｄ（１２，１１）　
−ｄ　（１３，ｌ’ｌ）の１３点であり、その距離の総
和は１５であり、このＤＰマツチング距１ｉＤ（Ａ、Ｂ
’）は０．６５である。

このＤＰ−バスを３方向乃とした結果より明らかな様に
入力パターンＡがそのＤＰマツクチグ距離の小さな標準
パターンＢ′と判定され、判定されるべき結果が得られ
ない。この様にＤＰマツクチグ処理においては部分的に
類似しているような語い間に於いて誤認識し易い。

又、ＤＰマツクチグ処理においては上述した様に標準パ
ターンのフレーム数Ｎが不定であり、しかも入力パター
ンに対して全標準パターンをＤＰマツクチグ処理する必
要があり、語いが多くなるとそれに伴って演算量が飛躍
的に増加し、標準パターンメモ１月４）の記憶容量や演
算量の点で問題があった。

この為、部分的に類似しているようなｉ＆い間に於いて
も誤認識することが比較的少なく、且つ標準パターンメ
モリ（４）の記憶容量や処理の為の演算量が比較的少な
い音声認識装置として第９図に示す如きものが考えられ
ている。

第９図において０、（１）は、音声信号入力部としての
マイクロホンを示し、このマイクロホンｆｌｌからの音
声信号を音響分析部（２）の増幅器（８）に供給し、こ
の増幅器（８）の音声信号をカットオフ周波数５．５Ｋ
Ｈｚのローパスフィルタ（９）を介してサンプリング周
波数１２．５ＫＨｚの１２ビツトＡ／Ｄ変換器Ｏ１に供
給し、このＡ／Ｄ変換器Ｏ１のデジタル音声信号を１５
チヤンネルのデジタルバンドパスフィルタバンク（ＩＩ
Ａ　）　、　’（ｌ１ｇ　）　、　”、　　（ｌｌｏ　
）に供給する。

この１５チヤンネルのデジタルバンドパスフィルタバン
ク　（１１＾）　、　　ＣＩＩＦ＋）　、・・・・、　
　（ｌｌｏ）は例えばバターワース４次のデジタルフィ
ルタにて構成し、２５０Ｈｚから５．５ＫＨｚまでの帯
域が対数軸上で等間隔となるように割り振られている。

そして、各デジタルバンドパスフィルタ（１１＾）、（
１１Ｂ）。

・・・・、（ｌｌｏ）の出力信号を１５チヤンネルの整
流器（１２Ａ）　、　　（１２ｓ）　、　・・・・、　
　（１２ｏ）に夫々供給し、これら整流器（１２＾）、
（１２８）、・・・・。

（１２ｏ）の２乗出力を１５チヤンネルのデジタルロー
パスフィルタ（１３＾）、（１３ｅ）、・・・・、（１
３ｏ）に夫々供給する。これらデジタルローパスフィル
タ（１３＾）　、　　（１３Ｂ）　、・・・・、（１３
ｏ）はカットオフ周波数５２．８ＨｚのＦＩＲ（有限イ
ンパルス応答形）ローパスフィルタにて構成する。

そして、各デジタルローパスフイルり（１３八）。

（１３Ｂ）、・・・・、（１３ｏ）の出力信号をサンプ
リング周期５．１２＋ｍｓのサンプラー（１４）に供給
する。

このサンプラー（１４）によりデジタルローパスフィル
タ　（１３＾）、（１３日）、・・・・、（１３ｏ）の
出力信号をフレーム周期５．１２ａ＋ｓ毎にサンプリン
グし、このサンプラー（１４）のサンプリング信号を音
源情報正規化器（１５）に供給する。この音源情報正規
化器（１５）は認識しようとする音声の話者による声帯
音源特性の違いを除去するものである。

即ち、フレーム周期毎にサンプラー（１４）から供給さ
れるサンプリング信号Ａｉ（ｎｌ　（１−１＋・・・・
。

１５；ｎ：フレーム番号）に対してＡｉ（ｎｌ＝　　ｌｏｇ　（＾１（ｎｌ＋Ｂ）・・Ｉｌ
ｌなる対数変換がなされる。このｔｉｔ式において、Ｂ
はバイアスでノイズレベルが隠れる程度の値を設定する
。そして、声帯音源特性をｙｉ　＝ａ　−ｉ＋ｂなる式
で近似する。このａ及びｂの計数は次式により決定され
る。

（Ｎ　−１５）　　　　・・・　（２）（Ｎ＝１５）　
　　　・・・　（３）そして、音線の正規化されたパラメータをＰ　ｉ　（ｎ
ｌとすると、ａ（ｎ）＜ＱのときパラメータＰｉ（ｎ）
はＰｉ（ｎｌ＝Ａｉ（ｎｌ　　（ａ（ｎｌ　・ｉ　＋　
ｂ（ｎｌｌ　　　・・・（４１と表わされる。

又、ａ　（ｎｌ上０のときレベルの正規化のみ行ない、
パラメータＰｉ（ｎｌは・・・　（５）と表わされる。

この様な処理により声帯音源特性の正規化されたパラメ
ータＰｉｆｎｌを音声区間内パラメータメモリ（１６）
に供給する。この音声区間内パラメータメモリ　（１６
）は後述する音声区間判定部（１７）からの音声区間判
定信号を受けて声帯音源特性の正規化されたパラメータ
Ｐｉｌｎｌを音声区間毎に格納する。

一方、Ａ／Ｄ変換器ＯＩのデジタル音声信号を音声区間
判定部（１７）のゼロクロスカウンタ（１８）及びパワ
ー算出器（１９）に夫々供給する。このゼロクロスカウ
ンタ（１８）は５．１２ｏ＋ｓ毎にその区間の６４点の
デジタル音声信号のゼロクロス数をカウントし、そのカ
ウント値を音声区間判定器（２０）の第１の入力端に供
給する。又、パワー算出器（１９）は５．１２ｍ５毎に
その区間のデジタル音声信号のパワー、即ち２乗和を求
め、その区間内パワーを示すパワー信号を音声区間判定
器（２０）の第２の入力端に供給する。更に、音源情報
正規化器（１５）の音源正規化情ｆｉＩｌａ　ｌｎ）及
びｂ　（ｎｌを音声区間判定器（２０）の第３の入力端
に供給する。そして、音声区間判定器（２０）において
はゼロクロス数、区間内パワー及び音源正規化情報ａ　
（ｎｌ、　　ｂｌｎｌを複合的に処理し、無音、無声音
及び有声音の判定処理を行ない、音声区間を決定する。

この音声区間判定器（２０）の音声区間を示す音声区間
判定信号を音声区間判定部（１７）の出力として音声区
間内パラメータメモリ　（１６）に供給する。

この音声区間内パラメータメモリ　（１６）に格納され
た音声区間毎に一帯音源特性の正規化された音響パラメ
ータＰｉ（ｎｌをその時系列方向にＮＡＴ（Ｎｏｒｍａ
ｌｉｚａｔｉｏｎ　Ａｌｏｎｇ　Ｔｒａｊｅｃｔｏｒｙ
）処理部（２１）に供給する。このＮＡＴ処理部（２１
）は　ＮＡＴ処理として音響パラメータ時系列Ｐｉ（ｎ
）からそのパラメータ空間における軌跡を直線近位にて
推定し、この軌跡に沿って直線補間にて新たな音響パラ
メータ時系列Ｑｉｌ＋ｎｌを形成する。

ここで、このＮＡＴ処理部（２１）について更に説明す
る。音響パラメータ時系列Ｐｉ＋ｎ）　（ｉ　−１，・
・・・＋Ｉ；　ｎ　”’　１＋・・・・、Ｎ）はそのパ
ラメータ空間に点列を描く。第１０図に２次元パラメー
タ空間に分布する点列の例を示す。この第１０図に示す
如く音声の非定席部の点列は粗に分布し、準定雷部は密
に分布する。この事は完全に定常であればパラメータは
変化せず、その場合には点列はパラメータ空間に停留す
ることからも明らかである。

第１１図は第１０図に不ず如き点列上に滑らかな曲線よ
りなる軌跡を推定し描いた例を示す。この第１１図に示
す如く点列に対して軌跡を推定できれば、音声の発声速
度変動に対して軌跡は殆ど不変であると考えることがで
きる。何故ならば、音声の発声速度変動による時間長の
違いは殆どが準定富部の時間的伸縮（第１Ｏ図にボず如
き点列におい“ζは準定常部の点列密度の違いに相当す
る。）に起因し、非定席部の時間長の影響は少ないと考
えられるからである。

ＮＡＴ処理部（２１）においてはこの様な音声の発声速
度変動に対する軌跡の不変性に着目して時間軸正規化を
行なう。

即ち、第１に音響パラメータ時系列Ｐｉ（ｎｌに対して
始点Ｐｉｆｌｌから終点Ｐｉ（Ｎ）迄を連続曲線で描い
た軌跡を推定し、この軌跡を示す曲線をＰｉ（ｓｌ（０
≦Ｓ≦Ｓ）とする。この場合、必ずしも’Ｐ’１ｆＯ）
　＝　Ｐ　１（１１。

点列全体を近似的に通過するようなものであれば良い。

第２に推定されたｐｉ（ｓｌから軌跡の長さＳＬを求め
、第１２図にＯ印にて示す如く軌跡に沿って一定長で新
たな点列をリサンプリングする。例えばＭ点にサンプリ
ングする場合、一定長さ、即ちリサンプリング間隔Ｔ＝
ＳＬ／（Ｍ−１）を基準として軌跡上をリサンプリング
する。このリサンプリングされた点列を（ｌｉ−（ｉ＝
１．・・・・、Ｉ；ｍ＝１．・・・・、静この様にして
得られた新たなパラメータ時系列Ｑｉｆｍは軌跡の基本
情報を有しており、しかも音声の発声速度変動に対して
殆ど不変なパラメータとなる。即ち、新たなパラメータ
時系列Ｑｉ（（２）は時間軸正規化がなされたパラメー
タ時系列となる。

この様な処理の為に、音声区間内パラメータメモリ　（
１６）の音響パラメータ時系列Ｐｉ（ｎ）を軌跡長算出
器（２２）に供給する。この軌跡長算出器（２２）は音
響パラメータ時系列Ｐｉ（ｎｌがそのパラメータ空間に
おいて描く直線近似による軌跡の長さ、即ち軌跡長を算
出するものである。この場合、■次元ベクトルａ１及び
ｂｉ間の距離として例えばユークリッド距離Ｄ　　（ａ
ｉ、ｂｉ）をとれば・　・　・　　（６）である。尚、この距離としてはチェビシェフ距離、平方
距離等をとることを可とする。そこで、■次元の音響パ
ラメータ時系列ＰＨｎ）　（ｉ　＝　１．・・・・＋Ｉ
ｉｎ　”’　１　＋・・・・、Ｎ）より、直線近似によ
り軌跡を推定した場合の時系列方向に隣接するパラメー
タ間距＊　Ｓ　（ｎ）は５（ｎｌ−Ｄ　（Ｐｉ　（ｎｌｘ　）　、　Ｐｉ（ｎｌ
）　　（ｆｉ＝Ｌ・−・−、Ｎ−１・　・　・　　（７
）と表わされる。そして、時系列方向における第１番目の
パラメータＰｉ（１）から第ｎ番目のパラメータＰｉ（
ｎｌ迄の距ＭｓＬｔｎ）はｎ’＝１と表わされる。向、ＳＬ＋１１　＝　０である。更に、
軌跡長ＳＬはと表わされる。軌跡長算出器（２２）はこの（７）式、
（８）式及び（９）式にＣ示す信号処理を行なう如くな
す。

この軌跡長算出器（２２）の軌跡長ＳＬを示す軌跡長信
号を補間間隔算出器（２３）に供給する。この補間間隔
算出器（２３）は軌跡に沿って直線補間により新たな点
列をリサンプリングする一定長のりサンプリング間隔Ｔ
を算出するものである。この場合、Ｍ点にリサンプリン
グするとすれば、リサンプリング間隔ＴはＴ−５Ｌ／　（Ｍ−１）　　　　　　　　・・・　Ｏｌ
と表わされる。補間間隔算出器（２３）はこの０１式に
て示す信号処理を行なう如くなす。

この補間間隔算出器（２３）のりサンプリング間隔Ｔを
示すリサンプリング間隔信号を炉間点抽出器（２４）の
一端に供給すると共に音声区間内パラメータメモリ　（
１６）の音響パラメータ時系列Ｐｉｉｎｌを補間点抽出
器（２４）の他端に供給する。この補間点抽出器（２４
）は音響パラメータ時系列Ｐｉｆｎｌのそのパラメータ
空間における軌跡例えばパラメータ間を直線近似した軌
跡に沿ってリサンプリング間隔Ｔで新たな点ダ１ｒをリ
サンプリングし、この新たな点列より新たな音響パラメ
ータ時系列０Ｎ（２）を形成するものである。

ここで、この補間点抽出器（２４）における信号処理を
第１３図に示す流れ図に沿って説明する。先ず、ブロッ
ク（２４ａ）にてリサンプリング点の時系列方向におけ
る番号を示す変数Ｊに値１が設定されると共に音響パラ
メータ時系列Ｐｉ（ｎｌの時系列方向における番号を示
す変数ＩＣに値１が設定される。そして、ブロック（２
４ｂ）にて変数Ｊがインクリメントされ、ブロック（２
４ｃ）にてそのときの変数Ｊが（Ｍ−１）以トであるか
どうかにより、そのときのりサンプリング点の時系列方
向における番号がリサンプリングする必要のある最後の
番号になっていないかどうかを判断し、なっていればこ
の補間点抽出器（２４）の信号処理を終ｒし、なってい
なければブロック（２４ｄ　）にて第１番目のりサンプ
リング点から第３番目のりサンプリング点までのりサン
プル距＃ＤＬが算出され、ブロック（２４ｅ）にて変数
ＩＣがインクリメントされ、ブロック（２４ｆ　）にて
リサンプル距離［ＩＬが音響パラメータ時系列Ｐｉｆｎ
）の第１番目のパラメータＰｉｌｌｌから第１Ｃ番目の
パラメータＰｉ（Ｉｃ）までの距Ｉｔ　ＳＬ（＋ｃ　）
よりも小さいかどうかにより、そのときのりサンプリン
グ点が軌跡上においてそのときのパラメータＰｉ（ＩＣ
）よりも軌跡の始端側に位置するかどうかを判断し、位
置し°Ｃいなければブロック（２４ｅ　）にて変数ＩＣ
をインクリメントした後再びブロック（２４ｆ　）にて
リサンプリング点とパラメータＰＨ＋ｃ）との軌跡上に
おける位置の比較有し、リサンプリング点が軌跡上にお
いてパラメータＰｉ（１ｃ）よりも始端側に位置すると
判断されたとき、ブロック（２４，）にてリサンプリン
グにより軌跡に沿う新たな音響パラメータＤｉ（Ｊ）が
形成される。即ち、先ず第３番目のりサンプリング点に
よるリサンプル距ＭＤＬからこの第Ｊ＃ｒ目のりサンプ
リング点よりも始端側に位置する第（ＩＣ−１）番目の
パラメータＰｉ（＋ｃ−ｔ）による距離５Ｌ（ＩＣ−１
）を減算して第（ＩＣ−１）番目のパラメータＰｊＯｃ
−１１から第３番目のりサンプリング点迄の距離ＳＳを
求める。次に、軌跡上においてこの第３番目のりサンプ
リング点の両側に位置するパラメータＰｉ（ｒｅ−ｔ）
及びノくラメータＰｉ（Ｉｃ）間の距離Ｓ　Ｑｃ　−１
）　、　（この距離Ｓ（Ｉｃ−１）は（７）式にてボさ
れる信号処理にて得られる。）にてこの距離ＳＳを除算
ＳＳ／　Ｓ　（ＩＧ−１）　Ｌ、この除算結果ＳＳ／　
Ｓ　（ＩＧ−１）に軌跡上において第３番目のりサンプ
リング点の両側に位置するパラメータＰ　ｋＯｃ　）と
ＰｉＯｃ−ｘ）との差（Ｐｉ（Ｉｃ）−Ｐ　１（ｌｃ　
−１１）を掛算（Ｐｉ（Ｉｃ）　’−Ｐｉ（ＩＣ−１）
）　＊　３５／　Ｓ　（Ｉｃ−１）して、ｖＬ跡上にお
いて第３番目のりサンプリング点のこのリサンプリング
点よりも始端側に隣接して位置する第（ＩＣ−１）番目
のパラメータＰｉ（＋ｃ−ｔ）からの補間量を算出し、
この補間量と第３番目のりサンプリング点よりも始端側
に隣接して位置する第（ＩＣ−１）番目のパラメータＰ
ｉ（ＩＣ−１）とを加算して、軌跡に沿う新たな音響パ
ラメータＱｉ（Ｊ）が形成される。第１４図に２次元の
音響パラメータ時系列Ｐ（１１，Ｐ（２１，・・・・、
Ｐ（８１に対してパラメータ間を直線近似して軌跡を推
定し、この軌跡に沿って直線補間により６点の新たな音
響パラメータ時系列Ｑ　（１１、Ｑ　（２１、・・・・
’、　Ｑ（６１を形成した例を示す。

又、このブロック（２４ｇ）においては周波数系列方向
にＩ次元分（ｉ−１，・・・・、Ｉ）の信号処理が行な
われる。

である。）を除＜　　ＣＭ−２）点のりサンプリングに
より新たな音響パラメータ時系列Ｑ！（ホ）が形成され
る。

このＮＡＴ処理部（２１）の新たな音響パラメータ時系
列Ｏ１（ホ）をモード切換スイッチ（３）により、登録
モードにおいては認識対象梧毎に標準パターンメモ１月
４）に格納し、認識モードにおいてはチェビシェフ距離
算出部（２５）の一端に供給する。又、この認識モード
においては標準パターンメモ１月４）に格納されている
標準パターンをチェビシェフ距離算出部（２５）の他端
に供給する。このチェビシェフ距離算出部（２５）にお
いてはその時入力されている音声の時間軸の正規化され
た新たな音響パラメータ時系列Ｑｉ＋（２）よりなる人
カバターンと、標準パターンメモ１月４）の標準パター
ンとのチェビシェフ距離算出処理がなされる。

そして、このチェビシェフ距離を示す距離信号を最小距
離判定部（６）に供給し、この最小距離判定部（６）に
て入力パターンに対するチェビシェフ距離が最小となる
標準パターンが判定され、この判定結果より入力音声を
示す認識結果を出力端子（７）に供給する。

この様にしてなる音声ｇ＆ｌｌｉ装置の動作について説
明する。

マイクロホン（１）の音声信号が音響分析部（２）に゛
ζ音声区間毎に声帯音源特性の正規化された音響パラメ
ータ時系列Ｐｉｆｎｌに変換され、この音響パラメータ
時系列ＰｉｌｎｌがＮＡＴ処理部（２１）に供給され、
このＮＡＴ処理部（２１）にて音響パラメータ時系列Ｐ
ｉｆｎｌからそのパラメータ空間における直線近似によ
る軌跡が推定され、この軌跡に沿っ゛ζ直線？１１間さ
れ時間軸正規化のなされた新たな音響バラメーク時系列
Ｑｉ（ホ）が形成され、登録モードにおいてはこの新た
な音響パラメータ時系列Ｑｉｈｌがモード切換スイッチ
（３）を介し′（標準パターンメＴ−１月４）に格納さ
れる。

又、認識モードにおいては、ＮＡＴ処理部（２１）の新
たな音響パラメータ時系列Ｑｉ（ロ）がモード切換スイ
ッチ（３）を介してチェビシェフ距離算出部（２５）に
供給されると共に標準パターンメモ１月４）の標準パタ
ーンがチェビシェフ距離算出部（２５）に供給される。

第１５図乃至第１７図に第４図乃至第６図に示す１次元
の入力パターンへのパラメータ時系列；　２．４．６．
８．８．８．８．６．４．４．４．６．８　、標準パタ
ーンＡ′のパラメータ時系列；　３．５．７．９゜９、
９．９．７．５．５．７．９、標準パターンＢ′のパラ
メータ時系列ｉ　７．６．６．８．８．８．８．６．４
．４゜４をＮＡＴ処理部（２１）にて直線近似にて軌跡
を推定し、リサンプリング屯を８点とする処理をした１
次元の入力パターンＡのパラメータ時系列；２、４．６
．８．６．４．６．８、標準パターンＡ′のバラメータ
時系列；３．５．７．９．７．５．７．９、標準パター
ンＢ′のパラメータ時系列；　７．６．７．８゜７、６
．５．４を夫々示す。この場合、音響パラメータ時系列
Ｐｉ（ｎ）からそのパラメータ空間における軌跡を推足
し、この軌跡に沿って新たな音響パラメータ時系列Ｑｉ
■が形成されるので、入力音声を変換した音響パラメー
タ時系列Ｐｉ（ｎｌ自身により時間軸正規化がなされる
。そして、チェビシェフ距離算出部（２５）において入
力パターンＡと標準パターンＡ′との間のチェビシェフ
距［８が算出されると共に入力パターンＡと標準パター
ンＢ′との間のチェビシェフ距［１６が算出され、これ
ら距離８及び距離１６を夫々示す距離信号が最小比ｍ’
ｌ’ｌ１足部（６）に供給され、この最小距離判定部（
６）にて距離８が距１ｉ１１ｔ１６よりも小さいことか
ら標準パターンＡが入力パターンＡ′であると判定され
、ごの゛μｊ定砧果より人力音声が標準パターン八であ
ることを示す認識結果が出力端子（７）に得られる。従
っζ、部分的に類似しているような給い間に於いても誤
認識することが比較的少ない音声ｇｍを行なうことがで
きる。

ここで、ＮＡＴ処理を行なう音声ｔｇ織装置とＤＰマツ
クチグ処理を行なう音声１ｍ装置との演算量における差
異について説明する。

入力パターンに対する標準パターン１個当たりのＤＰマ
ツチング距距離計郡部５）における平均演算量をαとし
、チェビシェフ距離算出部（２５）における平均演算量
をβとし、ＮＡＴ処理部（２１）の平均の演算量をγと
したとき、３個の標準パターンに対するＤＰマツクチグ
処理による演算ｉｉ　ＣｒはＣ１−α　・　Ｊ　　　　　　　　　　　　　・　・　
・　（１１）である。又、３個の標準パターンに対する
ＮＡＴ処理した場合の演算量Ｃ２はＣ２−β・Ｊ＋γ　　　　　　・・・　（１２）である
。一般に、平均演算量αは平均演算量βに対してα）β
なる関係がある。従って、γ なる関係が成り立つ、即ち認識対象語い数が増加するに
従って演算＠Ｃ１は演算量Ｃ２に対してＣ１＞＞Ｃ２な
る関係となり、ＮＡＴ処理を９−Ｊなう音声認識装置に
依れば、演算量を大幅に低減できる。

又、ＮＡＴ処理部（２１）より得られる新たな音響パラ
メータ時系列ＯＮ−はその時系列方向において一足のパ
ラメータ数に設定できるので、標準パターンメモリ（４
）の記憶領域を有効に利用でき、その記憶容重を比較的
少なくできる。

この様にＮＡＴ処理を行うようにした音声認識装置にお
いてはＤＰマツクチグ処理を行うようにした音声認識装
置に比べ入力パターンに対する標準パターン１個当りの
平均演算量の違いにより認識対象語い数の増加に伴って
演算量が低減する。

然し乍ら、このＮＡＴ処理を行うようにした音声認識装
置においζも、入力パターンに対して全標準パターンを
処理しており、処理のための演算の絶対量は依然として
多いという不都合があった。

発明の目的本発明は斯かる点に鑑み処理のための演算量の比較的少
ないものを得ることを１４的とする。

発明の概要本発明は音声イご号人力部を有し、この音声信号入力部
の音声信号を音響分析部に供給し、この音響分析部に基
づい゛（得た音響パラメータ系列を軌跡長算出器に供給
し、この軌跡長算出器にて音響パラメータ系列からその
パラメータ空間における軌跡の軌跡長を谷山し、入力パ
ターンとこの入力パターンの軌跡長に応じた標準パター
ンとをマツチング処理して音声を認識するようにしたも
のであり、斯かる本発明音声認識装置に依れば処理のた
めの演算量を比較的少なくできる利益がある。

実施例以下、８１８図乃至第２０図を参照しながら本発明音声
認識装置の一実施例について説明しよう。この第１８図
乃至第２０図において第１図乃至第１７図と対応する部
分に同一符号を付してその詳細な説明は省略する。

本例においては第１８図にボず如（ＮＡＴ処理部（２１
）の補間点抽出器（２４）の新たな音響パラメ−夕晴系
列Ｑｉ（ｍｌを軌跡長信号付加器（２６）の一端に供給
すると共にＳＡＴ処理部（２１）の軌跡長算出器（２２
）の軌跡長信号を執′ａ長信号付加器（２６）の他端及
び後述する標準パターン選択部（２７）の一端に供給す
る。このり【路長信号付加器（２６）はＮＡＴ処理部（
２１）の新たな音響パラメータ時系列口ｉｔｍｌ毎にこ
の新たな音響パラメータ時系列ｎｉｔｍｌの元となる音
響分析部（２）の音響パラメータ時系列Ｐｉｌｎｌのパ
ラメータ空間における軌跡のｉｌｔ跡長ＳＬを示す軌跡
長信号を付加する。

この軌跡長信号付加器（２６）の軌跡長信号が付加され
た新たな音響パラメータ時系列ｏｉｔｍｌをモード切換
スイッチ（３）により、登録モードにおいては認識対象
語毎に標準パターンメモ１月４）に格納し、認識モード
においてはチェビシェフ距離算出部（２５）の一端に供
給する。又、この認識モードにおいては標準パターンメ
モリ（４）に格納されＣいる標準パターンを標準パター
ン選択部（２７）の他端に供給する。この標準パターン
選択部（２７）は認識モードにおいζその時入力されて
いる人カバターンとしての新たな音響パラメータ時系列
Ｑｉ■に付加された軌跡長信号と、標準パターンメモ１
月４）の標準パターン毎に付加された軌跡長信号とを比
較し、この比較結果に基づいて入力パターンに対してマ
ツチング処理する標準パターンを選択する。

ここで、この標準パターン選択部（２７）について更に
説明する。一般に、同−ｔＸ語であればその音響パラメ
ータ系列はそのパラメータ空間において形状及び長さが
略等しい軌跡を描くと考えられる。標準パターン選択部
（２７）においてはこの点に着目して入力パターンの軌
跡長に対してあまり大きなずれのない標準パターンを選
択するものである。即ち、標準パターンの軌跡長をＴＲ
ＬＳとし、入力パターンの軌跡長をＴＲＬＩとして、こ
れら標準パターンの軌跡長ＴＲＬＳと入力パターンの軌
跡長ＴＲＬＩとの軌跡長のずれＴＲＬを例えばなる信号
処理にて算出する。尚、軌跡長のずれＴＲＬはこの（１
４）式に限らず適宜な関数を用いることができる。この
場合、！ＩＬ跡長のずれＴＲＬは（１４）式より明らか
な如く標準パターンの軌跡長ＴＲＬＳと入力パターンの
軌跡長ＴＲＬＩとが等しいＴＲＬＳ＝　ＴＲＬＩときに
最小値２をとる。本例においては入力パターンの軌跡長
ＴＲＬＩに対して標準パターンの軌跡長ＴＲＬＳの軌跡
長のずれＴＲＬが値２．１以ドをとる標準パターンをチ
ェビシェフ距離算出部（２５）の他端に供給する。その
他は上述第９図に示す音声認識装置と同様に構成する。

斯かる構成に依れば、マイクロホンｆｉ＋の音声信号が
音響分析部（２）にて音声区間毎に声帯音源特性の正規
化された音響パラメータ時系列Ｐｉ（ｎ）に変換され、
この音響パラメータ時系列Ｐｉ（ｎｌがＮＡＴ処理部（
２１）に供給され、このＮ　Ａ　Ｔ処理部（２１）にて
音響パラメータ時系列Ｐｉ（ｎｌからそのパラメータ空
間における直線近似による軌跡が推定され、この軌跡に
基いて時間軸正規化のなされた新たな音響パラメータ時
系列Ｑｉｈｌが形成される。そして、ｔｌＬ跡長倍長信
号付加器６）にてこの新たな音響パラメータ時系列Ｏｉ
＋（ロ）にＮＡＴ処理部（２１）の軌跡長算出器（２２
）のこの新たな音響パラメータ時系列Ｏｉ（ホ）の元と
なる音響分析部（２）の音響パラメータ時系列Ｐｉ（ｎ
ｌのパラメータ空間における直線近似による軌跡の軌跡
長を示す軌跡長信号が付加される。

そして、この軌跡長信号付加器（２６）の軌跡長信号が
付加された新たな音響バラメーク時系列０１（２））が
、登録モードにおいてはモード切換スイッチ（３）を介
して標準パターンメモ１月４）に格納される。

又、認識モードにおいては、軌跡長信号付加器（２６）
の軌跡長信号が付加された入力パターンとしての新たな
音響パラメータ時系列Ｑｉ−がモード切換スイッチ（３
）を介してチェビシェフ距離算出部（２５）に供給され
る。又、軌跡長算出器（２２）の軌跡長信号と標準パタ
ーンメモ１月４）の軌跡長ず６号の付加された標準パタ
ーンとが標準パターン選択部（２７）に供給され、この
標準パターン選択部（２７）にて入力パターンの軌跡長
に対する標準パターンの軌跡長のずれＴＲＬが（１４）
式にて示される信号処理により算出され、このずれＴＲ
Ｌが値２．１以下となる標準パターンが選択され、ごの
標準パターンがチェビシェフ距離算出部（２５）に供給
される。このとき、標準パターンメモリ（４）に格納さ
れていた全欅準パターンを第１９図に示す如き領域Ｆと
すると、標準パターン選択部（２７）を介してチェビシ
ェフ距ＭＩＩＦ田部（２５）に供給される標準パターン
は第１９図に示す如き狭い領域ｆにて表される。そして
、゛このチェビシェフ距離算出部（２５）にて入力パタ
ーンと選択された標準パターンとのチェビシェフ距離が
算出され、このチェビシェフ距離を示す距離信号が最小
距離判定部（６）にて判定され、入力パターンがどの標
準パターンであるか、即ち人力音声が如何なる標準パタ
ーンであるかを示す認識結果が出力端子（７）に得られ
る。

この場合、入力パターンに対して全標準パターンでなく
その一部分の標準パターンとマツチング処理すればよく
、チェビシェフ距離算出部（２５）及び最小距離判定部
（６）の処理のための演算量が大幅に低減される。

又、異なる単語の標準パターンであるが第２０図に示す
如く部分的に１７１４ｍしている部分があるためにチェ
ビシェフ距離が判定されるべき標準パターンより小さく
なることが希にある。第２０図にこの様な状況を示す、
この第２０図においては、パラメータ空間における入力
パターンＡ；“Ａ”と、標準パターンＡ　’　　ｉ″八
″びＢｌ、“ＳＡＮ″とを無音を示す準定當部にて切断
し展開して示す。

この場合、無音をネオ準定常部と、“Ａ゛を示す準定常
部とにおいて入力パターンＡが標準パターンＡ′よりも
標準パターンＢ′により類イ以し、その他の部分におい
てはあまり差を生じていない。

この様な場合において本例によれば、入力パターンＡ；
”Ａ”の軌跡長と、標準パターンＡ′　；Ａ″及びＢ′
　；“ＳＡＮ”の軌跡長とが標準パターン選択部（２７
）にて比較され、標準パターンＢ′の軌跡長が人カバタ
ーン人の軌跡長に比べてずれＴＲＬが大きずぎることか
判断され、第２０図に示す如き状況にある標準パターン
Ｂ′は選択されず、入力パターンＡとして判定されるべ
き標準パターンＡ′がチェビシェフ距離算出部（２５）
に供給され、その分だけｗ４認識することがなくなる。

以上述べた如く本例の音声認識装置に依れば、音声信号
入力部としてのマイクロホンｆｉｌを有し、この音声信
号人力部（１１の音声信号を音響分析部（２）に供給し
、この音響分析部（２）の音響パラメータ時系列Ｐｆ（
ｎｌを軌跡長算出器（２２）に供給し、このＵ【路長算
出′ｌ５（２２）にて音響パラメータ時系列Ｐｉｆｎｌ
からそのパラメータ空間における軌跡の軌跡長を算出し
、入力パターンとこの入力パターンの軌跡長に応じた標
準パターンとをマツチング処理して音声を認識するよう
にした為、入力パターンに対して標準パターンメモリ（
４）の全標準パターンをマツチング処理する必要がなく
、その分だけ演算量を比較的少なくできる利益がある。

因みに、標準パターン選択部（２７）の（１４）式にて
示す軌跡長のずれＴＲＬＯ値を２．１以下に設定したと
ころマツチング処理のための演算量が第９図に示すもの
に比べ略半減することが明らかとなった。

尚、上述実施例においては音響パラメータ時系列ＰｉＴ
ｎｌからそのパラメータ空間における軌跡の軌跡長を算
出した場合について述べたけれども、音響パラメータ周
波数系列からそのパラメータ空間における軌跡の軌跡長
を算出するようにしても上述実施例と同様の作用効果を
得ることができることは容易に理解できよう。又、上述
実施例においては音響パラメータ時系列からそのパラメ
ータ空間における直線近似による軌跡の軌跡長を算出す
るようにした場合について述べたけれども、円弧近似、
スプライン近似等による軌跡の軌跡長を算出するように
しても上述実施例と同様の作用効果を得ることができる
ことは容易に理解できよう。

更に、上述実施例においては音響分析部（２）の音響パ
ラメータ時系列Ｐｉ（ｎ）をＮＡＴ処理部（２１）の軌
跡長算出器（２２）に供吟し、このＮＡＴ処理部（２１
）の軌跡長算出器（２２）より音響パラメータ時系列Ｐ
ｉ（ｎｌからそのパラメータ空間における軌跡の軌跡長
を算出するようにした場合について述べたけれども、Ｎ
ＡＴ処理部（２１）の軌跡長算出器（２２）とは別途に
軌跡長算出器を設け、この軌跡長算出器にＮＡＴ処理部
（２１）の新たな音響パラメータ時系列０１（２））を
供給し、新たな音響パラメー少時系列Ｇｉ＆ｎｌからそ
のパラメータ空間における軌跡の軌跡長を算出し、この
軌跡長に基づいて標準パターンを選択するようにしても
上述実施例と同様の作用効果を得ることができることは
容易に理解できよう。更に、第１図に示す如きＤＰマツ
クチグ処理を行うようにした音声認識装置においても、
音響分析部（２）の音響パラメータ系列を軌跡長算出器
に供給し、この軌跡長算出器の軌跡長信号を音響パラメ
ータ系列に付加し、人カバターンの軌跡長に応じて標準
パターンを選択するようにしてもＤＰマツクチグ処理の
ための演算量を比較的少なくすることができる。更に、
本発明は上述実施例に限らず本発明の要旨を逸脱するこ
となくその他種々の構成を取り得ることは勿論である。

発明の効果本発明音声認識装置に依れば、音声信号入力部を有し、
この音声信号入力部の音声信号を音響分析部に供給し、
この音響分析部に基づいて得た音響パラメータ系列を軌
跡長算出器に供給し、このｉｌｔｍ長算出器にて音響パ
ラメータ系列からそのパラメータ空間におけるｇｔ跡の
軌跡長を算出し、入力パターンとこの人カバターンの軌
跡長に応じた標準パターンとをマツチング処理して音声
を認識するようにした為、演算量を比較的少なくできる
利益がある。

【図面の簡単な説明】

第１図はＤＰマツクチグ処理により音声認識を行なうよ
うにした音声認識装置の例を示す構成図、第２図はＤＰ
マツクチグ処理の説明に供する概念図、第３図は音響パ
ラメータ空間における軌跡の説明に供する線図、第４図
、第５図及び第６図は夫々１次元の人カバターンＡ、標
準パターンＡ′及び標準パターンＢ′の例を承す線図、
第７図は入力パターンＡのパラメータ時系列と標準パタ
ーンＡ′のパラメータ時系列とのＤＰマツクチグ処理に
よる時間軸正規化の説明に供する線図、第８図は人カバ
ターンＡのパラメータ時系列と標準パターンＢ′のパラ
メータ時系列とのＤＰマツクチグ処理による時間軸＋Ｅ
規化の説明に供する線図、第９図はＳＡＴ処理をして音
声認識を行なうようにした音声認識装置の例をボず構成
図、第１０図、第１１図、ｆｆ１１２図及び第１４図は
夫々ＮＡＴ処理部の説明に供する線図、第１３図は補間
点抽出器の説明に供する流れ図、第１５図、第１６図及
び第１７図は夫々ＮＡＴ処理部にてＮＡＴ処理した人カ
バターンＡ、標準パターンＡ′及び標準パターンＢ′の
１次元の音響パラメータ時系列を示す線図、第１８図は
本発明音声認識装置の一実施例を示す構成図、第１９図
及び第２０図は夫々第１８図の説明に供する線図である
。（１）は音声信号人力部としてのマイクロホン、（２）
は音響分析部、（３）はモード切換スイッチ、（４）は
標準パターンメモＩＪ　、＋６１は最小距離判定部、（
ＩＩＡ）（ＩＩｓ　）　、　”・・、　　（ｌｌｏ　）
は１５チヤンネルのデジタルバンドパスフィルタハンク
、（１６）は音声区間内パラメータメモリ、（２１）は
ＮＡＴ処理部、（２２）は１ｌｔｌｉ！６長算出器、（
２３）は補間間隔算出器、（２４）は補間点抽出器、（
２５）はチェビシェフ距離算出部、（２６）は軌跡長信
号付加器、（２７）は標準パターン選択部である。１１因第１３図

Claims

【特許請求の範囲】

音声信号入力部を有し、該音声信号入力部の音声信号を
音響分析部に供給し、該音響分析部に基づいて得た音響
パラメータ系列を軌跡長算出器に供給し、該軌跡長算出
器にて上記音響パラメータ系列からそのパラメータ空間
における軌跡の軌跡長を算出し、入力パターンと該入力
パターンの軌跡長に応じた標準パターンとをマッチング
処理して音声を認識するようにしたことを特徴とする音
声認識装置。