JPS58123598A

JPS58123598A - 音声認識装置

Info

Publication number: JPS58123598A
Application number: JP57007064A
Authority: JP
Inventors: 北川　秀雅
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1982-01-19
Filing date: 1982-01-19
Publication date: 1983-07-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は標準音声パターンとパターン照合を行なった結
果の判定を行なう特定話者のだめの音声認識装置に関す
るものであり、その目的とするところは、使用者による
標準パターンの再登録を不要にし、同一話者での発話パ
ターンの長時間変動による認循率の低下を防ぎ、同時に
短時間変動による認識率の変動を安定化することができ
る音声認識装置を提供することにある。

一般に、音声の！特徴を一定時間毎に抽出し、この入力
特徴ベクトルの時系列パターンと、既に記憶されている
標準パターンとを比較して認識を行う音声認識装置にお
いては音声パターンが発話の毎に変動し、このため認識
率を完全に１００％にすることは困難とされていること
ｉＪ周知の１１実で３７ある。この変動の太きさは話者によっても、又、同一話
者でも日ごとに変化する。す々わち、第１図に示すよう
に短時間の範囲（１日〜１週間程度）で見ると、その認
識率はランダムに」−下し、長時間（１〜２ケ月以」＝
）の範囲で見ると、全体的に単調に下降する曲線を描く
のが常である。そのだめ、従来の音声認識装置では、前
者の短時間変動に対しては数回以上の回数の発話を使用
者に行なわせ、そｉｌらのパターンを全て標準パターン
として記憶するか又はそれらの平均パターンを１つの標
準パターンとして記憶することによシ対処していた。又
、長時間変動に対しては標準パターンの再登録を行うか
或いはそのわずられしさを除くために新入カバターンと
置換することが行なわれてきた。しかし、上記の様な短
時間変動の対策では長時間変動に対処できず、標準パタ
ーンの再登録以外に方法はなく、又、上記の様な長時間
変動の対策では標準パターンを新入カバターンと全く置
換してしまうため、短時間変動には十分対処でき、　　
亭ず、さらに、認識結果を標準ハターン置換してしまう危
険があった。

本発明はかカーる従来の欠点にかんがみてなされたもの
で、認識結果又は認識結果に対する話者の判定によって
標準パターンと入カバターンを加重平均し、常に近い過
去の影響を標準パターン残すことにより、短時間変動と
長時間変動の両方の悪影響に対処することができるよう
に構成したものである。

以下、本発明の音声認識装置について実施例の図面と共
に説明する。第２図は本発明の一実施例を示すブロック
図である。第２図で、１はマイクロホン、２は増幅器、
３１〜３６はスペクトル分析用（特徴抽出用）のバンド
パスフィルタ群、４１〜４６は両波整流器群、５１〜５
６は平滑回路群、６はマルチプレクサ、７ＨＡ／Ｄコン
バータ、８゜９はランダムアクセスメモリ（ＲＡＭ）、
１０は距離割算器で、２つの入力、Ａ　−（ａｌ　＋　
ａ２・・・…　、ａ　　）Ｂ＝（ｂｌ、ｂ２．……、ｂ
ｎ）に対して５、、。

る。１１は最少距離判定器で、順次入力してきた距離値
の最少値を判定し、その登録順番の番数を出力する。１
２は出力表示器、１３は重み係数発生器、１４は乗算器
、１５は加算器、１６はランダムアクセスメモリ（ＲＡ
Ｍ）、１７は入力用キーボード、１９はＡＮＤ回路、１
８は定数（定文字）発生器、２ｏは遅延器である。又、
Ｓｌ−は手動式バイ１．チで、ａ、ｂはそれぞれ接点を
示す。

８２′はリレースイッチである。

このような構成の音声認識装置の動作は先ずスイッチ８
１′を接点ａに倒すことによって開始される。スイッチ
Ｓ４・が接点ａに倒されると音声登録モードとなる。こ
の後に標準パターン登録のための所定の発話を行々う。

この発話による音声はマイクロホン１を通して電気信号
に変換され、増幅器２で増幅されてバンドパスフィルタ
３１〜３６の群に分配され、音声の特徴が帯域パワース
ペクトルの形で抽出される。それぞれのバンドパスフィ
ルタ３１〜３６の出力は両波整流器４１〜４６で整流さ
れ、平滑回路６１〜６６で平滑され、直流に変換される
。従って、それらの出力は音声の振幅（包絡）とともに
ゆるやかに変化する直流となる。

これらの６個のパラレル出力はＡ／Ｄコンバータ節約の
ため、マルチプレクサ６によってシリアル出力に変換さ
れ、Ａ／Ｄコンバータ７でディジタル計に変便される。

ここでマルチプレクサによるシリアル変換は、平滑の時
定数より十分速い速度で２０　ｍ　Ｓｅｃごとに行なわ
れる。Ａ／Ｄコンバータ７の出力はさらにスイッチｓ１
の接点ａを通してＲＡＭ８に入力され標準パターンとし
て記憶される。必要に応じてこれらの操作をくり返すこ
とにより、数個〜士数個の単語が登録できる。登録した
単語はその順番に番号が割り当てられる。これらの登録
は使用者によっても可能であるが、メーカーによる平均
的話者の登録により、使用者の登録が不要とすることが
できる。ただし当初の認識率は多少落ち、又、不揮発性
ＲＡＭを使用する必要がある。次にスイッチＳ１　は使
用者の手によって接点すに倒され、認識モードとなる。

認識のだめに登録した単語のいずれがか発話されると、
７ベー〕゛登録の場合と同様に、マイクロホン１、増幅器２、バン
ドパスフィルター３１〜３６、両波整流器４１〜４６、
平滑回路６１〜６６、マルチプレクサ６、Ａ／Ｄコンバ
ータ７を順次通ることにより、音声の特徴パラメータは
シリアルのディジタル値となね、スイッチＳ１　に達す
る。特徴パラメータはさらにスイッチＳ１　の接点すを
通じてＲＡＭ９に記憶される。ＲＡＭ９の内容はさらに
距離計算器１゜に送られ、同時に入力したＲＡＭ８の内
容すなわち標準パターンとの距離を計算する。標準パタ
ーンはＲＡＭ８の中に登録の順番に入っており、ＲＡＭ
９からの入カバターンとの距離はその順番に従うて計算
され、順次最少距離判定器１１に送られ、最少距離を判
定する。その判定結果は登録番数として出力表示器１２
に出力し、その番数及び正誤入力要求を使用者に表示す
る。又、これと同時にＲＡＭ８の出力は乗算器１４に送
られ、重み係数発生器１３で発止した重み係数を乗ぜら
れる。

重み係数ＷはＯ＜Ｗ＜１なる実数で通常は０．５程度に
設定する。この乗算器１４の出力はＲＡＭ９の出力とと
もに加算器１５に入力して加重平均し、その加重平均結
果をＲＡＭ１６に記憶する。つまり、ＲＡＭ’８．９の
出力をそれぞれＡ−（ａｌ。

ａ２＋”””　　、ａｎ）Ｂ＝　（ｂｌ　、ｂ２．＋１
１１１１１１１１１１　　、ｂｎ）と１．５　　　　　
　１．５表示器１２の表示の結果において、使用者が正しくない
認識結果と判断した場合はｒＮＯＪを５秒以内にキーボ
ード１７を通じて入力する。キーボード１７は出力表示
器１２の表示出力がら５秒以内に応答（キー人力）が無
い場合、自動的にｒＹＥＳＪを送出するものとする。こ
の動作は最少距離判定器１１の出力の分配が遅延器２０
を通り５秒後にキーボード１７に入力することにより行
なわれる。

キーボード１７の出力はＡＮＤ回路１９に入力し、定数
発生器１８の内容ｒＹＥｓＪと比較される。すなわち、
ｒＹＥｓＪならＡＮＤ回路１９は１を出力し、リレース
イッチＳ２をＯＮにする。ｒＹＥＳＪ９ページ以外なら０を出力し、リレースイ・フチＳ２は駆動され
ない。ｒＹＥＳＪの応答によってリレースイッチＳ２が
ＯＮになった場合は、前述のＲＡＭ１６に記憶された加
重平均値がＲＡＭ８にロードされ、新しい標準パターン
として登録される。この様にして標準パターンは、前回
の発話の影響を多少残しながら遂次更新されて行き、短
期間の発話変動と、長期間の発話変動の影響を同時に除
去し、常に安定した認識を行うことが可能となる。

なお、上記実施例では、特徴抽出部として６チヤンネル
フイルタノぐンクを用いたが、６チヤンネル以上とする
とさらに認識率は向」ニし、又、平滑部の後にサンプル
ホールドを用いると、スペクトルの同時性が厳密となり
マルチプレクサ６の速度も遅くすることができる。そし
て、これらの場合でも本発明の効果には何ら影響しない
。又、フィルタバンク以外の特徴パラメータであるＬＰ
Ｇ　。

フーリエ変換、ケプストラム等を用いても本発明の効果
に影響を与えないことは言うまでもない。

１゜なる、いわゆるユークリッド距離を用いたが、他ノイず
れの距離を用いても良い。

以上、詳述したように本発明によれば、認識結果又は認
識結果に対する話者の判定により標準パターンと入カバ
ターンを加重平均し、この加重平均したパターンを新だ
々標準パターンとして記憶させるようにしたので、常に
近い過去の影響を標準パターンに残すことができるため
、使用者による標準パターンの登録を不要にすることも
可能と率が得られる。そして、話者の長時間（年単位）
での発話変動の影響を除くことができる利点を有するも
のである。

【図面の簡単な説明】

第１図は発話の短期間変動と長期間変動の説明のだめの
特性図、第２図は本発明の音声認識装置の一実施例を示
すブロック図である。１・・１１１１＠・マイクロホン、２・・・拳・・増幅
器、３１〜３６＠・・・・−バントハスフィルタ、４１
〜４６・・・１１／、−ン・・・両波整流器、５１〜６６・・・・・・平滑回路、
６・・・・・・、マルチプレクー＋ｊ、７　拳・・・・
・Ａ／Ｄコンバータ、８，９．１６・・・・・・ランダ
ムアクセスメモリ（ＲＡＭ）、１０・・・・・・距餅１
泪算器、１１・・・・・・最少距離判定器、１２・・・
・・・出力表示器、１３・・・・・・重み係数発生器、
１４・・・・・・乗算器、１５・・・・・・加算器、１
７・・・・・・キーボード、１８・・・・・・定数発生
器、１９・・・・・・Ａ　Ｎ　Ｄ回路、２ｏ・・・・・
・遅延器、Ｓｌ、Ｓ２・・・・・・スイッチ。代理人の氏名　弁理士　中　尾　敏　男　ほか１名第１
図認識率

Claims

【特許請求の範囲】

（１）音声を取り込む手段と、一定時間毎に音声の特徴
を抽出する手段と、この抽出された特徴の時系列パター
ンと標準パターンとを比較演算する手段と、この演算の
結果によって音声の判定を行う手段と、上記演算結果に
よって前記標準パターンと入力時系列パターンとの加重
平均を行う手段と、この加重平均の結果を前記標準パタ
ーンと置換する手段を具備してなる音声認識装置。
（２）認識結果を出力する手段と、該出力された結果に
対して使用者が正誤を判定し、この判定結果を入力する
手段を具備し、この入力結果に応じて加重平均を行うこ
とを特徴とする特許請求の範囲第１項記載の音声認識装
置。
（３）使用者による正誤の判定の結果の誤の場合のみ入
力を行う手段と、使用者に入力を要求する手段と、入力
を要求する手段の出力後の経過時間を測定する手段ど、
一定時間経過する寸での間に入力を行う手段からの出力
が無い場合のみ正の判定第１項記載の音声認識装置。