JPS62204299A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62204299A
JPS62204299A JP61047620A JP4762086A JPS62204299A JP S62204299 A JPS62204299 A JP S62204299A JP 61047620 A JP61047620 A JP 61047620A JP 4762086 A JP4762086 A JP 4762086A JP S62204299 A JPS62204299 A JP S62204299A
Authority
JP
Japan
Prior art keywords
pattern
patterns
standard
learning
centroid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61047620A
Other languages
English (en)
Inventor
別所 由実
正宏 浜田
博之 直野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61047620A priority Critical patent/JPS62204299A/ja
Publication of JPS62204299A publication Critical patent/JPS62204299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき、複数個の
標準パターンテンプレートを持つ音声認識装置に関する
ものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき、複数個の標準パターンを用いる方法は有効
な方法である。上記方法では、より多くの話者に対応し
たり、同話者であっても話者の発声状態が時間の経過と
共に変化した場合に対応するためには、話者の数2発声
状態の変化に応じて、標準パターンテンプレートに最適
なパターンを追加する必要があり、追加パターンは、誤
認識パターンから選択すると効率が良い。しかしながら
、追加したパターンが他の単語もしくは音節、音韻との
類似度が高い場合は、追加した単語もしくは音節、音韻
の認識率が向上しても、他の単語もしくは音節、音韻の
認識率が逆に低下する場合がある。従来の音声認識装置
では、上記問題点を解決するため、更新する前の標準パ
ターンを使用した場合の全単語もしくは音節、音韻の認
識率と、更新後の認識率を比較し、後者の方が高認識率
であった場合のみ、更新後の標準パターンテンプレート
を採用し、後者の方が低認識率であった場合には、標準
パターンテングレートを更新前の状態に戻すという方法
がとられた。以上の方法により、標準パターンを更新す
ることで、必ず認識率が向上することが可能になり、よ
り話者に適したテンプレートを使用することが可能とな
る。
(たとえば、飯塚、森戸、山田、(沖電気(株)基盤研
究所)、「不特定話者単語音声認識」、音響学会音声研
究会資料、 883−54(12,22,1983))
以下、図面を参照しながら、上述したような従来の音声
認識装置について説明を行う。第2図は、従来の音声認
識装置のブロック図である。1は音声入力端子、2は特
徴抽出部、11はパターン照合部、1oは認識結果出力
端子、15は追加パターン判定部、14Fi保管パター
ンテンプレート、13は標準パターンテンプレート、1
2はスイッチである。以上のように構成された音声認識
装置について、その動作を説明する。
まず、話者が最初に使用する際には、音声入力端子1よ
り入力された学習用音声信号を特徴抽出部2で分析し、
特徴パラメータを抽出する。学習用音声信号としては、
標準パターンテンプレート13に含まれている単語音声
信号を用いる。また、分析方法には、たとえばLPGケ
プヌトラム法を用いれば、単位時間ごとに所定の個数の
ケダスト5・、 ラム係数が算出される。
標準パターンテンプレート13には、音声区間分のケプ
ヌトラム係数を1単語分とする標準パターンが各単語に
つき複数個含まれており、パターン照合部11で標準パ
ターンを入力し、特徴抽出部2で分析された学習音声パ
ターンと標準パターンとの距離を算出し、最短距離の標
準パターンを選ぶ。学習用音声信号を入力してから後の
以上の過程を標準パターンテンプレートに含まれる全単
語について複数回繰り返し、パターン照合部11で、認
識の可、不可を判断し、全単語の認識率と誤認識単語の
1回分のパターンを保管パターンテンプレート14に保
管する。
次に、再度学習用音声信号を音声入力端子1よシ入力し
、音声信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。信号の種類2分析条件は、最初の学習時と同
様である。
次ニ、パターン照合部11で、標準パターンテンプレー
ト13と保管パターンテンプレート14より、それぞれ
標準パターンと最初の学習時に保6・−・−′ 管した誤認識パターンを入力し、以上の全てのパターン
を標準パターンとみなし、学習用入力音声パターンと標
準パターンとの距離を算出する。
学習用音声信号を入力してから後の以上の課程を標準パ
ターンに含まれている全単語について複数回繰り返しパ
ターン追加判定部15で、最初の学習時の認識率と、再
学習時の認識率を比較する。
その結果、最初の学習時の認識率が高い場合には、保管
パターンテンプレート14にある誤認識パターンを消去
し、再学習時の認識率が高い場合には、保管パターンテ
ンプレート14にある誤認識パター7を標準パターンテ
ンプレート13に追加する。
次に認識時には、音声信号を音声信号入力端子1より入
力し、信号を特徴抽出部2で分析し、特徴パラメータを
抽出する。信号の種類2分析条件は、学習時と同様であ
る。
次にパターン照合部11で、学習時に更新した標準パタ
ーンテンプレート13の標準パターンと入力パターンと
の距離を算出し、出力端子1oより認識結果を出力する
なお、スイッチ12は、学習時にはパターン追加判定部
15へ、認識時には結果出力端子10に認識結果を出力
するように動作する。
発明が解決しようとする問題点 しか1.なから、上記のような構成では、標準パターン
テンプレートを更新するまでに、同種の学習を2回行な
わなければならず、話者への負担が大きくなる。しかも
、認識率を比較した結果、更新する前のテンプレートを
採用すると判断された場合は、学習が無駄になり、特定
の単語に関しては、何回学習を行なっても認識率が向上
せず、学習速度が遅くなるという問題点を有していた。
本発明は、上記問題点に鑑み、話者に負担をかけるが学
習速度が速く、しかも学習を無駄にせずに話者に対して
確実に認識率を向上させる学習と、学習速度は遅いが話
者に負担をかけることなく認識率を向上させる学習とを
組み合わせたシステム構成を用い、学習時には、話者自
身が、状況に応じて、負担を許容できるかとうかまたは
、学習速度は遅くても良いかを判断して上記2つの学習
方法を使い分けることにより、不都合な話者の負担を軽
減し、かつ、不都合な学習の無駄をも軽減して学習速度
を速くシ、効率良く認識率を向上させることのできる音
声認識装置を提供するものである。
問題点を解決するための手段 この目的を達成するために本発明の音声認識装置は、各
単語もしくは音節、音韻についての複数個の標準パター
ンを有する標準パターンテンプレートと、標準パターン
の更新に必要なパターンを保管する保管パターンテンプ
レートト、標準パターンと認識されるべき入力パターン
とを照合するパターン照合部と、入力パターンの中より
標準パターンテンプレートに追加するべきパターンを決
定する追加パターン決定部と、複数個の保管パターンに
対し類似度の高いパターンを同クラスとみなしたクラス
分けを行い、各クラスのセントロイドを決定するセント
ロイド決定部と、上記クラス分けの結果から、各セント
ロイドのパターンを標準パターンテンプノートに追加す
るかどうかを判定する追加パターン判定部とから構成さ
れている。
作用 この構成によって、標準パターンを更新するための学習
時に、話者に負担を許容できるが学習速度は速くなけれ
ばいけない際には、話者が認識するべき音声をまとめて
入力し、前記追加パターン決定部で、上記入力パターン
の中より追加するべきパターンを決定するように動作し
、学習速度は遅くても良いが話者に負担を許容できない
際には、認識時に、前記パターン照合部で誤認識パター
ンを前記保管パターンテーブルに保管しておき、標準パ
ターンを更新するための学習時に、前記セントロイド決
定部で、保管された誤認識パターンを対象にクラス分け
を行い、セントロイドを決定し、前記追加パターン判定
部で、上記セントロイドパターンを追加するべきである
と判定された場合に、相当するパターンを追加するよう
に動作する。認識時には、更新された標準パターンテン
プレートを用いて認識する。
実施例 10   。
以下、本発明の単語音声認識における一実施例について
第1図を参照しながら説明する。
第1図において、1は音声入力端子、2は特徴抽出部、
3はパターン照合部、4はスイッチ、5は追加パターン
決定部、6はセントロイド決定部、7は追加パターン判
定部、8は標準パターンテンプレート、9は保管パター
ンテンプレート、1゜は認識結果出力端子であり、前記
従来例と同じものは、同一の番号を付与している。
以上のように構成された音声認識装置について以下その
動作について説明する。
話者が負担を許容できるが学習速度が速くなければいけ
ない際には、話者が全単語音声をまとめて入力すること
で、確実に話者に適用するように標準パターンテンプレ
ートを更新するための学習を行う。この際の動作は以下
の通りである。
初めに、音声入力端子1より入力された一回分の全単語
音声信号を特徴抽出部2で分析し、特徴パラメータを抽
出し、分析されたパターンを保管パターンテンプレート
9に保管する。学習用音声信号の種類2分析条件は従来
例と同様である。
次に、再度音声信号を入力し、分析した後、パターン照
合部3で、標準パターンテンプレート8より標準パター
ン、保管パターンテンプレート9より保管パターンを入
力し、標準パターンと保管パターンを共に標準パターン
とみなして、入力パターンと標準パターンとの距離を算
出する。
次に、追加パターン決定部6で、上記で照合した結果の
第2候補までの標準パターン番号を参照しながら、次の
規則に従って追加パターンを決定する。
規則)第1候補または第2候補に使用されておυ、かつ
、それぞれ他の第2候補または第1候補が異なった単語
パターンであるような保管パターンは、標準パターンテ
ンプレートに追加する。
また、学習速度は遅くても良いが話者に負担を許容でき
ない際には、特別に話者に対して学習時を設けず、認識
時に誤認識した場合に、誤認識パターンを単語ごとに保
管パターンテンプレート9に保管しておき、その結果、
保管パターンテンプレート9内のパターンが一定個数以
上になった単語が存在した場合、以下の動作により標準
パターンテンプレートを更新する。靭めにセントロイド
決定部6で、その単語の保管パターン及び標準パターン
ヲ保管パターンテンプレート9.標準パターンテンプレ
ート8からそれぞれ入力し、以上のパターンを対象にク
ラスタリングを行い、各クラスの中心パターンを決定す
る。クラスタリングの方法は、たとえば各パターンにつ
き距離の近い上位に個のパターンを各パターンの近傍点
とし同クラスとする。そして、互いに近傍点となるパタ
ーンが存在すれば、相当するパターンのクラスを合わせ
たものを新しいクラスとする。(以上の処理を以後に−
NN法と呼ぶ。)これを式で示すと、次に、セントロイ
ドの決定法は、たとえば、同クラス内の全てのパターン
との距離の和が最も小13 ・\− さいパターンを中心パターンとする。(以後ポテンシャ
ル法と呼ぶ。) 次に追加パターン判定部7で、各クラスに対し、次の判
定条件を満たすクラスの中心パターンを追加パターンと
して、相当する単語の標準パターンテンプレート8に追
加する。
判定条件1)各クラス内に標準パターンが半数以上ある
判定条件2)中心パターンは保管パターンである。
認識時には、音声信号を音声入力端子1より入力し、信
号を特徴抽出部2で分析し、特徴パラメータを抽出する
。学習用音声信号の種類9分析条件は従来例と同様であ
る。
次に、パターン照合部3で、学習時に更新した標準パタ
ーンテンプレート8より、標準パターンと入力パターン
の距離を算出し、出力端子6より認識結果を出力する。
なお、スイッチ4は、話者に負担をかける際の学習時に
は追加パターン決定部5へ9話者に負担をかけない際の
学習時にはセントロイド決定部614 ・、−− へ、認識時には結果出力端子6へ動作結果を出力するよ
うに動作する。
以上のように、本実施例によれば、標準パターンを更新
するための学習時に、話者に負担を許容できるが学習速
度は速くなければいけない際には、話者がまとめて入力
した認識するべき全単語パターンを保管し、再度全単語
を入力し、前記パターン照合部3で、標準パターンと保
管パターンを共に標準パターンとみなして、入力パター
ンと標準パターンを照合し、その結果、追加パターン決
定部6で、第1候補または第2候補に使用されており、
かつ、それぞれ他の第2候補または第1候補が異なった
単語パターンであるような保管パターンを、標準パター
ンテンプレート8に追加する。
また、学習速度は遅くても良いが話者に負担を許容でき
ない際には、認識時に、前記パターン照合部3で誤認識
パターンを前記保管パターンテーブル9に保管しておき
、標準パターンを更新するための学習時に、前記セント
ロイド決定部6で、保管された誤認識パターンに標準パ
ターンを含めたパターンを対象にに−NN法によるクラ
スタリングを行い、各クラスの中心パターンをポテンシ
ャル法により決定し、前記追加パターン判定部7で、ク
ラス内のパターンの半数以上が標準パターンでありしか
も中心パターンが誤認識パターンであるクラスが存在し
た場合のみ、中心パターンを標準パターンテンプレート
8に追加する。以上により、不都合な話者の負担が軽減
され、かつ、不都合な学習の無駄も軽減されて学習速度
が速くなり、効率良く認識率を向上させることが可能と
なる。
発明の効果 本発明は、標準パターンを更新するための学習時に、話
者に負担を許容できるが学習速度は速くなければいけな
い際には、話者が認識するべき音声をまとめて入力し、
前記追加パターン決定部で、上記入力パターンの中より
追加するべきパターンを決定するように動作し、学習速
度は遅くても良いが話者に負担を許容できない際には、
認識時に、前記パターン照合部で誤認識パターンを前記
保管ハターンテーブルに保管しておき、標準パターンを
更新するための学習時に、前記セントロイド決定部で、
保管された誤認識パターンを対象にクラス分けを行い、
セントロイドを決定し、前記追加パターン判定部で、上
記セントロイドパターンを追加するべきであると判定さ
れた場合に、相当するパターンを追加することにより、
不都合な話者の負担が軽減され、かつ、不都合な学習の
無駄も軽減されて学習速度が速くなり、効率良く認識率
を向上させることが可能となる優れた音声認識装置を実
現するものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は従来例における音声認識装置のブロッ
ク図である。 1・・・・・・音声入力端子、2・・・・・・特徴抽出
部、3・・・・・・パターン照合部、4・・・・・・ス
イッチ、6・・・・・・追加パターン決定部、6・・・
・・・セントロイド決定部、7・・・・・・追加パター
ン判定部、8・・・・・・標準パターンテンプレート、
9・・・・・・保管パターンテンプレート、10・・・
・・・認識結果出力端子。

Claims (1)

    【特許請求の範囲】
  1. 各単語もしくは音節、音韻についての複数個の標準パタ
    ーンを有する標準パターンテンプレートと、標準パター
    ンの更新に必要なパターンを保管する保管パターンテン
    プレートと、標準パターンと認識されるべき入力パター
    ンとを照合するパターン照合部と、入力パターンの中よ
    り標準パターンテンプレートに追加するべきパターンを
    決定する追加パターン決定部と、複数個の保管パターン
    に対し類似度の高いパターンを同クラスとみなしたクラ
    ス分けを行い、各クラスのセントロイドを決定するセン
    トロイド決定部と、上記クラス分けの結果から、各セン
    トロイドのパターンを標準パターンテンプレートに追加
    するかどうかを判定する追加パターン判定部とを具備し
    、標準パターンを更新するための学習時に話者に負担を
    許容できる際には、話者が認識するべき音声をまとめて
    入力し、前記追加パターン決定部で、上記入力パターン
    の中より追加するべきパターンを決定し、話者に負担を
    許容できない際には、認識時に、前記パターン照合部で
    誤認識パターンを前記保管パターンテーブルに保管して
    おき、標準パターンを更新するための学習時に、前記セ
    ントロイド決定部で保管された誤認識パターンを対象に
    クラス分けを行い、セントロイドを決定し、前記追加パ
    ターン判定部で、上記セントロイドパターンを追加する
    べきであると判定された場合に、相当するパターンを追
    加することを特徴とする音声認識装置。
JP61047620A 1986-03-05 1986-03-05 音声認識装置 Pending JPS62204299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61047620A JPS62204299A (ja) 1986-03-05 1986-03-05 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61047620A JPS62204299A (ja) 1986-03-05 1986-03-05 音声認識装置

Publications (1)

Publication Number Publication Date
JPS62204299A true JPS62204299A (ja) 1987-09-08

Family

ID=12780253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61047620A Pending JPS62204299A (ja) 1986-03-05 1986-03-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62204299A (ja)

Similar Documents

Publication Publication Date Title
JPS62239231A (ja) 口唇画像入力による音声認識方法
JPS62204299A (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JPS63118198A (ja) 音声認識装置
JPS61138296A (ja) 音声認識装置
Benıtez et al. Word verification using confidence measures in speech recognition
JPS63247799A (ja) 音声認識装置
JPS6315295A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
Viet et al. A combination of Gaussian Mixture Model and Support Vector Machine for speaker verification
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS63218999A (ja) 音声認識装置
JPS60147797A (ja) 音声認識装置
JPS61123889A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPS61279896A (ja) 音声認識装置
Fa Topics in speech recognition
JPS63213897A (ja) 話者認識装置における辞書更新方式
JPS58159598A (ja) 単音節音声認識方式
JPH01158499A (ja) 定常雑音除去方式
JPS63155195A (ja) 音声認識装置
JPS607492A (ja) 単音節音声認識方式
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPH06195096A (ja) 音声認識の辞書検索における単語検索方法
JPS62159200A (ja) 特定話者用単語音声認識装置