JPS62111292A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62111292A
JPS62111292A JP60251413A JP25141385A JPS62111292A JP S62111292 A JPS62111292 A JP S62111292A JP 60251413 A JP60251413 A JP 60251413A JP 25141385 A JP25141385 A JP 25141385A JP S62111292 A JPS62111292 A JP S62111292A
Authority
JP
Japan
Prior art keywords
pattern
patterns
standard
class
centroid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60251413A
Other languages
English (en)
Inventor
別所 由実
正宏 浜田
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60251413A priority Critical patent/JPS62111292A/ja
Publication of JPS62111292A publication Critical patent/JPS62111292A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、各単語もしくは音節、音韻につき複数個の標
準パターンを持つ音声認識装置に関するものである。
従来の技術 不特定話者に対応させるために、各単語もしくは音節、
音韻につき複数個の標準パターンを用いる方法は有効な
方法である。上記方法では、より多くの話者に対応した
り、同話者であっても話者の発声状態が時間の経過と共
に変化した場合に対応するためには、話者の数、発声状
態の変化に応じて、標準パターンテンプレートに最適な
パターンを追加する必要があり、追加パターンは、誤認
識パターンから選択すると効率が良い0しかしながら、
追加した誤認識パターンが、他の単語もしくは音節、音
韻との類似度が高い場合は、追加した同単語もしくは音
節、音韻の認識率は向上しても、他の単語もしくは音節
、音韻の認識率が逆に低下する場合がある0従来の音声
認識装置では。
上記問題点を解決するために、誤認識パターンの中で、
同単語もしくは音節、音韻の標準パターンとの距離が近
いパターンのみを追加パターンとし、同単語もしくは音
節、音韻の標準パターンとの距離が遠い場合には追加し
ないという方法が取られた。以上の方法でパターンを追
加することにより、他の単語もしくは音節、音韻の認識
率を低下させることなく、より話者に適応した標準パタ
ーンテンプレートを用いることが可能となる。
(たとえば、飯塚、森戸、山田(沖電気(株)基盤技術
研究所)「不特定話者単語音声認識」音響学会音声研究
会資料383−54(12,22゜以下、図面を参照し
ながら、上述したような従来の音声認識装置について説
明を行う。第3図は従来の音声認識装置のブロック図で
ある。1は音声入力端子、2は特徴抽出部、5は認識結
果出力端子、12は追加パターン決定部、8は標準パタ
ーンテンプレート、13は保管パターンテーブル、11
はスイッチである。以上のように構成された音声認識装
置について、その動作を説明する。
標準パターンを更新するための学習を行う際には、音声
入力端子1より学習用音声信号を入力し、特徴抽出部2
で分析し特徴パラメータを抽出する。
学習用音声信号としては、標準パターンテンプレート8
に含まれている単語と同単語の音声信号を用い、単語の
入力順序も決めておく。従って装置は入力される音声信
号の単語の種類は既知である。
また分析方法として、たとえばLPCクプストラム法を
用いれば、単位時間ごとに所定の個数のケプストラム係
数が算出される。
標準パターンテンプレート8には、音声区間分のケプス
トラム係数を1単語とする標準パターンが、各単語につ
き複数個含まれている。パターン照合部1oで、上記標
準パターンを入力し、特徴抽出部2で分析された学習音
声パターンと標準パターンとの距離を(7)式を用いて
算出する。
但し、CR=標準音声のケプストラム係数Of  =入
力音声のケプストラム係数N :分析次数 M :全フレーム数 D :距離 である。
そして、同部で最短距離である標準パターンが、学習音
声パターンと他単語である場合には、誤認識とし、上記
学習音声パターンを保管パターンテーブル13に単語ご
とに保管する。
学習用音声信号を入力してから後の以上の過程を、標準
パターンテンプレート8に含まれている全単語について
、単数もしくは複数の話者が、複数回繰り返す。
上記動作の結果、保管パターンテーブル内のパターンが
一定個数以上になった単語が存在すれば追加パターン決
定部12で、その単語の保管パターン及び標準パターン
を保管パターンテーブル13、 tsパターンテンプレ
ート8からそれぞれ入力し、各々の保管パターンに対し
、標準パターンとの最短距離を(1)式を用いて算出す
る。そして同部で、最短距離値が一定値以下であり、し
かも最小となる保管パターンを追加パターンとして相当
する単語の標準パターンテンプレート8に追加する。な
お、上記動作では、最短距離値が最小となる保管パター
ンのみを追加するが、これは、最短距離値の小さいパタ
ーン順にn番目の保管パターンまでを全て追加しても良
い。
また、認識する際には、音声信号を音声信号入力端子1
より入力し、入力信号を特徴抽出部2で分析し、特徴パ
ラメータを抽出する0音声信号の種類、分析条件は、学
習時と同様である。
次にパターン照合部1oで、学習時に更新した標準パタ
ーンテンプレート8より標準パターンを入力し、標準パ
ターンと入力パターンとの距離を(1)式を用いて算出
し、最短距離となった単語名を認識結果として出力端子
6より出力する0なお1スイツチ11は、学習時には、
追加ノくターン決定部12に、認識時には、結果出力端
子6に動作結果を出力するように動作する0発明が解決
しようとする問題点 しかしながら、上記の従来の構成では、誤認識パターン
の相互関係を考慮せずに、標準パターンに距離の近い1
つもしくは少数の誤認識パターンのみを追加パターンと
するので、追加パターンが追加しなかった他の誤認識パ
ターンに対し有効であるとは限らず、極端な場合、追加
したパターンのみに有効となり、ある一定個数以上の誤
認識パターンを保管したにもかかわらず、多くのパター
ンが無駄となり、学習の効率が悪くなるという問題点を
有していた。また、複数のパターンを追加する場合も、
非常に類似度の高い2つ以上のパターンが全て追加され
ることもあり、学習が冗長になるという問題点も有して
いた。
本発明は、上記の従来の問題点を解決するもので、学習
の際に、誤認識パターンに標準パターンを含めたパター
ンを対象に類似度の高いパターンを同クラスと見做した
クラス分けを行い(以後クラスタリングと呼ぶ。)、ク
ラス内のパターンの一定数以上が標準パターンであり、
しかも、セントロイドであるパターン(以後中心パター
ンと呼ぶ。)が誤認識パターンであるクラスが存在した
場合に、そのクラスの中心パターンを標準パターンに追
加することで、保管された誤認識パターンの大部分に有
効であり、なおかつ、冗長のない追加パターンを決定す
ることができ、認識の際には効率良く最適標準パターン
を用いることで認識率が向上する音声認識装置を提供す
るものである。
問題点を解決するための手段 この目的を達成するために本発明の音声認識装置は、各
単語もしくは音節、音韻につき複数個の標準パターンを
持つ標準パターン記憶部と、標準パターンの更新に必要
なパターンを保管する保管パターン記憶部ト、標準パタ
ーンと入力パターンとの照合を行うパターン照合部と、
複数個の標準パターン及び保管パターンを対象にクラス
タリングを行い、中心パターンを決定するセントロイド
決定部と、中心パターンを標準パターンテンプレートに
追加するかどうかを、上記クラス内のパターンの種類を
調べることで判定する追加パターン判定部とから構成さ
れている。
作用 この構成により、認識もしくは標準パターンを更新する
ための学習の際に、パターン照合部で誤認識パターンを
単語もしくは音節、音韻ごとに保管パターンテーブルに
保管し、標準パターンを更新するための学習時に、セン
トロイド決定部で、保管された誤認識パターンに標準パ
ターンを含めm−たパターンを対象にクラスタリングし
中心パターンを決定し、追加パターン判定部で、クラス
内のパターンの一定数以上が標準パターンでありしかも
中心パターンが誤認識パターンであるクラスが存在した
場合のみ、上記クラスの中心ノ(ターンを標準パターン
として記憶する。
実施例 以下、本発明の単語音声認識における実施例について図
面を参照しながら説明する。第1図は本発明の一実施例
における音声認識装置のブロック図、第2図はその動作
を説明するためのフローチャートである。
第1図において、1は音声入力端子、2は音声の特徴パ
ラメータを抽出する特徴抽出部、3は標準パターンと認
識されるべき入力パターンとを照合するパターン照合部
、4は学習時と認識時とで出力光を切り換えるスイッチ
、5は認識結果出力端子、6は標準パターン及び保管パ
ターンに対しクラスタリングを行い、セントロイドを決
定するセントロイド決定部、7は各セントロイドのパタ
ーンを標準パターンテンプレートに追加するかどうかを
決定する追加パターン決定部、8は各単語もしくは音節
、音韻につき複数個の標準パターンを持つ標準パターン
テンプレート、9は標準パターンの更新に必要なパター
ンを保管する保管バタ−ンテンプレートである。なお、
第1図において第3図に示す従来例と同一部には、同一
番号を付している。
以上のように構成された音声認識装置について、以下第
2図のフローチャートを用いてその動作を説明する。
標準パターンを更新するための学習を行う際には、音声
入力端子1より学習用音声信号を入力しく処理21)、
特徴抽出部2で分析し特徴パラメータを抽出する(処理
22)。学習用音声信号の種類、分析条件は従来例と同
様である。
標準パターンテンプレート8には、音声区間分のケプヌ
トラム係数を1単語とする標準パターンが各単語につき
複数個含まれている。パターン照合部3で、上記標準パ
ターンを入力し、特徴抽出部2で分析された学習音声パ
ターンと標準パターンとの距離を算出する(処理23)
。最短距離である標準パターンが、学習音声パターンと
他単語である場合には、誤認識パターンとして上記学習
音声パターンを保管バタ〒ンテーブル9に保管する(処
理26)。
学習用音声信号を入力してから後の以上の過程を、標準
パターンテンプレート8に含まれている全単語について
、単数もしくは複数の話者が、複数回繰り返す。
上記動作の結果、保管パターンテーブル内のパターンが
一定個数以上になった単語が存在すればセントロイド決
定部6で、その単語の保管パターン及び標準パターンを
保管パターンテーブル9、標準パターンテンプレート8
がらそれぞれ入力しく処理29.処理30)以上のパタ
ーンを対象にクラスタリングを行い(処理31)各クラ
スの中心パターンを決定する(処理32)Oクラスタリ
ングの方法は、たとえば、各パターンにつき距離の近い
上位に個のパターンを各パターンの近傍点とし同クラス
とする。そして互いに近傍点となるパターンが存在すれ
ば、相当するパターンのクラスを合わせたものを新しい
クラスとする。(以上の処理を以後に−NN法と呼ぶ)
これを(2)式に示す0 また、セントロイドの決定法は、たとえば、同クラス内
の全てのパターンとの距離の和が最も小さいパターンを
中心パターンとする。(以後ポテンシャル法と呼ぶ) 次に追加パターン決定部7で、各クラスに対し次の判定
条件を満たすクラスの中心パターンを追加パターンとし
て、相当する単語の標準パターンテンプレート8に追加
する(処理36)。
(判定条件1) 各クラス内に標準パターンが半数以上
ある。
(判定条件2) 中心パターンは保管パターンである。
また、認識する際には、音声信号を音声信号入力端子1
より入力しく処理21)、入力信号を特徴抽出部2で分
析しく処理22)特徴パラメータを抽出する。音声信号
の種類0分析条件は、学習時と同じである。
次にパターン照合部3で、学習時に更新した標準パター
ンテンプレート8より標準パターンを入力し、標準パタ
ーンと入力パターンとの距離を(1)式を用いて算出(
処理23)し、最短距離となった単語名を認識結果とし
て出力端子6より出力する(処理27)。
なお、スイ、フチ4は、学習時にはセントロイド決定部
6に、認識時には結果出力端子5に動作結果を出力する
ように動作する。
以上のように1本実施例によれば、標準パターンを更新
する学習時に、セントロイド決定部6で保管された誤認
識パターンに標準パターンを含めたパターンを対象に−
NN法によるクラスタリングを行い、各クラスタの中心
パターンをポテンシャル法により決定し、追加パターン
決定部7で、クラス内のパターンの半数以上が標準パタ
ーンテありしかも中心パターンが誤認識パターンである
クラスが存在した場合のみ、上記クラスの中心パターン
を標準パターンとして記憶することにより、保管した誤
認識パターンの大部分に有効であり。
なおかつ、冗長のない追加パターンを決定することが可
能となり、効率良く学習ができる。
なお、本実施例では、パターン照合部3で、学習時のみ
誤認識パターンを保管したが、認識時に誤認識した場合
キーボードなど音声以外の手段で話者が装置に正しい単
語名を入力することが可能であれば、a!識時に誤認識
パターンを保管してもよい。この場合は1本実施例と同
じ効果があり。
さらに、学習時に、話者が学習用音声信号を入力する必
要がなくなるため、話者の負担が軽減する。
発明の効果   ゛ 本発明は、標準パターンを更新するための学習時に、保
管した誤認識パターンに標準パターンを含めたパターン
を対象にクラスタリングを行い、セントロイドを決定し
、各クラス内のパターンの一定数以上が標準パターンで
あり、かつ、セントロイドが誤認識パターンであるクラ
スが存在した場合のみ、上記クラスのセントロイドのパ
ターンを標準パターンとして記憶することにより、保管
した誤認識パターンの大部分に有効であV、なおかつ、
冗長のない追加パターンを決定することが可能となり、
効率良く学習ができる優れた音声認識装置を実現できる
ものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のプロ
ワク図、第2図は同音声認識装置のフローチャート、f
g3図は従来の音声認識装置のブロック図である。 1・・・・・・音声入力端子、2・旧・・特徴抽出部、
3・・・・・・パターン照合部、4・・・・・・スイフ
チ、6・旧・・認識結果出力端子、6・・・・・・セン
トロイド決定部、7・・・・・・追加パターン決艇部、
8・・・・・・標準パターンテンフレート%9・・・・
・・保管パターンテーブル。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
図 第 211J

Claims (1)

    【特許請求の範囲】
  1. 各単語もしくは音節、音韻につき、複数個の標準パター
    ンを持つ標準パターン記憶部と、標準パターンの更新に
    必要なパターンを保管する保管パターン記憶部と、標準
    パターンと認識されるべき入力パターンとを照合するパ
    ターン照合部と、複数個の標準パターン及び保管パター
    ンに対し類似度の高いパターンを同クラスと見做したク
    ラス分けを行い、各クラスのセントロイドを決定するセ
    ントロイド決定部と、上記クラス分けの結果から各セン
    トロイドのパターンを標準パターンテンプレートに追加
    するかどうかを判定する追加パターン判定部を具備し、
    認識時もしくは標準パターンを更新するための学習時に
    、前記パターン照合部で誤認識パターンを前記保管パタ
    ーンテーブルに保管し、標準パターンを更新するための
    学習時に、前記セントロイド決定部で、保管された誤認
    識パターンに標準パターンを含めたパターンを対象にク
    ラス分けを行いセントロイドを決定し、前記追加パター
    ン判定部で、クラス内のパターンの一定数以上が標準パ
    ターンであり、しかもセントロイドが誤認識パターンで
    あるクラスが存在した場合のみ、上記クラスのセントロ
    イドのパターンを標準パターンとして記憶することを特
    徴とする音声認識装置。
JP60251413A 1985-11-08 1985-11-08 音声認識装置 Pending JPS62111292A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60251413A JPS62111292A (ja) 1985-11-08 1985-11-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60251413A JPS62111292A (ja) 1985-11-08 1985-11-08 音声認識装置

Publications (1)

Publication Number Publication Date
JPS62111292A true JPS62111292A (ja) 1987-05-22

Family

ID=17222471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60251413A Pending JPS62111292A (ja) 1985-11-08 1985-11-08 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62111292A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176067A (ja) * 2009-02-02 2010-08-12 Fujitsu Ltd 音声認識装置及び音声認識方法
JP2010175869A (ja) * 2009-01-30 2010-08-12 Fujitsu Ltd 音声認識用辞書作成装置及び音声認識用辞書作成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010175869A (ja) * 2009-01-30 2010-08-12 Fujitsu Ltd 音声認識用辞書作成装置及び音声認識用辞書作成方法
JP2010176067A (ja) * 2009-02-02 2010-08-12 Fujitsu Ltd 音声認識装置及び音声認識方法

Similar Documents

Publication Publication Date Title
JP3444108B2 (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JPH02232696A (ja) 音声認識装置
JP3289670B2 (ja) 音声認識方法および音声認識装置
JPH1097270A (ja) 音声認識装置
JP3291073B2 (ja) 音声認識方式
JP2827590B2 (ja) 音声認識装置
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS63118198A (ja) 音声認識装置
JPS62204299A (ja) 音声認識装置
JPH0455518B2 (ja)
JPH0554116B2 (ja)
JPS6136797A (ja) 音声セグメンテ−シヨン法
JPH0619497A (ja) 音声認識方法
JPS6073592A (ja) 特定話者用音声認識装置
JPS63247799A (ja) 音声認識装置
JPS63303398A (ja) 音声認識装置
JPH08297500A (ja) 離散単語音声認識システムにおける誤認識不能処理方法
JPS63218999A (ja) 音声認識装置
JPS5977500A (ja) 単語音声認識方式
JPS607492A (ja) 単音節音声認識方式
JPS61123889A (ja) 音声認識装置
Xu et al. Research on automatic speaker recognition based on speech clustering
JPH0484196A (ja) 連続音声認識用登録パターン作成方法
JPS6315295A (ja) 音声認識装置