JP2543584B2 - 音声標準パタン登録方式 - Google Patents

音声標準パタン登録方式

Info

Publication number
JP2543584B2
JP2543584B2 JP63225937A JP22593788A JP2543584B2 JP 2543584 B2 JP2543584 B2 JP 2543584B2 JP 63225937 A JP63225937 A JP 63225937A JP 22593788 A JP22593788 A JP 22593788A JP 2543584 B2 JP2543584 B2 JP 2543584B2
Authority
JP
Japan
Prior art keywords
voice
pattern
category
recognition
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63225937A
Other languages
English (en)
Other versions
JPH0273398A (ja
Inventor
敬 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63225937A priority Critical patent/JP2543584B2/ja
Publication of JPH0273398A publication Critical patent/JPH0273398A/ja
Application granted granted Critical
Publication of JP2543584B2 publication Critical patent/JP2543584B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は音声認識装置における音声標準パタン登録
方式に関するものである。
(従来の技術) 音声認識装置はコンピュータ、その他の種々の外部機
器の有力な入力装置として利用され始めており、そのた
め、種々の開発が進められている。
第2図は従来の音声認識装置の典型例を示すブロック
図である。先ず、この発明の理解を容易にするためこの
従来装置の認識処理及び標準パタン登録処理につき簡単
に説明する。
先ず、認識処理動作を説明する。
使用する話者の発声した音声をマイクロホン等の外部
音声入力装置10によって取り込み、このアナログ入力音
声をA/D変換部12においてディジタル音声信号に変換
し、特徴抽出部14においてこの音声信号から音声の特徴
パラメータを抽出しこれを音声切り出し部16及び認識部
18へそれぞれ出力する。通常、音声切り出し部16におい
て、この抽出した特徴パタメータの時間変化から音声区
間を判定して認識部18へ送る。そして20は標準パタン辞
書メモリであって、未知の音声パタンとマッチングを行
うために用いる標準パタンを予め登録しておくためのも
のである。
この認識部18において、音声区間の特徴パラメータ系
列である音声パタンを音声パタン保存用RAM22に一時保
存する。認識部18中のマッチング部24ではこの音声パタ
ンと予め音声標準パタンメモリ20に登録されている標準
パタンを読み出してきて音声パタンとこの標準パタンと
の類似度を求め、選択部26において最大類似度を有する
標準パタンの属するカテゴリを認識判定し、認識結果と
しての当該標準パタンのカテゴリの番号を外部機器28へ
出力し、その後の所望の処理に供せしめる構成となって
いる。
このような音声認識装置では標準パタンの品質が認識
結果を左右する。
次に、登録処理動作につき説明する。
一般に標準パタン登録方式としては、文献:特開昭61
−6694号公報に開示されているように、話者に同一カテ
ゴリの音声を複数回発声させ、その内の適当と思われる
音声パタンを取捨選択し、選択されたパタンから標準パ
タンとして登録する技術がある。
この従来の標準パタン選択方式の原理は音声パタンの
識別能力を評価し、その評価値が最も高いものを選ぶ方
式である。ここではその評価値として同じカテゴリの音
声パタンとの平均距離DSELF(以下、自カテゴリ平均距
離と称する。)とその他のカテゴリに属する音声パタン
との平均距離DL(以下、自他カテゴリ平均距離と称す
る。)との差△Dを用いている。この差△Dは自カテゴ
リの認識能力を表している。この差△Dの算出手順につ
いて第2図を参照して簡単に述べる。
まず、登録しようとする話者がマイクロホン10に対し
発声し必要な音声を入力する。入力された音声をA/D変
換部12を経て特徴抽出部14に送り、そこで特徴パラメー
タを算出する。
次に音声切り出し部16において特徴パラメータから音
声区間を判定し、音声区間の特徴パラメータ系列である
音声パタンPij(カテゴリi、発声番号j回目の発声で
作られた音声パタン)を認識部18の音声パタン保存用RA
M22に一時保存する。マッチング部24ではすべての音声
パタンの相互距離D(Pij、Pkl)を算出し、その結果を
相互距離記録用RAM30に記憶する。次に、選択部26にお
いて、カテゴリ1、発声番号1から順に音声パタンPij
の自カテゴリ平均距離DSELF,自他カテゴリ平均距離DL及
び差△Dを算出する。
△D=DL=DSELF 次に音声パタンPij(j=l,m)で最も差△Dが大きく
なる音声パタンPを選択し、標準パタンとして相互距離
記録用RAM30から標準パタン辞書メモリ20に登録する。
(発明が解決しようとする課題) 従来の標準パタン登録方式では自カテゴリ内の音声パ
タン間はもとより自他カテゴリ間での音声パタンの相互
距離D(Pij,Pkl)(但し、i=kを含む)を単に平均
値としての評価にしか用いていなかった。この相互距離
D(Pij,Pkl)はそれ以上の情報を含んでおり、例え
ば、この相互距離D(Pij,Pkl)から単語を誤認識する
割合が推定できる。更に特定の音声パタンの存在がカテ
ゴリ単位の誤認識を引き起こす割合従って認識に悪影響
を及ぼす可能性を推定できる。しかしながら、この従来
の方式ではこの様な情報をまったく利用していなかっ
た。
この発明の目的は、以上に述べた単語間の相互距離か
ら特定の音声パタンが他カテゴリの単語の誤認識を引き
起こす割合を評価し、誤認識を招きやすい音声パタンを
音声標準パタン作成用パタンとして用いないようにする
ことによって、総合的な認識性能の優れた音声認識装置
とすることを可能にした音声標準パタン登録方式を提供
することにある。
(課題を解決するための手段) この目的の達成を図るため、この発明の音声標準パタ
ン登録方式によれば、 登録対象のカテゴリ数をnとし、同じカテゴリの単語
をm回発生するものとするとき、認識部に、 音声標準パタン作成用の音声パタン群のうちの任意の
音声パタンPij(カテゴリi、発声番号j回目の発声で
作られた音声パタン)とそれ以外のすべての音声パタン
Pkl(カテゴリk、音声番号l回目の発声で作られた音
声パタン)との相互距離D(Pij、Pkl)を算出する機能
と、同一カテゴリkに属する音声パタン間の相互距離D
(Pkj、Pkl)の平均値である平均相互距離DS(k)を
(イ)式により算出する機能と、この相互距離D
(Pij、Pkl)とこの平均相互距離DS(k)との差δを
(ロ)式により算出する機能と、前記音声パタンPij
前記音声パタンPklの認識により引き起こす割合De
(i、j、k、l)を前記差δから関数fを用いて
(ハ)式により算出する機能と、この割合De(i、j、
k、l)を加算して前記音声パタンPijがカテゴリiと
は異なるカテゴリの音声パタンの認識に誤りを引き起こ
す割合である誤認識誘起度合ES(i、j)を(ニ)式に
より算出する機能とを有する算出手段と、 これら誤認識を引き起こす割合De(i、j、k、l)
の大きさ及び前記異なるカテゴリに対する全ての誤認識
誘起度合ES(i、j)の大きさのいずれか一方又は双方
に基づいて前記あるカテゴリiの音声パタンPijを音声
標準パタン作成用パタンとして判定する判定手段とを 具えることを特徴とする。
δ=D(Pij、Pkl)=DS(k) ・・・(ロ) De(i、j、k、l)=f(δ) ・・・(ハ) この発明の実施に当って、この判定手段は前述の誤認
識を引き起す割合Deが一定の閾値より小さいときに前述
のあるカテゴリの音声パタンを音声標準パタン作成用パ
タンとして採用するのが好適である。
或いはこの発明の好適な実施例によれば、この判定手
段は前述の誤認識誘起度合Esが一定の閾値より小さいと
きに前述のあるカテゴリの音声パタンを音声標準パタン
作成用パタンとして採用するのがよい。
又、或はこの発明の他の実施例では、この判定手段は
前述の誤認識を引き起こす割合De及び前述の誤認識誘起
度合Esが個別の一定の閾値よりそれぞれ小さいときに前
述のあるカテゴリの音声パタンを音声標準パタン作成用
パタンとして採用するの好適である。
(作用) 上述した構成によれば、認識部は本来の音声認識処理
機能の他に、音声標準パタン登録のための誤認識を引き
起す割合及びその加算値である誤認識誘起度合を算出す
る機能を有する算出手段と、判定手段とを具えている。
この算出手段においては、音声標準パタン作成に用い
られる音声パタン群のうち任意の一パタンとそれ以外の
全ての音声パタンとの相互距離を算出し、同一カテゴリ
に属する音声パタン間の平均距離Dsを求める。次に任意
のカテゴリαに属する音声パタンPとカテゴリαとは異
なるカテゴリβに属する音声パタンP′の相互距離値D
(P,P′)からカテゴリβの平均相互距離Dsを減じた値
の大小によって、音声パタンPがカテゴリβに対して誤
認識を引き起す割合Deを算出する。そして、さらに所要
に応じ、これら誤認識を引き起す割合Deの加算値を誤認
識誘起度合Esとして算出することも出来る。
次に判定手段において、この算出されたカテゴリの内
の音声パタンに対応する割合Deの大きさ及びそれ自身の
カテゴリα以外のカテゴリに属する全ての音声パタンに
対応するDeの加算値Esの大きさのいずれか一方又は双方
が予め経験的にそれぞれ対応して定められた閾値よりも
大なる場合は、その音声パタンPを音声標準パタン作成
より除去するように定量的に評価する。
このように各カテゴリ毎に誤認識を誘起する割合De又
はEsを定量的に評価して音声認識に悪影響を及ぼし易い
音声パタンを排除しているので誤認識を引き起こすおそ
れの少ない音声パタンのみを標準パタン作成用パタンと
して選択し、これより決定された標準パタンを登録する
ので、安定した高い認識率をもった音声認識装置を実現
できる。
(実施例) 以下、図面を参照してこの発明の音声標準パタン登録
方式の実施例につき説明する。
第1図はこの発明の音声標準パタン登録方式の説明に
供するブロック図であり、第2図に示した構成成分と同
一の構成成分については同一符号を付して示しその詳細
な説明を省略する。
この発明の実施例では、認識部18の一構成成分である
選択部26に、本来の認識処理機能に加えて、音声標準パ
タン登録処理のための誤認識を引き起す割合及び誤認識
誘起度合の算出手段40と判定手段42とを設ける。又、所
要に応じ、この判定手段42には利用者に対し処理の結果
を表示したり、処理結果に応じて次の処理のための指示
を与えるための指示表示を行うための光学式、或は、音
響式等の表示部44を設けておいてもよい。
以下、音声標準パタン登録の処理に必要な音声パタン
の入力処理と、誤認識を引き起す割合De及び誤認識誘起
度合Esを算出する処理と、その結果から音声パタンが標
準パタン作成用パタンとして適合しているか否かを判定
する判定処理とに分けて説明する。
入力処理 入力処理は登録しようとする利用者が音声入力用マイ
クロホン10に向けて発声した音声入力から音声パタンを
作り出し、この音声パタンを音声パタン保存用RAM22に
一時保存するための処理であるが、これは従来装置の場
合と同様に行われるので、その詳細な説明を省略する。
この実施例では登録対象のカテゴリ数をnとし、同じカ
テゴリの単語をm回発声するものとし、カテゴリ1から
順に同じ単語をm回発声し、カテゴリnまで繰り返す。
各発声におけるマイクロホン10からの入力音声はA/D変
換部12でディジタル信号となり、特徴抽出部14でこのデ
ィジタル信号より特徴パラメータを算出する。次に音声
切り出し部16で切り出された音声区間の特徴パラメータ
系列、すなわち、音声パタンPij(カテゴリi、音声番
号j回目の発声で作られた音声パタン)を音声パタン保
存用RAM22に一時保存する。すべてのカテゴリ(i=1
…,n)の音声パタン(j=1…,m)につき保存用RAM22
への入力終了後、次の誤認識を引き起す割合De及び誤認
識誘起度合Esの算出処理に移る。
De及びEs算出処理 第3図はこの実施例における誤認識を引き起す割合De
及び誤認識誘起度合Esの算出手段を説明するための動作
の流れ図である。
この処理ではマッチング部24において予め最初にすべ
ての音声パタンの相互距離D(Pij,Pkl)を算出し、そ
の結果を交互距離記録用RAM30に記憶する(ステップS
1)。尚、ここまでの処理は従来と同様である。
次に、この発明の実施例では、選択部26の算出手段40
において、先ず、同じカテゴリの平均相互距離DS(i)
を計算しておく。
この計算は下記の式(1)に従って実行する(ステッ
プS2)。
ある音声パタンPklを入力したときの同一カテゴリk
内の残りの(m−1)個の音声パタンとのそれぞれの相
互距離はDS(k)で近似できる。同様にカテゴリkの音
声パタンPklを入力したときの、異なるカテゴリiの音
声パタンPijとの相互距離はD(Pij,Pkl)で与えられ
る。そこで、この発明の実施例では下記の(2)式で示
すような、この両者の距離はD(Pij,Pkl)及びDs
(k)の差を算出する(ステップS3)。この差δが小さ
い程、誤認識が起こり易くなる。第4図はこの差δと誤
認識を起す割合De(i,j,k,l)との関係を示す図であ
り、この関係は横軸にδ及び縦軸にDeをプロットして示
した曲線で与えられる。この曲線からも理解できるよう
に、δが小さくなるにつれて誤認識の割合De(i,j,k,
l)が大きくなることがわかる。尚、この割合De(i,j,
k,l)は音声パタンPklに近い他の音声パタンがカテゴリ
kとは異なるカテゴリに属する音声パタンであると誤認
識されてしまう当該誤認識のうちで音声パタンPijに起
因するとして起こる誤認識の割合を与えるもので、次の
式(3)で表わされる。但し、式(2)のf(δ)は距
離の差δから誤認識を起す割合Deに変換する関数であ
る。尚、関数f(δ)は認識システム毎に異なってくる
が、一般に認識装置の評価に用いられるコンフユージョ
ンマトリックス等から簡単に求めることが出来、当業者
には容易に理解できるのでその説明は省略する。
δ=D(Pij、Pkl)=DS(k) ・・・(2) De(i,j,k,l)=f(δ) ・・・(3) さらにある音声パタンPijが他の全カテゴリに対して
誤認識を誘起する度合、すなわち誤認識誘起度合ES(i,
j)は下記の(4)式で与えられる。
判定処理 <Deによる判定> 先ず、判定手段42において誤認識を引き起す割合De
(i,j,k,l)を利用して注目した音声パタンが音声標準
パタン作成に適したパタンか否かの判定を行う。この判
定処理はDe群中、飛び抜けて大きな値のDeを排除しよう
とするための手法である。
第5図はこの判定処理の動作の流れ図である。尚、同
図において、ステップS10は既に説明した入力処理であ
り、ステップS11及びステップS12は第3図で説明したス
テップS1〜S4までのDe算出処理を示している。
第5図に示す処理は、一例として、求められた誤認識
を引き起す割合De(i,j,k,l)の各々が経験により予め
定められかつ適当なメモリ(RAM22又は30或は別個に設
けたメモリ46であってもよい)に読出し自在に格納され
ている閾値λよりも大きいか又は小さいか或は等しい
かによって注目する音声パタンが音声標準パタン作成用
パタンとして適しているか否かを判定する判定処理を示
している。
先ず、カテゴリi←1(ステップS13)かつ発声回数
番号j←1(ステップS14)と初期設定を行う。続い
て、カテゴリk←1(ステップS15)と初期設定を行な
った後、k=iかどうかの判定処理を行い(ステップS1
6)、k=iでなければl←1と初期設定を行う(ステ
ップS17)。k=iであればkを更新して後述するステ
ップS21へ飛ぶ。
次に、割合De(i,j,k,l)(但し、この回ではi=1,j
=1である)につき、メモリから流出してきた閾値λ
と大きさの比較を行う(ステップS18)。この比較によ
ってDe(i,j,k,l)<λである場合には、音声パタンP
ijは音声標準パタン作成用パタンとして選択出来る可能
性がある。
次にl←l+1として次の発声に進み(ステップS1
9)、l>mでなければ(ステップS20)ステップS18へ
戻り、(l+1)回目、この場合は、2回目の発声につ
き同様にDe(i,j,k,l)と閾値λとの比較を行う。
このようにしてDe(i,j,k,l)<λが続く限り、l
=m回目の発声までの全ての音声パタンPk,mまで繰り
返し行う(ステップS20)。l番目のカテゴリについて
l>m(ステップS20)となった場合には、カテゴリk
を次のカテゴリk+1へ進ませ(ステップS21)、k>
nでなければ(ステップS22)、ステップS16へ戻り、l
=1〜mにつき上述した場合と同様に割合De(i,j,k,
l)と閾値λとの比較を行い、これをk=nまで繰り
返しで行う(ステップS22)。
次にj←j+1として次の発声に進み(ステップS2
3)、j>mでなければ(ステップS24)ステップS15へ
戻り、(j+1)回目、この場合は、2回目の発声につ
き同様にDe(i,j,k,l)と閾値λとの比較を行う。こ
の場合音声パタンPij,j+1も音声標準パタン作成用パ
タンとして選択出来る可能性がある。
このようにしてDe(i,j,k,l)<λが続く限り、j
=m回目の発声までの全ての音声パタンPi,jまで繰り
返し行う(ステップS15〜S24)。i番目のカテゴリにつ
いてj>m(ステップS24)となった場合には、カテゴ
リiを次のカテゴリi+1へ進ませ(ステップS25)、
i>nでなければ(ステップ26)、ステップS14へ戻
り、i=1〜nの全てのカテゴリにつき上述した場合と
同様に割合De(i,j,k,l)と閾値λとの比較を行い
(ステップ18)、これをi=nまで繰り返しで行う(ス
テップS15〜S19)。
ところで、ステップS18において割合De(i,j,k,l)が
閾値λ以上となったとき、すなわち、De(i,j,k,l)
≧λのときは、音声パタンPi,jは総合的な認識性能
を低下させるパタンであるとして標準パタン作成用パタ
ンから排除する(ステップS18)。この場合には、表示
部44で再発声するか否かを利用者に尋ね(ステップS2
7)、再発声する場合にはカテゴリの単語を更新する
(ステップS28)。この更新とは音声入力を入れ換えて
同一のカテゴリiの全ての音声パタンを作り直すことを
意味し、カテゴリi及び発声回数のところの計算をやり
直すためDe算出処理の最初のステップS11へ戻る。
ステップS27において、利用者が再発声を許容しない
場合には、ステップS16へ進み、それ以後処理を行わせ
ることが出来るが、これは設計上の問題である。
このようなステップS10〜S28の処理を介した後は、誤
認識を招くような発声が取り除かれているため常に安定
した認識性能が得られる音声パタンPijのセットとなっ
ている。この後は例えば従来のように差△Dが最大の音
声パタンPを標準パタンとして標準パタン辞書メモリ20
に登録したり、或は又、伝意好適な方法で例えば選択さ
れた全ての音声パタンを標準パタンとして、或は平均化
したパタンを標準パタンとする等の種々の方法で標準パ
タンを登録すればよい(ステップS29)。
<ESによる判定> 上述した実施例では誤認識を引き起す割合De(i,j,k,
l)毎に一定の閾値λと比較を行っているが、そのよう
にする代わりに注目する音声パタンPij属するカテゴリ
i以外のカテゴリに属する音声パタンに対する全ての誤
認識を引き起す割合De(i,j,k,l)の加算値 として与えられる誤認識誘起度合Es(i,j)が経験によ
り予め定めた一定の閾値λより小さいときには注目す
る音声パタンPijを音声標準パタン作成用のパタンとし
て選択するように構成することが出来る。判定手段42に
おいて上述したDeに基づく判定の代わりに、誤認識誘起
度合Esを利用して注目した音声パタンが音声標準パタン
作成に適したパタンか否の判定を行うことも出来る。こ
の手法は、De群中に突出した値のものが存在しない場合
に有効的である。
第6図はこの判定処理の動作の流れ図である。尚、同
図において、ステップS10は既に説明した入力処理であ
り、ステップS11及びステップS12は第3図で説明したス
テップS1〜S4までのEs算出処理を示している。
第6図に示す処理は、一例として、求められた各誤認
識誘起度合Es(i,j)が経験により予め定められかつ適
当なメモリ(RAM22又は30或は別個に設けたメモリ46で
あってもよい)に読出し自在に格納されている閾値λ
よりも大きいか又は小さいか或いは等しいかによって注
目する音声パタンが音声標準パタン作成用パタンとして
適しているか否かを判定する判定処理を示している。
先ず、カテゴリi=1(ステップS41)かつ発声回数
番号j=1(ステップS42)と初期設定を行う。
次に、度合Es(i,j)(但し、この回ではi=1,j=1
である)につき、メモリから流出してきた閾値λと大
きさの比較を行う(ステップS43)。この比較によってE
s(i,j)<λである場合には、音声パタンPijは音声
標準パタン作成用パタンとて選択出来る。
次にj=j+1として次の発声に進み(ステップS4
4)、(j+1)回目、この場合は、2回目の発声につ
き同様にEs(i,j)と閾値λとの比較を行う。この場
合音声パタンPi,j+iも音声標準パタン作成用パタン
として選択出来る。
このようにしてEs(i,j)<λが続く限り、j=m
回目の発声までの全ての音声パタンPi,mまで繰り返し
行う(ステップS45)。i番目のカテゴについてi>m
(ステップS45)となった場合には、カテゴリiを次の
カテゴリi+1へ進ませてj=1〜mにつき上述した場
合と同様に度合Es(i,j)と閾値λとの比較を行い、
これをi=mまで繰り返しで行う(ステップ47)。
ところで、ステップS43において度合Es(i,j)が閾値
λ以上となったとき、すなわち、Es(i,f)≧λ
ときは、音声パタンPi,jは総合的な認識性能を低下さ
せるパタンであるとして標準パタン作成用パタンから排
除する(ステップS43)。この場合には、表示部44で再
発声するか否かを利用者に尋ね(ステップS48)、再発
声する場合にはカテゴリの単語を更新する(ステップS4
9)。この更新とは音声入力を入れ換えて同一のカテゴ
リiの全ての音声パタンを作り直すことを意味し、カテ
ゴリi及び発声回数のところの計算をやり直すためEs算
出処理の最初のステップS11へ戻る。
ステップS48において、利用者が再発声を許容しない
場合には、ステップS44へ進み、以下のステップS45〜S5
0を行わせることが出来るが、これは設計上の問題であ
る。
このようなステップS10,S11,S40〜S49の処理を介した
後は、前述したDeにより判定処理の場合と同様に、誤認
識を招くような発声が取り除かれているため常に安定し
た認識性能が得られる音声パタンPijのセットとなって
いる。この後は例えば従来のように差△Dが最大の音声
パタンPを標準パタンとして標準パタン辞書メモリ20に
登録したり、或は又、伝意好適な方法で例えば選択され
た全ての音声パタンを標準パタンとして、或は平均化し
たパタンを標準パタンとする等の種々の方法で標準パタ
ンを登録すればよい(ステップS50)。
<他の判定処理> 或は又、上述した各Deと一定の閾値λとの大小関係
の比較及び上述した加算値 と一定の閾値λとの大小関係との比較を行って、両比
較において前者がλ1,及び後者がλよりもそれぞれ小
さいと判定された音声パタンPijを音声標準パタン作成
用のパタンとして選択してもよい。
(発明の効果) 上述した説明からも明らかなように、この発明によれ
ば標準パタン登録用音声間の相互距離から各カテゴリ間
の類似度を求める。さらに各カテゴリごとに誤認識を誘
起する割合を定量的に評価し、誤認識の原因となる音声
パタンを排除するようにしたものである。その結果とし
て当然ながら安定した高い認識率を持つ音声認識装置が
実現できる。従って、この発明による登録手法は特定27
話者音声認識装置と呼ばれるあらかじめ音声パタンを登
録する認識装置全般に適応できるばかりでなく、複数の
話者の音声パタンを用いて不特定の話者を対象とする様
な音声認識装置においても標準パタン作成用音声パタン
の妥当性を判定する手法としても利用できる。
【図面の簡単な説明】
第1図はこの発明の音声標準パタン登録方式の説明に供
する図、 第2図は従来の音声標準パタン登録方式の説明に供する
図、 第3図はこの発明の音声標準パタン登録方式での誤認識
誘起度合の算出処理流れ図、 第4図は距離差δと音声パタンPijに起因して誤認識を
引き起す割合De(i,j,k,l)との関係を示す曲線図、第
5図及び第6図はこの発明の音声標準パタン登録方式で
の判定処理の流れ図である。 10:外部音声入力部、12:A/D変換部、 14:特徴抽出部、16:音声切り出し部、 18:認識部、 20:標準パタン辞書メモリ、 24:マッチング部、26:選択部、 28:外部機器、 30:相互距離記録用RAM、 40:算出手段、42:判定手段、 44:表示部、46:メモリ。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声標準パタンを読出し自在に予め登録し
    ておくための標準パタン辞書メモリと、 外部音声入力部からの入力音声の音声パタンと予め登録
    された音声標準パタンとの類似度を算出する認識部とを
    含み、 該類似度に基づいて認識結果を外部処理装置へ出力する
    ように構成した音声認識装置の当該標準パタン辞書メモ
    リに、各音声パタンの相互距離Dに基づいて、音声標準
    パタンを登録する方式において、 登録対象のカテゴリ数をnとし、同じカテゴリの単語を
    m回発生するものとするとき、前記認識部は、 音声標準パタン作成用の音声パタン群のうちの任意の音
    声パタンPij(カテゴリi、発声番号j回目の発声で作
    られた音声パタン)とそれ以外のすべての音声パタンP
    kl(カテゴリk、発声番号l回目の発声で作られた音声
    パタン)との相互距離D(Pij、Pkl)を算出する機能
    と、同一カテゴリkに属する音声パタン間の相互距離D
    (Pkj、Pkl)の平均値である平均相互距離DS(k)を
    (イ)式により算出する機能と、該相互距離D(Pij、P
    kl)と該平均相互距離DS(k)との差δを(ロ)式によ
    り算出する機能と、前記音声パタンPijが前記音声パタ
    ンPklの認識に誤りを引き起こす割合De(i、j、k、
    l)を前記差δから関数fを用いて(ハ)式により算出
    する機能と、該割合De(i、j、k、l)を加算して前
    記音声パタンPijがカテゴリiとは異なるカテゴリの音
    声パタンの認識に誤りを引き起こす割合である誤認識誘
    起度合ES(i、j)を(ニ)式により算出する機能とを
    有する算出手段と、 これら誤認識を引き起こす割合De(i、j、k、l)の
    大きさ及び前記異なるカテゴリに対する全ての誤認識誘
    起度合ES(i、j)の大きさのいずれか一方又は双方に
    基づいて前記あるカテゴリiの音声パタンPijを音声標
    準パタン作成用パタンとして判定する判定手段とを 具えることを特徴とする音声標準パタン登録方式。 δ=D(Pij、Pkl)=DS(k) ・・・(ロ) De(i、j、k、l)=f(δ) ・・・(ハ)
  2. 【請求項2】前記判定手段は前記誤認識を引き起す割合
    Deが一定の閾値より小さいときに前記あるカテゴリの音
    声パタンを音声標準パタン作成用パタンとして採用する
    ことを特徴とする請求項1記載の音声標準パタン登録方
    式。
  3. 【請求項3】前記判定手段は前記誤認識誘起度合ESが一
    定の閾値より小さいときに前記あるカテゴリの音声パタ
    ンを音声標準パタン作成用パタンとして採用することを
    特徴とする請求項1記載の音声標準パタン登録方式。
  4. 【請求項4】前記判定手段は前記誤認識を引き起こす割
    合De及び前記誤認識誘起度合ESが個別の一定の閾値より
    それぞれ小さいときに前記あるカテゴリの音声パタンを
    音声標準パタン作成用パタンとして採用することを特徴
    とする請求項1記載の音声標準パタン登録方式。
JP63225937A 1988-09-09 1988-09-09 音声標準パタン登録方式 Expired - Fee Related JP2543584B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63225937A JP2543584B2 (ja) 1988-09-09 1988-09-09 音声標準パタン登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63225937A JP2543584B2 (ja) 1988-09-09 1988-09-09 音声標準パタン登録方式

Publications (2)

Publication Number Publication Date
JPH0273398A JPH0273398A (ja) 1990-03-13
JP2543584B2 true JP2543584B2 (ja) 1996-10-16

Family

ID=16837235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63225937A Expired - Fee Related JP2543584B2 (ja) 1988-09-09 1988-09-09 音声標準パタン登録方式

Country Status (1)

Country Link
JP (1) JP2543584B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3110478B2 (ja) 1991-03-26 2000-11-20 日本放送協会 パターン認識方法および装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007111197A1 (ja) * 2006-03-24 2007-10-04 Pioneer Corporation 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3110478B2 (ja) 1991-03-26 2000-11-20 日本放送協会 パターン認識方法および装置

Also Published As

Publication number Publication date
JPH0273398A (ja) 1990-03-13

Similar Documents

Publication Publication Date Title
US5018201A (en) Speech recognition dividing words into two portions for preliminary selection
EP1239459A1 (en) Adaptation of a speech recognizer to a non native speaker pronunciation
JPH0554959B2 (ja)
US5873061A (en) Method for constructing a model of a new word for addition to a word model database of a speech recognition system
JPH0422276B2 (ja)
JPH0816187A (ja) 音声分析における音声認識方法
EP0118484B1 (en) Lpc word recognizer utilizing energy features
JP2955297B2 (ja) 音声認識システム
JP2543584B2 (ja) 音声標準パタン登録方式
JPH0247760B2 (ja)
JP3428058B2 (ja) 音声認識装置
JPH08123469A (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JPH06266386A (ja) ワードスポッティング方法
JP3135594B2 (ja) パターン認識装置およびパターン認識方法
JPH0777998A (ja) 連続単語音声認識装置
JP3775454B2 (ja) 音声認識用ニューラルネットワークの学習方法
JP3011421B2 (ja) 音声認識装置
JPH04271397A (ja) 音声認識装置
JPS59173884A (ja) パタ−ン比較装置
JP3097134B2 (ja) Dpマッチング法
JP2995941B2 (ja) 不特定話者用音声認識装置
JPH0119596B2 (ja)
JPH10171488A (ja) 音声認識方法及び装置及び記憶媒体
JPH0449719B2 (ja)
JP3009962B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees