JPH02135499A - 音声認識リジェクト閾値設定方式 - Google Patents

音声認識リジェクト閾値設定方式

Info

Publication number
JPH02135499A
JPH02135499A JP63290814A JP29081488A JPH02135499A JP H02135499 A JPH02135499 A JP H02135499A JP 63290814 A JP63290814 A JP 63290814A JP 29081488 A JP29081488 A JP 29081488A JP H02135499 A JPH02135499 A JP H02135499A
Authority
JP
Japan
Prior art keywords
word
standard
pattern
voice
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63290814A
Other languages
English (en)
Other versions
JP2553173B2 (ja
Inventor
Hiroyuki Noto
広之 野戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP63290814A priority Critical patent/JP2553173B2/ja
Publication of JPH02135499A publication Critical patent/JPH02135499A/ja
Application granted granted Critical
Publication of JP2553173B2 publication Critical patent/JP2553173B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、音声認識装置においで発声され茫単語の入
力音声の音声パタンと標準パタン辞書メモリに予め登録
された音声標準パタンとの類似度、従って両パタン開の
距離に基づいて音声認識の判定の基準となるリジェクト
閾値を設定するための音声認識リジェクト閾値設定方式
に関するものである。
(従来の技術) 先ず、この発明の理解を容易にするために、音声認識装
置の概要につき説明する。
音声認識装置はコンピュータ、その他の種々の外部機器
の有力な入力装置として利用され始めでおり、そのため
、種々の開発が進められている。
第2図は従来の音声認識袋フの典型例を示すブロック図
である。この従来製画の認識処理及び音声標準パタン登
録処理につき簡単に説明する。
先ず、認識処理動作を説明する。使用する話者の発声し
た音声をマイクロホン等の外部音声入力装置10によっ
て取り込み、このアナログ入力音声VA/D変換部12
においてディジタル音声信号に変換し、特徴抽出部14
においでこの音声信号から音声の特徴パラメータを抽出
しこれを音声切り出し部16及び認識部18へそれぞれ
出力する。通常、特徴パラメータとして、フレームと称
される一定時間間隔て、スペクトル成分Sと対数パワー
P等を抽出する。そして、音声切り出し部16において
、この抽出した特徴パラメータの時間変化から音声区間
を判定して認識部18へ送る。
この認識部1日において音声区間の周波数成分S及び対
数パワーPの系列すなわち特徴パラメータ系列である音
声パタンを特徴パタンとして求め、この特徴パタンと予
め音声標準パタンメモリ20に登録されている標準パタ
ンを読み出しできで特徴パタンとこの標準パタンとの類
似度従って距離を求めて、この距離が一定のリジェクト
閾値より小さいとき、当該距離(類似度)を有する標準
パタンの屈するカテゴリを認識判定する。そして、認識
結果出力部22から認識結果としての当該標準パタンの
カテゴリの番号を外部機器24へ出力し、その後の所望
の処理に供せしめる構成となっている。
このような認識方法では、どのようなリジェクト閾値を
設定するかによって音声認識の良否が左右される。
次に、この従来のリジェクト閾値についで説明する。
第3図(A)及びCB)は音声認識時にある単語名の入
力があった場合(認識対象単語以外の音で、音声として
区間検出された音を含む。以下、これを入力音と称する
。)、標準パタンに対して計算される距離の度数分布を
示す図であり、横軸に距HD及び縦軸に度数をプロット
してそれぞれ示しである。第3図(A)は、ある単語名
Ccxの標準パタンに対する度数分布の例であり、分布
曲線Taは入力音が単語名Cαであった場合の単語度数
分布、分布曲線■αは単語名Cαの標準パタンに対しで
計算された他の単語名の標準パタンとの距離の度数分布
及び分布曲線■αは単語名Cα以外の入力音に対する距
離の度数分布の例である。第3図CB)はある単語名C
eの標準パタンに対する度数分布の例であり、分布曲線
Ia は入力音か単語名C[Iであった場合の単語度数
分布、分布曲線■βは単語名CBの標準パタンに対して
計算された他の単語の標準パタンとの距離の度数分布及
び単語名[[B は単語名C6以外の入力音に対する距
離の度数分布である。
既に説明したように、一般に音声認識時には、音声とし
て区間検出された入力音に対して、全ての単語の標準パ
タンとの距離を計算し、最小の距atもつ標準パタンの
単語名を出力する。しかし、たとえその単語名がcoで
あったとしてもその距離かリジェクト閾値Tよりも大き
な値である場合には、入力音は認識対象の単語以外の音
であると判定して誤入力に対する出力を抑制するのが一
般的な方法であった。
この従来の方法ではこの際に用いられるリジェクト閾値
Tは、単語名やその標準パタンの特徴によらず一定の値
を用い、しがもその値の設定は人手によって経験的に定
められたり、特定の単語セットに対する分析から求めら
れるのが普通であった。しかしこのような方法では、リ
ジェクト閾値Tかある単語名Ccxに対しては有効な値
であっても、他の単語名Caに対しでは最良の値ではな
い場合が多く見られた。その理由としでは、単語名C6
の標準パタンに対する距離の分布(第3図(A)9照)
と、単語名Cθの標準パタンに対する距離の分布(第3
図(B)参照)か各単語の標準パタンに対応しで異なっ
ていることによる。例えば、リジェクト閾値Tを第3図
(A)に示すような値に定めたとき、単語名Cαに対し
ては有効であっても、このリジェクト閾値Tが第3図(
B)の単語名Caに対しては高すぎる場合には、入力音
として単語名CG に類似した音で、なおかつ認識対象
語ではない音が入力された場合に、誤って認識結果Ca
が出力される可能性が高い。一方、逆にリジェクト閾値
T。を第3図(A)に示すような値としたとき、第3図
(8)の単語名CBに対しでは有効であっても、第3図
(A)の単語名C,xに対しでは低すぎる場合には、入
力として単語名Cαを正しく発声しても出力が抑制され
る可能性が高い。
(発明が解決しようとする課題) このように、上述した従来の音声認識リジェクト閾値設
定方法では、話者の発声のしかたや使用する単語セット
の変化にもかかわらず、リジェクト閾値が一定であるた
めに、認識対象単語を発声した(こもかかわらず認識対
象単語以外の音であると判定されたり、認識対象外の音
が入力されたにもかかわらず、認識結果が出力されると
いった問題点があった。
この発明の目的は以上のような話者の変化や使用単語セ
ットの変化によって認識対象単語がどうかの判定の性能
が変化するという問題点を解決し、話者や使用単語セッ
トの変化に対応して自動的にリジェクト閾値を設定する
音声認識リジェクト閾値設定方法を提供することにある
(課題を解決するための手段) この目的の達成を図るため、この発明によれば、 音声標準パタンを読み出し自在に登録しておくための標
準パクン辞書メモリと、 外部音声入力部からの入力音声の音声パタンと予め登録
された音声標準パタンとの類似度を算出する認識部とを
含み、 該類似度に基づいて音声認識の判定を行った認識結果を
外部処理装置へ出力するように構成した音声認識袋3の
当該音声認識の判定に用いるリジェクト閾値を設定する
方式においで、前記認識部に、 登録したい単語名を発声して得られた入力音声の1つの
リジェクト閾値股定対象標準パタンと他の単語名(こ屈
する標準パタンとの距Mを全て算出する標準パラメータ
算出手段と、 これら距離の分布状@壱表現するパラメータを求めるパ
ラメータ算出手段と、 これらパラメータに基づいて前記リジェクト閾値設定対
象標準パタンに対するリジェクト閾値を算出するリジェ
クト閾値算出手段と を設けたことを特徴とする。
(作用) この発明の音声認識リジェクト閾値設定方式によれば、
標準パタン間距離算出手段によって単語標準パタンの全
での組み合わせの間の距離を求めてこれを集計する。
続いてパラメータ算出手段によってこれら距離の分布状
態を表現するパラメータ、例えば、各単語標準パタンに
対する他の単語標準パタンの距離の平均値及び各単語標
準パタンに対する他の単語標準パタンの距離の平均偏差
を求め、これらパラメータによっである着目した単語標
準パタンと他の単語標準パタンとの間の距離の分布を表
現する。
次に、リジェクト閾値算出手段によってこのパラメータ
から着目した単語標準パタンに対するリジェクト閾値を
定める。この場合、各単語標準パタンに対する他の単語
標準パタンの距離の分布(全ての単語標準パタンに対す
る分布曲線IT。
(蔦3図(A))及び■[1(第3図(8)))を用い
て本来ならば推定が不可能な各単語標準パタンに対する
入力音の距離の分布(全ての単語標準パタンに対する分
布曲線■α (第3図(ハ))及びl1la  (第3
図(B)))u近似し、その分布から各単語標準パタン
に対するリジェクト閾値を設定する。これによって各単
語標準パタンに対しで最適なリジェクト閾値を設定し、
音声認識応答を抑制することができるようにしたもので
ある。
(実施例) 以下、図面を参照しで、この発明の音声認識リジェクト
閾値設定方式の実施例につき説明する。
第1図はこの発明の一実施例を説明するためのブロック
図であり、同図においで、第2図で説明した構成成分と
同一の構成成分については、特に言及する場合を除き、
同一の符号を付して示し、その詳細な説明を省略する。
この発明の音声認識リジェクト閾値設定方式によれば、
認識部に標準パタン門距離算出手段310、パラメータ
算出手段320及びリジェクト閾値算出手段330を、
従来の音声認識機能に追加しで設ける。従ってこのよう
な新たな機能をもったこの発明に係る認識部を30で示
す。
次に、これら各手段310.320及び330について
説明する。
〈標準パタン門距離算出手段〉 この標準パタン間距離の算出は従来周知の方法はもとよ
り、他の任意好適な手法を用いて算出してもよいが、こ
の実施例では、本出願人に係る他の出願に開示されてい
る手法を用いて標準パタン間距離の算出を行う例につき
説明する。
音声認識機能では標準パタンは標準パタン辞書メモリ2
0に登録されている。一般にこの標準パタンの登録に当
り、話者に指示を与えて同一カテゴリの音声を複数回発
声させ、これら発声音声から、音声標準パタン作成のた
めの特徴パタンセットを作成し、この特徴パタンセット
を構成する全ての特徴パタンを音声標準パタンとして登
録したつする技術、この特徴パタンセットの中から一つ
又はいくつかの特徴パタンを適当な規準を設けで取捨選
択し、選択されたパタンの音声長(音声区間)間の平均
化等を行い、平均音声長に該当する音声パタンを標準パ
タンとして登録する技術、或いは、マルチテンプレート
法、その他の技術等がある。いずれにしても、音声認識
においで標準パタンを作成する際には認識の規準となる
音声を発声し、その特徴を数値化して音声の特徴パタン
とし、これを標準パタンとして保存する必要がある。
このような特徴パタンを作成するには、認識部30にお
いて、たとえば、特開昭62−159195において提
案されている技術により音声の特徴パタンを作成する。
特徴パタンは音声認識の際に用いる特徴量であればどの
ようなものであってもよい。
これら特徴パタンに基づく、標準パタンの作成法として
、まず、1f!頚の単語当り複数回例えば3回の登録発
声を行い、複数個、この場合3つの特徴パタンを標準パ
タンとして得る。このような繰作を単語の全種類にわた
って行うことにより、単語の種類をNとすると3N個の
特徴パタンか初期標準パタンセットとして得られる。
しかし、このような従来の音声標準パタンの登録技術で
は、話者に対しで指示した単語が指示とあつに発声され
ていることを前提にしでおり、読みや発声の誤り、音声
以外の音が入力された場合でも指示した単語が発声され
たとして、音声の標準パタンの作成が行われでいた。例
えば発声者の登録発声の際に言い誤り、或いは雑音の混
入などによって、登録すべき音声以外の音の特徴パタン
(ここでは不良特徴パタンと称する)が生したとすると
、その場合の単語の特徴空間内での各特徴パタンの配百
は、例えば第4図のようになるにこで、n番目の単語の
1番目の登録発声の特徴パタン%P。1とする。また、
登録発声が正常に行われた場合には特徴パタンPnlは
それぞれ特徴空間内のC1の範囲内に納まるとする。例
えば、不良特徴パタンP32か生した場合には、従来技
術ではその音の特徴を用いて音声標準パタンか作成され
るために、音声標準パタンの質を悪くし、音声認識の際
に認識率を悪くする原因となる不良特徴パタンP3□か
音声標準パタンの決定に用いられでしまうという問題か
あった。
そこで、前述した本出願に係る先の特許出願において、
このような質の悪い音声標準パタンの登録を回避し、音
声認識の際の認識率の低下を図るためには、前述したよ
うな不良特徴パタンを用いず、新たに単語名C3の登録
発声を要求し、正常な特徴パタンP’32!得ることに
よって良好な標準パタンセットを作成すればよいという
根拠に基づき、初期標準パタンセットを作成し、不良特
徴パタンを検出し、再登録操作によって最終的に良好な
標準パタンセットを得る処理手順を採用した音声標準パ
タン登録方式を提案している。
この発明の実施例では、この提案された音声標準パタン
登録方式に従って標準パタン辞書メモリ20に標準パタ
ンの登録を行う場合に、その手順の途中で導出される標
準パタン開路Mを利用する。
以下、第1図及び第4図(A)〜(C)を参照しで、前
述の先の出願の音声標準パタン登録方式に従って、認識
部30において、初期標準パタンセットを作成し、不良
特徴パタンを検出し、再登録操作によって最終的に良好
な標準パタンセットを得るまでの処理手順の一実施例に
つき説明する。
第5図はこの発明における標準パタン作成のための動作
の流れ図を示す。ここでSは処理ステップを表わす。第
5図(A)は初期標準パタンセットの作成の動作の流れ
図であり、第5図(8)及び(C)は不良特徴パタンの
判定と再登録の動作の流れ図をそれぞれ示す。尚、図中
、■、■及び■は動作の続き間係をそれぞれ示す。
7準パタンセ・・ト 処理はます、初期標準パタンセットのなかのどの特徴パ
タンを作成するかを定めるn及びi%1に初期化するこ
とがら始める(sl)。次に、n番目の単語名C,,の
登録発声を登録話者に対しで要求し、発声を促す(S2
)。尚、この実施例では単語の種類をNとし、1単語当
りの発声回数を3回とする。この発声により外部音声入
力製画10、A/D変換部12を経て特徴抽出部14及
び音声切り出し部16のそれぞれからの単語音声の入力
を受ける(S3)。これらの入力を受けて、例えば本出
願人による先の出願(特開昭62−211698)にお
いて提案されでいる方法により、単語音声区間の検出を
開始する。この単語音声区間内の入力フレームデータに
対し、例えば(特開昭62−159195)においで提
案されている方法によって特徴パタン壱作成し、Pni
として記憶する(S4)。そして、同一単語での発声回
数をカウントするiに対して1を加え(S5)、発声回
数である3と比較しくS6)、3以下であれば同一の単
語名に対する登録発声の要求(S2)に戻る。もしも3
よつ大き1すれば、n番目の単語名coに対する登録発
声は終了したので、iを1に戻し、nに1を加える(S
7)。最後にnと単語数Nとを比較し、n≦Nならば登
録発声の要求(S2)に戻る(S8)。逆にn>Nなら
ば初期標準パタンセットの作成が終了したので、次の不
良特徴パタン判定処理へ移る。
不 、 パタン1 不良特徴パタンの判定処理に入ると、まず、判定を行う
べき単語名の番号nを1とし、総不良特徴パタンの数B
を○とする(S9)。次に、いま着目しているn番目の
単語に対する不良特徴パタンの数AVOとする(S 1
0)。ざらに、この単語内で着目すべき発声回数の番号
iを1とする。
ここで、判定の対象となる特徴パタンの単語番号nと発
声回数iが定まったので、特徴パタンPIT1が不良特
徴パタンであるがどろかの判定を行う。特徴パタンP。
、ともう1つの特徴パタンP、、(たたし、x=1.2
、・・・、N:yl、2.3:n≠Xまたはi≠y)と
の間の距M、LD、、I全でのx、yの組合せに対しで
求める。特徴パタン間の距離は線形伸縮によるパタンマ
ツチング(特開昭62−73299)や、動的計画法に
よるパタンマ・ンチング(特開昭6273298)によ
り計算する(S11)。次に、処理ステップS11で求
めた距離、、l D X Vのうち、最小のもののx、
ytそれぞれX、Yとする(S 12)。そして、Xと
nとを比較しく513)、もしも−敗していなければ、
pHlは単語名C1以外の単語名の特徴パタンと最も距
離が近いので、不良特徴パタンと判定し、不良特徴パタ
ン数Aに1を加える(S14)。もしもこの処理ステッ
プ314でXとnが−敗しでいれば、P、、1は不良特
徴パタンではないので、次の処理ステップへ実行を移す
。ここではパタンを判定の対象とするため、1に1を加
える(S15)。もしもiが3以下ならば同じ単語名C
7の次の発声の特徴パタンに対する判定(S11)〜(
S 14)に戻り、1が3よりも大きければ、処理ステ
ップS17に移る(S 16)。処理ステップS17で
はn番目の単語に対する不良特徴パタン数へと1単語当
りの特徴パタン数(実施例では3)に対する過半数の2
とを比較し、Aが2以上であれば、次の処理ステップS
18に移り、このn番目の単語の特徴パタンは全て不良
特徴パタンであるとしで、全てのiに対するP、、7i
不良特徴パタンと判定し、不良特徴パタン数Aを3とす
る。
ここで、n番目の単語に対する不良特徴パタンの判定か
おわったので、総不良特徴パタン数日にn番目の単語の
不良特徴パタン数Au加え(S19)、ざらに次の単語
名の特徴パタンを判定の対象とするためにnに1を加え
(S 19) 、次の処理ステップへ移る(S20)。
nが単語数N以下ならば、処理ステップ(S 10)へ
戻り、単語名C1の3つの特徴パタンについての判定に
戻る。もしもnか単語数Nよりも大きければ処理ステッ
プ(S21)に移る。ここでBが0ならば(S21)、
全ての特徴パタンは不良特徴パタンではないので一連の
処理の終了となる。もしもBか0でなければ(S21)
 、処理ステップS14で不良と判定された全ての特徴
パタンpl、、に対して代わりの特徴パタンを登録する
(以降これを再登録と称する)処理を行うために第5図
(C)に示す再登録操作の処理に移る。
再」jL操(支)ヨL段 ます、再登録のパタン数をカウントするkを1とする(
S23)。次にに番目の不良特徴パタンの単語名の再登
録発声を登録話者に対して要求する(S24)。そして
、単語音声の入力を受ける(S25)。ここでは、第5
図(A)で示した処理ステップS3と同様の単語音声区
間を検出する。この単語音声区間内の入力フレームデー
タに対し、第5図(A)で示した処理ステップS4と同
様の方法により特徴パタンを作成し、k番目の不良特徴
パタンを消去すると同時にこの消去した特徴パタンと同
しn、1を持つ特徴パタンPnlとして格納する(S2
6)。
次にkに1を加え(S27)、不良特徴パタン数Bと比
較しく528)、k>Bでなければ次の不良特徴パタン
の再登録のために処理ステップS24に戻る。k>8な
らば、全ての不良特徴パタンか消去され、再登録によっ
て新しい特徴パタンか格納されているので不良特徴パタ
ン判定手段320での、第5図(B)で示した処理ステ
ップS9に戻り、標準パタンセットの中の不良特徴パタ
ンを判定する処理に戻る。
以上の処理を不良特徴パタン数BがOになるまで繰り返
す(39〜528)。
この発明の実施例では、標準パタン間距離算出手段31
0は上述したこのような一連の処理手順のうち、処理ス
テップSl(第5図(A))から第5図(B)の処理ス
テップS11までの処理を行う。又、処理ステップ51
2(第5図(B))から処理ステップ528(第5図(
C))までの処理をこの手段310において実行出来る
ように構成しでもよいし、又、別の機能手段としで設け
でもよい。
以上の標準パタン間距M算比の処理は特定話者に対する
認識方式の場合のリジェクト閾値の設定に必要な処理で
あるか、不特定話者に対する認識方式であっても、特徴
パタンP6ともう1つの特徴パタンPw、(但し、x=
1.2、・・・、N:y=1.2.3;n#xまたは1
≠y)との間の距離n+Dxyu全てのx、yの組み合
わせに対して求めることによって同様にリジェクト閾値
の設定か行える。
〈パラメータ算出手段〉 次に、上述した処理ステップS11で得られた距離を用
いて、各単語の標準パタンに対する、他の単語の標準パ
タンの距離の分布をパラメータによって表現する。
この実施例では、パラメータとして各単語nの標準パタ
ンに対する他の単語標準パタンの距離の平均値へ。及び
その平均偏差M/にとする例につき説明する。尚、ここ
でMは偏差(=ΔM=、、、D、、−A、、)の総和で
あり、Kは分布測定の対象となった他単語の標準パタン
数の計数である。
第6図にこの実施例におけるリジェクト閾値設定のため
の動作の流れ図を示す、第6図(A)は各単語標準パタ
ンに対する他の単語標準パタンの距離の平均値を求める
動作の流れ図であり、第6図(B)は主として各単語標
準パタンに対する他の単語標準パタンの距離の平均偏差
を求めるための動作の流れ図である。
江  パタン 距 この平均値はパラメーク算出手段320で算出して求め
る。
この処理を開始すると、まず最初に他の単語標準パタン
に対する距離の平均値を求める対象となる単語名の番号
nを1と初期設定する(S30)。次に、距離の総和S
をo、分布測定の対象となった他単語の標準パタン数の
計数Kを○とし、現在着目している単語の中のテンプレ
ートの計数17alとする(531)。次に、分布測定
の対象となる単語の単語番号Xを1とする(S32)0
次に、現在着目している単語口と分布測定の対象となる
単語が同一の単語がどうかを判定しく533)、もし、
同一の単語であれば処理ステップ(338)に処理を移
す。もし、同一の単語ではない場合には分布測定の対象
となる単語の中のテンプレートの計数ytlとする(S
34)、そして、距離の総和Sと距離□D XVとを加
え、計数Kに1を加える(S35)。次にテンプレート
の計数yに1を加え(S36)、テンプレート計数yと
1単語あたりのテンプレート数3とを比較しく537)
、3以下であれば(S35)に戻り、次のテンプレート
に対する処理に戻る0判定処理(S37)による判定で
yが3よりも大きければ、分布測定の対象となる単語名
の単語番号Xに1を加える(S38)。次に、Xと単語
数Nとを比較判定しく539)、xfJ<N以下であれ
ば処理ステップ(S33)に戻る0判定処理(539)
においでx>Nであると判定されると、リジェクト閾値
設定の対象となるテンプレートの番号iに1を加え(S
40)、今度はiと1単語あたりのテンプレート数3と
を比較しく541)、3以下であれば処理ステップ(S
32)に戻り、同一の単語の他のテンプレートに対する
距離の分布の測定に移る。処理ステップ841において
、iか3よりも大きければ、n番目の単語に対する距離
の平均値An!S/Kにより計算しかつ単語番号nに1
を加える(S42)、続いて、分布測定の対象となる単
語名の単語番号Xに1を加える(S43)、次に、単語
番号nと単語数Nとを比較判定しく544)、nが単語
数以下の場合には(331)に戻り、次の単語に対する
距離の平均値を求める上述した一連の処理を行う(33
1〜542)、nが単語数Nよりも大きければ第6図C
B)の最初の処理ステップ(S45)に移り、各単語標
準パタンに対する他の単語標準パタンの距離の平均偏差
を求める処理を実行する。
このように、この実施例では、上述した処理ステップ8
30〜S44を経る処理手順によってパラメータとして
の単語標準パタン間距離の平均値A、の算出を実行でき
る。
江  パタン 距 の   差 これら平均偏差M/には単語名Cαの分布曲線IIa(
第3図(A))及び単語名C,+1の分布曲線■Ωのそ
れぞれの広がりの度合を表わすパラメータである。これ
らパラメータをパラメータ算出手段320で算出する。
この算出処理を開始すると、先ず、他の単語標準パタン
に対する距離の平均偏差を求める対象となる単語名の番
号nを1とする(S45)。次に、偏差の総和IVIO
1分布測定の対象となった他単語の標準パタン数の計数
Kを○とし、現在着目している単語の中のテンプレート
の計数iを1とする(S46)。続いて、分布測定の対
象となる単語の単語番号xulとしくS47)、現在着
目している単語Xと分布測定の対象となる単語nが同一
の単語かどうかを判定しく548) 、もし、同一の単
語であれば処理ステップ(S54)に処理を移す。この
判定処理(S 48)で同一単語でないと判定されたと
きには、分布測定の対象となる単語の中のテンプレート
の計数yを1とする(S49)。
然る後、距離。1DXyと単語nにおける他単語の距離
の平均値へ、、との差の絶対値である偏差ΔM (= 
1 、、lD、、−A、  l ) %求める(S50
)。次に、偏差の総和Mに、上述した偏差ΔMを加えた
新たな偏差の総和Mとし、しかも、計数Kに1を加える
(S51)。次に、テンプレートの計数yに1を加え(
S52)、計数yと1単語あたりのテンプレート数3と
を比較し、3以下であれば(S50)に戻り、次のテン
プレートに対する処理に戻る。この判定処理(S53)
でyが3よりも大きければ、処理ステップ(S54)に
処理を移し、分布測定の対象となる単語名の単語番号X
に1を加える0次に、この単語番号Xと単語数Nとを比
較しく555)、xがN以下であれば処理(S48)に
戻る。この判定処理(S55)での判定がx>Nである
と、リジェクト閾値設定の対象となるテンプレートの番
号iに1を加え(S56)、続いて、テンプレート番号
iと1単語あたりのテンプレート数3とを比較しく55
7)、3以下であれば処理ステップ(S47)に戻り、
同一の単語の他のテンプレートに対する距離の分布の測
定に移る(847〜557)。この判定処理(S57)
での判定結果でテンプレート番号iが3よりも大きけれ
ば、次の処理ステップ(S 58)に処理を移し、処理
ステップS51で得た偏差の総和Mt、分布測定の対象
となった他単語の標準パタン数の計数にで除算した値M
/に%平均偏差として算出する(858)。
このように、上述した処理ステップ545〜858を経
る処理手順によってパラメータとしての単語標準パタン
間距離の平均偏差M/にの算出を実行できる。
〈リジェクト閾値算出手段〉 この実施例では、リジェクト閾@算出手段330におい
て、上述した処理手順中の処理ステップS42で得られ
た平均値A、(=S/K)と処理ステップS58で得ら
れた平均偏差M/にとからn番目の単語に対するリジェ
クト閾値T、lを計算する。ここでαはリジェクトの強
度を決定する定数であり、この値が小さければリジェク
トの傾向が強くなり、認識対象単語以外の音声を全く受
けつけなくなる。αが大きければリジェクトの傾向は弱
くなるが認識対象単語以外の音を受けつける可能性が大
きくなる。n番目の単語に対するリジェクト閾値T。は
、この定数αと平均偏差M/Kを乗じて距離の平均値A
、、を加えることにより計算する(S59)、尚、この
αは例えば認識部30に設けた定数テーブルメモリ或い
は他の任意のメモリ(図示せず)に読み出し自在に格納
しておけばよい、ざらに、この実施例では、この処理ス
テップS59で、単語番号nに1を加え、分布測定の対
象となる単語名の単語番号Xに1を加える。
次に、単語番号nと単語数Nとを比較しく560)、n
が単語数以下の場合には処理ステ・ンブ(S46)に戻
り、次の単語に対するリジェクト閾値を求める。この判
定処理(S60)によって単語番号nが単語数Nよりも
大きければ、全ての単語標準パタンのリジェクト閾値の
設定が終了したので全処理を終了する。
上述した実施例ではリジェクト閾値設定のためのパラメ
ータとして平均mA、及び平均偏差M/KM用いたが、
これらの代わりに分布の形状を表わす数値であればどの
ようなパラメータを使ってもよい。例えば、平均偏差の
代わりに標準偏差を使う、分布形状を2項分布や正規分
布を仮定して最小2剰近似したうえて、その標準偏差を
用いるなどの方法を用いてもよい。
このようにして得られたリジェクト閾値は認識部30又
は任意所望の箇所に設けたメモリに読み出し自在に格納
しておき、特定又は不特定話者の音声認識の際に、発声
して得られた入力単語音声の認識判定のための閾値とし
て利用できる。
この発明は上述した実施例にのみ限定されるものではな
く、種々の変形又は変更を行い得ること明らかである。
例えば、上述したリジェクト閾値を決定するための処理
手順は設計に応じて任意に変えることができる。
又、上述した実施例では、この種の音声認識装=には常
套手段であるメモリ、制御部、その他の処理回路等の図
示及び説明を省略したが、これらは所要に応じ設けるこ
とが出来る。
(発明の効果) 上述した説明からも明らかなように、この発明の音声認
識リジェクト閾値の設定方式によれば、ある着目した標
準パタンに対するリジェクト閾値か他の標準パタンとの
距離の分布から自動的に求められ、認識時の距離が大き
くなる傾向のある標準パタンに対してはリジェクト閾値
が大きく設定され、逆に認識時の距離が小さくなる傾向
のある標準パタンに対してはリジェクト閾値が小ざ〈設
定されるので、認識単語による応答率の変化が少なく安
定した性能の音声認識を実現出来る。
【図面の簡単な説明】
第1図はこの発明の音声認識リジェクト閾値設定方式の
説明に供するブロック図、 第2図は従来方式の説明に供するブロック図、第3図(
A)及び(B)はこの発明及び従来のリジェクト閾値の
説明に供する、標準パタンに対する入力音の距離の度数
分布を示す図、第4図はこの発明の詳細な説明に供する
、不良特徴バタシを含む標準パタンセットの説明図、菓
5図(A)〜(C)はこの発明の方式の実施例を実行す
る処理手順における音声標準パタンの登録処理及び標準
パタン間距離の算出の説明に供する動作の流れ図、 第6図(A)及び(B)はこの発明の方式の実施例を実
行する処理手順におりるリジェクト閾値設定の動作の流
れ図である。 10・・・外部音声入力装置、12・・・A/D変換部
14・・・特徴抽出部、   16・・・音声切り出し
部20・・・標準パタン辞書メモリ 22・・・認識結果出力部、 24・・・外部機器30
・・・認識部 310・・・標準パタン間距離算出手段320・・・パ
ラメータ算出手段 330・・・リジェクト閾値算出手段。

Claims (1)

    【特許請求の範囲】
  1. (1)音声標準パタンを読み出し自在に登録しておくた
    めの標準パタン辞書メモリと、 外部音声入力部からの入力音声の音声パタンと予め登録
    された音声標準パタンとの類似度を算出する認識部とを
    含み、 該類似度に基づいて音声認識の判定を行った認識結果を
    外部処理装置へ出力するように構成した音声認識装置の
    当該音声認識の判定に用いるリジェクト閾値を設定する
    方式において、 前記認識部に、 登録したい単語名を発声して得られた入力音声の1つの
    リジェクト閾値設定対象標準パタンと他の単語名に属す
    る標準パタンとの距離を全て算出する標準パタン間距離
    算出手段と、 これら距離の分布状態を表現するパラメータを求めるパ
    ラメータ算出手段と、 これらパラメータに基づいて前記リジェクト閾値設定対
    象標準パタンに対するリジェクト閾値を算出するリジェ
    クト閾値算出手段と を設けたことを特徴とする音声認識リジェクト閾値設定
    方式。
JP63290814A 1988-11-17 1988-11-17 音声認識リジェクト閾値設定方式 Expired - Lifetime JP2553173B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63290814A JP2553173B2 (ja) 1988-11-17 1988-11-17 音声認識リジェクト閾値設定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63290814A JP2553173B2 (ja) 1988-11-17 1988-11-17 音声認識リジェクト閾値設定方式

Publications (2)

Publication Number Publication Date
JPH02135499A true JPH02135499A (ja) 1990-05-24
JP2553173B2 JP2553173B2 (ja) 1996-11-13

Family

ID=17760830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63290814A Expired - Lifetime JP2553173B2 (ja) 1988-11-17 1988-11-17 音声認識リジェクト閾値設定方式

Country Status (1)

Country Link
JP (1) JP2553173B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09106296A (ja) * 1995-07-31 1997-04-22 At & T Corp 音声認識装置及び方法
JP2011022476A (ja) * 2009-07-17 2011-02-03 Fujitsu Ltd 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置
JP2018063328A (ja) * 2016-10-12 2018-04-19 株式会社東芝 電子機器及びその制御方法
JP2020074043A (ja) * 2020-02-06 2020-05-14 東芝映像ソリューション株式会社 電子機器及びその制御方法
JP2020074044A (ja) * 2020-02-06 2020-05-14 東芝映像ソリューション株式会社 電子機器及びその制御方法
JP2020091492A (ja) * 2020-02-06 2020-06-11 東芝映像ソリューション株式会社 電子機器及びその制御方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58189696A (ja) * 1982-04-30 1983-11-05 日産自動車株式会社 車両用音声認識装置
JPS63163399A (ja) * 1986-12-25 1988-07-06 日本電気株式会社 パタ−ン認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58189696A (ja) * 1982-04-30 1983-11-05 日産自動車株式会社 車両用音声認識装置
JPS63163399A (ja) * 1986-12-25 1988-07-06 日本電気株式会社 パタ−ン認識装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09106296A (ja) * 1995-07-31 1997-04-22 At & T Corp 音声認識装置及び方法
JP2011022476A (ja) * 2009-07-17 2011-02-03 Fujitsu Ltd 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置
JP2018063328A (ja) * 2016-10-12 2018-04-19 株式会社東芝 電子機器及びその制御方法
US10522139B2 (en) 2016-10-12 2019-12-31 Qingdao Hisense Electronics Co., Ltd. Electronic device and control method thereof
US11404060B2 (en) 2016-10-12 2022-08-02 Hisense Visual Technology Co., Ltd. Electronic device and control method thereof
JP2020074043A (ja) * 2020-02-06 2020-05-14 東芝映像ソリューション株式会社 電子機器及びその制御方法
JP2020074044A (ja) * 2020-02-06 2020-05-14 東芝映像ソリューション株式会社 電子機器及びその制御方法
JP2020091492A (ja) * 2020-02-06 2020-06-11 東芝映像ソリューション株式会社 電子機器及びその制御方法

Also Published As

Publication number Publication date
JP2553173B2 (ja) 1996-11-13

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
JPH0554959B2 (ja)
JPH05181494A (ja) 音声パターンの識別装置と方法
JPH09325790A (ja) 音声処理方法および装置
US5621849A (en) Voice recognizing method and apparatus
US5040213A (en) Method of renewing reference pattern stored in dictionary
JPH08185196A (ja) 音声区間検出装置
JPH02135499A (ja) 音声認識リジェクト閾値設定方式
US5751898A (en) Speech recognition method and apparatus for use therein
JP2008275987A (ja) 音声認識装置および会議システム
JP3403838B2 (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JP2002287785A (ja) 音声セグメンテーション装置及びその方法並びにその制御プログラム
JP3437492B2 (ja) 音声認識方法及び装置
JPH11202895A (ja) 音声認識システムと方法およびそのプログラムを記録した記録媒体
JP2010044239A (ja) 音声認識装置およびプログラム
JPS645320B2 (ja)
JP2975772B2 (ja) 音声認識装置
JP3360978B2 (ja) 音声認識装置
JPH02127697A (ja) 音声標準パタン登録方式
JP2543584B2 (ja) 音声標準パタン登録方式
US11527244B2 (en) Dialogue processing apparatus, a vehicle including the same, and a dialogue processing method
JPH0566788A (ja) 不特定話者用音声認識装置
JP2574242B2 (ja) 音声入力装置
JP2000099099A (ja) データ再生装置
JP2001034291A (ja) 音声認識装置