JPH03174599A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH03174599A
JPH03174599A JP1312271A JP31227189A JPH03174599A JP H03174599 A JPH03174599 A JP H03174599A JP 1312271 A JP1312271 A JP 1312271A JP 31227189 A JP31227189 A JP 31227189A JP H03174599 A JPH03174599 A JP H03174599A
Authority
JP
Japan
Prior art keywords
speech
word
feature
pattern
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1312271A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1312271A priority Critical patent/JPH03174599A/ja
Publication of JPH03174599A publication Critical patent/JPH03174599A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は入力音声単語を効率良く、しかも高精度に認識
することのできる単語音声認識方式に関する。
(従来の技術) 音声認識の技術は、優れたマンマシン・インターフェー
スを実現する上での重要な役割を担っている。この音声
認識において、その認識精度を高める上での重要な前処
理として音声区間検出があり、従来より種々研究・開発
されている。
この音声区間検出は、従来−膜内には入力単語音声のパ
ワー時系列を求め、その音声パワーPが所定の閾値Tl
より大きくなった時点を入力音声単語の始端Sとして検
出し、またこの音声始端検出後に上記音声パワーPが所
定の閾値T2より小さくなった時点をその入力音声単語
の終端Eとして検出することにより行われる。
ところがこのような音声区間検出では、その音声区間が
一意に決定されるので、例えば実際の音声区間の前後に
息洩れや舌打ちノイズ等が存在すると、これをも音声区
間の一部として検出してしまうと云う不具合がある。ま
た逆に音節の先頭や最終音節が無声化し易い単語音声の
場合には、その無声化音節部分のパワーPが極端に小さ
くなるので、この部分が検出音節区間から脱落し易いと
云う欠点がある。
このような音声区間の検出誤りは、その音声認識におい
て致命的な誤認識や認識リジェクトの原因となる。特に
装置利用者が発声した単語音声の特徴パターンを標準パ
ターンとして登録しておき、音声認識時に入力された単
語音声の特徴パターンと先に登録されている標準パター
ンとの類似度を求めてその認識結果を得る特定話者単語
音声認識方式にあっては、標準パターン作成時に音声区
間検出誤りが生じると、登録しようとしている単語の音
声区間とは違う音声区間の特徴パターンを標準パターン
として登録してしまうことになる。このようにして誤っ
た標準パターンを登録してしまうと、仮に音声認識時に
正しく音声区間が検出されたとしても、誤った認識結果
を出力してしまう原因となる。
このような標準パターン作成時での音声区間検出誤りが
原因となる誤認識を少なくする技術として、標準パター
ン作成時に認識対象単語を複数回発声入力し、それらの
発声時間がほぼ等しいときにのみ標準パターンを作成し
て登録し、発声時間にばらつきがある場合には再発声を
要求する手法がある。しかし複数回の発声の全てに同じ
ようなノイズの付加や音声区間の脱落が生じると、上述
した発声区間の比較だけでは音声区間の検出誤りを防ぐ
ことができないと云う問題がある。
またノイズの付加や音声区間の脱落を少なくする手法と
して、入力単語音声に対して複数の始端候補(Sl、S
2.〜SM)と終端候補(E 1.E 2.〜EN)と
をそれぞれ求め、これらの候補に対して所定の規則に従
って確率(fsl、  fs2.〜fsM) 。
(f el、  f e2.〜f eN)をそれぞれ与
える。そして上記始端候補(Sl、S2.〜SM)と終
端候補(El、E2.〜EN)の組み合わせとして求め
られる複数の音声区間候補[Ss、Enコ (但し、 
11−1゜2、〜M、rr1.2.〜N )についての
尤度LmnをLmn  −fsm  X  fen として計算し、尤度L+gnの高い上位の複数の音声区
間候補についての標準パターンとのマツチングをとるこ
とで、入力単語音声に対する認識結果を求める手法が単
語境界仮説法として提唱されている。
しかしこのような手法を採用しても、標準パターンとし
て求めた単語音声の音声区間自体が誤って検出されてい
ると、結局、入力単語音声を正しく認識することができ
ないと云う問題があった。
(発明が解決しようとする課題) このように従来にあっては、複数回に亘って発声入力さ
れた単語音声からその標準パターンを作成する際に、そ
の音声区間の検出誤りを防いで信頼性の高い、高精度な
標準パターンをどのようにして得るかと云う点で幾つか
の問題が残されている。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、標準パターン作成時における音
声区間の検出誤りを効果的に防いでその標準パターンを
求め、音声区間検出誤りが生じ易い入力音声単語につい
ても確実に、信頼性良く認識することのできる単語音声
認識方式を提供することにある。
[発明の構成コ (課題を解決するための手段) 本発明は、入力単語音声を音響分析してその特徴パラメ
ータを求め、この音響分析された特徴パラメータから単
語境界仮説生成部にて求められる上記入力単語音声の音
声区間候補毎に前記特徴パラメータを正規化して前記入
力音声の特徴パターンを生威し、この特徴パターンと標
準パターン作成部で作成された認識対象・単語音声の標
準パターンと類似度を計算して前記入力単語音声に対す
る単語音声認識結果を求める単語音声認識方式に係り、 前記標準パターン作成部では、認識対象単語について複
数回に亘って発声入力される単語音声についてそれぞれ
求められる複数の特徴パターンの間で相互にその尤度を
計算し、その尤度が所定の閾値以上となる特徴パターン
の組み合わせを求め、これらの複数回の発声における特
徴パターンの組み合わせに従って、例えば尤度の最も高
い特徴パターンの組み合わせや音声区間が最も長い特徴
パターンの組み合わせ等を手掛かりとして当該認識対象
単語音声の標準パターンとして求めるようにしたことを
特徴とするものである。
(作 用) このような機能を備えた本発明によれば、単語境界仮説
生成部で求められる複数の音声区間候補の中から正しい
音声区間を決定するに際し、同一単語について複数回発
声された各入力音声についてそれぞれ求められる複数の
特徴パターン間で相互にその尤度を計算し、その尤度が
所定の閾値以上となる特徴パターンの組み合わせを得た
ときにそれらの音声区間候補を正しい音声区間であると
決定するので、その音声区間を高い精度で信頼性良く決
定することができる。この結果、信頼性の高い音声区間
の特徴パターンから信頼性の高い標準パターンを得、そ
の認識性能を向上させることが可能となる。
(実施N) 以下、図面を参照して本発明に係る単語音声認識方式の
一実施例について説明する。
第1図は実施例方式が適用される音声認識装置の要部概
略構成図であり、1は入力音声を音響分析してその特徴
パラメータを求める音響分析部である。この音響分析部
1は音声区間検出に用いる為の特徴量としてその音声パ
ワー時系列を求めると共に、認識辞書との照合に用いる
為の特徴量として、例えば周波数分析したバンドパスフ
ィルタ群出力を求める。
単語境界仮説生成部2は上記音響分析部1で求められた
入力音声の特徴パラメータに対して種々の音声区間検出
パラメータを適応的に設定して複数の音声区間候補を設
定する。具体的には、単語境界仮説生成部2は入力単語
音声に対して複数の始端候補(Sl、S2.〜SM)と
複数の終端候補(El、E2.〜EN)とをそれぞれ求
め、これらの各候補に対して所定の規則に従って確率(
f sl。
f、s2.〜fsM) 、  (fel、  fe2.
〜fen)をそれぞれ与える。
そして上記始端候補(SL、S2.〜.SN)と終端候
補(E 1.E 2.〜EN)の組み合わせとして求め
られる複数の音声区間候補[Sm、Enl  (但し。
m”1,2.〜M、n−1.2.〜N )についての尤
度LsnをLmn  −fsm  X  fen として計算し、これらの音声区間候補[Si、Enlに
ついての尤度Lmnをその値の高いものから順に、上位
の複数の音声区間候補を検出する。
しかしてリサンプル部3は上述した如く求められる複数
の音声区間候補[Si、Enlについて、前記音響分析
部1にて周波数分析して求められたバンドパスフィルタ
群出力からなる特徴パラメータをリサンプルし、各音声
区間候補における入力単語音声の正規化された特徴パタ
ーンをそれぞれ求める。尚、尤度の高い音声区間候補が
1つしか求められない場合には、その音声区間候補につ
いてのみリサンプル処理が行われ、1つの特徴パターン
だけが求められる。
類似度計算部4はこのようにして求められる入力単語音
声についての特徴パターンと、標準パターン辞書5に登
録されている認識対象単語についての後述する標準パタ
ーンとの間での類似度をそれぞれ計算する。認識結果出
力部6は、類似度計算部4にて求められる入力単語音声
の特徴パターンと認識対象単語についての標準パターン
との類似度を相互に比較し、高い類似度結果を得た所定
数の認識対象単語のカテゴリ名とその類似度値をそれぞ
れ求める。そしてこれらの上位複数個のカテゴリ名を前
記入力単語音声に対する認識候補として出力したり、或
いはその類似度値が再上位の認識対象単語のカテゴリ名
を前記入力単語音声に対する認識結果として出力する。
ところで標準パターン辞書5に登録される認識対象単語
についての標準パターンは、いま1つ設けられた類似度
演算部7と標準パターン作成部8とにより生成される。
類似度演算部7は、標準パターン作成時にカテゴリ名の
既知なる認識対象単語音声を複数回に亘って発声入力し
たとき、前述したリサンプル部3にてそれぞれ求められ
る複数の特徴パターンを用いて、複数の発声入力単語音
声間での類似度を計算する。この類似度計算は、従来よ
り種々提唱されている部分空間法やDPマツチング法等
の手法を用いて行われる。
しかして類似度演算部7は組み合わせ決定部7aを備え
、複数の発声入力音声からそれぞれ求められた特徴パタ
ーン間の類似度から、その類似度が所定の閾値を越える
複数の発声に亘る特徴パターンの組み合わせが存在する
か否かを判定している。
そしてこの組み合わせ決定部7aにて、その類似度が成
る閾値を越える特徴パターンの組み合わせが上記複数の
発声入力単語音声中で存在することが検出されたとき、
その特徴パターンを抽出して標準パターン作成部8に与
えている。尚、上記類似度が成る閾値を越える特徴パタ
ーンの組み合わせが上記複数の発声入力単語音声中で存
在しない場合には、当該単語音声の再発声入力が促され
る。
標準パターン作成部8はこのようにして尤度が所定の閾
値を越える標準パターンの組み合わせをなしている前記
各入力単語音声の特徴パターンをその認識対象単語につ
いての標準パターンとして求め、その標準パターンに入
力音声のカテゴリ名を付して前記標準パターン辞書5に
登録する。
この標準パターンの作成について更に詳しく説明すると
、標準パターン作成時にはカテゴリ名の既知なる単語音
声を複数回に亘って発声入力する。
そしてこれらの入力単語音声について前述した音響分析
Mlにて音響分析してその特徴パラメータを求め、前記
単語境界仮説生成部2にて確からしい音声区間候補をそ
れぞれ求める。そしてこれらの各音声区間候補について
前記リサンプル部3にてその特徴パターンをそれぞれ求
める。
具体的には第2図に示すように、1回目の発声時にその
音声区間候補Lll、  L12を求め、これらの音声
区間候補Lll、  L12での特徴パターンP 11
゜PI3をそれぞれ求める。同様にして2回目の発声時
にはその音声区間候補L 21.  L 22について
その特徴パターンP 21.  P 22をそれぞれ求
め、更に3回目の発声時にもその音声区間候補L31.
  L32についてその特徴パターンP 31.  P
 32をそれぞれ求める。
尚、ここでは各入力単語音声について2つの音声区間候
補を求め、それらの特徴パターンを求めているが、3個
以上の音声区間候補についての特徴パターンをそれぞれ
求める場合もある。また3回の発声で十分なる結果が得
られない場合には、4回以上の発声が促される場合も勿
論ある。
類似度演算部7はこのようにして求められる各発声入力
音声の複数の特徴パターン間で、相互にその類似度(尤
度)を計算し、その類似度が所定の閾値を越える特徴パ
ターンの組み合わせが上記複数の発声入力単語音声中に
存在するか否かを調べる。
例えば′上述した1回目の発声入力音声から求められた
特徴パターンpHに対応する2回目の発声入力音声から
得た特徴パターンを求めるべく、この2回目の発声入力
音声から求められる特徴パターンP21.  P22と
の間で、その間の類似度Qを次のようにそれぞれ計算す
る。
Q21−   [pH−P21]  、   Q2’2
−   [pH−P22コそしてこれらの類似度の中で
最大値に対して、成る閾値Tを越えているか否かの判定
を行い、類似度が閾値T以上である場合には、その特徴
パターンを前記特徴パターンP11に対応する特徴パタ
ーンとして求める。
例えばQ 21a Q 22であって、Q21kTであ
る場合、2回目の発声入力音声から求められた特徴バタ
ーンP21を1回目の発声入力音声から求められた特徴
パターンpHに対応する特徴パターンであるとして求め
る。
しかる後、前記特徴パターンPLIに対応する3回目の
発声入力音声から得た特徴パターンを求めるべく、この
3回目の発声入力音声から求められる特徴パターンP3
1.  Pa2との間で、その間の類似度Qを次のよう
にそれぞれ計算する。
Q31−   [pH・ Pa1l  、   Q32
−   [Pll  ・ Pa2コそして同様にしてこ
れらの類似度の中で最大値に対して、成る閾値Tを越え
ているか否かの判定を行い、類似度が閾値T以上である
場合には、その特徴パターンを前記特徴パターンpHに
対応する特徴パターンとして求める。
例えばQ 31; Q 31であって、Q 32a T
である場合、2回目の発声入力音声から求められた特徴
パターンP32を1回目の発声入力音声から求められた
特徴パターンpHに対応する特徴パターンであるとして
求める。
このような類似度に対する判定処理により、この場合に
は特徴パターンpH,P21.  Pa2が相互に対応
する特徴パターンの組み合わせであるとして求められる
同様にして前述した1回目の発声入力音声から求められ
る特徴パターンPL2についても2回目の発声入力音声
から求められる特徴パターンP21゜・P22に対して
その類似度Qをそれぞれ次のように計算する。
Q21’ −[P21− Pa1l 。
Q22’ −[P21・Pa2] そしてこの場合、仮にQ21’ aQ22’であった場
合には、Q21′が所定の閾値T以上であるか否かの判
定が行われる。しかしこの場合には、特徴パターンP1
2は正しい音声区間の前方にノイズが加わった特徴パタ
ーンであることから、正しい音声区間の特徴パターンP
21との類似度Q 21’ は小さいものとなっている
。この結果、例えば前述した所定の閾値Tより大きいと
云う条件が満たされなくなるので、この場合には2回目
の発声入力音声から求められた特徴パターンには前記特
徴パターンP12に対応するものがないと判定される。
しかし仮にQ21′が所定の閾値T以上である場合には
、特徴パターンPL2と特徴パターンP21とが対応す
るとして判定される。従ってこの場合には、3回目の発
声入力音声から求められた特徴パターンP 31.  
P 32に対して同様にその類似度Qが次のように計算
される。
Q31’ −CF3I・Pa1l。
Q32’ −[P21・Pa2] そしてQ31’ mQ32’なる関係が導き出された場
合には、Q31′が所定の閾値T以上であるか否かの判
定が行われる。しかしこの場合、前述したように特徴パ
ターンP12は正しい音声区間の前方にノイズ区間が加
わって求められた特徴パターンであることから、3回目
の発声入力音声から求められた特徴パターンPalとの
類似度Q31の値は小さく、−膜内には前述した所定の
閾値Tに対する条件が満たされない。このような結果か
ら、3回目の発声入力音声から求められる特徴パターン
P 31.  P 32は前述した特徴パターンP12
には対応しないとして判定される。
このようにして1回目の発声入力音声から求められた特
徴パターンPL2に対して、2回目および3回目の発声
入力音声から求められた特徴パターンの中に対応するも
のがないと判定された場合、その特徴パターンは正しく
ないと判定される。この結果、この第2図に示す例では
、1回目乃至3回目の発声入力音声から求められた特徴
パターンP 11.、 P 21. P 32の組み合
わせについてだけ、それらの間の類似度に対する判定条
件が満たされることから、これらの特徴パターンの組が
正しい音声区間のものであると判断される。そしてこれ
らの特徴パターンpH,P21.  Pa2を用いて当
該入力音声カテゴリについての標準パターンの作成が行
われる。この標準パターンの作成は、これらの特徴パタ
ーンP 11.  P 21.  P 31を平均化す
る等して求められる。
ところで上述したようにして複数回の発声入力音声から
それぞれ求められる特徴パターンの組み合わせを求める
場合、その特徴パターンの組み合わせが複数通り求めら
れる場合がある。
例えば第3図に例示するように3回の発声により求めら
れた特徴パターンの音声区間候補がそれぞれ第2図に示
す場合と同様にL 11.  L 12.  L 2.
1゜L22.  L31.  L32として求められ、
それらの特徴パターンがpH,PI3.  P21. 
 P22.  P31.  P32として求められた場
合、同様な特徴パターンの組み合わせ判定を行うことに
より、例えば[pH,P21.  P31] 、  [
PI3.  P22.  P32]なる2組の特徴パタ
ーンの組み合わせが求められることがある。
このような場合には、そのいずれの組み合わせの特徴パ
ターンが正しい音声区間のものであるかをこのままでは
判定することができない。従ってこのような場合には、
例えばその組み合わせ判定に使用した類似度Qの情報を
用い、類似度Qが大きい方をより信頼性の高い音声区間
のものであると判定するようにすれば良い。
具体的には、第1の特徴パターンの組み合わせを得た類
似度の和[Q 21+ Q 323 と、第1の特徴パ
ターンの組み合わせを得る類似度の和E Q 22’十
Q32’]とを比較し、その値の大きい方を標準パター
ン作成用として採用するようにすれば良い。
或いは第1の特徴パターンの組み合わせを得た類似度の
内の大きい方wax [Q 21+Q 32]と、第2
の特徴パターンの組み合わせを得た類似度の内の大きい
方wax [Q 21+Q 32] とをそれぞれ求め
、これらを相互に判定してその値の大きい方を標準パタ
ーン作成用として採用するようにすれば良い。
また逆に第1の特徴パターンの組み合わせを得た類似度
の内の小さい方akin [Q 21+ Q 32コと
、第2の特徴パターンの組み合わせを得た類似度の内の
小さい方sin [Q 21+ 0821 とをそれぞ
れ求め、これらを相互に判定して標準パターンの選択決
定を行うようにすることも可能である。
またこのような類似度に着目することに代えて、特徴パ
ターンの組み合わせについて、その音声区間長を調べ、
その長さの長い方を最長マツチングの原則に従って標準
パターン作成用として採用することも可能である。この
音声区間長を比較する場合にも、その組み合わせにおけ
る特徴パターンの各音声区間長の和を求めたり、最大区
間長や最小区間長を相互に比較するようにすれば良い。
尚、最長マツチングの原則は、複数回の発声において正
しい音声区間にそれぞれ同様なノイズが付加され、これ
によって正しい音声区間より長い音声区間の特徴パター
ンの組み合わせが求められることは極めて希であり、一
般にその音声区間が最も長い特徴パターンの組み合わせ
が、その音声区間を正しく表現しているとの観点に立脚
したものである。
そして実際的には、無声化等により正しい音声区間の一
部が欠落して正しい音声区間よりも短い音声区間の特徴
パターンの組み合わせが求められることが多々在る。ま
た多くの場合、単語は複数の音声により構成されて有音
区間と無音区間とが交互に繰り返されることが多い。こ
のような場合にも、正しい音声区間よりも短い区間での
特徴ベクトルの組み合わせが求められることが往々にし
である。従ってこのようなことを配慮し、特徴パターン
の組み合わせが複数通り求められるような場合には、上
述したようにその中で音声区間が最も長いものを正しい
音声区間の特徴パターンであると判定することは非常に
有用であると云える。
尚、特徴パターンの組み合わせが複数通り求められるよ
うな場合、これらの特徴パターンのそれぞれから標準パ
ターンを求め、これによって標準パターン辞書5の学習
を行うようにすることも有用である。
このようにして本装置では、複数回の同一カテゴリの発
声入力単語音声についてそれぞれ求められる特徴パター
ン間での類似度(尤度)を求め、所定の閾値Tを越える
特徴パターンの組み合わせが各発声での特徴パターン中
に存在するとき、これを正しく音声区間検出された特徴
パターンとして抽出している。そしてこれらの正しく音
声区間検出されたときの特徴パターンに基づいてその標
準パターンを作成し、標準パターン辞@5に登録して単
語音声の認識処理に供するものとなっている。
従って本装置によれば、標準パターン自体をその音声区
間が正しく検出されているときの特徴パターンとするこ
とができるので、その認識辞書性能を十分高いものとす
ることができる。この結果、その認識性能を十分に高く
することができる。
また上述したように入力音声の音声区間を、特徴パター
ン間での類似度から特徴パターンの組み合わせとして評
価し、正しい音声区間での特徴パターンだけを抽出して
標準パターンを作成するので、その処理手続きが非常に
簡単であり、処理効率が高い。そして少ない発声回数で
効果的にその標準パターンを作成していくことができる
等の効果が奏せられる。
尚、本発明は上述した実施例に限定されるものではない
。例えば4回以上の発声入力音声についての特徴パター
ン間で類似度(尤度)を計算して音声区間の正しい特徴
パターンを抽出するようにしても良い。このようにすれ
ば、標準パターン作成の信頼性を高め、より性能の高い
標準パターン(認識辞書)を構築していくことが可能と
なる。
また上述した実施例では、1回目の発声入力音声から求
められる特徴パターンを基準として2回目および3回目
の発声入力音声から求められる特徴パターンとの組み合
わせを決定するようにしたが、2回目や3回目の発声入
力音声から求められる特徴パターンを基準としてその組
み合わせ決定を行うようにしても良い。また候補区間数
の多い発声入力音声の特徴パターンを基準として組み合
わせ決定処理を進めることも可能である。その他、本発
明はその要旨を逸脱しない範囲で種々変形して実施する
ことができる。
[発明の効果] 以上説明したように本発明によれば、ノイズの付加や音
声区間の脱落の影響を排除して入力音声の音声区間を正
しく検出し、その特徴パターンを抽出するので、信頼性
の高い音声区間候補の特徴パターンだけを用いて効率的
に高性能な標準パターンを作成することができ、その認
識性能の向上を効果的に図ることができる等の実用上多
大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る単語音声認識方式の概
略構成図、第2図および第3図はそれぞれ実施例装置に
おける標準パターン作成時での複数回の入力音声に対す
る音声区間候補とその特徴パターンについて模式的に示
す図である。 l・・・音響分析部、2・・・単語境界仮説生成部、3
・・・リサンプル部、4・・・類似度計算部(特徴パタ
ーンと標準パターンとの類似度計算)、も・・・標準パ
ターン辞書、6・・・認識結果出力部、7・・・類似度
計算部(特徴パターン間での尤度計算処理)、7a・・
・組み合わせ決定部(特徴パターンの組み合わせの判定
)、8・・・標準パターン作成部。

Claims (1)

  1. 【特許請求の範囲】 入力単語音声を音響分析してその特徴パラメータを求め
    る音響分析部と、この音響分析された特徴パラメータか
    ら上記入力単語音声の音声区間候補を求める単語境界仮
    説生成部と、この単語境界仮説生成部にて求められる音
    声区間毎に前記特徴パラメータを正規化して前記入力音
    声の特徴パターンを生成するリサンプル部と、認識対象
    単語の入力音声の特徴パターンから当該認識対象単語の
    標準パターンを作成する標準パターン作成部と、この標
    準パターン作成部で作成された認識対象単語音声の標準
    パターンと前記リサンプル部で求められる入力単語音声
    の特徴パターンとの類似度を計算する類似度演算部と、
    この類似度演算結果に従って前記入力単語音声に対する
    単語音声認識結果を求める認識結果出力部とを具備し、 前記標準パターン作成部は、認識対象単語について複数
    回に亘って発声入力される単語音声についてそれぞれ求
    められる複数の特徴パターンの間で相互にその尤度を計
    算する手段と、計算された尤度が所定の閾値以上となる
    前記特徴パターンの組み合わせを求め、この特徴パター
    ンの組み合わせから当該認識対象単語音声の標準パター
    ンを求める手段とからなることを特徴とする単語音声認
    識方式。
JP1312271A 1989-12-02 1989-12-02 音声認識方式 Pending JPH03174599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1312271A JPH03174599A (ja) 1989-12-02 1989-12-02 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1312271A JPH03174599A (ja) 1989-12-02 1989-12-02 音声認識方式

Publications (1)

Publication Number Publication Date
JPH03174599A true JPH03174599A (ja) 1991-07-29

Family

ID=18027234

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1312271A Pending JPH03174599A (ja) 1989-12-02 1989-12-02 音声認識方式

Country Status (1)

Country Link
JP (1) JPH03174599A (ja)

Similar Documents

Publication Publication Date Title
US20230139140A1 (en) User recognition for speech processing systems
US6125345A (en) Method and apparatus for discriminative utterance verification using multiple confidence measures
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US20220343895A1 (en) User-defined keyword spotting
JPH03501657A (ja) パターン認識エラー低減装置
JP2004518155A (ja) マッピングを用いた自動音声認識のためのシステムおよび方法
CN1957397A (zh) 声音识别装置和声音识别方法
WO2006093092A1 (ja) 会話システムおよび会話ソフトウェア
JP2002202797A (ja) 音声認識方法
US20110218802A1 (en) Continuous Speech Recognition
Hirschberg et al. Generalizing prosodic prediction of speech recognition errors
JP2004251998A (ja) 対話理解装置
JPH03174599A (ja) 音声認識方式
JP2838848B2 (ja) 標準パターン登録方式
JPH0283593A (ja) ノイズ適応形音声認識装置
JPH02298996A (ja) 単語音声認識装置
JP4236502B2 (ja) 音声認識装置
JPH03174600A (ja) 音声認識方式
KR20000025827A (ko) 음성인식시스템에서의 반음소모델 구축방법및 그를 이용한 발화 검증방법
JPH1145097A (ja) 連続音声認識方式
JPH0997095A (ja) 音声認識装置
JPH0484197A (ja) 連続音声認識装置
JPS6147999A (ja) 音声認識装置
Kitaoka et al. Detection and recognition of correction utterances on misrecognition of spoken dialog system
JP4297349B2 (ja) 音声認識システム