JPS59140500A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59140500A
JPS59140500A JP59007129A JP712984A JPS59140500A JP S59140500 A JPS59140500 A JP S59140500A JP 59007129 A JP59007129 A JP 59007129A JP 712984 A JP712984 A JP 712984A JP S59140500 A JPS59140500 A JP S59140500A
Authority
JP
Japan
Prior art keywords
recognition
speakers
speaker
speech
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59007129A
Other languages
English (en)
Other versions
JPS6227399B2 (ja
Inventor
中田 和男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59007129A priority Critical patent/JPS59140500A/ja
Publication of JPS59140500A publication Critical patent/JPS59140500A/ja
Publication of JPS6227399B2 publication Critical patent/JPS6227399B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、不特定の話者を対象とした音声認識装置に関
するものである。
音声認識方式には、その認識の対象とする語の発生形態
と発生個体(話者)とによって第1図に示すように分類
される。音声認識の現状技術レベルは、分類■すなわち
特定話者の(限定)単独単語認識がようやく実用化の段
階をむがえたところといえよう。研究段階では話者を不
特定に拡大する方向(I−11)と、語を連続(任意)
音声に拡大する方向(1−III)に研究がす\められ
ている。
特定話者/不特定話者の音声認識についていえば、限定
単独の単語認識において、特定話者による認識率は98
%以上達成可能であるが、不特定話者による認識では9
0〜95%の認識がやっとであり、これを特定話者なみ
にすることはむづがしく、この状況が改善されることは
仲々望めそうにない。
したがって、不特定話者認識において、その認識率を実
用可能なレベル(たとえば97%以」二)にまで高める
必要がある。
この解決策として、第2図に示すように、予じめ多数の
話者の音声を分析し比較して、それらを複数の標準バタ
ン系列#1〜#nに分類しておき、使用に先立って内容
が既知のテスト音声を未知話者に発声してもらい、それ
を分析することによって、どの標準バタン系列に属する
かを判断し、特定の標準バタン系列を選定し、認識を行
なうことが考えられている。
この場合、限定語 の単語認識では全語 が一度に特定
化されるという利点を有する反面、通常標準バタン系列
の数はそれほど多くとれないので特定化の効果は充分と
は誹えず、高い認識率を保つことは難かしいという問題
があった。
本発明の目的は、誤認識の可能性を少なくし、極めて高
い認識率を実現した音声認識装置を提供することにある
このような目的を達成するために、本発明では複数の話
者に平均的な標7(+3パタンを初期条件として認識を
スタートさせ、未知話者の音声バタンか人力され認識さ
れるにしたがって、その入力バタンと標Q(Qパタンを
順次置き換え、標(f!バタンを特定化して認識率を高
めろようにしたことに特徴がある。
第3図は本発明による音声認識装置の原理を示すもので
ある。
本発明では、予じめ多数の話者の音声を分析しそれらか
ら平均的な標準バタンを作成しておき、それを初期条件
に認識をスタートする。話者の未知の音声入力を認識し
、その結果が確認され、正しく認識された場合には、そ
の単語について、平均的な標準パタンをその時に話者の
音声入力バタンでおきかえる。また、誤認識の時は何ら
かの手段によって、正しい単語番号が外部や)ら指示さ
れれば、その単語のバタンとして入力バタンをおきかえ
る。
平均的な標準パタンは不特定話者に応じられるよう一般
的にひろがっており、標準バタン間相互の分離が悪く誤
りをおこしやすい。これに対して特定話者のバタンはそ
の話者個有の特性によって歪んではいるが、拡がりは狭
く、バタン相互の分離は良く認識率は高い。この方法に
よれは使用頻度の高いものが順次特定話者バタンにおき
かえられてゆき、誤認識を急激にへらすことができる。
家 本発明に\よれば、不特定話者用の平均的な標Y(Qバ
タンからスタートし、すみやかに特定話者の標準パタン
におきかわることにより、高い認識率を確保することが
できる。
第4図は本発明による音声認識装置の−・実施例の構成
を示すものである。
図において、■は入力音声波形の分析部、2は分析1で
得られた特徴パラメータを格納するレジ宇部、6は認識
結果の確認部、7はメモリ3の書き換え制御を行なう書
き込み制御部、8は標準)(タンを予備的に格納するメ
モリである。
そしてメモリ3,8には、予じめ、多数の話者に平均的
な標準パタンかパラメータの系列として記憶されている
このような構成において、入力音声波形Sllよ分析部
1によ−って分析され、特徴)(ラメータの系列S2に
変換される。例えば20ミリ秒毎番320ミリ秒間を一
区間とする分析(たとえは、良く知相関分析とか)が行
なわれ、ノ(ラメータの系列(k:J) 、  i =
 ] 、 −’n  (分析)17 1.番号)、j=
1.〜P(分析パラメータの:次元数)、に変換される
。このパラメータ値はレジスタ2に分析先頭区間から順
次記憶されるとともに整合部4番:送りこまれる。
整合部4では、分析部1で未知人力音声波形番;施した
のと同じ分析を施して、あらかじめ特徴値の系列に変換
されて記憶されているメモリ3内の標準パタンの各単語
と順次整合が4呈される。このとき、たとえば時間軸の
非線形変換1之合のためにDP(ダイナミックプロクラ
ミンク)手法を使うとか、時間軸方向に情報圧縮を行う
ため番こ特徴系列の安定点や変化点が抽出されるなどの
処理力1必要に応じてとられることはいうまでもなし\
整合の結果は判定部5に送らJL、全標’l(Q、)<
タンとの接合が終った時点で、その最小値(あるb)、
+1最大値)が検出され、認識結果として確認部6 L
Zおくられる。確認部6では認識結果S3が人間し;与
えられ、その確認結果S4が入力される。S3と84が
一致しているときは正しい認識が行な]−)れたわけで
書き込み制御部7により、レジスタ2に貯えられている
分析情報はメモリ3内の認識結果に対応する標準パタン
におきかえられ、特定化が行なわれる。
誤認識の場合、確認結果S4として正しい入力の指示が
与えられれば、それにしたがってレジスタ2に貯えら九
でいる分析情報はメモリ3内の指示された標準パタンに
おきかえられる。
これらのおきかえの制御は、上述した書き込み制御部7
で制御される。なお、この制御部7ではすでにおきかえ
が行なわれているときは、認識結果が誤ったときのみに
おきかえを行なう。
話者が特定のAからBに変るとき、標7(+!パタンは
ほとんどAのものに特定化されており、そのままスター
1−シたのでは誤認識率が大きくなる恐れがあるので、
リセノ1−スイッチによる指令S5で保存用の標7(+
!バタンメモリ8から、平均的な標準パタンが再び標準
パタンメモリ3に書き込まれ、平均標準パタンを初期条
件としてスタートする。
このことによって最初の誤認識率のふえるのを防ぐ。以
下話者Aの場合と同じようにして、話者Bの使用につれ
て標準パタンは話者Bのパタンに特定化されていく。
以上のべたように本発明によれは、平均標準パタンを初
期条件とすることによって、不特定話者に対する初期誤
りを低いレベルに保ちながら、標準パタンを順次特定話
者のものにおきかえていくことによって特定化し、高い
認識率を保つことができ、その効果は大きい。
なお、本実施例では単語認識について説明したが、単音
節やvC■音韻連鎖を単位とする認識においても同様に
実施できることはいうまでもない。
【図面の簡単な説明】
第1図は音声認識方式の説明図、第2図は従来の音声認
識装置の原理図、第3図は本発明による音声認識装置の
原理図、第4図は本発明による音声認識装置の一実施例
の構成図を示す。 1・・・分析部、2・・・レジスタ、3,8・・624
パタンメモリ、4・・・整合部、5・・・判定部。 第 1 図 高    z    図       木宗竿バフ)7
2スタ罰 3 図 硝冒、免 嘱  4  目

Claims (1)

    【特許請求の範囲】
  1. 1、入力音声パタンから特徴パラメータを抽出する分析
    手段と、複数の話者の平均的な標準バタンの特徴からの
    特徴パラメータを予じめ格納したメモリと、前記分析手
    段からの特徴パラメータと前記メモリからの特徴パラメ
    ータとの整合状態を調べ、前記入力音声バタンの認識を
    行なう認−識手段と、該手段の認識結果に基づいて、前
    記メモリに格納されている標準バタンを前記分析手段か
    らの入力音声パタンにおきかえる制−御手段とからなる
    ことを特徴とする音声認識装置。
JP59007129A 1984-01-20 1984-01-20 音声認識装置 Granted JPS59140500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59007129A JPS59140500A (ja) 1984-01-20 1984-01-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59007129A JPS59140500A (ja) 1984-01-20 1984-01-20 音声認識装置

Publications (2)

Publication Number Publication Date
JPS59140500A true JPS59140500A (ja) 1984-08-11
JPS6227399B2 JPS6227399B2 (ja) 1987-06-15

Family

ID=11657466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59007129A Granted JPS59140500A (ja) 1984-01-20 1984-01-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59140500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05199840A (ja) * 1991-10-18 1993-08-10 Airemu Kk 食品およびその製造方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5267501A (en) * 1975-12-02 1977-06-04 Fuji Xerox Co Ltd System for recognizing difference by audio
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5267501A (en) * 1975-12-02 1977-06-04 Fuji Xerox Co Ltd System for recognizing difference by audio
JPS53114601A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05199840A (ja) * 1991-10-18 1993-08-10 Airemu Kk 食品およびその製造方法

Also Published As

Publication number Publication date
JPS6227399B2 (ja) 1987-06-15

Similar Documents

Publication Publication Date Title
EP0109190A1 (en) Monosyllable recognition apparatus
JPS58129682A (ja) 個人照合装置
Sethu et al. Speaker normalisation for speech-based emotion detection
JPS61186998A (ja) 音声の区分化方法
CN108665901A (zh) 一种音素/音节提取方法及装置
JPS59140500A (ja) 音声認識装置
JPS63179398A (ja) 音声認識方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS599080B2 (ja) 音声認識方法
JPS58149099A (ja) パタ−ン認識方式
JPS6073592A (ja) 特定話者用音声認識装置
JPS58224396A (ja) 音声認識装置
JP2000122693A (ja) 話者認識方法および話者認識装置
JPS608898A (ja) 音声認識装置
JPS5934595A (ja) 音声認識処理方式
JPH11184492A (ja) 話者認識装置及びその方法
JPH04271397A (ja) 音声認識装置
JPS59143200A (ja) 連続音声認識装置
JPS63157199A (ja) 話者照合装置
JPS5977500A (ja) 単語音声認識方式
JPS63292199A (ja) 音声認識装置
JPS59126600A (ja) 音声認識装置
JP2000515991A (ja) パターン認識
JPS62111292A (ja) 音声認識装置
JPS5934597A (ja) 音声認識処理装置