JPH0252279B2

JPH0252279B2 -

Info

Publication number: JPH0252279B2
Application number: JP58209782A
Authority: JP
Inventors: Uitsutoreruri Uitsutore
Original assignee: INGU CHII ORIBETSUTEI E CO SpA
Current assignee: INGU CHII ORIBETSUTEI E CO SpA
Priority date: 1982-11-08
Filing date: 1983-11-08
Publication date: 1990-11-13
Also published as: IT8268302A0; EP0108609B1; US4703504A; IT1156544B; DE3371134D1; JPS59101700A; EP0108609A1

Description

【発明の詳細な説明】この発明は、話し手によつて話されたことばな
いし単語の音声認識を行うための方法及び装置で
あつて、言葉を周期的に分析して少なくとも一つ
のベクトルを得てこれを複数の基準音素のベクト
ルと比較して分析された音声部分に最も類似した
音素を選択するようにしたものに関する。

既知の形式の単語認識用装置は話し手の協力を
前提条件としている。すなわち、「話し手特定
（speaker dependent）」形式のものにおいては、
認識は同じ話し手によりサンプル又はモデルとし
て事前記録された単語又は音素と音声との比較に
基づいて行われる。音声はモデル単語又は音素の
一つと十分に接近していると判断されたときに認
識される。従つて、話し手は比較に使用されるサ
ンプルにできるだけ類似した音声を発生すること
が必要である。

「話し手不特定（speaker independent）」形
式のものにおいては、話し手はそれほど正確に定
義されていないある種の発音方法に従えばよい。
この要件は結局「十分明りよう」に話すというこ
とである。

いずれの場合でも、認識が欠如した場合には話
し手はその原因がわからず、従つて、よい結果を
期待してむやみに動作を繰り返すことができるだ
けである。経験により、使用者は時として偶然に
機械の応答の仕方を学んで、次第に誤り率が減少
する。

この発明の目的は、非常に短い時間で音声に応
答することができ、話し手の音声が最良の性能を
得るように話し手による音声調整を可能にするよ
うな応答を話し手に対して与えることができる認
識装置を得ることである。機械の応答に関する自
然の習得過程はそれゆえ容易になる。

単語の音声認識（phonetic recognition of
words）のためのこの発明による装置は選択され
た音素に対応する可視表示をリアル・タイム（実
時間）で行うことを特徴としており、これによつ
て話し手は自己の発音を基準音素に対応する発音
と一致するように適応させることができる。この
発明による話された言葉の音声認識のための装置
は、音声信号をデイジタル形式に変換するための
装置と、変換された音声信号を分析して少なくと
も一つの対応するベクトルを発生するための分析
装置と、このようにして発生されたベクトルを基
準音素の複数のベクトルのそれぞれと比較するた
めの比較装置と、該比較装置の出力に応答して、
分析された音素に最も類似した基準音素を認識す
る認識装置とを備え、更に認識された音素の可視
表示を実時間で発生するための制御装置を設ける
とともに、前記認識装置が、一連の認識段階にわ
たり該認識装置により行われた認識の安定度を表
す安定度信号を発生し且つこの安定度信号の表示
を実時間で行うように構成されていることにより
特徴づけられている。

次にこの発明の採択した一実施例を添付の図面
について説明する。

この発明の装置は、話し手の音声信号を連続的
に捕えてこれを増幅器６に送信するように構成さ
れたマイクロホン５を備えている。増幅された信
号は次に一連の帯域通過又は偽信号除去フイルタ
７に送られ後続の標本化をひずませるおそれのあ
る望ましくない周波数が除去される。このような
周波数は、例えば、米国ニユージヤージ州エング
ルウツド・クリツフスのプレンテイス・ホール社
出版の、「音声信号のデイジタル処理」と題する
ローレンス・アール・ラビナ及びドナルド・ダブ
リユー・シエイフアの著書の2.4.1頁
（paragraph2.4.1of the book by Lawrence Ｒ
Rabiner and Ronald Ｗ Schafer entitled
“Digital Processing of Speech Signals”，
published by Prentice−Hall，Inc，
Englewood Cliffs，New Jersey）に記載された
アルゴリズムに基づいて決定することができる。

この発明の装置は更に、所定の周波数、例えば
12ないし20KHzの周波数を持つたフイルタから来
る信号を前述のアルゴリズムに基づいて標本化す
るためにタイマ９によつて制御される標本化装置
８を備えている。

このようにして標本化された信号はアナログ・
デイジタル変換器１０によつて変換される。

分析装置１１は変換器１０から出る音声信号を
分析してこの信号に対応する少なくとも一つのベ
クトルＶを発生するように構成されている。分析
装置は、所定の時間TW（第２図）に変換器１０
によつて供給される信号を分析するようにそれぞ
れ構成された一連の分析器A₁，A₂……A_oからな
つている。

分析器A₁…A_oは各動作ごとに信号の窓又は部
分Ｗを分析して、反射係数Kiを含有した対応す
るベクトルＶ（第１図）、すなわち分析された音声
部分Ｗの分析的表示を発生する。ここで、反射係
数は、下記の著書「音声の線形予測」に正確に規
定されているような、話者の声門や口唇の位置を
示し且つ声道モデルによるパラメータを意味す
る。音声部分のこのような分析的定義のアルゴリ
ズムは、例えば米国ニユーヨークのシユプリン
ガ・フエアラーク社によつて出版された「音声の
線形予測」と題するジエイ・デイー・マーケル及
びエイ・エイチ・グレイ・ジユニアの著書の
4.2.1項（paragraph4.2.1 of the book by Ｊ
Ｄ Markel and ＡＨ Gray，Jr，entitled
“Linear Prediction of Speech”，published by
Springer Verlog，New York）の記載されてい
る。係数Kiの数としては12ないし18に選べばよ
いが、これは周知のように標本化周波数に相関し
ている。分析器A₁……A_oは更に、分析される音
声部分Ｗの時間TW中の信号の平均電力を表す値
ENを発生する。

各分析器A₁……A_oは、適当にプログラムされ
且つ各記憶装置が音声部分Ｗの持続時間TWに対
応する信号の多数の標本を記憶するのに十分な容
量を持つている二つの緩衝記憶装置を備えたマイ
クロプロセツサによつて都合よく構成することが
できる。この二つの緩衝記憶装置は交互に使用さ
れ、一方は新しい入力データを記憶するために且
つ他方は分析の結果をベクトルＶとして出力に供
給するのに使用される。

個個の分析器A₁……A_oに送られるべき音声部
分W₁……W_oはタイマ９によつて制御された論理
回路１２によつて規定されるが、この論理回路は
音声部分W₁……W_oを時間的にずらし且つ部分的
に重ね合わせて、すなわち持続時間TWと分析器
A₁……A_o（第１図）の数との比に等しい時間TI
（第２図）だけ隔てて、分析器A₁……A_oに順に送
るように構成されている。それゆえ、各分析器
A₁……A_oはそれぞれの音声部分を連続的に分析
し、従つて種種の分析器A₁……A_oは時間的に一
部分重なり合う音声部分W₁……W_oを分析する。
換言すれば、持続時間TWの一部分である持続時
間TIにおける各音声部分は、装置１１が三つの
分析器A₁，A₂，A₃からなつているものと仮定し
て音声部分Ｗの順序を示してある第２図の線図か
ら明らかなように、すべての分析器A₁……A_oに
よつて同時に分析される。

この発明の装置は更に、複数の比較器C₁，C₂
……C_nからなる比較装置１３を備えており、こ
の各比較器は分析器A₁……A_oの一つによつて発
生されたベクトルＶを、比較器に記憶された、対
応する音素を表すそれぞれの基準ベクトルV₁，
V₂……V_nと比較するように構成されている。ベ
クトルV₁，V₂……V_nは「話し手特定」方式では
話し手の声から得ることができ、又「話し手不特
定」方式では平均的な状態を表すようにすればよ
い。当然、認識の信頼度は前者の方が後者よりも
良いであろう。各比較の結果は、分析された音声
部分に関するベクトルとこれに対応する基準ベク
トルとの間の距離Ｄであり、この距離は二つのベ
クトルの反射係数の対の間の差の絶対値の和とし
て計算される。分析器A₁……A_oと比較器C₁……
C_nとの間には走査器１４が配置されていて、こ
の走査器はベクトルＶ及び値ENを入力として順
次受け取り、且つ出力として各ベクトルＶをすべ
ての比較器C₁……C_nに並列に送ると共に、順次
値ENを緩衝記憶装置に記憶させる。比較器C₁，
C₂……C_nの出力の全体はｍ個のベクトルＤを表
しており、これのそれぞれはｍ個の基準音素に関
して分析された最後の音声部分Ｗの距離を表して
いる。

比較器C₁，C₂……C_n及び緩衝記憶装置１６の
出力は、分析されるものに最も類似した基準音素
を選択するように構成された音素認識装置１７に
接続されている。更に詳しくは、認識装置１７は
緩衝記憶装置１８を備えた適当にプログラムされ
たマイクロコンピユータによつて構成されてお
り、この記憶装置１８には装置１７により比較装
置１３及び緩衝記憶装置１６の出力がタイマ９に
よつて決定される周期TIで記録されるようにな
つている。緩衝記憶装置１８はそれゆえ分析され
た最後の音声部分Ｗの所定数Ｘのものに関するベ
クトルＤ及び値ENを記憶するように構成されて
いる。認識装置１７は、緩衝記憶装置１８に記憶
されている分析された最後の音声部分Ｗに関する
ベクトルＤを同じ周期TIで分析して、ベクトル
Ｄを発生したものに最も類似している基準音素を
選択するようにプログラムされている。実際に
は、装置１７は、音声部分Ｗの音素からの最小距
離ｄを示し且つ選択された基準音素の符号Ｙ、及
び前記の距離ｄの所定値に対する補数によつて構
成された認識のメリツト値を表す符号Ｐを有する
音素FYをｍ個の基準音素の中から選択する。

更に、認識装置１７は分析された音声部分Ｗの
エネルギーレベルを表す符号ENを発生する。最
後に、認識装置１７は緩衝記憶装置１８における
最後のＸ個のベクトルＤを比較して認識が安定で
あるか否かを、すなわち最後のＸ個の音声部分に
おいて基準音素との比較が常に同じ選択になつて
いるか否かを確定するようにプログラムされてい
る。肯定の場合には、装置１７は安定度を示す二
進値STの符号を発生する。

この発明の装置は更に、陰極線管によつて構成
されたモニタ２０に対する制御装置１９を備えて
いる。更に詳しくは、制御装置１９は認識装置１
７から符号Ｙ，Ｐ，EN及びSTを受けて、音声部
分自体の分析と共に実時間で前記の諸符号を表す
ヒストグラムの可視表示をモニタ２０に与えるよ
うに構成されている。このヒストグラムはモニタ
２０の実質上上半部２３に可視表示され、且つ第
３図に示したように一連の柱状部からなつてい
る。このヒストグラムにおいて、第１柱状部はエ
ネルギーENのアナログ値を表し、第２のものは
安定度STを表すものであつて二つの値のみ（安
定であれば高レベル、安定でなければゼロ）をと
ることができ、それに続く柱状部はそれぞれ比較
音素の一つに対応しており、認識音素FYに対応
するもの以外はすべてゼロレベルであり、認識音
素の高さはメリツト値Ｐをアナログ形式で表して
いる。

モニタ２０の表示面上の種々の柱状部の下には
柱状部の意味が固定表示されている。種々の基準
音素FYはアルフアベツトの文字（例えば、母音）
及び語の音節の形で表示されている。又、認識可
能な音素の数は変更することが可能であろうし、
且つ又柱状部の意味の可視表示はモニタ２０に固
定表示する代わりに同じ制御装置１９（第１図）
によつて制御することができよう。

モニタ２０上に所望のヒストグラム像を発生す
るために、制御装置１９はビームの水平偏向を指
令するが、この偏向は線形であり、且つ装置１９
が認識装置１７から情報のブロツクを受けた瞬間
と同期している。制御装置１９は次にデイジタ
ル・アナログ変換器２１を介して適当なタイミン
グで、垂直偏向を制御する信号を送る。

最後に、この発明の装置は、適当にプログラム
されたマイクロコンピユータと、辞書又は単語集
の、適当に符号化された音声表示、すなわち、同
じ語のアルフアベツト表示に対するそれぞれの符
号と関連した、この発明の装置が認識することの
できる語、が記録されている記憶装置とから実質
上なつている辞書的認識論理装置２２を備えてい
る。辞書的認識装置２２は音素認識ユニツト１７
から出力された情報の各項目を制御装置１９と並
列に受けて一連の音素FYのデータをこれが認識
されるときに一時的に記憶するように構成されて
いる。更に、装置２２は走査器１４から出力され
た情報の各項目を受けて、分析された実際の音素
信号に対応する一連のベクトルＶをも記憶する。

辞書的認識装置２２は記憶された単語の内容を
音声認識装置１７によつて受け取られた一連の音
素FYと比較して、これをつなぎ合わせ、それぞ
れの音素が一連のものの一群の音素FYと一致す
るときには単語又は単語の一部分を認識するよう
に構成されている。認識された一連の音素FYと
単語又は単語の一部分との一致が完全でない場
合、例えば認識のあいまいさがある場合には、装
置２２は認識装置１７により認識されたものに類
似した他の基準音素を考慮することによつて、走
査器１４から直接受け取つたベクトルＶを利用す
る。

装置２２の動作の結果は、モニタ２０を制御し
て、例えば表示面の下方部分２４に、アルフアベ
ツト形式で認識された単語又は単語の一部分を可
視的に表示し、且つ又ある単語が認識されていな
い部分に対しては一連の点を可視的に表示するこ
とにある。

認識装置は次の方法で動作する。

認識装置は音素及び語彙の二つの認識論理のレ
ベルを与える。

音素認識は実時間で行われて、操作員に見える
反応を発生するが、これも又実時間である。

話し手から発したマイクロホン５（第１図）に
よつて捕えられた音声信号は増幅器６によつて増
幅させてフイルタ７によりフイルタされる。この
ようにしてフイルタされた信号は次に標本化装置
８によつて高い周波数で標本化され、そして変換
器１０によつてデイジタル信号に変換される。こ
の値は論理回路１２によつて受け取られ、この回
路は多数の標本化信号からなる、持続時間TW
（第２図）中のこの信号の一連の音声部分Ｗを発
生する。例えば、音素の平均持続時間は100msの
程度であるので、この発明の装置がただ三つの分
析器A₁，A₂，A₃を備えていると考えると、持続
時間TWは30msに選べばよく、又標本化は18000
Hzで行えばよい。

連続した音声部分W₁，W₂，W₃，W₄……は持
続時間TWと分析器の数との比に等しい時間TI
だけ隔置されており、従つてTI＝10msとなる。
論理回路１２（第１図）は継続する音声部分Ｗを
分析器A₁，A₂……に分配し、従つてこれらの分
析器は第２図に示したようにずれて重なり合つた
音声部分について動作する。各分析器A₁，A₂…
…は対応する音声部分を分析するのに時間TAを
必要とし、この目的のために、第２図のグラフ２
５で示した時点において、分析の結果、すなわ
ち、それぞれのベクトルＶを構成する反射係数及
び音声信号の平均電力の相対値EN、を出力とし
て供給する。

従つて、各分析器A₁，A₂……は、次々と発生
するが重なり合つていない音声部分の分析結果を
各音声部分の終りに対する遅延TAを伴つて供給
する。

第２図の線図から明らかなように、ベクトルＶ
及び値ENはTIに等しい時間間隔で得られる。連
続したベクトルＶは走査器１４によつて順次選択
されてｍ個の比較器C₁……C_nに並列に送られ、
又ENの値は適当な緩衝記憶装置１６に記憶され
る。ｍ個の比較器C₁……C_nは次に、第２図のグ
ラフ２６で示した期間において、分析された最後
の音声部分を表すベクトルＶと比較器に記憶され
た多くの基準音素を表すｍ個のベクトルV₁……
V_nとの間の距離を同時に測定して、第２図のグ
ラフ２７によつて示した時点における比較装置１
３からの出力として、分析された最後の音声部分
のｍ個の基準音素からの距離を表すｍ個のベクト
ルＤを定義する。周期TIで、ベクトルＤ及び緩
衝記憶装置１６（第１図）の内容が認識装置１７
によつて得られ、そして分析されたｘ個の最後の
音声部分に関するベクトルＤ及び値ENが記憶装
置１８に記憶される。次に、認識装置１７におけ
る最後のベクトルＤの検査に基づいて、分析され
た最後の音声部分に最も類似した基準音素FYが
認識される。

他方、装置１７の記憶装置１８における最後の
ｘ個のベクトルＤを比較することによつて、認識
の安定性があるか否かが確立される。TIに等し
い時間間隔で、認識装置１７は次に信号EN，
Ｙ，Ｐ，STを制御装置１９及び辞書的認識装置
２２に送る。変換器２１を介して、制御装置１９
はモニタ２０を制御して、第３図の上方部分に表
示された形式の対応するヒストグラムを発生させ
る。第３図では認識された音素は文字「０」であ
る。このヒストグラムはそれゆえ、この発明の装
置によつて行われる音声認識の可視表示を実時間
で受けている話し手によつて、単語の音節発音に
おける話し手の自然の速度に一致した時間で常時
観察することができる。更に詳しくは、話し手
は、認識された音素が彼の発音しようとしたもの
でないことに気づいたときには、彼の発音を基準
音素に一層近くなるようにすることができる。更
に、話し手はヒストグラムの柱状部ENによつて
表示されたレベルが低いことを認めた場合には彼
の音調を上げることができる。最後に、ヒストグ
ラムの柱状部STは認識があいまいさなしに行わ
れたこと及びそれが辞書的認識装置２２によつて
受け入れられたことの表示を話し手に与える。逆
に、柱状部STの欠如は話し手の速度がこの発明
の装置の分析速度に適合していないことを表示す
ることができ、従つてこの場合には話し手は、話
す速度を適当に適合させることができる。

明らかなことであるが、既述のこの発明の装置
は話し手に自己の話がどのように認識されたかと
いう直接の知覚を与える認識方法の単なる一例で
ある。明らかに、既述の音声認識論理はすべての
音素に等しく適するものではない。更に詳しく
は、それは母音、鼻子音、及び時間的に接続させ
ることのできる摩擦音（例えば、ｆ、ｓ、sc））
に対してはよく適しているが、破裂子音（例え
ば、ｐ、ｋ、ｔ、ｄ）を相互に認識するのにはあ
まり適していないようである。これらの子音の認
識を確実にするためには、比較器C₁，C₂……の
数を増大させて、話し手が対処できる音素の数に
した後、この発明の装置によつて認識を行うよう
にすればよい。

音素認識とは対照的に、辞書的（語彙）認識は
実時間では行われず、話し手が認識されるべき単
語の発音を完了した後に開始される。

辞書的認識のために、辞書的認識装置２２は音
素認識装置１７から出力された情報と走査器１４
から出力されたすべての情報との両方を受ける。
装置２２はそれゆえ、装置１７によつてこまかく
認識される一連の音素FYに対応する一連の符号
と、走査器１４から出て来るより豊富な一連の情
報とを自由に使える。認識装置２２は次に一連の
音素を相互に連結して、まずその単語集の内容と
装置１７から受けた一連の情報とを比較する。

この一連のものの一部分と辞書の要素との対応
によつて装置２２は単語を認識して、対応するア
ルフアベツトの可視表示を与えるようにモニタ２
０を制御する。話し手がこの発明の装置の反応に
順応するのに成功した程度まで、ユニツト１７に
よつて発生される一連の情報は確実な情報基礎を
構成するであろう。しかしながら、実時間での音
声認識は不完全であるので、それは完全ではあり
得ない。例えば、それは破裂音を相互に区別する
ことができない。解釈のあいまいさがある場合に
は、装置２２における認識論理回路は相互につな
がつて、走査器１４から直接受けたベクトルＶを
それの単語集と比較し、このようにして類似の音
素を相互に区別する。

それゆえ、装置２２は又モニタ２０を介して話
し手に受け取つた一連の音素を表示する反応及び
認識された単語の図式表示を送る。明確な概念を
与えるために、イタリア語「sette」（すなわち、
「７」）の場合には、認識される一連の音素は
SE・・Ｅであろう（ここで、点は、第３図に示
したように、一般に破裂音に先行する無音を表し
ている。）他方、辞書及び走査器１４から受けた
データの援助により、完全に書かれた単語、すな
わち「SETTE」を得ることができる。第３図は
表示面の下半部にSE・・Ｅの表示を示している。
これは上半部に示された音素「０」の認識とは別
の例である。

それゆえ明らかなことであるが、既述のこの発
明の装置は所望の反応を実時間で、すなわち平均
的な母音音素の持続時間（約100ms）よりも短い
時間で発生するように特に設計されており、又音
声信号は断絶なく連続して処理される。情報は一
連の論理装置を通過し、この論理装置のそれぞれ
は、第２図の線図に示した時間要件に従つて、既
述の技法により実施することのできる機能を行
う。

注意するべきことであるが、話し手に対する実
時間での反応という基本的な考えと一致する他の
論理構造に関係した別の認識手順を利用すること
もできる。

最後に、明白なことであるが、この発明の範囲
から外れることなく既述の特定のこの発明の装置
において種種の変更及び改善を行うことができ
る。例えば、モニタ２０によつて与えられる表示
のいくつかは他の可視装置又は光学的表示装置に
よつて与えることができるであろう。更に、装置
２２によつて制御される単語のアルフアベツト表
示はプリンタによつて与えてもよく、又装置２２
は走査器１４からの代わりに装置１１の分析器か
ら直接ベクトルＶを取り寄せることもできるであ
ろう。

【図面の簡単な説明】

第１図は単語の音声認識のためのこの発明によ
る装置の構成図である。第２図は第１図の装置の
動作に関する時間図である。第３図は第１図の装
置のモニタに発生したヒストグラムの線図であ
る。これらの図面において、１０はＡ−Ｄ変換器、
１１は分析装置、A₁，A₂……A_oは分析器、１３
は比較装置、C₁，C₂……C_nは比較器、１７は音
素認識装置、１９は制御装置、２０はモニタ、２
２は辞書的認識装置を示す。

Claims

【特許請求の範囲】１音声信号をデイジタル形式に変換するための
装置１０と、変換された音声信号を分析して少なくとも一つ
の対応するベクトルＶを発生するための分析装置
１１と、このようにして発生されたベクトルを基準音素
の複数のベクトルのそれぞれと比較するための比
較装置１３と、該比較装置１３の出力に応答して、分析された
音素に最も類似した基準音素FYを認識する認識
装置１７とを備える話し手によつて話された言葉
の音声認識のための装置において、認識された音素の可視表示を実時間で発生する
ための制御装置１９を設けるとともに、前記認識装置１７が、一連の認識段階にわたり
該認識装置１７により行われた認識の安定度を表
す安定度信号STを発生し且つこの安定度信号ST
の表示を実時間で行うように構成されていること
を特徴とする話し手によつて話された言葉の音声
認識のための装置。２特許請求の範囲第１項に記載の装置におい
て、認識された音素FYを文字又は音節で表示す
る表示装置２０を備え、且つ前記制御装置１９が
認識された音素FYに関する情報を表示するヒス
トグラムを発生するように構成されており、これ
により発音された単語が前記音声認識のための装
置により正しく認識されているか否かを話し手が
実時間で検査することができることを特徴とする
話し手によつて話された言葉の音声認識のための
装置。３特許請求の範囲第１項又は第２項に記載の装
置において、前記分析装置１１はデイジタル符号形式で音声
部分Ｗを受け取るように構成された複数の分析器
A₁，A₂……A_oを有し、該種々の分析器は音声部分の持続時間TWと分
析器の数との比TIだけ分離された時点で順次分
析を開始し、時間的に重なり合う音声部分Ｗを分
析して対応する一連のベクトルＶを発生するよう
に構成されており、前記比較装置は複数の比較器C₁，C₂……C_nを
有し、該複数の比較器の各々は、それぞれの基準ベク
トルと前記分析器によつて供給された一連のベク
トルＶとを比較するように構成されていることを
特徴とする話し手によつて話された言葉の音声認
識のための装置。４特許請求の範囲第３項に記載の装置におい
て、前記比較器C₁，C₂……C_nがそれぞれ各基準
ベクトルからの前記の一連のものの一つのベクト
ルＶの距離を計算するように構成されており、且
つ前記認識装置１７が前記の一連のものの一つの
ベクトルＶからの最小距離を持つた基準ベクトル
に対応する基準音素FYを選択するとともにこの
最小距離値を所定数の連続した選択について記憶
するように構成されていることを特徴とする話し
手によつて話された言葉の音声認識のための装
置。５特許請求の範囲第４項に記載の装置におい
て、前記認識装置１７が少なくとも最後の二つの
記憶された最小距離値に応答して認識の安定度を
示す値STを発生するように、且つ対応する計算
距離の所定値の補数である認識メリツト値Ｐを発
生するように構成されていることを特徴とする話
し手によつて話された言葉の音声認識のための装
置。６特許請求の範囲第５項に記載の装置におい
て、前記認識装置１７が分析された音声部分Ｗの
平均エネルギーに対応するエネルギー信号ENを
発生することを特徴とする話し手によつて話され
た言葉の音声認識のための装置。７特許請求の範囲第５項に記載の装置におい
て、前記制御装置１９が前記の安定度値ST及び
前記認識メリツト値Ｐを含むヒストグラム表示を
発生することを特徴とする話し手によつて話され
た言葉の音声認識のための装置。８特許請求の範囲第６項又は第７項に記載の装
置において、前記制御装置１９がエネルギー信号
ENを含むヒストグラム表示を発生することを特
徴とする話し手によつて話された言葉の音声認識
のための装置。９特許請求の範囲第１〜８項のいずれか一項に
記載の装置において、一連の連続して認識された
音素FYを、記憶装置に記録された語彙の単語と
比較して単語の認識を行うように構成された辞書
的認識装置２２を備えており、且つこの辞書的認
識装置２２により制御されて、認識された単語の
表示が行われることを特徴とする話し手によつて
話された言葉の音声認識のための装置。１０特許請求の範囲第１〜９項のいずれか一項
に記載の装置において、各表示がモニタの表示面
に発生させることを特徴とする話し手によつて話
された言葉の音声認識のための装置。１１特許請求の範囲第１〜１０項のいずれか一
項に記載の装置において、前記の少なくとも一つ
の分析器A₁，A₂……A_o、前記制御装置１９及び
前記辞書的認識装置２２がプログラムされたマイ
クロプロセツサを備えていることを特徴とする話
し手によつて話された言葉の音声認識のための装
置。