JPS6226040B2 - - Google Patents

Info

Publication number
JPS6226040B2
JPS6226040B2 JP54502077A JP50207779A JPS6226040B2 JP S6226040 B2 JPS6226040 B2 JP S6226040B2 JP 54502077 A JP54502077 A JP 54502077A JP 50207779 A JP50207779 A JP 50207779A JP S6226040 B2 JPS6226040 B2 JP S6226040B2
Authority
JP
Japan
Prior art keywords
signal
pulse
distance
feature
store
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54502077A
Other languages
English (en)
Other versions
JPS55500884A (ja
Inventor
Furanku Kurisutofuaa Paatsu
Roorensu Richaado Rabinaa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Publication of JPS55500884A publication Critical patent/JPS55500884A/ja
Publication of JPS6226040B2 publication Critical patent/JPS6226040B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Image Analysis (AREA)

Description

請求の範囲 1 各基準ワードの複数個の発声の各々の特徴を
予測パラメータの形で表わす第1の信号を発声す
る段階と、 該第1信号に応答し、基準ワードの一群の発声
の予測パラメータ特徴を表わす少なくともひとつ
のテンプレート信号を各基準ワードに対して発生
する段階と、 未知の発声の特徴を予測パラメータの形で表わ
す第2の信号を発生する段階と、 各基準ワードのテンプレート信号と該第2信号
とに応答して、該第2信号の予測パラメータ特徴
と1つの基準ワードに対するテンプレート信号の
予測パラメータ特徴との間の距離をそれぞれが表
わす信号の集合を発生する段階と、 全基準ワードの距離信号に応答して、該未知の
発声を最小距離信号を有する基準ワードとして認
識する段階とを含む方法において、 該テンプレート信号発生段階は、基準ワードの
該第1信号に応答し、それぞれが一対の基準ワー
ド第1信号間の距離を表わす信号の集合を発生し
て記憶し、さらに該記憶された基準ワード距離信
号に応答し、基準ワードの該第1信号を特徴信号
集合のクラスタに継続して分割する段階を含み、 各クラスタにおける該第1信号はそのクラスタ
の他の第1信号の所定の距離内にあり、 各クラスタの該第1信号の平均信号が該記憶さ
れた基準ワード距離信号に応答して決められ、 該平均した第1信号を該クラスタのテンプレー
ト信号として用いることを特徴とする未知の発声
を基準ワードの集合の1つとして認識する方法。 2 請求の範囲第1項に記載の方法において、 該分割の段階において基準ワードの特徴信号集
合の対の間の距離信号に対応する信号の集合を発
生してソートし、記憶された距離信号に応動して
基準ワードの特徴信号集合の中心の集合が決定さ
れ中心の集合から所定の距離の中にある特徴信号
集合の第1のグループが判定され、記憶された距
離信号から特徴信号集合の前のグループの中心の
集合を判定することによつて所定の類似度を持つ
クラスタ化されていない特徴信号集合の連続した
グループが形成され前のグループの中心の集合の
所定の距離にある前のグループの特徴信号集合を
次の連続したグループのメンバとして識別し、グ
ループの中心の集合から所定の距離にある形成さ
れたグループのすべての特徴信号集合に応動して
形成されたグループは所定の類似度を有する特徴
信号集合のクラスタとして識別されることを特徴
とする方法。 3 請求の範囲第1項に記載の方法において、 該分割の段階において、特徴信号集合の中心の
集合を判定し基準ワードの距離信号に応動して判
定された中心の信号から所定の距離にある基準ワ
ード信号集合の第1のグループを識別し、記憶さ
れた距離信号から直前のグループの中心の信号を
判定し直前のグループの中心の第1の信号から所
定の距離にある直前のグループの信号を次のグル
ープのメンバであると識別することによつて、所
定の類似度を有する信号のグループを次々に決定
し、直前のグループのすべての信号が直前のグル
ープの中心の信号から所定の距離以内にあること
に応動して直前のグループの特徴信号集合を所定
の類似度を持つ特徴信号のクラスタとして識別す
ることを特徴とする方法。 4 請求の範囲第2項または第3項に記載の方法
において、 テンプレート信号識別段階においてクラスタの
中心の特徴信号集合を特徴信号集合のクラスタの
テンプレート信号として記憶することを特徴とす
る方法。 5 請求の範囲第1項乃至第4項のいずれかに記
載の方法において、 未知の発声の予測パラメータ信号と基準ワード
のテンプレートの予測パラメータ信号との間の距
離を表わす信号を発生する段階において、未知の
発声の終端フレームまでのフレームの数を決定
し、未知の発生の予測パラメータ信号とテンプレ
ートの予測パラメータ信号の間の終端フレームま
での平均フレーム距離に対応する第1の信号を発
生し、中間フレームから終端フレームまでの未知
の発声の音声エネルギーが未知の発声の全音声信
号エネルギーの所定の部分を占めるように未知の
発声の中間フレームを判定し、未知の発声の予測
パラメータ信号とテンプレートの予測パラメータ
信号の間の中間フレームまでの平均フレーム距離
に対応する第2の信号を発生し、距離を表わす信
号として第1および第2の信号を選択することを
特徴とする方法。 6 請求の範囲第5項に記載の方法において、 距離信号の発生およびソーテイングの段階で
は、J行J列の記憶マトリクスに各基準ワードの
距離信号を記憶し、中心の集合の判定段階ではマ
トリクスの各列の最大距離信号を選択し選択され
た最大の距離信号に応動して選択された最大の距
離信号が判定され、選択された最大の距離信号の
判定された最小の行位置に対応する信号が中心の
集合を識別するために記憶されることを特徴とす
る方法。 7 基準ワードの複数個の発声の各々に応動して
発声の特徴を表わす信号を発生する手段と、各基
準ワードの特徴信号集合に応動して各テンプレー
ト信号が基準ワードの特徴信号集合のグループを
表わす少なくともひとつのテンプレート信号を発
生する手段と、未知の発声に応動して未知の発声
の特徴を表わす信号の集合を発生する手段と、未
知の特徴信号集合と各々の基準ワードのテンプレ
ート信号に応動してそれぞれの未知の特徴信号と
該基準ワードのテンプレート信号の間の類似度を
表わす信号を形成する手段とを含む未知の発声を
基準ワードの集合のひとつとして認識する回路に
おいて、 選択手段130が各基準ワードの類似度信号に
応動して基準ワードの複数個の類似度信号を選択
し、選択手段の出力は各基準ワードについての選
択された類似度信号の平均に対応する信号を形成
するのに適した平均手段135に接続されてお
り、平均手段の出力は未知の発声を最も類似した
基準ワードとして識別するように平均の類似度信
号に応動する識別装置140,145に接続され
ていることを特徴とする未知の発声を基準ワード
のひとつとして認識する回路。 8 請求の範囲第7項に記載の回路において、 テンプレート信号発生手段112はさらに、基
準ワードの特徴信号集合を特徴信号集合のクラス
タに順次に分割する手段222,224,22
5,226,228,230を含み、各クラスタ
の特徴信号集合は所定の類似度を有するようにな
つており、該発生手段112はさらに、各クラス
タ中の特徴信号集合をクラスタ中のすべての特徴
信号集合を表わすテンプレート信号として識別す
る手段600,230,216を含むことを特徴
とする回路。 9 請求の範囲第8項に記載の回路において、 分割手段224,225,226,228,2
30はさらに、各基準ワードの特徴信号集合に応
動して基準ワードの特徴信号集合の対の間の距離
に対応する信号の集合を発生して記憶するように
各基準ワードの特徴信号集合に応動する手段22
2,224,493と、記憶された距離信号に応
動して基準ワードの特徴信号集合の中心を判定し
中心の集合から所定の距離以内にある第1のグル
ープを識別する手段225,226,228,5
05,587と、記憶された距離信号に応動して
特徴信号集合の直前のグループの中心の集合を判
定するように記憶された距離信号に応動する手段
226,230,505を含む所定の類似度を持
つ特徴信号集合の連続したグループをくりかえし
て形成するように動作する手段225,226,
230,232,234,505,600と、前
のグループの中心の集合から所定の距離以内にあ
る前のグループの特徴信号集合を次のグループの
メンバとして識別する手段225,232,23
4,600と、前のグループのすべての特徴信号
集合が前のグループの中心の集合から所定の距離
以内に入つていることに応動して前のグループを
所定の類似度を有する特徴信号集合のクラスタと
して識別する手段とを含む回路。 10 請求の範囲第8項または第9項に記載の回
路において、 該テンプレート信号識別手段はさらに、 クラスタの中心の特徴信号集合を特徴信号集合
の該クラスタのテンプレート信号として識別する
手段216,230,640を含むことを特徴と
する回路。 11 請求の範囲第7項乃至第10項のいずれか
に記載の回路において、各々の特徴信号集合発生
手段は発声を表わす予測パラメータ信号を発生す
る手段を含み、類似度信号発生手段は未知の発声
の予測パラメータ信号と各々の基準ワードのテン
プレート信号の予測パラメータ信号の両者に応動
して未知の発声の予測パラメータ信号と基準ワー
ドの予測パラメータ信号の間の距離を表わす信号
を発生する手段を含む回路において、 選択手段130はさらに、各基準ワードについ
て複数個の最小の距離信号を選択する手段182
5を含み、平均手段135は各基準ワードについ
て選択された距離信号の平均を表わす信号を形成
する手段1830,1833,1836を含み、
識別手段140,145はすべての基準ワードに
ついて形成された平均距離信号に応動して最小の
平均距離信号を持つ基準ワードとして未知の発声
を識別する手段1839,1891を含むことを
特徴とする回路。 12 請求の範囲第10項または第11項に記載
の回路において、 未知の発声の予測パラメータ信号とテンプレー
トの予測パラメータ信号の間の距離を表わす信号
を発生する手段は、未知の発声に応動して未知の
発声の終端フレームまでのフレームの数を判定す
る手段205と、中間フレームから終端フレーム
までの間の未知の発声の音声信号が未知の発声の
音声信号の全エネルギーの所定の部分を占めるよ
うな未知の発声の中間フレームを判定するために
未知の発声の予測パラメータ信号とテンプレート
の予測パラメータ信号との間の終端フレームまで
の平均フレーム距離に対応する第1の信号を発生
し、中間フレームまでの未知の発声の予測パラメ
ータ信号とテンプレートの予測パラメータ信号と
の間の平均フレーム距離に対応する第2の信号を
発生するのに適した手段880,1806と、第
1の信号および第2の信号に応動して距離を表わ
す信号として第1の信号及び第2の信号の内の最
小のものを選択する手段1817,1820とを
含むことを特徴とする回路。 13 請求の範囲第12項に記載の回路であつ
て、距離信号発生および記憶手段は各基準ワード
の距離信号をJ行J列の記憶マトリクスに記憶す
る手段を含む回路において、 中心集合判定手段はマトリクスの各列の距離信
号に応動して列の最大の距離信号を選択する手段
(702―1乃至702―J)と、選択された最
大の距離信号に応動して選択された最大の距離信
号の内から最小のものを判定する手段720と、
中心の集合を識別するために選択された最大の距
離信号から判定された最小のものの行位置を記憶
する手段228,230とを含むことを特徴とす
る回路。 14 請求の範囲第11項乃至第13項のいずれ
かに記載の回路において、 各基準ワードについて最小の距離信号を選択す
る手段1825はさらに、距離信号発生手段18
03,1806,1817,1820から基準ワ
ードの距離信号を受信する手段と、大きい方から
小さい方への順序で最小値距離信号の集合を記憶
する手段2002,2012,2022,203
2と、距離信号記憶手段2002,2012,2
022,2032に記憶された距離信号の各々と
受信手段からの距離信号を比較する手段200
4,2014,2024,2034と、各々の比
較手段(例えば、2024)の動作に応動して、
もし受信した距離信号が距離信号記憶手段(例え
ば、2022)中の距離信号より大で、次のより
小さい順序の距離信号記憶手段(例えば、201
2)中の距離信号より小であれば、距離信号記憶
手段(例えば、2022)中の距離信号を受信し
た距離信号で置き換え、もし該受信した距離信号
が距離信号記憶手段(例えば、2022)中の距
離信号より大であれば距離信号記憶手段(例え
ば、2022)中の距離信号を保持し、もし受信
した距離信号が次に小さい順序の距離信号記憶手
段(例えば、2012)および距離信号記憶手段
(例えば、2022)の両方の距離記憶より小で
あれば、次に小さい順序の距離信号記憶手段(例
えば、2012)中の距離信号を距離信号記憶手
段(例えば、2022)に転送するように動作す
る手段(例えば、2020,2026,202
8)とを含むことを特徴とする回路。 15 請求の範囲第11項に記載の回路におい
て、 未知の発声を識別する識別装置140,145
はさらに、各基準ワードの距離表示信号に応動し
て複数個の基準ワードの距離表示信号を選択する
手段130と、基準ワードの選択された距離信号
の平均に対応する信号を形成する手段135と、
すべての基準ワードについての平均選択された距
離を表わす信号に応動して最小の平均距離表示信
号を持つ基準ワードとして未知の発声を認識する
手段140,145とを含むことを特徴とする回
路。 明細書 本発明は音声認識方式、特に複数個の基準ワー
ドの発声を認識する装置に関する。多くの処理、
制御および通信システムにおいては、情報、デー
タおよびコマンドの入力として音声信号を使用す
るのが有利である。音声入力はトランザクシヨン
のデータを記録したり、デイジタル符号化装置が
容易に利用できない場合に電話接続を通して電話
番号情報を要求したりするのに使用することがで
きる。直接音声入力は機械工具の動作を制御した
り、他の動作を中断することなく、オペレータが
音声によつてデータ処理あるいは制御装置と対話
するのに使用される。音声による発声からデータ
あるいはコマンド信号を得るには、処理装置によ
つて発声を特定のワードあるいは語句として認識
しなければならない。しかし、音声信号の複雑さ
および冗長性、話者による音声信号のかなりの相
違、ならびに特定の話者でさえばらつきがあるこ
との故に、音声信号を正確に認識することは困難
である。 多くの音声認識システムにおいては、入力の音
声を分析して、その発声の特徴信号特性の集合を
得る。このような特徴信号は音声のスペクトル分
析、あるいは直線予測分析によつて誘導できる。
はじめ認識装置はすでにわかつている基準ワード
の入力発声を使用して訓練される。それぞれの既
知のワードの入力発声を分析して基準特徴信号の
集合が生じ、この信号が蓄積される。システムに
よつて認識されるべきすべての基準ワードの特徴
信号の集合を記憶した後で、未知の発声を分析し
て、未知の発声を表わす特徴信号の集合が得られ
る。これらの未知の特徴信号は記憶された基準ワ
ードの特徴信号と比較されて、この間の対応の度
合が判定される。この比較が完了した後で、その
特徴信号が未知の発声の特徴信号に最も密接に対
応する基準ワードとして未知の発声が識別され
る。 同一の話者から基準特徴信号と未知の特徴信号
が得られたときには、未知の発声の識別はかなり
の精度で行なわれる。このような話者に依存した
認識装置は発声の期間の変化を補償する装置を含
み、音声のパターンの変動を補償するのに適した
認識条件を利用している。しかし、基準の発声と
未知の発声が異なる話者から得られるときには、
話者の変化によつてその認識は本質的に不正確な
ものになる。 話者に依存するワード認識システムにおいて、
認識されるべき発声が任意の話者によつて与えら
れるときには、1978年5月30日発行のL.R.
RabinerおよびM.Samburの米国特許第4092493号
に明らかにされているように基準特徴信号は複数
の話者から得られた特徴信号を平均化することに
よつて得られる。この平均特徴信号の集合は記憶
されて、未知の発声の後の認識のための基準テン
プレートとして使用される。個々の基準特徴信号
は平均化のときに使用されるが、大幅に異なる値
を持つこともある。従つて、それから得られた平
均化された基準テンプレートは数人以上の話者を
表わすことはないかもしれない。例えば、成人男
子のクラス、女性および少年の話者のクラスの両
方から作られた平均特徴信号の集合はどのクラス
も表わさない可能性がある。従つて平均基準テン
プレートを利用できるようにするには、Bruce J.
Lowerreによる1977 IEEE International
Conference on Acoustics,Speech,and Siqnal
Processinq Record 第788〜790頁の“Dynamic
Speaker Adaptation in the Harpy Speech
Recoqnition System”に述べられているように
新しい話者を考えるたびに平均がそれを表わして
いるかを認識して平均がそれを表わすように特性
に手動調整を行なうことが必要となる。 IEEE Proceedings of Southeast Conference
19770n Imaginative Enqineerinq Through
Education and Experiences,1977年第419〜422
頁にあるG.H.Thaker およびJ.N.Gowdyの
“Comparison of Fast Fourier and Fast Walsh
Transform Methods in Speech Recognition
Systems”と題する論文に示されているように、
これ以外の音声認識方法としては、各々の基準特
徴の集合を直接に未知の発声の認識のためのテン
プレートとして利用しており、これによつて広範
囲の基準特徴集合の平均化に起因する不正確さを
避けている。しかしこのような装置は多数の比較
が必要となり、装置が基準ワードの発声の間の類
似性を無視しているため、比較的能率の悪いもの
となる。 多くのパターン認識システムにおいては特徴ベ
クトルの集合を分割するクラスタリングの装置が
利用されている。例えば、1976年6月4日発行の
Ping Chien Chuangの米国特許第4028670号では
個人の先に確認されたサインを表わす正規化ベク
トルを比較する自動サイン認識システムが明らか
にされている。予め定められた類似度を持つベク
トルはクラスタとしてまとめられ、クラスタのベ
クトルの成分を平均化することによつてクラスタ
毎に原型ベクトルが発生する。原型ベクトルとま
だ確認していないサインから得られたベクトルの
間の差を解析してまだ確認していないサインを確
認する。認識のために必要となる特徴の数が比較
的少ない場合にはクラスタリング手法をパターン
認識において使つて成功している。しかし音声認
識システムにおいては、単一のワードの発声の場
合においてすら、特徴の数は非常に多数で多数の
特徴の直接のクラスタ化には極めて膨大なデータ
処理を必要とする。 各基準ワードとして多数のテンプレートを使用
する話者独立のワード認識装置においては、異な
るワードのテンプレートがかなりの重複した類似
性を持ち、未知の発声の特徴をテンプレートに対
して独立に比較すると未知の発声の認識があいま
いになることがある。上述したThaker他の論文
では、テンプレートは未知の発生の対応する特徴
と順次に比較され未知の発声とテンプレートの間
の類似性を表わす距離信号が形成される。k番目
に小さい距離信号が最も良く生ずる基準ワードと
して認識を行なう。テンプレートは大幅に変化
し、また異なる基準ワードのテンプレートが重な
りあつているから、Thaker他のk番目に近いラ
ンプレートの方式では多数のテンプレートの重な
り合いに起因する認識のあいまいさを除去するこ
とはできない。 発明の概要 本発明は特徴信号の集合の各基準ワードの複数
個の発声の各々について発生するような未知の発
声を基準ワードの集合のひとつとして認識するた
めの音声分析器に関するものである。各基準ワー
ドの特徴信号の集合に応動して、基準ワードに対
して少くともひとつのテンプレート信号が発生す
る。各テンプレート信号は基準ワードの特徴信号
の集合のグループを表わしている。未知の発声の
特徴を表わす信号の集合も発生する。未知の発声
の特徴信号の集合と各基準ワードのテンプレート
信号の両方に応動して、それぞれ未知の発声の信
号の集合とテンプレート信号の間の類似度を表わ
す信号の集合が形成される。各基準ワードについ
て複数個の類似度信号が選択され、この基準ワー
ドで選択された類似度信号の平均に対応する信号
が発生する。すべての基準ワードに対する平均類
似度信号に応動して、未知の発声は最も類似した
基準ワードとして認識される。本発明によれば、
各基準ワードに対する類似度信号の選択と各基準
ワードについて選択された類似度信号の平均化に
よつて、テンプレート信号の変動と重なり合いに
起因する認識のあいまいさが大幅に減少する。 本発明のひとつの特徴によれば、テンプレート
信号の発生は各基準ワードの基準ワード特徴信号
を所定の類似度を持つ集合のクラスタに分割し、
各クラスタの特徴信号の集合を該クラスタ中のす
べての特徴信号の集合を表わすテンプレート信号
として識別することを含んでいる。 本発明の他の特徴によれば、発声の特徴信号の
集合は発声の連続時間フレームの線形予測パラメ
ータを含んでいる。未知の発声の線形予測パラメ
ータと各テンプレートの線形予測パラメータの間
の距離を表わす信号が発生する。 各基準ワードについて、複数個の最小距離信号
を選択し、選択された距離信号の平均に対応する
信号が形成される。未知の発声は最小の平均距離
信号を持つ基準ワードとして識別される。 本発明の他の特徴によれば、基準ワードの特徴
信号集合の分割は基準ワード特徴信号集合のすべ
ての対の間の距離を表わす信号の発生と蓄積を含
んでいる。記憶された距離信号に応動して基準ワ
ード特徴信号集合の中心が決定され、中心の集合
から所定の距離以内にある特徴信号が第1のグル
ープとして識別される。特徴信号集合の連続した
グループは先のグループ識別された特徴信号の中
心をくりかえして判定し、次のグループに対して
決定された中心の集合から所定の距離以内にある
特徴信号集合だけを識別することによつて該第1
のグループから形成される。今判定された中心の
集合から該所定の距離の外にある先に識別された
特徴信号集合は外部特徴信号集合として再分類さ
れる。今判定された中央の集合から所定の距離の
中にある先に識別されたすべての特徴信号集合に
応動して、先に識別された特徴信号集合は所定の
類似度を持つクラスタとして識別される。クラス
タの中心の特徴信号集合はクラスタのテンプレー
ト信号として記憶される。 変声の終りで生ずる呼吸のような外部音あるい
は雑音は音声認識のひとつの困難を生ずる原因と
なる。この外部音は発声の終りの部分の特徴信号
を大幅に変化させてしまい、このため特徴信号距
離の比較による発声識別の精度が低下する。本発
明のさらに他の特徴によれば、未知の発声の特徴
信号と基準ワードテンプレートの間の距離を表わ
す信号の発生は発声の終端フレームの検出と発声
の中間フレームの判定を伴う。中間フレームから
該終端フレームへの発声音声信号エネルギーは発
声の全音声信号エネルギーのうちの所定の部分で
ある。第1の信号は終端フレームが形成されるま
での未知の発声特徴信号と基準テンプレートの間
の平均フレーム距離に対応し、第2の信号は中間
フレームまでの未知の発声特徴信号と基準テンプ
レートの間の平均フレーム距離に対応する。第1
および第2の平均フレーム距離信号の最小のもの
は未知の発声を基準テンプレートの間の類似度を
表わす距離表示信号として選択される。
【図面の簡単な説明】
第1図は本発明を図示する音声分析器の全体ブ
ロツク図;第2図および第3図は第1図の基準ワ
ードテンプレート発生装置の詳細なブロツク図;
第4図、第5図および第6図は第2図の訓練モー
ド制御器の詳細なブロツク図;第7図は第2図の
クラスタ中心セレクタの詳細なブロツク図;第8
図は本発明を説明する音声分析器に有用なマイク
ロプロセツサのブロツク図;第9図は第2図およ
び第3図の訓練モードプロセスのフロー図;第1
0図乃至第17図は第2図および第3図のブロツ
ク図の動作を説明するのに有用な波形図;第18
図は第1図の認識装置の詳細なブロツク図;第1
9図は第18図の認識制御器の詳細なブロツク
図;第20図は第18図のソータ兼ストアブロツ
クの詳細なブロツク図;第21図は第18図で実
行される認識モードプロセスのフロー図;第22
図および23図は第18図のブロツク図の動作を
説明するのに有用な波形である。
【発明の詳細な説明】
本発明を図示する音声分析器の一般的ブロツク
図を第1図に示す。第1図の回路はまず各基準ワ
ードのテンプレートを形成するために訓練モード
で動作する。このテンプレートはシステムの各基
準ワードの音響的特徴に対応する。各テンプレー
トは基準ワードの複数個の発声について得られた
類似した特徴信号のクラスタを表わす特徴信号の
シーケンスを含む。訓練モードは第9図のフロー
チヤートで示されている。 訓練モードでは、第1図の訓練制御器118が
モードセレクタ119に与えられる訓練信号TR
に応動して起動される。訓練制御器118がオン
になつてから、話者は電話の送話器101のマイ
クロフオンに向つて一時にひとつづつ示された基
準ワードを発声し、マイクロフオンからの通話信
号は音声信号デイジタイザ103に与えられる。
デイジタイザ103は音声信号から望ましくない
周波数成分(例えば3kHz以上の周波数成分)を
除くために音声信号を低域波する。次に低域
波された信号は例えば6.67kHzの周波数で連続的
にサンプルされ、各々の音声信号サンプルについ
てデイジタル符号が形成される。 デイジタイザ103からの連続したデイジタル
符号は特徴信号発生器105に与えられ、これは
符号化された音声サンプルの30ミリ秒のフレーム
毎に線形予測パラメータの集合を発生する。線型
予測パラメータは当業者には周知であるように、
音声信号のフレーム・セグメントの特徴を表わす
ものである。予測パラメータa1,a2、……、ap
は次式に従う。 ここでpは予測器の順序であり;soはフレー
ムのn番目の音声サンプルの予測値;sokは符
号化された音声サンプル;akはk番目の予測パ
ラメータ信号である。 特徴信号発生器105の出力からの予測パラメ
ータ信号は訓練制御器118の制御によつて特徴
信号ストアに転送され記憶される。基準ワードの
発声が終了すると、発声の予測パラメータ特徴信
号の系列は制御器118から基準ワード符号によ
つて指定されたストア110のセクシヨンに記憶
される。話者が既知の基準ワードを完全に発声し
たときに、それに対応する特徴集合はストア11
0の中にあり、別の話者についての新らしい訓練
モードが設定されることになる。第9図のブロツ
ク901で示されるように、同一のあるいは異な
る話者についての未知の発声を認識する準備とし
て、複数個の話者についての各基準ワードについ
ての特徴信号集合が得られる。 異なる話者についての所定の数の特徴信号集合
が得られた後で、訓練制御器118は特徴信号ク
ラスタラ112とテンプレート・ストア116を
動作し、ストア110の中の各基準ワード(j=
1、2、…、J、w=1、2、…、W)について
のJ個の特徴信号集合X1w、X2w、…、XJwは同
様の特徴信号集合のグループに分割される。テン
プレートの集合Tkwが各グループについて選択さ
れ、このテンプレートがグループ内のすべての特
徴信号集合を表わすことになる。選択されたテン
プレートTkwはテンプレート・ストア116に記
憶されて、これに続く認識モードで未知の発声の
認識のために用いられる。 特徴信号クラスタラ112は周知の動的時間ワ
ープ法によつて基準ワードwについての特徴信号
集合の各対(例えば、Xiw、Xjwただしi=1、
2、…J、j=1、2、…J)の間の距離を 決定するのに適している。ここでNはワードの特
徴信号集合Xiwのフレームの数、v(n)はXiw
のフレーム数nをXjwのフレーム数v(n)を最
適に関連付けるワーピング路、d(Xiw(n)、
jwv(n))はXiwのn番目のフレームとXjw
v(n)番目のフレームの間の距離であり、F.
ItakuraのIEEE Transactions on Acoustics,
Speech and Signal Processing,ASSP―23巻第
67〜72頁(1975年2月)の“Minimum
Prediction Residual Principle Applied to
Speech Recognition”と題する論文で述べられ
たものである。 基準ワードの距離信号の集合はクラスタラ11
2のマトリクス・ストアに入れられる。第9図の
ブロツク903で示された計算と記憶のプロセス
は特徴信号ストア110からの予測パラメータ信
号とフレーム信号Nに応動して実行される。記憶
された距離信号に応動して基準ワード信号集合X
1w、X2w、…、XJwの内の中央のものXiwが、
行列の各列jの最大距離信号を選択することによ
つて第9図の動作ブロツク905に示されるよう
に決定される。中央の集合Xiwは最大列距離信
号の内の最小のものに対応する。従つてi〓は であるような集合Xiwのインデクスである。こ
こでiは行列ストアの行のインデクス、jは行列
ストアの列のインデクスである。次にj=1、
2、…、Jである各々の特徴信号集合Xjwと中央
の集合Xiwの距離を所定のスレシヨルド距離T
と比較することによつて特徴信号集合の第1の仮
のクラスタX1w(1)、X2w(1)、…、Xnw(1)が選択さ
れる。所定のスレシヨルド距離Tの中のすべての
特徴信号集合は第9図の動作ブロツク907で示
されるように第1の仮グループのメンバであると
見なされる。しかし基準ワード特徴信号の中央の
集合Xiwは第1の仮グループX1w(1)、X2w(1)、
…、Xnw(1)の中央の集合Xn〓w(1)でないことが
あることは明らかである。次にグループX1w(1)、
2w(1)、…、Xnw(1)の中央の集合Xnwであるような集合Xnwのインデクスm〓から
決定される。この操作は第9図の動作ブロツク9
09によつて示される。中央の集合Xnwの所
定のスレシヨルド距離以内にある仮グループX1w
(1)、X2w(1)、…、Xnw(1)の特徴信号集合は第9図
のブロツク911で示されるように第2の仮グル
ープX1w(2)、X2w(2)、…、Xnw(2)のメンバとな
る。このグループ化はブロツク909,911,
913,915で示すように継続され、最後にグ
ループX1w (p)、X2w (p)、…、Xnw (p)が次のグ
ループX1 (p+1)、X2w (p+2)、…、Xnw (p+1)と同
一となり(判定ブロツク913)、このときグル
ープX1w (p)、X2w (p)、…、Xnw (p)のメンバは
永久にクラスタのメンバであるとされ、このクラ
スタの中央の特徴信号集合Xnw (p)は特徴信号
ストア110からテンプレート・ストア116に
転送され、テンプレート信号集合T1wは今決定さ
れたクラスタを表わすものとなる。これが第9図
のブロツク917で示されている。仮グループを
所定の回数L回形成してもグループ化によつてあ
るクラスタへの収束が行なわれなければ(ブロツ
ク915で判定)、L番目のグループを最終クラ
スタとして受け入れ、その中央のメンバXnw
(1)はそれを表わすテンプレートT1wとして記憶さ
れる(ブロツク917)。 ストア116中の第1のテンプレート信号集合
を記憶した後で、上述のクラスタ形成の操作は残
りのグループ化されていない特徴信号集合、すな
わち先に形成されたクラスタとして識別されてい
ない特徴信号集合について、くりかえされる。ク
ラスタが形成されるたびに、その中央の集合はス
トア116内のテンプレートTkw、k=1、2、
…Kとして記憶される。このようにして各テンプ
レートはそのクラスタの中のすべての特徴信号を
代表する特徴信号集合となる。有利なことに、各
クラスタ中の固定数の集合を必要とすることもな
く、距離信号を平均化する必要もなく、予測パラ
メータ距離信号によつて決定される所定の類似度
を持つすべての集合を含むことになる。 すべての基準ワードw=1、2、…、Wについ
てのテンプレートTkwが選択され、テンプレー
ト・ストア116に記憶された後で(判定ブロツ
ク921)、認識モードが付勢される(ブロツク
923)。次にモードセレクタ119は外部で発
生されたRE信号に応動して認識制御器150を
付勢する。認識モードにおいては、話者からの未
知の発声Uが電話の送話器101のマイクロフオ
ンに与えられる。送話器のマイクロフオンからの
音声信号は音声信号デイジタイザ103に与えら
れ、これは前述のように、連続したフレームで音
声信号のデイジタル符号化されたサンプルを特徴
発生器105に与えるよう動作する。発生器10
5の各フレームについて発生した予測パラメータ
信号は認識制御器150の制御によつて順次特徴
信号レジスタ120に与えられる。特徴信号集合
の形成は認識プロセスを図示するフローチヤート
である第21図の動作ブロツク2101で示され
ている。 発声が終了すると、距離プロセツサ122はス
トア116からテンプレート信号集合Tkwの連続
とレジスタ120からの未知の特徴信号Tuを受
信する。プロセツサ122はTkw信号とTu信号
とに応動して、各テンプレートTkwと未知の発声
の特徴信号Tuの間の類似度を表わす距離信号D
(Tkw、Tu)を発生する。距離信号の発生は第2
1図の動作ブロツク2103によつて示されてい
る。 未知の発声はその終端部に外部雑音を含む可能
性があるから、プロセツサ122は各特徴信号の
比較について1対の距離信号を与える。一方の距
離信号DT/NTは発声の終端フレームに到るまで
のTkwとTuの間の平均フレーム距離に対応し、
他方の距離信号DI/NIは選択された中間フレー
ムの特徴信号集合TkwとTuの間の平均フレーム
距離に対応する。中間フレームNIは中間フレー
ムNIから終端フレームNTへの未知の発声の音声
信号が未知の発声の全音声エネルギーの所定の部
分となるように選定される。このようにして、フ
レームNIの後で生ずる外部雑音は除去される。
両方の距離信号DT/NTとDI/NIは最小距離セ
レクタ125に与えられ、この中で二つの信号の
内の小さい方が各基準ワードについて選択され
る。この最小距離信号は認識の目的のためのより
良い選択となる。この最小距離信号の選択は第2
1図の動作ブロツク2105で示されている。 基準ワードの各テンプレートについて選択され
た距離信号はソータ兼ストア回路130に与えら
れ、ここで各々の選択されたテンプレート距離信
号は先に発生した選択された基準ワードのテンプ
レート距離信号と比較される。ソータ兼ストア回
路130はq個の最小の値を持つ距離信号を記憶
するように動作する。残りのk―q個の距離信号
は捨てられる。ソータ兼ストアの動作は第21図
の動作ブロツク2107で示されている。最小距
離セレクタからの各基準ワードについてのq個の
最小距離信号の平均値は選択された距離信号の平
均回路135(動作ブロツク2111)で形成さ
れ、結果として得られた平均距離信号と対応する
基準ワード符号はソータ兼ストア140に入れら
れる(動作ブロツク2113)。ソータ兼ストア
140は受信した平均距離信号をソートして最小
平均距離信号をそれに対応する基準ワード・コー
ドと共に記憶する。 すべての基準ワードに対する選択された距離信
号の平均が発生され、ストア240に最小集合が
記憶された後で、判定ブロツク2115は動作ブ
ロツク2117に制御を移し、ワード・セレクタ
145はソータ兼ストア140から最小の平均さ
れた距離信号を選択するように動作する。次に最
小の平均された距離信号に対応する基準ワードの
コードがセレクタ145によつて発生し、動作ブ
ロツク2119で示されるようにプロセツサ15
5に転送される。未知の発声の認識モードはこう
して終了する。この代りにワード・セレクタ14
5は最小の平均距離信号の値を持つ所定の集合を
選択して、これらの平均された距離信号に対応す
る基準ワードのコードを発生してプロセツサ15
5に送り、ここで当業者には周知のシンタツクス
的あるいはセマンテイツクス的な分析を行なつて
もよい。 第2図および第3図は第1図に述べた訓練モー
ドのテンプレート発生装置の詳細なブロツク図で
ある。第2図および第3図の回路はまず第4図の
論理回路491の制御によつて一連の話者からす
べての基準ワードの既知の発声を受けるように動
作する。話者が電話の送話器201の所に行つた
とき、手動で発生した第10図の波形1001で
示すSTパルスが訓練モード制御器218に与え
られる。第4図の論理回路491のパルス発生器
401はST信号の後縁でトリガされ、時刻t0
おいて第10図の波形1003で示す短い時間幅
の正のS1制御パルスを発生する。S1制御パルスは
ORゲート360を通してワードカウンタ340
のクリア入力と、ORゲート363を通して再印
加カウンタ343のクリア入力に与えられ、これ
によつて、これらのカウンタの各々はその最初の
状態にリセツトされる。S1パルスはまたORゲー
ト367を通してセレクタ346の制御入力と
ORゲート380を通してセレクタ332の制御
入力に与えられる。S1パルスに応動して、セレク
タ346は再印加カウンタ343の出力からのj
信号をセレクタの出力のJAアドレス線に接続す
るようにスイツチされる。セレクタ346はそれ
に他の制御パルスが与えられるまでそのj接続状
態に留る。セレクタ332はS1制御パルスに応動
してその入力に与えられた零コードφ信号をクラ
スタ識別ストア334の入力に接続する。セレク
タ332はそれに他の制御パルスが与えられるま
でそのφ接続状態に留る。 ワードカウンタ340からのワード・コードw
としてセレクタ346からの符号化されたアドレ
ス信号JA(j)は特徴ストア210に与えられ
て、特徴信号発生器205からの線形予測係数
(LPC)の特徴信号の記憶のアドレスを与える。
このとき、第1の話者の第1の基準ワードの発声
が電話の送話器201のマイクロフオンで受信さ
れる。第4図の論理回路491のフリツプフロツ
プ405はORゲート403を通してそれに与え
られたS1パルスでセツトされて、フリツプフロツ
プ405のRWI出力は正となる。(時刻t1におけ
る波形1005)。正のRWIパルスは第2図の低
域フイルタ兼サンプラ203、アナログ・デイジ
タル変換器204、特徴信号発生器205および
終端検出器206を付勢する。送話器201のマ
イクロフオンに向つている話者は表示回路273
からの視覚あるいは聴覚による信号を受信し、こ
れに応動して話者は第1のワード(w=1)を発
声する。マイクロフオンからの音声信号は低域フ
イルタ兼サンプラ203に与えられ、ここで3k
Hzを越える周波数成分は除去される。低域波さ
れた信号はクロツク270からのクロツク信号
CL1によつて決定される6.67kHzでサンプルさ
れ、連続した音声信号サンプルがA/D変換器2
04に与えられる。A/D変換器204中で、サ
ンプルはサンプル振幅を表わす適切なデイジタル
符号に変換される。 A/D変換器204からのデイジタル符号は特
徴信号発生器205と終端検出器206の入力に
与えられる。終端検出器は音声信号サンプルのエ
ネルギー内容から発声の終端を判定するものであ
り、米国特許第3909532号に示されたもので良
い。発声の終り(第10図の時刻t2)で高レベル
のUC信号(波形1007)が終端検出器206
の出力から得られる。 LPC特徴信号発生器205において、発声サン
プルsoはブロツクすなわち符号化信号S1乃至
S300個のフレームとして記憶される。他のフレー
ム構成も使用できることも了解されるであろう。
サンプルされた音声信号の線形予測分析は次式に
従つて行なわれる。 ここでn=1、2、…、300であり、pは予測
分析モデルの極の数である。線形予測分析はB.S.
Atal,S.L.HanauerのJournal of Acoustic
Society of America第50巻第637〜655頁(1971
年)の“Speech Analysis and Synthesis by
Linear Prediction of the Speech Wave”と題
する論文に述べられた当業者には周知の全極線形
予測フイルタモデルに従つて行なわれる。音声認
識の目的では、8極のフイルタモデルが適切であ
ることがわかつている。しかしながら、これとは
異なる数の極を有するフイルタモデルを使つて良
いことを了解されたい。 線形予測係数a(i)は式(5)の表現に従うサンプル
音声信号soの係数である。8極フイルタモデル
では式(6)および(7)に従う線形予測分析の自己相関
法によつて300サンプルの各フレームでLPC発生
器205によつて係数a(1)乃至a(8)が発生され
る。 ここでNは各フレーム(N=300)のサンプル
の数であり、p=8である。当業者には周知なよ
うに、式(5)の線形予測係数a(i)は式(6)および(7)に
従う平均二乗予測誤差を最小化するように選択さ
れている。式(6)で示されるように、これはサンプ
ル信号so乃至so+Nのブロツクの自己相関分析
によつて実行される。この結果得られる線形予測
係数a(1)乃至a(8)はN個の音声サンプルの各フレ
ームについて得られる。 特徴信号発生器205は米国特許第3631520号
に述べられた予測パラメータ計算機で良い。この
計算装置は当業者には周知の共分散法に従つて線
形予測パラメータを発生する。この代りに、
John D.MarkelのSpeech Communications
Research Laboratory,Inc.,Monograph第7巻
(1971年10月)の“Formant Trajectory
Estimation From a Linear Least Squared
Inverse Filter Formulation”の付録Aのフオー
トラン言語プログラムを実現できるPDP11もしく
はNova800あるいは望ましくはData General
Micro Nova Computer,Intel8080マイクロプロ
セツサあるいはMotorola6800マイクロプロセツサ
のような任意のコンピユータを使用することがで
きる。このフオートランのプログラムは当業者に
は周知の自己相関法によつている。各フレームの
長さは30ミリ秒で、各フレームの係数a(1)乃至a
(8)は対応するサンプルso乃至so+300のフレー
ムの終りで発生器205に一時的に記憶される。
共分散法あるいは自己相関法のいずれかによつて
誘導された各フレームの係数信号a(1)乃至a(8)を
第2図および第3図で使用してもよい。 第8図は第2図のLPC信号発生器205として
使用できる当業者には周知のマイクロプロセツサ
のブロツク図を示している。第8図においてはマ
イクロプロセツサ880の制御信号は当業者には
周知のマイクロプロセツサのフオートラン・コン
パイラによつて前述のMarkelの論文の付録Aの
フオートランプログラムリストを実行するために
形成されたリードオンリーメモリ(ROM)を含
む蓄積プログラム制御装置809によつて与えら
れる。マイクロプロセツサ880のランダムアク
セス・メモリ(RAM)807はダイレクト・メ
モリ・アクセス805およびインタフエース・ア
ダプタ801からデータバス824を通してデー
タ情報を受信し、またアドレスバス822を通し
てダイレクト・メモリ・アクセス805およびプ
ロセツサ・ユニツト803からアドレス情報を受
信する。蓄積プログラム制御装置809中に固定
記憶されたプログラムに従つてプロセツサ・ユニ
ツト803は計算を行なう。マイクロプロセツサ
880の制御はダイレクト・メモリ・アクセス8
05、RAM807、蓄積プログラム制御ROM8
09およびインタフエース・アダプタ801に接
続された制御バス820を経由してプロセツサユ
ニツト803によつて実行される。 インタフエース・アダプタ801はRAM80
7およびプロセツサユニツト803で使用する入
力制御情報およびデータを入力線840および8
42から受信し、RAM807およびプロセツサ
ユニツト803からの出力制御データを出力線8
50および852に送信する。マイクロプロセツ
サとその部品については“Technical Reference
Micronove Computer Systems―014―000073―
00”、“User’s Manual Progranmer’s
Reference Micronova Computers015―000050―
00”および“Techuical Reference Micronova
Integrated Circuits014―000074―00”に述べら
れており、これらはすべて1975年Data General
Corporation刊のものである。あるいは1975年
Motorola Semiconductor Products,Inc.の版権
になるMcGraw Hill Book Company刊の
Motorola Inc.による“Microprocessor
Applications Manual”にも述べられている。 LPC発生器205として使用されるマイクロプ
ロセツサ880においては、順次の音声サンプル
符号Soが変換器204から第8図の線840に
与えられ、インタフエース・アダプタに挿入され
る。フリツプフロツプ405からの信号RWIは
線842を通してインタフエース・アダプタ80
1に供給されており、これによつて発声の間第8
図のマイクロプロセツサによつてLPC信号が発生
される。発声の終りで、終端検出器206からの
信号UCがフリツプフロツプ405をリセツトし
て、サンプラ回路203およびA/D変換器20
4を消勢する。信号UCはまた第4図の論理49
1中のバルス発生器407に与えられ、これは時
刻t3で波形1009に示すS2制御パルスを発生す
る。時刻t3におけるS2制御パルスに応動して、ワ
ードX11のLPC特徴信号集合はワードカウンタ3
40からのw=1信号を再印加カウンタ343か
ら生ずるj=1のJAアドレス信号のアドレスに
よつて、発生器205から特徴信号ストア210
のセクシヨンに転送される。第8図のマイクロプ
ロセツサ880によつて発生されるLPC信号は線
850を通してインタフエース・アダプタ801
から第2図の特徴信号ストア210に与えられ
る。 特徴信号発生器205はまたLPC特徴信号が発
生されるに従つて発声中の音声信号フレームの数
を計数するように動作する。発声の終りで、フレ
ームの総数に対応する信号NTは発生器205か
らNFストア211に転送され、ここでカウンタ
340から与えられるワードカウンタ信号wとセ
レクタ346からのJA信号として与えられる再
印加カウンタ信号jのアドレスによつてフレーム
の全数が記憶される。クラスタ識別ストア334
は特徴集合が割当てられたクラスタを識別する各
特徴信号集合のPNコードを記憶する。PNコード
はφ、―1あるいはkである。φコードは特徴集
合がグループされていないことを示す。kコード
は割当ての後の特徴集合のクラスタ数に対応す
る。―1コードはクラスタリング装置で使用され
る一時的なコードである。各々の特徴信号集合が
ストア210に転送されたときに、φコードがク
ラスタ識別ストア334にwおよびJA信号のア
ドレスによつて挿入される。 パルス発生器409はS2パルスの後縁に応動し
て、時刻t4で波形1011のS3制御パルスを発生
する。次にS3制御パルスはORゲート361を経
由してワードカウンタ340の増分入力に与えら
れる。これによつてワードカウンタ340は次の
状態に増分される。カウンタ340からのw=2
信号は比較器341の一方の入力に与えられ、こ
れはここで定数信号W+1と比較される。Wはシ
ステム中の基準ワードの総数に対応する。比較器
341はw>W+1のときに高レベルのW1信号
(波形1015)を発生し、wW+1のときに
高レベルのW2信号(波形1017)を発生す
る。W1信号は第4図のゲート413に与えら
れ、一方W2信号はゲート414に与えられる。 パルス発生器411は時刻t5においてS3制御パ
ルスの後縁に応動して短い時間幅の出力(波形1
013)を与える。パルス発生器411の出力は
ANDゲート413の一方の入力とANDゲート4
14の一方の入力に与えられる。時刻t5におい
て、wはW+1以下であり、これによつてゲート
414が付勢され、そこからのパルスがORゲー
ト403を経由してフリツプフロツプ405をセ
ツトする。フリツプフロツプ405は「1」状態
にセツトされ、信号RWI(波形1005)がt6
おいて付勢状態となる。信号RWIに応動してイ
ンデイケータ273はオンとなつて、話者は第2
のワードを発声する指示信号を受ける。 話者の第1のワードw=1の発声について述べ
たように、LPC特徴信号の集合は発生器205で
発生され、この信号は特徴ストア210に記憶さ
れる。第2のワードの発声のフレームの全数は
NFストア211に入れられる。このようにし
て、各基準ワードw=1、2、…、Wの話者の発
声についての特徴信号集合が得られる。第10図
の時刻t11において、比較器341から高レベル
のW1信号(波形1015)が得られると、話者
はすべての基準ワードの発声を終了したことにな
り、ゲート413から出力が得られる。ゲート4
13からの出力はパルス発生器416をトリガ
し、これは時刻t12においてS4制御パルス(波形
1019)を発生する。 S4制御パルスはワードカウンタ340のクリア
入力に与えられ、従つてこのカウンタはw=1の
状態にリセツトされる。パルスS4はまたORゲー
ト364を経由して再印加カウンタ343の増分
入力に与えられる。再印加カウンタ343は各基
準ワードの発声の数の計数値を保持する。S4パル
スに応動して、表示回路275が動作して、次の
話者を要求する信号を与える。 再印加カウンタ343の出力に接続された比較
器344はカウンタ343の状態(j)を定数J+1
信号と比較するように動作する。Jはシステムに
よつて要求される各基準ワードwの再印加の総数
に対応する。カウンタ343からのj信号が>J
+1であるときに、比較器344からのJ1出力が
付勢され、j信号がJ+1であるときには比較
器344からのJ2信号が付勢する。パルスS4はパ
ルス発生器418をトリガし、これは時刻t13
t14の間で両方のゲート420および421に与
えられる短い正のパルス(波形1021)を発生
する。この時間の間に、信号J2(波形1025)
が付勢され、ANDゲート421は、再トリガフ
リツプフロツプ405にパルスを与える。時刻
t14において新らしいRWI信号(波形1005)
がフリツプフロツプ405から得られて、新らし
い話者に対してw=1の基準ワードを発声するべ
く信号が与えられる。 前述のように、新らしい話者の発声は発生器2
05で特徴信号集合に変換され、この信号集合は
特徴ストア210に記憶される。各発声のフレー
ムの数はNFストア211に記憶され、特徴信号
集合がクラスタ識別ストア334のφコードによ
るグループ化されていない特徴信号となる。各基
準ワードについての所定の数の再印加が得られる
と、パルス発生器418からのパルス(時刻t23
とt24の間の波形)は比較器344からのJ1信号
(波形1023)に応動してゲート420を通
る。パルス発生器423は次に時刻t24でE1信号
(波形1027)を発生し、この信号は訓練モー
ドの入力段階(第9図の動作ブロツク901)が
完了したことを表示する。時刻t4において、各基
準ワードについてのJ個の特徴信号集合はワード
番号w=1、2、…、Wと再印加番号j=1、
2、…、Jのアドレスで特徴ストア210に記憶
されたことになる。 信号E1は訓練モードの距離処理段階を開始す
るのに用いられ、この段階では式(2)に示される距
離信号が基準ワードの特徴信号集合の各対につい
て距離プロセツサ222によつて発生する。この
結果として得られた距離信号D(Xiw、Xjw
(i=1、2、…、J、j=1、2、…、Jでw
は基準ワード)はカウンタ343からのj信号に
よるアドレスによつて距離マトリクスストア22
4に挿入される。j信号はセレクタ346を経由
して与られ、仮インデクス信号iはカウンタ34
8から与えられる。iインデクス信号はマトリク
ス224の行に対応し、jインデクス信号はマト
リクス224の列に対応する。基準ワードwにつ
いて距離信号の記憶の後で、基準ワードwのXjw
信号集合はクラスタ化され、距離プロセツサ22
2が付勢されて次の基準ワードw+1についての
距離信号が発生する。 信号E1に応動して、それぞれ波形1103お
よび1105に示した制御パルスS5およびS6が第
4図の制御論理回路493中のパルス発生器42
7および429の連続したトリガによつて発生さ
れる。パルスS5は第3図のテンプレート・カウン
タ355をk=1の状態にリセツトする。パルス
S6はORゲート369を経由してテンプレート・
インデクスカウンタ348と、ORゲート363
を経由して再印加カウンタ343に与えられ、こ
れによつて、これらのカウンタの各々にその第1
の状態にリセツトされる。第2図および第3図の
回路は、これによつて、第9図の動作ブロツク9
03に示される距離処理段階のために初期化され
る。 次に制御パルスS7、S8およびS9(波形110
7,1109および1111)が第4図の論理4
93のパルス発生器433,435および437
によつて次々に発生される。パルスS6の後縁に応
動してパルスS7が発生する。S7のパルスはセレク
タ346を時刻t3において状態iに移し、この状
態では、カウンタ348からのi信号はセレクタ
のJAアドレス出力に接続される。ここで特徴信
号ストア210の第1のワードX11の第1の特徴
信号がこのときアドレスされる。パルスS7もセレ
クタ266に与えられ、これはセレクタ266の
i入力をその出力に接続するように動作する。制
御パルスS8は時刻t4において特徴ストア210と
レジスタ217に与えられ、これによつて特徴信
号集合X11は特徴ストアからレジスタ217への
信号Pとして転送される。このとき時刻t5のパル
スS9によりセレクタ346はj状態にスイツチさ
れ、従つて再印加カウンタ343の出力はセレク
タ346を経由して距離マトリクス・ストア22
4のj列をアドレスする。カウンタ348からの
j信号はセレクタ266を経由してマトリクス・
ストア224のi行をアドレスする。 論理回路493のパルス発生器437からのS9
パルスはORゲート439を経由してパルス発生
器441に与えられる。パルスS9の後縁に応動し
て、パルス発生器441は制御パルスS10を発生
し(第11図の時刻t6の波形1113)、これが
距離プロセツサ222を付勢する。プロセツサ2
22は例えば、蓄積プログラム制御装置809に
固定記憶された付録Aに示す距離処理プログラム
を持つ第8図のマイクロプロセツサ880で良
い。このときレジスタ217中にある第1の基準
ワードの第1の発声の特徴信号集合X11が線83
0を経由してダイレクト・メモリ・アクセス回路
805に転送される。パルスS10に応動し、特徴
ストア210からの第1の特徴信号集合X11は線
832を経由してダイレクト・メモリ・アクセス
回路805に入れられる。このときマイクロプロ
セツサ880は距離信号D(X11,X11)を発生す
る。 距離信号発生の終りの時刻t7で、終了信号G1
(波形1115)が線850に現われ、第4図の
パルス発生器443の入力に与えられる。信号
G1に応動して、論理回路493のパルス発生器
443,445および447は次々にトリガされ
る。パルス発生器443はまずS11制御パルス
(波形1117)を発生し、このパルスが距離マ
トリクス・ストアを付勢する。ストア224はマ
イクロプロセツサ880の線852から距離信号
Dを受信し、この距離信号は制御信号i=1と列
信号j=1のアドレスによつて第1の列位置の第
1の行位置に入れられる。 制御信号S12(波形1119)は時刻t9におい
て、ORゲート364を経由して再印加カウンタ
343の増分入力に与えられる。カウンタ343
はそのj=2の状態に増分され、従つて特徴スト
ア210の次の特徴信号集合X21がアドレスさ
れ、マトリクス・ストア224の第1の行の第2
の位置にもまたアドレスが与えられる。カウンタ
343の増分の後で、時刻t10においてパルス発
生器447(波形1121)の出力にパルスが生
じ、このパルスは論理回路493のANDゲート
449と450に与えられる。比較器344のJ2
出力(波形1125)が高レベルであり、パルス
発生器441,443,445はORゲート43
9を経由して次々にトリガされるのでゲート45
0は付勢される。時刻t20におけるパルス発生器
441からのS10パルス(波形1113)によつ
てX21特徴信号集合は距離プロセツサ222に転
送され、これは次にD(X11,X21)信号を発生す
るように進む。時刻t21で生ずるG1パルスに応動
して、距離信号D(X11,X21)の終りで、パルス
発生器443にパルスS11が生ずる。次にプロセ
ツサ222からの距離信号はパルスS11に応動し
てマトリクス・ストア224の第1行の第2列に
挿入される。 パルスS12は再び再印加カウンタ343を増分
する。このとき比較器344からのJ2信号は高レ
ベルであるから、ゲート450の出力はパルス発
生器441,443および445を再トリガす
る。このようにして、マトリクス・ストア224
の第1行の距離信号D(X11,X11)、D(X11
X21)、…、D(X11,XJ1)が発生されてそこに
記憶される。再印加カウンタ343がJ+1状態
に達した後で、比較器344からの信号J1(波形
1123)が高レベルとなり、信号J2が低レベル
となる。パルス発生器447からのパルス出力
(波形1121)は、次に時刻t31においてゲート
449を経由してパルス発生器452に与えら
れ、従つてS13の制御パルスが発生する。パルス
S13(波形1127)は時刻t32において再印加カ
ウンタ343をj=1の状態にリセツトし、iカ
ウンタ348をi=2の状態に増分する。このと
きカウンタ248からのi=2の信号はI+1よ
り小なので比較器349からのI1信号は低レベル
であり、比較器349からのI2信号は高レベルで
ある。従つて、時刻t40においてパルスS13に応動
したパルス発生器454からのパルス(波形11
29)はANDゲート457およびORゲート43
1を通過して論理493のパルス発生器433,
435および437を次々にトリガする。 パルス発生器433からのパルスS7はセレクタ
346を動作してカウンタ348からのi信号を
特徴信号ストア210のJAアドレス入力に与
え、これによつてストア210の中のX21特徴信
号集合がアドレスされる。パルスS8が発生する
と、この特徴信号集合はレジスタ217に送られ
る。パルス発生器437からのパルスS9は再印加
カウンタのj出力をセレクタ346を通して特徴
ストア210と距離マトリクスストア224に送
る。 制御パルスS9の後縁はパルス発生器441をト
リガし、これがS10制御パルスを発生する。S10
御パルスによつてX21特徴信号集合はストア21
0からプロセツサ222に転送され、プロセツサ
222を付勢して距離信号D(X21,X11)を発生
する。プロセツサ222からの終了信号に応動し
て、パルス発生器433はS11パルスを距離マト
リクス・ストア224に与え、これは距離信号D
(X21,X11)をそのi=2、j=1の位置に入れ
る。パルス発生器445からのパルスS12(波形
1119)は再印加カウンタ343を増分し、パ
ルス発生器447を時刻t44でトリガする。 パルス発生器447の出力はゲート450を通
り、パルス発生器441,443,445および
447を順次にトリガし、これによつて距離信号
D(X21,X21)がプロセツサ222によつて発生
し距離マトリクス・ストア224のi=2、j=
2の位置に記憶される。このようにして、第2行
の距離信号D(X21,X11)D(X21,X21)、…、
D(X21,XJ1)が次々に発生して、次々にくり
かえされる。S10,G1,S11およびS12信号に応動
してマトリクス・ストア224に記憶される。再
印加カウンタ343がパルスS12によつてJ+1
状態に増分されると、比較器344のJ1出力は高
レベルとなる。パルス発生器447からのパルス
はANDゲート449を通り、パルスS13が発生す
る。Iインデクス・カウンタ348はそのi=3
の状態に増分され、再印加カウンタ343は、パ
ルス発生器452からのパルスS13によつてj=
1の状態にリセツトされる。i<J+1であるか
ら、パルス発生器454からのパルスはANDゲ
ート457を通り、これによつてパルスS7,S8
よびS9が再び発生する。この連続パルスによつ
て、X31信号集合は特徴ストア210からレジス
タ217に挿入され、パルス発生器441をトリ
ガしてS10パルスを発生する。S10,G1,S11およ
びS12の系列が次にくりかえされ、これは距離信
号D(X31,X11)D(X31,X21)、…、D(X31
J1)がマトリクス・ストア224の第3行に記
憶されてしまうまで続く。 D(XJ1,XJ1)距離信号がマトリクス・スト
ア224に記憶された後で、カウンタ343がそ
のJ+1状態に増分され、カウンタ348がi=
Jの状態となると、パルス発生器447からのパ
ルスはANDゲート449を通る。パルス発生器
452からの次のS13パルスに応動して、カウン
タ348はそのJ+1の状態におかれ、第11図
の比較器349のI1出力(波形1131)は時刻
T62で高レベルとなる。パルス発生器454から
のパルスはANDゲート456を付勢し、E2パル
ス(波形1135)が発生される。距離信号処理
の完了によつてE2パルスが時刻t62(第11図)
で発生する。 基準ワードw=1についての距離信号D
(X11,X11)乃至D(XJ1,XJ1)がマトリクス・
ストア224に記憶された後で、w=1の基準ワ
ードの特徴信号X11,X21、…、XJ1のクラスタ化
が開始する。訓練モードのクラスタ化段階におい
ては、第2図および第3図の回路はまず式(3)に従
つて第1のワードの特徴信号集合X11,X21、…、
J1の中心Xi〓、を判定するように動作する。
パルスE2に応動して、第5図の論理回路505
のフリツプフロツプ503がセツトされ、第13
図の波形1301に示したS17制御パルスがパル
ス発生器507によつて発生する。パルスS17
再印加カウンタ343をそのj=1の状態にクリ
アし、セレクタ346をそのj状態にして、これ
によつてカウンタ343の出力はアドレス線JA
に接続されることになる。このとき、j=1、w
=1特徴信号集合に対するクラスタ識別ストア2
34からのPN識別コードが比較器336,33
7および338に与えられる。 比較器336はストア334からのPNコード
をφコードと比較する。比較器337はPNコー
ドを―1と比較し、比較器338はPNコードを
Rと比較する。すべてのPN識別コードは先にφ
にセツトされているから、比較器336のPN=
φ出力(波形1303)は高レベルでカウンタ3
43の出力がJ状態に達するまで高レベルのまま
である。これらすべての特徴信号集合X11,X21
…、XJ1がこのときまでグループ化されていない
ためである。比較器336からのPN≠φ信号は
高レベルであるから、第5図の論理回路505の
ANDゲート512が付勢される。パルス発生器
516,520および522は次々にトリガさ
れ、従つて第7図に詳細を示したクラスタ中心セ
レクタ226が動作してマトリクス・ストア22
4の各列jの最大距離信号を判定するように動作
する。論理回路505のパルス発生器516から
のパルス(波形1309)はIインデクス・カウ
ンタ348を時刻t1においてi=1の状態にリセ
ツトする。カウンタ343はそのj=1の状態に
あり、このとき第7図のデコーダ701は高レベ
ルのEN1信号を発生する。パルス発生器520か
らのパルスS19(波形1311)は次に時刻t3
おいて第7図に示した最大選択論理回路702―
1乃至702―Jに与えられる。このときデコー
ダ701からの信号EN1だけが高レベルであるか
ら、最大選択論理回路702―1が動作する。i
=1、JA=1信号および制御パルスS19に応動し
て、マトリクスの第1の行の第1の列の距離信号
が線706を通してラツチ703―1の入力と比
較器704―1の一方の入力に与えられる。ラツ
チ703―1は先に0状態にクリアされている。
カウンタ348からの行インデクス信号iはラツ
チ706―1に与えられる。 それに与えられた距離信号を比較する比較器7
04―1の出力は、もし線706上のマトリク
ス・ストア224からの距離信号が、ラツチ70
3―1に記憶されている信号より大であれば、高
レベルとなる。比較器704―1の出力が高レベ
ルとなつたときにゲート705―1は付勢され
る。従つてラツチ703―1はS19パルスの間に
比較器704―1に与えられた信号の内大きい方
を記憶することになる。大きい方の距離信号の行
インデクス信号はラツチ706―1に挿入され
る。パルス発生器522からのパルスS20(波形
1313)は時刻t4でカウンタ348を増分し、
従つてマトリクス・ストア224のj=1の列の
次の行の距離信号にアドレスが与えられる。行i
=1、2、…、Jを計数するカウンタ348の出
力がJ+1状態に達するまで、比較器349から
は高レベルの信号I2(波形1217)が得られ、
ANDゲート527の動作に応動してパルスのシ
ーケンスS19およびS20がくりかえされる。このよ
うにして、ストア224の列j=1の距離信号の
最大値はラツチ703―1に保持され、対応する
インデクス番号がラツチ706―1に入れられ
る。 カウンタ348がi=Jの状態に達したとき、
j=1列の最後の距離信号はラツチ703―1の
先に決定された最大距離信号と比較される。j=
1の列信号の最大値はこのときラツチ703―1
にあり、対応する行インデクス番号はラツチ70
6―1にある。次にカウンタ348はi=J+1
に増分され、これによつて発生器524からのパ
ルス、比較器349からの高レベルのI1信号が
ANDゲート526を付勢する。次に時刻t13でパ
ルス発生器530からのパルスS21(波形132
1)がカウンタ343をそのj=2の状態に増分
し、これによつてデコーダ701からのEN2信号
が高レベルになつたときにマトリクスストア22
4のj=2列のアドレスされる。比較器344か
らのJ2信号に応動してゲート535が時刻t14で付
勢され(波形1327)、パルス発生器532か
らのパルスは論理回路505中のパルス発生器5
16,520,522および524を次々にトリ
ガする。パルスS18,S19およびS20に応動して第
2の列の最大距離信号が最大選択論理回路702
―2によつて判定され、先に論理回路702―1
に関して述べたように対応する行インデクス番号
iが記憶される。カウンタ348がi=J+1の
状態に増分された後で、j=2列の最大距離信号
が論理回路702―2に記憶される。これに対応
する行インデクス番号iもまた論理回路702―
2に記憶される。 次にカウンタ343はそのj=3の状態に増分
され、j=3列の最大距離信号が判定されて、対
応する行インデクス番号と共に第7図には図示さ
れていない最大選択論理回路702―3に記憶さ
れる。時刻t32においてパルス発生器530から
のS21パルスに応動してカウンタ343がそのJ
+1状態に増分された後で、マトリクス・ストア
224の各列の最大距離信号と対応する行インデ
クス番号が最大選択論理回路702―1乃至70
2―Jに記憶される。比較器344のJ1出力(波
形1323)は高レベルとなり、ANDゲート5
34が付勢され、時刻t33においてE5パルス(波
形1329)が論理回路505によつて発生す
る。 式(3)に従えば、最大選択論理回路702―1乃
至702―Jに記憶された距離信号の内の最小の
ものの行インデクスが中央の特徴信号集合Xi
のインデクスとなる。この最小値は第7図の最
小選択論理回路720によつて選択される。論理
回路505において、E5信号に応動して時刻t34
でパルス発生器537によつて制御パルスS22
(波形1331)が発生する。このS22パルスは再
印加カウンタ343をそのj=1の状態にクリア
し、ORゲート539を通してパルス発生器54
1をトリガし、ANDゲート543および544
に供給されるパルスを発生する。比較器336か
らのPN=φ信号は高レベルであるから、発生器
541からのパルスはANDゲート544を経由
してパルス発生器546をトリガし、S23制御パ
ルス(波形1335)が時刻t36で発生する。こ
のS23制御パルスは第7図のANDゲート716の
一方の入力に与えられる。 第7図のセレクタ710は、カウンタ343が
そのj=1状態にあるので、まず最大選択論理回
路702―1中の最大距離信号を選択する。ラツ
チ712は先にその最大値状態にリセツトされて
おり、比較器714は高レベル出力信号を発生す
る。ゲート716は付勢されて、これによつてj
=1列の最大距離信号がラツチ712に挿入され
る。これと同時に最小選択論理回路720のラツ
チ718はゲート716からのパルスによつて付
勢され、従つてラツチ706―1に先に記憶され
ていた行インデクスiがセレクタ724を経由し
てラツチ718に転送される。 時刻t37において、制御パルスS23が終了する
と、パルス発生器550によつて制御パルスS24
(波形1337)が発生する。パルスS24はカウン
タ343をその次の状態に増分し、パルス発生器
552をトリガする。比較器344の高レベルの
J2出力と論理回路505のパルス発生器552か
らのパルスが時刻t38でANDゲート556(波形
1339)を付勢する。こうしてパルス発生器5
41,546,550および552が順次に再ト
リガされ、従つて最大選択論理回路702―2中
の距離信号は比較器714でラツチ712中の距
離信号と比較される。この二つの距離信号の内の
小さい方がラツチ712に記憶され、小さい方の
距離信号の行インデクスが先に述べたようにラツ
チ718に記憶される。 この最小選択のシーケンスは論理回路702―
Jに記憶されている距離信号が、ラツチ712中
の先に得られた最小距離信号と比較されてしまう
まで継続する。ラツチ702―1乃至702―J
の最大距離信号の内の最小のものがラツチ712
に記憶され、対応する行インデクス番号i〓がラ
ツチ718に記憶されてしまうと、カウンタ34
3は時刻t52においてS24制御パルスによつてその
J+1の状態に増分される。比較器344のJ1
力はここで高レベルとなり、パルス発生器552
からのパルスはANDゲート555を通る。AND
ゲート555からのパルス出力と、フリツプフロ
ツプ503からのE4信号に応動して、ANDゲー
ト558が付勢されて、ここから高レベルのE6
出力(波形1341)が得られる。E6信号は第
1の基準ワードの特徴信号集合X11,X21、…、X
J1が判定されたことを示している。 次に第2図および第3図の回路が動作して中央
の特徴信号集合Xiから所定のスレシヨルド
距離内にある特徴信号集合の第1のグループを識
別するために距離マトリクス・ストア224中の
距離信号をしらべる。距離信号D(Xi,Xj
)>Tであるすべての特徴信号集合は、クラス
タ識別ストア334中で―1コードによつて識別
される。その距離信号D(Xi,Xj1)Tで
ある残りの特徴信号集合はφの識別コードを保持
する。第1のグループの特徴信号集合X11(1),
X21(1)、…、Xn1(1)はクラスタ識別ストア334
中でφコードによつて区別される。 第5図ANDゲート558からの信号E6は第5
図の論理回路587中のパルス発生器561をト
リガし、これが次にS25制御パルスを発生する。
第14図の波形1401に示したS25制御パルス
は第2図のラツチ228に与えられ、従つてクラ
スタ中心セレクタ226のラツチ712からのi
〓インデクスはラツチ228に転送される。パル
スS25はセレクタ266をそのi〓の状態にスイ
ツチし、これによつてラツチ228の出力はマト
リクス・ストア224のi〓行アドレス入力に接
続される。セレクタ332はORゲート372に
与えられたパルスS25によつてその―1状態にセ
ツトされる。―1状態においては、セレクタ33
2はクラスタ識別ストア334の入力に対して―
1コードを接続する。 ORゲート363に与えられたS25パルスによつ
て再印加カウンタ343はそのj=1の状態にリ
セツトされる。パルスS25の終了によつて距離マ
トリクス・ストア224の行i〓の第1の列位置
(j=1)がアドレスされる。アドレスされた距
離信号D(Xi,X11)はマトリクス・ストア
224から読み出され、比較器225の一方の入
力に与えられる。所定のスレシヨルド距離コード
Tは比較器225の他方の入力に与えられる。も
しアドレスされた距離信号がスレシヨルド距離よ
り大であれば、比較器225のD>T出力(第1
4図の波形1405)が高レベルとなり(例えば
時刻t3とt7の間)、第5図の論理回路537の
ANDゲート568(波形1409)が付勢され
る。ゲート568からのパルスはパルス発生器5
70を付勢し、これによつて時刻t6でS26制御パ
ルス(波形1411)が発生する。S26制御パル
スは第3図のクラスタ識別ストア334を付勢
し、セレクタ332からの―1コードを書き込
み、これによつて再印加カウンタ343からのj
信号によつて指定されたクラスタ識別ストア33
4中の位置に―1コードが記憶される。このよう
にして、距離信号DがT以上であるアドレスされ
た特徴信号集合は特徴信号集合の第1のグループ
の外の集合として識別される。 クラスタ識別ストア334からのアドレスされ
た距離信号が、所定のスレシヨルド距離Tに等し
いか、それ以下であるときには、例えば第14図
の時刻t0とt4の間のように比較器225のDT
出力(波形1403)が高レベルとなる。第5図
の論理回路587のANDゲート567がこのと
き付勢される。クラスタ識別ストア334の対応
する位置はパルスS26が発生されていないから変
化しない。クラスタ識別コードがφであるときに
は、アドレスされた特徴信号集合は第1のグルー
プに入つていることになる。 論理回路587のパルス発生器574はS27
御パルス(波形1413)を発生し、これは再印
加カウンタ343を増分し、パルス発生器576
をトリガする。このとき比較器344のJ2出力
(波形1417)は高レベルとなり、カウンタ3
43がそのJ+1状態になるまで高レベルのまま
である。従つてパルス発生器576からのパルス
はANDゲート579を付勢し(波形1419)
次にアドレスされる距離信号とスレシヨルド距離
Tとの比較が実行される。このようにして、行i
〓のj=1、2、…、Jの列位置の距離信号はス
レシヨルド距離Tと順次に比較され、これによつ
てクラスタ識別ストア334中の第1のグループ
が識別される。 行i〓中の最後の距離信号D(Xi,Xj1
が距離スレシヨルドTと比較されて、結果をクラ
スタ識別ストア334に入れた後、再印加カウン
タ343はそのJ+1の状態に増分され、比較器
344のJ1出力(波形1415)が時刻t11で高レ
ベルとなる。論理回路587のANDゲート57
8は高レベルのJ1信号とパルス発生器576から
のパルスによつて付勢される。こうして高レベル
のE7信号(波形1421)が時刻t12でANDゲー
ト578の出力に現われる。E7信号は第1のグ
ループの形成が終了したことを示す。 第1のグループX11(1)、X21(1)、…、Xn-1(1)の
中心の特徴信号集合Xn〓iは一般に集合Xi
ではないから、第1の仮クラスタの中心の集合は
別に決定しなければならない。本発明によれば、
これはクラスタ中心セレクタ226(第7図に詳
細を示す)によつて であるような行インデクスm〓を検出することに
よつて行なわれる。信号E7は第5図の論理回路
505中のフリツプフロツプ503をリセツト
し、S17制御パルスを発生するパルス発生器50
7をトリガする。パルスS17は再印加カウンタ3
43をそのj=1の状態にリセツトし、セレクタ
346をORゲート367を経由してそのj状態
にセツトするように動作する。中心の特徴信号集
合Xiの決定に関して前述したように、クラ
スタ中心セレクタ226を含む第2図および第3
図の回路はマトリクス・ストア222の最大列距
離信号の最小のものを選択し、該最小距離信号の
m〓行インデクス番号を識別するために制御パル
スS18,S19,S20およびS21に応動して動作する。
しかしXn集合を決定するときには、第1の
グループの特徴信号集合だけが考慮される。第1
のグループの特徴信号集合X11(1),X21(1)、…、X
j1(1)、…、Xn1(1)はクラスタ識別ストア334中
に記憶されたクラスタ識別コードPN=φによつ
て識別される。 ストア334のPN出力がφであるときには、
比較器336は論理回路505のゲート512に
対して高レベルのPN=φ出力を与え、これによ
つて第7図に示されたクラスタ中心セレクタ22
6が制御パルスS18,S19,S20によつて付勢され
る。しかしもし比較器336のPN=φ出力が高
レベルでアドレスされた特徴信号集合がグループ
に入つていないことが示されると、制御パルス
S18,S19およびS20は発生しないから、クラスタ
中心セレクタ326は最大列距離信号選択中の対
応する距離信号を無視するように動作する。同様
に、論理回路505中のANDゲート543はPN
識別コードがφ以外の特徴信号集合を除外するよ
うに動作するから、グループ中の特徴信号集合だ
けが、最大列距離信号の最小の選択において考慮
される。第1のグループについてのクラスタ動作
の終りで、第1のグループの中心の集合Xn〓〓
に対応するm〓インデクスが第7図のラツチ71
8に記憶されていることになる。ANDゲート5
55からのパルスとフリツプフロツプ503から
の高レベルのE3信号に応動して第5図のゲート
559によつて信号E9が発生する。 Xn〓〓の選択の後で、第2図および第3図の
回路は集合Xn〓〓からスレシヨルド距離T以内
にあるような特徴信号集合を選択するように動作
する。ANDゲート559からの信号E9に応動し
て、第6図の論理回路600中のパルス発生器6
01は第15図の波形1501に示したS28制御
パルスを発生し、これはラツチ718(第7図)
からのm〓行インデクスを第2図のラツチ230
に転送する。パルスS28はまたセレクタ266を
そのm〓状態にセツトし、再印加カウンタ343
をクリアし、フリツプフロツプ605をリセツト
して高レベルのE12信号が得られるようにする
(波形1503)。 パルスS28の終了時の時刻t1において、マトリ
クス・ストア224のm〓行のj=1列の位置が
アドレスされ、クラスタ識別ストア334の中の
第1の特徴信号集合識別コード位置がアドレスさ
れる。S28の後縁によつて論理回路600のパル
ス発生器607がトリガされ、パルス発生器60
7の出力はANDゲート609および610に与
えられる。比較器336のPN≠0出力はANDゲ
ート609に与えられ、一方比較器336のPN
≠0出力(波形1505)はANDゲート610
に与えられる。もしアドレスされた第1のグルー
プ中の特徴信号集合が第1のグループ中にあれ
ば、PN=φ信号が高レベルであり(t0とt10
間)、ANDゲート610(波形1509)は時刻
t1で付勢されて、パルス発生器612からパルス
が得られる。 マトリクス・ストア224中のアドレスされた
距離信号は比較器225に与えられ、その中で所
定の距離スレシヨルド信号Tと比較される。第2
図の比較器225からの高レベルのDT信号
(波形1513)に応動して、ANDゲート615
が付勢されて、時刻t2においてS29パルス(波形
1515)がパルス発生器617によつて発生さ
れる。S29パルスはセレクタ332をそのk状態
にスイツチし、従つてテンプレート・カウンタ3
55のk出力はクラスタ識別ストア334の入力
に接続され、kコードを持つテンプレート信号が
時刻t3においてパルス発生器623からのパルス
S31によつて(波形1519)ストア334のア
ドレスされた位置に記入される。この手順で対応
する特徴信号集合を第2のグループX11(2),
X21(2)、…、Xj(2)、…、Xn1(2)のメンバである
と識別する。 マトリクス・ストア224中のアドレスされた
距離信号とスレシヨルド距離信号Tの比較によつ
て、比較器225のD>T出力(波形1511)
が高レベルになると(例えば時刻t5とt14の間)、
時刻t11においてANDゲート614が付勢され
て、パルス発生器619によつてS30制御パルス
(波形1517)が発生する。パルスS30に応動し
て、セレクタ332は―1の状態にスイツチさ
れ、これによつて―1信号がパルス発生器623
からのパルスS31によつてクラスタ識別ストア3
34中のアドレスされた位置に挿入される。この
―1信号はアドレスされた特徴距離信号集合を、
外部集合、すなわち、第2のグループのメンバで
はないものとして識別する。アドレスされた特徴
信号集合に対して例えば時刻t14とt21の間のよう
に比較器336のPN=φ出力が高レベルにあれ
ば、ANDゲート609が付勢され、S29あるいは
S3パルスはいずれも生じない。ゲート609の動
作に応動して時刻t21においては制御パルスS32
発生する。このようにして、クラスタ識別ストア
334における特徴信号集合の識別コードは不変
で、集合は第2の仮クラスタのメンバではないこ
とになる。 第1のグループの各特徴信号集合が外部集合か
あるいは第2のグループのメンバかが、制御パル
スS29あるいはS30および制御パルスS31に応動し
て識別された後で、論理回路600のパルス発生
器627によつて制御パルスS32が発生される。
パルスS32は再印加カウンタ343を増分し、増
分された再印加カウンタ343によつてアドレス
された次の信号集合について識別プロセスが継続
される。再印加カウンタ343がJ番目の特徴信
号集合によつてそのJ+1状態に増分されたとき
に、比較器244のJ1出力(波形1523)は時
刻t23で高レベルとなり、時刻t34においてゲート
631によりE10信号(波形1529)が発生す
る。こうして第2のグループX11(2),X21(2)、…、
n1(2)の識別は完了する。 もし特徴集合の識別の間に、ANDゲート61
4によつて外部特徴信号集合を検出すると(D>
T)、この結果として生ずるS30パルス(時刻t11
おける波形1517)はフリツプフロツプ605
をセツトし、従つてそれから高レベルのE11信号
が得られる。すべての集合X11(1),X21(1)、…、X
n1(1)が中心の集合Xn(1)からスレシヨルド距
離T以内にあれば、E10信号がゲート631によ
つて発生したときに、フリツプフロツプ605は
リセツトされたままであり、E12信号が得られ
る。E12信号は第2のグループは先の第1のグル
ープと同一であることを示している。外部特徴信
号集合を検出しなかつたときには、上述した特徴
信号集合のグループが第1のクラスタとして受理
され、中心の集合Xn(1)は特徴信号ストア2
10からテンプレート・ストア216へT11テン
プレートとして転送される。 説明の目的で、信号E10が発生されたときに、
フリツプフロツプ605の信号E11が高レベルで
少くともひとつの外部集合が比較器225によつ
て検出されたと仮定しよう。高レベルのE10およ
びE11信号に応動して第6図のANDゲート644
が付勢され、第16図の波形1601で示される
制御パルスS33がパルス発生器647から得られ
る。S33パルスは第3図のくりかえしカウンタ3
51を増分し、このカウンタがグループ形成の回
数を記録する。パルス発生器649は次にS33
ルスの後縁によつてトリガされる。このとき、比
較器353は高レベルのL2信号を生じ、これは
カウンタ351の状態がL+1コードに等しい
か、あるいはこれより小さいことを示す。ここで
Lはシステムで許容されるくりかえし回数の最大
数を示す。 比較器353のL2出力と発生器649からの
パルスに応動して、論理回路640のANDゲー
ト651が付勢され、(波形1603)、S39パル
ス(波形1605)が時刻t2においてパルス発生
器654によつて発生する。S39パルスは再印加
カウンタ343をクリアし、セレクタ332をφ
にスイツチし、セレクタ346をそのj状態にス
イツチする。第2図および第3図の回路はこれに
よつて初期設定され、従つて各クラスタ識別コー
ドPN=kは次のグループの形成の前にPN=φコ
ードに変更される。このようにして、クラスタ識
別ストア334においてkコードによつて先に識
別されていたグループ化されていない特徴信号集
合は変更される。パルス発生器658はS3-9制御
パルスによつてトリガされる。クラスタ識別スト
ア334の第1の位置がkコードを含んでいれ
ば、比較器338はPN=k信号を与え、時刻t3
においてANDゲート661(波形1609)が
付勢される。ここでS40制御パルス(波形161
1)がパルス発生器663によつて発生する。こ
のS40パルスはORゲート375を経由してストア
334の書込み入力に与えられ、従つてPN=φ
信号がセレクタ332からクラスタ識別ストア3
34のアドレスされた位置に記入される。 クラスタ識別ストア234中のアドレスされた
位置のPNコードがkコードでない場合には、比
較器338からのPN≠k信号によつて時刻t11
ANDゲート660が付勢され(波形1607)
ストア334中のアドレスされた位置のコードは
不変である。S41パルス(波形1613)がパル
ス発生器667によつて発生し、このパルスが再
印加カウンタ343を増分する。再印加カウンタ
343がJ+1状態に達するまで、比較器344
のJ2出力(波形1617)は高レベルのままであ
り、パルス発生器669からのパルスによつてゲ
ート673が付勢され(時刻t6とt13の波形161
9)、ゲート660と661の動作と制御パルス
S40とに応動して次のアドレスされた特徴信号集
合についてクラスタ識別コードの変更プロセスが
くりかえされる。クラスタ識別ストアのJ番目の
位置が処理された後で、再印加カウンタはそのJ
+1状態に増分される。時刻t23において、比較
器344のJ1出力(波形1615)は高レベルと
なり、時刻t24においてANDゲート671からE13
パルス(波形1621)が得られる。 すべての第2のグループの集合X11(2),X21(2)、
…、Xn1(2)がクラスタ識別ストア334において
論理回路640の制御でPN=φのコードによつ
てクラスタに入つていない集合として識別された
ときにE13パルスが生ずる。第5図の論理回路5
05の制御によつてストア334中でPN=φの
コードを持つ信号についての距離信号に応動して
クラスタ中心セレクタ226によつて第2のグル
ープの中心の集合Xn(2)を判定する。フリツ
プフロツプ503は第6図の論理回路640の
ANDゲート671からのE13パルスによつてリセ
ツトされ、パルス発生器507からはS17制御パ
ルスが発生する。中心の特徴信号集合Xi
nの判定に関して述べたように、第5図の
論理回路505からの制御パルスS17,S18
S19,S20およびS21はクラスタ中心セレクタ論理
回路226を動作して、クラスタ識別ストア33
4中のPN=φコードを持つ集合について距離マ
トリクス・ストア224中の各j列について最大
距離を次々に判定して、対応する行インデクスi
を記憶するように動作する。 ストア224中の最後の列について最大の距離
信号が判定された後で、E5信号がANDゲート5
34によつて発生し、この信号がパルス発生器5
37をトリガすることによつて、最大列距離信号
の内の最小のものの選択を開始する。制御パルス
S22,S23およびS24に応動して、最小選択論理回
路720は最大選択論理回路702―1乃至70
2―J中の距離信号の内の最小のものをラツチ7
12に記憶し、それに対応する行インデクスm〓
をラツチ718に記憶するように動作する。この
選択はクラスタ識別ストア334中でPN=0コ
ードで識別されANDゲート543および544
によつて区別された特徴信号集合に限定されるか
ら、その中で第2のグループ集合でないものはこ
の最小選択から除外される。第J列の比較が完了
したとき、第7図のラツチ718は第2のグルー
プの中心の集合Xn〓〓を含んでおり、フリツプ
フロツプ503からの高レベルのE8信号とAND
ゲート555からのパルスに応動して、論理回路
505のANDゲート559によつて信号E9が発
生する。 ANDゲート559からの信号E9は、論理回路
600の制御で比較器225におけるスレシヨル
ドと、距離信号との比較を開始する。信号E9
応動して、論理回路600によつて制御パルス
S28,S29,S30,S31およびS22が発生し、この制御
パルスによつて、距離マトリクス・ストア224
に記憶された距離信号D(Xn(2),X11(2))乃
至D(Xn(2),Xn1(2))は、第1のグループ
について先に述べたように所定のスレシヨルドT
と次々に比較される。このようにして、第3のグ
ループの集合が識別される。比較器のDT出力
が高レベルである第2のグループ中の各特徴信号
集合についてのPN=φコードはテンプレート・
カウンタ355によつて決定されるkに変更され
る。 すべての比較で高レベルのDT出力が得られ
れば、第3のグループは直前の第2のグループと
同一であると認識されて、終了信号E10がANDゲ
ート631で発生したときに、フリツプフロツプ
605はリセツト状態にあることになる。比較さ
れているグループに少くともひとつの外部特徴信
号集合が存在すれば、それについて比較器225
から高レベルのD>T信号が得られ、信号E10
生じたときにフリツプフロツプ605はセツト状
態になる。フリツプフロツプ605からの高レベ
ルのE11信号とANDゲート631からのE10パル
スとに応動して、第6図の論理回路640からの
制御パルスS33,S39,S40およびS41はPN=φコー
ドを持つ第3の仮クラスタ特徴信号集合
(X11(3),X21(3)、…、Xn1(3))を再識別するよう
に動作する。第6図の論理回路600の制御によ
る距離信号比較において、外部信号集合が検出さ
れないようになるまで、連続してグループの形成
が行なわれる。 説明の目的のためにANDゲート631がE10
号を発生したときに、フリツプフロツプ605か
らの信号E12が高レベルであつたと考えよう。こ
れは直前に形成されたグループ(例えば、p+
1)がその前のグループ(例えば、p)と同一で
あるときに生ずる。このときにはクラスタは固定
されて、直前のグループについて判定された中心
集合Xn〓〓がテンプレート・ストア216に記
憶されるべきテンプレート信号となる。 第17図の波形1701に示すように第6図の
論理回路640のANDゲート645は高レベル
のE10信号とE12信号とによつて付勢され、パルス
発生器676はS34制御パルス(波形1703)
を発生する。S34パルスに応動して、第3図のセ
レクタ346はm〓状態にスイツチされ、ラツチ
230のm〓行インデクス・コードが特徴ストア
210のJAアドレス入力に与えられる。S34パル
スはまた論理回路640のパルス発生器678を
トリガし、これはS35制御パルス(波形170
5)を発生する。ANDゲート280を通して、
ワードカウンタ340のw=1出力と、ANDゲ
ート284を通してテンプレートカウンタ355
のk=1出力とによつてアドレスされたテンプレ
ート・ストア216はこのときS35パルスに応動
して特徴ストア210からXn〓〓の特徴信号集
合を受信する。このようにして、第1の基準ワー
ドの第1のクラスタのテンプレートT11=Xn
〓がテンプレート・ストア216に挿入される。
このとき制御パルスS36(波形1707)がパル
ス発生器680によつて発生し、従つてテンプレ
ート・カウンタはk=2の状態に増分される。 外部特徴信号集合が検出された各グループ形成
の後で、第6図の論理回路640のパルス発生器
647によつて制御パルスS33が発生する。くり
かえしカウンタ351はパルスS33によつて増分
される。L番目のグループが形成された後で、く
りかえしカウンタ351はパルスS33によつてそ
のL+1状態に進み、比較器353は高レベルの
L1信号を発生し、これがANDゲート652を付
勢する。ANDゲート652の出力によつて制御
パルスS34,S35およびS36が順次発生し、従つて
特徴ストア210のL番目の仮クラスタ中心進合
n〓〓はT11テンプレート信号としてテンプレ
ート・ストア216に転送される。このようにし
て、Lグループの識別の終りで仮クラスタの形成
が終了する。 第1の基準ワードのテンプレート信号(T11
がテンプレート・ストア216に転送された後
で、クラスタ識別ストア234中にはφコードは
残つていない。各集合はストア334中の今形成
されたk=1のクラスタのメンバであると識別さ
れるか、あるいはストア334中のPN=―1コ
ードによつて外部集合であると識別される。k=
2のクラスタを形成するのに使用される外部集合
はPN=φコードによつてグループ化されていな
い集合であるとして識別しなければならない。 パルス発生器680からのS36パルスに応動し
て、パルス発生器682は高レベルの出力を生ず
る。ゲート684はゲート682の出力と第3図
の比較器357からの高レベルのK2信号(波形
1711)によつて付勢される。ゲート684は
時刻t4においてE14信号(波形1713)を発生
し、この信号は第4図の論理回路495中のパル
ス発生器461に与えられる。パルス発生器46
1は第12図の波形1201で示したS14制御パ
ルスを与える。S14パルスは再印加カウンタ34
3をそのj=1の状態にクリアし、セレクタ33
2をPN=φコードをクラスタ識別ストア334
の入力に接続するように設定し、セレクタ346
を再印加カウンタ346のj出力をJAアドレス
線に接続するように設定する。ストア334はこ
のときカウンタ343のj出力とカウンタ340
のw出力によつてアドレスされる。パルス発生器
465はS14制御パルスによつてトリガされ、ク
ラスタ識別ストア334のj=1の位置が比較器
357に与えられる。時刻t0とt5の間では比較器
337のPN=―1出力(波形1205)は高レ
ベルである。従つて、ゲート468が付勢されて
S15制御パルス(波形1207)は時刻t3におい
てパルス発生器470によつて発生される。S15
パルスはORゲート375を経由してクラスタ識
別ストア334の書込み入力に与えられ、従つて
セレクタ332からのPN=φコードがストア3
34のw=1、j=1の位置に挿入される。 パルス発生器474はS15パルスあるいはAND
ゲート467の出力に応動してS16制御パルスを
生ずる。S16制御パルスはORゲート364を経由
して再印加カウンタ343を増分する。カウンタ
343はこのときj=2状態にあり、従つて比較
器344は高レベルのJ2信号(波形1213)を
生ずる。高レベルのJ2信号とパルス発生器476
からのパルスに応動してANDゲート476は付
勢され(波形1215)パルス発生器465が再
トリガされる。第12図の時刻t5とt20の間で、比
較器337のPN=1出力は低レベルでありPN≠
1出力は高レベルである。従つて、ゲート467
は付勢されて、パルス発生器474がトリガされ
る。このときS16パルスが時刻t6で発生するが、
S15パルスは発生しない。クラスタ識別ストア中
のw=1、j=2の位置のコードは変化しない。
再印加カウンタ343は時刻t6でS16パルスによ
つてそのj=3の状態に増分され、パルス発生器
465が再トリガされる。論理回路495はj=
3、4、…、JについてもS15およびS16パルスを
発生することによつてクラスタ識別ストア334
の制御を続ける。時刻t21においてJ番目の特徴
信号集合についてパルスS16が発生した後で、再
印加カウンタ343はそのj=J+1の状態に増
分され、比較器344は高レベルのJ1出力(波形
1211)を与える。ゲート478はパルス発生
器476からのパルスと高レベルのJ1出力とによ
つて付勢され、これによつて時刻t2でE3信号(波
形1217)が発生する。E3信号は第5図の論
理505に与えられ、これは前述しようにPN=
φのコードで識別された特徴信号集合の内の中心
の集合を見付けるように動作する。 クラスタ識別ストア334中のPN=φコード
で外部集合が識別された後で、k=2のテンプレ
ートの一連のグループk=1のテンプレートにつ
いて詳述したように次々に形成される。第9図に
示すフローチヤートを参照すれば、PN=φで識
別された特徴信号集合の内の中心の集合Xi
が第9図のボツクス905で示されるように、第
5図の論理回路505の制御で形成される。残り
のグループ化されていない特徴信号集合について
中心の集合Xiが判定された後で、論理回路
505のゲート558からのE6信号に応動し
て、論理回路587は第2図および第3図の回路
を制御し、これによつて第1のグループの集合が
識別される。これらの第1のグループの集合は中
心の集合Xiからスレシヨルド距離T以内に
あるグループ化されていない集合である。第1の
グループの識別は第9図のブロツク907の動作
に従つて実行される。論理回路587からの信号
E7はk=2についての第1のグループ集合
X11(1),X21(1)、…、Xn1(1)の識別が完了した後で
発生する。論理回路505の制御によつてブロツ
ク909で示されるように第1のグループの中心
の集合Xiが決定される。 次にブロツク911で示されるようにスレシヨ
ルド距離比較によつて第2図および第3図の回路
により次の仮クラスタが識別され、そのとき識別
されたグループがその直前に識別されたグループ
と同一であるかが、判定ブロツク913で示され
るようにテストされる。これらの動作は前述した
ように論理回路600の制御によつて第2図およ
び第3図の回路によつて実行される。上で形成さ
れたグループがその直前のグループと同一であ
り、L番目のグループでなければ(判定ブロツク
915)、第9図の動作ブロツク911に示すよ
うに、新らしい仮のクラスタが形成される。 もしそのとき形成されたグループが直前のグル
ープに等しいか、あるいはL番目のグループであ
れば、ブロツク917の動作が実行され、直前の
グループの中心の集合(Xn(p) )が特徴信号
ストア210からT21テンプレートとして、テン
プレート・ストア216に転送される。テンプレ
ート・カウンタ355のテンプレート番号kを検
査して判定ブロツク919に示すように第1の基
準ワードのすべてのテンプレートが形成されてい
るかが判定される。K番目のテンプレートが調べ
られるまで、比較器357からの信号K2(波形
1711)は高レベルであり、論理回路640に
おいてANDゲート684からE14信号が得られ
る。ここで論理回路495が付勢されて、動作ブ
ロツク925で示されるようにグループ化されて
いない特徴信号集合の再識別が行なわれる。論理
回路495から制御信号E3がくりかえし発生し
て、ブロツク905,907,909,911,
913,915,917,919および925の
グループ形成動作が再開される。テンプレート・
ストア216に第1の基準ワードのK番目のテン
プレート(Tk1)が記憶された後で、比較器35
7から信号K1(波形1709)が得られる。
ANDゲート685は付勢されて、パルス発生器
687はS37パルス(波形1717)を生じ、こ
れがワードカウンタ340を増分する。ワードカ
ウンタ340がそのW+1状態になるまでに、比
較器341からの高レベルのW2信号(波形17
21)とパルス発生器689からのパルスが
ANDゲート341を付勢してE15信号を与える。
第9図の動作ブロツク903には論理回路640
のANDゲート691からの制御信号E15に応動し
て入り、次の基準ワードのテンプレートが第9図
のフローチヤートに従つて形成される。 最後の基準ワードWについてのK番目のテンプ
レートの形成によつて、テンプレート発生モード
が終了し、ブロツク923で示されるように認識
モードが付勢できるようになる。第6図の論理回
路640において、ANDゲート692の出力
は、ワードカウンタ340がW+1状態にあると
きにパルス発生器689からのパルスと第17図
の時刻t35におけるW1信号(波形1719)とに
応動してフリツプフロツプ694をセツトする。 比較器341から得られたW1信号は最後の基
準ワードのテンプレートが形成されたことを示す
から、第18図の認識制御器1885に対して
ER信号が与えられ、これによつて外部から与え
られたSRパルスによつて第18図の論理回路が
認識モードで動作できるようになる。 認識制御器1885は認識モードの動作を制御
するものであるが、第19図にその詳細を示して
いる。認識モードの間に、SR信号が外部信号源
から与えられた後で、第2図の電話の送話器20
1に対して未知の発声が供給される。第22図の
波形2201で示す信号SRは第19図のORゲー
ト1900に供給され、訓練モード制御器218
からのER信号が高レベルで、フリツプフロツプ
1958からの高レベルの信号が得られたと
きに、パルス発生器1901をトリガする。認識
モードの間を除いて、信号は常に高レベルで
あるから、認識モードの中断は防止される。パル
ス発生器1901は高レベルのRI制御パルス
(波形2103)を発生し、このパルスはインデ
イケータ回路1887を通して話者に対して発声
を開始して良いことを示す表示を与える。発生器
1901からのRIパルスは第2図の低域フイル
タ兼サンプラ203、A/D変換器204、LPC
特徴信号発生器205および終端検出器206を
動作し、これにより未知の発声に応動して特徴信
号集合Tuが発生される。 発声が完了した後で、終端検出器206からの
信号EC(波形2205)が第19図のパルス発
生器1905をトリガし、r1制御パルス(波形2
207)が発生される。r1パルスはワードカウン
タ1850をそのwr=1の状態にクリアし、フ
リツプフロツプ1958をセツトしてそこからの
IR信号を生じ、第2図の発生器205からの未
知の発声の特徴信号集合Tuを第18図の特徴信
号レジスタ1909に転送するようにする。r1
ルスはまたORゲート1907を経由して、時刻
t1においてパルス発生器1909をトリガし、従
つてr2パルス(波形2209)が発生される。 r2パルスに応動して、テンプレート・カウンタ
1860はORゲート1805を通してkr=1状
態にクリアされる。このときテンプレート・カウ
ンタ1860とワードカウンタ1850によつて
アドレスされたテンプレート集合T11が第2図の
テンプレート・ストア216から得られる。この
テンプレート集合T11とレジスタ1801中の未
知の発声の特徴信号集合Tuが距離プロセツサ1
803に与えられる。プロセツサ1803は例え
ば蓄積プログラム制御装置809に固定記憶さ
れ、付録Bにフオートラン言語で示した距離信号
処理プログラムを持つ、第8図のマイクロプロセ
ツサ880で構成しても良い。付録Bのプログラ
ムによれば、プロセツサ1803のダイレクト・
メモリ・アクセス805はリード830を通して
未知の発声の特徴信号集合Tuを特徴信号レジス
タ1801から受信し、リード832を通してテ
ンプレート信号T11を第2図のテンプレート・ス
トア216から受信する。r2パルスの後縁で、パ
ルス発生器1913によつてr3制御パルス(波形
2211)が発生する。r3パルスはリード840
を通してプロセツサ880に与えられ、プロセツ
サ.ユニツト1803は未知の発声の終端フレー
ムNTの平均フレーム距離であるDT(Tu,
T11)/NTを計算する。インタフエース・アダプ
タ801で信号DT(Tu,T11)/NTが利用でき
るようになつたときに、信号ED1はインタフエー
ス・アダプタ801からリード850を通してパ
ルス発生器1915に与えられ、これがr4制御パ
ルス(波形2213)を発生する。r4パルスはラ
ツチ1810に与えられ、従つてリード852か
らのDT(Tu,T11)/NT信号がラツチ1810
に転送される。 このときプロセツサ1803はフレームNI
ら終端フレームNTの間の未知の発生の全エネル
ギーが未知の発生の全音声エネルギーの所定の部
分となるような、未知の発生の中間フレームNI
を決定するように動作する。次にプロセツサ18
03によつて平均フレーム距離信号DI(Tu,
T11)/NIが計算される。信号DI(Tu,T11)/
Iがインタフエース・アダプタ801で利用で
きるようになつたときに、インタフエース・アダ
プタのリード854からのED2信号が第19図の
パルス発生器1917をトリガする。パルス発生
器1917からのr5制御信号(波形2215)は
次にDI(Tu,T11)/NI信号を第8図のリード
852から第18図のラツチ1815に転送す
る。比較器1817はラツチ1810からのDT
(Tu,T11)/NT信号とラツチ1815からのDI
(Tu,T11)/NI信号を受信する。未知の発声の
終端部における外部雑音のためにDI(Tu,
T11)/NI<DT(Tu,T11)/NTであるときに
は、比較器1817からセレクタ1820に与え
られる高レベルの出力信号によつて、セレクタ1
820はラツチ1815をソータ兼ストア182
5の出力に接続する。もしDT(Tu,T11)/NI
T(Tu,T11)/NTであれば、ラツチ181
0の出力はセレクタ1820を通してソータ兼ス
トア1825の入力に接続される。比較器181
7とセレクタ1820はラツチ1810および1
815の内の小さい方をソータ兼ストア1825
に転送するように動作する。 ソータ兼ストア1825は第1ワードの距離信
号の系列D(Tu,T11)、D(Tu,T21)、…、D
(Tu,Tk1)から最小距離信号の集合を選択し大
きい方から小さい方の順序で選択された距離信号
を配列するように動作する。第20図はソータ兼
ストア1825の詳細なブロツク図を示してい
る。第20図を参照すれば、ラツチ2002,2
012,2022および2032は選択された距
離信号を記憶する。比較器2004,2014,
2024および2034の各々はセレクタ182
0からの距離信号をその比較器に関連したラツチ
に先に入つている距離信号と比較する。比較器2
014,2024および2034の出力に応動し
て、ラツチ2012,2022および2032を
付勢して、セレクタ1820からの距離信号を入
れるか、前のラツチからの距離信号を入れるか、
あるいは先にそこに記憶されていた距離信号を保
持する。 説明の目的のために、セレクタ1820からの
基準ワードwの距離信号の系列はD(Tu,T1
)=1、D(Tu,T2w)=3、D(Tu,T3w
=3、D(Tu,T4w)=2、D(Tu、T5w)=5
であると仮定しよう。ラツチ2002,201
2,2022および2032はプロセツサ180
3の基準ワードwの距離信号の形成の前に制御信
号r2に応動して最大の可能な値(LPV)にセツト
される。信号D(Tu,T1w)が比較器200
4,2014,2024および2034に与えら
れたときには、D(Tu,T1w)=1は制御パルス
r2によつてラツチ2002,2012,2022
および2032に初期に記憶された値よりは小さ
いからCM1,CM2,CM3およびCM4の出力はす
べて高レベルとなる。 セレクタ2010はANDゲート2016の低
レベルの出力に応動してラツチ2002の出力を
ラツチ2012の入力に接続する。同様にセレク
タ2020はラツチ2012の出力をラツチ20
22の入力に接続し、セレクタ2030はラツチ
2022の出力をラツチ2032の入力に接続す
る。制御パルスr6(波形2217)がそれに与え
られたときにはゲート2008,2018,20
28および2038が付勢される。ラツチ200
2はD(Tu,T1w)=1信号を受信し、これを記
憶する。ラツチ2012,2022および203
2は直前のラツチからの最大値LPV信号を受信し
て記憶する。 次にD(Tu,T2w)=3信号がセレクタ182
0から与えられ、従つて比較器2004の1
出力が高レベルとなり、一方比較器2014,2
024および2028のCM2,CM3およびCM4
出力は高レベルのままである。比較器2014と
2024の高レベル1およCM2信号に応動し
て、セレクタ2010はセレクタ1820の出力
をラツチ2012の入力に接続する。ANDゲー
ト2026および2036は付勢されないから、
セレクタ2020はラツチ2012の出力をラツ
チ2022の入力に接続し、セレクタ2030は
ラツチ2022の出力をラツチ2032の入力に
接続する。 次のr6パルスはANDゲート2018を付勢
し、距離信号D(Tu,T2w)=3は付勢されたセ
レクタ2010を通してラツチ2012に入れら
れる。信号CM1は低レベルであるから、ANDゲ
ート2008は付勢されず、D(Tu,T1w)=1
信号がラツチ2002に残る。CM3およびCM4
の両方の信号は共に高レベルであるからラツチ2
022はラツチ2012からのLPV信号を受信
し、ラツチ2032はラツチ2022からのLPV
信号を受信する。距離信号D(Tu,T3w)=3が
セレクタ1820に与えられたときには、ラツチ
2002のラツチD(Tu,T1w)=1はD(T
u,T3w)=3よりも小であるから比較器2004
の1出力は高レベルのままである。ラツチ2
012に記憶されているD(Tu,T2w)=3はセ
レクタ1820からのD(Tu,T3w)=3と等し
いから、比較器2014の2出力は高レベル
となる。ラツチ2022および2032に記憶さ
れている最大値はD(Tu,T3w)=3より大であ
るから信号CM3およびCM4は高レベルのままで
ある。 次のr6パルスが生じたとき、信号CM1および
CM2は低レベルであるから、ラツチ2002お
よび2012は変化しない。しかしラツチ202
2はANDゲート2026に与えられた高レベル
の2およびCM3信号に応動してセレクタ18
20からのD(Tu,T3w)=3信号を受信するよ
うにANDゲート2028によつて付勢される。
ラツチ2032はANDゲート2038によつて
付勢され、信号CM3およびCM4は共に高レベル
であるからセレクタ2030を通してラツチ20
22からのLPV信号を受信する。 D(Tu,T4w)=2信号がセレクタ1820に
よつて供給されたときには、比較器2004,2
014,2024および2034の1,
CM2,CM3およびCM4は高レベルとなる。ラツ
チ2002は2より小であるD(Tu,T1w)=1
信号を含み、ラツチ2012,2022および2
032はD(Tu,T4w)=2より大であるD(T
u,T2w)=3、D(Tu,T3w)=3それにLPV信
号をそれぞれ含むので、このようになるのであ
る。ANDゲート2016は高レベルの1と
CM2信号によつて付勢され、これによりセレク
タ2010はセレクタ1820の出力をラツチ2
012の入力に接続する。ANDゲート2026
および2036は付勢されず、従つてセレクタ2
020はラツチ2012の出力をラツチ2022
に接続し、セレクタ2030はラツチ2022の
出力をラツチ2032の入力に接続する。次のr6
パルスに応動して、ラツチ2012はANDゲー
ト2018によつて付勢され、D(Tu,T4w)=
2信号はセレクタ2010を通してそこに挿入さ
れる。ラツチ2022および2032はまたゲー
ト2028および2038によつて付勢され、ラ
ツチ2012からのD(Tu,T2w)=3信号はラ
ツチ2022に挿入され、一方ラツチ2022か
らのD(Tu,T3w)=3信号はラツチ2032に
入れられる。このとき、ラツチ2002,201
2,2022および2032はそれぞれ1,2,
3および4に等しい距離信号を含んでいる。 次の距離信号D(Tu,T5w)=5は次に第20
図のソータ兼ストアに供給される。D(Tu,T5
)=5信号は第20図のラツチ2002,20
12,2022および2032に記憶されている
距離信号より大であるから1,2,3
および4信号は高レベルである。ゲート20
08,2018,2028および2038は付勢
されないので、次のr6パルスに応じて、これらの
ラツチはいずれも付勢されない。従つて、第20
図のラツチの距離信号は不変である。もし次の距
離信号D(Tu,Tkw)が3以下例えば1.5であ
り、これがセレクタ1820に与えられると、こ
れは第20図のラツチ2002,2012,20
22および2032の距離信号のひとつを置換
え、最大の距離信号がラツチ2032から除去さ
れる。 この1.5距離信号はラツチ2002の1信号よ
り大であるが、ラツチ2012,2022および
2032の信号より小である。従つて信号
1,CM2,CM3およびCM4が高レベルとなる。
この結果、ラツチ2002はANDゲート200
8によつて付勢されず、1の信号はそのままであ
る。セレクタ2010はANDゲート2016に
与えられた1およびCM2の高レベル信号に応
動して、セレクタ1820の出力をラツチ201
2に接続する。次のr6信号パルスによつて、1.5
の距離信号はラツチ2012に挿入される。ゲー
ト2026、ゲート2036はいずれも付勢され
ないから、ラツチ2012の2の信号はセレクタ
2020を通してラツチ2022に送られ、ラツ
チ2022の3の信号はセレクタ2030を通し
てラツチ2032に送られる。基準ワードwにつ
いての最後の距離信号が第20図のソータ兼スト
ア回路に与えられた後では、ラツチ2002,2
012,2022および2032は小から大への
順序でその基準ワードについての最小の4個の距
離信号を記憶していることになる。第20図の回
路は当業者には容易に改造でき、そこにソートさ
れ記憶される距離信号を大幅に増加することもで
きる。 第19図の回路においては、r3からr7制御パル
ス列がパルス発生器1913,1915,191
7,1919および1921によつて発生し、こ
れらが基準ワードの各テンプレートについての距
離信号の発生とソーテイングを制御する。パルス
r6に応動して各テンプレートについてソータ兼ス
トア1825の動作が完了してから、パルス発生
器1921がトリガされ、r7制御パルス(波形2
219)が発生する。このr7パルスはORゲート
1866を通してテンプレート・カウンタ186
0に与えられ、これによつてテンプレート・カウ
ンタが増分され、テンプレート・ストア216の
次のテンプレート信号集合がアドレスされる。テ
ンプレート・カウンタ1860がそのKr+1状
態になるまで、比較器1861からは高レベルの
K4信号(波形2223)が得られる。r7パルスの
後縁に応動したパルス発生器1923からのパル
スと比較器1861からの高レベルのK4信号は
ANDゲート1926を付勢し(波形2225)
これによつて次のr3からr7パルスのシーケンスが
発生する。このようにして、距離信号処理とソテ
イングによつて基準ワードの各テンプレートが評
価される。第22図の時刻t20でテンプレート・
カウンタ1860がKr+1状態に達した基準ワ
ードに対するK番目のテンプレートの後で、比較
器1861からの高レベルのK3信号(波形22
21)とパルス発生器1923からのパルスに応
動してANDゲート1925からR1信号が得られ
る。 R1信号はある基準ワードのすべてのテンプレ
ートが評価されて4個の最小の距離値がソータ兼
ストア1825のラツチ2002,2012,2
022および2032に記憶されたときに生ず
る。ソータ兼ストア1825のこれらのラツチ中
の距離信号の平均は加算器1830、アキユミユ
レータ・ラツチ1833および割算器1836に
よつて得られる。R1信号はパルス発生器193
0をトリガすることによつて平均化を開始し、こ
れは第23図の波形2301に示したr8制御パル
スを生ずる。r8パルスはテンプレート・カウンタ
1860とアキユミユレータ・ラツチ1833の
クリア入力に与えられ、テンプレート・カウンタ
1860をそのKr=1状態にクリアし、ラツチ
1883を0にクリアするように動作する。r8
御パルスの後縁はパルス発生器1934をトリガ
し、これによつてr9制御パルス(波形2303)
が発生する。このとき、カウンタ1860のKr
=1出力はセレクタ1827をその第1の状態に
スイツチし、これによつてセレクタ1827はラ
ツチ2002の出力を加算器1830の一方の入
力に接続する。加算器1830の他方の入力はア
キユミユレータ・ラツチ1833の出力から供給
される。加算器1830からの和信号は、アキユ
ミユレータ・ラツチ1833がラツチ2002か
らの距離信号を含むようにパルスr9に応動してラ
ツチ1833の入力に供給される。 r9パルスの後縁に応動して、パルス発生器19
36はr10制御パルス(波形2305)を発生
し、これがテンプレート・カウンタ1860をそ
のKr=2の状態に増分する。カウンタ1860
からの出力コードは比較器のKr+1=5の入力
より小であるから、比較器1861は高レベルの
K4信号を生ずる。r10パルスの後縁でパルス発生
器1938が出力パルスが生じたときに、AND
ゲート1941(波形2311)が付勢されて、
r9およびr10パルスの第2のシーケンスが発生す
る。第2のr9パルスに応動して、ラツチ2012
の出力はセレクタ2040を経由して、アキユミ
ユレータ・ラツチ1833の内容に加算され、和
がアキユミユレータ・ラツチに入れられる。この
r9およびr10パルスのシーケンスはラツチ200
2,2012,2022および2032からの距
離信号の和がラツチ1833に累積されるまで継
続する。次に比較器1861からの高レベルの
K3信号(波形2307)とパルス発生器193
8からのパルスによつてANDゲート1940
(波形2313)が付勢される。割算器1836
はラツチ1833の累積された和をKr=4で割
算するように動作し、こうして基準ワードw=1
に対する選択された距離信号の平均値が形成され
る。平均D1は未知の発生と基準ワードw=1の
間の類似度を表わしている。 基準ワードw=1の選択された距離信号の平均
値はソータ兼ストア1839に入れられ、これは
大から小の順序で割算器1836からの最小の値
の信号Dnの集合とワードカウンタ1850から
得られた対応する基準ワードの番号を記憶するよ
うに動作する。ソータ兼ストア1839中のDw
信号のソーテイングはソータ兼ストア1839の
ラツチがパルスr2によるのではなく第2図のラツ
チ2002,2012,2022および2032
に与えられたr1パルスによつてその最大の可能な
値に設定されること、r6パルスではなく、r11
ルスがゲート2008,2018,2028およ
び2038を付勢し、ラツチ2002,201
2,2022および2032にクロツクを与える
点を除いて、ソータ兼ストア1825に関連して
前述した動作と本質的に同様である。 基準ワードw=1について選択された距離信号
の平均化が終了し第6図のANDゲート1940
が付勢されたときに、パルス発生器1944によ
つて制御パルスr11(波形2315)が発生され
る。割算器1836からの平均信号D1は認識モ
ードの開始時にr1パルスによつてラツチ200
2,2012,2022および2032に初期に
与えられた最大の可能な値の信号より小である。
比較器2004,2014,2024および20
34のCM1,CM2,CM3およびCM4出力は高レ
ベルである。従つて、r11パルスとCM1信号によ
つてゲート2008が付勢される。次に信号D1
はラツチ2002に入れられる。ANDゲート2
046はまたパルスr11と比較器2014からの
高レベルのCM1出力とによつて付勢されて、従
つてwr=1信号はラツチ2042に入れられ
る。先のr1パルスによつて0コードに初期に設定
されているラツチ2052,2062および20
72は、ゲート2054,2064および202
4が消勢されているので、前のラツチからの0符
号を受ける。 D1信号がラツチ2002に入り、ラツチ20
42の中に対応するwr=1信号が挿入された後
で、パルスr11の後縁はパルス発生器1946を
トリガし、r12制御パルス(波形2317)が発
生する。r12パルスはワードカウンタ1850を
r=2に増分し、パルス発生器1948をトリ
ガする。カウンタ1850はその最終ワードの状
態(wr=W)ではないから、カウンタ1850
からのwr信号を定数W+1信号と比較する比較
器1851は高レベルのW4出力(波形232
1)を与える。ANDゲート1951は高レベル
のW4信号とパルス発生器1948からのパルス
によつて付勢され、これによつてR2信号(波形
2323)が得られる。第1の基準ワードに対す
るテンプレート・ストア216からのすべてのテ
ンプレートT11,T21,…,Tk1が第18図の回路
で処理され、その平均距離信号D1がそれに対応
する基準ワードコードと共にソータ兼ストア18
39に記憶されたときにR2信号が生ずる。信号
R2はパルス発生器1909を再トリガし、従つ
て第18図の認識回路は第2の基準ワードのテン
プレート信号を処理するように付勢される。 認識モードにおける基準ワードのテンプレート
信号の処理は第21図のフローチヤートに示され
ている。第1の基準ワードのテンプレート信号に
ついて述べたように、動作ブロツク2103で示
された距離信号がプロセツサ1803で発生され
る。各テンプレートについての最小距離信号がブ
ロツク2105で示されるように選択され、選択
された最小距離信号はブロツク2107で示すよ
うに、ソートされて記憶される。最後(K番目
の)距離信号がソートされて記憶されるまで、判
定ブロツク2109は第18図の回路を動作し
て、動作ブロツク2103,2105および21
07を経由して現在の基準ワードの次のテンプレ
ート信号を処理する。その基準ワードの最後の距
離信号D(Tu,Tkw)がソータ兼ストア回路1
825で処理された後で、ソートされ選択された
信号Dwの平均値が動作ブロツク2111で示す
ように判定され、平均距離信号が動作ブロツク2
113に示すようにソータ兼ストア回路1839
で示すように、ソータ兼ストア回路1839に記
憶されている先の平均距離信号D1,D2,…,Dw
−1に関連してソートされる。最後の基準ワード処
理が完了するまで、判定ブロツク2115に従つ
てR2信号が得られる。次の基準ワードはブロツ
ク2102で選択されブロツク2103,210
5,2107,2109,2111,2113お
よび2115に従う認識のための次の基準ワード
の処理は第18図に従つて実行される。 最後の基準ワードWについて選択された距離信
号Dwの平均操作がソータ兼ストア1839で処
理された後で、ワードカウンタ1850はパルス
発生器1946からの制御パルスr12(時刻t10
おける波形2317)でそのwr=W+1状態に
増分され、比較器1851は高レベルのW3信号
(波形2319)を生ずる。高レベルのW3信号と
パルス発生器1948からのパルスに応動して、
ANDゲート1950は付勢されて、そこからの
R3信号(波形2325)がパルス発生器195
4をトリガする。パルス発生器1954からの
r13制御パルス(波形2327)は基準ワードコ
ーダ1841に与えられ、これが次にソータ兼ス
トア1839のラツチ2042の中の最小の平均
距離信Dwnioに対応する基準ワードのコード化さ
れた信号を生ずる。これらの動作は第21図のブ
ロツク2117と2119によつて示されてい
る。Dwnioの基準ワードのコード化された信号は
次に未知の発声に対応する基準ワードとしてプロ
セツサ1842に与えられる。 この代りにラツチ2042,2052,206
2および2072中の基準ワード信号を基準ワー
ドコーダ1841に転送し、これからの信号をプ
ロセツサ1842に与えて当業者には周知の文法
的あるいは意味的な解析を行なつてもよい。r13
パルスの後縁に応動して、パルス発生器1956
はフリツプフロツプ1958をリセツトするパル
スを与える。そこから得られた高レベルの出
力信号によつて訓練制御器218あるいは認識制
御器1885によつて新らしい認識モードあるい
は新らしい訓練モード開始することができる。 以上本発明について特定の実施例を参照して説
明した。しかし本発明の精神と範囲を逸脱するこ
となく、種々の変更や修正を行なうことは当業者
には可能であることを理解されたい。例えば、図
に示された種々のハードウエア論理回路はそこに
固定記憶された処理命令を含むマイクロプロセツ
サ装置でおきかえることができる。
【表】
【表】
【表】
【表】
【表】
【表】
【表】
【表】
【表】
【表】
JP54502077A 1978-10-31 1979-10-22 Expired JPS6226040B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US05/956,438 US4181821A (en) 1978-10-31 1978-10-31 Multiple template speech recognition system

Publications (2)

Publication Number Publication Date
JPS55500884A JPS55500884A (ja) 1980-10-30
JPS6226040B2 true JPS6226040B2 (ja) 1987-06-05

Family

ID=25498248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54502077A Expired JPS6226040B2 (ja) 1978-10-31 1979-10-22

Country Status (6)

Country Link
US (1) US4181821A (ja)
JP (1) JPS6226040B2 (ja)
DE (1) DE2953262T1 (ja)
FR (1) FR2440592A1 (ja)
GB (1) GB2056145B (ja)
WO (1) WO1980001014A1 (ja)

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL177950C (nl) * 1978-12-14 1986-07-16 Philips Nv Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak.
JPS55157799A (en) * 1979-05-29 1980-12-08 Nippon Electric Co High efficiency pattern matching unit
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
US4383135A (en) * 1980-01-23 1983-05-10 Scott Instruments Corporation Method and apparatus for speech recognition
US4831653A (en) * 1980-11-12 1989-05-16 Canon Kabushiki Kaisha System for registering speech information to make a voice dictionary
US4384273A (en) * 1981-03-20 1983-05-17 Bell Telephone Laboratories, Incorporated Time warp signal recognition processor for matching signal patterns
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer
US4415767A (en) * 1981-10-19 1983-11-15 Votan Method and apparatus for speech recognition and reproduction
JPS5870287A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
JPS5870286A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
JPS58105295A (ja) * 1981-12-18 1983-06-23 株式会社日立製作所 音声標準パタン作成方法
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
US4509187A (en) * 1982-06-14 1985-04-02 At&T Bell Laboratories Time warp signal recognition processor using recirculating and/or reduced array of processor cells
JPS59192A (ja) * 1982-06-25 1984-01-05 株式会社東芝 個人照合装置
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
US4771401A (en) * 1983-02-18 1988-09-13 Houghton Mifflin Company Apparatus and method for linguistic expression processing
US4790017A (en) * 1983-03-10 1988-12-06 American Telephone And Telegraph Company, At&T Bell Laboratories Speech processing feature generation arrangement
JPS6022283A (ja) * 1983-07-19 1985-02-04 Nec Corp パタ−ンマツチング装置
US4860358A (en) * 1983-09-12 1989-08-22 American Telephone And Telegraph Company, At&T Bell Laboratories Speech recognition arrangement with preselection
FR2560262B1 (fr) * 1984-02-29 1986-08-22 Thomann Chantal Installation pour le ravalement de batiments
US5165007A (en) * 1985-02-01 1992-11-17 International Business Machines Corporation Feneme-based Markov models for words
US4783758A (en) * 1985-02-05 1988-11-08 Houghton Mifflin Company Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words
DE3514286A1 (de) * 1985-04-19 1986-10-23 Siemens AG, 1000 Berlin und 8000 München System zur erkennung einzeln gesprochener woerter
US4980918A (en) * 1985-05-09 1990-12-25 International Business Machines Corporation Speech recognition system with efficient storage and rapid assembly of phonological graphs
US4759068A (en) * 1985-05-29 1988-07-19 International Business Machines Corporation Constructing Markov models of words from multiple utterances
US5774851A (en) * 1985-08-15 1998-06-30 Canon Kabushiki Kaisha Speech recognition apparatus utilizing utterance length information
US4751737A (en) * 1985-11-06 1988-06-14 Motorola Inc. Template generation method in a speech recognition system
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
DE3779351D1 (ja) * 1986-03-28 1992-07-02 American Telephone And Telegraph Co., New York, N.Y., Us
US4882759A (en) * 1986-04-18 1989-11-21 International Business Machines Corporation Synthesizing word baseforms used in speech recognition
US5072452A (en) * 1987-10-30 1991-12-10 International Business Machines Corporation Automatic determination of labels and Markov word models in a speech recognition system
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
US5033087A (en) * 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
JPH03120598A (ja) * 1989-10-03 1991-05-22 Canon Inc 音声認識方法及び装置
US5136654A (en) * 1989-10-19 1992-08-04 Kurzweil Applied Intelligence, Inc. Vocabulary partitioned speech recognition apparatus
US5682464A (en) * 1992-06-29 1997-10-28 Kurzweil Applied Intelligence, Inc. Word model candidate preselection for speech recognition using precomputed matrix of thresholded distance values
FR2696036B1 (fr) * 1992-09-24 1994-10-14 France Telecom Procédé de mesure de ressemblance entre échantillons sonores et dispositif de mise en Óoeuvre de ce procédé.
US5628002A (en) * 1992-11-02 1997-05-06 Woodrum; Luther J. Binary tree flag bit arrangement and partitioning method and apparatus
US5689616A (en) * 1993-11-19 1997-11-18 Itt Corporation Automatic language identification/verification system
US5895447A (en) * 1996-02-02 1999-04-20 International Business Machines Corporation Speech recognition using thresholded speaker class model selection or model adaptation
JP3039623B2 (ja) * 1996-10-28 2000-05-08 日本電気株式会社 音声認識装置
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6076055A (en) * 1997-05-27 2000-06-13 Ameritech Speaker verification method
US6112172A (en) * 1998-03-31 2000-08-29 Dragon Systems, Inc. Interactive searching
US6393399B1 (en) 1998-09-30 2002-05-21 Scansoft, Inc. Compound word recognition
US7120582B1 (en) 1999-09-07 2006-10-10 Dragon Systems, Inc. Expanding an effective vocabulary of a speech recognition system
US6526382B1 (en) 1999-12-07 2003-02-25 Comverse, Inc. Language-oriented user interfaces for voice activated services
DE10011178A1 (de) * 2000-03-08 2001-09-13 Siemens Ag Verfahren zum sprachgesteuerten Initieren von in einem Gerät ausführbaren Aktionen durch einen begrenzten Benutzerkreis
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7231349B2 (en) * 2003-05-30 2007-06-12 Microsoft Corporation Method and apparatus for compressing asymmetric clustering language models
US8874438B2 (en) * 2004-03-12 2014-10-28 Siemens Aktiengesellschaft User and vocabulary-adaptive determination of confidence and rejecting thresholds
CA2621114A1 (en) * 2005-08-30 2007-03-08 Jack I Raffel An interactive audio puzzle solving, game playing, and learning tutorial system and method
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8024193B2 (en) * 2006-10-10 2011-09-20 Apple Inc. Methods and apparatus related to pruning for concatenative text-to-speech synthesis
US20080256613A1 (en) * 2007-03-13 2008-10-16 Grover Noel J Voice print identification portal
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8170874B2 (en) * 2007-07-02 2012-05-01 Canon Kabushiki Kaisha Apparatus and method for recognizing speech based on feature parameters of modified speech and playing back the modified speech
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3521235A (en) * 1965-07-08 1970-07-21 Gen Electric Pattern recognition system
US3770892A (en) * 1972-05-26 1973-11-06 Ibm Connected word recognition system
GB1435779A (en) * 1972-09-21 1976-05-12 Threshold Tech Word recognition
JPS605960B2 (ja) * 1974-04-12 1985-02-14 富士通株式会社 音声認識方式
JPS50155105A (ja) * 1974-06-04 1975-12-15
DE2448908C3 (de) * 1974-10-15 1979-07-05 Olympia Werke Ag, 2940 Wilhelmshaven Elektrisches Verfahren und Schaltungsanordnung zur Spracherkennung
JPS5936758B2 (ja) * 1974-11-30 1984-09-05 富士通株式会社 音声認識方法
US4028670A (en) * 1976-02-06 1977-06-07 International Business Machines Corporation Fetch instruction for operand address calculation
US4028674A (en) * 1976-06-04 1977-06-07 Recognition Equipment Incorporated Automated signature verification system
US4092493A (en) * 1976-11-30 1978-05-30 Bell Telephone Laboratories, Incorporated Speech recognition system

Also Published As

Publication number Publication date
DE2953262C2 (ja) 1988-02-11
GB2056145A (en) 1981-03-11
FR2440592B1 (ja) 1984-04-13
US4181821A (en) 1980-01-01
WO1980001014A1 (en) 1980-05-15
FR2440592A1 (fr) 1980-05-30
GB2056145B (en) 1983-01-26
DE2953262T1 (de) 1981-01-08
JPS55500884A (ja) 1980-10-30

Similar Documents

Publication Publication Date Title
JPS6226040B2 (ja)
US5165007A (en) Feneme-based Markov models for words
KR102134201B1 (ko) 숫자 음성 인식에 있어서 음성 복호화 네트워크를 구성하기 위한 방법, 장치, 및 저장 매체
US5526463A (en) System for processing a succession of utterances spoken in continuous or discrete form
JP3434838B2 (ja) ワードスポッティング法
US6442519B1 (en) Speaker model adaptation via network of similar users
US5046099A (en) Adaptation of acoustic prototype vectors in a speech recognition system
TW514867B (en) Method and apparatus for constructing voice templates for a speaker-independent voice recognition system
JPS61262799A (ja) ヒドン形式マルコフモデル音声認識方法
EP0302663A2 (en) Low cost speech recognition system and method
JPH05216490A (ja) 音声コード化装置及び方法並びに音声認識装置及び方法
Das et al. Bangladeshi dialect recognition using Mel frequency cepstral coefficient, delta, delta-delta and Gaussian mixture model
JPH0535299A (ja) 音声符号化方法及び装置
CN117043857A (zh) 用于英语发音评估的方法、设备和计算机程序产品
USRE31188E (en) Multiple template speech recognition system
Kumar et al. Comparative analysis of different feature extraction and classifier techniques for speaker identification systems: A review
Anusuya et al. Speaker independent kannada speech recognition using vector quantization
Walter et al. An evaluation of unsupervised acoustic model training for a dysarthric speech interface
EP0238693B1 (en) Speech recognition system and method using statistical models for words
Mehmood et al. An overview on speech recognition system and comparative study of its approaches
Hsu et al. On the use of HMMs to recognize cerebral palsy speech: Isolated word case
Wang et al. Automatic segmentation and alignment of continuous speech based on the temporal decomposition model
Pieraccini et al. A coarticulation model for continuous digit recognition
EP0190489A1 (en) Speaker-independent speech recognition method and system
JP6073952B2 (ja) 学習データ生成装置、方法及びプログラム