JPS59501520A

JPS59501520A - 調音音声認識のための装置

Info

Publication number: JPS59501520A
Application number: JP57502755A
Authority: JP
Inventors: ケレツト・ヘンリ−・ジ−
Original assignee: トランス・デ−タ・アソシエイツ
Priority date: 1982-08-04
Filing date: 1982-08-04
Publication date: 1984-08-23
Also published as: DE3279549D1; EP0114814A4; WO1984000634A1; EP0114814B1; EP0114814A1; ATE41544T1; JPH0475520B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は（＋）言語の波形を分析することにより声道の音響特性を測定しくト）言語の波形を声道の転送機能によって分類し各波形のセグメントを所定の調音状態と関連づけることに関する。

従来技術の説明母音は通常フォルマントと称されるそれらの共鳴・ぐターンにより大略分類されることは長期にわたり知られている。研究者によっては、音声を１．　２．　３あるいはそれ以上のフォルマントに区別できればと各人各様に痛感してきた。１９４０年代には、フォルマントおよび、全ゆる形式の言語の発声の間のそれらの動きを図示する装置が考案された。フォルマントは母音においてのみならず、はとんどあるいは全ての音声要素、即ち音素において認められた。全ての音声を表現するのに発行者により十分と考えられる最初の６種類のフォルマントを網羅して、男性、女性、子供の平均的なフォルマント周波数と、その関連の強度について広範なデータが発行された。周知の記憶された基準に対してフォルマントの周波数と運動とを比較するためにパターンをマツチングする方法が考案された。前述のような努力は現在まで続けられてきたが成功の範囲は限定されたものであったものの、ある用途には有用であった。

フォルマントパターンを処理するさらに複雑な装置は機械による言語認識を約束するに至るまでに極めて遅々とした進歩をしてきた。全体的なスはクトルをマツチングする方法と平行して、関連したフォルマントをトラッキングする技術が案出されたが、この技術においてはフォルマントのピークが電子回路あるいはコンピュータプログラムによりトラッキングされる。フォルマントの周波数と、ある場合には振幅とはさらにマツチングならびに分析するため電圧あるいは図形に変換される。また、前述のような努力と平行して、相互相関として知られる直接的な波形マツチング、自己相関として知られる間接的な時間、波形マツチングおよび、若干述べただけでも音声−非音声、ゼロークロシソング、対称、エンベロツブおよびそのスロープといった時間と波形の特徴を抽出する方法に対する実験がなされた。

これらの方法は限定された用途においては限定的に成巧したが、実験者が望む、期待した顕著な成巧には至らなかった。

最近では、研究は線形予測コーディング法に向けられてきている。これらの研究方向は本質的には電気的ハードウェアで対処し、フォーリアとラップレース（Ｆｏｕｒｉｅｒ　ａｎｄ　Ｌａｐｌａｃｅ）による変換方法により分析された作業の裏返しである。最終的には、モソシャ（Ｍｏｓｈｉｅｒ）の米国特許第３．６１０．８３１号に示す最近の研究の一方向は１つの場合に基本的な反転フィルタによる認識方法を達成するために、ウェイトをつけ、かつ合算した遅延音声信号を使用してきた。

調音言語に関する研究と開発は、例えば振幅変調、周波数変調、抑圧した搬送波、単一側波帯および各種形態のパルス変調のように通信システムの開発において広範に使用される分析方法と特徴づけの方法を追従してきた。発声は空洞変調と称しう３る分類に属するが、通信関係文献にはそれについてはほとんど述べられていない。

前述の言語認識方法は全体的に、さらに古い通信技術に対して考案された概念を利用している。その結果、母音は周期的な波形として概括され、言語の音声はその強度あるいは振幅スＲクトルによってのみ特定化される。前記の技術はピッチの差によって、同一の音素における一方の例から別の例に対して発生しうる多数の種々の波形を上手く説明し、かつ対処するものではない。波形の変化の重要な源は声道によって発生する基本波形が移動することにより重複し、音源インノξ ルスのパターンならびに声道の形態に応じてスはクトル差を発生させる重複発生作用によるものと考えられる。したがって、音声の強度あるいは振幅ス投りトルに依存した場合、種々の音声組合せは簡単に分類することができない。

リアルタイムを基準に確実に作動しうる分類装置、即ち音声指令に対して確実、かつ正確に応答しうる装置において調音速度で分類しうる分類装置に対するニーズがある。また、前述のような分類装置は周波帯の幅あるいは時間、またはその双方に関して限度のあるチャンネルを通して音声を伝達でき、発声の種類が伝達でき、次いで受信側で言語に変換される。本発明はピッチに関係なく声道のパターンによって音を分類するので、ピッチによって変化する音声の強度スはクトルに基いた従来技術より優れており、したがって効果的で実用的な言語認識システムの実現を可能にするものと考えられている。

本発明は複数の声道反転フィルタを並列に使用する。このフィルタのバンクにおける各フィルタは、特定の音声に対応する、特定の声道転送機能に相反する複合ツーオーリア（Ｆｏｕｒｉｅｒ）転送機能を有する。（「音声」は典型的には１０ミリ秒のような短い間隔では不変と考えられる一組の音素部分の中の１個を意味する）。勿論、これらの音素部分はより長い時間にわたって不変でありうる。

以下に述べるように、時間と共に変る音素については前記音素部分を基準にして１個づつ概括することにより対処される）。特に、本発明は個々の人の言葉における所定の音声の調音が１個以上の入力インパルスに応答して、発声時の個人の声道の状態に応じて特定の線形フィルタの出方とじて概括しうるという理解に基いている。したがって、本発明における各フィルタは、仮定による声道フィルタに対応するよう構成され、理想的にはフィルタの複合フォーリア転送機能が仮定された声道音声フィルタの複合フォーリア転送機能と相反するよう構成される。

このように、検出すべき形式の非零の音声波形に対して本発明により構成された完壁なフィルタの応答性は、音源の瞬間における単なるインパルスであって、音源のない場合は零である。

声は全体的によく似ているので、特定の仮定した声道に対応するよう構成された声道反転フィルタ分析器は仮定モデルに類似の声道特定を有する等級の音声に対して作動する。しかしながら、本発明のある局面におけるように、チューニングを使用し多数のフィルタバンクを設けることにより本発明を全ゆる人声に応用できるようにする。

本発明によって確認される言語要素は（典型的には１０ミリ秒のような）短時間の音素部分であることが認められる。前記言語要素は時間に伴って変化しない（持続性のある）音素の場合においてのみ該音素に対応する。好適実施例においては、持続性のある音素に対応するよう構成された反転フィルタのバンクはまた、（正確に）時間と共に変化する（変移）音素と近密にマツチングできるものと想定される。この想定は、言語が時間に対して不変の声道モデルのバンク内のモデルを連続して活動化することによりモデル化される、発声の個々のモデルと対応する。しかしながら、本発明は変移音素の測定基準に持続性ある音素の使用に限定されるものと解釈すべきでない。声道反転フィルタが時間に対して不変の声道モデルと正確に合致した場合、その出力が調音モデルの記憶されたインパルスに対応する１個以上の一連のインパルスであるように仮定された。時間に対して不変の声道モデルの各々に対して声道反転フィルタが設けられている。このように、摩擦音波形である入力に応答して一連のインパルスを概括する出力を発生させるフィルタを周知のフィルタ構成方法を応用して構成することができる。同様に、鼻音および母音に対するフィルタを容易に構成できる。また、破裂音、（個々に概括することにより）二重母音、（ある場合には個々に概括することにより）移行音、半母音、および（個々に概括することにより）破擦音に対して満足に使える。

このように、前述の言語要素のシーケンスにより多種タイプの音素を検出し、表示できる。

本発明によって採用されている言語の音声認識モデルは（各々のモデルが所定の音声に対応する）インパルスにより作動し、時間と共に変化しない線形声道モデル）のバンク中の各モデルを順次作動させることにより、言語が前記モデルから発生する波形の総和であり、したがって連続した波形を表示する言語を再生するモデルに関する。重複作用の原理により、直線声道モデルの波形での応答は数個の入力イン／ξルスによる応答の総和に対応する。言語を合成させるこのモデルに関しては、それを線形分析するための関連の方法がある。即ち、非零の入力に応答する場合、特定のチャンネルからの出力はインパルスの間に概ね零の信号を備えた一連の幅の狭いインーξルスである程度までは、前記チャンネルに対応する音声は入力に介在ずみであらねばならない。したがって、本発明によれば、フィルタのバンクにおける各フィルタの入力側は言語の波形入力側に接続されている。そうすれば、各フィルタの出力を検査して、どの出力が絶対値が最小か測定することができる。一般的に、所定時間においてフィルタチャンネルが最小の出力を有する場合、その時点でフィルタノルクの入力側に当該フィルタが検出すべき音声の波形が通常介在するようにフィルタを構成できる。

選定した音声が実際には入力側に介在する波形の音声であることを確認しやすくするために、本発明の好適実施例は所定の短い時間にわたり、最大全体時間に対しいづれのフィルタの出力が絶対値が最小であるか決定し、関連の音声が入力側に介在する音声として特定される。典型的には、優勢な音声がピックアップされる時間は１０ミリ秒近辺である。

さらに、本発明の好適実施例は基本的な音声のス投クトル機７能をプレエンファシスし、低周波数に対して高周波数を増幅する装置を組込んでいる。したがって、全体の音声スはクトルは基本的に平担化され、そのため分析に対して特定の範囲が不当に影響を及ぼすことはない。プレエンファシスフィルタ機能は各声道反転フィルタの一部であって、したがって反転フィルタバンクの構成においてもそのように対処する必要のあることが理解される。また、調時された時間にわたり音声の入力信号を一定のピークレベルに保つために、自動レベル制御装置が使用される。

本明細書に開示した、本発明による装置は音声入力のピッチ成分に対しては、概ね無感応性を備えて機能する。この結果は、本発明が基準としているモデルの結果を考察すれば明らかである。本発明は（各音声に対して異った線形システムを使用しているにもかかわらず）所定のスピーチの音声の調音の間声道が線形システムを形成するものと想定している。このように、音声は一連の入力インパルスに対する線形システムの応答である。

次いで、モデルにしたがいピッチは本質的に、所定音声の調音の間声道に左右される仮定的な線形フィルタに対する入力である音源インパルスのパターンとして理解できる。線形フィルタシステムはその反転性と組合せて、［オールパス（ａｌｌ−ｐａｓｓ）Ｊ特性を有するので、音源のインノξルスの同一パターンは声道反転フィルタの出力側で回収され、前記フィルタの複合フォーリア変換性が仮定の線形フィルタシステムに対して相反してマツチングされる。一方のチャンネルの出力側における音源の狭幅のインパルスのパターンが前記インパルスの発生周波数に無感応の装置により検出される。その結果、本発明により構成された装置の出力は概ねピッチには左右されない。

本発明ではピッチに左右されず、多数の話者による音声の調音に対して全体的に類似の装置を使用しているので、前述したように一人の話者に対する本発明は例えば大人の男性のように広範囲な話者に対しても適用可能である。例えば女性や子供のようなその他の種類の音声は大人の男性に対して測定したものに対して中央の周波数が全体に比例するフォーマットを特徴とする。希望に応じて、これら追加の種類の音声要素は、大人の男性用に構成したフィルタチャンネルと並列の追加のフィルタチャンネルを含むことにより対応できる。このように、声道反転フィルタチャンネルのバンクで表示される各発声要素に対して例えば４個のような数個の追加の代替的チャンネルを含むことができる。典型的な声道の寸法の変化に基く前述の付加的なチャンネルは一般的な人間の種々範囲の話者に対して言語認識を可能とする手段を提供する。

図面の簡単な説明第１図は、調音要素を区別するために使用した並列チャンネルと装置を示す、調音要素を認識し分類するための本発明の好適実施例の概略線図；第２図は調音要素を反転マツチングするために使用する、第１図に示すフィルタバンクにおけるフォルマント反転フィルタの典型的なカスケードゝの概略図；第６図は第２図に示すフィルタのカスケード８において使用可能なフォルマント反転フィルタの簡略化した実施例を示す図；第４α図は単一の音声フォルマントの転送機能を表示する単一の共鳴装置に対する典型的な振幅と位相プロットを示す図；第４ｂ図はフォルマントの反共鳴フィルタの対応する振幅と位相プロットを示し、フォルマントの共鳴と反共鳴要素とを組合せることによりオールパス特性を提供することを示す図；第４Ｃ図は第１図に示す本発明による装置の好適実施例により反共鳴フィルタ要素を構成する上で使用するパラメータを示し、漸近的ゲインＧが１であり、Ｃｘｒｎｉｎが典型的には０２０Ｇであることを示す図；第５図は第２図に示す反共鳴反転要素のカスケードにおいて使用されるフォルマット反転フィルタの実施例を示す図；第６図は第１図に示す本発明による装置の好適実施例による絶対値回路として使用される全波整流器の概略図面；第７図は第８図に示すコン・ξレータエレメントのバンクに対する一定電流源の概略図；第８図は第１図に示す本発明の装置の好適実施例による几コンパレータエレメントのバンクの一要素の概略線図；第９図は、全て第１図に示す本発明の装置の好適実施例による、狭幅の排出パルスに応答して積分器を放電する装置を含む（典型的には１０ミリ秒の）低周波数のクロック時間にわたり二層の入力信号の全体作用時間を測定するために使用する積分器の概略図；第１０図は第１図に示す本発明の好適実施例により、積分された信号を幅の狭い転送パルスに応答してキャパシタに転送しくその転送は積分器の放電作動の開始前に完了）、記憶された信号の低インピーダンス表示を行う単純な標本および保持回路の概略図；第１１Ａ図から第１１Ｅ図までは、第１図に示す最大コンパレータ２２へのｎ個の波形入力の中の１個を展開し、調時された調音時間にわたり特定の全体累積作動時間を示す安定した信号レベルを提供するために第１図に示す最小コンパレータ１８の急速応答二重出力が処理される様子を示す図；第１２Ａ図および第１２Ｂ図は、第１図に示す本発明の好適実施例において、１つ以上の音声に対して同じフォルマットが適用される場合ある種のフォルマント反転フィルタを多数個使用する状態を示す図である。

特定実施例についての説明各図面を詳細に参照すれば、第１図には言語の調音要素を認識し、かつ分類する本発明による装置の好適実施例の基本的要素の概略図が示されている。本装置は、特定の対比しうる声道転送機能を瞬時に認識し、かつ選択する装置と、認識された転送機能を調時分類かつ選択する装置を含む。

音声を瞬間的に認識することは、集約して参照番号１２（１・・・ｎ）で指示する複数の声道反転フィルタのバンクにより達成される。声道反転フィルタバンクは「ル」個の並列の反転フィルタチャンネルから構成でき、各チャンネルは少なくとも１個の複合及共鳴要素を有するフィルタから構成されている。典型的には反転フィルタバンク１２は１０個から１００個のフィルタチャンネルから構成され、前記チャンネルの各々は共通の音声入力に接続されている。各声道反転フィルタチャンネルは、１１所定の音声を話者が調音する場合声道の特定の共鳴状態を複合転送する機能と相反する転送機能を有する。

各声道反転フィルタチャンネル１２（１・・・ｎ）の出力における信号は集約的に参照番号１６で指示し、かつ個別に参照番号１６０’）（）＝１・・ｎ）で指示する全波整流器のバンクの中の１個によりその絶対値を示す信号に瞬時に変換される。各全波整流器１６０）、（ノート・ｎ）は同じチャンネルノにおける同じ番号の声道反転フィルタ１２０）に対応する。

特定の全波整流器の出力は、（ｎ）個のチャンイ、ル１８０）（ノート・ｎ）を有する多数の最小入力電流スイッチコン・ξレータ１８により実施される瞬時選択装置により選択され、その選択はいづれの特定の反転フィルタチャンネルがいづれがの瞬間における最小の出力振幅を有するかを指示する。コンパレータ１８は入力の音声に現われるにつれて仮定した特定の声道フィルタ機能の振動および変移特性を最も抑制する反転フィルタを認識する。全てのコンパレータチャンネル１８０’）（ノート・ｎ）の出力は選択したチャンネルを除き電圧は零である。選択されたチャンネルにおけるコンパレータ１８の出力は零より大きい電圧である。

調音時間に対応する特定の短時間（典型的には１０ミリ秒）に対する主要なチャンネルを決定するために、積分器チャンイ、ル２００’）（）’＝１・・・ｎ）のバンクが設けられている。各積分チャンネル２００）は調音時間にわたりコンパレータ１８の所定のチャンネルＯ）の出力を合算する。調音時間は低周波クロック２４により調時される。クロック２４からの転送パルスは標本装置２１の各標本保持要素２１０’）（ノート・・、ｎ）のパルス入力側に到来する。標本保持要素２１０）の信号入力側は積分器２００）の出力側に接続されている。この出力が要素２１０）で記憶された直後、積分器の出力側２００）はクロック２４かものリセットパルスにより零にリセットされる。次に、積分器は最小コン・ξ レータ要素１８０）からの出力を集積する新しいサイクルな開始する。

一方引続き、最大値のコンパレータ２２がいづれの標本保持要素２１０）が記憶された最大電圧値を有するか決定する。実際には、最大値コンパレータ２２からの出力（７Ｌ）が調音時間にわたり最大の全体時間に対していづれの（ｎ）チャンネルが整流器１６の出力側において最小の信号を有するか指示する。このように、これらの出力はその決定が規則的な速度で行われることにおいて、同期調音測定を含む。

選定されたチャンネルにおいて零以上で、その他の全てのチャンネルにおいては零である出力電圧により最大値コンパレータ２２から決定が指示される。低周波数クロックの各時間（典型的には１０ミリ秒）に対して新規な決定が行われる。

ル個のコン・ξレータ出力の他に、可聴入力において音のない場合応答する調音チャンネル（ｎ＋１）が設けられている。このチャンネルへの入力は「制御」電圧であって、それは通常自動レベル制御要素２８の内部で使用されている。この電圧は各クロックの時間（典型的には１０ミリ秒持続）の範囲内で測定される言葉の振動ピークに追従する。制御電圧が著しい言語音声レベルに対応するレベルを上根ると「静寂識別」装置が「高３い」出力を発生させる。通常この装置は自動レベル制御装置が信号増幅を低下し始める振幅より丁度上位にセットされている。

また、静寂識別要素により発生する抑止信号により「静寂」状態が介在すると全てその他の調音信号の発生を抑止するル個の抑止ゲート２３が設けられている。

静寂識別出力を含む全ての調音出力からなるル＋１個のチャンネルの出力が本発明による調音測定を行う。

前記の測定を反映する出力は、元の調音声道共鳴パターン、即ち所定の言語の音声あるいは静寂のパターンを選定したものとして前記出力を理解する装置に対する入力として使用できる。

積分器の代りにカウンタで代替しうろことを理解すべきである。

調時された時間を分類するプロセスは通常の言語における最高速の調音速度と対比しうる速度であるべきで、その速度は典型的には１００ヘルツ、即ちそれぞれ１０ミリ秒の間隔に対応することが認められている。

さらに、特定の調音フィルタの機能を正確に認識することを可能とするが、本発明による調音認識および分類装置の精神と範囲を必ずしも限定するものと考えら °れないが、言語波形の入力側ろＯと、反転フィルタバ；／り１２への入力側との間にプレエンファシス回路２６と自動レベル制御回路２８とが使用されている。前述のように、プレエンファシス回路は低周波数に対してより高波周数を増幅し、生の言語音声の波の種々の周波数成分を均一化するよう平均化する。平均言語スＲクトルの全体のバランスが得られ、これは声門音インパルスをデルタ関数を示す狭幅のパルスに変換することにより調音の各種形態を区別しやすくし、そのため入力波形の転送機能が音源とは関係なく受動的声道の結果として現われようとする。しかしながら、受動声道の周期的なインパルスの励振により重複作用は存在し続ける。

最近の技術においてはプレニ／ファシス回路は言語処理への使用において周知のものである。プレエンファンスによる出力）ままだ通常のスピーチの波形特性と似ており、そのような出力は高周波数が異常に強調されるものの、まだ人間の耳には聞き分けられる。

プレエンファシス回路は２つの増幅段階を有し、各段階は微分回路として作用する。第１の微分は電気入力が入ってきたときに行われるが、この第１段は１０００ヘルツまでの低周波数の微分に限定され、この周波数以上の周波数の線形増幅に戻る。

３０００−Ｘルツ以上の周波数は微分する必要がなく、第２の微分回路はこの点板上の周波数の線形増幅器となりうる。音声ス投りトルにわたり全ての周波数に対して対比しうる平均的な強度が得られることは言語の正確な分類に対して重要な機能である。

自動ゲイン調整はレベル制御回路２８によって行われる。自動レベル制御回路２８は入力スピーチを比較的一定のレベルに保つことにより、広範なグイナミンクレンジと低ノイズの超精密認識および分類チャンネルの必要性を排除する。レベル制御回路が入力波形に現われる変移および振動特性に干渉しないことが重要である。自動レベル制御回路２８は当該！！コ術分野で共通の特定の良質の制御要素のいづれかでよい。自動レベル制ｌ５御回路２８はピーク振幅を調整し、一方調音入力波形の変移特性を保つようされている。作動時、レベル制御回路２８は最高速の通常の調音速度に対応する、調時された典型的には１０ミリ秒の時間にわたり、その絶対−一りとより入力スピーチ波形を分割することができる。したがって、入力波形のピークの絶対値は２個のクロックパルスの間で測定され、全体のクロック時間の間増幅を決定するために使用される。クロック時間に等しい可聴遅延がピーク測定作様に続き、かつ信号増幅調整に先立って信号チャンネルに供給できる。したがって、スピーチ波形の発声速度部分が本質的に一定のピークレベルに対して調整され、一方その特徴のある変移特性が失われることはない。割り算器は、例えば絶対値回路およびキヤ・ξシタを放電しうる電界効果トオンジスタのような周知の要素と関連して使用されるＡＤ７５１３あるいはその均等物のような要素でよい。

第２図は、実際には参照番号４０−４６で指示するフォルマント反共鳴フィルタのカスケードゝである反転フィルタバンク１２（１・・・ｎ、）の中の１個の可能な形態を示す。反転フィルタ１２（１・・・ｒＬ）は、そのフォーリア変換が１組の言語音声の調音において有効な声道の相反を概括するよう設計されているので実際には声道反転フィルタである。反転フィルタバンク１２は自動レベル制御回路２８から言語入力を受取り、言語信号は反転フィルタチャンネル（１，・・・ｎ）の各々へ入る。各チャンネルはフォルマント反共鳴フィルタの特定の組合せを有する。フォルマント反共鳴フィルタのカスケード８は、本質的には声道の’４定の共鳴である特定のフォルマントの振幅と位相とに応答づる。

当該技術においては、認識に対して重要で、それぞれ明確な周波数範囲を有する４個の主要なフォルマントが知られている。

したがって、フォルマントのパターンは調音共鳴のパターン認識に対する基準を形成する。言語波により搬送される単一の共鳴は数個の異った反転フィルタに近密に関係しているが、１個のフィルタのみが言語波の前記全ての振動要素に近密にマツチングするよう正確に応答するので、音声の調音器官が新しく・音素表示に向かって動くまでは音源のインパルスの間の出方は最小となる。このように、各カスケードゝはフォーリア変換機能において、フォルマント共鳴の特定パターンに対して相反的に対応するよう構成されている。各チャンネルを４個までの、あるいはそれ以上のフォルマント反共鳴フィルタで構成してよいが、必要なフィルタの数はマツチングすべき共鳴のパターンによって決まる。

第６図は例えば４０のような、単純な形式のフォルマント反共鳴フィルタを示し、該フィルタはフィルタのカスケードゝを構成するために使用できる。レジスタ７２および７４を使用した反転作動増幅器７０は入力を受取り、フイービバックループ７８のバント９パスフイルタ７６と関連して作動する。この回路はバント４パスフィルタ自体が増幅しようとする形式の音声に対する反共鳴回路をつくり出す。一連の、４個まで、あるいはそれ以上の前記フォルマント反共鳴フィルタが、言語波で表示されるにつれて声道の特定の状態とマツチングするよう作動する。

第４α図は仮定音声共鳴の振幅および位相特性を示す。これ７は単一共鳴回路の周知の転送特性に対応し、当該技術分野の専問家には言語フォルマントの共鳴特性を合理的に概括するものと理解されている。

第４ｈ図は音声の反共鳴フィルタ要素の振幅と位相特性を示し、第６図に示す如き回路の転送特性て対応する。当該技術分野の専問家には２個のフィルタをカスケード化することによる優勢な周波数が２個の増幅応答の産物である振幅応答を発生させ、位相応答は２個の位相応答の総和であることが周知である。

第４Ｃ図は当該技術分野の専問家によって、第４ｂ図に示す特性を有し、かつ所定組の言語調音要素に対応する反共鳴フィルタを構成するために使用される設計パラメータを示す。

第１表は第２図に示す形態の２０個のフィルタチャンイ、ルからなる１組に対するフィルタ特性についての、初期の最上モードの一覧表である。この中に含むよう選定した音素は、それらが発生した場合、先行あるいは後続の音素とは独立して通常の言語内で持続する音素である。対照的に、音素／ｅ／は例えばＳａｙに含まれておらず、活されると／ｅ／が通常二重母音／ε工ｌ　を形成する組合せである。　ｒｓａｙＪという言葉において／ｅ／を確認するには／ｅ／に対する特定のチャンネルを有さない分析器は、／ｅ／の周波数特性に最も近密にマツチングする一連のフィルタチャンネルに応答するものと考えられる。二重母音に対する分析器の出力は通常／ε工／　と読める。次に／ε工／　のシーケンスが、／工／が後続するバ／は／ｅ／と確認されるというルールに基いてシーケンス対音素の辞典入口によりコンピュータプログラム・に変換されうる。音素対言葉の８辞書における次のサーチがシーケンス対音素工／をｒｓａｙｊ　と（・う言葉として確認する。チャンネルの持続時間ならびに辞典と辞書双方を決定するカウンタは本発明の一部を構成ＩＬｉＬなし・力１、本発明の重要な局面は言葉や節を確認するための発声測定出力を処理する上でのコンピュータ操作の簡便性と速度とにあ私ｔｏｏｋ　／ｕ／４９０　４０　１１００　６０　２５００　１５０　３６００　２１０ｂｏｏｔ　／ｕ／　３５０　３０　９００　６０　２５００　１５０　３６００　２１０ｂｕｔ　／Ａ／６００　３０　１２００　６０　２５００　１５０　３６００　２１０ｈｅｒ　／ａ／４５０　３０　１４００　６０　１７００　１５０　３６００　２１０発声された摩擦子音ｙｏｉｃｅ／ｖ／３５０　９０　１１００　６０　２２００　１５０　３６００　２１０１）　第１のフォノがント」岳＆を’ｉ、：Ｙイ上第３のフォルマント第４の７オノはント注：フオルマント反共鳴フィルタはその中央周波数において漸近ゲイｙＧ＝１．０、Ｇｍ１ｎ＝０．２０を有する。

第５図は第６図と類似であって、前述のフォルマント反共鳴フィルタと同様に作動する反共鳴フィルタ回路８０の好適実施列を示す。７４１型の集積回路８２とその関連のレジスタ８４゜８６が入力波形が入ると増幅機能作用を行う。第２の７４１集積回路８８．その関連のレジスタ９０，９２．９６　および関連のキャパシタ９８，１００が、特定の声道フォルマントとマツチングし、かつ波形及共鳴機能を提供するよう集積回路８２にフィートゝバックするフォルマント　ノξ ントゝ、ノミスフイルり機能を果す。集積回路８８とその関連の要素とはマルチプルフィートノミントの構造上特定フォルマントの中央周波数と周波帯幅に応じて変わる。特定のフィルタの周波数と周波帯幅とはキャパシタ９８と１００を比例的に同時に変えることにより変更できる。また反転フィルタ回路は可変の周波数と周波帯幅を有するよう構成してもよい。レジスタとキャパシタとを予め選定することにより各種フォルマントの周波数や周波帯幅を初期セットしたり変更するには、周知のバーブラウン（Ｂｕｒｒ　Ｂｒｏｗｎ）ハンドブックを含む多（のハンドブックを参照すればよい。

本発明によれば、反転フィルタの各カスケードは、言語信号が一連のデルタ機能に近づく該当チャンネル上で明確な信号を発生させるよう、ある声道形状から発生する言語信号と相反的にマツチングするよう組合わされて構成されている。全てのフォルマント反転フィルタ回路８０は、各々の回路のレジスタとキャパシタの値が特定組の発声共鳴に対して変化し低効率サイクル音源インパルスの間で最小の出力を発生させることを除いては概ね類似している。第５図に示すフォルマントフィルタは第２図に示すカスケードの中のほんの１個のフィルタであることに注意すべきである。

以下の問題は本発明によって反転フィルタバンクを構成する上で考慮すべき領域を述べる。

Ａ．各フィルタの適正応答性を設定する方法各話者に対してフィルタの適正応答性を設定するには数種類の過程が必要である。それらは、１、言語音声ライブラリの選定１２　対応するインパルス応答の記録３　声道転送機能の計算４　声道反転フィルタの計算５　反転フィルタの計画１　言語音声ライブラリの選定本発明に対する入力は連続した発声過程を個々に概括したモデルから出発する。

前記モデルの声道フィルタは例えば英語の持続性のある音素あるいは前記音素の部分集合を表示するよう構成される。英語の持続性ある音声は（大略）母音（ハ／。

摩擦音（／Ｓ／．／Ｉ／．Ｉｆ／．／＋１／．／ｈ／）、発声される摩擦音Ｃ／Ｚ／．／Ｖ／．／６八ハ／）、および鼻音（／ｍ八へｎ／，／Ｄ／）である７前記の中あるものは、例えば／ｆ／やハ／　および鼻音　／ｍ／．／ｎ／，／ｎ／　のように音響−発音レベルにおいて同じ音声として処理しうる。当該技術分野においては、前記後者のグループ内に入る要素は、隣接する母音に対して、あるいはそこからの発声上の変移を基準に区別しうる。

２　声道インパルス応答の記り所定の人が発音する所定の音声の認識基準を設定する基本的な測定方法は声道インパルス応答で、次にフォーリア変換による声道転送機能である。声道インパルス応答は「人工喉頭」を使用することにより、あるいは音源インパルスを声道へ導入するために声道へ挿入された変換器により所定の人間から確認できる。その結果としての出力は唇からある距離をおいたマイクロフォンを介して記録できる。前記方法の重要な要件は（声道がフィルタとして扱われる場合）フィルタ応答に何らオーバラップがないようにするに十分イン・ξルス速度が遅（されることであるっフィルタのインパルス応答を定義すれば単一の（理想的な）インパルスに応答するその出力である。音源の多数のインパルスによりオーバラップが発生すると、出力はインパルス応答を正確に表示していない。ピッチの低い話者の発声音は極めてオーバラップの少ない一連のイン、ａルス応答として現われるので、それらは声道転送機能、次に反転フィルタバンクを得るため直接使用しうる。

プレイバックセグメントを選定するために、カーサを備えたデジタル記憶オ／ロスコープのような波形記録装置を声道インパルス応答ライブラリを収集するため使用できる。

前述の方法は声門で励振した母音やその他の音声に特に適しているが、摩擦音の場合は適用可能でないかもしれない。これらの場合、発行されたデータ、あるいは出力を聴きかつそれを目標とする音声の記録と対比しながらパラメータを調整し５る言語モデルの出力によればよい。勿論、この方法は反転フィルタバンクを構成する上で使用するパラメータを確認する主要な方法として使用しうる。言語処理技術の専門家であれば、言語合成に使用され、かつ特に「ターミナル　アナログ　スピーチ合成装置」として周知の装置に使用されてきた前記方法を利甲しうるであろう。

前述のことから、−人の話者が話す基本言語音声の選定した営業に対応する一組のイン・ξルス応答が得られる。各音声のインパルス応答は最初は振幅の大きい振動を有し、徐々に、数ミ２３９秒（１０ρ）ら２０ミリ秒）で基不的に零まで消滅する。声道イン・ｅルス応答を測定する上での重要な配慮は、応答波形が単一の音源イン・ξルスによることである。近接する音源インパルスからの重複による何もがの影響が記録された結果において誤差を生ぜしめる。

３　声道転送機能の計算事実、言語音声のライブラリに対応する前述の組の声道インパルス応答はかなり複雑な突発性があり、これは時間の関数として電圧により表示され、かつ実際には短い（２０ミ１，１秒程度）、音声の突発（ｔ＝Ｏ）　から始まり、全ての振動が本質的に消滅する（ｔ−１ｈ）まで続く音声部分により概括しうる。インパルス応答の組は、ブラウン管上に表示されるインパルス応答から撮った写真のようなグラフ形態で存在するか、あるいはコンピュータ記憶装置に標本化され、かつコートゝ化された形態で記憶できる。

声道転送機能は声道インパルス応答のフォーリア変換である。

ル番目の言語音声ライブラリに対応するル番目のインパルス応答がｇｎ、（ｔ）により表わされるとすれば、対応する声道転換機能Ｇｎσ）は下式で表わされる。

Ｇｎ（ｊ）−戸　ｇｎ（ｔ）ｅｘｐ（２πｊｆｔ）ｄｔこれは周波数の複合関数であって、Ｇｎσ）−Ａｎσ）＋７’ＢｙＬσ）で書きかえてもよい。当該技術分野の専問家には、音声共鳴器の特性により、Ｇ７Ｌσ）は有限であって、言語が占める周波数範囲にわたり、非零であって、従い有限で、かつ言語の周波数範囲にわたって複合反転性を有することが判る。

４　声道反転フィルタの計算Ｇび）−Ａ（７″）ｌ’Ｂ（イ）の転送関数を有する所定の音素に対しては、声道反転フィルタは前記関数の相反形である転送機能を有する。

即ち、声道転送機能は言語処理技術の専問家によりインパルス応答から簡単に計算できる。声道転送機能は図形におけるプロットの対（実際と仮想）として、あるいはコンピュータ記憶装置において標本、かつ復号したデータの複合アレイとして表示することかできる。

５、反転フィルタの計画ネットワーク合成およびフィルタ設計における専問家は前述の複合機能に近密に対応してフィルタを容易に構成できる。好適実施例においては、反共鳴が声道の転送機能における共鳴と対応した反共鳴フィルタのカスケードとして設計される。したがって、実際の作動において、声道転送機能と反共鳴フィルタの特定カスケードの間にマツチングが行われ、その結果、１、周波数の平坦スペクトルが支配的であり、２９時間間隔における音源インパルスが支配的となる。フィルタのカスケードにおける特定の要素は、対応する声道転送機能プロットから測定した中央周波数と周波帯幅と反転マツチングするよう構成できる。

中央周波数と周波帯幅とが調整可能とされることを除いて声道の周知の特性にしたがって装置が構成されることによって、５所定の音声がフィルタの中央周波数と周波帯幅とを試行錯誤式の調整によりつくり出せるようにする方法が可能である。前述の調整は記録された音素の連続的繰返し、詳しくはある数の言語音声ライブラリに対する装置と関連して行われる。

合成された音声が記録された例と近似する場合、その・ξラメータ、特に種々共鳴の周波数と周波帯幅とを測定、かつ書き留めることができる。前記測定目的に使用する装置は、本質的に端子アナログ言語合成装置であって、その構造は当該技術分野では周知である。

また、各種反転フィルタのパラメータは調整可能の反転フィルタのカスケードを含む装置によって確認できる。この方法により、声道インパルス応答、あるいは声道転送機能のいづれかを得る必要はなくなる。反共鳴の周波数と周波帯幅とは入力音素がテープループあるいは波形レコーダにより連続的に繰返されている間に調整される。その出力はオンロスコープにより観察でき、かつオンロスコープで観察される、出力の振動特性を最小にするため反共鳴が調整される。前記調整は試行錯誤により行う、必要がある。前記調整の各々は、全ての振動要素が除去され、音源の波形のみが残るようになるある組合せが見出されるまで続々と調整されろ。

Ｂ、フィルタバンクの適゛正応答を設定する方法音響音素認識のために反転フィルタバンクを構成する場合の重要な配慮は正規化の方法であって、それにより特定へ・づれかの出力に対して何ら素地のないことが確実にされる。正規化方法は本発明に対して入力を提供する調音モデルに対して、ロスレスフィルタの概念を適用することに基いている。

１、　フィルタバンクの正規化フィルタのバンクの適正応答を設定するために使用しうる理論的な方法は「ロスレス・フィルタ」理論に基いている。厳密にいえば、この理論は入力エネルギと等しい出力エネルギを有するフィルタに適用される。また、この理論はエネルギ損失が一定の場合、即ち本発明のように全ての声道フィルタ内での損失が零と想定しうる場合にも適用しうる。

音源イン・ξルスＩ　（ｔ）が狭い場合を検討する。

入力としてロスレスフィルタに適用されると、フィルタの応答Ｒ（ｔ）は以下の通りである。

第１のロスレスフィルタの相反であり、該フィルタとカスケード形態である第２のロスレスフィルタの場合、工／ｌ）に対するカスケードの応答■ｏ（ｔ）は音源のインパルスＩ　（ｔ）が再生されるようなものである。即ち、Ｖｏ（ｔ）− Ｒ（ｔ）’Ｒ（ｔ）−Ｉ（ｔ）　※ハ回旋を示しＲ１（ｔ）は反転フィルタのイン・々ルス応答である。

声道モデルはロスレスフィルタのバンクであって、反転フィルタバンクがロスレスフィルタから構成されているので、正確にマツチングされた反転フィルタの出力における全体的な結果は元のエネルギを備えた音源インパルスを再生していることである。このように、このチャンネルにおいては再生したインパルスの間の波形活動はほとんどない。ここで、実用的な認識装置が機能する状況によって、唇からマイクロフォンまでの距離２７により音声の減衰と遅延があるが、これは全ての音声に対して一定であって、したがって、システムの作動を理解する上で重要でない。

反転フィルタバンクを構成する場合、ロスレスフィルタ理論に一致するよう注意する必要がある。完全な反転フィルタ（フィルタのカスケードゝでもよい）の各々の転送機能ＲＮ（ｆ）はζＲＮ（１）ＵＮ（７％ｆ−一定　という特性を有する必要がある。

ＲＮ（７′）はＲＮ（７′）の結合である。実際には、これは一定の「ホワイトノイズ」入力電圧に応答する一定の出力即ちＲｍｓ電圧に対応する。各フィルタの出力においてゲイン調整が行われ、ホワイトノイズを入力側に供給することにより最終調整が行われ、がつＲｍＳ電圧計において一定の出力に対してフィルタが調整される。

当該技術分野の専門家には、ロスレスフィルタ理論に基（前記手法を使用することによりフィルタバンクが正規化されることが理解される。したがって、このように確認されたフィルタは、そのために反転フィルタバンクを設けた全ての言語音声に対して素地をもつことなく応答する。

２　正規化におけるスペクトル平坦化の役目特定の言語の音声に対する何らかの素地を阻止するために、特にフィルタバンクの正規化において本発明によるモデルを構築し、かつ使用する技術における専門家には反転フィルタとスにクトル平坦化との関係を理解することが有用なので、本明細書ではスはクトル平坦化の問題を含めている。

言語認識の技術分野における専門家には、多数の人々に対する平均的な言語スペクトルは平担ではな（、そのピークは言語スペクトルの低重近くにあることが理解される。この周波数特注は唇における放射特注により若干緩和された、声門音響源の特注によって生じるものと理解されるスペクトル平担化を行うことにより言語の波があたかもインパルス源によって発生したように現われる。

プレエンファシスあるいはスペクトル平坦化機能は本質的には、各反転フィルタの一部であって、声門および摩擦音の音源の波形ならびに唇による音声エネルギの放射によるスペクトル作用を補正する。第１図に示すプレエンファシスのブロック図は声門波形および組合わされた放射特注を変換するため反転フィルタを概括する。声道反転フィルタは全ての反転フィルタチャンネルの前記共通要素を反映しないようにされている。

スペクトル平坦化を適用すると、スペクトルの全ての部分振幅を音響音素の確認の重要性と対応させようとする傾向がある。

また平担な長時間の平均的なスペクトルを声道反転フィルタのバンクの入力に概括化させ、その結果、全体の正規化に対してフィルタチャンネルを調整および（または）試験する、即ちフィルタバンクに対して平担なスペクトル（ホワイト）ノイズを適用し、かつ必要に応じてゲインを調整し全てのチャンネルから同じＲＭＳを得るための実用的な手段を提供する。

３、実用的な実施方法フィルタバンクの各々がロスレスフィルタであり、あるいは各々が一定のロスを有するように構成されたフィルタパン９りは、他の音声に対していづれの音声についても選好性の素地が最小にされているという意味ですでに正規化されている。実際には、適度の正規化に対してフィルタバンクの各要素を試験および（または）調整する手段を提供することが望ましい。

プレエンファシスまたは「スにクトル平担化」が作動することによって、声道反転フィルタのバンクの入力に平担な長時間の平均スペクトルを概括化する。フィルタバンクの正規化のための試験は全体のバンクにわたり（理想的な場合零において）ロスを均等化する試験と解してよい。ロスの均等化はプレエンファシスおよび各フィルタ出力におけるＲＭＳ電圧の測定の後フィルタバンクにホワイトノイズを適用することにより試験できる。全てのＲＭＳ出力が等しい場合、フィルタバンクは適度に正規化され、かつ素地な（、入力言語音声に応答する。

Ｃ１発声タイプのマツチング発声の１タイプ」とは声道の種々の特注および音声情報形成における前記時１の変化といえる。発声過程における２つの音響的に重要な要素は１）音響源と２）音響源に作用する声道の形状である。また、発声の「タイプ」は言語方言、アクセントを含む言語のタイプならびに例えば強調したり、ささやいたり等のより個人的で、かつ表現上の言語の特性ともいえる。

１、調音モデル「調音のタイプ」の規定は最も適切には音源の特性あるいはタイプといえるが、調音の場所や、言語を調音することに関連する生理学的なその他の中味に関してそれ以上細く分割できる。

事項の応用は、音源の存在する調音のモデルと、言語の明確な音声の各々に関連した声道フィルタに基いている。ある種の音声は調音動作の結果であるが、個々の概括を経たモデル、即ち一連の適当な音素モデルを活性化することによって対処される。

当該技術分野の専門家には調音器官を働かすことにより音素の知覚性が持続性のある音素からとった一連の短（接続されたセクメントによって模擬しうろことが理解される。

２、音響の音源タイプはとんどの言語の調音に関係する音源は３つのタイプがある。

それは１）声門音２）摩擦音および３）破裂音である。声門音の音源は一連の略周期的なインパルスを発生し、一方摩擦音は一連のランダムなインパルスを発生させる。モデルの破裂音の音源は単一のインパルスを発生させる。本発明はピッチあるいは音源のパターンに関係なく、一連の声道フィルタを確認する方法である。声門音源によりつくり出される音声の場合、本発明は所定の音声を、デルタ機能を近似化する狭幅のインパルスである、音源インパルスを最もよ（再生する反転フィルタチャンネルを選定することにより所定の声道形状によりつくり出されるものとして検出する。好適実施例においては、前記検出は再生されたインパルスの間の最小の波形活動を検出することにより行われる。最良の音源インパルス源ス生はそのインノぐロスのパターンに依るのではないため、本発明は種々タイプの音響の音源によっつ（り出される種々タイプの調音をマツチングさせることができる。

３、調音器官本発明を理解すれば、音声の調音器官は種々の形状を伴って３１運動し、そのため音響源の１つから発生する音響信号に音声上の情報を付与することが判る。摩擦音や破裂音の場合、同じものが音源および調音器官の双方として作用しうる。発生は主として、舌、唇およびあごの運動を介して行われる。舌は硬口蓋、歯肉の隆起および歯と共に音響空洞を形成する。怪は母音を宮を丸（して発音する場合歯と共に、かつ歯に対して作用する。

下あごは、ある子音の調音の間上下に運動し、かつまた特徴のある母音の共鳴を形成する１つの要素である。調音における別の要素は鼻音による子音の形成において軟口蓋により鼻の空洞を結合させたり離すことである。

本発明は声道の形状およびその変化によっつ（り出される種々タイプの調音をマツチングさせることができる。本発明による声道反転フィルタは各々の明確な持続性ある音素を直接マツチングできる。当該技術分野の専門家には、調音器官を動かすことによっつ（り出される言語音声は接続性ある音素の一連の接続されたセグメントにより近密に概括化でき、したがって、反転フィルタのライブラリは、着実で、かつ運動する調音器官により調音を近密にマツチングできる。

４、言語および方言反転フィルタバンクは明確な持続性のある音素にマツチングするよう構成されて〜・るので、特定の言語や方言に対して適正化されていることは勿論である。ある場合には、２種類の言語あるいは方言の発声要素が、その双方に対して１個のみのフィルタバンクで要を足すに十分類似であるかもしれない。その他の場合には、特定の言語あるいは方言に対して適正化したフィルタバンクを構成することが望ましいかもしれない。

異る方言や言語が調音の１タイプ」と考えられるという観点から、それらは３種類の方法の中の１つによりマツチングできる。即ち、１）別の言語あるいは方言を概ねマツチングさせるため１つの言語または方言に適正化したフィルタバンクを直接的に使用すること、２）別の言語あるいは方言に対して適当に作用するよう１つの言語に対して適正化されたフィルタバンクのフィルタエレメントを追加および（または）代替することにより修正を行うこと、あるいは３）新規の言語または方言に適正化された新規のフィルタバンクを構成することである。前記３種類の方法の１つを使用することにより、本発明は異る言語や方言によってもたらされる種々タイプの調音をマツチングできる。

５、異常形態および表現のタイプ最も近代的な言語は基本的に同じ全体的な方法により調音されるが、欧州の言語群内でさえも、調音過程での全体的な特質においてではないものの、ある種の際立った差異がある。その差異は喉音音声、声門停止音および子音群を使用した場合に発生する。本発明をこれらの形態に適用した場合何ら困難はない。

しかしながら世界のある地域の隔絶された人々によって使用される、口笛や、トーンおよび擬音語のタイプがある。しかしながら、これらは言語として明確に分類することは不可能なので、本明細書では調音の「タイプ」として扱わない。

人間はその音声のトーンにより広範囲の感情を表現することができ、かつその声を種々の音響環境に適合させることができ３る。これら表現タイプのあるものは１）強調したスピーチ、２）叫び３）がん高い泣き声４）もぐもぐいうこと等である。はとんどの部分に対してはそれらは南道内の各種の筋肉を緊張させることにより制御され、そのため声門の波形および（または）調音の間の口腔の空洞の硬直性や精密性を変える。これら種々の表現タイプをマツチングさせるため本発明の使用において採られる方法は　１）通常の調音に本来の構成を合わせる２）種々の表現タイプからの例を用いて作動試験する３）初期のセツティングにより確実に認識されない調音要素を網羅するためフィルタチャンネルを修正、および（または）追加することである。１つの特定の表現タイプに対する性能を最大にするニーズがあるとすれば、該タイプを基準にフィルタバンクを構成することは可能である。したがって、本発明は感情ならびに環境から出しる調音の各種タイプをマツチングさせることが可能なることが判る。

ささやくような調音の場合も同じ基本的方法を採ることができる。もつとも、この場合は通常の調音において声門の振動により励振される音声は声門の抑制部を通過する空気により励振するが、空洞の配列は双方の場合同じであって、したが（・調音された言語とささやかれた言語の双方に対して同じフィルタバンクで十分である。ささやかれた言語に応答する本発明のフィルタバンクの出力は一連のランダムインノξルスである。回収されり狭幅の音源インパルスな除いて、最小の波形活動を有する出力チャンネルは認識された調音種類を指示する。

Ｄ０人声タイプのマツチング本発明は人の声のタイプを３種類の方法の中の１つによりマツチングできる。

１　ある場合には、ある人に対するフィルタバンクが他の人の声のタイプに対して十分機能する。

２　ある場合には、ある人の声のタイプに対するフィルタバンクを、他の人の声のタイプにも十分機能するようフィルタを追加、代替あるいは並列に使用して修正することができる。

３、ある場合には、著しく異常の声のタイプを網羅するよう全く新規のフィルタバンクを構成する必要がある。

人の声の種々のタイプをカバーするための付加的な方法があタバンクがいづれかの周知の１つの声あるいは声のタイプに対して良好な性能を提供するように構成された多数のフィルタバンクが提供される。

ｂ、調整可能フィルタバンク認識により、例えば平均的な男性と女性との間に見出されるように、声道寸法の差を補正するようフィルタバンクの全ての反共鳴性が同時に調整可能である。

Ｃ１個々のパラメータによる方法により、反転フィルタバンクの全ての反共鳴註に対して均等に、個々のフィルタが調整され、そのため当該活者に対して適度の性能を達成するため個々の活者に対して）ξラメータが調整できる。

８０人の調音スタイルのタイプのマツチング■、　ピッチおよびピッチ抑揚調音スタイルのこれら要素は、前述した本発明による基本的３５なピツチ不感応性により対処される。

２、調音速度本発明の調音速度に対して決定した速度は通常の最も速い調音速度に追従するに十分速いものと想定される。したがって、調音認識装置は調音過程の十分詳細な画を提供するので、入力とじての調音の全ての意味を抽出し、かつ認識するようより高レベルの処理を行うことができる。

３　強調と明確さ強調された調音は相手に判ってもらうよう意識的な努力の結果として現われ、強調されていない調音よりさらに明確であると考えられる。本発明は、強調された、即ち明確な調音に対して構成しうろことは勿論であるが、それらは通常の調音の変形とも感じられ、したがって通常の調音に対して構成されたシステムによって多分認識可能である。

４、かすれた調音およびささやく調音かすれた調音は通常の発声の変形と考えられるが、他方ささやかれた調音は、概ね周期的な声門の音源の代りにノイズ状のランダムインパルス発生源に代替する。本発明は音源インパルスのパターンに対しては不感応団として示してきたので、ささやかれた調音に応答することは可能である。

一時第１図を参照すれば、全波整流器１６は、その各チャンネルの声道反転フィルタカスケードゝの出力側における修正された言語波形を一方向性の形態に変えている。第６図に示すように、第１図の全波整流器１６は７４１型集積回路１１０と、その関連のレジスタ１１２．１１４およびダイオード１】６．１１８により実施できる。全波整流器は、いづれがの瞬間に対してどの反転フィルタカスケ −Ｖｌ　２（ｊｌ　（ｊ　＝　Ｉ　−ｎ　）が最小の絶対値出力を有するかをコンパレータ１８が決定しうるようにする信号を提供する。

（ｒ］）個のチャンネルを有する第１図（ＩＣ示す、マルチプル入カ電流スイツチコンパノータ１８はいづれかの瞬間に対して最小の絶対値回路出力を選定、かつ決定し、それ自体の出力信号によりチャンネルを指示する。いづれかの瞬間に対して、唯一個の反転フィルタが零に近い最小出方を有し、そのため対応する１個のコンパレータの出方が絶対値回路を介して可能とされる。

実際には、コンノミレータ１８は単に、マルチゾル入力電流スイッチである。

コンパレータ１８の目的は、ｎ番目の反転フィルタ信号を表わすｎ番目のチャンネルから、最小の絶対値を有するものを連続的、かつ瞬間に選定することである。ｎ番目のコンパレータの出力側の信号はバイナリの形態であるが、瞬間作動のため狭いスパイクと、種々の長さのパルスを含む。瞬間性のコンノミレータは５Ｈｚ程度の速度で切換えることが可能であるべきである。

参照番号１２４は番号１８の一部であって、一定の電流源として作動するトランジスタである。作動の詳細は第７図参照のこと。「ＯＮ」　状態におけるエミッタ電圧ＶＢＥへのベースは典型的にはシリコンＰＮＰ　）ランジメタタイプ２Ｎ３９０６用の一〇、８ボルトである。ＶＢはデバイダレジスタＲ１およびＲ２によりＶ＋よりさらにマイナスの２から３ボルトに選定される。

７次に、エミッタの電圧■ＥはＶＥ、、ＶＢ−ＶＢＥ　Ｋより与えられるので、Ｒ３で展開した一定電流ＩＣは次式から与えられる。

トランジスタタイプ２Ｎ３９０６　の高度のｎｆｅＫより、ベース電流１Ｂは負荷電施工りよりはるかに小さく、したがってＩＬ、ＩＣは第８図における電流スイッチトランジスタ１２２の全体バンクに対する一定電流供給を行う。

さて第８図を参照すれば、第１図に示すコンノルータ１８ｆｊｌカ示すれている。コン／ぐレータエレメントのバンクにおける各トランジスタ１２２のエミッタは第７図に示す一定電流源トランジスタ】２４に接続されている。また、電流スイッチトランジスタ１２２は「ＯＮ」　状態で、ＶＢＥ＝−０，８ボルトのタイプ２Ｎ３９０６　）ランジスタである。トランジスタ１２２への入力電圧■１の１つは他のいづれ峡してよりも負であるためＶＥ−騙（Ｖｉ　）　＋　０．８　Ｖまたはｍｉｘ　（Ｖｉ　）　−ＶＥ＝　−０，８ボルトである。

その地金てのトランジスタのエミッタ電圧に対するベースは下記によって得られる。

Ｖｌ−ＶＥ）−０，８ポル）、Ｖｉｆ騙（Ｖｉ）Ｋ対して。

これは、前記トランジスタにおいて電流を遮断する方向であり、したがって、全体電流は一定なのでｍｍ（Ｖｉ）を有するトランジスタにおいてさらに電流は増える。入力としてＭ（ｖｌ）を有するトランジスタは一定電流源トランジスタ１８により供給される電流のほとんどを導く傾向があり、その他のトランジスタはその特注曲線の曲がりにより全体の一定電流Ｉｃの中のはるかに小さい比率を占める。

入力として１１１１１１（ＶＬ）を有するものを除いて第８図に示す全てのトランジスタ１２２は遮断されるか、その方向に行く傾向がある。遮断されるトランジスタはそのコレクタにおいて本質的ＫＶ−であり、これがＮＰＮ　トランジスタタイプ２Ｎ３９０４　である対応するエレメント１２６０ベースに供給される。また前記トランジスタのエミッタ１（ｖ−が現われ、ＶＢＥχ　０であって、それらは接触しない。最も激しく導電しているトランジスタ１２２は対応するトランジスタ１２６０ベースによす少ない負の電圧を供給して該トランジスタを導電し、前記一方のトランジスタのコレクタに負の電位差を提供する。トランジスタ１２２の入力側に正のフィードバックが供給され、そのため作動ポイントがわづかに移動することを犠牲にしてより堅実な決定が行われる。本質的には、前記線図におけるフィートゝバックレジスタはオーム値が太き（（典型的には１５０にΩ）、後続するレベル検出回路に著しい影響を与えない。また、オーム直の小さいレジスタ（典型的には１００Ω）のエレメント１２０は正のフィードバックネットワークの一部として使用され、全ゆる瞬間において最小入力の明瞭な決定を保証するよう入力信号のバランスな極わづかに変える。

いづれかのエレメント１２６が非導電性のとき、タイプＬＭ３１１、またはタイプＭ３９９の１／４でよい集積回路コンパレータ１２７の（−）入力側にレジスタを介して電圧入力】３２にお３９いて正の電圧が供給される。（−）入力に供給される正の電圧は、対応するエレメント１２６が非導電のとき（ト）入力に供給されろ基準電位差よりも大きい（より正である）必要があり、その結果ニレメン目２７からの出力は零となる。

エレメント１２６が導電しているとき、そのコレクタは負となり本質的には■− までとなり、その結果、入力１３２から電圧の効果は零となり、負の電位差がエレメント１２７の（−）入力側へ送られ、その出力を完全に正とさせる。ダイオ −）１２８は（−）入力側を過度に負の電圧から保護する。

第１図に示す積分器のバンク２０は、その中の１個を第９図に示す（ｎ１個のチャンネルを有する。

第９図に示す各積分器エレメントは、対応する最小のコン、２レータエレメントから出力を受取る入力側を有し、積分器エレメントは、フィードバックループ′ １４２にお号・ては、反転入力側て対して直列のレジスタ１４１とキャパシタ１４４を備えた、高インピーダンスの入力作動増幅器１４０を含む。この回路を言クロックされた時間コンパレータチャンネルの作動を、全体時間の中のクロックされた時間の終りに指示する線形積分器である。積分器バンク２０の各要素は、電界効果トランジスタの入力で作動する増幅器タイプＬＦ１３７４１　（参照番号１４０）であって、フィードバックループにおけるキヤノ々シタ（参照番号１４４）と、第１図に示すクロック２４からのクロックリセットパルスに応答してキャパシタを放電するようキャノξシタを横切ってＡＤ７５１３の捧の二重アナログスイッチから構成されるアナログスイッチとを備えている。反転入力は充電レジスタに対して事実上アースとして現われるので、積分は線形である。集積出力レベルは、入力パルスが常に正あるいは零であるのでエレメント１４００反転により掌に負となる。調音速度をクロックした時間の終りと、アナログスイッチ１４６により積分器をリセットする前に、最大値コンパレータ２２の入力側における積分レベルは第１０図に示す標本保持回路（（より第１０図に示すキャノ々シタ１５０へ転送される。前記キャ／々シタは次のクロックされた時間の間前記レベルン保持する。先行する最小コンパレータ１８のＯＮの状態での積分値はクロック時間全体にわたりその全体値でキャノξシタ１５０において保持され、最大値コンパレータが各調音時間に対して、最高即ち最大の積分信号を選定できるようにし、そのため１つのクロック時間における支配的な反転フィルタチャンネルを確認し、次のクロック時間の間その結果を表示する。高入力インピーダンスで作動する増幅器１５２はキャパシタを著しく放電することなく、該キャノξシタ１５０に記憶された電圧に対応する出力を発生させ、該出力は対応する最大値コンパレータエレメントに接続されている。

キャノｇシタ１５０にわたって通る電圧は、第１図に示すクロック２４からの転送パルスによりアナログスイッチ１４８が瞬間に閉鎖するとぎ新しい値が提供されるまで変らない。

第１１Ａ図は最小値コン−３レータ１８のエレメントの二層出力の典型である波形を示す。前記波形は５ＫＨｚ！であり、かつそれを土建る周波数で発生する。

ａルスを有する。第１１Ｂ図と第１．’Ｉ　０図とは、それぞれ転送パルスとリセットパルスとから構成され（典型的には１ｏＯＨｚである）調音速度における１狭幅のクロックパルスである。これらは、クロック時間の間最小コンパレータのチャンネルの全体作動時間の決定において、積分器２０と共に使用される。第１１Ｄ図は積分器２ｏの出力波形を示す。この積分器は前述の狭幅のリセットパルスにより零にリセットされ、次に第１１Ａ図の波形を積分する。転送パルスの到来時、積分レベル１、丁アナログ電流スイッチエレメント１４８を介して第１０図のキャパシタ１５０へ転送さａる。第１０図に示す電圧フォロワ１５２はＦＥＴ高入力インピーダンスタイプＬＦ１３７４１　であって、そのためキャパシタ１５０の積分レベルは第１１Ｅ図に示すように、次のクロック時間の間その出力側で現われる。

上に示した波形分析は最小コンパレータチャン汗ルの作動時間を測定し、最大コンパレータに入力を提供する方法を提供する。積分器をリセットすることによる「不動時間」は、調音時間と比較して極短い時間内に転送リセットが完了する限りは影響はほとんどない。即ち、最大および最小コンパレータに同一の回路を使用できる。電圧フォロワ１５２の最大負の出力が最大コンノ′２レークの出力を決定し、前述のように、最小コンパレータが絶対値エレメント１６の出力の中最小の正の値を得る。

コンパレータ回路は正および負の双方の範囲で作動しりるので、双方のコンパレータに対して同一の回路を使用しうる。

コンパレータ１８と２２は声道に最も近密にマツチングする反転フィルタを選択するため調音入力に応答して作動する。最小コンパレータ１８は、全ゆる瞬間にお０て最もよ（マツチングした反転フィルタを支配する、整流されたフィルり出力に対して瞬時に応答する。最大コンパレータ２２は調音速度で作動し、マツチングした支配的な反転フィルタと応答し、そのため入力信号がその中から発生した仮定／声道を表わし、かつ確認する出力を提供する。

最小コンパレータの認識基準は１つである。該コンパレータは反転フィルタと減衰チャンオ・ルの出力の中から最小の絶対値信号を有する１つのチャンネルを瞬時に選択する必要がある。

フィルタバンクの出力側に供給される計算ずみウェイトの形態の正規化は、本発明の基盤となっている言語認識モデルによるシステムＣ（おいては必要でない。

これが正しいということは以下簡単に示しうる。

単一の声道音源インパルスは該当時間１（ｔ）および該当周波数Ｉ（ｆ）として表わすことができる。Ｈ（→により提供される言語発声モデルの声道フィルタと、言語認識モデルのマツチングした反転フィルタＨＩ（ｆ）とが組み合わされてオールノξスフィルタを形成する。したがって、Ｉ　（ｆ）　、　Ｈ（ｆｌ　、　ＨＩ　（ｆｌ　＝　Ｉ　（ｆ）で反転フォーリア変換はＦ”−’　ＣＩ（ｆｌｌ　＝　ｉ（ｔ、）により提供さｒる。

これは１（ｔ）が理想的モデルにおいて元の振幅で再生されるという意味で正規化を意味する。

実際の調音に基いて作動する実゛用システムにおいては、口からマイクロフォンまでの距離によって減衰を表わす常数Ｋが加えられ、認識装置の入口側に導入される増幅を含むことができる。また、唇からマイクロフォノまでの伝播時間のため、遅れｒも生じる。その結果、再生されたイン・パルスはｉ’ｆｔｌ＝Ｋｉ４３（ｔ−ｒ）　としてより正確に表わされる。ｎ個の介ンネルの間で瞬間的に比較を行うためには、Ｋとｒとは全てのチャンネルに対して同じ効果を有し、したがって反転フィルタの決定に影響を与えず、最小の瞬間的な絶対値を提供する。

最小コンパレ−タ１８の作動は、最小の゛電圧レベルを有するチャンネルな、絶対値回路１６のｎ個の出方の中から瞬間的に選択するものとして観察できる。これは、ｎ個の反転フィルタリング・ルの中から最小の絶対瞬間信号レベルを有する１個のチャンネルを選定することに相等する。

最大コンパレータ２２と標本保持回路２１の作動は、調音を表示するに適した調時時間内で最小コンパレータ１８の積分器りの中から最大値のものを比較し、選定し、かつ確認することを含む。より詳しくは、コンパレータ２２はｎ個の積分器信号の中から前記時間の終りに存在する最大のものを選択する。

ここに開示した調音言語認識装置はより高いレベルの処理に入力を提供するために使用する意図のものである。その出力は、調時されたセグメント内で波形活動に関するカテゴリ別の決定の形態である。最大の決定回路要素２２は、この波形の活動のみに基き、時間外に行われたいづれの決定とも無関係に一連の前記の決定を行う。前記決定とはそれらが調音・特ａｋ確認するが、いづれかの隣接する要素に及ぶいづれかの波形データあるいは決定情報を考慮に入れないという意味で調音に関するものである。この種の性格の作業は本発明によるシステムの出力側に供給しうるが、本発明の請求の範囲には含まれていない。

最大コンパレータの入力信号は、本質的に、第１０図に示すキャパシタ１５０に対する充電の形態で調音時間にわたって一定に保持され、前記充電は（これも第１０図に示し）狭幅の転送パルスによって作動するアナログスイッチ要素１４８を介して更新され、そのため次の調音間隔を開始するよう積分器がリセットされる前に全体の積分器出力をキャパシタ１５（１転送する。キャパシタ１５０を通る電圧は電圧フォロワ１５２の出力側で低インピーダンス　の形態で現われる。

転送パルスの間で全ての入力は着実であるので、コンパレータ２２の出力は転送パルスの間を除いて変化しない。従い、決定出力は後の転送や、より高位での処理や認識における利用に対して十分な時間一定状態に留る。

本発明による決定回路は反転フィルタのバンクからいづれのフィルタが声道に対して（反転という視点で）最もよくマツチングしているかを決定、かつ確認するためのもので、あって、そのような決定は調音を表示するに適当な時間について行われる。

最良のマツチングは有効声道ならびにその反転フィルタがオールパスフィルタに対応するので、音源インパルスが最良に再生されることを基準にして行われる。

関連の回路と共にコンパレータ１８および２２によって表示される２つのレベルの決定は、音源インパルスの最良再生を概括する「時間優先（タイムドミナンス）」法を含む。音源インパルスの最良再生は再生された狭幅のインパルスの間の波形活動のないことｔ検出し、かつ再生されたインパルス自体の近傍での応答を最小にすることにより示される。

前記決定方法は再生された音源インパルスの短い持続時間と５高いピークを有効利用している。時間優先は、まづ瞬間的に比較を行い、したがって全体的な強度と決定プロセスからの時間に半つ強度の変化の双方を排除することにより確実にされる。

再生されたインパルスの近傍での決定は名目的には調音決定のみに貢献し、その貢献は時間のみに対して比例するのであって、絶対値回路出力の直接的積分と最小値決定回路への適用によって実施されるように強度と時間を合せた産物には比例しない。

絶対値回路１６、最小値コン−ξレータ１８、積分器２０および最大値コンパレータ２２を前述のように実施する他に、アナログ対デジタル変換およびデジタル処理を利用した均等の方法がある。これら代替的方法の要素を以下の通り開示する。

アナログからデジタルへの変換は反転フィルタ１２あるいは絶対値回路１６の出力側へ供給しうる。前者の場合、周知のデジタル法により絶対値がデジタル的に取り出される。アナログからデジタルへの変換プロセスにおいては、周知のサンプリング理論により指示されるように低パスのフィルタリングが適用される。そのため、アナログからデジタルへの変換プロセスはサンプリング速度の半分以下に限定される。典型的には、５ＫＨｚ以上の発声の周波数が抑制され、１０　ＫＨｚのサンプリング速度を使用しうる。

各チャンネルに対して、１個のアナログからデジタルへの変換器モジュールを使用でき、あるいは１個以上のチャンネルをデジタル形態に単一のＡ／Ｄモジュールが変換するマルチプレキシングを使用してもよい。事実、全ての反転フィルタチャンネルをデジタル形態に変換するために単一の高速作動のＡ／Ｄ変換をマルチプレキンングできる。残りの説明は各チャンネルに対して１個のＡ／ＤＫ基いて行うが、マルチゾレキシングしたシステムとの均等物も考慮に入れるべきである。

アナログ、あるいはデジタルのいづれかでの実行に必要な主要操作が２つある。

即ち（ａ）典型的には１０ＫＨｚ　の速度での最小絶対値信号を有するチャンネルを瞬間的に決定することとｆｂ）　典型的には１００Ｈｚの速度で、発声を表わす時間内で最小となることが最も頻繁なチャンネルを選定することである。

最小値チャンネルを瞬間的に決定することは、高速デジタル処理方法により実施できる。（典型的には１００ミリ秒である）サンプリング信号の１回の間隔の範囲内で、全てのチャンネルのデジタル表示が最小の信号を見出すよう走査され、そのチャンネルが確認され、かつ指定される。前記プロセスは各サンプリング間隔に対して繰返され、そのため各サンプリング間隔に対して最小のチャンネルが確認される。

前記のチャンネル確認データは、調音を表わす間隔、典型的には１０ミリ秒（典型的には１００回のサンプリング間隔）内で最も頻繁に最小となるチャンネル選定のための別のデジタル処理装置に対する入力として使用される。選定プロセスは、各反転フィルタチャンネルに対して１個のカウンタのバンクとして理解され、各チャンネルにおける最小チャンネル確認の全体数が（典型的には１０ミリ秒即ち１００回のサンプリング間隔の）規定されたクロック間隔にわたって確認される。調音間隔の終りにおいて、１個のカウンタが最大カウン）Ｖ含み、そのため特定の調音カテゴリーを指定する。

４７第１２Ａ図、第１２Ｂ図は反転フィルタのバンクを構成する上で全体コストと複雑さを低減する方法を示す。言語音声のある対は共通のフォルマントを有し、かつある場合には１個のフォルマント反転フィルタは双方のカスケードの一要素として作用しうる。第１２Ａ図においては、５個の独立したフィルタカスケードのバンクが示されている。しかしながら、第１２図においては、ある反転フィルタが等しい場合、即ちＡ＝Ｅ＝ＩおよびＢ＝Ｆの場合に対する均等のバンクが示されている。複雑さにおいである低減を行うには、可能なところであるフォルトマントフィルタを多目的使用することである。

本発明は、音声ピッチの差による言語音声の多数の異った波形表示に対処でき、かつ事実上音声ピッチと独立して作動しうるので、言語認識技術における著しい進歩を考えられる。音声要素の連続した流れを認識する上で、前記要素のあるもののみが各フィルタチャンネルに関連する持続性ある音素であることが注目される。叙述されたモートゝがそれぞれ１０ミリ秒間隔においていづれかの組の周波数に対して、ある１個のフィルタチャンネルを選定するので、本発明は、シーケンスのみならず選定したチャンネルの持続時間に関して、子音や母音の移行と関連する特徴のある音声の姿勢を確認する感応性を備えている。

したがって、本発明による装置は実験的に決定されたチャンネルのシーケンスとチャンネルの持続時間とを、持続性ある音素以外の言語音声の要素に関連づけるピッチとは独立した変換論理を発生させるよう利用できる。本発明は言語認識周波帯幅の圧縮およびそれらの応用に対して実用的システムの実現に貢献４８　特表昭５９−５０１５２０　（１５）するものと考えられる。

前述した実施例は以下の請求の範囲の精神と範囲とから逸脱することなく構成しうる多数の潜在的実施例を単に例示するものと理解すべきである。

第３図第５図第６図第８図第９図第１１Ｃ図　種々１１リセ、ト第＋２Ａ図

Claims

【特許請求の範囲】１、一連の調音状態により、かつ概ね音声のピッチとは独立して言語の分類を行う装置において、電子フィルタのバンクを含み、前記バンクにおいて、各フィルタの入力側が分類すべき言語を表示する電子信号に接続するための共通入力側に接続されており；各電子フィルタが声道の１つの調音状態の複合転送機能の反転を概括する転送機能を有するように構成され、そのため前記フィルタへの、特定の調音状態を表示する非零の信号の入力によって、前記フィルタから一連の１個以上の音源インパルスを概括し、かつ前記インパルスの間の零出力を概括する出力を発生させ；１つのみの調音状態の介在を表示する言語信号に対してフィルタが応答するのに十分短い時間である一連の持続時間にわたって音声イン７ぐルスを最良再生するフィルタを繰返し決定するコンル−タが設けられ、該コンノミレータは言語信号入力に応答して最小の絶対値を有するフィルタを瞬間的に決定する装置を含み、最小の絶対値出力を有するフィルタを瞬間的に決定する前記装置は増幅装置のバンクを含み；前記増幅装置（例えばトランジスタ）の各々は、（例えばベースのような）入力要素と、（例えばエミッタのような）入力と出力に共通の要素と、（例えばコレクタのような）出力要素とを含み、前記出力要素を通る電流は共通の要素に関して入力要素の電圧の関数であり：バンク状とされた増幅装置の全ての共通要素は一定の電流源に接続され；入力要素の各々は比較すべきフィルタチャンネルの出力信号に接続され；そのため出力要素が所定の増幅装置が導電しているか、したがって比較されつつある信号の最小のものｔその入力要素で受取っているかを指示する信号を含むことを特徴とする言語の分類を行う装置。２、請求の範囲第１項に記載の装置において、正のフィートゝバックを提供するよう各増幅装置と関連し、かつ接続された第２の増幅装置をさらに含む言語を分類する装置。３、請求の範囲第１項に記載の装置において、コンル−タが各入力の絶対値を決定するよう該コンパレータへの各入力側と関連した整流回路をさらに含む言語を分類する装置。４、言語の一連の調音状態により、かつそのピンチとは概ね独立して言語を分類する装置において、電子フィルタのバンクと、最大の全体時間に対して最小の絶対値出力を有するフィルタを所定のクロック間隔にわたり繰返し決定する装置とを含み：前記電子フィルタのバンクが、各フィルタの入力が、分類すべき言語を表示する電気信号に接続される共通入力に接続され；各電子フィルタが声道の１つの調音状態の複合転送機能の反転を概括する転送機能を有するよう構成され、そのため前記フィルタへの、特定の調音状態を表示する非零の信号の入力が、前記フィルタからの、１個以上の一連の音源インパルスを概略し、かつ前記イン・ｔルスの間の零出力を概括する出力を発生さ５１せ；１つのみの調音状態の介在を表示する言語信号にフィルタが応答するに十分短い一連の持続時間にわたり音源インパルス火最良再生するフィルタを繰返し決定するコンパレータが設けられ、前記コンノルータ１↓言語信号入方に応答する最小の絶対値出力の有するフィルタを瞬間的に決定する装置を含み；前記フィルタを繰返し決定する装置が；キャパシタのバンクと；チャンネルが作動可能のとき一定の充電電流を各キャパシタに供給し、そうでない場合電流を零とする装置と；所定のクロック間隔の終りにおいて各キャパシタを横切って電圧を一時的に記憶する装置と；電圧が記憶された後各クロック間隔の終りにおいてキャパシタを放電する装置と；および各クロック間隔の終りにおいて最大の電圧を有するキャパシタを決定する装置とを含むことを特徴とする言語を分類する装置。５、請求の範囲第５項に記載の装置において、クロック間隔が約１０ミリ秒である言語を分類する装置。６　請求の範囲第４項に記載の装置において、各クロック間隔の終りにおいて最大の電圧を有するキャパシタを決定する装置が増幅装置のバンクを含み；各増幅装置（例えばトランジスタ）が（例えばベースのような）入力要素と、（例えばエミッタのような）入力と出力に対して共通の要素と、（例えばコレクタのような）出力要素とを含み、前記出力要素を通る電流が共通要素に対して入力要素への電圧の関数であり；バンク状の増幅装置の全ての共通要素が一定の電流源に接続されており；各入力要素が比較すべき記憶された信号と接続されており；そのため、出力要素はいづれの増幅装置が導電しているか、したがって比較されつつあるキャパシタ電圧の最大のものをその入力要素において受取っているかを指示する信号を含むことを特徴とする言語を分類する装置。７、請求の範囲第１項または第４項に記載の装置において。音声入力の介在を検出する装置と；前記音声入力検出装置により何ら音声入力が検出されない場合全てのフィルタチャンネルの出方を使用禁止にする装置と；前記音声入力検出装置により何ら音声入力が検出されないいづれの瞬間において出力信号を発生させる装置をさらに含む言語を分類する装置。８　請求の範囲第１項に記載の装置において、フィルタのバンクに入力を提供する前に言語信号のレイルを自動的に制御する装置をさらに含む言語を分類する装置。９、請求の範囲第１項に記載の装置において、各フィルタが少な（とも１個の７オルマント反共鳴フィルタのカスケードを含む言語を分類する装置。１０、請求の範囲第１項に記載の装置において、電子フィルタのバンクが、フォルマント反共鳴フィルタと、所定カテゴリの活者の声道特注に一致するよう同じ比率で前記フォルマント反３共鳴フィルタの全てのフォルマント周波数と周波帯幅とを同時に調整する装置とを含む言語を分類する装置。１１、ＭＰ？、の範囲第９項に記載の装置において、フィルタバンクの１個以上のフィルタチャンネルに関連して所定の７オルマント反共鳴フィルタが使用される言語を分類する装置。１２、特許請求の範囲第４項に記載の装置において、最小の絶対値の出力を有するフィルタを瞬間的に決定する装置が増幅装置のバンクを含み；（トランジスタのような）各増幅装置が（例えばベースのような）入力要素と、（例えばエミッタのような）入力と出力に共通の要素と、（例えばコレクタのような）出力要素とを含み、前記出力要素を通る電流が共通要素に関して入力要素の電圧の関数であり；バンク状の増幅装置の全ての共通要素が一定の電流源に接続され：各入力要素が比較すべきフィルタチャンネルの出力信号に接続され、そのため出力要素が、所定の増幅装置が導電しており、したがって比較されつつある信号の最小のものをその入力要素において受取っているかを指示する信号を含む言語を分類する装置。工３　請求の範囲第１２項に記載の装置にお（・て、各クロック間隔の終りにおいて最大の電圧を有するキャノξシタを決定する装置が増幅装置のバンクを含み、（例えばトランジスタのような）各増幅装置が（ベースのような）入力要素と、（例えばエミッタのような）入力と出力に共通の要素と、（例えばコレクタのような）出力要素とを含み、前記出力要素を通る電流が共通要素に関して入力要素の電圧の関数であり；バンク状の増幅装置の全ての共通の要素が一定の電流源に接続されており；各入力要素が比較すべき記憶された信号に接続され；そのため、出力要素は所定の増幅装置が導電しており、したがってその入力要素において比較されつつあるキャパシタの電圧の最大のものを受取っているかを指示する信号を含む言語を分類する装置。１４、請求の範囲第１３項に記載の装置において、コンパレータが各入力の絶対値を測定するようコンパレータへの各入力側と関連した整流器回路をさらに含む言語を分類する装置。１５　請求の範囲第１４項に記載の装置において、正のフィードバンクを提供するよう各増幅装置に関連し、かつ接続された第２の増幅装置をさらに含む言語を分類する装置。１６、請求の範囲第１５項に記載の装置において、音声入力の介在を検出する装置と；前記音声入力検出装置により何ら音声入力が検出されないいづれの瞬間においても出力信号を発生させる装置とをさらに含む言語を分類する装置。１７、請求の範囲第１６項に記載の装置において、フィルタのバンクへの入力の前に言語信号のレベルを自動制御する装置をさらに含む言語を分類する装置。１８、請求の範囲第１７項に記載の装置において、クロック間５５隔が約１０ミリ秒である言語を分類する装置。１９　言語の一連の調音状態に応じて、かつそのピッチに実質的に独立して言語を分類する装置において、各フィルタの入力が分類すべき言語を表示する電気信号に接続される共通入力側に接続され；各電子フィルタが声道の１つの調音状態の複合転送機能の反転を概括する転送機能を有することによって、前記フィルタへの、特定の調音状態を表示する非零の入力が、前記フィルタから一連の１個以上の音源インパルスを概括し、かつ前記インパルス間の零出力を概括する出力を発生させる電子フィルタのバンクと；１つのみの調音状態の介在を表示する言語信号にフィルタが応答するに十分短い一連の持続時間にわたり音源イン、（ルスを最良に再生するフィルタを繰返し決定し、言語信号入力に応答して最小の絶対値出力を有するフィルタケ瞬間的に決定する装置を含むコンパレータと；所定のクロック間隔にわたり、最大の全体時間に対して最小の絶対値出力を有するフィルタを繰返し決定する装置とを含むことを特徴とする言語を分類する装置。２、特許請求の範囲第１９項に記載の装置において、クロック間隔が約１０ミリ秒である言語を分類する装置。２１、言語の一連の調音状態により、そのピッチと概ね独立して言語を分類する装置において、各フィルタの入力が分類すべき言語を表示する電気信号へ接続する共通入力側に接続され、各電子フィルタが声道の１つの調音状態の複合転送機能の反転を概括するよう構成されており、そのため前記フィルタへの、規定の調音状態を表示する非零の信号の入力が、前記フィルタからの、一連の１個以上の音源インパルスを概括し、前記インパルスの間の零出力を概括する出力を発生させる電子フィルタのバンクと；１つのみの調音状態の介在を表わす言語信号に前記フィルタが応答するようにするに十分短い一連の持続時間にわたって音源インパルスを最良に再生するフィルタを繰返し決定するコンパレータとを含むことを特徴とする言語を分類する装置。