JPS5854400B2 - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS5854400B2 JPS5854400B2 JP51096193A JP9619376A JPS5854400B2 JP S5854400 B2 JPS5854400 B2 JP S5854400B2 JP 51096193 A JP51096193 A JP 51096193A JP 9619376 A JP9619376 A JP 9619376A JP S5854400 B2 JPS5854400 B2 JP S5854400B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- signal
- output
- detectors
- detector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 230000003595 spectral effect Effects 0.000 abstract description 15
- 238000001228 spectrum Methods 0.000 abstract description 7
- 239000013598 vector Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010615 ring circuit Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Description
【発明の詳細な説明】
本発明は電気信号に変換された音声を受信し、その電気
信号を予定数の周波数帯域に分割し、前記信号のエネル
ギーを一定の期間に亘り各周波数帯域毎に各別の出力端
子に供給するフィルタ群と、前記出力端子に接続され、
全周波数帯域に亘るエネルギー分布パターンを予定のパ
ターンと順次に比較する装置とを具える音声認識装置に
関するものである。
信号を予定数の周波数帯域に分割し、前記信号のエネル
ギーを一定の期間に亘り各周波数帯域毎に各別の出力端
子に供給するフィルタ群と、前記出力端子に接続され、
全周波数帯域に亘るエネルギー分布パターンを予定のパ
ターンと順次に比較する装置とを具える音声認識装置に
関するものである。
斯種の装置はドイツ国特許出願公開第
2363590号により既知である。
この既知の装置そは、フィルタ群の積分出力信号をマル
チプレクサ及びアナログ−デジタル変換器を経てコンピ
ュータに供給する。
チプレクサ及びアナログ−デジタル変換器を経てコンピ
ュータに供給する。
短期間に亘り゛積分された検査すべき信号のスペクトル
分布は多値ベクトルを表わすため、コンピュータは種々
のベクトルの時間的な順番を受信し、既知の種々の順番
と比較する。
分布は多値ベクトルを表わすため、コンピュータは種々
のベクトルの時間的な順番を受信し、既知の種々の順番
と比較する。
しかし、ベクトルを表わすためには多数のビットが必要
とされるので、長いベクトル順番は大記憶容量を必要と
すると共に高速コンピュータの場合でも相当長い処理時
間を必要とするため、極めて大形且つ高速で従って高価
なコンピュータを必要とすることなく実時間処理を達成
することは殆んど不可能である。
とされるので、長いベクトル順番は大記憶容量を必要と
すると共に高速コンピュータの場合でも相当長い処理時
間を必要とするため、極めて大形且つ高速で従って高価
なコンピュータを必要とすることなく実時間処理を達成
することは殆んど不可能である。
本発明の目的は、多数の種々の音声を実時間で簡単に認
識し得る装置を提供せんとするにある。
識し得る装置を提供せんとするにある。
本発明の他の目的は音声信号の簡単且つ効果的な前処理
装置を提供せんとするにある。
装置を提供せんとするにある。
本発明は、これらの目的を実現するために、複数個のパ
ターン検出器を設け、各パターン検出器をフィルタ群の
出力端子の少くとも1部分に接続し、各パターン検出器
においては、これが接続されたフィルタ群の各出力端子
に対し限界値検出器を設けてこの出力端子上の信号が下
限値fu と上限値fo との間に位置するときにそ
の出力端子に信号レベルを発生させると共に、AND素
子により当該パターン検出器に含まれる全ての限界値検
出器の出力を合成し、全ての限界値検出器の出力端子に
信号レベルが発生する場合に当該パターン検出器の出力
端子に相当する前記AND素子の出力端子に信号レベル
を発生させ、他に前記複数個のパターン検出器に接続さ
れた記憶装置を設けてこれらパターン検出器の出力端子
の信号レベルの時間的順番を記憶すると共にこの順番を
比較装置に供給するようにしたことを特徴とする。
ターン検出器を設け、各パターン検出器をフィルタ群の
出力端子の少くとも1部分に接続し、各パターン検出器
においては、これが接続されたフィルタ群の各出力端子
に対し限界値検出器を設けてこの出力端子上の信号が下
限値fu と上限値fo との間に位置するときにそ
の出力端子に信号レベルを発生させると共に、AND素
子により当該パターン検出器に含まれる全ての限界値検
出器の出力を合成し、全ての限界値検出器の出力端子に
信号レベルが発生する場合に当該パターン検出器の出力
端子に相当する前記AND素子の出力端子に信号レベル
を発生させ、他に前記複数個のパターン検出器に接続さ
れた記憶装置を設けてこれらパターン検出器の出力端子
の信号レベルの時間的順番を記憶すると共にこの順番を
比較装置に供給するようにしたことを特徴とする。
各期間において検査すべき信号のスペクトル分布、即ち
各ベクトルは、人間の言語の場合既知のよう音素に相当
するスペクトルパターンとみなせる。
各ベクトルは、人間の言語の場合既知のよう音素に相当
するスペクトルパターンとみなせる。
音素のスペクトル分布は話者に依存し、部分的に相当の
公差を有するため、各音素における各スペクトル部分に
対し、上限値及び下限値を用いる。
公差を有するため、各音素における各スペクトル部分に
対し、上限値及び下限値を用いる。
これら限界値は互に無関係に調整し得るようにするのが
好適である。
好適である。
本発明によればフンピユータは可能性のある全てのベク
トルを受信しないで、実際に発生するベクトル又はパタ
ーンのみを受信し、これらベクトルを復号するため、多
大のデータ削減が得られる。
トルを受信しないで、実際に発生するベクトル又はパタ
ーンのみを受信し、これらベクトルを復号するため、多
大のデータ削減が得られる。
限界値検出器は2個の比較器、例えを±演算増幅器を用
い、その後段に相互接続部材を後続させることによって
極めて簡単に構成することができる。
い、その後段に相互接続部材を後続させることによって
極めて簡単に構成することができる。
従って、パターン検出器は多数のスペクトル範囲に対す
る多数の限界値検出器を設けてパターンの解像度を良く
する場合でも極めて簡単じ構成できるため、パターン検
出器を多数の種々の音又は音素に対応して多数とする場
合には安価な装置を得ることができる。
る多数の限界値検出器を設けてパターンの解像度を良く
する場合でも極めて簡単じ構成できるため、パターン検
出器を多数の種々の音又は音素に対応して多数とする場
合には安価な装置を得ることができる。
各パターン検出器にアドレスを割当て、出力信号を発生
するパターン検出器のアドレスを符号化して記憶装置に
記憶し、これらアドレス符号列を予定のパターン列と比
較する装置に供給するのが好適である。
するパターン検出器のアドレスを符号化して記憶装置に
記憶し、これらアドレス符号列を予定のパターン列と比
較する装置に供給するのが好適である。
これがため、斯る認識装置は例えば発電機や車輌のよう
な機械の動作状態(種々の動作雑音から判明する)を、
パターン検出器に対応するアドレス符号列を比較値とし
て与えることにより遂次認識することができる。
な機械の動作状態(種々の動作雑音から判明する)を、
パターン検出器に対応するアドレス符号列を比較値とし
て与えることにより遂次認識することができる。
また、斯る予定のアドレス符号列は声素列即ち言語又は
一続きの言葉を表わすものとして音声認識に用いること
ができる。
一続きの言葉を表わすものとして音声認識に用いること
ができる。
斯る予定のアドレス符号列はアダプティブパターン認識
プログラムで実現することができる。
プログラムで実現することができる。
このプログラムによれば、学習制御中認識すべき1つの
言語に対し限界値アドレス列で表わされた複数個の既知
のモデルを書込む。
言語に対し限界値アドレス列で表わされた複数個の既知
のモデルを書込む。
このプログラムではこれらアドレス列の周波数分布を認
定し、記憶する。
定し、記憶する。
このことは予定した語粟の各語について行なう。
装置を話者とできるだけ無関係とするためには、多くの
人に学習すべき各語に対するモデルを話してもらうのが
よい。
人に学習すべき各語に対するモデルを話してもらうのが
よい。
学習制御の終了後、認識すべき各語に対するアドレス列
をコンピュータに記憶する。
をコンピュータに記憶する。
学習制御の終了後語を認識する場合、マイクロホン及び
フィルタ群を経て発生されたスペクトルをパターン検出
器に供給し、これら検出器のアドレスをこれらの出力信
号の順番に応じて符号化し、コンピュータに供給し、学
習させた語粟の周波数分布と語単位で比較する。
フィルタ群を経て発生されたスペクトルをパターン検出
器に供給し、これら検出器のアドレスをこれらの出力信
号の順番に応じて符号化し、コンピュータに供給し、学
習させた語粟の周波数分布と語単位で比較する。
瞬時アドレス列に対し最高値を発生する周波数分布を有
する語を認識された語をみなす。
する語を認識された語をみなす。
完全な文章の認識を行なう場合は、本発明装置の信頼性
を、可能な語順に対し文法的語句配列規則を用いること
により高めることができる。
を、可能な語順に対し文法的語句配列規則を用いること
により高めることができる。
以下図面につき本発明を説明する。
第1図に示すスペクトルは第2図に示す装置によって得
られる。
られる。
第2図において、認識すべき音又は音列はマイクロホン
1で受信され、電気信号に変換される。
1で受信され、電気信号に変換される。
この電気信号は自動音量調整器2に供給し、ここでその
電気信号を振幅について標準化する。
電気信号を振幅について標準化する。
自動音量制御は音声再生技術において公知であるため、
これ以上説明しない。
これ以上説明しない。
このようにして認識又は識別は総合音量と無関係とする
(このことは言語認識等に対して不可欠であることが認
められている)。
(このことは言語認識等に対して不可欠であることが認
められている)。
フィルタ群3において調整器2の出力信号を、入力信号
を共通に受信し、出力信号を並列に発生する1組のリン
グ回路又は狭帯域フィルタによって予定数にの順次の周
波数範囲又はスペクトル成分に分割する。
を共通に受信し、出力信号を並列に発生する1組のリン
グ回路又は狭帯域フィルタによって予定数にの順次の周
波数範囲又はスペクトル成分に分割する。
得られた信号を積分装置(図示してないが慣例のRC回
路網とすることができる)により整流し例えば10is
の一定の時間隔に亘り積分する。
路網とすることができる)により整流し例えば10is
の一定の時間隔に亘り積分する。
或は又、クロック動作を用い、各クロックパルスで前記
積分時間隔を終了させると共にフィルタ群の出力端子に
積分結果を発生させることができる。
積分時間隔を終了させると共にフィルタ群の出力端子に
積分結果を発生させることができる。
この場合には装置の次段の素子にもクロックパルス入力
端子を設ける必要があるが、この装置についてはこれ以
上論じない。
端子を設ける必要があるが、この装置についてはこれ以
上論じない。
整流積分された各別のスペクトル成分はフィルタ群3か
もチャンネル5を経て出力される。
もチャンネル5を経て出力される。
各出力端子の信号又は電圧値は前記積分時間に亘って積
分された各スペクトル成分のエネルギー量に比例し、そ
の一例は第1図で与えられ、本例はフィルタ群3の出力
数が10の場合である。
分された各スペクトル成分のエネルギー量に比例し、そ
の一例は第1図で与えられ、本例はフィルタ群3の出力
数が10の場合である。
このエネルギー分布は一般に非静止音の場合少恢ともい
くつかのスペクトル成分が時間に依存する。
くつかのスペクトル成分が時間に依存する。
フィルタ群3からのに個の出力端子は第2図のパターン
検出器4(1)〜4(n)の何れにも並列に接続する。
検出器4(1)〜4(n)の何れにも並列に接続する。
各パターン検出器によりに個の各出力の電圧が各パター
ン検出器に特定的に限定された下限値fu と上限値
fo との間の公差範囲内に位置するか否かを検査す
る。
ン検出器に特定的に限定された下限値fu と上限値
fo との間の公差範囲内に位置するか否かを検査す
る。
第1図にはこれらの公差範囲のいくつかを垂直ストロー
ク線で示すが、これらはパターン検出器の内の1個にお
いて設定し得る。
ク線で示すが、これらはパターン検出器の内の1個にお
いて設定し得る。
この種の公差範囲は各チャンネルについて示してない。
その理由は種々の音声に対しては一般に音声の認識にあ
まり重要でないいくつかのチャンネルが存在するためで
ある。
まり重要でないいくつかのチャンネルが存在するためで
ある。
これがため、パターン検出の複雑さを軽減でき、認識の
信頼性を幾分増すことができる。
信頼性を幾分増すことができる。
第1図の例はチャンネル2−4及び7−9の信号が関連
する公差範囲内に位置するため、対応するパターン検出
器が正出力信号を発生することを示す。
する公差範囲内に位置するため、対応するパターン検出
器が正出力信号を発生することを示す。
しかし、何れか1チヤンネルの信号が公差範囲内にない
場合そのパターン検出器は出力信号を発生しない。
場合そのパターン検出器は出力信号を発生しない。
第1図は、更に、種々のチャンネルに対する公差範囲が
等しくないことも示す。
等しくないことも示す。
これは、特に言語認識の場合いろいろな話者に基づいて
決定される種々のチャ/ネル出力の信号の偏差が等しい
大きさでないためである。
決定される種々のチャ/ネル出力の信号の偏差が等しい
大きさでないためである。
第3図は第2図のパターン検出器4の内部構造の一例を
示す。
示す。
この検出器は破線で示す多数の限界値検出器10(1)
〜10(rn)を具え、それらの出力端子A(1)〜A
(1111はAND素子6で合成される。
〜10(rn)を具え、それらの出力端子A(1)〜A
(1111はAND素子6で合成される。
パターン検出器4の出力端子Mは上述したように全ての
限界値検出器10(1)〜10(mlの出力端子A(j
)が同時に正出力信号を発生する場合にのみ出力信号を
発生する。
限界値検出器10(1)〜10(mlの出力端子A(j
)が同時に正出力信号を発生する場合にのみ出力信号を
発生する。
各限界値検出器の入力端子E(1)・・・・・・・・・
E(m)は対応するスイッチsw(i)・・・・・・・
・・Sw(rrllの第1接続点に接続する。
E(m)は対応するスイッチsw(i)・・・・・・・
・・Sw(rrllの第1接続点に接続する。
各スイッチによりフィルタ群3のに個の出力端子501
個を選択する。
個を選択する。
各スイッチはこれら出力端子の1部にのみ接続し、スイ
ッチsw(i)は最低項数1)の出力端子にのみ接続し
、スイッチ5W(2)は次のいくつかの出力端子に重複
して接続し、最后のスイッチSW(m)は最高順番的の
チャンネルにのみ接続する。
ッチsw(i)は最低項数1)の出力端子にのみ接続し
、スイッチ5W(2)は次のいくつかの出力端子に重複
して接続し、最后のスイッチSW(m)は最高順番的の
チャンネルにのみ接続する。
これはmの値がKの値より小さい場合に好適な接続配置
であること明らかである。
であること明らかである。
各限界値検出器10は2個の比較器V1及びV2を具え
、これら比較器としては本例では演算増幅器を用いる。
、これら比較器としては本例では演算増幅器を用いる。
演算増幅器の非反転入力端子(+記号で示す)を各別の
入力端子E(j)に接続すると共に一記号で示す入力端
子には2個の抵抗R1及び及2とポテンシオメータP1
及びP2の直列接続回路により発生される限界電圧を受
信させる。
入力端子E(j)に接続すると共に一記号で示す入力端
子には2個の抵抗R1及び及2とポテンシオメータP1
及びP2の直列接続回路により発生される限界電圧を受
信させる。
この直列接続回路は電圧源の正及び負端子+U及び−U
間に接続する。
間に接続する。
下限値fuはポテンシオメータP2の設定を変えて調整
することができ、この限界値と上限値fo との間隔
はポテンシオメータP1によって調整することができる
。
することができ、この限界値と上限値fo との間隔
はポテンシオメータP1によって調整することができる
。
比較器V1及び■2の出力信号は信号の論理値に影響を
与えない数個の回路素子(後述する)を経て排他的OR
素子Gに供給し、その出力端子は限界値検出器10の出
力端子Aに接続する。
与えない数個の回路素子(後述する)を経て排他的OR
素子Gに供給し、その出力端子は限界値検出器10の出
力端子Aに接続する。
この回路の基本動作を第5a図について詳細に説明する
。
。
入力端子Eの電圧aが下限電圧fu より低い限り、
比較器V1の出力信号す及び比較器■2の出力信号Cは
低レベルである。
比較器V1の出力信号す及び比較器■2の出力信号Cは
低レベルである。
入力電圧aが下限電圧fu を越えると同時に、比較器
v2の出力信号Cが高レベルとなり、排他的OR素子G
は信号dで示すように高出力信号を発生する。
v2の出力信号Cが高レベルとなり、排他的OR素子G
は信号dで示すように高出力信号を発生する。
入力電圧aが更に増大し、上限電圧fo をも越える場
合、比較器■1の出力信号すも高レベルとなるため、排
他的OR素子Gは2個の高入力信号を受信し、既知のよ
うに低出力信号を発生する。
合、比較器■1の出力信号すも高レベルとなるため、排
他的OR素子Gは2個の高入力信号を受信し、既知のよ
うに低出力信号を発生する。
従って、正信号は入力電圧aが2つの限界電圧fu及び
fo間の値を有する場合にのみ出力端子Aに発生する。
fo間の値を有する場合にのみ出力端子Aに発生する。
入力電圧aが再び減少する場合、入力電圧aが2個の限
界値で制限された公差範囲を通過する間中再び高出力信
号を発生する。
界値で制限された公差範囲を通過する間中再び高出力信
号を発生する。
その理由は比較器■1及びv2の出力信号が第5a図に
示すように順次に低レベルとなるためである。
示すように順次に低レベルとなるためである。
比較器v1及びv2として用いる演算増幅器は後続の論
理回路で必要とされる電源電圧より高い電源電圧を必要
とする場合が多いため、それらの出力信号(電源電圧に
略々等しい)をこの低論理レベルに制限する必要がある
。
理回路で必要とされる電源電圧より高い電源電圧を必要
とする場合が多いため、それらの出力信号(電源電圧に
略々等しい)をこの低論理レベルに制限する必要がある
。
比較器■1に対しこのレベル制限は抵抗R3及びR5と
ダイオードD1で行なう。
ダイオードD1で行なう。
これら抵抗の値は、比較器v1の出力が高出力電圧の場
合に回路S1の入力電圧が最大許容値を越えないように
選択する。
合に回路S1の入力電圧が最大許容値を越えないように
選択する。
この場合ダイオードD1は遮断し、不作動である。
比較器V1の出力が負出力信号の場合にはダイオードD
1が導通し、回路S1の入力電圧を略々零電位に制限す
る。
1が導通し、回路S1の入力電圧を略々零電位に制限す
る。
比較器V2の出力信号も同様に抵抗R4及びR6とダイ
オードD2とによって後続の論理回路のレベルに制限す
る。
オードD2とによって後続の論理回路のレベルに制限す
る。
回路S1及びS2はシュミットトリガ回路として、入力
電圧が2個の限界電圧の一方fu又はfo を極めて単
調に横切る場合、従って比較器の出力信号に極めて単調
な遷移を発生する場合でも、後続の論理回路は急峻な側
縁を有する信号を得るようにする。
電圧が2個の限界電圧の一方fu又はfo を極めて単
調に横切る場合、従って比較器の出力信号に極めて単調
な遷移を発生する場合でも、後続の論理回路は急峻な側
縁を有する信号を得るようにする。
従って比較器の入力信号が極めて単調に変化する場合で
も排他的OR素子Gはその論理出力を変えるか変えない
ことができるため、如何なる瞬時においても1個以上の
パターン検出器から正出力信号が発生することは起り得
ない。
も排他的OR素子Gはその論理出力を変えるか変えない
ことができるため、如何なる瞬時においても1個以上の
パターン検出器から正出力信号が発生することは起り得
ない。
第4図は限界値検出器10の他の例を示す。
本例でも比較器V3及びv4として演算増幅器を用いる
が、入力端子Eを上側比較器v3の反転入力端子と下側
比較器v4の非反転入力端子に接続する。
が、入力端子Eを上側比較器v3の反転入力端子と下側
比較器v4の非反転入力端子に接続する。
両比較器の他方の入力端子はそれぞれ第3図に示すよう
にして発生し得る限界電圧fu及びfo に接続する。
にして発生し得る限界電圧fu及びfo に接続する。
これら比較器の出力をダイオードD3及びD4より成る
AND素子を経て、例えば比較器v3及びV4の比較的
高い正の電源電圧Uに抵抗R7を経て接続された点Pに
接続する。
AND素子を経て、例えば比較器v3及びV4の比較的
高い正の電源電圧Uに抵抗R7を経て接続された点Pに
接続する。
本例回路の動作を第5b図について詳細に説明する。
入力端子Eの電圧aに下限電圧fu より低い限り、比
較器v3の出力は曲線eで示すように高レベル信号であ
るが、比較器V4の出力は第5a図の曲線Cに対応する
曲線Cに従って低レベル信号である。
較器v3の出力は曲線eで示すように高レベル信号であ
るが、比較器V4の出力は第5a図の曲線Cに対応する
曲線Cに従って低レベル信号である。
入力電圧aが下限電圧fu を越えると同時に、比較器
v4の出力信号が正となり、従ってAND機能のために
点Pも曲線dで示すように正信号となる。
v4の出力信号が正となり、従ってAND機能のために
点Pも曲線dで示すように正信号となる。
次いで入力電圧aが上限電圧fo を越えると、比較器
v3の出力電圧が負になり、従って点Pの電圧も負にな
る。
v3の出力電圧が負になり、従って点Pの電圧も負にな
る。
第5b図を第5a図と比較すると、点P上には第3図に
示す回路の出力端子A上と同一の電圧変化が発生するこ
とが解るが、点P上の信号は比較器の出力信号と同等の
電圧振幅を有するため、この信号も後続の論理回路の低
レベルに調整する必要がある。
示す回路の出力端子A上と同一の電圧変化が発生するこ
とが解るが、点P上の信号は比較器の出力信号と同等の
電圧振幅を有するため、この信号も後続の論理回路の低
レベルに調整する必要がある。
このレベル調整はダイオードD5と抵抗R8により行な
う。
う。
この場合、両比較器が高出力信号を発生するとき、点P
の電圧はこのとき導通するダイオードD5のために抵抗
R7及びR8の比で決まる値を越え得ない。
の電圧はこのとき導通するダイオードD5のために抵抗
R7及びR8の比で決まる値を越え得ない。
しかし、一方の比較器が負出力信号を発生する場合、点
Pの電圧は略々この負信号と同一値となるが、このとき
ダイオードD5が遮断し、抵抗R8が存在するために回
路S3の入力端子に略々零電位が供給される。
Pの電圧は略々この負信号と同一値となるが、このとき
ダイオードD5が遮断し、抵抗R8が存在するために回
路S3の入力端子に略々零電位が供給される。
回路S3の入力端子の最大正電圧の制限は破線を経て点
P゛と論理回路の電源としても作用する電圧+U1とに
接続したダイオードD6で与えることもできる。
P゛と論理回路の電源としても作用する電圧+U1とに
接続したダイオードD6で与えることもできる。
このダイオードのために、点Pの電圧はこの電源電圧よ
り正になることはできない。
り正になることはできない。
更に他の方法としては、抵抗R7に対し比較器■3及び
■4の動作電圧の代りに論理回路素子の電源電圧U1を
用いることができる。
■4の動作電圧の代りに論理回路素子の電源電圧U1を
用いることができる。
この場合比較器■3及びV4が正出力信号の場合ダイオ
ードD3及びD4は常に遮断される。
ードD3及びD4は常に遮断される。
限界値検出器の出力端子Aの前段にシュミットトリガ回
路53を設げる。
路53を設げる。
この回路は前述したように常に急峻な側縁を有する出力
信号を発生する。
信号を発生する。
第5 a 、5 b図において信号値(曲線a)及び公
差限界値fo 、 fuは曲線b 、 ’c 1 d
、 eの論理レベルの電気的値とは関係ないことに注意
されたい。
差限界値fo 、 fuは曲線b 、 ’c 1 d
、 eの論理レベルの電気的値とは関係ないことに注意
されたい。
以上述べたように第2図に示すパターン検出器4はフィ
ルタ群3の出力端子に接続された入カバターンの全成分
がプリセットパターンと一致するときに出力信号を発生
する。
ルタ群3の出力端子に接続された入カバターンの全成分
がプリセットパターンと一致するときに出力信号を発生
する。
認識すべき各基本信号パターン(即ち人間の言語の場合
における各音素)に対して斯るパターン検出器を設ける
。
における各音素)に対して斯るパターン検出器を設ける
。
種々の単音のみを認識する必要がある場合、パターン検
出器の出力を直接用いることができ、例えばこれら出力
によって表示装置を制御することができる。
出器の出力を直接用いることができ、例えばこれら出力
によって表示装置を制御することができる。
複数個の順次の基本パターンより成る信号列を認識する
場合には各基本パターンをそれぞれのパターン検出器に
より認識し、認識した基本パタ〒ン列を第2図に示すよ
うに記憶装置8に一時的に記憶するのが好適である。
場合には各基本パターンをそれぞれのパターン検出器に
より認識し、認識した基本パタ〒ン列を第2図に示すよ
うに記憶装置8に一時的に記憶するのが好適である。
この目的のために、パターン検出器4の出力端子をアド
レスマルチプレクサTに接続し、これによりパターン検
出器の1ビット出力信号をそのパターン検出器のアドレ
スを表わす2進数に変換する。
レスマルチプレクサTに接続し、これによりパターン検
出器の1ビット出力信号をそのパターン検出器のアドレ
スを表わす2進数に変換する。
次に、この2進数を記憶装置8にデータとして供給する
。
。
言語認識の場合にはnの値は最大で約32である。
これがため、前記パターン検出器のアドレスは5ビツト
で構成する。
で構成する。
言語を認識する場合、記憶装置8は認識すべき言語の最
大の音素列を記憶する必要がある。
大の音素列を記憶する必要がある。
言語認識においてはこの音素列は最大で16パターンの
長さを有し、これがため記憶装置8の容量は5X16=
80ビツトとする。
長さを有し、これがため記憶装置8の容量は5X16=
80ビツトとする。
制御ユニット9は記憶装置8の書込みを制御し、そのた
めのアドレス発生器を具える。
めのアドレス発生器を具える。
最初の基本パターンを認識する場合、制御ユニット9に
より記憶装置8の第1記憶位置を駆動してここに対応す
るパターン検出器のアドレスを書込む。
より記憶装置8の第1記憶位置を駆動してここに対応す
るパターン検出器のアドレスを書込む。
制御ユニットは認識が終了すると1位置進むアドレスカ
ウンタを具え、次の記憶位置を駆動する。
ウンタを具え、次の記憶位置を駆動する。
この制御は、全てのゲート6(第3図)の出力をORゲ
ート(図示せず)で合成して実現することができる。
ート(図示せず)で合成して実現することができる。
このORゲートの゛↓″出力を記憶装置8の”書込″指
令及び制御ユニット9の“1ステップアップパ指令とし
て堝用させる。
令及び制御ユニット9の“1ステップアップパ指令とし
て堝用させる。
検出器アドレスの書込みは認識したパターンが記憶装置
8の容量一杯となるまで繰返すことができる。
8の容量一杯となるまで繰返すことができる。
斯る2進数の列(本例では最大16個)は認識すべき信
号の基本パターン(言語認識の場合は音素)の列を表わ
し、これら基本パターンより成る言語に関する答を与え
るものである。
号の基本パターン(言語認識の場合は音素)の列を表わ
し、これら基本パターンより成る言語に関する答を与え
るものである。
例えば、パターン検出器4(1)が°゛a″を、次にパ
ターン検出出器4(7)が鼻音“n ”を、次にパター
ン検出器4(1)が再びa ”を認識する場合、数列1
.7、■が話された言葉” Anna ”に対するパタ
ーン列として記憶される。
ターン検出出器4(7)が鼻音“n ”を、次にパター
ン検出器4(1)が再びa ”を認識する場合、数列1
.7、■が話された言葉” Anna ”に対するパタ
ーン列として記憶される。
言葉の終りは第2図のマイクロホン1で受信された音響
エネルギーが著しく低くなるときに信号を発するギャッ
プ検出器で検出することができる。
エネルギーが著しく低くなるときに信号を発するギャッ
プ検出器で検出することができる。
この終了信号は制御ユニット9内のアドレスカウンタを
リセットすると共に記憶装置8の読出動作を制御してそ
の内容の全てを出力端子8Aに接続された処理装置に転
送する。
リセットすると共に記憶装置8の読出動作を制御してそ
の内容の全てを出力端子8Aに接続された処理装置に転
送する。
この読出動作は破壊読出しとし、前記コンピュータによ
り別の制御系で行うことができる。
り別の制御系で行うことができる。
コンピュータへの情報の転送は慣例の技術であるからこ
の点についてはこれ以上説明しない。
の点についてはこれ以上説明しない。
前記ギャップ検出器は図示してないが、その出力信号は
導線1人を経て供給する。
導線1人を経て供給する。
1つの言葉が終了した後アドレススデジット列は前記コ
ンピュータに書込まれ、ここで認識語粟の種々の語の周
波数分布と比較され、一致により特定の語と関連せしめ
られる。
ンピュータに書込まれ、ここで認識語粟の種々の語の周
波数分布と比較され、一致により特定の語と関連せしめ
られる。
雑音信号の工業的分析評価においては、制御ユニット9
を他の制御信号、例えば手動制御ボタンにより1回循環
させて全てのアドレス位置を走査することができる。
を他の制御信号、例えば手動制御ボタンにより1回循環
させて全てのアドレス位置を走査することができる。
以上要約すると、本発明では音又は言語信号を電気信号
に変換し、フィルタ群にて複数個の各別のスペクトル成
分に分割する。
に変換し、フィルタ群にて複数個の各別のスペクトル成
分に分割する。
これら成分を短時間に亘り積分し、短時間の信号スペク
トルを発生させる。
トルを発生させる。
これらスペクトル成分を対応する個数の連列リード線を
経て複数個のパターン検出器に供給する。
経て複数個のパターン検出器に供給する。
各検出器は供給されたスペクトル分布パターンが当該パ
ターン検出器に調整したパターンに一致する場合にのみ
出力信号を発生する。
ターン検出器に調整したパターンに一致する場合にのみ
出力信号を発生する。
この目的のために、各パターン検出器は供給された入力
信号が2個の可調整限界値間に位置する場合に信号を発
生する複数個の限界値検出器で構成する。
信号が2個の可調整限界値間に位置する場合に信号を発
生する複数個の限界値検出器で構成する。
各限界値検出器をフィルタ群の異なる出力端子に接続す
ると共に種々の限界値に調整する。
ると共に種々の限界値に調整する。
これら限界値検出器を出力をAND素子で合成してパタ
ーン検出器の全ての限界値検出器が駆動された場合にの
み信号を発生させる。
ーン検出器の全ての限界値検出器が駆動された場合にの
み信号を発生させる。
各音、言語の場合には各音素に対し1個のパターン検出
器を設ける。
器を設ける。
音列を認識するときは、出力信号を順次に発生するこれ
らパターン検出器のアドレスを記憶し、次いで比較のた
めコンピュータに供給する。
らパターン検出器のアドレスを記憶し、次いで比較のた
めコンピュータに供給する。
上述したところから明らかなように、本発明装置はあら
ゆる用途に通用でき、任意の音及び相当長い音列を認識
することができ、且つ音源は任意とすることができる。
ゆる用途に通用でき、任意の音及び相当長い音列を認識
することができ、且つ音源は任意とすることができる。
音響信号から導出されたものでない電気信号も本発明装
置で検査することができる。
置で検査することができる。
工業の分野では本発明は電気回転エンジン、点火エンジ
ン又はパワータービンのような機械の雑音出力を試験す
るのに用いることができる。
ン又はパワータービンのような機械の雑音出力を試験す
るのに用いることができる。
機械からの特定の音響出力信号パターンから種々の欠陥
を検出し得ることを確かめた。
を検出し得ることを確かめた。
この点において本発明は試験処理の機械化に用いること
ができる。
ができる。
図面の簡単な説明 ・
第1図は関連する公差と共に示す信号周波数スペクトル
の一例のスペクトル図、第2図は本発明装置全体のブロ
ック図、第3図は限界値検出器の第1の例を具えるパタ
ーン検出器の構成図、第4図は限界値検出器の第2の例
の構成図、第5a及び5b図は第3及び第4図の限界値
検出器の動作説明用波形図である。
の一例のスペクトル図、第2図は本発明装置全体のブロ
ック図、第3図は限界値検出器の第1の例を具えるパタ
ーン検出器の構成図、第4図は限界値検出器の第2の例
の構成図、第5a及び5b図は第3及び第4図の限界値
検出器の動作説明用波形図である。
1・・・・・・マイクロホン、2・・・・・・自動音量
調整器、3・・・・・・フィルタ群、4・・・・・・パ
ターン検出器、5・・・・°°出力端子、7・・・・・
・アドレスマルチプレクサ、8・・・・・・記憶装置、
9・・・・・・制御ユニット、10・・・・・・限界値
検出器、6・・・・・・Mの素子、VLV2゜■3.v
4・・・・・・比較器1. R1、R2、P 1 、P
2・・・・・・限界値回路、fo 、 fu・・・・
・・限界値、E(1)〜E(rrj・・・・・・入力端
子、sw(i)〜8v(ホ)・・・・・・スイッチ、A
(1)〜A(ハ)・・・・・・出力端子、R3,R5,
Dl ;R4,R6,D2;R7,R8,D5.D6・
・−・・・レヘル調整回路、Sl、82.S3・・・・
・・シュミットトリガ回路、G・・・・・・排他的OR
素子、D3゜D4・・・・・・AND素子。
調整器、3・・・・・・フィルタ群、4・・・・・・パ
ターン検出器、5・・・・°°出力端子、7・・・・・
・アドレスマルチプレクサ、8・・・・・・記憶装置、
9・・・・・・制御ユニット、10・・・・・・限界値
検出器、6・・・・・・Mの素子、VLV2゜■3.v
4・・・・・・比較器1. R1、R2、P 1 、P
2・・・・・・限界値回路、fo 、 fu・・・・
・・限界値、E(1)〜E(rrj・・・・・・入力端
子、sw(i)〜8v(ホ)・・・・・・スイッチ、A
(1)〜A(ハ)・・・・・・出力端子、R3,R5,
Dl ;R4,R6,D2;R7,R8,D5.D6・
・−・・・レヘル調整回路、Sl、82.S3・・・・
・・シュミットトリガ回路、G・・・・・・排他的OR
素子、D3゜D4・・・・・・AND素子。
Claims (1)
- 【特許請求の範囲】 1 電気信号に変換された音声を受信し、その電気信号
を予定数の周波数帯域に分割し、前記信号のエネルギー
を一定の期間に亘り各周波数帯域毎に各別の出力端子に
供給するフィルタ群3と、前記出力端子に接続され、全
周波数帯域に亘るエネルギー分布パターンを予定のパタ
ーンと順次に比較する装置4とを具える音声認識装置に
おいて、複数個のパターン検出器4を設け、各パターン
検出器を前記フィルタ群3の複数個の出力端子5に接続
し、各パターン検出器においては、これを接続したフィ
ルタ群の各出力端子に対し限界値検出器10を設けてこ
の出力端子の信号が下限値fuと上限値fo との間
に位置するときにその出力端子に信号レベルを発生させ
ると共に、AND素子6を設けて当該パターン検出器に
含まれる全ての限界値検出器の出力を合成し、全ての限
界値検出器の出力端子に信号レベルが発生する場合に当
該パターン検出器の出力端子に相当する前記AND素子
の出力端子に信号レベルを発生させるようにし、他に前
記複数個のパターン検出器に接続された記憶装置7,8
,9を設げて前記パターン検出器の出力端子の信号レベ
ルの順序を記憶し、この順序を比較装置に供給するよう
にしたことを特徴とする音声認識装置。 2、特許請求の範囲1記載の装置において、各パターン
検出器にアドレスを割当て、出力信号を発生するパター
ン検出器のアドレスを符号化して記憶装置8に記憶し、
これらアドレス符号列を予定のパターン列と比較する装
置に供給するようにしたことを特徴とする音声認識装置
。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2536640A DE2536640C3 (de) | 1975-08-16 | 1975-08-16 | Anordnung zur Erkennung von Geräuschen |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5242007A JPS5242007A (en) | 1977-04-01 |
JPS5854400B2 true JPS5854400B2 (ja) | 1983-12-05 |
Family
ID=5954186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51096193A Expired JPS5854400B2 (ja) | 1975-08-16 | 1976-08-13 | 音声認識装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US4432096A (ja) |
JP (1) | JPS5854400B2 (ja) |
DE (1) | DE2536640C3 (ja) |
ES (1) | ES450719A1 (ja) |
FR (1) | FR2321739A1 (ja) |
GB (1) | GB1562995A (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2919228C2 (de) * | 1977-01-31 | 1983-07-28 | Gert Heinz Manfred 4000 Düsseldorf Kölchens | Akustisch fernbedienbarer Schalter |
FR2380612A1 (fr) * | 1977-02-09 | 1978-09-08 | Thomson Csf | Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif |
DE2939077A1 (de) * | 1979-09-27 | 1981-04-09 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal |
US4370521A (en) * | 1980-12-19 | 1983-01-25 | Bell Telephone Laboratories, Incorporated | Endpoint detector |
JPS57201300A (en) * | 1981-06-05 | 1982-12-09 | Hitachi Ltd | Voice recognizer |
CH645501GA3 (ja) * | 1981-07-24 | 1984-10-15 | ||
JPS603700A (ja) * | 1983-06-22 | 1985-01-10 | 日本電気株式会社 | 音声検出方式 |
DE3407644A1 (de) * | 1984-03-01 | 1985-09-12 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bewertung der aehnlichkeit jeweils zweier digital dargestellter zahlenfolgen, insbesondere funktionskurven |
GB2158980B (en) * | 1984-03-23 | 1989-01-05 | Ricoh Kk | Extraction of phonemic information |
US4805225A (en) * | 1986-11-06 | 1989-02-14 | The Research Foundation Of The State University Of New York | Pattern recognition method and apparatus |
US4843562A (en) * | 1987-06-24 | 1989-06-27 | Broadcast Data Systems Limited Partnership | Broadcast information classification system and method |
US4910784A (en) * | 1987-07-30 | 1990-03-20 | Texas Instruments Incorporated | Low cost speech recognition system and method |
US5210820A (en) * | 1990-05-02 | 1993-05-11 | Broadcast Data Systems Limited Partnership | Signal recognition system and method |
JP2890831B2 (ja) * | 1990-11-28 | 1999-05-17 | ヤマハ株式会社 | Midiコード作成装置 |
US5745873A (en) * | 1992-05-01 | 1998-04-28 | Massachusetts Institute Of Technology | Speech recognition using final decision based on tentative decisions |
US7171016B1 (en) | 1993-11-18 | 2007-01-30 | Digimarc Corporation | Method for monitoring internet dissemination of image, video and/or audio files |
US5519824A (en) * | 1994-03-18 | 1996-05-21 | Timex Corporation | System and method for storing and displaying font data representing fixed-width and compressed characters |
US8094949B1 (en) | 1994-10-21 | 2012-01-10 | Digimarc Corporation | Music methods and systems |
US6560349B1 (en) * | 1994-10-21 | 2003-05-06 | Digimarc Corporation | Audio monitoring using steganographic information |
US7486799B2 (en) * | 1995-05-08 | 2009-02-03 | Digimarc Corporation | Methods for monitoring audio and images on the internet |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
US6829368B2 (en) * | 2000-01-26 | 2004-12-07 | Digimarc Corporation | Establishing and interacting with on-line media collections using identifiers in media signals |
US7562392B1 (en) | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
US5754978A (en) * | 1995-10-27 | 1998-05-19 | Speech Systems Of Colorado, Inc. | Speech recognition system |
US8180844B1 (en) | 2000-03-18 | 2012-05-15 | Digimarc Corporation | System for linking from objects to remote resources |
US7689532B1 (en) | 2000-07-20 | 2010-03-30 | Digimarc Corporation | Using embedded data with file sharing |
US7302574B2 (en) * | 1999-05-19 | 2007-11-27 | Digimarc Corporation | Content identifiers triggering corresponding responses through collaborative processing |
US8095796B2 (en) * | 1999-05-19 | 2012-01-10 | Digimarc Corporation | Content identifiers |
US7194752B1 (en) | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
CA2310769C (en) * | 1999-10-27 | 2013-05-28 | Nielsen Media Research, Inc. | Audio signature extraction and correlation |
US7035873B2 (en) * | 2001-08-20 | 2006-04-25 | Microsoft Corporation | System and methods for providing adaptive media property classification |
US6963975B1 (en) * | 2000-08-11 | 2005-11-08 | Microsoft Corporation | System and method for audio fingerprinting |
KR100349656B1 (ko) * | 2000-12-20 | 2002-08-24 | 한국전자통신연구원 | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 |
AU2002232817A1 (en) | 2000-12-21 | 2002-07-01 | Digimarc Corporation | Methods, apparatus and programs for generating and utilizing content signatures |
US7046819B2 (en) | 2001-04-25 | 2006-05-16 | Digimarc Corporation | Encoded reference signal for digital watermarks |
JP2004536348A (ja) * | 2001-07-20 | 2004-12-02 | グレースノート インコーポレイテッド | 録音の自動識別 |
US20040091111A1 (en) * | 2002-07-16 | 2004-05-13 | Levy Kenneth L. | Digital watermarking and fingerprinting applications |
US20070256499A1 (en) * | 2006-04-21 | 2007-11-08 | Pelecanos Jason W | Machine and operating environment diagnostics, detection and profiling using sound |
US20080051029A1 (en) * | 2006-08-25 | 2008-02-28 | Bradley James Witteman | Phone-based broadcast audio identification |
CA2678942C (en) | 2007-02-20 | 2018-03-06 | Nielsen Media Research, Inc. | Methods and apparatus for characterizing media |
US8458737B2 (en) * | 2007-05-02 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
WO2009064561A1 (en) | 2007-11-12 | 2009-05-22 | Nielsen Media Research, Inc. | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
DE102007056221B4 (de) * | 2007-11-27 | 2009-07-09 | Siemens Ag Österreich | Verfahren zur Spracherkennung |
US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
ES2512640T3 (es) * | 2008-03-05 | 2014-10-24 | The Nielsen Company (Us), Llc | Métodos y aparato para generar firmas |
US8687839B2 (en) | 2009-05-21 | 2014-04-01 | Digimarc Corporation | Robust signatures derived from local nonlinear filters |
US20140025385A1 (en) * | 2010-12-30 | 2014-01-23 | Nokia Corporation | Method, Apparatus and Computer Program Product for Emotion Detection |
US9536517B2 (en) | 2011-11-18 | 2017-01-03 | At&T Intellectual Property I, L.P. | System and method for crowd-sourced data labeling |
US10930276B2 (en) * | 2017-07-12 | 2021-02-23 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
US11489691B2 (en) | 2017-07-12 | 2022-11-01 | Universal Electronics Inc. | Apparatus, system and method for directing voice input in a controlling device |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4950804A (ja) * | 1972-05-26 | 1974-05-17 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2575909A (en) * | 1949-07-01 | 1951-11-20 | Bell Telephone Labor Inc | Voice-operated system |
US3683284A (en) * | 1968-06-25 | 1972-08-08 | Picker Corp | Pulse height analyzer |
US3755627A (en) * | 1971-12-22 | 1973-08-28 | Us Navy | Programmable feature extractor and speech recognizer |
-
1975
- 1975-08-16 DE DE2536640A patent/DE2536640C3/de not_active Expired
-
1976
- 1976-08-13 GB GB33772/76A patent/GB1562995A/en not_active Expired
- 1976-08-13 JP JP51096193A patent/JPS5854400B2/ja not_active Expired
- 1976-08-14 ES ES450719A patent/ES450719A1/es not_active Expired
- 1976-08-16 FR FR7624875A patent/FR2321739A1/fr active Granted
-
1981
- 1981-09-14 US US06/301,869 patent/US4432096A/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4950804A (ja) * | 1972-05-26 | 1974-05-17 |
Also Published As
Publication number | Publication date |
---|---|
DE2536640B2 (ja) | 1979-02-08 |
FR2321739B1 (ja) | 1983-02-04 |
JPS5242007A (en) | 1977-04-01 |
ES450719A1 (es) | 1977-09-01 |
FR2321739A1 (fr) | 1977-03-18 |
DE2536640C3 (de) | 1979-10-11 |
GB1562995A (en) | 1980-03-19 |
DE2536640A1 (de) | 1977-02-24 |
US4432096A (en) | 1984-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5854400B2 (ja) | 音声認識装置 | |
US4284846A (en) | System and method for sound recognition | |
US4181813A (en) | System and method for speech recognition | |
US6594630B1 (en) | Voice-activated control for electrical device | |
US4783807A (en) | System and method for sound recognition with feature selection synchronized to voice pitch | |
US3770892A (en) | Connected word recognition system | |
US20050143997A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
JPS58134700A (ja) | 連続音声認識の改良 | |
JPH0361959B2 (ja) | ||
Pallett | Performance assessment of automatic speech recognizers | |
US3198884A (en) | Sound analyzing system | |
US4707857A (en) | Voice command recognition system having compact significant feature data | |
Haleem | Voice controlled automation system | |
Patel et al. | Optimize approach to voice recognition using iot | |
Mandel et al. | Audio super-resolution using concatenative resynthesis | |
JPH02298998A (ja) | 音声認識装置とその方法 | |
JP3523382B2 (ja) | 音声認識装置及び音声認識方法 | |
CA2045612A1 (en) | Time series association learning | |
Clapper | Automatic word recognition | |
JPS59137999A (ja) | 音声認識装置 | |
US5774862A (en) | Computer communication system | |
JPS59501520A (ja) | 調音音声認識のための装置 | |
JPS63502144A (ja) | 騒音環境で言語を認識する方法 | |
Mishra et al. | Automation System Voice Controlled | |
Abel et al. | A biologically inspired onset and offset speech segmentation approach |