JPS5854400B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5854400B2
JPS5854400B2 JP51096193A JP9619376A JPS5854400B2 JP S5854400 B2 JPS5854400 B2 JP S5854400B2 JP 51096193 A JP51096193 A JP 51096193A JP 9619376 A JP9619376 A JP 9619376A JP S5854400 B2 JPS5854400 B2 JP S5854400B2
Authority
JP
Japan
Prior art keywords
pattern
signal
output
detectors
detector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP51096193A
Other languages
English (en)
Other versions
JPS5242007A (en
Inventor
エルンスト・ブンゲ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JPS5242007A publication Critical patent/JPS5242007A/ja
Publication of JPS5854400B2 publication Critical patent/JPS5854400B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Description

【発明の詳細な説明】 本発明は電気信号に変換された音声を受信し、その電気
信号を予定数の周波数帯域に分割し、前記信号のエネル
ギーを一定の期間に亘り各周波数帯域毎に各別の出力端
子に供給するフィルタ群と、前記出力端子に接続され、
全周波数帯域に亘るエネルギー分布パターンを予定のパ
ターンと順次に比較する装置とを具える音声認識装置に
関するものである。
斯種の装置はドイツ国特許出願公開第 2363590号により既知である。
この既知の装置そは、フィルタ群の積分出力信号をマル
チプレクサ及びアナログ−デジタル変換器を経てコンピ
ュータに供給する。
短期間に亘り゛積分された検査すべき信号のスペクトル
分布は多値ベクトルを表わすため、コンピュータは種々
のベクトルの時間的な順番を受信し、既知の種々の順番
と比較する。
しかし、ベクトルを表わすためには多数のビットが必要
とされるので、長いベクトル順番は大記憶容量を必要と
すると共に高速コンピュータの場合でも相当長い処理時
間を必要とするため、極めて大形且つ高速で従って高価
なコンピュータを必要とすることなく実時間処理を達成
することは殆んど不可能である。
本発明の目的は、多数の種々の音声を実時間で簡単に認
識し得る装置を提供せんとするにある。
本発明の他の目的は音声信号の簡単且つ効果的な前処理
装置を提供せんとするにある。
本発明は、これらの目的を実現するために、複数個のパ
ターン検出器を設け、各パターン検出器をフィルタ群の
出力端子の少くとも1部分に接続し、各パターン検出器
においては、これが接続されたフィルタ群の各出力端子
に対し限界値検出器を設けてこの出力端子上の信号が下
限値fu と上限値fo との間に位置するときにそ
の出力端子に信号レベルを発生させると共に、AND素
子により当該パターン検出器に含まれる全ての限界値検
出器の出力を合成し、全ての限界値検出器の出力端子に
信号レベルが発生する場合に当該パターン検出器の出力
端子に相当する前記AND素子の出力端子に信号レベル
を発生させ、他に前記複数個のパターン検出器に接続さ
れた記憶装置を設けてこれらパターン検出器の出力端子
の信号レベルの時間的順番を記憶すると共にこの順番を
比較装置に供給するようにしたことを特徴とする。
各期間において検査すべき信号のスペクトル分布、即ち
各ベクトルは、人間の言語の場合既知のよう音素に相当
するスペクトルパターンとみなせる。
音素のスペクトル分布は話者に依存し、部分的に相当の
公差を有するため、各音素における各スペクトル部分に
対し、上限値及び下限値を用いる。
これら限界値は互に無関係に調整し得るようにするのが
好適である。
本発明によればフンピユータは可能性のある全てのベク
トルを受信しないで、実際に発生するベクトル又はパタ
ーンのみを受信し、これらベクトルを復号するため、多
大のデータ削減が得られる。
限界値検出器は2個の比較器、例えを±演算増幅器を用
い、その後段に相互接続部材を後続させることによって
極めて簡単に構成することができる。
従って、パターン検出器は多数のスペクトル範囲に対す
る多数の限界値検出器を設けてパターンの解像度を良く
する場合でも極めて簡単じ構成できるため、パターン検
出器を多数の種々の音又は音素に対応して多数とする場
合には安価な装置を得ることができる。
各パターン検出器にアドレスを割当て、出力信号を発生
するパターン検出器のアドレスを符号化して記憶装置に
記憶し、これらアドレス符号列を予定のパターン列と比
較する装置に供給するのが好適である。
これがため、斯る認識装置は例えば発電機や車輌のよう
な機械の動作状態(種々の動作雑音から判明する)を、
パターン検出器に対応するアドレス符号列を比較値とし
て与えることにより遂次認識することができる。
また、斯る予定のアドレス符号列は声素列即ち言語又は
一続きの言葉を表わすものとして音声認識に用いること
ができる。
斯る予定のアドレス符号列はアダプティブパターン認識
プログラムで実現することができる。
このプログラムによれば、学習制御中認識すべき1つの
言語に対し限界値アドレス列で表わされた複数個の既知
のモデルを書込む。
このプログラムではこれらアドレス列の周波数分布を認
定し、記憶する。
このことは予定した語粟の各語について行なう。
装置を話者とできるだけ無関係とするためには、多くの
人に学習すべき各語に対するモデルを話してもらうのが
よい。
学習制御の終了後、認識すべき各語に対するアドレス列
をコンピュータに記憶する。
学習制御の終了後語を認識する場合、マイクロホン及び
フィルタ群を経て発生されたスペクトルをパターン検出
器に供給し、これら検出器のアドレスをこれらの出力信
号の順番に応じて符号化し、コンピュータに供給し、学
習させた語粟の周波数分布と語単位で比較する。
瞬時アドレス列に対し最高値を発生する周波数分布を有
する語を認識された語をみなす。
完全な文章の認識を行なう場合は、本発明装置の信頼性
を、可能な語順に対し文法的語句配列規則を用いること
により高めることができる。
以下図面につき本発明を説明する。
第1図に示すスペクトルは第2図に示す装置によって得
られる。
第2図において、認識すべき音又は音列はマイクロホン
1で受信され、電気信号に変換される。
この電気信号は自動音量調整器2に供給し、ここでその
電気信号を振幅について標準化する。
自動音量制御は音声再生技術において公知であるため、
これ以上説明しない。
このようにして認識又は識別は総合音量と無関係とする
(このことは言語認識等に対して不可欠であることが認
められている)。
フィルタ群3において調整器2の出力信号を、入力信号
を共通に受信し、出力信号を並列に発生する1組のリン
グ回路又は狭帯域フィルタによって予定数にの順次の周
波数範囲又はスペクトル成分に分割する。
得られた信号を積分装置(図示してないが慣例のRC回
路網とすることができる)により整流し例えば10is
の一定の時間隔に亘り積分する。
或は又、クロック動作を用い、各クロックパルスで前記
積分時間隔を終了させると共にフィルタ群の出力端子に
積分結果を発生させることができる。
この場合には装置の次段の素子にもクロックパルス入力
端子を設ける必要があるが、この装置についてはこれ以
上論じない。
整流積分された各別のスペクトル成分はフィルタ群3か
もチャンネル5を経て出力される。
各出力端子の信号又は電圧値は前記積分時間に亘って積
分された各スペクトル成分のエネルギー量に比例し、そ
の一例は第1図で与えられ、本例はフィルタ群3の出力
数が10の場合である。
このエネルギー分布は一般に非静止音の場合少恢ともい
くつかのスペクトル成分が時間に依存する。
フィルタ群3からのに個の出力端子は第2図のパターン
検出器4(1)〜4(n)の何れにも並列に接続する。
各パターン検出器によりに個の各出力の電圧が各パター
ン検出器に特定的に限定された下限値fu と上限値
fo との間の公差範囲内に位置するか否かを検査す
る。
第1図にはこれらの公差範囲のいくつかを垂直ストロー
ク線で示すが、これらはパターン検出器の内の1個にお
いて設定し得る。
この種の公差範囲は各チャンネルについて示してない。
その理由は種々の音声に対しては一般に音声の認識にあ
まり重要でないいくつかのチャンネルが存在するためで
ある。
これがため、パターン検出の複雑さを軽減でき、認識の
信頼性を幾分増すことができる。
第1図の例はチャンネル2−4及び7−9の信号が関連
する公差範囲内に位置するため、対応するパターン検出
器が正出力信号を発生することを示す。
しかし、何れか1チヤンネルの信号が公差範囲内にない
場合そのパターン検出器は出力信号を発生しない。
第1図は、更に、種々のチャンネルに対する公差範囲が
等しくないことも示す。
これは、特に言語認識の場合いろいろな話者に基づいて
決定される種々のチャ/ネル出力の信号の偏差が等しい
大きさでないためである。
第3図は第2図のパターン検出器4の内部構造の一例を
示す。
この検出器は破線で示す多数の限界値検出器10(1)
〜10(rn)を具え、それらの出力端子A(1)〜A
(1111はAND素子6で合成される。
パターン検出器4の出力端子Mは上述したように全ての
限界値検出器10(1)〜10(mlの出力端子A(j
)が同時に正出力信号を発生する場合にのみ出力信号を
発生する。
各限界値検出器の入力端子E(1)・・・・・・・・・
E(m)は対応するスイッチsw(i)・・・・・・・
・・Sw(rrllの第1接続点に接続する。
各スイッチによりフィルタ群3のに個の出力端子501
個を選択する。
各スイッチはこれら出力端子の1部にのみ接続し、スイ
ッチsw(i)は最低項数1)の出力端子にのみ接続し
、スイッチ5W(2)は次のいくつかの出力端子に重複
して接続し、最后のスイッチSW(m)は最高順番的の
チャンネルにのみ接続する。
これはmの値がKの値より小さい場合に好適な接続配置
であること明らかである。
各限界値検出器10は2個の比較器V1及びV2を具え
、これら比較器としては本例では演算増幅器を用いる。
演算増幅器の非反転入力端子(+記号で示す)を各別の
入力端子E(j)に接続すると共に一記号で示す入力端
子には2個の抵抗R1及び及2とポテンシオメータP1
及びP2の直列接続回路により発生される限界電圧を受
信させる。
この直列接続回路は電圧源の正及び負端子+U及び−U
間に接続する。
下限値fuはポテンシオメータP2の設定を変えて調整
することができ、この限界値と上限値fo との間隔
はポテンシオメータP1によって調整することができる
比較器V1及び■2の出力信号は信号の論理値に影響を
与えない数個の回路素子(後述する)を経て排他的OR
素子Gに供給し、その出力端子は限界値検出器10の出
力端子Aに接続する。
この回路の基本動作を第5a図について詳細に説明する
入力端子Eの電圧aが下限電圧fu より低い限り、
比較器V1の出力信号す及び比較器■2の出力信号Cは
低レベルである。
入力電圧aが下限電圧fu を越えると同時に、比較器
v2の出力信号Cが高レベルとなり、排他的OR素子G
は信号dで示すように高出力信号を発生する。
入力電圧aが更に増大し、上限電圧fo をも越える場
合、比較器■1の出力信号すも高レベルとなるため、排
他的OR素子Gは2個の高入力信号を受信し、既知のよ
うに低出力信号を発生する。
従って、正信号は入力電圧aが2つの限界電圧fu及び
fo間の値を有する場合にのみ出力端子Aに発生する。
入力電圧aが再び減少する場合、入力電圧aが2個の限
界値で制限された公差範囲を通過する間中再び高出力信
号を発生する。
その理由は比較器■1及びv2の出力信号が第5a図に
示すように順次に低レベルとなるためである。
比較器v1及びv2として用いる演算増幅器は後続の論
理回路で必要とされる電源電圧より高い電源電圧を必要
とする場合が多いため、それらの出力信号(電源電圧に
略々等しい)をこの低論理レベルに制限する必要がある
比較器■1に対しこのレベル制限は抵抗R3及びR5と
ダイオードD1で行なう。
これら抵抗の値は、比較器v1の出力が高出力電圧の場
合に回路S1の入力電圧が最大許容値を越えないように
選択する。
この場合ダイオードD1は遮断し、不作動である。
比較器V1の出力が負出力信号の場合にはダイオードD
1が導通し、回路S1の入力電圧を略々零電位に制限す
る。
比較器V2の出力信号も同様に抵抗R4及びR6とダイ
オードD2とによって後続の論理回路のレベルに制限す
る。
回路S1及びS2はシュミットトリガ回路として、入力
電圧が2個の限界電圧の一方fu又はfo を極めて単
調に横切る場合、従って比較器の出力信号に極めて単調
な遷移を発生する場合でも、後続の論理回路は急峻な側
縁を有する信号を得るようにする。
従って比較器の入力信号が極めて単調に変化する場合で
も排他的OR素子Gはその論理出力を変えるか変えない
ことができるため、如何なる瞬時においても1個以上の
パターン検出器から正出力信号が発生することは起り得
ない。
第4図は限界値検出器10の他の例を示す。
本例でも比較器V3及びv4として演算増幅器を用いる
が、入力端子Eを上側比較器v3の反転入力端子と下側
比較器v4の非反転入力端子に接続する。
両比較器の他方の入力端子はそれぞれ第3図に示すよう
にして発生し得る限界電圧fu及びfo に接続する。
これら比較器の出力をダイオードD3及びD4より成る
AND素子を経て、例えば比較器v3及びV4の比較的
高い正の電源電圧Uに抵抗R7を経て接続された点Pに
接続する。
本例回路の動作を第5b図について詳細に説明する。
入力端子Eの電圧aに下限電圧fu より低い限り、比
較器v3の出力は曲線eで示すように高レベル信号であ
るが、比較器V4の出力は第5a図の曲線Cに対応する
曲線Cに従って低レベル信号である。
入力電圧aが下限電圧fu を越えると同時に、比較器
v4の出力信号が正となり、従ってAND機能のために
点Pも曲線dで示すように正信号となる。
次いで入力電圧aが上限電圧fo を越えると、比較器
v3の出力電圧が負になり、従って点Pの電圧も負にな
る。
第5b図を第5a図と比較すると、点P上には第3図に
示す回路の出力端子A上と同一の電圧変化が発生するこ
とが解るが、点P上の信号は比較器の出力信号と同等の
電圧振幅を有するため、この信号も後続の論理回路の低
レベルに調整する必要がある。
このレベル調整はダイオードD5と抵抗R8により行な
う。
この場合、両比較器が高出力信号を発生するとき、点P
の電圧はこのとき導通するダイオードD5のために抵抗
R7及びR8の比で決まる値を越え得ない。
しかし、一方の比較器が負出力信号を発生する場合、点
Pの電圧は略々この負信号と同一値となるが、このとき
ダイオードD5が遮断し、抵抗R8が存在するために回
路S3の入力端子に略々零電位が供給される。
回路S3の入力端子の最大正電圧の制限は破線を経て点
P゛と論理回路の電源としても作用する電圧+U1とに
接続したダイオードD6で与えることもできる。
このダイオードのために、点Pの電圧はこの電源電圧よ
り正になることはできない。
更に他の方法としては、抵抗R7に対し比較器■3及び
■4の動作電圧の代りに論理回路素子の電源電圧U1を
用いることができる。
この場合比較器■3及びV4が正出力信号の場合ダイオ
ードD3及びD4は常に遮断される。
限界値検出器の出力端子Aの前段にシュミットトリガ回
路53を設げる。
この回路は前述したように常に急峻な側縁を有する出力
信号を発生する。
第5 a 、5 b図において信号値(曲線a)及び公
差限界値fo 、 fuは曲線b 、 ’c 1 d
、 eの論理レベルの電気的値とは関係ないことに注意
されたい。
以上述べたように第2図に示すパターン検出器4はフィ
ルタ群3の出力端子に接続された入カバターンの全成分
がプリセットパターンと一致するときに出力信号を発生
する。
認識すべき各基本信号パターン(即ち人間の言語の場合
における各音素)に対して斯るパターン検出器を設ける
種々の単音のみを認識する必要がある場合、パターン検
出器の出力を直接用いることができ、例えばこれら出力
によって表示装置を制御することができる。
複数個の順次の基本パターンより成る信号列を認識する
場合には各基本パターンをそれぞれのパターン検出器に
より認識し、認識した基本パタ〒ン列を第2図に示すよ
うに記憶装置8に一時的に記憶するのが好適である。
この目的のために、パターン検出器4の出力端子をアド
レスマルチプレクサTに接続し、これによりパターン検
出器の1ビット出力信号をそのパターン検出器のアドレ
スを表わす2進数に変換する。
次に、この2進数を記憶装置8にデータとして供給する
言語認識の場合にはnの値は最大で約32である。
これがため、前記パターン検出器のアドレスは5ビツト
で構成する。
言語を認識する場合、記憶装置8は認識すべき言語の最
大の音素列を記憶する必要がある。
言語認識においてはこの音素列は最大で16パターンの
長さを有し、これがため記憶装置8の容量は5X16=
80ビツトとする。
制御ユニット9は記憶装置8の書込みを制御し、そのた
めのアドレス発生器を具える。
最初の基本パターンを認識する場合、制御ユニット9に
より記憶装置8の第1記憶位置を駆動してここに対応す
るパターン検出器のアドレスを書込む。
制御ユニットは認識が終了すると1位置進むアドレスカ
ウンタを具え、次の記憶位置を駆動する。
この制御は、全てのゲート6(第3図)の出力をORゲ
ート(図示せず)で合成して実現することができる。
このORゲートの゛↓″出力を記憶装置8の”書込″指
令及び制御ユニット9の“1ステップアップパ指令とし
て堝用させる。
検出器アドレスの書込みは認識したパターンが記憶装置
8の容量一杯となるまで繰返すことができる。
斯る2進数の列(本例では最大16個)は認識すべき信
号の基本パターン(言語認識の場合は音素)の列を表わ
し、これら基本パターンより成る言語に関する答を与え
るものである。
例えば、パターン検出器4(1)が°゛a″を、次にパ
ターン検出出器4(7)が鼻音“n ”を、次にパター
ン検出器4(1)が再びa ”を認識する場合、数列1
.7、■が話された言葉” Anna ”に対するパタ
ーン列として記憶される。
言葉の終りは第2図のマイクロホン1で受信された音響
エネルギーが著しく低くなるときに信号を発するギャッ
プ検出器で検出することができる。
この終了信号は制御ユニット9内のアドレスカウンタを
リセットすると共に記憶装置8の読出動作を制御してそ
の内容の全てを出力端子8Aに接続された処理装置に転
送する。
この読出動作は破壊読出しとし、前記コンピュータによ
り別の制御系で行うことができる。
コンピュータへの情報の転送は慣例の技術であるからこ
の点についてはこれ以上説明しない。
前記ギャップ検出器は図示してないが、その出力信号は
導線1人を経て供給する。
1つの言葉が終了した後アドレススデジット列は前記コ
ンピュータに書込まれ、ここで認識語粟の種々の語の周
波数分布と比較され、一致により特定の語と関連せしめ
られる。
雑音信号の工業的分析評価においては、制御ユニット9
を他の制御信号、例えば手動制御ボタンにより1回循環
させて全てのアドレス位置を走査することができる。
以上要約すると、本発明では音又は言語信号を電気信号
に変換し、フィルタ群にて複数個の各別のスペクトル成
分に分割する。
これら成分を短時間に亘り積分し、短時間の信号スペク
トルを発生させる。
これらスペクトル成分を対応する個数の連列リード線を
経て複数個のパターン検出器に供給する。
各検出器は供給されたスペクトル分布パターンが当該パ
ターン検出器に調整したパターンに一致する場合にのみ
出力信号を発生する。
この目的のために、各パターン検出器は供給された入力
信号が2個の可調整限界値間に位置する場合に信号を発
生する複数個の限界値検出器で構成する。
各限界値検出器をフィルタ群の異なる出力端子に接続す
ると共に種々の限界値に調整する。
これら限界値検出器を出力をAND素子で合成してパタ
ーン検出器の全ての限界値検出器が駆動された場合にの
み信号を発生させる。
各音、言語の場合には各音素に対し1個のパターン検出
器を設ける。
音列を認識するときは、出力信号を順次に発生するこれ
らパターン検出器のアドレスを記憶し、次いで比較のた
めコンピュータに供給する。
上述したところから明らかなように、本発明装置はあら
ゆる用途に通用でき、任意の音及び相当長い音列を認識
することができ、且つ音源は任意とすることができる。
音響信号から導出されたものでない電気信号も本発明装
置で検査することができる。
工業の分野では本発明は電気回転エンジン、点火エンジ
ン又はパワータービンのような機械の雑音出力を試験す
るのに用いることができる。
機械からの特定の音響出力信号パターンから種々の欠陥
を検出し得ることを確かめた。
この点において本発明は試験処理の機械化に用いること
ができる。
図面の簡単な説明 ・ 第1図は関連する公差と共に示す信号周波数スペクトル
の一例のスペクトル図、第2図は本発明装置全体のブロ
ック図、第3図は限界値検出器の第1の例を具えるパタ
ーン検出器の構成図、第4図は限界値検出器の第2の例
の構成図、第5a及び5b図は第3及び第4図の限界値
検出器の動作説明用波形図である。
1・・・・・・マイクロホン、2・・・・・・自動音量
調整器、3・・・・・・フィルタ群、4・・・・・・パ
ターン検出器、5・・・・°°出力端子、7・・・・・
・アドレスマルチプレクサ、8・・・・・・記憶装置、
9・・・・・・制御ユニット、10・・・・・・限界値
検出器、6・・・・・・Mの素子、VLV2゜■3.v
4・・・・・・比較器1. R1、R2、P 1 、P
2・・・・・・限界値回路、fo 、 fu・・・・
・・限界値、E(1)〜E(rrj・・・・・・入力端
子、sw(i)〜8v(ホ)・・・・・・スイッチ、A
(1)〜A(ハ)・・・・・・出力端子、R3,R5,
Dl ;R4,R6,D2;R7,R8,D5.D6・
・−・・・レヘル調整回路、Sl、82.S3・・・・
・・シュミットトリガ回路、G・・・・・・排他的OR
素子、D3゜D4・・・・・・AND素子。

Claims (1)

  1. 【特許請求の範囲】 1 電気信号に変換された音声を受信し、その電気信号
    を予定数の周波数帯域に分割し、前記信号のエネルギー
    を一定の期間に亘り各周波数帯域毎に各別の出力端子に
    供給するフィルタ群3と、前記出力端子に接続され、全
    周波数帯域に亘るエネルギー分布パターンを予定のパタ
    ーンと順次に比較する装置4とを具える音声認識装置に
    おいて、複数個のパターン検出器4を設け、各パターン
    検出器を前記フィルタ群3の複数個の出力端子5に接続
    し、各パターン検出器においては、これを接続したフィ
    ルタ群の各出力端子に対し限界値検出器10を設けてこ
    の出力端子の信号が下限値fuと上限値fo との間
    に位置するときにその出力端子に信号レベルを発生させ
    ると共に、AND素子6を設けて当該パターン検出器に
    含まれる全ての限界値検出器の出力を合成し、全ての限
    界値検出器の出力端子に信号レベルが発生する場合に当
    該パターン検出器の出力端子に相当する前記AND素子
    の出力端子に信号レベルを発生させるようにし、他に前
    記複数個のパターン検出器に接続された記憶装置7,8
    ,9を設げて前記パターン検出器の出力端子の信号レベ
    ルの順序を記憶し、この順序を比較装置に供給するよう
    にしたことを特徴とする音声認識装置。 2、特許請求の範囲1記載の装置において、各パターン
    検出器にアドレスを割当て、出力信号を発生するパター
    ン検出器のアドレスを符号化して記憶装置8に記憶し、
    これらアドレス符号列を予定のパターン列と比較する装
    置に供給するようにしたことを特徴とする音声認識装置
JP51096193A 1975-08-16 1976-08-13 音声認識装置 Expired JPS5854400B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2536640A DE2536640C3 (de) 1975-08-16 1975-08-16 Anordnung zur Erkennung von Geräuschen

Publications (2)

Publication Number Publication Date
JPS5242007A JPS5242007A (en) 1977-04-01
JPS5854400B2 true JPS5854400B2 (ja) 1983-12-05

Family

ID=5954186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51096193A Expired JPS5854400B2 (ja) 1975-08-16 1976-08-13 音声認識装置

Country Status (6)

Country Link
US (1) US4432096A (ja)
JP (1) JPS5854400B2 (ja)
DE (1) DE2536640C3 (ja)
ES (1) ES450719A1 (ja)
FR (1) FR2321739A1 (ja)
GB (1) GB1562995A (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2919228C2 (de) * 1977-01-31 1983-07-28 Gert Heinz Manfred 4000 Düsseldorf Kölchens Akustisch fernbedienbarer Schalter
FR2380612A1 (fr) * 1977-02-09 1978-09-08 Thomson Csf Dispositif de discrimination des signaux de parole et systeme d'alternat comportant un tel dispositif
DE2939077A1 (de) * 1979-09-27 1981-04-09 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal
US4370521A (en) * 1980-12-19 1983-01-25 Bell Telephone Laboratories, Incorporated Endpoint detector
JPS57201300A (en) * 1981-06-05 1982-12-09 Hitachi Ltd Voice recognizer
CH645501GA3 (ja) * 1981-07-24 1984-10-15
JPS603700A (ja) * 1983-06-22 1985-01-10 日本電気株式会社 音声検出方式
DE3407644A1 (de) * 1984-03-01 1985-09-12 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bewertung der aehnlichkeit jeweils zweier digital dargestellter zahlenfolgen, insbesondere funktionskurven
GB2158980B (en) * 1984-03-23 1989-01-05 Ricoh Kk Extraction of phonemic information
US4805225A (en) * 1986-11-06 1989-02-14 The Research Foundation Of The State University Of New York Pattern recognition method and apparatus
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
US4910784A (en) * 1987-07-30 1990-03-20 Texas Instruments Incorporated Low cost speech recognition system and method
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
JP2890831B2 (ja) * 1990-11-28 1999-05-17 ヤマハ株式会社 Midiコード作成装置
US5745873A (en) * 1992-05-01 1998-04-28 Massachusetts Institute Of Technology Speech recognition using final decision based on tentative decisions
US7171016B1 (en) 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US5519824A (en) * 1994-03-18 1996-05-21 Timex Corporation System and method for storing and displaying font data representing fixed-width and compressed characters
US8094949B1 (en) 1994-10-21 2012-01-10 Digimarc Corporation Music methods and systems
US6560349B1 (en) * 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US7486799B2 (en) * 1995-05-08 2009-02-03 Digimarc Corporation Methods for monitoring audio and images on the internet
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US6829368B2 (en) * 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US7562392B1 (en) 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
US8180844B1 (en) 2000-03-18 2012-05-15 Digimarc Corporation System for linking from objects to remote resources
US7689532B1 (en) 2000-07-20 2010-03-30 Digimarc Corporation Using embedded data with file sharing
US7302574B2 (en) * 1999-05-19 2007-11-27 Digimarc Corporation Content identifiers triggering corresponding responses through collaborative processing
US8095796B2 (en) * 1999-05-19 2012-01-10 Digimarc Corporation Content identifiers
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
CA2310769C (en) * 1999-10-27 2013-05-28 Nielsen Media Research, Inc. Audio signature extraction and correlation
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
KR100349656B1 (ko) * 2000-12-20 2002-08-24 한국전자통신연구원 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
AU2002232817A1 (en) 2000-12-21 2002-07-01 Digimarc Corporation Methods, apparatus and programs for generating and utilizing content signatures
US7046819B2 (en) 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
JP2004536348A (ja) * 2001-07-20 2004-12-02 グレースノート インコーポレイテッド 録音の自動識別
US20040091111A1 (en) * 2002-07-16 2004-05-13 Levy Kenneth L. Digital watermarking and fingerprinting applications
US20070256499A1 (en) * 2006-04-21 2007-11-08 Pelecanos Jason W Machine and operating environment diagnostics, detection and profiling using sound
US20080051029A1 (en) * 2006-08-25 2008-02-28 Bradley James Witteman Phone-based broadcast audio identification
CA2678942C (en) 2007-02-20 2018-03-06 Nielsen Media Research, Inc. Methods and apparatus for characterizing media
US8458737B2 (en) * 2007-05-02 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
WO2009064561A1 (en) 2007-11-12 2009-05-22 Nielsen Media Research, Inc. Methods and apparatus to perform audio watermarking and watermark detection and extraction
DE102007056221B4 (de) * 2007-11-27 2009-07-09 Siemens Ag Österreich Verfahren zur Spracherkennung
US8457951B2 (en) 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
ES2512640T3 (es) * 2008-03-05 2014-10-24 The Nielsen Company (Us), Llc Métodos y aparato para generar firmas
US8687839B2 (en) 2009-05-21 2014-04-01 Digimarc Corporation Robust signatures derived from local nonlinear filters
US20140025385A1 (en) * 2010-12-30 2014-01-23 Nokia Corporation Method, Apparatus and Computer Program Product for Emotion Detection
US9536517B2 (en) 2011-11-18 2017-01-03 At&T Intellectual Property I, L.P. System and method for crowd-sourced data labeling
US10930276B2 (en) * 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US11489691B2 (en) 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4950804A (ja) * 1972-05-26 1974-05-17

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2575909A (en) * 1949-07-01 1951-11-20 Bell Telephone Labor Inc Voice-operated system
US3683284A (en) * 1968-06-25 1972-08-08 Picker Corp Pulse height analyzer
US3755627A (en) * 1971-12-22 1973-08-28 Us Navy Programmable feature extractor and speech recognizer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4950804A (ja) * 1972-05-26 1974-05-17

Also Published As

Publication number Publication date
DE2536640B2 (ja) 1979-02-08
FR2321739B1 (ja) 1983-02-04
JPS5242007A (en) 1977-04-01
ES450719A1 (es) 1977-09-01
FR2321739A1 (fr) 1977-03-18
DE2536640C3 (de) 1979-10-11
GB1562995A (en) 1980-03-19
DE2536640A1 (de) 1977-02-24
US4432096A (en) 1984-02-14

Similar Documents

Publication Publication Date Title
JPS5854400B2 (ja) 音声認識装置
US4284846A (en) System and method for sound recognition
US4181813A (en) System and method for speech recognition
US6594630B1 (en) Voice-activated control for electrical device
US4783807A (en) System and method for sound recognition with feature selection synchronized to voice pitch
US3770892A (en) Connected word recognition system
US20050143997A1 (en) Method and apparatus using spectral addition for speaker recognition
JPS58134700A (ja) 連続音声認識の改良
JPH0361959B2 (ja)
Pallett Performance assessment of automatic speech recognizers
US3198884A (en) Sound analyzing system
US4707857A (en) Voice command recognition system having compact significant feature data
Haleem Voice controlled automation system
Patel et al. Optimize approach to voice recognition using iot
Mandel et al. Audio super-resolution using concatenative resynthesis
JPH02298998A (ja) 音声認識装置とその方法
JP3523382B2 (ja) 音声認識装置及び音声認識方法
CA2045612A1 (en) Time series association learning
Clapper Automatic word recognition
JPS59137999A (ja) 音声認識装置
US5774862A (en) Computer communication system
JPS59501520A (ja) 調音音声認識のための装置
JPS63502144A (ja) 騒音環境で言語を認識する方法
Mishra et al. Automation System Voice Controlled
Abel et al. A biologically inspired onset and offset speech segmentation approach