JPH11502953A - 厳しい環境での音声認識方法及びその装置 - Google Patents

厳しい環境での音声認識方法及びその装置

Info

Publication number
JPH11502953A
JPH11502953A JP9526617A JP52661797A JPH11502953A JP H11502953 A JPH11502953 A JP H11502953A JP 9526617 A JP9526617 A JP 9526617A JP 52661797 A JP52661797 A JP 52661797A JP H11502953 A JPH11502953 A JP H11502953A
Authority
JP
Japan
Prior art keywords
recognition
speech
syntax
phrases
coupled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9526617A
Other languages
English (en)
Inventor
クリスティアン ギュリ
ドミニク パストール
ジェラール レノー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales Avionics SAS
Original Assignee
Thales Avionics SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales Avionics SAS filed Critical Thales Avionics SAS
Publication of JPH11502953A publication Critical patent/JPH11502953A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 本発明のシステムは、音響音声解読装置11と音声認識装置3に結合する記憶保存装置5を有し、該解読装置11は認識管理装置6に結合し、音声認識装置3は辞書12と認識管理装置6とシンタックス認識装置7と結合し、シンタックス認識装置7は対話蓄積装置8と結合し、対話蓄積装置8は認識管理装置6と結合していることを特徴とする。

Description

【発明の詳細な説明】 厳しい環境での音声認識方法及びその装置 技術分野 本発明は、“厳しい”状況下、すなわち雑音のみならずユーザに影響を与えう る様々な物理的、生理的な要因によって強烈に妨害された環境のもとでの音声指 令システムに関するものである。 背景技術 例えば、軍用航空機の操縦室のような場合の厳しい環境では音声の獲補、回復 、処理の装置は最適化されておらず、さらに効率よく機能していない。乗組員と 別の話し手が交わす無線による通信はまさに程度が低い。ユーザは何人かの相手 (他の航空機や地上の整備員、他の乗組員、それに自分の声)と通信するわけだ が、こういった通信は単音で行われていて、妨害されるのでかなり理解しづらく 、階層的な構造になっていない。さらには様々な物理的、生理的要素でユーザの 能力までもが妨害されることもある。これらの要素の中には特に航空機の負荷率 や酵素マスク、高呼吸圧、操縦士のストレスといったものが認められる。このよ うな条件の悪い困難な通信は周囲の雑音が加わると乗組員を疲労させたり、健康 にまでも悪影響を及ぼしたりす る。乗組員はヘルメットを着用するが、このような雑音から守る働きは皆無に等 しい。彼らが通信を幾分でもしやすくするためにできる唯一の手段は音声レベル を調節する事であるが、これも満足のいくものとはほど遠い。こうした音声の通 信にはいろんな装置は備わっているがそういった装置はそれぞれ異なるもので必 ずしも比較できるわけではない。加えて、複雑化する機内のシステムで操縦士の 負担は重くなり、ストレスでいらいらしたり、集中力がなくなったり、効率が落 ちたりするなどの結果を招く。最高の条件で任務を果たすには大変不利である。 こうした意味で、高認識率音声指令装置はきわめて有効なものになってくる。高 認識率音声指令装置があれば、比較的に自然で直接的に複雑なシステムを制御す る事ができるようになる。というのは、触知板やキーボード、多値ボタンを使用 しているときなどは実際不可能を思われるが、操縦士の全神経を必要とすること などもなくなるのである。 本発明の目的は特に雑音の大きい環境のもとで10語以上から成るフレーズ及 び数百個の単語を備え、高認識率(概して95%)を達成した音声指令システム である。 発明の開示 本発明の方法は、雑な認識を行い、保存されている音響レファレンスと比較し 、認識されたN個の最適語句を提供し、それら可能性のある会話のモデルと比較 し、音響的デコードを行って最も確からしいフレーズを選択する。 この発明による音声認識システムには、音響音声解読装置に接続している獲得 装置なるものがあり、この音響音声解読装置には音声認識装置と認識管理装置に 連結している。またこの音声認識装置は辞書を認識管理装置と構文認識装置と繋 がっている。構文認識装置は対話蓄積装置と接続していて、その対話蓄積装置は 認識管理装置に連結されている。 図面の簡単な説明 単一の図面は本発明の音声指令システムのブロックの図を示している。 発明を実施するための最良の形態 下記は航空機の音響電話機システム、とりわけ戦闘機のものに関して述べてあ るがそれだけに限らず他の機種の乗り物(地上、海上問わず)や既に備え付けら れた設備にも同様に使用することができるし、特に冶金工場のような大変周りの 雑音の大きい状況などにも応用することができる。このシステムのユーザはこの 場合戦闘機のパイロットということになるが、当然のことながら同時にこのシス テムを使用する数人の人もいるわけである。特に民間の輪送飛行機の場合には一 人一人のユーザ用に特定の装置がユーザの数に相当する分だけ用意されることに なる。 音声認識システム1は押しボタン2あるいは音声指令オン/オフスイッチとも 呼ばれるボタンにより稼働する。こ のボタン2は機内連絡や無線通信といった伝達信号と、ユーザが発した声による 指令を区別するようになっている。このスイッチ2を押すと音声認識装置3の演 算処理が始まる。この装置3は図には示されていないが(マイク回線から起こり 母線でありうる導線4を伝って)マイクサンプルのフレームを絶えず受信し、1 50msの言語を蓄積できる記憶装置5の中のバッファ域にそれをいったん保留 する。従ってこの回路はボタン2を押すよりも前に発声の開始をいち早く探索す ることができる。 音声認識装置3は認識管理装置6に、そして構文認識装置7を通じて対話モデ ルを蓄積し吟味する装置8に結合している。またこの装置8は先ほどの装置6と 結合している。装置6はインターフェース9及び母線10を通じて管理プロセサ (図には記載されていない)に結合している。この音声認識システムにはこのほ かに音響音声解読装置11があり、これは記憶装置5と認識管理装置6を結んで いる。その他音声認識装置3に連結している音響レファレンス辞書12や、認識 管理装置6と母線4をつなぐテキスト基準の合成装置13もこのシステムに含ま れている。辞書12は母線4を通ってインターフェース14に結合しているが、 この14は設定記憶カード15とうまく協力している。このカードにはそのカー ド所持者のパラメータが内蔵されているので辞書12の音響レファレンスを最大 限に活用することができる。もちろんこの読み取り器や記憶カードはプラグイン ROMや遠隔負荷など同種の装置ならどんな ものでも代用できる。 音声認識装置3は記憶装置5から受け取ったサンプルに基づいて認識した語及 び語句を認識管理装置6に提供する。この装置3は形式的には次の3つの部分か らなっている。獲得、パラメータ化、及びパターン認識である。母線4から送ら れる音声信号の獲得はサンプリング周波数12キロヘルツで、16ビットの語に 行われる。 パラメータ化とは音声信号の特性化と圧縮を行うことである。すなわち256 個の16ビットサンプルのフレームから8個の8ビットセプストラル(CEPS TRAL)係数が供給される。この動作は、雑音の大きい状態でも活動検索と雑 音抑制などの機能によって効率よく補足・改善化がなされている。この活動検索 機はスピーチの始まりと終わりを正確に探知できるので発生とスイッチのオン/ オフ操作の同期という課題も克服される。演算方式は有声音(倍音構造の調査) と無声音(おおまかにいって摩擦子音図と呼ばれている)の検索に基づいており 、その発声がどのような構造になっているか、例えば母音やその母音に先行した り後に続いたりする摩擦子音などを見極める機能を果たす査定段階によってより 有効なものとなっている。雑音抑制は2段階で行われる。まず第一に検索段階で 探知の正確性を高めるために除去フィルタリング(白化)というかたちで、第2 に“慣性”媒体鎖において、厳しい環境でのパラメータの質を高めるために周波 数フィルタリング(例えばウィーナーのフィルタリング)のかたちで行われる。 この雑音抑制は2重の雑音モデルを使用していて一つは適応フィルタリングまた は線形予測による自己退化モデル、もう一つは周波数フィルタリング用の平均雑 音スペクトルの2NDの桁のモーメントの評価をするモデルである。第1近似とし て雑音が静止的であると仮定する。ボタン2を使うことによっていずれの会話モ ードが選択されても、雑音フレームを選択するためのアルゴリズムが実行される 。これは音声認識やマイク雑音抑制と互換性がある。 パターン認識はパラメータ化から生じるスペクトルとレファレンススペクトル の動的比較(距離計算)を行う。レファレンススペクトルとは操縦士が習得段階 で使用し、飛行までに記憶装置に蓄積されたものである。(話し手が一人の音声 認識の場合)こうした計算に基づいて、のちに認識管理モジュールが分析するこ とになる、単一の解決法ではなく複数の解決手段を選ぶことが可能になる。(ま さに最高の語句がこのパターン認識演算で得られるのである。さらに、音声指令 言語を組み立てるためのシンタックス装置は簡単な木構造の準入れ子シンタック ス装置でできている。つまり入れ子になっていないもとでは“音声指令”が機能 的に作動し、認識率が高く保たれ、極度に大きく枝分かれした要素による語句を 除外することができるのである。こうして操縦士は自分の指令に併せて実際に役 立つ構文を選択することが出来、その指令が変更された場合にも対応できる。こ の構文の変更はまた負荷率の変化などの場合に任しく管理装置に接続してあるセ ンサー(慣性整備や迎 え角探査機など)の状態によっても自動的に行われる。 装置8は操縦士と機械の相互作用(例えば出されたばかりの指示、航空機の構 成、軍用航空機の任務計画など)や発せられた指令も“操縦上の文脈”を考慮す るという働きをする。従って決定的に語の間のシンタックスアークの重みづけを する。この重みづけは様々な要素を参考にして行われる。つまり、航空機の航空 術や兵器の構成、物理的感知器の状態(慣性整備や負荷率など)、過去の対話の 記録、辞書12の内容、対話と実際の仕事のモデル、“音声上の基準”に従って 最初の除去を行う音響音声解読、そして認知された多様なフレーズなどの要素で ある。こうした操作はすべて認識装置6によりモニターされる。このように本発 明は先に定義した“厳しい”環境での音声認識を最適化することを可能にするも のである。そしてこの回路は“賢く”て動的な文脈の処理ができるので、操縦士 の発声に癖がない場合に他の発声に応じて特定の発声を好んで選んだり、逆に不 利に扱ったりして(例えば負荷率のもとに決定した振動数を避けたりして)不明 瞭な認識を防ぐことができる。 音響音声解読は、信号の通常のパラメータ化及び認識と平行して行われる。そ の目的は音声信号の音声要素を決定すること、1つ1つの信号に音素記号を割り 当てること、または最低限、音素記号の分類に着手することである。(rada rは〔r]〔a〕〔d]〔a〕〔r〕という音素を含み、それぞれ順に有声流音 、有声音、有声破裂音、有 声音、有声流音である。これ以上の情報はモニター6に伝えられそこで距離計算 的には似通っているが音素は比較できない語句が抹消される。(例えば“aut o”と“stop”など) モニター6は確実化された指令をインターフェース9に提供する役目がある。 この指令は認識された中で最適のものでなければなれないし、慣性整備や負荷率 感知、迎え角感知など航空機の感知装置からの情報と、対話モデルや音響音声解 読の結果を考慮に入れた指令でなければならない。 テキスト基準の合成装置13は音声を合成して認識された指令を作成し母線4 を通じてそれを操縦士の聞き込みフィードバック回路へ送る。好ましくは、この 回路は要求すればもとに戻る記憶装置に保存されているデジタル語を使わないが 、しかし逆に、この回路は正確な公式に基づいて認識された発声や音響音声要素 を再創造することができる。 要約するとシステム1の様々の認識装置の機能は次のようになる。音声認識装 置3は記憶装置5に蓄えられた発声つまり雑な認識に従って(例えば信号のパラ メータやパターン認識で知られている処理を行い、辞書12に内蔵された音響レ ファレンスと比較した後に決められた構文に属している認識された中で最適のN 個のフレーズを提供することである。 音響音声解読装置11は既知の型の分析(例えばフィル ターのバンクを機能させたり特徴となる音声要素を探した後に、発せられたばか りの語の幾分詳細な音声構造を提供する)を請け負う。音声構造を探知するこの 機能は例えば有声音領域と無声音領域を区別することにある。 対話モデル装置8は認識された語句の探索がなされるシンタックスベースを最 新にすることすなわち、このベースを狭めたり広くしたりすることができる。こ のシンタックスベースの最新化は次のパラメータの少なくともいずれかの機能と して実行される。航空機のパラメータ(飛行機の場合、迎え角、負荷率など)、 進行上の指令の種類や段階(戦闘機の場合、巡回、攻撃、離陸、接近など)、過 去に既に実施された音声指令データ(従って認識は成功している)、そして最後 におそらく音響音声解読装置11の可能性に応じた、発声の音声構造である。有 利なことに、この装置8は完全に指令を繰り返したり、誤認識や操縦士のミス( 例えば、「エンジンページを左に表示してください。」という語句が認識された とすると操縦士は次のように訂正することができる。「いいえ、レーダーページ です。」または「いいえ、右です。」)に続いて間違えたりしないで音声指令を 再び使用することができる。 認識管理装置6は音声認識装置3、音響音声解読装置11、対話モデル装置8 が提供した情報原に基づいて認識されたその語句(やがてはこれが音声指令とな る)に関する決定を下す役目をもっている。この装置6は認識された語句を、装 置9と13が理解可能な一連のシンボルとしてコ ード化する。インターフェース9は発せられた音声指令に関係する装置に対応す る指令を出す。原文基準の合成装置13は効果的にも、例えば実施されるアクシ ョンに関連した視覚的なチェックがない場合などに指令に相当するアクションを 受け取ったことを音声的に再生する。さらに認識管理装置6は過去に発せられた 指令データの更新のために、下された決定を対話モデル装置に知らせる。 以上で述べた各種装置が行う音声認識は次のような結果となる。すなわち、操 縦士がスイッチ2を押し、言葉を発する(記憶装置5に保存される)。結果的に 起こる信号は音声認識装置3と音響音声解読装置11で処理され認識される。分 析の結果は認識管理装置6に送られる。N個の最適語句(音声認識装置3の認識 の結果にたいへん類似したものである)を構文装置7が選ぶ。認識管理装置6は 有声音であるとか破裂音であるとかいう音響音声解読装置から得た音声構造に関 する情報の助けによりこれらのN個の最適語句をもとに決断をする。この管理装 置は対話モデル8の内容を補うとともに過去の指令データを更新する。対話モデ ル8は活性のシンタックスの重みづけをする。例えばラジオ局を選択するときな どに前回の指令に相応する指令がきちんと選択されるようになっているのである 。現在の場合では、管理装置6が決定する指令はテキスト基準の合成装置13で はなくインターフェース9へ伝えられる。というのは、結果が視覚的にチェック することができるからである。(選択されたラジオのチャンネルの表示など)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 パストール ドミニク フランス国,94117 アルキュイユ セデ, アヴェニュ デュ プレズィダン−サルヴ ァドール−アレンド,13番地 トムソン− セーエスエフ エス.セー.ペ.イ.内 (72)発明者 レノー ジェラール フランス国,94117 アルキュイユ セデ, アヴェニュ デュ プレズィダン−サルヴ ァドール−アレンド,13番地 トムソン− セーエスエフ エス.セー.ペ.イ.内

Claims (1)

  1. 【特許請求の範囲】 1.厳しい環境で、雑な認識を行い、蓄積してある音響レファレンスと比較した 後に、N個の最適フレーズを提供し、可能性のある対話モデルとN個のフレーズ を比較し音響音声を解読することによりN個のフレーズから最も見込みの高いフ レーズを選択することを特徴とする音声認識方法。 2.対話のモデルは認識の操作上の状況をもとに選択される請求項1記載の方法 。 3.語の間のシンタックスアークの重みづけによって対話モデルが選択され、こ の重みづけは周囲の雑音とは区別して次の要素、すなわち、周囲の条件に関する 物理量の感知器の状態、過去の対話、音響レファレンスの辞書の内容、対話及び その関連する機能のモデル、音声的基準に従って最初の拒絶反応が行われる音響 音声解読、そして既に認識済みの様々なフレーズの少なくとも一つを参照して行 われる、請求項2記載の方法。 4.戦闘機に応用できるものとして、周囲の条件に関わる物理量は、戦闘機の航 空術や兵器システム、慣性整備や負荷率といった感知器の状態も含まれている、 請求項3記載の方法。 5.音声音響解読装置(11)と音声認識装置(3)に結合する記憶保存装置( 5)を有し、該解読装置(11)は 認識管理装置(6)に結合し、音声認識装置(3)は辞書(12)と認識管理装 置(6)とシンタックス認識装置(7)と結合し、シンタックス認識装置装置( 7)は対話蓄積装置(8)と結合し、対話蓄積装置(8)は認識管理装置(6) と結合することを特徴とする、請求項1記載の方法を実施するための厳しい環境 での音声コマンドのためのシステム。 6.話者に関するパラメータを蓄積した設定記憶カード(15)と共同動作する メモリーカードインターフェース(14)が結合する請求項5記載のシステム。 7.音声認識装置(3)はパターン認識及び信号のパラメータ化を行う装置であ る請求項5または6記載のシステム。 8.音響音声解読装置はフィルターのバンクを持つ分析装置である請求項5〜7 のいづれかに記載のシステム。
JP9526617A 1996-01-26 1997-01-24 厳しい環境での音声認識方法及びその装置 Pending JPH11502953A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9600934A FR2744277B1 (fr) 1996-01-26 1996-01-26 Procede de reconnaissance vocale en ambiance bruitee, et dispositif de mise en oeuvre
FR96/00934 1996-01-26
PCT/FR1997/000147 WO1997027577A1 (fr) 1996-01-26 1997-01-24 Procede de reconnaissance vocale en ambiance severe, et dispositif de mise en oeuvre

Publications (1)

Publication Number Publication Date
JPH11502953A true JPH11502953A (ja) 1999-03-09

Family

ID=9488513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9526617A Pending JPH11502953A (ja) 1996-01-26 1997-01-24 厳しい環境での音声認識方法及びその装置

Country Status (7)

Country Link
US (1) US6128594A (ja)
EP (1) EP0818036B1 (ja)
JP (1) JPH11502953A (ja)
CA (1) CA2214103A1 (ja)
DE (1) DE69701774T2 (ja)
FR (1) FR2744277B1 (ja)
WO (1) WO1997027577A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2771542B1 (fr) 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
FR2786107B1 (fr) 1998-11-25 2001-02-16 Sextant Avionique Masque inhalateur d'oxygene avec dispositif de prise de son
US6449617B1 (en) * 1999-06-15 2002-09-10 Microsoft Corporation Edit command delegation program for editing electronic files
FR2808917B1 (fr) * 2000-05-09 2003-12-12 Thomson Csf Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
US7236859B2 (en) * 2000-09-01 2007-06-26 Cattron Intellectual Property Corporation Remote control system for a locomotive
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
US7127271B1 (en) 2001-10-18 2006-10-24 Iwao Fujisaki Communication device
US7107081B1 (en) 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
US7466992B1 (en) 2001-10-18 2008-12-16 Iwao Fujisaki Communication device
FR2842064B1 (fr) * 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
US8229512B1 (en) 2003-02-08 2012-07-24 Iwao Fujisaki Communication device
US8241128B1 (en) 2003-04-03 2012-08-14 Iwao Fujisaki Communication device
EP1654728A1 (en) * 2003-08-01 2006-05-10 Philips Intellectual Property & Standards GmbH Method for driving a dialog system
US8090402B1 (en) 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
US7917167B1 (en) 2003-11-22 2011-03-29 Iwao Fujisaki Communication device
US8041348B1 (en) 2004-03-23 2011-10-18 Iwao Fujisaki Communication device
ZA200702870B (en) * 2004-09-07 2010-09-29 Sensear Pty Ltd Apparatus and method for sound enhancement
US8208954B1 (en) 2005-04-08 2012-06-26 Iwao Fujisaki Communication device
US7774202B2 (en) * 2006-06-12 2010-08-10 Lockheed Martin Corporation Speech activated control system and related methods
US8692809B2 (en) * 2006-07-06 2014-04-08 Elo Touch Solutions, Inc. Auto-gain switching module for acoustic touch systems
US20080114603A1 (en) * 2006-11-15 2008-05-15 Adacel, Inc. Confirmation system for command or speech recognition using activation means
US20080201148A1 (en) * 2007-02-15 2008-08-21 Adacel, Inc. System and method for generating and using an array of dynamic grammar
US7890089B1 (en) 2007-05-03 2011-02-15 Iwao Fujisaki Communication device
US8559983B1 (en) 2007-05-03 2013-10-15 Iwao Fujisaki Communication device
US8234121B1 (en) * 2007-08-10 2012-07-31 Rockwell Collins, Inc. Voice recognition system for an avionics system using unique words to encode specific frequencies
US8676273B1 (en) 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
ES2363037T3 (es) * 2007-09-21 2011-07-19 The Boeing Company Control de vehículos.
US8639214B1 (en) 2007-10-26 2014-01-28 Iwao Fujisaki Communication device
US8472935B1 (en) 2007-10-29 2013-06-25 Iwao Fujisaki Communication device
US8744720B1 (en) 2007-12-27 2014-06-03 Iwao Fujisaki Inter-vehicle middle point maintaining implementer
US8543157B1 (en) 2008-05-09 2013-09-24 Iwao Fujisaki Communication device which notifies its pin-point location or geographic area in accordance with user selection
US8340726B1 (en) 2008-06-30 2012-12-25 Iwao Fujisaki Communication device
US8452307B1 (en) 2008-07-02 2013-05-28 Iwao Fujisaki Communication device
US8515763B2 (en) * 2009-11-24 2013-08-20 Honeywell International Inc. Methods and systems for utilizing voice commands onboard an aircraft
US8700405B2 (en) * 2010-02-16 2014-04-15 Honeywell International Inc Audio system and method for coordinating tasks
US8666748B2 (en) 2011-12-20 2014-03-04 Honeywell International Inc. Methods and systems for communicating audio captured onboard an aircraft
US8930180B1 (en) * 2012-08-15 2015-01-06 The Boeing Company Rapid scenario generation using natural language understanding
US9305554B2 (en) * 2013-07-17 2016-04-05 Samsung Electronics Co., Ltd. Multi-level speech recognition
US9550578B2 (en) 2014-02-04 2017-01-24 Honeywell International Inc. Systems and methods for utilizing voice commands onboard an aircraft
DE102014017385B4 (de) 2014-11-24 2016-06-23 Audi Ag Kraftfahrzeug-Gerätebedienung mit Bedienkorrektur
CN104931130B (zh) * 2015-06-16 2017-07-04 中国气象科学研究院 一种数据采集传输仪以及数据采集和识别系统
FR3041140B1 (fr) 2015-09-15 2017-10-20 Dassault Aviat Reconnaissance vocale automatique avec detection d'au moins un element contextuel, et application au pilotage et a la maintenance d'un aeronef
CN108932944B (zh) * 2017-10-23 2021-07-30 北京猎户星空科技有限公司 解码方法及装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870286A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
JPS5870287A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
US4725956A (en) * 1985-10-15 1988-02-16 Lockheed Corporation Voice command air vehicle control system
US4797924A (en) * 1985-10-25 1989-01-10 Nartron Corporation Vehicle voice recognition method and apparatus
EP0238695B1 (en) * 1986-03-27 1991-08-28 International Business Machines Corporation Automatic generation of simple markov model stunted baseforms for words in a vocabulary
US4827518A (en) * 1987-08-06 1989-05-02 Bell Communications Research, Inc. Speaker verification system using integrated circuit cards
FR2652164A1 (fr) * 1989-09-15 1991-03-22 Thomson Csf Procede de formation de voies pour sonar, notamment pour sonar remorque.
CA2049173C (en) * 1990-08-16 1996-06-25 Shoji Fujimoto Speech recognition apparatus
FR2677828B1 (fr) * 1991-06-14 1993-08-20 Sextant Avionique Procede de detection d'un signal utile bruite.
FR2678103B1 (fr) * 1991-06-18 1996-10-25 Sextant Avionique Procede de synthese vocale.
US5241619A (en) * 1991-06-25 1993-08-31 Bolt Beranek And Newman Inc. Word dependent N-best search method
US5390278A (en) * 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
FR2696574B1 (fr) * 1992-10-06 1994-11-18 Sextant Avionique Procédé et dispositif d'analyse d'un message fourni par des moyens d'interaction à un système de dialogue homme-machine.
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
FR2700055B1 (fr) * 1992-12-30 1995-01-27 Sextant Avionique Procédé de débruitage vectoriel de la parole et dispositif de mise en Óoeuvre.
FR2704111B1 (fr) * 1993-04-16 1995-05-24 Sextant Avionique Procédé de détection énergétique de signaux noyés dans du bruit.
JPH0781498A (ja) * 1993-09-20 1995-03-28 Mitsubishi Electric Corp 車両用走行制御装置
US5805772A (en) * 1994-12-30 1998-09-08 Lucent Technologies Inc. Systems, methods and articles of manufacture for performing high resolution N-best string hypothesization
JP3741156B2 (ja) * 1995-04-07 2006-02-01 ソニー株式会社 音声認識装置および音声認識方法並びに音声翻訳装置
US5677990A (en) * 1995-05-05 1997-10-14 Panasonic Technologies, Inc. System and method using N-best strategy for real time recognition of continuously spelled names
JP3716870B2 (ja) * 1995-05-31 2005-11-16 ソニー株式会社 音声認識装置および音声認識方法
US5712957A (en) * 1995-09-08 1998-01-27 Carnegie Mellon University Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists
US5937383A (en) * 1996-02-02 1999-08-10 International Business Machines Corporation Apparatus and methods for speech recognition including individual or speaker class dependent decoding history caches for fast word acceptance or rejection
FR2744871B1 (fr) * 1996-02-13 1998-03-06 Sextant Avionique Systeme de spatialisation sonore, et procede de personnalisation pour sa mise en oeuvre

Also Published As

Publication number Publication date
EP0818036A1 (fr) 1998-01-14
WO1997027577A1 (fr) 1997-07-31
FR2744277B1 (fr) 1998-03-06
US6128594A (en) 2000-10-03
CA2214103A1 (fr) 1997-07-31
EP0818036B1 (fr) 2000-04-26
DE69701774T2 (de) 2000-11-09
FR2744277A1 (fr) 1997-08-01
DE69701774D1 (de) 2000-05-31

Similar Documents

Publication Publication Date Title
JPH11502953A (ja) 厳しい環境での音声認識方法及びその装置
KR970001165B1 (ko) 대화자 훈련의 음성 인식기 및 그 사용방법
US5995928A (en) Method and apparatus for continuous spelling speech recognition with early identification
US6950796B2 (en) Speech recognition by dynamical noise model adaptation
US8688451B2 (en) Distinguishing out-of-vocabulary speech from in-vocabulary speech
US6553342B1 (en) Tone based speech recognition
US20030061037A1 (en) Method and apparatus for identifying noise environments from noisy signals
US20030200090A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
US9245526B2 (en) Dynamic clustering of nametags in an automated speech recognition system
RU2466468C1 (ru) Система и способ распознавания речи
JP2007500367A (ja) 音声認識方法およびコミュニケーション機器
US20040215454A1 (en) Speech recognition apparatus, speech recognition method, and recording medium on which speech recognition program is computer-readable recorded
Gupta et al. Speech feature extraction and recognition using genetic algorithm
CN110189746A (zh) 一种应用于地空通信的话音识别方法
Ranjan et al. Isolated word recognition using HMM for Maithili dialect
EP1376537B1 (en) Apparatus, method, and computer-readable recording medium for recognition of keywords from spontaneous speech
CN111833878A (zh) 基于树莓派边缘计算的中文语音交互无感控制系统和方法
US5487129A (en) Speech pattern matching in non-white noise
Loh et al. Speech recognition interactive system for vehicle
Englund Speech recognition in the JAS 39 Gripen aircraft-adaptation to speech at different G-loads
Pittermann et al. Integrating emotion recognition into an adaptive spoken language dialogue system
CN113707156B (zh) 一种用于车载的语音识别方法及系统
Rahul et al. Development of voice activated ground control station
KR100587260B1 (ko) 음향 기기의 음성인식장치
Kaur et al. Power-Normalized Cepstral Coefficients (PNCC) for Punjabi automatic speech recognition using phone based modelling in HTK