JPS63502144A - 騒音環境で言語を認識する方法 - Google Patents

騒音環境で言語を認識する方法

Info

Publication number
JPS63502144A
JPS63502144A JP62500399A JP50039986A JPS63502144A JP S63502144 A JPS63502144 A JP S63502144A JP 62500399 A JP62500399 A JP 62500399A JP 50039986 A JP50039986 A JP 50039986A JP S63502144 A JPS63502144 A JP S63502144A
Authority
JP
Japan
Prior art keywords
pattern
language
patterns
frequency
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62500399A
Other languages
English (en)
Inventor
プロープスト マックス ヨーゼフ
Original Assignee
バイエリツシエ モ−ト−レン ウエルケアクチエンゲゼルシヤフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイエリツシエ モ−ト−レン ウエルケアクチエンゲゼルシヤフト filed Critical バイエリツシエ モ−ト−レン ウエルケアクチエンゲゼルシヤフト
Publication of JPS63502144A publication Critical patent/JPS63502144A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 騒音環境で言語を認識する方法 本発明は、請求の範囲第1項の前提概念に記載の方法に関するものである。
騒音に満ちた環境で人間の言語をはっきりと聞き分けるにはかなりの困難を伴う ものである。言語情報はしばことは種々のケースに適用されるが、特に自動車に おいてこの種の言語情報に依存して制御過程を迅速且つ確実に行うためには、言 語情報を迅速且つ正確に把握することがどうしても必要である。
音響信号を例えば基本周波数、エネルギー含有量等の種々のパラメータに関して 分析することは理論的には可能であるが、装備上かなりの経費を必要とし、特に 時間浪費的であるのが通常である。従って経費的及び時間的な理由からほとんど の場合適用することができない6本発明の目的は、装備上の経費を少なくして人 間の言葉を正確に認識することができるような方法を提供することである。
本発明は、上記目的を請求の範囲第1項の特徴部分によって達成するものである 。
周波数模様とは5周波数の分析から得られるn次元の模様、有利には2次元の模 様であり、例えば1984年11月9日に川崎型で“A 5peech rec ognition LSIchip set”をテーマにGippon Ele ctronic社が行なった講演の講演原稿の刊行物から知られている。
本発明の主旨は、まず音響信号をその周波数に関して分析することである。人間 の言語は、騒音と異なって、一定の周波数を含んでおり、即ち所定範囲の周波数 を含んでいることによって特徴づけられる1例えば人間の言語には共通して基本 周波数が存在し、この基本周波数は話し手の解剖学的な特徴によって決定される が、80ヘルツ(成人男性)ないし400ヘルツ(子供)である。
これと関連して上位周波数(0berfrequenzen )がある・上位周 波数は、基本周波数に対して一定の関係にあり、声または言葉を発するときに生 じる。もし音響信号の1つのパケットを例えば基本周波数の上記の範囲に関して 調べ、この種の周波数が存在しないならば、人間の言語ではなi)ことを確実に 決定することができる。
この場合、音響信号の1゛つのパケットは一義的に騒音の範囲に関係づけられ、 比較模様の形態で記憶される。
比較のために考慮される騒音の比較模様の数は産室ての場所に依存しており、1 0ないし12の最大数に限定されている。比較的静かな環境の場合には、通常2 ないし3の比較騒音で、すべての音響信号を一義的に騒音または人間の言語に関 係づけることができる。これに対して例えば自動車の車内のように著しく騒音が ひどい環境の場合には、最大で12の比較信号或いは比較模様を用いないと、す べての騒音を排除して、音響信号の1つのパケットに含まれる人間の言語の内容 を認識することがでこのため、存在する周波数に基づいて人間の言語の範囲に関 係づけられるパケットから騒音成分が分離される。
これは、人間の言語に基づく音響信号と共に騒音をも含んでいるこの種のパケッ トから騒音成分を排除するようにして行われる。さらにこのパケットから、記憶 された騒音模様が排除される。残存する差板様の少なくとも1つは所望の言語情 報を含んでおり、この言語情報は、言語模様の形態の予め設定された情報と比較 される。言語模様は、このパケットの周波数模様と同じアルゴリズムにしたがっ て形成される。比較によって一致した場合に。
人間から発せられた情報であることが確認される。
比較模様は、種々の方法で予め保持しておくことができる。例えば一連の標準的 な比較模様を予め保持しておくことができる。これに対して、環境騒音に特有の 模様を実際の騒音を用いて記憶しておくことは極めて有利である。さらに、騒音 の範囲に一義的に関係づけられているパケットを順次記憶しておき、最後に記憶 された騒音模様が最初に記憶された騒音模様に置き換えられる。この記憶装置の 作動態様は、1つのシフトレジスタに対応している。従って最後の騒音模様が記 憶される。この最後の騒音模様は状況に応じた騒音に対して重要であり、従って 少なくとも、最後に記憶された騒音模様に続く騒音模様とほぼ等しい。
差板様も種々の方法で生じさせることができる。例えば同様に標準的な差板様を 予め保持しておくことができる。これに対して言語模様を、予め行われる学習ス テップで設定することは有利である。これによって、同一の話し手から異なる時 間に発せられた異なる言語模様をも難なく認識することができる。
本発明の有利な実施例は、請求の範囲第4項に開示された特徴によって与えられ る。環境騒音に適した異なるアルゴリズムの選定の仕方の一例を示すと、異なる アルゴリズムをg(x)とf(x)とし、またaを騒音を象徴する記号、 Wを 確認されるべき言語を表わす記号とする。確認されるべき言語は、キャッチされ た騒音a に重畳される。このとき差板様は次の式で表わされる。
g(x)1え=t+、 −t:(x)l、:、= g(a+w) −f(a)  =g(a)−f(a)十警−g’ (a)+・・・・・・・この式から上述の関 係が得られる。アルゴリズムgとfを適当に選定すると、騒音aに依存して差板 様は対するアルゴリズムgの残留影響を表わす項が残る。
パケット内で可変な騒音がそれほど強くなければ、導関数g′はほぼ一定である 。
次に、添付の図面に図示した実施例に関して本発明の詳細な説明する。
添付の図面は、自動車の車内で言語を認識するための方法を、使用した構成要素 を用いて図示したものである。
まず生じた音響信号をマイクロフォン1を用いて拾い上げ、時間的に等しい長さ のパケットに分割して、これらのパケットを周波数分析器2に入力する。これら のパケット内に、明らかに人間の言語に特徴的であるような周波数が存在しない 場合には、これらのパケットを模様形成装置3に導入する。この模様形成装置3 で、パケットの時間的な周波数変化を意味する2次元の平面模様をアルゴリズム fを用いて生じさせる。この種のパケットは模様形成装置3内に図示されている 。模様形成装置3で生じた周波数模様は、参照模様として騒音メモリ4に入力さ れる。騒音メモリ4は、12の連続する周波数模様を記憶し、シフトレジスタと して作動する。即ち最後に生じる参照模様は、時間的に最初に記憶された参照模 様を代用するものである。従って騒音メモリ4内には、最後に生じた12個の参 照模様が記憶されている。
これに対して、パケット内に明らかに人間の言語に特徴的であるような周波数が 存在する場合には、生じるパケットを分析器2を用いて模様形成器5に導入する 。模様形成器5は、2次元の周波数模様を生じさせる点では模様形成装置3と同 様に作動する。模様形成器5は、他のアルゴリズムgにしたがって周波数模様を 形成する。
使用される2つのアルゴリズムfとgは、参照模様の近傍或いは形状に依存して 次のように選定されており、即ちその差膜様が騒音によってわずかたけ影響を受 けながらも言語の主要な特徴を完全に含んでいるように選定されている。
模様形成器5に形成される周波数模様は、比較装置6に入力される。比較装置6 は、模様形成器5に形成される周波数模様から騒音メモリ4内に含ま九でいる参 照模様を減じる。その結果得られる、比較装置6の構成要素6′に形成される差 膜様は、予め設定された言語模様とまれている参照模様の数に等しい。
比較のために用いられる。予め設定された言語模様は。
言語メモリ7に含まれている。言語メモリ7内には一定の条件のもとて言語模様 が入力されており1例えば騒音のない状態で予め学習ステップ(Lernsch ritt )を行うことにより入力されている。
言語模様のそれぞれには、一定の一連の制御命令等が関係づけられている。これ らの制御命令は、比較装置6に含まれている差膜様が1つの言語模様と一致した ときに生じる。これによって呼び出された、自動車の装備要素または制御要素の 制御は、公知の方法で行われる。
国際調を報告 ANNEX To i′F、E INTERNATIONAL SE八へCHR EPORT ON

Claims (4)

    【特許請求の範囲】
  1. 1.騒音環境、特に自動車の車内で言語を認識する方法において、音響信号を一 定長さのパケットに分割して、その周波数を分析し、周波数模様として再生する 段階と、人間の言語に特有な周波数を含むパケットを検出する段階と、人間の言 語に特有な周波数を含んでいないパケットの周波数模様を比較模様として順次記 憶する段階と、人間の言語に特有な周波数を含んでいるパケットの周波数模様か ら前記比較模様を減じる段階と、残存している差模様を予め設定される言語模様 と比較する段階とを有する方法。
  2. 2.シフトレジスタの作業段階に応じて比較模様を連続的に記憶することを特徴 とする、請求の範囲第1項に記載の方法。
  3. 3.言語模様を、予め行われる学習ステップで設定することを特徴とする、請求 の範囲第1項に記載の方法。
  4. 4.人間の言語に特有の周波数を含んでいるパケットの周波数模様と比較模様と を異なったアルゴリズムにしたがって形成し、該アルゴリズムを、差模様が人間 の言語の特徴を含んでいるようにその都度の環境に依存して形成することを特徴 とする、請求の範囲第1項から第3項までのいずれか1つに記載の方法。
JP62500399A 1985-12-20 1986-12-12 騒音環境で言語を認識する方法 Pending JPS63502144A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE3545447.4 1985-12-20
DE19853545447 DE3545447A1 (de) 1985-12-20 1985-12-20 System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero

Publications (1)

Publication Number Publication Date
JPS63502144A true JPS63502144A (ja) 1988-08-18

Family

ID=6289171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62500399A Pending JPS63502144A (ja) 1985-12-20 1986-12-12 騒音環境で言語を認識する方法

Country Status (5)

Country Link
EP (1) EP0231490B1 (ja)
JP (1) JPS63502144A (ja)
DE (2) DE3545447A1 (ja)
ES (1) ES2022808B3 (ja)
WO (1) WO1987003995A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9082415B2 (en) 2007-01-30 2015-07-14 Fujitsu Limited Sound determination method and sound determination apparatus

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2631147B1 (fr) * 1988-05-04 1991-02-08 Thomson Csf Procede et dispositif de detection de signaux vocaux
AT404887B (de) * 1994-06-08 1999-03-25 Siemens Ag Oesterreich Vorlesegerät
DE19959702A1 (de) * 1999-12-10 2001-06-21 Daimler Chrysler Ag Anzeige- und Bedieneinheit

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9082415B2 (en) 2007-01-30 2015-07-14 Fujitsu Limited Sound determination method and sound determination apparatus

Also Published As

Publication number Publication date
WO1987003995A1 (en) 1987-07-02
EP0231490A1 (de) 1987-08-12
DE3679539D1 (de) 1991-07-04
DE3545447A1 (de) 1988-01-28
ES2022808B3 (es) 1991-12-16
EP0231490B1 (de) 1991-05-29

Similar Documents

Publication Publication Date Title
US6411927B1 (en) Robust preprocessing signal equalization system and method for normalizing to a target environment
US4432096A (en) Arrangement for recognizing sounds
US7617106B2 (en) Error detection for speech to text transcription systems
EP1903560A1 (en) Sound signal correcting method, sound signal correcting apparatus and computer program
CA2284484A1 (en) Recognition system
US5963904A (en) Phoneme dividing method using multilevel neural network
JPS63502144A (ja) 騒音環境で言語を認識する方法
FR2645999A1 (fr) Procede de reconnaissance de la parole
Peer et al. Reverberation matching for speaker recognition
WO1991011802A1 (en) Time series association learning
JPH03208099A (ja) 音声認識装置及び方法
JP3091504B2 (ja) 神経回路網モデルによる音声認識方法
JPS59137999A (ja) 音声認識装置
CN115148208B (zh) 音频数据处理方法、装置、芯片及电子设备
JP2975808B2 (ja) 音声認識装置
JPH04295894A (ja) 神経回路網モデルによる音声認識方法
JPH0643892A (ja) 音声認識方法
WO1993009531A1 (en) Processing of electrical and audio signals
JPH04347898A (ja) 音声認識方法
Antelis et al. Using Neural Networks to Identify Squeaks and Rattles in Vehicles
GB2605693A (en) Method and apparatus for improving speech intelligibility in a room
Ainsworth et al. Comparing error correction strategies in speech recognition systems
Alkaher et al. Howling Detection and Gain Control for Speech Reinforcement in a Noisy Car Cabin Environment
JPS62124599A (ja) 音声認識装置
JPS60198598A (ja) 音声認識方式