DE96712T1 - Verfahren und system fuer spracherkennung. - Google Patents

Verfahren und system fuer spracherkennung.

Info

Publication number
DE96712T1
DE96712T1 DE198383900305T DE83900305T DE96712T1 DE 96712 T1 DE96712 T1 DE 96712T1 DE 198383900305 T DE198383900305 T DE 198383900305T DE 83900305 T DE83900305 T DE 83900305T DE 96712 T1 DE96712 T1 DE 96712T1
Authority
DE
Germany
Prior art keywords
input signal
clipped
speech recognition
discrete binary
recognition system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE198383900305T
Other languages
English (en)
Inventor
James Martin Wichita Ks 67212 Avery
Elmer August Wichita Ks 67220 Hoyer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR Voyix Corp
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Publication of DE96712T1 publication Critical patent/DE96712T1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Complex Calculations (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Navigation (AREA)
  • Machine Translation (AREA)
  • Traffic Control Systems (AREA)

Claims (1)

  1. ΓΜρΙ.-Ι;,,; 89 31 V·.·,.·
    Europäische Patentanmeldung 839ΟΟ3Ο5.Ο 3265/EPC
    2.2.1984
    NCR Corporation, World Headquarters, ■ Dayton, Ohio 45479 (USA)
    Übersetzung der Patentansprüche:
    1. Spracherkennungssystem, gekennzeichnet durch Vorrichtungen zum Abschneiden (10, 20), die angeordnet sind, um ein einen gesprochenen Ausdruck darstellendes Analogeingangssignal zu empfangen und ein beschnittenes Eingangssignal zu erzeugen, Abtastvorrichtungen (30, 40) zum Abtasten des beschnittenen Eingangssignals, die betriebsmäßig mit den Vorrichtungen zum Abschneiden verbunden sind, um eine Vielzahl diskreter Binärwerte zu erzeugen, wobei jeder diskrete Binärwert einen Abtastwert des beschnittenen Eingangssignals darstellt, und eine Vorrichtung (60) zum Analysieren der Vielzahl von Abtastwerten, um hierdurch den gesprochenen Ausdruck zu identifizieren.
    2. Spracherkennungssystem nach Anspruch 1, dadurch gekennzeichnet , daß die Vorrichtungen zum Abschneiden eine Filtervorrichtung (10) zum Filtern des Analogeingangssignals, um unerwünschte Frequenzkomponenten des Analogeingangssignals zu entfernen und damit ein gefiltertes Eingangssignal zu erzeugen, und eine Abschneideschaltung (20) aufweisen, die betriebsmäßig mit der Filtervorrichtung (10) zum Erzeugen des beschnittenen Eingangssignals aus dem gefilterten Eingangssignal verbunden ist.
    3- Spracherkennungssystem nach Anspruch 1 oder 2, dadurch gekennzeichnet , daß die Abtastvorrichtungen eine Schieberegistervorrichtung (40),
    die angeordnet ist, um Abtastwerte des beschnittenen 5
    Eingangssignals darstellende diskrete Binärwerte zu
    halten, und eine Taktvorrichtung (30) aufweisen zum Bestimmen der Abtastzeit des beschnittenen Eingangssignals und zum Steuern des Verschiebens und Ausgebens der in der Schieberegistervorrichtung (40) ent-10
    haltenen diskreten Binärwerte.
    4. Spracherkennungssystem nach Anspruch 3, dadurch gekennzeichnet , daß die Abtastvorrichtungen ferner eine Puffervorrichtung (50) als Schnittstelle
    zwischen der Schieberegistervorrichtung (40) und der Analysiervorrichtung (60) aufweisen.
    5. Spracherkennungssystem nach Anspruch 2, dadurch gekennzeichnet , daß die Filtervorrichtung
    ein Bandpaßfilter (10) umfaßt.
    6. Verfahren zur Spracherkennung, gekennzeichnet durch die Schritte a) Beschneiden eines Analogeingangssignals, das representativ ist für einen gesprochenen Ausdruck, um ein beschnittenes Eingangssignal zu erzeugen, b) Abtasten des beschnittenen Eihgangssignals, um eine Vielzahl diskreter Binärwerte zu erzeugen, wobei jeder diskrete Binärwert einen Abtastwert des beschnittenen Eingangssignals darstellt;
    und c) Analysieren der Vielzahl von Abtastwerten, um hierdurch den gesprochenen Ausdruck zu identifizieren.
    7. Erkennungsverfahren nach Anspruch 6, gekennzeichnet durch die Schritte a) Filtern des Analogeingangssignals vor dem Abschneideschritt zum Entfernen unerwünschter Frequenzkomponenten aus dem
    Analogeingangssignal, um ein gefiltertes Eingangssignal zu erzeugen, wobei das gefilterte Eingangssignal das Eingangssignal für den Abschneideschritt ist.
    Erkennungsverfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet , daß der Schritt Analysieren die Schritte aufweist: a) Berechnen der linearen Vorhersage-Koeffizienten a' eines abgetasteten beschnittenen Eingangssignals y(n), wobei
    j/co= - JET
    κ-
    K=I
    wobei ρ die Anzahl von Polen eines allpoligen linearen Vorhersagefiltermodells ist; b) Bestimmen eines Abstandsmaßes ; und c) Identifizieren einer Einzelheit in einer Datenbasis mit dem minimalen Abstand, wie der gesprochene Ausdruck.
    9. Erkennungsverfahren nach Anspruch 8, dadurch gekennzeichnet , daß der Schritt Bestimmen eines Abstandsmaßes durchgeführt wird durch Auswerten des gemessenen Abstands gemäß
DE198383900305T 1981-12-11 1982-12-07 Verfahren und system fuer spracherkennung. Pending DE96712T1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/329,776 US4477925A (en) 1981-12-11 1981-12-11 Clipped speech-linear predictive coding speech processor
PCT/US1982/001716 WO1983002190A1 (en) 1981-12-11 1982-12-07 A system and method for recognizing speech

Publications (1)

Publication Number Publication Date
DE96712T1 true DE96712T1 (de) 1984-05-10

Family

ID=23286972

Family Applications (2)

Application Number Title Priority Date Filing Date
DE198383900305T Pending DE96712T1 (de) 1981-12-11 1982-12-07 Verfahren und system fuer spracherkennung.
DE8383900305T Expired DE3271705D1 (en) 1981-12-11 1982-12-07 A system and method for recognizing speech

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE8383900305T Expired DE3271705D1 (en) 1981-12-11 1982-12-07 A system and method for recognizing speech

Country Status (6)

Country Link
US (1) US4477925A (de)
EP (1) EP0096712B1 (de)
JP (1) JPS58502113A (de)
CA (1) CA1180447A (de)
DE (2) DE96712T1 (de)
WO (1) WO1983002190A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4763278A (en) * 1983-04-13 1988-08-09 Texas Instruments Incorporated Speaker-independent word recognizer
DE3419636C2 (de) * 1984-05-25 1986-08-28 Rolf 8000 München Treutlin Verfahren zur Erzeugung und Verarbeitung von bestimmten Stellen einer Tonaufzeichnung angeordneten Steuerungsinformationen zur Steuerung akustischer oder optischer Einrichtungen und Vorrichtung zur Durchführung des Verfahrens
US4860357A (en) * 1985-08-05 1989-08-22 Ncr Corporation Binary autocorrelation processor
US5136652A (en) * 1985-11-14 1992-08-04 Ncr Corporation Amplitude enhanced sampled clipped speech encoder and decoder
US4817154A (en) * 1986-12-09 1989-03-28 Ncr Corporation Method and apparatus for encoding and decoding speech signal primary information
NL8603163A (nl) * 1986-12-12 1988-07-01 Philips Nv Werkwijze en inrichting voor het afleiden van formantfrekwenties uit een gedeelte van een spraaksignaal.
DE4434255A1 (de) * 1994-09-24 1996-03-28 Sel Alcatel Ag Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung
EP1850328A1 (de) * 2006-04-26 2007-10-31 Honda Research Institute Europe GmbH Verstärkung und Extraktion von Sprachsignalformanten
JP4882899B2 (ja) * 2007-07-25 2012-02-22 ソニー株式会社 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム
US8036891B2 (en) * 2008-06-26 2011-10-11 California State University, Fresno Methods of identification using voice sound analysis
CN111384051B (zh) * 2016-03-07 2022-09-27 杭州海存信息技术有限公司 兼具语音识别功能的存储器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3071652A (en) * 1959-05-08 1963-01-01 Bell Telephone Labor Inc Time domain vocoder
US3278685A (en) * 1962-12-31 1966-10-11 Ibm Wave analyzing system
GB1012765A (en) * 1964-03-06 1965-12-08 Standard Telephones Cables Ltd Apparatus for the analysis of waveforms
US3521235A (en) * 1965-07-08 1970-07-21 Gen Electric Pattern recognition system
GB1337385A (en) * 1969-10-21 1973-11-14 Nat Res Dev Apparatus for frequency analysis
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US4015088A (en) * 1975-10-31 1977-03-29 Bell Telephone Laboratories, Incorporated Real-time speech analyzer

Also Published As

Publication number Publication date
CA1180447A (en) 1985-01-02
EP0096712A1 (de) 1983-12-28
WO1983002190A1 (en) 1983-06-23
EP0096712B1 (de) 1986-06-11
JPS58502113A (ja) 1983-12-08
US4477925A (en) 1984-10-16
DE3271705D1 (en) 1986-07-17

Similar Documents

Publication Publication Date Title
DE69429905T2 (de) Puls - Monitor
DE69420400T2 (de) Verfahren und gerät zur sprechererkennung
DE3878001T2 (de) Spracherkennungseinrichtung unter anwendung von phonemermittlung.
DE3687815T2 (de) Verfahren und vorrichtung zur sprachanalyse.
DE69300413T2 (de) Verfahren zum Identifizieren von Sprach- und Rufverlaufsignalen.
DE69009545T2 (de) Verfahren zur Sprachanalyse und -synthese.
DE96712T1 (de) Verfahren und system fuer spracherkennung.
ATE215245T1 (de) Aus analytischen trennungsprozessen resultierendes dekonvolutionsverfahren zur analyse von daten
DE07003891T1 (de) Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale
DE3481388D1 (de) Text-zu-sprache-uebersetzungssystem.
Gopalan et al. A comparison of speaker identification results using features based on cepstrum and Fourier-Bessel expansion
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
Atal et al. Linear prediction analysis of speech based on a pole‐zero representation
EP0182989A1 (de) Normalisierung von Sprachsignalen
DE3012771A1 (de) Verfahren fuer ein sprachanalysensystem
EP0703565A2 (de) Verfahren und System zur Sprachsynthese
EP0222612A2 (de) Gleichzeitiges Filtern und Hintergrundkorrektur von chromatographischen Messdaten
DE60222983T2 (de) Serieller Datenzeiger
DE69824063T2 (de) Normalisierung von Sprachsignalen
CN108593293B (zh) 一种适用于提取轴承故障特征的自适应滤波方法
DE69128990T2 (de) Sprecherkennungsvorrichtung
DE3036440C2 (de) Sprach-Auswerter
Biem et al. A discriminative filter bank model for speech recognition.
Kuwabara A pitch-synchronous analysis/synthesis system to independently modify formant frequencies and bandwidths for voiced speech
Burget et al. Data driven design of filter bank for speech recognition