DE96712T1 - Verfahren und system fuer spracherkennung. - Google Patents
Verfahren und system fuer spracherkennung.Info
- Publication number
- DE96712T1 DE96712T1 DE198383900305T DE83900305T DE96712T1 DE 96712 T1 DE96712 T1 DE 96712T1 DE 198383900305 T DE198383900305 T DE 198383900305T DE 83900305 T DE83900305 T DE 83900305T DE 96712 T1 DE96712 T1 DE 96712T1
- Authority
- DE
- Germany
- Prior art keywords
- input signal
- clipped
- speech recognition
- discrete binary
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract 6
- 238000005070 sampling Methods 0.000 claims 3
- 238000001914 filtration Methods 0.000 claims 2
- 208000019300 CLIPPERS Diseases 0.000 abstract 1
- 238000005311 autocorrelation function Methods 0.000 abstract 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Complex Calculations (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Navigation (AREA)
- Machine Translation (AREA)
- Traffic Control Systems (AREA)
Claims (1)
- ΓΜρΙ.-Ι;,,; 89 31 V·.·,.·Europäische Patentanmeldung 839ΟΟ3Ο5.Ο 3265/EPC2.2.1984NCR Corporation, World Headquarters, ■ Dayton, Ohio 45479 (USA)Übersetzung der Patentansprüche:1. Spracherkennungssystem, gekennzeichnet durch Vorrichtungen zum Abschneiden (10, 20), die angeordnet sind, um ein einen gesprochenen Ausdruck darstellendes Analogeingangssignal zu empfangen und ein beschnittenes Eingangssignal zu erzeugen, Abtastvorrichtungen (30, 40) zum Abtasten des beschnittenen Eingangssignals, die betriebsmäßig mit den Vorrichtungen zum Abschneiden verbunden sind, um eine Vielzahl diskreter Binärwerte zu erzeugen, wobei jeder diskrete Binärwert einen Abtastwert des beschnittenen Eingangssignals darstellt, und eine Vorrichtung (60) zum Analysieren der Vielzahl von Abtastwerten, um hierdurch den gesprochenen Ausdruck zu identifizieren.2. Spracherkennungssystem nach Anspruch 1, dadurch gekennzeichnet , daß die Vorrichtungen zum Abschneiden eine Filtervorrichtung (10) zum Filtern des Analogeingangssignals, um unerwünschte Frequenzkomponenten des Analogeingangssignals zu entfernen und damit ein gefiltertes Eingangssignal zu erzeugen, und eine Abschneideschaltung (20) aufweisen, die betriebsmäßig mit der Filtervorrichtung (10) zum Erzeugen des beschnittenen Eingangssignals aus dem gefilterten Eingangssignal verbunden ist.3- Spracherkennungssystem nach Anspruch 1 oder 2, dadurch gekennzeichnet , daß die Abtastvorrichtungen eine Schieberegistervorrichtung (40),die angeordnet ist, um Abtastwerte des beschnittenen 5Eingangssignals darstellende diskrete Binärwerte zuhalten, und eine Taktvorrichtung (30) aufweisen zum Bestimmen der Abtastzeit des beschnittenen Eingangssignals und zum Steuern des Verschiebens und Ausgebens der in der Schieberegistervorrichtung (40) ent-10haltenen diskreten Binärwerte.4. Spracherkennungssystem nach Anspruch 3, dadurch gekennzeichnet , daß die Abtastvorrichtungen ferner eine Puffervorrichtung (50) als Schnittstellezwischen der Schieberegistervorrichtung (40) und der Analysiervorrichtung (60) aufweisen.5. Spracherkennungssystem nach Anspruch 2, dadurch gekennzeichnet , daß die Filtervorrichtungein Bandpaßfilter (10) umfaßt.6. Verfahren zur Spracherkennung, gekennzeichnet durch die Schritte a) Beschneiden eines Analogeingangssignals, das representativ ist für einen gesprochenen Ausdruck, um ein beschnittenes Eingangssignal zu erzeugen, b) Abtasten des beschnittenen Eihgangssignals, um eine Vielzahl diskreter Binärwerte zu erzeugen, wobei jeder diskrete Binärwert einen Abtastwert des beschnittenen Eingangssignals darstellt;und c) Analysieren der Vielzahl von Abtastwerten, um hierdurch den gesprochenen Ausdruck zu identifizieren.7. Erkennungsverfahren nach Anspruch 6, gekennzeichnet durch die Schritte a) Filtern des Analogeingangssignals vor dem Abschneideschritt zum Entfernen unerwünschter Frequenzkomponenten aus demAnalogeingangssignal, um ein gefiltertes Eingangssignal zu erzeugen, wobei das gefilterte Eingangssignal das Eingangssignal für den Abschneideschritt ist.Erkennungsverfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet , daß der Schritt Analysieren die Schritte aufweist: a) Berechnen der linearen Vorhersage-Koeffizienten a' eines abgetasteten beschnittenen Eingangssignals y(n), wobeij/co= - JETκ-K=Iwobei ρ die Anzahl von Polen eines allpoligen linearen Vorhersagefiltermodells ist; b) Bestimmen eines Abstandsmaßes ; und c) Identifizieren einer Einzelheit in einer Datenbasis mit dem minimalen Abstand, wie der gesprochene Ausdruck.9. Erkennungsverfahren nach Anspruch 8, dadurch gekennzeichnet , daß der Schritt Bestimmen eines Abstandsmaßes durchgeführt wird durch Auswerten des gemessenen Abstands gemäß
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US06/329,776 US4477925A (en) | 1981-12-11 | 1981-12-11 | Clipped speech-linear predictive coding speech processor |
PCT/US1982/001716 WO1983002190A1 (en) | 1981-12-11 | 1982-12-07 | A system and method for recognizing speech |
Publications (1)
Publication Number | Publication Date |
---|---|
DE96712T1 true DE96712T1 (de) | 1984-05-10 |
Family
ID=23286972
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE198383900305T Pending DE96712T1 (de) | 1981-12-11 | 1982-12-07 | Verfahren und system fuer spracherkennung. |
DE8383900305T Expired DE3271705D1 (en) | 1981-12-11 | 1982-12-07 | A system and method for recognizing speech |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE8383900305T Expired DE3271705D1 (en) | 1981-12-11 | 1982-12-07 | A system and method for recognizing speech |
Country Status (6)
Country | Link |
---|---|
US (1) | US4477925A (de) |
EP (1) | EP0096712B1 (de) |
JP (1) | JPS58502113A (de) |
CA (1) | CA1180447A (de) |
DE (2) | DE96712T1 (de) |
WO (1) | WO1983002190A1 (de) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4763278A (en) * | 1983-04-13 | 1988-08-09 | Texas Instruments Incorporated | Speaker-independent word recognizer |
DE3419636C2 (de) * | 1984-05-25 | 1986-08-28 | Rolf 8000 München Treutlin | Verfahren zur Erzeugung und Verarbeitung von bestimmten Stellen einer Tonaufzeichnung angeordneten Steuerungsinformationen zur Steuerung akustischer oder optischer Einrichtungen und Vorrichtung zur Durchführung des Verfahrens |
US4860357A (en) * | 1985-08-05 | 1989-08-22 | Ncr Corporation | Binary autocorrelation processor |
US5136652A (en) * | 1985-11-14 | 1992-08-04 | Ncr Corporation | Amplitude enhanced sampled clipped speech encoder and decoder |
US4817154A (en) * | 1986-12-09 | 1989-03-28 | Ncr Corporation | Method and apparatus for encoding and decoding speech signal primary information |
NL8603163A (nl) * | 1986-12-12 | 1988-07-01 | Philips Nv | Werkwijze en inrichting voor het afleiden van formantfrekwenties uit een gedeelte van een spraaksignaal. |
DE4434255A1 (de) * | 1994-09-24 | 1996-03-28 | Sel Alcatel Ag | Vorrichtung zur Sprachaufzeichnung mit anschließender Texterstellung |
EP1850328A1 (de) * | 2006-04-26 | 2007-10-31 | Honda Research Institute Europe GmbH | Verstärkung und Extraktion von Sprachsignalformanten |
JP4882899B2 (ja) * | 2007-07-25 | 2012-02-22 | ソニー株式会社 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
US8036891B2 (en) * | 2008-06-26 | 2011-10-11 | California State University, Fresno | Methods of identification using voice sound analysis |
CN111384051B (zh) * | 2016-03-07 | 2022-09-27 | 杭州海存信息技术有限公司 | 兼具语音识别功能的存储器 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3071652A (en) * | 1959-05-08 | 1963-01-01 | Bell Telephone Labor Inc | Time domain vocoder |
US3278685A (en) * | 1962-12-31 | 1966-10-11 | Ibm | Wave analyzing system |
GB1012765A (en) * | 1964-03-06 | 1965-12-08 | Standard Telephones Cables Ltd | Apparatus for the analysis of waveforms |
US3521235A (en) * | 1965-07-08 | 1970-07-21 | Gen Electric | Pattern recognition system |
GB1337385A (en) * | 1969-10-21 | 1973-11-14 | Nat Res Dev | Apparatus for frequency analysis |
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4015088A (en) * | 1975-10-31 | 1977-03-29 | Bell Telephone Laboratories, Incorporated | Real-time speech analyzer |
-
1981
- 1981-12-11 US US06/329,776 patent/US4477925A/en not_active Expired - Fee Related
-
1982
- 1982-12-07 WO PCT/US1982/001716 patent/WO1983002190A1/en active IP Right Grant
- 1982-12-07 CA CA000417214A patent/CA1180447A/en not_active Expired
- 1982-12-07 JP JP83500435A patent/JPS58502113A/ja active Pending
- 1982-12-07 DE DE198383900305T patent/DE96712T1/de active Pending
- 1982-12-07 EP EP83900305A patent/EP0096712B1/de not_active Expired
- 1982-12-07 DE DE8383900305T patent/DE3271705D1/de not_active Expired
Also Published As
Publication number | Publication date |
---|---|
CA1180447A (en) | 1985-01-02 |
EP0096712A1 (de) | 1983-12-28 |
WO1983002190A1 (en) | 1983-06-23 |
EP0096712B1 (de) | 1986-06-11 |
JPS58502113A (ja) | 1983-12-08 |
US4477925A (en) | 1984-10-16 |
DE3271705D1 (en) | 1986-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69429905T2 (de) | Puls - Monitor | |
DE69420400T2 (de) | Verfahren und gerät zur sprechererkennung | |
DE3878001T2 (de) | Spracherkennungseinrichtung unter anwendung von phonemermittlung. | |
DE3687815T2 (de) | Verfahren und vorrichtung zur sprachanalyse. | |
DE69300413T2 (de) | Verfahren zum Identifizieren von Sprach- und Rufverlaufsignalen. | |
DE69009545T2 (de) | Verfahren zur Sprachanalyse und -synthese. | |
DE96712T1 (de) | Verfahren und system fuer spracherkennung. | |
ATE215245T1 (de) | Aus analytischen trennungsprozessen resultierendes dekonvolutionsverfahren zur analyse von daten | |
DE07003891T1 (de) | Vorrichtung und Verfahren zur Erzeugung von Tonhöhenwellensignalen und Vorrichtung sowie Verfahren zum Komprimieren, Erweitern und Synthetisieren von Sprachsignalen unter Verwendung dieser Tonhöhenwellensignale | |
DE3481388D1 (de) | Text-zu-sprache-uebersetzungssystem. | |
Gopalan et al. | A comparison of speaker identification results using features based on cepstrum and Fourier-Bessel expansion | |
DE2636032C3 (de) | Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal | |
Atal et al. | Linear prediction analysis of speech based on a pole‐zero representation | |
EP0182989A1 (de) | Normalisierung von Sprachsignalen | |
DE3012771A1 (de) | Verfahren fuer ein sprachanalysensystem | |
EP0703565A2 (de) | Verfahren und System zur Sprachsynthese | |
EP0222612A2 (de) | Gleichzeitiges Filtern und Hintergrundkorrektur von chromatographischen Messdaten | |
DE60222983T2 (de) | Serieller Datenzeiger | |
DE69824063T2 (de) | Normalisierung von Sprachsignalen | |
CN108593293B (zh) | 一种适用于提取轴承故障特征的自适应滤波方法 | |
DE69128990T2 (de) | Sprecherkennungsvorrichtung | |
DE3036440C2 (de) | Sprach-Auswerter | |
Biem et al. | A discriminative filter bank model for speech recognition. | |
Kuwabara | A pitch-synchronous analysis/synthesis system to independently modify formant frequencies and bandwidths for voiced speech | |
Burget et al. | Data driven design of filter bank for speech recognition |