DE2715411B2 - Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals - Google Patents
Elektrisches Verfahren zum Bestimmen der Grundperiode eines SprachsignalsInfo
- Publication number
- DE2715411B2 DE2715411B2 DE2715411A DE2715411A DE2715411B2 DE 2715411 B2 DE2715411 B2 DE 2715411B2 DE 2715411 A DE2715411 A DE 2715411A DE 2715411 A DE2715411 A DE 2715411A DE 2715411 B2 DE2715411 B2 DE 2715411B2
- Authority
- DE
- Germany
- Prior art keywords
- speech signal
- signal
- difference signal
- determining
- fundamental period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Description
Die Erfindung betrifft ein elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals, aus
dem mit Hilfe von Prädiktoren gebildeten Differenzsignal zwischen dem ursprünglichen Sprachsignal und
dem vom Prädiktor geschätzten SprachsignaL Es sind Verfahren bekannt, bei denen eine Analyse der
Stimmbandgrundfrequenz durch Autokorrelation am Originalsprachsignal vorgenommen wird. Diese Verfahren
sind aber durch Formanteinflüsse so stark störbar, daß bei tiefliegenden ersten Formanten eine brauchbare
Analyse durch Maximumbildung in der Autokorrelationsfunktion nicht möglich ist In gleicher Weise kann
am Originalsprachsignal auch eine reine Polaritätskorrelation nicht praktiziert werden. Bekannte Lösungen
zur Analyse der Stimmbandfrequenz aus dem Differenzsignal eines LPC-Vocoders bedienen sich bisher
ausschließlich einfacher Maximum-Suchmethoden. Solehe Verfahren arbeiten aber nur bei sehr gutmütigen
Differenzsignalen einwandfrei. Korrelationsanalysen am Differenzsignal mit voller Rechengenauigkeit
arbeiten zwar technisch einwandfrei, sind aber mit hohem technischen Aufwand verknüpft
So sind aus der Zeitschrift IEEE Transactions on Audio and Electroacoustics, Vol. Au-16, No. 2, Juni 1968
von Man, Mohan, Sondhi, »New Methods of Pitch Extraction« und in Vol. Au-20, No. 5, Dezember
1972 von J. D. Markel »THE SIFT Algorithm for
fundamental Frequency Estimation«, Verfahren bekannt, die nur die mittlere Grundperiode bestimmen,
nicht den speziellen Einsatzzeitpunkt jedes Pitchimpulses.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, das den speziellen Einsatzzeitpunkt
jedes Pitchimpulses feststellt und mit geringem technischen Aufwand realisierbar ist.
Die Aufgabe wird gelöst wie im Anspruch 1 beschrieben. Weitere Ausgestaltungen sind in den
Unteransprüchen angegeben.
Die Figur zeigt ein Ausführungsbeispiel, wie das erfindungsgemäße Verfahren realisiert werden kann.
An Hand des dargestellten Ausführungsbeispiels sei im folgenden das erfindungsgemäße Verfahren näher
erläutert
Bei LPC-Vocodern wird in einem Prädiktor 1 eine
Schätzung über den mutmaßlichen weiteren Signalverlauf eines Sprachsignals aus dessen vergangenen
Werten vorgenommen. Diese Schätzung Xk wird in einem Differenzbildungsnetzwerk 2 von dem wirklichen
Sprachsignal XK subtrahiert Das entstehende Differenzsignal
dk weist während stimmhafter Abschnitte
starke impulsförmige Periodizitäten auf.
In einem Rechenwerk 3 wird das Differenzsigna] auf seine wesentlichen Eigenschaften reduziert Zu den
wesentlichen Eigenschaften gehören das Vorzeichen und eine Aussage, ob der Betrag des Differenzsignals
einen Schwellwert überschreitet Der Schwellwert bestimmt sich als fester Bruchteil des maximalen
Differenzsignalwertes in dem zu korrelierenden Signalabschnitt Diese Eigenschaften lassen sich durch zwei
Binärzeichen (Bit) darstellen. Ein drittes Bit kann für die Information verwendet werden, wieweit dsr Schwellwert
überschritten wird. Der Vorgang kann als gesteuerte Quantisierung mit zwei oder drei Bit
bezeicnnet werden. Die Figur zeigt eine 2-Bit-Ausführung.
Am Ausgang der beiden Schieberegister 4 und 5, die beide mit gleicher Taktgeschwindigkeit umlaufen,
stehen die jeweils für die Autokorrelation nach der Formel
benötigten Zahlenwerte di, und A+►
Bei einer Abtastfrequenz von 8 kHz für das Sprachsignal bzw. das daraus berechnete Differenzsignal
kanr. ein solches Schieberegister beispielsweise 256 Worte mit zwei oder drei Bits enthalten. Damit sind
mindestens drei Perioden im Schieberegister, so daß eine hinreichende Korrelation möglich ist In der
Koinzidenzschaltung 6 wird geprüft ob die Eigenschaften positiv oder negativ korreliert sind. Die Korrelationen
werden in einem Vorwärts-Rückwärts-Zähler 7
aufsummiert.
Nach Durchlauf wird das Zählergebnis in einem Register 8 gespeichert und nach Bestimmung aller
Korrelationswerte qi, die für die menschliche Stimmlage möglich sind, wird das Maximum der Korrelationswerte
ermittelt. Der Index des Maximums ist der Zahlenwert der angibt wieviel Abtastperioden die Grundperiode
ergeben.
Die Zeitverzögerung in der Rückführung des Registers 4 bewirkt, daß beim nächsten Umlauf der
Register die Eigenschaften dt und </*+/ um einen
Abtastwert gegeneinander verschoben erscheinen, der Index /des Korrelationskoeffizienten ρ/hat sich um eins
vergrößert
In der 3-Bit-Ausführung wird die Koinzidenzschaltung
und der Zähler durch einen Akkumulatorbaustein (Addierer und Register) ersetzt. Hierbei kann auf die
Berücksichtigung der negativen Korrelation verzichtet werden.
3 4
Die Vorteile der genannten Erfindung — nämlich die Korrelation nur eine minimale Leistungsverminderung
Anwendung der Polaritätskorrelation auf das Differenz- aber gleichzeitig eine enorme Vereinfachung des
signal des LPC-Vocoders — verbindet die Vorteile der Verfahrens möglich ist. Die Vereinfachung >st so extrem,
Autokorrelationsanalyse und diejenigen einer einfachen daß eine Realisierung sogar mit hochintegrierbaren
technischen Realisierung, da durch die vereinfachte ■> MOS-Schaltkreisen möglich ist
Hierzu 1 Blatt Zeichnungen
Claims (4)
1. Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals aus dem mit Hilfe
von Prädiktoren gebildeten Differenzsignal zwischen dem ursprünglichen Sprachsignal und dem
vom Prädiktor geschätzten Sprachsignal, dadurch gekennzeichnet, daß nur die wesentlichen
Eigenschaften des Differenzsignals autokor- ι ο reliert werden und daß die Maxima der Korrelationskoeffizienten
die Grundperiode festlegen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
daß das Differenzsignal oberhalb einer vorbestimmten positiven Schwelle auf +1, unterhalb
einer vorbestimmten negativen Schwelle auf — 1 und für Werte zwischen den beiden Schwellen mit 0
codiert wird.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß die Beträge, um die die
Differenzsignalwerte die vorgegebene Schwelle über- bzw. unterschreiten, mit mehr als 1 Bit codiert
werden.
4. Verfahren nach Anspruch 1, 2 und 3, dadurch gekennzeichnet, daß die Schwellwerte signalabhängig
nachgesteuert werden.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2715411A DE2715411B2 (de) | 1977-04-06 | 1977-04-06 | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals |
US05/891,144 US4161625A (en) | 1977-04-06 | 1978-03-28 | Method for determining the fundamental frequency of a voice signal |
NL7803622A NL7803622A (nl) | 1977-04-06 | 1978-04-05 | Werkwijze voor het bepalen van de grondperiode van een spraaksignaal. |
GB13633/78A GB1596818A (en) | 1977-04-06 | 1978-04-06 | Method of an apparatus for determining the basic period of a speech signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE2715411A DE2715411B2 (de) | 1977-04-06 | 1977-04-06 | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2715411A1 DE2715411A1 (de) | 1978-10-12 |
DE2715411B2 true DE2715411B2 (de) | 1979-02-01 |
Family
ID=6005789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2715411A Ceased DE2715411B2 (de) | 1977-04-06 | 1977-04-06 | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals |
Country Status (4)
Country | Link |
---|---|
US (1) | US4161625A (de) |
DE (1) | DE2715411B2 (de) |
GB (1) | GB1596818A (de) |
NL (1) | NL7803622A (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS597120B2 (ja) * | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
NL177950C (nl) * | 1978-12-14 | 1986-07-16 | Philips Nv | Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak. |
JPS5857758B2 (ja) * | 1979-09-28 | 1983-12-21 | 株式会社日立製作所 | 音声ピッチ周期抽出装置 |
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
US4860357A (en) * | 1985-08-05 | 1989-08-22 | Ncr Corporation | Binary autocorrelation processor |
US4803730A (en) * | 1986-10-31 | 1989-02-07 | American Telephone And Telegraph Company, At&T Bell Laboratories | Fast significant sample detection for a pitch detector |
EP2081405B1 (de) | 2008-01-21 | 2012-05-16 | Bernafon AG | An einen bestimmten Stimmentyp in einer akustischen Umgebung angepasstes Hörgerät sowie Verfahren dafür und Verwendung davon |
US20150372805A1 (en) * | 2014-06-23 | 2015-12-24 | Qualcomm Incorporated | Asynchronous pulse modulation for threshold-based signal coding |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4015088A (en) * | 1975-10-31 | 1977-03-29 | Bell Telephone Laboratories, Incorporated | Real-time speech analyzer |
-
1977
- 1977-04-06 DE DE2715411A patent/DE2715411B2/de not_active Ceased
-
1978
- 1978-03-28 US US05/891,144 patent/US4161625A/en not_active Expired - Lifetime
- 1978-04-05 NL NL7803622A patent/NL7803622A/xx not_active Application Discontinuation
- 1978-04-06 GB GB13633/78A patent/GB1596818A/en not_active Expired
Also Published As
Publication number | Publication date |
---|---|
NL7803622A (nl) | 1978-10-10 |
US4161625A (en) | 1979-07-17 |
GB1596818A (en) | 1981-09-03 |
DE2715411A1 (de) | 1978-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3236832C2 (de) | Verfahren und Gerät zur Sprachanalyse | |
Rabiner | On the use of autocorrelation analysis for pitch detection | |
DE69619284T3 (de) | Vorrichtung zur Erweiterung der Sprachbandbreite | |
DE3236834C2 (de) | Verfahren und Gerät zur Sprachanalyse | |
DE2659096C2 (de) | ||
DE69627580T2 (de) | Verfahren zur Rauschverminderung in einem Sprachsignal | |
DE69534285T2 (de) | Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate | |
DE60009206T2 (de) | Rauschunterdrückung mittels spektraler Subtraktion | |
DE3236885A1 (de) | Verfahren und geraet zur sprachanalyse | |
DE3407078A1 (de) | Elektronisches musikinstrument | |
EP0076234A1 (de) | Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung | |
DE60212617T2 (de) | Vorrichtung zur sprachverbesserung | |
DE2825082A1 (de) | Verfahren zur spracherkennung | |
DE2636032C3 (de) | Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal | |
DE10234130B3 (de) | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals | |
DE2715411B2 (de) | Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals | |
WO2000013173A1 (de) | Verfahren zur instrumentellen sprachqualitätsbestimmung | |
EP1755110A2 (de) | Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE60215547T2 (de) | Verfahren und einheit zur subtraktion des quantisierungsrauschen von einem pcm-signal | |
EP0803861B1 (de) | Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal | |
DE10023157A1 (de) | Vorrichtung und Verfahren zum Verarbeiten der Phaseninformation eines akustischen Signals | |
DE2357949A1 (de) | Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls | |
DE3115884C2 (de) | ||
DE4124493C1 (de) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OAP | Request for examination filed | ||
OD | Request for examination | ||
BF | Willingness to grant licences | ||
8235 | Patent refused |