DE2715411B2 - Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals - Google Patents

Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals

Info

Publication number
DE2715411B2
DE2715411B2 DE2715411A DE2715411A DE2715411B2 DE 2715411 B2 DE2715411 B2 DE 2715411B2 DE 2715411 A DE2715411 A DE 2715411A DE 2715411 A DE2715411 A DE 2715411A DE 2715411 B2 DE2715411 B2 DE 2715411B2
Authority
DE
Germany
Prior art keywords
speech signal
signal
difference signal
determining
fundamental period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE2715411A
Other languages
English (en)
Other versions
DE2715411A1 (de
Inventor
Harald Dipl.-Ing. 7900 Ulm Katterfeldt
Helmut Dipl.-Ing. 7913 Aufheim Mangold
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Licentia Patent Verwaltungs GmbH
Original Assignee
Licentia Patent Verwaltungs GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Licentia Patent Verwaltungs GmbH filed Critical Licentia Patent Verwaltungs GmbH
Priority to DE2715411A priority Critical patent/DE2715411B2/de
Priority to US05/891,144 priority patent/US4161625A/en
Priority to NL7803622A priority patent/NL7803622A/xx
Priority to GB13633/78A priority patent/GB1596818A/en
Publication of DE2715411A1 publication Critical patent/DE2715411A1/de
Publication of DE2715411B2 publication Critical patent/DE2715411B2/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Description

Die Erfindung betrifft ein elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals, aus dem mit Hilfe von Prädiktoren gebildeten Differenzsignal zwischen dem ursprünglichen Sprachsignal und dem vom Prädiktor geschätzten SprachsignaL Es sind Verfahren bekannt, bei denen eine Analyse der Stimmbandgrundfrequenz durch Autokorrelation am Originalsprachsignal vorgenommen wird. Diese Verfahren sind aber durch Formanteinflüsse so stark störbar, daß bei tiefliegenden ersten Formanten eine brauchbare Analyse durch Maximumbildung in der Autokorrelationsfunktion nicht möglich ist In gleicher Weise kann am Originalsprachsignal auch eine reine Polaritätskorrelation nicht praktiziert werden. Bekannte Lösungen zur Analyse der Stimmbandfrequenz aus dem Differenzsignal eines LPC-Vocoders bedienen sich bisher ausschließlich einfacher Maximum-Suchmethoden. Solehe Verfahren arbeiten aber nur bei sehr gutmütigen Differenzsignalen einwandfrei. Korrelationsanalysen am Differenzsignal mit voller Rechengenauigkeit arbeiten zwar technisch einwandfrei, sind aber mit hohem technischen Aufwand verknüpft
So sind aus der Zeitschrift IEEE Transactions on Audio and Electroacoustics, Vol. Au-16, No. 2, Juni 1968 von Man, Mohan, Sondhi, »New Methods of Pitch Extraction« und in Vol. Au-20, No. 5, Dezember 1972 von J. D. Markel »THE SIFT Algorithm for fundamental Frequency Estimation«, Verfahren bekannt, die nur die mittlere Grundperiode bestimmen, nicht den speziellen Einsatzzeitpunkt jedes Pitchimpulses.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, das den speziellen Einsatzzeitpunkt jedes Pitchimpulses feststellt und mit geringem technischen Aufwand realisierbar ist.
Die Aufgabe wird gelöst wie im Anspruch 1 beschrieben. Weitere Ausgestaltungen sind in den Unteransprüchen angegeben.
Die Figur zeigt ein Ausführungsbeispiel, wie das erfindungsgemäße Verfahren realisiert werden kann. An Hand des dargestellten Ausführungsbeispiels sei im folgenden das erfindungsgemäße Verfahren näher erläutert
Bei LPC-Vocodern wird in einem Prädiktor 1 eine Schätzung über den mutmaßlichen weiteren Signalverlauf eines Sprachsignals aus dessen vergangenen Werten vorgenommen. Diese Schätzung Xk wird in einem Differenzbildungsnetzwerk 2 von dem wirklichen Sprachsignal XK subtrahiert Das entstehende Differenzsignal dk weist während stimmhafter Abschnitte starke impulsförmige Periodizitäten auf.
In einem Rechenwerk 3 wird das Differenzsigna] auf seine wesentlichen Eigenschaften reduziert Zu den wesentlichen Eigenschaften gehören das Vorzeichen und eine Aussage, ob der Betrag des Differenzsignals einen Schwellwert überschreitet Der Schwellwert bestimmt sich als fester Bruchteil des maximalen Differenzsignalwertes in dem zu korrelierenden Signalabschnitt Diese Eigenschaften lassen sich durch zwei Binärzeichen (Bit) darstellen. Ein drittes Bit kann für die Information verwendet werden, wieweit dsr Schwellwert überschritten wird. Der Vorgang kann als gesteuerte Quantisierung mit zwei oder drei Bit bezeicnnet werden. Die Figur zeigt eine 2-Bit-Ausführung.
Am Ausgang der beiden Schieberegister 4 und 5, die beide mit gleicher Taktgeschwindigkeit umlaufen, stehen die jeweils für die Autokorrelation nach der Formel
benötigten Zahlenwerte di, und A+
Bei einer Abtastfrequenz von 8 kHz für das Sprachsignal bzw. das daraus berechnete Differenzsignal kanr. ein solches Schieberegister beispielsweise 256 Worte mit zwei oder drei Bits enthalten. Damit sind mindestens drei Perioden im Schieberegister, so daß eine hinreichende Korrelation möglich ist In der Koinzidenzschaltung 6 wird geprüft ob die Eigenschaften positiv oder negativ korreliert sind. Die Korrelationen werden in einem Vorwärts-Rückwärts-Zähler 7 aufsummiert.
Nach Durchlauf wird das Zählergebnis in einem Register 8 gespeichert und nach Bestimmung aller Korrelationswerte qi, die für die menschliche Stimmlage möglich sind, wird das Maximum der Korrelationswerte ermittelt. Der Index des Maximums ist der Zahlenwert der angibt wieviel Abtastperioden die Grundperiode ergeben.
Die Zeitverzögerung in der Rückführung des Registers 4 bewirkt, daß beim nächsten Umlauf der Register die Eigenschaften dt und </*+/ um einen Abtastwert gegeneinander verschoben erscheinen, der Index /des Korrelationskoeffizienten ρ/hat sich um eins vergrößert
In der 3-Bit-Ausführung wird die Koinzidenzschaltung und der Zähler durch einen Akkumulatorbaustein (Addierer und Register) ersetzt. Hierbei kann auf die Berücksichtigung der negativen Korrelation verzichtet werden.
3 4
Die Vorteile der genannten Erfindung — nämlich die Korrelation nur eine minimale Leistungsverminderung
Anwendung der Polaritätskorrelation auf das Differenz- aber gleichzeitig eine enorme Vereinfachung des
signal des LPC-Vocoders — verbindet die Vorteile der Verfahrens möglich ist. Die Vereinfachung >st so extrem,
Autokorrelationsanalyse und diejenigen einer einfachen daß eine Realisierung sogar mit hochintegrierbaren
technischen Realisierung, da durch die vereinfachte ■> MOS-Schaltkreisen möglich ist
Hierzu 1 Blatt Zeichnungen

Claims (4)

Patentansprüche:
1. Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals aus dem mit Hilfe von Prädiktoren gebildeten Differenzsignal zwischen dem ursprünglichen Sprachsignal und dem vom Prädiktor geschätzten Sprachsignal, dadurch gekennzeichnet, daß nur die wesentlichen Eigenschaften des Differenzsignals autokor- ι ο reliert werden und daß die Maxima der Korrelationskoeffizienten die Grundperiode festlegen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Differenzsignal oberhalb einer vorbestimmten positiven Schwelle auf +1, unterhalb einer vorbestimmten negativen Schwelle auf — 1 und für Werte zwischen den beiden Schwellen mit 0 codiert wird.
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß die Beträge, um die die Differenzsignalwerte die vorgegebene Schwelle über- bzw. unterschreiten, mit mehr als 1 Bit codiert werden.
4. Verfahren nach Anspruch 1, 2 und 3, dadurch gekennzeichnet, daß die Schwellwerte signalabhängig nachgesteuert werden.
DE2715411A 1977-04-06 1977-04-06 Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals Ceased DE2715411B2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE2715411A DE2715411B2 (de) 1977-04-06 1977-04-06 Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals
US05/891,144 US4161625A (en) 1977-04-06 1978-03-28 Method for determining the fundamental frequency of a voice signal
NL7803622A NL7803622A (nl) 1977-04-06 1978-04-05 Werkwijze voor het bepalen van de grondperiode van een spraaksignaal.
GB13633/78A GB1596818A (en) 1977-04-06 1978-04-06 Method of an apparatus for determining the basic period of a speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2715411A DE2715411B2 (de) 1977-04-06 1977-04-06 Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals

Publications (2)

Publication Number Publication Date
DE2715411A1 DE2715411A1 (de) 1978-10-12
DE2715411B2 true DE2715411B2 (de) 1979-02-01

Family

ID=6005789

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2715411A Ceased DE2715411B2 (de) 1977-04-06 1977-04-06 Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals

Country Status (4)

Country Link
US (1) US4161625A (de)
DE (1) DE2715411B2 (de)
GB (1) GB1596818A (de)
NL (1) NL7803622A (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS597120B2 (ja) * 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
NL177950C (nl) * 1978-12-14 1986-07-16 Philips Nv Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak.
JPS5857758B2 (ja) * 1979-09-28 1983-12-21 株式会社日立製作所 音声ピッチ周期抽出装置
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
US4860357A (en) * 1985-08-05 1989-08-22 Ncr Corporation Binary autocorrelation processor
US4803730A (en) * 1986-10-31 1989-02-07 American Telephone And Telegraph Company, At&T Bell Laboratories Fast significant sample detection for a pitch detector
EP2081405B1 (de) 2008-01-21 2012-05-16 Bernafon AG An einen bestimmten Stimmentyp in einer akustischen Umgebung angepasstes Hörgerät sowie Verfahren dafür und Verwendung davon
US20150372805A1 (en) * 2014-06-23 2015-12-24 Qualcomm Incorporated Asynchronous pulse modulation for threshold-based signal coding

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4015088A (en) * 1975-10-31 1977-03-29 Bell Telephone Laboratories, Incorporated Real-time speech analyzer

Also Published As

Publication number Publication date
NL7803622A (nl) 1978-10-10
US4161625A (en) 1979-07-17
GB1596818A (en) 1981-09-03
DE2715411A1 (de) 1978-10-12

Similar Documents

Publication Publication Date Title
DE3236832C2 (de) Verfahren und Gerät zur Sprachanalyse
Rabiner On the use of autocorrelation analysis for pitch detection
DE69619284T3 (de) Vorrichtung zur Erweiterung der Sprachbandbreite
DE3236834C2 (de) Verfahren und Gerät zur Sprachanalyse
DE2659096C2 (de)
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
DE69534285T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE60009206T2 (de) Rauschunterdrückung mittels spektraler Subtraktion
DE3236885A1 (de) Verfahren und geraet zur sprachanalyse
DE3407078A1 (de) Elektronisches musikinstrument
EP0076234A1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
DE60212617T2 (de) Vorrichtung zur sprachverbesserung
DE2825082A1 (de) Verfahren zur spracherkennung
DE2636032C3 (de) Elektrische Schaltungsanordnung zum Extrahieren der Grundschwingungsperiode aus einem Sprachsignal
DE10234130B3 (de) Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
DE2715411B2 (de) Elektrisches Verfahren zum Bestimmen der Grundperiode eines Sprachsignals
WO2000013173A1 (de) Verfahren zur instrumentellen sprachqualitätsbestimmung
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
DE60215547T2 (de) Verfahren und einheit zur subtraktion des quantisierungsrauschen von einem pcm-signal
EP0803861B1 (de) Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal
DE10023157A1 (de) Vorrichtung und Verfahren zum Verarbeiten der Phaseninformation eines akustischen Signals
DE2357949A1 (de) Verfahren zum ermitteln des der periode der anregungsfrequenz der stimmbaender entsprechenden intervalls
DE3115884C2 (de)
DE4124493C1 (de)

Legal Events

Date Code Title Description
OAP Request for examination filed
OD Request for examination
BF Willingness to grant licences
8235 Patent refused