DE1472003B2 - Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse - Google Patents

Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse

Info

Publication number
DE1472003B2
DE1472003B2 DE19651472003 DE1472003A DE1472003B2 DE 1472003 B2 DE1472003 B2 DE 1472003B2 DE 19651472003 DE19651472003 DE 19651472003 DE 1472003 A DE1472003 A DE 1472003A DE 1472003 B2 DE1472003 B2 DE 1472003B2
Authority
DE
Germany
Prior art keywords
register
signal
contents
signals
digital signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19651472003
Other languages
English (en)
Other versions
DE1472003A1 (de
Inventor
Helmut Dipl.-Ing. 7031 WeiHKnauft Günter 7032 Sindelfingen; Spruth Wilhelm Dr.-Ing. 7030 Böblingen Lamparter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1472003A1 publication Critical patent/DE1472003A1/de
Publication of DE1472003B2 publication Critical patent/DE1472003B2/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Interface Circuits In Exchanges (AREA)

Description

Die Erfindung betrifft Verfahren und Anordnungen zur Gewinnung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip und deren Darstellung in codierter Form.
Eine Reihe bekannter Verfahren ermöglicht die Sprachübertragung über Kanäle, deren Bandbreite schmäler ist als das Frequenzband des originalen Sprachsignals. Die hierbei erreichte Verständlichkeit ist meist zufriedenstellend.
Nach den gebräuchlichsten Methoden wird das Sprachsignal in eine bestimmte Anzahl von Frequenzbändern zerlegt und mit Hilfe zweier Funktionen dargestellt, die den Amplitudenverlauf des Sprachsignals zu definierten Zeitpunkten angeben. Die erste Funktion, die sogenannte Spektrumfunktion, gibt den Energiegehalt in jedem der Frequenzbänder an. Die zweite Funktion, die sogenannte Anregungsfunktion, gibt dagegen die Sprachgrundfrequenz an, wenn das Sprachsignal einen periodischen oder quasi-periodischen Charakter besitzt.
Die Zeitintervalle, die die Zeitpunkte, zu denen die erwähnten Funktionen, definiert sind, voneinander trennen, können abweichen und auch für die zwei verschiedenen Funktionen verschiedene Werte aufweisen. Da sich die Spektrumfunktion im allgemeinen zeitlich langsamer ändert als die Anregungsfunktion, wird bei manchen Einrichtungen die Spektrumfunktion in zeitlich größeren Abständen ermittelt, als es im Falle der Anregungsfunktion geschieht.
Drei bekannte Verfahren werden bisher im wesentlichen zur Ableitung der Spektrumfunktion verwendet:
Beim ersten wird die Spektrumfunktion zur gleichen Zeit, wie die Anregungsfunktion abgeleitet, jedoch nur jedes n-te mal, wobei η eine ganze Zahl bedeutet, die größer als eins ist.
Beim zweiten Verfahren wird die Spektrumfunktion zu jeweils festen Zeitintervallen abgeleitet. Sie wird dabei derjenigen Anregungsfunktion zugeordnet, deren Ableitung zu dem am nächsten gelegenen Zeitpunkt erfolgte.
Beim dritten Verfahren wird die Spektrumfunktion zu einem bestimmten Zeitpunkt der Ableitung der Anregungsfunktion gewonnen. Es handelt sich dabei um diejenige Ableitung, die jenem Zeitpunkt folgte, zu dem ein festes Zeitintervall nach der vorherigen Ableitung der Spektrumfunktion vorübergegangen war.
Diese drei Verfahren haben jedoch Nachteile, die in folgenden Grenzfällen auftreten können: Der erste Nachteil entsteht, wenn, als Extremfall, sich die Spektrumfunktion zeitlich sehr langsam verändert.
Dann sind zwei aufeinanderfolgende Werte identisch oder nahezu identisch. Sind an den Sprachanalysator Einrichtungen zur Sprachverarbeitung, beispielsweise eine Datenverarbeitungsanlage für nach bestimmten Programmen vorzunehmende wissenschaftliche Sprachuntersuchungen oder eine Einrichtung zur Vokabularerstellung für Datenverarbeitungsanlagen mit Datenausgabe in gesprochener Form, angeschlossen, dann wird die Speicherkapazität dieser Einrichtungen durch die Redundanz der Kanalenergiewerte unnötig belastet. Beim zweiten Extremfall ändert sich die Spektrumfunktion dagegen sehr schnell, so daß ihre Bestimmung zu den zeitlich nun verhältnismäßig weit auseinanderliegenden Intervallen für eine naturgetreue Sprachwiedergabe unzureichend ist.
Es ist daher die Aufgabe der Erfindung ein Verfahren anzugeben, welches diese Nachteile weitgehend vermeidet. Für ein Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip besteht die Erfindung darin, daß die gerade abgeleiteten Kanalenergiewerte geprüft werden, ob ihre Größe sich in vorgebbarer Höhe von den zuvor abgeleiteten Kanalenergiewerten unterscheidet und daß im Falle einer genügenden Unterscheidung die zuletzt abgeleiteten Kanalenergiewerte zur weiteren Verarbeitung verwertet werden und daß im Falle einer nicht genügenden Unterscheidung diese Werte nicht weiter verarbeitet werden.
Eine weitere Ausgestaltung des Verfahrens besteht darin, daß die Größe der vorgebbaren Unterscheidung definiert wird durch einen Unterschied korrespondierender Werte von mehr als zwei Einheiten in mehr als zwei Kanälen.
Eine Anordnung zur Durchführung des Verfahrens ist dadurch gekennzeichnet, daß die Kanalenergiewerte nach ihrer Analog-Digital-Umwandlung in je Kanal vorgesehenen Konvertern in einem ersten Register gespeichert werden, daß ferner ein zweites Register vorgesehen ist, welches über eine Vielfachleitung mit
dem ersten Register verbunden ist, daß weiterhin eine Vergleichseinrichtung vorgesehen ist, weiche die über Vielfachleitungen anliegenden gespeicherten Werte der Register vergleicht und über eine Verbindungsleitung ein Steuersignal an eine Entscheidungsschaltung abgibt, die über eine Steuerleitung die Übertragung des im ersten Register befindlichen Wertes über eine Vielfachleitung zu einer Verarbeitungseinrichtung und über eine weitere Vielfachleitung zu dem zweiten Register veranlaßt, wenn die vorgegebenen Abweichungen in der Vergleichseinrichtung festgestellt wurden, oder die über eine Leitung ein Signal abgibt, welches angibt, daß sich der Wert der Spektrumfunktion nicht wesentlich geändert hat, wenn die Vergleichseinrichtung die vorgegebene Abweichung nicht festgestellt hat.
Im folgenden wird die Erfindung an Hand eines durch Zeichnung erläuterten Ausführungsbeispieles näher beschrieben. Die Figur zeigt eine Einrichtung die im wesentlichen folgenden Aufbau besitzt: Über die Leitung 1 wird das zu analysierende Sprachsignal s(t) zu dem Analysator übertragen. Dieser besitzt zunächst eine Reihe von Bandfiltern 2\ bis 2„, die das Sprachsignal in die gewünschten Frequenzbänder zerlegen. Diesen Bandfiltern folgen eine Reihe von Gleichrichtern 3i bis 3Λ eine Reihe von Tiefpaßfiltern 4| bis 4„ und Torschaltungen 5i bis 5„. Ferner sind eine Anzahl von Verbindungsleitungen 61 bis 6„ vorgesehen, über welche Steuerimpulse übertragen werden, die die Torschaltungen zu bestimmten Zeitpunkten öffnen. Die Steuereinrichtungen selbst sind nicht dargestellt. Diese Steuerimpulse können beispielsweise in bekannten Anordnungen gewonnen werden, welche die Ableitung der Anregungsfunktion steuern. Diesen Torschaltungen folgen je Kanal Analog-Digital-Wandler 7i bis 7„, die an ihren Ausgängen kodierte Signale abgeben, welche die Größe der Amplituden der Signale, die von den Torschaltungen 5i bis 5„ her übertragen werden, angeben.
Da die Systeme zur Erzeugung der Anregungsfunktion bekannt sind, wird von einer ausführlichen Beschreibung derselben abgesehen.
Die Anordnung zur Verbesserung des Analysenteils des Vocoders nach der Erfindung umfaßt die Register 8 und 9, die Vergleichseinrichtung 10 und den Entscheidungskreis 11. Die Anordnung selbst arbeitet nun auf folgende Weise: Wenn einer der Werte der Spektrumfunktion ermittelt worden ist, dann werden die Signale, die dieser Funktion entsprechen, zu dem Register 8 übertragen. Ferner steuert ein Impuls, welcher über die Letung 12 übertragen wird und welcher ebenso, wie die über die Leitungen 61 bis 6„ übertragenen Signale in dem Sprachanalysator abgeleitet wird, den Vergleichsvorgang in der Vergleichseinrichtung 10. In dieser Einrichtung erfolgt ein Vergleich der in den Registern 8 und 9 enthaltenen Werte. Wenn das Ergebnis dieses Vergleichs große Unterschiede der Werte in beiden Registern zeigt, dann wird ein Signal zu dem Entscheidungskreis 11 übertragen. Die Bedingung für die Übertragung dieses Signals kann beispielsweise sein, wenn ein Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen auftritt oder wenn Unterschiede auftreten, die größer als zwei Einheiten in mehr als zwei Kanälen sind. Beim Empfang dieses Signals steuert der Entscheidungskreis 11 über die Leitung 15 die Übertragung des Inhaltes von Register 8 zu der nicht dargestellten Verarbeitungseinheit (z. B. eine elektronische Rechenanlage oder eine Übertragungsleitung) und über die Leitung 16 zu dem Register 9, wo dieser Wert den vorherigen Wert ersetzt. Die Übertragung des Inhaltes von Register 8 zu der nicht dargestellten Verarbeitungseinheit erfolgt über eine Leitung oder ein Leitungsbündel 13, je nachdem, ob die Übertragung serial oder parallel erfolgt. Wenn im Gegensatz hierzu die Leitung 12 ein Signal liefert dem kein Ausgangssignal des Vergleichskreises 10 folgt, dann veranlaßt die Entscheidungsschaltung 11 die Löschung des Registers 8 und der Inhalt des Registers 9 bleibt unverändert. In diesem Fall liefert die Entscheidungsschaltung 11 ein besonderes Signal, welches über die Leitung 14 übertragen wird und angibt, daß die Spektrumfunktion sich nicht geändert hat.
Da es auch möglich ist, den Sprachanalysator direkt mit einer elektronischen Datenverarbeitungsanlage zu verbinden, können auch alle oder auch nur ein Teil der Funktionen der mit 8, 9 und 11 bezeichneten Baueinheiten von dieser Anlage übernommen werden.
Hierzu 1 Blatt Zeichnungen

Claims (5)

Patentansprüche:
1. Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip, dadurch gekennzeichnet, daß die abgeleiteten Kanalenergiewerte mit den zuletzt verarbeiteten Kanalenergiewerten verglichen und nur dann weiterverarbeitet werden, wenn sie sich von diesen um einen vorgegebenen Betrag unterscheiden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist durch einen Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen zwischen den zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerten.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist durch Unterschiede zwischen korrespondierenden Werten, die größer als zwei Einheiten in mehr als zwei Kanälen sind zwischen den zuvor und zuletzt abgeleiteten Kanalenergiewerten.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß von zwei an eine Vergleichseinrichtung (10) angeschlossenen Registern (8, 9) das erste (8) eingangsseitig mit den Kanalausgängen (7| — 7n) und ausgangsseitig (über 16) mit den Eingängen des zweiten Registers (9) sowie (>iber 13) mit den Eingängen der Anordnung zur Weiterverarbeitung der Kanalenergiewerte verbunden ist, und daß durch die Vergleichseinrichtung (10) die Weiterleitung bzw. die Löschung des Inhaltes des ersten Registers (8) steuerbar ist.
5. Anordnung nach Anspruch 4 zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß die Vergleichseinrichtung (10) über eine Signalleitung (14) ein Signal zur Weiterverarbeitungseinheit überträgt, wenn die zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerte sich nicht um einen vorgegebenen Betrag voneinander unterscheiden.
DE19651472003 1964-05-26 1965-05-24 Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse Pending DE1472003B2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR06007398A FR1406026A (fr) 1964-05-26 1964-05-26 Nouveaux perfectionnements aux systèmes d'analyse de la voix

Publications (2)

Publication Number Publication Date
DE1472003A1 DE1472003A1 (de) 1969-10-09
DE1472003B2 true DE1472003B2 (de) 1976-09-16

Family

ID=1574602

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19651472003 Pending DE1472003B2 (de) 1964-05-26 1965-05-24 Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse

Country Status (5)

Country Link
CH (1) CH435784A (de)
DE (1) DE1472003B2 (de)
FR (1) FR1406026A (de)
GB (1) GB1059015A (de)
SE (1) SE307977B (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH645501GA3 (de) * 1981-07-24 1984-10-15

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259A1 (de) * 1976-10-29 1978-05-03 Tekade Felten & Guilleaume Verfahren zur automatischen verarbeitung von gestoerter telefonsprache

Also Published As

Publication number Publication date
FR1406026A (fr) 1965-07-16
SE307977B (de) 1969-01-27
CH435784A (de) 1967-05-15
DE1472003A1 (de) 1969-10-09
GB1059015A (en) 1967-02-15

Similar Documents

Publication Publication Date Title
DE2934489C2 (de)
DE3244476C2 (de)
EP0069398B1 (de) Verfahren zur Prüfung von Analog-Digital-Wandlern und/oder von Digital-Analog-Wandlern oder von nachrichtentechnischen Übertragungsabschnitten, die solche Wandler enthalten oder mit ihnen in Reihe geschaltet sind, insbesondere zur Prüfung von Codecs für PCM-Geräte, sowie Vorrichtung zur Durchführung des Verfahrens
EP1214703B1 (de) Verfahren zum trainieren der grapheme nach phonemen regeln für die sprachsynthese
DE2820418A1 (de) Nachrichtensignal-verschluesselungsgeraet
DE3889612T2 (de) Dateneingangs-/-ausgangsschaltung.
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE2357067A1 (de) Vorrichtung zur sprachanalyse
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
DE1912981A1 (de) Codierer fuer Pulscodemodulation und differentielle Pulscodemodulation
DE1472003B2 (de) Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse
EP0814457B1 (de) Verfahren zur automatischen Erkennung eines gesprochenen Textes
DE3113189C2 (de) Vorrichtung zur Umsetzung von digitalen Zeichencodes, die von einem Datenverarbeitungssystem empfangen oder geliefert werden
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE2435654C2 (de) Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache
DE2307441C1 (de) Verfahren zum Verschleiern von Sprachsignalen
DE2303497A1 (de) Verfahren zur uebertragung von sprachsignalen
DE2905343A1 (de) Vorrichtung zur umsetzung eines nicht gleichfoermig abgetasteten signals mit kurzzeitspektrum in ein gleichfoermig abgetastetes signal
DE2104012C3 (de) Elektrische Einrichtung zur Erkennung von Sprachlauten
DE69119005T2 (de) Verfahren und Einrichtung zur Kodierung eines Analogsignals mit Wiederholeigenschaft
DE3834871C1 (en) Method for encoding speech
EP1845680B1 (de) Verfahren und Vorrichtung zur Übertragung von Befehlskombinationen mittels codierter Frequenzumtastung
DE3114421A1 (de) Anordnung zur spektralanalyse eines analogsignals
DE2061307A1 (de) Frequenzbandanalysator
DE1296212B (de) Verfahren zur UEbertragung von Sprachsignalen mit verminderter Bandbreite

Legal Events

Date Code Title Description
SH Request for examination between 03.10.1968 and 22.04.1971