DE1472003A1 - Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse - Google Patents

Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse

Info

Publication number
DE1472003A1
DE1472003A1 DE19651472003 DE1472003A DE1472003A1 DE 1472003 A1 DE1472003 A1 DE 1472003A1 DE 19651472003 DE19651472003 DE 19651472003 DE 1472003 A DE1472003 A DE 1472003A DE 1472003 A1 DE1472003 A1 DE 1472003A1
Authority
DE
Germany
Prior art keywords
register
signal
contents
energy values
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19651472003
Other languages
English (en)
Other versions
DE1472003B2 (de
Inventor
Lamparter Dipl-Ing Helmut
Guenter Knauft
Spruth Dr-Ing Wilhelm
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1472003A1 publication Critical patent/DE1472003A1/de
Publication of DE1472003B2 publication Critical patent/DE1472003B2/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Interface Circuits In Exchanges (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

Neue Änmeldungsunteriagen
H72003
IBM Deutschland Internationale Büro-Maschinen Gesellschaft mbH
Böblingen, 22. Januar 1969 jo-oc
Anmelderin: International Business Machines
Corporation, Armonk, N. Y. 10
Amtliches Aktenzeichen: P 14 72 003. 7
Aktenzeichen der Anmelderin: Docket 25 102; GE 93/64
Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse
Die Erfindung betrifft Verfahren und Anordnungen zur Gewinnung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip und deren Darstellung in codierter Form,
Eine Reihe bekannter Verfahren ermöglicht die Sprachübertragung über Kanäle, deren Bandbreite schmäler ist als das Frequenzband des originalen Sprachsignales. Die
909841/0432
-d-
hierbei erreichte Verständlichkeit ist meist zufriedenstellend.
Nach den gebräuchlichsten Methoden wird das Sprachsignal in eine bestimmte Anzahl von Frequenzbändern zerlegt und mit Hilfe zweier Funktionen dargestellt, die den Amplitudenverlauf des Sprachsignales zu definierten Zeitpunkten angeben. Die erste Funktion, die sogenannte Spektrumfunktion gibt den Energiegehalt in jedem der Frequenzbänder ,an. Die zweite Funktion, die sogenannte Anregungsfunktion, gibt dagegen die Sprachgrundfrequenz an, wenn das Sprachsignal einen periodischen oder quasi-periodischen Charakter besitzt.
Die Zeitintervalle, die die Zeitpunkte, zu denen die erwähnten Funktionen definiert sind,voneinander trennen,können abweichen und auch für die zwei verschiedenen Funktionen verschiedene Werte aufweisen. Da sich die Spektrumfunktion im allgemeinen "zeitlich langsamer ändert als die Anregungsfunktion, wird bei manchen Einrichtungen die Spektrumfunktion in zeitlich größeren Abständen ermittelt, als es im Falle der Anregungsfunktion geschieht.
25102 . 909841/0432
H72003
Drei bekannte Verfahren werden bisher im wesentlichen zur Ableitung der Spektrumfunktion verwendet:
Beim ersten wird die Spektrumfunktion zur gleichen Zeit, wie die Anregungsfunktion abgeleitet, jedoch nur jedes n-te mal, wobei η eine ganze Zahl bedeutet, die größer als eins ist.
Beim zweiten Verfahren wird die Spektrumfunktion zu jeweils festen Zeitintervallen abgeleitet. Sie wird dabei derjenigen Anregungsfunktion zugeordnet, deren Ableitung zu dem am nächsten gelegenen Zeitpunkt erfolcte.
Beim dritton Verfahren wird die Spektrumfunktion zu einem bestimmten Zeitpunkt der Ableitung der Anregungsfunktion gewonnen. Es handelt sich dabei um diejenige Ableitung, die jenen Zeitpunkt folgte, zu dem ein festes Zeitintervall nach der vorherigen Ableitung der Spektrumfunktion vorübergegangen war.
Diese drei Verfahren haben jedoch Nachteile, die in folgenden Grer.nfallen auftreten können:De:1 erste Kachteil entsteht, wenn, air- Extremfall, sich die Spektrumfunktion
909841/OA32
25 102 -4-
BAD ORiGiNAL
U72003
zeitlich sehr langsam verändert. Dann sind zwei aufeinanderfolgende Werte identisch oder nahezu identisch. Sind an den Sprachanalysator Einrichtungen zur Sprachverarbeitung, beispielsweise eine Datenverarbeitungs« anlage für nach bestimmten Programmen vorzunehmende wi ssen schaftliche Sprachuntersuchungen oder eine Einrichtung zur Vokabular er stellung für Datenverarbeitungsanlagen mit Datenausgabe in gesprochener Form, angeschlossen, dann wird die Speicherkapazität dieser Einrichtungen durch die Redundanz der Kanalenergiewerte unnötig belastet. Beim zweiten Extremfall ändert sich die Spektrumfunktion dagegen sehr schnell, so daß ihre Bestimmung zu den zeitlich nun verhältnismäßig weit auseinanderliegenden Intervallen für eine naturgetreue Sprachwiedergabe unzureichend ist.
Es ist daher die Aufgabe der Erfindung ein Verfahren anzugeben, welches diese Nachteile weitgehend vermeidet. Für ein Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip besteht die Erfindung darin, daß die gerade abgeleiteten Kanalenergiewerte geprüft werden, ob ihre Größe sich in vorgebbarer Höhe von den zuvor abgeleiteten Kanalenergiewerten unterscheidet und daß im Falle einer genügenden Unterscheidung die zuletzt abgeleiteten Kanalenergiewerte zur weiteren Verarbeitung verwertet werden und daß im Falle einer nicht genügenden Unterscheidung diese Werte nicht weiter verarbeitet werden.
Eine weitere Ausgestaltung des Verfahrens besteht darin, daß die Größe der vorgebbaren Unterscheidung definiert
909841/0432
U72003
wird durch einen Unterschied korrespondierender Werte von mehr als zwei Einheiten in mehr als zwei Kanälen.
Eine Anordnung zur Durchführung des Verfahrens ist dadurch gekennzeichnet, daß die Kanalenergiewerte nach ihrer Analog-Digital-Umwandlung in je Kanal vorgesehenen Konvertern in einem ersten Register gespeichert werden, daß ferner ein zweites Register vorgesehen ist, welches über eine Vielfachleitung mit dem ersten Register verbunden ist, daß weiterhin eine Vergleichseinrichtung vorgesehen ist, welche die über Vielfachleitungen anliegenden gespeicherten Verte der Register vergleicht und über eine Verbindungsleitung ein Steuersignal an eine Entscheidungsschaltung abgibt, die über eine Steuerleitung die Übertragung des im ersten Register befindlichen Wertes über eine Vielfachleitung zu einer Verarbeitungseinrichtung und über dne v/eitere Vielfachleitung zu dem zweiten Register veranlaßt, wenn die vorgegebenen Abweichungen in der Verbleichseinrichtung fest- - gestellt·, wurden-, -oder die über eine Leitung ein Signal abgibt, welches angibt, daß sich der Wert der Spektrumfunktion nicht wesentlich geändert hat, wenn die Vergleichseinrichtung die vorgegebene Abweichung nicht festgestellt hat.
909841/0432
25 102 BAD ORIGINAL
;· U72003
Im folgenden wird die Erfindung an Hand eines durch Zeichnung erläuterten Ausführungsbeispieles näher beschrieben. Die Figur zeigt eine Einrichtung die im wesentlichen folgenden Aufbau besitzt: über die Leitung 1 wird das zu analysierende Sprachsignal s (t) zu dem Analysator übertragen. Dieser besitzt zunächst eine Reihe von Bandfiltern 2.. bis 2β, die das Sprachsignal in die gewünschtenFrequenzbänder zerlegen. Diesen BandfUtern folgen eine Reihe von GIe ichrichtern 3-j bis 3 > eine Reihe von Tiefpassfiltern 4. bis 4 und Torschaltungen 51 bis 5_- Ferner sind eine Anzahl von Verbindungsleitungen O1 bis 6 vorgesehen, über welche Steuerimpulse übertragen werden, die die Torschaltungen zu bestimmten Zeitpunkten öffnen. Die Steuereinrichtungen selbst sind nicht dargestellt. Diese Steuerimpulse können beispielsweise in bekannten Anordnungen gewonnen werden, welche die Ableitung der Anregungsfunktion steuern. Diesen Torschaltungen folgen je Kanal Analog-Digital-Wandler 7« bis 7nJ die an ihren Ausgängen kodierte Signale abgeben, welche die Größe der Amplituden der Signale, die von den Torschaltungen 5- bis 5n her übertragen werden, angeben .
25102 909841/0432
H72003
Da die Systeme zur Erzeugung der Anregungsfunktion bekannt sind, wird von einer ausführlichen Beschreibung derselben abgesehen.
Die Anordnung zur Verbesserung des Analysenteils des Vocoders nach der Erfindung umfaßt die Register 8 und 9, die Vergleichseinrichtung 10 und den Entscheidungskreis 11. Die Anordnung selbst arbeitet nun auf folgende Weise: Wenn einer der V'erte der Spektrumfunktion ermittelt worden ist, dann werden die Signale, die dieser Funktion entsprechen, zu dem Register 8 übertragen. Ferner steuert ein Impuls, welcher über die Leitung 12 übertragen wird und welcher ebenso, wie die über die Leitungen 6^ bis 6 übertragenen Signale in dem Sprachanalysator abgeleitet wird, den Vergleichsvorgang in der Vergleichseinrichtung 10. In dieser Einrichtung erfolgt ein Vergleich der in den Registern 8 und 9 enthaltenen V.'erte. Wenn das Ergebnis dieses Vergleichs große Unterschiede der «erte in beiden Registern zeigt, dann wird ein Signal zu dem Entscheidungskreis 11 übertragen. Die Bedingung für die übertragung dieses Signales kann beispielsweise sein, wenn ein Unterschied zwischen korrespondierenden Vierten in mehr als zwei Kanälen auftritt oder wenn Unterschiede auftreten, die größer als
■909841/0432
BAD ORiQiNAL
U72003
zwei Einheiten in mehr als zwei Kanälen sind. Beim Empfang dieses Signales steuert der Entscheidungskreis über die Leitung 15 die Übertragung des Inhaltes von Register 8 zu der nicht dargestellten Verarbeitungseinheit (z.B. eine elektronische Rechenanlage oder eine übertragungsleitung) und über die Leitung 16 zu dem Register 9> wo dieser Wert den vorherigen Wert ersetzt. Die übertragung des Inhaltes von Register 8 zu der nicht dargestellten Verarbeitungseinheit erfolgt über eine Leitung oder ein Leitungsbündel 13* je nachxdem, ob die Übertragung serial oder parallel erfolgt. Wenn im Gegensatz hierzu die Leitung 12 ein Signal liefert dem kein Ausgangssignal des Vergleichskreises 10 folgt, dann veranlaßt die Entscheidungsschaltung 11 die Löschung des Registers 8 und der Inhalt des Registers 9 bleibt unverändert. In diesem Fall liefert die Entscheidungsschaltung 11 ein besonderes Signal, welches über die Leitung 14 übertragen wird und angibt, daß die Spektrumfunktion sich nicht geändert hat.
Da es auch möglich ist, den Sprachanalysator direkt mit einer elektronischen Datenverarbeitungsanlage zu verbinden, können auch alle oder auch nur ein Teil der Funktionen der mit 6, 9 und 11 bezeichneten Baueinheiten von dieser Anlage übernommen werden.
809841/0432
25 102 -9-
BAD ORIGINAL

Claims (5)

"UVZUUJ PATENTANSPRÜCHE
1. Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip, dadurch gekennzeichnet, daß die abgeleiteten Kanalenergiewerte mit den zuletzt verarbeiteten Kanalenergiewerten verglichen und nur dann weiterverarbeitet werden, wenn sie sich von diesen um einen vorgegebenen Betrag unterscheiden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist durch einen Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen zwischen den zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerten.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist durch Unterschiede zwischen korrespondierenden Werten, die größer als zwei Einheiten in mehr als zwei Kanälen sind zwischen den zuvor und zuletzt abgeleiteten Kanalenergiewerten.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß von zwei an eine Vergleichseinrichtung (10,
: :-L^llijangcBchlpsBeaen itegifitern (8, 9) das erste (8) eingangsseitig mit den Kanalausgängen (7~ - 7 ) und ausgangsseitig (Über 16) mit den Eingängen des zweiten Registers (9) sowie(über 13) mit den Eingängen der Anordnung zur Weiterverarbeitung der Kanalenergiewerte verbunden ist, und daß durch die Vergleichseinrichtung (10, 11) die Weiterleitung bzw. die Löschung des Inhaltes des ersten Registers (8) steuerbar ist.
9 0.9 841/0432
V ..- I Jr*ri!ria€n fArt. 7 S1 Afc* ?**. 1 Satz 3 desXnderunssees.v.4.9.19R7?
5. Anordnung nach Anspruch 4 zur Durchführung des Verfahrens nach Anspruch 1,2 oder 3, dadurch gekennzeichnet, da β die Vergleichseinrichtung (10, 11) über eine Signalleitung (14) ein Signal zur Weiterverarbeitungseinheit überträgt, wenn die zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerte sich nicht um einen vorgegebenen Betrag voneinander unterscheiden.
809841/0432
DE19651472003 1964-05-26 1965-05-24 Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse Pending DE1472003B2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR06007398A FR1406026A (fr) 1964-05-26 1964-05-26 Nouveaux perfectionnements aux systèmes d'analyse de la voix

Publications (2)

Publication Number Publication Date
DE1472003A1 true DE1472003A1 (de) 1969-10-09
DE1472003B2 DE1472003B2 (de) 1976-09-16

Family

ID=1574602

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19651472003 Pending DE1472003B2 (de) 1964-05-26 1965-05-24 Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse

Country Status (5)

Country Link
CH (1) CH435784A (de)
DE (1) DE1472003B2 (de)
FR (1) FR1406026A (de)
GB (1) GB1059015A (de)
SE (1) SE307977B (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2649259C2 (de) * 1976-10-29 1983-06-09 Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg Verfahren zum automatischen Erkennen von gestörter Telefonsprache
CH645501GA3 (de) * 1981-07-24 1984-10-15

Also Published As

Publication number Publication date
FR1406026A (fr) 1965-07-16
SE307977B (de) 1969-01-27
DE1472003B2 (de) 1976-09-16
GB1059015A (en) 1967-02-15
CH435784A (de) 1967-05-15

Similar Documents

Publication Publication Date Title
DE2934489C2 (de)
DE2613258C2 (de) Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache
EP0386418B1 (de) Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale
DE69425468T2 (de) Verfahren und Gerät zur Analog-Digital-Umsetzung
DE2820645A1 (de) Vorrichtung und verfahren zur spracherkennung
DE2753707A1 (de) Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache
WO1983000231A1 (en) Method for testing analog/digital converters and/or digital/analog converters or sections of information transmission circuits, comprising such converters or connected in series therewith, for communication apparatus, particularly for testing coders-decoders for pcm apparatus, as well as device for implemeting such method
DE2418653B2 (de) Vorrichtung zum Anzeigen eines Extremwertes einer Folge von Digitalwerten
DE3889612T2 (de) Dateneingangs-/-ausgangsschaltung.
DE69127134T2 (de) Sprachkodierer
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute
EP0285222A2 (de) Verfahren zum Erkennen zusammenhängend gesprochener Wörter
DE2720666C2 (de) Verfahren und Anordnung zur Geräuschanalyse
DE2634426A1 (de) Bandkompressionseinrichtung
DE3813068A1 (de) Filter mit geschaltetem kondensator fuer einen digital-analog-konverter
DE1472003A1 (de) Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse
EP0814457B1 (de) Verfahren zur automatischen Erkennung eines gesprochenen Textes
DE1541624A1 (de) Verfahren zur Frequenzumsetzung
DE3115884C2 (de)
DE2307441C1 (de) Verfahren zum Verschleiern von Sprachsignalen
DE2303497C2 (de) Verfahren zur Übertragung von Sprachsignalen
DE69119005T2 (de) Verfahren und Einrichtung zur Kodierung eines Analogsignals mit Wiederholeigenschaft
DE3113189A1 (de) "verfahren und vorrichtung zur umwandlung von digitalen zeichencodes, die von einem datenverarbeitungssystem empfangen oder geliefert werden"
DE4229372C2 (de) Verfahren zum Übertragen oder Speichern der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung
DE2104012C3 (de) Elektrische Einrichtung zur Erkennung von Sprachlauten

Legal Events

Date Code Title Description
SH Request for examination between 03.10.1968 and 22.04.1971