DE1472003A1 - Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse - Google Patents
Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der SprachanalyseInfo
- Publication number
- DE1472003A1 DE1472003A1 DE19651472003 DE1472003A DE1472003A1 DE 1472003 A1 DE1472003 A1 DE 1472003A1 DE 19651472003 DE19651472003 DE 19651472003 DE 1472003 A DE1472003 A DE 1472003A DE 1472003 A1 DE1472003 A1 DE 1472003A1
- Authority
- DE
- Germany
- Prior art keywords
- register
- signal
- contents
- energy values
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 title claims description 19
- 238000012545 processing Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000012546 transfer Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 31
- 230000005284 excitation Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 5
- 238000009795 derivation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005032 impulse control Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Interface Circuits In Exchanges (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
H72003
IBM Deutschland Internationale Büro-Maschinen Gesellschaft mbH
Böblingen, 22. Januar 1969 jo-oc
Anmelderin: International Business Machines
Corporation, Armonk, N. Y. 10
Amtliches Aktenzeichen: P 14 72 003. 7
Aktenzeichen der Anmelderin: Docket 25 102; GE 93/64
Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse
Die Erfindung betrifft Verfahren und Anordnungen zur Gewinnung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip
und deren Darstellung in codierter Form,
Eine Reihe bekannter Verfahren ermöglicht die Sprachübertragung über Kanäle, deren Bandbreite schmäler ist als das Frequenzband
des originalen Sprachsignales. Die
909841/0432
-d-
hierbei erreichte Verständlichkeit ist meist zufriedenstellend.
Nach den gebräuchlichsten Methoden wird das Sprachsignal in eine bestimmte Anzahl von Frequenzbändern zerlegt und
mit Hilfe zweier Funktionen dargestellt, die den Amplitudenverlauf
des Sprachsignales zu definierten Zeitpunkten angeben. Die erste Funktion, die sogenannte Spektrumfunktion
gibt den Energiegehalt in jedem der Frequenzbänder ,an. Die zweite Funktion, die sogenannte Anregungsfunktion, gibt dagegen die Sprachgrundfrequenz an, wenn
das Sprachsignal einen periodischen oder quasi-periodischen Charakter besitzt.
Die Zeitintervalle, die die Zeitpunkte, zu denen die erwähnten Funktionen definiert sind,voneinander trennen,können
abweichen und auch für die zwei verschiedenen Funktionen verschiedene Werte aufweisen. Da sich die Spektrumfunktion
im allgemeinen "zeitlich langsamer ändert als die Anregungsfunktion,
wird bei manchen Einrichtungen die Spektrumfunktion in zeitlich größeren Abständen ermittelt, als
es im Falle der Anregungsfunktion geschieht.
25102 . 909841/0432
H72003
Drei bekannte Verfahren werden bisher im wesentlichen zur Ableitung der Spektrumfunktion verwendet:
Beim ersten wird die Spektrumfunktion zur gleichen Zeit, wie die Anregungsfunktion abgeleitet, jedoch nur jedes
n-te mal, wobei η eine ganze Zahl bedeutet, die größer als eins ist.
Beim zweiten Verfahren wird die Spektrumfunktion zu jeweils festen Zeitintervallen abgeleitet. Sie wird dabei
derjenigen Anregungsfunktion zugeordnet, deren Ableitung zu dem am nächsten gelegenen Zeitpunkt erfolcte.
Beim dritton Verfahren wird die Spektrumfunktion zu
einem bestimmten Zeitpunkt der Ableitung der Anregungsfunktion gewonnen. Es handelt sich dabei um diejenige
Ableitung, die jenen Zeitpunkt folgte, zu dem ein festes
Zeitintervall nach der vorherigen Ableitung der Spektrumfunktion vorübergegangen war.
Diese drei Verfahren haben jedoch Nachteile, die in folgenden Grer.nfallen auftreten können:De:1 erste Kachteil
entsteht, wenn, air- Extremfall, sich die Spektrumfunktion
909841/OA32
25 102 -4-
BAD ORiGiNAL
U72003
zeitlich sehr langsam verändert. Dann sind zwei aufeinanderfolgende
Werte identisch oder nahezu identisch. Sind an den Sprachanalysator Einrichtungen
zur Sprachverarbeitung, beispielsweise eine Datenverarbeitungs« anlage für nach bestimmten Programmen vorzunehmende wi ssen schaftliche
Sprachuntersuchungen oder eine Einrichtung zur Vokabular er stellung für
Datenverarbeitungsanlagen mit Datenausgabe in gesprochener Form, angeschlossen, dann wird die Speicherkapazität dieser Einrichtungen durch die
Redundanz der Kanalenergiewerte unnötig belastet. Beim zweiten Extremfall ändert sich die Spektrumfunktion dagegen sehr schnell, so daß ihre
Bestimmung zu den zeitlich nun verhältnismäßig weit auseinanderliegenden Intervallen für eine naturgetreue Sprachwiedergabe unzureichend ist.
Es ist daher die Aufgabe der Erfindung ein Verfahren anzugeben, welches
diese Nachteile weitgehend vermeidet. Für ein Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip besteht
die Erfindung darin, daß die gerade abgeleiteten Kanalenergiewerte geprüft werden, ob ihre Größe sich in vorgebbarer Höhe von den zuvor abgeleiteten Kanalenergiewerten unterscheidet und daß im Falle einer genügenden
Unterscheidung die zuletzt abgeleiteten Kanalenergiewerte zur weiteren Verarbeitung verwertet werden und daß im Falle einer nicht genügenden
Unterscheidung diese Werte nicht weiter verarbeitet werden.
Eine weitere Ausgestaltung des Verfahrens besteht darin, daß die Größe
der vorgebbaren Unterscheidung definiert
909841/0432
U72003
wird durch einen Unterschied korrespondierender Werte von mehr als zwei Einheiten in mehr als zwei Kanälen.
Eine Anordnung zur Durchführung des Verfahrens ist dadurch gekennzeichnet, daß die Kanalenergiewerte nach ihrer Analog-Digital-Umwandlung
in je Kanal vorgesehenen Konvertern in einem ersten Register gespeichert werden, daß ferner
ein zweites Register vorgesehen ist, welches über eine Vielfachleitung mit dem ersten Register verbunden ist, daß
weiterhin eine Vergleichseinrichtung vorgesehen ist, welche die über Vielfachleitungen anliegenden gespeicherten Verte
der Register vergleicht und über eine Verbindungsleitung ein Steuersignal an eine Entscheidungsschaltung abgibt, die
über eine Steuerleitung die Übertragung des im ersten Register befindlichen Wertes über eine Vielfachleitung zu
einer Verarbeitungseinrichtung und über dne v/eitere Vielfachleitung
zu dem zweiten Register veranlaßt, wenn die vorgegebenen Abweichungen in der Verbleichseinrichtung fest-
- gestellt·, wurden-, -oder die über eine Leitung ein Signal abgibt,
welches angibt, daß sich der Wert der Spektrumfunktion nicht wesentlich geändert hat, wenn die Vergleichseinrichtung
die vorgegebene Abweichung nicht festgestellt hat.
909841/0432
25 102 BAD ORIGINAL
;· U72003
Im folgenden wird die Erfindung an Hand eines durch Zeichnung erläuterten Ausführungsbeispieles näher beschrieben.
Die Figur zeigt eine Einrichtung die im wesentlichen folgenden Aufbau besitzt: über die Leitung
1 wird das zu analysierende Sprachsignal s (t) zu dem Analysator übertragen. Dieser besitzt zunächst
eine Reihe von Bandfiltern 2.. bis 2β, die das Sprachsignal
in die gewünschtenFrequenzbänder zerlegen. Diesen BandfUtern folgen eine Reihe von GIe ichrichtern 3-j bis
3 > eine Reihe von Tiefpassfiltern 4. bis 4 und Torschaltungen
51 bis 5_- Ferner sind eine Anzahl von Verbindungsleitungen
O1 bis 6 vorgesehen, über welche Steuerimpulse übertragen werden, die die Torschaltungen
zu bestimmten Zeitpunkten öffnen. Die Steuereinrichtungen selbst sind nicht dargestellt. Diese Steuerimpulse können
beispielsweise in bekannten Anordnungen gewonnen werden, welche die Ableitung der Anregungsfunktion steuern. Diesen
Torschaltungen folgen je Kanal Analog-Digital-Wandler 7«
bis 7nJ die an ihren Ausgängen kodierte Signale abgeben,
welche die Größe der Amplituden der Signale, die von den Torschaltungen 5- bis 5n her übertragen werden, angeben
.
25102 909841/0432
H72003
Da die Systeme zur Erzeugung der Anregungsfunktion bekannt sind, wird von einer ausführlichen Beschreibung
derselben abgesehen.
Die Anordnung zur Verbesserung des Analysenteils des Vocoders nach der Erfindung umfaßt die Register 8 und
9, die Vergleichseinrichtung 10 und den Entscheidungskreis 11. Die Anordnung selbst arbeitet nun auf folgende
Weise: Wenn einer der V'erte der Spektrumfunktion ermittelt worden ist, dann werden die Signale, die
dieser Funktion entsprechen, zu dem Register 8 übertragen. Ferner steuert ein Impuls, welcher über die
Leitung 12 übertragen wird und welcher ebenso, wie die über die Leitungen 6^ bis 6 übertragenen Signale in
dem Sprachanalysator abgeleitet wird, den Vergleichsvorgang in der Vergleichseinrichtung 10. In dieser Einrichtung
erfolgt ein Vergleich der in den Registern 8 und 9 enthaltenen V.'erte. Wenn das Ergebnis dieses Vergleichs
große Unterschiede der «erte in beiden Registern zeigt,
dann wird ein Signal zu dem Entscheidungskreis 11 übertragen. Die Bedingung für die übertragung dieses Signales
kann beispielsweise sein, wenn ein Unterschied zwischen korrespondierenden Vierten in mehr als zwei Kanälen auftritt
oder wenn Unterschiede auftreten, die größer als
■909841/0432
U72003
zwei Einheiten in mehr als zwei Kanälen sind. Beim Empfang dieses Signales steuert der Entscheidungskreis
über die Leitung 15 die Übertragung des Inhaltes von
Register 8 zu der nicht dargestellten Verarbeitungseinheit (z.B. eine elektronische Rechenanlage oder eine übertragungsleitung)
und über die Leitung 16 zu dem Register 9> wo
dieser Wert den vorherigen Wert ersetzt. Die übertragung des Inhaltes von Register 8 zu der nicht dargestellten
Verarbeitungseinheit erfolgt über eine Leitung oder ein Leitungsbündel 13* je nachxdem, ob die Übertragung serial
oder parallel erfolgt. Wenn im Gegensatz hierzu die Leitung 12 ein Signal liefert dem kein Ausgangssignal des Vergleichskreises 10 folgt, dann veranlaßt die Entscheidungsschaltung
11 die Löschung des Registers 8 und der Inhalt des Registers 9 bleibt unverändert. In diesem Fall liefert die
Entscheidungsschaltung 11 ein besonderes Signal, welches über die Leitung 14 übertragen wird und angibt, daß die
Spektrumfunktion sich nicht geändert hat.
Da es auch möglich ist, den Sprachanalysator direkt mit einer elektronischen Datenverarbeitungsanlage zu verbinden,
können auch alle oder auch nur ein Teil der Funktionen der mit 6, 9 und 11 bezeichneten Baueinheiten von
dieser Anlage übernommen werden.
809841/0432
25 102 -9-
Claims (5)
1. Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse
nach dem Vocoderprinzip, dadurch gekennzeichnet, daß die abgeleiteten
Kanalenergiewerte mit den zuletzt verarbeiteten Kanalenergiewerten verglichen und nur dann weiterverarbeitet werden, wenn sie sich von diesen
um einen vorgegebenen Betrag unterscheiden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene
Betrag definiert ist durch einen Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen zwischen den zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerten.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene
Betrag definiert ist durch Unterschiede zwischen korrespondierenden Werten, die größer als zwei Einheiten in mehr als zwei Kanälen sind zwischen
den zuvor und zuletzt abgeleiteten Kanalenergiewerten.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3,
dadurch gekennzeichnet, daß von zwei an eine Vergleichseinrichtung (10,
: :-L^llijangcBchlpsBeaen itegifitern (8, 9) das erste (8) eingangsseitig mit den
Kanalausgängen (7~ - 7 ) und ausgangsseitig (Über 16) mit den Eingängen
des zweiten Registers (9) sowie(über 13) mit den Eingängen der Anordnung
zur Weiterverarbeitung der Kanalenergiewerte verbunden ist, und daß durch die Vergleichseinrichtung (10, 11) die Weiterleitung bzw. die Löschung des
Inhaltes des ersten Registers (8) steuerbar ist.
9 0.9 841/0432
V ..- I Jr*ri!ria€n fArt. 7 S1 Afc* ?**. 1 Satz 3 desXnderunssees.v.4.9.19R7?
5. Anordnung nach Anspruch 4 zur Durchführung des Verfahrens nach
Anspruch 1,2 oder 3, dadurch gekennzeichnet, da β die Vergleichseinrichtung (10, 11) über eine Signalleitung (14) ein Signal zur Weiterverarbeitungseinheit überträgt, wenn die zuvor abgeleiteten und
zuletzt abgeleiteten Kanalenergiewerte sich nicht um einen vorgegebenen Betrag voneinander unterscheiden.
809841/0432
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR06007398A FR1406026A (fr) | 1964-05-26 | 1964-05-26 | Nouveaux perfectionnements aux systèmes d'analyse de la voix |
Publications (2)
Publication Number | Publication Date |
---|---|
DE1472003A1 true DE1472003A1 (de) | 1969-10-09 |
DE1472003B2 DE1472003B2 (de) | 1976-09-16 |
Family
ID=1574602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19651472003 Pending DE1472003B2 (de) | 1964-05-26 | 1965-05-24 | Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse |
Country Status (5)
Country | Link |
---|---|
CH (1) | CH435784A (de) |
DE (1) | DE1472003B2 (de) |
FR (1) | FR1406026A (de) |
GB (1) | GB1059015A (de) |
SE (1) | SE307977B (de) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2649259C2 (de) * | 1976-10-29 | 1983-06-09 | Felten & Guilleaume Fernmeldeanlagen GmbH, 8500 Nürnberg | Verfahren zum automatischen Erkennen von gestörter Telefonsprache |
CH645501GA3 (de) * | 1981-07-24 | 1984-10-15 |
-
1964
- 1964-05-26 FR FR06007398A patent/FR1406026A/fr not_active Expired
-
1965
- 1965-05-12 CH CH664265A patent/CH435784A/de unknown
- 1965-05-21 GB GB2175465A patent/GB1059015A/en not_active Expired
- 1965-05-24 DE DE19651472003 patent/DE1472003B2/de active Pending
- 1965-05-25 SE SE683465A patent/SE307977B/xx unknown
Also Published As
Publication number | Publication date |
---|---|
FR1406026A (fr) | 1965-07-16 |
SE307977B (de) | 1969-01-27 |
DE1472003B2 (de) | 1976-09-16 |
GB1059015A (en) | 1967-02-15 |
CH435784A (de) | 1967-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2934489C2 (de) | ||
DE2613258C2 (de) | Schaltungsanordnung zum Erkennen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache | |
EP0386418B1 (de) | Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale | |
DE69425468T2 (de) | Verfahren und Gerät zur Analog-Digital-Umsetzung | |
DE2820645A1 (de) | Vorrichtung und verfahren zur spracherkennung | |
DE2753707A1 (de) | Einrichtung zur erkennung des auftretens eines kommandowortes aus einer eingangssprache | |
WO1983000231A1 (en) | Method for testing analog/digital converters and/or digital/analog converters or sections of information transmission circuits, comprising such converters or connected in series therewith, for communication apparatus, particularly for testing coders-decoders for pcm apparatus, as well as device for implemeting such method | |
DE2418653B2 (de) | Vorrichtung zum Anzeigen eines Extremwertes einer Folge von Digitalwerten | |
DE3889612T2 (de) | Dateneingangs-/-ausgangsschaltung. | |
DE69127134T2 (de) | Sprachkodierer | |
DE2020753A1 (de) | Einrichtung zum Erkennen vorgegebener Sprachlaute | |
EP0285222A2 (de) | Verfahren zum Erkennen zusammenhängend gesprochener Wörter | |
DE2720666C2 (de) | Verfahren und Anordnung zur Geräuschanalyse | |
DE2634426A1 (de) | Bandkompressionseinrichtung | |
DE3813068A1 (de) | Filter mit geschaltetem kondensator fuer einen digital-analog-konverter | |
DE1472003A1 (de) | Verfahren und Anordnung zur Ableitung der Spektrumfunktion bei der Sprachanalyse | |
EP0814457B1 (de) | Verfahren zur automatischen Erkennung eines gesprochenen Textes | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE3115884C2 (de) | ||
DE2307441C1 (de) | Verfahren zum Verschleiern von Sprachsignalen | |
DE2303497C2 (de) | Verfahren zur Übertragung von Sprachsignalen | |
DE69119005T2 (de) | Verfahren und Einrichtung zur Kodierung eines Analogsignals mit Wiederholeigenschaft | |
DE3113189A1 (de) | "verfahren und vorrichtung zur umwandlung von digitalen zeichencodes, die von einem datenverarbeitungssystem empfangen oder geliefert werden" | |
DE4229372C2 (de) | Verfahren zum Übertragen oder Speichern der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung | |
DE2104012C3 (de) | Elektrische Einrichtung zur Erkennung von Sprachlauten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
SH | Request for examination between 03.10.1968 and 22.04.1971 |