DE1472003B2 - Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse - Google Patents
Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyseInfo
- Publication number
- DE1472003B2 DE1472003B2 DE19651472003 DE1472003A DE1472003B2 DE 1472003 B2 DE1472003 B2 DE 1472003B2 DE 19651472003 DE19651472003 DE 19651472003 DE 1472003 A DE1472003 A DE 1472003A DE 1472003 B2 DE1472003 B2 DE 1472003B2
- Authority
- DE
- Germany
- Prior art keywords
- register
- signal
- contents
- signals
- digital signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 title claims description 18
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 30
- 230000005284 excitation Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000009795 derivation Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000005032 impulse control Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Interface Circuits In Exchanges (AREA)
Description
Die Erfindung betrifft Verfahren und Anordnungen zur Gewinnung der Spektrumfunktion bei der Sprachanalyse
nach dem Vocoderprinzip und deren Darstellung in codierter Form.
Eine Reihe bekannter Verfahren ermöglicht die Sprachübertragung über Kanäle, deren Bandbreite
schmäler ist als das Frequenzband des originalen Sprachsignals. Die hierbei erreichte Verständlichkeit ist
meist zufriedenstellend.
Nach den gebräuchlichsten Methoden wird das Sprachsignal in eine bestimmte Anzahl von Frequenzbändern
zerlegt und mit Hilfe zweier Funktionen dargestellt, die den Amplitudenverlauf des Sprachsignals
zu definierten Zeitpunkten angeben. Die erste Funktion, die sogenannte Spektrumfunktion, gibt den
Energiegehalt in jedem der Frequenzbänder an. Die zweite Funktion, die sogenannte Anregungsfunktion,
gibt dagegen die Sprachgrundfrequenz an, wenn das Sprachsignal einen periodischen oder quasi-periodischen
Charakter besitzt.
Die Zeitintervalle, die die Zeitpunkte, zu denen die erwähnten Funktionen, definiert sind, voneinander
trennen, können abweichen und auch für die zwei verschiedenen Funktionen verschiedene Werte aufweisen.
Da sich die Spektrumfunktion im allgemeinen zeitlich langsamer ändert als die Anregungsfunktion,
wird bei manchen Einrichtungen die Spektrumfunktion in zeitlich größeren Abständen ermittelt, als es im Falle
der Anregungsfunktion geschieht.
Drei bekannte Verfahren werden bisher im wesentlichen zur Ableitung der Spektrumfunktion verwendet:
Beim ersten wird die Spektrumfunktion zur gleichen Zeit, wie die Anregungsfunktion abgeleitet, jedoch nur
jedes n-te mal, wobei η eine ganze Zahl bedeutet, die größer als eins ist.
Beim zweiten Verfahren wird die Spektrumfunktion zu jeweils festen Zeitintervallen abgeleitet. Sie wird
dabei derjenigen Anregungsfunktion zugeordnet, deren Ableitung zu dem am nächsten gelegenen Zeitpunkt
erfolgte.
Beim dritten Verfahren wird die Spektrumfunktion zu einem bestimmten Zeitpunkt der Ableitung der
Anregungsfunktion gewonnen. Es handelt sich dabei um diejenige Ableitung, die jenem Zeitpunkt folgte, zu dem
ein festes Zeitintervall nach der vorherigen Ableitung der Spektrumfunktion vorübergegangen war.
Diese drei Verfahren haben jedoch Nachteile, die in folgenden Grenzfällen auftreten können: Der erste
Nachteil entsteht, wenn, als Extremfall, sich die Spektrumfunktion zeitlich sehr langsam verändert.
Dann sind zwei aufeinanderfolgende Werte identisch oder nahezu identisch. Sind an den Sprachanalysator
Einrichtungen zur Sprachverarbeitung, beispielsweise eine Datenverarbeitungsanlage für nach bestimmten
Programmen vorzunehmende wissenschaftliche Sprachuntersuchungen oder eine Einrichtung zur
Vokabularerstellung für Datenverarbeitungsanlagen mit Datenausgabe in gesprochener Form, angeschlossen,
dann wird die Speicherkapazität dieser Einrichtungen durch die Redundanz der Kanalenergiewerte
unnötig belastet. Beim zweiten Extremfall ändert sich die Spektrumfunktion dagegen sehr schnell, so daß ihre
Bestimmung zu den zeitlich nun verhältnismäßig weit auseinanderliegenden Intervallen für eine naturgetreue
Sprachwiedergabe unzureichend ist.
Es ist daher die Aufgabe der Erfindung ein Verfahren anzugeben, welches diese Nachteile weitgehend vermeidet.
Für ein Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip
besteht die Erfindung darin, daß die gerade abgeleiteten Kanalenergiewerte geprüft werden, ob
ihre Größe sich in vorgebbarer Höhe von den zuvor abgeleiteten Kanalenergiewerten unterscheidet und
daß im Falle einer genügenden Unterscheidung die zuletzt abgeleiteten Kanalenergiewerte zur weiteren
Verarbeitung verwertet werden und daß im Falle einer nicht genügenden Unterscheidung diese Werte nicht
weiter verarbeitet werden.
Eine weitere Ausgestaltung des Verfahrens besteht darin, daß die Größe der vorgebbaren Unterscheidung
definiert wird durch einen Unterschied korrespondierender Werte von mehr als zwei Einheiten in mehr als
zwei Kanälen.
Eine Anordnung zur Durchführung des Verfahrens ist dadurch gekennzeichnet, daß die Kanalenergiewerte
nach ihrer Analog-Digital-Umwandlung in je Kanal vorgesehenen Konvertern in einem ersten Register
gespeichert werden, daß ferner ein zweites Register vorgesehen ist, welches über eine Vielfachleitung mit
dem ersten Register verbunden ist, daß weiterhin eine Vergleichseinrichtung vorgesehen ist, weiche die über
Vielfachleitungen anliegenden gespeicherten Werte der Register vergleicht und über eine Verbindungsleitung
ein Steuersignal an eine Entscheidungsschaltung abgibt, die über eine Steuerleitung die Übertragung des im
ersten Register befindlichen Wertes über eine Vielfachleitung zu einer Verarbeitungseinrichtung und über eine
weitere Vielfachleitung zu dem zweiten Register veranlaßt, wenn die vorgegebenen Abweichungen in
der Vergleichseinrichtung festgestellt wurden, oder die über eine Leitung ein Signal abgibt, welches angibt, daß
sich der Wert der Spektrumfunktion nicht wesentlich geändert hat, wenn die Vergleichseinrichtung die
vorgegebene Abweichung nicht festgestellt hat.
Im folgenden wird die Erfindung an Hand eines durch Zeichnung erläuterten Ausführungsbeispieles näher
beschrieben. Die Figur zeigt eine Einrichtung die im wesentlichen folgenden Aufbau besitzt: Über die
Leitung 1 wird das zu analysierende Sprachsignal s(t) zu dem Analysator übertragen. Dieser besitzt zunächst
eine Reihe von Bandfiltern 2\ bis 2„, die das Sprachsignal
in die gewünschten Frequenzbänder zerlegen. Diesen Bandfiltern folgen eine Reihe von Gleichrichtern 3i bis
3Λ eine Reihe von Tiefpaßfiltern 4| bis 4„ und
Torschaltungen 5i bis 5„. Ferner sind eine Anzahl von
Verbindungsleitungen 61 bis 6„ vorgesehen, über welche
Steuerimpulse übertragen werden, die die Torschaltungen zu bestimmten Zeitpunkten öffnen. Die Steuereinrichtungen
selbst sind nicht dargestellt. Diese Steuerimpulse können beispielsweise in bekannten Anordnungen
gewonnen werden, welche die Ableitung der Anregungsfunktion steuern. Diesen Torschaltungen folgen je
Kanal Analog-Digital-Wandler 7i bis 7„, die an ihren
Ausgängen kodierte Signale abgeben, welche die Größe der Amplituden der Signale, die von den Torschaltungen
5i bis 5„ her übertragen werden, angeben.
Da die Systeme zur Erzeugung der Anregungsfunktion bekannt sind, wird von einer ausführlichen
Beschreibung derselben abgesehen.
Die Anordnung zur Verbesserung des Analysenteils des Vocoders nach der Erfindung umfaßt die Register 8
und 9, die Vergleichseinrichtung 10 und den Entscheidungskreis 11. Die Anordnung selbst arbeitet nun auf
folgende Weise: Wenn einer der Werte der Spektrumfunktion ermittelt worden ist, dann werden die Signale,
die dieser Funktion entsprechen, zu dem Register 8 übertragen. Ferner steuert ein Impuls, welcher über die
Letung 12 übertragen wird und welcher ebenso, wie die über die Leitungen 61 bis 6„ übertragenen Signale in dem
Sprachanalysator abgeleitet wird, den Vergleichsvorgang in der Vergleichseinrichtung 10. In dieser
Einrichtung erfolgt ein Vergleich der in den Registern 8 und 9 enthaltenen Werte. Wenn das Ergebnis dieses
Vergleichs große Unterschiede der Werte in beiden Registern zeigt, dann wird ein Signal zu dem
Entscheidungskreis 11 übertragen. Die Bedingung für die Übertragung dieses Signals kann beispielsweise sein,
wenn ein Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen auftritt oder wenn
Unterschiede auftreten, die größer als zwei Einheiten in mehr als zwei Kanälen sind. Beim Empfang dieses
Signals steuert der Entscheidungskreis 11 über die Leitung 15 die Übertragung des Inhaltes von Register 8
zu der nicht dargestellten Verarbeitungseinheit (z. B. eine elektronische Rechenanlage oder eine Übertragungsleitung)
und über die Leitung 16 zu dem Register 9, wo dieser Wert den vorherigen Wert ersetzt. Die
Übertragung des Inhaltes von Register 8 zu der nicht
dargestellten Verarbeitungseinheit erfolgt über eine Leitung oder ein Leitungsbündel 13, je nachdem, ob die
Übertragung serial oder parallel erfolgt. Wenn im Gegensatz hierzu die Leitung 12 ein Signal liefert dem
kein Ausgangssignal des Vergleichskreises 10 folgt, dann veranlaßt die Entscheidungsschaltung 11 die
Löschung des Registers 8 und der Inhalt des Registers 9 bleibt unverändert. In diesem Fall liefert die Entscheidungsschaltung
11 ein besonderes Signal, welches über die Leitung 14 übertragen wird und angibt, daß die
Spektrumfunktion sich nicht geändert hat.
Da es auch möglich ist, den Sprachanalysator direkt mit einer elektronischen Datenverarbeitungsanlage zu
verbinden, können auch alle oder auch nur ein Teil der Funktionen der mit 8, 9 und 11 bezeichneten
Baueinheiten von dieser Anlage übernommen werden.
Hierzu 1 Blatt Zeichnungen
Claims (5)
1. Verfahren zur Verarbeitung der Spektrumfunktion bei der Sprachanalyse nach dem Vocoderprinzip,
dadurch gekennzeichnet, daß die abgeleiteten Kanalenergiewerte mit den zuletzt verarbeiteten Kanalenergiewerten verglichen und
nur dann weiterverarbeitet werden, wenn sie sich von diesen um einen vorgegebenen Betrag unterscheiden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist
durch einen Unterschied zwischen korrespondierenden Werten in mehr als zwei Kanälen zwischen den
zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerten.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der vorgegebene Betrag definiert ist
durch Unterschiede zwischen korrespondierenden Werten, die größer als zwei Einheiten in mehr als
zwei Kanälen sind zwischen den zuvor und zuletzt abgeleiteten Kanalenergiewerten.
4. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet,
daß von zwei an eine Vergleichseinrichtung (10) angeschlossenen Registern (8, 9) das erste (8)
eingangsseitig mit den Kanalausgängen (7| — 7n) und
ausgangsseitig (über 16) mit den Eingängen des zweiten Registers (9) sowie (>iber 13) mit den
Eingängen der Anordnung zur Weiterverarbeitung der Kanalenergiewerte verbunden ist, und daß durch
die Vergleichseinrichtung (10) die Weiterleitung bzw. die Löschung des Inhaltes des ersten Registers
(8) steuerbar ist.
5. Anordnung nach Anspruch 4 zur Durchführung des Verfahrens nach Anspruch 1, 2 oder 3, dadurch
gekennzeichnet, daß die Vergleichseinrichtung (10) über eine Signalleitung (14) ein Signal zur Weiterverarbeitungseinheit
überträgt, wenn die zuvor abgeleiteten und zuletzt abgeleiteten Kanalenergiewerte sich nicht um einen vorgegebenen Betrag
voneinander unterscheiden.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR06007398A FR1406026A (fr) | 1964-05-26 | 1964-05-26 | Nouveaux perfectionnements aux systèmes d'analyse de la voix |
Publications (2)
Publication Number | Publication Date |
---|---|
DE1472003A1 DE1472003A1 (de) | 1969-10-09 |
DE1472003B2 true DE1472003B2 (de) | 1976-09-16 |
Family
ID=1574602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19651472003 Pending DE1472003B2 (de) | 1964-05-26 | 1965-05-24 | Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse |
Country Status (5)
Country | Link |
---|---|
CH (1) | CH435784A (de) |
DE (1) | DE1472003B2 (de) |
FR (1) | FR1406026A (de) |
GB (1) | GB1059015A (de) |
SE (1) | SE307977B (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH645501GA3 (de) * | 1981-07-24 | 1984-10-15 |
-
1964
- 1964-05-26 FR FR06007398A patent/FR1406026A/fr not_active Expired
-
1965
- 1965-05-12 CH CH664265A patent/CH435784A/de unknown
- 1965-05-21 GB GB2175465A patent/GB1059015A/en not_active Expired
- 1965-05-24 DE DE19651472003 patent/DE1472003B2/de active Pending
- 1965-05-25 SE SE683465A patent/SE307977B/xx unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2649259A1 (de) * | 1976-10-29 | 1978-05-03 | Tekade Felten & Guilleaume | Verfahren zur automatischen verarbeitung von gestoerter telefonsprache |
Also Published As
Publication number | Publication date |
---|---|
FR1406026A (fr) | 1965-07-16 |
SE307977B (de) | 1969-01-27 |
CH435784A (de) | 1967-05-15 |
DE1472003A1 (de) | 1969-10-09 |
GB1059015A (en) | 1967-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2934489C2 (de) | ||
DE3244476C2 (de) | ||
EP0069398B1 (de) | Verfahren zur Prüfung von Analog-Digital-Wandlern und/oder von Digital-Analog-Wandlern oder von nachrichtentechnischen Übertragungsabschnitten, die solche Wandler enthalten oder mit ihnen in Reihe geschaltet sind, insbesondere zur Prüfung von Codecs für PCM-Geräte, sowie Vorrichtung zur Durchführung des Verfahrens | |
EP1214703B1 (de) | Verfahren zum trainieren der grapheme nach phonemen regeln für die sprachsynthese | |
DE2820418A1 (de) | Nachrichtensignal-verschluesselungsgeraet | |
DE3889612T2 (de) | Dateneingangs-/-ausgangsschaltung. | |
DE3043516C2 (de) | Verfahren und Vorrichtung zur Spracherkennung | |
DE2357067A1 (de) | Vorrichtung zur sprachanalyse | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE1912981A1 (de) | Codierer fuer Pulscodemodulation und differentielle Pulscodemodulation | |
DE1472003B2 (de) | Verfahren und anordnung zur ableitung der spektrumfunktion bei der sprachanalyse | |
EP0814457B1 (de) | Verfahren zur automatischen Erkennung eines gesprochenen Textes | |
DE3113189C2 (de) | Vorrichtung zur Umsetzung von digitalen Zeichencodes, die von einem Datenverarbeitungssystem empfangen oder geliefert werden | |
DE1541624A1 (de) | Verfahren zur Frequenzumsetzung | |
DE2435654C2 (de) | Verfahren und Vorrichtung zur Analyse und Synthese von menschlicher Sprache | |
DE2307441C1 (de) | Verfahren zum Verschleiern von Sprachsignalen | |
DE2303497A1 (de) | Verfahren zur uebertragung von sprachsignalen | |
DE2905343A1 (de) | Vorrichtung zur umsetzung eines nicht gleichfoermig abgetasteten signals mit kurzzeitspektrum in ein gleichfoermig abgetastetes signal | |
DE2104012C3 (de) | Elektrische Einrichtung zur Erkennung von Sprachlauten | |
DE69119005T2 (de) | Verfahren und Einrichtung zur Kodierung eines Analogsignals mit Wiederholeigenschaft | |
DE3834871C1 (en) | Method for encoding speech | |
EP1845680B1 (de) | Verfahren und Vorrichtung zur Übertragung von Befehlskombinationen mittels codierter Frequenzumtastung | |
DE3114421A1 (de) | Anordnung zur spektralanalyse eines analogsignals | |
DE2061307A1 (de) | Frequenzbandanalysator | |
DE1296212B (de) | Verfahren zur UEbertragung von Sprachsignalen mit verminderter Bandbreite |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
SH | Request for examination between 03.10.1968 and 22.04.1971 |