DE396121T1 - System zur codierung von breitbandaudiosignalen. - Google Patents
System zur codierung von breitbandaudiosignalen.Info
- Publication number
- DE396121T1 DE396121T1 DE199090108332T DE90108332T DE396121T1 DE 396121 T1 DE396121 T1 DE 396121T1 DE 199090108332 T DE199090108332 T DE 199090108332T DE 90108332 T DE90108332 T DE 90108332T DE 396121 T1 DE396121 T1 DE 396121T1
- Authority
- DE
- Germany
- Prior art keywords
- long
- signal
- lag
- excitation
- term analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims 50
- 230000007774 longterm Effects 0.000 claims 48
- 230000005284 excitation Effects 0.000 claims 36
- 239000013598 vector Substances 0.000 claims 33
- 238000000034 method Methods 0.000 claims 26
- 238000003786 synthesis reaction Methods 0.000 claims 24
- 230000015572 biosynthetic process Effects 0.000 claims 21
- 230000006870 function Effects 0.000 claims 18
- 238000001914 filtration Methods 0.000 claims 9
- 238000013139 quantization Methods 0.000 claims 6
- 101000972841 Lens culinaris Non-specific lipid-transfer protein 4 Proteins 0.000 claims 4
- 230000015654 memory Effects 0.000 claims 4
- 230000005236 sound signal Effects 0.000 claims 4
- 238000001228 spectrum Methods 0.000 claims 4
- 101000578195 Lens culinaris Non-specific lipid-transfer protein 5 Proteins 0.000 claims 3
- 101000578200 Lens culinaris Non-specific lipid-transfer protein 6 Proteins 0.000 claims 3
- 230000005540 biological transmission Effects 0.000 claims 3
- 238000005070 sampling Methods 0.000 claims 3
- 230000003044 adaptive effect Effects 0.000 claims 2
- 238000007493 shaping process Methods 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 claims 2
- 101100406317 Arabidopsis thaliana BCE2 gene Proteins 0.000 claims 1
- 101100060402 Dianthus caryophyllus CMB2 gene Proteins 0.000 claims 1
- 101710196810 Non-specific lipid-transfer protein 2 Proteins 0.000 claims 1
- 244000309464 bull Species 0.000 claims 1
- 101150029874 cmb1 gene Proteins 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/113—Regular pulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (19)
1. Verfahren zum Codieren breitbandiger Audiosignale, bei dem man das zu codierende Signal in digitale Form umwandelt, das
digitale Signal so filtert, daß das gesamte Band in eine Anzahl von Teilbändern aufgespalten wird, und die Signale
jedes Teilbands, die in Rahmen zweckmäßiger Dauer von Abtastwerten organisiert sind, unabhängig von denen der
anderen Teilbänder codiert und sie gegebenenfalls gemeinsam mit Nicht-Sprechsignalen auf eine übertragungsleitung sendet,
dadurch gekennzeichnet, daß man für eine übertragung der codierten Audiosignale mit mittlerer Bitrate die Signale
jedes Teilbands entsprechend einer Technik mit Analyse durch ■
Synthese codiert, bei der man eine kurzfristige und eine langfristige Analyse der zu codierenden Signale durchführt.
2. Verfahren nach Anspruch l, dadurch gekennzeichnet, daß man
während des Codierens die zur Verfügung stehende Bitrate gleichmäßig unter den verschiedenen Teilbändern aufteilt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man
während des Codierens die zur Verfügung stehende Bitrate ungleichmäßig unter den verschiedenen Teilbändern aufteilt
und jedem Teilband eine Bitrate so zuteilt, daß im Mittel in allen Teilbändern eine gleichförmige Verzerrung sichergestellt
ist.
4. Verfahren nach Anspruch 1 oder 3, dadurch gekennzeichnet, daß man jedes Teilband mit derjenigen Technik codiert, die für
die Darstellung der Charakteristiken seiner Erregung besser geeignet ist und für die die für dieses Teilband gewählte
Bitrate besser geeignet ist.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die zur Verfügung stehende Bitrate ungleichmäßig und
dynamisch unter den verschiedenen Teilbändern aufteilt und jedem Teilband in jedem Rahmen und in einer von einem Rahmen
zum nächsten Rahmen wechselnden Weise diejenige Bitrate zuordnet, die während jedes Rahmens eine gleichförmige
Verzerrung sicherstellt. '
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch
gekennzeichnet, daß man die Codierungstechnik unter den folgenden Techniken auswählt: 'Codierung mit linearer
Vorhersage mit Multiimpulserregung, Codierung mit linearer Vorhersage mit Codebucherregung, Codierung mit vektoriell
adaptiver Vorhersage, Codierung mit regelmäßiger Impulserregung und langfristiger Vorhersage, vektorielle adaptive
differenzielle Pulscodemodulation.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die
Codierungstechnik eine mit linearer Vorhersage mit Multiimpulserregung ist, bei der man eine Vektorquantisierung mit
aufgeteiltem Codebuch einer Darstellung linearer Vorhersagekoeffizienten, die aus der kurzfristigen Analyse resultieren,
durchführt und man eine langfristige Analyse und Erregungsimpulserzeugung in aufeinanderfolgenden Schritten durchführt,
indem man zuerst die Optimalwerte der Nacheilung bestimmt,
die einen gegenwärtigen Abtastwert von einem für die Verarbeitung dieses gegenwärtigen Abtastwerts verwendeten
vorhergehenden Abtastwert trennt (Nacheilung der langfristigen Analyse), sowie die Verstärkung bestimmt, mit der der
vorhergehende Abtastwert zum Verarbeiten des gegenwärtigen Abtastwerts gewichtet wird (Vertärkung der langfristigen
Analyse), und dann die Amplituden und Positionen der Erregungsimpulse bestimmt, wobei man die Nacheilung und die
Verstärkung der langfristigen Analyse ebenfalls in aufeinanderfolgenden Schritten bestimmt.
8. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Codierungstechnik eine mit linearer Vorhersage mit Codebucherregung
ist, bei der man eine Vektorquantisierung mit aufgeteiltem Codebuch einer Darstellung der linearen
Vorhersagekoeffizienten, die aus der kurzfristigen Analyse resultieren, durchführt und bei der man die langfristige
Analyse und Erregungsgeneration in zwei aufeinanderfolgenden Schritten durchführt, wobei man im ersten Schritt einen
Optimalwert für die Nacheilung bestimmt, die einen gegenwärtigen Abtastwert von einem für die Verarbeitung dieses
gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt (Nacheilung der langfristigen Analyse),
während man im zweiten Schritt ein Optimum-Erregungsmodell bestimmt, das aus der optimalen Verstärkung, mit der der
vorhergehende Abtastwert gewichtet wird (Verstärkung der langfristigen Analyse), aus einer Folge von Vektoren und aus
einem entsprechenden Skalenfaktor besteht, und wobei die Verstärkung der langfristigen Analyse und die Vektoren und
Skalenfaktoren gemeinsam bestimmt werden.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß man
vor diesen beiden Schritten den Beitrag [S0(p)], den man den Analysen und Synthesen gibt, die sich durch früher durchgeführte
Analysen und Synthesen auf einen gegenwärtigen Rahmen beziehen, einmal für alle bestimmt, indem man ein Nullsignal
durch eine Gewichtungsfunktion [1/A(z,^ )]gewichtet , die von
den linearen Vorhersagekoeffizienten abhängt, die nach einer
Vektorquantisierung mit geteiltem Codebuch rekonstruiert
sind, und daß man diesen Beitrag von einem ersten gewichteten Signal [Sw(p)] subtrahiert, das man durch spektrale Formung
des zu codierenden Signals erhält, wodurch man ein erstes Fehlersignal [Sl(p)] erzeugt.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß man für die Bestimmung des Optimalwerts (M) der Nacheilung der
langfristigen Analyse die Energie eines zweiten Fehlersignals
[s3(p)] minimalisiert, wobei dieses Signal die Differenz zwischen dem ersten Fehlersignal [sl(p)] und einem zweiten
gewichteten Signal [s2(p)] ist, das man dadurch erhält, daß man ein Nullsignal einer ersten langfristigen Synthesefilterung
unterwirft und mit der Gewichtungsfunktion das aus der Synthesefilterung resultierende Signal gewichtet, wobei man
die erste langfristige Synthesefilterung durchführt, indem man aufeinanderfolgend alle möglichen Werte (m) der Nacheilung
der langfristigen Analyse verwendet und für jeden von ihnen einen entsprechenden Optimalwert [b(m)] der Verstärkung
der langfristigen Analyse verwendet; und daß man durch Bestimmung· der Erregung die Energie eines dritten Fehlersignals
[s5(p)] minimalisiert, das die Differenz zwischen dem ersten Fehlersignal und einem dritten gewichteten Signal
[s4(p)] ist, welches man durch Gewichten mit der Gewichtungsfunktion [l/A (z, ^ )] eines Signals erhält, das die Summe
eines Erregungsvektors [e(i)], der vom betreffenden Skalenfaktor (g) gewichtet ist, und eines weiteren Signals ist, das
man dadurch erhält, daß man ein Nullsignal einer zweiten langfristigen Synthesefilterung unterwirft, bei der die
verwendete Nacheilung der Optimalwert (M) der Nacheilung der langfristigen Analyse und die Verstärkung eine optimale
Verstärkung der langfristigen Analyse für diesen Vektor ist.
11. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß man zum Bestimmen des Optimalwerts (M) der Nacheilung der
langfristigen Analyse die Energie eines vierten Fehlersignals [s7(p)] minimalisiert, wobei dieses Signal die Differenz
zwischen dem ersten Fehlersignal [sl(p)] und einem vierten
gewichteten Signal [s6(p)] ist, das man dadurch erhält, daß
man ein Nullsignal einer dritten langfristigen Synthesefilterung unterwirft, bei der alle möglichen Werte (m) der
Nacheilung der langfristigen Analyse aufeinanderfolgend in Kombination mit einer Einheitsverstärkung verwendet werden
und das aus der Synthesefilterung resultierende Signal mit der Gewichtungsfunktion gewichtet und das aus der Gewichtung
resultierende Signal (ti) mit einem Wert [b(m)] der Verstärkung der langfristigen Analyse, der den Optimalwert für diese
Nacheilung darstellt, multipliziert; und daß man für die Bestimmung der Erregung die Energie eines fünften Fehlersignals
[s9(p)] minimalisiert, das man dadurch erhält, daß man ein viertes gewichtetes Signal [s8(p)] von einem weiteren
Signal subtrahiert, wobei das vierte gewichtete Signal erhalten wird durch Gewichtung aller möglichen Erregungsvektoren
e(i) mit der Gewichtungs funktion [1/A(z,^ )] und durch
Multiplizieren jedes gewichteten Vektors mit einem Wert [g(i)] des Skalenfaktors, der den Optimalwert für diesen
Vektor darstellt, und das weitere Signal aus dem vierten Fehlersignal [s7(p)] besteht, wenn der Optimalwert (M) der
Nacheilung. der langfristigen Analyse und ein Wert der
Verstärkung der langfristigen Analyse, die den Optimalwert für diesen Vektor darstellt, bei der dritten langfristigen
Synthesefilterung verwendet werden".
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die Werte des Skalenfaktors in Bezug zum Maximum oder Mittelwert
dieses Faktors innerhalb eines Rahmens normalisiert werden und daß in jedem Rahmen dieses Maximum oder dieser Mittelwert
so optimiert wird, daß die Energie des fünften Fehlersignals [s9(p)] minimalisiert wird.
13. Verfahren nach einem der Ansprüche 8 bis 12, dadurch gekennzeichnet,
daß man das Erregungs-Vektor-Codebuch erzeugt, indem man von einer beschränkten Zahl von Schlüsselvektoren
ausgeht, die aus einer Kombination von Abtastwerten mit Einheitsamplitude bestehen, die jeweils für einen anderen
Abtastzeitpunkt relevant sind, wobei die Anzahl der zur
Erzeugung dieser Paare verwendbaren Abtastwerte nicht höher ist als die Anzahl der Abtastwerte, die einen Codebuchvektor
bilden.
14. Vorrichtung zum Codieren breitbandiger Audiosignale, mit
einer Einrichtung (CMO) zum Abtasten des zu codierenden Signals mit einer ersten Frequenz, die ein Vielfaches der
Maximalfrequenz dieses Signals ist, Einrichtungen (FQl, FQ2) zum Filtern des abgetasteten Signals so, daß sein Band in
aneinander angrenzende Teilbänder aufgeteilt wird, Einrichtungen (CMl, CM2) zum Abtasten der Signale jedes Teilbands
mit der betreffenden Nyquist-Frequenz, Codierern (CDI, CD2)
zum digitalen Codieren der abgetasteten Signale jedes Teilbands und einer Einrichtung (MX) zum Senden der sich auf
die einzelnen Teilbänder beziehenden codierten Signale gegebenenfalls in Verbindung mit Nicht-Audio-Signalen, die
ebenfalls in digitaler Form codiert sind, auf eine übertragungsleitung
(109), dadurch gekennzeichnet, daß jeder Codierer (CDI, CD2) ein Codierer mit Analyse durch Synthese
ist, der Einrichtungen (STA, LTA, LTAl) für kurzfristige Analyse und für langfristige Analyse des zu codierenden
Signals umfaßt.
15. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, daß der Codierer (CDI, CD2), der sich auf wenigstens eines der
Teilbänder bezieht, ein auf einer linearen Vorhersagecodierung mit Multiimpulserregung basierender Codierer ist, in
dem die Einrichtung (LTA) für die langfristige Analyse die Nacheilung (M) bestimmt, die einen gegenwärtigen Abtastwert
von einem zur Verarbeitung des gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt, und die
Verstärkung (B) bestimmt, mit der der vorhergehende Abtastwert in zwei aufeinanderfolgenden Stufen gewichtet wird, die
beide einem Schritt vorausgehen, bei dem die Amplituden und Positionen der Erregungsimpulse durch einen Erregungsgenerator
(EG) bestimmt werden, und in dem die Einrichtung (STA) für die kurzfristige Analyse mit einer Schaltung (VQ) für die
Vektorquantisierung mit geteiltem Codebuch benachbarter
•Spektrumslinienpaare oder von Differenzen zwischen benachbarten
Spektrumslinien, die eine Darstellung linearer Vorhersagekoeffizienten bilden, die als Ergebnis der kurzfristigen
Analyse erhalten werden, verbunden ist.
16. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, daß der Codierer (CDI, CD2), der sich auf wenigstens eines der
Teilbänder bezieht, ein auf der linearen Vorhersagetechnik mit Codebucherregung basierender Codierer ist, in dem die
Einrichtung (LTAl) für die langfristige Analyse die Nacheilung (M) bestimmt, die einen gegenwärtigen Abtastwert von
einem zur Bestimmung des gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt, und zwar in einem
ersten Betriebsschritt, der einem Schritt vorausgeht, in dem ein Erregungsgenerator (EGl) ein optimales Erregungsmodell
bestimmt, das aus dem optimalen Wert der Verstärkung (B), mit der dieser vorhergehende Abtastwert gewichtet wird, aus einer
Folge von Vektoren, die aus dem Erregungs-Codebuch ausgewählt
sind, und aus dem betreffenden Skalenfaktor besteht, wobei die Verstärkung, die Erregungsvektoren und der Skalenfaktor
gemeinsam b.estimmt werden, und daß die Einrichtung (STA) für die kurzfristige Analyse mit einer Schaltung (VQ) für die
Vektorquantisierung mit geteiltem Codebuch benachbarter Spektrumslinienpaare oder von Differenzen zwischen benachbarten
Spektrumslinien, die als Darstellung linearer Vorhersagecoeffizienten erhalten werden, welche durch die kurzfristige
Analyse bestimmt sind, verbunden sind.
17. Vorrichtung nach Anspruch 16, dadurch gekennzeichnet, daß die Einrichtung (LTAl) für die langfristige Analyse ein erstes
Gewichtungsfilter (F5), das den gegebenen Beitrag [sO(p)] zur Analyse und Synthese, die sich auf einen gegenwärtigen Rahmen
aufgrund der vorher durchgeführten Analysen und Synthesen bezieht, durch Gewichten eines Nullsignals mit einer Gewichtungsfunktion
[1/A(z,y ).] in Abhängigkeit von den linearen Vorhersagekoeffizienten, die nach der Vektorquantisierung
rekonstruiert sind, und einen ersten Addierer (SM3) umfaßt, der diesen Beitrag von einem ersten gewichteten Signal
[sw(p)], das von der spektralen Formung des Eingangssignals
des Codierers (CDI, CD2) erhalten wird, subtrahiert und ein erstes Fehlersignal [sl(p)] liefert, das zumindest zur
Bestimmung der Nacheilung (M) der langfristigen Analyse dient.
18. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, daß die Einrichtung (LTAl) für die langfristige Analyse weiterhin
folgende Teile umfaßt:
ein erstes langfristiges Synthesefilter (LTP4), das mit einem Nullsignal gespeist ist, eine Transferfunktion in
Abhängigkeit von der Nacheilung und Verstärkung der langfristigen Analyse aufweist und aufeinanderfolgend
alle möglichen Nacheilungswerte und für jeden von ihnen einen Verstärkungswert [b(m)], der den Optimalwert für
diese Nacheilung darstellt, aufweist;
ein zweites Gewichtungsfilter (F6), das mit dem Ausgang des langfristigen Synthesefilters (LTP4) verbunden ist
und als Transferfunktion die Gewichtungsfunktion hat;
einen zweiten Addierer (SM4), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Gewichtungsfilters (F6) empfängt und ein zweites Fehlersignal [s3(p)] abgibt, das die Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist; eine zweite Verarbeitungseinheit (CMBl), die aufeinanderfolgend das Synthesefilter (LTP4) mit allen möglichen Werten (m) der Nacheilung der langfristigen Analyse beliefert, das zweite Fehlersignal empfängt und den Wert der Nacheilung, der dessen Energie minimalisiert und die optimale Nacheilung (M) bildet, bestimmt, wobei die Verarbeitungseinheit bei jedem neuen Wert der Nacheilung den Speicher des zweiten Gewichtungsfilters (F6) zurückstellt;
einen zweiten Addierer (SM4), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Gewichtungsfilters (F6) empfängt und ein zweites Fehlersignal [s3(p)] abgibt, das die Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist; eine zweite Verarbeitungseinheit (CMBl), die aufeinanderfolgend das Synthesefilter (LTP4) mit allen möglichen Werten (m) der Nacheilung der langfristigen Analyse beliefert, das zweite Fehlersignal empfängt und den Wert der Nacheilung, der dessen Energie minimalisiert und die optimale Nacheilung (M) bildet, bestimmt, wobei die Verarbeitungseinheit bei jedem neuen Wert der Nacheilung den Speicher des zweiten Gewichtungsfilters (F6) zurückstellt;
und daß die Einrichtung (EGl) zum Bestimmen des optimalen Erregungsmodells folgende Teile umfaßt:
ein zweites langfristiges Synthesefilter (LTP5), das mit einem Nullsignal gespeist ist, eine Transferfunktion
analog der des ersten Synthesefilters (LTP4) aufweist und den optimalen Nacheilungswert (M) und den Wert [b(i)] der
Verstärkung, der der Optimalwert für einen gegebenen Erregungsvektor [e(i)] ist, verwendet;
einen dritten Addierer (SM5), der das Ausgangssignal des
dritten Synthesefilters (LTP5) und das Ausgangssignal eines ersten Multiplizierers (Ml), der einen Erregungsvektor mit einem entsprechenden Skalenfaktor multipliziert
, addiert;
ein drittes Gewichtungsfilter (F7), das mit dem Ausgang
des dritten Addierers (SM5) verbunden ist und als Transferfunktion die Gewichtungsfunktion [1/A(z,y)] hat;
einen vierten Addierer (SM6), der an einem ersten Eingang
das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal [s4(p)] des dritten Gewichtungsfilters
(F7) empfängt und ein drittes Fehlersignal [s5(p)] abgibt, das die Differenz zwischen den an seinem
ersten und zweiten Eingang anliegenden Signalen ist;
eine zweite Verarbeitungseinheit (CEl), die das zweite Synthesefilter (LTP5) mit dem Verstärkungswert [b(i)] und den ersten Multiplizierer (Ml) mit den Vektoren und Skalenfaktoren speist, das dritte Fehlersignal [s5(p)] empfängt und die Kombination von Verstärkung (B), Erregungsvektoren und jeweiligen Skalenfaktoren, die das optimale Erregungsmodell durch Minimierung der Energie des dritten Fehlersignals bilden, bestimmt und außerdem bei jeder neuen Kombination von Verstärkung, Vektor und Skalenfaktor die Speicher des dritten Gewichtungsfilters (F7) zurückstellt.
eine zweite Verarbeitungseinheit (CEl), die das zweite Synthesefilter (LTP5) mit dem Verstärkungswert [b(i)] und den ersten Multiplizierer (Ml) mit den Vektoren und Skalenfaktoren speist, das dritte Fehlersignal [s5(p)] empfängt und die Kombination von Verstärkung (B), Erregungsvektoren und jeweiligen Skalenfaktoren, die das optimale Erregungsmodell durch Minimierung der Energie des dritten Fehlersignals bilden, bestimmt und außerdem bei jeder neuen Kombination von Verstärkung, Vektor und Skalenfaktor die Speicher des dritten Gewichtungsfilters (F7) zurückstellt.
19. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, daß die
Einrichtung (LTAl) für die langfristige Analyse weiterhin folgende Teile umfaßt:
ein drittes langfristiges Synthesefilter (LTP6), das eine Transferfunktion in Abhängigkeit von der Nacheilung der
langfristigen Analyse aufweist, mit einem Nullsignal gespeist ist und während der Bestimmung der optimalen
Nacheilung der langfristigen Analyse aufeinanderfolgend
alle möglichen Nacheilungswerte verwendet, wobei sie
während der Bestimmung des optimalen Erregungsmodells den optimalen Nacheilungswert verwendet;
ein viertes Gewichtungsfilter (F8), das mit dem Ausgang des dritten langfristigen Synthesefilters (LTP2)
verbunden ist und als Transferfunktion die Gewichtungsfunktion hat;
einen zweiten Multiplizierer (M2), der mit dem Ausgang
des vierten Gewichtungsfilters (F8) verbunden ist und während der Bestimmung der optimalen Nacheilung der
langfristigen Analyse für jeden Nacheilungswert, der im dritten Synthesefilter (LTP6) verwendet wird, das
Ausgangssignal (ti) des vierten Gewichtungsfilters (F8)
mit einem Wert [b(m)] der Verstärkung der langfristigen Analyse, der der Maximalwert für diese Nacheilung ist,
multipliziert, wobei er während der Bestimmung des optimalen Erregungsmodells das Ausgangssignal des vierten
Filters (F8) mit dem Wert [b(i)] der Verstärkung der langfristigen Analyse, die der Optimalwert für einen
gegebenen Erregungsvektor ist, multipliziert;
einen fünften Addierer (SM7), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Multiplizierers (M2) empfängt und ein viertes Fehlersignal [s7(p)] abgibt, das aus der Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist;
einen fünften Addierer (SM7), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Multiplizierers (M2) empfängt und ein viertes Fehlersignal [s7(p)] abgibt, das aus der Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist;
eine dritte Verarbeitungseinheit (CMB2), die aufeinanderfolgend das dritte Synthesefilter (LTP6) mit allen
möglichen Werten (m) der Nacheilung der langfristigen Analyse speist, wobei sie bei jedem neuen Wert den
Speicher des vierten Gewichtungsfilters (F8) zurückstellt und während der Bestimmung der optimalen Nacheilung den
zweiten Multiplizierer (M2) mit den Werten der Verstärkung [b(m)] beliefert, das vierte Fehlersignal empfängt
und den Nacheilungswert bestimmt, der die Energie des vierten Fehlersignals minimalisiert und die optimale
Nacheilung (M) bildet;
und daß die Einrichtung (EGl) zum Bestimmen der optimalen Verstärkung (B) der langfristigen Analyse, des Vektors e(i)
und ihrer jeweiligen Skalenfaktoren (g), die das optimale Erregungsmodell bilden, folgende Teile umfaßt:
ein fünftes Gewichtungsfilter (F9), das mit den Erregungsvektoren gespeist ist und als Transferfunktion die
Gewichtungsfunktion hat;
einen dritten Multiplizierer (M3), der mit dem Ausgang des fünften Gewichtungsfilters (F9) verbunden ist und für
jeden Vektor, den er diesem fünften Gewichtungsfilter lierfert, das Ausgangssignal des Filters (F9) mit einem
optimalen Skalenfaktor multipliziert; einen fünften Addierer (SM8), der an einem ersten Eingang
das vierte Fehlersignal [s7(p)] und an einem zweiten Eingang das Ausgangssignal [s8(p)] des fünften Gewichtungsfilters
(F9) empfängt und ein fünftes Fehlersignal [s9(p)] erzeugt, das aus der Differenz zwischen den am
ersten und am zweiten Eingang vorhandenen Signalen besteht;
eine vierte Verarbeitungseinheit (CE2), die das fünfte
Gewichtrungsfilter (F9) mit den Erregungsvektoren, den dritten Multiplizierer (M3) mit dem optimalen Skalenfaktor
für jeden vom fünften Gewichtungsfilter (F9) gelieferten Vektor und den zweiten Multiplizierer (M2)
mit der optimalen Verstärkung der langfristigen Analyse für diesen Vektor beliefert, das fünfte Fehlersignal
[s9(p)] empfängt und die Kombination von Verstärkung (B) der langfristigen Analyse, Erregungsvektoren und
jeweilige Skalenfaktoren bestimmt, die das optimale Erregungsmodell bildet, indem sie die Energie des fünften
Fehlersignals [s9(p)] minimalisiert, wobei die vierte Verarbeitungseinheit die Speicher des fünften Gewichtungsfilters
(F9) bei jeder neuen Kombination von Vektor, Skalenfaktor und Verstärkung der langfristigen Analyse
zurückstellt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT8967317A IT1232084B (it) | 1989-05-03 | 1989-05-03 | Sistema di codifica per segnali audio a banda allargata |
Publications (1)
Publication Number | Publication Date |
---|---|
DE396121T1 true DE396121T1 (de) | 1991-03-21 |
Family
ID=11301410
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69028434T Expired - Lifetime DE69028434T2 (de) | 1989-05-03 | 1990-05-02 | System zur Codierung von Breitbandaudiosignalen |
DE199090108332T Pending DE396121T1 (de) | 1989-05-03 | 1990-05-02 | System zur codierung von breitbandaudiosignalen. |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69028434T Expired - Lifetime DE69028434T2 (de) | 1989-05-03 | 1990-05-02 | System zur Codierung von Breitbandaudiosignalen |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP0396121B1 (de) |
CA (1) | CA2016042C (de) |
DE (2) | DE69028434T2 (de) |
IT (1) | IT1232084B (de) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
EP0910064B1 (de) * | 1991-02-26 | 2002-12-18 | Nec Corporation | Sprachparameterkodierungsvorrichtung |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
US5717824A (en) * | 1992-08-07 | 1998-02-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear predictor with multiple codebook searches |
IT1257431B (it) * | 1992-12-04 | 1996-01-16 | Sip | Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi |
BE1007617A3 (nl) * | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5506908A (en) * | 1994-06-30 | 1996-04-09 | At&T Corp. | Directional microphone system |
JPH09506478A (ja) * | 1994-10-06 | 1997-06-24 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | 光放射半導体ダイオード及びこのようなダイオードの製造方法 |
JP2842276B2 (ja) * | 1995-02-24 | 1998-12-24 | 日本電気株式会社 | 広帯域信号符号化装置 |
TW321810B (de) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
FI114248B (fi) | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
JP3199020B2 (ja) | 1998-02-27 | 2001-08-13 | 日本電気株式会社 | 音声音楽信号の符号化装置および復号装置 |
FI113571B (fi) | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
WO2006030340A2 (en) * | 2004-09-17 | 2006-03-23 | Koninklijke Philips Electronics N.V. | Combined audio coding minimizing perceptual distortion |
MY153562A (en) * | 2008-07-11 | 2015-02-27 | Fraunhofer Ges Forschung | Method and discriminator for classifying different segments of a signal |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5921039B2 (ja) * | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
EP0111612B1 (de) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Verfahren und Einrichtung zur Kodierung eines Sprachsignals |
DE3688980T2 (de) * | 1986-10-30 | 1994-04-21 | Ibm | Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens. |
-
1989
- 1989-05-03 IT IT8967317A patent/IT1232084B/it active
-
1990
- 1990-05-02 EP EP90108332A patent/EP0396121B1/de not_active Expired - Lifetime
- 1990-05-02 DE DE69028434T patent/DE69028434T2/de not_active Expired - Lifetime
- 1990-05-02 DE DE199090108332T patent/DE396121T1/de active Pending
- 1990-05-03 CA CA002016042A patent/CA2016042C/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CA2016042A1 (en) | 1990-11-03 |
DE69028434D1 (de) | 1996-10-17 |
EP0396121A1 (de) | 1990-11-07 |
EP0396121B1 (de) | 1996-09-11 |
IT1232084B (it) | 1992-01-23 |
DE69028434T2 (de) | 1997-02-20 |
IT8967317A0 (it) | 1989-05-03 |
CA2016042C (en) | 1998-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3883519T2 (de) | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. | |
DE396121T1 (de) | System zur codierung von breitbandaudiosignalen. | |
DE69603743T2 (de) | Verfahren und gerät zum kodieren, behandeln und dekodieren von audiosignalen | |
DE2934489C2 (de) | ||
EP1979901B1 (de) | Verfahren und anordnungen zur audiosignalkodierung | |
DE3853161T2 (de) | Vektorquantisierungscodierer. | |
DE3784942T2 (de) | Duplex-datenuebertragung. | |
DE69529672T2 (de) | System zur sprachkodierung | |
DE69614782T2 (de) | Verfahren und Einrichtung zur Wiedergabe von Sprachsignalen und Verfahren zu seiner Übertragung | |
DE69731588T2 (de) | Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem | |
DE69828725T2 (de) | Sprachcodier- und -decodiersystem | |
DE19604273C5 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
DE19647298C2 (de) | Kodiersystem | |
DE69121411T2 (de) | Methode und gerät zur codierung von analogen signalen | |
DE69013738T2 (de) | Einrichtung zur Sprachcodierung. | |
DE582921T1 (de) | Kodierer von Tonsignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken. | |
DE19742655C2 (de) | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals | |
EP1280138A1 (de) | Verfahren zur Analyse von Audiosignalen | |
DE69128407T2 (de) | Verfahren und Einrichtung zur Übertragung mit niedriger Bitrate eines Sprachsignals mittels CELP-Codierung | |
DE69618408T2 (de) | Verfahren und Vorrichtung zur Sprachkodierung | |
EP1023777B1 (de) | Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms | |
DE69017842T2 (de) | Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate. | |
DE68917584T2 (de) | Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung. | |
DE186763T1 (de) | Verfahren und einrichtung zur kodierung und dekodierung von sprachsignalen durch vektorquantisierung. | |
DE69128582T2 (de) | Methode zur Phonemunterscheidung |