DE396121T1 - System zur codierung von breitbandaudiosignalen. - Google Patents

System zur codierung von breitbandaudiosignalen.

Info

Publication number
DE396121T1
DE396121T1 DE199090108332T DE90108332T DE396121T1 DE 396121 T1 DE396121 T1 DE 396121T1 DE 199090108332 T DE199090108332 T DE 199090108332T DE 90108332 T DE90108332 T DE 90108332T DE 396121 T1 DE396121 T1 DE 396121T1
Authority
DE
Germany
Prior art keywords
long
signal
lag
excitation
term analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE199090108332T
Other languages
English (en)
Inventor
Roberto Torino Montagna
Maurizio Sarmeola Di Ribano Omologo (Padova)
Daniele Torino Sereno
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telecom Italia SpA
Original Assignee
CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSELT Centro Studi e Laboratori Telecomunicazioni SpA filed Critical CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Publication of DE396121T1 publication Critical patent/DE396121T1/de
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/113Regular pulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (19)

Patentansprüche
1. Verfahren zum Codieren breitbandiger Audiosignale, bei dem man das zu codierende Signal in digitale Form umwandelt, das digitale Signal so filtert, daß das gesamte Band in eine Anzahl von Teilbändern aufgespalten wird, und die Signale jedes Teilbands, die in Rahmen zweckmäßiger Dauer von Abtastwerten organisiert sind, unabhängig von denen der anderen Teilbänder codiert und sie gegebenenfalls gemeinsam mit Nicht-Sprechsignalen auf eine übertragungsleitung sendet, dadurch gekennzeichnet, daß man für eine übertragung der codierten Audiosignale mit mittlerer Bitrate die Signale jedes Teilbands entsprechend einer Technik mit Analyse durch ■ Synthese codiert, bei der man eine kurzfristige und eine langfristige Analyse der zu codierenden Signale durchführt.
2. Verfahren nach Anspruch l, dadurch gekennzeichnet, daß man während des Codierens die zur Verfügung stehende Bitrate gleichmäßig unter den verschiedenen Teilbändern aufteilt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man während des Codierens die zur Verfügung stehende Bitrate ungleichmäßig unter den verschiedenen Teilbändern aufteilt und jedem Teilband eine Bitrate so zuteilt, daß im Mittel in allen Teilbändern eine gleichförmige Verzerrung sichergestellt ist.
4. Verfahren nach Anspruch 1 oder 3, dadurch gekennzeichnet, daß man jedes Teilband mit derjenigen Technik codiert, die für die Darstellung der Charakteristiken seiner Erregung besser geeignet ist und für die die für dieses Teilband gewählte Bitrate besser geeignet ist.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die zur Verfügung stehende Bitrate ungleichmäßig und dynamisch unter den verschiedenen Teilbändern aufteilt und jedem Teilband in jedem Rahmen und in einer von einem Rahmen zum nächsten Rahmen wechselnden Weise diejenige Bitrate zuordnet, die während jedes Rahmens eine gleichförmige Verzerrung sicherstellt. '
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß man die Codierungstechnik unter den folgenden Techniken auswählt: 'Codierung mit linearer Vorhersage mit Multiimpulserregung, Codierung mit linearer Vorhersage mit Codebucherregung, Codierung mit vektoriell adaptiver Vorhersage, Codierung mit regelmäßiger Impulserregung und langfristiger Vorhersage, vektorielle adaptive differenzielle Pulscodemodulation.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Codierungstechnik eine mit linearer Vorhersage mit Multiimpulserregung ist, bei der man eine Vektorquantisierung mit aufgeteiltem Codebuch einer Darstellung linearer Vorhersagekoeffizienten, die aus der kurzfristigen Analyse resultieren, durchführt und man eine langfristige Analyse und Erregungsimpulserzeugung in aufeinanderfolgenden Schritten durchführt, indem man zuerst die Optimalwerte der Nacheilung bestimmt,
die einen gegenwärtigen Abtastwert von einem für die Verarbeitung dieses gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt (Nacheilung der langfristigen Analyse), sowie die Verstärkung bestimmt, mit der der vorhergehende Abtastwert zum Verarbeiten des gegenwärtigen Abtastwerts gewichtet wird (Vertärkung der langfristigen Analyse), und dann die Amplituden und Positionen der Erregungsimpulse bestimmt, wobei man die Nacheilung und die Verstärkung der langfristigen Analyse ebenfalls in aufeinanderfolgenden Schritten bestimmt.
8. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß die Codierungstechnik eine mit linearer Vorhersage mit Codebucherregung ist, bei der man eine Vektorquantisierung mit aufgeteiltem Codebuch einer Darstellung der linearen Vorhersagekoeffizienten, die aus der kurzfristigen Analyse resultieren, durchführt und bei der man die langfristige Analyse und Erregungsgeneration in zwei aufeinanderfolgenden Schritten durchführt, wobei man im ersten Schritt einen Optimalwert für die Nacheilung bestimmt, die einen gegenwärtigen Abtastwert von einem für die Verarbeitung dieses gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt (Nacheilung der langfristigen Analyse), während man im zweiten Schritt ein Optimum-Erregungsmodell bestimmt, das aus der optimalen Verstärkung, mit der der vorhergehende Abtastwert gewichtet wird (Verstärkung der langfristigen Analyse), aus einer Folge von Vektoren und aus einem entsprechenden Skalenfaktor besteht, und wobei die Verstärkung der langfristigen Analyse und die Vektoren und Skalenfaktoren gemeinsam bestimmt werden.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, daß man vor diesen beiden Schritten den Beitrag [S0(p)], den man den Analysen und Synthesen gibt, die sich durch früher durchgeführte Analysen und Synthesen auf einen gegenwärtigen Rahmen beziehen, einmal für alle bestimmt, indem man ein Nullsignal durch eine Gewichtungsfunktion [1/A(z,^ )]gewichtet , die von den linearen Vorhersagekoeffizienten abhängt, die nach einer
Vektorquantisierung mit geteiltem Codebuch rekonstruiert sind, und daß man diesen Beitrag von einem ersten gewichteten Signal [Sw(p)] subtrahiert, das man durch spektrale Formung des zu codierenden Signals erhält, wodurch man ein erstes Fehlersignal [Sl(p)] erzeugt.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß man für die Bestimmung des Optimalwerts (M) der Nacheilung der langfristigen Analyse die Energie eines zweiten Fehlersignals [s3(p)] minimalisiert, wobei dieses Signal die Differenz zwischen dem ersten Fehlersignal [sl(p)] und einem zweiten gewichteten Signal [s2(p)] ist, das man dadurch erhält, daß man ein Nullsignal einer ersten langfristigen Synthesefilterung unterwirft und mit der Gewichtungsfunktion das aus der Synthesefilterung resultierende Signal gewichtet, wobei man die erste langfristige Synthesefilterung durchführt, indem man aufeinanderfolgend alle möglichen Werte (m) der Nacheilung der langfristigen Analyse verwendet und für jeden von ihnen einen entsprechenden Optimalwert [b(m)] der Verstärkung der langfristigen Analyse verwendet; und daß man durch Bestimmung· der Erregung die Energie eines dritten Fehlersignals [s5(p)] minimalisiert, das die Differenz zwischen dem ersten Fehlersignal und einem dritten gewichteten Signal [s4(p)] ist, welches man durch Gewichten mit der Gewichtungsfunktion [l/A (z, ^ )] eines Signals erhält, das die Summe eines Erregungsvektors [e(i)], der vom betreffenden Skalenfaktor (g) gewichtet ist, und eines weiteren Signals ist, das man dadurch erhält, daß man ein Nullsignal einer zweiten langfristigen Synthesefilterung unterwirft, bei der die verwendete Nacheilung der Optimalwert (M) der Nacheilung der langfristigen Analyse und die Verstärkung eine optimale Verstärkung der langfristigen Analyse für diesen Vektor ist.
11. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß man zum Bestimmen des Optimalwerts (M) der Nacheilung der langfristigen Analyse die Energie eines vierten Fehlersignals [s7(p)] minimalisiert, wobei dieses Signal die Differenz zwischen dem ersten Fehlersignal [sl(p)] und einem vierten
gewichteten Signal [s6(p)] ist, das man dadurch erhält, daß man ein Nullsignal einer dritten langfristigen Synthesefilterung unterwirft, bei der alle möglichen Werte (m) der Nacheilung der langfristigen Analyse aufeinanderfolgend in Kombination mit einer Einheitsverstärkung verwendet werden und das aus der Synthesefilterung resultierende Signal mit der Gewichtungsfunktion gewichtet und das aus der Gewichtung resultierende Signal (ti) mit einem Wert [b(m)] der Verstärkung der langfristigen Analyse, der den Optimalwert für diese Nacheilung darstellt, multipliziert; und daß man für die Bestimmung der Erregung die Energie eines fünften Fehlersignals [s9(p)] minimalisiert, das man dadurch erhält, daß man ein viertes gewichtetes Signal [s8(p)] von einem weiteren Signal subtrahiert, wobei das vierte gewichtete Signal erhalten wird durch Gewichtung aller möglichen Erregungsvektoren e(i) mit der Gewichtungs funktion [1/A(z,^ )] und durch Multiplizieren jedes gewichteten Vektors mit einem Wert [g(i)] des Skalenfaktors, der den Optimalwert für diesen Vektor darstellt, und das weitere Signal aus dem vierten Fehlersignal [s7(p)] besteht, wenn der Optimalwert (M) der Nacheilung. der langfristigen Analyse und ein Wert der Verstärkung der langfristigen Analyse, die den Optimalwert für diesen Vektor darstellt, bei der dritten langfristigen Synthesefilterung verwendet werden".
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die Werte des Skalenfaktors in Bezug zum Maximum oder Mittelwert dieses Faktors innerhalb eines Rahmens normalisiert werden und daß in jedem Rahmen dieses Maximum oder dieser Mittelwert so optimiert wird, daß die Energie des fünften Fehlersignals [s9(p)] minimalisiert wird.
13. Verfahren nach einem der Ansprüche 8 bis 12, dadurch gekennzeichnet, daß man das Erregungs-Vektor-Codebuch erzeugt, indem man von einer beschränkten Zahl von Schlüsselvektoren ausgeht, die aus einer Kombination von Abtastwerten mit Einheitsamplitude bestehen, die jeweils für einen anderen Abtastzeitpunkt relevant sind, wobei die Anzahl der zur
Erzeugung dieser Paare verwendbaren Abtastwerte nicht höher ist als die Anzahl der Abtastwerte, die einen Codebuchvektor bilden.
14. Vorrichtung zum Codieren breitbandiger Audiosignale, mit einer Einrichtung (CMO) zum Abtasten des zu codierenden Signals mit einer ersten Frequenz, die ein Vielfaches der Maximalfrequenz dieses Signals ist, Einrichtungen (FQl, FQ2) zum Filtern des abgetasteten Signals so, daß sein Band in aneinander angrenzende Teilbänder aufgeteilt wird, Einrichtungen (CMl, CM2) zum Abtasten der Signale jedes Teilbands mit der betreffenden Nyquist-Frequenz, Codierern (CDI, CD2) zum digitalen Codieren der abgetasteten Signale jedes Teilbands und einer Einrichtung (MX) zum Senden der sich auf die einzelnen Teilbänder beziehenden codierten Signale gegebenenfalls in Verbindung mit Nicht-Audio-Signalen, die ebenfalls in digitaler Form codiert sind, auf eine übertragungsleitung (109), dadurch gekennzeichnet, daß jeder Codierer (CDI, CD2) ein Codierer mit Analyse durch Synthese ist, der Einrichtungen (STA, LTA, LTAl) für kurzfristige Analyse und für langfristige Analyse des zu codierenden Signals umfaßt.
15. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, daß der Codierer (CDI, CD2), der sich auf wenigstens eines der Teilbänder bezieht, ein auf einer linearen Vorhersagecodierung mit Multiimpulserregung basierender Codierer ist, in dem die Einrichtung (LTA) für die langfristige Analyse die Nacheilung (M) bestimmt, die einen gegenwärtigen Abtastwert von einem zur Verarbeitung des gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt, und die Verstärkung (B) bestimmt, mit der der vorhergehende Abtastwert in zwei aufeinanderfolgenden Stufen gewichtet wird, die beide einem Schritt vorausgehen, bei dem die Amplituden und Positionen der Erregungsimpulse durch einen Erregungsgenerator (EG) bestimmt werden, und in dem die Einrichtung (STA) für die kurzfristige Analyse mit einer Schaltung (VQ) für die Vektorquantisierung mit geteiltem Codebuch benachbarter
•Spektrumslinienpaare oder von Differenzen zwischen benachbarten Spektrumslinien, die eine Darstellung linearer Vorhersagekoeffizienten bilden, die als Ergebnis der kurzfristigen Analyse erhalten werden, verbunden ist.
16. Vorrichtung nach Anspruch 14, dadurch gekennzeichnet, daß der Codierer (CDI, CD2), der sich auf wenigstens eines der Teilbänder bezieht, ein auf der linearen Vorhersagetechnik mit Codebucherregung basierender Codierer ist, in dem die Einrichtung (LTAl) für die langfristige Analyse die Nacheilung (M) bestimmt, die einen gegenwärtigen Abtastwert von einem zur Bestimmung des gegenwärtigen Abtastwerts verwendeten vorhergehenden Abtastwert trennt, und zwar in einem ersten Betriebsschritt, der einem Schritt vorausgeht, in dem ein Erregungsgenerator (EGl) ein optimales Erregungsmodell bestimmt, das aus dem optimalen Wert der Verstärkung (B), mit der dieser vorhergehende Abtastwert gewichtet wird, aus einer Folge von Vektoren, die aus dem Erregungs-Codebuch ausgewählt sind, und aus dem betreffenden Skalenfaktor besteht, wobei die Verstärkung, die Erregungsvektoren und der Skalenfaktor gemeinsam b.estimmt werden, und daß die Einrichtung (STA) für die kurzfristige Analyse mit einer Schaltung (VQ) für die Vektorquantisierung mit geteiltem Codebuch benachbarter Spektrumslinienpaare oder von Differenzen zwischen benachbarten Spektrumslinien, die als Darstellung linearer Vorhersagecoeffizienten erhalten werden, welche durch die kurzfristige Analyse bestimmt sind, verbunden sind.
17. Vorrichtung nach Anspruch 16, dadurch gekennzeichnet, daß die Einrichtung (LTAl) für die langfristige Analyse ein erstes Gewichtungsfilter (F5), das den gegebenen Beitrag [sO(p)] zur Analyse und Synthese, die sich auf einen gegenwärtigen Rahmen aufgrund der vorher durchgeführten Analysen und Synthesen bezieht, durch Gewichten eines Nullsignals mit einer Gewichtungsfunktion [1/A(z,y ).] in Abhängigkeit von den linearen Vorhersagekoeffizienten, die nach der Vektorquantisierung rekonstruiert sind, und einen ersten Addierer (SM3) umfaßt, der diesen Beitrag von einem ersten gewichteten Signal
[sw(p)], das von der spektralen Formung des Eingangssignals des Codierers (CDI, CD2) erhalten wird, subtrahiert und ein erstes Fehlersignal [sl(p)] liefert, das zumindest zur Bestimmung der Nacheilung (M) der langfristigen Analyse dient.
18. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, daß die Einrichtung (LTAl) für die langfristige Analyse weiterhin folgende Teile umfaßt:
ein erstes langfristiges Synthesefilter (LTP4), das mit einem Nullsignal gespeist ist, eine Transferfunktion in Abhängigkeit von der Nacheilung und Verstärkung der langfristigen Analyse aufweist und aufeinanderfolgend alle möglichen Nacheilungswerte und für jeden von ihnen einen Verstärkungswert [b(m)], der den Optimalwert für diese Nacheilung darstellt, aufweist;
ein zweites Gewichtungsfilter (F6), das mit dem Ausgang des langfristigen Synthesefilters (LTP4) verbunden ist und als Transferfunktion die Gewichtungsfunktion hat;
einen zweiten Addierer (SM4), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Gewichtungsfilters (F6) empfängt und ein zweites Fehlersignal [s3(p)] abgibt, das die Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist; eine zweite Verarbeitungseinheit (CMBl), die aufeinanderfolgend das Synthesefilter (LTP4) mit allen möglichen Werten (m) der Nacheilung der langfristigen Analyse beliefert, das zweite Fehlersignal empfängt und den Wert der Nacheilung, der dessen Energie minimalisiert und die optimale Nacheilung (M) bildet, bestimmt, wobei die Verarbeitungseinheit bei jedem neuen Wert der Nacheilung den Speicher des zweiten Gewichtungsfilters (F6) zurückstellt;
und daß die Einrichtung (EGl) zum Bestimmen des optimalen Erregungsmodells folgende Teile umfaßt:
ein zweites langfristiges Synthesefilter (LTP5), das mit einem Nullsignal gespeist ist, eine Transferfunktion
analog der des ersten Synthesefilters (LTP4) aufweist und den optimalen Nacheilungswert (M) und den Wert [b(i)] der Verstärkung, der der Optimalwert für einen gegebenen Erregungsvektor [e(i)] ist, verwendet;
einen dritten Addierer (SM5), der das Ausgangssignal des dritten Synthesefilters (LTP5) und das Ausgangssignal eines ersten Multiplizierers (Ml), der einen Erregungsvektor mit einem entsprechenden Skalenfaktor multipliziert , addiert;
ein drittes Gewichtungsfilter (F7), das mit dem Ausgang des dritten Addierers (SM5) verbunden ist und als Transferfunktion die Gewichtungsfunktion [1/A(z,y)] hat; einen vierten Addierer (SM6), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal [s4(p)] des dritten Gewichtungsfilters (F7) empfängt und ein drittes Fehlersignal [s5(p)] abgibt, das die Differenz zwischen den an seinem ersten und zweiten Eingang anliegenden Signalen ist;
eine zweite Verarbeitungseinheit (CEl), die das zweite Synthesefilter (LTP5) mit dem Verstärkungswert [b(i)] und den ersten Multiplizierer (Ml) mit den Vektoren und Skalenfaktoren speist, das dritte Fehlersignal [s5(p)] empfängt und die Kombination von Verstärkung (B), Erregungsvektoren und jeweiligen Skalenfaktoren, die das optimale Erregungsmodell durch Minimierung der Energie des dritten Fehlersignals bilden, bestimmt und außerdem bei jeder neuen Kombination von Verstärkung, Vektor und Skalenfaktor die Speicher des dritten Gewichtungsfilters (F7) zurückstellt.
19. Vorrichtung nach Anspruch 17, dadurch gekennzeichnet, daß die Einrichtung (LTAl) für die langfristige Analyse weiterhin folgende Teile umfaßt:
ein drittes langfristiges Synthesefilter (LTP6), das eine Transferfunktion in Abhängigkeit von der Nacheilung der langfristigen Analyse aufweist, mit einem Nullsignal gespeist ist und während der Bestimmung der optimalen Nacheilung der langfristigen Analyse aufeinanderfolgend
alle möglichen Nacheilungswerte verwendet, wobei sie während der Bestimmung des optimalen Erregungsmodells den optimalen Nacheilungswert verwendet;
ein viertes Gewichtungsfilter (F8), das mit dem Ausgang des dritten langfristigen Synthesefilters (LTP2) verbunden ist und als Transferfunktion die Gewichtungsfunktion hat;
einen zweiten Multiplizierer (M2), der mit dem Ausgang des vierten Gewichtungsfilters (F8) verbunden ist und während der Bestimmung der optimalen Nacheilung der langfristigen Analyse für jeden Nacheilungswert, der im dritten Synthesefilter (LTP6) verwendet wird, das Ausgangssignal (ti) des vierten Gewichtungsfilters (F8) mit einem Wert [b(m)] der Verstärkung der langfristigen Analyse, der der Maximalwert für diese Nacheilung ist, multipliziert, wobei er während der Bestimmung des optimalen Erregungsmodells das Ausgangssignal des vierten Filters (F8) mit dem Wert [b(i)] der Verstärkung der langfristigen Analyse, die der Optimalwert für einen gegebenen Erregungsvektor ist, multipliziert;
einen fünften Addierer (SM7), der an einem ersten Eingang das erste Fehlersignal [sl(p)] und an einem zweiten Eingang das Ausgangssignal des zweiten Multiplizierers (M2) empfängt und ein viertes Fehlersignal [s7(p)] abgibt, das aus der Differenz zwischen den an seinem ersten und an seinem zweiten Eingang anliegenden Signalen ist;
eine dritte Verarbeitungseinheit (CMB2), die aufeinanderfolgend das dritte Synthesefilter (LTP6) mit allen möglichen Werten (m) der Nacheilung der langfristigen Analyse speist, wobei sie bei jedem neuen Wert den Speicher des vierten Gewichtungsfilters (F8) zurückstellt und während der Bestimmung der optimalen Nacheilung den zweiten Multiplizierer (M2) mit den Werten der Verstärkung [b(m)] beliefert, das vierte Fehlersignal empfängt und den Nacheilungswert bestimmt, der die Energie des vierten Fehlersignals minimalisiert und die optimale Nacheilung (M) bildet;
und daß die Einrichtung (EGl) zum Bestimmen der optimalen Verstärkung (B) der langfristigen Analyse, des Vektors e(i) und ihrer jeweiligen Skalenfaktoren (g), die das optimale Erregungsmodell bilden, folgende Teile umfaßt:
ein fünftes Gewichtungsfilter (F9), das mit den Erregungsvektoren gespeist ist und als Transferfunktion die Gewichtungsfunktion hat;
einen dritten Multiplizierer (M3), der mit dem Ausgang des fünften Gewichtungsfilters (F9) verbunden ist und für jeden Vektor, den er diesem fünften Gewichtungsfilter lierfert, das Ausgangssignal des Filters (F9) mit einem optimalen Skalenfaktor multipliziert; einen fünften Addierer (SM8), der an einem ersten Eingang das vierte Fehlersignal [s7(p)] und an einem zweiten Eingang das Ausgangssignal [s8(p)] des fünften Gewichtungsfilters (F9) empfängt und ein fünftes Fehlersignal [s9(p)] erzeugt, das aus der Differenz zwischen den am ersten und am zweiten Eingang vorhandenen Signalen besteht;
eine vierte Verarbeitungseinheit (CE2), die das fünfte Gewichtrungsfilter (F9) mit den Erregungsvektoren, den dritten Multiplizierer (M3) mit dem optimalen Skalenfaktor für jeden vom fünften Gewichtungsfilter (F9) gelieferten Vektor und den zweiten Multiplizierer (M2) mit der optimalen Verstärkung der langfristigen Analyse für diesen Vektor beliefert, das fünfte Fehlersignal [s9(p)] empfängt und die Kombination von Verstärkung (B) der langfristigen Analyse, Erregungsvektoren und jeweilige Skalenfaktoren bestimmt, die das optimale Erregungsmodell bildet, indem sie die Energie des fünften Fehlersignals [s9(p)] minimalisiert, wobei die vierte Verarbeitungseinheit die Speicher des fünften Gewichtungsfilters (F9) bei jeder neuen Kombination von Vektor, Skalenfaktor und Verstärkung der langfristigen Analyse zurückstellt.
DE199090108332T 1989-05-03 1990-05-02 System zur codierung von breitbandaudiosignalen. Pending DE396121T1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT8967317A IT1232084B (it) 1989-05-03 1989-05-03 Sistema di codifica per segnali audio a banda allargata

Publications (1)

Publication Number Publication Date
DE396121T1 true DE396121T1 (de) 1991-03-21

Family

ID=11301410

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69028434T Expired - Lifetime DE69028434T2 (de) 1989-05-03 1990-05-02 System zur Codierung von Breitbandaudiosignalen
DE199090108332T Pending DE396121T1 (de) 1989-05-03 1990-05-02 System zur codierung von breitbandaudiosignalen.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69028434T Expired - Lifetime DE69028434T2 (de) 1989-05-03 1990-05-02 System zur Codierung von Breitbandaudiosignalen

Country Status (4)

Country Link
EP (1) EP0396121B1 (de)
CA (1) CA2016042C (de)
DE (2) DE69028434T2 (de)
IT (1) IT1232084B (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
EP0910064B1 (de) * 1991-02-26 2002-12-18 Nec Corporation Sprachparameterkodierungsvorrichtung
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5506908A (en) * 1994-06-30 1996-04-09 At&T Corp. Directional microphone system
JPH09506478A (ja) * 1994-10-06 1997-06-24 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 光放射半導体ダイオード及びこのようなダイオードの製造方法
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
TW321810B (de) * 1995-10-26 1997-12-01 Sony Co Ltd
FI114248B (fi) 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
JP3199020B2 (ja) 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
WO2006030340A2 (en) * 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
MY153562A (en) * 2008-07-11 2015-02-27 Fraunhofer Ges Forschung Method and discriminator for classifying different segments of a signal

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
EP0111612B1 (de) * 1982-11-26 1987-06-24 International Business Machines Corporation Verfahren und Einrichtung zur Kodierung eines Sprachsignals
DE3688980T2 (de) * 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.

Also Published As

Publication number Publication date
CA2016042A1 (en) 1990-11-03
DE69028434D1 (de) 1996-10-17
EP0396121A1 (de) 1990-11-07
EP0396121B1 (de) 1996-09-11
IT1232084B (it) 1992-01-23
DE69028434T2 (de) 1997-02-20
IT8967317A0 (it) 1989-05-03
CA2016042C (en) 1998-04-28

Similar Documents

Publication Publication Date Title
DE3883519T2 (de) Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten.
DE396121T1 (de) System zur codierung von breitbandaudiosignalen.
DE69603743T2 (de) Verfahren und gerät zum kodieren, behandeln und dekodieren von audiosignalen
DE2934489C2 (de)
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE3853161T2 (de) Vektorquantisierungscodierer.
DE3784942T2 (de) Duplex-datenuebertragung.
DE69529672T2 (de) System zur sprachkodierung
DE69614782T2 (de) Verfahren und Einrichtung zur Wiedergabe von Sprachsignalen und Verfahren zu seiner Übertragung
DE69731588T2 (de) Coderienrichtung mit verringerter komplexität für ein signalübertragungssystem
DE69828725T2 (de) Sprachcodier- und -decodiersystem
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE19647298C2 (de) Kodiersystem
DE69121411T2 (de) Methode und gerät zur codierung von analogen signalen
DE69013738T2 (de) Einrichtung zur Sprachcodierung.
DE582921T1 (de) Kodierer von Tonsignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken.
DE19742655C2 (de) Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
EP1280138A1 (de) Verfahren zur Analyse von Audiosignalen
DE69128407T2 (de) Verfahren und Einrichtung zur Übertragung mit niedriger Bitrate eines Sprachsignals mittels CELP-Codierung
DE69618408T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE69017842T2 (de) Verfahren und Einrichtung zur Codierung von Prädiktionsfiltern in Vocodern mit sehr niedriger Datenrate.
DE68917584T2 (de) Zur Sprachqualitätsverbesserung geeignetes Kodiergerät unter Anwendung einer Doppelanlage zur Pulserzeugung.
DE186763T1 (de) Verfahren und einrichtung zur kodierung und dekodierung von sprachsignalen durch vektorquantisierung.
DE69128582T2 (de) Methode zur Phonemunterscheidung