DE19804584A1 - Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen - Google Patents

Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen

Info

Publication number
DE19804584A1
DE19804584A1 DE1998104584 DE19804584A DE19804584A1 DE 19804584 A1 DE19804584 A1 DE 19804584A1 DE 1998104584 DE1998104584 DE 1998104584 DE 19804584 A DE19804584 A DE 19804584A DE 19804584 A1 DE19804584 A1 DE 19804584A1
Authority
DE
Germany
Prior art keywords
spectral
value
values
prediction
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1998104584
Other languages
English (en)
Inventor
Lin Yin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of DE19804584A1 publication Critical patent/DE19804584A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Description

Die Erfindung betrifft Verfahren zum Codieren und Decodieren elektronischer Signale, und sie betrifft Vorrichtungen zum Ausführen solcher Verfahren.
Es ist wohlbekannt, daß die Übertragung von Daten in digi­ taler Form für erhöhte Signal/Rauschsignal-Verhältnisse und erhöhte Informationskapazitäten entlang einem Übertragungs­ kanal sorgt. Es existiert jedoch dauernd der Wunsch, die Ka­ nalkapazität durch noch stärkeres Komprimieren digitaler Si­ gnale weiter zu erhöhen. Im Hinblick auf Audiosignale werden herkömmlich zwei Kompressions-Grundprinzipien verwendet. Zum ersten gehört es, statistische oder determinierte Redundan­ zen im Quellensignal zu beseitigen, während es zum zweiten gehört, im Quellensignal Elemente zu unterdrücken oder zu beseitigen, die insoweit redundant sind, als es das mensch­ liche Wahrnehmungsvermögen betrifft. In jüngerer Zeit wurde das letztere Prinzip bei Audioanwendungen hoher Qualität vorherrschend, und zu ihm gehört es typischerweise, ein Audiosignal in Frequenzkomponenten (manchmal als "Subbänder" bezeichnet) zu unterteilen, von denen jedes mit einer Quan­ tisierungsgenauigkeit analysiert und quantisiert wird, die so bestimmt ist, daß Datenirrelevanz (bezogen auf den Hö­ rer) beseitigt wird. Der Audiocodierungsstandard ISO (Inter­ national Standards Organisation) MPEG (Moving Pictures Ex­ pert Group) sowie andere Audiocodierungsstandards verwenden dieses Prinzip und definieren es detailliert. Jedoch verwen­ den MPEG (und andere Standards) auch eine Technik, die als "adaptive Vorhersage" bekannt ist, um die Datenrate weiter zu verringern.
Eine spezielle Form adaptiver Vorhersage ist als "adaptive Gittervorhersage in Rückwärtsrichtung" bekannt. Ein Algo­ rithmus hierfür ist von Fuchs et al. in "Improving MPEG Audio coding by Backward Adaptive Linear Stereo Prediction", AES Convention, New York, Preprint 4086, Oktober 1995 be­ schrieben. Für jeden spektralen Wert (der "aktuelle" Wert) jeder Frequenzkomponente erzeugt adaptive Gittervorhersage in Rückwärtsrichtung einen Satz von Vorhersagekoeffizienten im Codierer aus den zuvor berechneten spektralen Werten die­ ser Komponente (über eine Zwischenberechnung quantisierter spektraler Werte). Diese Koeffizienten werden dann dazu ver­ wendet, den aktuellen spektralen Wert vorherzusagen. Die Ab­ weichung zwischen dem aktuellen spektralen Wert und dem vor­ hergesagten spektralen Wert wird bestimmt, und dieser Abwei­ chungswert (nach der Quantisierung) wird an den Empfänger übertragen. Es ist ersichtlich, daß zu jedem vorgegebenen Zeitpunkt die aktuellen Vorhersagekoeffizienten tatsächlich aus allen zuvor empfangenen Abtastwerten hergeleitet sind. Im Empfänger werden die Koeffizienten auf ähnliche Weise be­ rechnet, und wiederhergestellte spektrale Werte werden da­ durch erhalten, daß die vorhergesagten spektralen Werte mit den empfangenen Abweichungswerten kombiniert werden.
Bei bestimmten Algorithmen, die adaptive Vorhersage in Rück­ wärtsrichtung verwenden, tritt häufig der Fall auf, daß während des Kompressionsprozesses ein Maß für die erzielte Kompression bestimmt wird und die Abweichungswerte nur dann geliefert werden, wenn ein positiver Kompressionsgewinn er­ zielt ist. Falls nicht, werden statt dessen die tatsächli­ chen quantisierten Frequenzkomponentensignale übertragen.
Der neue Standard MPEG-2 AAC verwendet psychoakustische Mo­ dellbildung und adaptive, lineare Vorhersage in Rückwärts­ richtung mit 1024 Frequenzkomponenten. Es ist ins Auge ge­ faßt, daß der neue Standard MPEG-4 VM ähnliche Erforder­ nisse aufweist. Jedoch führt eine derartig große Zahl von Frequenzkomponenten wegen der Kompliziertheit des Vorhersa­ gealgorithmus zu einem großen Berechnungsoverhead, und es müssen auch große Speichergebiete zur Verfügung stehen, um die berechneten Koeffizienten einzuspeichern. Außerdem muß der Decodierer bei adaptiver Gittervorhersage in Rückwärts­ richtung selbst dann, wenn die Vorhersageeinrichtungen "ab­ geschaltet" sind (z. B. dann, wenn aus der Kompression kein Vorteil durch das Übertragung der Abweichungswerte erzielt werden kann), damit fortfahren, die Koeffizienten zu bestim­ men, so daß die Vorhersageeinrichtungen erneut bei Bedarf ohne jede zeitliche Funktionsbeeinträchtigung wieder "einge­ schaltet" werden können. Dies sorgt für einen zusätzlichen Berechnungsoverhead.
Der Erfindung liegt die Aufgabe zugrunde, Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen zu schaffen, mit denen es möglich ist, diesen Berechnungs­ overhead zu vermeiden.
Diese Aufgabe ist hinsichtlich des Codierungsverfahrens durch den beigefügten Anspruch 1, hinsichtlich des Decodie­ rungsverfahrens durch den beigefügten Anspruch 11, hinsicht­ lich der Codierungsvorrichtung durch den beigefügten An­ spruch 12 sowie hinsichtlich der Decodierungsvorrichtung durch den beigefügten Anspruch 13 gelöst.
Die Erfindung nutzt einen Algorithmus für adaptive Vorhersa­ ge in Rückwärtsrichtung, der auf eine relativ große Anzahl von Frequenzkomponenten eines zu codierenden Audiosignals einwirkt und Vorhersagekoeffizienten für eine Komponente aus einer vorbestimmten Anzahl zuvor empfangener Abtastwerte dieser Komponente berechnet.
Beim erfindungsgemäßen Verfahren wird nicht unmittelbar ein Satz von Vorhersagekoeffizienten aus allen vorangegangenen spektralen Komponenten berechnet, wie dies bei den herkömm­ lichen Algorithmen für adaptive Vorhersage in Rückwärtsrich­ tung der Fall ist. D. h., daß die Vorhersagekoeffizienten für jeden spektralen Wert neu berechnet werden und sie nicht lediglich aus dem zuvor berechneten Satz adaptiert werden. Demgemäß besteht in Perioden, in denen die Vorhersageein­ richtung abgeschaltet ist, kein Erfordernis, mit dem Aktua­ lisieren der Koeffizienten im Decodierer fortzufahren.
Es wurde herausgefunden, daß zwar Algorithmen für adaptive Vorhersage in Rückwärtsrichtung, die Vorhersagekoeffizienten aus den Kovarianzen einer vorbestimmten Anzahl voriger spek­ traler Werte berechnen, im allgemeinen nicht zum Codieren von Audiosignalen geeignet sind, die in eine relativ kleine Anzahl von Frequenz-Subbändern (z. B. 32) unterteilt sind, daß derartige Vorhersagealgorithinen jedoch zweckdienlich sind, wenn ein Audiosignal in eine relativ große Anzahl von Frequenz-Subbändern (z. B. 1024, wie durch den Entwurf zum Standard MPEG-4 definiert) unterteilt ist. Dies, da dann, wenn eine große Anzahl von Subbändern definiert ist, die Ordnung des Vorhersagealgorithmus (d. h. die Anzahl der Vor­ hersagekoeffizienten) niedrig sein kann, und die Erfindung realisierende Algorithmen zeigen hohes Funktionsvermögen und sind bei niedrigen Ordnungen berechnungsmäßig wirkungsvoll. Vorzugsweise hat die Vorhersageordnung den Wert Eins oder Zwei. Bevorzugter hat die Vorhersageordnung den Wert Zwei.
Bevorzugt wird die genannte vorbestimmte Anzahl zuvor emp­ fangener, aufeinanderfolgender spektraler Werte dazu verwen­ det, eine entsprechende Anzahl quantisierter spektraler Wer­ te herzuleiten. Es handelt sich um die quantisierten Werte, die dann dazu verwendet werden, die Vorhersagekoeffizienten zu berechnen.
Vorzugsweise überlappen die dem Audiosignal entnommenen Zeitfenster. Z. B. kann jedes Fenster 2048 Abtastpunkte bei einer Überlappung mit einem benachbarten Fenster von 50% enthalten. Jedoch können die Fenster auch zusammenhängend angeordnet sein.
Bei bestimmten Ausführungsformen der Erfindung kann ein neu­ er Satz von Vorhersagekoeffizienten für jeden einzelnen spektralen Wert berechnet werden. Jedoch kann es bei anderen Ausführungsformen berechnungsmäßig wirkungsvoller sein, die Vorhersagekoeffizienten nur für jeden zweiten oder dritten (oder ein anderes ganzzahliges Vielfaches) spektralen Wert erneut zu berechnen und dieselben Koeffizienten für mehrere aufeinanderfolgende spektrale Werte zu verwenden. Es kann auch zweckdienlich sein, für ein Umschalten zwischen einer niedrigen Koeffizienten-Aktualisierungsrate (z. B. für einen Wert pro Sekunde) und ein hoher Aktualisierungsrate (z. B. für jeden spektralen Wert) unmittelbar nach Erkennung eines Übergangs im Audiosignal zu sorgen.
Die Untergrenze der vorbestimmten Anzahl zuvor empfangener Abtastpunkte, wie dazu verwendet, jeden der Vorhersagekoef­ fizienten zu berechnen, ist durch die erforderliche Codie­ rungsqualität bestimmt. Vorzugsweise beträgt die Zahl jedoch vier oder mehr. Die Obergrenze dieser Zahl ist durch Spei­ cher- und Rechnerbeschränkungen bestimmt. Vorzugsweise be­ trägt die Zahl zehn oder weniger. Bevorzugter hat die vorbe­ stimmte Zahl den Wert sechs.
Es kann jedes geeignete Verfahren zum Berechnen der Vorher­ sagekoeffizienten verwendet werden, z. B. ein Autokorrela­ tionsverfahren. Jedoch zeigte es sich, daß das Verfahren mit dem kleinsten Fehlerquadrat besonders vorteilhaft ist.
Vorzugsweise sind die Vorhersagekoeffizienten, die dazu ver­ wendet werden, vorhergesagte spektrale Werte zu berechnen, Koeffizienten aus linearer Vorhersage.
Es ist zu beachten, daß die Erfindung zur Verwendung mit psychoakustischer Kompensation vorgesehen ist und daß die Quantisierung der Abweichungssignale entsprechend gesteuert werden kann.
Beim Verfahren gemäß Anspruch 11 bestimmen die speziellen Realisierungsdetails des Codierungsverfahrens stark die Realisierungseinzelheiten des Decodierungsverfahrens, z. B. die Vorhersageordnung.
Für ein besseres Verständnis der Erfindung, und um anzuge­ ben, wie dieselbe ausgeführt werden kann, wird nun beispiel­ haft auf die beigefügten Zeichnungen Bezug genommen.
Fig. 1 zeigt schematisch eine Vorrichtung zum Codieren eines Audiosignals unter Verwendung adaptiver Vorhersage in Rückwärtsrichtung gemäß einem Ausführungsbeispiel der Erfin­ dung;
Fig. 2 zeigt schematisch eine Vorrichtung zum Decodieren eines Audiosignals, das mit der Vorrichtung gemäß Fig. 1 codiert wurde; und
Fig. 3 zeigt ein Mobiltelephon, das die Vorrichtungen der Fig. 1 und 2 enthält.
Gemäß Fig. 1 wird ein zu codierendes Impulscode-moduliertes (PCM) Audio-Eingangssignal g(t) an den Eingang einer ersten Signalverarbeitungseinheit 1 einer Codiervorrichtung gege­ ben. Diese erste Einheit 1 ist so ausgebildet, daß sie das Eingangssignal g(t) auf Rahmenbasis von der Zeit- in die Frequenzdomäne transformiert, wobei jeder Rahmen n aus 2048 Abtastwerten besteht und benachbarte Rahmen eine Überlappung von 50% aufweisen. Genauer gesagt, verwendet die Einheit 1 eine modifizierte, diskrete Cosinustransformation (MDCT) zum Transformieren des Signals in die Frequenzdomäne, so daß das Ausgangssignal der Einheit 1 aus 1024 gesonderten Strö­ men spektraler Werte xj(n) besteht, wobei jeder Strom j einer anderen spektralen Komponente entspricht. Es wird dar­ auf hingewiesen, daß andere Transformationsverfahren ver­ wendet werden können, z. B. Fouriertransformation.
Jeder Strom von Datenwerten xj(n) wird an den entsprechenden Eingang einer Vorhersageeinrichtung 2 für adaptive Vorhersa­ ge in Rückwärtsrichtung gegeben, deren Funktion unten im einzelnen beschrieben ist. Allgemein gesagt, berechnet die Vorhersageeinrichtung 2 für jeden spektralen Wert xj(n) ei­ nen Satz von Vorhersagekoeffizienten aj(n) unter Verwendung nachfolgend hergeleiteter, rekonstruierter, quantisierter spektraler Werte, die ihrerseits aus zuvor empfangenen spek­ tralen Werten dieses Stroms hergeleitet werden. Die Vorher­ sagekoeffizienten werden ihrerseits dazu verwendet, einen Abweichungswert ej(n) für den spektralen Wert zu berechnen. Die Abweichungswerte für jeden Strom werden an den Eingang eines Quantisierers 3 gegeben, der so ausgebildet ist, daß er quantisierte Abweichungen j(n) für anschließende digi­ tale Übertragung erzeugt. Die quantisierten Abweichungen j(n) werden an einen Multiplexer 4 geliefert, der ein Ab­ weichungs-Multiplexsignal 9 zur Übertragung erzeugt, und sie werden auch an die Vorhersageeinrichtung 2 zurückgeführt.
Es ist auch eine weitere Signalverarbeitungseinheit 5 vor­ handen, um den Betrieb der Signalverarbeitungseinheit 1 und des Quantisierers 3 abhängig von der psychoakustischen Cha­ rakteristik des Eingangs-Audiosignals g(t) zu steuern. Der Betrieb dieser Einheit ist herkömmlich und wird hier nicht im einzelnen beschrieben.
Für jede spektrale Komponente j sind x(n), (n) und (n) das Eingangsignal für die Vorhersageeinrichtung 2, das Aus­ gangssignal derselben bzw. ein wiederhergestelltes quanti­ siertes Signal, und e(n) und (n) sind ein Vorhersage-Ab­ weichungssignal bzw. ein quantisiertes Vorhersage-Abwei­ chungssignal. Der Satz von Vorhersagekoeffizienten kann wie folgt repräsentiert werden:
a(n)=[a1(n),a2(n), . . ., aP(n)]T
wobei diese Größe zeitabhängig ist und wobei der hochge­ stellte Wert T die Transponierte repräsentiert. Das Aus­ gangssignal der Vorhersageeinrichtung 2, nämlich x(n), wird wie folgt berechnet:
mit
wobei P die Vorhersageordnung ist, d. h. die Anzahl von Ko­ effizienten. Die Vorhersageordnung ist:
und das wiederhergestellte quantisierte Signal ist
Die Berechnung der Vorhersagekoeffizienten beruht auf einer Minimierung der Vorhersageabweichung gemäß dem mittleren Fehlerquadrat. a(n) kann wie folgt ausgedrückt werden:
wobei E den Erwartungswert repräsentiert.
Es ist zu beachten, daß dann, wenn einmal die Autokorrela­ tionsfunktionen r(n) erhalten sind, die linearen Vorhersage­ werte durch Lösen der Normalengleichung erhalten werden kön­ nen. Jedoch wird hier ein Algorithmus mit kleinstem Fehler­ quadrat angegeben, um die linearen Vorhersagekoeffizienten für jeden Abtastwert einzeln abzuschätzen. Das Verfahren mit dem kleinsten Fehlerquadrat führt häufig zu einer besseren Abschätzung eines Koeffizienten aus linearer Vorhersage als das Autokorrelationsverfahren, insbesondere dann, wenn die Anzahl verfügbarer Daten klein ist. Nachfolgend wird ge­ zeigt, daß dann, wenn die Ordnung der Vorhersageeinrichtung niedrig ist, insbesondere nur zwei, die Kompliziertheit des Algorithmus mit kleinstem Fehlerquadrat vergleichbar derje­ nigen des bekannten Algorithmus mit adaptiver Gittervorher­ sage oder kleiner ist.
Es sei erneut angenommen, daß das wiederhergestellte quan­ tisierte Signal mit (n) bezeichnet ist. Für eine Vorher­ sageordnung von zwei und eine Blocklänge L werden die Kova­ rianzen des wiederhergestellten Signals wie folgt berechnet:
Ein wirkungsvoller Algorithmus wäre
Mit diesen Kovarianzen können die zwei Koeffizienten der li­ nearen Vorhersage wie folgt berechnet werden:
Es ist zu beachten, daß die Koeffizienten der linearen Vor­ hersage aus einer vorbestimmten oder festgelegten, relativ kleinen Anzahl voriger spektraler Werte hergeleitet werden. Die Berechnung der Koeffizienten hängt nicht von jedem zuvor empfangenen spektralen Wert ab.
Um die Robustheit der adaptiven Vorhersage in Rückwärtsrich­ tung gegenüber Kanalfehlern und zahlenmäßigen Rundungsfeh­ lern zu verbessern, kann nach dem Erhalten der Koeffizienten für lineare Vorhersage eine Bandbreitenexpansion ausgeführt werden. Die durch die obigen Gleichungen berechneten Koeffi­ zienten für lineare Vorhersage seien ai, i = 0, 1, 2, mit a0 = 1. Die Bandbreiten-Expansionsoperation ersetzt jeden Wert ai durch γiai, wobei γ eine Konstante ist, die gering­ fügig kleiner als eins ist.
Wie es aus dem vorigen Abschnitt erkennbar ist, werden die Kovarianzfunktionen für jeden Abtastwert aktualisiert. Dem­ gemäß können die Koeffizienten für lineare Vorhersage eben­ falls für jeden Abtastwert einzeln durch Lösen der Normalen­ gleichung erhalten werden. Um jedoch Rechenaufwand einzuspa­ ren, können die Koeffizienten für lineare Vorhersage weniger häufig berechnet werden. Z. B. können die Koeffizienten für lineare Vorhersage ein Mal für zwei Abtastwerte berechnet werden. Der Verlust an mittlerem Vorhersagegewinn ist ver­ nachlässigbar. Jedoch ist der Verlust an Vorhersagegewinn dann deutlich erkennbar, wenn im zu codierenden Audiosignal ein Übergang auftritt. Daher ist ein Übergangsdetektor 10 vorhanden, der die Vorhersageeinrichtung von einer normalen, niedrigen Koeffizienten-Aktualisierungsrate (z. B. mit einem spektralen Wert pro Sekunde) auf eine hohe Aktualisierungs­ rate (z. B. für jeden spektralen Wert) umschaltet, wenn ein Übergang erkannt wird. Die hohe Aktualisierungsrate kann für eine kurze Periode nach der Erkennung eines Übergangs beibe­ halten werden.
Es sei angenommen, daß G1 den Vorhersagegewinn im Skalie­ rungsfaktorband l bezeichnet. Wenn G1 < 0 gilt, kann die Vorhersageeinrichtung in diesem Subband abhängig vom gesam­ ten Vorhersagegewinn umgeschaltet werden, der wie folgt be­ rechnet wird:
wobei Ns die Anzahl von Skalierungsfaktorbändern ist. Wenn G das Erfordernis eines Zusatzbits für die Information sei­ tens der Vorhersageeinrichtung kompensiert, d. h., wenn G < T1 (dB) gilt oder wenn der Vorhersagegewinn nicht dras­ tisch fällt, d. h. bei Gaktuell - Gvorig < T2 (dB), wird die Information der vollständigen Seite übertragen, und die Vor­ hersageeinrichtungen, die positive Gewinne erzeugen, werden eingeschaltet; andernfalls werden die Vorhersageeinrichtun­ gen nicht verwendet, was auch bedeutet, daß sich ein Über­ gang nähert. Nachdem die Übergangsrahmen erkannt sind, wer­ den die Koeffizienten für adaptive Vorhersage in Rückwärts­ richtung für jeden Abtastwert berechnet. Nach einer bestimm­ ten Anzahl von Abtastwerten werden die Vorhersagekoeffizien­ ten für die Abtastwerte berechnet, wie sie jede Sekunde auf­ treten.
Fig. 2 zeigt eine Vorrichtung zum Decodieren eines Signals, das unter Verwendung des oben im einzelnen beschriebenen Verfahrens codiert wurde. Das empfangene Abweichungs-Multi­ plexsignal 9 wird an den Eingang eines Demultiplexers 6 ge­ geben, der das Signal in 1024 Ströme ej(n) spektraler Werte unterteilt. Diese Ströme werden dann an eine Signalverarbei­ tungseinheit 7 weitergegeben. Für jeden Strom berechnet die­ se Einheit 7 für jeden Abweichungswert einen vorhergesagten oder abgeschätzten spektralen Wert. Eine vorbestimmte Anzahl dieser vorhergesagten Werte wird dann dazu verwendet, Koef­ fizienten für lineare Vorhersage zu berechnen, um die Be­ rechnung eines Vorhersagewerts für einen aktuellen Abtast­ wert zu ermöglichen. Dieser Prozeß ist identisch mit demje­ nigen der für den Codierprozeß beschrieben wurde. Ein wie­ derhergestellter spektraler Wert wird dadurch erhalten, daß das empfangene Abweichungssignal mit dem entsprechenden Vor­ hersagewert kombiniert wird. Die Ströme wiederhergestellter spektraler Werte werden an eine weitere Verarbeitungseinheit 8 geliefert, die einen inversen MDCT-Vorgang an den Daten ausführt, um im wesentlichen das ursprüngliche Audiosignal wiederherzustellen.
Fig. 3 zeigt ein Mobiltelephon 11, das in seinem Sender eine Vorrichtung 12 (entsprechend der Vorrichtung von Fig. 1) zum Codieren eines Funktelephonsignals unter Verwendung des obenbeschriebenen Codierungsverfahrens enthält. Das Te­ lephon enthält in seinem Empfänger auch eine Vorrichtung 13 (entsprechend der Vorrichtung von Fig. 2) zum Decodieren eines empfangenen, codierten Telephonsignals.

Claims (15)

1. Verfahren zum Codieren eines elektrischen Audiosignals unter Verwendung adaptiver Vorhersage in Rückwärtsrichtung, gekennzeichnet durch die folgenden Schritte:
  • a) Empfangen eines ersten Zeitrahmens des zu codierenden elektrischen Audiosignals;
  • b) Transformieren des Zeitrahmens in die Frequenzdomäne, um ein Frequenzspektrum mit 512 oder mehr spektralen Komponen­ ten zu erzeugen;
  • c) Empfangen folgender Zeitrahmen des elektrischen Audiosi­ gnals, und aufeinanderfolgendes Wiederholen des Schritts (b) für diese Rahmen, um einen Strom spektraler Datenwerte für jede spektrale Komponente zu erzeugen; und
  • e) Berechnen, für jeden dieser Ströme, eines Satzes von Vorhersagekoeffizienten für jeden spektralen Wert unter Ver­ wendung der Kovarianzen einer vorbestimmten Anzahl zuvor bestimmter, rekonstruierter spektraler Werte des Stroms un­ ter Verwendung des Satzes von Vorhersagekoeffizienten, um einen vorhergesagten spektralen Wert zu erzeugen, und Be­ rechnen der Abweichung zwischen dem vorhergesagten spektra­ len Wert und dem entsprechenden tatsächlichen spektralen Wert, wobei die berechneten Abweichungen für eine codierte Wiedergabe des Stroms spektraler Werte sorgen und wobei die­ se Abweichungen mit vorhergesagten spektralen Werten kombi­ niert werden können, um rekonstruierte spektrale Werte zu erhalten.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Vorhersageordnung den Wert Zwei hat.
3. Verfahren nach einem der vorstehenden Ansprüche, da­ durch gekennzeichnet, daß die Vorhersagekoeffizienten nur dann erneut berechnet werden, wenn mehrere spektrale Werte empfangen wurden, wobei für mehrere aufeinanderfolgende spektrale Werte dieselben Koeffizienten verwendet werden.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Berechnung nach Empfang von jeweils zwei spektralen Wer­ ten erfolgt.
5. Verfahren nach einem der Ansprüche 3 oder 4, gekenn­ zeichnet durch ein Umschalten zwischen einer niedrigen und einer hohen Koeffizienten-Aktualisierungsrate unmittelbar beim Erkennen eines Übergangs im zu codierenden Audiosignal.
6. Verfahren nach einem der vorstehenden Ansprüche, da­ durch gekennzeichnet, daß die vorbestimmte Anzahl spektra­ ler Werte vier oder mehr ist.
7. Verfahren nach einem der vorstehenden Ansprüche, da­ durch gekennzeichnet, daß die vorbestimmte Anzahl spektra­ ler Werte zehn oder weniger ist.
8. Verfahren nach einem der vorstehenden Ansprüche, da­ durch gekennzeichnet, daß ein Verfahren mit kleinsten Feh­ lerquadraten dazu verwendet wird, die Vorhersagekoeffizien­ ten abzuschätzen.
9. Verfahren nach Anspruch 8 in Abhängigkeit von Anspruch 2, dadurch gekennzeichnet, daß die Kovarianzen wie folgt bestimmt werden:
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß die Vorhersagekoeffizienten wie folgt bestimmt werden:
11. Verfahren zum Decodieren eines codierten elektrischen Audiosignals, gekennzeichnet durch die folgenden Schritte:
  • - Empfangen einer Abfolge von Abweichungswerten, die dem co­ dierten Audiosignal entsprechen, als Eingangssignal, und un­ terteilen dieser Werte in Ströme spektraler Komponenten;
  • - Bestimmen, für jeden Strom, eines entsprechenden, vorher­ gesagten Werts der spektralen Komponente für jeden Abwei­ chungswert unter Verwendung eines Satzes von Vorhersagekoef­ fizienten, die unter Verwendung von Kovarianzen einer vorbe­ stimmten Anzahl zuvor bestimmter aufeinanderfolgender, vor­ hergesagter Werte spektraler Komponenten für diesen Strom berechnet werden, und Kombinieren des Abweichungswerts und des vorhergesagten spektralen Werts, um einen rekonstruier­ ten spektralen Wert zu erzeugen; und
  • - Rekonstruieren im wesentlichen des Audiosignals durch Kom­ binieren und Frequenz-Zeit-Transformieren der rekonstruier­ ten spektralen Werte aller Ströme.
12. Vorrichtung zum Codieren eines elektrischen Audiosi­ gnals unter Verwendung adaptiver Vorhersage in Rückwärts­ richtung, gekennzeichnet durch:
  • - einen Eingang zum Empfangen eines zu codierenden elektri­ schen Audiosignals;
  • - eine Einrichtung zum Transformieren (1) von der Zeit in die Frequenzdomäne, um sequentiell empfangene Zeitrahmen des empfangenen Signals aus der Zeitdomäne in die Frequenzdomäne zu transformieren, um Frequenzspektren mit 512 oder mehr spektralen Komponenten zu erzeugen; und
  • - eine Signalverarbeitungseinrichtung (2-5), die jeder spektralen Komponente zugeordnet ist, um einen Strom der zu­ gehörigen spektralen Werte zu empfangen, um für jeden spek­ tralen Wert einen Satz von Vorhersagekoeffizienten unter Verwendung von Kovarianzen einer vorbestimmten Anzahl zuvor rekonstruierter spektraler Werte zu berechnen, um diesen Satz von Vorhersagekoeffizienten zum Erzeugen eines vorher­ gesagten spektralen Werts zu verwenden, und um die Abwei­ chung zwischen dem vorhergesagten Wert und dem entsprechen­ den aktuellen spektralen Wert zu berechnen, wobei die be­ rechneten Abweichungen für eine codierte Wiedergabe des emp­ fangenen Stroms spektraler Werte sorgen, und wobei die Ab­ weichungen mit vorhergesagten spektralen Werten kombiniert werden können, um rekonstruierte spektrale Werte zu erhal­ ten.
13. Vorrichtung zum Decodieren eines codierten elektrischen Audiosignals, gekennzeichnet durch:
  • - einen Eingang zum Empfangen einer Abfolge von dem codier­ ten Audiosignal entsprechenden Abweichungswerten; und
  • - eine Signalverarbeitungseinrichtung (6, 7) zum Unterteilen dieser Abfolge von Werten in getrennte Ströme spektraler Komponenten und um für jeden Abweichungswert unter Verwen­ dung eines Satzes von Vorhersagekoeffizienten einen entspre­ chenden vorhergesagten spektralen Wert zu bestimmen, wobei die Verarbeitungseinrichtung so ausgebildet ist, daß sie die Vorhersagekoeffizienten unter Verwendung von Kovarianzen einer vorbestimmten Anzahl zuvor bestimmter, aufeinanderfol­ gender, rekonstruierter spektraler Werte berechnet, und wo­ bei die Signalverarbeitungseinrichtung ferner so ausgebildet ist, daß sie jeden Abweichungswert mit dem entsprechenden vorhergesagten spektralen Wert kombiniert, um einen rekon­ struierten spektralen Wert zu erzeugen und um im wesentli­ chen das Audiosignal dadurch zu rekonstruieren, daß die wiederhergestellten spektralen Werte aller Subbänder kombi­ niert werden und einer Frequenz-Zeit-Transformation unterzo­ gen werden.
14. Kommunikationssystem mit einer Kombination der Vorrich­ tungen der Ansprüche 12 und 13.
15. Mobile Kommunikationsvorrichtung mit einer Kombination der Vorrichtungen der Ansprüche 12 und 13.
DE1998104584 1997-02-07 1998-02-05 Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen Withdrawn DE19804584A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI970553A FI970553A (fi) 1997-02-07 1997-02-07 Audiokoodausmenetelmä ja -laite

Publications (1)

Publication Number Publication Date
DE19804584A1 true DE19804584A1 (de) 1998-08-13

Family

ID=8548146

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1998104584 Withdrawn DE19804584A1 (de) 1997-02-07 1998-02-05 Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen

Country Status (9)

Country Link
JP (1) JPH10260699A (de)
CN (1) CN1202513C (de)
AU (1) AU5664898A (de)
DE (1) DE19804584A1 (de)
FI (1) FI970553A (de)
FR (1) FR2759510A1 (de)
GB (1) GB2322776B (de)
SE (1) SE9800338L (de)
WO (1) WO1998035447A2 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332216B2 (en) 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
US8665945B2 (en) * 2009-03-10 2014-03-04 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02131038A (ja) * 1988-11-10 1990-05-18 Pioneer Electron Corp 信号伝送装置
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
EP0692881B1 (de) * 1993-11-09 2005-06-15 Sony Corporation Quantisierungsvorrichtung und -verfahren, kodierer und kodierverfahren mit hoher effizienz, dekodierer und aufzeichnungsträger
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus

Also Published As

Publication number Publication date
AU5664898A (en) 1998-08-26
FR2759510A1 (fr) 1998-08-14
GB9802611D0 (en) 1998-04-01
GB2322776B (en) 2002-03-13
CN1199959A (zh) 1998-11-25
CN1202513C (zh) 2005-05-18
SE9800338D0 (sv) 1998-02-05
SE9800338L (sv) 1998-08-08
FI970553A0 (fi) 1997-02-07
WO1998035447A2 (en) 1998-08-13
GB2322776A (en) 1998-09-02
FI970553A (fi) 1998-08-08
WO1998035447A3 (en) 1998-11-19
JPH10260699A (ja) 1998-09-29

Similar Documents

Publication Publication Date Title
DE19811039B4 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE19628293C1 (de) Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
EP0846405B1 (de) Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE60021083T2 (de) Verfahren zur verbesserung der kodierungseffizienz eines audiosignals
DE4320990B4 (de) Verfahren zur Redundanzreduktion
EP0227956B1 (de) Verfahren zur Datenreduktion digitaler Bildsignale durch Vektorquantisierung
EP0414838B2 (de) Verfahren zur übertragung eines signals
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
EP0978172A1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE19706516C1 (de) Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE60211854T2 (de) Vorrichtung zur datenverarbeitung
DE19804584A1 (de) Verfahren und Vorrichtung zum Codieren und Decodieren von Audiosignalen
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE19735675C2 (de) Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom
EP0284962B1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE102021203087A1 (de) Kompression von Audiodaten im Fahrzeug
DE10065363A1 (de) Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals
DE102006053976A1 (de) Verfahren zur Umschaltung von Fenster und zur Entscheidung des Bandstatus der Mittel/Seitenkodierung für fortgeschrittene Audiokodierung

Legal Events

Date Code Title Description
8141 Disposal/no request for examination