DE60300500T2 - Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom - Google Patents

Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom Download PDF

Info

Publication number
DE60300500T2
DE60300500T2 DE60300500T DE60300500T DE60300500T2 DE 60300500 T2 DE60300500 T2 DE 60300500T2 DE 60300500 T DE60300500 T DE 60300500T DE 60300500 T DE60300500 T DE 60300500T DE 60300500 T2 DE60300500 T2 DE 60300500T2
Authority
DE
Germany
Prior art keywords
window
subbands
information
block
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60300500T
Other languages
English (en)
Other versions
DE60300500D1 (de
Inventor
Walter Voessing
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of DE60300500D1 publication Critical patent/DE60300500D1/de
Application granted granted Critical
Publication of DE60300500T2 publication Critical patent/DE60300500T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Description

  • Die Erfindung bezieht sich auf ein Verfahren und auf eine Vorrichtung zum Kodieren und Dekodieren eines Audiosignals, das unter Verwendung von mehreren Unterbändern und überlappenden Fensterfunktionen und unter Verwendung von erweiterten Unterband-Signal-Fenster-Schaltkonfigurationen verarbeitet wird.
  • Hintergrund
  • Bei der Audio-Kodierung wird eine Kurzzeit-Cosinus- oder Fourier-Transformation verwendet, um spektrale Koeffizienten aus Zeit-Domäne-Eingangsabtastungen zu erzeugen. Die Koeffizienten werden kodiert, wodurch Redundanz und Irrelevanz beseitigt werden. An der Empfängerseite werden die kodierten Koeffizienten dekodiert und invers in Zeit-Domäne-Abtastungen transformiert. Vorzugsweise werden die Längen der Transformationsblöcke von lang auf kurz und umgekehrt geschaltet, je nach den gegenwärtigen Eigenschaften des Eingangssignals, um Vor-Echos zu verdecken und hörbares Rauschen zu vermindern, das in Blöcken mit einer mehr oder weniger stillen Periode vor einer plötzlichen Zunahme der Amplitude des Eingangssignals entsteht.
  • Unabhängiges Schalten der Transformations-Blocklänge innerhalb von Unterbändern wird zum Beispiel in dem ATRAC-Kompressions-Algorithmus verwendet, wie in EP-A-0 998 051 erwähnt ist.
  • Schalten der Transformations-Blocklänge wird auch in ISO/IIC 11172-3 (MPEG-1 Audio-Schicht 3) und in ISO/IIC 13818-3 (MPEG-2) Audio-Schicht 3) und in AAC (advanced audio coding) verwendet.
  • Erfindung
  • Die Erfindung wird durch die unabhängigen Ansprüche 1, 5, 9 und 10 definiert.
  • In der MPEG-1 Audio-Schicht 3 und in der MPEG-2 Audio-Schicht 3 werden die Informationen über das Schalten der Transformations-Blocklänge oder die Informationen über das Schalten der Fensterlänge innerhalb des Overheads (zwischen ,Haupt_Daten_Beginn' und ,Haupt_Daten') der Rahmen des Datenstroms unter Verwendung eines Kennzeichens, das ,Fenster_Schalt_Kennzeichen' genannt wird, für jede ,Grandule' genannte Gruppe von Koeffizienten übertragen.
  • Die verschiedenen Schichten in MPEG-1 Audio und MPEG-2 Audio wie auch anderer Codecs wie das Minidisc-System verwenden Unterband-Kodierung/Dekodierung, wobei das gesamte Frequenzband in eine vorbestimmte Zahl von Unterbändern aufgeteilt wird, z. B. 32 Bänder, oder in 3 Unterbänder im Fall der Minidisc. 2 zeigt mehrere Unterbänder SB1 ... SB32, in jedem von denen Fenstertechnik verwendet wird. Die Länge der Fenster, und somit die Länge der Transformationen in der spektralen Domäne, ist in ,Fensterlängen-Zeiteinheiten' WLTU gegeben. Echte Fenster/Transformationsblöcke können z. B. 12 und 2048 Abtastungen mit originalen PCM-Abtastraten von z. B. 32 kHz, 44,1 kHz oder 48 kHz enthalten.
  • Die Fenster überlappen sich um zum Beispiel 50%, wie in 2 dargestellt ist. Der Transformations-Typ kann ein MDCT sein, der Unterabtastung mit einem Faktor 2 verwendet, so dass die Gesamtmenge von Eingangs-Koeffizienten nicht erhöht wird.
  • Die in 2 gezeigten Fensterfunktionen sind nur symbolisch, echte Fensterfunktionen haben zum Beispiel Sinus/Cosinus- oder Kaiser-Bessel- oder Fielder-Form.
  • In der MPEG-1 Audio-Schicht 3, in der MPEG-2 Audio-Schicht 3 und in Minidisc-Codecs ist es auch möglich, für eine gegebene Dauer des Eingangssignals eine unterschiedliche Transformations-Block- oder Fensterlänge in unterschiedlichen Unterbändern auszuwählen. In einem solchen Fall müssen die Informationen darüber, welches Unterband oder welche Gruppe von Unterbändern welche Transformations- oder Fensterlänge verwenden soll, in dem Datenstrom für die Abschätzung in dem Dekoder enthalten sein. Z. B. wird dieser Parameter in der MPEG-1 Audio-Schicht 3 und in der MPEG-2 Audio-Schicht 3 als ,gemischtes_Block-Kennzeichen' bezeichnet, das bestimmt, dass in den untersten zwei Unterbändern SB1 und SB2 nur lange Blöcke verwendet werden sollen, während in gleichmäßiger Weise in den oberen 30 Unterbändern die Blocklänge zwischen langen Blöcken und kurzen Blöcken einschließlich Übergangsblöcken, die als Startblöcke und Stopp-Blöcke bezeichnet werden, schwankt. Es wird auch der Block- oder Fenster-Typ unter Verwendung des 2-Bit-Parameters ,Block_Typ' signalisiert. Wenn kurze Blöcke verwendet werden, ergibt sich in jedem Fall eine Block-Typ-Sequenz, wie zum Beispiel in 2 für die Unterbänder 3 und 4 gezeigt ist: langer Block (Code 0), Startblock (Code 1 mit unsymmetrischen Fensterfunktions-Hälften), drei kurze Blöcke (Code 2; wenigstens ein kurzer Block, allgemein gesprochen), Stopp-Block (Code 3 mit unsymmetrischen Fensterfunktions-Hälften), langer Block (Code 0).
  • Eine von der Erfindung zu lösende Aufgabe ist die Schaffung einer verbesserten Anpassung der zulässigen Block- oder Fensterlängen oder Fensterformen innerhalb des gesamten Bereichs von Unterbändern. Diese Aufgabe wird durch die in den Ansprüchen 1 und 5 offenbarten Verfahren gelöst. Vorrichtungen, die diese Verfahren verwenden, sind in den Ansprüche 9 und 10 offenbart.
  • Zum Beispiel wird in der MPEG-1 Audio-Schicht 3 und in der MPEG-2 Audio-Schicht 3, folgend dem ,Fenster_Schalt_Kennzeichen' der entsprechende 2-Bit-Wert von ,Block_Typ' wiederholt gesendet, obwohl der Dekoder schon von dem Auftreten des Parameters ,Fenster_Schalt_Kennzeichen' weiß, dass die oben beschriebene Sequenz von ,Startblock', ,kurze(s) Fenster', ,Stopp-Block' und ,langes Fenster' folgen wird. Daher ist die mehrmalige Übertragung des sich ändernden Parameters ,Block_Typ' eine redundante Information.
  • Gemäß der Erfindung wird der überflüssige Parameter ,Block_Typ'-Kennzeichen nicht für Block-Typ-Signalisierungszwecke gesendet. Statt dessen werden die beiden entsprechenden Bits verwendet, um dem Dekoder unterschiedliche Unterband-Signal-Fenster-Schalt-Konfigurationstypen zu signalisieren.
  • Diese Konfigurationstypen definieren, in welchen von der gesamten Zahl von verwendeten Unterbändern das Fensterschalten durch den obigen Parameter ,Fenster_Schalt_Kennzeichen' betroffen ist, oder in welchem von der gesamten Zahl von verwendeten Unterbändern das Fensterschalten von dem Parameter ,Fenster_Schalt_Kennzeichen' nicht betroffen ist. Diese Konfigurationstypen können ferner verschiedene Unterband-Gruppen definieren, die innerhalb der gesamten Zahl von Unterbändern festgelegt sind, die von dem Parameter ,Fenster_Schalt_Kennzeichen' betroffen sind. Diese Konfigurationstypen können ferner variable Unterband-Gruppen innerhalb der Gesamtzahl von Unterbändern definieren, die von dem Parameter ,Fens ter_Schalt_Kennzeichen' betroffen sind. Beide Alternativen können auch kombiniert werden.
  • Im Prinzip ist das erfindungsgemäße Verfahren zum Kodieren eines Audiosignals geeignet, das unter Verwendung mehrerer Unterbänder und überlappender Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wird,
    bei dem die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert und unter Verwendung von Datenverminderung kodiert werden,
    und bei dem unterschiedliche Fensterformen verwendet werden und die Informationen über die verwendeten Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert werden,
    und bei dem mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe von Unterbändern verwendet werden, zusätzliche Informationen über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert werden,
    und wobei, folgend einer solchen Entscheidung, in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fenster-Informationen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe von Unterbändern verwendet wird, Informationen über die in der gegebenen Sequenz verwendeten Fensterformen nicht übertragen, aufgezeichnet oder in den Seitenbändern gespeichert werden, aber statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurationstypen übertragen, aufgezeichnet oder in den Seitenbändern gespeichert werden.
  • Im Prinzip ist das erfindungsgemäße Verfahren zum Dekodieren eines Audiosignals geeignet, das unter Verwendung von mehreren Unterbändern und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wurde,
    bei dem die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert und unter Verwendung von Datenverminderung kodiert wurden,
    und bei dem unterschiedliche Fensterformen verwendet wurden und die Informationen über die verwendeten Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert wurden,
    und bei dem mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung von Unterbandsignalen in einer zweiten Gruppe von Unterbändern verwendet werden, zusätzliche Informationen über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden,
    wobei die Dekodierung die Schritte einschließt:
    • – Dekodieren der Seiteninformationen des empfangenen, wiedergegebenen oder ausgelesenen Signals,
    • – Verwenden der kodierten Seiteninformationen, Ausführen einer Datenverminderungs-Dekodierung des empfangenen, wiedergegebenen oder ausgelesenen Codes, und in jedem Fall inverse Transformation der Blöcke von spektralen Domäne-Koeffizienten in entsprechende Abtastblöcke,
    • – Zusammenfügen der invers transformierten Blöcke unter Verwendung der überlappenden Fensterfunktionen und Einfügen der mehreren Unterbandsignale in das dekodierte Audiosignal, wobei mit der Kodierung, einer solchen Entscheidung folgend, in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung von Unterbandsignalen in einer zweiten Gruppe von Unterbändern verwendet werden, in den Seiteninformationen Informationen über die in der gegebenen Sequenz verwendeten Fensterformen nicht übertragen, aufgezeichnet oder gespeichert wurden, aber statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurationstypen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden,
    • – Abschätzen bei der Kodierung die weiteren Unterbandsignal-Fenster-Schalt-Konfigurationstyp-Informationen und Auswählen der entsprechenden Fensterformen beim Zusammenfügen der invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen und beim Einfügen der mehreren Unterbandsignale in das dekodierte Audiosignal.
  • Im Prinzip enthält die Vorrichtung zum Kodieren eines Audiosignals:
    • – Mittel zur Verarbeitung des Audiosignals unter Verwendung von mehreren Unterbändern und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, und zur Transformation in jedem Fall der resultierenden Abtastblöcke in entsprechende Blöcke von spektralen Domäne-Koeffizienten,
    • – Mittel zum Kodieren der Koeffizienten unter Verwendung von Datenverminderung, wobei unterschiedliche Fensterformen verwendet werden und die Informationen über die verwendeten Fensterformen dem kodierten Audiosignal in den Seiteninformationen für die kodierten Koeffizienten hinzugefügt werden, und wobei mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe von Unterbändern verwendet werden, zusätzliche Informationen über eine solche Mischung von Fensterformen den Seiteninformationen hinzugefügt werden, und wobei einer solchen Entscheidung folgend, in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung einer zweiten Gruppe von Unterbändern verwendet wird, die Informationen über die in der gegebenen Sequenz verwendeten Fensterformen den Seiteninforma tionen nicht hinzugefügt werden, aber statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurationstypen.
  • Im Prinzip ist die erfindungsgemäße Vorrichtung zum Dekodieren eines Audiosignals geeignet, das unter Verwendung von mehreren Unterbändern und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wurde,
    bei der die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert und unter Verwendung von Datenverminderung kodiert wurden,
    und wobei unterschiedliche Fensterformen verwendet wurden und die Informationen über die verwendeten Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert wurden, und wobei mit der Entscheidung bei der Kodierung, während einer gegebenen Zeitdauer in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe von Unterbändern verwendet werden, zusätzliche Informationen über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden, wobei die Vorrichtung enthält:
    • – Mittel zum Dekodieren der Seiteninformationen der empfangenen, wiedergegebenen oder ausgelesenen Signale,
    • – Mittel zur Ausführung einer Datenverminderungs-Kodierung des empfangenen, wiedergegebenen oder aus gelesenen Codes unter Verwendung der dekodierten Seiteninformationen, und zur inversen Transformation in jedem Fall der Blöcke von spektralen Domäne-Koeffizienten in entsprechende Abtastblöcke, und zum Zusammenfügen der invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen und zum Einfügen der mehreren Unterbandsignale in das dekodierte Audiosignal,
    wobei bei der Kodierung nach einer solchen Entscheidung, in einer ersten Gruppe von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe von Unterbändern verwendet werden, in den Seiteninformationen Informationen über die in der gegebenen Sequenz verwendeten Fensterformen nicht übertragen, aufgezeichnet oder gespeichert wurden, sondern statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurationstypen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden,
    und wobei die Mittel zum Dekodieren der Seiteninformationen die weiteren Unterbandsignal-Fenster-Schalt-Konfigurationstyp-Informationen abschätzen, die dann zur Auswahl der entsprechenden Fensterformen verwendet werden, wenn die invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen zusammengefügt werden, und wenn die mehreren Unterbandsignale in das dekodierte Audiosignal in den Mitteln zur Ausführung der Datenverminderungs-Dekodierung der inversen Transformation und der Zusammenfügung eingefügt werden.
  • Vorteilhafte zusätzliche Ausführungsformen der Erfindung sind in den entsprechenden Unteransprüchen offenbart.
  • Zeichnungen
  • Ausführungsbeispiele der Erfindung werden anhand der beigefügten Zeichnungen beschrieben. In den Zeichnungen stellen dar:
  • 1 ein Blockschaltbild eines Kodierers, der die Erfindung ausführen kann;
  • 2 Orte von Fenstern innerhalb von Frequenz-Unterbändern;
  • 3 ein Blockschaltbild eines Dekoders, der die Erfindung ausführen kann.
  • Ausführungsbeispiele
  • In 1 wird das Kodierer-Eingangssignal im Block EINP empfangen. Die Stufe SAFW führt die Unterband-Analyse-Filterung aus (d. h. die Erzeugung der obigen 32 Unterbandsignale), die Fenstertechnik und die Transformation in die spektrale Domäne. Die Stufe ScFCal berechnet die Normierungsfaktoren aus den spektralen Koeffizienten aus. Die Stufe ScFCod kodiert die Normierungsfaktoren unter Verwendung der von der Stufe BRAdj empfangenen Seiteninformationen. Die Stufe NQCod führt die Normalisierung, Quantisierung und Kodierung der Koeffizienten aus den Unterbändern aus, wobei die Seiteninformationen von der Stufe BRAdj verwendet werden. Die Stufe FrFo führt die Formatierung der zu übertragenden, aufzuzeichnenden oder zu speichernden Audio-Rahmen aus.
  • Die Stufe FFTA führt eine FFT-Analyse (schnelle Fourier-Transformation) des Eingangssignals EINP parallel aus, um eine Quelle für psycho-akustische Informationen vorzusehen. Die nachfolgende Stufe ThCalSD berechnet daraus die Abdeckungs-Schwellenwerte und die Signal/Abdeckungs-Verhältnisse und bestimmt die Fenster-Schalt-Informationen, die für die Unterbänder benötigt werden. Diese Fenster-Schalt-Informationen werden in der Stufe SAFW den Unterbandsignalen und den entsprechenden Transformations-Operationen zugeführt. Die Stufe BallCal berechnet die erforderliche Bit-Zuordnung. Die nachfolgende Stufe BRAdj steuert die Einstellung auf die gewünschte feste Bit-Rate durch Senden entsprechender Steuersignale an die Stufen ScFCod und NQCod.
  • Es ist nur ein Kanal von zwei (stereo) oder mehr Kanälen dargestellt, wobei die Stufen FFTA, ThCalSD, BallCal und BRAdj normalerweise für alle Kanäle gemeinsam verwendet werden.
  • In 3 wird das Dekoder-Eingangssignal im Block DINP empfangen, wiedergegeben oder ausgelesen. Die Stufe SIDec dekodiert die in dem Dekoder erzeugten und von dem Dekoder benötigten Seiteninformationen, z. B. Skalierungsfaktor-Informationen, Bit-Zuordnungs-Informationen, Fenster-Schalt-Informationen, Normierungs-Informationen, Quantisierungs-Informationen und Schwellwert-Informationen. Die Stufe SIDec steuert die nachfolgenden Stufen INQDec und SSFW. Die Stufe INQDec führt die inverse Kodierung, die inverse Quantisierung und die inverse Normierung bei den empfangenen oder wiedergegebenen Koeffizienten aus den Unterbändern aus. Die Stufe SSFW führt die inverse Transformation, das entsprechende Fenster-Schalten und die Unterband-Synthese-Filterung aus und liefert die Ausgangs-PCM- Abtastungen. Nur ein Kanal von zwei (stereo) oder mehr Kanälen ist dargestellt.
  • Das erfindungsgemäße Fenster-Schalten – wie unter Verwendung des Beispiels von 2 mit Unterbändern 1/2, 3/4 und 31/32 gezeigt – wird unter Verwendung von unterschiedlichen Unterbandsignal-Fenster-Schalt-Konfigurationstypen in der Stufe SAFW in dem Kodierer und in der Stufe SSFW in dem Dekoder angewendet. Die Informationen über den auszuwählenden Konfigurationstyp werden in der Stufe ThCalSD bestimmt, übertragen und in der Stufe SIDec in dem Dekoder abgeschätzt.
  • Die Erfindung kann in erweiterten Systemen verwendet werden, die zum Beispiel auf MPEG-1 Audio-Schicht 3, MPEG-2 Audio-Schicht 3 oder AAC beruhen.

Claims (10)

  1. Verfahren zum Kodieren eines Audiosignals, das unter Verwendung von mehreren Unterbändern (SB1 ... SB32) und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wird (SAFW), bei dem die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert (SAFW) und unter Verwendung von Datenverminderung kodiert werden (ScFDod, NQCod) , bei dem unterschiedliche Fensterformen verwendet werden und die Informationen (Block_Typ) über die verwendeten Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert werden, und bei dem mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe (SB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, zusätzliche Informationen (Mixed_Block_Flag) über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert werden, gekennzeichnet durch die Schritte: – einer solchen Entscheidung folgend, in einer ersten Gruppe (SB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet wird, die Informationen (Block_Typ) über die in der gegebenen Sequenz verwendeten Fensterformen nicht zu übertragen, aufzuzeichnen oder in den Seiteninformationen zu speichern; – statt dessen Übertragen, Aufzeichnen oder Speichern von Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurationstypen in den Seiteninformationen.
  2. Verfahren nach Anspruch 1, bei dem das Audiosignal eine MPEG-1 Audio-Schicht 3, eine MPEG-2 Audio-Schicht 3 oder ein AAC-Audiosignal ist.
  3. Verfahren nach Anspruch 1 oder 2, bei dem die Konfigurationstypen definieren, in welchem aus der gesamten Zahl von verwendeten Unterbändern das Fenster-Schalten durch die zusätzlichen Informationen (Mixed_Block_Flag) über das Mischen von Fensterformen betroffen oder nicht betroffen wird.
  4. Verfahren nach Anspruch 3, bei dem die Konfigurationstypen ferner verschiedene in der gesamten Zahl von Unterbändern festgelegten Unterband-Gruppen definieren, die von den zusätzlichen Informationen (Mixed_Block_Flag) (Mixed_Block_Flag) betroffen werden, und/oder bei dem die Konfigurationstypen ferner variable Unterband-Gruppen innerhalb der gesamten Zahl von Unterbändern definieren, die durch die zusätzlichen Informationen (Mixed_Block_Flag) betroffen werden.
  5. Verfahren zum Dekodieren eines Audiosignals, das unter Verwendung von mehreren Unterbändern (SBl ... SB32) und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wurde (SAWF), bei dem die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert (SAWF) und unter Verwendung von Datenverminderung kodiert wurden (SacFCod, NQCod), und bei dem unterschiedliche Fensterformen verwendet wurden und die Informationen (Block_Typ) über die verwendeten Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert wurden, und bei dem mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe (SBl, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, zusätzliche Informationen (Mixed_Block_Flag) über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden, wobei die Dekodierung die Schritte enthält: – Dekodieren (SIDec) der Seiteninformationen des empfangenen, wiedergegebenen oder ausgelesenen Signals, – Verwendung der dekodierten Seiteninformationen, Ausführen einer Datenverminderungs-Dekodierung (INQDec) des empfangenen, wiedergegebenen oder ausgelesenen Codes, und in jedem Fall inverse Transformmation (SSFW) der Blöcke von spektralen Domäne-Koeffizienten in entsprechende Abtastblöcke, – Zusammenfügen (SSFW) der invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen und Einfügen (SSFW) der mehreren Unterbandsignale (SBl ... SB32) in das dekodierte Audiosignal (PCM), gekennzeichnet durch den Schritt: – bei dem mit der Kodierung, einer solchen Entscheidung folgend, in einer ersten Gruppe (SB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, in den Seiteninformationen Informationen (Block_Typ) über die in der gegebenen Sequenz verwendeten Fensterformen nicht übertragen, aufgezeichnet oder gespeichert wurden, aber statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigurations-typen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden, – Abschätzen (SIDec) bei der Dekodierung die weiteren Unterbandsignal-Fenster-Schalt-Konfigurationstyp-Informationen und Auswählen der entsprechenden Fensterformen beim Zusammenfügen (SSFW) der invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen und beim Einfügen (SSFW) der mehreren Unterbandsignale (SBl ... SB32) in das dekodierte Audiosignal (PCM).
  6. Verfahren nach Anspruch 5, bei dem das Audiosignal ein MPEG-1 Audio-Schicht 3, ein MPEG-2 Audio-Schicht 3 oder ein AAC-Audiosignal ist.
  7. Verfahren nach Anspruch 5 oder 6, bei dem die Konfigurationstypen definieren, in welchem aus der gesamten Zahl von verwendeten Unterbändern das Fenster-Schalten durch die zusätzlichen Informationen (Mixed_Block_Flag) über das Mischen von Fensterformen betroffen oder nicht betroffen ist.
  8. Verfahren nach Anspruch 7, bei dem die Konfigurationstypen ferner verschiedene in der gesamten Zahl von Unterbändern festgelegte Untergruppen definieren, die von den zusätzlichen Informationen (Mixed_Block_Flag) betroffen werden, und/oder bei dem die Konfigurationstypen ferner variable Unterband-Gruppen innerhalb der gesamten Zahl von Unterbändern definieren, die durch die zusätzlichen Informationen (Mixed_Block_Flag) betroffen sind.
  9. Vorrichtung zum Kodieren eines Audiosignals, enthaltend: – Mittel (SAFW) zur Verarbeitung des Audiosignals unter Verwendung von mehreren Unterbändern (SBl ... SB32) und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, und zur Transformation in jedem Fall der resultie renden Abtastblöcke in entsprechende Blöcke von spektralen Domäne-Koeffizienten, – Mittel (ScFCal, ScFCod, NQCod, FFTA, ThCalSD, Ball-Cal, BRAdj) zum Kodieren der Koeffizienten unter Verwendung von Datenverminderung, wobei unterschiedliche Fensterformen verwendet werden und die Informationen (Block_Typ) über die verwendeten Fensterformen dem kodierten Audiosignal in den Seiteninformationen für die kodierten Koeffizienten hinzugefügt werden, und wobei mit der Entscheidung, während einer gegebenen Zeitdauer in einer ersten Gruppe (SB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, zusätzliche Informationen (Mixed_Block_Flag) über eine solche Mischung von Fensterformen den Seiteninformationen hinzugefügt werden, und wobei einer solchen Entscheidung folgend, in einer ersten Gruppe (AB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet wurden, die Informationen (Block_Typ) über die in der gegebenen Sequenz verwendeten Fensterformen den Seiteninformationen nicht hinzugefügt werden, sondern statt dessen Informationen über weitere Unterbandsignal-Fenster-Schalt-Konfigura-tionstypen.
  10. Vorrichtung zum Dekodieren eines Audiosignals, das unter Verwendung von mehreren Unterbändern (SBl ... SB32) und überlappenden Fensterfunktionen, in die die Signale in den Unterbändern unterteilt werden, verarbeitet wurde (SAFW), bei der die resultierenden Abtastblöcke in jedem Fall in entsprechende Blöcke von spektralen Domäne-Koeffizienten transformiert (SAFW) und unter Verwendung von Datenverminderung kodiert wurden, und bei der unterschiedliche Fensterformen verwendet wurden und die Informationen (Block_Typ) über die verwendeten Fensterfunktionen übertragen, aufgezeichnet oder in den Seiteninformationen für die kodierten Koeffizienten gespeichert wurden, und bei der mit der Entscheidung bei der Kodierung, während einer gegebenen Zeitdauer in einer ersten Gruppe (SBl, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, zusätzliche Informationen (Mixed_Block_Flag) über eine solche Mischung von Fensterformen übertragen, aufgezeichnet oder in den Seiteninformationen gespeicher wurden, wobei die Vorrichtung enthält: – Mittel (SIDec) zum Dekodieren der Seiteninformationen des empfangenen, wiedergegebenen oder ausgelesenen Signals, – Mittel (INQDec, SSFW) zur Ausführung einer Datenverminderungs-Kodierung des empfangenen, wiedergegebenen oder ausgelesenen Codes unter Verwendung der de kodierten Seiteninformationen und zur inversen Transformation in jedem Fall der Blöcke von spektralen Domäne-Koeffizienten in entsprechende Abtastblöcke, und zum Zusammenfügen der invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen und zum Einfügen der mehreren Unterbandsignale (SB1 ... SB32) in das dekodierte Audiosignal (PCM), wobei mit der Kodierung, einer solchen Entscheidung folgend, in einer ersten Gruppe (SB1, SB2) von Unterbändern die Unterbandsignale wenigstens zum Teil mit einer gegebenen Sequenz von Fensterformen zu verarbeiten, die sich von der entsprechenden Sequenz von Fensterformen unterscheidet, die zur Verarbeitung der Unterbandsignale in einer zweiten Gruppe (SB3 ... SB32) von Unterbändern verwendet werden, in den Seiteninformationen Informationen (Block_Typ) über die in der gegebenen Sequenz verwendeten Fensterformen nicht übertragen, aufgezeichnet oder gespeichert wurden, sondern statt dessen Informationen über weitere Untersignal-Fenster-Schalt-Konfigurationstypen übertragen, aufgezeichnet oder in den Seiteninformationen gespeichert wurden, und wobei die Mittel (SIDec) zum Dekodieren der Seiteninformationen die weiteren Unterbandsignal-Fenster-Schalt-Konfigurationstyp-Informationen abschätzen, die dann zur Auswahl der entsprechenden Fensterformen verwendet werden, wenn die invers transformierten Abtastblöcke unter Verwendung der überlappenden Fensterfunktionen zusammengefügt werden, und wenn die mehreren Unterbandsignale in das dekodierte Audiosignal (PCM) in den Mitteln (INQDec, SSFW) zusammengefügt werden, um die Datenverminde rungs-Dekodierung, die inverse Transformation und die Zusammenfügung auszuführen.
DE60300500T 2002-08-28 2003-08-18 Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom Expired - Fee Related DE60300500T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02090308 2002-08-28
EP02090308A EP1394772A1 (de) 2002-08-28 2002-08-28 Signalierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom

Publications (2)

Publication Number Publication Date
DE60300500D1 DE60300500D1 (de) 2005-05-19
DE60300500T2 true DE60300500T2 (de) 2005-09-15

Family

ID=31197944

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60300500T Expired - Fee Related DE60300500T2 (de) 2002-08-28 2003-08-18 Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom

Country Status (6)

Country Link
US (1) US20040158472A1 (de)
EP (1) EP1394772A1 (de)
JP (1) JP2004094223A (de)
KR (1) KR20040019889A (de)
CN (1) CN1487746A (de)
DE (1) DE60300500T2 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100530377B1 (ko) * 2003-12-30 2005-11-22 삼성전자주식회사 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법
JP5100124B2 (ja) * 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US20100040135A1 (en) * 2006-09-29 2010-02-18 Lg Electronics Inc. Apparatus for processing mix signal and method thereof
EP2084901B1 (de) 2006-10-12 2015-12-09 LG Electronics Inc. Vorrichtung zum verarbeiten eines mischsignals und verfahren dafür
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
PL2311032T3 (pl) * 2008-07-11 2016-06-30 Fraunhofer Ges Forschung Koder i dekoder audio do kodowania i dekodowania próbek audio
EP2372703A1 (de) 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signalprozessor, Fensterlieferant, codiertes Mediensignal, Verfahren zur Verarbeitung eines Signals und Verfahren zur Bereitstellung eines Fensters
CN101894557B (zh) * 2010-06-12 2011-12-07 北京航空航天大学 一种用于aac编码的窗型判别方法
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
KR20130109793A (ko) * 2012-03-28 2013-10-08 삼성전자주식회사 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치
WO2013186344A2 (en) 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
CA2900437C (en) 2013-02-20 2020-07-21 Christian Helmrich Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法

Also Published As

Publication number Publication date
JP2004094223A (ja) 2004-03-25
KR20040019889A (ko) 2004-03-06
CN1487746A (zh) 2004-04-07
DE60300500D1 (de) 2005-05-19
US20040158472A1 (en) 2004-08-12
EP1394772A1 (de) 2004-03-03

Similar Documents

Publication Publication Date Title
DE60300500T2 (de) Signalisierung von Fensterschaltungen in einem MPEG Layer 3 Audio Datenstrom
DE19730129C2 (de) Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69834010T2 (de) Skalierbares stereo Tonkodierungs- und Tondekodierungsverfahren und Vorrichtung dafür
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60303209T2 (de) Parametrische audiocodierung
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE602004002390T2 (de) Audiocodierung
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE102004009954B4 (de) Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE60308567T2 (de) Dekodierungsgerät, Kodierungsgerät, Dekodierungsverfahren und Kodierungsverfahren
DE69534140T2 (de) Verfahren und vorrichtung zur signalkodierung und -dekodierung, aufzeichnungsmedium und signalübertragungsverfahren
WO1999004506A1 (de) Verfahren zum codieren eines audiosignals
DE60316099T2 (de) Verfahren und Vorrichtung zur Codierung/Dekodierung von Audiodaten mit Skalierbarkeit
DE60311334T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung eines digitalen Informationssignals
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
DE19811039A1 (de) Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
DE60303346T2 (de) Encodier- und/oder Decodierverfahren für digitale Audiosignale, basierend auf Zeit-Frequenzkorrelation und Vorrichtung hierzu
EP2385521A1 (de) Steganographie in digitalen Signal-Codierern

Legal Events

Date Code Title Description
8320 Willingness to grant licences declared (paragraph 23)
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee