DE602004004818T2 - Audiosignalcodierung oder -decodierung - Google Patents

Audiosignalcodierung oder -decodierung Download PDF

Info

Publication number
DE602004004818T2
DE602004004818T2 DE602004004818T DE602004004818T DE602004004818T2 DE 602004004818 T2 DE602004004818 T2 DE 602004004818T2 DE 602004004818 T DE602004004818 T DE 602004004818T DE 602004004818 T DE602004004818 T DE 602004004818T DE 602004004818 T2 DE602004004818 T2 DE 602004004818T2
Authority
DE
Germany
Prior art keywords
subband
subband signals
sub
signals
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602004004818T
Other languages
English (en)
Other versions
DE602004004818D1 (de
Inventor
F. Lars VILLEMOES
Per Ekstrand
Heiko Purnhagen
G. Erik SCHUIJERS
J. Fransiscus M. DE BONT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Coding Technologies Sweden AB
Original Assignee
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34530779&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE602004004818(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV, Coding Technologies Sweden AB filed Critical Koninklijke Philips Electronics NV
Publication of DE602004004818D1 publication Critical patent/DE602004004818D1/de
Application granted granted Critical
Publication of DE602004004818T2 publication Critical patent/DE602004004818T2/de
Anticipated expiration legal-status Critical
Active legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereophonic System (AREA)
  • Insulated Conductors (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf Codierung eines Audiosignals oder Decodierung eines codierten Audiosignals.
  • Erik Schuijers, Werner Oomen, Bert den Brinker und Jeroen Breebaart "Advances in Parametric Coding for High-Quality Audio", Preprint 5852, 114, AES Konvention, Amsterdam, Niederlande, 22. bis 25. März 2003 beschreibt ein parametrisches Codierungsschema, wobei eine effiziente parametrische Darstellung für das Stereobild verwendet wird. Zwei Eingangssignale werden zu einem einzigen Mono-Audiosignal vermischt. Wahrnehmbar relevante räumliche Stichwörter werden explizit modelliert, wie in 1 dargestellt. Das vermischte Signal wird unter Verwendung eines parametrischen Mono Codierers codiert. Die Stereo Parameter Interkanalintensitätsdifferenz (IID), die Interkanalzeitdifferenz (ITD) und die Interkanalkreuzkorrelation (ICC) werden quantisiert, codiert und gemultiplext zu einem Bitstrom, zusammen mit dem quantisierten und codierten Mono Audiosignal. An der Decoderseite wird der Bitstrom zu einem codierten Mono Signal und den Stereo Parametern gedemultiplext. Das codierte Mono Audiosignal wird decodiert zum Erhalten eines decodierten Mono Audiosignals m' (siehe 2). Aus dem Mono Zeitdomänensignal wird unter Verwendung eines Filters D ein dekorreliertes Signal berechnet, was eine wahrnehmbare Dekorrelation ergibt. Das Mono Zeitdomänensignal m' und das dekorrelierte Signal d werden zu einer Frequenzdomäne transformiert. Danach wird das Frequenzdomäne Stereosignal mit den IID-, ITD- und ICC-Parametern bearbeitet, und zwar durch Skalierung, Phasenmodifikation bzw. Mischung in einer Parameterverarbeitungseinheit zum Erhalten des decodierten Stereopaares 1' und r'. Die resultierenden Frequenzdomäne Darstellungen werden in die Zeitdomäne zurück transformiert.
  • Jin u. a. "A scalable Subband Coding Scheme for ATM Environments", "IE-EE SoutheastCon 2001, Seiten 271-275, beschreibt Teilbandfilterung mit nachfolgendem MDCT Transformation und Quantisierung entsprechend berechneten psychoakustischen Modellparametern.
  • Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, eine vorteilhafte Audio Codierung oder Decodierung zu schaffen, und zwar unter Verwendung räumlicher Parameter. Dazu schafft die vorliegende Erfindung ein Codierungsverfahren, einen Audiocodierer, eine Anordnung zur Übertragung oder Speicherung, ein Decodierungsverfahren, einen Audiodecoder, eine Wiedergabeanordnung und ein Computerprogrammprodukt, wie in den Hauptansprüchen definiert. Vorteilhafte Ausführungsformen sind in den Unteransprüchen definiert.
  • Nach einem ersten Aspekt der vorliegenden Erfindung wird ein Audiosignal codiert, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei die Codierung Teilbandfilterung des ersten Audiokanals sowie des zweiten Audiokanals in einer komplexen modulierten Filterbank umfasst zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal und einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal, Abwärtsabtastung jedes der Teilbandsignale zum Schaffen einer ersten Anzahl abwärts abgetasteter Teilbandsignale und einer zweiten Anzahl abwärts abgetasteter Teilbandsignale, und einer weiteren Teilbandfilterung wenigstens eines der abwärts abgetasteten Teilbandsignale in einer weiteren Filterbank zum Schaffen einer Anzahl Subteilbandsignale, Herleitung räumlicher Parameter aus den Subteilbandsignalen und aus den abwärts abgetasteten Subteilbandsignalen, die nicht weiter teilbandgefiltert werden, und Herleitung eines Einkanal-Audiosignals mit hergeleiteten Teilbandsignalen, hergeleitet aus der ersten Anzahl abwärts abgetasteter Teilbandsignale und der zweiten Anzahl abwärts abgetasteter Teilbandsignale. Durch Durchführung einer weiteren Teilbandfilterung in einem Teilband wird die Frequenzauflösung des genannten Teilbandes gesteigert. Eine derartige größere Frequenzauflösung bietet den Vorteil, dass es möglich wird, eine höhere Audioqualität zu erzielen (die Bandbreite eines einzigen Teilbandsignal ist typischerweise viel höher als die kritischer Bänder in dem menschlichen Hörsystem) in einer effizienten Implementierung (weil nur einige Bänder transformiert zu werden brauchen). Der parametrische räumliche Codierer versucht die binärischen Stichwörter zu modellieren, die in einer nicht einheitlichen Frequenzskala erfahren werden, entsprechend der ERB-Skala ("Equivalent Rectangular Bands" ). Das Einkanal-Audiosignal kann unmittelbar von der ersten Anzahl abwärts abgetasteter Teilbandsignale und der zweiten Anzahl abwärts abgetasteter Teilbandsignale hergeleitet werden. Das Einkanal-Audiosignal wird aber auf vorteilhafte Art und Weise von Teilbandsignalen für diejenigen abwärts abgetasteten Teilbänder hergeleitet, die weiter teilbandgefiltert werden, wobei in diesem Fall die Teilbandsignale jedes Teilbandes zusammen gefügt werden um neue Teilbandsignale zu bilden und wobei das Einkanal-Audiosignal von diesen neuen Teilbandsignalen und den Teilbändern von der ersten und der zweiten Anzahl Teilbänder, die nicht weiter gefiltert werden.
  • Nach einem anderen Hauptaspekt der vorliegenden Erfindung wird Audiodecodierung eines codierten Audiosignals geschaffen, wobei das codierte Audiosignal ein codiertes Einkanal-Audiosignal und einen Satz räumlicher Parameter aufweist, wobei die Audiodecodierung die Decodierung des codierten Einkanal-Audiosignals umfasst zum Erhalten einer Anzahl abwärts abgetasteter Teilbandsignale, weiterhin die Teilbandfilterung wenigstens eines Signals der abwärts abgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Teilbandsignale zu schaffen, und die Herleitung zweier Audiokanäle aus den räumlichen Parametern, den Teilbandsignalen und den abwärts abgetasteten Teilbandsignalen für diejenigen Teilbänder, die nicht weiter teilbandgefiltert werden. Dadurch, dass eine weitere Teilbandfilterung in einem Teilband durchgeführt wird, wird die Frequenzauflösung des genannten Teilbandes gesteigert und folglich kann eine Audiodecodierung einer höheren Qualität erzielt werden.
  • Einer der Hauptvorteile dieser Aspekte der vorliegenden Erfiung ist, dass eine parametrische räumliche Codierung auf einfache Art und Weise mit SBR-Techniken ("Spectral Band Replication") kombiniert werden kann. SBR ist an sich aus Martin Dietz, Lars Liljeryd, Kristofer Kjörling und Oliver Kunz "Spectral Band Replication, a novel approach in audio coding", Vorabdruck 5553, 112. AES Konvektion, München, Deutschland, 10. bis 13. Mai 2002 und aus Per Ekstrand "Bandwith extension of audio signals by spectral band replication", "Proc. 1 st IEEE Benelux Workshop on Model based Processing an Coding of Audio (MPCA-2002)", Seiten 53-58, Löwen, Belgien, 15. November 2002 bekannt. Weiterhin sei auf die MPEG-4 Norm ISO/IEC 14496-3:2001/FDAM1, JTC1/SC29/WG11, "Coding of Moving Picttuen an Audio, Bandwith Extension" was einen Audio-Codec unter Anwendung von SBR beschreibt.
  • SBR basiert auf dem Gedanken, dass es zwischen dem niedrigen und den hohen Frequenzen in einem Audiosignal eine große Korrelation gibt. Als solcher besteht der SBR-Prozess aus der Kopierung der unteren Teile des Spektrums zu den höheren Teilen, wonach die spektrale Umhüllende für die höheren Teile des Spektrums eingestellt wird, und zwar unter Verwendung von wenig Information, die codiert in dem Bitstrom vorhanden ist. Ein vereinfachtes Blockschaltbild eines derartigen SBR verbesserten Decoders ist in 3 dargestellt. Der Bitstrom wird gemultiplext und in Kerndaten decodiert (beispielsweise MPEG-2/4 AAC-Daten ("Advanced Audio Coding") und SBR-Daten. Unter Verwendung der Kerndaten wird das Signal mit der halben Abtastfrequenz des vollen Band breitensignals decodiert, Das Ausgangssignal des Kerndecoders wird mit Hilfe einer komplexen (Pseudo) Quadraturspiegelfilterbank (QMF) mit 32 Bändern analysiert. Diese 32 Bänder werden danach zu voller Bandbreite, d.h. zu 64 Bändern, erweitert, in denen der HF-Inhalt mit Hilfe von Kopierteilen der niedrigeren Bänder erzeugt wird. Die Umhüllende der Bänder, für die der HF-Inhalt erzeugt wird, wird entsprechend den SBR-Daten eingestellt. Zum Schluss wird mit Hilfe einer komplexen QMF Synthesebank mit 64 Bändern das PCM Ausgangssignal rekonstruiert.
  • Der SBR-Decoder, wie in 3 dargestellt, ist ein sog. Doppelratendecoder. Dies bedeutet, dass der Kerndecoder mit der halben Abtastfrequenz läuft und dass dadurch nur eine Analysen-QMF-Bank mit 32 Bändern verwendet wird. Einzelratendecoder, wobei der Kerndecoder mit der vollen Abtastfrequenz läuft und die Analysen-QMF-Bank aus 64 Bändern besteht, ist auch möglich. In der Praxis erfolgt die Rekonstruktion mit Hilfe einer (pseudo) komplexen QMF-Bank. Weil die komplexe QMF-Filterbank nicht kritisch abgetastet wird, brauchen keine zusätzlichen Maßnahmen getroffen zu werden um einen Alias-Effekt zu berücksichtigen. Es sei bemerkt, dass in dem SBR-Decoder, wie von Ekstrand beschrieben, die Analysen-QMF-Bank aus nur 32 Bändern besteht, während die Synthese-QMF-Bank aus 64 Bändern besteht, da der Kerndecoder mit der halben Abtastfrequenz läuft, dies im Vergleich zu dem ganzen Audiodecoder. In dem entsprechenden Codierer aber wird eine Analysen-QMF-Bank mit 64 Bändern verwendet um den ganzen Frequenzbereich zu decken.
  • Obschon die vorliegende Erfindung insbesondere vorteilhaft ist für Stereo Audiocodierung, ist die vorliegende Erfindung auch vorteilhaft bei der Codierung von Signalen mit mehr als zwei Audiokanälen.
  • Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 ein Blockschaltbild einer Einheit zur Stereo Parameterextraktion, wie in einem parametrischen Stereo Codierer ("PS") verwendet,
  • 2 ein Blockschaltbild einer Einheit zur Rekonstruktion eines Stereosignals, wie in einem PS-Decoder verwendet,
  • 3 ein Blockschaltbild eines SBR-Decoders ("Spectral Band Replication")
  • 4 ein Blockschaltbild eines kombinierten PS- und SBR-verbesserten Codierers nach einer Ausführungsform der vorliegenden Erfindung,
  • 5 ein Blockschaltbild eines kombinierten PS- und SBR-verbesserten Codierers nach einer Ausführungsform der vorliegenden Erfindung,
  • 6 eine abwärts abgetastete komplexe QMMF Analysenbank (links) und Synthesenbank (rechts) mit M Bändern,
  • 7 eine Größenreaktion in dB eines Prototypenfilters,
  • 8 eine Größenreaktion in dB der ersten vier von 64 nicht abwärts abgetasteten komplexen modulierten Analysenfiltern,
  • 9 ein Blockschaltbild einer Filterbank mit Q Bändern mit unbedeuteter Synthese,
  • 10 eine kombinierte Größenreaktion in dB eines ersten nicht abwärts abgetasteten modulierten QMF-Filters und einer komplexen modulierten Filterbank mit 8 Bändern,
  • 11 eine stilisierte Größenreaktion einer gleichmäßig gestapelten Filterbank mit vier Bändern (oben) und einer unregelmäßig gestapelten Filterbank (unten)( nach einer Ausführungsform der vorliegenden Erfindung,
  • 12 eine nicht einheitliche hybride Analysenfilterbank mit 77 Bändern auf Basis einer komplexen Analyse QMF mit 64 Bändern nach einer Ausführungsform der vorliegenden Erfindung,
  • 13 eine nicht einheitliche hybride Analysenfilterbank auf Basis einer komplexen Analyse QMF mit 64 Bändern zur Verwendung in einem Audiodecoder, und
  • 14 ein Blockschaltbild einer effizienten Implementierung der komplexen modulierten Analysenfilterbank.
  • Die Zeichnung zeigt nur diejenigen Elemente, die zum Verständnis der vorliegenden Erfindung erforderlich sind.
  • Das Kombinieren von SBR mit PS ergibt möglicherweise einen extrem starken Codec. SBR sowie PS sind Nachbearbeitungsalgorithmen in einem Decoder, der aus einer ziemlich ähnlichen Struktur besteht, d.h. einer bestimmten Form von Zeit-zu-Frequenzumwandlung, Verarbeitung und zum Schluss einer Frequenz-zu-Zeitumwandlung. Wenn die beiden Algorithmen kombiniert werden ist es erforderlich, dass die beiden Algorithmen gleichzeitig in beispielsweise einer DSP Applikation laufen können. Es ist vorteil haft, möglichst viel von den berechneten Zwischenergebnissen des einen Codecs für den anderen wieder zu verwenden. Im Falle einer Kombination von PS und SBR führt dies zu einer Neuverwendung der komplexen (Pseudo) QMF Teilbandsignale für PS-Verarbeitung. In einem kombinierten Codierer (siehe 4)wird das Stereo-Eingangssignal mit Hilfe zweier Analysenfilterbanken mit 64 Bändern analysiert. Unter Verwendung der komplexen Teilbanddomänendarstellung schätzt eine PS Recheneinheit die Stereo-Parameter und schafft eine Mono (Teilband) Abwärtsmischung. Diese Mono Abwärtsmischung wird danach einer SBR Parameterschätzungseinheit zugeführt. Zum Schluss wird die Mono Abwärtsmischung mit Hilfe einer Synthesefilterbank mit 32 Bändern in die Zeitdomäne zurückverwandelt, so dass diese durch den Kerndecoder codiert werden kann (der Kerndecoder braucht nur die halbe Bandbreite).
  • In dem kombinierten Decoder, wie in 5 dargestellt, werden, ungeachtet ob ein Doppelraten- oder ein Einzelratensystem angewandt wird, die ganzen Bandbreite-(64 Bänder)-Teilbanddomänensignale nach der Umhüllendeneinstellung zu einem Stereosatz mit Teilbanddomänensignalen entsprechend den Stereoparametern umgewandelt werden. Diese zwei Sätze mit Teilbandsignalen werden zum Schluss in die Zeitdomäne umgewandelt, und zwar mit Hilfe der Synthese QMF Bank mit 64 Bändern umgewandelt. Wenn man nur PS mit SBR kombinieren würde, ist die Bandbreite der niedrigeren Frequenzbänder des QMF-Filters größer als für eine Stereodarstellung hoher Qualität erforderlich. Damit man imstande ist, eine Darstellung des Stereobildes hoher Qualität zu bieten, wird nach vorteilhaften Ausführungsformen der vorliegenden Erfindung eine weitere Unterteilung der niedrigeren Teilbandsignale durchgeführt.
  • Zum besseren Verständnis von Aspekten der vorliegenden Erfindung wird zunächst die Theorie hinter den komplexen QMF-Teilbandfiltern erläutert.
  • QMF-Teilbandfilter
  • Das QMF-Anlysenteilbandfilter kann wie folgt beschrieben werden. Wenn ein reell bewertetes lineares Phasenprototypfilter p(v) gegeben ist, kann eine M-Band komplexe modulierte Analysenfilterbank durch die Analysenfilter definiert werden:
    Figure 00060001
  • Phasenparameter Θ ist für die nachfolgende Analyse nicht wichtig, Für k = 0,1, ..., M – 1. Der aber eine typische Wahl ist (N + M)/2, wobei N die Prototypenfilterordnung ist. Wenn ein reell bewertetes diskretes Zeitsignal x(v) gegeben ist, werden die Teilbandsignale vk(n) durch Filterung (Konvolution) von x(v) mit hk(v) und durch nachfolgende Abwärtsabtastung des Ergebnisses um einen Faktor M erhalten (siehe das linke Seitenband in 6).
  • Ein Synthesevorgang besteht zunächst aus der Aufwärtsabtastung der QMF-Teilbandsignale um einen Faktor M, wonach eine Filterung mit komplexen modulierten Filtern vom Typ (1) und Addierung der Ergebnisse folgt, und wobei zum Schluss zweimal den reellen Teil genommen wird (siehe den rechten Teil in 6). Danach kann eine fast einwandfreie Rekonstruktion der reell bewerteten Signal durch einen geeigneten Entwurf eines reell bewerteten linearen Phasenprototypfilters p(v) erhalten werden. Die Größenreaktion des Prototypfilters, wie dieses in dem SBR-System der MPEG-4 Norm (oben genannt) im Falle von 64 Bändern verwendet wird, ist in 7 dargestellt. Die Größenreaktion der 64 komplexen modulierten Analysenfilter wird durch Verschiebung der Größenreaktion des Prototypenfilters p(v) by
    Figure 00070001
    rhalten. Ein teil dieser Reaktionen ist in 8 dargestellt. Es sei bemerkt, dass nur die positiven Frequenzen gefiltert werden, ausgenommen für k = 0 und k = M – 1. Dadurch sind die Teilbandsignale vor der Abwärtsabtastung nahezu analytisch, was Amplituden- und Phasenmodifikationen reell bewerteter Sinuskurven ermöglicht. Phasenmodifikationen sind auch für das erste und das letzte Band möglich, solange die Sinuskurven, die in diesen Bändern liegen, eine Frequenz haben, die über π/2M oder unterhalb π – π/2M liegt. Für Frequenzen außerhalb dieses Gebietes verschlechtert die Leistung der Phasenmodifikation schnell, und zwar wegen Interferenz der negativen Frequenzen.
  • Ausgehend von QMF-Analysenfiltern, wie oben beschrieben, wird in Ausführungsformen der vorliegenden Erfindung eine feinere Frequenzauflösung dadurch erhalten, dass jedes abwärts abgetastete Teilbandsignal vk(n) zu Qk weiter gefiltert wird. Nachstehend werden die Eigenschaften der weiteren Teilbandfilterung hergeleitet.
  • Signalmodifikation in einer komplexen QMF-Teilbanddomäne
  • Nachstehend wird vorausgesetzt, dass
    Figure 00070002
    die diskrete Zeit Fourier-Transformation eines diskreten Zeitsignals z(n) ist. Es wird die nahezu einwandfreie Rekonstruktionseigenschaft, wie oben genannt, und auch der Entwurf, wobei P(ω), die Fourier-Transformation p(v), im Wesentlichen aus dem Frequenzintervall [–π/M, n/M] verschwindet, was für das Prototypfilter p(v) der Fall ist, wie oben dargestellt, wobei nun der nächste Schritt hier ist, ein System zu betrachten, wobei die Teilbandsignale vk(n) vor der Synthese modifiziert werden. Nun wird vorausgesetzt, dass jedes Teilband k durch Filterung mit einem Filter Bk(ω) modifiziert wird. Mit der bestehenden Definition Bk(ω) = B-1-k(–ω)* for k < 0 (2)
  • Wobei der Stern eine komplexe Konjugation bedeutet, kann dargelegt werden (wobei eine gesamte Verzögerung vernachlässigt wird, unter der Voraussetzung einer reell bewerteten Eingangssignals und eines Einzelratensystems), dass das resultierende System mit Filterbanksynthese einer Filterung mit dem nachfolgenden Filter entspricht:
    Figure 00080001
  • Entsprechend der Hypothese in Bezug auf die Eigenschaften von P(ω), wobei Bk(ω) = 1 für alle k in (3) zu B(ω) = 1 führt, eingefügt wird, und eine quadratische Summenidentität für die verschobenen Prototypenreaktionen folgt. Durch die Wahl von reell bewerteten Konstanten Bk(ω) = bk≥ 0 ist das System als Entzerrer wirksam, der die Verstärkungswerte bk bei den Frequenzen π(k + 1/2)/M interpoliert. Das interessante Merkmal ist, dass das Gesamtsystem zeitinvariant ist, d.h. ohne Aliasing-Effekt, trotz der Anwendung von Abwärts- und Aufwärtsabtastung. Dies gilt selbstverständlich nur bis zum Betrag der Abweichung von den genannten Prototypenfilterhypothesen.
  • Um ein Mono Audiosignal herzuleiten, soll eine zusätzliche Teilfilterung der komplexen Teilbandsignale nicht nur diese Eigenschaften aufbewahren, sondern auch diese Eigenschaften auf Manipulation der gefilterten Teilbandsignale erweitern. Teilfilterung, welche diese Eigenschaften beibehält, kann durchgeführt werden, und zwar unter Anwendung von Modifikation so genannter M. Bandfilter, wie an sich aus P.P. Vaidyanathan "Multirate systems and filter banks", Prentice Hall Signal Processing Series, 1993, Abschnitte 4.6.1–4.6.2.
  • Modulierte Filterbanken mit unbedeutender Synthese
  • Ein diskretes Zeitsignal v(n) kann durch eine Bank mit Filtern mit Impulsantworten gq(n), q = 0,1, .., Q – 1, in Q verschiedene Signale aufgeteilt werden. Dies ist in 9 dargestellt.
  • Es wird vorausgesetzt, dass die entsprechenden Analysenausgänge yq(n) sind und es wird nun die unbedeutende Synthese betrachtet:
    Figure 00090001
  • Eine Einwandfreie Rekonstruktion y(n) = v(n), wird danach durch eine derartige Wahl der Filter erhalten, dass
    Figure 00090002
  • Wobei δ(n) = 1 ist, wenn n = 0 ist, und δ(n) = 0 ist, wenn n ≠ 0 ist. Für Kausalfilter sollte die rechte Seite von (5) durch δ(n – d) ersetzt werden, wobei d eine positive Verzögerung ist, aber auf diese einfache Modifikation wird der Deutlichkeit der Erläuterung halber verzichtet.
  • Die Filter gq(n) können als komplexe Mudulationen eines Prototypenfilters g(n) gewählt werden, durch
    Figure 00090003
  • In dieser bevorzugten Ausführungsform der vorliegenden Erfindung werden die Filter unregelmäßig gestapelt (der Faktor q + 1/2). Ein Vorteil dieser bevorzugten Ausführungsform wird nachher noch näher erläutert. Eine einwandfreie Rekonstruktion (5) wird erhalten, wenn und nur wenn g(Qn) = δ(n)/Q. (3)
  • Eine Variation darauf ist die reell bewertete Kosinusmodulation wie
    Figure 00090004
    wobei ein reell bewertetes Prototypenfilter g(m) Folgendes erfüllt: g(2Qn) = δ(n)/Q. (5)
  • Subfilterung der komplex-exponentiellen modulierten Filterbank
  • Ausgehend von den QMF-Analysenfiltern, wie oben beschrieben, wird eine feinere Frequenzauflösung dadurch erhalten, dass jedes abwärts abgetastete Teilbandsignal vk(n) zu Qk Unterteilbändern weiter gefiltert wird, und zwar durch Anwendung einer der modulierten oben stehenden Strukturen (6) oder (8). Die resultierenden Ausgangssignale ykq (n) sollen bemerkt werden und es wird vorausgesetzt, dass gkq (n) die Filterbank beschreibt, die in dem Teilband k angewandt wurde. Wenn Qk = 1 ist gibt es keine Filterung und gk0 (n) = δ(n). Ein typisches Applikationsbeispiel ist der Fall, wobei M = 64 , Q0 = 8 , Qk = 4 für k = 1,2, and Qk = 1 für k > 2.
  • Der kombinierte Effekt der zwei Filterbanken aus x(v) zu ykq (n) kann als Filterung mit den Filtern Fkq (ω) mit einer nachfolgenden Abwärtsabtastung um einen Faktor M beschrieben werden, wobei Fkq (ω) = Hk(ω)Gkq (Mω). (6)
  • Wenn die Prototypenfilterreaktion P(ω) wesentlich Null ist außerhalb des Intervalls [–π/M, π/M], was der Fall ist für die SBR Analysenfilter (siehe 7), dann hat das Filter Fkq (ω) eine einzelne nominale Mittenfrequenz, definiert in dem komplexen modulierten Fall durch ωk,q = 2π(q + Qks + 1/2)/(MQk), (11)wobei s eine ganze Zahl ist, derart gewählt, dass Qk (k – 1/2) ≤ 2(q + Qks) + 1 ≤ Qk (k + 3/2) Wie beispielsweise in 10 dargestellt, wenn k = 0 ist und Q0 = 8 ist, sind die Werte von ω0,0, ω0,1, ..., ω0,7
    Figure 00100001
  • Signalmodifikation mit einer nicht einheitlichen Frequenzauflösung
  • Die Einfügung von Unterteilbandfiltern, wie oben beschrieben, führt keine weitere Abwärtsabtastung ein, so dass die Aliasing-freie Leistung der Signalmodifikation, wie oben nur im Falle der komplexen QMF dargestellt, aufbewahrt wird. Es wird nun der allgemeine kombinierte Vorgang der M-Teilbandanalyse, die weitere Teilbandfilterung durch Verwendung von Qk, von Unterteilbändern innerhalb des Teilbandes k, Filterung jedes Unterteilbandsignals ykq (n) durch ein Filter Ak,g(ω), Synthese innerhalb jedes Teilbandes k durch Summierung und zum Schluss Synthese durch die M-Band Synthesebank. Die gesamte Übertragungsfunktion eines derartigen Systems wird gegeben durch (3) mit für k ≥ 0,
    Figure 00110001
  • Für ω > π/(2M), ergibt dies
    Figure 00110002
    so dass die Durchführungsreaktion des Unterteilbandes (k, q) wie folgt ist: Gkq (Mω)|P(ω – π(k + 1/2)/M)|2.
  • Für |ω| ≤ π/(2M) soll Acht gegeben werden, und zwar wegen (2). In diesem Frequenzbereich gilt, dass B(ω) = B0(Mω)|P(ω – π/(2M))|2 + B0(–Mω)*|P(ω + π/(2M))|2 (14)und wenn echte Unterteilband Prototypenfilterkoeffizienten vorausgesetzt werden, gilt dass
    Figure 00110003
    so dass, wenn die modifizierenden Filter derart gewählt werden, dass
    Figure 00110004
    dann B0(–Mω)* = B0(Mω) und die quadratische Summenidentität, erwähnt im Zusammenhang mit (3) führt zu B0(–Mω)* = B0(Mω) (17)für |ω| ≤ π/(2M), entsprechend einer Durchführungsreaktion G0q (Mω) für das Unterteilband (0, q).
  • Die Gleichungen (15) bis (17) geben den Wunsch zum Unterscheiden zwischen positiven und negativen Frequenzen an. Dies ist der Grund, weshalb unregelmäßig gestapelte (komplexe) Filter zur Teilfilterung der QMF-Unterteilbandsignale statt der regelmäßig gestapelter (komplexer) Filter verwendet erden (siehe 11). Für gleichmäßig gestapelte Filter ist es nicht möglich, Phasenmodifikationen der Sinuskurven in dem zentralen Filter anzuwenden, d.h. in dem Filter mit einer Mittenfrequenz gleich Null, da es dort nicht zwischen positiven und negativen Frequenzen unterscheiden kann. Es wird nun ein Prototypenfilter mit einer Reaktion G(ω) vorausgesetzt, dessen Band auf [–2π/Q,2π/Q] begrenzt ist, wobei Q die Anzahl Bänder ist, für den gleichmäßig gestapelten Fall, ist die untere Grenze, auf die Phasenmodifikationen nahezu angewandt werden können, 2π/Q, während für den unregelmäßig gestapelten Fall die untere Grenze, auf die Phasenmodifikationen nahezu angewandt werden können, π/Q ist.
  • Wie eingangs erwähnt, sind für PS Synthese wichtige Spezialfälle Entzerrung und Phasenmodifikation. Für Entzerrung Ak,q(ω) = ak,q ≥ 0 und die Bedingung (16) reduziert auf
    Figure 00120001
  • Der Phasenmodifikationsfall entspricht Ak,q(ω) = exp(iαk,q) wobei in diesem Fall die Bedingung (16) erfüllt wird, wenn
    Figure 00120002
  • Stereo-Parameterschätzung
  • Die nicht einheitliche komplexe Filterbank, d.h. die QMF-Bank, der die weitere Teilbandfilterung, wie oben beschrieben, kann angewandt werden um die Stereoparameter IID ("Inter-channel Intensity Differences"), IPD ("Inter-channel Phase Differences und ICC ("Inter-channel Cross Correlation", wie nachstehend dargestellt, zu schätzen. Es sei bemerkt, dass in dieser speziellen Ausführungsform IPD als praktisch gleichwertigen Ersatz für die ITD verwendet wird, die in der Veröffentlichung von Schuijers u. a. verwendet wird. In dem kombinierten PS Codierer (siehe 4) werden die ersten drei komplexen QMF Kanäle teilgefiltert, so dass insgesamt 77 komplex bewertete Signale erhalten werden (siehe 12).
  • Von diesem Punkt aus werden die 77 komplex bewerteten, zeitlich ausgerichteten linken und rechten Unterteilbandsignale wie folgt bezeichnet: lkq (n) bzw. rkq (n), und zwar entsprechend der Indexierung von ykq (n).
  • Zum Schätzen der Stereoparameter an einer bestimmten Teilbandabtaststelle n' werden die linke, rechte und nicht normalisierte Kreuzkanalanregung wie folgt berechnet:
    Figure 00130001
    für jedes Stereo-Bin b, ist h(n) das Teilbanddomänenfenster mit der Länge L, ε ein sehr kleiner Wert, der Teilung durch Null vermeidet (beispielsweise ε = 1e – 10 ) und lkq (n) und rkq (n) das linke und rechte Unterteilband-Domänensignal. Im Falle von 20 Stereo-Bins geht die Summierung über k von ki bis einschließlich kh und q von q1 bis einschließlich qh wie in der Tabelle dargestellt. Es sei bemerkt, dass die "negativen" Frequenzen (beispielsweise k = 0 mit q = 4...7) nicht in die Parameterschätzung von (20) eingeschlossen sind.
  • Tabelle 1: Start- und Stop-Indizes der Summierung über k und q
    Figure 00130002
  • Figure 00140001
  • Die Summierungen zum Berechnen von el(b), er(b) und eR(b) werden derart ausgerichtet, dass der Mittelpunkt dieser Signale in der Summierung mit der Parameterstelle zusammenfällt, daher die Verschiebung um
    Figure 00140002
    Wie aus der Tabelle 1 hervorgeht, werden nur Unterteilbandsignale und Teilbandsignale mit einer positiven Mittenfrequenz zum Schätzen von Stereoparametern verwendet.
  • Die IID, bezeichnet als I(b), die ICC, bezeichnet als C(b) und die IPD, bezeichnet als P(b) für jedes Stereo-Bin b wird berechnet als:
    Figure 00140003
  • Der Winkel in der Gleichung P(b) = ⦟eR(b) wird unter Verwendung der vier Quadranten Arcustangensfunktion, die Werte zwischen –π und π gibt, berechnet. Je nach Zielbitrate und Applikation werden diese Parameter oder ein Subsatz dieser Parameter quantisiert und in den PS Teil des Bitstroms codiert.
  • Stereosignalsynthese
  • Um die Rechenkosten (in Termen von RAM-Benutzung) in dem Decoder möglichst niedrig zu halten, wird eine ähnliche Analysenstruktur verwendet. Das erste Band aber ist nur teilweise komplex (siehe 13). Dies wird durch Summierung der Mittenbandpaare G02 (ω) und G05 (ω) und G03 (ω) und G04 (ω) erhalten. Weiterhin sind das zweite und das dritte Band reell bewertete Doppelbandfilterbanken, die durch Summierung des Ausgangssignals von G0k (ω) und des Ausgangssignals Gk3 (ω) und durch Summierung von Gk1 (ω) und Gk2 (ω) erhalten werden (siehe auch die Beschreibung in dem Abschnitt über modulierte Filterbanken). Unter Anwendung dieser Vereinfachung der Decoderfilterbankstruktur wird dennoch das unterscheidende Merkmal zwischen positiven und negativen Frequenzen beibehalten durch Unterteilung des ersten Teilbandfilters. Die Decoderanalysenfilterbank ist in 13 dargestellt. Es sei bemerkt, dass die Indexierung der ersten QMF gefilterten (Unter)Teilbandsignale nach der Frequenz sortiert ist.
  • Die Stereo-(Unter)Teilbandsignale eines einzigen Frames sind wie folgt konstruiert: lk(n) = Λ11sk(n) + Λ21dk(n) rk(n) = Λ12sk(n) + Λ22dk(n) (22)
    Figure 00150001
    wobei Sekundärknoten(n) die Mono (Unter)Teilbandsignale sind und dk(n) die Mono dekorrelierten (Unter)Teilbandsignale sind, die von den Mono (Unter)Teilbandsignalen hergeleitet werden, um Synthetisierung der ICC Parameter zu berücksichtigen, wobei k = 0, ... ,K – 1 der Teilbandindex ist (K ist die gesamte Anzahl Teilbänder, d.h. K = 71), QMF Teilbandabtastindex n = 0, ... N – 1 wobei N die Anzahl Teilbandabtastwerte eines Frames ist, wobei Λ11, Λ12, Λ21, A22 die Skalierungsfaktormanipulationsmatrizes sind und wobei Prt die Phasenrotationsmanipulationsmatrix ist. Die Manipulationsmatrizes sind als eine Funktion der Zeit und der Frequenz definiert und können einfach aus den Manipulationsvektoren hergeleitet werden, wie in der MPEG-4 Norm ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, "Coding of Moving Pictures and Audio", Erweiterung 2 beschrieben worden ist.
  • sk(n) wird entsprechend 12 definiert, resultierend in 13: s0(n) = y06 (n) s1(n) = y07 (n) s2(n) = y00 (n) s3(n) = y01 (n) s4(n) = y02 (n) + y05 (n) s5(n) = y03 (n) + y04 (n) s6(n) = y01 (n) + y13 (n) s7(n) = y11 (n) + y12 (n) s8(n) = y20 (n) + y23 (n) s9(n) = y21 (n) + y22 (n) sk(n) = yk-70 (n) k = 10...70
  • Synthese der Stereo Parameter erfolgt entsprechend der Indexierung der Tabelle 1.
  • Tabelle 1: Parameterindexierungstabelle
    Figure 00160001
  • Figure 00170001
  • Die Synthesengleichungen sehen auf diese Weise wie folgt aus: lk (n) = Λ11(i(k), n)sk(n) +Λ21(i(k), n)dk(n) rk (n) = Λ12(i(k), n)sk(n) + Λ22(i(k), n)dk(n) (25)
    Figure 00170002
  • Es sei bemerkt, dass das Vorzeichen von Prt sich in den oben stehenden Gleichungen ändert, wenn ein Asterisk in der Tabelle gefunden wird. Dies ist entsprechend der Gleichung (19), d.h. die inverse Phasendrehung soll für die negativen Frequenzen angewandt werden.
  • Effiziente Implementierung modulierter Filterbanken mit trivialer Synthese
  • Wenn eine modulierte Filterbank mit einem Prototypenfilter der Länge L vorausgesetzt wird, würde eine direkte Formimplementierung QL Vorgänge je Eingangsabtastwert erfordern, aber die Tatsache, dass die Modulation in (6) antiperiodisch zu der Periode Q ist, kann verwendet werden um die Filterung in eine Polyphasenfensterung von L Vorgängen aufzuteilen, wonach eine Transformation der Größe Q für jeden Eingangsabtastwert folgt. Es sei bemerkt, dass eine Polyphasendarstellung an sich aus P.P. Vaidyanathan "Multirate systems and filter banks", "Prentice Hall Signal Processing Series", 1993, Abschnitt 4.3) bekannt ist. Untenstehendes schafft eine vorteilhafte Applikation einer derartigen Polyphasendarstellung nach einer bevorzugten Ausführungsform der vorliegenden Erfindung.
  • Die Transformation ist eine DFT mit nachfolgender Phasendrehung, die von der Größenordnung Qlog2Q ist, wenn Q die zweite Potenz ist. Eine derart große Einsparung wird in typischen Fällen erreicht, wenn L viel größer ist als log2Q. In dem reell modulierten Fall (8) kann Antiperiodizität der Periode 2Q kombiniert mit geraden/ungeraden Symmetrien um n = 0 und n = Q wieder zur Polyphasenfensterung verwendet werden und der Transformationskern ist eine DCT vom Typ III. Eine detaillierte Beschreibung für den Fall einer komplexen Modulation wird unten gegeben.
  • Eine effektive Implementierung der Unterteilfilterung, unter Anwendung von FFT Kernverarbeitung kann unter Anwendung von Polyphasendekomposition des Prototypenfilters mit nachfolgender Modulation verwirklicht werden. Es wird nun ein Prototypenfilter g(n) der Größenordnung N vorausgesetzt, wobei N = mQ ist und wobei m ein positive ganze Zahl ist. Diese Bedingung ist nicht begrenzend, da ein Prototypenfilter einer beliebigen Größenordnung Null-gepolstert sein kann um die Beschränkung zu erfüllen. Die Z-Transformation des Prototypenfilters, entworfen zur Verwendung in einem komplexen modulierten System (6) ist:
    Figure 00180001
  • Dies kann in Polyphasennotierung ausgedrückt werden wie:
    Figure 00180002
    wobei
  • Figure 00180003
  • Alle Filter der Filterbank sind frequenzmodulierte Versionen des Prototypenfilters. Die Z-Transformation des Filters gq(n) wird gegeben durch:
    Figure 00180004
    wobei
  • Figure 00180005
  • Der Ausdruck für das Ausgangssignal eines einzigen Filters ist:
    Figure 00180006
  • Durch Identifikation der Elemente der letzten Summe ist ersichtlich, dass die Polyphasenelemente verzögerte Versionen des Eingangssignals verarbeiten, die danach mit einer exponentiellen Größe multipliziert werden. Zum Schluss werden alle Ausgangssignale Yq(z), q = 0...Q – 1 dadurch gefunden, dass eine invertierte FFT (ohne Skalierungsfaktor) angewandt wird. 14 zeigt das Layout für die Analysenfilterbank. Da die Polyphasenfilter in (29) nicht-kausal sind, soll ein wesentlicher Betrag an Verzögerung zu allen Polyphasenelementen hinzugefügt werden.
  • Es sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende Erfindung mehr illustrieren als begrenzen und dass der Fachmann imstande sein wird, im Rahmen der beiliegenden Patentansprüche viele alternative Ausführungsformen zu entwerfen. In den Ansprüchen sollen eingeklammerte Bezugszeichen nicht als den Anspruch begrenzend betrachtet werden. Das Wort "umfassen" schließt das Vorhandensein anderer Elemente oder Schritte als diejenigen, die in einem Anspruch genannt sind, nicht aus. Die vorliegende Erfindung kann mit Hilfe von Hardware mit vielen einzelnen Elementen und mit Hilfe eines auf geeignete Art und Weise programmierten Computers implementiert werden In einem Anordnungsanspruch, worin viele Mittel nummeriert sind, können viele dieser Mittel durch ein und dasselbe Hardware-Item verkörpert werden. Die bloße Tatsache, dass bestimmte Maßnahmen in untereinander verschiedenen Unteransprüchen genannt sind, gibt nicht an, dass eine Kombination dieser Maßnahmen nicht auf vorteilhafte Weise angewandt werden könnte.
  • Text in der Zeichnung
  • 1
    • Nicht einheitliche Filterung
    • Parameterextraktion
  • 2
    • Zeit-Frequenz-Transformation
    • Parameterverarbeitung
    • Frequenz-Zeit-Transformation
  • 3
    • Bitstrom
    • Bitstromdemultiplexer
    • Kerndecoder
    • 32 Band Analysen-QMF
    • Umhüllende-Einstellelement
    • 64 Band Synthese-QMF
    • PCM Ausgang
  • 4
    • PCM links
    • 64 Band Analysen-QMF
    • PS Parameterschätzung + Mono-Abwärtsmischung
    • SBR Parameterschätzung
    • PS-Bitstrom
    • 32 Band Synthese QMF
    • Kerncodierer
    • Kernbitstrom
  • 5
    • Bitstrom
    • Bitstromdemultiplexer
    • Kerndecoder
    • 32 Band Analysen-QMF
    • Umhüllende-Einstellelement
    • Parametrische Stereo Parameter
    • Parametrische Stereo Synthese
    • 64 Band Synthese-QMF
    • Linkskanal PCM
    • Rechtskanal PCM

Claims (24)

  1. Verfahren zum Codieren eines Audiosignals, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst: – Teilbandfilterung des ersten Audiokanals sowie des zweiten Audiokanals in einer komplex modulierten Filterbank zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal und einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal, – Unterabtastung jedes der Teilbandsignale zum Schaffen einer ersten Anzahl unterabgetasteter Teilbandsignale und einer zweiten Anzahl unterabgetasteter Teilbandsignale, – weitere Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Unterteilbandsignale zu schaffen, – Herleitung räumlicher Parameter aus den Unterteilbandsignalen und aus denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden, und – Herleitung eines Einkanalaudiosignals mit hergeleiteten Teilbandsignalen, hergeleitet aus der ersten Anzahl unterabgetasteter Teilbandsignale und der zweiten Anzahl unterabgetasteter Teilbandsignale.
  2. Verfahren nach Anspruch 1, wobei für jedes Teilband, das weiter teilbandgefiltert wird, die Unterteilbandsignale nach Skalierung und/oder Phasendrehung zusammengefügt werden, und zwar zum Bilden eines neuen Teilbandsignals, und wobei das Einkanalaudiosignal aus diesen neuen Teilbandsignalen und den unterabgetasteten Teilbandsignalen, die nicht weiter gefiltert werden, hergeleitet werden.
  3. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterung an wenigstens dem Teilbandsignal mit der niedrigsten Frequenz der ersten Anzahl unterabgetasteter Teilbandsignale und an dem Teilbandsignal mit der niedrigsten Frequenz der zweiten Anzahl unterabgetasteter Teilbandsignale durchgeführt wird.
  4. Verfahren nach Anspruch 3, wobei die weitere Teilbandfilterung weiterhin an wenigstens dem Teilbandsignal mit der zweitniedrigsten Frequenz der ersten Anzahl unterabgetasteter Teilbandsignale und an dem Teilbandsignal mit der zweitniedrigsten Frequenz der zweiten Anzahl unterabgetasteter Teilbandsignale durchgeführt wird.
  5. Verfahren nach Anspruch 4, wobei die Anzahl Unterteilbänder in den Teilbandsignalen mit der niedrigsten Frequenz gröber ist als die Anzahl Unterteilbänder in den Teilbandsignalen mit der zweitniedrigsten Frequenz.
  6. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank wenigstens teilweise eine komplex modulierte Filterbank ist.
  7. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank wenigstens teilweise eine reell bewertete kosinusmodulierte Filterbank ist.
  8. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank eine unüblich gestapelte Filterbank ist.
  9. Verfahren nach Anspruch 1, wobei die Unterteilbandsignale nicht weiter unterabgetastet werden.
  10. Verfahren nach Anspruch 1, wobei das Einkanal-Audiosignal in der Bandbreite begrenzt ist und weiter codiert ist und wobei Spektralband-Replikationsparameter von der ersten Anzahl unterabgetasteter Teilbandsignale und/oder der zweiten Anzahl unterabgetasteter Teilbandsignale hergeleitet werden.
  11. Audiocodierer zum Codieren eines Audiosignals, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei der Codierer die nachfolgenden Elemente aufweist: – eine erste komplex modulierte Filterbank zur Teilbandfilterung des ersten Audiokanals zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal, – eine zweite komplex modulierte Filterbank zur Teilbandfilterung des zweiten Audiokanals zum Schaffen einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal, – Mittel zum Unterabtasten jedes der Teilbandsignale zum Schaffen einer ersten Anzahl unterabgetasteter Teilbandsignale und einer zweiten Anzahl unterabgetasteter Teilbandsignale, – eine weitere Filterbank zur weiteren Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale, zum Schaffen einer Anzahl Unterteilbandsignale, – Mittel zum Herleiten räumlicher Parameter von den Unterteilbandsignalen und von denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter unterabgetastet werden, und – Mittel zum Herleiten eines Einkanal-Audiosignals mit hergeleiteten Teilbandsignalen, hergeleitet von der ersten Anzahl unterabgetasteter Teilbandsignale und der zweiten Anzahl unterabgetasteter Teilbandsignale.
  12. Anordnung zum Übertragen oder Speichern eines codierten Audiosignals auf Basis eines Eingangs-Audiosignals, wobei die Anordnung die nachfolgenden Elemente umfasst: – eine Eingangseinheit zum Empfangen eines Eingangs-Audiosignals, – einen Audiocodierer nach Anspruch 11 zum Codieren des Eingangs-Audiosignals zum Erhalten eines codierten Audiosignals, – einen Kanalcodierer zum weiteren Codieren des codierten Audiosignals in ein Format, das zum Übertragen oder Speichern geeignet ist.
  13. Verfahren zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal ein codiertes Einkanalaudiosignal und einen Satz räumlicher Parameter aufweist, wobei das Decodierverfahren die nachfolgenden Verfahrensschritte umfasst: – das Decodieren des codierten Einkanalaudiosignals zum Erhalten einer Anzahl unterabgetasteter Teilbandsignale, – weitere Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Unterteilbandsignale zu schaffen, und – das Herleiten zweier Audiokanäle aus den räumlichen Parametern, den Unterteilbandsignale und denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden.
  14. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterung an we nigstens dem Teilbandsignal der Anzahl unterabgetasteter Teilbandsignale mit der niedrigsten Frequenz durchgeführt wird.
  15. Verfahren nach Anspruch 14, wobei die weitere Teilbandfilterung weiterhin an wenigstens dem Teilbandsignal der Anzahl unterabgetasteter Teilbandsignale mit der zweitniedrigsten Frequenz durchgeführt wird.
  16. Verfahren nach Anspruch 15, wobei die Anzahl Unterteilbänder in den Teilbandsignalen mit der niedrigsten Frequenz höher ist als die Anzahl Unterteilbänder in den Teilbandsignalen mit der zweitniedrigsten Frequenz.
  17. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank wenigstens teilweise eine komplex modulierte Filterbank ist.
  18. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank wenigstens teilweise eine reell bewertete Kosinusmodulierte Filterbank ist.
  19. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank eine unüblich gestapelte Filterbank ist.
  20. Verfahren nach Anspruch 13, wobei in dem Teilband mit der niedrigsten Frequenz Phasenänderungen gegenüber Unterteilbandsignalen mit einer negativen Mittenfrequenz in der Zeitdomäne dadurch ermittelt werden, dass das Negative der Phasenänderung genommen wird, die auf ein Unterteilbandsignal mit einer positiven Mittenfrequenz angewandt wurde, das im Absolutwert der genannten negativen Mittenfrequenz am nächsten liegt.
  21. Verfahren nach Anspruch 13, wobei das codierte Audiosignal Spektralband-Replikationsparameter aufweist und wobei ein HF-Anteil von der Anzahl unterabgetasteter Teilbandsignale und den Spektralband-Replikationsparametern hergeleitet wird, und wobei die zwei Audiokanäle von den räumlichen Parametern, den Unterteilbandsignalen, denjenigen unterangetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden und dem HF-Anteil hergeleitet werden.
  22. Audiodecoder zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal ein codiertnes Einkanal-Audiosignal und einen Satz räumlicher Parameter aufweist, wobei der Audiodecoder die nachfolgenden Elemente umfasst: – einen Decoder zum Decodieren des codierten Einkanalaudiosignals zum Erhalten einer Anzahl unterabgetasteter Teilbandsignale, – eine weitere Filterbank zur weiteren Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank zum Schaffen einer Anzahl Unterteilbandsignale, und – Mittel zum Herleiten zweier Audiokanäle aus den räumlichen Parametern, den Unterteilbandsignalen und diejenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden.
  23. Anordnung zum Wiedergeben eines Ausgangsaudiosignals, wobei diese Anordnung Folgendes umfasst: – eine Eingangseinheit zum Erhalten eines codierten Audiosignals, – einen Audiodecoder nach Anspruch 22 zum Decodieren des codierten Audiosignals zum Erhalten des Ausgangsaudiosignals, und – eine Wiedergabeeinheit, wie einen Lautsprecher- oder Kopfhörerausgang zum Wiedergeben des Ausgangsaudiosignals.
  24. Computerprogrammprodukt mit einem Code zum Instruieren eines Computers zum Durchführen der Verfahrensschritte nach Anspruch 1 oder 13.
DE602004004818T 2003-10-30 2004-10-28 Audiosignalcodierung oder -decodierung Active DE602004004818T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03104034 2003-10-30
EP03104034 2003-10-30
PCT/IB2004/052226 WO2005043511A1 (en) 2003-10-30 2004-10-28 Audio signal encoding or decoding

Publications (2)

Publication Number Publication Date
DE602004004818D1 DE602004004818D1 (de) 2007-03-29
DE602004004818T2 true DE602004004818T2 (de) 2007-12-06

Family

ID=34530779

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004004818T Active DE602004004818T2 (de) 2003-10-30 2004-10-28 Audiosignalcodierung oder -decodierung

Country Status (12)

Country Link
US (3) US7519538B2 (de)
EP (1) EP1683133B1 (de)
JP (4) JP4966013B2 (de)
KR (2) KR101217649B1 (de)
CN (2) CN101540171B (de)
AT (1) ATE354160T1 (de)
BR (2) BR122018007834B1 (de)
DE (1) DE602004004818T2 (de)
ES (1) ES2282899T3 (de)
PL (1) PL1683133T3 (de)
RU (1) RU2374703C2 (de)
WO (1) WO2005043511A1 (de)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
JP4939424B2 (ja) * 2004-11-02 2012-05-23 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化
JPWO2006059567A1 (ja) * 2004-11-30 2008-06-05 松下電器産業株式会社 ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
EP1905004A2 (de) * 2005-05-26 2008-04-02 LG Electronics Inc. Verfahren zum codieren und decodieren eines audiosignals
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007004831A1 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8082157B2 (en) 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101248483B (zh) 2005-07-19 2011-11-23 皇家飞利浦电子股份有限公司 多声道音频信号的生成
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
JP5108767B2 (ja) * 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP5173811B2 (ja) * 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR100857111B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
ES2478004T3 (es) * 2005-10-05 2014-07-18 Lg Electronics Inc. Método y aparato para decodificar una señal de audio
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US7752053B2 (en) * 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
TWI329462B (en) 2006-01-19 2010-08-21 Lg Electronics Inc Method and apparatus for processing a media signal
EP1974344A4 (de) 2006-01-19 2011-06-08 Lg Electronics Inc Verfahren und anordnung zum kodieren eines signals
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP5054035B2 (ja) 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
EP1999747B1 (de) 2006-03-29 2016-10-12 Koninklijke Philips N.V. Dekodierung von audiosignalen
US7612275B2 (en) * 2006-04-18 2009-11-03 Nokia Corporation Method, apparatus and computer program product for providing rhythm information from an audio signal
US7818079B2 (en) * 2006-06-09 2010-10-19 Nokia Corporation Equalization based on digital signal processing in downsampled domains
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
EP2337224B1 (de) * 2006-07-04 2017-06-21 Dolby International AB Filtereinheit und Verfahren zur Erzeugung von Subbandfilter-Impulsreaktionen
US7876904B2 (en) 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP5171842B2 (ja) 2006-12-12 2013-03-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8655663B2 (en) * 2007-10-26 2014-02-18 D&M Holdings, Inc. Audio signal interpolation device and audio signal interpolation method
EP2215629A1 (de) * 2007-11-27 2010-08-11 Nokia Corporation Mehrkanalige audiocodierung
CA2708861C (en) 2007-12-18 2016-06-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2077550B8 (de) * 2008-01-04 2012-03-14 Dolby International AB Audiokodierer und -dekodierer
AU2009221443B2 (en) * 2008-03-04 2012-01-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
TWI662788B (zh) 2009-02-18 2019-06-11 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
AU2016262695B2 (en) * 2009-02-18 2017-11-09 Dolby International Ab Low Delay Modulated Filter Bank
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
AU2012204119B2 (en) * 2009-04-03 2014-04-03 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5365363B2 (ja) * 2009-06-23 2013-12-11 ソニー株式会社 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
ES2805349T3 (es) 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
CN102667920B (zh) * 2009-12-16 2014-03-12 杜比国际公司 Sbr比特流参数缩混
KR102020334B1 (ko) * 2010-01-19 2019-09-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
CA3097372C (en) 2010-04-09 2021-11-30 Dolby International Ab Mdct-based complex prediction stereo coding
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
MX2012001696A (es) 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN103155033B (zh) * 2010-07-19 2014-10-22 杜比国际公司 高频重建期间的音频信号处理
BR122021003884B1 (pt) 2010-08-12 2021-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
CA3191597C (en) 2010-09-16 2024-01-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
EP2477188A1 (de) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierung und Decodierung von Slot-Positionen von Ereignissen in einem Audosignal-Frame
PL2676265T3 (pl) 2011-02-14 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do kodowania sygnału audio z stosowaniem zrównanej części antycypacji
BR112013020482B1 (pt) * 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP3544006A1 (de) 2011-11-11 2019-09-25 Dolby International AB Upsampling durch überabgetastete sbr
EP2828854B1 (de) 2012-03-23 2016-03-16 Dolby Laboratories Licensing Corporation Aktive hierarchische spracherkennung
US9601122B2 (en) * 2012-06-14 2017-03-21 Dolby International Ab Smooth configuration switching for multichannel audio
EP3528249A1 (de) 2013-04-05 2019-08-21 Dolby International AB Stereoaudiocodierer und -decodierer
EP3742440B1 (de) 2013-04-05 2024-07-31 Dolby International AB Audiodecodierer zur verschachtelten wellenformcodierung
EP2830053A1 (de) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mehrkanaliger Audiodecodierer, mehrkanaliger Audiocodierer, Verfahren und Computerprogramm mit restsignalbasierter Anpassung einer Beteiligung eines dekorrelierten Signals
EP2830052A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiodecodierer, Audiocodierer, Verfahren zur Bereitstellung von mindestens vier Audiokanalsignalen auf Basis einer codierten Darstellung, Verfahren zur Bereitstellung einer codierten Darstellung auf Basis von mindestens vier Audiokanalsignalen und Computerprogramm mit Bandbreitenerweiterung
EP2830061A1 (de) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Codierung und Decodierung eines codierten Audiosignals unter Verwendung von zeitlicher Rausch-/Patch-Formung
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
KR102318581B1 (ko) * 2014-06-10 2021-10-27 엠큐에이 리미티드 오디오 신호의 디지털 캡슐화
EP2963646A1 (de) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodierer und Verfahren zur Decodierung eines Audiosignals, Codierer und Verfahren zur Codierung eines Audiosignals
EP3192282A1 (de) * 2014-09-12 2017-07-19 Dolby Laboratories Licensing Corp. Rendering von audioobjekten in einer wiedergabeumgebung mit surround- und/oder höhenlautsprechern
US9837065B2 (en) 2014-12-08 2017-12-05 Ford Global Technologies, Llc Variable bandwidth delayless subband algorithm for broadband active noise control system
EP3067889A1 (de) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und vorrichtung zur transformation für signal-adaptive kernelschaltung bei der audiocodierung
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10672408B2 (en) 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
WO2017124007A1 (en) * 2016-01-15 2017-07-20 Dolby Laboratories Licensing Corporation Audio signal processing with low latency
EP3203472A1 (de) * 2016-02-08 2017-08-09 Oticon A/s Monaurale sprachverständlichkeitsprädiktoreinheit
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
PL3707706T3 (pl) * 2017-11-10 2021-11-22 Nokia Technologies Oy Określanie kodowania przestrzennego parametrów dźwięku i związane z tym dekodowanie
CN107918710B (zh) * 2017-11-22 2020-11-06 桂林电子科技大学 基于凸优化的非下采样图滤波器组的设计方法
CN108806705A (zh) * 2018-06-19 2018-11-13 合肥凌极西雅电子科技有限公司 音频处理方法和处理系统
US11195543B2 (en) * 2019-03-22 2021-12-07 Clear Peaks LLC Systems, devices, and methods for synchronizing audio
CN113314132B (zh) * 2021-05-17 2022-05-17 武汉大学 交互式音频系统中的音频对象编码方法、解码方法及装置
CN117292694B (zh) * 2023-11-22 2024-02-27 中国科学院自动化研究所 基于时不变编码的少令牌神经语音编解码方法和系统

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3211752C2 (de) 1982-03-30 1985-09-26 Siemens AG, 1000 Berlin und 8000 München Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung
JPS621228A (ja) 1985-06-26 1987-01-07 Fujitsu Ltd タングステンシリサイドの選択成長方法
US4692343A (en) 1985-08-05 1987-09-08 Spectrum Cvd, Inc. Plasma enhanced CVD
US4737474A (en) 1986-11-17 1988-04-12 Spectrum Cvd, Inc. Silicide to silicon bonding process
US4902645A (en) 1987-08-24 1990-02-20 Fujitsu Limited Method of selectively forming a silicon-containing metal layer
DE69127842T2 (de) * 1990-03-09 1998-01-29 At & T Corp Hybride wahrnehmungsgebundene Kodierung von Audiosignalen
JPH0410429A (ja) 1990-04-26 1992-01-14 Matsushita Electron Corp 半導体装置
JP2892451B2 (ja) 1990-07-13 1999-05-17 住友重機械工業株式会社 電気―空気サーボアクチュエータ
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5392037A (en) * 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
JP2778324B2 (ja) * 1992-01-24 1998-07-23 日本電気株式会社 サブバンド分割方式
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5926791A (en) * 1995-10-26 1999-07-20 Sony Corporation Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5852806A (en) * 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
EP1423847B1 (de) * 2001-11-29 2005-02-02 Coding Technologies AB Wiederherstellung von hochfrequenzkomponenten
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩

Also Published As

Publication number Publication date
US20090216544A1 (en) 2009-08-27
JP2011128649A (ja) 2011-06-30
JP2007514962A (ja) 2007-06-07
US8260607B2 (en) 2012-09-04
WO2005043511A1 (en) 2005-05-12
EP1683133B1 (de) 2007-02-14
BR122018007834B1 (pt) 2019-03-19
RU2374703C2 (ru) 2009-11-27
JP2013167908A (ja) 2013-08-29
ES2282899T3 (es) 2007-10-16
KR20110113765A (ko) 2011-10-18
JP4966013B2 (ja) 2012-07-04
US8073685B2 (en) 2011-12-06
US20070067162A1 (en) 2007-03-22
RU2006118682A (ru) 2007-12-10
US7519538B2 (en) 2009-04-14
CN101540171B (zh) 2013-11-06
CN101540171A (zh) 2009-09-23
BRPI0415951A8 (pt) 2018-05-02
JP5335015B2 (ja) 2013-11-06
KR20060131745A (ko) 2006-12-20
JP5889828B2 (ja) 2016-03-22
KR101217649B1 (ko) 2013-01-02
BRPI0415951B1 (pt) 2018-08-28
DE602004004818D1 (de) 2007-03-29
EP1683133A1 (de) 2006-07-26
CN1875402B (zh) 2012-03-21
JP5192424B2 (ja) 2013-05-08
US20110178810A1 (en) 2011-07-21
JP2009163257A (ja) 2009-07-23
CN1875402A (zh) 2006-12-06
KR101106026B1 (ko) 2012-01-17
ATE354160T1 (de) 2007-03-15
PL1683133T3 (pl) 2007-07-31
BRPI0415951A (pt) 2007-01-02

Similar Documents

Publication Publication Date Title
DE602004004818T2 (de) Audiosignalcodierung oder -decodierung
DE602004005846T2 (de) Audiosignalgenerierung
DE602006000399T2 (de) Teilweise komplexmodulierte filterbank
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE602005002833T2 (de) Kompensation von multikanal-audio energieverlusten
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE602004005020T2 (de) Audiosignalsynthese
DE602004002390T2 (de) Audiocodierung
EP1647009B1 (de) Vorrichtung und verfahren zum verarbeiten eines signals
DE60317722T2 (de) Verfahren zur Reduzierung von Aliasing-Störungen, die durch die Anpassung der spektralen Hüllkurve in Realwertfilterbanken verursacht werden
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
EP1609084B1 (de) Vorrichtung und verfahren zum umsetzen in eine transformierte darstellung oder zum inversen umsetzen der transformierten darstellung
WO2003088212A1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
EP1654674B1 (de) Vorrichtung und verfahren zum verarbeiten von wenigstens zwei eingangswerten
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
DE69823557T2 (de) Schnelle frequenztransformationstechnik für transform audio koder
DE69522883T2 (de) Vorrichtung zur bestimmung des signalspektrums eines digitalen breitbandsignals und zur ableitung einer bitzuweisungsinformation

Legal Events

Date Code Title Description
8364 No opposition during term of opposition