DE602005002833T2 - Kompensation von multikanal-audio energieverlusten - Google Patents

Kompensation von multikanal-audio energieverlusten Download PDF

Info

Publication number
DE602005002833T2
DE602005002833T2 DE602005002833T DE602005002833T DE602005002833T2 DE 602005002833 T2 DE602005002833 T2 DE 602005002833T2 DE 602005002833 T DE602005002833 T DE 602005002833T DE 602005002833 T DE602005002833 T DE 602005002833T DE 602005002833 T2 DE602005002833 T2 DE 602005002833T2
Authority
DE
Germany
Prior art keywords
energy
channel
conversion
signal
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602005002833T
Other languages
English (en)
Other versions
DE602005002833D1 (de
Inventor
Lars Villemoes
Kristofer KJÖRLING
Heiko Purnhagen
Jonas Röden
Jeroen Breebaart
Gerard Hotho
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Coding Technologies Sweden AB
Original Assignee
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV, Coding Technologies Sweden AB filed Critical Koninklijke Philips Electronics NV
Publication of DE602005002833D1 publication Critical patent/DE602005002833D1/de
Application granted granted Critical
Publication of DE602005002833T2 publication Critical patent/DE602005002833T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)
  • Fats And Perfumes (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Amplifiers (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Manufacturing Of Micro-Capsules (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Electroluminescent Light Sources (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf eine Mehrkanalrekonstruktion von Audiosignalen basierend auf einem verfügbaren Stereosignal und zusätzlichen Steuerdaten.
  • Hintergrund der Erfindung
  • Die jüngste Entwicklung bei einer Audiocodierung hat die Fähigkeit verfügbar gemacht, eine Mehrkanaldarstellung eines Audiosignals basierend auf einem Stereo- (oder Mono-) Signal und entsprechenden Steuerdaten wieder zu erzeugen. Diese Verfahren unterscheiden sich wesentlich von einer älteren matrixbasierten Lösung, wie beispielsweise Dolby Prologic, da zusätzliche Steuerdaten übertragen werden, um die Wiedererzeugung, auch als eine Heraufumsetzung bezeichnet, der Surroundkanäle basierend auf den übertragenen Mono- oder Stereokanälen zu steuern.
  • Daher rekonstruieren die Parametermehrkanalaudiodecodierer N Kanäle basierend auf M übertragenen Kanälen, wobei N > M, und den zusätzlichen Steuerdaten. Die zusätzlichen Steuerdaten stellen eine erheblich niedrigere Datenrate als ein Übertragen der zusätzlichen N – M Kanäle dar, was die Codierung sehr effizient macht, während gleichzeitig eine Kompatibilität sowohl mit M-Kanal-Vorrichtungen als auch N-Kanal-Vorrichtungen sichergestellt ist.
  • Diese Parameter-Surround-Codierverfahren weisen für gewöhnlich eine Parametrisierung des Surroundsignals basierend auf IID (Inter channel Intensity Difference, dt. etwa: Zwischenkanalintensitätsunterschied) und ICC (Inter Channel Coherence, dt. etwa: Zwischenkanalkohärenz) auf. Diese Parameter beschreiben Leistungsverhältnisse und eine Korre lation zwischen Kanalpaaren bei dem Heraufumsetzprozess. Weitere Parameter, die ebenfalls im Stand der Technik verwendet werden, weisen Prädiktionsparameter auf, die verwendet werden, um Zwischen- oder Ausgangskanäle während der Heraufumsetzprozedur vorherzusagen.
  • Eine der ansprechendsten Nutzungen eines prädiktionsbasierten Verfahrens, wie es im Stand der Technik beschrieben ist, besteht für ein System, das einen 5.1-Kanal aus zwei übertragenen Kanälen wiedererzeugt. Bei dieser Konfiguration ist eine Stereoübertragung auf der Decodiererseite verfügbar, die eine Herunterumsetzung des ursprünglichen 5.1-Mehrkanalsignals ist. In diesem Zusammenhang ist es besonders interessant, in der Lage zu sein, den Mitte-Kanal so genau wie möglich aus dem Stereosignal zu extrahieren, da der Mitte-Kanal für gewöhnlich zu sowohl dem Links- als auch dem Rechts-Herunterumsetzkanal herunterumgesetzt ist. Dies wird mittels eines Schätzens zweier Prädiktionskoeffizienten vorgenommen, die die Größe von jedem der zwei übertragenen Kanäle beschreiben, die verwendet werden, um den Mitte-Kanal aufzubauen. Diese Parameter werden für unterschiedliche Frequenzbereiche ähnlich den IID- und ICC-Parametern oben geschätzt.
  • Da jedoch die Prädiktionsparameter kein Leistungsverhältnis von zwei Signalen beschreiben, sondern auf einer Signalverlaufsanpassung in dem Sinn eines geringsten Fehlerquadrats basieren, wird das Verfahren inhärent empfindlich für eine jegliche Modifizierung des Stereosignalverlaufs nach der Berechnung der Prädiktionsparameter.
  • Weitere Entwicklungen bei einer Audiocodierung über die letzten Jahre hinweg haben Hochfrequenzrekonstruktionsverfahren als ein sehr nützliches Werkzeug bei Audiocodecs mit niedrigen Bitraten eingebracht. Ein Beispiel ist SBR (Spectral Band Replication = Spektralbandreplikation) [ WO 98/ 57436 ], die bei MPEG-standardisierten Codecs verwendet werden, wie beispielsweise MPEG-4 High Efficiency AAC.
  • Diesen Verfahren ist gemeinsam, dass dieselben die hohen Frequenzen auf der Decodiererseite aus einem schmalbandigen Signal wiedererzeugen, das durch den zu Grunde liegenden Kern-Codec und eine geringe Menge an zusätzlichen Führungsinformationen codiert ist. Ähnlich dem Fall der parametrischen Rekonstruktion von Mehrkanalsignalen basierend auf einem oder zwei Kanälen, ist die Menge an Steuerdaten, die erforderlich ist, um die fehlenden Signalkomponenten (in dem Fall von SBR die hohen Frequenzen) wiederzuerzeugen, erheblich geringer als die Menge an Daten, die erforderlich wäre, um das gesamte Signal mit einem Signalverlaufscodec zu codieren.
  • Es sollte jedoch klar sein, dass das wiedererzeugte Hochbandsignal wahrnehmungsmäßig dem ursprünglichen Hochbandsignal gleich ist, während sich der tatsächliche Signalverlauf erheblich unterscheidet. Ferner wird bei Signalverlaufscodierern, die Stereosignale mit niedriger Bitrate codieren, üblicherweise eine Stereovorverarbeitung verwendet, was bedeutet, dass eine Begrenzung an dem Seite-Signal der Mitte/Seite-Darstellung des Stereosignals durchgeführt wird.
  • Wenn eine Mehrkanaldarstellung basierend auf einem Stereocodecsignal unter Verwendung von MPEG-4 High Efficiency AAC oder irgendeinem anderen Codec erwünscht ist, der Hochfrequenzrekonstruktionstechniken verwendet, müssen diese und andere Aspekte des Codecs, der verwendet wird, um das herunterumgesetzte Stereosignal zu codieren, betrachtet werden.
  • Ferner ist es üblich, dass es für eine Aufzeichnung, die als ein Mehrkanalaudiosignal verfügbar ist, eine zweckgebundene Stereomischung gibt, die keine automatische Herunterumsetzversion des Mehrkanalsignals ist. Dies wird für gewöhnlich als eine „künstlerische Herunterumsetzung" (artistic down-mix) bezeichnet. Diese Heruntermischung kann nicht als eine lineare Kombination der Mehrkanalsignale ausgedrückt werden.
  • Die Doktorarbeit (PhD-Thesis) Nr. 3062 „Parametric coding of spatial audio" C. Faller, 24. September 2004, offenbart ein BCC-Schema mit mehreren Audioübertragungskanälen. In dem Codierer werden C Eingangskanäle auf E übertragene Audiokanäle herunterumgesetzt. Zwischenkanalzeitdifferenzen, Zwischenkanalpegeldifferenzen und Zwischenkanalkohärenzmaße zwischen bestimmten Paaren von Eingangskanälen werden in Abhängigkeit von Zeit und Frequenz geschätzt. Die geschätzten Hinweise werden als Seiteninformationen an den Decodierer übertragen. Auf der Decodiererseite werden die übertragenen Audiokanäle und die Parameter, die in den Seiteninformationen enthalten sind, verwendet, um eine Synthese eines Mehrkanalausgangssignals durchzuführen.
  • Die WO 2005/086139 A1 , die nach dem Prioritätsdatum dieser Anmeldung veröffentlicht wurde, offenbart ein Mehrkanalaudiocodierschema, bei dem mehrere Audiokanäle entweder zu einem monophonen zusammengesetzten Signal oder zu mehreren Audiokanälen kombiniert werden, zusammen mit verwandten Hilfsinformationen, aus denen mehrere Audiokanäle rekonstruiert werden. Kopplungsartefakte bei dem Codierprozess werden durch ein Einstellen relativer Zwischenkanalphasen vor einem Herunterumsetzen reduziert. Die räumliche Dimensionalität des wiedergegebenen Signals wird durch ein Wiederherstellen der Phasenwinkel und Dekorrelationsgrade in dem Decodierer verbessert.
  • Es ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Mehrkanalherunterumsetz-/Codierer- oder Heraufumsetz-/Decodierer-Konzept zu schaffen, das zu einer besseren Qualität der rekonstruierten Mehrkanalausgabe führt.
  • Zusammenfassung der Erfindung
  • Gemäß der Erfindung wird diese Aufgabe durch einen Mehrkanalsynthetisierer gemäß Anspruch 1, einen Codierer zum Verarbeiten eines Mehrkanaleingangssignals gemäß Anspruch 28, ein Verfahren zum Erzeugen von zumindest drei Ausgangskanälen gemäß Anspruch 40, ein Verfahren zum Codieren gemäß Anspruch 41, ein codiertes Mehrkanalsignal gemäß Anspruch 42 oder ein maschinenlesbares Medium gemäß Anspruch 43 gelöst.
  • Bevorzugte Ausführungsbeispiele sind in den abhängigen Ansprüchen dargelegt.
  • Die vorliegende Erfindung, die in den Ansprüchen definiert ist, bezieht sich auf das Problem einer Signalverlaufsmodifizierung des herunterumgesetzten Mehrkanalsignals, wenn prädiktionsbasierte Heraufumsetzverfahren verwendet werden. Dies umfasst, wenn das herunterumgesetzte Signal durch einen Codec codiert ist, der eine Stereovorverarbeitung, eine Hochfrequenzrekonstruktion und andere Codierschemata durchführt, die den Signalverlauf wesentlich modifizieren. Ferner spricht die Erfindung das Problem an, das sich ergibt, wenn prädiktive Heraufumsetztechniken für eine künstlerische Herunterumsetzung verwendet werden, d. h. ein Herunterumsetzsignal, das nicht aus dem Mehrkanalsignal automatisiert ist.
  • Die vorliegende Erfindung weist die folgenden Merkmale auf:
    • – Schätzung der Prädiktionsparameter basierend auf dem modifizierten Signalverlauf anstelle des herunterumgesetzten Signalverlaufs;
    • – Verwendung von prädiktionsbasierten Verfahren lediglich in den Frequenzbereichen, wo es vorteilhaft ist;
    • – Korrektur des Energieverlusts und einer ungenauen Korrelation zwischen Kanälen, die bei der prädiktionsbasierten Heraufumsetzprozedur eingebracht werden.
  • Kurze Beschreibung der Zeichnungen
  • Die vorliegende Erfindung wird nun durch darstellende Beispiele, die den Schutzbereich der Erfindung nicht einschränken, mit Bezug auf die zugehörigen Zeichnungen beschrieben, in denen:
  • 1 eine prädiktionsbasierte Rekonstruktion von drei Kanälen aus zwei Kanälen darstellt;
  • 2 eine prädiktive Heraufumsetzung mit einer Energiekompensation darstellt;
  • 3 eine Energiekompensation bei der prädiktiven Heraufumsetzung darstellt;
  • 4 einen Prädiktionsparameterestimator auf der Codiererseite mit einer Energiekompensation des Herunterumsetzsignals darstellt;
  • 5 eine prädiktive Heraufumsetzung mit einer Korrelationsrekonstruktion darstellt;
  • 6 ein Mischmodul zum Mischen des dekorrelierten Signals mit dem heraufumgesetzten Signal bei der Heraufumsetzung mit Korrelationsrekonstruktion darstellt;
  • 7 ein alternatives Mischmodul zum Mischen des dekorrelierten mit dem heraufumgesetzten Signal bei der Heraufumsetzung mit Korrelationsrekonstruktion darstellt;
  • 8 eine Prädiktionsparameterschätzung auf der Codiererseite darstellt;
  • 9 eine Prädiktionsparameterschätzung auf der Codiererseite darstellt;
  • 10 ein erfindungsgemäßes Mehrparameterszenario darstellt;
  • 11 eine Heraufumsetzervorrichtung darstellt;
  • 12 ein Energieschaubild darstellt, das das Ergebnis einer einen Energieverlust einbringenden Heraufumsetzung und der bevorzugten Kompensation zeigt;
  • 13 eine Tabelle von Energiekompensationsverfahren;
  • 14a ein schematisches Diagramm eines bevorzugten Mehrkanalcodierers;
  • 14b ein Flussdiagramm des Verfahrens, das durch die Vorrichtung von 14a durchgeführt wird;
  • 15a einen Mehrkanalcodierer mit einer Spektralbandreplikationsfunktionalität zum Erzeugen einer unterschiedlichen Parametrisierung verglichen mit der Vorrichtung in 14a;
  • 15b eine tabellarische Darstellung einer frequenzselektiven Erzeugung und Übertragung von Parameterdaten;
  • 16a einen Decodierer, der die Berechnung von Heraufumsetzmatrixkoeffizienten darstellt;
  • 16b eine detaillierte Beschreibung einer Parameterberechnung für die prädiktive Heraufumsetzung;
  • 17 einen Sender und einen Empfänger eines Übertragungssystems; und
  • 18 ein Audioaufzeichnungsgerät, das einen Codierer aufweist, und ein Audioabspielgerät, das einen Decodierer aufweist.
  • Beschreibung bevorzugter Ausführungsbeispiele
  • Die unten beschriebenen Ausführungsbeispiele sind lediglich darstellend für die Grundlagen der vorliegenden Erfindung. Es ist klar, dass Modifikationen und Variationen der Anordnungen und der Einzelheiten, die hierin beschrieben sind, Fachleuten auf dem Gebiet ersichtlich sind. Es ist deshalb die Absicht, lediglich durch den Schutzbereich der bevorstehenden Patentansprüche und nicht durch die spezifischen Einzelheiten begrenzt zu sein, die durch eine Beschreibung und Erläuterung der Ausführungsbeispiele hierin vorgelegt sind.
  • Es wird betont, dass eine nachfolgende Parameterberechnung, Anwendung, Heraufumsetzung, Herunterumsetzung und irgendwelche anderen Handlungen auf einer frequenzbandselektiven Basis durchgeführt werden, d. h. für Subbänder in einer Filterbank.
  • Um die Vorteile der vorliegenden Erfindung zu umreißen, wird zuerst eine detailliertere Beschreibung einer prädiktiven Heraufumsetzung abgegeben, wie dieselbe durch den Stand der Technik bekannt ist. Es sei eine Dreikanalheraufumsetzung basierend auf zwei Herunterumsetzkanälen angenommen, wie es in 1 umrissen ist, wobei 101 den ursprünglichen Links-Kanal darstellt, 102 den ursprünglichen Mitte-Kanal darstellt, 103 den ursprünglichen Rechts-Kanal darstellt, 104 das Herunterumsetz- und Parameterextraktionsmodul auf der Codiererseite darstellt, 105 und 106 Prädiktionsparameter darstellen, 107 den herunterumgesetz ten Links-Kanal darstellt, 108 den herunterumgesetzten Rechts-Kanal darstellt, 109 das prädiktive Heraufumsetzmodul darstellt und 110, 111 und 112 den rekonstruierten Links-, Mitte- bzw. Rechts-Kanal darstellen.
  • Es seien die folgenden Definitionen angenommen, wobei X eine 3×L-Matrix ist, die die drei Signalsegmente l(k), r(k), c(k), k = 0, ..., L – 1 als Zeilen umfasst.
  • Gleichermaßen sollen die zwei herunterumgesetzten Signale l0(k), r0(k) die Zeilen von X0 bilden. Der Herunterumsetzprozess ist beschrieben durch X0 = DX, (1) wobei die Herunterumsetzmatrix definiert ist durch
  • Figure 00090001
  • Eine bevorzugte Wahl einer Herunterumsetzmatrix lautet
    Figure 00090002
    was bedeutet, dass das Links-Herunterumsetzsignal l0(k) lediglich l(k) und αc(k) umfasst und r0(k) lediglich r(k) und αc(k) umfasst. Diese Herunterumsetzmatrix ist bevorzugt, da dieselbe der Links- und der Rechts-Herunterumsetzung eine gleiche Größe des Mitte-Kanals zuweist und da dieselbe der Links-Herunterumsetzung keinen ursprünglichen Rechts-Kanal zuweist oder umgekehrt.
  • Die Heraufumsetzung ist definiert durch X ^ = CX0, (4) wobei C eine 3×2-Heraufumsetzmatrix ist.
  • Die prädiktive Heraufumsetzung, die aus dem Stand der Technik bekannt ist, stützt sich auf den Gedanken eines Lösens des überbestimmten Systems CX0 = X (5)nach C in dem Sinn kleinster Quadrate. Dies führt zu den normalen Gleichungen CX0X*0 = XX*0 . (6)
  • Ein Multiplizieren von (6) auf der linken mit D ergibt DCX0X * / 0 = X0X * / 0, was in dem allgemeinen Fall, in dem X0X0* = DXX*D* nichtsingulär ist, DC = I2 (7)impliziert, wobei In die n-Identitätsmatrix bezeichnet. Diese Beziehung reduziert den Parameterraum C auf die zweite Dimension.
  • Angesichts des Obigen kann die Heraufumsetzmatrix
    Figure 00100001
    auf der Decodiererseite vollständig definiert werden, falls die Herunterumsetzmatrix D bekannt ist und zwei Elemente der C-Matrix übertragen werden, z. B. c11 und c22.
  • Die restlichen (Prädiktionsfehler-) Signale sind gegeben durch Xr = X – X ^ =(I3 – CD)X. (8)
  • Ein Multiplizieren auf der linken mit D ergibt DXr = (D – DCD)X = 0 (9)aufgrund von (7). Es folgt, dass es ein 1×L-Zeilenvektorsignal xr ergibt, derart, dass Xr = vxr (10)wobei v ein 3×1-Einheitsvektor ist, der den Kernel (Nullraum) von D überspannt. In dem Fall der Herunterumsetzung (3) kann man beispielsweise
    Figure 00110001
    verwenden.
  • Wenn v = [νl, νr, νc]T und X ^ = [l ^(k), rr ^((k), c ^(k)]T gilt, bedeutet dies im Allgemeinen nur, dass bis zu einem Gewichtungsfaktor das Restsignal für alle drei Kanäle gemeinsam ist, l(k) = l ^(k) + νlxr(k) r(k) = r ^(k) + νrxr(k) c(k) = c ^(k) + νcxr(k). (12)
  • Aufgrund des Orthogonalitätsprinzips ist der Rest xr(k) orthogonal zu allen drei vorausgesagten Signalen l ^(k), r ^(k), c ^(k).
  • Gelöste Probleme und erhaltene Verbesserungen durch bevorzugte Ausführungsbeispiele der vorliegenden Erfindung
  • Es ergeben sich offensichtlich die folgenden Probleme bei einem Verwenden einer prädiktionsbasierten Heraufumsetzung gemäß dem Stand der Technik, wie es oben umrissen ist:
    • • Das Verfahren stützt sich auf ein Anpassen eines Signalverlaufs in einem Sinn kleinster mittlerer Fehlerquadrate, was nicht bei Systemen funktioniert, bei denen der Signalverlauf der herunterumgesetzten Signale nicht beibehalten ist.
    • • Das Verfahren liefert nicht die korrekte Korrelationsstruktur zwischen den rekonstruierten Kanälen (wie es unten umrissen wird).
    • • Das Verfahren rekonstruiert nicht die richtige Menge an Energie in den rekonstruierten Kanälen.
  • Energiekompensation
  • Wie es oben erwähnt wurde, besteht eines der Probleme bei einer prädiktionsbasierten Mehrkanalrekonstruktion darin, dass der Prädiktionsfehler einem Energieverlust der drei rekonstruierten Kanäle entspricht. Unten ist die Theorie für diesen Energieverlust und eine Lösung umrissen, die durch bevorzugte Ausführungsbeispiele gelehrt wird. Ersten wird die theoretische Analyse durchgeführt und nachfolgend wird ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung gemäß der unten umrissenen Theorie gegeben.
  • E, E ^ und Er seien die Summe der Energien der ursprünglichen Signale in X, der vorausgesagten Signale in X ^ bzw. der Prädiktionsfehlersignale in Xr. Aus der Orthogonalität folgt E = E ^ + Er (13)
  • Der Gesamtprädiktionsgewinn kann definiert sein als
    Figure 00130001
    aber im Folgenden wird es zweckmäßiger sein, den Parameter
    Figure 00130002
    zu betrachten.
  • Somit misst ρ2 ∊[0,1] die gesamte relative Energie der prädiktiven Heraufumsetzung.
  • Angesichts dieses ρ ist es möglich, jeden Kanal durch ein Anwenden eines Kompensationsgewinns, z ^g(k) = gzz ^(k), neu einzustellen, derart, dass ||z ^g||2 = ||z||2 für z = l, r, c gilt. Genau gesagt ist die Zielenergie gegeben durch (12), ||z||2 = ||z ^||2 + ν2z ||xr||2, (15)so dass man g2z ||z ^||2 = ||z ^||2 + ν2z ||xr||2 (16)lösen muss.
  • Da v ein Einheitsvektor ist, gilt hier Er = ||xr||2, (17)und es folgt aus der Definition (14) von ρ und (13), dass
    Figure 00130003
  • Wenn man all dies zusammensetzt, gelangt man zu dem Gewinn
    Figure 00140001
  • Es ist offensichtlich, das bei diesem Verfahren, zusätzlich zu einem Übertragen von ρ, die Energieverteilung der decodierten Kanäle an dem Decodierer berechnet werden muss. Zudem werden lediglich die Energien korrekt rekonstruiert, während die außerdiagonale Korrelationsstruktur ignoriert wird.
  • Es ist möglich, einen Gewinnwert abzuleiten, der sicherstellt, dass die Gesamtenergie bewahrt wird, während nicht sichergestellt ist, dass die Energie der einzelnen Kanäle korrekt ist. Ein gemeinsamer Gewinn für alle Kanäle gz = g, der sicherstellt, dass die Gesamtenergie bewahrt wird, wird über die definierende Gleichung g2E ^ = E erhalten. Das heißt
    Figure 00140002
  • Durch eine Linearität kann dieser Gewinn in dem Codierer auf die herunterumgesetzten Signale angewandt werden, so dass kein zusätzlicher Parameter übertragen werden muss.
  • 2 umreißt ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung, das die drei Kanäle wieder erzeugt, während die korrekte Energie der Ausgangskanäle beibehalten wird. Die herunterumgesetzten Signale l0 und r0 werden zusammen mit den Prädiktionsparametern c1 und c2 in das Heraufumsetzmodul 201 eingegeben. Das Heraufumsetzmodul erzeugt die Heraufumsetzmatrix C wieder basierend auf einer Kenntnis über die Herunterumsetzmatrix D und die empfangenen Prädiktionsparameter. Die drei Ausgangskanäle von 201 werden zusammen mit dem Einstellungsparameter ρ in 202 eingegeben. Die drei Kanäle werden in Abhängigkeit des übertragenen Parameters ρ gewinnmäßig eingestellt und die energiemäßig korrigierten Kanäle werden ausgegeben.
  • In 3 ist ein detaillierteres Ausführungsbeispiel des Einstellungsmoduls 202 angezeigt. Die drei heraufumgesetzten Kanäle werden in ein Einstellungsmodul 304, sowie in ein Modul 301, 302 bzw. 303 eingegeben. Die Energieschätzungsmodule 301303 schätzen die Energie der drei heraufumgesetzten Signale und geben die gemessene Energie an das Einstellungsmodul 304 aus. Das Steuersignal ρ (das den Prädiktionsgewinn darstellt), das von dem Codierer empfangen wird, wird auch in 304 eingegeben. Das Einstellungsmodul implementiert Gleichung (19), wie es oben umrissen ist.
  • Bei einer alternativen Implementierung der vorliegenden Erfindung kann die Energiekorrektur auf der Codiererseite vorgenommen werden. 4 stellt eine Implementierung des Codierers dar, bei der die herunterumgesetzten Signale l0 107 und r0 108 durch 401 und 402 gemäß einem Gewinnwert, der durch 403 berechnet wird, gewinnmäßig eingestellt werden. Der Gewinnwert ist gemäß Gleichung (20) oben abgeleitet. Wie es oben umrissen ist, ist es ein Vorteil dieses Ausführungsbeispiels der vorliegenden Erfindung, da es nicht notwendig ist, die Energie der drei wiedererzeugten Kanäle aus der prädiktiven Heraufumsetzung zu berechnen. Dies stellt jedoch lediglich sicher, dass die Gesamtenergie der drei wiedererzeugten Kanäle korrekt ist. Dasselbe stellt nicht sicher, dass die Energie der einzelnen Kanäle korrekt ist.
  • Ein bevorzugtes Beispiel für eine Herunterumsetzmatrix, die Gleichung (3) entspricht, ist unten bei dem Herunterumsetzer in 4 angegeben. Der Herunterumsetzer kann jedoch irgendeine allgemeine Herunterumsetzmatrix anwenden, wie es in Gleichung (2) umrissen ist.
  • Wie es später umrissen wird, sind für den vorliegenden Fall eines Herunterumsetzers, der als einen Eingang drei Kanäle aufweist und als einen Ausgang zwei Kanäle aufweist, zwei zusätzliche Heraufumsetzparameter c1, c2 erforderlich. Wenn eine Herunterumsetzmatrix D variabel ist oder einem Decodierer nicht vollständig bekannt ist, müssen zusätzlich zu den Parametern 105 und 106 auch zusätzliche Informationen über die verwendete Herunterumsetzung von der Codiererseite an eine Decodiererseite übertragen werden.
  • Korrelationsstruktur
  • Eines der Probleme bei der Heraufumsetzprozedur, die durch den Stand der Technik beschrieben ist, besteht darin, dass dieselbe nicht die korrekte Korrelation zwischen den wiedererzeugten Kanälen rekonstruiert. Wie es oben umrissen wurde, da der Mitte-Kanal als eine lineare Kombination des Links-Herunterumsetzkanals und des Rechts-Herunterumsetzkanals vorausgesagt wird und der Links- und der Rechts-Kanal durch ein Subtrahieren des vorausgesagten Mitte-Kanals von dem Links- und dem Rechts-Herunterumsetzkanal rekonstruiert werden. Es ist offensichtlich, dass der Prädiktionsfehler zu Resten des ursprünglichen Mitte-Kanals in dem vorausgesagten Links- und dem Rechts-Kanal führen wird. Dies impliziert, dass die Korrelationen zwischen den drei Kanälen für die rekonstruierten Kanäle nicht die gleichen wie für die ursprünglichen drei Kanäle sind.
  • Ein bevorzugtes Ausführungsbeispiel lehrt, dass die vorausgesagten drei Kanäle mit dekorrelierten Signalen gemäß dem gemessenen Prädiktionsfehler kombiniert werden sollten.
  • Die grundlegende Theorie zum Erreichen der korrekten Korrelationsstruktur wird nun umrissen. Die spezielle Struktur des Rests kann verwendet werden, um die vollständige 3×3-Korrelationsstruktur XX* durch ein Substituieren eines dekorrelierten Signals xd mit dem Rest in dem Decodierer zu rekonstruieren.
  • Erstens ist zu beachten, dass die normalen Gleichungen (6) zu XrX*0 = 0 führen, also X,X ^* = 0, X ^X*r = 0. (21)
  • Wenn X = X ^ + Xr, gilt somit XX* = X ^X ^* + XrX*r = X ^X ^* + vv*Er (22)wobei (10) und (17) für die letzte Gleichheit angewandt wurden.
  • Es sei xd ein Signal, dass von allen decodierten Signalen l ^, r ^, c ^ dekorreliert ist, derart, dass X ^x*r = 0 gilt. Das verbesserte Signal Y + vxd (23)weist dann die Korrelationsmatrix YY* X ^X ^* + vv*||xd||2 (24)auf. Um die ursprüngliche Korrelationsmatrix (22) vollständig zu reproduzieren, genügt es, dass ||xd||2 = Er. (25)
  • Falls xd durch ein Dekorrelieren des herunterumgesetzten Signals erhalten wird, beispielsweise 1/2(l0 + r0), gefolgt von einem Gewinn γ, dann sollte gelten, dass γ2||1/2(l0 + r0)|| = Er. (26)
  • Dieser Gewinn kann in dem Codierer berechnet werden. Falls jedoch der besser definierte Parameter ρ2 ∊[0,1] aus (14) verwendet werden soll, muss eine Schätzung von E ^ und ||1/2(l0 + r0)|| in dem Decodierer durchgeführt werden. Angesichts dessen besteht eine ansprechendere Alternative darin, xd unter Verwendung von drei Dekorrelatoren xd = γ·(d1{l ^} + d2{r ^} + d3{c ^}) (26a)zu erzeugen, da dann ||xd||2 = γ2E ^ gilt, so dass (25) erfüllt ist durch die Wahl von
    Figure 00180001
  • 5 stellt ein Ausführungsbeispiel der vorliegenden Erfindung für eine prädiktive Heraufumsetzung von drei Kanälen aus zwei Herunterumsetzkanälen dar, während die korrekte Korrelationsstruktur zwischen den Kanälen beibehalten wird. In 5 sind die Module 109, 110, 111 und 112 die gleichen wie in 1 und werden hier nicht weiter ausführlich behandelt. Die drei heraufumgesetzten Signale, die von 109 ausgegeben werden, werden in Dekorrelationsmodule 501, 502 und 503 eingegeben. Diese erzeugen gegenseitig dekorrelierte Signale. Die dekorrelierten Signale werden summiert und in die Mischmodule 504, 505 und 506 eingegeben, wo dieselben mit der Ausgabe von 109 gemischt werden. Das Mischen der prädiktiven heraufumgesetzten Signale mit dekorrelierten Versionen derselben ist ein wesentliches Merkmal der vorliegenden Erfindung. In 6 ist ein Ausführungsbeispiel der Mischmodule 504, 505 und 506 angezeigt. Bei diesem Ausführungsbeispiel der Erfindung wird der Pegel des dekorrelierten Signals durch 601 basierend auf dem Steuersignal γ eingestellt. Das dekorrelierte Signal wird nachfolgend zu dem prädiktiven heraufumgesetzten Signal in 602 addiert.
  • Ein drittes bevorzugtes Ausführungsbeispiel verwendet Dekorrelatoren 501, 502, 503 für die heraufumgesetzten Kanäle. Ein dekorreliertes Signal kann auch durch einen Dekorrelator 501' erzeugt werden, der als ein Eingangssignal den Herunterumsetzkanal oder sogar alle Herunterumsetzkanäle empfängt. In dem Fall von mehr als einem Herunterumsetzkanal, wie es in 5 gezeigt ist, kann das Dekorrelationssignal ferner auch durch getrennte Dekorrelatoren für den Links-Basiskanal l0 und den Rechts-Basiskanal r0 und durch ein Kombinieren der Ausgabe dieser getrennten Dekorrelatoren erzeugt werden. Diese Möglichkeit ist im Wesentlichen die gleiche wie die in 5 gezeigte Möglichkeit, aber weist einen Unterschied bezüglich der in 5 gezeigten Möglichkeit dahingehend auf, dass die Basiskanäle vor einem Heraufumsetzen verwendet werden.
  • Ferner ist in Verbindung mit 5 umrissen, dass die Mischmodule 504, 505 und 506 nicht nur den Faktor γ empfangen, der für alle drei Kanäle gleich ist, da dieser Faktor lediglich von dem Energiemaß ρ abhängt, sondern auch den kanalspezifischen Faktor νl, νc und νr empfangen, der bestimmt wird, wie es in Verbindung mit Gleichung (10) und (11) umrissen ist. Dieser Parameter muss jedoch nicht von einem Codierer zu einem Decodierer übertragen werden, wenn der Decodierer die Herunterumsetzung kennt, die bei dem Codierer verwendet wird. Anstelle dessen sind diese Parameter in der Matrix v, wie es in Gleichung (10) und (11) gezeigt ist, vorzugsweise in die Mischmodule 504, 505 und 506 vorprogrammiert, so dass diese kanalspezifischen Gewichtungsfaktoren nicht übertragen werden müssen (aber natürlich übertragen werden können, wenn es erforderlich ist).
  • In 6 ist gezeigt, dass die Gewichtungsvorrichtung 601 die Energie des dekorrelierten Signals unter Verwendung des Produktes von γ und dem kanalspezifischen herunterumsetzabhängigen Parameter νz einstellt, wobei z für l, r oder c steht. In diesem Zusammenhang ist zu beachten, dass Gleichung (26a) sicherstellt, dass die Energie von xd gleich der Summenenergie der prädiktiv heraufumgesetzten Links-, Rechts- und Mitte-Kanäle ist. Deshalb kann die Vorrichtung 601 einfach als ein Skalierer implementiert sein, der den Skalierungsfaktor GI verwendet. Wenn jedoch das dekorrelierte Signal alternativ erzeugt wird, muss das Mischmodul 504, 505, 506 eine Absolutenergieeinstellung des dekorrelierten Signals durchführen, das durch eine Addiervorrichtung 602 addiert wird, so dass die Energie des Signals, das an dem Addierer 602 addiert wird, gleich der Energie des Restsignals ist, z. B. der Energie, die durch die nicht energiebewahrende prädiktive Heraufumsetzung verloren geht.
  • Hinsichtlich des kanalspezifischen herunterumsetzabhängigen Parameters νz gelten die gleichen Bemerkungen, die oben mit Bezug auf 6 umrissen sind, auch für das Ausführungsbeispiel von 7.
  • Ferner ist hier zu beachten, dass die Ausführungsbeispiele von 6 und 7 auf der Erkenntnis beruhen, dass zumindest ein Teil der Energie, die bei dem prädiktiven Heraufumsetzen verloren geht, unter Verwendung eines Dekorrelationssignals addiert wird. Um korrekte Signalenergien und korrekte Abschnitte der Trockensignalkomponente (unkorreliert) und der „Nass"-Signalkomponente (dekorreliert) zu haben, ist sicherzustellen, dass das „Trocken"-Signal, das in das Mischmodul 504 eingegeben wird, nicht vorskaliert ist. Wenn beispielsweise die Basiskanäle auf der Codiererseite vorkorrigiert wurden (wie es in 4 gezeigt ist), dann muss diese Vorkorrektur von 4 durch ein Multiplizieren des Kanals mit dem (relativen) Energiemaß ρ kompensiert werden, bevor der Kanal in den Mischerkasten 504, 505 oder 506 eingegeben wird. Zusätzlich muss die gleiche Prozedur vorgenommen werden, wenn eine derartige Energiekorrektur auf einer Decodiererseite durchgeführt wurde, bevor die Herunterumsetzkanäle in den Heraufumsetzer 109 eingegeben werden, wie es in 5 gezeigt ist.
  • Wenn lediglich ein Teil der Restenergie durch ein dekorreliertes Signal abgedeckt werden soll, muss eine Vorkorrektur nur partiell durch ein Vorskalieren des Signals, das in den Mischkasten 504, 505, 506 eingegeben wird, um einen ρ-abhängigen Faktor entfernt werden, der jedoch näher an Eins liegt als der Faktor ρ selbst. Natürlich hängt dieser teilweise kompensierende Vorskalierungsfaktor von dem codierererzeugten Signal κ ab, das bei 605 in 7 eingegeben wird. Wenn eine derartige partielle Vorskalierung durchgeführt werden muss, dann ist der Gewichtungsfaktor, der bei G2 angewandet wird, nicht notwendig. Anstelle dessen ist dann die Verzweigung von dem Eingang 604 zu dem Summierer 602 der gleiche wie in 6.
  • Steuern des Grades an Dekorrelation
  • Ein bevorzugtes Ausführungsbeispiel der Erfindung lehrt, dass die Größe einer Dekorrelation, die zu den vorausgesagten heraufabgetasteten Signalen addiert wird, von dem Codierer aus gesteuert werden kann, während immer noch die korrekte Ausgabeenergie beibehalten wird. Dies ist so, weil bei einem typischen „Interview"-Beispiel von trockener Sprache in dem Mitte-Kanal und einer Umgebung in dem Links- und dem Rechts-Kanal die Substitution eines dekorrelierten Signals mit einem Prädiktionsfehler in dem Mitte-Kanal eventuell unerwünscht ist.
  • Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung kann eine alternative Mischprozedur zu derselben, die in 5 umrissen ist, verwendet werden. Unten wird gezeigt, wie gemäß der vorliegenden Erfindung die Probleme einer Gesamtenergiebewahrung und einer echten Korrelationswiedergabe getrennt werden können und die Größe einer Dekorrelation durch den Parameter κ gesteuert werden kann.
  • Es sei angenommen, dass eine Gesamtenergie bewahrende Gewinnkompensation (20) an dem herunterumgesetzten Signal durchgeführt wurde, so dass man zuerst das decodierte Signal X ^/ρ erhält. Aus diesem wird ein dekorreliertes Signal d mit der gleichen Gesamtenergie ||d||2 = E^/ρ2 erzeugt, beispielsweise durch eine Verwendung von drei Dekorrelatoren, wie bei dem vorhergehenden Abschnitt. Die gesamte Heraufumsetzung ist dann definiert gemäß
    Figure 00220001
    wobei κ ∊ [ρ,1] ein übertragender Parameter ist. Die Wahl κ = 1 entspricht einer Gesamtenergiebewahrung ohne Hinzufügung eines dekorrelierten Signals, und κ = ρ entspricht einer vollständigen 3×3-Korrelationsstrukturwiedergabe. Man erhält
    Figure 00220002
    so dass die Gesamtenergie für alle κ ∊ [ρ,1] bewahrt wird, wie es durch ein Berechnen der Spuren (Summe von Diagonalwerten) der Matrizen in (30) zu sehen ist. Eine korrekte einzelne Energie wird jedoch lediglich für κ = ρ erhalten.
  • 7 stellt ein Ausführungsbeispiel der Mischmodule 504, 505 und 506 von 5 gemäß der oben umrissenen Theorie dar. Bei dieser Alternative der Mischmodule wird der Steuerparameter γ in 702 und 701 eingegeben. Der Gewinnfaktor, der für 702 verwendet wird, entspricht κ gemäß der obigen Gleichung (29) und der Gewinnfaktor, der für 701 verwendet wird, entspricht
    Figure 00220003
    gemäß der obigen Gleichung (29).
  • Das oben beschriebene Ausführungsbeispiel der vorliegenden Erfindung ermöglicht, dass das System einen Erfassungsmechanismus auf der Codiererseite einsetzt, der die Größe einer Dekorrelation schätzt, die bei der prädiktionsbasierten Heraufumsetzung addiert werden soll. Die in 7 beschriebene Implementierung addiert die angegebene Größe eines dekorrelierten Signals und wendet eine Energiekorrektur an, so dass die Gesamtenergie der drei Kanäle korrekt ist, während dieselbe immer noch in der Lage ist, eine beliebige Größe des Prädiktionsfehlers durch ein dekorreliertes Signal zu ersetzen.
  • Dies bedeutet, dass bei einem Beispiel mit drei Umgebungssignalen, z. B. ein klassisches Musikstück mit viel Umgebung, der Codierer das Fehlen eines „trockenen" Mitte-Kanals erfassen kann und den Decodierer den gesamten Prädiktionsfehler mit einem dekorrelierten Signal ersetzen lassen kann, wobei so die Umgebung des Klangs von den drei Kanälen auf eine Weise wiedererzeugt wird, die mit prädiktionsbasierten Verfahren des Stands der Technik allein nicht möglich wäre. Bei einem Signal mit einem trockenen Mitte-Kanal, z. B. Sprache in dem Mitte-Kanal und Umgebungsklängen in dem Links- und dem Rechts-Kanal, erfasst der Codierer, dass ein Ersetzen des Prädiktionsfehlers durch ein dekorreliertes Signal psychoakustisch nicht korrekt ist, und lässt anstelle dessen den Decodierer die Pegel der drei rekonstruierten Kanäle einstellen, so dass die Energie der drei Kanäle korrekt ist. Offensichtlich stellen die extremen Beispiele oben zwei mögliche Resultate der Erfindung dar. Dieselbe ist nicht begrenzt, lediglich die Extremfälle abzudecken, die in den obigen Beispielen umrissen sind.
  • Anpassen der Prädiktionskoeffizienten an modifizierte Signalverläufe.
  • Wie es oben umrissen ist, werden die Prädiktionsparameter durch ein Minimieren des mittleren Fehlerquadrats geschätzt, das in den ursprünglichen drei Kanälen X und einer Herunterumsetzmatrix D gegeben ist. In vielen Situationen jedoch kann man sich nicht darauf verlassen, dass das herunterumgesetzte Signal als eine Herunterumsetzmatrix D multipliziert mit einer Matrix X beschrieben werden kann, die das ursprüngliche Mehrkanalsignal beschreibt.
  • Ein offensichtliches Beispiel für dies ist, wenn eine so genannte „künstlerische Herunterumsetzung" verwendet wird, d. h. die Zweikanalherunterumsetzung kann nicht als eine lineare Kombination des Mehrkanalsignals beschrieben werden. Ein anderes Beispiel ist, wenn das herunterumgesetzte Signal durch einen Wahrnehmungsaudiocodec codiert ist, der eine Stereovorverarbeitung oder andere Werkzeuge für eine verbesserte Codiereffizienz verwendet. Es ist im Stand der Technik allgemein bekannt, dass sich viele Wahrnehmungsaudiocodecs auf eine Mitte/Seite-Stereocodierung stützen, bei der das Seite-Signal unter einer Bedingung mit eingeschränkter Bitrate gedämpft wird, was eine Ausgabe ergibt, die ein schmaleres Stereobild als dieses des Signals aufweist, das zum Codieren verwendet wird.
  • 8 zeigt ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung, bei dem die Parameterextraktion auf der Codiererseite neben dem Mehrkanalsignal auch einen Zugriff auf das modifizierte Herunterumsetzsignal hat. Die modifizierte Herunterumsetzung wird hier durch 801 erzeugt. Falls lediglich zwei Parameter der C-Matrix übertragen werden, wird eine Kenntnis der D-Matrix auf der Decodierer-Seite benötigt, um in der Lage zu sein, die Heraufumsetzung vorzunehmen und das geringste mittlere Fehlerquadrat für alle heraufumgesetzten Kanäle zu erhalten. Das vorliegende Ausführungsbeispiel lehrt jedoch, dass man die herunterumgesetzten Signale l0 und r0 auf der Codiererseite durch die herunterumgesetzten Signale l'0 und r'0 ersetzen kann, die durch ein Verwenden einer Herunterumsetzmatrix D erhalten werden, die nicht zwangsläufig die gleiche wie diese ist, die an dem Decodierer angenommen wird. Ein Verwenden der alternativen Herunterumsetzung für eine Parameterschätzung auf der Codiererseite garantiert lediglich eine korrekte Mitte-Kanal-Wiedergabe auf der Decodiererseite. Durch ein Übertragen zusätzlicher Informationen von dem Codierer an den Decodierer kann eine genauere Heraufumsetzung der drei Kanäle erhalten werden. In einem Extremfall können alle sechs Elemente der C-Matrix übertragen werden. Das vorliegende Ausführungsbeispiel lehrt jedoch, dass ein Teilsatz der C-Matrix übertragen werden kann, falls derselbe von Informationen über die Herunterumsetzmatrix D begleitet ist, die 802 verwendete.
  • Wie zuvor erwähnt, setzen Wahrnehmungsaudiocodecs eine Mitte/Seite-Codierung für eine Stereocodierung bei niedrigen Bitraten ein. Ferner wird eine Stereovorverarbeitung häufig eingesetzt, um die Energie des Zeit-Signals unter Bedingungen mit eingeschränkter Bitrate zu reduzieren. Dies wird basierend auf dem psychoakustischen Gedanken vorgenommen, dass für ein Stereosignal gegenüber einer hörbaren Quantisierungsverzerrung und einer Bandbreitenbegrenzung eine Reduzierung der Breite des Stereosignals ein bevorzugtes Codierartefakt ist.
  • Falls eine Stereovorverarbeitung verwendet wird, kann somit die Herunterumsetzgleichung (3) ausgedrückt werden als
    Figure 00250001
    wobei γ die Dämpfung des Seite-Signals ist. Wie es früher umrissen wurde, muss die D-Matrix auf der Decodiererseite bekannt sein, um korrekt in der Lage zu sein, die drei Kanäle zu rekonstruieren. Daher lehrt das vorliegende Ausführungsbeispiel, dass der Dämpfungsfaktor an den Decodierer gesendet werden sollte.
  • 9 zeigt ein anderes Ausführungsbeispiel der vorliegenden Erfindung, bei dem das Herunterumsetzsignal l0 und r0, das von 104 ausgegeben wird, in eine Stereovorverarbeitungsvorrichtung 901 eingegeben wird, die das Seite-Signal (l0 – r0) der Mitte/Seite-Darstellung des Herunterumsetzsignals um einen Faktor γ begrenzt. Dieser Parameter wird an den Decodierer übertragen.
  • Parametrisierung für HFR-Codec-Signale
  • Falls die prädiktionsbasierte Heraufumsetzung bei Hochfrequenzrekonstruktionsverfahren wie SBR [ WO 98/57436 ] verwendet wird, stimmen die Prädiktionsparameter, die auf der Codiererseite geschätzt werden, nicht mit dem wiedererzeugten Hochbandsignal auf der Decodiererseite überein. Das vorliegende Ausführungsbeispiel lehrt die Verwendung einer alternativen nicht signalverlaufsbasierten Heraufumsetzstruktur für eine Wiedererzeugung von drei Kanälen aus zweien. Die vorgeschlagene Heraufumsetzprozedur ist entworfen, um die korrekte Energie aller heraufumgesetzten Kanäle in einem Fall von unkorrelierten Rauschsignalen wieder zu erzeugen.
  • Es sei angenommen, dass die Herunterumsetzmatrix Dα verwendet wird, wie es (3) definiert ist. Und dass man nun die Heraufumsetzmatrix C definiert. Dann ist die Heraufumsetzung definiert durch X ^ = CX0. (32)
  • Wenn man lediglich nach einem Wiedererzeugen der korrekten Energie des heraufumgesetzten Signals l(k), r(k) und c(k) strebt, wobei die Energien L, R und C betragen, ist die Heraufumsetzmatrix gewählt, so dass die Diagonalelemente von X ^X ^* und XX* die gleichen sind, gemäß:
    Figure 00270001
  • Der entsprechende Ausdruck für die Herunterumsetzmatrix lautet
    Figure 00270002
  • Ein Gleichsetzen des Diagonalelements von X ^X ^* mit dem Diagonalelement von XX* führt zu drei Gleichungen, die die Beziehung zwischen den Elementen C und L, R und C definieren.
  • Figure 00270003
  • Basierend auf dem obigen kann eine Heraufumsetzmatrix definiert werden. Es ist bevorzugt, eine Heraufumsetzmatrix zu definieren, die den herunterumgesetzten Rechts-Kanal nicht zu dem heraufumgesetzten Links-Kanal addiert und umgekehrt. Somit kann eine geeignete Heraufumsetzmatrix
    Figure 00270004
    lauten. Dies ergibt eine C-Matrix gemäß:
    Figure 00280001
  • Es lässt sich zeigen, dass die Elemente der C-Matrix auf der Decodiererseite aus den zwei übertragenen Parametern
    Figure 00280002
    wiedererzeugt werden können.
  • 10 umreißt ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung. Hier sind 101112 die gleichen wie in 1 und werden hier nicht weiter detailliert behandelt. Die drei ursprünglichen Signale 101103 werden in das Schätzungsmodul 1001 eingegeben. Dieses Modul schätzt zwei Parameter, z. B.
    Figure 00280003
    aus denen die C-Matrix auf der Decodiererseite abgeleitet werden kann. Diese Parameter, zusammen mit den Parametern, die von 104 ausgegeben werden, werden in ein Auswahlmodul 1002 eingegeben. Bei einem bevorzugten Ausführungsbeispiel gibt das Auswahlmodul 1002 die Parameter von 104 aus, falls die Parameter einem Frequenzbereich entsprechen, der durch einen Signalverlaufscodec codiert ist, und gibt die Parameter von 1001 aus, falls die Parameter einem Frequenzbereich entsprechen, der durch eine HFR rekonstruiert ist. Das Auswahlmodul 1002 gibt auch Informationen 1005 darüber aus, welche Parametrisierung für die unterschiedlichen Frequenzbereiche des Signals verwendet wird.
  • Auf der Decodiererseite nimmt das Modul 1004 die übertragenen Parameter und leitet dieselben an die prädiktive Heraufumsetzung 109 oder die energiebasierte Heraufumsetzung 1003 gemäß dem Obigen abhängig von der Angabe, die durch den Parameter 1005 gegeben ist. Die energiebasierte Heraufumsetzung 1003 implementiert die Heraufumsetzmatrix C gemäß der Gleichung (40).
  • Die Heraufumsetzmatrix C, die in Gleichung (40) umrissen ist, weist gleiche Gewichtungen (6) auf, um das geschätzte (Decodierer-) Signal c(k) aus den zwei herunterumgesetzten Signalen l0(k), r0(k) zu erhalten. Basierend auf der Beobachtung, dass die relative Größe des Signals c(k) sich bei den zwei herunterumgesetzten Signalen l0(k), r0(k) unterscheiden kann (d. h. C/L nicht gleich C/R), könnte man auch die folgende generische Heraufumsetzmatrix betrachten:
    Figure 00290001
  • Um c(k) zu schätzen, erfordert dieses Ausführungsbeispiel auch eine Übertragung von zwei Steuerparametern c1 und c2, die beispielsweise gleich c1 = α2C/(L + α2X) und c2 = α2X/(R + α2C) sind. Eine mögliche Implementierung der Heraufumsetzmatrixfunktionen fi ist dann gegeben durch
    Figure 00290002
  • Die Signalisierung der unterschiedlichen Parametrisierung für den SBR-Bereich gemäß der vorliegenden Erfindung ist nicht auf SBR begrenzt. Die oben umrissene Parametrisierung kann bei irgendeinem Frequenzbereich verwendet werden, bei dem der Prädiktionsfehler der prädiktionsbasierten Heraufumsetzung als zu groß erachtet wird. Somit kann das Modul 1002 die Parameter von 1001 oder 104 abhängig von einer Vielzahl von Kriterien ausgeben, wie beispielsweise einem Codierverfahren der übertragenen Signale, einem Prädiktionsfehler, etc.
  • Ein bevorzugtes Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion umfasst auf der Codiererseite ein Extrahieren unterschiedlicher Mehrkanalparametrisierungen für unterschiedliche Frequenzbereiche und auf der Decodiererseite ein Anwenden dieser Parametrisierungen auf die Frequenzbereiche, um die mehreren Kanäle zu rekonstruieren.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung umfasst ein Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, die auf der Codiererseite ein Extrahieren von Informationen über den verwendeten Herunterumsetzprozess und ein nachfolgendes Senden dieser Informationen an einen Decodierer und auf der Decodiererseite ein Anwenden einer Heraufumsetzung basierend auf extrahierten Prädiktionsparametern und den Informationen über die Herunterumsetzung umfasst, um die mehreren Kanäle zu rekonstruieren.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung umfasst ein Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, bei dem auf der Codiererseite die Energie des Herunterumsetzsignals gemäß einem Prädiktionsfehler eingestellt wird, der für die extrahierten prädiktiven Heraufumsetzparameter erhalten wird.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf ein Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, bei dem auf der Decodiererseite eine Energie, die aufgrund des Prädiktionsfehlers verloren geht, durch ein Anwenden eines Gewinns auf die heraufumgesetzten Kanäle kompensiert wird.
  • Ein weiteres Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf ein Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, bei dem auf der Decodiererseite die Energie, die aufgrund eines Prädiktionsfehlers verloren geht, durch ein dekorreliertes Signal ersetzt wird.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf ein Verfahren für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, bei dem auf der Decodiererseite ein Teil der Energie, die aufgrund eines Prädiktionsfehlers verloren geht, durch ein dekorreliertes Signal ersetzt wird und ein Teil der verlorenen Energie durch ein Anwenden eines Gewinns auf die heraufumgesetzten Kanäle ersetzt wird. Dieser Teil der verlorenen Energie wird vorzugsweise von einem Codierer signalisiert.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist eine Vorrichtung für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, die eine Einrichtung zum Einstellen der Energie des Herunterumsetzsignals gemäß dem Prädiktionsfehler aufweist, der für die extrahierten prädiktiven Heraufumsetzparameter erhalten wird.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist eine Vorrichtung für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, die eine Einrichtung zum Kompensieren des Energieverlusts aufgrund des Prädiktionsfehlers durch ein Anwenden eines Gewinns auf die heraufumgesetzten Kanäle aufweist.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist eine Vorrichtung für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, die eine Einrichtung zum Ersetzen der Energie, die aufgrund des Prädiktionsfehlers verloren geht, durch ein dekorreliertes Signal aufweist.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist eine Vorrichtung für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, die eine Einrichtung zum Ersetzen eines Teils der Energie, die aufgrund des Prädiktionsfehlers verloren geht, durch ein dekorreliertes Signal und eines Teils der verlorenen Energie durch ein Anwenden eines Gewinns auf die heraufumgesetzten Kanäle aufweist.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist ein Codierer für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, der ein Einstellen der Energie des Herunterumsetzsignals gemäß dem Prädiktionsfehler umfasst, der für die extrahierten prädiktiven Heraufumsetzparameter erhalten wird.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist ein Decodierer für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, der ein Kompensieren eines Energieverlusts aufgrund des Prädiktionsfehlers durch ein Anwenden eines Gewinns auf die heraufumgesetzten Kanäle umfasst.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf einen Decodierer für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, der ein Ersetzen der Energie, die aufgrund des Prädiktionsfehlers verloren wird, durch ein dekorreliertes Signal umfasst.
  • Ein weiteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist ein Decodierer für eine verbesserte prädiktionsbasierte Mehrkanalrekonstruktion, der ein Ersetzen eines Teils der Energie, die aufgrund des Prädiktionsfehlers verloren wird, durch ein dekorreliertes Signal und eines Teils der verlorenen Energie durch ein Anwenden eines Gewinns auf die herunterumgesetzten Kanäle umfasst.
  • 11 zeigt einen Mehrkanalsynthetisierer zum Erzeugen zumindest dreier Ausgangskanäle 1100 unter Verwendung eines Eingangssignals, das zumindest einen Basiskanal 1102 aufweist, wobei der zumindest eine Basiskanal von einem ursprünglichen Mehrkanalsignal abgeleitet ist. Der in 11 gezeigte Mehrkanalsynthetisierer umfasst eine Heraufumsetzervorrichtung 1104, die implementiert sein kann, wie es in irgendeiner der 2 bis 10 gezeigt ist. Im Allgemeinen ist die Heraufumsetzervorrichtung 1104 wirksam, um den zumindest einen Basiskanal unter Verwendung einer Heraufumsetzregel heraufumzusetzen, so dass die zumindest drei Ausgangskanäle erhalten werden. Der Heraufumsetzer 1104 ist wirksam, um die zumindest drei Ausgangskanäle ansprechend auf ein Energiemaß 1106 und zumindest zwei unterschiedliche Heraufumsetzparameter 1108 unter Verwendung einer einen Energieverlust einbringenden Heraufumsetzregel zu erzeugen, so dass die zumindest drei Ausgangskanäle eine Energie aufweisen, die höher als eine Energie von Signalen ist, die sich aus der einen energieverlusteinbringenden Heraufumsetzregel allein ergibt. Ungeachtet eines Energiefehlers, der von der einen Energieverlust einbringenden Heraufumsetzregel abhängt, führt die Erfindung somit zu einem energiekompensierten Ergebnis, wobei die Energiekompensation durch ein Skalieren und/oder eine Addition eines dekorrelierten Signals erfolgen kann. Die zumindest zwei unterschiedlichen Heraufumsetzparameter 1108 und das Energiemaß 1106 sind in dem Eingangssignal enthalten.
  • Vorzugsweise ist das Energiemaß irgendein Maß, das auf einen Energieverlust bezogen ist, der durch die Heraufumsetzregel eingebracht wird. Dasselbe kann ein absolutes Maß des durch die Heraufumsetzung eingebrachten Energiefehlers oder der Energie des Heraufumsetzsignals (das normalerweise energiemäßig geringer als das ursprüngliche Signal ist) sein oder dasselbe kann ein relatives Maß sein, wie bei spielsweise eine Beziehung zwischen der Energie des ursprünglichen Signals und der Energie des Heraufumsetzsignals oder eine Beziehung zwischen dem Energiefehler und der Energie des ursprünglichen Signals oder sogar eine Beziehung zwischen dem Energiefehler und der Energie des Heraufumsetzsignals. Ein relatives Energiemaß kann als ein Korrekturfaktor verwendet werden, aber ist dennoch ein Energiemaß, da dasselbe von dem Energiefehler abhängt, der in das Heraufumsetzsignal eingebracht und durch eine einen Energieverlust einbringende Heraufumsetzregel oder – in anderen Worten ausgedrückt – eine nicht energiebewahrende Heraufumsetzregel erzeugt wird.
  • Eine exemplarische, einen Energieverlust einbringende Heraufumsetzregel (nicht energiebewahrende Heraufumsetzregel) ist eine Heraufumsetzung unter Verwendung übertragener Prädiktionskoeffizienten. Im Fall einer nichtvollkommenen Voraussage eines Rahmens oder eines Subbands eines Rahmens ist das Heraufumsetzausgangssignal durch einen Prädiktionsfehler betroffen, entsprechend einem Energieverlust. Natürlich variiert der Prädiktionsfehler von Rahmen zu Rahmen, da im Fall einer beinahe vollkommenen Voraussage (ein geringer Prädiktionsfehler) lediglich eine kleine Kompensation (durch ein Skalieren oder Addieren eines dekorrelierten Signals) vorgenommen werden muss, während im Fall eines größeren Prädiktionsfehlers (einer nichtvollkommenen Voraussage) mehr Kompensation vorgenommen werden muss. Deshalb variiert das erfindungsgemäße Energiemaß auch zwischen einem Wert, der keine oder lediglich eine geringe Kompensation angibt, und einem Wert, der eine große Kompensation angibt.
  • Wenn das Energiemaß als ein Zwischenkanalkohärenzwert (ICC-Wert; ICC = InterChannel Coherence) betrachtet wird, wobei diese Betrachtung natürlich ist, wenn die Kompensation durch ein Addieren eines dekorrelierten Signals vorgenommen wird, das abhängig von dem Energiemaß skaliert ist, variiert das vorzugsweise verwendete relative Energiemaß (ρ) typischerweise zwischen 0,8 und 1,0, wobei 1,0 angibt, dass die heraufumgesetzten Signale dekorreliert sind, wie es erforderlich ist, oder dass kein dekorreliertes Signal addiert werden soll, oder dass die Energie des prädiktiven Heraufumsetzergebnisses gleich der Energie des ursprünglichen Signals ist, oder dass der Prädiktionsfehler Null beträgt.
  • Die vorliegende Erfindung ist jedoch auch in Verbindung mit anderen einen Energieverlust einbringenden Heraufumsetzregeln nützlich, d. h. Regeln, die nicht auf einer Signalverlaufsanpassung basieren, sondern die auf anderen Techniken basieren, wie beispielsweise der Verwendung von Codebüchern, einer Spektralanpassung oder irgendwelchen anderen Heraufumsetzregeln, die sich nicht um eine energiebewahrung kümmern.
  • Im Allgemeinen kann die Energiekompensation vor oder nach einem Anwenden der einen Energieverlust einbringenden Heraufumsetzregel durchgeführt werden. Alternativ kann die Energieverlustkompensation sogar in die Heraufumsetzregel eingeschlossen werden, wie beispielsweise durch ein Ändern der ursprünglichen Matrixkoeffizienten unter Verwendung des Energiemaßes, so dass eine neue Heraufumsetzregel erzeugt und durch den Heraufumsetzer verwendet wird. Diese neue Heraufumsetzregel basiert auf der einen Energieverlust einbringenden Heraufumsetzregel und dem Energiemaß. In anderen Worten ausgedrückt bezieht sich dieses Ausführungsbeispiel auf eine Situation, in der die Energiekompensation in die „verbesserte" Heraufumsetzregel „gemischt" wird, so dass die Energiekompensation und/oder die Addition eines dekorrelierten Signals durch ein Anwenden einer oder mehrerer Heraufumsetzmatrizen auf einen Eingangsvektor (den einen Basiskanal oder die mehreren Basiskanäle) durchgeführt werden, um (nach der einen oder den mehreren Matrixoperationen) den Ausgangsvektor (das rekonstruierte Mehrkanalsignal mit zumindest drei Kanälen) zu erhalten.
  • Vorzugsweise empfängt die Heraufumsetzervorrichtung zwei Basiskanäle l0, r0 und gibt drei rekonstruierte Kanäle l, r und c aus.
  • Nachfolgend wird auf 12 Bezug genommen, um ein Beispiel einer Energiesituation an unterschiedlichen Positionen an einem Codierer-Decodierer-Weg zu zeigen. Ein Block 1200 zeigt eine Energie eines Mehrkanalaudiosignals, wie beispielsweise eines Signals, das zumindest einen Links-Kanal, einen Rechts-Kanal und einen Mitte-Kanal aufweist, wie es in 1 gezeigt ist. Bei dem Ausführungsbeispiel in 12 wird angenommen, dass die Eingangskanäle 101, 102, 103 in 1 vollständig unkorreliert sind und dass der Herunterumsetzer energiebewahrend ist. In diesem Fall ist die Energie des einen oder der mehreren Basiskanäle, die durch einen Block 1202 angegeben sind, identisch mit der Energie 1200 des ursprünglichen Mehrkanalsignals. Wenn die ursprünglichen Mehrkanalsignale miteinander korreliert sind, kann die Basiskanalenergie 1202 niedriger als die Energie des ursprünglichen Mehrkanalsignals sein, wenn beispielsweise der linke und der rechte einander (teilweise) aufheben.
  • Für die nachfolgende Erörterung jedoch wird angenommen, dass die Energie 1202 der Basiskanäle die gleiche wie die Energie 1200 des ursprünglichen Mehrkanalsignals ist.
  • 1204 stellt die Energie der Heraufumsetzsignale dar, wenn die Heraufumsetzsignale (z. B. 110, 111, 112 von 1) unter Verwendung einer nicht energiebewahrenden Heraufumsetzung oder einer prädiktiven Heraufumsetzung erzeugt werden, wie es in Verbindung mit 1 erörtert ist. Wie es später im Hinblick auf 14a und 14b umrissen wird, wird die Energie 1204 des Heraufumsetzergebnisses niedriger als die Energie der Basiskanäle 1202 sein, da eine derartige prädiktive Heraufumsetzung einen Energiefehler Er einbringt.
  • Der Heraufumsetzer 1104 ist wirksam, um Ausgangskanäle auszugeben, die eine Energie aufweisen, die höher als die Energie 1204 ist. Vorzugsweise führt die Heraufumsetzervorrichtung 1104 eine vollständige Kompensation durch, so dass das Heraufumsetzergebnis 1100 in 11 eine Energie aufweist, die bei 1206 gezeigt ist.
  • Vorzugsweise ist das Heraufumsetzergebnis, dessen Energie bei 1204 gezeigt ist, nicht einfach heraufskaliert, wie es in 2 gezeigt ist, oder einzeln heraufskaliert, wie es in 3 gezeigt ist, oder codiererseitig heraufskaliert, wie es in 4 gezeigt ist. Anstelle dessen ist die verbleibende Energie Er, die dem Fehler aufgrund der prädiktiven Heraufumsetzung entspricht, unter Verwendung eines dekorrelierten Signals „aufgefüllt". Bei einem anderen bevorzugten Ausführungsbeispiel ist dieser Energiefehler Er teilweise durch ein dekorreliertes Signal abgedeckt, während der Rest des Energiefehlers durch ein Heraufskalieren des Heraufumsetzergebnisses ausgeglichen wird. Die vollständige Abdeckung des Energiefehlers durch ein dekorreliertes Signals ist in 5 und 6 gezeigt, während die „Teil"-Lösung durch 7 dargestellt ist.
  • 13 zeigt eine Mehrzahl von Energiekompensationsverfahren, z. B. Verfahren, denen das Merkmal gemeinsam ist, dass basierend auf einem Energiemaß, das von dem Energiefehler abhängt, die Energie der Ausgangskanäle höher als das reine Ergebnis der prädiktiven Heraufumsetzung ist, d. h. das Ergebnis der (nicht korrigierten) einen Energieverlust einbringenden Heraufumsetzregel.
  • Nummer 1 der Tabelle in 13 bezieht sich auf die decodiererseitige Energiekompensation, die nachfolgend zu der Heraufumsetzung durchgeführt wird. Diese Option ist in 2 gezeigt und ist zusätzlich ferner in Verbindung mit 3 ausführlich dargelegt, die die kanalspezifischen Heraufskalierfaktoren gz zeigt, die nicht nur von dem Energiemaß ρ abhängen, sondern die zusätzlich von den kanalabhängigen Herunterumsetzfaktoren νz abhängen, wobei z für l, r oder c steht.
  • Nummer 2 von 13 umfasst das codiererseitige Kompensationsverfahren, das nachfolgend zu der Herunterumsetzung durchgeführt wird, die in 4 dargestellt ist. Dieses Ausführungsbeispiel ist dahingehend bevorzugt, dass das Energiemaß ρ oder γ nicht von dem Codierer an den Decodierer übertragen werden muss.
  • Nummer 3 der Tabelle in 13 bezieht sich auf die decodiererseitige Energiekompensation, die vor der Heraufumsetzung durchgeführt wird. Wenn 2 betrachtet wird, würde die Energiekorrektur 202, die nach der Heraufumsetzung in 2 durchgeführt wird, vor dem Heraufumsetzblock 201 in 2 durchgeführt. Dieses Ausführungsbeispiel führt verglichen mit 2 zu einer einfacheren Implementierung, da keine kanalspezifischen Korrekturfaktoren erforderlich sind, wie es in 3 gezeigt ist, obwohl Qualitätsverluste auftreten könnten.
  • Nummer 4 von 13 bezieht sich auf ein weiteres Ausführungsbeispiel, bei dem eine codiererseitige Korrektur vor einer Herunterumsetzung durchgeführt wird. Wenn 1 betrachtet wird, würden die Kanäle 101, 102, 103 um einen entsprechenden Kompensationsfaktor heraufskaliert, so dass die Herunterumsetzerausgabe nach einem Herunterumsetzen erhöht ist, wie es bei 1208 in 12 gezeigt ist. Somit weist das Ausführungsbeispiel Nummer Vier in 13 die gleiche Folge für die Ausgabe der Basiskanäle durch einen Codierer wie das Ausführungsbeispiel Nummer Zwei der vorliegenden Erfindung auf.
  • Nummer 5 der Tabelle von 13 bezieht sich auf das Ausführungsbeispiel in 5, wenn das dekorrelierte Signal von den Kanälen abgeleitet ist, die durch die nicht energiebewahrende Heraufumsetzregel 109 in 5 erzeugt sind.
  • Das Ausführungsbeispiel Nummer 6 in der Tabelle in 13 bezieht sich auf das Ausführungsbeispiel, bei dem lediglich ein Teil der restlichen Energie durch das dekorrelierte Signal abgedeckt ist. Dieses Ausführungsbeispiel ist in 7 dargestellt.
  • Das Ausführungsbeispiel Nummer 8 von 13 ist dem Ausführungsbeispiel Nummer 5 oder 6 ähnlich, aber das dekorrelierte Signal wird von den Basiskanälen vor einem Heraufumsetzen abgeleitet, wie es durch einen Kasten 501' in 5 umrissen ist.
  • Nachfolgend wird ein bevorzugtes Ausführungsbeispiel des Codierers detailliert beschrieben. 14a stellt einen Codierer zum Verarbeiten eines Mehrkanaleingangssignals 1400 mit zumindest zwei Kanälen und vorzugsweise mit zumindest drei Kanälen l, c, r dar.
  • Der Codierer umfasst eine Energiemaßberechnungseinrichtung 1402 zum Berechnen eines Energiemaßes abhängig von einer Energiedifferenz zwischen einer Energie des Mehrkanaleingangssignals 1400 oder zumindest einem Basiskanal 1404 und einem heraufumgesetzten Signal 1406, das durch eine nicht energiebewahrende Heraufumsetzungsoperation 1407 erzeugt wird.
  • Ferner umfasst der Codierer eine Ausgabeschnittstelle 1408 zum Ausgeben des zumindest einen Basiskanals, nachdem derselbe durch einen Skalierungsfaktor 403 abhängig von dem Energiemaß skaliert wurde (401, 402), und zum Ausgeben des Energiemaßes selbst.
  • Bei einem bevorzugten Ausführungsbeispiel umfasst der Codierer einen Herunterumsetzer 1410 zum Erzeugen des zumindest einen Basiskanals 1404 aus den ursprünglichen mehreren Kanälen 1400. Zum Erzeugen der Heraufumsetzparameter sind ferner eine Differenzberechnungseinrichtung 1414 und ein Parameteroptimierer 1416 vorhanden. Diese Elemente sind wirksam, um die am besten passenden Heraufumsetzparameter 1412 zu finden. Zumindest zwei aus diesem Satz von am besten passenden Heraufumsetzparametern werden über die Ausgabeschnittstelle bei einem bevorzugten Ausführungsbeispiel als die Parameterausgabe ausgegeben. Die Differenzberechnungseinrichtung ist vorzugsweise wirksam, um eine Minimal-Mittleres-Fehlerquadrat-Berechnung zwischen dem ursprünglichen Mehrkanalsignal 1400 und dem von dem Heraufumsetzer erzeugten Heraufumsetzsignal für eine Parametereingabe an einer Parameterleitung 1412 durchzuführen. Diese Parameteroptimierungsprozedur kann durch mehrere unterschiedliche Optimierungsprozeduren durchgeführt werden, die alle durch das Ziel getrieben sind, ein am besten passendes Heraufumsetzergebnis 1406 durch eine bestimmte Heraufumsetzmatrix zu erhalten, die in dem Heraufumsetzer 1407 enthalten ist.
  • Die Funktionalität des Codierers von 14a ist in 14b gezeigt. Nach einem Herunterumsetzschritt 1440, der durch den Herunterumsetzer 1410 durchgeführt wird, kann der Basiskanal oder die Mehrzahl von Basiskanälen ausgegeben werden, wie es durch 1442 dargestellt ist. Dann wird ein Heraufumsetzparameteroptimierungsschritt 1444 durchgeführt, der abhängig von einer bestimmten Optimierungsstrategie eine iterative oder nichtiterative Prozedur sein kann. Iterative Prozeduren sind jedoch bevorzugt. Im Allgemeinen kann die Heraufumsetzparameteroptimierungsprozedur implementiert sein, derart, dass die Differenz zwischen dem Heraufumsetzergebnis und dem ursprünglichen Signal möglichst gering ist. Abhängig von der Implementierung kann diese Differenz eine einzelne kanalbezogene Differenz oder eine kombinierte Differenz sein. Im Allgemeinen ist der Heraufumsetzparameteroptimierungsschritt 1444 wirksam bei einem Minimieren irgendeiner Kostenfunktion, die von einzelnen Kanälen oder von kombinierten Kanälen abgeleitet sein kann, so dass für einen Kanal eine größere Differenz (Fehler) angenommen wird, wenn beispielsweise für die anderen zwei Kanäle eine viel bessere Anpassung erreicht wird.
  • Wenn dann der am besten passende Parametersatz, z. B. die am besten passende Heraufumsetzmatrix gefunden wurde, werden zumindest zwei Heraufumsetzparameter des Parametersatzes, der durch den Schritt 1444 erzeugt wird, an die Ausgabeschnittstelle ausgegeben, wie es durch einen Schritt 1446 angegeben ist.
  • Nachdem der Heraufumsetzparameteroptimierungsschritt 1444 abgeschlossen ist, kann ferner das Energiemaß berechnet und ausgegeben werden, wie es durch einen Schritt 1448 angegeben ist. Im Allgemeinen wird das Energiemaß von dem Energiefehler 1210 abhängen. Bei einem bevorzugten Ausführungsbeispiel ist das Energiemaß der Faktor ρ, der von der Beziehung der Energie des Heraufumsetzergebnisses 1406 und der Energie des ursprünglichen Signals 1400 abhängt, wie es in 2 gezeigt ist. Alternativ kann das Energiemaß, das berechnet und ausgegeben wird, ein absoluter Wert für den Energiefehler 1210 sein oder kann die absolute Energie des Heraufumsetzergebnisses 1406 sein, die natürlich von dem Energiefehler abhängt. In diesem Zusammenhang ist zu beachten, dass das Energiemaß, das durch die Ausgabeschnittstelle 1408 ausgegeben wird, vorzugsweise quantisiert und wiederum vorzugsweise unter Verwendung irgendeines gut bekannten Entropiecodierers entropiecodiert wird, wie beispielsweise eines arithmetischen Codierers, eines Huffman-Codierers oder eines Lauflängencodierers, was besonders nützlich ist, wenn es viele nachfolgende identische Energiemaße gibt. Alternativ oder zusätzlich können die Energiemaße für nachfolgende Zeitabschnitte oder Rahmen differenzcodiert sein, wobei diese Differenzcodierung vorzugsweise vor einer Entropiecodierung durchgeführt wird.
  • Nachfolgend wird Bezug auf 15a genommen, die ein alternatives Herunterumsetzerausführungsbeispiel zeigt, das gemäß einem bevorzugten Ausführungsbeispiel der vorliegen den Erfindung mit dem Codierer von 14a kombiniert ist. Das Ausführungsbeispiel von 15a deckt eine SBR-Implementierung ab, obwohl dieses Ausführungsbeispiel auch in Fällen verwendet werden kann, in denen keine Spektralbandreplikation durchgeführt wird, sondern in denen die vollständige Bandbreite der Basiskanäle übertragen wird. Der Codierer von 15a umfasst einen Herunterumsetzer 1500 zum Herunterumsetzen des ursprünglichen Signals 1500, um zumindest einen Basiskanal 1504 zu erhalten. Bei einem Nicht-SBR-Ausführungsbeispiel wird der zumindest eine Basiskanal 1504 in einen Kerncodierer 1506 eingegeben, der in dem Fall eines einzigen Basiskanals ein AAC-Codierer für Monosignale sein kann oder der im Fall von beispielsweise zwei Stereobasiskanälen irgendein Stereocodierer sein kann. An dem Ausgang des Kerncodierers 1506 wird ein Bitstrom ausgegeben (1508), der einen codierten Basiskanal umfasst oder eine Mehrzahl von codierten Basiskanälen umfasst.
  • Wenn das Ausführungsbeispiel von 15a eine SBR-Funktionalität aufweist, wird der zumindest eine Basiskanal 1504 tiefpassgefiltert 1510, bevor derselbe in den Kerncodierer eingegeben wird. Natürlich können die Funktionalitäten der Blöcke 1510 und 1506 durch eine einzige Codierervorrichtung implementiert sein, die ein Tiefpassfiltern und ein Kerncodieren innerhalb eines einzigen Codieralgorithmus durchführt.
  • Die codierten Basiskanäle an dem Ausgang 1508 umfassen lediglich ein Tiefband der Basiskanäle 1504 in codierter Form. Informationen über das Hochband werden über eine SBR-Spektralhüllkurvenberechnungseinrichtung 1512 berechnet, die mit einem SBR-Informationscodierer 1514 zum Erzeugen und Ausgeben codierter SBR-Seiteninformationen an einem Ausgang 1516 verbunden ist.
  • Das ursprüngliche Signal 1502 wird in eine Energieberechnungseinrichtung 1520 eingegeben, die Kanalenergien erzeugt (für eine bestimmte Zeitperiode der ursprünglichen Kanäle l, c, r, wobei die Kanalenergien durch L, C, R angegeben sind, die durch einen Block 1520 ausgegeben werden). Die Kanalenergien L, C, R werden in einen Parameterberechnungseinrichtungsblock 1522 eingegeben. Die Parameterberechnungseinrichtung 1522 gibt zwei Heraufumsetzparameter c1, c2 aus, die beispielsweise die Parameter c1, c2 sein können, die in 15a angegeben sind. Natürlich können andere (z. B. lineare) Energiekombinationen, die die Energien aller Eingangskanäle betreffen, durch die Parameterberechnungseinrichtung 1522 für eine Übertragung an einen Decodierer erzeugt werden. Natürlich führen unterschiedliche übertragene Heraufumsetzparameter zu einer unterschiedlichen Art eines Berechnens der verbleibenden Heraufumsetzmatrixelemente. Wie es in Verbindung mit Gleichung (40) oder Gleichungen (41 – 44) angegeben ist, weist die Heraufumsetzmatrix für das energiegerichtete Ausführungsbeispiel von 15 zumindest vier Elemente ungleich Null auf, wobei die Elemente in der dritten Zeile einander gleich sind. Somit kann die Parameterberechnungseinrichtung 1522 beispielsweise irgendeine Kombination der Energien L, C, R verwenden, aus der die vier Elemente in der Heraufumsetzmatrix abgeleitet werden können, wie beispielsweise eine Heraufumsetzmatrixangabe (40) oder (41).
  • Das Ausführungsbeispiel von 15a stellt einen Codierer dar, der wirksam ist, um eine energiebewahrende, oder allgemein ausgedrückt die energieabgeleitete, Heraufumsetzung für die gesamte Bandbreite eines Signals durchzuführen. Dies bedeutet, dass auf der Codiererseite, die in 15a dargestellt ist, die Parameterdarstellung, die durch die Parameterberechnungseinrichtung 1522 ausgegeben wird, für das gesamte Signal erzeugt wird. Dies bedeutet, dass für jedes Subband des codierten Basiskanals ein entsprechender Satz von Parametern berechnet und ausgegeben wird. Wenn beispielsweise der codierte Basiskanal, der beispielsweise ein Signal voller Bandbreite mit den Subbändern ist, betrachtet wird, könnte die Parameterberechnungseinrichtung zehn Parameter c1 und c2 für jedes Subband des codierten Basiskanals ausgeben. Wenn jedoch der codierte Basiskanal ein Tiefbandsignal bei einem SBR-Ausführungsbeispiel wäre, das lediglich die fünf unteren Subbänder abdeckt, dann würde die Parameterberechnungseinrichtung 1522 einen Satz von Parametern für jedes der fünf unteren Subbänder und zusätzlich für jedes der fünf oberen Subbänder ausgeben, obwohl das Signal an dem Ausgang 1508 kein entsprechendes Subband umfasst. Dies rührt von der Tatsache her, dass ein derartiges Subband auf der Decodiererseite wiedererzeugt werden würde, wie es nachfolgend in Verbindung mit 16a beschrieben wird.
  • Vorzugsweise jedoch, und wie es in Verbindung mit 10 beschrieben ist, sind die Energieberechnungseinrichtung 1520 und die Parameterberechnungseinrichtung 1522 lediglich für den Hochbandteil des ursprünglichen Signals wirksam, während Parameter für den Tiefbandteil des ursprünglichen Signals durch die prädiktive Parameterberechnungseinrichtung 104 in 10 berechnet werden, die dem prädiktiven Heraufumsetzer 109 in 10 entsprechen würde.
  • 15b zeigt eine schematische Darstellung einer Parameterdarstellung, die durch das Auswahlmodul 1002 in 10 ausgegeben wird. Somit umfasst eine Parameterdarstellung gemäß der vorliegenden Erfindung (mit oder ohne dem codierten Basiskanal (den codierten Basiskanälen) und optional sogar ohne dem Energiemaß) einen Satz von prädiktiven Parametern für das Tiefband, z. B. für die Subbänder 1 bis i, und subbandweise Parameter für das Hochband, z. B. für die Subbänder i + 1 bis N. Alternativ können die prädiktiven Parameter und die Energiestilparameter gemischt sein, z. B. so dass ein Subband mit Energiestilparametern zwischen Subbändern mit prädiktiven Parametern positioniert sein kann. Ferner kann ein Rahmen, der lediglich prädiktive Parameter aufweist, auf einen Rahmen folgen, der lediglich Energiestilparameter aufweist. Deshalb bezieht sich allgemein gesagt die vorliegende Erfindung, wie es in Verbindung mit 10 erörtert ist, auf unterschiedliche Parametri sierungen, die in der Frequenzrichtung unterschiedlich sein können, wie es in 15b gezeigt ist, oder die in der Zeitrichtung unterschiedlich sein können, wenn ein Rahmen mit lediglich prädiktiven Parametern von einem Rahmen mit lediglich Energiestilparametern gefolgt ist. Natürlich kann sich die Verteilung oder Parametrisierung von Subbändern von Rahmen zu Rahmen verändern, so dass beispielsweise das Subband i in einem ersten Rahmen einen ersten (z. B. prädiktiven) Parametersatz aufweist, wie es in 15b gezeigt ist, und in einem anderen Rahmen einen zweiten (z. B. Energiestil-) Parametersatz aufweist.
  • Ferner ist die vorliegende Erfindung auch nützlich, wenn Parametrisierungen verwendet werden, die sich von der prädiktiven Parametrisierung, die in 14a gezeigt ist, oder der Energiestilparametrisierung, die in 15a gezeigt ist, unterscheiden. Es können auch weitere Beispiele für eine Parametrisierung, neben prädiktiv oder Energiestil, verwendet werden, sobald irgendein Zielparameter oder ein Zielereignis angibt, dass die Heraufumsetzqualität, die Herunterumsetzbitrate, die Recheneffizienz auf der Codiererseite oder auf der Decodiererseite oder beispielsweise der Energieverbrauch von z. B. batteriebetriebenen Vorrichtungen etc. sagt, dass für ein bestimmtes Subband oder einen bestimmten Rahmen die erste Parametrisierung besser als die zweite Parametrisierung ist. Natürlich kann auch die Zielfunktion eine Kombination von unterschiedlichen einzelnen Zielen/Ereignissen sein, wie es oben umrissen ist. Ein exemplarisches Ereignis wäre ein SBR-rekonstruiertes Hochband etc.
  • Ferner ist zu beachten, dass die frequenz- oder zeitselektive Berechnung und Übertragung von Parametern explizit signalisiert werden kann, wie es bei 1005 in 10 gezeigt ist. Alternativ kann die Signalisierung auch implizit durchgeführt werden, wie es beispielsweise in Verbindung mit 16a erörtert ist. In diesem Fall werden vordefinierte Regeln für den Decodierer verwendet, beispielsweise dass der Decodierer automatisch annimmt, dass die übertragenen Parameter Energiestilparameter für Subbänder sind, die zu dem Hochband in 15b gehören, z. B. für Subbänder, die durch eine Spektralbandreplikations- oder Hochfrequenzregenerationstechnik rekonstruiert wurden.
  • Ferner ist zu beachten, dass die erfindungsgemäße codiererseitige Berechnung von einer, zwei oder sogar mehr unterschiedlichen Parametrisierungen und die codiererseitige Auswahl, welche Parametrisierung übertragen wird, die auf einer Entscheidung beruht, die irgendwelche codiererseitig verfügbaren Informationen verwendet (die Informationen können eine tatsächlich verwendete Zielfunktion oder Signalisierungsinformationen sein, die aus anderen Gründen verwendet werden, wie beispielsweise einer SBR-Verarbeitung und Signalisierung) mit oder ohne einem Übertragen des Energiemaßes durchgeführt werden können. Selbst wenn die bevorzugte Energiekorrektur überhaupt nicht durchgeführt wird, z. B. wenn das Ergebnis der nicht energiebewahrenden Heraufumsetzung (prädiktiven Heraufumsetzung) nicht energiemäßig korrigiert wird oder wenn keine entsprechende Vorkompensation auf der Codiererseite durchgeführt wird, ist das erfindungsgemäße Umschalten zwischen unterschiedlichen Parametrisierungen zum Erhalten einer besseren Mehrkanalausgabequalität und/oder einer niedrigeren Bitrate nützlich.
  • Insbesondere kann das erfindungsgemäße Umschalten zwischen unterschiedlichen Parametrisierungen abhängig von verfügbaren codiererseitigen Informationen mit oder eine Addition eines dekorrelierten Signals verwendet werden, das den Energiefehler vollständig oder zumindest teilweise abdeckt, der durch die prädiktive Heraufumsetzung durchgeführt wird, wie es in Verbindung mit 5 bis 7 gezeigt ist. In diesem Zusammenhang wird die Addition eines dekorrelierten Signals, wie es in Verbindung mit 5 beschrieben ist, lediglich für die Subbänder/Rahmen durchgeführt, für die prädiktive Heraufumsetzparameter übertragen werden, während unterschiedliche Maße für eine Dekorrelation für diese Subbänder oder Rahmen verwendet werden, in denen Energiestilparameter übertragen wurden. Derartige Maße sind beispielsweise ein Herunterskalieren des Nass-Signals und ein Erzeugen eines dekorrelierten Signals und ein Skalieren des dekorrelierten Signals, so dass eine erforderliche Größe einer Dekorrelation erhalten wird, wie es beispielsweise durch ein übertragenes Zwischenkanalkorrelationsmaß, wie beispielsweise ICC, erforderlich ist, wenn die ordnungsgemäß skalierten dekorrelierten Signale zu dem Trocken-Signal addiert werden.
  • Nachfolgend wird 16a erörtert zum Darstellen einer decodiererseitigen Implementierung des erfindungsgemäßen Heraufumsetzblocks 201 und der entsprechenden Energiekorrektur bei 202. Wie es in Verbindung mit 11 erörtert ist, werden die übertragenen Heraufumsetzparameter 1108 aus einem empfangenen Eingangssignal extrahiert. Diese übertragenen Heraufumsetzparameter werden vorzugsweise in eine Berechnungseinrichtung 1600 zum Berechnen der verbleibenden Heraufumsetzparameter eingegeben, wenn die Heraufumsetzmatrix 1602, die eine Energiekompensation umfasst, eine prädiktive Heraufumsetzung und eine vorhergehende oder nachfolgende Energiekorrektur durchführen soll. Die Prozedur zum Berechnen der verbleibenden Heraufumsetzparameter wird nachfolgend in Verbindung mit 16b erörtert.
  • Die Berechnung der Heraufumsetzparameter basiert auf der Gleichung in 16b, die auch als Gleichung (7) wiederholt ist. Bei dem Ausführungsbeispiel mit drei Eingangssignalen/zwei Ausgangssignalen weist die Herunterumsetzmatrix D sechs Variablen auf. Zusätzlich weist die Heraufumsetzmatrix C ebenfalls sechs Variablen auf. Auf der rechten Seite von Gleichung (7) gibt es jedoch lediglich vier Werte. Deshalb hätte man im Fall einer unbekannten Herunterumsetzung und einer unbekannten Heraufumsetzung zwölf unbekannte Variablen aus den Matrizen D und C und lediglich vier Gleichungen zum Bestimmen dieser zwölf Variablen. Die Herunterumsetzung ist jedoch bekannt, so dass die Anzahl von Variablen, die unbekannt sind, sich auf die Koeffizienten der Heraufumsetzmatrix C reduziert, die sechs Variablen aufweist, obwohl es immer noch vier Gleichungen zum Bestimmen dieser sechs Variablen gibt. Deshalb wird das Optimierungsverfahren, das in Verbindung mit dem Schritt 1444 in 14b erörtert und in 14a dargestellt ist, zum Bestimmen von zumindest zwei Variablen der Heraufumsetzmatrix verwendet, die vorzugsweise c11 und c22 sind. Da es nun vier Unbekannte gibt, z. B. c12, c21, c31 und c32, und da es vier Gleichungen gibt, z. B. eine Gleichung für jedes Element in der Identitätsmatrix I auf der rechten Seite der Gleichung in 16b, können die verbleibenden unbekannten Variablen der Heraufumsetzmatrix auf einfache Weise berechnet werden. Diese Berechnung wird in der Berechnungseinrichtung 1600 zum Berechnen der verbleibenden Heraufumsetzparameter durchgeführt.
  • Die Heraufumsetzmatrix in der Vorrichtung 1602 ist gemäß den zwei übertragenen Heraufumsetzparametern, die weitergeleitet werden, durch eine gestrichelte Linie 1604 und durch die verbleibenden vier Heraufumsetzparameter, die durch den Block 1600 berechnet werden, festgelegt. Diese Heraufumsetzmatrix wird dann auf die Basiskanäle angewandt, die über die Leitung 1102 eingegeben werden. Abhängig von der Implementierung wird ein Energiemaß für eine Tiefbandkorrektur über die Leitung 1106 weitergeleitet, so dass eine korrigierte Heraufumsetzung erzeugt und ausgegeben werden kann. Wenn die prädiktive Heraufumsetzung lediglich für das Tiefband durchgeführt wird, wie es beispielsweise implizit über die Leitung 1606 signalisiert wird, und wenn Energiestilheraufumsetzparameter an der Leitung 1108 für das Hochband existieren, wird diese Tatsache für ein entsprechendes Subband an die Berechnungseinrichtung 1600 und an die Heraufumsetzmatrixvorrichtung 1602 signalisiert. In dem Energiestilfall ist bevorzugt, die Heraufumsetzmatrixelemente der Heraufumsetzmatrix (40) oder (41) zu berechnen. Zu diesem Zweck werden die übertragenen Parameter, wie es unter Gleichung (40) angegeben ist, oder die entsprechenden Parameter, wie es unter Gleichung (41) angegeben ist, verwendet. Bei diesem Ausführungsbeispiel können die übertragenen Heraufumsetzparameter c1, c2 nicht direkt für einen Heraufumsetzkoeffizienten verwendet werden, sondern die Heraufumsetzkoeffizienten der Heraufumsetzmatrix, wie es in Gleichung (40) oder (41) gezeigt ist, müssen unter Verwendung der übertragenen Heraufumsetzparameter c1 und c2 berechnet werden.
  • Für das Hochband wird eine Heraufumsetzmatrix, die für die energiebasierten Heraufumsetzparameter bestimmt ist, zum Heraufumsetzen des Hochbandteils der Mehrkanalausgangssignale verwendet. Nachfolgend werden der Tiefbandteil und der Hochbandteil in einem Tief/Hoch-Kombinierer 1608 zum Ausgeben der vollständig bandbreitenrekonstruierten Ausgangskanäle l, r, c kombiniert. Wie es in 16a dargestellt ist, wird das Hochband der Basiskanäle unter Verwendung eines Decodierers zum Decodieren der übertragenen Tiefbandbasiskanäle erzeugt, wobei dieser Decodierer für ein Monobasissignal ein Monodecodierer ist und für zwei Stereobasiskanäle ein Stereodecodierer ist. Dieser decodierte Tiefbandbasiskanal (diese decodierten Tiefbandbasiskanäle) wird (werden) in eine SBR-Vorrichtung 1614 eingegeben, die zusätzlich Hüllkurveninformationen empfängt, die durch die Vorrichtung 1512 in 15a berechnet werden. Basierend auf dem Tiefbandteil und den Hochbandhüllkurveninformationen wird das Hochband der Basiskanäle erzeugt, um Basiskanäle mit voller Bandbreite an der Leitung 1102 zu erhalten, die in die Heraufumsetzmatrixvorrichtung 1602 weitergeleitet werden.
  • Die erfindungsgemäßen Verfahren oder Vorrichtungen oder Computerprogramme können in mehreren Vorrichtungen implementiert oder enthalten sein. 17 zeigt ein Übertragungssystem, das einen Sender aufweist, der einen erfindungsgemäßen Codierer umfasst, und einen Empfänger aufweist, der einen erfindungsgemäßen Decodierer umfasst. Der Übertragungskanal kann ein drahtloser oder verdrahteter Kanal sein. Wie es in 18 gezeigt ist, kann der Codierer ferner in einem Audioaufzeichnungsgerät enthalten sein oder kann der Decodierer in einem Audioabspielgerät enthalten sein. Audioaufzeichnungen von dem Audioaufzeichnungsgerät können an das Audioabspielgerät über das Internet oder über ein Speichermedium verteilt werden, das unter Verwendung von Post oder Kurierressourcen oder anderen Möglichkeiten zum Verteilen von Speichermedien verteilt wird, wie beispielsweise Speicherkarten, CDs oder DVDs.
  • Abhängig von bestimmten Implementierungsanforderungen der erfindungsgemäßen Verfahren können die erfindungsgemäßen Verfahren in Hardware oder in Software implementiert sein. Die Implementierung kann unter Verwendung eines digitalen Speichermediums durchgeführt werden, insbesondere einer Platte oder einer CD, auf der elektronisch lesbare Steuersignale gespeichert sind, die mit einem programmierbaren Computersystem zusammenwirken können, derart, dass die erfindungsgemäßen Verfahren durchgeführt werden. Mit anderen Worten bestehen deshalb die erfindungsgemäßen Verfahren in einem Computerprogramm, das einen Programmcode zum Durchführen der erfindungsgemäßen Verfahren aufweist, wenn das Computerprogramm auf einem Computer ausgeführt wird.

Claims (50)

  1. Mehrkanalaudiosynthetisierer zum Erzeugen von zumindest drei Ausgangskanälen (1100) unter Verwendung eines Eingangssignals, das zumindest einen Basiskanal (1102) aufweist, wobei der Basiskanal von dem ursprünglichen Mehrkanalsignal (101, 102, 103) abgeleitet ist, der folgende Merkmale aufweist: einen Heraufumsetzer (1104) zum Heraufumsetzen des zumindest einen Basiskanals basierend auf einer einen Energieverlust einbringenden Heraufumsetzregel (201, 1407), so dass die zumindest drei Ausgangskanäle erhalten werden, wobei der Heraufumsetzer (1104) wirksam ist, um die zumindest drei Ausgangskanäle ansprechend auf ein Energiemaß (1106) und zumindest zwei unterschiedliche Heraufumsetzparameter (1108) zu erzeugen, so dass die zumindest drei Ausgangskanäle (1100) eine Energie aufweisen, die höher als eine Energie eines Signals ist, das durch ein Verwenden von lediglich der einen Energieverlust einbringenden Heraufumsetzregel erhalten wird, wobei so ein Energiefehler kompensiert wird, wobei der Energiefehler von der einen Energieverlust einbringenden Heraufumsetzregel abhängt, und wobei die zumindest zwei unterschiedlichen Heraufumsetzparameter (1108) und das Energiemaß zum Steuern des Heraufumsetzers in dem Eingangssignal enthalten sind, wobei die einen Energieverlust einbringende Heraufumsetzregel eine prädiktive Heraufumsetzregel ist, die eine Heraufumsetzmatrix verwendet, die Matrixkoeffi zienten aufweist, die auf Prädiktionskoeffizienten basieren, und wobei die zumindest zwei unterschiedlichen Heraufumsetzparameter zwei unterschiedliche Elemente (c11, c22) der Heraufumsetzmatrix sind oder Parameter sind, von denen die zwei unterschiedlichen Elemente der Heraufumsetzmatrix ableitbar sind.
  2. Mehrkanalsynthetisierer gemäß Anspruch 1, bei dem das Energiemaß direkt oder indirekt eine Beziehung einer Energie eines Aufwärtsumsetzergebnisses unter Verwendung der einen Energieverlust einbringenden Heraufumsetzregel zu einer Energie des ursprünglichen Mehrkanalsignals oder eine Beziehung des Energiefehlers zu einer Energie oder dem ursprünglichen Mehrkanalsignal oder dem Energiefehler in absoluten Ausdrücken angibt.
  3. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem der Heraufumsetzer eine Berechnungseinrichtung (1600) zum Ableiten einer Heraufumsetzmatrix basierend auf den zumindest zwei Heraufumsetzparametern und Informationen über eine Herabumsetzregel aufweist, die zum Erzeugen des zumindest einen Basiskanals aus dem ursprünglichen Mehrkanalsignal verwendet wird.
  4. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem der Heraufumsetzer wirksam ist, um einen Links-Basiskanal und einen Rechts-Basiskanal zu verarbeiten und ein Links-Ausgangssignal, ein Rechts-Ausgangssignal und ein Mitten-Signal auszugeben, wobei der Links-Basiskanal und der Rechts-Basiskanal eine stereokompatible Darstellung des Mehrkanalsignals sind.
  5. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem der Heraufumsetzer (1104) wirksam ist, um die zumindest drei Ausgangskanäle unter Verwendung von Skalierungsfaktoren einzeln zu skalieren (304), wobei ein Skalierungsfaktor (gz) für einen Ausgangskanal von einer Energie eines Heraufumsetzergebnisses der einen Energieverlust einbringenden Heraufumsetzregel und einer Energie des Ausgangskanals nach einem Heraufumsetzen unter Verwendung der einen Energieverlust einbringenden Heraufumsetzregel und Informationen über eine Herabumsetzung (v) zum Erzeugen des zumindest einen Basiskanals abhängt.
  6. Mehrkanalsynthetisierer gemäß Anspruch 5, bei dem der Skalierungsfaktor wie folgt bestimmt ist:
    Figure 00530001
    wobei vZ ein erster herabumsetzabhängiger Faktor für einen Ausgangskanal z ist, wobei ρ das Energiemaß ist, wobei E ^ die Energie des Mehrkanalsignals ist, das durch die einen Energieverlust einbringende Heraufumsetzregel erzeugt ist, und wobei ||z ^|| eine Energie des zu skalierenden Ausgangskanals der einen Energieverlust einbringenden Heraufumsetzregel darstellt.
  7. Mehrkanalsynthetisierer gemäß einem der Ansprüche 1 bis 5, bei dem der Heraufumsetzer (1104) ferner einen Dekorrelator (501, 502, 503, 501',503') zum Erzeugen eines dekorrelierten Signals aus dem zumindest einen Basiskanal oder aus dem zumindest einen Ausgangssignale der einen Energieverlust einbringenden Heraufumsetzregel aufweist, und wobei der Heraufumsetzer wirksam ist, um das dekorrelierte Signal zu verwenden, derart, dass eine Energiegröße des dekorrelierten Signals in einem Ausgangska nal kleiner oder gleich einer Größe des Energiefehlers ist, der durch das Energiemaß ableitbar ist.
  8. Mehrkanalsynthetisierer gemäß Anspruch 7, bei dem der Heraufumsetzer wirksam ist, um ein Dekorrelationssignal zu erzeugen, das eine Energie aufweist, die gleich einer Energie des Ausgangskanals ist, der um einen Herunterskalierungsfaktor herunterskaliert ist, wobei der Herunterskalierungsfaktor von dem Energiemaß abhängt, und wobei der Heraufumsetzer wirksam ist, um das dekorrelierte Signal und ein Ausgangssignal der einen Energieverlust einbringenden Heraufumsetzregel (109) zu addieren.
  9. Mehrkanalsynthetisierer gemäß Anspruch 7 oder 8, bei dem der Dekorrelator wirksam ist, um die zumindest drei Ausgangssignale durch ein Addieren eines dekorrelierten Signals, das durch einen kanalspezifischen Faktor (ν) gewichtet ist und unter Verwendung des Energiemaßes (ρ) gewichtet ist, einzeln zu dekorrelieren und das gewichtete dekorrelierte Signal zu einem Ausgangssignal eines Heraufumsetzers (109), der die einen Energieverlust einbringende Heraufumsetzregel durchführt, zu addieren (602).
  10. Mehrkanalsynthetisierer gemäß Anspruch 8 oder 9, bei dem der Dekorrelator wirksam ist, um ein Eingangssignal unter Verwendung eines digitalen Filters zu filtern.
  11. Mehrkanalsynthetisierer gemäß Anspruch 8, bei dem der Herunterskalierungsfaktor wie folgt abgeleitet ist:
    Figure 00540001
    wobei γ der Herunterskalierungsfaktor ist und wobei ρ das Energiemaß ist.
  12. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem der Heraufumsetzer (1104) wirksam ist, um zum teilweisen oder vollständigen Kompensieren des Energieverlusts aufgrund der einen Energieverlust einbringenden Heraufumsetzregel ein dekorreliertes Signal, das eine Energie aufweist, die geringer als der Energiefehler und größer Null ist, zu zumindest einem Kanal zu addieren, der durch die einen Energieverlust einbringende Heraufumsetzregel erzeugt ist.
  13. Mehrkanalsynthetisierer gemäß Anspruch 12, bei dem, wenn die Energie des dekorrelierten Signals geringer als der Energiefehler ist, der Heraufumsetzer wirksam ist, um den zumindest einen Basiskanal oder ein Signal, das durch die Heraufumsetzregel erzeugt ist, heraufzuskalieren, derart, dass die kombinierte Energie des heraufskalierten Signals oder eines Heraufumsetzsignals, das unter Verwendung des heraufskalierten zumindest einen Basiskanals erzeugt ist, und des addierten dekorrelierten Signals kleiner oder gleich einer Energie des ursprünglichen Signals ist.
  14. Mehrkanalsynthetisierer gemäß Anspruch 13, bei dem die Energie des addierten dekorrelierten Signals durch einen Dekorrelationsfaktor bestimmt ist, wobei ein hoher Dekorrelationsfaktor nahe 1 angibt, dass ein dekorreliertes Signal mit kleinerem Pegel addiert werden soll, während ein kleinerer Dekorrelationsfaktor nahe 0 angibt, dass ein Dekorrelationssignal mit höherem Pegel addiert werden soll, und wobei das Dekorrelationsmaß aus dem Eingangssignal extrahiert ist.
  15. Mehrkanalsynthetisierer gemäß Anspruch 12 oder 13, bei dem der zumindest eine Basiskanal eine skalierte Version eines Basiskanals ist, der durch eine Herabumsetzmatrix erzeugt ist, wobei der Skalierungsfaktor von dem Energiemaß abhängt, so dass die Dekorrelationsinformationen (605) das einzige übertragene Energiemaß sind, das ebenfalls von der Fehlerenergie abhängt.
  16. Mehrkanalsynthetisierer gemäß Anspruch 13, bei dem das Energiemaß, das in dem Eingangssignal enthalten ist, einen ersten Energiewert umfasst, der von dem Energiefehler (ρ) abhängt, und einen zweiten Energiewert umfasst, der von einem Grad an Korrelation (κ) abhängt.
  17. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem das Eingangssignal zusätzlich zu den zwei unterschiedlichen Heraufumsetzparametern Informationen über eine Herabumsetzung umfasst, die dem zumindest einen Basiskanal zugrunde liegt, wobei der Heraufumsetzer wirksam ist, um die zusätzlichen Herabumsetzinformationen zum Erzeugen einer Heraufumsetzmatrix (802) zu verwenden.
  18. Mehrkanalsynthetisierer gemäß Anspruch 17, bei dem Informationen (γ) einer Berechnung einer Stereovorverarbeitung (901) in dem Eingangssignal als die Herabumsetzinformationen enthalten sind.
  19. Mehrkanalsynthetisierer gemäß einem der vorhergehenden Ansprüche, bei dem das Eingangssignal ferner eine Heraufumsetzermodusangabe (1005) umfasst, die in einem ersten Zustand angibt, dass eine erste Heraufumsetzregel durchgeführt werden soll, und in einem zweiten Zustand angibt, dass eine unterschiedliche Heraufumsetzregel durchgeführt werden soll, und wobei der Heraufumsetzer (1104) wirksam ist, um Parameter für die Heraufumsetzregel unter Verwendung der zumindest zwei unterschiedlichen Heraufumsetzparameter (1108) in Abhängigkeit von der Heraufumsetzermodusangabe (1005) zu berechnen.
  20. Mehrkanalsynthetisierer gemäß Anspruch 19, bei dem die Heraufumsetzermodusangabe wirksam ist, um einen Heraufumsetzermodus subbandweise oder rahmenweise zu signalisieren.
  21. Mehrkanalsynthetisierer gemäß Anspruch 19 oder 20, bei dem die erste Heraufumsetzregel eine prädiktive Heraufumsetzregel ist und bei dem eine zweite Heraufumsetzregel eine Heraufumsetzregel ist, die energieabhängige Heraufumsetzparameter aufweist.
  22. Mehrkanalsynthetisierer gemäß Anspruch 20,, bei dem die zweite Heraufumsetzregel wie folgt definiert ist:
    Figure 00570001
    wobei L ein Energiewert eines Links-Eingangskanals ist, wobei C ein Energiewert eines Mitten-Eingangskanals ist, wobei R ein Energiewert eines Rechts-Eingangskanals ist und wobei α ein bestimmter Herunterumsetzparameter ist.
  23. Mehrkanalsynthetisierer gemäß einem der Ansprüche 19 bis 22, bei dem die zweite Heraufumsetzregel so ist, dass ein Rechts-Herunterumsetzkanal nicht zu einem Links-Heraufumsetzkanal addiert wird, und umgekehrt.
  24. Mehrkanalsynthetisierer gemäß einem der Ansprüche 19 bis 23, bei dem die erste Heraufumsetzregel durch eine Wellenformanpassung zwischen Wellenformen des ursprünglichen Mehrkanalsignals und Wellenformen von Signalen, die durch die erste Heraufumsetzregel erzeugt sind, bestimmt ist.
  25. Mehrkanalsynthetisierer gemäß einem der Ansprüche 19 bis 24, bei dem die erste oder die zweite Heraufumsetzregel wie folgt bestimmt ist:
    Figure 00580001
    wobei Funktionen f1, f2, f3 Funktionen der übertragenen zwei unterschiedlichen Heraufumsetzparameter c1, c2 angeben, und wobei die Funktionen wie folgt bestimmt sind:
    Figure 00580002
    wobei α ein reellwertiger Parameter ist.
  26. Mehrkanalsynthetisierer gemäß einem der Ansprüche 19 bis 25, der ferner eine SBR-Einheit (1614) aufweist zum Regenerieren eines Bands des zumindest einen Basiskanals, der nicht in dem übertragenen Basiskanal eingeschlossen ist, unter Verwendung eines Teils des zumindest einen Basiskanals, der in dem Eingangssignal eingeschlossen ist, und wobei der Mehrkanalsynthetisierer wirksam ist, um die zweite Heraufumsetzregel bei einem regenerierten Band des zumindest eines Basiskanals anzuwenden und die erste Heraufumsetzregel bei einem Band des Basiskanals anzuwenden, das in dem Eingangssignal eingeschlossen ist.
  27. Mehrkanalsynthetisierer gemäß Anspruch 26, bei dem die Heraufumsetzermodusangabe eine SBR-Signalisierung (1606) ist, die in dem Eingangssignal eingeschlossen ist.
  28. Codierer zum Verarbeiten eines Mehrkanalaudioeingangssignals, der eine Energiemaßberechnungseinrichtung (1402) zum Berechnen eines Energiemaßes (ρ) abhängig von einer Energiedifferenz zwischen einem Mehrkanaleingangssignal oder zumindest einem Basiskanal, der von dem Mehrkanaleingangssignal abgeleitet ist, und einem heraufumgesetzten Signal, das durch eine einen Energieverlust einbringende Heraufumsetzoperation erzeugt ist; und eine Ausgabeschnittstelle (1408) zum Ausgeben des zumindest einen Basiskanals, nachdem derselbe durch einen Skalierungsfaktor (403) abhängig von dem Energiemaß skaliert wurde (401, 402), oder zum Ausgeben des Energiemaßes aufweist.
  29. Codierer gemäß Anspruch 28, bei dem das Energiemaß (ρ) basierend auf einer Beziehung einer Energie des heraufumgesetzten Signals, das durch ein Heraufumsetzen des zumindest einen Basiskanals unter Verwendung einer eine Energie einbringenden Heraufumsetzregel erzeugt ist, und einer Energie des ursprünglichen Mehrkanalsignals bestimmt ist und der Skalierungsfaktor durch ein Invertieren des Energiemaßes bestimmt ist.
  30. Codierer gemäß Anspruch 28 oder 29, der ferner eine Korrelationsgradberechnungseinrichtung zum Bestimmen eines Grads an Korrelation (κ) aufweist, und bei dem die Ausgabeschnittstelle wirksam ist, um ein Korrelationsmaß (κ) basierend auf dem Grad an Korrelation auszugeben.
  31. Codierer gemäß einem der Ansprüche 28 bis 30, der ferner eine Heraufumsetzerparameterberechnungseinrichtung (1407, 1414, 1416) zum Berechnen von zumindest zwei unterschiedlichen Heraufumsetzparametern (1412) umfasst, und wobei die Ausgabeschnittstelle wirksam ist, um die zumindest zwei unterschiedlichen Heraufumsetzparameter auszugeben.
  32. Codierer gemäß einem der Ansprüche 28 bis 31, der ferner eine Herunterumsetzvorrichtung (1410) zum Berechnen des zumindest einen Basiskanals aufweist, und wobei die Ausgabeschnittstelle (1408) wirksam ist, um Informationen über eine Herabumsetzoperation auszugeben.
  33. Codierer gemäß Anspruch 32, bei dem die Herabumsetzvorrichtung einen Stereovorprozessor umfasst und bei dem die Ausgabeschnittstelle wirksam ist, um Informationen über den Stereovorprozessor auszugeben.
  34. Codierer gemäß Anspruch 31, bei dem die Heraufumsetzerparameterberechnungseinrichtung wirksam ist, um durch ein Verwenden von Signalverläufen von heraufumgesetzten Kanälen eine Parameteroptimierung (1444) durchzuführen, um zumindest zwei Heraufumsetzparameter zu erzeugen, die basierend auf optimalen Heraufumsetzparametern zu einem Decodierer übertragen werden sollen, und um das Energiemaß basierend auf Signalen, die durch ein Heraufumsetzen des zumindest einen Basiskanals unter Verwendung der optimalen Heraufumsetzparameter erzeugt sind, zu berechnen und auszugeben.
  35. Codierer gemäß einem der Ansprüche 28 bis 34, der ferner einen Parametergenerator (104, 1001, 1520, 1522, 1414, 1416) zum Erzeugen einer spezifischen parametrischen Darstellung unter einer Mehrzahl unterschiedlicher parametrischer Darstellungen basierend auf Informationen aufweist, die bei dem Codierer verfügbar sind; wobei die Ausgabeschnittstelle (1408) wirksam ist, um die erzeugte parametrische Darstellung und Informationen auszugeben, die implizit oder explizit die spezifische Parameterdarstellung unter der Mehrzahl unterschiedlicher Parameterdarstellungen angeben.
  36. Codierer gemäß Anspruch 35, bei dem die Mehrzahl unterschiedlicher Parameterdarstellungen eine erste parametrische Darstellung für ein wellenformbasiertes prädiktives Heraufumsetzschema und eine zweite parametrische Darstellung für eine nicht wellenformbasierte Heraufumsetzregel aufweist.
  37. Codierer gemäß Anspruch 36, bei dem die nicht wellenformbasierte Heraufumsetzregel eine energiebewahrende Heraufumsetzregel ist.
  38. Codierer gemäß einem der Ansprüche 35 bis 37, bei dem eine erste parametrische Darstellung eine Parameterdarstellung ist, deren Parameter unter Verwendung einer Optimierungsprozedur bestimmt sind, und wobei eine zweite parametrische Darstellung durch ein Berechnen (1520) der Energien der ursprünglichen Kanäle und durch ein Berechnen von Parametern (1522) basierend auf Kombinationen von Energien bestimmt ist.
  39. Codierer gemäß einem der Ansprüche 28 bis 38, der ferner ein Spektralbandreplikationsmodul (1512, 1514) zum Erzeugen von Spektralbandreplikationsseiteninformationen für zumindest ein Band des ursprünglichen Eingangssignals aufweist, das nicht in einem Basiskanal enthalten ist, der durch den Codierer ausgegeben wird.
  40. Verfahren zum Erzeugen von zumindest drei Audioausgangskanälen (1100) unter Verwendung eines Eingangssignals, das zumindest einen Basiskanal (1102) aufweist, wobei der Basiskanal von dem ursprünglichen Mehrkanalsignal (101, 102, 103) abgeleitet ist, das folgende Schritte aufweist: Heraufumsetzen (1104) des zumindest einen Basiskanals basierend auf einer einen Energieverlust einbringenden Heraufumsetzregel (201, 1408), so dass die zumindest drei Ausgangskanäle erhalten werden, wobei bei dem Schritt des Heraufumsetzens die zumindest drei Ausgangskanäle ansprechend auf ein Energiemaß (1106) und zumindest zwei unterschiedliche Heraufumsetzparameter (1108) erzeugt werden, so dass die zumindest drei Ausgangskanäle eine Energie aufweisen, die höher als eine Energie eines Signals ist, das durch ein Verwenden von lediglich der einen Energieverlust einbringenden Heraufumsetzregel erhalten wird, wobei so ein Energiefehler kompensiert wird, wobei der Energiefehler von der einen Energieverlust einbringenden Heraufumsetzregel abhängt, und wobei die zumindest zwei unterschiedlichen Heraufumsetzparameter (1108) und das Energiemaß zum Steuern des Heraufumsetzers in dem Eingangssignal enthalten sind, wobei die einen Energieverlust einbringende Heraufumsetzregel eine prädiktive Heraufumsetzregel ist, die eine Heraufumsetzmatrix verwendet, die Matrixkoeffizienten aufweist, die auf Prädiktionskoeffizienten basieren, und wobei die zumindest zwei unterschiedlichen Heraufumsetzparameter zwei unterschiedliche Elemente (c11, c22) der Heraufumsetzmatrix sind oder Parameter sind, von denen die zwei unterschiedlichen Elemente der Heraufumsetzmatrix ableitbar sind.
  41. Verfahren zum Verarbeiten eines Mehrkanalaudioeingangssignals, das folgende Schritte aufweist: Berechnen (1402) eines Energiemaßes (ρ) abhängig von einer Energiedifferenz zwischen einem Mehrkanaleingangssignal oder zumindest einem Basiskanal, der von dem Mehrkanaleingangssignal abgeleitet ist, und einem heraufumgesetzten Signal, das durch eine einen Energieverlust einbringende Heraufumsetzoperation erzeugt ist; und Ausgeben (1408) des zumindest einen Basiskanals, nachdem derselbe durch einen Skalierungsfaktor (403) abhängig von dem Energiemaß skaliert wurde (401, 402), oder Ausgeben des Energiemaßes.
  42. Codiertes Mehrkanalaudioinformationssignal, das zumindest einen Basiskanal, ein Energiemaß und zumindest zwei unterschiedliche Heraufumsetzparameter aufweist, wobei das Energiemaß von einer Energiedifferenz zwischen einem Mehrkanaleingangssignal oder zumindest einem Basiskanal, der von dem Mehrkanaleingangssignal abgeleitet ist, und einem heraufumgesetzten Signal abhängt, das durch eine einen Energieverlust einbringende Heraufumsetzoperation erzeugt ist, wobei die einen Energieverlust einbringende Heraufumsetzregel eine prädiktive Heraufumsetzregel ist, die eine Heraufumsetzmatrix mit Matrixkoeffizienten verwendet, die auf Prädiktionskoeffizienten basieren, und wobei die zumindest zwei unterschiedlichen Heraufumsetzparameter zwei unterschiedliche Elemente (c11, c12) der Heraufumsetzmatrix sind oder Parameter sind, von denen die zwei unterschiedlichen Elemente der Heraufumsetzmatrix ableitbar sind.
  43. Maschinenlesbares Medium, auf dem ein codiertes Mehrkanalinformationssignal gemäß Anspruch 42 gespeichert ist.
  44. Sender oder Audioaufzeichnungsgerät mit einem Codierer gemäß einem der Ansprüche 28 bis 39.
  45. Empfänger oder Audioabspielgerät mit einem Synthetisierer gemäß einem der Ansprüche 1 bis 27.
  46. Übertragungssystem mit einem Sender gemäß Anspruch 44 und einem Empfänger gemäß Anspruch 45.
  47. Verfahren zum Senden oder Aufzeichnen von Audio, wobei das Verfahren ein Verfahren zum Verarbeiten gemäß Anspruch 41 aufweist.
  48. Verfahren zum Empfangen oder Abspielen von Audio, wobei das Verfahren ein Verfahren zum Erzeugen gemäß Anspruch 40 umfasst.
  49. Verfahren zum Empfangen gemäß Anspruch 48 und Senden gemäß Anspruch 49.
  50. Computerprogramm, das eine Computerprogrammcodeeinrichtung aufweist, die, wenn dieselbe auf einem Computer läuft, alle Schritte eines Verfahrens gemäß einem der Verfahren gemäß Anspruch 40, 41, 47, 48 oder 49 durchführt.
DE602005002833T 2004-11-02 2005-10-28 Kompensation von multikanal-audio energieverlusten Active DE602005002833T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0402652A SE0402652D0 (sv) 2004-11-02 2004-11-02 Methods for improved performance of prediction based multi- channel reconstruction
SE0402652 2004-11-02
PCT/EP2005/011586 WO2006048203A1 (en) 2004-11-02 2005-10-28 Methods for improved performance of prediction based multi-channel reconstruction

Publications (2)

Publication Number Publication Date
DE602005002833D1 DE602005002833D1 (de) 2007-11-22
DE602005002833T2 true DE602005002833T2 (de) 2008-03-13

Family

ID=33488133

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602005002833T Active DE602005002833T2 (de) 2004-11-02 2005-10-28 Kompensation von multikanal-audio energieverlusten
DE602005002256T Active DE602005002256T2 (de) 2004-11-02 2005-10-28 Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE602005002256T Active DE602005002256T2 (de) 2004-11-02 2005-10-28 Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion

Country Status (14)

Country Link
US (2) US8515083B2 (de)
EP (2) EP1738353B1 (de)
JP (2) JP4527781B2 (de)
KR (2) KR100885192B1 (de)
CN (2) CN1969317B (de)
AT (2) ATE375590T1 (de)
DE (2) DE602005002833T2 (de)
ES (2) ES2292147T3 (de)
HK (2) HK1097336A1 (de)
PL (2) PL1738353T3 (de)
RU (2) RU2369918C2 (de)
SE (1) SE0402652D0 (de)
TW (2) TWI338281B (de)
WO (2) WO2006048203A1 (de)

Families Citing this family (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
US7853022B2 (en) 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
KR101177677B1 (ko) * 2004-10-28 2012-08-27 디티에스 워싱턴, 엘엘씨 오디오 공간 환경 엔진
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US8019614B2 (en) * 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
CN101406073B (zh) * 2006-03-28 2013-01-09 弗劳恩霍夫应用研究促进协会 用于多声道音频重构中的信号成形的增强的方法
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP4999846B2 (ja) * 2006-08-04 2012-08-15 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
CN101518103B (zh) * 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
JP5451394B2 (ja) 2006-09-29 2014-03-26 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
WO2008063035A1 (en) 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
WO2008069596A1 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN103137132B (zh) 2006-12-27 2016-09-07 韩国电子通信研究院 用于编码多对象音频信号的设备
AU2008215232B2 (en) 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
BRPI0809760B1 (pt) * 2007-04-26 2020-12-01 Dolby International Ab aparelho e método para sintetizar um sinal de saída
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
WO2009049896A1 (en) 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
BRPI0820488A2 (pt) * 2007-11-21 2017-05-23 Lg Electronics Inc método e equipamento para processar um sinal
CA2710560C (en) * 2008-01-01 2015-10-27 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101911733A (zh) * 2008-01-01 2010-12-08 Lg电子株式会社 用于处理音频信号的方法和装置
KR20100095586A (ko) 2008-01-01 2010-08-31 엘지전자 주식회사 신호 처리 방법 및 장치
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
EP2250641B1 (de) * 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum mischen mehrerer eingabedatenströme
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
US8705749B2 (en) * 2008-08-14 2014-04-22 Dolby Laboratories Licensing Corporation Audio signal transformatting
JP5326465B2 (ja) 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
EP2345027B1 (de) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energie-bewahrende mehrkanal-audiokodierung und -dekodierung
CN101740030B (zh) * 2008-11-04 2012-07-18 北京中星微电子有限公司 语音信号的发送及接收方法、及其装置
EP2214162A1 (de) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aufwärtsmischer, Verfahren und Computerprogramm zur Aufwärtsmischung eines Downmix-Tonsignals
US9172572B2 (en) 2009-01-30 2015-10-27 Samsung Electronics Co., Ltd. Digital video broadcasting-cable system and method for processing reserved tone
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
UA101291C2 (ru) 2009-12-16 2013-03-11 Долби Интернешнл Аб Сводка параметров последовательности бит sbr
AU2013242852B2 (en) * 2009-12-16 2015-11-12 Dolby International Ab Sbr bitstream parameter downmix
US8872911B1 (en) * 2010-01-05 2014-10-28 Cognex Corporation Line scan calibration method and apparatus
ES2607683T3 (es) 2010-01-13 2017-04-03 Sun Patent Trust Transmisor, método de transmisión, receptor, método de recepción, programa, y circuito integrado
EP2360681A1 (de) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Extrahieren eines direkten bzw. Umgebungssignals aus einem Downmix-Signal und raumparametrische Information
JP5604933B2 (ja) 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
KR101437896B1 (ko) 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
WO2012009851A1 (en) 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
KR101678610B1 (ko) 2010-07-27 2016-11-23 삼성전자주식회사 롱텀 채널 정보를 기반으로 다중 노드 간 서브밴드 별 협력 통신을 수행하는 방법 및 장치
BR112013016350A2 (pt) * 2011-02-09 2018-06-19 Ericsson Telefon Ab L M codificação/decodificação eficaz de sinais de áudio
EP2710588B1 (de) 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensischer nachweis von parametrischen audiokodierungschemata
EP2560161A1 (de) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimale Mischmatrizen und Verwendung von Dekorrelatoren in räumlicher Audioverarbeitung
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
JP6106983B2 (ja) 2011-11-30 2017-04-05 株式会社リコー 画像表示装置、画像表示システム、方法及びプログラム
JP5799824B2 (ja) 2012-01-18 2015-10-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US20130253923A1 (en) * 2012-03-21 2013-09-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Multichannel enhancement system for preserving spatial cues
JP6051621B2 (ja) 2012-06-29 2016-12-27 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2704142B1 (de) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Wiedergabe eines Audiosignals, Vorrichtung und Verfahren zur Erzeugung eines codierten Audiosignals, Computerprogramm und codiertes Audiosignal
DK2922053T3 (da) * 2012-11-15 2019-09-23 Ntt Docomo Inc Lydkodningsindretning, lydkodningsfremgangsmåde, lydkodningsprogram, lydafkodningsindretning, lydafkodningsfremgangsmåde og lydafkodningsprogram
JP6096934B2 (ja) * 2013-01-29 2017-03-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 周波数拡張されたオーディオ信号を生成するためのデコーダ、復号化方法、符号化された信号を生成するためのエンコーダ、およびコンパクトな選択サイド情報を使用する符号化方法
PT2951825T (pt) * 2013-01-29 2022-02-02 Fraunhofer Ges Forschung Aparelho e método para geração de um sinal aprimorado em frequência utilizando suavização temporal de sub-bandas
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
BR112015025022B1 (pt) 2013-04-05 2022-03-29 Dolby International Ab Método de decodificação, decodificador em um sistema de processamento de áudio, método de codificação, e codificador em um sistema de processamento de áudio
US9679571B2 (en) 2013-04-10 2017-06-13 Electronics And Telecommunications Research Institute Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830045A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Konzept zur Audiocodierung und Audiodecodierung für Audiokanäle und Audioobjekte
EP2830334A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mehrkanaliger Audiodecodierer, mehrkanaliger Audiocodierer, Verfahren, Computerprogramm und codierte Audiodarstellung unter Verwendung einer Dekorrelation gerenderter Audiosignale
KR101829822B1 (ko) * 2013-07-22 2018-03-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 다채널 오디오 디코더, 다채널 오디오 인코더, 방법, 컴퓨터 프로그램 및 렌더링된 오디오 신호들의 역상관을 사용하는 인코딩된 오디오 표현
EP2830048A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Realisierung eines SAOC-Downmix von 3D-Audioinhalt
EP2830053A1 (de) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mehrkanaliger Audiodecodierer, mehrkanaliger Audiocodierer, Verfahren und Computerprogramm mit restsignalbasierter Anpassung einer Beteiligung eines dekorrelierten Signals
EP2830049A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur effizienten Codierung von Objektmetadaten
EP2830051A3 (de) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer, Audiodecodierer, Verfahren und Computerprogramm mit gemeinsamen codierten Restsignalen
CN104376857A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 信息处理的方法及电子设备
RU2639952C2 (ru) * 2013-08-28 2017-12-25 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP3044783B1 (de) * 2013-09-12 2017-07-19 Dolby International AB Audiokodierung
JP6479786B2 (ja) * 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
BR112016008426B1 (pt) 2013-10-21 2022-09-27 Dolby International Ab Método para reconstrução de uma pluralidade de sinais de áudio, sistema de decodificação de áudio, método para codificação de uma pluralidade de sinais de áudio, sistema de codificação de áudio, e mídia legível por computador
CN107452390B (zh) * 2014-04-29 2021-10-26 华为技术有限公司 音频编码方法及相关装置
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
AU2015326856B2 (en) * 2014-10-02 2021-04-08 Dolby International Ab Decoding method and decoder for dialog enhancement
EP3332557B1 (de) 2015-08-07 2019-06-19 Dolby Laboratories Licensing Corporation Verarbeiten objektbasierter audiosignale
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
GB2554065B (en) * 2016-09-08 2022-02-23 V Nova Int Ltd Data processing apparatuses, methods, computer programs and computer-readable media
CN109859766B (zh) * 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
DE102018127071B3 (de) 2018-10-30 2020-01-09 Harman Becker Automotive Systems Gmbh Audiosignalverarbeitung mit akustischer Echounterdrückung
TWI772930B (zh) * 2020-10-21 2022-08-01 美商音美得股份有限公司 適合即時應用之分析濾波器組及其運算程序、基於分析濾波器組之信號處理系統及程序
US11837244B2 (en) 2021-03-29 2023-12-05 Invictumtech Inc. Analysis filter bank and computing procedure thereof, analysis filter bank based signal processing system and procedure suitable for real-time applications
CN113438595B (zh) * 2021-06-24 2022-03-18 深圳市叡扬声学设计研发有限公司 音频处理系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4744044A (en) * 1986-06-20 1988-05-10 Electronic Teacher's Aids, Inc. Hand-held calculator for dimensional calculations
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6590983B1 (en) 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP4347698B2 (ja) 2002-02-18 2009-10-21 アイピージー エレクトロニクス 503 リミテッド パラメトリックオーディオ符号化
TWI242992B (en) 2002-04-25 2005-11-01 Raytheon Co Dynamic wireless resource utilization
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
GB0228163D0 (en) * 2002-12-03 2003-01-08 Qinetiq Ltd Decorrelation of signals
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
KR101079066B1 (ko) * 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine

Also Published As

Publication number Publication date
RU2006146947A (ru) 2008-07-10
KR20070049627A (ko) 2007-05-11
ATE371925T1 (de) 2007-09-15
RU2369917C2 (ru) 2009-10-10
US20060140412A1 (en) 2006-06-29
EP1730726B1 (de) 2007-10-10
US7668722B2 (en) 2010-02-23
WO2006048203A1 (en) 2006-05-11
RU2369918C2 (ru) 2009-10-10
JP4527782B2 (ja) 2010-08-18
HK1097082A1 (en) 2007-06-15
JP4527781B2 (ja) 2010-08-18
US20060165237A1 (en) 2006-07-27
CN1998046B (zh) 2012-01-18
KR100905067B1 (ko) 2009-06-30
ES2292147T3 (es) 2008-03-01
TWI338281B (en) 2011-03-01
ES2294738T3 (es) 2008-04-01
TWI328405B (en) 2010-08-01
DE602005002256T2 (de) 2008-05-29
ATE375590T1 (de) 2007-10-15
JP2008517337A (ja) 2008-05-22
JP2008517338A (ja) 2008-05-22
CN1969317B (zh) 2010-12-29
TW200629961A (en) 2006-08-16
EP1738353A1 (de) 2007-01-03
DE602005002256D1 (de) 2007-10-11
PL1730726T3 (pl) 2008-03-31
PL1738353T3 (pl) 2008-01-31
EP1730726A1 (de) 2006-12-13
CN1998046A (zh) 2007-07-11
SE0402652D0 (sv) 2004-11-02
US8515083B2 (en) 2013-08-20
DE602005002833D1 (de) 2007-11-22
KR20070038043A (ko) 2007-04-09
KR100885192B1 (ko) 2009-02-24
RU2006146948A (ru) 2008-07-10
EP1738353B1 (de) 2007-08-29
CN1969317A (zh) 2007-05-23
WO2006048204A1 (en) 2006-05-11
HK1097336A1 (en) 2007-07-27
TW200627380A (en) 2006-08-01

Similar Documents

Publication Publication Date Title
DE602005002833T2 (de) Kompensation von multikanal-audio energieverlusten
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE602005005083T2 (de) Interpolation und signalisierung von parametern zur räumlichen rekonstruktion für mehrkanalige kodierung und dekodierung von audioquellen
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE602004004818T2 (de) Audiosignalcodierung oder -decodierung
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE60013785T2 (de) VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE60303689T2 (de) Audiodecodierungsvorrichtung und -verfahren
DE602004008613T2 (de) Treueoptimierte kodierung mit variabler rahmenlänge
DE602004002390T2 (de) Audiocodierung
DE602004010885T2 (de) Audio-transkodierung
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE602004005020T2 (de) Audiosignalsynthese
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE60120766T2 (de) Indizieren von impulspositionen und vorzeichen in algebraischen codebüchern zur codierung von breitbandsignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition