DE602005002451T2 - Vorrichtung und verfahren zur erzeugung eines pegelparameters und vorrichtung und verfahren zur erzeugung einer mehrkanal-repräsentation - Google Patents

Vorrichtung und verfahren zur erzeugung eines pegelparameters und vorrichtung und verfahren zur erzeugung einer mehrkanal-repräsentation Download PDF

Info

Publication number
DE602005002451T2
DE602005002451T2 DE602005002451T DE602005002451T DE602005002451T2 DE 602005002451 T2 DE602005002451 T2 DE 602005002451T2 DE 602005002451 T DE602005002451 T DE 602005002451T DE 602005002451 T DE602005002451 T DE 602005002451T DE 602005002451 T2 DE602005002451 T2 DE 602005002451T2
Authority
DE
Germany
Prior art keywords
parameter
channel
channels
level
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE602005002451T
Other languages
English (en)
Other versions
DE602005002451D1 (de
Inventor
Heiko Purnhagen
Lars Villemoes
Jonas Engdegard
Jonas Röden
Kristofer KJÖRLING
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of DE602005002451D1 publication Critical patent/DE602005002451D1/de
Application granted granted Critical
Publication of DE602005002451T2 publication Critical patent/DE602005002451T2/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Radio Relay Systems (AREA)
  • Circuits Of Receivers In General (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf ein Codieren von Mehrkanaldarstellungen von Audiosignalen unter Verwendung von räumlichen Parametern. Die vorliegende Erfindung lehrt neue Verfahren zum Schätzen und Definieren geeigneter Parameter zur Wiedererzeugung eines Mehrkanalsignals aus einer Anzahl von Kanälen, die geringer ist als die Anzahl von Ausgangskanälen. Im Besonderen richtet sie sich auf ein Minimieren der Bitrate für die Mehrkanaldarstellung und ein Bereitstellen einer codierten Darstellung des Mehrkanalsignals, die eine leichte Codierung und Decodierung der Daten für alle möglichen Kanalkonfigurationen ermöglicht.
  • Hintergrund der Erfindung
  • In der WO-A-03/007656 „Efficient and scalable Parametric Stereo Coding for Low Bit rate Audio Coding Applications" wurde gezeigt, dass es möglich ist, ein Stereobild aus einem Monosignal angesichts einer sehr kompakten Darstellung des Stereobildes wiederzuerzeugen, das dem ursprünglichen Stereobild sehr ähnelt. Das Grundprinzip ist eine Trennung des Eingangssignals in Frequenzbänder und Zeitsegmente und bei diesen Frequenzbändern und Zeitsegmenten eine Schätzung einer Zwischen-Kanal-Intensitätsdifferenz (IID = interchannel intensity difference) und einer Zwischen-Kanal-Kohärenz (ICC = intercannel coherence) durchzuführen. Der erste Parameter ist eine Messung der Leistungsverteilung zwischen den zwei Kanälen in dem spezifischen Frequenzband, und der zweite Parameter ist eine Schätzung der Korrelation zwischen den zwei Kanälen für das bestimmte Frequenzband. Decodereinrichtungsseitig wird das Stereobild aus dem Monosignal durch ein Aufteilen des Monosignals zwischen den zwei Ausgangskanälen gemäß den IID-Daten, und durch Hinzufügen eines dekorrelierten Signals, um die Kanalkorrelation der ursprünglichen Stereokanäle zu bewahren, wiedererzeugt.
  • Bei einem Mehrkanalfall (Mehrkanal bedeutet in diesem Zusammenhang mehr als zwei Ausgangskanäle) müssen mehrere zusätzliche Punkte berücksichtigt werden. Es gibt mehrere Mehrkanalkonfigurationen. Die Bekannteste ist die 5.1-Konfiguration (mittlerer Kanal, vorderer linker/rechter Kanal, linker/rechter Surroundkanal und LFE-Kanal). Es gibt jedoch auch viele andere Konfigurationen. Von dem gesamten Codiereinrichtungs-/Decodiereinrichtungs-System aus betrachtet ist es erwünscht, ein System zu haben, das denselben Parametersatz (z. B. IID und ICC) oder Teilsätze desselben für alle Kanalkonfigurationen verwenden kann. ITU-R BS.775 definiert verschiedene Abwärtsmischschemata, um eine Kanalkonfiguration erhalten zu können, die weniger Kanäle aus einer gegebenen Kanalkonfiguration umfasst. Anstatt stets alle Kanäle decodieren zu müssen und sich auf eine Abwärtsmischung stützen zu müssen, kann es erwünscht sein, eine Mehrkanaldarstellung zu haben, die es ermöglicht, dass ein Empfänger die für die vorliegende Kanalkonfigurationen relevanten Parameter vor dem Decodieren der Kanäle extrahieren kann. Ferner ist, was eine skalierbare oder eingebettete Codierung betrifft, ein Parametersatz erwünscht, der inhärent skalierbar ist, wobei es beispielsweise möglich ist, die den Surroundkanälen entsprechenden Daten in einer Verbesserungsschicht in dem Bitstrom zu speichern.
  • Im Gegensatz zu dem im Vorhergehenden Genannten kann es auch erwünscht sein, in der Lage zu sein, verschiedene auf den Charakteristika des verarbeiteten Signals basierende Parameterdefinitionen zu verwenden, um zwischen der Parametrisierung, die den niedrigsten Bitratenmehraufwand für das aktuell verarbeitete Signalsegment zur Folge hat, zu schalten.
  • Eine weitere Darstellung von Mehrkanalsignalen unter Verwendung eines Summensignals oder eines Abwärtsmischsignals und zusätzlicher parametrischer Nebeninformationen ist im Fachgebiet als binaurale Einsatzcodierung bzw. Cue-Codierung (BCC = binaural cue coding) bekannt. Diese Technik ist in „Binaural Cue Coding – Part 1: Psycho-Acoustic Fundamentals and Design Principals", IEEE Transactions an Speech and Audio Processing, Bd. 11, Nr. 6, November 2003, F. Baumgarte; C. Faller, und „Binaural Cue Coding. – Part II: Schemes and Applications", IEEE Transactions an Speech and Audio Processing, Bd. 11, Nr. 6, November 2003, C. Faller und F. Baumgarte, beschrieben.
  • Im Allgemeinen ist binaurale Cue-Codierung ein Verfahren zur räumlichen Mehrkanalwiedergabe basierend auf einem abwärts gemischten Audiokanal und Nebeninformationen. Verschiedene durch eine BCC-Codiereinrichtung zu berechnende und durch eine BCC-Decodiereinrichtung zu verwendende Parameter zur Audiorückgewinnung oder Audiowiedergabe umfassen Zwischen-Kanal-Pegeldifferenzen, Zwischen-Kanal-Zeitdifferenzen und Zwischen-Kanal-Kohärenzparameter. Diese Zwischen-Kanal-Cues sind der bestimmende Faktor für die Wahrnehmung eines räumlichen Bilds. Diese Parameter sind für Blöcke von Zeitabtastwerten des ursprünglichen Mehrkanalsignals gegeben und sind auch frequenzselektiv gegeben, so dass jeder Block von Mehrkanalsignalabtastwerten mehrere Cues für mehrere Frequenzbänder aufweist. Im allgemeinen Fall von C Wiedergabekanälen werden die Zwischen-Kanal-Pegeldifferenzen und die Zwischen-Kanal-Zeitdifferenzen in jedem Teilband zwischen Paaren von Kanälen, d. h. für jeden Kanal bezüglich eines Referenzkanals, berücksichtigt. Ein Kanal ist definiert als der Referenzkanal für jede Zwischen-Kanal-Pegeldifferenz. Mit den Zwischen-Kanal-Pegeldifferenzen und den Zwischen-Kanal-Zeitdifferenzen ist es möglich, eine Quelle in jede beliebige Richtung zwischen einem der Lautsprecherpaare einer Wiedergabeanordnung, die verwendet wird, wiederzugeben. Zum Bestimmen der Breite oder Ausbreitung einer wiedergegebenen Quelle reicht es aus, einen Parameter pro Teilband für alle Audiokanäle zu berücksichtigen. Dieser Parameter ist der Zwischen-Kanal-Kohärenzparameter. Die Breite der wiedergegebenen Quelle wird durch Modifizieren der Teilbandsignale derart gesteuert, dass alle möglichen Kanalpaare denselben Zwischen-Kanal-Kohärenzparameter aufweisen.
  • Bei einer BCC-Codierung werden alle Zwischen-Kanal-Pegeldifferenzen zwischen dem Referenzkanal 1 und jedem anderen Kanal bestimmt. Wenn z. B. der mittlere Kanal als der Referenzkanal bestimmt wird, wird eine erste Zwischen-Kanal-Pegeldifferenz zwischen dem linken Kanal und dem mittleren Kanal, eine zweite Zwischen-Kanal-Pegeldifferenz zwischen dem rechten Kanal und dem mittleren Kanal, eine dritte Zwischen-Kanal-Pegeldifferenz zwischen dem linken Surroundkanal und dem mittleren Kanal und eine vierte Zwischen-Kanal-Pegeldifferenz zwischen dem rechten Surroundkanal und dem mittleren Kanal berechnet. Dieses Szenario beschreibt ein Fünfkanalschema. Wenn das Fünfkanalschema zusätzlich einen Niederfrequenzverbesserungskanal umfasst, der auch als ein „Sub-Woofer"-Kanal bekannt ist, wird auch eine fünfte Zwischen-Kanal-Pegeldifferenz zwischen dem Niederfrequenzverbesserungskanal und dem mittleren Kanal, der der einzige Referenzkanal ist, berechnet.
  • Bei der Rückgewinnung des ursprünglichen Mehrkanals unter Verwendung des einzigen Abwärtsmischkanals, der auch als der „Mono"-Kanal bezeichnet wird, und der übertragenen Cues wie z. B. ICLD (Interchannel Level Difference = Zwischen-Kanal-Pegeldifferenz), ICTD (Interchannel Time Difference = Zwischen-Kanal-Zeitdifferenz) und ICC (Interchannel Coherence = Zwischen-Kanal-Kohärenz) werden die spektralen Koeffizienten des Monosignals unter Verwendung dieser Cues modifiziert. Die Pegelmodifizierung wird unter Verwendung einer positiven reellen Zahl, die die Pegelmodifizierung für jeden spektralen Koeffizienten bestimmt, durchgeführt. Die Zwischen-Kanal-Zeitdifferenz wird unter Verwendung einer komplexen Zahl des Betrags 1, die eine Phasenmodifi zierung für jeden spektralen Koeffizienten bestimmt, erzeugt. Eine weitere Funktion bestimmt den Kohärenzeinfluss. Dies Faktoren für Pegelmodifizierungen jedes Kanals werden berechnet, indem zuerst der Faktor für den Referenzkanal errechnet wird. Der Faktor für den Referenzkanal wird derart berechnet, dass für jede Frequenzpartition die Summe der Leistung aller Kanäle gleich der Leistung des Summensignals ist. Anschließend werden, basierend auf dem Pegelmodifizierungsfaktor für den Referenzkanal, die Pegelmodifizierungsfaktoren für die anderen Kanäle unter Verwendung der entsprechenden ICLD-Parameter errechnet.
  • Somit muss, um eine BCC-Synthese durchführen zu können, der Pegelmodifizierungsfaktor für den Referenzkanal errechnet werden. Für diese Berechnung werden alle ICLD-Parameter für ein Frequenzband benötigt. Anschließend können, basierend auf dieser Pegelmodifizierung für den einzelnen Kanal die Pegelmodifizierungsfaktoren für die anderen Kanäle, d. h. die Kanäle, die nicht der Referenzkanal sind, errechnet werden.
  • Dieser Ansatz ist insofern nachteilig, als man für ein perfekte Rückgewinnung jede einzelne Zwischen-Kanal-Pegeldifferenz benötigt. Diese Anforderung ist sogar noch problematischer, wenn ein fehleranfälliger Übertragungskanal vorhanden ist. Jeder Fehler in einer übertragenen Zwischen-Kanal-Pegeldifferenz führt zu einem Fehler in dem rückgewonnenen Mehrkanalsignal, da es erforderlich ist, dass jede Zwischen-Kanal-Pegeldifferenz jedes einzelne der Mehrkanalausgangssignale errechnet. Zudem ist keine Rückgewinnung möglich, wenn eine Zwischen-Kanal-Pegeldifferenz während der Übertragung verloren ging, auch wenn diese Zwischen-Kanal-Pegeldifferenz lediglich für beispielsweise den linken Surroundkanal oder den rechten Surroundkanal nötig war, welche Kanäle sind, die für eine Mehrkanalrückgewinnung nicht so wichtig sind, da die meisten Informationen in dem vorderen linken Kanal, der nachfolgend als der linke Kanal bezeichnet wird, dem vorderen rechten Kanal, der nachfolgend als der rechte Kanal bezeichnet wird, oder dem mittleren Kanal enthalten sind. Diese Situation verschlimmert sich sogar noch, wenn die Zwischen-Kanal-Pegeldifferenz des Niederfrequenzverbesserungskanals während der Übertragung verloren ging. In dieser Situation ist keine oder lediglich eine fehlerhafte Mehrkanalrückgewinnung möglich, auch wenn der Niederfrequenzverbesserungskanal nicht so entscheidend für den Hörkomfort des Hörers ist. Somit werden Fehler in einer einzigen Zwischen-Kanal-Pegeldifferenz zu Fehlern in jedem der rückgewonnenen Ausgangskanälen verbreitet.
  • Parametrische Mehrkanaldarstellungen sind problematisch in der Hinsicht, dass normalerweise Zwischen-Kanal-Pegeldifferenzen wie beispielsweise ICLDs bei einer BCC-Codierung oder Ausgleichswerte in anderen parametrischen Mehrkanaldarstellungen als relative Werte und nicht als absolute Werte gegeben sind. Bei BCC beschreibt ein ICLD-Parameter die Pegeldifferenz zwischen einem Kanal und einem Referenzkanal. Ausgleichswerte können auch als ein Verhältnis zwischen zwei Kanälen in einem Kanalpaar gegeben sein. Bei der Rückgewinnung des Mehrkanalsignals werden derartige Pegeldifferenzen oder Ausgleichsparameter auf einen Basiskanal angelegt, der ein Monobasiskanal- oder ein Stereobasiskanalsignal mit zwei Basiskanälen sein kann. Somit wird die in dem zumindest einen Basiskanal enthaltene Energie auf die beispielsweise fünf oder sechs rückgewonnenen Ausgangskanäle verteilt. Somit ist die absolute Energie in einem rückgewonnenen Ausgangskanal durch die Zwischen-Kanal-Pegeldifferenz oder den Ausgleichsparameter und die Energie des Abwärtsmischsignals an dem Empfängereingang bestimmt.
  • Wenn Situationen auftreten, in denen die Energie des Abwärtsmischsignals an dem Empfängereingang mit Bezug auf ein durch eine Codiereinrichtung ausgegebenes Abwärtsmischsignal variiert, treten Pegelschwankungen auf. In diesem Zusammenhang muss betont werden, dass, abhängig von dem verwendeten Parametrisierungsschema, derartige Pegelschwankungen nicht nur zu einer allgemeinen Lautstärkeschwankung des hergestellten Signals führen, sondern auch zu ernst zu nehmenden Artefakten führen können, wenn die Parameter frequenzselektiv gegeben sind. Wenn beispielsweise ein gewisses Frequenzband des Abwärtsmischsignals mehr beeinflusst wird als ein Frequenzband an einem anderen Ort auf der Frequenzskala, zeigt sich diese Beeinflussung sogleich in dem rückgewonnenen Ausgangssignal, da die Frequenzkomponenten in dem Ausgangskanal in dem gewissen Frequenzband einen Pegel aufweisen, der zu niedrig oder zu hoch ist.
  • Zudem führen zeitlich variierende Pegelbeeinflussungen auch zu einem Gesamtpegel des rückgewonnenen Ausgangssignals, der im Zeitverlauf variiert und demzufolge als ein unerfreuliches Artefakt wahrgenommen wird.
  • Während die im Vorhergehenden genannten Situationen auf Pegelbeeinflussungen ausgerichtet sind, die sich durch Codieren, Senden und Decodieren eines Abwärtsmischsignals ergeben, können auch andere Pegelabweichungen auftreten. Aufgrund von Phasenabhängigkeiten zwischen unterschiedlichen Kanälen, die in einen oder zwei Kanäle abwärtsgemischt werden, kann eine Situation auftreten, in der das Monosignal eine Energie aufweist, die nicht gleich der Summe der Energien in dem ursprünglichen Signal ist. Da die Abwärtsmischung normalerweise abtastwertweise, das heißt, durch Addieren von Zeitfunktionen, durchgeführt wird, führt eine Phasendifferenz zwischen dem linken Signal und dem rechten Signal von beispielsweise 180 Grad zu einer vollständigen Aufhebung beider Kanäle in dem Abwärtsmischsignal, was zu einer Null-Energie führen würde, obwohl beide Signale selbstverständlich eine gewisse Signalenergie aufweisen. Auch wenn in normalen Situationen eine derartige Extremsituation nicht sehr wahrscheinlich ist, finden trotzdem Energieschwankungen statt, da alle Signale selbstverständlich nicht vollständig unkorreliert sind. Derartige Schwankungen können auch zu Lautstärkefluktuationen in dem rück gewonnenen Ausgangssignal führen und führen auch zu Artefakten, da die Energie des rückgewonnenen Ausgangssignals sich von der Energie des ursprünglichen Mehrkanalsignals unterscheidet.
  • Zusammenfassung der Erfindung
  • Es ist die Aufgabe der vorliegenden Erfindung, ein Parametrisierungskonzept bereitzustellen, das zu einer Mehrkanalrückgewinnung mit einer verbesserten Ausgangsqualität führt.
  • Diese Aufgabe wird durch eine Vorrichtung zum Erzeugen eines Pegelparameters gemäß Anspruch 1, eine Vorrichtung zum Erzeugen einer rückgewonnenen Mehrkanaldarstellung gemäß Anspruch 7, ein Verfahren zum Erzeugen eines Pegelparameters gemäß Anspruch 9, ein Verfahren zum Erzeugen einer rückgewonnenen Mehrkanaldarstellung gemäß Anspruch 10, ein Computerprogramm gemäß Anspruch 11 oder eine Parameterdarstellung gemäß Anspruch 12 gelöst.
  • Die vorliegende Erfindung basiert auf der Erkenntnis, dass für eine Rückgewinnung hoher Qualität und mit Blick auf flexible Codier-/Übertragungs- und Decodierschemas ein zusätzlicher Pegelparameter zusammen mit dem Abwärtsmischsignal oder der Parameterdarstellung eines Mehrkanalsignals übertragen wird, so dass eine Mehrkanalrückgewinnungseinrichtung diesen Pegelparameter zusammen mit den Pegeldifferenzparametern und dem Abwärtsmischsignal zum Wiedererzeugen eines Mehrkanalausgangssignals verwenden kann, das nicht durch Pegelschwankungen oder frequenzselektive pegelinduzierte Artefakte beeinträchtigt ist.
  • Gemäß der vorliegenden Erfindung wird der Pegelparameter derart berechnet, dass eine Energie des zumindest einen Abwärtsmischkanals gewichtet (wie beispielsweise multipli ziert oder dividiert) durch den Pegelparameter gleich einer Summe von Energien der ursprünglichen Kanäle ist.
  • Bei einem Ausführungsbeispiel wird der Pegelparameter von einem Verhältnis zwischen der Energie des Abwärtsmischkanals oder der Abwärtsmischkanäle und der Summe der Energien der ursprünglichen Kanäle abgeleitet. Bei diesem Ausführungsbeispiel werden jegliche Pegeldifferenzen zwischen dem Abwärtsmischkanal oder den Abwärtsmischkanälen und dem ursprünglichen Mehrkanalsignal codiereinrichtungsseitig berechnet und in den Datenstrom als ein Pegelkorrekturfaktor eingegeben, der als ein zusätzlicher Parameter behandelt wird, der ebenfalls für einen Block von Abtastwerten des Abwärtsmischkanals oder der Abwärtsmischkanäle und für ein gewisses Frequenzband gegeben ist. Somit wird für jeden Block und jedes Frequenzband, für die Zwischen-Kanal-Pegeldifferenzen oder Ausgleichsparameter bestehen, ein neuer Pegelparameter addiert.
  • Die vorliegende Erfindung stellt auch eine Flexibilität bereit, da sie ein Senden einer Abwärtsmischung eines Mehrkanalsignals ermöglicht, die sich von der Abwärtsmischung unterscheidet, auf der die Parameter basieren. Derartige Situationen können sich beispielsweise ergeben, wenn eine Rundsendestation nicht wünscht, ein durch eine Mehrkanalcodiereinrichtung erzeugtes Abwärtsmischsignal rundzusenden, jedoch wünscht, ein durch einen Tontechniker in einem Tonstudio erzeugtes Abwärtsmischsignal rundzusenden, das eine auf dem subjektiven und kreativen Eindruck eines Menschen basierende Abwärtsmischung ist. Nichtsdestotrotz mag der Rundsender den Wunsch haben, auch Mehrkanalparameter in Verbindung mit dieser „Master-Abwärtsmischung" zu übermitteln. Gemäß der vorliegenden Erfindung wird die Anpassung zwischen dem Parametersatz und der Master-Abwärtsmischung durch den Pegelparameter bereitgestellt, der in diesem Fall eine Pegeldifferenz zwischen der Master-Abwärtsmischung und der Parameterabwärtsmischung ist, auf der der Parametersatz basiert.
  • Die vorliegende Erfindung ist dahin gehend vorteilhaft, dass der zusätzliche Pegelparameter eine verbesserte Ausgangsqualität und eine verbesserte Flexibilität bereitstellt, da auf ein Abwärtsmischsignal bezogene Parametersätze auch auf eine andere Abwärtsmischung angepasst werden können, die nicht während der Parameterberechnung erzeugt wird.
  • Zum Zweck der Bitratenreduzierung ist es bevorzugt, eine Δ-Codierung des neuen Pegelparameters und eine Quantisierung und eine Entropie-Codierung anzuwenden. Im Besonderen führt die Δ-Codierung zu einem hohen Codierungsgewinn, da die Schwankung von Band zu Band oder von Zeitblock zu Zeitblock nicht so hoch sein wird, so dass relativ kleine Differenzwerte erhalten werden, die die Möglichkeit eines guten Codierungsgewinns erlauben, wenn sie zusammen mit einer nachfolgenden Entropie-Codierung wie zum Beispiel einer Huffman-Codiereinrichtung verwendet werden.
  • Bei einem bevorzugten Ausführungsbeispiel der Erfindung wird eine Mehrkanalsignalparameterdarstellung verwendet, die zumindest zwei unterschiedliche Ausgleichsparameter umfasst, die einen Ausgleich zwischen zwei unterschiedlichen Kanalpaaren anzeigen. Im Besonderen sind Flexibilität, Skalierbarkeit, Widerstandsfähigkeit gegen Fehler und sogar Bitrateneffizienz die Folge der Tatsache, dass das erste Kanalpaar, das die Basis für den ersten Ausgleichsparameter ist, sich von dem zweiten Kanalpaar, das die Basis für die zweiten Ausgleichsparameter ist, unterscheidet, wobei die vier diese Kanalpaare bildenden Kanäle sich alle voneinander unterscheiden.
  • Somit weicht das bevorzugte Konzept von dem Konzept eines einzigen Referenzkanals ab und verwendet ein Mehrausgleichs- oder Superausgleichskonzept, das intuitiver und natürlicher für den Höreindruck eines Menschen ist. Im Besonderen können die dem ersten und zweiten Ausgleichspa rameter zugrunde liegenden Kanalpaare ursprüngliche Kanäle, Abwärtsmischkanäle oder vorzugsweise bestimmte Kombinationen von Eingangskanälen umfassen.
  • Es hat sich gezeigt, dass ein von dem mittleren Kanal als dem ersten Kanal und einer Summe aus dem linken ursprünglichen Kanal und dem rechten ursprünglichen Kanal als dem zweiten Kanal des Kanalpaars abgeleiteter Ausgleichsparameter besonders nützlich zum Bereitstellen einer genauen Energieverteilung zwischen dem mittleren Kanal und dem linken und rechten Kanal ist. In diesem Zusammenhang sei darauf hingewiesen, dass diese drei Kanäle normalerweise die meisten Informationen der Audioszene umfassen, wobei besonders die Links-Rechts-Stereolokalisation nicht nur durch den Ausgleich zwischen links und rechts, sondern auch durch den Ausgleich zwischen der Mitte und der Summe aus links und rechts beeinflusst wird. Diese Beobachtung spiegelt sich in einer Verwendung dieses Ausgleichsparameters gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wider.
  • Vorzugsweise hat es sich gezeigt, dass, wenn ein einzelnes Monoabwärtsmischsignal übertragen wird, zusätzlich zu dem Mitte/Links-plus-Rechts-Ausgleichsparameter ein Links/Rechts-Ausgleichsparameter, ein hinterer linker/hinterer rechter Ausgleichsparameter und ein Vorne/Hinten-Ausgleichsparameter eine optimale Lösung für eine bitrateneffiziente Parameterdarstellung ist, die flexibel, widerstandsfähig gegen Fehler und weitgehend artefaktfrei ist.
  • Empfängerseitig verwendet die erfindungsgemäße Mehrausgleichsdarstellung, im Gegensatz zu einer BCC-Synthese, in der jeder Kanal allein durch die übertragenen Informationen berechnet wird, zusätzlich Informationen über das zum Erzeugen des Abwärtsmischkanals oder der Abwärtsmischkanäle verwendete Abwärtsmischschema. Somit werden, gemäß der vorliegenden Erfindung, Informationen über das Abwärtsmischschema, die in Systemen des Stands der Technik nicht verwendet werden, ebenfalls zum Aufwärtsmischen zusätzlich zu dem Ausgleichsparameter verwendet. Die Aufwärtsmischoperation wird demzufolge derart durchgeführt, dass der Ausgleich zwischen den Kanälen in einem rückgewonnenen Mehrkanalsignal, die ein Kanalpaar für einen Ausgleichsparameter bilden, durch den Ausgleichsparameter bestimmt wird.
  • Dieses Konzept, d. h. ein Vorhandensein unterschiedlicher Kanalpaare für unterschiedliche Ausgleichsparameter, ermöglicht es, einige Kanäle ohne Kenntnis jedes einzelnen übertragenen Ausgleichsparameters zu erzeugen. Im Besonderen können der linke, rechte und mittlere Kanal ohne jegliche Kenntnis über irgendeinen Hinten-Links/Hinten-Rechts-Ausgleich oder ohne irgendeine Kenntnis über einen Vorne/Hinten-Ausgleich rückgewonnen werden. Dieser Effekt erlaubt die sehr fein abgestimmte Skalierbarkeit, da ein Extrahieren eines zusätzlichen Parameters aus einem Bitstrom oder ein Übertragen eines zusätzlichen Ausgleichsparameters an einen Empfänger folglich die Rückgewinnung eines oder mehrerer zusätzlicher Kanäle erlaubt. Dies steht im Gegensatz zu dem Einzelreferenzsystem des Stands der Technik, in dem man jede einzelne Zwischen-Kanal-Pegeldifferenz zum Rückgewinnen aller oder lediglich einer Teilgruppe aller rückgewonnenen Ausgangskanäle benötigte.
  • Das bevorzugte Konzept ist auch dahingehend flexibel, dass die Wahl der Ausgleichsparameter auf eine gewisse Rückgewinnungsumgebung angepasst werden kann. Wenn z. B. eine Fünfkanalanordnung die ursprüngliche Mehrkanalsignalanordnung bildet, und wenn eine Vierkanalanordnung eine Rückgewinnungsmehrkanalanordnung bildet, die lediglich einen einzigen Surroundlautsprecher aufweist, der beispielsweise hinter dem Hörer positioniert ist, ermöglicht ein Vorne/Hinten-Ausgleichsparameter ein Errechnen des kombinierten Surroundkanals ohne jegliche Kenntnis über den linken Surroundkanal und den rechten Surroundkanal. Dies steht im Gegensatz zu einem Einzelreferenzkanalsystem, in dem man eine Zwischen-Kanal-Pegeldifferenz für den linken Surround kanal und eine Zwischen-Kanal-Pegeldifferenz für den rechten Surroundkanal aus dem Datenstrom extrahieren muss. Anschließend muss man den linken Surroundkanal und den rechten Surroundkanal berechnen. Schließlich muss man beide Kanäle addieren, um den einzelnen Surroundlautsprecherkanal für eine Vierkanalrückgewinnungsanordnung zu erhalten. Alle diese Schritte müssen in der intuitiveren und mehr auf einen Benutzer ausgelegten Ausgleichsparameterdarstellung nicht durchgeführt werden, da diese Darstellung automatisch den kombinierten Surroundkanal liefert, und zwar wegen der Ausgleichsparameterdarstellung, die nicht an einen einzigen Referenzkanal gebunden ist, sondern es ermöglicht, eine Kombination aus ursprünglichen Kanälen als einen Kanal eines Ausgleichsparameterkanalpaars zu verwenden.
  • Die vorliegende Erfindung bezieht sich auf die Problematik einer parametrisierten Mehrkanaldarstellung von Audiosignalen. Sie liefert eine effiziente Art und Weise, um die geeigneten Parameter für die Mehrkanaldarstellung zu definieren, sowie die Fähigkeit, die Parameter, die die erwünschte Kanalkonfiguration darstellen, zu extrahieren, ohne alle Kanäle decodieren zu müssen. Die Erfindung löst ferner das Problem des Auswählens der optimalen Parameterkonfiguration für ein gegebenes Signalsegment, um die Bitrate, die erforderlich ist, um die räumlichen Parameter für das gegebene Signalsegment zu codieren, zu minimieren. Die vorliegende Erfindung stellt auch heraus, wie die Dekorrelationsverfahren, die früher lediglich auf den Zweikanalfall anwendbar waren, in einer allgemeinen Mehrkanalumgebung anzuwenden sind.
  • Bei bevorzugten Ausführungsbeispielen weist die vorliegende Erfindung die folgenden Merkmale auf:
    • – Abwärtsmischen des Mehrkanalsignals auf eine Ein- oder Zweikanaldarstellung auf der Codiereinrichtungsseite;
    • – Angesichts des Mehrkanalsignals, Definieren der die Mehrkanalsignale darstellenden Parameter, entweder in einer flexiblen Weise auf einer rahmenweisen Basis, um eine Bitrate zu minimieren, oder um es zu ermöglichen, dass die Decodiereinrichtung die Kanalkonfiguration auf einer Bitstromebene extrahieren kann;
    • – Decodiereinrichtungsseitig, den relevanten Parametersatz angesichts der aktuell durch die Decodiereinrichtung unterstützten Kanalkonfiguration zu extrahieren;
    • – Erzeugen der erforderlichen Anzahl von gegeneinander dekorrelierten Signalen angesichts der aktuellen Kanalkonfiguration;
    • – Wiedererzeugen der Ausgangssignale angesichts des aus den Bitstromdaten decodierten Parametersatzes und der dekorrelierten Signale;
    • – Bestimmung einer Parametrisierung des Mehrkanalaudiosignals, derart, dass dieselben Parameter oder ein Teilsatz der Parameter unberücksichtigt der Kanalkonfiguration verwendet werden kann;
    • – Bestimmung einer Parametrisierung des Mehrkanalaudiosignals, derart, dass die Parameter in einem skalierbaren Codierschema verwendet werden können, wobei Teilsätze des Parametersatzes in unterschiedlichen Schichten des skalierbaren Stroms übertragen werden;
    • – Bestimmung einer Parametrisierung des Mehrkanalaudiosignal, derart, dass die Energierückgewinnung der Ausgangssignale aus der Decodiereinrichtung nicht durch den zugrunde liegenden Audiocodec, der verwendet wird, um das abwärtsgemischte Signal zu codieren, beeinträchtigt ist; Umschalten zwischen unterschiedlichen Parametrisierungen des Mehrkanalaudiosignals, derart, dass der Bitratenmehraufwand zum Codieren der Parametrisierung minimiert ist;
    • – Bestimmung einer Parametrisierung des Mehrkanalaudiosignals, in der ein Parameter aufgenommen ist, der den Energiekorrekturfaktor für das abwärtsgemischte Signal darstellt;
    • – Verwendung mehrerer gegeneinander dekorrelierter Dekorrelatoren, um das Mehrkanalsignal wiederzuerzeugen;
    • – Wiedererzeugen des Mehrkanalsignals aus einer Aufwärtsmischmatrix H, die basierend auf dem übertragenen Parametersatz berechnet wird.
  • Kurzbeschreibung der Zeichnungen
  • Die vorliegende Erfindung wird nachfolgend mittels veranschaulichender Beispiele, die den Schutzbereich oder die Wesensart der Erfindung nicht beschränken, mit Bezug auf die zugehörigen Zeichnungen beschrieben. Es zeigen:
  • 1 eine Nomenklatur, die für eine 5.1-Kanalkonfiguration, wie sie in der vorliegenden Erfindung eingesetzt wird, verwendet wird;
  • 2 eine mögliche Codiereinrichtungsimplementierung eines bevorzugten Ausführungsbeispiels der vorliegenden Erfindung;
  • 3 eine mögliche Decodiereinrichtungsimplementierung eines bevorzugten Ausführungsbeispiels der vorliegenden Erfindung;
  • 4 eine bevorzugte Parametrisierung des Mehrkanalsignals gemäß der vorliegenden Erfindung;
  • 5 eine bevorzugte Parametrisierung des Mehrkanalsignals gemäß der vorliegenden Erfindung;
  • 6 eine bevorzugte Parametrisierung des Mehrkanalsignals gemäß der vorliegenden Erfindung;
  • 7 eine schematische Anordnung für ein Abwärtsmischschemas, das einen einzelnen Basiskanal oder zwei Basiskanäle erzeugt;
  • 8 eine schematische Darstellung eines Aufwärtsmischschemas, das auf den erfindungsgemäßen Ausgleichsparametern und Informationen über das Abwärtsmischschema basiert;
  • 9a schematisch eine Bestimmung eines Pegelparameters codiereinrichtungsseitig gemäß der vorliegenden Erfindung;
  • 9b schematisch die Verwendung des Pegelparameters decodiereinrichtungsseitig gemäß der vorliegenden Erfindung;
  • 10a einen skalierbaren Bitstrom mit unterschiedlichen Teilen der Mehrkanalparametrisierung in unterschiedlichen Schichten des Bitstroms;
  • 10b eine Skalierbarkeitstabelle, die anzeigt, welche Kanäle unter Verwendung welcher Ausgleichsparameter aufgebaut werden können, und welche Ausgleichsparameter und Kanäle nicht verwendet oder berechnet werden; und
  • 11 die Anwendung der Aufwärtsmischmatrix gemäß der vorliegenden Erfindung.
  • Beschreibung der bevorzugten Ausführungsbeispiele
  • Die nachfolgend beschriebenen Ausführungsbeispiele veranschaulichen lediglich die Prinzipien der vorliegenden Erfindung bezüglich einer Mehrkanaldarstellung von Audiosignalen. Es sei darauf hingewiesen, dass Modifikationen und Variationen der Anordnungen und der Details, die hierin beschrieben sind, für andere Fachleute auf dem Gebiet offensichtlich sind. Die einzige Beschränkung soll daher lediglich durch den Schutzbereich der bevorstehenden Patentansprüche und nicht durch die mittels einer Beschreibung und Erläuterung der hierin enthaltenen Ausführungsbeispiele dargelegten spezifischen Details gegeben sein.
  • In der nachfolgenden Beschreibung der vorliegenden Erfindung, die zeigt, wie IID- und ICC-Parameter zu parametrisieren sind und wie dieselben anzuwenden sind, um eine Mehrkanaldarstellung von Audiosignalen wiederzuerzeugen, wird davon ausgegangen, dass alle Signale, auf die Bezug genommen wird, Teilbandsignale in einer Filterbank oder irgendeine andere frequenzselektive Darstellung eines Teils des gesamten Frequenzbereichs für den entsprechenden Kanal sind. Es sei daher darauf hingewiesen, dass die vorliegende Erfindung nicht auf eine spezifische Filterbank beschränkt ist und dass die vorliegende Erfindung nachfolgend für ein Frequenzband der Teilbanddarstellung des Signals skizziert ist und dass dieselben Operationen für alle Teilbandsignale gelten.
  • Auch wenn ein Ausgleichsparameter auch als ein „Zwischen-Kanal-Intensitätsdifferenzparameter (IID-Parameter; IID = inter-channel intensity difference)" bezeichnet wird, sei betont, dass ein Ausgleichsparameter zwischen einem Kanalpaar nicht notwendigerweise das Verhältnis zwischen der Energie oder Intensität in dem ersten Kanal des Kanalpaars und der Energie oder Intensität des zweiten Kanals in dem Kanalpaar ein muss. Im Allgemeinen zeigt der Ausgleichsparameter die Lokalisation einer Schallquelle zwischen den zwei Kanälen des Kanalpaars an. Auch wenn diese Lokalisation in der Regel durch Energie-/Pegel-/Intensitäts-Differenzen gegeben ist, können auch andere Charakteristika eines Signals wie z. B. ein Leistungsmaß für beide Kanäle oder Zeit- oder Frequenzhüllkurven der Kanäle usw. verwendet werden.
  • In 1 sind die unterschiedlichen Kanäle für eine 5.1-Kanalkonfiguration veranschaulicht, wobei a(t) 101 den linken Surroundkanal, b(t) 102 den linken vorderen Kanal, c(t) 103 den mittleren Kanal, d(t) 104 den rechten vorderen Kanal, e(t) 105 den rechten Surroundkanal und f(t) 106 den LFE-Kanal (LFE = low frequency effect = Niederfrequenzeffekt) darstellt.
  • Angenommen, dass der Erwartungsoperator als
    Figure 00180001
    definiert wird, können somit die Energien für die im Vorhergehenden behandelten Kanäle gemäß A = E[a2(t)]definiert werden (hier am Beispiel des linken Surroundkanals gezeigt). Die fünf Kanäle sind Codiereinrichtungsseitig auf eine Zweikanaldarstellung oder eine Einkanaldarstellung heruntergemischt. Dies kann auf verschiedene Arten durchgeführt werden und eine im Allgemeinen verwendete ist die ITU-Abwärtsmischung (ITU = International Telecommunications Union = Internationale Fernmeldeunion), die wie folgt definiert ist:
    Die 5.1-zu-Zweikanal-Abwärtsmischung: ld(t) = αb(t) + βa(t) + γc(t) + δf(t) rd(t) = αd(t) + βe(t) + γc(t) + δf(t)
  • Und die 5.1-zu-Einkanal-Abwärtsmischung:
    Figure 00190001
  • Im Allgemeinen verwendeten Werte für die Konstanten α, β, γ und 6 sind
    Figure 00190002
  • Die IID-Parameter sind als Energieverhältnisse der zwei willkürlich gewählten Kanäle oder gewichteten Gruppen von Kanälen definiert. Angesichts der Energien der im Vorhergehenden behandelten Kanäle für die 5.1-Kanalkonfiguration können verschiedene Sätze von IID-Parametern definiert werden.
  • 7 zeigt einen allgemeinen Abwärtsmischer 700 unter Verwendung der Gleichungen, auf die im Vorhergehenden Bezug genommen wurde, zum Errechnen eines einzeln basierten Kanals m oder zweier vorzugsweise stereobasierter Kanäle ld und rd. im Allgemeinen verwendet der Abwärtsmischer bestimmte Abwärtsmischinformationen. Bei dem bevorzugten Ausführungsbeispiel einer linearen Abwärtsmischung umfassen diese Abwärtsmischinformationen Gewichtungsfaktoren α, β, γ und δ. Im Fachgebiet ist bekannt, dass mehr oder weniger konstante oder nicht konstante Gewichtungsfaktoren verwendet werden können.
  • Bei einer durch die ITU empfohlenen Abwärtsmischung wird α auf 1 eingestellt, β und γ werden so eingestellt, dass sie gleich und gleich der Quadratwurzel aus 0,5 sind, und δ wird auf 0 eingestellt. im Allgemeinen kann der Faktor α zwischen 1,5 und 0,5 variieren. Zudem können die Faktoren β und γ sich voneinander unterscheiden und zwischen 0 und 1 variieren. Dasselbe gilt für den Niederfrequenzverbesserungskanal f(t). Der Faktor δ für diesen Kanal kann zwischen 0 und 1 variieren. Zudem müssen die Faktoren für die Linksabwärtsmischung und die Rechtsabwärtsmischung nicht gleich sein. Dies wird klar, wenn man eine nicht automatische Abwärtsmischung betrachtet, die z. B. durch einen Tontechniker durchgeführt wird. Der Tontechniker konzentriert sich eher darauf, eine kreative Abwärtsmischung als eine Abwärtsmischung, die sich nach mathematischen Gesetzen richtet, durchzuführen. Stattdessen lässt sich der Tontechniker von seinem eigenen kreativen Gefühl leiten. Wenn diese „kreative" Abwärtsmischung durch einen gewissen Parametersatz aufgezeichnet wird, wird dieser gemäß der vorliegenden Erfindung durch einen erfindungsgemäßen Aufwärtsmischer, wie er in 8 gezeigt ist, verwendet, der sich nicht nur nach den Parametern, sondern auch nach zusätzlichen Informationen über das Abwärtsmischschema richtet.
  • Wenn eine lineare Abwärtsmischung wie in 7 durchgeführt worden ist, sind die Gewichtungsparameter die bevorzugten Informationen über das Abwärtsmischschema, das durch den Aufwärtsmischer verwendet wird. Wenn jedoch andere Informationen vorliegen, die in dem Abwärtsmischschema verwendet werden, können diese anderen Informationen auch als die Informationen über das Abwärtsmischschema durch einen Aufwärtsmischer verwendet werden. Derartige andere Informationen können z. B. gewisse Matrixelemente oder gewisse Faktoren oder Funktionen in Matrixelementen einer Aufwärtsmischmatrix, wie sie z. B. in 11 angezeigt ist, sein.
  • Angesichts der in 1 behandelten 5.1-Kanalkonfiguration und einer Beobachtung, wie andere Kanalkonfigurationen auf die 5.1-Kanalkonfiguration bezogen sind, zeigt sich Folgen des: Bei einem Dreikanalfall, bei dem keine Surroundkanäle verfügbar sind, sind B, C und D sind gemäß vorheriger Notation verfügbar. Bei einer Vierkanalkonfiguration sind B, C und D verfügbar, jedoch auch eine Kombination aus A und E, die den einzelnen Surroundkanal oder, wie in diesem Zusammenhang üblicher bezeichnet, den schwarzen Kanal darstellt.
  • Die vorliegende Erfindung verwendet IID-Parameter, die für alle diese Kanäle gültig sind, d. h., der Vierkanalteilsatz der 5.1-Kanalkonfiguration weist einen entsprechenden Teilsatz in dem IID-Parametersatz auf, der die 5.1-Kanäle beschreibt. Der folgende IID-Parametersatz löst dieses Problem:
    Figure 00210001
  • Es ist offenkundig, dass der r1-Parameter dem Energieverhältnis zwischen dem linken Abwärtsmischkanal und der rechten Kanalabwärtsmischung entspricht. Der r2-Parameter entspricht dem Energieverhältnis zwischen dem mittleren Kanal und dem linken und rechten vorderen Kanal. Der r3- Parameter entspricht dem Energieverhältnis zwischen den drei vorderen Kanälen und den zwei Surroundkanälen. Der r4-Parameter entspricht dem Energieverhältnis zwischen den zwei Surroundkanälen. Der r5-Parameter entspricht dem Energieverhältnis zwischen dem LFE-Kanal und allen anderen Kanälen.
  • In 4 sind die Energieverhältnisse, wie im Vorhergehenden erörtert, veranschaulicht. Die unterschiedlichen Ausgangskanäle sind durch 101 bis 105 angezeigt und sind dieselben wie in 1 und werden daher hier nicht weiter ausgeführt. Die Lautsprecheranordnung wird in eine linke und eine rechte Hälfte unterteilt, wobei der mittlere Kanal 103 beiden Hälften angehört. Das Energieverhältnis zwischen der Ebene der linken Hälfte und der Ebene der rechten Hälfte ist genau der Parameter, der gemäß der vorliegenden Erfindung als r1 bezeichnet wird. Dies ist in 4 durch die durchgezogene Linie unterhalb r1 angezeigt. Ferner ist die Energieverteilung zwischen dem mittleren Kanal 103 und dem linken vorderen 102 und rechten vorderen 103 Kanal gemäß der vorliegenden Erfindung durch r2 angezeigt. Schließlich ist die Energieverteilung zwischen der gesamten Vorderkanalanordnung (102, 103 und 104) den Hintenkanälen (101 und 105) durch den Pfeil in 5 an dem r3-Parameter veranschaulicht.
  • Angesichts der im Vorhergehenden erörterten Parametrisierung und der Energie des übertragenen einzelnen abwärtsgemischten Kanals: M = 12 2(B + D) + β2(A + E) + 2γ2C + 2δ2F),können die Energien der rückgewonnenen Kanäle wie folgt ausgedrückt werden:
    Figure 00230001
  • Folglich kann die Energie des M-Signals auf die rückgewonnenen Kanäle verteilt werden, was rückgewonnenen Kanäle zur Folge hat, die dieselben Energien wie die ursprünglichen Kanäle aufweisen.
  • Das im Vorhergehenden erörterte bevorzugte Aufwärtsmischschema ist in 8 veranschaulicht. Aus den Gleichungen für F, A, E, C, B und D ist ersichtlich, dass die Informationen über das Abwärtsmischschema, das durch den Aufwärtsmischer verwendet wird, die Gewichtungsfaktoren α, β, γ und δ sind, die für eine Gewichtung der ursprünglichen Kanäle verwendet werden, bevor derartige gewichtete oder ungewichtete Kanäle zusammenaddiert oder voneinander subtrahiert werden, um eine Anzahl von Abwärtsmischkanälen zu erhalten, die kleiner ist als die Anzahl von ursprünglichen Kanälen. Somit ist aus 8 ersichtlich, dass gemäß der vorliegenden Erfindung die Energien der rückgewonnenen Kanäle nicht nur durch die Ausgleichsparameter, die von einer Codiereinrichtungsseite an eine Decodiereinrichtungsseite übertragen werden, bestimmt sind, sondern auch durch den Abwärtsmischfaktor α, β, γ und δ bestimmt sind.
  • Wird 8 betrachtet wird klar, dass zur Berechnung der linken und rechten Energie B und D die bereits berechneten Kanalenergien F, A, E, C in der Gleichung verwendet werden. Dies setzt jedoch nicht notwendigerweise ein sequentielles Aufwärtsmischschema voraus. Stattdessen werden, zum Erhalten eines vollständig parallelen Aufwärtsmischschemas, das z. B. unter Verwendung einer gewissen Aufwärtsmischmatrix mit gewissen Aufwärtsmischmatrixelementen durchgeführt wird, die Gleichungen für A, C, E und F in die Gleichungen für B und D eingefügt. Somit wird klar, dass eine rückgewonnene Kanalenergie lediglich durch Ausgleichsparameter, den oder die Abwärtsmischkanäle und die Informationen über das Abwärtsmischschema wie z. B. die Abwärtsmischfaktoren bestimmt ist.
  • Angesichts der im Vorhergehenden erörterten IID-Parameter leuchtet ein, dass das Problem eines Definierens eines Parametersatzes für IID-Parameter, der für mehrere Kanalkonfigurationen verwendet werden kann, gelöst worden ist, wie es aus dem Nachfolgenden ersichtlich ist. Beispielsweise zeigt eine Betrachtung der Dreikanalkonfiguration (d. h., ein Wiedererzeugen von drei vorderen Kanälen aus einem verfügbaren Kanal), dass es erwiesen ist, dass der r3-, der r4- und der r5-Parameter überflüssig sind, da der A-, der E- und der F-Kanal nicht existieren. Es ist auch erwiesen, dass die Parameter r1 und r2 ausreichen, um die drei Kanäle aus einem abwärtsgemischten einzelnen Kanal wiederzuerzeugen, da r1 das Energieverhältnis zwischen dem linken und rechten vorderen Kanal beschreibt und r2 das Energieverhältnis zwischen dem mittleren Kanal und dem linken und rechten vorderen Kanal beschreibt.
  • In dem allgemeineren Fall ist ohne weiteres zu erkennen, dass die IID-Parameter (r1 ... r5), wie sie im Vorhergehenden definiert sind, für alle Teilsätze zum Wiedererzeugen von n Kanälen aus m Kanälen gelten, wobei m < n ≤ 6. Betrachtet man 4, können folgende Aussagen getroffen werden:
    • – Für ein System, das zwei Kanäle aus einem Kanal wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r1-Parameter gewonnen;
    • – Für ein System, das drei Kanäle aus einem Kanal wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r1- und dem r2-Parameter gewonnen;
    • – Für ein System, das vier Kanäle aus einem Kanal wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r1-, dem r2- und dem r3-Parameter gewonnen;
    • – Für ein System, das fünf Kanäle aus einem Kanal wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r1-, dem r2-, dem r3- und dem r4-Parameter gewonnen;
    • – Für ein System, das 5.1 Kanäle aus einem Kanal wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r1-, dem r2-, dem r3-, dem r4- und dem r5-Parameter gewonnen;
    • – Für ein System, das 5.1 Kanäle aus zwei Kanälen wiedererzeugt, werden ausreichend Informationen zum Bewahren des korrekten Energieverhältnisses zwischen den Kanälen aus dem r2-, dem r3-, dem r4- und dem r5-Parameter gewonnen.
  • Das im Vorhergehenden beschriebene Skalierbarkeitsmerkmal ist durch die Tabelle in 10b veranschaulicht. Der skalierbare Bitstrom, der in 10a veranschaulicht und später beschrieben wird, kann zum Erhalten einer wesentlich feineren Skalierbarkeit als der in 10a gezeigten auch auf die Tabelle im 10b angepasst werden.
  • Das erfindungsgemäße Konzept ist besonders dahin gehend vorteilhaft, dass der linke und rechte Kanal ohne weiteres aus einem einzigen Ausgleichsparameter r1 ohne Kenntnis oder Extrahierung irgendeines anderen Ausgleichsparameters rückgewonnen werden kann. Dazu werden einfach in den Gleichungen für B, D in 8, die Kanäle A, C, F und E auf Null eingestellt.
  • Alternativ sind, wenn lediglich der Ausgleichsparameter r2 betrachtet wird, die rückgewonnenen Kanäle auf der einen Seite die Summe aus dem mittleren Kanal und dem Niederfrequenzkanal (wenn dieser Kanal nicht auf Null eingestellt ist), und auf der anderen Seite die Summe aus dem linken und rechten Kanal. Somit können einerseits der mittlere Kanal und andererseits das Monosignal unter Verwendung lediglich eines einzelnen Parameters rückgewonnen werden. Dieses Merkmal kann auch bereits für eine einfache 3-Kanaldarstellung nützlich sein, bei der das linke und rechte Signal von der Summe aus Links und Rechts z. B. durch Halbierung abgeleitet werden, und bei der die Energie zwischen der Mitte und der Summe aus Links und Rechts durch den Ausgleichsparameter r2 exakt bestimmt ist.
  • In diesem Rahmen befinden sich die Ausgleichsparameter r1 oder r2 in einer niedrigeren Skalierungsschicht.
  • Bezüglich des zweiten Eintrags in der Tabelle der 10b, der anzeigt, wie 3 Kanäle B, D und die Summe aus C und F unter Verwendung von lediglich zwei Ausgleichsparametern statt allen fünf Ausgleichsparametern erzeugt werden können, kann einer dieser Parameter r1 und r2 bereits in einer höheren Skalierungsschicht als der Parameter r1 oder r2, der sich in der niedrigeren Skalierungsschicht befindet, sein.
  • Wenn die Gleichungen in 8 betrachtet werden zeigt sich, dass zum Berechnen von C der nicht extrahierte Parameter r5 und der andere nicht extrahierte Parameter r3 auf 0 eingestellt sind. Zusätzlich sind auch die nicht verwendeten Kanäle A, E, F auf 0 eingestellt, so dass die 3 Kanäle B, D und die Kombination aus dem mittleren Kanal C und dem Niederfrequenzverbesserungskanal F berechnet werden können.
  • Wenn eine 4-Kanaldarstellung aufwärtsgemischt werden soll, ist es ausreichend, lediglich die Parameter r1, r2 und r3 aus dem Parameterdatenstrom zu extrahieren. In diesem Zusammenhang könnte r3 in einer nächsthöheren Skalierungsschicht als der andere Parameter r1 oder r2 sein. Die 4-Kanalkonfiguration ist besonders geeignet in Verbindung mit der Superausgleichsparameterdarstellung der vorliegenden Erfindung, da, wie es später in Verbindung mit 6 beschrieben ist, der dritte Ausgleichsparameter r3 bereits von einer Kombination der Vorderkanäle einerseits und der Hinterkanäle andererseits abgeleitet ist. Dies liegt in der Tatsache begründet, dass der Parameter r3 ein Vorne/Hinten-Ausgleichsparameter ist, der von dem Kanalpaar abgeleitet ist, das, als einen ersten Kanal, eine Kombination aus den Hinterkanälen A und E aufweist und, als die vorderen Kanäle, eine Kombination aus dem linken Kanal B, dem rechten Kanal E und dem mittleren Kanal C aufweist.
  • Somit wird die kombinierte Kanalenergie beider Surroundkanäle ohne eine irgendeine weitere gesonderte Berechnung und nachfolgende Kombination, wie es bei einer Einzelreferenzkanalanordnung der Fall wäre, automatisch gewonnen.
  • Wenn fünf Kanäle aus einem einzigen Kanal wiedererzeugt werden müssen, ist der weitere Ausgleichsparameter r4 erforderlich. Dieser Parameter r4 kann sich wiederum in einer nächsthöheren Skalierungsschicht befinden.
  • Muss eine 5.1-Rückgewinnung durchgeführt werden, ist jeder Ausgleichsparameter erforderlich. Somit muss eine nächst höhere Skalierungsschicht, die den nächsten Ausgleichsparameter r5 umfasst, an einen Empfänger übertragen und durch den Empfänger ausgewertet werden.
  • Jedoch können unter Verwendung desselben Ansatzes des Erweiterns der IID-Parameter gemäß der erweiterten Anzahl von Kanälen die im Vorhergehenden erörterten IID-Parameter erweitert werden, um eine Kanalkonfiguration s mit einer größeren Anzahl von Kanälen als die 5.1-Konfiguration abzudecken. Somit ist die vorliegende Erfindung nicht auf die im Vorhergehenden behandelten Beispiele begrenzt.
  • Es wird nun der Fall betrachtet, bei dem die Kanalkonfiguration eine 5.1-Kanalkonfiguration ist, was einer der am häufigsten verwendeten Fälle ist. Ferner sei angenommen, dass die 5.1-Kanäle aus zwei Kanälen wiedererzeugt werden. Für diesen Fall kann durch Ersetzen der Parameter r3 und r4 durch:
    Figure 00280001
    ein anderer Parametersatz definiert werden. Die Parameter q3 und q4 repräsentieren das Energieverhältnis zwischen dem vorderen und hinteren linken Kanal und das Energieverhält nis zwischen dem vorderen und hinteren rechten Kanal. Verschiedene andere Parametrisierungen sind vollstellbar.
  • In 5 ist die modifizierte Parametrisierung veranschaulicht. Anstatt eines Parameters, der die Energieverteilung zwischen den Vorder- und Hinterkanälen darstellt (wie es durch r3 in 4 dargestellt war), und eines Parameters, der die Energieverteilung zwischen dem linken Surroundkanal und dem rechten Surroundkanal beschreibt (wie es durch r4 in 4 skizziert war), werden die Parameter q3 und q4 verwendet, die das Energieverhältnis zwischen dem linken vorderen Kanal 102 und dem linken Surroundkanal 101 und das Energieverhältnis zwischen dem rechten vorderen Kanal 104 und dem rechten Surroundkanal 105 beschreiben.
  • Die vorliegende Erfindung lehrt, dass mehrere Parametersätze verwendet werden können, um die Mehrkanalsignale darzustellen. Ein zusätzliches Merkmal der vorliegenden Erfindung ist, dass unterschiedliche Parametrisierungen abhängig von dem verwendeten Typ von einer Quantisierung der Parameter gewählt werden können.
  • Beispielsweise sollte in einem System, das aufgrund hoher Bitratenbeschränkungen eine grobe Quantisierung der Parametrisierung verwendet, eine Parametrisierung verwendet werden, die Fehler während des Aufwärtsmischprozesses nicht verstärkt.
  • Betrachtet man zwei der im Vorhergehenden beschriebenen Ausdrücke für die rückgewonnenen Energien in einem System, das 5.1 Kanäle aus einem Kanal wiedererzeugt, zeigt sich Folgendes:
    Figure 00290001
    Figure 00300001
  • Es ist erwiesen, dass die Subtraktionen aufgrund der relativ kleinen Quantisierungseffekte der M-, A-, C- und F-Parameter große Variationen der B- und D-Energien ergeben können.
  • Gemäß der vorliegenden Erfindung sollte eine andere Parametrisierung verwendet werden, die weniger empfindlich gegenüber einer Quantisierung der Parameter ist. Somit gilt, falls eine große Quantisierung verwendet wird, für den r1-Parameter, wie er im Vorhergehenden definiert wurde, dass:
    Figure 00300002
    durch die alternative Definition gemäß: r1 = BD ersetzt werden kann.
  • Dies ergibt Gleichungen für die rückgewonnenen Energien gemäß:
    Figure 00300003
    und die Gleichungen für die rückgewonnenen Energien von A, E, C und F verändern sich nicht zum Vorhergehenden. Es zeigt sich, dass diese Parametrisierung im Sinne einer Quantisierung ein besser konditioniertes System darstellt.
  • In 6 sind die Energieverhältnisse, wie sie im Vorhergehenden erläutert sind, dargestellt. Die unterschiedlichen Ausgangskanäle sind durch 101 und 105 angezeigt und sind dieselben wie in 1 und werden deshalb hier nicht weiter ausgeführt. Die Lautsprecheranordnung ist in einen vorderen Teil und einen hinteren Teil unterteilt. Die Energieverteilung zwischen der gesamten Vorderkanalanordnung (102, 103 und 104) und den Hinterkanälen (101 und 105) ist durch den in 6 bei dem r3-Parameter angezeigten Pfeil veranschaulicht.
  • Ein weiteres wichtiges beachtenswertes Merkmal der vorliegenden Erfindung ist, dass, wenn die Parametrisierung
    Figure 00310001
    betrachtet wird, dies nicht nur was eine Quantisierung betrifft ein besser konditioniertes System ist. Die vorhergehende Parametrisierung weist auch den Vorteil auf, dass die Parameter, die verwendet werden, um die drei vorderen Kanäle rückzugewinnen, ohne jeglichen Einfluss der Surroundkanäle abgeleitet werden. Es könnte ein Parameter r2 vorgesehen werden, der die Relation zwischen dem mittleren Kanal und allen anderen Kanälen beschreibt. Dies hätte jedoch den Nachteil, dass die Surroundkanäle in die Schätzung der Parameter, die die vorderen Kanäle beschreiben, mit aufgenommen wären.
  • Erinnert man sich daran, dass die in der vorliegenden Erfindung beschriebene Parametrisierung auch auf Messungen einer Korrelation oder Kohärenz zwischen Kanälen angewendet werden kann, zeigt sich, dass ein Aufnehmen der Hinterkanäle in die Berechnung von r2 einen beträchtlichen negativen Einfluss auf den Erfolg einer exakten Wiedererzeugung der vorderen Kanäle ausüben kann.
  • Als ein Beispiel könnte man sich eine Situation mit demselben Signal in allen vorderen Kanälen und vollständig unkorrelierten Signal in den Hinterkanälen vorstellen. Dies ist nicht selten, angesichts dessen, dass die Hinterkanäle häufig verwendet werden, um Umgebungsinformationen des ursprünglichen Schalls wiederzuerzeugen.
  • Ist der mittlere Kanal mit Bezug auf alle anderen Kanäle beschrieben, ist das Korrelationsmaß zwischen der Mitte und der Summe aller anderen Kanäle ziemlich niedrig, da die hinteren Kanäle vollständig unkorreliert sind. Dasselbe gilt für einen Parameter, der die Korrelation zwischen den vorderen Links/Rechts-Kanälen und den hinteren Links/Rechts-Kanälen schätzt.
  • Somit gelangt man zu einer Parametrisierung, die die Energien korrekt rückgewinnen kann, die jedoch nicht die Information umfasst, dass alle vorderen Kanäle identisch, d. h. stark korreliert, waren. Sie enthält jedoch die Information, dass der linke und rechte vordere Kanal gegenüber den hinteren Kanälen dekorreliert sind und dass der mittlere Kanal ebenfalls gegenüber den hinteren Kanälen dekorreliert ist. Jedoch ist die Tatsache, dass alle vorderen Kanäle gleich sind, von einer derartigen Parametrisierung nicht ableitbar.
  • Dies wird unter Verwendung der Parametrisierung
    Figure 00320001
    wie sie durch die vorliegende Erfindung gelehrt ist, überwunden, da die hinteren Kanäle nicht in die Schätzung der decodiereinrichtungsseitig verwendeten Parameter zum Wiedererzeugen der vorderen Kanäle aufgenommen ist.
  • Die Energieverteilung zwischen dem mittleren Kanal 103 und dem linken vorderen Kanal 102 und rechten vorderen Kanal 103 sind gemäß der vorliegenden Erfindung durch r2 angezeigt. Die Energieverteilung zwischen dem linken Surroundkanal 101 und dem rechten Surroundkanal 105 ist durch r4 veranschaulicht. Schließlich ist die Energieverteilung zwischen dem linken vorderen Kanal 102 und dem rechten vorderen Kanal 104 durch r1 gegeben. Wie es sich zeigt, sind alle Parameter gleich, wie es in 4 skizziert ist, außer r1, der hier der Energieverteilung zwischen dem linken vorderen Lautsprecher und dem rechten vorderen Lautsprecher entspricht, im Gegensatz zu der gesamten linken Seite und der gesamten rechten Seite. Zur Vervollständigung ist auch der Parameter r5 angegeben, der die Energieverteilung zwischen dem mittleren Kanal 103 und dem lfe-Kanal 106 skizziert.
  • 6 zeigt einen Überblick über das bevorzugte Parametrisierungsausführungsbeispiel der vorliegenden Erfindung. Der erste Ausgleichsparameter r1 (angezeigt durch die durchgezogene Linie) bildet einen Vorne-Links/Vorne-Rechts-Ausgleichsparameter. Der zweite Ausgleichsparameter r2 ist ein mittlerer Links-Rechts-Ausgleichsparameter. Der dritte Ausgleichsparameter r3 bildet einen Vorne/Hinten-Ausgleichsparameter. Der vierte Ausgleichsparameter r4 bildet einen Hinten-Links/Hinten-Rechts-Ausgleichsparameter. Schließlich bildet der fünfte Ausgleichsparameter r5 einen Mitte-lfe-Ausgleichsparameter.
  • 4 zeigt eine ähnliche Situation. Der erste Ausgleichsparameter r1, der in 4 im Fall eines Abwärtsmisch-Links/Rechts-Ausgleichs durch durchgezogene Linien veranschaulicht ist, kann durch einen ursprünglichen Vorne-Links/Vorne-Rechts-Ausgleichsparameter, der als das zugrunde liegende Kanalpaar zwischen den Kanälen B und D definiert ist, ersetzt werden. Dies ist durch die Strichlinie r1 in 4 dargestellt und entspricht der durchgezogenen Linie r1 in 5 und 6.
  • In einer Zweibasiskanalsituation werden die Parameter r3 und r4, d. h. der Vorne/Hinten-Ausgleichsparameter und der Hinten-Links/Rechts-Ausgleichsparameter durch zwei einseitige Vorne/Hinten-Parameter ersetzt. Der erste einseitige Vorne/Hinten-Parameter q3 kann auch als der erste Ausgleichsparameter betrachtet werden, der von dem Kanalpaar, das aus dem linken Surroundkanal A und dem linken Kanal B besteht, abgeleitet ist. Der zweite einseitige Vorne/Links-Ausgleichsparameter ist der Parameter q4, der als der zweite Parameter betrachtet werden kann, der auf dem zweiten Kanalpaar basiert, das aus dem rechten Kanal D und dem rechten Surroundkanal E besteht. Wiederum sind beide Kanalpaare unabhängig voneinander. Dasselbe gilt für den Mitte/Links-Rechts-Ausgleichsparameter r2, der als einen ersten Kanal einen mittleren Kanal C und als einen zweiten Kanal die Summe aus dem linken und rechten Kanal B und D aufweist.
  • Eine weitere Parametrisierung, die gut für eine grobe Quantisierung für ein System geeignet ist, das 5.1-Kanäle aus einem oder zwei Kanälen wiedererzeugt, ist gemäß der vorliegenden Erfindung nachfolgend definiert.
  • Für den einen zu 5.1-Kanälen:
    Figure 00340001
  • Und für den Fall von zwei zu 5.1-Kanälen:
    Figure 00350001
  • Es ist erwiesen, dass die im Vorhergehenden beschriebenen Parametrisierungen mehr Parameter umfassen als von einem streng theoretischen Standpunkt aus betrachtet benötigt werden, um die Energie der gesendeten Signale korrekt auf die wiedererzeugten Signale wiederzuverteilen. Jedoch ist die Parametrisierung sehr unempfindlich gegenüber Quantisierungsfehlern.
  • Der Parametersatz für eine Zweibasiskanalanordnung, auf den im Vorhergehenden Bezug genommen wurde, verwendet mehrere Referenzkanäle. Im Gegensatz zu der Parameterkonfiguration in 6 stützt sich der Parametersatz in 7 jedoch ausschließlich auf Abwärtsmischkanäle statt auf ursprüngliche Kanäle als Referenzkanäle. Die Ausgleichsparameter q1, q3 und q4 werden von vollständig unterschiedlichen Kanalpaaren abgeleitet.
  • Auch wenn mehrere erfindungsgemäße Ausführungsbeispiele beschrieben wurden, in denen die Kanalpaare zum Ableiten von Ausgleichsparametern lediglich ursprüngliche Kanäle umfassen (4, 5, 6) oder ursprüngliche Kanäle sowie Abwärtsmischkanäle umfassen (4, 5) oder sich lediglich auf Abwärtsmischkanäle als die Referenzkanäle stützen, wie es in 7 unten angezeigt ist, ist es bevorzugt, dass der Parametererzeuger, der in die Surrounddatencodiereinrichtung 206 der 2 aufgenommen ist, wirksam ist, um lediglich ursprüngliche Kanäle oder Kombinationen aus ursprünglichen Kanälen statt einem Basiskanal oder einer Kombination aus Basiskanälen für die Kanäle in den Kanalpaaren zu verwenden, auf denen die Ausgleichsparameter basieren. Dies liegt in der Tatsache begründet, dass sich nicht vollständig sicherstellen lässt, dass kein Energiewechsel auf den einzelnen Basiskanal oder die zwei Stereobasiskanäle während ihrer Übertragung von einer Surroundcodiereinrichtung zu einer Surrounddecodiereinrichtung stattfindet. Derartige Energieschwankungen zu den Abwärtsmischkanälen oder dem einzelnen Abwärtsmischkanal können durch eine Audiocodiereinrichtung 205 (2) oder eine Audiodecodiereinrichtung 302 (3), die unter Bedingungen einer Niedrigbitrate wirksam sind, verursacht werden. Derartige Situationen können zu einer Manipulation der Energie des Monoabwärtsmischkanals oder der Stereoabwärtsmischkanäle führen, wobei die Manipulation sich zwischen dem linken und rechten Stereoabwärtsmischkanal unterscheiden kann oder sogar frequenzselektiv und zeitselektiv sein kann.
  • Für einen vollständigen Schutz vor derartigen Energieschwankungen wird ein zusätzlicher Pegelparameter für jeden Block und jedes Frequenzband für jeden Abwärtsmischkanal gemäß der vorliegenden Erfindung übertragen. Wenn die Ausgleichsparameter auf dem ursprünglichen Signal statt dem Abwärtsmischsignal basieren, ist ein einziger Korrekturfaktor für jedes Band ausreichend, da eine Energiekorrektur keinen Einfluss auf eine Ausgleichssituation zwischen den ursprünglichen Kanälen hat. Selbst wenn kein zusätzlicher Pegelparameter übertragen wird, führen Energieschwankungen in Abwärtsmischkanälen in keinem Fall zu einer verzerrten Lokalisierung von Schallquellen in dem Audiobild, sondern nur zu einer allgemeinen Lautstärkeschwankung, die weniger ärgerlich als eine durch variierende Ausgleichsbedingungen verursachte Wanderung einer Schallquelle ist.
  • Es darf nicht übersehen werden, dass es wichtig ist, darauf zu achten, dass die Energie M (der abwrtsgemischten Kanäle) die Summe der Energien B, D, A, E, C und F ist, wie es im Vorhergehenden behandelt wurde. Aufgrund der Phasenabhängigkeiten zwischen den unterschiedlichen Kanälen, die auf einem Kanal abwärtsgemischt werden, ist dies nicht immer der Fall. Der Energiekorrekturfaktor kann als ein zusätzlicher Parameter rM übertragen werden, und die Energie des abwärtsgemischten Signals, das decodereinrichtungsseitig empfangen wird, ist somit wie folgt definiert: rMM = 12 2(B + D) + β2(A + E) + 2γ2C + 2δ2F).
  • In 9 ist die Anwendung des zusätzlichen Parameters rM gemäß der vorliegenden Erfindung skizziert. Das abwärtsgemischte Eingangssignal wird durch den rM-Parameter in 901 vor einer Übertragung in die Aufwärtsmischmodule von 701705 modifiziert. Diese sind gleich denen in 7 und werden hier aus diesem Grund nicht weiter behandelt. Für Fachleute auf dem Gebiet ist es offensichtlich, dass der Parameter rM für das im Vorhergehenden beschriebene Beispiel einer Einzelkanalabwärtsmischung auf einen Parameter pro Abwärtsmischkanal erweitert werden kann und somit nicht auf einen einzigen Abwärtsmischkanal beschränkt ist.
  • 9a veranschaulicht eine erfindungsgemäße Pegelparameterberechnungseinrichtung 900, wohingegen 9b eine erfindungsgemäße Pegelkorrektureinrichtung 902 beschreibt. 9a zeigt die Situation codiereinrichtungsseitig und 9b veranschaulicht die entsprechende Situation decodiereinrichtungsseitig. Der Pegelparameter oder „zusätzliche" Parameter rM ist ein Korrekturfaktor, der ein gewisses Energieverhältnis vorgibt. Um dies zu erläutern, wird das nachfolgende beispielhafte Szenario angenommen. Für ein gewisses ursprüngliches Mehrkanalsignal besteht eine „Masterabwärtsmischung" einerseits und eine „Parameterabwärtsmischung" andererseits. Die Masterabwärtsmischung wurde durch einen Tontechniker in einem Tonstudio basierend auf, z. B., subjektiven Qualitätseindrücken erzeugt. Zusätzlich umfasst ein gewisses Audiospeicherungsmedium auch die Parameterabwärtsmischung, die durch beispielsweise die Surroundcodiereinrichtung 203 der 2 durchgeführt wurde. Die Parameterabwärtsmischung umfasst einen Basiska nal oder zwei Basiskanäle, wobei die Basiskanäle die Basis für die Mehrkanalrückgewinnung unter Verwendung des Ausgleichsparametersatzes oder irgendeiner anderen parametrischen Darstellung des ursprünglichen Mehrkanalsignals bilden.
  • Es kann beispielsweise der Fall sein, dass ein Übermittler nicht die Parameterabwärtsmischung sondern die Masterabwärtsmischung von einem Sender an einen Empfänger übertragen will. Zudem überträgt der Übermittler zum Aktualisieren der Masterabwärtsmischung auf die Mehrkanaldarstellung auch eine parametrische Darstellung des ursprünglichen Mehrkanalsignals. Da die Energie (in einem Band und in einem Block) zwischen der Masterabwärtsmischung und der Parameterabwärtsmischung variieren kann (und dies in der Regel auch tut), wird in Block 900 ein relativer Pegelparameter rM erzeugt und an den Empfänger als ein zusätzlicher Parameter übertragen. Der Pegelparameter wird von der Masterabwärtsmischung und der Parameterabwärtsmischung abgeleitet und ist vorzugsweise ein Verhältnis zwischen den Energien in einem Block und einem Band der Masterabwärtsmischung und der Parameterabwärtsmischung.
  • Im Allgemeinen wird der Pegelparameter als das Verhältnis der Summe aus den Energien (Eorig) der ursprünglichen Kanäle und der Energie des Abwärtsmischkanals bzw. der Abwärtsmischkanäle berechnet, wobei dieser Abwärtsmischkanal bzw. diese Abwärtsmischkanäle die Parameterabwärtsmischung (EPD) oder die Masterabwärtsmischung (EMD) oder ein beliebiges anderes Abwärtsmischsignal sein kann. In der Regel wird die Energie des spezifischen Abwärtsmischsignals verwendet, das von einer Codiereinrichtung zu einer Decodiereinrichtung gesendet wird.
  • 9b veranschaulicht eine decodiereinrichtungsseitige Implementierung der Verwendung des Pegelparameters. Der Pegelparameter sowie auch das Abwärtsmischsignal werden in den Pegelkorrektureinrichtungsblock 902 eingegeben. Die Pegelkorrektureinrichtung korrigiert den Kanal auf einer einzigen Basis oder die Kanäle auf mehreren Basen abhängig von dem Pegelparameter. Da der zusätzliche Parameter rM ein relativer Wert ist, wird dieser relative Wert mit der Energie des entsprechenden Basiskanals multipliziert.
  • Auch wenn 9a und 9b eine Situation anzeigen, in der die Pegelkorrektur auf den Abwärtsmischkanal oder die Abwärtsmischkanäle angewendet wird, kann der Pegelparameter auch in die Aufwärtsmischmatrix integriert werden. Dazu wird jedes Vorkommen von M in den Gleichungen in 8 durch den Term „rM M" ersetzt.
  • In Betrachtung des Falls, wenn 5.1 Kanäle aus zwei Kanälen wiedererzeugt werden, wird die folgende Beobachtung gemacht.
  • Wenn die vorliegende Erfindung mit einem zugrundeliegenden Audiocodec, wie er in 2 und 3 205 und 203 skizziert ist, verwendet wird, muss noch mehr berücksichtigt werden. Betrachtet man die IID-Parameter, wie sie im Vorhergehenden definiert sind, wobei r1 gemäß
    Figure 00390001
    definiert wurde, ist dieser Parameter implizit decodiereinrichtungsseitig verfügbar, da das System. 5.1 Kanäle aus zwei Kanälen wiedererzeugt, vorausgesetzt, dass die zwei übertragenen Kanäle die Stereoabwärtsmischung der Surroundkanäle sind.
  • Jedoch modifiziert der Audiocodec, der mit einer Bitratenbeschränkung wirksam ist, die spektrale Verteilung unter Umständen derart, dass die Energien L und R, wie sie auf der Decodiereinrichtung gemessen werden, sich von ihren Werten auf Seiten der Codiereinrichtung unterscheiden.
  • Gemäß der vorliegenden Erfindung verschwindet ein derartiger Einfluss auf die Energieverteilung der wiedererzeugten Kanäle durch Übertragen des Parameters r1 = BD auch für den Fall, dass 5.1 Kanäle aus zwei Kanälen rückgewonnen werden.
  • Wird eine Signalisierungseinrichtung bereitgestellt, kann die Codiereinrichtung das vorliegende Signalsegment unter Verwendung unterschiedlicher Parametersätze codieren und den Satz von IID-Parametern wählen, der mit dem niedrigsten Mehraufwand für das bestimmte verarbeitete Signalsegment verbunden ist. Es ist möglich, dass die Energiepegel zwischen dem rechten vorderen und hinteren Kanal ähnlich sind und dass die Energiepegel zwischen dem vorderen und hinteren linken Kanal ähnlich sind, sich jedoch beträchtlich von den Pegeln in dem rechten vorderen und hinteren Kanal unterscheiden. Angesichts einer Deltacodierung von Parametern und einer nachfolgenden Entropiecodierung kann es unter Umständen wirksamer sein, statt den Parametern r3 und r4 die Parameter q3 und q4 zu verwenden. Für ein anderes Signalsegment mit unterschiedlichen Charakteristika kann ein anderer Parametersatz unter Umständen einen niedrigeren Bitratenmehraufwand bereitstellen. Die vorliegende Erfindung ermöglicht es, frei zwischen unterschiedlichen Parameterdarstellungen hin- und herzuschalten, um den Bitratenmehraufwand für das aktuell codierte Signalsegment angesichts der Charakteristika des Signalsegments zu minimieren. Die Fähigkeit, zwischen unterschiedlichen Parametrisierungen der IID-Parameter hin- und herzuschalten, um einen möglichst niedrigen Bitratenmehraufwand zu erhalten, und eine Signalisierungseinrichtung bereitzustellen, um anzuzeigen, welche Parametrisierung aktuell verwendet wird, ist ein wesentliches Merkmal der vorliegenden Erfindung.
  • Ferner kann die Deltacodierung der Parameter entweder in der Frequenzrichtung oder in der Zeitrichtung durchgeführt werden, sowie auch eine Deltacodierung zwischen unterschiedlichen Parametern. Gemäß der vorliegenden Erfindung kann ein Parameter bezüglich eines beliebigen anderen Parameters deltacodiert werden, wenn gegeben ist, dass eine Signalisierungseinrichtung bereitgestellt ist, die die bestimmte verwendete Deltacodierung anzeigt.
  • Ein interessantes Merkmal für jedes beliebige Codierschema ist die Fähigkeit, eine skalierbare Codierung durchzuführen. Dies bedeutet, dass der codierte Bitstrom in mehrere verschiedene Schichten aufgeteilt werden kann. Die Kernschicht ist durch sich selbst decodierbar, und die höheren Schichten können decodiert werden, um das decodierte Kernschichtsignal zu verbessern. Die Anzahl von verfügbaren Schichten kann für unterschiedliche Bedingungen variieren, solange jedoch die Kernschicht verfügbar ist, kann die Decodiereinrichtung Ausgangsabtastwerte erzeugen. Die Parametrisierung für die Mehrkanalcodierung, wie sie im Vorhergehenden unter Verwendung der Parameter r1 bis r5 umrissen ist, ist sehr gut für eine skalierbare Codierung geeignet. Somit ist es möglich, die Daten für z. B. die zwei Surroundkanäle (A und E) in einer Verbesserungsschicht zu speichern, d. h., die Parameter r3 und r4 und die den vorderen Kanälen in einer Kernschicht entsprechenden Parameter, dargestellt durch die Parameter r1 und r2.
  • In 10 wird eine skalierbare Bitstromimplementierung gemäß der vorliegenden Erfindung behandelt. Die Bitstromschichten sind durch 1001 und 1002 veranschaulicht, wobei 1001 die Kernschicht ist, die die signalverlaufcodierten Abwärtsmischsignale sowie auch die Parameter r1 und r2, die erforderlich sind, um die vorderen Kanäle (102, 103 und 104) wiederzuerzeugen, fasst. Die Verbesserungsschicht, die durch 1002 veranschaulicht ist, fasst die Parameter zum Wiedererzeugen der hinteren Kanäle (101 und 105).
  • Ein weiterer wichtiger Aspekt der vorliegenden Erfindung ist die Verwendung von Dekorrelatoren in einer Mehrkanalkonfiguration. Das Konzept eines Verwendens eines Dekorrelators wurde in dem Dokument PCT/SE02/01372 für den Fall eines Kanals auf zwei Kanäle ausgearbeitet. Wird diese Theorie jedoch auf mehr als zwei Kanäle erweitert, ergeben sich verschiedene Probleme, die die vorliegende Erfindung löst.
  • Elementarmathematik zeigt, dass, um M gegeneinander dekorrelierte Signale aus N Signalen zu erhalten, M-N Dekorrelatoren erforderlich sind, wobei alle unterschiedlichen Dekorrelatoren Funktionen sind, die gegeneinander orthogonale Ausgangssignale aus einem gemeinsamen Eingangssignal erzeugen. Ein Dekorrelator ist in der Regel ein Allpass- oder Fast-Allpassfilter, das angesichtseiner Eingabe x(t) eine Ausgabe y(t) mit E[|y|2] = E[|x|2] und einer fast verschwindenden Kreuzkorrelation E[yx*] erzeugt. Weitere wahrnehmbare Kriterien werden in den Entwurf eines guten Dekorrelators aufgenommen, und es kommen beispielsweise auch Entwurfsverfahren vor, die auch den Kammfiltercharakter minimieren, wenn das ursprüngliche Signal zu dem dekorrelierten Signal addiert wird, und die den Effekt einer manchmal zu langen Pulsantwort bei Übergangssignalen minimieren. Manche Dekorrelatoren des Stands der Technik verwenden eine künstliche Halleinrichtung zum Dekorrelieren. Der Stand der Technik umfasst auch Teilverzögerungen, z. B. durch Modifizieren der Phase der komplexen Teilbandabtastwerte, um eine höhere Echodichte und damit mehr Zeitdiffusion zu erreichen.
  • Die vorliegende Erfindung schlägt Verfahren zum Modifizieren eines auf einem Dekorrelator basierenden Halls vor, um mehrere Dekorrelatoren zu erhalten, die gegeneinander dekorrelierte Ausgangssignale aus einem gemeinsamen Eingangssignal erzeugen. Zwei Dekorrelatoren sind gegeneinan der dekorreliert, wenn ihre Ausgaben y1(t) und y2(t) angesichts derselben Eingabe eine verschwindende oder fast verschwindende Kreuzkorrelation aufweisen. Angenommen, die Eingabe ist ein stationäres weißes Rauschen, dann folgt daraus, dass die Pulsantworten h1 und h2 in dem Sinne, dass E[h1h2 *] verschwindend oder fast verschwindend ist, orthogonal sein müssen. Sätze paarweiser gegeneinander dekorrelierter Dekorrelatoren können auf verschiedenen Wegen hergestellt werden. Eine effiziente Art, derartige Modifizierungen durchzuführen, ist es, den Phasenrotationsfaktor q, der Teil der Teilverzögerung ist, zu verändern.
  • Die vorliegende Erfindung gibt vor, dass die Phasenrotationsfaktoren Teil der Verzögerungsleitungen in den Allpassfiltern oder lediglich eine Gesamtteilverzögerung sein können. In dem letzteren Fall ist dieses Verfahren nicht auf Allpassfilter oder hallmäßige Filter beschränkt, sondern kann auch beispielsweise auf einfache Verzögerungen einschließlich eines Teilverzögerungsteils angewendet werden. Eine Allpassfilterverknüpfung in dem Dekorrelator kann in dem Z-Bereich wie folgt beschrieben sein:
    Figure 00430001
    wobei q der komplexwertige Phasenrotationsfaktor (|q| = 1) ist, m die Verzögerungsleitungslänge bei Abtastwerten und a der Filterkoeffizient ist. Aus Gründen der Stabilität muss der Betrag des Filterkoeffizienten auf |a| < 1 beschränkt sein. Jedoch wird, unter Verwendung des alternativen Filterkoeffizienten a' = –a eine neue Halleinrichtung definiert, der dieselben Hallverfallseigenschaften aufweist, jedoch mit einer Ausgabe, die bezüglich der Ausgabe aus der nicht modifizierten Halleinrichtung beträchtlich unkorreliert ist. Ferner kann eine Modifizierung des Phasenrotationsfaktors q beispielsweise durch Addieren eines konstanten Phasenversatzes, q' = qejc, durchgeführt werden. Die Konstan te C kann als ein konstanter Phasenversatz verwendet werden oder könnte so skaliert werden, dass sie einem konstanten Zeitversatz für sämtliche Frequenzbänder, auf die sie angelegt wird, entspräche. Die Phasenversatzkonstante C kann auch ein zufälliger Wert sein, der sich für alle Frequenzbänder unterscheidet.
  • Gemäß der vorliegenden Erfindung wird die Erzeugung von n Kanälen aus m Kanälen durch Anwendung einer Aufwärtsmischmatrix H der Größe n × (m + p) auf einen Spaltenvektor einer Größe (m + p) × 1 von Signalen y = [ms ]durchgeführt, wobei m die m abwärtsgemischten und codierten Signale sind, und die p-Signale in s sowohl gegeneinander dekorreliert als auch von allen Signalen in m dekorreliert sind. Diese dekorrelierten Signale werden aus den Signalen in m durch Dekorrelatoren erzeugt. Die n rückgewonnenen Signale a',b', ... sind anschließend in dem Spaltenvektor x' = Hyenthalten.
  • Das im Vorhergehenden Erläuterte ist durch 11 veranschaulicht, in der die dekorrelierten Signale durch die Dekorrelatoren 1102, 1103 und 1104 erzeugt werden. Die Aufwärtsmischmatrix H ist dadurch gegeben, dass 1101 an dem Vektor y wirksam ist, was das Ausgangssignal x' ergibt.
  • Angenommen, R = E[xx*] ist die Korrelationsmatrix des ursprünglichen Signalvektors, so sei R' = E[x'x'*] die Korrelationsmatrix des rückgewonnenen Signals. Hier und in dem Nachfolgenden bezeichnet X* für eine Matrix oder einen Vektor X mit komplexen Eingaben die adjungierte Matrix, die komplexe konjugierte Transponierte von X.
  • Die Diagonale von R enthält die Energiewerte A,B,C, ... und kann bis zu einem Gesamtenergiepegel aus den im Vorhergehenden definierten Energieanteilen decodiert werden. Da R* = R gilt, gibt es lediglich n(n – 1)/2 unterschiedliche Nicht-Diagonal-Kreuzkorrelationswerte, die Informationen enthalten, die durch Einstellen der Aufwärtsmischmatrix H vollständig oder teilweise rückgewonnen werden sollen. Eine Rückgewinnung der gesamten Korrelationsstruktur entspricht dem Fall R' = R. Eine Rückgewinnung korrekter Energiepegel entspricht nur dem Fall, dass R' und R gleich ihren Diagonalen sind.
  • In dem Fall von n Kanälen aus m = 1 Kanal wird die Rückgewinnung der gesamten Korrelationsstruktur durch Verwendung von p = n – 1 gegeneinander dekorrelierten Dekorrelatoren eine Aufwärtsmischmatrix H, die die Bedingung HH* = 1 / MR erfüllt, wobei M die Energie des einzelnen gesendeten Signals ist. Da R positiv semidefinit ist, ist es allgemein bekannt, dass eine derartige Lösung existiert. Darüber hinaus sind n(n – 1)/2 Freiheitsgrade für den Entwurf von H übrig, die in der vorliegenden Erfindung verwendet werden, um weitere erwünschte Eigenschaften der Aufwärtsmischmatrix zu erhalten. Ein zentrales Entwurfskriterium ist, dass die Abhängigkeit von H von den übertragenen Korrelationsdaten gleichmäßig sein soll.
  • Eine zweckmäßige Art und Weise zum Parametrisieren der Aufwärtsmischmatrix ist H = UDV, wobei U und V orthogonale Matrizen sind und D eine diagonale Matrix ist. Die Quadrate der Absolutwerte von D können gleich den Eigenwerten von R/M gewählt sein. Wird V weggelassen und werden die Eigenwerte derart sortiert, dass der größte Wert auf die erste Koordinate angewendet wird, so wird die Gesamtenergie der dekorrelierten Signale in der Ausgabe minimiert. Die orthogonale Matrix U ist in dem realen Fall durch n(n – 1)/2 Rotationswinkel parametrisiert. Eine Übertragung von Korrelationsdaten in der Form dieser Winkel und der n Diagonalwerte von D würde unmittelbar die erwünschte gleichmäßige Abhängigkeit von H ergeben. Da jedoch die Energiedaten in Eigenwerte umgewandelt werden müssen, wird durch diesen Ansatz auf eine Skalierbarkeit verzichtet.
  • Ein zweites durch die vorliegende Erfindung gelehrtes Verfahren besteht in einer Trennen des Energieteils von dem Korrelationsteil in R durch Definieren einer normierten Korrelationsmatrix R0 durch R = GR0G, wobei G eine diagonale Matrix mit den diagonalen Werten gleich den Quadratwurzeln der diagonalen Einträge von R ist, d. h.,..., A, √B und R0 weist Einsen auf der Diagonalen auf. H0 sei eine orthogonale Aufwärtsmischmatrix, die die bevorzugte normierte Aufwärtsmischung in dem Fall vollständig unkorrelierter Signale gleicher Energie definiert. Beispiele derartiger bevorzugter Aufwärtsmischmatrizen sind
    Figure 00460001
  • Die Aufwärtsmischung wird dann durch H = GSH0/√M definiert, wobei die Matrix S SS* = R0 löst. Die Abhängigkeit dieser Lösung von den normierten Kreuzkorrelationswerten in R0 wird so gewählt, dass sie kontinuierlich ist und dass S gleich der Identitätsmatrix I in dem Fall R0 = I ist.
  • Werden die n Kanäle in Gruppen von weniger Kanälen unterteilt, ist dies eine günstige Art und Weise, um eine teil weise Kreuzkorrelationsstruktur rückzugewinnen. Gemäß der vorliegenden Erfindung ist eine besonders vorteilhafte Gruppierung für den Fall von 5.1 Kanälen aus einem Kanal {a,e}, {c}, {b,d}, {f}, wobei für die Gruppen {c},{f} keine Dekorrelation angewendet wird und die Gruppen {a,e}, {b,d} durch eine Aufwärtsmischung desselben abwärtsgemischten/dekorrelierten Paars erzeugt werden. Für diese zwei Teilsysteme müssen die bevorzugten normierten Aufwärtsmischungen in dem vollständig unkorrelierten Fall jeweils wie folgt gewählt werden:
    Figure 00470001
  • Somit werden lediglich zwei der Gesamtheit von 15 Kreuzkorrelationen übertragen und rückgewonnen, nämlich diese zwischen Kanälen {a,e} und {b,d}. In der im Vorhergehenden verwendeten Terminologie ist dies ein Beispiel für einen Entwurf für den Fall n = 6, m = 1 und p = 1. Die Aufwärtsmischmatrix H weist die Größe 6 × 2 auf, wobei Nullen in den zwei Einträgen in der zweiten Spalte in den Zeilen 3 und 6 Ausgaben c' und f' entsprechen.
  • Ein dritter durch die vorliegende Erfindung gelehrter Ansatz zum Aufnehmen von dekorrelierten Signalen ist der einfachere Standpunkt, dass jeder Ausgangskanal einen anderen Dekorrelator aufweist, was zu dekorrelierten Signalen sa, sb, ... führt. Die rückgewonnenen Signale werden dann wie a' = √A/M(m cosφa + sa sinφa), b' = √B/M(m cos φb + sb sin φb),usw.
    gebildet.
  • Die Parameter φa, φb, ... steuern die in den Ausgangskanälen a', b', ... vorliegende Menge an dekorreliertem Signal. Die Korrelationsdaten werden in Form dieser Winkel übertragen. Es kann ohne weiteres berechnet werden, dass die sich ergebende normierte Kreuzkorrelation zwischen beispielsweise Kanal a' und b' gleich des Produkts cosφacosφb ist. Da die Anzahl paarweiser Kreuzkorrelationen n(n – 1)/2 ist und n Dekorrelatoren vorhanden sind, ist es im Allgemeinen nicht möglich, mit diesem Ansatz einer gegebenen Korrelationsstruktur zu entsprechen, falls n > 3, die Vorteile liegen jedoch in einem sehr einfachen und stabilen Decodierungsverfahren und in der direkten Steuerung bezüglich der erzeugten Menge an dekorreliertem Signal, die in jedem Ausgangssignal vorliegt. Dies macht es möglich, dass das Mischen dekorrelierter Signale auf wahrnehmbaren Kriterien basiert, die z. B. Energiepegeldifferenzen von Kanalpaaren aufnehmen.
  • Für den Fall von n Kanälen aus m > 1 Kanälen kann die Korrelationsmatrix Ry = E[yy*] nicht mehr länger als diagonal betrachtet werden, und dies muss bei dem Anpassen von R' = HRyH* auf das Ziel R berücksichtigt werden. Eine Vereinfachung findet statt, da Ry die Blockmatrixstruktur
    Figure 00480001
    aufweist, wobei Rm = E [mm*] und Rs = E[ss*]. Ferner ist die Matrix Rs unter Annahme von gegeneinander dekorrelierten Dekorrelatoren diagonal. Es sei darauf hingewiesen, dass sich dies auch auf den Aufwärtsmischentwurf hinsichtlich der Rückgewinnung korrekter Energien auswirkt. Die Lösung ist es, Informationen über die Korrelationsstruktur Rm der abwärtsgemischten Signale in der Decodiereinrichtung zu berechnen oder von der Codiereinrichtung zu übertragen.
  • Für den Fall von 5.1 Kanälen aus zwei Kanälen ist
    Figure 00490001
    ein bevorzugtes Verfahren für die Aufwärtsmischung, wobei s1 aus einer Dekorrelation von m1 = ld erhalten wird und s2 aus einer Dekorrelation von m2 = rd erhalten wird.
  • Hier werden die Gruppen {a,b} und {d,e} als getrennte 1→2-Kanalsysteme behandelt, wobei die paarweisen Kreuzkorrelationen berücksichtigt werden. Für die Kanäle c und f müssen die Gewichtungen derart eingestellt werden, dass
    Figure 00490002
    gilt.
  • Die vorliegende Erfindung kann sowohl in Hardwarechips als auch DSPs, für verschiedene Arten von Systemen, zur Speicherung und Übertragung von Signalen, analog oder digital, unter Verwendung willkürlich gewählter Codecs implementiert werden. 2 und 3 zeigen eine mögliche Implementierung der vorliegenden Erfindung. In diesem Beispiel ist ein System, das an sechs Eingangssignalen (einer 5.1-Kanalkonfiguration) wirksam ist, gezeigt. In 2 ist codiereinrichtungsseitig gezeigt, wie die analogen Eingangssignale für die getrennten Kanäle in ein digitales Signal 201 umgewandelt und unter Verwendung einer Filter bank für jeden Kanal 202 analysiert werden. Die Ausgabe aus den Filterbänken wird in die Surroundcodiereinrichtung 203 gespeist, die einen Parametererzeuger umfasst, der eine Abwärtsmischung durchführt, die den bzw. die durch die Audiocodiereinrichtung 205 codierten einen oder zwei Kanäle erzeugt. Ferner werden die Surroundparameter wie z. B. die IID- und ICC-Parameter gemäß der vorliegenden Erfindung extrahiert, und es werden Steuerdaten, die das Zeitfrequenzgitter der Daten skizzieren, sowie auch skizzieren, welche Parametrisierung verwendet wird, gemäß der vorliegenden Erfindung extrahiert 204. Die extrahierten Parameter werden codiert 206, wie es durch die vorliegende Erfindung gelehrt wird, indem entweder zwischen unterschiedlichen Parametrisierungen umgeschaltet wird oder die Parameter in einer skalierbaren Art und Weise angeordnet werden. Die Surroundparameter 207, Steuersignale und die codierten abwärtsgemischten Signale 208 werden in einen seriellen Bitstrom gemultiplext 209.
  • In 3 ist eine typische Decodiereinrichtungsimplementierung, d. h. eine Vorrichtung zum Erzeugen einer Mehrkanalrückgewinnung, gezeigt. Es wird angenommen, dass die Audiodecodiereinrichtung ein Signal in einer Frequenzbereichsdarstellung ausgibt, z. B. die Ausgabe von der Hocheffizienz-AAC-Decodiereinrichtung MPEG-4 vor der Filterbank zur QMF-Synthese. Der serielle Bitstrom wird gedemultiplext 301, und die codierten Surrounddaten werden in die Surrounddatendecodiereinrichtung 303 gespeist, und die abwärtsgemischten codierten Kanäle werden in die Audiodecodiereinrichtung 302 gespeist, in diesem Beispiel eine Hocheffizienz-AAC-Decodiereinrichtung MPEG-4. Die Surrounddatendecodiereinrichtung decodiert die Surrounddaten und speist dieselben in die Surrounddecodiereinrichtung 305, die einen Aufwärtsmischer umfasst, der sechs Kanäle basierend auf den decodierten abwärtsgemischten Kanälen und die Surrounddaten und die Steuersignale wiedererzeugt. Die Frequenzbereichsausgabe aus der Surrounddecodiereinrichtung wird zu Zeitbereichssignalen synthetisiert 306, die nach folgend durch den DAC 307 in analoge Signale umgewandelt werden.
  • Auch wenn die vorliegende Erfindung hauptsächlich mit Bezug auf die Erzeugung und Verwendung von Ausgleichsparametern beschrieben wurde, sei darauf hingewiesen, dass vorzugsweise dieselbe Gruppierung von Kanalpaaren zum Ableiten von Ausgleichsparametern auch zum Berechnen von Zwischen-Kanal-Kohärenzparametern oder „Breiten"-Parametern zwischen diesen zwei Kanalpaaren verwendet wird. Zusätzlich können Zwischen-Kanal-Zeitdifferenzen oder eine Art von „Phasen-Cues" auch unter Verwendung derselben Kanalpaare, die für die Ausgleichsparameterberechnung verwendet werden, abgeleitet werden. Empfängerseitig können diese Parameter zusätzlich oder als eine Alternative zu den Ausgleichsparametern verwendet werden, um eine Mehrkanalrückgewinnung zu erzeugen. Alternativ können die Zwischen-Kanal-Kohärenzparameter oder sogar die Zwischen-Kanal-Zeitdifferenzen auch zusätzlich zu anderen Zwischen-Kanal-Pegeldifferenzen, die durch andere Referenzkanäle bestimmt werden, verwendet werden. Hinsichtlich des Skalierbarkeitsmerkmals der vorliegenden Erfindung, wie es in Verbindung mit 10a und 10b erörtert wurde, ist es jedoch bevorzugt, dieselben Kanalpaare für alle Parameter zu verwenden, so dass in einem skalierbaren Bitstrom jede Skalierungsschicht sämtliche Parameter zum Rückgewinnen der Teilgruppe von Ausgangskanälen, die durch die jeweilige Skalierungsschicht, wie es in der vorletzten Spalte der Tabelle in 10b skizziert ist, erzeugt werden kann, umfasst. Die vorliegende Erfindung ist nützlich, wenn lediglich die Kohärenzparameter oder die Zeitdifferenzparameter zwischen den jeweiligen Kanalpaaren berechnet und an eine Decodiereinrichtung übertragen werden. In diesem Fall bestehen die Pegelparameter bereits in der Decodiereinrichtung zur Verwendung, wenn eine Mehrkanalrückgewinnung durchgeführt wird.
  • Abhängig von gewissen Implementierungsanforderungen der erfindungsgemäßen Verfahren können die erfindungsgemäßen Verfahren in Hardware oder in Software implementiert sein. Die Implementierung kann unter Verwendung eines digitalen Speicherungsmediums, im Besonderen einer Platte oder einer CD mit darauf gespeicherten elektronisch lesbaren Steuersignalen, die mit einem programmierbaren Computersystem derart zusammenwirken, dass die erfindungsgemäßen Verfahren durchgeführt werden, durchgeführt werden. Im Allgemeinen ist die vorliegende Erfindung daher ein Computerprogrammprodukt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode, der zum Durchführen der erfindungsgemäßen Verfahren wirksam ist, wenn das Computerprogramm auf einem Computer abläuft. Mit anderen Worten, die erfindungsgemäßen Verfahren sind daher ein Computerprogramm mit einem Programmcode zum Durchführen zumindest eines der erfindungsgemäßen Verfahren, wenn das Computerprogramm auf einem Computer abläuft.

Claims (13)

  1. Vorrichtung zum Erzeugen eines Pegelparameters in einer Parameterdarstellung eines Mehrkanalsignals mit mehreren ursprünglichen Kanälen, wobei die Parameterdarstellung einen Parametersatz aufweist, der, wenn er zusammen mit zumindest einem Abwärtsmischkanal verwendet wird, eine Mehrkanalrückgewinnung erlaubt, wobei die Vorrichtung folgende Merkmale aufweist: eine Pegelparameterberechnungseinrichtung (900) zum Berechnen eines Pegelparameters (rM), wobei der Pegelparameter derart berechnet wird, dass eine Energie des zumindest einen Abwärtsmischkanals, gewichtet durch den Pegelparameter, gleich einer Summe von Energien der ursprünglichen Kanäle ist; und eine Ausgabeschnittstelle zum Erzeugen von Ausgabedaten, die den Pegelparameter und den Parametersatz oder den Pegelparameter und den zumindest einen Abwärtsmischkanal umfassen.
  2. Vorrichtung gemäß Anspruch 1, bei der die Pegelparameterberechnungseinrichtung (900) wirksam ist, um als den Pegelparameter ein Maß eines Verhältnisses zwischen einer Summe von Energien der ursprünglichen Kanäle und einer Energie des zumindest einen Abwärtsmischkanals zu berechnen.
  3. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Parameterdarstellung einen Parametersatz für jedes einer Anzahl von Frequenzbändern des zumindest einen Abwärtsmischkanals umfasst, und bei dem die Parameterberechnungseinrichtung (900) wirksam ist, um einen Pegelparameter für jedes der Frequenzbänder zu berechnen.
  4. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Parameterdarstellung einen Parametersatz für eine Zeitperiode in einer Sequenz von Zeitperioden des zumindest einen Abwärtsmischkanals umfasst, und bei der die Pegelparameterberechnungseinrichtung (900) wirksam ist, um einen Pegelparameter für jede Zeitperiode in einer Sequenz von Zeitperioden des zumindest einen Abwärtsmischkanals zu berechnen.
  5. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Ausgabeschnittstelle wirksam ist, um einen skalierbaren Datenstrom zu erzeugen, der, in einer niedrigeren Skalierungsschicht, eine erste Teilgruppe von Parametern des Parametersatzes, die eine Rückgewinnung der ersten Teilgruppe von Ausgabekanälen erlaubt, umfasst, der, in einer höheren Skalierungsschicht, eine zweite Teilgruppe von Parametern des Parametersatzes, die, zusammen mit der ersten Teilgruppe, eine Rückgewinnung einer zweiten Teilgruppe von Ausgabekanälen erlaubt, umfasst, und bei der die Ausgabeschnittstelle ferner wirksam ist, um den Pegelparameter in die niedrigere Skalierungsschicht einzugeben.
  6. Vorrichtung gemäß einem der vorhergehenden Ansprüche, die ferner einen Parametergenerator aufweist, der gebildet ist, um, als einen ersten Ausgleichsparameter einen Links-/Rechtsausgleichsparameter, als einen zweiten Ausgleichsparameter einen Mittenausgleichsparameter, als einen dritten Ausgleichsparameter einen Vorder-/Rückausgleichsparameter, als einen vierten Ausgleichsparameter einen Links-/Rechtshintenausgleichsparameter und als einen fünften Ausgleichsparameter einen Niedrigfrequenzhervorhebungsausgleichsparameter zu erzeugen.
  7. Vorrichtung zum Erzeugen einer rückgewonnenen Mehrkanaldarstellung eines ursprünglichen Mehrkanalsignals mit zumindest drei ursprünglichen Kanälen unter Verwendung einer Parameterdarstellung mit einem Parametersatz, der, wenn er zusammen mit zumindest einem Abwärtsmischkanal verwendet wird, eine Mehrkanalrückgewinnung erlaubt, wobei die Parameterdarstellung einen Pegelparameter umfasst, wobei der Pegelparameter derart berechnet wird, dass eine Energie des zumindest einen Abwärtsmischkanals, gewichtet durch den Pegelparameter, gleich einer Summe von Energien der ursprünglichen Kanäle ist, wobei die Vorrichtung folgende Merkmale aufweist: eine Pegelkorrigiereinrichtung (902) zum Anwenden einer Pegelkorrektur des zumindest einen Abwärtsmischkanals unter Verwendung des Pegelparameters, so dass eine korrigierte Mehrkanalrückgewinnung durch Aufwärtsmischen unter Verwendung von Parametern in dem Parametersatz gewonnen werden kann.
  8. Vorrichtung gemäß Anspruch 7, bei der der Pegelparameter ein Verhältnis zwischen Energien von Kanälen ist, und bei der die Pegelkorrigiereinrichtung (902) wirksam ist, um den zumindest einen Abwärtsmischkanal unter Verwendung des Pegelparameters zu gewichten.
  9. Verfahren zum Erzeugen eines Pegelparameters in einer Parameterdarstellung eines Mehrkanalsignals mit mehreren ursprünglichen Kanälen, wobei die Parameterdarstellung einen Parametersatz aufweist, der, wenn er zusammen mit zumindest einem Abwärtsmischkanal verwen det wird, eine Mehrkanalrückgewinnung erlaubt, wobei das Verfahren folgende Schritte aufweist: Berechnen (900) eines Pegelparameters (rM), wobei der Pegelparameter derart berechnet wird, dass eine Energie des zumindest einen Abwärtsmischkanals, gewichtet durch den Pegelparameter, gleich einer Summe von Energien der ursprünglichen Kanäle ist; und Erzeugen von Ausgabedaten, die den Pegelparameter und den Parametersatz oder den Pegelparameter und den zumindest einen Abwärtsmischkanal umfassen.
  10. Verfahren zum Erzeugen einer rückgewonnenen Mehrkanaldarstellung eines ursprünglichen Mehrkanalsignals mit zumindest drei ursprünglichen Kanälen unter Verwendung einer Parameterdarstellung mit einem Parametersatz, der, wenn er zusammen mit zumindest einem Abwärtsmischkanal verwendet wird, eine Mehrkanalrückgewinnung erlaubt, wobei die Parameterdarstellung einen Pegelparameter umfasst, wobei der Pegelparameter derart berechnet wird, dass eine Energie des zumindest einen Abwärtsmischkanals, gewichtet durch den Pegelparameter, gleich einer Summe von Energien der ursprünglichen Kanäle ist, wobei das Verfahren folgende Schritte aufweist: Anwenden (902) einer Pegelkorrektur des zumindest einen Abwärtsmischkanals unter Verwendung des Pegelparameters, so dass eine korrigierte Mehrkanalrückgewinnung durch Aufwärtsmischen unter Verwendung von Parametern in dem Parametersatz gewonnen wird.
  11. Computerprogramm mit maschinenlesbaren Befehlen, das angepasst ist, um ein Verfahren gemäß Anspruch 9 oder 10 durchzuführen, wenn es auf einem Computer abläuft.
  12. Parameterdarstellung mit einem Parametersatz, der, wenn er zusammen mit zumindest einem Abwärtsmischkanal verwendet wird, eine Mehrkanalrückgewinnung erlaubt, wobei die Parameterdarstellung einen Pegelparameter umfasst, wobei der Pegelparameter derart berechnet wird, dass eine Energie des zumindest einen Abwärtsmischkanals, gewichtet durch den Pegelparameter, gleich einer Summe von Energien der ursprünglichen Kanäle ist.
  13. Parameterdarstellung gemäß Anspruch 12 zum Steuern einer Mehrkanalrückgewinnung, wenn sie in eine Vorrichtung gemäß Anspruch 7 eingegeben wird.
DE602005002451T 2004-04-16 2005-04-12 Vorrichtung und verfahren zur erzeugung eines pegelparameters und vorrichtung und verfahren zur erzeugung einer mehrkanal-repräsentation Active DE602005002451T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0400998 2004-04-16
SE0400998A SE0400998D0 (sv) 2004-04-16 2004-04-16 Method for representing multi-channel audio signals
PCT/EP2005/003848 WO2005101370A1 (en) 2004-04-16 2005-04-12 Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation

Publications (2)

Publication Number Publication Date
DE602005002451D1 DE602005002451D1 (de) 2007-10-25
DE602005002451T2 true DE602005002451T2 (de) 2008-06-12

Family

ID=32294334

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602005002942T Active DE602005002942T2 (de) 2004-04-16 2005-04-12 Verfahren zur darstellung von mehrkanal-audiosignalen
DE602005002451T Active DE602005002451T2 (de) 2004-04-16 2005-04-12 Vorrichtung und verfahren zur erzeugung eines pegelparameters und vorrichtung und verfahren zur erzeugung einer mehrkanal-repräsentation

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE602005002942T Active DE602005002942T2 (de) 2004-04-16 2005-04-12 Verfahren zur darstellung von mehrkanal-audiosignalen

Country Status (13)

Country Link
US (24) US8223976B2 (de)
EP (2) EP1695338B1 (de)
JP (4) JP4589962B2 (de)
KR (2) KR100848367B1 (de)
CN (4) CN102157155B (de)
AT (2) ATE373301T1 (de)
DE (2) DE602005002942T2 (de)
ES (2) ES2293578T3 (de)
HK (3) HK1093594A1 (de)
PL (2) PL1695338T3 (de)
SE (1) SE0400998D0 (de)
TW (1) TWI334736B (de)
WO (2) WO2005101371A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11393481B2 (en) 2013-10-22 2022-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Families Citing this family (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002050782A2 (en) * 2000-12-19 2002-06-27 Azoteq (Pty) Ltd Method of and apparatus for transferring data
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
KR101205480B1 (ko) * 2004-07-14 2012-11-28 돌비 인터네셔널 에이비 오디오 채널 변환
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1691348A1 (de) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametrische kombinierte Kodierung von Audio-Quellen
EP1866911B1 (de) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Skalierbare mehrkanal-audiokodierung
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
EP1866912B1 (de) * 2005-03-30 2010-07-07 Koninklijke Philips Electronics N.V. Mehrkanal-audiocodierung
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US20080262853A1 (en) 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US7929709B2 (en) * 2005-12-28 2011-04-19 Yamaha Corporation Sound image localization apparatus
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
JP4806031B2 (ja) 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
CN101410891A (zh) 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
KR100983286B1 (ko) 2006-02-07 2010-09-24 엘지전자 주식회사 부호화/복호화 장치 및 방법
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
PL1994526T3 (pl) * 2006-03-13 2010-03-31 France Telecom Połączona synteza i uprzestrzennienie dźwięków
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
CN102394063B (zh) * 2006-07-04 2013-03-20 韩国电子通信研究院 运动图像专家组环绕解码器和恢复多通道音频信号的方法
ES2396072T3 (es) 2006-07-07 2013-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para combinar múltiples fuentes de audio paramétricamente codificadas
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
EP2070392A2 (de) * 2006-09-14 2009-06-17 Koninklijke Philips Electronics N.V. Sweetspot-manipulation für ein mehrkanalsignal
JP4946305B2 (ja) * 2006-09-22 2012-06-06 ソニー株式会社 音響再生システム、音響再生装置および音響再生方法
MX2008012251A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
EP2105019A2 (de) * 2006-09-29 2009-09-30 Avinity Systems B.V. Verfahren zum streaming paralleler benutzersitzungen, system und computersoftware
WO2008039038A1 (en) 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
EP2102858A4 (de) 2006-12-07 2010-01-20 Lg Electronics Inc Verfahren und vorrichtung zum verarbeiten eines audiosignals
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
WO2008088772A2 (en) * 2007-01-12 2008-07-24 Ictv, Inc. Mpeg objects and systems and methods for using mpeg objects
CN101647060A (zh) * 2007-02-13 2010-02-10 Lg电子株式会社 处理音频信号的方法和装置
JP5161893B2 (ja) * 2007-03-16 2013-03-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
CN103299363B (zh) 2007-06-08 2015-07-08 Lg电子株式会社 用于处理音频信号的方法和装置
US8806324B2 (en) * 2007-08-03 2014-08-12 Sap Ag Annotation data filtering of computer files
US8295494B2 (en) 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
GB2467247B (en) * 2007-10-04 2012-02-29 Creative Tech Ltd Phase-amplitude 3-D stereo encoder and decoder
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
JPWO2009050896A1 (ja) * 2007-10-16 2011-02-24 パナソニック株式会社 ストリーム合成装置、復号装置、方法
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2215629A1 (de) * 2007-11-27 2010-08-11 Nokia Corporation Mehrkanalige audiocodierung
US8204235B2 (en) * 2007-11-30 2012-06-19 Pioneer Corporation Center channel positioning apparatus
WO2009093866A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
CN102027535A (zh) * 2008-04-11 2011-04-20 诺基亚公司 信号处理
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
CN102099854B (zh) * 2008-07-15 2012-11-28 Lg电子株式会社 处理音频信号的方法和装置
TWI496479B (zh) 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
EP2175670A1 (de) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaurale Aufbereitung eines Mehrkanal-Audiosignals
US9330671B2 (en) 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
DE102008056704B4 (de) * 2008-11-11 2010-11-04 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
EP2378515B1 (de) * 2009-01-13 2013-09-25 Panasonic Corporation Audiosignal dekodiervorrichtung und verfahren zur balance einstellung
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
US9393412B2 (en) 2009-06-17 2016-07-19 Med-El Elektromedizinische Geraete Gmbh Multi-channel object-oriented audio bitstream processor for cochlear implants
US20100322446A1 (en) * 2009-06-17 2010-12-23 Med-El Elektromedizinische Geraete Gmbh Spatial Audio Object Coding (SAOC) Decoder and Postprocessor for Hearing Aids
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
US8786852B2 (en) 2009-12-02 2014-07-22 Lawrence Livermore National Security, Llc Nanoscale array structures suitable for surface enhanced raman scattering and methods related thereto
TWI444989B (zh) * 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
KR101410575B1 (ko) 2010-02-24 2014-06-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 강화 다운믹스 신호를 생성하는 장치, 강화 다운믹스 신호를 생성하는 방법 및 컴퓨터 프로그램
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
WO2012009851A1 (en) * 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
WO2012051528A2 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2686654A4 (de) * 2011-03-16 2015-03-11 Dts Inc Kodierung und wiedergabe dreidimensionaler audiospuren
EP2695388B1 (de) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Latenzreduktion in videoverteilungsnetzwerken mit adaptiver bitrate
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
EP2523472A1 (de) 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren und Computerprogramm zur Erzeugung eines Stereoausgabesignals zur Bereitstellung zusätzlicher Ausgabekanäle
EP2530956A1 (de) * 2011-06-01 2012-12-05 Tom Van Achte Verfahren zur Erzeugung eines Surround-Audiosignals aus einem Mono-/Stereo-Audiosignal
CN103636235B (zh) * 2011-07-01 2017-02-15 杜比实验室特许公司 用于扬声器阵列的均衡和/或低音管理的方法和装置
TWI603632B (zh) 2011-07-01 2017-10-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
JP5505395B2 (ja) * 2011-10-28 2014-05-28 ヤマハ株式会社 音響処理装置
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
CN103188595B (zh) * 2011-12-31 2015-05-27 展讯通信(上海)有限公司 处理多声道音频信号的方法和系统
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
US9436929B2 (en) * 2012-01-24 2016-09-06 Verizon Patent And Licensing Inc. Collaborative event playlist systems and methods
ITTO20120067A1 (it) 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US9395304B2 (en) 2012-03-01 2016-07-19 Lawrence Livermore National Security, Llc Nanoscale structures on optical fiber for surface enhanced Raman scattering and methods related thereto
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
US20150371646A1 (en) * 2013-02-14 2015-12-24 Dolby Laboratories Licensing Corporation Time-Varying Filters for Generating Decorrelation Signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
JP6013646B2 (ja) * 2013-04-05 2016-10-25 ドルビー・インターナショナル・アーベー オーディオ処理システム
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
CN105474308A (zh) * 2013-05-28 2016-04-06 诺基亚技术有限公司 音频信号编码器
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
US9386558B2 (en) * 2013-06-27 2016-07-05 Microsoft Technology Licensing, Llc Radio channel utilization
WO2015017223A1 (en) * 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
EP3044783B1 (de) 2013-09-12 2017-07-19 Dolby International AB Audiokodierung
EP4379714A2 (de) 2013-09-12 2024-06-05 Dolby Laboratories Licensing Corporation Lautstärkeeinstellung für abwärtsgemischten audioinhalt
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
AU2014339065B2 (en) 2013-10-21 2017-04-20 Dolby International Ab Decorrelator structure for parametric reconstruction of audio signals
EP3061089B1 (de) * 2013-10-21 2018-01-17 Dolby International AB Parametrische rekonstruktion von tonsignalen
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control
WO2015089468A2 (en) * 2013-12-13 2015-06-18 Wu Tsai-Yi Apparatus and method for sound stage enhancement
WO2015104447A1 (en) 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
EP2980789A1 (de) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Verbesserung eines Audiosignals, Tonverbesserungssystem
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
WO2016196211A1 (en) 2015-05-29 2016-12-08 Armo Biosciences, Inc. Methods of using interleukin-10 for treating diseases and disorders
DK3353779T3 (da) 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
EP3369257B1 (de) * 2015-10-27 2021-08-18 Ambidio, Inc. Vorrichtung und verfahren zur klangraumverbesserung
CA3127805C (en) * 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US10979844B2 (en) * 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215667B (zh) 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
EP3422738A1 (de) * 2017-06-29 2019-01-02 Nxp B.V. Audioprozessor für fahrzeug mit zwei betriebsmodi in abhängigkeit der rücksitzbelegung
BR112020001660A2 (pt) * 2017-07-28 2021-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para decodificar um sinal multicanal codificado, descorrelacionador de sinal de áudio, método para descorrelacionar um sinal de entrada de áudio
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2574667A (en) * 2018-06-15 2019-12-18 Nokia Technologies Oy Spatial audio capture, transmission and reproduction
FR3101741A1 (fr) * 2019-10-02 2021-04-09 Orange Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés
KR20210060253A (ko) 2019-11-18 2021-05-26 삼성전자주식회사 메모리 컨트롤러, 메모리 시스템 및 이의 동작 방법
US11451919B2 (en) * 2021-02-19 2022-09-20 Boomcloud 360, Inc. All-pass network system for colorless decorrelation with constraints
US20240161754A1 (en) * 2021-04-06 2024-05-16 Dolby International Ab Encoding of envelope information of an audio downmix signal
CN113301329B (zh) * 2021-05-21 2022-08-05 康佳集团股份有限公司 基于图像识别的电视声场校正方法、装置及显示设备
CN116962955A (zh) * 2022-04-15 2023-10-27 华为技术有限公司 多通道的混音方法、设备及介质

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
EP0688113A2 (de) * 1994-06-13 1995-12-20 Sony Corporation Verfahren und Vorrichtung für die Kodierung und Dekodierung von digitalen Tonsignalen und Vorrichtung zur Aufzeichnung von digitalen Tonsignalen
US6029129A (en) * 1996-05-24 2000-02-22 Narrative Communications Corporation Quantizing audio data using amplitude histogram
WO1998046045A1 (fr) * 1997-04-10 1998-10-15 Sony Corporation Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6437944B2 (en) 1997-10-20 2002-08-20 Fujitsu Limited Head slider supporting device, disk device and suspension
US6122619A (en) 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6322189B1 (en) 1999-01-13 2001-11-27 Hewlett-Packard Company Multiple printhead apparatus with temperature control and method
US6578074B1 (en) 1999-06-25 2003-06-10 Mediaone Group, Inc. Provisioning server enhancement
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP4424566B2 (ja) 1999-10-26 2010-03-03 ザ・インクテック株式会社 アルカリ可溶性接着剤
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
GB0124580D0 (en) 2001-10-12 2001-12-05 Univ Reading New composition
AU2002343151A1 (en) 2001-11-23 2003-06-10 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US6890125B1 (en) 2002-01-30 2005-05-10 Calder Brothers Corporation Adjustable screed system
KR20040091110A (ko) 2002-03-07 2004-10-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 사용자 제어 다중-채널 오디오 변환 시스템
KR100981694B1 (ko) * 2002-04-10 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호들의 코딩
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
AU2003216686A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
KR101016982B1 (ko) * 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
WO2003094369A2 (en) * 2002-05-03 2003-11-13 Harman International Industries, Incorporated Multi-channel downmixing device
KR100981699B1 (ko) * 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20050255191A1 (en) 2002-07-23 2005-11-17 Shandera Donald L Process for treating corn and millets
KR20040043743A (ko) * 2002-11-19 2004-05-27 주식회사 디지털앤디지털 멀티채널 검색장치와 방법
WO2005025241A2 (en) 2003-09-10 2005-03-17 A.D.I. Video Technologies Ltd. Device, system and method of multi-channel processing
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050169846A1 (en) 2004-01-31 2005-08-04 Bart Kennington Enhancement of fragrance release from candles
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP2007096002A (ja) * 2005-09-29 2007-04-12 Matsushita Electric Ind Co Ltd 半導体装置の製造方法および半導体装置
JP4806031B2 (ja) * 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
JP2008003007A (ja) * 2006-06-23 2008-01-10 Fujitsu Ltd 個体認識方法及び装置、個体認識範囲調整方法、及びプログラム
JP5228305B2 (ja) 2006-09-08 2013-07-03 ソニー株式会社 表示装置、表示方法
ATE539434T1 (de) 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
BRPI0816556A2 (pt) 2007-10-17 2019-03-06 Fraunhofer Ges Zur Foerderung Der Angewandten Forsschung E V codificação de áudio usando downmix
JP5428564B2 (ja) 2009-06-18 2014-02-26 東洋紡株式会社 車両内装材用部材およびそれを用いた車両用内装材

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11393481B2 (en) 2013-10-22 2022-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US11922957B2 (en) 2013-10-22 2024-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Also Published As

Publication number Publication date
JP2007531027A (ja) 2007-11-01
US8538031B2 (en) 2013-09-17
US10250985B2 (en) 2019-04-02
HK1144043A1 (zh) 2011-01-21
CN102157155B (zh) 2014-07-02
US20170229126A1 (en) 2017-08-10
US10440474B2 (en) 2019-10-08
US20170148450A1 (en) 2017-05-25
US11184709B2 (en) 2021-11-23
US20110075848A1 (en) 2011-03-31
US7986789B2 (en) 2011-07-26
US10129645B2 (en) 2018-11-13
CN101860784A (zh) 2010-10-13
EP1735775B8 (de) 2008-11-19
US20170229127A1 (en) 2017-08-10
KR100848367B1 (ko) 2008-07-24
JP5185337B2 (ja) 2013-04-17
US20200304913A1 (en) 2020-09-24
CN1965351B (zh) 2011-05-11
US9621990B2 (en) 2017-04-11
JP5185340B2 (ja) 2013-04-17
HK1163911A1 (en) 2012-09-14
JP2011030228A (ja) 2011-02-10
EP1695338B1 (de) 2007-09-12
US9743185B2 (en) 2017-08-22
US20170238113A1 (en) 2017-08-17
US10244321B2 (en) 2019-03-26
US8693696B2 (en) 2014-04-08
US20070002971A1 (en) 2007-01-04
ATE376240T1 (de) 2007-11-15
US20140236604A1 (en) 2014-08-21
KR20070001162A (ko) 2007-01-03
EP1735775A1 (de) 2006-12-27
US20230345176A1 (en) 2023-10-26
US11647333B2 (en) 2023-05-09
US20170236523A1 (en) 2017-08-17
TWI334736B (en) 2010-12-11
KR100848365B1 (ko) 2008-07-24
WO2005101370A1 (en) 2005-10-27
US20170238112A1 (en) 2017-08-17
US10271142B2 (en) 2019-04-23
US9635462B2 (en) 2017-04-25
ATE373301T1 (de) 2007-09-15
WO2005101371A1 (en) 2005-10-27
EP1735775B1 (de) 2007-10-17
DE602005002451D1 (de) 2007-10-25
CN1930608B (zh) 2010-05-05
DE602005002942T2 (de) 2008-07-24
US10244320B2 (en) 2019-03-26
US20170229129A1 (en) 2017-08-10
US10623860B2 (en) 2020-04-14
US8223976B2 (en) 2012-07-17
US20170229131A1 (en) 2017-08-10
TW200637415A (en) 2006-10-16
US20130236021A1 (en) 2013-09-12
US20180054676A9 (en) 2018-02-22
US20160203823A1 (en) 2016-07-14
CN101860784B (zh) 2016-02-17
US20170229132A1 (en) 2017-08-10
US20170229128A1 (en) 2017-08-10
JP4603037B2 (ja) 2010-12-22
CN1930608A (zh) 2007-03-14
CN102157155A (zh) 2011-08-17
CN1965351A (zh) 2007-05-16
US20070258607A1 (en) 2007-11-08
US10015597B2 (en) 2018-07-03
JP2011018060A (ja) 2011-01-27
US9972329B2 (en) 2018-05-15
JP4589962B2 (ja) 2010-12-01
SE0400998D0 (sv) 2004-04-16
US20160203822A1 (en) 2016-07-14
ES2294703T3 (es) 2008-04-01
DE602005002942D1 (de) 2007-11-29
US20190320263A1 (en) 2019-10-17
KR20070001226A (ko) 2007-01-03
US10250984B2 (en) 2019-04-02
US20170229130A1 (en) 2017-08-10
PL1735775T3 (pl) 2009-04-30
US20220159379A1 (en) 2022-05-19
HK1093594A1 (en) 2007-03-02
EP1695338A1 (de) 2006-08-30
US20110002470A1 (en) 2011-01-06
US20200021915A1 (en) 2020-01-16
US10244319B2 (en) 2019-03-26
US9972330B2 (en) 2018-05-15
JP2007532960A (ja) 2007-11-15
PL1695338T3 (pl) 2008-02-29
ES2293578T3 (es) 2008-03-16
US9972328B2 (en) 2018-05-15
US10499155B2 (en) 2019-12-03

Similar Documents

Publication Publication Date Title
DE602005002451T2 (de) Vorrichtung und verfahren zur erzeugung eines pegelparameters und vorrichtung und verfahren zur erzeugung einer mehrkanal-repräsentation
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE602005002833T2 (de) Kompensation von multikanal-audio energieverlusten
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE112019003358T5 (de) Verfahren und vorrichtung zum codieren und/oder decodieren immersiver audiosignale
WO2014072513A1 (de) Nichtlineare inverse kodierung von multikanal-signalen
DE112015003108B4 (de) Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals
DE112021004444T5 (de) Stereobasierte immersive codierung (stic)

Legal Events

Date Code Title Description
8364 No opposition during term of opposition