DE60306512T2 - Parametrische beschreibung von mehrkanal-audio - Google Patents

Parametrische beschreibung von mehrkanal-audio Download PDF

Info

Publication number
DE60306512T2
DE60306512T2 DE60306512T DE60306512T DE60306512T2 DE 60306512 T2 DE60306512 T2 DE 60306512T2 DE 60306512 T DE60306512 T DE 60306512T DE 60306512 T DE60306512 T DE 60306512T DE 60306512 T2 DE60306512 T2 DE 60306512T2
Authority
DE
Germany
Prior art keywords
audio signal
information
channel audio
parameters
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60306512T
Other languages
English (en)
Other versions
DE60306512D1 (de
Inventor
J. Arnoldus W. OOMEN
G. Erik SCHUIJERS
J. Dirk BREEBAART
L. Steven VAN DE PAR
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of DE60306512D1 publication Critical patent/DE60306512D1/de
Application granted granted Critical
Publication of DE60306512T2 publication Critical patent/DE60306512T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verfahren zum Codieren eines Mehrkanal-Audiosignals, auf einen Codierer zum Codieren eines Mehrkanal-Audiosignals, auf eine Anordnung zum Liefern eines Audiosignals, auf ein codiertes Audiosignal, auf ein Speichermedium, auf dem das codierte Audiosignal gespeichert ist, auf ein Verfahren zum Decodieren eines codierten Audiosignals, auf einen Decoder zum Decodieren eines codierten Audiosignals und auf eine Anordnung zum Liefern eines decodierten Audiosignals.
  • EP-A-1107232 beschreibt ein parametrisches Codierungsschema zum Erzeugen eine Darstellung eines Stereo-Audiosignals, das aus einem linken Kanalsignal und einem rechten Kanalsignal zusammengesetzt ist. Um Übertragungsbandbreite auf effiziente Art und Weise zu benutzen enthält eine derartige Darstellung Information in Bezug auf nur ein Monosignal, das entweder das Linkskanalsignal oder das Rechtskanalsignal ist, und parametrische Information. Das andere Stereosignal kann auf Basis des Monosignals zusammen mit der parametrischen Information wieder hergestellt werden. Die parametrische Information umfasst Lokalisationsstichwörter des Stereo-Audiosignals, mit Intensitäts- und Phasencharakteristiken des Links- und Rechtskanals.
  • Die Veröffentlichung: "Subband Coding of Stereophonic Digital Audio Signals" von R. van der Waal, R. Veldhuis, Philips Research Laboratories, in "IEEE 1991", Heft 2 Seiten 3601-3604 (ISBN: 0-7803-0003-3) beschreibt einen Subbandcodierungsalgorithmus. In Subbandcodierungsalgorithmen wird das zu codierende Frequenzspektrum in nicht überlappende Teilbänder aufgeteilt. Die Codierung je Teilband umfasst eine Rotationstransformation.
  • Bekannte Lösungen in Audio-Codierern, die vorgeschlagen wurden, zum Reduzieren der Bitrate von Stereo-Programmmaterial umfassen Intensitäts-Stereo und M/S-Stereo.
  • In dem Intensitäts-Stereoalgorithmus werden hohe Frequenzen (typischerweise über 5 kHz) durch ein einfaches Audio-Signal (d.h. Monosignal) kombiniert mit zeitvariablen und frequenzabhängigen Skalierungsfaktoren oder Intensitätsfaktoren dargestellt, die es ermöglichen, ein decodiertes Audiosignal wieder herzustellen, das dem ursprünglichen Stereosignal für diese Frequenzgebiete ähnlich ist. In dem M/S-Algorithmus wird das Signal in ein Summensignal (oder gemitteltes oder gemeinsames Signal) und ein Differenzsignal (oder Seitensignal, oder nicht gemeinsames Signal) zerlegt. Diese Zerlegung wird manchmal mit einer grundsätzlichen Anteilanalyse oder mit zeitvariablen Skalierungsfaktoren kombiniert. Diese Signale werden danach unabhängig codiert, entweder durch einen Transformationscodierer oder einen Teilbandcodierer (die beide Wellenformcodierer sind). Der Betrag an Informationsreduktion, erreicht durch diesen Algorithmus ist stark abhängig von den räumlichen Eigenschaften des Quellensignals. Wenn beispielsweise das Quellensignal ein Monosignal ist, ist das Differenzsignal Null und kann abgelegt werden. Wenn aber die Korrelation des linken und rechten Audiosignals niedrig ist (was oft der Fall ist für die höheren Frequenzgebiete) bietet dieses Schema nur eine geringe Bitratenreduktion. Für die niedrigeren Frequenzgebiete schafft M/S Codierung im Allgemeinen wesentliche Verdienste.
  • Parametrische Beschreibungen von Audiosignalen sind in den letzten Jahren von größerem Interesse geworden, insbesondere im Bereich der Audiocodierung. Es hat sich herausgestellt, dass Übertragung (Quantisierung) von Parametern, die Audiosignale beschreiben, nur eine geringe Übertragungskapazität erfordert um ein wahrnehmbar gleiches Signal am Empfänger künstlich herzustellen. Aber die heutigen parametrischen Audiocodierer richten sich auf Codierung von Monosignalen, und Stereosignale werden als doppelte Monosignale verarbeitet.
  • Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung ein parametrisches Mehrkanal-Audiosystem zu schaffen, das imstande ist, die Qualität des codierten Audiosignals mit der verfügbaren Bitrate zu skalieren oder die Qualität des decodierten Audiosignals mit der Komplexität des Decoders oder der verfügbaren Übertragungsbandbreite zu skalieren.
  • Ein erster Aspekt der vorliegenden Erfindung schafft ein Verfahren zum Codieren eines Mehrkanal-Audiosignals nach Anspruch 1. Ein zweiter Aspekt der vorliegenden Erfindung schafft einen Codierer zum Codieren eines Mehrkanal-Audiosignals nach Anspruch 13. Ein dritter Aspekt der vorliegenden Erfindung schafft ein codiertes Audiosignal nach Anspruch 16. Ein vierter Aspekt der vorliegenden Erfindung schafft ein Speichermedium, auf dem das codierte Signal gespeichert wird, nach Anspruch 17. Ein fünfter Aspekt der vorliegenden Erfindung schafft ein Verfahren zum Decodieren nach Anspruch 18. Ein sechster Aspekt der vorliegenden Erfindung schafft einen Decoder zum Decodieren eines codierten Audiosignals nach Anspruch 19. Vorteilhafte Ausführungsformen sind in den Unteransprüchen definiert.
  • Bei dem Verfahren zum Codieren eines Mehrkanal-Audiosignals nach dem ersten Aspekt der vorliegenden Erfindung wird ein Einkanal-Audiosignal erzeugt. Weiterhin wird aus dem Mehrkanal-Audiosignal Information erzeugt, wodurch, mit einem erforderlichen Qualitätspegel, Wiederherstellung des Mehrkanal-Audiosignals aus dem Einkanal-Audiosignal und der Information ermöglicht wird. Vorzugsweise umfasst die Information Sätze mit Parametern, beispielsweise wie aus EP-A-1107232 bekannt.
  • Nach dem ersten Aspekt der vorliegenden Erfindung wird die Information dadurch erzeugt, dass ein erster Teil der Information für ein erstes Frequenzgebiet des Mehrkanal-Audiosignals bestimmt wird und dass ein zweiter Teil der Information für ein zweites Frequenzgebiet des Mehrkanal-Audiosignals bestimmt wird. Das zweite Frequenzgebiet ist ein Teil des ersten Frequenzgebietes und ist folglich ein Teilgebiet des ersten Frequenzgebietes. Nun sind zwei Qualitätspegel der Decodierung möglich. Für einen niedrigen Qualitätspegel des decodierten Mehrkanal-Audiosignals benutzt der Decoder das codierte Einkanal-Audiosignal, und den ersten Teil der Information. Für einen höheren Qualitätspegel benutzt der Decoder das codierte Einkanal-Audiosignal sowie den ersten und den zweiten Teil der Information. Selbstverständlich ist es möglich, die Decodierungsqualität aus vielen Pegeln zu selektieren, wenn eine Anzahl Informationsteile, die mit einem anderen Frequenzgebiet assoziiert sind, vorhanden sind. So kann beispielsweise der erste Teil einen einzigen Satz mit Parametern enthalten, die innerhalb eines Frequenzgebietes ermittelt worden sind, das die volle Bandbreite des Mehrkanal-Audiosignals deckt. Und der zweite Teil kann verschiedene Sätze mit Parametern enthalten, wobei jeder Satz mit Parametern für einen Teilbereich oder einen Teil der vollen Bandbreite ermittelt wird. Zusammen decken die Teile vorzugsweise die volle Bandbreite.
  • Diese Darstellung des codierten Audiosignals ermöglicht es, dass eine Qualität des decodierten Audiosignals von der Komplexität des Decoders abhängig ist. So kann beispielsweise in einem einfachen Decoder ein Decoder einer geringen Komplexität verwendet werden, der einen geringeren Energieverbrauch hat und dadurch imstande ist, nur einen Teil der Information zu verwenden. In einer Spitzenapplikation wird ein komplexer Decoder verwendet, der alle verfügbare Information in dem codierten Signal verwendet.
  • Die Qualität des decodierten Audios kann auch von der verfügbaren Übertragungsbandbreite abhängig sein. Wenn die Übertragungsbandbreite hoch ist, kann der Decoder alle verfügbaren Schichten decodieren, da sie alle übertragen werden. Wenn die Übertragungsbandbreite niedrig ist, kann der Sender entscheiden, nur eine begrenzte Anzahl Schichten zu übertragen.
  • In einer Ausführungsform wie in Anspruch 2 definiert, empfängt der Codierer eine maximal erlaubte Bitrate des codierten Mehrkanal-Audiosignals. Diese maximal erlaubte Bitrate kann durch die verfügbare Bitrate eines Übertragungskanals, wie Internet, oder von einem Speichermedium, definiert werden. In Applikationen, in denen die Übertragungsbandbreite variabel ist und folglich die maximal erlaubte Bitrate in der Zeit sich ändert, ist es wichtig, dass man imstande ist, diese Bitrate an diese Schwankungen der Übertragungsbandbreite anzupassen um eine sehr geringe Qualität des decodierten Audiosignals zu vermeiden. Normalerweise codiert der Codierer alle verfügbaren Schichten. Es wird bei dem Sender entschieden, welche Schichten übertragen werden, und zwar abhängig von der verfügbaren Kanalkapazität. Es ist möglich, dies mit dem Codierer in der Schleife zu tun, aber dies ist komplizierter als nur einige Schichten vor der Übertragung auszulassen.
  • Der Codierer fügt nur den zweiten Teil der Information für das zweite Frequenzgebiet des Mehrkanal-Audiosignals zu dem codierten Audiosignal hinzu, wenn eine Bitrate des codierten Mehrkanal-Audiosignals, das das Einkanal-Audiosignal enthält, und der erste und zweite Teil der Information nicht höher ist als die maximal gestattete Bitrate ist. Auf diese Weise ist der zweite Teil nicht in dem codierten Audiosignal vorhanden, wenn die Übertragungsbandbreite nicht groß genug ist um die Übertragung des zweiten Teils zu unterstützen.
  • In einer Ausführungsform, wie in Anspruch 3 definiert, umfasst die Information Sätze mit Parametern, wobei jeder der Teile der Information durch einen oder mehrere Sätze mit Parametern dargestellt wird. Die Anzahl Sätze mit Parameter ist abhängig von der Anzahl Frequenzgebiete, die in den Teilen der Information vorhanden sind.
  • In einer Ausführungsform, wie in Anspruch 4 definiert, umfassen die Sätze mit Parametern wenigstens eines der Lokalisierungsstichwörter.
  • In einer Ausführungsform, wie in Anspruch 6 definiert, deckt das erste Frequenzgebiet im Wesentlichen die volle Bandbreite des Mehrkanal-Audiosignals. Auf diese Weise reicht ein einziger Satz mit Parametern um die Basisinformation zu schaffen, die erforderlich ist zum Decodieren des Einkanal-Audiosignals zu dem Mehrkanal-Audiosignal. Auf diese Weise wird ein Basisqualitätspegel des decodierten Audiosignals gewährleistet. Der zweite Frequenzbereich deckt einen Teil der vollen Bandbreite. Auf diese Weise verbessert der zweite Teil, wenn in dem codierten Audiosignal vorhanden, die Qualität des decodierten Audiosignals in diesem Frequenzbereich.
  • In einer Ausführungsform, wie in Anspruch 7 definiert, umfasst der zweite Til der Information wenigstens zwei Frequenzbereiche, die zusammen im Wesentlichen die volle Bandbreite des Mehrkanal-Audiosignals decken. Auf diese Weise ist die durch den zweiten Teil geschaffene Qualitätsverbesserung über die volle Bandbreite vorhanden.
  • In einer Ausführungsform, wie in Anspruch 8 definiert, ist die Basisschicht, die das Einkanal-Audiosignal und den ersten Teil der Information aufweist, immer in dem codierten Audiosignal vorhanden. Die Verbesserungsschicht, die den zweiten Teil der Information enthält wird nur dann codiert, wenn die Bitrate des codierten Audiosignals die maximal erlaubte Bitrate nicht übersteigt. Auf diese Weise wird die Qualität des decodierten Audiosignals von der maximal erlaubten Bitrate abhängig sein. Wenn die maximal erlaubte Bitrate zu niedrig ist um die Verbesserungsschicht unterzubringen, wird das decodierte Audiosignal aus der Basisschicht erhalten, was eine bessere Qualität des decodierten Audios ergeben wird als der Fall sein wird, wenn unvorhersagbare Teile des codierten Audios den Decoder nicht erreichen werden.
  • In den Ausführungsformen, wie in den Ansprüchen 9 bis 11 definiert, werden die Teile der Information (meistens mit Sätzen mit Parametern, wobei ein Satz für jedes Frequenzband dargestellt wird) in einem nächsten Frame codiert, und zwar auf Basis der Parameter des vorhergehenden Frames. Meistens reduziert dies die Bitrate der codierten Teile der Information, weil, durch Korrelation die Information in zwei aufeinander folgenden Frames nicht wesentlich anders sein wird.
  • In den Ausführungsformen, wie in Anspruch 12 definiert, wird die Differenz der Parameter zweier aufeinander folgender Frames statt der Parameter selber codiert.
  • Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 ein Blockschaltbild eines Mehrkanal-Codierers für Stereo-Audio,
  • 2 ein Blockschaltbild eines Mehrkanal-Decoders für Stereo-Audio,
  • 3 eine Darstellung eines codierten Datenstroms,
  • 4 eine Ausführungsform der Frequenzbereiche nach der vorliegenden Erfindung,
  • 5 eine andere Ausführungsform der Frequenzbereiche nach der vorliegenden Erfindung,
  • 6 die Ermittlung der Sätze mit Parametern auf Basis der Parameter in einem vorhergehenden Frame nach einer Ausführungsform der vorliegenden Erfindung,
  • 7 einen Satz mit Parametern,
  • 8 die differenzielle Ermittlung der Parameter der Basisschicht, und
  • 9 die differenzielle Ermittlung der Parameter entsprechend einem Frequenzgebiet einer Verbesserungsschicht.
  • 1 zeigt ein Blockschaltbild eines Mehrkanal-Codierers. Der Codierer empfängt ein Mehrkanal-Audiosignal, das als Stereo-Signal RI, LI dargestellt ist, und der Codierer liefert das codierte Mehrkanal-Audiosignal EBS.
  • Der Mischer 1 kombiniert das Stereosignal oder die Stereokanäle RI, LI zu einem Einkanal-Audiosignal (auch als Monosignal bezeichnet) SC. So kann beispielsweise der Mischer 1 den Mittelwert der Eingangs-Audiosignale RI, LI ermitteln.
  • Der Codierer 3 codiert das Monosignal SC zum Erhalten eines codierten Monosignals ESC. Der Codierer 3 kann von einem bekannten Typ sein, beispielsweise ein MPEG-Codierer (MPEG-LII, MPEG-LIII (mp3), oder MPEG2-AAC).
  • Die Parameterbestimmungsschaltung 2 bestimmt die Sätze mit Parametern S1, S2, ...., die die Information INF auf Basis der Eingangs-Audiosignale RI, LI kennzeichnen. Gegebenenfalls empfängt die Parameterbestimmungsschaltung 2 die maximal erlaubte Bitrate MPR um nur die Parametersätze S1, S2,./.. zu ermitteln, die, wenn durch den Parametercodierer 4 codiert, zusammen mit dem codierten Monosignal ESC die maximal erlaubte Bitrate MBR nicht übersteigt. Die codierten Parameter werden durch EIN bezeichnet.
  • Der Formatierer 5 kombiniert das codierte Monosignal SC und die codierten Parameter EIN zu einem Datenstrom in einem gewünschten Format zum Erhalten des codierten Mehrkanal-Audiosignals ESB.
  • Die Wirkungsweise des Codierers wird nachstehend als Beispiel in Bezug auf eine Ausführungsform detailliert erläutert. Das Mehrkanal-Audiosignal LI, RI wird zu einem einfachen Monosignal SC codiert (weiterhin aus als Einkanal-Audiosignal bezeich net). Die Parameterisierung räumlicher Attribute der Mehrkanal-Audiosignale LI, RI erfolgt durch die Parameterermittlungsschaltung 2. Die Parameter enthalten Information über die Tatsache, wie das Mehrkanal-Audiosignal LI, RI aus dem Monosignal SC wiederhergestellt werden soll. Die Parameter werden meistens durch den Parametercodierer 4 codiert, bevor sie mit dem codierten einfachen Monosignal ESC kombiniert werden. Auf diese Weise werden für allgemeine Audiocodierungsapplikationen diese Parameter kombiniert mit nur einem Mono-Audiosignal übertragen oder gespeichert. Das kombinierte codierte Signal ist das codierte Mehrkanal-Audiosignal EBS. Die Übertragung- oder Speicherungskapazität, erforderlich zum Übertragen oder Speichern des codierten Mehrkanal-Audiosignals EBS wird im Vergleich zu Audio-Codierern, die die Mehrkanäle unabhängig verarbeiten, weitgehend reduziert. Dennoch wird der ursprüngliche räumliche Eindruck durch die Information INF beibehalten, die die (Sätze mit) Parameter(n) enthält.
  • Insbesondere bezieht sich die parametrische Beschreibung von Mehrkanal-Audio RI, LI auf ein binaurales Verarbeitungsmodell, das eine Beschreibung der effektiven Signalverarbeitung des binauralen auditiven Systems anstrebt.
  • Das Modell spaltet das eintreffende Audio LI, RI in mehrere bandbegrenzte Signale, die vorzugsweise in einem ERB-Ratenskala linear in einem Abstand voneinander liegen. Die Bandbreite dieser Signale ist von der zentralen Frequenz abhängig, infolge der ERB-Rate. Daraufhin werden vorzugsweise für jedes Frequenzband die nachfolgenden Eigenschaften der eintreffenden Signale analysiert:
    • – Die interaurale Pegeldifferenz oder ILD, definiert durch die relativen Pegel der bandbegrenzten Signaleindämmung von dem linken und dem rechten Ohr,
    • – Die interaurale Zeitdifferenz (oder Phasendifferenz) ITD (oder IPD), definiert durch die interaurale Verzögerung (oder Phasenverschiebung) entsprechend der Spitze in der interauralen Kreuzkorrelationsfunktion, und
    • – Die (Un)Ähnlichkeit der Wellenformen, die nicht durch ITDs oder ILDs nachgewiesen werden kann, die durch die maximale interaurale Kreuzkorrelations-IC parameterisiert werden kann (beispielsweise den Wert der Kreuzkorrelation an der Stelle der maximalen Spitze).
  • Die Sätze S1, S2, .... der drei Parameter, einen Satz für jedes Frequenzband FRI, FR2, ..., variieren mit der Zeit. Da aber das binaurale Hörsystem sehr langsam in der Verarbeitung ist, ist die Aktualisierungsrate dieser Eigenschaften ziemlich niedrig (typischerweise einige zehn Millisekunden).
  • Es kann vorausgesetzt werden, dass die (langsamen) in der Zeit variierenden Parameter die einzigen räumlichen Signaleigenschaften sind, die in dem binauralen Hörsystem verfügbar sind und dass aus diesen zeit- und frequenzabhängigen Parametern die wahrgenommene Hörwelt durch höhere Pegel des Hörsystems rekonstruiert wird.
  • 2 zeigt ein Blockschaltbild eines Mehrkanaldecoders. Der Decoder empfängt das codierte Mehrkanal-Audiosignal EBS und liefert das wiederhergestellte decodierte Mehrkanal-Audiosignal, das als Stereosignale RO, LO dargestellt ist.
  • Der Deformatierer 6 erfasst das codierte Monosignal ESC' und die codierten Parameter EIN' aus dem Datenstrom EBS. Der Decoder 7 decodiert das codierte Monosignal ESC' zu dem Ausgangs-Monosignal SCO. Der Decoder 7 kann von jedem bekannten Typ sein (selbstverständlich angepasst an den Codierer, der verwendet wird), so ist beispielsweise der Decoder 7 ein MPEG Decoder. Der Decoder 8 decodiert die codierten Parameter EIN' zu Ausgangparametern INO.
  • Der Demultiplexer 9 stellt die Ausgangs-Stereo-Audiosignale LO und RO wieder her, indem die Parametersätze S1, S2, ... der Ausgangsparameter INO auf das Ausgangs-MONO-Signal SCO angewandt werden.
  • 3 zeigt eine Darstellung des codierten Datenstroms. So startet beispielsweise in jedem Frame F1, F2, ... das Datenpaket mit einem Header H, dem das codierte Monosignal ESC folgt, nun durch A bezeichnet, ein erster Teil P1 der codierten Information EIN, ein zweiter Teil P2 der codierten Information EIN, und ein dritter Teil P3 der codierten Information EIN.
  • Wenn das Frame F1, F2, ... nur den Header H und das codiere Monosignal ESC enthält, wird nur das Monosignal SC übertragen.
  • Wie in EP-A-1107232 beschrieben, wird das volle Frequenzband, in dem das Eingangs-Audiosignal auftritt, in eine Anzahl Teilfrequenzbänder aufgeteilt, die zusammen das volle Frequenzband decken. In der Terminologie nach der vorliegenden Erfindung wird die Mehrkanalinformation INF in eine Anzahl Parametersätze S1, S2, ... codiert, einen Satz für jedes Teilfrequenzband FR1, FR2, ... Diese Anzahl Parametersätze S1, S2, ... wird in dem ersten Teil P1 der codierten Information EIN codiert. Auf diese Weise umfasst zum Übertragen eines Mehrkanal-Audiosignals mit einer Basispegelqualität der Bitstrom den Header H, den Teil A, der das codierte Monosignal ECS ist, und den ersten Teil P1.
  • In dem Bitstrom nach einer Ausführungsform der vorliegenden Erfindung besteht der erste Teil P1 aus einem einzigen Satz von Parametern S1. Der einzige Satz wird für die volle Bandbreite FR1 bestimmt. Dieser Bitstrom, der den Header H und die Teile A P1 umfasst, liefert eine Basisqualitätsschicht, angegeben durch BL in 3.
  • Um eine verbesserte Qualität zu unterstützen sind in dem Bitstrom weitere Teile P2, P3 der codierten Information EIN vorhanden. Diese weiteren Teile bilden eine Verbesserungsschicht EL. Der Bitstrom kann einen einzigen weiteren Teil P2 oder mehr als einen weiteren Teil enthalten. Der weitere Teil P2 umfasst vorzugsweise eine Anzahl Sätze S2, S3, ... mit Parametern, einen Satz für jedes Teilfrequenzband FR2, FR3, ..., wobei die Teilfrequenzbänder FR2, FR3, ... vorzugsweise das volle Frequenzband FR1 decken. Die verbesserte Qualität kann auch auf eine schrittartige Weise vorhanden sein, ein erster Verbesserungspegel wird durch die Verbesserungsschicht EL1 geschaffen, die den ersten Teil aufweist. Und eine zweite Verbesserungsschicht EL umfasst die erste Verbesserungsschicht EL1 und die zweite Verbesserungsschicht EL2, die den Teil P3 aufweist.
  • Der weitere Teil P2 kann auch einen einzigen Satz S2 mit Parametern entsprechend einem einzigen Frequenzband FR2 aufweisen, das ein Teilband des vollen Frequenzbandes FR1 ist. Der weitere Teil P2 kann auch eine Anzahl Sätze mit Parametern S2, S3, ... aufweisen, die den Frequenzbändern FR2, FR3, ... aufweist, die zusammen nicht das volle Frequenzband FR1 decken.
  • Der weitere Teil P3 enthält vorzugsweise Parametersätze für Frequenzbänder, die wenigstens eines der Teilbänder des weiteren Teils P2 unterteilen.
  • Dieses Format des Bitstroms nach der vorliegenden Erfindung ermöglicht in dem Übertragungskanal, oder in dem Decoder das Skalieren der Qualität des decodierten Audiosignals mit der Bitrate des Übertragungskanals, oder die decodierende Komplexität des Decoders. Wenn beispielsweise der Audiodecoder einen niedrigen Energieverbrauch haben soll, wie dies für tragbare Anordnungen wichtig ist, kann der Decoder eine geringe Komplexität haben und nur die Teile H, A und P benutzen. Es wäre sogar möglich, dass der Decoder imstande ist, komplexere Vorgänge mit einem größeren Energieverbrauch durchzuführen, wenn der Benutzer angibt, dass er eine höhere Qualität des decodierten Audios wünscht.
  • Es ist ebenfalls möglich, dass der Codierer sich von der maximalen erlaubten Bitrate MBR bewusst ist, die über den Übertragungskanal übertragen werden kann oder die auf einem Speichermedium gespeichert werden kann. Nun ist der Codierer imstande zu entscheiden, wie viel weitere Teile P1, P2, ... in die maximal erlaubte Bitrate MBR passen. Der Codierer codiert nur diese erlaubten Teile P1, P2, ... in dem Bitstrom.
  • 4 zeigt eine Ausführungsform der Frequenzgebiete nach der vorliegenden Erfindung. Bei dieser Ausführungsform ist das Frequenzband FR1 gleich der vollen Bandbreite FBW des Mehrkanal-Audiosignals L1, R1, und das Frequenzband FR2 ist ein Teilfrequenzband der vollen Bandbreite FBW.
  • Wenn dies die einzigen Frequenzbereiche sind, für die Parametersätze S1, S2, ... ermittelt werden, wird ein einziger Parametersatz S1 für das Frequenzband FR1 ermittelt und ist in dem Teil P1 vorhanden, und es wird ein einziger Parametersatz S2 für das Frequenzband FR2 ermittelt und ist in dem Teil P2 vorhanden. Die Qualitätsskalierung ist dadurch möglich, dass ggf. der Teil P2 verwendet wird.
  • 5 zeigt eine andere Ausführungsform der Frequenzbereiche nach der vorliegenden Erfindung. Bei dieser Ausführungsform ist das Frequenzband FR1 wieder gleich der vollen Bandbreite FBW, und die Teilfrequenzbänder FR2 und FR3 decken zusammen die volle Bandbreite FBW. Oder mit anderen Worten, das Frequenzband FR1 wird in die Teilfrequenzbänder FR2 und FR3 aufgeteilt.
  • Wenn dies die einzigen Frequenzbereiche sind, für die Parametersätze S1, S2, ... ermittelt werden, umfasst der Teil P1 einen einzigen Parametersatz S1, ermittelt für das Frequenzband FRI, und der Teil P2 umfasst zwei Parametersätze S2 und S3, ermittelt für die Frequenzbänder FR2 bzw. FR3. Die Qualitätsskalierung ist dadurch möglich, dass ggf. der Teil P2 verwendet wird.
  • 6 zeigt die Ermittlung der Sätze mit Parametern auf Basis der Parameter in einem vorhergehenden Frame nach einer Ausführungsform der vorliegenden Erfindung.
  • 6 zeigt einen Datenstrom, der in jedem Frame F1, F2, .... Die codierte Information EIN aufweist, die den Teil P1 enthält, der ein Teil der Basisschicht BL ist und den Teil P2, der die Verbesserungsschicht EL bildet.
  • In dem Frame F1 umfasst der Teil P1 einen einzigen Satz mit Parametern S1, die für die volle Bandbreite FR1 ermittelt wird. Der Teil P2 umfasst beispielsweise vier Sätze mit Parametern S2, S3, S4, S5, die für die Teilfrequenzbänder FR2, FR3, FR4 bzw. FR5 ermittelt werden. Die vier Teilfrequenzbänder FR2, FR3, FR4, FR5 teile das Frequenzband FR1 auf.
  • In dem Frame F2, das dem Frame F1 folgt, umfasst der Teil P1 einen einzigen Satz mit Parametern S1', die für die volle Bandbreite FR1 ermittelt werden und ein Teil der Basisschicht BL' sind. Der Teil P2 umfasst vier Sätze mit Parametern S2', S3', S4', S5', die wieder für die Teilfrequenzbänder FR2, FR3, FR4 bzw. FR5 ermittelt werden und die die Verbesserungsschicht EL' bilden.
  • Es ist möglich, jeden der Sätze mit Parametern S1, S2, ... für jedes der Frames F1, F2, einzeln zu codieren. Es ist auch möglich, die Sätze mit Parametern des Teils P2 in Bezug auf die Parameter des Teils P1 zu codieren. Dies ist durch die Pfeile angegeben, ausgehend von S1 und endend bei S2 bis S5 in dem Frame F1. Selbstverständlich ist dies auch in den anderen Frames F2, ... (nicht dargestellt) möglich. Auf gleiche Weise ist es möglich, den Satz mit Parametern S1' gegenüber S1 zu codieren. Und zum Schluss können die Sätze mit Parametern S2', S3', S4', S5' gegenüber den Sätzen mit Parametern S2, S3, S4, S5 codiert werden.
  • Auf diese Weise kann die Bitrate der codierten Information EIN reduziert werden, da die Redundanz oder die Korrelation zwischen Sätzen mit Parametern Si angewandt wird.
  • Vorzugsweise werden die neuen Parameter der neuen Sätze mit Parametern S1', S2', S3', S4', S5' als die Differenz zwischen ihrem Wert und dem Wert der Parameter der vorhergehenden Sätze mit Parametern S1, S2, S3, S4, S5.
  • Zu regelmäßigen Zeitintervallen soll wenigstens der Parametersatz S1 absolut und nicht differentiell codiert werden, und zwar um zu vermeiden, dass Fehler sich zu lange fortpflanzen.
  • 7 zeigt einen Satz mit Parametern. Jeder Satz mit Parametern Si kann einen oder mehrere Parameter enthalten. Üblicherweise sind die Parameter Lokalisierungsstichwörter, die Information über die Lage von Schallobjekten in der Audioinformation erteilen. Meistens sind die Lokalisierungsstichwörter die interaurale Pegeldifferenz ILD, die interaurale Zeit- oder Phasendifferenz ITD oder IPD, und die interaurale Kreuzkorrelation IC. Mehr detaillierte Information über diese Parameter lässt sich finden in dem Dokument: "Audio Engineering Society Convention 5574, Binaural Cue Coding Applied to Ste reo and Multi-Channel Audio Compression" angeboten bei der 112. Konvention, vom 10. bis zum 13. Mai, München, Deutschland, von Christof Faller u. a.
  • 8 zeigt die differenzielle Ermittlung eines Parameters der Basisschicht. Die horizontale Achse bezeichnet aufeinander folgende Frames F1 bis F5. Die vertikale Achse zeigt den Wert PVG eines Parameters des Satzes mit Parametern S1 der Basisschicht BL. Dieser Parameter hat die Werte A1 bis A5 für die Frames F1 bis F5. Der Beitrag dieses Parameters an der Bitrate der codierten Information EIN wird abnehmen, wenn nicht die wirklichen Werte A2 bis A5 des Parameters codiert werden, sondern die kleineren Differenzen D1, D2, ....
  • 9 zeigt die differenzielle Ermittlung der Parameter entsprechend einem Frequenzbereich einer Verbesserungsschicht. Die horizontale Achse gibt zwei aufeinander folgende Frames F1 und F2 an. Die vertikale Achse gibt die Werte eines bestimmten Parameters der Basisschicht BL und der Verbesserungsschicht EL an. In diesem Beispiel umfasst die Basisschicht den Teil P1 mit Information INF mit einem einzigen Satz mit Parametern, ermittelt für den vollen Frequenzbereich FBW, den bestimmten Parameter des Teils P1 hat den Wert A1 für das Frame F1 und A2 für das Frame F2. Die Verbesserungsschicht EL umfasst den Teil P2 mit Information INF mit drei Sätzen mit Parametern, ermittelt für drei Frequenzbereiche FR2, FR3, FR4, die zusammen den vollen Frequenzbereich FBW füllen. Die drei bestimmten Parameter (beispielsweise den Parameter, der die ILD darstellt) haben einen Wert B11, B12, B13 in dem Frame F1 und einen Wert B21, B22, B23 in dem Frame F2.
  • Der Beitrag dieser Parameter an der Bitrate der codierten Information EIN wird abnehmen, wenn nicht die wirklichen Werte B11 bis B23 des bestimmten Parameters sondern die Differenzen D11, D12, ... codiert werden, weil diese Differenzen auf effizientere Weise als die wirklichen Werte codiert werden können.
  • Zusammengefasst, in einer bevorzugten Ausführungsform nach der vorliegenden Erfindung wird vorgeschlagen, die Stereo-Parameterinformation INF derart zu organisieren, dass eine Basisschicht BL einen einzigen Satz mit Parametern enthält (vorzugsweise die Zeit/Pegeldifferenz und die Korrelation) S1, die für die volle Bandbreite FBW des Mehrkanal-Audiosignals LI, RI ermittelt wird. Die Verbesserungsschicht EL enthält mehrere Sätze mit Parametern S2, S3, ..., die den nachfolgenden Frequenzintervallen FR2, FR3, ... innerhalb der vollen Bandbreite FBW entsprechen. Für Bitrateneffizienz kön nen die Sätze mit Parametern S2, S3, ... in der Verbesserungsschicht EL gegenüber dem Satz mit Parametern S1 in der Basisschicht BL differenziell codiert werden.
  • Die Information INF wird auf eine Mehrschichtweise codiert, damit eine Skalierung der Decodierungsqualität gegenüber der Bitrate ermöglicht wird.
  • Abschließend wird nachstehend eine bevorzugte Ausführungsform nach der vorliegenden Erfindung in Bezug auf einen Programmcode und der Erläuterung näher erläutert.
  • Erstens werden für alle Subframes (die Teile P1, P2, ...) in den Frames F1, F2, ... die Daten ESC für die Monowiedergabe SC, die Daten EIN für den Satz mit Stereoparametern S1 für die volle Bandbreite FBW, und die Stereoparameter S2, S3, ... für die Frequenzbins (oder Gebiete) FR2, FR3, ... ermittelt.
  • Der Programmcode ist auf der linken Seite dargestellt und die Erläuterung des Programmcodes ist unter der Beschreibung auf der rechten Seite angegeben.
  • Figure 00130001
  • Zweitens werden, abhängig von dem Wert von "bit refresh_stereo" die Stereoparameter für die volle Bandbreite absolut codiert (der wirkliche Wert wird codiert) oder die Differenz mit vorhergehenden Werten wird codiert. Der nachfolgende Code gilt für die interaurale Pegeldifferenz ILD.
  • Figure 00140001
  • Drittens werden, abhängig von dem Wert von "bit refresh_stereo" die Stereoparameter für alle Frequenzbins absolut codiert (der wirkliche Wert wird codiert) oder die Differenz mit den entsprechenden Parametern für die volle Bandbreite wird codiert. Der nachfolgende Code gilt für die interaurale Pegeldifferenz ILD.
  • Figure 00140002
  • Figure 00150001
  • Wobei:
    • Der Term "refresh stereo" ist ein Merker, ob die Stereoparameter ggf. erneuert werden sollen (0 = FALSE, 1 = TRUE).
    • Der Term "ild_global[sf]" stellt den Huffman codierten absoluten Darstellungspegel der ILD für das ganze Frequenzgebiet für das Frame f dar.
    • Der Term "ild_global_diff[f]" stellt den Huffman codierten relativen Darstellungspegel der ILD für das ganze Frequenzgebiet für das Frame f dar.
    • Der Term "ild_bin[f, b]" stellt den Huffman codierten absoluten Darstellungspegel der ILD für Frame f und bin b dar.
    • Der Term "ild_bin_diff[f, b] stellt den Huffman codierten relativen Darstellungspegel der ILD für Frame f und bin b dar.
  • Es sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende Erfindung illustrieren statt begrenzen, und dass der Fachmann imstande sein wird, viele alternative Ausführungsformen im Rahmen der beiliegenden Patentansprüche zu entwerfen.
  • Obschon die vorliegende Erfindung in den Figuren in Bezug auf ein Stereosignal erläutert worden ist, kann die Erweiterung auf ein mehr als ein Zweikanalaudiosignal auf einfache Art und Weise vom Fachmann durchgeführt werden.
  • In den Patentansprüchen sollen eingeklammerte Bezugszeichen nicht als den Anspruch begrenzend betrachtet werden. Das Wort "enthalten" schließt das Vorhandensein von Elementen oder Verfahrensschritten, anders als die genannten, nicht aus. Die vorliegende Erfindung kann mit Hilfe von Hardware mit verschiedenen einzelnen Elementen implementiert werden, sowie mit Hilfe eines auf geeignete Art und Weise programmierten Computers. In dem Vorrichtungsanspruch, der mehrere Mittel aufzählt, können mehrere dieser Mittel durch ein und dasselbe Hardware-Item verkörpert werden. Die Tatsache, dass bestimmte Maßnahmen in verschiedenen Unteransprüchen erwähnt sind, bedeutet nicht, dass Kombinationen dieser Maßnahmen nicht mit Vorteil angewandt werden können.
  • Zusammenfassend werden Mehrkanal-Audiosignale zu einem Mono-Audiosignal und Information codiert, die es ermöglicht, das Mehrkanal-Audiosignal aus dem Mono-Audiosignal und der Information wieder herzustellen. Die Information wird dadurch erzeugt, dass ein erster Teil der Information für ein erstes Frequenzgebiet des Mehrkanal-Audiosignals ermittelt wird, und dadurch, dass ein zweiter Teil der Information für ein zweites Frequenzgebiet des Mehrkanal-Audiosignals ermittelt wird. Das zweite Frequenzgebiet ist ein Teil des ersten Frequenzgebietes und ist folglich ein Teilbereich des ersten Frequenzgebietes. Die Information ist mehrschichtig, wodurch eine Skalierung der Decodierungsqualität gegenüber Bitrate ermöglicht wird.

Claims (20)

  1. Verfahren zum Codieren eines Mehrkanal-Audiosignals mit wenigstens zwei Audiokanälen (RI, LI), wobei dieses Verfahren Folgendes umfasst: – das Erzeugen (1) eines Einkanal-Audiosignals (SC) mit einer bestimmten Kombination der wenigstens zwei Audiokanäle (RI, LI), und das Codieren des Einkanal-Audiosignals (SC) in einen Bitstrom (EBS) als ein codiertes Einkanal-Audiosignal (ESC), – das Erzeugen (2) von Information (INF) aus den wenigstens zwei Audiokanälen (RI, LI), wodurch es ermöglicht wird, mit einem erforderlichen Qualitätspegel das Mehrkanal-Audiosignal aus dem Einkanal-Audiosignal (SC) und der Information (INF) wiederherzustellen, wobei die Erzeugung (2) der Information Folgendes umfasst: – das Ermitteln (2) eines ersten Teils der Information (P1) bestehend aus einem einzigen Satz von Parametern (S1), ermittelt für ein erstes Frequenzgebiet (FR1) des Mehrkanal-Audiosignals, und das Codieren des ersten Teils der Information (P1) in den Bitstrom (EBS) als ein codierter erster Teil der Information (EIN), und – das Ermitteln (2) eines zweiten Teils der Information (P2) für ein zweiten Frequenzgebiet (FR2) des Mehrkanal-Audiosignals, wobei das zweite Frequenzgebiet (FR2) ein Teil des ersten Frequenzgebietes (FR1) ist, und das Codieren des zweiten Teils der Information (P2) in den Bitstrom (EBS) als ein codierter zweiter Teil der Information (EIN).
  2. Verfahren zum Codieren eines Mehrkanal-Audiosignals nach Anspruch 1, wobei das Verfahren weiterhin Folgendes umfasst: – nur das Ermitteln (2) des zweiten Teils der Information (P2) für das zweite Frequenzgebiet (FR2) des Mehrkanal-Audiosignals, wenn eine Bitrate des codierten Mehrkanal-Audiosignals mit dem Einkanal-Audiosignal (SC), dem ersten Teil der Information (P1) und dem zweiten Teil der Information (P2) nicht höher ist als eine maximal erlaubte Bitrate (MBR).
  3. Verfahren zum Codieren nach Anspruch 1, dadurch gekennzeichnet, dass die Information (INF) Sätze von Parametern (S1, S2, ...) aufweist, dass der erste Teil (P1) we nigstens einen ersten Satz (S1) der Sätze mit Parametern (S1, S2, ...) aufweist, dass der zweite Teil (P2) wenigstens einen zweiten Satz (S2) der Sätze mit Parametern (S1, S2, ...) aufweist, wobei jeder Satz mit Parametern mit einem entsprechenden Frequenzgebiet (FRI, FR2, ...) assoziiert ist.
  4. Verfahren zum Codieren nach Anspruch 3, dadurch gekennzeichnet, dass die Sätze mit Parametern wenigstens einen Lokalisierungsaufruf (ILD, ITD, IPD, IC) aufweist.
  5. Verfahren zum Codieren nach Anspruch 4, dadurch gekennzeichnet, dass der wenigstens eine Lokalisierungsaufruf (ILD, ITD, IPD, IC) aus: einer interauralen Pegeldifferenz (ILD), einer interauralen Zeit- oder Phasendifferenz (ITD, IPD), oder einer interauralen Kreuzkorrelation (IC) selektiert wird.
  6. Verfahren zum Codieren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das erste Frequenzgebiet (FR1) eine volle Bandbreite (FBW) des Mehrkanal-Audiosignals deckt.
  7. Verfahren zum Codieren nach Anspruch 1, dadurch gekennzeichnet, dass das erste Frequenzgebiet (FR1) im Wesentlichen eine Volle Bandbreite (FBW) des Mehrkanal-Audiosignals deckt, dass das zweite Frequenzgebiet (FR2) einen teil der vollen Bandbreite (FBW) deckt, und dass die Ermittlung (2) des zweiten Teils der Information (P2) dazu vorgesehen ist, Sätze mit Parametern (S2, S3, ...) für das zweite Frequenzgebiet (FR2) und einen Satz weiterer Frequenzgebiete (FR3, FR4, FR5) zu ermitteln, wobei das zweite Frequenzgebiet (FR2) und der Satz weiterer Frequenzgebiete (FR3, FR4, FR5) im Wesentlichen die volle Bandbreite (FBW) decken, wobei der Satz weiterer Frequenzgebiete (FR3, FR4, FR5) wenigstens ein weiteres Frequenzgebiet (FR3) aufweist.
  8. Verfahren zum Codieren nach Anspruch 7, dadurch gekennzeichnet, dass das Einkanal-Audiosignal (SC) und der erste Teil (P1) der Information (INF) eine Basisinformationsschicht bilden, d immer in dem codierten Mehrkanal-Audiosignal (EBS) vorhanden ist, und dass das Verfahren Folgendes umfasst: das Empfangen (2) einer maximal erlaubten Bitrate (MBR) des codierten Mehrkanal-Audiosignals (EBS), wobei der zweite Teil der Information (P2) eine Verbesserungsinformationsschicht (EL) bildet, die nur dann codiert wird, wenn die Bitrate der codierten Basisschicht (BL) und der Verbesserungsschicht (EL) nicht höher ist als die maximal erlaubte Bitrate (MBR).
  9. Verfahren zum Codieren nach Anspruch 3, dadurch gekennzeichnet, dass die Ermittlung (2) des ersten Teils der Information (P1) in einem bestimmten Frame (F2) codierter Information (EIN) die Ermittlung (2) des ersten Satzes der Sätze mit Parametern (S1') in dem bestimmten Frame (F2), und das Codieren des ersten Satzes der Sätze mit Parametern (S1') auf Basis des ersten Satzes der Sätze mit Parametern (S1) eines Frames (F1) vor dem betreffenden Frame (F22) umfasst.
  10. Verfahren zum Codieren nach Anspruch 7, dadurch gekennzeichnet, dass die Ermittlung (2) des zweiten Teils der Information (P2) in einem bestimmten Frame (F2) der codierten Information (EIN) die Ermittlung (2) der Sätze mit Parametern (S2', S3', ...) des zweiten Teils (P2) in dem bestimmten Frame (F2) und die Codierung der Sätze mit Parametern (S2', S3', ...) des zweiten Teils (P2) in dem bestimmten Frame (F2) auf Basis der Sätze mit Parametern (S2, S3, ...) eines Frames (F1) vor dem betreffenden Frame (F2) umfasst.
  11. Verfahren zum Codieren nach Anspruch 7, dadurch gekennzeichnet, dass die Ermittlung (2) des zweiten Teils der Information (P2) in einem bestimmten Frame (F2) der codierten Information (EIN) die Ermittlung (2) der Sätze mit Parametern (S2', S3', ...) des zweiten Teils (P2) in dem betreffenden Frame (F2) und die Codierung der Sätze mit Parametern (S2', S3', ...) des zweiten Teils (P2) in dem betreffenden Frame (F2) auf Basis des ersten Satzes der Sätze mit Parametern (S1) eines Frames (F1) vor dem betreffenden Frame (F2) umfasst.
  12. Verfahren zum Codieren nach einem der Ansprüche 9 bis 11, dadurch gekennzeichnet, dass die Ermittlung (2) das Berechnen einer Differenz zwischen den entsprechenden Parametern in dem betreffenden Frame (F2) und dem Frame (F1) vor dem betreffenden Frame (F2) umfasst.
  13. Codierer zum Codieren eines Mehrkanal-Audiosignals mit wenigstens zwei Audiokanälen (RI, LI), wobei der Codierer Folgendes umfasst: – Mittel zum Erzeugen (1) eines Einkanal-Audiosignals (SC) mit einer bestimmten Kombination der wenigstens zwei Audiokanäle (RI, LI), – Mittel zum Erzeugen (2) von Information (INF) aus den wenigstens zwei Audiokanälen (RI, LI), wodurch es möglich wird, das Mehrkanal-Audiosignal aus dem Einkanal-Audiosignal (SC) und der Information (INF) mit einem erforderlichen Qualitätspegel wiederherzustellen, wobei die Mittel zum Erzeugen (2) von Information Folgendes umfassen: – Mittel zum Ermitteln (2) eines ersten Teils der Information (P1) bestehend aus einem einzelnen Satz mit Parametern (S1) ermittelt für ein erstes Frequenzgebiet (FR1) des Mehrkanal-Audiosignals, und – Mittel zum Ermitteln (2) eines zweiten Teils der Information (P2) für ein zweites Frequenzgebiet (FR2) des Mehrkanal-Audiosignals, wobei das zweite Frequenzgebiet (FR2) ein Teil des ersten Frequenzgebietes (FR1) ist.
  14. Codierer zum Codieren eines Mehrkanal-Audiosignals nach Anspruch 13, der weiterhin Mittel aufweist um nur den zweiten Teil der Information (P2) für das zweite Frequenzgebiet (FR2) des Mehrkanal-Audiosignals zu ermitteln (2), wenn eine Bitrate des codierten Mehrkanal-Audiosignals, der das Einkanal-Audiosignal (SC), den ersten Teil der Information (P1) und den zweiten Teil der Information (P2) enthält, nicht höher ist als eine maximal erlaubte Bitrate (MBR).
  15. Gerät zum Liefern eines Audiosignals, wobei das Gerät Folgendes umfasst: – einen Eingang zum Empfangen eines Mehrkanal-Audiosignals, – einen Codierer nach Anspruch 13 oder 14 zum Codieren des Mehrkanal-Audiosignals zum Erhalten eines codierten Mehrkanal-Audiosignals, und – einen Ausgang zum Liefern des codierten Mehrkanal-Audiosignals.
  16. Codiertes Mehrkanal-Audiosignal, das Folgendes umfasst: – ein Einkanal-Audiosignal (SC) mit einer bestimmten Kombination aus wenigstens zwei Audio-Kanälen (RI, LI), – Information (INF) aus den wenigstens zwei Audiokanälen (RI, LI), wodurch es möglich ist, mit einem erforderlichen Qualitätspegel das Mehrkanal-Audiosignal aus dem Einkanal- Audiosignal (SC) und der Information (INF) wiederherzustellen, wobei die Information Folgendes umfasst: – einen ersten Teil der Information (P1), bestehend aus einem einzigen Satz mit Parametern (S1), ermittelt für ein erstes Frequenzgebiet (FR1) des Mehrkanal-Audiosignals, und – einen zweiten Teil der Information (P2) für ein zweites Frequenzgebiet (FR2) des Mehrkanal-Audiosignals, wobei das zweite Frequenzgebiet (FR2) ein Teil des ersten Frequenzgebietes (FR1) ist.
  17. Speichermedium, auf dem das codierte Audiosignal nach Anspruch 16 gespeichert worden ist.
  18. Verfahren zum Decodieren eines codierten Mehrkanal-Audiosignals, das nach Anspruch 16 codiert worden ist, wobei das Decodierverfahren Folgendes umfasst: – das Erhalten (6, 7) eines decodierten Einkanal-Audiosignals (SCO) mit einer bestimmten Kombination der wenigstens zwei Audiokanäle (RI, LI), – das Erhalten (6, 8) decodierter Information (INO) aus der Information (INF), wodurch es möglich ist, das Mehrkanal-Audiosignal aus dem decodierten Einkanal-Audiosignal (SCO) und der decodierten Information (INO) wiederherzustellen, wobei die decodierte Information (INO) den ersten Teil der Information (P1) und den zweiten Teil der Information (P2) enthält, und – das Anwenden (9) des ersten Teils der Information (P1) oder des ersten Teils (P1) und des zweiten Teils der Information (P2) auf das Einkanal-Audiosignal (SCO) zum Erzeugen eines decodierten Mehrkanal-Audiosignals (LO, RO).
  19. Decoder zum decodieren eines codierten Mehrkanal-Audiosignals, das nach Anspruch 16 codiert worden ist, wobei der Decoder Folgendes umfasst: – Mittel zum Erhalten (6, 7) eines decodierten Einkanal-Audiosignals (SCO) mit einer bestimmten Kombination der wenigstens zwei Audiokanäle (RI, LI), – Mittel zum Erhalten (6, 8) decodierter Information (INO) aus der Information (INF), wodurch es möglich wird, das Mehrkanal-Audiosignal aus dem decodierten Einkanal-Audiosignal (SCO) und der decodierten Information (INO) wiederherzustellen, wobei die decodierte Information (INO) den ersten Teil der Information (P1) und den zweiten Teil der Information (P2) enthält, und – Mittel zum Anwenden (9) des ersten teils der Information (P1) und des zweiten teils der Information (P2) auf das Einkanal-Audiosignal (SCO) zum Erzeugen eines decodierten Mehrkanal-Audiosignals (LO, RO).
  20. Gerät zum Liefern eines decodierten Audiosignals, wobei das Gerät Folgendes umfasst: – einen Eingang zum Empfangen eines codierten Mehrkanal-Audiosignals, – eine Decoder nach Anspruch 19 zum Decodieren des codierten Mehrkanal-Audiosignals zum Erhalten eines Mehrkanal-Ausgangssignal, und – einen Ausgang zum Liefern oder Wiedergeben des Mehrkanal-Ausgangssignals.
DE60306512T 2002-04-22 2003-04-22 Parametrische beschreibung von mehrkanal-audio Expired - Lifetime DE60306512T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02076588 2002-04-22
EP02077869 2002-07-16
EP02077869 2002-07-16
PCT/IB2003/001591 WO2003090207A1 (en) 2002-04-22 2003-04-22 Parametric multi-channel audio representation

Publications (2)

Publication Number Publication Date
DE60306512D1 DE60306512D1 (de) 2006-08-10
DE60306512T2 true DE60306512T2 (de) 2007-06-21

Family

ID=29252214

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60306512T Expired - Lifetime DE60306512T2 (de) 2002-04-22 2003-04-22 Parametrische beschreibung von mehrkanal-audio

Country Status (11)

Country Link
US (1) US8498422B2 (de)
EP (1) EP1500083B1 (de)
JP (1) JP4714415B2 (de)
KR (1) KR101021079B1 (de)
CN (1) CN1647156B (de)
AT (1) ATE332003T1 (de)
AU (1) AU2003216686A1 (de)
BR (2) BR0304542A (de)
DE (1) DE60306512T2 (de)
ES (1) ES2268340T3 (de)
WO (1) WO2003090207A1 (de)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7644001B2 (en) 2002-11-28 2010-01-05 Koninklijke Philips Electronics N.V. Differentially coding an audio signal
US20040264713A1 (en) * 2003-06-27 2004-12-30 Robert Grzesek Adaptive audio communication code
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005083679A1 (en) * 2004-02-17 2005-09-09 Koninklijke Philips Electronics N.V. An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
DE602005016571D1 (de) * 2004-08-26 2009-10-22 Panasonic Corp Mehrkanalige signal-dekodierung
JP4794448B2 (ja) * 2004-08-27 2011-10-19 パナソニック株式会社 オーディオエンコーダ
CN101010985A (zh) * 2004-08-31 2007-08-01 松下电器产业株式会社 立体声信号生成装置及立体声信号生成方法
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
CN101015230B (zh) * 2004-09-06 2012-09-05 皇家飞利浦电子股份有限公司 音频信号增强
DE102004043521A1 (de) 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
JP4809234B2 (ja) * 2004-09-17 2011-11-09 パナソニック株式会社 オーディオ符号化装置、復号化装置、方法、及びプログラム
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR101268218B1 (ko) * 2004-11-29 2013-10-17 내셔널 유니버시티 오브 싱가포르 휴대형 장치용 지각인지 저전력 오디오 디코더
DE602005017302D1 (de) * 2004-11-30 2009-12-03 Agere Systems Inc Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006060279A1 (en) 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
ATE545131T1 (de) * 2004-12-27 2012-02-15 Panasonic Corp Tonkodierungsvorrichtung und tonkodierungsmethode
KR20070090217A (ko) * 2004-12-28 2007-09-05 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5046653B2 (ja) * 2004-12-28 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7937272B2 (en) * 2005-01-11 2011-05-03 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
US8036390B2 (en) 2005-02-01 2011-10-11 Panasonic Corporation Scalable encoding device and scalable encoding method
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
ES2623551T3 (es) * 2005-03-25 2017-07-11 Iii Holdings 12, Llc Dispositivo de codificación de sonido y procedimiento de codificación de sonido
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
WO2007004833A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
CA2617050C (en) * 2005-07-29 2012-10-09 Lg Electronics Inc. Method for signaling of splitting information
JP5113050B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
JP5053849B2 (ja) * 2005-09-01 2012-10-24 パナソニック株式会社 マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
WO2007040349A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
JP4920692B2 (ja) * 2005-11-04 2012-04-18 ナショナル ユニヴァーシティー オブ シンガポール オーディオクリップ再生装置、再生方法および記憶媒体
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
JP5394754B2 (ja) 2006-02-23 2014-01-22 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
US20100040135A1 (en) * 2006-09-29 2010-02-18 Lg Electronics Inc. Apparatus for processing mix signal and method thereof
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US9418667B2 (en) 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
WO2008060111A1 (en) * 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
EP2102855A4 (de) 2006-12-07 2010-07-28 Lg Electronics Inc Verfahren und vorrichtung zum decodieren eines audiosignals
WO2008069594A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US9042454B2 (en) 2007-01-12 2015-05-26 Activevideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
WO2009113516A1 (ja) * 2008-03-14 2009-09-17 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101108060B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
EP2169664A3 (de) 2008-09-25 2010-04-07 LG Electronics Inc. Verfahren und Vorrichtung zur Verarbeitung eines Signals
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2214162A1 (de) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aufwärtsmischer, Verfahren und Computerprogramm zur Aufwärtsmischung eines Downmix-Tonsignals
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US7975063B2 (en) * 2009-05-10 2011-07-05 Vantrix Corporation Informative data streaming server
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
CA2814070A1 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2477418B1 (de) * 2011-01-12 2014-06-04 Nxp B.V. Signalverarbeitungsverfahren
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
EP2815582B1 (de) 2012-01-09 2019-09-04 ActiveVideo Networks, Inc. Wiedergabe einer interaktiven vereinfachten benutzerschnittstelle auf einem fernsehgerät
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
US9865269B2 (en) 2012-07-19 2018-01-09 Nokia Technologies Oy Stereo audio signal encoder
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
EP2976768A4 (de) * 2013-03-20 2016-11-09 Nokia Technologies Oy Audiosignalcodierer mit einem mehrkanalparameterwähler
EP3005712A1 (de) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Überlagerte darstellung einer benutzerschnittstelle auf quellvideoinhalten
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10063612B2 (en) 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions
JP7092050B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH09274500A (ja) * 1996-04-09 1997-10-21 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
US6931291B1 (en) * 1997-05-08 2005-08-16 Stmicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1442453B1 (de) * 2001-10-19 2006-09-06 Koninklijke Philips Electronics N.V. Differentielle kodierung im frequenz bereich von sinusmodell parametern
EP1440300B1 (de) * 2001-11-02 2005-12-28 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法

Also Published As

Publication number Publication date
BR0304542A (pt) 2004-07-20
DE60306512D1 (de) 2006-08-10
KR20040102163A (ko) 2004-12-03
AU2003216686A1 (en) 2003-11-03
EP1500083B1 (de) 2006-06-28
JP2005523479A (ja) 2005-08-04
ATE332003T1 (de) 2006-07-15
CN1647156A (zh) 2005-07-27
CN1647156B (zh) 2010-05-26
US8498422B2 (en) 2013-07-30
KR101021079B1 (ko) 2011-03-14
WO2003090207A1 (en) 2003-10-30
JP4714415B2 (ja) 2011-06-29
EP1500083A1 (de) 2005-01-26
ES2268340T3 (es) 2007-03-16
BRPI0304542B1 (pt) 2018-05-08
US20050226426A1 (en) 2005-10-13

Similar Documents

Publication Publication Date Title
DE60306512T2 (de) Parametrische beschreibung von mehrkanal-audio
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE602004002390T2 (de) Audiocodierung
DE60318835T2 (de) Parametrische darstellung von raumklang
DE69933659T2 (de) Verfahren und system zur räumlichen kodierung mit niedriger bitrate
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
DE60311794T2 (de) Signalsynthese
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE60303209T2 (de) Parametrische audiocodierung
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60208426T2 (de) Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
EP1864279B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
EP1687809A1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
EP2005421B1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
DE69827775T2 (de) Tonkanalsmischung
EP0931386A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
WO2006094635A1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE20321886U1 (de) Inverse Quantisierung für Audio
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE60310449T2 (de) Audiosignalkodierung
DE10148351B4 (de) Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus

Legal Events

Date Code Title Description
8364 No opposition during term of opposition