EP2094031A2 - Device and method for creating an encoding stereo signal of an audio section or audio data stream - Google Patents
Device and method for creating an encoding stereo signal of an audio section or audio data stream Download PDFInfo
- Publication number
- EP2094031A2 EP2094031A2 EP09006142A EP09006142A EP2094031A2 EP 2094031 A2 EP2094031 A2 EP 2094031A2 EP 09006142 A EP09006142 A EP 09006142A EP 09006142 A EP09006142 A EP 09006142A EP 2094031 A2 EP2094031 A2 EP 2094031A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- channel
- stereo
- uncoded
- channels
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S3/004—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Abstract
Description
Die vorliegende Erfindung bezieht sich auf die Multikanal-Audiotechnik und insbesondere auf Multikanal-Audioanwendungen in Verbindung mit Kopfhörer-Techniken.The present invention relates to multi-channel audio technology, and more particularly to multi-channel audio applications in conjunction with headphone techniques.
Die beiden internationalen Patentanmeldungen
Auf einer linken Seite in
Die in
Wäre beispielsweise der Kanal 1 in
Eine solche Filterdarstellung ist in
Jedes der in
Die Tatsache, dass sich die Signale von allen Lautsprechern am Ohr des Zuhörers 207 superponieren, wird durch die Addierer 22 und 23 in
Aufgrund der Tatsache, dass es neben dem Direktschall auch frühe Reflexionen und insbesondere auch einen diffusen Nachhall gibt, welche insbesondere für die Raumwahrnehmung von großer Bedeutung sind, damit der Ton nicht synthetisch oder "hölzern" klingt, sondern dem Hörer das Gefühl vermittelt, er sitzt wirklich in einem Konzertsaal mit seinen akustischen Eigenschaften, werden die Impulsantworten der einzelnen Filter 21 alle eine beträchtliche Länge annehmen. Die Faltung jedes einzelnen Multi-Kanals der Multikanal-Darstellung mit zwei Filtern führt daher bereits zu einer erheblichen Rechenaufgabe. Da für jeden einzelnen Multi-Kanal zwei Filter benötigt werden, nämlich einer für das linke Ohr und ein anderer für das rechte Ohr, werden, wenn der Subwoofer-Kanal ebenfalls eigens behandelt wird, für eine Kopfhörer-Wiedergabe einer 5.1-Multikanal-Darstellung insgesamt 12 voneinander unterschiedliche Filter benötigt. Alle Filter haben, wie es aus
Um das bekannte Konzept in die Realität umzusetzen, wird daher, wie es in
Kopfhörer-Anlagen zum Erzeugen eines Multikanal-Kopfhörer-Sounds sind daher aufwendig, sperrig und teuer, was an der hohen Rechenleistung, am hohen Strombedarf für die nötige hohe Rechenleistung und am hohen Arbeitsspeicherbedarf für die durchzuführenden Bewertungen mit der Impulsantwort und am damit verbundenen großen Volumen oder teuren Bausteinen für das Abspielgerät liegt. Solche Anwendungen sind daher an Home-PC-Soundkarten bzw. Laptop-Soundkarten oder auch Heim-Stereo-Anlagen gebunden.Headphone systems for generating a multi-channel headphone sounds are therefore complicated, bulky and expensive, due to the high computing power, the high power requirements for the necessary high computing power and high memory requirements for the ratings to be performed with the impulse response and the associated large volume or expensive blocks for the player is. Such applications are therefore tied to home PC sound cards or laptop sound cards or home stereo systems.
Insbesondere ist dem immer größer werdenden Markt an mobilen Abspielgeräten, wie beispielsweise mobilen CD-Playern oder insbesondere den Hardware-Playern bleibt der Multikanal-Kopfhörer-Sound verschlossen, da die Rechenanforderungen zum Filtern der Multi-Kanäle mit z. B. 12 unterschiedlichen Filtern sowohl im Hinblick auf die Prozessorressourcen als auch im Hinblick auf den Stromverbrauch der typischerweise batteriebetriebenen Geräte nicht in dem Preissegment realisierbar sind. Hier geht es um ein Preissegment am unteren (niedrigen) Ende der Skala. Gerade dieses Preissegment ist aber aufgrund der großen Stückzahlen wirtschaftlich sehr interessant.In particular, the ever-expanding market for mobile players, such as mobile CD players or in particular the hardware players remains the multi-channel headphone sound closed because the computational requirements for filtering the multi-channels with z. B. 12 different filters both in terms of processor resources as well as in terms of power consumption of the typically battery-powered devices are not feasible in the price segment. This is about a price segment at the lower (low) end of the scale. Especially this price segment is economically very interesting because of the large quantities.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein effizientes Signalverarbeitungskonzept zu liefern, das eine Kopfhörer-Wiedergabe in Multikanal-Qualität auch auf einfachen Wiedergabegeräten ermöglicht.The object of the present invention is to provide an efficient signal processing concept that enables multi-channel headphone reproduction even on simple playback devices.
Diese Aufgabe wird durch eine Vorrichtung zum Erzeugen eines codierten Stereo-Signals nach Patentanspruch 1 oder durch ein Verfahren zum Erzeugen eines codierten Stereo-Signals nach Patentanspruch 11 oder ein Computer-Programm nach Patentanspruch 12 gelöst.This object is achieved by a device for generating a coded stereo signal according to
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass der hoch qualitative und attraktive Multikanal-Kopfhörer-Sound allen verfügbaren Abspielgeräten, wie beispielsweise CD-Playern oder Hardware-Playern, dadurch zur Verfügung gestellt werden kann, dass aus einer Multikanal-Darstellung eines Audiostücks oder Audiodatenstroms, also beispielsweise einer 5.1-Darstellung eines Audiostücks außerhalb eines Hardware-Players, also z. B. in einem rechenstarken Computer eines Providers einer Kopfhörer-Signalverarbeitung unterzogen. Erfindungsgemäß wird das Ergebnis Kopfhörer-Signalverarbeitung jedoch nicht einfach abgespielt, sondern einem typischen Audio-Stereo-Codierer zugeführt, der dann aus dem linken Kopfhörerkanal und dem rechten Kopfhörerkanal ein codiertes Stereosignal erzeugt.The present invention is based on the finding that the high-quality and attractive multi-channel headphone sound can be made available to all available playback devices, such as CD players or hardware players, by providing a multi-channel display of an audio track or audio data stream So, for example, a 5.1 representation of an audio piece outside of a hardware player, so z. B. in a high-power computer of a provider of a headphone signal processing. However, according to the invention, the result of earphone signal processing is not simply played back but fed to a typical audio stereo coder, which then generates a coded stereo signal from the left earphone channel and the right earphone channel.
Dieses codierte Stereosignal kann dann, wie jedes andere codierte Stereosignal, das keine Multikanaldarstellung aufweist, dem Hardware-Player oder z. B. einem mobilen CD-Player in Form einer CD zugeführt werden. Das Wiedergabegerät wird dann den Benutzer mit einem Kopfhörer-Multikanal-Sound versorgen, ohne dass irgendwelche zusätzlichen Ressourcen bzw. Einrichtungen an bereits bestehenden Geräten hinzugefügt werden müssen. Erfindungsgemäß wird das Ergebnis der Kopfhörer-Signalverarbeitung, also das linke und das rechte Kopfhörersignal nicht, wie im Stand der Technik, in einem Kopfhörer wiedergegeben, sondern codiert und als codierte Stereo-Daten ausgegeben.This coded stereo signal can then, like any other coded stereo signal, which has no multi-channel representation, the hardware player or z. B. a mobile CD player in the form of a CD. The player will then provide the user with a headphone multi-channel sound without having to add any additional resources or equipment to existing devices. According to the invention, the result of the headphone signal processing, ie the left and the right headphone signal is not reproduced in a headphone, as in the prior art, but coded and output as coded stereo data.
Eine solche Ausgabe kann eine Speicherung, eine Übertragung oder irgendetwas ähnliches sein. Eine solche Datei mit codierten Stereodaten kann dann ohne weiteres jedem beliebigen für Stereo-Wiedergabe ausgebildeten Wiedergabegerät zugeführt werden, ohne dass der Benutzer irgendwelche Änderungen an seinem Gerät durchführen müsste.Such an output may be a store, a transfer, or anything like that. Such a file with coded stereo data can then be readily supplied to any player designed for stereo playback without the user having to make any changes to his device.
Das erfindungsgemäße Konzept, aus dem Ergebnis der Kopfhörer-Signalverarbeitung ein codiertes Stereo-Signal zu erzeugen, ermöglicht es somit, dass die Multikanal-Darstellung, die eine wesentlich bessere und lebensnahere Qualität für einen Benutzer liefert, auch auf allen einfachen und sehr stark verbreiteten und in Zukunft noch stärker verbreiteten Hardware-Playern eingesetzt werden kann.The concept according to the invention of generating a coded stereo signal from the result of the headphone signal processing thus makes it possible for the multichannel presentation, which provides a much better and more lifelike quality for a user, to also be simple and very widely used in the future even more widespread hardware players can be used.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird von einer codierten Multikanal-Darstellung ausgegangen, also einer Parameterdarstellung, die einen oder typischerweise zwei Basiskanäle aufweist, und die ferner Parameterdaten aufweist, um auf der Basis der Basiskanäle und der Parameterdaten die Multi-Kanäle der Multikanaldarstellung zu erzeugen. Nachdem ein Frequenzbereichbasiertes Verfahren zur Multikanal-Decodierung bevorzugt wird, wird erfindungsgemäß die Kopfhörer-Signalverarbeitung nicht in dem Zeitbereich durch Faltung des Zeitsignals mit der Impulsantwort durchgeführt, sondern im Frequenzbereich durch Multiplikation mit der Filter-Übertragungsfunktion.In a preferred embodiment of the present invention is based on a coded multi-channel representation, that is, a parameter representation having one or typically two base channels, and further comprising parameter data to on the basis of the base channels and the parameter data to the multi-channels of the multi-channel representation produce. After a frequency-domain-based method for multi-channel decoding is preferred, the headphone signal processing according to the invention is performed not in the time domain by convolution of the time signal with the impulse response, but in the frequency domain by multiplication with the filter transfer function.
Dies ermöglicht die Einsparung von wenigstens einer Rücktransformation vor der Kopfhörer-Signalverarbeitung und ist insbesondere dann vorteilhaft, wenn auch der nachfolgende Stereo-Codierer im Frequenzbereich arbeitet, sodass dann, ohne dass jemals in den Zeitbereich gegangen werden muss, die Stereo-Codierung des Kopfhörer-Stereo-Signals ebenfalls ohne Gang in den Zeitbereich erfolgen kann. Die Verarbeitung von der Multikanal-Darstellung bis zum codierten Stereosignal ohne Einschaltung eines Zeitbereichs oder durch eine wenigstens reduzierte Anzahl von Transformationen ist nicht nur im Hinblick auf die Rechenzeiteffizienz interessant, sondern grenzt Qualitätsverluste ein, da weniger Verarbeitungsstufen auch weniger Artefakte in das Audiosignal einführen.This makes it possible to save at least one inverse transformation before the headphone signal processing and is particularly advantageous when the subsequent stereo coder operates in the frequency domain, so that then, without ever having to go into the time domain, the stereo coding of the headphone Stereo signal can also be done without gear in the time domain. The processing from the multi-channel representation to the coded stereo signal without the intervention of a time domain or at least a reduced number of transformations is not only interesting in terms of computational time efficiency, but limits quality losses, since fewer processing stages also introduce fewer artifacts into the audio signal.
Insbesondere bei Block-basierten Verfahren, die unter Berücksichtigung einer psychoakustischen Maskierungsschwelle quantisieren, wie es für den Stereo-Codierer bevorzugt wird, ist es wichtig, so viel Tandem-Codierungs-Artefakte als möglich zu verhindern.In particular, in block-based methods that quantize considering a psychoacoustic masking threshold, as is preferred for the stereo encoder, it is important to prevent as much tandem coding artifacts as possible.
Bei einem besonders bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird als Multikanal-Darstellung eine BCC-Darstellung mit einem oder vorzugsweise zwei Basiskanälen verwendet. Nachdem das BCC-Verfahren im Frequenzbereich arbeitet, werden die Multi-Kanäle nicht, wie beim BCC-Decodierer üblich, nach ihrer Synthese in den Zeitbereich transformiert. Stattdessen wird die blockweise vorliegende Spektraldarstellung der Multikanäle verwendet und der Kopfhörer-Signalverarbeitung unterzogen. Hierzu werden die Übertragungsfunktionen der Filter verwendet, also die Fourier-Transformierten der Impulsantworten, um eine Multiplikation zwischen der Spektraldarstellung der Multi-Kanäle und den Filter-Übertragungsfunktionen durchzuführen. Sofern die Impulsantworten der Filter zeitlich länger als ein Block von Spektralkomponenten am Ausgang des BCC-Decodierers sind, wird eine blockweise Filterverarbeitung bevorzugt, bei der die Impulsantworten der Filter im Zeitbereich getrennt werden und blockweise transformiert werden, um dann entsprechende für solche Maßnahmen nötige Gewichtungen der Spektren durchzuführen, wie sie beispielsweise in der
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
- Fig. 1
- ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Erzeugen eines codierten Stereo-Signals;
- Fig. 2
- eine Detaildarstellung einer Implementierung der Kopfhörer-Signalverarbeitung von
Fig. 1 ; - Fig. 3
- einen bekannten Joint-Stereo-Codierer zum Erzeugen von Kanaldaten und parametrischen Multikanal-Informationen;
- Fig. 4
- eine Darstellung eines Schemas zum Bestimmen von ICLD-, ICTD- und ICC-Parametern für eine BCC-Codierung/Decodierung;
- Fig. 5
- eine Blockdiagrammdarstellung einer BCC-Codierer/Decodierer-Kette;
- Fig. 6
- ein Blockdiagramm einer Implementierung des BCC-Synthese-Blocks von
Fig. 5 ; - Fig. 7
- eine Kaskadierung zwischen einem Multikanal-Decodierer und der Kopfhörer-Signalverarbeitung ohne Transformation in den Zeitbereich;
- Fig. 8
- eine Kaskadierung zwischen der Kopfhörer-Signalverarbeitung und einem Stereo-Codierer ohne Transformation in den Zeitbereich;
- Fig. 9
- ein Prinzip-Blockdiagramm eines bevorzugten Stereo-Codierers;
- Fig. 10
- eine Prinzipdarstellung eines Wiedergabe-Szenarios zum Bestimmen der Filterfunktionen von
Fig. 2 ; - Fig. 11
- eine prinzipielle Darstellung einer zu erwartenden Impulsantwort eines Filters, das gemäß
Fig. 10 bestimmt ist.
- Fig. 1
- a block diagram of the inventive apparatus for generating a coded stereo signal;
- Fig. 2
- a detailed representation of an implementation of the headphone signal processing of
Fig. 1 ; - Fig. 3
- a known joint stereo encoder for generating channel data and multi-channel parametric information;
- Fig. 4
- a representation of a scheme for determining ICLD, ICTD and ICC parameters for BCC encoding / decoding;
- Fig. 5
- a block diagram representation of a BCC encoder / decoder chain;
- Fig. 6
- a block diagram of an implementation of the BCC synthesis block of
Fig. 5 ; - Fig. 7
- a cascading between a multi-channel decoder and the headphone signal processing without transformation into the time domain;
- Fig. 8
- a cascading between the headphone signal processing and a stereo encoder without transformation into the time domain;
- Fig. 9
- a schematic block diagram of a preferred stereo encoder;
- Fig. 10
- a schematic representation of a playback scenario for determining the filter functions of
Fig. 2 ; - Fig. 11
- a schematic representation of an expected impulse response of a filter according to
Fig. 10 is determined.
Ist die Multikanal-Darstellung dagegen in einer codierten Form vorhanden, so umfasst diese codierte Form typischerweise einen oder mehrere Basis-Kanäle sowie Parameter zum Synthetisieren der drei oder mehr Multi-Kanäle aus dem einen oder den beiden Basiskanälen. Ein Multikanal-Decodierer 11 ist daher ein Beispiel für eine Einrichtung zum Bereitstellen der mehr als zwei Multi-Kanäle aus der Multikanal-Darstellung. Liegt die Multikanal-Darstellung dagegen bereits in uncodierter Form vor, also z. B. in Form von 5+1 PCM-Kanälen, so entspricht die Einrichtung zum Bereitstellen einem Eingangsanschluss für eine Einrichtung 12 zum Durchführen einer Kopfhörer-Signalverarbeitung, um das uncodierte Stereosignal mit dem uncodierten ersten Stereo-Kanal 10a und dem uncodierten zweiten Stereo-Kanal 10b zu erzeugen.On the other hand, if the multi-channel representation is in encoded form, this encoded form typically includes one or more base channels and parameters for synthesizing the three or more multi-channels from the one or both base channels. A
Vorzugsweise ist die Einrichtung 12 zum Durchführen Kopfhörer-Signalverarbeitung ausgebildet, um die Multi-Kanäle der Multikanal-Darstellung jeweils mit einer ersten Filterfunktion für den ersten Stereo-Kanal und mit einer zweiten Filterfunktion für den zweiten Stereo-Kanal zu bewerten und bewertete Multi-Kanäle jeweils aufzuaddieren, um den uncodierten ersten Stereo-Kanal und den uncodierten zweiten Stereo-Kanal zu erhalten, wie es anhand von
Erfindungsgemäß wird somit ein Konzept erreicht, das es ermöglicht, Mehrkanalton, der auch als "Surround" bezeichnet wird, über einfache Abspielgeräte, wie beispielsweise Hardware-Player, Stereo-Kopfhörern zuzuführen.According to the invention, a concept is thus achieved which makes it possible to supply multi-channel sound, which is also referred to as "surround", via simple playback devices, such as hardware players, stereo headphones.
Als einfache Kopfhörer-Signalverarbeitung kann z. B. die Summe bestimmter Kanäle gebildet werden, um die Ausgangskanäle für die Stereo-Daten zu erhalten. Verbesserte Verfahren arbeiten mit komplexeren Algorithmen, die wiederum eine bessere Qualität der Wiedergabe erreichen.As a simple headphone signal processing z. B. the sum of certain channels are formed to obtain the output channels for the stereo data. Improved methods work with more complex algorithms, which in turn achieve a better quality of reproduction.
Es sei darauf hingewiesen, dass es das erfindungsgemäße Konzept ermöglicht, dass die rechenaufwendigen Schritte zum Multikanal-Decodieren und zum Durchführen der Kopfhörer-Signalverarbeitung nicht im Abspielgerät selbst durchgeführt werden, sondern extern durchgeführt werden. Das Ergebnis des erfindungsgemäßen Konzepts ist eine codierte Stereo-Datei, die beispielsweise ein MP3-File, ein AAC-File, ein HE-AAC-File oder irgendein anderes Stereo-File ist.It should be noted that the inventive concept allows the computationally expensive steps to multi-channel decode and perform headphone signal processing not be performed in the player itself, but are performed externally. The result of the inventive concept is a coded stereo file, which is for example an MP3 file, an AAC file, a HE AAC file or any other stereo file.
Bei anderen Ausführungsbeispielen können auch die Multikanal-Decodierung, die Kopfhörer-Signalverarbeitung und die Stereo-Codierung auf unterschiedlichen Geräten ausgeführt werden, da die Ausgangsdaten bzw. Eingangsdaten der einzelnen Blöcke leicht portierbar und standardisiert erzeugbar und abspeicherbar sind.In other embodiments, the multi-channel decoding, the headphone signal processing and the stereo encoding can be performed on different devices, since the output data or input data of the individual blocks are easily portable and standardized generated and stored.
Nachfolgend wird Bezug nehmend auf
Bei dem in
Bei einem besonders bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird auf dem Weg von der Multikanal-Darstellung am Eingang des Blocks 11 von
Nachfolgend wird auf bevorzugte Implementierungen des Multikanal-Decodierers bzw. auf bevorzugte Multikanal-Darstellungen anhand der
So existieren in der Technik viele Techniken zum Reduzieren der Datenmenge, die zur Übertragung eines Multikanal-Audiosignals benötigt wird. Solche Techniken werden Joint-Stereo-Techniken genannt. Zu diesem Zweck wird auf
Normalerweise wird der Trägerkanal Subband-Abtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte etc. umfassen, die eine relativ feine Darstellung des zugrundeliegenden Signals liefern, während die parametrischen Daten keine solchen Abtastwerte oder Spektralkoeffizienten umfassen, sondern Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus, wie beispielsweise Gewichten durch Multiplizieren, durch Zeitverschieben, durch Frequenzverschieben, etc. Die parametrischen Multikanalinformationen umfassen daher eine relativ grobe Darstellung des Signals oder des zugeordneten Kanals. In Zahlen ausgedrückt beträgt die Menge an Daten, die von einem Trägerkanal benötigt wird, eine Menge von etwa 60 bis 70 kBit/s, während die Menge an Daten, die durch parametrische Seiteninformationen für einen Kanal benötigt wird, im Bereich von 1,5 bis 2,5 kBit/s ist. Es sei darauf hingewiesen, dass die vorstehenden Zahlen für komprimierte Daten gelten. Selbstverständlich benötigt ein nicht-komprimierter CD-Kanal Datenraten im Bereich von etwa dem Zehnfachen. Ein Beispiel für parametrische Daten sind die bekannten Skalenfaktoren, Intensity-Stereo-Informationen oder BCC-Parameter, wie es nachfolgend dargelegt wird.Normally, the carrier channel will include subband samples, spectral coefficients, time domain samples, etc., which provide a relatively fine representation of the underlying signal, while the parametric data does not include such samples or spectral coefficients, but control parameters for controlling a particular reconstruction algorithm, such as multiplying by weight. by time shifting, by frequency shifting, etc. The parametric multi-channel information therefore comprises a relatively rough representation of the signal or the associated channel. Expressed in numbers, the amount of data needed by a carrier channel is about 60 to 70 kbps, while the amount of data required by one channel parametric page information is in the range of 1.5 to 2.5 kbps. It should be noted that the above figures apply to compressed data. Of course, a non-compressed CD channel requires data rates on the order of about ten times. An example of parametric data is the known scale factors, intensity stereo information, or BCC parameters, as set forth below.
Die Technik der Intensity-Stereo-Codierung ist in dem AES-Preprint 3799, "
Zusätzlich wird bei praktischen Implementierungen das übertragene Signal, d. h. der Trägerkanal aus dem Summensignal des linken Kanals und des rechten Kanals anstatt der Rotation beider Komponenten erzeugt. Ferner wird diese Verarbeitung, d. h. das Erzeugen von Intensity-Stereo-Parametern zum Durchführen der Skalierungsoperationen frequenzselektiv durchgeführt, d. h. unabhängig für jedes Skalenfaktorband, d. h. für jede Codiererfrequenzpartition. Vorzugsweise werden beide Kanäle kombiniert, um einen kombinierten oder "Träger"-Kanal und zusätzlich zu dem kombinierten Kanal die Intensity-Stereo-Informationen zu bilden. Die Intensity-Stereo-Informationen hängen von der Energie des ersten Kanals, der Energie des zweiten Kanals oder der Energie des kombinierten Kanals ab.In addition, in practical implementations, the transmitted signal, i. H. the carrier channel is generated from the sum signal of the left channel and the right channel instead of the rotation of both components. Furthermore, this processing, i. H. generating intensity-stereo parameters to perform the scaling operations in a frequency-selective manner, i. H. independent for each scale factor band, d. H. for each encoder frequency partition. Preferably, both channels are combined to form a combined or "carrier" channel and, in addition to the combined channel, the intensity stereo information. The intensity stereo information depends on the energy of the first channel, the energy of the second channel or the energy of the combined channel.
Die BCC-Technik ist in dem AES-Convention-Paper 5574 "
Auf Decodiererseite empfängt der Decodierer typischerweise ein Monosignal und den BCC-Bitstrom. Das Monosignal wird in den Frequenzbereich transformiert und in einen Raumsyntheseblock (Spatial-Syntheseblock) eingegeben, der auch decodierte ICLD- und ICTD-Werte empfängt. In dem Spatial-Syntheseblock werden die BCC-Parameter (ICLD und ICTD) verwendet, um eine Gewichtungsoperation des Monosignals durchzuführen, um die Multikanalsignale zu synthetisieren, die, nach einer Frequenz-/Zeit-Umwandlung eine Rekonstruktion des ursprünglichen Multikanal-Audiosignals darstellen.On the decoder side, the decoder typically receives a mono signal and the BCC bit stream. The mono signal is transformed into the frequency domain and input to a spatial synthesis block which also receives decoded ICLD and ICTD values. In the spatial synthesis block, the BCC parameters (ICLD and ICTD) are used to perform a weighting operation of the mono signal to synthesize the multi-channel signals representing, after a frequency / time conversion, a reconstruction of the original multi-channel audio signal.
Im Fall von BCC ist das Joint-Stereo-Modul 60 wirksam, um die kanalseitigen Informationen so auszugeben, dass die parametrischen Kanaldaten quantisierte und codierte ICLD- oder ICTD-Parameter sind, wobei einer der ursprünglichen Kanäle als Referenzkanal zum Codieren der Kanalseiteninformationen verwendet wird.In the case of BCC, the
Normalerweise wird der Trägersignal aus der Summe der teilnehmenden Ursprungskanäle gebildet.Normally, the carrier signal is formed from the sum of the participating source channels.
Natürlich liefern die obigen Techniken nur eine Monodarstellung für einen Decodierer, der nur den Trägerkanal verarbeiten kann, der jedoch nicht in der Lage ist, die parametrischen Daten zur Erzeugung von einer oder mehreren Approximationen von mehr als einem Eingangskanal zu verarbeiten.Of course, the above techniques provide only a monodic representation for a decoder that can only process the carrier channel, but is unable to process the parametric data to produce one or more approximations of more than one input channel.
Die BCC-Technik ist auch in den US-Patentveröffentlichungen
Nachfolgend wird ein typisches BCC-Schema zur Multikanalaudiocodierung detaillierter dargestellt, und zwar Bezug nehmend auf die
Andere Downmixing-Schemen sind in der Technik bekannt, so dass unter Verwendung eines Multikanal-Eingangssignals ein Downmix-Kanal mit einem einzigen Kanal erhalten wird.Other downmixing schemes are known in the art such that a single channel downmix channel is obtained using a multi-channel input signal.
Dieser einzige Kanal wird an einer Summensignalleitung 115 ausgegeben. Eine Seiteninformation, die von dem BCC-Analyseblock 116 erhalten wird, wird auf einer Seiteninformationsleitung 117 ausgegeben.This single channel is output on a
Bei dem BCC-Analyseblock werden Interkarial-Pegelunterschiede (ICLD) und Interkanal-Zeitunterschiede (ICTD) berechnet, wie es vorstehend dargestellt worden ist. Neuerdings ist der BCC-Analyseblock 116 auch in der Lage, Interkanal-Korrelationswerte (ICC-Werte) zu berechnen. Das Summensignal und die Seiteninformationen werden in einem quantisierten und codierten Format zu einem BCC-Decodierer 120 übertragen. Der BCC-Decodierer zerlegt das übertragene Summensignal in eine Anzahl von Subbändern und führt Skalierungen, Verzögerungen und andere Verarbeitungsschritte aus, um die Subbänder der auszugebenden Multikanal-Audiokanäle zu liefern. Diese Verarbeitung wird so durchgeführt, dass die ICLD-, ICTD- und ICC-Parameter (Cues) eines rekonstruierten Multikanalsignals am Ausgang 121 mit den entsprechenden Cues für das ursprüngliche Multikanalsignal am Eingang 110 in dem BCC-Codierer 112 übereinstimmen. Zu diesem Zweck umfasst der BCC-Decodierer 120 einen BCC-Syntheseblock 122 und einen Seiteninformationenüberarbeitungsblock 123.In the BCC analysis block, inter-carial level differences (ICLD) and inter-channel time differences (ICTD) are calculated, as shown above. Recently, the
Nachfolgend wird der interne Aufbau des BCC-Syntheseblocks 122 Bezug nehmend auf
Der BCC-Syntheseblock 122 umfasst ferner eine Verzögerungsstufe 126, eine Pegelmodifikationsstufe 127, eine Korrelationsverarbeitungsstufe 128 und eine Inversfilterbankstufe IFB 129. Am Ausgang der Stufe 129 kann das rekonstruierte Multikanalaudiosignal mit beispielsweise fünf Kanälen im Falle eines 5-Kanal-Surroundsystems zu einem Satz von Lautsprechern 124 ausgegeben werden, wie sie in
Das Eingangssignal sn wird in den Frequenzbereich oder den Filterbankbereich mittels des Elements 125 umgewandelt. Das Signal, das vom Element 125 ausgegeben wird, wird derart kopiert, dass mehrere Versionen desselben Signals erhalten werden, wie es durch den Kopierknoten 130 dargestellt ist. Die Anzahl der Versionen des ursprünglichen Signals ist gleich der Anzahl der Ausgangskanäle in dem Ausgangssignal. Dann wird jede Version des ursprünglichen Signals am Knoten 130 einer bestimmten Verzögerung d1, d2, ..., di, ... dN unterzogen. Die Verzögerungsparameter werden durch den Seiteninformationsverarbeitungsblock 123 in
Dasselbe gilt für die Multiplikationsparameter a1, a2, ..., ai, ..., aN, die ebenfalls durch den Seiteninformationsverarbeitungsblock 123 basierend auf den Interkanal-Pegelunterschieden, wie sie durch den BCC-Analyseblock 116 berechnet worden sind, berechnet werden.The same applies to the multiplication parameters a 1 , a 2 ,..., A i ,..., A N , which are also calculated by the page
Die durch den BCC-Analyseblock 116 berechneten ICC-Parameter werden zum Steuern der Funktionalität des Blocks 128 verwendet, so dass bestimmte Korrelationen zwischen den verzögerten und in ihren Pegeln manipulierten Signalen an den Ausgängen des Blocks 128 erhalten werden. Es sei hier darauf hingewiesen, dass die Reihenfolge der Stufen 126, 127, 128 von der in
Es sei darauf hingewiesen, dass bei einer rahmenweisen Verarbeitung des Audiosignals auch die BCC-Analyse rahmenweise durchgeführt wird, also zeitlich variabel, und dass ferner eine frequenzweise BCC-Analyse erhalten wird, wie es durch die Filterbank-Aufteilung aus
Nachfolgend wird Bezug nehmend auf
ICC-Parameter können auf verschiedene Arten und Weisen definiert werden. Allgemein gesagt kann man ICC-Parameter in dem Codierer zwischen allen möglichen Kanalpaaren bestimmen, wie es in
Bezüglich der Berechnung beispielsweise der Multiplikationsparameter a1, aN basierend auf den übertragenen ICLD-Parametern wird auf das AES-Convention-Paper Nr. 5574 Bezug genommen. Die ICLD-Parameter stellen eine Energieverteilung eines ursprünglichen Mehrkanalsignals dar. Ohne Verlust der Allgemeinheit wird es bevorzugt, wie es in
Bei dem in
Im Hinblick auf eine komplette im Frequenzbereich stattfindende Verarbeitung sei darauf hingewiesen, dass dann der Multikanal-Decodierer, also z. B. die Filterbank 125 von
Die Eingangsdaten bzw. Ausgangsdaten beim erfindungsgemäßen Konzept sind daher vorzugsweise im Frequenzbereich codiert mittels Transformation/Filterbank und sind nach psychoakustischen Vorgaben unter Ausnutzung von Verdeckungseffekten codiert, wobei insbesondere im Decodierer eine spektrale Darstellung der Signale vorliegen sollte. Beispiele hierfür sind MP3-Dateien, AAC-Dateien oder AC3-Dateien. Die Eingangsdaten bzw. Ausgangsdaten können jedoch auch durch Summen- und Differenzbildung codiert sein, wie es bei so genannten matrizierten Verfahren der Fall ist. Beispiele hierfür sind Dolby ProLogic, Logic7 oder Circle Surround. Die Daten insbesondere der Multikanaldarstellung können zusätzlich mit parametrischen Verfahren codiert sein, wie es bei MP3 Surround der Fall ist, wobei dieses Verfahren auf der BCC-Technik basiert.The input data or output data in the inventive concept are therefore preferably coded in the frequency domain by means of transformation / filter bank and are coded according to psychoacoustic specifications taking advantage of masking effects, in which case a spectral representation of the signals should be present in particular in the decoder. Examples include MP3 files, AAC files or AC3 files. However, the input data or output data can also be encoded by summing and subtraction, as is the case with so-called matrixed methods. Examples are Dolby ProLogic, Logic7 or Circle Surround. The data, in particular the multichannel representation, can additionally be coded with parametric methods, as is the case with MP3 surround, this method being based on the BCC technique.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Erzeugen in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung eines erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.Depending on the circumstances, the inventive method for generating can be implemented in hardware or in software. The implementation may be on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which may interact with a programmable computer system such that the method is performed. In general, the invention thus also consists in a computer program product with a program code stored on a machine-readable carrier for carrying out a method according to the invention, when the computer program product runs on a computer. In other words, the invention can thus be realized as a computer program with a program code for carrying out the method when the computer program runs on a computer.
Claims (11)
wobei die Einrichtung (11) zum Bereitstellen ausgebildet ist, um aus dem einen oder den mehreren Basiskanälen und den Parameterinformationen die wenigstens drei Multi-Kanäle zu berechnen.
einer Einrichtung (12) zum Durchführen einer Kopfhörer-Signalverarbeitung, um ein uncodiertes Stereosignal mit einem uncodierten ersten Stereo-Kanal (10a) und einem uncodierten zweiten Stereo-Kanal (10b) zu erzeugen, wobei die Einrichtung (12) zum Durchführen ausgebildet ist,
um jeden Multi-Kanal mit einer ersten Filterfunktion (HiL), die von einer virtuellen Position eines Lautsprechers zum Wiedergeben des Multi-Kanals und einer virtuellen ersten Ohrposition eines Hörers abgeleitet ist, für den ersten Stereo-Kanal und mit einer zweiten Filterfunktion (HiR), die von einer virtuellen Position des Lautsprechers und einer virtuellen zweiten Ohrposition des Hörers abgeleitet ist, für den zweiten Stereo-Kanal zu bewerten, um für jeden Multi-Kanal einen ersten bewerteten Kanal und einen zweiten bewerteten Kanal zu erzeugen, wobei die beiden virtuellen Ohrpositionen des Hörers unterschiedlich sind,
um die bewerteten ersten Kanäle aufzuaddieren (22), um den uncodierten ersten Stereo-Kanal (10a) zu erhalten, und
um die bewerteten zweiten Kanäle aufzuaddieren (23), um den uncodierten zweiten Stereo-Kanal (10b) zu erhalten; und
einem Stereo-Codierer (13) zum Codieren des ersten uncodierten Stereo-Kanals (10a) und des uncodierten zweiten Stereo-Kanals (10b), um das codierte Stereo-Signal (14) zu erhalten, wobei der Stereo-Codierer derart ausgebildet ist, dass eine Datenrate, die zum Übertragen des codierten Stereo-Signals nötig ist, kleiner als eine Datenrate ist, die zum Übertragen des uncodierten Stereo-Signals nötig ist.Apparatus for generating a coded stereo signal of an audio piece or audio data stream having a first stereo channel and a second stereo channel from a multi-channel representation of the audio piece or audio data stream having information over more than two multi-channels, comprising:
wherein the means (11) for providing is adapted to calculate from the one or more base channels and the parameter information the at least three multi-channels.
means (12) for performing headphone signal processing to produce an uncoded stereo signal having an uncoded first stereo channel (10a) and an uncoded second stereo channel (10b), the means (12) being adapted to pass through,
for each multi-channel having a first filter function (H iL ) derived from a virtual position of a loudspeaker for reproducing the multi-channel and a virtual first ear position of a listener for the first stereo channel and with a second filter function (H iR ) derived from a virtual position of the loudspeaker and a virtual second ear position of the listener for the second Evaluate a stereo channel to produce for each multi-channel a first weighted channel and a second weighted channel, the two virtual ear positions of the listener being different,
to add up the weighted first channels (22) to obtain the uncoded first stereo channel (10a), and
to add up the weighted second channels (23) to obtain the uncoded second stereo channel (10b); and
a stereo encoder (13) for encoding the first uncoded stereo channel (10a) and the uncoded second stereo channel (10b) to obtain the encoded stereo signal (14), the stereo encoder being arranged a data rate necessary for transmitting the encoded stereo signal is less than a data rate necessary for transmitting the uncoded stereo signal.
bei der die Einrichtung (11) zum Bereitstellen ausgebildet ist, um ausgangsseitig eine blockweise Frequenzbereichsdarstellung für jeden Multikanal zu liefern, und
bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um die blockweise Frequenzbereichs-Darstellung mit einer Frequenzbereichs-Darstellung der ersten und der zweiten Filterfunktion zu bewerten.Device according to claim 1,
wherein the means (11) for providing is adapted to provide a block-wise frequency domain representation for each multichannel on the output side, and
in which the means (12) for performing is designed to evaluate the block-wise frequency domain representation with a frequency domain representation of the first and the second filter function.
bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um eine blockweise Frequenzbereichs-Darstellung des uncodierten ersten Stereokanals und des uncodierten zweiten Stereo-Kanals zu liefern, und
bei der der Stereo-Codierer (13) ein Transformationsbasierter Codierer ist und ferner ausgebildet ist, um die blockweise Frequenzbereichsdarstellung des uncodierten ersten Stereo-Kanals und des uncodierten zweiten Stereo-Kanals ohne eine Umsetzung von der Frequenzbereichs-Darstellung in eine zeitliche Darstellung zu verarbeiten.Device according to one of the preceding claims,
wherein the means (12) is arranged to perform to provide a block-wise frequency domain representation of the uncoded first stereo channel and the uncoded second stereo channel, and
wherein the stereo encoder (13) is a transform based encoder and is further configured to process the block-wise frequency domain representation of the uncoded first stereo channel and the uncoded second stereo channel without conversion from the frequency domain representation to a temporal representation.
bei der der Stereo-Codierer (13) ausgebildet ist, um eine gemeinsame Stereo-Codierung (15) des ersten und des zweiten Stereokanals durchzuführen.Device according to one of the preceding claims,
wherein the stereo encoder (13) is adapted to perform a common stereo coding (15) of the first and the second stereo channel.
bei der der Stereo-Codierer (13) ausgebildet ist, um einen Block von Spektralwerten unter Verwendung einer psychoakustischen Maskierungsschwelle zu quantisieren (16) und einer Entropie-Codierung (17) zu unterziehen, um das codierte Stereo-Signal zu erhalten.Device according to one of the preceding claims,
wherein the stereo encoder (13) is adapted to quantize a block of spectral values using a psychoacoustic masking threshold (16) and an entropy coding (17) to obtain the coded stereo signal.
bei der die Einrichtung (11) zum Bereitstellen als BCC-Decodierer ausgebildet ist.Device according to one of the preceding claims,
in which the device (11) is designed to be provided as a BCC decoder.
bei der die Einrichtung (11) zum Bereitstellen als Multikanal-Decodierer ausgebildet ist, der eine Filterbank mit mehreren Ausgängen aufweist,
bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um Signale an den Filterbank-Ausgängen mit der ersten und der zweiten Filterfunktion zu bewerten, und
bei der der Stereo-Codierer (13) ausgebildet ist, um den im Frequenzbereich vorliegenden uncodierten ersten Stereo-Kanal und den im Frequenzbereich vorliegenden uncodierten zweiten Stereo-Kanal zu quantisieren (16) und einer Entropie-Codierung (17) zu unterziehen, um das codierte Stereo-Signal zu erhalten.Device according to one of the preceding claims,
in which the means (11) for providing is designed as a multi-channel decoder which has a filter bank with a plurality of outputs,
wherein the means (12) is adapted to perform to evaluate signals at the filter bank outputs with the first and the second filter function, and
in which the stereo coder (13) is designed to quantize (16) and to apply an entropy coding (17) to the uncoded first stereo channel present in the frequency domain and the uncoded second stereo channel present in the frequency domain to get encoded stereo signal.
wobei beim Bereitstellen aus dem einen oder den mehreren Basiskanälen und den Parameterinformationen die wenigstens drei Multi-Kanäle berechnet werden;
Durchführen (12) einer Kopfhörer-Signalverarbeitung, um ein uncodiertes Stereosignal mit einem uncodierten ersten Stereo-Kanal (10a) und einem uncodierten zweiten Stereo-Kanal (10b) zu erzeugen, wobei der Schritt des Durchführens (12) folgende Schritte aufweist:
wherein when providing from the one or more base channels and the parameter information, the at least three multi-channels are calculated;
Performing (12) headphone signal processing to produce an uncoded stereo signal having an uncoded first stereo channel (10a) and an uncoded second stereo channel (10b), the step of performing (12) comprising the steps of:
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005010057A DE102005010057A1 (en) | 2005-03-04 | 2005-03-04 | Apparatus and method for generating a coded stereo signal of an audio piece or audio data stream |
EP06707184A EP1854334B1 (en) | 2005-03-04 | 2006-02-22 | Device and method for generating an encoded stereo signal of an audio piece or audio data stream |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP06707184A Division EP1854334B1 (en) | 2005-03-04 | 2006-02-22 | Device and method for generating an encoded stereo signal of an audio piece or audio data stream |
Publications (2)
Publication Number | Publication Date |
---|---|
EP2094031A2 true EP2094031A2 (en) | 2009-08-26 |
EP2094031A3 EP2094031A3 (en) | 2014-10-01 |
Family
ID=36649539
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP09006142.5A Ceased EP2094031A3 (en) | 2005-03-04 | 2006-02-22 | Device and method for creating an encoding stereo signal of an audio section or audio data stream |
EP06707184A Active EP1854334B1 (en) | 2005-03-04 | 2006-02-22 | Device and method for generating an encoded stereo signal of an audio piece or audio data stream |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP06707184A Active EP1854334B1 (en) | 2005-03-04 | 2006-02-22 | Device and method for generating an encoded stereo signal of an audio piece or audio data stream |
Country Status (20)
Country | Link |
---|---|
US (1) | US8553895B2 (en) |
EP (2) | EP2094031A3 (en) |
JP (1) | JP4987736B2 (en) |
KR (1) | KR100928311B1 (en) |
CN (1) | CN101133680B (en) |
AT (1) | ATE461591T1 (en) |
AU (1) | AU2006222285B2 (en) |
BR (1) | BRPI0608036B1 (en) |
CA (1) | CA2599969C (en) |
DE (2) | DE102005010057A1 (en) |
ES (1) | ES2340796T3 (en) |
HK (1) | HK1111855A1 (en) |
IL (1) | IL185452A (en) |
MX (1) | MX2007010636A (en) |
MY (1) | MY140741A (en) |
NO (1) | NO339958B1 (en) |
PL (1) | PL1854334T3 (en) |
RU (1) | RU2376726C2 (en) |
TW (1) | TWI322630B (en) |
WO (1) | WO2006094635A1 (en) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005010057A1 (en) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a coded stereo signal of an audio piece or audio data stream |
US7876904B2 (en) * | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
KR101499785B1 (en) | 2008-10-23 | 2015-03-09 | 삼성전자주식회사 | Method and apparatus of processing audio for mobile device |
PL2647222T3 (en) | 2010-12-03 | 2015-04-30 | Fraunhofer Ges Forschung | Sound acquisition via the extraction of geometrical information from direction of arrival estimates |
EP2705516B1 (en) * | 2011-05-04 | 2016-07-06 | Nokia Technologies Oy | Encoding of stereophonic signals |
FR2976759B1 (en) * | 2011-06-16 | 2013-08-09 | Jean Luc Haurais | METHOD OF PROCESSING AUDIO SIGNAL FOR IMPROVED RESTITUTION |
JP6007474B2 (en) * | 2011-10-07 | 2016-10-12 | ソニー株式会社 | Audio signal processing apparatus, audio signal processing method, program, and recording medium |
US20140341404A1 (en) * | 2012-01-17 | 2014-11-20 | Koninklijke Philips N.V. | Multi-Channel Audio Rendering |
US9602927B2 (en) * | 2012-02-13 | 2017-03-21 | Conexant Systems, Inc. | Speaker and room virtualization using headphones |
KR20140017338A (en) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | Apparatus and method for audio signal processing |
JP6160072B2 (en) * | 2012-12-06 | 2017-07-12 | 富士通株式会社 | Audio signal encoding apparatus and method, audio signal transmission system and method, and audio signal decoding apparatus |
JP6328662B2 (en) | 2013-01-15 | 2018-05-23 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | Binaural audio processing |
CN104919820B (en) * | 2013-01-17 | 2017-04-26 | 皇家飞利浦有限公司 | binaural audio processing |
EP2757559A1 (en) | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
US10075795B2 (en) | 2013-04-19 | 2018-09-11 | Electronics And Telecommunications Research Institute | Apparatus and method for processing multi-channel audio signal |
WO2014171791A1 (en) | 2013-04-19 | 2014-10-23 | 한국전자통신연구원 | Apparatus and method for processing multi-channel audio signal |
US9412385B2 (en) * | 2013-05-28 | 2016-08-09 | Qualcomm Incorporated | Performing spatial masking with respect to spherical harmonic coefficients |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
TWI774136B (en) * | 2013-09-12 | 2022-08-11 | 瑞典商杜比國際公司 | Decoding method, and decoding device in multichannel audio system, computer program product comprising a non-transitory computer-readable medium with instructions for performing decoding method, audio system comprising decoding device |
KR102244379B1 (en) | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | Parametric reconstruction of audio signals |
CN112002337A (en) * | 2015-03-03 | 2020-11-27 | 杜比实验室特许公司 | Method, device and equipment for processing audio signal |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
AU2016312404B2 (en) | 2015-08-25 | 2020-11-26 | Dolby International Ab | Audio decoder and decoding method |
TWI577194B (en) * | 2015-10-22 | 2017-04-01 | 山衛科技股份有限公司 | Environmental voice source recognition system and environmental voice source recognizing method thereof |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
CN112261545A (en) * | 2019-07-22 | 2021-01-22 | 海信视像科技股份有限公司 | Display device |
US11523239B2 (en) | 2019-07-22 | 2022-12-06 | Hisense Visual Technology Co., Ltd. | Display apparatus and method for processing audio |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994001933A1 (en) | 1992-07-07 | 1994-01-20 | Lake Dsp Pty. Limited | Digital filter having high accuracy and efficiency |
WO1999014983A1 (en) | 1997-09-16 | 1999-03-25 | Lake Dsp Pty. Limited | Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener |
WO1999049574A1 (en) | 1998-03-25 | 1999-09-30 | Lake Technology Limited | Audio signal processing method and apparatus |
US20030026441A1 (en) | 2001-05-04 | 2003-02-06 | Christof Faller | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US20030219130A1 (en) | 2002-05-24 | 2003-11-27 | Frank Baumgarte | Coherence-based audio coding and synthesis |
KR20040027015A (en) * | 2002-09-27 | 2004-04-01 | (주)엑스파미디어 | New Down-Mixing Technique to Reduce Audio Bandwidth using Immersive Audio for Streaming |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US602349A (en) * | 1898-04-12 | Abrading mechanism | ||
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
JPH04240896A (en) * | 1991-01-25 | 1992-08-28 | Fujitsu Ten Ltd | Sound field controller |
FR2688371B1 (en) * | 1992-03-03 | 1997-05-23 | France Telecom | METHOD AND SYSTEM FOR ARTIFICIAL SPATIALIZATION OF AUDIO-DIGITAL SIGNALS. |
US5703999A (en) * | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
DE4236989C2 (en) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Method for transmitting and / or storing digital signals of multiple channels |
JPH06269097A (en) * | 1993-03-11 | 1994-09-22 | Sony Corp | Acoustic equipment |
US5488665A (en) | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
JP3404837B2 (en) * | 1993-12-07 | 2003-05-12 | ソニー株式会社 | Multi-layer coding device |
US5659619A (en) * | 1994-05-11 | 1997-08-19 | Aureal Semiconductor, Inc. | Three-dimensional virtual audio display employing reduced complexity imaging filters |
US5982903A (en) * | 1995-09-26 | 1999-11-09 | Nippon Telegraph And Telephone Corporation | Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5742689A (en) * | 1996-01-04 | 1998-04-21 | Virtual Listening Systems, Inc. | Method and device for processing a multichannel signal for use with a headphone |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JP3948752B2 (en) * | 1996-04-10 | 2007-07-25 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Encoding device for encoding multiple information signals |
AUPP271598A0 (en) * | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Headtracked processing for headtracked playback of audio signals |
CN1065400C (en) | 1998-09-01 | 2001-05-02 | 国家科学技术委员会高技术研究发展中心 | Compatible AC-3 and MPEG-2 audio-frequency code-decode device and its computing method |
CA2309077A1 (en) * | 1998-09-02 | 2000-03-16 | Matsushita Electric Industrial Co., Ltd. | Signal processor |
DE19932062A1 (en) * | 1999-07-12 | 2001-01-18 | Bosch Gmbh Robert | Process for the preparation of source-coded audio data as well as the sender and receiver |
JP2001100792A (en) * | 1999-09-28 | 2001-04-13 | Sanyo Electric Co Ltd | Encoding method, encoding device and communication system provided with the device |
JP3335605B2 (en) * | 2000-03-13 | 2002-10-21 | 日本電信電話株式会社 | Stereo signal encoding method |
JP3616307B2 (en) * | 2000-05-22 | 2005-02-02 | 日本電信電話株式会社 | Voice / musical sound signal encoding method and recording medium storing program for executing the method |
JP2002191099A (en) * | 2000-09-26 | 2002-07-05 | Matsushita Electric Ind Co Ltd | Signal processor |
JP3228474B2 (en) * | 2001-01-18 | 2001-11-12 | 日本ビクター株式会社 | Audio encoding device and audio decoding method |
JP2002262385A (en) * | 2001-02-27 | 2002-09-13 | Victor Co Of Japan Ltd | Generating method for sound image localization signal, and acoustic image localization signal generator |
JP2003009296A (en) * | 2001-06-22 | 2003-01-10 | Matsushita Electric Ind Co Ltd | Acoustic processing unit and acoustic processing method |
BRPI0308148A2 (en) * | 2002-04-05 | 2016-06-21 | Koninkl Philips Electronics Nv | methods and apparatus for encoding n input signals and for decoding encoded data representative of n signals, signal format, and recording carrier |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
KR100522593B1 (en) | 2002-07-08 | 2005-10-19 | 삼성전자주식회사 | Implementing method of multi channel sound and apparatus thereof |
RU2363116C2 (en) * | 2002-07-12 | 2009-07-27 | Конинклейке Филипс Электроникс Н.В. | Audio encoding |
JP4084990B2 (en) * | 2002-11-19 | 2008-04-30 | 株式会社ケンウッド | Encoding device, decoding device, encoding method and decoding method |
JP4369140B2 (en) | 2003-02-17 | 2009-11-18 | パナソニック株式会社 | Audio high-efficiency encoding apparatus, audio high-efficiency encoding method, audio high-efficiency encoding program, and recording medium therefor |
FR2851879A1 (en) * | 2003-02-27 | 2004-09-03 | France Telecom | PROCESS FOR PROCESSING COMPRESSED SOUND DATA FOR SPATIALIZATION. |
JP2004309921A (en) * | 2003-04-09 | 2004-11-04 | Sony Corp | Device, method, and program for encoding |
US7949141B2 (en) * | 2003-11-12 | 2011-05-24 | Dolby Laboratories Licensing Corporation | Processing audio signals with head related transfer function filters and a reverberator |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US20050276430A1 (en) * | 2004-05-28 | 2005-12-15 | Microsoft Corporation | Fast headphone virtualization |
US20050273324A1 (en) * | 2004-06-08 | 2005-12-08 | Expamedia, Inc. | System for providing audio data and providing method thereof |
JP2005352396A (en) * | 2004-06-14 | 2005-12-22 | Matsushita Electric Ind Co Ltd | Sound signal encoding device and sound signal decoding device |
DE102005010057A1 (en) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a coded stereo signal of an audio piece or audio data stream |
-
2005
- 2005-03-04 DE DE102005010057A patent/DE102005010057A1/en not_active Withdrawn
-
2006
- 2006-02-22 EP EP09006142.5A patent/EP2094031A3/en not_active Ceased
- 2006-02-22 AU AU2006222285A patent/AU2006222285B2/en active Active
- 2006-02-22 CN CN2006800070351A patent/CN101133680B/en active Active
- 2006-02-22 MX MX2007010636A patent/MX2007010636A/en active IP Right Grant
- 2006-02-22 ES ES06707184T patent/ES2340796T3/en active Active
- 2006-02-22 EP EP06707184A patent/EP1854334B1/en active Active
- 2006-02-22 WO PCT/EP2006/001622 patent/WO2006094635A1/en active Application Filing
- 2006-02-22 RU RU2007136792/09A patent/RU2376726C2/en active
- 2006-02-22 PL PL06707184T patent/PL1854334T3/en unknown
- 2006-02-22 DE DE502006006444T patent/DE502006006444D1/en active Active
- 2006-02-22 KR KR1020077020085A patent/KR100928311B1/en active IP Right Grant
- 2006-02-22 CA CA2599969A patent/CA2599969C/en active Active
- 2006-02-22 JP JP2007557373A patent/JP4987736B2/en active Active
- 2006-02-22 BR BRPI0608036-7A patent/BRPI0608036B1/en active IP Right Grant
- 2006-02-22 AT AT06707184T patent/ATE461591T1/en active
- 2006-02-24 MY MYPI20060803A patent/MY140741A/en unknown
- 2006-03-02 TW TW095106978A patent/TWI322630B/en active
-
2007
- 2007-08-17 US US11/840,273 patent/US8553895B2/en active Active
- 2007-08-22 IL IL185452A patent/IL185452A/en active IP Right Grant
- 2007-10-03 NO NO20075004A patent/NO339958B1/en unknown
-
2008
- 2008-06-03 HK HK08106174.7A patent/HK1111855A1/en unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1994001933A1 (en) | 1992-07-07 | 1994-01-20 | Lake Dsp Pty. Limited | Digital filter having high accuracy and efficiency |
WO1999014983A1 (en) | 1997-09-16 | 1999-03-25 | Lake Dsp Pty. Limited | Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener |
WO1999049574A1 (en) | 1998-03-25 | 1999-09-30 | Lake Technology Limited | Audio signal processing method and apparatus |
US20030026441A1 (en) | 2001-05-04 | 2003-02-06 | Christof Faller | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US20030219130A1 (en) | 2002-05-24 | 2003-11-27 | Frank Baumgarte | Coherence-based audio coding and synthesis |
KR20040027015A (en) * | 2002-09-27 | 2004-04-01 | (주)엑스파미디어 | New Down-Mixing Technique to Reduce Audio Bandwidth using Immersive Audio for Streaming |
Non-Patent Citations (4)
Title |
---|
HERRE J ET AL: "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", AUDIO ENGINEERING SOCIETY. CONVENTION PREPRINT, XX, XX, 8 May 2004 (2004-05-08), pages 1 - 14, XP002338414 * |
J. HERRE; K.H. BRANDENBURG; D. LEDERER: "Intensity Stereo Coding", AES-PREPRINT 3799, February 1994 (1994-02-01) |
T. FALLER; F. BAUMGARTE: "Binaural Cue Coding applied to stereo and multichannel audio compression", AES-CONVENTION-PAPER 5574, May 2002 (2002-05-01) |
T. FALLER; F. BAUMGARTE: "Binaural Cue Coding. Part II: Schemes and Applications", IEEE TRANS. ON AUDIO AND SPEECH PROC., vol. 11, no. 6, November 2003 (2003-11-01) |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1854334B1 (en) | Device and method for generating an encoded stereo signal of an audio piece or audio data stream | |
DE602006000239T2 (en) | ENERGY DEPENDENT QUANTIZATION FOR EFFICIENT CODING OF SPATIAL AUDIOPARAMETERS | |
DE602004004168T2 (en) | COMPATIBLE MULTICHANNEL CODING / DECODING | |
DE602005006385T2 (en) | DEVICE AND METHOD FOR CONSTRUCTING A MULTI-CHANNEL OUTPUT SIGNAL OR FOR PRODUCING A DOWNMIX SIGNAL | |
EP1687809B1 (en) | Device and method for reconstruction a multichannel audio signal and for generating a parameter data record therefor | |
DE102006050068B4 (en) | Apparatus and method for generating an environmental signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program | |
DE69633633T2 (en) | MULTI-CHANNEL PREDICTIVE SUBBAND CODIER WITH ADAPTIVE, PSYCHOACOUS BOOK ASSIGNMENT | |
EP1763870B1 (en) | Generation of a multichannel encoded signal and decoding of a multichannel encoded signal | |
DE602005006424T2 (en) | STEREO COMPATIBLE MULTICHANNEL AUDIO CODING | |
EP1999999B1 (en) | Generation of spatial downmixes from parametric representations of multi channel signals | |
DE69933659T2 (en) | METHOD AND SYSTEM FOR SPATIAL CODING WITH LOW BITRATE | |
EP1803117B1 (en) | Individual channel temporal envelope shaping for binaural cue coding schemes and the like | |
DE602005002942T2 (en) | METHOD FOR DISPLAYING MULTI CHANNEL AUDIO SIGNALS | |
DE102013223201B3 (en) | Method and device for compressing and decompressing sound field data of a region | |
KR20070028481A (en) | Multi-channel synthesizer and method for generating a multi-channel output signal | |
DE102005014477A1 (en) | Apparatus and method for generating a data stream and generating a multi-channel representation | |
EP2891334B1 (en) | Producing a multichannel sound from stereo audio signals | |
WO2007118533A1 (en) | Apparatus and method for production of a surrounding-area signal | |
WO2014072513A1 (en) | Non-linear inverse coding of multichannel signals | |
DE102020210917B4 (en) | Improved M/S stereo encoder and decoder | |
EP1719128A1 (en) | Device and method for writing on an audio cd, and audio cd |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AC | Divisional application: reference to earlier application |
Ref document number: 1854334 Country of ref document: EP Kind code of ref document: P |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR |
|
RIN1 | Information on inventor provided before grant (corrected) |
Inventor name: MUNDT, HARALD Inventor name: POPP, HARALD Inventor name: PLOGSTIES, JAN |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1135548 Country of ref document: HK |
|
PUAL | Search report despatched |
Free format text: ORIGINAL CODE: 0009013 |
|
AK | Designated contracting states |
Kind code of ref document: A3 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR |
|
RIC1 | Information provided on ipc code assigned before grant |
Ipc: H04S 3/00 20060101AFI20140826BHEP Ipc: G10L 19/00 20130101ALI20140826BHEP |
|
17P | Request for examination filed |
Effective date: 20150323 |
|
RBV | Designated contracting states (corrected) |
Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR |
|
17Q | First examination report despatched |
Effective date: 20160404 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED |
|
18R | Application refused |
Effective date: 20171214 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1135548 Country of ref document: HK |