CH708710A1 - Deriving multi-channel signals from two or more base signals. - Google Patents
Deriving multi-channel signals from two or more base signals. Download PDFInfo
- Publication number
- CH708710A1 CH708710A1 CH01727/13A CH17272013A CH708710A1 CH 708710 A1 CH708710 A1 CH 708710A1 CH 01727/13 A CH01727/13 A CH 01727/13A CH 17272013 A CH17272013 A CH 17272013A CH 708710 A1 CH708710 A1 CH 708710A1
- Authority
- CH
- Switzerland
- Prior art keywords
- signal
- frequency
- channel
- channels
- dependent
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Abstract
Die Erfindung betrifft ein Verfahren zur Extraktion mindestens eines Ausgangssignals aus zwei Eingangssignalen. Das Verfahren umfasst die direkte Extraktion von Multikanalsignalen anhand von Korrelationsvergleich, welche einerseits für zeitinvariante (stationäre) Signale eine mathematisch exakte Lösung liefert, und bei zeitvarianten (nichtstationären) Signalen ein spezifisches Residualverhalten aufweist. Dies führte zum unmittelbaren Nachweis eines, allen Residualen zugrundeliegenden, sehr einfach zu bestimmenden Signals. Dieses lässt sich beispielsweise in der Audiokodierung für die effiziente Verminderung von Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten benutzen – und führt zur effizienten Kodierung von Signalen höchster Ordnung (wie etwa NHK 22.2).The invention relates to a method for extracting at least one output signal from two input signals. The method comprises the direct extraction of multichannel signals on the basis of correlation comparison which, on the one hand, provides a mathematically exact solution for time-invariant (stationary) signals and exhibits a specific residual behavior for time-variant (non-stationary) signals. This led to the direct detection of a very easy to determine signal for all residuals. This can be used, for example, in audio coding for the efficient reduction of artifacts or color discoloration and other unmasking effects - and leads to the efficient coding of signals of the highest order (such as NHK 22.2).
Description
Beschreibung description
[0001 ] Multikanalsignale und insbesondere dreidimensionale Signale wie beispielsweise Audiosignale stellen hohe Anforderungen an zu übertragende oder zu speichernde Datenmengen, die es möglich effizient zu reduzieren gilt. Multichannel signals and in particular three-dimensional signals such as audio signals place high demands on data sets to be transmitted or stored, which it is possible to efficiently reduce.
[0002] Allgemeine bekannte Vorrichtungen oder Verfahren für eine derartige Datenreduktion sind hier parametrische Verfahren, die räumliche Information beispielsweise anhand der aus dem Stand der Technik bekannten Fast Fourier Transform (FFT) extrahieren und anschliessend als permanenten Datenstrom, etwa gemeinsam mit einem Mono- oder Stereosignal als Downmixsignal, übertragen. Eine solche Audio-Technologie ist insbesondere mit MPEG Surround bekannt und stellt mathematisch betrachtet ein adaptives Filterverfahren dar. Commonly known devices or methods for such data reduction are here parametric methods that extract spatial information, for example, using the known from the prior art Fast Fourier Transform (FFT) and then as a permanent data stream, such as together with a mono or stereo signal as downmix signal, transmitted. Such an audio technology is known in particular with MPEG Surround and mathematically represents an adaptive filtering method.
[0003] Die eigene unveröffentlichte Anmeldung CH 02 300/12, die beispielhaft anhand von Fig. 9 kurz erläutert wird, schlägt dahingegen erstmals den Einsatz der sogenannten nichtlinearen inversen Kodierung vor, dies unter zusätzlichem Einsatz von Korrelationsvergleich; dieser Ansatz kann, da nur noch die Parameters eines räumlichen Modells, dies nicht permanent, als Fleaderinformation oder Datenpuls übertragen werden müssen, mathematisch als ein statisches Filterverfahren betrachtet werden. The own unpublished application CH 02 300/12, which is briefly explained by way of example with reference to FIG. 9 proposes, however, for the first time the use of the so-called non-linear inverse coding, this with the additional use of correlation comparison; This approach can, because only the parameters of a spatial model, this does not have to be transmitted permanently, as Fleaderinformation or data pulse, mathematically be considered as a static filtering method.
[0004] Allerdings gibt CH 02 300/12 keine explizite technische Lösung für einen solchen Korrelationsvergleich an, da hier aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren existieren wie beispielsweise das Upmix-System UPM1 des britischen Unternehmens Soundfield, das, gleichfalls auf FFT basierend, insgesamt einen hohen Rechenaufwand erfordert. Die Bildung der Ausgangssignale erfolgt hier allerdings amplitudenabhängig, was den Nachteil wandernder Schallquellen und zeitlich sich verschiebender Artefakte auf den einzelnen Kanälen mit sich bringt, und insgesamt zu deutlichen spektralen Verfärbungen führt, die im Bereich der Audiokodierung sich störend auswirken. However, CH 02 300/12 does not provide any explicit technical solution for such a correlation comparison, since devices or methods known from the prior art exist here, for example the Upmix system UPM1 of the British company Soundfield, which, likewise based on FFT , a total of high computational complexity requires. The formation of the output signals takes place here, however, amplitude dependent, which brings the disadvantage of migrating sound sources and temporally shifting artifacts on the individual channels, and overall leads to significant spectral discoloration, which have a disturbing effect in the audio coding.
[0005] Eine einfache Vorrichtung oder ein einfaches Verfahren für einen solchen Korrelationsvergleich, das zudem das Ziel einer möglichst hohen psychoakustischen Transparenz erfüllt, wäre demnach beispielsweise in Hinblick auf die Kodierung von Multikanalsignalen in Echtzeit wünschenswert. A simple device or a simple method for such a correlation comparison, which also fulfills the goal of the highest possible psychoacoustic transparency, would therefore be desirable, for example, with regard to the coding of multichannel signals in real time.
[0006] Sofern eine solche einfache Vorrichtung oder ein einfaches Verfahren, wie dies für die vorliegende Erfindung der Fall ist, auf einer Fourier-Transformation basiert, die auf sich zeitlich verändernde («nichtstationäre») Signale angewandt wird, treten sogenannte Residuale auf. Es ist in diesem Falle wünschenswert, diese Residuale in einem Encoder so allgemein bestimmen zu können, dass nicht sämtliche Residuale übertragen werden müssen, was beispielsweise in der Audiokodierung zu deutlicher Bandbreitenersparnis führt. If such a simple device or a simple method, as is the case for the present invention, based on a Fourier transform, which is applied to time-varying ("non-stationary") signals, so-called residuals occur. It is desirable in this case to be able to determine these residuals in an encoder in such a general way that not all residuals need to be transmitted, which leads to significant bandwidth savings, for example in audio coding.
[0007] Die vorliegende Erfindung soll demnach eine einfache Vorrichtung oder ein einfaches Verfahren darstellen, welche einen solchen Korrelationsvergleich bei höchster Transparenz leistet. The present invention is therefore intended to represent a simple device or a simple method, which makes such a correlation comparison with maximum transparency.
[0008] Sie bleibt nicht auf Audiosignale beschränkt, obwohl sich insbesondere auf diese ein solches System optimal anwenden lässt. So lassen sich mit dem Erfindungsgegenstand etwa Videosignale effizient komprimieren und dekomprimieren - bzw. deren Residuale effizient minimieren. It is not limited to audio signals, although in particular can be optimally applied to such a system. For example, with the subject matter of the invention, video signals can be efficiently compressed and decompressed-or their residuals efficiently minimized.
[0009] Allgemein lässt sich der Erfindungsgegenstand in der gesamten Signaltechnik anwenden, sofern dieser eine Fourier-Transformation bzw. eine inverse Fourier-Transformation zugrunde liegt, und führt dort beispielsweise zu drastischer Bandbreitenersparnis oder ermöglicht eine effiziente Datenextraktion. In general, the subject invention can be applied in the entire signal technology, provided that it is based on a Fourier transform or an inverse Fourier transform, where it leads, for example, to drastic bandwidth savings or allows efficient data extraction.
[0010] Mit vorliegender Erfindung lässt sich beispielsweise in der Audiokodierung die Anzahl der Downmixkanäle auf ein Minimum beschränken, da die zugemischten Kanäle sich wiederum durch Korrelationsvergleich isolieren lassen und somit insgesamt eine effiziente Speicherung und Übertragung hochkomplexer Audiosignale ermöglichen. With the present invention, for example, in the audio encoding, the number of downmix channels can be kept to a minimum, since the mixed channels can in turn be isolated by correlation comparison and thus allow overall efficient storage and transmission of highly complex audio signals.
[0011 ] Insbesondere lassen sich solche hochkomplexen 3D-Audiosignale, wie sie beispielsweise mit dem Format NHK 22.2 bekannt sind, nunmehr in entsprechende Downmixkanäle zusammenfassen, die teilweise oder insgesamt wiederum einem solchen Korrelationsvergleich unterworfen werden können. In particular, such highly complex 3D audio signals, as they are known, for example, with the NHK 22.2 format, can now be combined into corresponding downmix channels, which can be subjected in part or in total to such a correlation comparison.
[0012] Beispielsweise lassen der Middle Layer und der Top Layer eines NHK-22.2-Systems (oder eines ähnlichen Formats) sich getrennt derartigen Korrelationsvergleichen unterziehen, da psychoakustisch horizontale Ebenen im Wesentlichen getrennt wahrgenommen werden, und es zwischen diesen Ebenen, also in der Vertikalen, Diagonalen etc., nur in geringem Masse zur Bildung von Phantomschallquellen kommt. For example, the middle layer and the top layer of a NHK-22.2 system (or similar format) separately undergo such correlation comparisons, since psychoacoustically horizontal planes are perceived substantially separately, and between these planes, that is, vertically , Diagonals, etc., comes only to a small extent to the formation of phantom sound sources.
[0013] Besonders vorteilhaft ist es demnach, derartige Korrelationsvergleiche innerhalb horizontaler Ebenen anzuwenden. Insbesondere ist es vorteilhaft, auch wenn sich die Erfindung nicht darauf beschränkt, derartige Korrelationsvergleiche auf benachbarten Kanälen auszuführen, da bei Signalen hoher Ordnung eine strikte Kanaltrennung eine Grundvoraussetzung für die saubere Bildung von Phantomschallquellen bildet. Accordingly, it is particularly advantageous to apply such correlation comparisons within horizontal levels. In particular, although the invention is not limited to performing such correlation comparisons on adjacent channels, it is advantageous that strict channel separation is a prerequisite for the clean formation of phantom sound sources in high order signals.
[0014] Natürlich bleibt die Erfindung nicht auf die Horizontale beschränkt, sondern es können auch vertikale bzw. diagonale oder sonstige Kombinationen verwendet werden. Of course, the invention is not limited to the horizontal, but it can also be used vertical or diagonal or other combinations.
[0015] Folgende Dokumente sind insbesondere als zum Stand der Technik gehörig zu betrachten: The following documents are to be considered in particular as belonging to the prior art:
[0016] EP 1 850 639 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden. EP 1 850 639 describes a static filter which generates a stereo signal from a mono signal. This filter can also be applied to multi-channel signals.
2 [0017] WO 2009 138 205 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden. [0017] WO 2009 138 205 describes a static filter which generates a stereo signal from a mono signal. This filter can also be applied to multi-channel signals.
[0018] WO 201 1 009 649 beschreibt eine Erweiterung der in EP 1 850 639 und WO 2009 138 205 beschriebenen statischen Filter zur Anpassung des Korrelationsgrads des jeweils erzeugten Stereosignals. Diese Erweiterung kann auch auf Multikanalsignale angewandt werden. WO 201 1 009 649 describes an extension of the static filters described in EP 1 850 639 and WO 2009 138 205 for adapting the degree of correlation of the respectively generated stereo signal. This extension can also be applied to multi-channel signals.
[0019] WO 201 1 009 650 beschreibt Erweiterungen der in EP 1 850 639 und WO 2009 138 205 und WO 201 1 009 649 beschriebenen Vorrichtungen oder Verfahren, um das jeweils erzeugte Stereosignal hinsichtlich der statischen Parameter zu optimieren. Diese Erweiterungen können auch auf Multikanalsignale angewandt werden. [0019] WO 201 1 009 650 describes extensions of the devices or methods described in EP 1 850 639 and WO 2009 138 205 and WO 201 1 009 649 in order to optimize the respectively generated stereo signal with regard to the static parameters. These extensions can also be applied to multi-channel signals.
[0020] WO 2012 016 992 beschreibt die erstmalige praktische Verwendung von algebraischen Invarianten allgemein in der Signaltechnik und insbesondere auf EP 1 850 639, WO 2009 138 205, WO 2011 009 649 und WO 2011 009 650. [0020] WO 2012 016 992 describes the first practical use of algebraic invariants generally in signaling technology and more particularly EP 1 850 639, WO 2009 138 205, WO 2011 009 649 and WO 2011 009 650.
[0021 ] WO 2012 032 178 beschreibt die zeitliche Skalierung von statischen Filtern gemäss EP 1 850 639, WO 2009 138 205, WO 201 1 009 649, WO 201 1 009 650 und WO 2012 016 992. WO 2012 032 178 describes the temporal scaling of static filters according to EP 1 850 639, WO 2009 138 205, WO 201 1 009 649, WO 201 1 009 650 and WO 2012 016 992.
[0022] Eigene unveröffentlichte Anmeldung CH 02 300/12, die beispielhaft anhand Fig. 9 kurz dargestellt wird, beschreibt Erweiterungen dieser statischen Filter für deren gezielte Anwendung auf Multikanalsignale, dies auch unter Anwendung von direktem Korrelationsvergleich, der beispielsweise unter direktem Einsatz des Upmix-Systems UPMI des britischen Unternehmens Soundfield stattfinden kann. Own unpublished application CH 02 300/12, which is briefly illustrated by way of example with reference to FIG. 9, describes extensions of these static filters for their specific application to multichannel signals, this also using direct correlation comparison, for example under direct use of the upmix Systems UPMI of the British company Soundfield can take place.
[0023] FIAMASAKI KIMIO ET AL:. «The 22.2 Multichannel Sound System and Its Application», AES CONVENTION 1 18, MAY 2005, beschreibt ein kanalbasiertes Wiedergabeformat höchster Ordnung und räumlicher Auflösung. FIAMASAKI KIMIO ET AL :. "The 22.2 Multichannel Sound System and Its Applica- tion", AES CONVENTION 1 18, MAY 2005, describes a channel-based playback format of highest order and spatial resolution.
[0024] MPEG Surround umschreibt als Standard die Verwendung sogenannter parametrischer Verfahren zur Übertragung von Multikanalsignalen auf Basis eines Mono- oder Stereosignals. MPEG Surround circumscribes as a standard the use of so-called parametric method for the transmission of multi-channel signals based on a mono or stereo signal.
Offenbarung der Erfindung Disclosure of the invention
[0025] In eigener unveröffentlichter Anmeldung CH 02 300/12, siehe Fig. 9 bzw. unten, wird eine Extraktion von Multikanalsignalen anhand von Korrelationsvergleich vorgeschlagen; das Dokument gibt jedoch keine explizite technische Lösung für einen solchen Korrelationsvergleich an, da aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren existieren. In its own unpublished application CH 02 300/12, see Fig. 9 and below, an extraction of multi-channel signals is proposed based on correlation comparison; however, the document does not provide an explicit technical solution for such a correlation comparison, since devices or methods known in the art exist.
[0026] Einen solchen Korrelationsvergleich leistet beispielsweise das Upmix-System UPM1 des britischen Unternehmens Soundfield, das, gleichfalls auf der Fast Fourier Transform (FFT, siehe unten) basierend, insgesamt einen hohen Rechenaufwand erfordert. Die Bildung der Ausgangssignale erfolgt hier allerdings amplitudenabhängig, was den Nachteil wandernder Schallquellen und zeitlich sich verschiebender Artefakte auf den einzelnen Kanälen mit sich bringt, und insgesamt zu deutlichen spektralen Verfärbungen führt, die im Bereich der Audiokodierung sich störend auswirken. Such a correlation comparison makes, for example, the upmix system UPM1 the British company Soundfield, which, also based on the Fast Fourier Transform (FFT, see below), requires a total of high computational effort. The formation of the output signals takes place here, however, amplitude dependent, which brings the disadvantage of migrating sound sources and temporally shifting artifacts on the individual channels, and overall leads to significant spectral discoloration, which have a disturbing effect in the audio coding.
[0027] Ein solcher Korrelationsvergleich kann beispielsweise auf einen sogenannten Downmix angewendet werden, bei dem dasselbe Signal oder gleichartige Signalanteile mit weiteren ursprünglichen oder sukzessive gebildeten Kanälen addiert wurden, wobei ein oder mehrere Pegel von einem oder mehreren ursprünglichen oder sukzessive gebildeten Signalen bekannt sein können. Such a correlation comparison can for example be applied to a so-called downmix, in which the same signal or similar signal components have been added to further original or successively formed channels, wherein one or more levels of one or more original or successively formed signals can be known.
[0028] Im Folgenden wird als Teil des Erfindungsgegenstands ein solcher Korrelationsvergleich zweier Signale L,<'>und R,<'>, bei welchen respektiv identische Signalanteile x(t) und y(t), welche für die Kurzzeit-Kreuzkorrelation In the following, as part of the subject invention, such a correlation comparison of two signals L, <'> and R, <'>, in which identical identical signal components x (t) and y (t), which for the short-term cross-correlation
5T f<x(t)ymt>' „rym,rr τ den Korrelationsgrad +1 aufweisen vorgeschlagen, der einerseits für zeitinvariante (stationäre) Signale eine mathematisch exakte Lösung darstellt, und bei Zeitvarianten (nichtstationären) Signalen ein spezifisches Residualverhalten aufweist (wobei ein Residual die Differenz zwischen dem ursprünglichen, nichtstationären Signalabschnitts und dessen Fourier-Transformation darstellt). 5T f <x (t) ymt> '"rym, rr τ have the degree of correlation +1, on the one hand represents a mathematically exact solution for time-invariant (stationary) signals, and has a specific residual behavior in time variants (non-stationary) signals (where Residual represents the difference between the original, non-stationary signal section and its Fourier transform).
[0029] Die mögliche Gewinnung des entsprechenden Residuals wird als Teil des Erfindungsgegenstands ebenfalls dargestellt. The possible recovery of the corresponding residual is also shown as part of the subject invention.
[0030] Im weiteren wird als Teil des Erfindungsgegenstands, welcher sich das spezifische Residualverhalten zunutze macht, eine näherungsweise Extraktionsmethode für Residuale vorgeschlagen, sofern die Residuale des Gesamtsystems bekannt ist. Furthermore, as part of the subject of the invention, which makes use of the specific residual behavior, an approximate extraction method for residuals is proposed, as long as the residuals of the overall system are known.
[0031 ] Betrachtet werden zwei Kanäle L,<'>, R,<'>, I < i < n, welche gleichartige Signalanteile C * aufweisen, wobei gilt: Consider two channels L, <'>, R, <'>, I <i <n, which have similar signal components C *, where:
3 Li + Ci li'(t) li<*>(t) + Ci<*>(t) 3 Li + Ci li '(t) li <*> (t) + Ci <*> (t)
Ri Ri
Ri + Ci Ri + Ci
= ri = ri
'(t) ri (t) + Ci (t) '(t) ri (t) + Ci (t)
[0032] Für die zeitabhängigen Signale I,<'>(t) und r{ (t) werden nunmehr jeweils die Fourier-Reihen bestimmt. Es gilt demnach für die Synthese, k = ...,-1,0, 1, ... oo li (t) = ^ xke<lkü>ot>k=-°° For the time-dependent signals I, <'> (t) and r {(t), the Fourier series are now determined in each case. Accordingly, for the synthesis, k = ..., - 1,0, 1, ... oo li (t) = ^ xke <lkü> ot> k = - °°
·/ M - · / M -
/£ Σ=-« / £ Σ = - «
Vk e ikü)0t und für die Analyse Vk e ikü) 0t and for the analysis
[0033] [0033]
(t)e~<ikc>°o *dt (t) e ~ <ikc> ° o * dt
<Γ>°/2<Γ> ° / 2
(t)e-ifco)0tdtund in der Praxis für die diskrete Fourier-Transformationen (DFT), aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen, wobei nunmehr k = 0, ..., N - 1 : (t) e-ifco) 0tdt and in practice for the discrete Fourier transforms (DFT), from which the Fast Fourier Transforms (FFT) can be directly derived, where now k = 0, ..., N-1:
N-1 N-1
L'i (fc) = e<~l~>ü<mk>m- 0 N-1 L'i (fc) = e <~ l ~> ü <mk> m-0 N-1
R- ( k ) = rl m)e~<l~>N<mk>m= 0 R- (k) = rl m) e ~ <l ~> N <mk> m = 0
[0034] Die Realteile von U R, und C, lassen sich für stationäre Signale für alle k = 0, N - 1 dann gemäss folgender Regeln wiedergewinnen: The real parts of U R, and C, can then be recovered for stationary signals for all k = 0, N-1 according to the following rules:
1. Bestimme die Vorzeichen der Realteile von L,<'>(k) und R,<'>(k). 1. Determine the signs of the real parts of L, <'> (k) and R, <'> (k).
2. Sind für k die Vorzeichen identisch, bestimme 2. If the signs are identical for k, determine
- die Beträge der Realteile von L,<'>(k) und R,<'>(k), - the magnitudes of the real parts of L, <'> (k) and R, <'> (k),
- die Minima bzw. Maxima dieser Beträge der Realteile von L,<'>(k) und Rf (k). - the minima or maxima of these amounts of the real parts of L, <'> (k) and Rf (k).
- Wähle jeweils als Realteil für C, (k) den diesem Minimum zugrundeliegenden Realteil von L,<'>(k) oder R,<'>(k). - Choose in each case as real part for C, (k) the real part of L, <'> (k) or R, <'> (k) on which this minimum is based.
- Subtrahiere den Realteil von C, (k) von dem Maximum zugrundeliegenden Realteil von L,<'>(k) oder R,<'>(k) und wähle, sofern der Realteil von L,<'>(k) diesem Maximum zugrunde liegt, das Resultat dieser Subtraktion als Realteil für L, (k), andernfalls, sofern der Realteil von R,<'>(k) diesem Maximum zugrunde liegt, das Resultat dieser Substraktion als Realteil für R, (k). - Subtract the real part of C, (k) the real part of L, <'> (k) or R, <'> (k) underlying the maximum and, if the real part of L, <'> (k), choose this maximum otherwise the result of this subtraction as a real part for L, (k), otherwise, if the real part of R, <'> (k) underlies this maximum, the result of this subtraction as a real part for R, (k).
- Setze den noch nicht bestimmten Realteil von L, (k) oder R, (k) gleich Null. - Set the not yet determined real part of L, (k) or R, (k) equal to zero.
4 3. Sind die Vorzeichen der Realteile von L<'>(k) und R,<'>(k) nicht identisch, setze C, (k) qleich Null und setze L (k) = L·<'>(k) und Rj (k)= R,<'>(k). 4 3. If the signs of the real parts of L <'> (k) and R, <'> (k) are not identical, set C, (k) equal to zero and set L (k) = L · <'> (k ) and Rj (k) = R, <'> (k).
[0035] Die Imaginärteile von L,, R, und C, lassen sich für stationäre Signale für alle k = 0, ..., N - 1 gemäss folgender Regeln wiedergewinnen: The imaginary parts of L ,, R, and C, can be recovered for stationary signals for all k = 0, ..., N - 1 according to the following rules:
1. Bestimme die Vorzeichen der Imaginärteile von L,<'>(k) und Rf (k). 1. Determine the signs of the imaginary parts of L, <'> (k) and Rf (k).
2. Sind für k die Vorzeichen identisch, bestimme 2. If the signs are identical for k, determine
- die Beträge der Imaginärteile von L,<'>(k) und Rf (k), the magnitudes of the imaginary parts of L, k (k) and Rf (k),
- die Minima bzw. Maxima dieser Beträge der Imaginärteile von L,<'>(k) und Rf (k). - the minima or maxima of these amounts of imaginary parts of L, <'> (k) and Rf (k).
- Wähle jeweils als Imaginärteil für C, (k) den diesem Minimum zugrundeliegenden Imaginärteil von L,<'>(k) oder R,<'>(k). - Choose as imaginary part for C, (k) the imaginary part of L, <'> (k) or R, <'> (k) on which this minimum is based.
- Subtrahiere den Imaginärteil von Q (k) von dem Maximum zugrundeliegenden Imaginärteil von L,<'>(k) oder R,<'>Subtract the imaginary part of Q (k) from the maximum underlying imaginary part of L, <'> (k) or R, <'>
(k) und wähle, sofern der Imaginärteil von L,<'>(k) diesem Maximum zugrunde liegt, das Resultat dieser Substraktion als Imaginärteil für L, (k), andernfalls, sofern der Imaginärteil von R<'>(k) diesem Maximum zugrunde liegt, das Resultat dieser Substraktion als Imaginärteil für R, (k). (k) and, if the imaginary part of L, <'> (k) underlies this maximum, choose the result of this subtraction as an imaginary part for L, (k), otherwise, if the imaginary part of R <'> (k) Maximum, the result of this subtraction as an imaginary part for R, (k).
- Setze den noch nicht bestimmten Imaginärteil von L, (k) oder R, (k) gleich Null. - Set the not yet determined imaginary part of L, (k) or R, (k) equal to zero.
3. Sind die Vorzeichen der Imaginärteile von L,<'>(k) und R,<'>(k) nicht identisch, setze C, (k) gleich Null und setze L, (k) 3. If the signs of the imaginary parts of L, <'> (k) and R, <'> (k) are not identical, set C, (k) equal to zero and set L, (k)
= U<'>(k) und Rj (k) = R,<'>(k). = U <'> (k) and Rj (k) = R, <'> (k).
[0036] Um abschliessend L, R, und C, zu gewinnen, werden für die Synthese für die zeitabhängigen Signale, k = ..., -1 , Finally, in order to obtain L, R, and C, for synthesis for the time-dependent signals, k = ..., -1,
0 1 k (t) = ^ fke<ik>“o* fe=-oo<r><<(t)>= Σ gke<iko}>^ k=-°° 0 1 k (t) = ^ fke <ik> "o * fe = -oo <r> << (t)> = Σ gke <iko}> ^ k = - °°
(t) = hke<ikü>ot>(t) = hke <ikü> ot>
(bzw. in der Praxis für die Analyse mittels diskreten Fourier-Transformationen (DFT), k = 0, ..., N - 1 , (or in practice for analysis by discrete Fourier transforms (DFT), k = 0, ..., N-1,
N -l N -l
Σ . , h(m)e<1>m=0 Σ. , h (m) e <1> m = 0
N-l i , N-1 i,
Ri (k) = rt(m)e . ,2π<1>N mk i , -2π j-mk , Ri (k) = rt (m) e. , 2π <1> N mk i, -2π j-mk,
Σ .2π , c£(m)e<l>N<mk>m= 0 N -l m= 0 aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen) für die Synthese die Koeffizienten fk, gk, hkbestimmt, k = 0, 1 , ..., gemäss der Analyse Σ .2π, c £ (m) e <l> N <mk> m = 0 N -lm = 0 from which the Fast Fourier Transforms (FFT) can be directly derived) for the synthesis the coefficients fk, gk, hk are determined, k = 0, 1, ..., according to the analysis
5<><Γ>°/2ί = ί h e-^dt<ι>° 5 <> <Γ> ° / 2ί = ί h e- ^ dt <ι> °
<“Γη>/2< "Γη> / 2
'0 / / 2 '0 / / 2
9k = ί Ά (t)e~<ik<>°<ot>dt<ι>° h 9k = ί Ά (t) e ~ <ik <> ° <ot> dt <ι> ° h
' '
J (t)e<~ikü>0>‘ dt J (t) e <~ ikü> 0> 'dt
• •
// 2 bzw. für die Synthese gemäss der inversen diskreten Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transforms (IFFT) ableiten lassen, k = 0, N - 1 , // 2 or for the synthesis according to the inverse discrete Fourier transformation (IDFT), from which the Inverse Fast Fourier Transforms (IFFT) can be derived directly, k = 0, N-1,
N m— 0 N-l m=0 N m- 0 N-1 m = 0
„ JV-1 "JV-1
1 ,.•22n7 ci(m = ij<c>A; i<k>^<e N>,.•22n7Γ A; n/c m= 0 1, • 22n7 ci (m = ij <c> A; i <k> ^ <e N> ,. • 22n7Γ A; n / c m = 0
[0037] Da eine Reihe von Audiocodecs zur verlustfreien oder verlustbehafteten Komprimierung von Audiosignalen sich bereits die Fourier-Transformation bzw. FFT zunutze machen, können im Übrigen mit geringem Rechenaufwand die oben beschriebenen Regeln zur Gewinnung der Realteile bzw. Imaginärteile unmittelbar in solche Audiocodecs integriert werden, bzw. Signale aus derartigen Audiocodecs abgeleitet werden, die diesen Regeln zur Gewinnung der Realteile bzw. Imaginärteile unterworfen werden können. Moreover, since a number of audio codecs for lossless or lossy compression of audio signals already make use of the Fourier transformation or FFT, the rules described above for obtaining the real parts or imaginary parts can be integrated directly into such audio codecs with little computation effort , or signals derived from such audio codecs that can be subjected to these rules for obtaining the real parts or imaginary parts.
[0038] Der schematische Ablauf eines solchen Korrelationsvergleichs ist in Fig. 15 beispielhaft dargestellt: The schematic sequence of such a correlation comparison is shown by way of example in FIG. 15:
[0039] Für je einen Kanal des zeitabhängigen Downmixsignals L, (t), R, (t) wird zuerst eine Fast Fourier Transform (FFT) ausgeführt, und es ergeben sich somit die frequenzabhängigen komplexwertigen Signalbeschreibungen L, (k) und R, (k). Auf diese werden nunmehr die Regeln zur Gewinnung der Realteile und der Imaginärteile von L,, R, und C, angewandt. Auf die resultierenden Signalbeschreibungen L, (k), R, (k) und C,(k) wird abschliessend je eine Inverse Fast Fourier Transform (IFFT) angewandt. Es ergeben sich die zeitabhängigen Signale C, (t), l, (t) und ri (t). For each one channel of the time-dependent downmix signal L, (t), R, (t), a Fast Fourier Transform (FFT) is executed first, and thus the frequency-dependent complex-valued signal descriptions L, (k) and R, ( k). Now the rules for obtaining the real parts and the imaginary parts of L ,, R, and C are applied to them. Finally, an Inverse Fast Fourier Transform (IFFT) is applied to the resulting signal descriptions L, (k), R, (k) and C, (k). The result is the time-dependent signals C, (t), l, (t) and ri (t).
[0040] Für nichtstationäre Signale tritt bei dieser Form des Korrelationsvergleichs ein Residual Δ auf, das generell folgendes Verhalten aufweist: For non-stationary signals occurs in this form of the correlation comparison, a residual Δ, which generally has the following behavior:
Li = L * + Δ R, = Ri* + Δ Ci = C * - 2Δ Li = L * + ΔR, = Ri * + ΔCi = C * - 2Δ
[0041 ] Dieses Residual spielt psychoakustisch, sofern es sich um die reine Wiedergabe von Lj, Rj und C, nach einer inversen diskreten Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, innerhalb einer normativen Abhörsituation (innerhalb des «Sweet Spot») handelt, keine Rolle, da das Residual ausgelöscht wird. Ausserhalb des «Sweet Spot», wie dies bei Abhörsituationen des täglichen Lebens und bei nicht normativen Lautsprecheraufstellungen vorkommt, kann es jedoch zu deutlich hörbaren Artefakten kommen, die es zu vermeiden gilt. This residual plays psychoacoustically, as far as it concerns the pure reproduction of Lj, Rj and C, according to an inverse discrete Fourier transform (IDFT), from which the Inverse Fast Fourier Transform (IFFT) can be directly derived normative interception situation (within the sweet spot) does not matter because the residual is wiped out. Outside of the "sweet spot", as is the case with daily life interception situations and with non-normative loudspeaker constellations, however, clearly audible artifacts can occur which must be avoided.
[0042] Insbesondere können bei der räumlichen Kodierung von Multikanalsignalen, sofern dieser derart extrahierte Signale zugrundeliegen, besonders ausserhalb der normativen Abhörsituation (ausserhalb des «Sweet Spot») sich Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte ergeben. In particular, in the spatial coding of multi-channel signals, provided that these signals thus extracted, especially outside the normative listening situation (outside of the "sweet spot"), discoloration of the tone and other unmasking effects result.
[0043] Abhängig vom Anwendungsfall ist es somit wünschenswert, solche Residuale zu bestimmen, dies beispielsweise in einem Encoder, und gegebenenfalls, um die Anzahl der Übertragungskanäle insgesamt zu vermindern, diese möglichst Depending on the application, it is thus desirable to determine such residuals, for example in an encoder, and, if appropriate, in order to reduce the number of transmission channels as a whole, if possible
6 gut zu approximieren, um Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte bei der weiteren räumlichen Kodierung zu minimieren bzw. hinsichtlich der subjektiven Wahrnehmung zu eliminieren. 6 to approximate to discoloration of the timbre and other unmasking effects in the further spatial coding to minimize or eliminate in terms of subjective perception.
[0044] Das Residual Δ selbst lässt sich etwa frequenzabhängig (die Fourier-Transformation für L, oder R, oder C, ist bereits bekannt, und es ist somit nur noch in derselben Weise, wie für L, oder R, oder C, beschrieben, die Fourier-Transformation für Li* oder R * oder C * auszuführen) für jede Frequenz k wie folgt gewinnen (bei frequenzabhängiger Berechnung ist gegebenenfalls für A(k) im Anschluss eine inverse diskrete Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, wie für L, oder R, oder C, beschrieben, auszuführen): The residual Δ itself can be approximately frequency-dependent (the Fourier transformation for L, or R, or C, is already known, and it is thus described only in the same manner as for L, or R, or C. to carry out the Fourier transformation for Li * or R * or C *) for each frequency k as follows (in the case of frequency-dependent computation, an inverse discrete Fourier transformation (IDFT), if any, for A (k)) may be used immediately to derive the Inverse Fast Fourier Transform (IFFT), as described for L, or R, or C, to execute):
A(k) = Li (k) - Li* (k) oder A (k) = Li (k) - Li * (k) or
A(k) = Ri (k) - R *(k) oder A (k) = R i (k) - R * (k) or
A(k) = 1/2* (C*i(k) - Ci (k)) A (k) = 1/2 * (C * i (k) -Ci (k))
[0045] Dies bedeutet, dass zur Gewinnung eines residualfreien Signals mittels Korrelationsvergleich aus zwei Kanälen L,<'>und R|<'>, 1 < i < n, welche gleichartige Signalanteile C * aufweisen, auch das zugehörige Residual Δ bekannt sein muss, welches etwa innerhalb des Encoder bestimmt wird, was beispielsweise in der Audiokodierung eine grosse Einschränkung darstellt, da sich etwa die absolut an den Decoder zu übertragende Kanalanzahl dahingehend nicht vermindern lässt, dass jedem Korrelationsvergleich auch ein solches Residual beigefügt werden muss. Alternativ können die Residuale auch zeitabhängig bestimmt werden, wenn das durch Korrelationsvergleich bestimmte gemeinsame Signal C, (t) oder das durch Korrelationsvergleich bestimmte erste Individualsignal L, (t) oder das durch Korrelationsvergleich bestimmte zweite Individualsignal R, (t) zeitabhängig vorliegt. This means that to obtain a residual-free signal by means of correlation comparison from two channels L, R 'and R 1, 1 <i <n, which have similar signal components C *, the associated residual Δ must also be known which is determined approximately within the encoder, which represents a major limitation in audio coding, for example, since the absolute number of channels to be transmitted to the decoder can not be reduced to the effect that each such correlation comparison must also be accompanied by such a residual. Alternatively, the residuals can also be determined as a function of time if the common signal C, (t) determined by correlation comparison or the first individual signal L, (t) determined by correlation comparison or the second individual signal R, (t) determined by correlation comparison is time-dependent.
[0046] Prinzipiell lassen sich solche residualfreien Signale durch simple Substraktion bzw. Addition sowohl frequenzabhängig als auch zeitabhängig gewinnen: In principle, such non-residue signals can be obtained by simple subtraction or addition both frequency-dependent and time-dependent:
Li* = Li - Δ Ri* = Ri - Δ C * = Ci + 2Δ Li * = Li - ΔRi * = Ri - ΔC * = Ci + 2Δ
[0047] Allerdings lässt sich zeigen, dass beispielsweise für jeweils benachbarte Kanäle L,, CM, R,, Ci2und B, mit G<'>= L * + CN* However, it can be shown that, for example, for adjacent channels L 1, CM, R 1, C 2 and B, where G <'> = L * + CN *
Rn = Ri* + Ch* + Ci2* Rn = Ri * + Ch * + Ci2 *
R|2<=>Ri* + Cil* + Cj2* R | 2 <=> Ri * + Cil * + Cj2 *
Bi<'>= B * + Ci2* sich nicht aus einem Residual Δ-ι, das aus dem Korrelationsvergleich zwischen L,<'>und Rh<'>resultiert, in linearer Form das Residual Δ2, das aus dem Korrelationsvergleich zwischen Ri2<'>und B,<'>resultiert, ableiten lässt. Bi <'> = B * + Ci2 * does not derive from a residual Δ-ι, which results from the correlation comparison between L, <'> and Rh <'>, in a linear form the residual Δ2, which results from the correlation comparison between Ri2 < '> and B, <'> results, can be deduced.
[0048] Eine ideale näherungsweise Bestimmung, die zudem die drastische Verminderung der Anzahl der zu übertragenden Residuale darstellt, besteht in der folgenden Überlegung: An ideal approximate determination, which also represents the drastic reduction in the number of residuals to be transmitted, consists in the following consideration:
[0049] Wurden n Residuale Δ-ι , Δ2, Δ3, Δ4, ... , Δηbestimmt, und gelten für die Differenzen If n Residuale Δ-ι, Δ2, Δ3, Δ4, ..., Δη determined, and apply to the differences
Δ2- Δι = η3- ηηΔ2- Δι = η3- ηη
Δ3 - Δ2= η4- η ι Δ3 - Δ2 = η4- ηι
Δ4- Δ3 = η5 ~ Τ|2 Δ4- Δ3 = η5 ~ Τ | 2
Δη Δ — Τ]ι ~ Τ]η-2 Δη Δ - Τ] ι ~ Τ] η-2
Δι - Δ„ = η2- ηη-ι dann lassen sich die Beziehungen Δι - Δ "= η2- ηη-ι then the relationships can be
7 Δχ = η2- ηη-χ + Δη7 Δχ = η2-ηη-χ + Δη
Δ2- Δχ= Δ2- (η2- ηη-ι + Δη) = η3- ηηbzw. Δ2- Δχ = Δ2- (η2-ηη-ι + Δη) = η3- ηηbzw.
Δ2= η3- ηη+ (η2- ηη-ι + Δ„) Δ2 = η3-ηη + (η2-ηη-ι + Δ ")
Δ3- Δ2= Δ3- (η3- ηη+ (η2- ηη-ι + Δη) ) = η4- ηι bzw. Δ3-Δ2 = Δ3- (η3-ηη + (η2-ηη-ι + Δη)) = η4- ηι or
Δ3= η4- ηι + (η 3 - ηη+ (η2- ηη-ι + Δη) ) Δ3 = η4-ηι + (η 3 -ηη + (η 2 -ηη-ι + Δη))
Δ - Δ3== Δ4- (η4- ηι + (η3~ ηη+ (η2- ηη-ι + Δη) ) ) = η5- η2bzw . Δ - Δ3 == Δ4- (η4-ηι + (η3 ~ ηη + (η2-ηη-ι + Δη))) = η5-η2bzw.
Δ4= η5- η2+ (η4- ηι + (η3- ηη+ (η2- ηη-ι + Δη) ) ) Δ4 = η5-η2 + (η4-ηι + (η3-ηη + (η2-ηη-ι + Δη)))
Δι - Δη = (η2- ηη-ι + Δη) - Δ„ = η2- ηη-ι bzw . Δι - Δη = (η2- ηη-ι + Δη) - Δ "= η2- ηη-ι or.
Δι = ( η2- ηη-ι + Δη) ableiten. Δι = (η2- ηη-ι + Δη) derived.
[0050] Somit ist beispielsweise (η2 - ηη.ι + Δη) ein Term, der in allen Residualen enthalten ist. Gleiche Überlegung lässt sich auf jedes Δ,, i = 1 , ..., n, anwenden. Da n in der Praxis klein bleibt, folgt daraus, dass mit jedem so bestimmten Term sich jedes Residual mit hoher Genauigkeiten approximieren lässt. Thus, for example, (η 2 - ηη.ι + Δη) is a term that is included in all Residuals. The same reasoning applies to every Δ ,, i = 1, ..., n. Since n remains small in practice, it follows that with every term so determined, each residual can be approximated with high accuracies.
[0051 ] Setzt man nunmehr Now set
8 Δ2- Δι = η3- ηη= ax8 Δ2- Δι = η3- ηη = ax
Δ3- Δ2= η4- ηι = a2Δ3-Δ2 = η4-ηι = a2
Δ4- Δ3= η5- η2= a3Δ4 - Δ3 = η5 - η2 = a3
Δ5- Δ4= η6- η3= a4Δ5-Δ4 = η6-η3 = a4
Δβ - Δ5 = Τ|7 “ Τ) 4<=>3-5 Δβ - Δ5 = Τ | 7 "Τ) 4 <=> 3-5
Δ7 - Δδ = ηβ - Ή5 = a6 Δ7 - Δδ = ηβ - Ή5 = a6
Δ3- Δ7 = η9~ η e<=>3.7 Δ3- Δ7 = η9 ~ η e <=> 3.7
Δ9- Δ3~ ηιο - η7<=>ag Δ9-Δ3 ~ ηιο -η7 <=> ag
Διο - Δ 9 = ηιι - η3= a9Διο - Δ 9 = ηιι - η3 = a9
Δι - Δη= η2- ηη-ι= anergibt sich η3 = Πη + ai ηε = Ήη + ax+ a4η9<+>ax+ a4+ a7bzw. η4= ηι + a2η7= ηι + a2+ as ηιο = ηι + a2+ as + a3bzw . η5= η2+ a3Όβ = η2+ a3+ a6 ηιι = η2+ a3+ a3+ a9Δι - Δη = η2-ηη-ι = gives η3 = Πη + ai ηε = Ήη + ax + a4η9 <+> ax + a4 + a7bzw. η4 = ηι + a2η7 = ηι + a2 + as ηιο = ηι + a2 + as + a3bzw. η5 = η2 + a3Όβ = η2 + a3 + a6 ηιι = η2 + a3 + a3 + a9
[0052] Aus den Beziehungen Tin = Ήη + ai + a4+ a7+■■■ + Sn-: Tjn-i = Tjn-i + an+ a3+ a6+... + 1 From the relationships Tin = Ήη + ai + a4 + a7 + ■■■ + Sn-: Tjn-i = Tjn-i + an + a3 + a6 + ... + 1
Tjn-2 = T)n-2 + 3n-1 + 3-2 + 85 +... + Tjn-2 = T) n-2 + 3n-1 + 3-2 + 85 + ... +
2bzw. ln-3 bZW. an-4 2bzw. ln-3 bZW. an-4
9 lässt sich nunmehr die «Differenzregel für Residuale» 9, the "difference rule for residuals" can now be
(a-ι + 84 + 87 + ... + an-2) + (an+ 83 + 36 + ... + an-3) + (an-i + 82 + 85 + ... + an-4) = 0 ableiten, was bedeutet, dass a-ι , a2, a3, ... , anpsychoakustisch innerhalb einer normativen Abhörsituation (innerhalb des «Sweet Spot») ein ideales Residualverhalten aufweisen, indem sie sich gegenseitig auslöschen. (a-1 + 84 + 87 + ... + an-2) + (an + 83 + 36 + ... + an-3) + (an-i + 82 + 85 + ... + an-4) = 0, which means that a-ι, a2, a3, ..., anpsychoacoustically within a normative listening situation (within the sweet spot) have an ideal residual behavior in that they cancel each other out.
[0053] Aus obiger «Differenzregel» lässt sich unmittelbar das folgende «Additionstheorem für Residuale» ableiten, nämlich Δ1 + Δ2+ Δ3+ ... + Δη= n* (η2- ηη_ι + Δη) was bedeutet, dass der Mittelwert aller Residuale zugleich in diesen enthalten ist und sich auch unschwer, beispielsweise innerhalb eines Encoder, errechnen lässt. From the above "difference rule" can be derived directly the following "addition theorem for residuals", namely Δ1 + Δ2 + Δ3 + ... + Δη = n * (η2- ηη_ι + Δη) which means that the mean of all Residuale at the same time This is included and can also be easily calculated, for example, within an encoder.
[0054] Wird nun die Residualkorrektur anstelle anhand der Residuale Δ-ι , Δ2, Δ3, ... , Δηnunmehr anhand von deren Mittelwert vorgenommen, lassen sich nicht nur Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte gezielt minimieren, sondern zugleich eine drastisch reduzierte Anzahl von Kanälen übertragen, beispielsweise von einem Audioencoder zu einem Audiodecoder. If now the residual correction instead of the residual Δ-ι, Δ2, Δ3, ..., Δηnunmehr made on the basis of their mean, not only discoloration of the timbre and other unmasking effects can be specifically minimize, but at the same time a drastically reduced number of Channels, for example, from an audio encoder to an audio decoder.
[0055] Es ist somit nunmehr gemäss Fig. 2 möglich, deren umschriebenes Dreieck mit seinen Ecken die Anzahl der Downmixkanäle bezeichnet und deren eingeschriebenes, strichliertes Dreieck die Anzahl der zusätzlich mittels Korrelationsvergleich extrahierten Kanäle (die von den. zugehörigen Downmixkanälen anschliessend subtrahiert werden,., um sämtliche ursprünglichen Kanäle des umschriebenen Dreiecks näherungsweise zu erhalten), bei Übertragung des Mittelwerts aller Residuale, aus wenigstens drei Kanälen maximal sechs Kanäle zu extrahieren, die deutlich geringere Artefakte bzw. Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte aufweisen. In anderen Worten beschreiben die Eckpunkte des umschriebenen Dreiecks die drei Downmixkanäle eines Multikanalsignals mit sechs Kanälen. Ein Eckpunkt des eingeschriebenen Dreiecks beschreibt einen, den beiden benachbarten Downmixkanälen zugemischten Kanal des Multikanalsignals. Ein solcher, zwischen zwei Downmixkanälen liegender weiterer Kanal kann durch einen Korrelationsvergleich zwischen den beiden angrenzenden Downmixkanälen (den Eckpunkten des umschriebenen Dreiecks) erhalten werden, indem dieses in beiden Downmixkanälen enthaltene Signal extrahiert wird, als auch jeweils die Summe der beiden ursprünglichen, äusseren Ecksignale vor dem Downmix mit ihrem benachbarten Signal, welches in der Mitte der, dem jeweilig betrachteten Ecksignal nächstgelegenen Seite des Dreiecks liegt (wohlgemerkt nicht auf jener Seite, auf der der erste Korrelationsvergleich durchgeführt wurde!). Wird nun auch für die beiden Downmixkanäle dieser neu betrachteten Seite ein Korrelationsvergleich ausgeführt, wird wiederum das in beiden Downmixkanälen enthaltene Signal extrahiert. Dieses lässt sich von der nächstgelegenen Summe des ersten Korrelationsvergleichs subtrahieren, und ergibt dann das ursprüngliche Ecksignal. Wenn dies für alle drei benachbarten Paare von Downmixkanälen gemacht wird, erhält man wieder die sechs Kanäle des Multikanalsignals. Da neben den Downmix-Signalen, sofern nicht stationär, nun zur exakten Berechnung der sechs Multikanalsignale neben den drei Downmixkanälen auch noch drei Residuale übertragen werden müssten, wäre die Menge der zu übertragenden Daten wieder gleich der Übertragung des Multikanalsignals. Deshalb wird nun der Mittelwert aller drei Residuale übertragen und die aus dem Korrelationsvergleich erhaltenen sechs Kanäle des Multikanalsignals werden auf der Basis dieses gemittelten Residuals korrigiert. 2, whose circumscribed triangle with its vertices denotes the number of downmix channels and whose inscribed, dashed triangle the number of additionally extracted channels by means of correlation comparison (which are subsequently subtracted from the associated downmix channels). to approximate all the original channels of the circumscribed triangle), when transmitting the average of all residuals, extract at most three channels of a maximum of six channels having significantly less artifacts or discoloration of the timbre and other unmasking effects. In other words, the vertices of the circumscribed triangle describe the three downmix channels of a six channel multi-channel signal. A vertex of the inscribed triangle describes a, the two adjacent downmix channels mixed channel of the multi-channel signal. Such a further channel lying between two downmix channels can be obtained by a correlation comparison between the two adjacent downmix channels (the vertices of the circumscribed triangle) by extracting this signal contained in both downmix channels, as well as in each case the sum of the two original, external corner signals the downmix with its adjacent signal, which lies in the middle of the nearest corner of the triangle considered to be the respective corner signal (not on the side on which the first correlation comparison was performed!). If a correlation comparison is now also carried out for the two downmix channels of this newly viewed page, the signal contained in both downmix channels is again extracted. This can be subtracted from the nearest sum of the first correlation comparison, and then gives the original corner signal. If this is done for all three adjacent pairs of downmix channels, one obtains again the six channels of the multichannel signal. Since, in addition to the downmix signals, if not stationary, three residuals would have to be transmitted in addition to the three downmix channels for exact calculation of the six multichannel signals, the amount of data to be transmitted would again be equal to the transmission of the multichannel signal. Therefore, the average of all three residuals is now transmitted and the six channels of the multi-channel signal obtained from the correlation comparison are corrected on the basis of this averaged residual.
[0056] Ebenso ist es nunmehr gemäss Fig. 3 möglich, deren umschriebenes Quadrat mit seinen Ecken die Anzahl der Downmixkanäle bezeichnet, und deren eingeschriebenes, strichliertes Quadrat die Anzahl der zusätzlich mittels Korrelationsvergleich extrahierten Kanäle (die von den zugehörigen Downmixkanälen anschliessend subtrahiert werden, um sämtliche ursprünglichen Kanäle des umschriebenen Quadrats näherungsweise zu erhalten), bei Übertragung des Mittelwerts aller Residuale aus wenigstens vier Downmixkanälen maximal acht Kanäle zu extrahieren, die deutlich geringere Artefakte bzw. Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte aufweisen. 3, whose circumscribed square with its vertices denotes the number of downmix channels, and whose inscribed, dashed square the number of additionally extracted by means of correlation comparison channels (which are then subtracted from the associated Downmixkanälen to to approximate all the original channels of the circumscribed square), to extract a maximum of eight channels transmitting substantially all artifacts from at least four downmix channels, which have significantly lower artifacts or discoloration of the timbre and other unmasking effects.
[0057] Es ist somit nunmehr gemäss Fig. 4 möglich, deren umschriebenes Pentagon mit seinen Ecken die Anzahl der Downmixkanäle bezeichnet und deren eingeschriebenes, strichliertes Pentagon die Anzahl der zusätzlich mittels Korrelationsvergleich extrahierten Kanäle (die von den zugehörigen Downmixkanälen anschliessend subtrahiert werden, um sämtliche ursprünglichen Kanäle des umschriebenen Pentagons näherungsweise zu erhalten), bei Übertragung des Mittelwerts aller Residuale, aus wenigstens fünf Kanälen maximal zehn Kanäle zu extrahieren, die deutlich geringere Artefakte bzw. Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte aufweisen. 4, whose circumscribed pentagon with its vertices designates the number of downmix channels and whose inscribed, dashed pentagon the number of additionally extracted by means of correlation comparison channels (which are then subtracted from the associated downmix channels to all to obtain approximate original channels of the circumscribed pentagon), when transmitting the average of all residuals, to extract from at least five channels a maximum of ten channels that have significantly lower artifacts or discoloration of the timbre and other unmasking effects.
[0058] Die Fig. 2 bis 4 haben rein kombinatorische Bedeutung und sind nicht mit konkreten Lautsprecherpositionen zu verwechseln. 2 to 4 have purely combinatorial meaning and are not to be confused with specific speaker positions.
[0059] Dieses Schema lässt sich nach unendlich erweitern, wobei allerdings der errechnete Mittelwert aller Residuale aufgrund obiger Überlegungen zunehmend zu Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten führt. This scheme can be extended to infinity, but the calculated mean of all residuals due to the above considerations increasingly leads to artifacts or discoloration of the timbre and other unmasking effects.
[0060] Weitere Kanäle lassen sich in sämtlichen Fällen mit einer linearen oder nichtlinearen inversen Kodierung existenter oder sukzessive abgeleiteter Kanäle oder auch anderen aus dem Stand der Technik bekannten weiteren räumlichen Kodierverfahren approximativ errechnen: Further channels can be calculated in all cases with a linear or non-linear inverse coding of existing or successively derived channels or other known from the prior art further spatial coding method approximatively:
[0061 ] Im Folgenden wird unter «inverser Kodierung» ein technischer Ablauf verstanden, der sich eines oder mehrerer Verfahren oder einer oder mehrerer Vorrichtungen der Ansprüche der Anmeldungen EP 1 850 629 oder WO 2009 138205 oder WO 201 1 009 649 oder WO 2011 009 650 oder WO 2012 016 992 oder WO 2012 032 178 bedient, wobei die eben genannten Dokumente hiermit als Referenz eingeführt werden. Insbesondere ist die inverse Kodierung in diesen In the following, "inverse coding" is understood to mean a technical sequence which is one or more methods or one or more devices of the claims of the applications EP 1 850 629 or WO 2009 138205 or WO 201 1 009 649 or WO 2011 009 650 or WO 2012 016 992 or WO 2012 032 178, the above-mentioned documents being hereby incorporated by reference. In particular, the inverse coding is in these
10 Dokumenten beschrieben. Während bei der linearen inversen Kodierung die beiden Ausgangskanäle einheitlich verstärkt erscheinen, zeigt Fig. 9 das Beispiel einer nichtlinearen inversen Kodierung, die sich dadurch kennzeichnet, dass die beiden Ausgangskanäle nicht einheitlich verstärkt werden. 10 documents. While in the linear inverse coding the two output channels appear uniformly amplified, Fig. 9 shows the example of a non-linear inverse coding characterized in that the two output channels are not uniformly amplified.
[0062] Die Downmixkanäle bzw. Residuale, die der möglichst effizienten Speicherung und Übertragung von Audiodaten, beispielsweise zwischen einem Encoder und einem Decoder, dienen sollen, lassen sich mit einem aus dem Stand der Technik bekannten entsprechenden verlustfreien oder verlustbehafteten Base Audio Codec (Beispiele eines solchen Base Audio Codecs sind Opus oder die MPEG-Standards MP3, AAC, HE-AAC, HE-AAC v2 und USAC) zusätzlich komprimieren und dekomprimieren, wobei der jeweils verwendete Base Audio Codec hinsichtlich des insgesamt zugrundeliegenden räumlichen Kodierverfahrens zusätzlich optimiert werden kann («Tuning»). The Downmixkanäle or Residuale, which should serve the most efficient storage and transmission of audio data, such as between an encoder and a decoder, can be with a known from the prior art corresponding lossless or lossy base audio codec (examples of a Opus or the MPEG standards MP3, AAC, HE-AAC, HE-AAC v2 and USAC) additionally compress and decompress such Base Audio Codecs, whereby the Base Audio Codec used in each case can additionally be optimized with regard to the overall underlying coding method (" Tuning ").
[0063] Insbesondere, da eine Reihe von Audiocodecs zur verlustfreien oder verlustbehafteten Komprimierung von Audiosignalen sich bereits die Fourier-Transformation bzw. Fast Fourier Transform (FFT) zunutze machen, können mit geringem Rechenaufwand die oben beschriebenen Regeln zur Gewinnung der Realteile bzw. Imaginärteile von Signalen direkt in diese Audiocodecs integriert werden, bzw. Signale aus derartigen Audiocodecs abgeleitet werden, die diesen Regeln zur Gewinnung der Realteile bzw. Imaginärteile unterworfen werden können. Der insgesamt notwendige Rechenaufwand kann so deutlich vermindert werden. In particular, since a number of audio codecs for lossless or lossy compression of audio signals already use the Fourier transform or Fast Fourier Transform (FFT), the rules described above for obtaining the real parts or imaginary parts of Signals are integrated directly into these audio codecs, or signals are derived from such audio codecs that can be subjected to these rules to obtain the real parts or imaginary parts. The total amount of computation required can thus be significantly reduced.
BESCHREIBUNG DER ZEICHNUNGEN DESCRIPTION OF THE DRAWINGS
[0064] Verschiedene Ausführungsformen der vorliegenden Erfindung werden im Folgenden beispielhaft beschrieben, wobei auf folgende Zeichnungen Bezug genommen wird: Various embodiments of the present invention will now be described by way of example, with reference to the following drawings:
Fig. 1 zeigt die acht möglichen Fälle eines unerwartet handlichen Algorithmus zum Korrelationsvergleich zweier Signale auf Basis einer Fourier-Transformation, wobei jeweils jene Signalanteile, welche für die KurzzeitKreuzkorrelation den Korrelationsgrad +1 aufweisen, für stationäre Signale exakt extrahiert werden. Für nichtstationäre Signale ist anschliessend eine Residualkorrektur ebenfalls gemäss Offenbarung der Erfindung exakt oder auch anhand des Mittelwerts aller Residuale möglich. Fig. 1 shows the eight possible cases of an unexpectedly handy algorithm for correlation comparison of two signals based on a Fourier transform, wherein in each case those signal components which have the degree of correlation +1 for the short-term cross-correlation are exactly extracted for stationary signals. For non-stationary signals, a residual correction is also possible according to the disclosure of the invention exactly or also based on the mean value of all residuals.
Fig. 2 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit drei Kanälen, die durch das umschriebene Dreieck veranschaulicht wird. Figure 2 geometrically illustrates the combinatorial application of such a correlation comparison to a corresponding three-channel downmix represented by the circumscribed triangle.
Fig. 3 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit vier Kanälen, die durch das umschriebene Quadrat veranschaulicht wird. FIG. 3 geometrically illustrates the combinatorial application of such a correlation comparison to a corresponding four-channel downmix represented by the circumscribed square.
Fig. 4 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit fünf Kanälen, die durch das umschriebene Pentagon veranschaulicht wird. FIG. 4 geometrically illustrates the combinatorial application of such a correlation comparison to a corresponding five-channel downmix represented by the circumscribed pentagon.
Fig. 5 zeigt eine 5.1 -Surround-Anordnung nach ITU-R BS.775-1. Fig. 5 shows a 5.1 -Surround arrangement according to ITU-R BS.775-1.
Fig. 6 zeigt eine erfindungsgemässe Kodierung von Multikanalsignalen anhand von Korrelationsvergleich und eventueller Residualkorrektur oder zusätzlicher räumlicher Kodierung. FIG. 6 shows an inventive coding of multi-channel signals on the basis of correlation comparison and possible residual correction or additional spatial coding.
Fig. 7 zeigt eine NHK-22.2-Anordnung. Fig. 7 shows a NHK-22.2 arrangement.
Fig. 8 zeigt die Anwendung von Fig. 6 auf ein NHK-22.2-Middle-Layer-Signal bei gleichzeitiger Anwendung zweier inverser Kodierungen für FL, FLc und FR, FRc. FIG. 8 shows the application of FIG. 6 to an NHK-22.2 middle layer signal with simultaneous use of two inverse codings for FL, FLc and FR, FRc.
Fig. 9 zeigt das Beispiel einer nichtlinearen inversen Kodierung gemäss der unveröffentlichten Anmeldung CH 02 300/12. Fig. 9 shows the example of a non-linear inverse coding according to the unpublished application CH 02 300/12.
Fig. 10 zeigt die Anwendung von Fig. 6 auf ein NHK-22.2-Top-Layer-Signal bei gleichzeitigem Korrelationsvergleich zur Gewinnung des TpC auf. Dieser Korrelationsvergleich findet in der psychoakustisch unkritischen frontalen Hauptachse oberhalb des Kopfes statt, in der eine exakte Lokalisation schwierig bleibt. Fig. 10 shows the application of Fig. 6 to a NHK-22.2 top-layer signal with simultaneous correlation comparison to obtain the TpC. This correlation comparison takes place in the psychoacoustically uncritical frontal axis above the head, in which an exact localization remains difficult.
Fig. 1 1 zeigt die Anwendung von Fig. 6 auf ein NHK-22.2-Top-Layer-Signal bei gleichzeitigem Panning der Summe von TpC und TpFC. Diese Panning findet in der psychoakustisch unkritischen frontalen Hauptachse oberhalb des Kopfes statt, in der eine exakte Lokalisation schwierig bleibt. Alternativ oder zusätzlich zum Panning kann auch eine lineare oder nichtlineare inverse Kodierung ausgeführt werden. FIG. 11 shows the application of FIG. 6 to a NHK-22.2 top-layer signal with simultaneous panning of the sum of TpC and TpFC. This panning takes place in the psychoacoustically uncritical frontal axis above the head, in which an exact localization remains difficult. Alternatively or additionally to the panning, a linear or non-linear inverse coding can also be carried out.
Fig. 12 zeigt einen Encoderbaustein auf der Basis des Erfindungsgegenstands, der sowohl einen Downmix berechnet als auch das Residual des zugehörigen Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung FIG. 12 shows an encoder module based on the subject invention, which calculates both a downmix and the residual of the associated correlation comparison according to the rules for acquisition
11 der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung. Auf alle Ausgangssignale wurde zuvor eine Fourier Transform (FFT) ausgeführt. 11 of the real and imaginary parts of signals, see disclosure of the invention. All output signals were previously Fourier Transform (FFT).
Fig. 13 zeigt einen Encoder für ein NFIK-22.2-Top-Layer-Signal auf der Basis des Erfindungsgegenstands, der sowohl den gesamten Downmix berechnet als auch den Mittelwert aller von den Encoderbausteinen berechneten Residuale. Fig. 13 shows an encoder for an NFIK 22.2 top layer signal based on the subject invention, which calculates both the total downmix and the average of all residuals calculated by the encoder chips.
Fig. 14 zeigt einen Decoder, der anhand des gesamten Downmix und des übertragenen Mittelwerts aller von den Encoderbausteinen berechneten Residuale mittels Korrelationsvergleich, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, und mittels Summenund Differenzbildung die ursprünglichen Eingangssignale des Encoder näherungsweise berechnet. Abschliessend werden die Inverse Fast Fourier Transforms (IFFT) bestimmt. Fig. 14 shows a decoder based on the total downmix and the transmitted average of all calculated by the encoder components Residuale by correlation comparison, according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, and by means of sum and difference the original Input signals of the encoder calculated approximately. Finally, the Inverse Fast Fourier Transforms (IFFT) are determined.
Fig. 15 zeigt das Prinzip des dargestellten Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung. Vor diesem Korrelationsvergleich wird eine Fast Fourier Transform (FFT) ausgeführt, nach diesem eine Inverse Fast Fourier Transform (IFFT). Fig. 15 shows the principle of the illustrated correlation comparison, according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention. Prior to this correlation comparison, a Fast Fourier Transform (FFT) is performed, followed by an Inverse Fast Fourier Transform (IFFT).
DETAILLIERTE BESCHREIBUNG DETAILED DESCRIPTION
Anwendung des Erfindungsgegenstands auf ein 5.1 -Surround-Signal: Application of the subject of the invention to a 5.1 surround signal:
[0065] Ein erstes, einfaches Beispiel einer Anwendung des Erfindungsgegenstands auf ein 5.1 -Surround-Signal gemäss ITU-R BS.775-1 , siehe Fig. 5, dies unter zusätzlicher Anwendung einer inversen Kodierung, stellt für die Kanäle L*, R*, C*, LS*, RS die Summenbildung (der «Downmix») A first, simple example of an application of the subject invention to a 5.1 surround signal in accordance with ITU-R BS.775-1, see FIG. 5, with additional use of an inverse coding, represents for the channels L *, R *, C *, LS *, RS the summation (the «downmix»)
L<'>= (L* + 1Λ/2 * LS*) + 1/2 * C* L <'> = (L * + 1Λ / 2 * LS *) + 1/2 * C *
R<'>= (R* + 1Λ/2 * RS*) + 1/2 * C* dar. R <=> (R * + 1Λ / 2 * RS *) + 1/2 * C *.
[0066] L<'>und R<'>lassen sich anhand eines Base Audio Codec, der für diesen Zweck speziell angepasst werden kann («Tuning»), dies zwecks effizienter Speicherung oder Übertragung, siehe Fig. 6 (wobei im vorliegenden Beispiel noch eine zusätzliche räumliche Enkodierung und Dekodierung anhand der sogenannten linearen oder nichtlinearen inversen Kodierung stattfindet), komprimieren und anschliessend dekomprimieren. L <'> and R <'> can be tuned by means of a base audio codec, which can be specially adapted for this purpose, for efficient storage or transmission, see FIG. 6 (in the present example still an additional spatial encoding and decoding based on the so-called linear or non-linear inverse coding takes place), compress and then decompress.
[0067] Im Encoder werden zuerst die linken Signale LS* und L* zu einem gemeinsamen linken Signal (L* + 1/V2 * LS*) zusammengefügt, und die rechten Signale RS* und R* zu einem gemeinsamen rechten Signal (R* + 1/V2 * RS*) zusammengefügt. Zur Bestimmung der Parameter, die psychoakustisch zur Separierung der Signale (LS* und L* bzw. RS* und R*) aus dem gemeinsamen Signal ( (L* + 1/V2 * LS*), (R* + 1/V2 * RS*)) führen, wird ein Verfahren der inversen Kodierung verwendet, wie es in einer der Patentanmeldungen WO 2009 138 205, WO 201 1 009 649, WO 201 1 009 650, WO 2012 016 992 oder WO 2012 032 178 offenbart ist. Die Offenbarung dieser Anmeldungen ist für die Bestimmung der Parameter, die zur psychoakustischen Separierung der Signale (LS* und L* bzw. RS* und R*) aus dem gemeinsamen Signal ( (L* + 1/V2 * LS*), (R* + 1/V2 * RS*)) notwendig sind, hier eingefügt. Durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, von L<'>und R<'>können nunmehr ein Signal 1/2 * C (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale L und R extrahiert werden. Im Encoder wird über das erfindungsgemässe Verfahren des Korrelationsvergleichs zwischen L<'>und R<'>eine Schätzung der Signale (L* + 1/V2 * LS*) oder (R* + 1/V2 * RS*) oder C* bestimmt, und die Differenz mit dem tatsächlichen Signal gebildet, um das Residual Δ zu bestimmen. Der Encoder gibt nun L<'>, R<'>, Δ und die Parameter für die Separierung von dem gemeinsamen linken Signal in die beiden linken Signale, und die Parameter für die Separierung von dem gemeinsamen rechten Signal in die beiden rechten Signale aus. In the encoder, the left signals LS * and L * are first combined to form a common left signal (L * + 1 / V2 * LS *), and the right signals RS * and R * are combined to form a common right signal (R *). + 1 / V2 * RS *). To determine the parameters that psychoacoustically separate the signals (LS * and L * or RS * and R *) from the common signal ((L * + 1 / V2 * LS *), (R * + 1 / V2 * RS *)), an inverse coding method is used, as disclosed in one of the patent applications WO 2009 138 205, WO 201 1 009 649, WO 201 1 009 650, WO 2012 016 992 or WO 2012 032 178. The disclosure of these applications is for the determination of the parameters which are used for the psychoacoustic separation of the signals (LS * and L * or RS * and R *) from the common signal ((L * + 1 / V2 * LS *), (R * + 1 / V2 * RS *)) are necessary, inserted here. By correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention of L <'> and R <'> can now be a signal 1/2 * C (which is then multiplied by a factor of 2) as also two signals L and R are extracted. In the encoder, an estimate of the signals (L * + 1 / V2 * LS *) or (R * + 1 / V2 * RS *) or C * is determined via the method according to the invention of the correlation comparison between L <'> and R <'> , and the difference with the actual signal is formed to determine the residual Δ. The encoder now outputs L <'>, R <'>, Δ and the parameters for the separation from the common left signal to the two left signals, and the parameters for the separation from the common right signal to the two right signals.
[0068] Der Korrelationsvergleich kann sich eine bereits im Base Audio Coder ausgeführte Fourier-Transformation zunutze machen, womit sich der insgesamt notwendige Rechenaufwand deutlich herabsetzen lässt. The correlation comparison can make use of a Fourier transformation already carried out in the base audio coder, whereby the overall computational effort required can be significantly reduced.
[0069] Im Decoder wird auf der Basis des erfindungsgemässen Korrelationsvergleichs aus L<'>und R<'>eine Schätzung der Signale (L* + 1/V2 * LS*), (R* + 1/V2 * RS*) und C* bestimmt. Anhand des optional übertragenen Residuals Δ für diesen Korrelationsvergleich, etwa von einem Encoder zu einem Decoder, lassen sich nunmehr die ursprünglichen Signale C*, (L* + 1/V2 * LS*) und (R* + 1/V2 * RS*) aus deren Schätzungen C, (L + 1/V2 * LS) und (R + 1/V2 * RS) gemäss folgenden Formeln rekonstruieren: In the decoder, on the basis of the correlation comparison of L <'> and R <'> according to the invention, an estimate of the signals (L * + 1 / V2 * LS *), (R * + 1 / V2 * RS *) and C * determined. On the basis of the optionally transmitted residual Δ for this correlation comparison, for example from an encoder to a decoder, the original signals C *, (L * + 1 / V2 * LS *) and (R * + 1 / V2 * RS *) can now be used. from whose estimates C, (L + 1 / V2 * LS) and (R + 1 / V2 * RS) are reconstructed according to the following formulas:
12 C<*>= C + 2Δ 12 C <*> = C + 2Δ
(L (L
+ 1/J<~>2 * LS<*>) = + 1 / J <~> 2 * LS <*>) =
(L + l/ 2 * (L + l / 2 *
LS LS
Δ Δ
(R<*>+ 1/Γ2 * RS (R <*> + 1 / Γ2 * RS
(R + l/v<r>2 * RS) - Δ (R + l / v <r> 2 * RS) - Δ
[0070] Aufgrund der geringen Kanalanzahl würde eine solche Residualbestimmung allerdings zu keiner wirklichen Komprimierung führen, sondern dient hier vielmehr zur Illustrierung des grundlegenden Residualverhaltens, das mit einem solchen Korrelationsvergleich einhergeht und entsprechend korrigiert werden kann. In diesem Fall entspricht das dekodierte gemeinsame linke Signal (L* + 1/V2 * LS*) der originalen Kanalkombination (L* + 1/V2 * LS*) des Multikanalsignals. Sollte in einem Multikanalsignal mit mehr Kanälen ein zusätzlich auf anderen Kanälen basierendes gemitteltes Residual für die Korrektur verwendet werden, ist das dekodierte gemeinsame linke Signal (L* + 1/V2 * LS*) nur eine Schätzung (analog für das gemeinsame rechte Signal). However, due to the small number of channels such a residual determination would lead to no real compression, but rather serves to illustrate the basic residual behavior that goes along with such a correlation comparison and can be corrected accordingly. In this case, the decoded common left signal (L * + 1 / V2 * LS *) corresponds to the original channel combination (L * + 1 / V2 * LS *) of the multichannel signal. If in a multi-channel signal with more channels an additional residual-based averaged residual is used for the correction, the decoded common left signal (L * + 1 / V2 * LS *) is just an estimate (analogous to the common right signal).
[0071 ] Auf der Basis der für die Separierung übertragenen Parameter werden näherungsweise für das durch Korrelationsvergleich und evtl, durch Residualkorrektur erhaltene gemeinsame linke Signal (L* + 1/V2 * LS*) nunmehr zwei linke Kanäle L* und LS* berechnet, und für das durch Korrelationsvergleich und evtl, durch Residualkorrektur erhaltene gemeinsame rechte Signal (R* + 1/V2 * RS*) nunmehr zwei rechte Kanäle R* und RS* berechnet. Dies kann anhand einer linearen oder nichtlinearen Kodierung, wie sie z.B. in Fig. 9 dargestellt ist, geschehen. Dabei werden die von dem Encoder empfangenen Parameter φ (Winkel zwischen Schallquelle und Mikrophonhauptachse), α (bestimmter linker Öffnungswinkel), ß (bestimmter rechter Öffnungswinkel), f (Richtcharakteristik des zu stereophonisierenden Monosignals), γ (Verstärker zur Veränderung des Korrelationsgrades bzw. Dämpfung zur Veränderung des Korrelationsgrades) bzw. p (Dämpfung zur Veränderung des Korrelationsgrades) und s (Zeitparameter) (oder aus diesen Parametern abgeleitete Parameter) in dem Decoder verwendet, um psychoakustisch optimale Verzögerungen und Verstärkungen des Eingangssignals zu erhalten und so ein Eingangssignal in zwei benachbarte Kanäle aufzusplitten. On the basis of the parameters transmitted for the separation, approximately two left channels L * and LS * are now calculated approximately for the common left signal (L * + 1 / V2 * LS *) obtained by correlation correction and possibly by residual correction, and for the common right signal (R * + 1 / V2 * RS *) obtained by correlation comparison and possibly by residual correction, two right channels R * and RS * are now calculated. This can be done by means of a linear or non-linear coding, as e.g. is shown in Fig. 9 done. The parameters received by the encoder are φ (angle between sound source and main microphone axis), α (certain left aperture angle), β (certain right aperture angle), f (directional characteristic of the mono signal to be stereophoned), γ (amplifier for changing the degree of correlation or damping to change the degree of correlation) or p (attenuation to change the degree of correlation) and s (time parameters) (or parameters derived from these parameters) are used in the decoder to obtain psychoacoustically optimum delays and gains of the input signal and thus an input signal into two adjacent ones Split channels.
Anwendung des Erfindungsgegenstands auf ein NHK-22.2-Middle-Layer-Signal (siehe Fig. 7, 8 und 15): Application of the Subject of the Invention to an NHK-22.2 Middle Layer Signal (See Figures 7, 8 and 15):
[0072] Ein zweites, komplexes Beispiel einer Anwendung des Erfindungsgegenstands, hier gemäss Fig. 8, auf ein NHK22.2-Middle-Layer-Signal als Multikanalsignal, siehe Fig. 7, stellt für die Kanäle FL, FR, FC, BL, BR, FLc, FRc, BC, SiL und SiR die Summenbildung (die Kanäle des Downmixsignals) A second, complex example of an application of the subject invention, here according to FIG. 8, to a NHK22.2 middle-layer signal as a multi-channel signal, see FIG. 7, for the channels FL, FR, FC, BL, BR, FLc, FRc, BC, SiL and SiR the summation (the channels of the downmix signal)
FL' = FL + l/V 2 * FLc + 0.5 * FC + 0.5 * SiL FL '= FL + 1 / V 2 * FLc + 0.5 * FC + 0.5 * SiL
FR' = FR + 1Λ/<">2 * FRc + 0.5 * FC + 0.5 * SiR FR '= FR + 1Λ / <"> 2 * FRc + 0.5 * FC + 0.5 * SiR
BL' = BL + 0.5 * SiL + 0.5 * BC BL '= BL + 0.5 * SiL + 0.5 * BC
BR' = BR + 0.5 * SiR + 0.5 * BC dar, wobei FL<'>, FR<'>, BL<'>, BR<'>den Eckpunkten des umschriebenen Ouadrats der Fig. 3 gemäss Fig. 8 entsprechen. BR '= BR + 0.5 * SiR + 0.5 * BC where FL <'>, FR <'>, BL <'>, BR <'> correspond to the vertices of the circumscribed ouadrate of Fig. 3 in Fig. 8.
[0073] Die Kanäle FL und FLc werden in dem Encoder vor dem, zur Berechnung der Residuale durchgeführten, Korrelationsvergleich zu einem gemeinsamen vorderen linken Kanal zusammengeführt, und die für die Separierung notwendigen Parameter bestimmt. Die Kanäle RL und RLc werden in dem Encoder vor dem, zur Berechnung der Residuale durchgeführten, Korrelationsvergleich zu einem gemeinsamen vorderen rechten Kanal zusammengeführt, und die für die Separierung notwendigen Parameter bestimmt. Dies wird z.B. wie im Zusammenhang der Zusammenfügung der Kanäle LS* und L* in dem 5.1 System beschrieben durchgeführt. Entsprechend werden in dem Decoder auf der Basis der Kanäle des Downmixsignals FL<'>, FR<'>, BL<'>, BR<'>mit dem Korrelationsvergleich und evtl, einer Korrektur durch das gemittelte Residual Δ die Kanäle (FL + 1/V2 * FLc), (FR + 1/V2 * FRc), FC, BL, BR, BC, SiL und SiR des Multikanalsignals bestimmt. Danach werden analog zu den Kanälen L*, LS*, R*, RS* des 5.1 -Systems die Kanäle FL, FR, FLc, FRc aus den Kanälen (FL + 1/V2 * FLc), (FR + 1/V2 * FRc) bestimmt. FL<'>, FR<'>, BL<'>, BR<'>als auch gegebenenfalls der Mittelwert Δ aller Residuale Δ-ι , Δ2, Δ3, Δ* lassen sich anhand eines Base Audio Codec, der für diesen Zweck speziell angepasst werden kann («Tuning»), dies zwecks effizienter Speicherung oder Übertragung, beispielsweise zwischen eine Encoder und Decoder, siehe Fig. 6 (wobei im vorliegenden Beispiel noch eine zusätzliche räumliche Enkodierung und Dekodierung anhand der sogenannten The channels FL and FLc are merged in the encoder before the correlation comparison made to calculate the residual, to a common front left channel, and the parameters necessary for the separation are determined. The channels RL and RLc are merged in the encoder before the, to calculate the Residuale performed correlation comparison to a common front right channel, and determines the parameters necessary for the separation. This is e.g. as described in connection with the assembly of the channels LS * and L * in the 5.1 system. Accordingly, in the decoder, based on the channels of the downmix signal FL <'>, FR <'>, BL <'>, BR <'> with the correlation comparison and possibly a correction by the mean residual Δ, the channels (FL + 1 / V2 * FLc), (FR + 1 / V2 * FRc), FC, BL, BR, BC, SiL and SiR of the multi-channel signal. Thereafter, analogous to the channels L *, LS *, R *, RS * of the 5.1 system, the channels FL, FR, FLc, FRc from the channels (FL + 1 / V2 * FLc), (FR + 1 / V2 * FRc) determined. FL <'>, FR <'>, BL <'>, BR <'> and, if appropriate, the mean value Δ of all residuals Δ-1, Δ2, Δ3, Δ * can be determined using a base audio codec, which is specific for this purpose can be adapted ("Tuning"), for the purpose of efficient storage or transmission, for example between an encoder and decoder, see Fig. 6 (in the present example, an additional spatial encoding and decoding using the so-called
13 nichtlinearen inversen Kodierung zwischen den Kanälen FL und FLc bzw. zwischen den Kanälen RL und RLc stattfindet), komprimieren und anschliessend dekomprimieren. 13 non-linear inverse coding between the channels FL and FLc or between the channels RL and RLc takes place), compress and then decompress.
[0074] Ebenso kann das im folgenden beschriebene System sich eine bereits im Base Audio Coder ausgeführte FourierTransformation zunutze machen, womit der insgesamt notwendige Rechenaufwand sich deutlich herabsetzen lässt. Likewise, the system described below can make use of a Fourier transformation already carried out in the base audio coder, whereby the overall computation effort required can be considerably reduced.
[0075] Durch Korrelationsvergleich von FL<'>und FR<'>gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (FC - 2 * Δ-ι) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (FL + 1/V2 * FLc + 0.5 * SiL) + Δ-ι und (FR + 1/V2 * FRc + 0.5 * SiR) + Δ·|. Siehe hierzu Fig. 8. By correlation comparison of FL <'> and FR <'> according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, now a signal 0.5 * (FC - 2 * Δ-ι) are extracted ( which is then multiplied by a factor of 2) as well as two signals (FL + 1 / V2 * FLc + 0.5 * SiL) + Δ-1 and (FR + 1 / V2 * FRc + 0.5 * SiR) + Δ · |. See Fig. 8.
[0076] Durch Korrelationsvergleich von FR<'>und BR<'>gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (SiR - 2 * Δ2) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (FR + 1/V2 * FRc + 0.5 * FC) + Δ2und (BR + 0.5 * BC) + Δ2. Siehe hierzu Fig. 8. By correlation comparison of FR <'> and BR <'> according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, now a signal 0.5 * (SiR - 2 * Δ2) are extracted (which multiplied by 2) as well as two signals (FR + 1 / V2 * FRc + 0.5 * FC) + Δ2 and (BR + 0.5 * BC) + Δ2. See Fig. 8.
[0077] Durch Korrelationsvergleich von BR<'>und BL<'>gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (BC - 2 * Δ3) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (BR +0.5 * SiR) + Δ3und (BL + 0.5 * SiL) + Δ3. Siehe hierzu Fig. 8. By correlation comparison of BR <'> and BL <'> according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, now a signal 0.5 * (BC - 2 * Δ3) are extracted (which multiplied by 2) as well as two signals (BR + 0.5 * SiR) + Δ3 and (BL + 0.5 * SiL) + Δ3. See Fig. 8.
[0078] Durch Korrelationsvergleich von FL<'>und BL<'>gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (SiL - 2 * Δ4) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (FL + 1/V2 * FLc + 0.5 * FC) + Δ4und (BL + 0.5 * BC) + Δ4. By correlation comparison of FL <'> and BL <'> according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, now a signal 0.5 * (SiL - 2 * Δ4) are extracted (which multiplied by 2) as well as two signals (FL + 1 / V2 * FLc + 0.5 * FC) + Δ4 and (BL + 0.5 * BC) + Δ4.
Siehe hierzu Fig. 8. See Fig. 8.
[0079] Mit den so extrahierten Signalen 0.5 * (FC - 2 * Δ-ι), 0.5 * (SiR - 2 * Δ2), 0.5 * (BC - 2 * Δ3), 0.5 * (SiL - 2 * Δ4) lassen sich, sofern die Residuale Δ-ι , Δ2, Δ3, Δ4nicht bekannt sind, nunmehr sämtliche übrigen Signale FL + 1/V2 * FLc, FR + 1/V2 * FRc, BR, BL näherungsweise errechnen: With the thus extracted signals 0.5 * (FC - 2 * Δ-1), 0.5 * (SiR - 2 * Δ2), 0.5 * (BC - 2 * Δ3), 0.5 * (SiL - 2 * Δ4) if the residuals Δ-1, Δ2, Δ3, Δ4 are not known, then now approximately calculate all other signals FL + 1 / V2 * FLc, FR + 1 / V2 * FRc, BR, BL:
FL + 1/V2 * FLc s (FL + 1/V2 * FLc + 0.5 * SiL) + ^ - 0.5 * (SiL - 2 * A4) = (FL + 1/V2 * FLc + 0.5 * FC) + Δ4- 0.5 * FL + 1 / V2 * FLc s (FL + 1 / V2 * FLc + 0.5 * SiL) + ^ - 0.5 * (SiL - 2 * A4) = (FL + 1 / V2 * FLc + 0.5 * FC) + Δ4- 0.5 *
(FC - 2 * Δ-ι) (FC - 2 * Δ-1)
FR + 1/V2 * FRc s (FR + 1/V2 * FRc + 0.5 * SiR) + ^ - 0.5 * (SiR - 2 * AZ) = (FR + 1/V2 * FRc + 0.5 * FC) + Δ2- 0.5 * FR + 1 / V2 * FRc s (FR + 1 / V2 * FRc + 0.5 * SiR) + ^ - 0.5 * (SiR - 2 * AZ) = (FR + 1 / V2 * FRc + 0.5 * FC) + Δ2- 0.5 *
(FC - 2 * Ai) (FC - 2 * Ai)
BR s (BR + 0.5 * BC) + Δ2- 0.5 * (BC - 2 * Δ3) = (BR + 0.5 * SiR) + Δ3- 0.5 * (SiR - 2 * Δ2) BR s (BR + 0.5 * BC) + Δ 2 - 0.5 * (BC - 2 * Δ 3) = (BR + 0.5 * SiR) + Δ 3 - 0.5 * (SiR - 2 * Δ 2)
BL s (BL + 0.5 * BC) + Δ4- 0.5 * (BC - 2 * Δ3) = (BL + 0.5 * SiL) + Δ3- 0.5 * (SiL - 2 * Δ4) BL s (BL + 0.5 * BC) + Δ 4 - 0.5 * (BC - 2 * Δ 3) = (BL + 0.5 * SiL) + Δ 3 - 0.5 * (SiL - 2 * Δ 4)
[0080] Aus den doppelten Lösungswegen ergibt sich, dass der Korrelationsvergleich nicht zwingend für alle drei möglichen Ausgangssignale erfolgen muss, siehe auch Fig. 14, sondern auch weniger Ausgangssignale enthalten kann. Es ergibt sich hier eine Unzahl verschiedener Kombinationsmöglichkeiten, die sich unschwer aus obigen Gleichungen ableiten lassen. From the double solution paths it follows that the correlation comparison does not necessarily have to be made for all three possible output signals, see also FIG. 14, but may also contain fewer output signals. This results in a myriad of different possible combinations, which can be easily derived from the above equations.
[0081 ] Gleiche Bemerkungen gelten im Übrigen auch für Systeme mit Residualkorrekturen. By the way, the same remarks also apply to systems with residual corrections.
[0082] Sind die Residuale Δ-ι , Δ2, Δ3, Δ4bekannt, ergeben sich folgende fett bezeichneten Residualkorrekturen (wobei bei einem solchen System sich allerdings keine Komprimierung erreichen lässt, dajedem Korrelationsvergleich schlussendlich wenigstens ein solches Residual zugeordnet werden muss): If the residuals Δ-1, Δ2, Δ3, Δ4 are known, the following boldly marked residual corrections result (although in such a system no compression can be achieved, since at least one such residual must ultimately be assigned to each correlation comparison):
FL + 1/V2 * FLc = (FL + 1/V2 * FLc + 0.5 * SiL) + ^ - 0.5 * (SiL - 2 * Δ4) - ^ - Δ4= (FL + 1Λ/2 * FLc + 0.5 * FC) + Δ4FL + 1 / V2 * FLc = (FL + 1 / V2 * FLc + 0.5 * SiL) + ^ - 0.5 * (SiL - 2 * Δ4) - ^ - Δ4 = (FL + 1Λ / 2 * FLc + 0.5 * FC ) + Δ4
- 0.5 * (FC - 2 * Δ-ι) - Δ4- ΔΊ- 0.5 * (FC - 2 * Δ-ι) - Δ4- ΔΊ
FR + 1/V2 * FRc = (FR + 1/V2 * FRc + 0.5 * SiR) + ^ - 0.5 * (SiR - 2 * Δ2) - ^ - Δ2= (FL + 1/V2 * FLc + 0.5 * FC) + Δ2- 0.5 * (FC - 2 * Δ^ - Δ2- Δ-ι FR + 1 / V2 * FRc = (FR + 1 / V2 * FRc + 0.5 * SiR) + ^ - 0.5 * (SiR - 2 * Δ2) - ^ - Δ2 = (FL + 1 / V2 * FLc + 0.5 * FC ) + Δ2- 0.5 * (FC - 2 * Δ ^ - Δ2-Δ-ι
BR = (BR + 0.5 * BC) + Δ2- 0.5 * (BC - 2 * Δ3) - Δ2- Δ3= (BR + 0.5 * SiR) + Δ3- 0.5 * (SiR - 2 * Δ2) - Δ3- Δ2BL = (BL + 0.5 * BC) + Δ4- 0.5 * (BC - 2 * Δ3) - Δ4- Δ3= (BL + 0.5 * SiL) + Δ3- 0.5 * (SiL - 2 * Δ4) - Δ3- Δ4BR = (BR + 0.5 * BC) + Δ2- 0.5 * (BC - 2 * Δ3) - Δ2 - Δ3 = (BR + 0.5 * SiR) + Δ3 - 0.5 * (SiR - 2 * Δ2) - Δ3 - Δ2BL = (BL + 0.5 * BC) + Δ4- 0.5 * (BC - 2 * Δ3) - Δ4 - Δ3 = (BL + 0.5 * SiL) + Δ3 - 0.5 * (SiL - 2 * Δ4) - Δ3 - Δ4
[0083] Werden nunmehr die Residualkorrekturen nicht anhand der Residuale Δ4, Δ2, Δ3, Δ4vorgenommen, sondern anhand des Mittelwertes A aller Residuale, sind nunmehr die fett bezeichneten Residualkorrekturen durch den Ausdruck If now the residual corrections are not made on the basis of the residuals Δ4, Δ2, Δ3, Δ4, but on the basis of the mean value A of all residuals, the residual corrections denoted bold are now represented by the expression
- 2Δ zu ersetzen. Dies führt gegenüber Signalen ohne Residualkorrektur zu deutlich herabgesetzten Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten, ohne dass sämtliche Residuale Δ-ι, Δ2, Δ3, Δ4, beispielweise von einem Encoder zu einem Decoder, übertragen werden müssen. Somit ergibt sich eine drastische Reduzierung der Bandbreite. - replace 2Δ. Compared to signals without residual correction, this leads to markedly reduced artefacts or discoloration of the timbre and other unmasking effects, without having to transfer all residual Δ-1, Δ2, Δ3, Δ4, for example from an encoder to a decoder. This results in a drastic reduction of the bandwidth.
[0084] Sollen andere räumliche Enkodierungen und Dekodierungen zur Anwendung kommen, wie beispielsweise die sogenannte nichtlineare inverse Kodierung gemäss der eigenen unveröffentlichter Anmeldung CH 02 300/12, siehe Fig. 9, lassen sich diese in obige Überlegungen gemäss Fig. 6 unmittelbar integrieren. If other spatial encodings and decoders are to be used, such as the so-called non-linear inverse encoding according to our own unpublished application CH 02 300/12, see FIG. 9, these can be directly integrated into the above considerations according to FIG.
[0085] Beispielsweise lassen sich FL und FLc bzw. FR und FRc vorteilhaft durch je eine solche nichtlineare inverse Kodierung der absolut oder näherungsweise gewonnenen Signale für (FL + 1/V2 * FLc) bzw. für (FR + 1/V2 * FRc) ebenfalls näherungsweise gewinnen: For example, FL and FLc or FR and FRc can be advantageously obtained by such a non-linear inverse coding of the absolute or approximately obtained signals for (FL + 1 / V2 * FLc) or for (FR + 1 / V2 * FRc) also approximately gain:
[0086] So wird etwa das linke Ausgangssignal für FL einer Anordnung gemäss Fig. 9 mit dem Faktor 1 (60001 ) verstärkt, das rechte Ausgangssignal für FLc einer solchen Anordnung jedoch mit dem Faktor 1/V2 (60002). In gleicher Weise wird etwa das rechte Ausgangssignal für FR einer Anordnung gemäss Fig. 9 mit dem Faktor 1 verstärkt (60002), das linke Ausgangssignal für FRc einer solchen Anordnung jedoch mit dem Faktor 1/V2 (60001 ). For example, the left output signal for FL of an arrangement according to FIG. 9 is amplified by the factor 1 (60001), but the right output signal for FLc of such an arrangement is multiplied by the factor 1 / V2 (60002). Similarly, the right output signal for FR of an arrangement according to FIG. 9 is amplified by the factor 1 (60002), whereas the left output signal for FRc of such an arrangement is multiplied by the factor 1 / V2 (60001).
14 [0087] Ein NHK-22.2-Middle-Layer-Signal lässt sich so hinsichtlich zu speichernder oder zu übertragenden Daten, beispielsweise zwischen einem Encoder und einem Decoder, im Sinne der Fig. 6 sehr deutlich reduzieren. An NHK-22.2 middle-layer signal can thus be significantly reduced in terms of data to be stored or transmitted, for example between an encoder and a decoder, in the sense of FIG.
Anwendung des Erfindungsgegenstands auf ein NHK-22.2-Top-Layer-Signal ohne TpC (siehe Fig. 7 und 10 bis 15): Application of the subject invention to an NHK 22.2 top layer signal without TpC (see FIGS. 7 and 10 to 15):
[0088] Das soeben beschriebene Wirkungsprinzip für ein NHK-22.2-Middle-Layer-Signal lässt sich unschwer auf ein NHK22.2-Top-Layer-Signal übertragen, sofern folgende Gleichsetzungen in obigem Beispiel vorgenommen werden: The principle of action just described for a NHK-22.2 middle-layer signal can be easily transferred to a NHK22.2 top-layer signal, provided the following equations are made in the above example:
TpFL = FL + 1/V<~>2 * FLc TpFR = FR + 1/V<~>2 * FRc TpFC = FC TpSiR = SiR TpBR = BR TpBC = BC TpBL = BL TpSiL = SiL TpFL = FL + 1 / V <~> 2 * FLc TpFR = FR + 1 / V <~> 2 * FRc TpFC = FC TpSiR = SiR TpBR = BR TpBC = BC TpBL = BL TpSiL = SiL
[0089] Eine zusätzliche räumliche Enkodierung und Dekodierung für TpFL und TpFR entfällt demnach. An additional spatial encoding and decoding for TpFL and TpFR is therefore eliminated.
[0090] Allerdings wird bei einer solchen Übertragung der TpC vernachlässigt, der beispielsweise bei NHK-22.2-Top-LayerSignalen eine wesentliche Rolle spielt. However, in such a transmission the TpC is neglected, which plays an essential role, for example, in NHK-22.2 top-layer signals.
Anwendung des Erfindungsgegenstands auf ein NHK-22.2-Top-Layer-Signal mit TpC (siehe Fig. 7 und 10 bis 15): Application of the subject invention to an NHK-22.2 top-layer signal with TpC (see FIGS. 7 and 10 to 15):
[0091 ] Ein viertes, komplexes Beispiel einer Anwendung des Erfindungsgegenstands, hier gemäss Fig. 10 und 1 1 , auf ein NHK-22.2-Top-Layer-Signal, siehe Fig. 7, stellt für die Kanäle TpFL, TpFR, TpFC, TpC, TpBL, TpBR, TpSiL, TpSiR, TpBC die Summenbildung (der «Downmix») A fourth, complex example of an application of the subject invention, here according to FIGS. 10 and 11, to an NHK-22.2 top-layer signal, see FIG. 7, represents for the channels TpFL, TpFR, TpFC, TpC , TpBL, TpBR, TpSiL, TpSiR, TpBC the summation (the downmix)
TpFL<'>= TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.5 * TpC TpFL <'> = TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.5 * TpC
TpFR<'>= TpFR + 0.5 * TpFC + 0.5 * TpSiR TpFR <'> = TpFR + 0.5 * TpFC + 0.5 * TpSiR
TpBL<'>= TpBL + 0.5 * TpBC + 0.5 * TpSiL TpBL <'> = TpBL + 0.5 * TpBC + 0.5 * TpSiL
TpBR<'>= TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.5 * TpC bzw. TpBR <'> = TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.5 * TpC respectively
TpFL<'>= TpFL + 0.5 * TpFC + 0.5 * TpSiL TpFR<'>= TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.5 * TpC TpBL<'>= TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.5 * TpC TpBR<'>= TpBR + 0.5 * TpBC + 0.5 * TpSiR dar, wobei TpFL<'>, TpFR<'>, TpBL<'>, TpBR<'>wiederum den Eckpunkten des umschriebenen Quadrats der Fig. 10 gemäss Fig. 3 entsprechen. Es lässt sich nunmehr für jede Seite des Quadrats ein Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, in der für die bisherigen NHK-22.2-Anordnungen beschriebenen Weise ausführen, und es ergeben sich demnach dieselben Signale wie oben beschrieben mit Ausnahme von neu TpFL <'> = TpFL + 0.5 * TpFC + 0.5 * TpSiL TpFR <'> = TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.5 * TpC TpBL <'> = TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.5 * TpC TpBR <'> = TpBR + 0.5 * TpBC + 0.5 * TpSiR, where TpFL <'>, TpFR <'>, TpBL <'>, TpBR <'> again the vertices of the circumscribed square of FIG. 10 according to FIG. 3 correspond. It is now possible for each side of the square to perform a correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, in the manner described for the previous NHK 22.2 arrangements, and there are therefore the same signals as described above with the exception of new
TpFL + 0.5 * TpC = (TpFL + 0.5 * TpC + 0.5 * TpSiL) + ^ - 0.5 * (TpSiL - 2 * Δ4) = (TpFL + 0.5 * TpC + 0.5 * TpFC) TpFL + 0.5 * TpC = (TpFL + 0.5 * TpC + 0.5 * TpSiL) + ^ - 0.5 * (TpSiL - 2 * Δ4) = (TpFL + 0.5 * TpC + 0.5 * TpFC)
+ Δ4- 0. 5 * (TpFC - 2 * Δ^ und + Δ4-0.5 * (TpFC - 2 * Δ ^ and
TpBR + 0.5 * TpC = (TpBR + 0.5 * TpC + 0.5 * TpBC) + Δ2- 0.5 * (TpBC - 2 * Δ3) 5 (TpBR + 0.5 * TpC + 0.5 * TpSiR) TpBR + 0.5 * TpC = (TpBR + 0.5 * TpC + 0.5 * TpBC) + Δ2- 0.5 * (TpBC - 2 * Δ3) 5 (TpBR + 0.5 * TpC + 0.5 * TpSiR)
+ Δ3- 0.5 * (TpSiR - 2 * Δ2) bzw. + Δ3- 0.5 * (TpSiR - 2 * Δ2) or
TpFR + 0.5 * TpC = (TpFR + 0.5 * TpC + 0.5 * TpSiR) + ^ - 0. 5 * (TpSiR - 2 * Δ2) = (TpFR + 0.5 * TpC + 0.5 * TpFC) + Δ2- 0.5 * (TpFC - 2 * Δ^ TpFR + 0.5 * TpC = (TpFR + 0.5 * TpC + 0.5 * TpSiR) + ^ - 0.5 * (TpSiR - 2 * Δ2) = (TpFR + 0.5 * TpC + 0.5 * TpFC) + Δ2- 0.5 * (TpFC - 2 * Δ ^
TpBL + 0.5 * TpC = (TpBL + 0.5 * TpC + 0.5 * TpBC) + Δ4- 0.5 * (TpBC - 2 * Δ3) = (TpBL + 0.5 * TpC + 0.5 * TpSiL) + Δ3- 0.5 * (TpSiL - 2 * Δ4) TpBL + 0.5 * TpC = (TpBL + 0.5 * TpC + 0.5 * TpBC) + Δ4- 0.5 * (TpBC - 2 * Δ3) = (TpBL + 0.5 * TpC + 0.5 * TpSiL) + Δ3 - 0.5 * (TpSiL - 2 * Δ4)
[0092] Dann gilt für den Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, der näherungsweise gewonnenen Signale für TpFL + 0.5 * TpC und TpBR + 0.5 * TpC bzw. TpFR + 0.5 * TpC und TpBL + 0.5 * TpC und für Fig. 3, dass für die aus benachbarten Korrelationsvergleichen resultierenden, näherungsweisen Signale nur die Differenz η4- η3oder η2- η-ι bzw. η-ι - η4oder η3- η2unmittelbaren Then applies to the correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, the approximately obtained signals for TpFL + 0.5 * TpC and TpBR + 0.5 * TpC or TpFR + 0.5 * TpC and TpBL + 0.5 * TpC and for FIG. 3, that for the approximate signals resulting from adjacent correlation comparisons, only the difference η4-η3 or η2-η-ι or η-ι-η4 or η3-η2-immediate
15 Einfluss nach Residualkorrektur um den Mittelwert der Summe Δ-ι + Δ2+ Δ3+ Δ4auf das aus diesem neuen Korrelationsvergleich resultierende Residual hat. 15 influence after residual correction by the mean value of the sum .DELTA.-1 + .DELTA.2 + .DELTA.3 + .DELTA.4 has on the Residual resulting from this new correlation comparison.
[0093] Nahe läge ebenfalls der Downmix TpFL<'>= TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.25 * TpC TpFR<'>= TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.25 * TpC TpBL<'>= TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.25 * TpC TpBR<'>= TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.25 * TpC Close would also be the downmix TpFL <'> = TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.25 * TpC TpFR <'> = TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.25 * TpC TpBL <'> = TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.25 * TpC TpBR <'> = TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.25 * TpC
[0094] Betrachtet werden nunmehr Now consider
Δ2- Δ-, = η3- η4= a-ι Δ2- Δ-, = η3- η4 = a-ι
Δ3- Δ2= η4- τ|ι = a2Δ3 - Δ2 = η4 - τ | ι = a2
Δ4- Δ3= ηι - η2= a3Δ4 - Δ3 = ηι - η2 = a3
Δι - Δ4= η2- η3= a4und demnach Δι - Δ4 = η2 - η3 = a4and accordingly
(Δ2- Δ-ι) + (Δ3- Δ2) = η3- τ|ι = a-ι + a2(Δ2-Δ-ι) + (Δ3-Δ2) = η3-τ | ι = a-1 + a2
(Δ3- Δ2) + (Δ4- Δ3) = η4- η2= a2+ a3(Δ3 - Δ2) + (Δ4 - Δ3) = η4 - η2 = a2 + a3
(Δ4- Δ3) + (Δι - Δ4) = τ|ι - η3= a3+ a4(Δ4 - Δ3) + (Δι - Δ4) = τ | ι - η3 = a3 + a4
(Δι - Δ4) + (Δ2- Δι) = η2- η4= a4+ ai (Δι - Δ4) + (Δ2 - Δι) = η2 - η4 = a4 + ai
[0095] Gleiche Überlegung wie in der Offenbarung der Erfindung führt zu T|2<=>|4 + (^4 + ai) bzw. τ|2= τ|4- (a2+ a3) und ηι = η3+ (a3+ 84) bzw. τ)ι = η3 - (ai + a2) was schlichtweg bedeutet, dass in diesem Falle der Extraktion von TpC kein gemeinsames Residual zugeordnet werden kann. The same consideration as in the disclosure of the invention leads to T | 2 <=> | 4 + (^ 4 + ai) or τ | 2 = τ | 4 (a2 + a3) and ηι = η3 + (a3 + 84) or τ) ι = η3 - (ai + a2) which simply means that in this case the extraction of TpC can not be assigned a common residual.
[0096] Ein solcher Downmix ist demnach möglich, jedoch nicht zu empfehlen, sofern nicht ein zur Extraktion des TpC zugehöriges Residual mit übertragen wird. Such a downmix is therefore possible, but not recommended, unless a residual associated with the extraction of the TpC is also transferred.
[0097] Eine Alternative zur näherungsweisen Extraktion des TpC mittels Korrelationsvergleichs stellt der Downmix An alternative to the approximate extraction of the TpC by means of correlation comparison is the downmix
TpFL<'>= TpFL + (0.5 * TpFC + 0.5 * TpC) + 0.5 * TpSiL TpFL <'> = TpFL + (0.5 * TpFC + 0.5 * TpC) + 0.5 * TpSiL
TpFR<'>= TpFR + (0.5 * TpFC + 0.5 * TpC) + 0.5 * TpSiR TpFR <'> = TpFR + (0.5 * TpFC + 0.5 * TpC) + 0.5 * TpSiR
TpBL<'>= TpBL + 0.5 * TpBC + 0.5 * TpSiL TpBL <'> = TpBL + 0.5 * TpBC + 0.5 * TpSiL
TpBR<'>= TpBR + 0.5 * TpBC + 0.5 * TpSiR dar, bei dem für den Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, zwischen TpFL<'>und TpFR<'>unmittelbar (0.5 * TpFC +0.5 * TpC - 2 * Δ-ι) extrahiert wird, und sich anschliessend eine Residualkorrektur in der oben beschriebenen Form durchführen lässt. TpBR <'> = TpBR + 0.5 * TpBC + 0.5 * TpSiR, where for the correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, between TpFL <'> and TpFR <'> immediately (0.5 * TpFC + 0.5 * TpC - 2 * Δ-1) is extracted, and then a residual correction in the form described above can be carried out.
[0098] Tatsächlich ist eine Lokalisation zwischen TpFC und TpC psychoakustisch mit grosser Unscharfe behaftet, die sich gezielt nutzen lässt: In fact, a localization between TpFC and TpC is psychoacoustically fraught with much fuzziness, which can be used selectively:
[0099] Anstelle eines Korrelationsvergleichs zur Extraktion des TpC wird mittels aus dem Stand der Technik bekannten einfachem oder dualem Panning die Abbildungsrichtung oder die Abbildungsbreite des exakten oder approximierten Signals (0.5 * TpFC + 0.5 * TpC) so beeinflusst, dass diese dem originalen Signal möglichst gleich kommt, und somit ein zum Originalsignal psychoakustisch vergleichbarer Eindruck entsteht. Übertragen werden somit anstelle einer räumlichen Kodierung oder eines Korrelationsvergleiches zur Gewinnung des TpC gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, nur noch die Parameter des einfachen oder dualen Panning. Instead of a correlation comparison for the extraction of the TpC, the imaging direction or the image width of the exact or approximated signal (0.5 * TpFC + 0.5 * TpC) is influenced by means of simple or dual panning known from the prior art so that it matches the original signal as much as possible comes immediately, and thus creates a psychoacoustically comparable impression to the original signal. Instead of a spatial coding or a correlation comparison for obtaining the TpC according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, only the parameters of the simple or dual panning are transmitted.
[0100] Sollen andere räumliche Enkodierungen und Dekodierungen zur Anwendung kommen, wie etwa die sogenannte inverse Kodierung, siehe oben, lassen sich diese in obige Überlegungen unmittelbar integrieren: If other spatial encodings and decoders are to be used, such as the so-called inverse encoding, see above, these can be directly integrated into the above considerations:
[0101 ] Beispielsweise lassen sich TpFC und TpC vorteilhaft durch eine nichtlineare inverse Kodierung gemäss Fig. 9, wie bereits oben erläutert, ausdrücken, die zudem mit einfachem oder dualem Panning verkoppelt werden kann. Das Resultat ist aufgrund der psychoakustischen Gegebenheiten ein präziser, natürlicher Höreindruck. For example, TpFC and TpC can be advantageously expressed by a non-linear inverse coding according to FIG. 9, as already explained above, which can also be coupled with simple or dual panning. The result is due to the psychoacoustic conditions a precise, natural hearing.
[0102] TpFL<'>, TpFR<'>, TpBL<'>, TpBR<'>als auch gegebenenfalls der Mittelwert A aller Residuale Δ4, Δ2, Δ3, Δ4(sowie allenfalls ein aus einem Korrelationsvergleich, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, zur Bestimmung von TpC resultierendes Residual, oder auch das TpC-Signal selbst) lassen sich anhand eines Base Audio Codec, der für diesen Zweck speziell angepasst werden kann («Tuning»), dies zwecks effizienter Speicherung oder Übertragung, siehe Fig. 6 (wobei im vorliegenden Beispiel noch eine zusätzliche räumliche Enkodierung und Dekodierung beispielsweise anhand der sogenannten inversen Kodierung stattfinden kann oder auch ein einfaches oder duales Panning), beispielsweise in einem Encoder, komprimieren und anschliessend, beispielsweise in einem Decoder, dekomprimieren. TpFL <'>, TpFR <'>, TpBL <'>, TpBR <'> and, if appropriate, the mean value A of all residuals Δ4, Δ2, Δ3, Δ4 (and possibly one from a correlation comparison, this according to the rules for Obtaining the real and imaginary parts of signals, see disclosure of the invention, for determining TpC resulting residual, or even the TpC signal itself) can be based on a base audio codec, which can be specially adapted for this purpose ("tuning") for efficient storage or transmission, see FIG. 6 (where in the present example additional spatial encoding and decoding can take place, for example, using the so-called inverse coding or else a simple or dual panning), for example in an encoder, and then for example, in a decoder, decompress.
[0103] Ebenso können die insgesamt beschriebenen Systeme sich eine bereits im Base Audio Coder ausgeführte Fourier-Transformation zunutze machen, womit sich der insgesamt notwendige Rechenaufwand deutlich herabsetzen lässt. Likewise, the systems described in total can make use of a Fourier transformation already carried out in the base audio coder, whereby the overall computation effort required can be significantly reduced.
16 Beispielhafter Aufbau eines Encoder und Decoder für ein NHK-22.2-Top-Layer-Signal ohne TpC (siehe Fig. 7 und 10 bis 15): 16 Example Design of an Encoder and Decoder for a NHK 22.2 Top Layer Signal without TpC (See FIGS. 7 and 10 to 15):
[0104] Insgesamt lassen sich die, der beschriebenen Kodierung zugeordneten, Parameter, siehe Fig. 6, als Headerinformation, als Datenpuls oder als permanenten Datenstrom, beispielsweise von einem Encoder zu einem Decoder, übertragen. Overall, the parameters associated with the described coding, see FIG. 6, can be transmitted as header information, as a data pulse or as a permanent data stream, for example from an encoder to a decoder.
[0105] Einen möglichen Aufbau eines Encoder und Decoder zur Encodierung und Decodierung eines NHK-22.2-TopLayer-Signals ohne TpC zeigen Fig. 12 bis 14: A possible construction of an encoder and decoder for encoding and decoding an NHK 22.2 top layer signal without TpC is shown in FIGS. 12 to 14:
[0106] Fig. 12 stellt hierbei einen Encoderbaustein E, dar, dem drei benachbarte Eingangskanäle I * (t), ci* (t) und r * (t) bzw. optional ein weiterer Eingangskanal c'<1>* (t) oder ein weiterer Eingangskanal c,2*(t) zugeführt werden. Aus diesen drei Eingangskanälen wird ein Downmix Li<'>(t) = li* (t) + 0.5 * Ci* (t) und FIG. 12 shows an encoder module E, in which three adjacent input channels I * (t), ci * (t) and r * (t) or optionally a further input channel c '<1> * (t) or another input channel c, 2 * (t) are supplied. From these three input channels, a downmix Li <'> (t) = li * (t) + 0.5 * Ci * (t) and
Ri<'>(t) = r * (t) + 0.5 * Ci* (t) oder Ri <'> (t) = r * (t) + 0.5 * Ci * (t) or
Li<'>(t) = li* (t) + 0.5 * Ci* (t) + 0.5 * ch* (t) und Li <'> (t) = li * (t) + 0.5 * Ci * (t) + 0.5 * ch * (t) and
Ri<'>(t) = r *(t) + 0.5 * Ci* (t) + 0.5 * ci2*(t) berechnet, wobei gegebenenfalls Ci1* (t) bzw. Ci2*(t) den jeweils nächstgelegenen, nicht beiden Downmixkanälen Lj<'>(t) und R,<'>(t) zugemischten Mitten-Kanal (demnach TpFC oder TpSiR oder TpBC oder TpSiL) bezeichnet. Für beide Downmix-Kanäle L,<'>(t) und R,<'>(t) wird anschliessend je eine Fast Fourier Transform (FFT) ausgeführt. Diese ergeben einerseits die Ausgangskanäle des Encoderbausteins, und andererseits wird auf diese ein Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, angewandt. Ebenso wird für den Eingangskanal C * (t) ebenfalls eine Fast Fourier Transform (FFT) ausgeführt. Es wird nunmehr das Residual Ai gemäss der Formel Ri <'> (t) = r * (t) + 0.5 * Ci * (t) + 0.5 * ci2 * (t) is calculated, where appropriate Ci1 * (t) or Ci2 * (t) the nearest, not both downmix channels Lj <'> (t) and R, <'> (t) are mixed center channel (according to TpFC or TpSiR or TpBC or TpSiL). For both downmix channels L, <'> (t) and R, <'> (t), a Fast Fourier Transform (FFT) is then executed. On the one hand, these result in the output channels of the encoder module, and on the other hand, a correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, is applied to them. Similarly, a Fast Fourier Transform (FFT) is also performed for the input channel C * (t). It is now the residual Ai according to the formula
Δι(k) = * [Ci (k) - Ci(k)] bestimmt, welches ebenfalls ein Ausgangssignal des Encoderbausteins darstellt. (Das beschriebene System lässt sich gemäss Offenbarung der Erfindung unter Hinzufügen von weiteren Eingangssignalen, beispielsweise in Anlehnung an Fig. 14, so modifizieren, dass das Residual Ai auch gemäss der Formeln Δ = Li - Lj* oder Δι (k) = * [Ci (k) -Ci (k)], which also represents an output signal of the encoder module. (The system described can be modified in accordance with disclosure of the invention by adding further input signals, for example based on FIG. 14, such that the residual Ai can also be expressed according to the formulas Δ = Li-Lj * or
Δ = Rj - Rj* berechnet werden kann.) Δ = Rj - Rj * can be calculated.)
[0107] Fig. 13 stellt nunmehr den Gesamtaufbau des Encoder dar. Vier Encoderbausteinen E4, E2, E3, E4werden folgende Eingangssignale zugeordnet: FIG. 13 now shows the overall structure of the encoder. Four encoder modules E4, E2, E3, E4 are assigned the following input signals:
TpFC = Ci<*>(t) TpFC = Ci <*> (t)
TpFL = li<*>(t) = r4<*>(t) TpFL = li <*> (t) = r4 <*> (t)
TpFR = rx‘ (t) = 12<*>(t) TpFR = rx '(t) = 12 <*> (t)
TpSiR = c2<*>(t) = Ci2<*>(t) = c3i<*>(t) TpSiR = c2 <*> (t) = Ci2 <*> (t) = c3i <*> (t)
TpBC = c3<*>(t) TpBC = c3 <*> (t)
TpBR = r2<*>(t) = l3<*>(t) TpBR = r2 <*> (t) = l3 <*> (t)
TpBL = r3<*>(t) = l4<*>(t) TpBL = r3 <*> (t) = l4 <*> (t)
TpSiL = c4<*>(t) = Cn<*>(t) = c32<*>(t) TpSiL = c4 <*> (t) = Cn <*> (t) = c32 <*> (t)
[0108] Der Encoderbaustein E-ι liefert die Ausgangssignale LC (k), R- (k), Δ-ι (k). Der Encoderbaustein E2liefert das Ausgangssignal A2(k). Der Encoderbaustein E3liefert die Ausgangssignale L3<'>(k), R3<'>(k), A3(k). Der Encoderbaustein E4liefert das Ausgangssignal A4(k). The encoder module E-ι supplies the output signals LC (k), R- (k), Δ-ι (k). The encoder module E2 supplies the output signal A2 (k). The encoder module E3 supplies the output signals L3 <'> (k), R3 <'> (k), A3 (k). The encoder module E4 delivers the output signal A4 (k).
[0109] Während die Ausgangssignale L/ (k), R/ (k) und L3<'>(k), R3<'>(k) zugleich Ausgangssignale des Encoder darstellen, wird abschliessend der Mittelwert A(k) der Residuale Δ-ι (k), A2(k), A3(k), A4(k) berechnet. Dieser Mittelwert stellt ebenfalls ein Ausgangssignal des Encoder dar. While the output signals L / (k), R / (k) and L3 <'> (k), R3 <'> (k) at the same time represent output signals of the encoder, the mean value A (k) of the residual Δ is finally -I (k), A2 (k), A3 (k), A4 (k). This average also represents an output signal of the encoder.
[0110] Fig. 14 zeigt nunmehr den Aufbau des Decoder: Fig. 14 now shows the structure of the decoder:
17 [0111 ] Es findet in diesem ein erster Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, anhand des linken Eingangssignals L (k) und des rechten Eingangssignals R/ (k) statt, wobei nur C-i(k) berechnet wird. There is in this a first correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, based on the left input signal L (k) and the right input signal R / (k) instead, where only Ci (k) is calculated.
[0112] Es findet in diesem ein zweiter Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, anhand des linken Eingangssignals R- (k) und des rechten Eingangssignals L3<'>(k) statt, wobei sowohl C2(k) als auch L2(k) berechnet werden. A second correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, takes place on the basis of the left input signal R- (k) and the right input signal L3 <'> (k), where both C2 (k) and L2 (k) are calculated.
[0113] Es findet in diesem ein dritter Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, anhand des linken Eingangssignals L3<'>(k) und des rechten Eingangssignals R3<'>(k) statt, wobei sowohl C3(k) als auch L3(k) berechnet werden. A third correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, is found on the basis of the left input signal L3 <'> (k) and the right input signal R3 <'> (k). instead of calculating both C3 (k) and L3 (k).
[0114] Es findet in diesem ein vierter Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung, anhand des linken Eingangssignals r3<'>(k) und des rechten Eingangssignals L-ι<'>(k) statt, wobei sowohl C4(k) als auch L4(k) und R4(k) berechnet werden. A fourth correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see disclosure of the invention, is found on the basis of the left input signal r3 <'> (k) and the right input signal L-1 <'> ( k), where both C4 (k) and L4 (k) and R4 (k) are calculated.
[0115] Anhand des Eingangssignals für das frequenzabhängige Residual A(k) werden nunmehr folgende frequenzabhängig beschriebenen Kanäle berechnet: Based on the input signal for the frequency-dependent residual A (k), the following frequency-dependent channels are now calculated:
Ci(k) + 2Δ (k) = ci (k) Ci (k) + 2Δ (k) = ci (k)
C2(k) + 2Δ (k) Ξ c2<*>(k) C2 (k) + 2Δ (k) Ξ c2 <*> (k)
L2(k) - CX(k) - 2A(t) s 12<*>( k) L2 (k) - CX (k) - 2A (t) s 12 <*> (k)
C3(k) + 2Δ (k) s c3<*>(k) C3 (k) + 2Δ (k) s c3 <*> (k)
L3(k) - C2(k) - 2A(k) s 13<*>(k) L3 (k) - C2 (k) - 2A (k) s 13 <*> (k)
C4(k) + 2Δ (k) s c4<*>(k) C4 (k) + 2Δ (k) s c4 <*> (k)
L4(k) - C3(k) - 2Δ (k) Ξ l4<*>(k) L4 (k) - C3 (k) - 2Δ (k) Ξ l4 <*> (k)
R4(k) - Ci(k) - 2Δ ( k) Ξ r4<*>(k) R4 (k) - Ci (k) - 2Δ (k) Ξ r4 <*> (k)
[0116] Auf jeden dieser frequenzabhängigen Kanäle wird nunmehr eine Inverse Fast Fourier Transform (IFFT) angewandt. An inverse Fast Fourier Transform (IFFT) is now applied to each of these frequency-dependent channels.
[0117] Es ergeben sich somit die folgenden Ausgangssignale für den Decoder, die näherungsweise die gleichnamigen Eingangssignale des Encoder darstellen, im Einzelnen: Thus, the following output signals for the decoder, which approximately represent the identically named input signals of the encoder, result in detail:
[0118] [0118]
Ci(t) + 2A(t) =Ci<*>(t) = TpFC c2(t) + 2A(t) = c2<*>(t) = TpSiR 12(t) - ci(t) - 2A(t) = l2<*>(t) = TpFR c3(t) + 2Δ (t) £= c3<*>(t) = TpBC l3(t) - c2(t) - 2Δ (t) S l3<*>(t) = TpBR c4(t) + 2Δ (t) S c4<*>(t) = TpSiL l4(t) - c3(t) - 2Δ (t) = l4<*>(t) = TpBL r4(t) - Ci(t) - 2Δ (t) = r4<*>(t) = TpFL Ci (t) + 2A (t) = Ci <*> (t) = TpFC c2 (t) + 2A (t) = c2 <*> (t) = TpSiR 12 (t) - ci (t) - 2A t) = l2 <*> (t) = TpFR c3 (t) + 2Δ (t) £ = c3 <*> (t) = TpBC l3 (t) - c2 (t) - 2Δ (t) S l3 <* > (t) = TpBR c4 (t) + 2Δ (t) S c4 <*> (t) = TpSiL l4 (t) - c3 (t) - 2Δ (t) = l4 <*> (t) = TpBL r4 (t) - Ci (t) - 2Δ (t) = r4 <*> (t) = TpFL
Schlussbemerkungen: Closing remarks:
[0119] Insgesamt dargestellte Prinzipien sind algorithmisch beliebig erweiterbar und gestatten somit insgesamt die effiziente Komprimierung von Multisignalen beliebiger, ja selbst höchster, Ordnung anhand eines Downmix, dies zum Zwecke der effizienten Speicherung oder Übertragung, beispielsweise zwischen einem Encoder und einem Decoder. Overall illustrated principles are algorithmically arbitrarily expandable and thus allow overall the efficient compression of multi-signals of any, even highest, order based on a downmix, this for the purpose of efficient storage or transmission, for example between an encoder and a decoder.
[0120] Die Ansprüche 9 bis 42 verwenden das Verfahren nach Anspruch 1 bis 8 zur Bestimmung zumindest eines gemeinsamen Signals und/oder eines ersten Individualsignals und/oder eines zweiten Individualsignals aus zwei Eingangs- Claims 9 to 42 use the method according to Claims 1 to 8 for determining at least one common signal and / or a first individual signal and / or a second individual signal from two input signals.
18 18
Claims (42)
Priority Applications (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CH01727/13A CH708710A1 (en) | 2013-10-09 | 2013-10-09 | Deriving multi-channel signals from two or more base signals. |
US15/026,739 US20160269847A1 (en) | 2013-10-02 | 2014-10-02 | Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal |
CN201480065847.6A CN106165453A (en) | 2013-10-02 | 2014-10-02 | For lower mixed multi channel signals and for upper mixed under the method and apparatus of mixed signal |
KR1020167011324A KR20160072131A (en) | 2013-10-02 | 2014-10-02 | Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal |
PCT/EP2014/071146 WO2015049332A1 (en) | 2013-10-02 | 2014-10-02 | Derivation of multichannel signals from two or more basic signals |
KR1020167011299A KR20160072130A (en) | 2013-10-02 | 2014-10-02 | Derivation of multichannel signals from two or more basic signals |
US15/026,735 US20160269846A1 (en) | 2013-10-02 | 2014-10-02 | Derivation of multichannel signals from two or more basic signals |
AU2014331092A AU2014331092A1 (en) | 2013-10-02 | 2014-10-02 | Derivation of multichannel signals from two or more basic signals |
PCT/EP2014/071154 WO2015049334A1 (en) | 2013-10-02 | 2014-10-02 | Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal |
JP2016520036A JP2016536855A (en) | 2013-10-02 | 2014-10-02 | Method and apparatus for downmixing multichannel signals and upmixing downmix signals |
JP2016520040A JP2016536856A (en) | 2013-10-02 | 2014-10-02 | Deriving multi-channel signals from two or more basic signals |
AU2014331094A AU2014331094A1 (en) | 2013-10-02 | 2014-10-02 | Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal |
CN201480065846.1A CN106104678A (en) | 2013-10-02 | 2014-10-02 | Derive multi channel signals from two or more baseband signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CH01727/13A CH708710A1 (en) | 2013-10-09 | 2013-10-09 | Deriving multi-channel signals from two or more base signals. |
Publications (1)
Publication Number | Publication Date |
---|---|
CH708710A1 true CH708710A1 (en) | 2015-04-15 |
Family
ID=49377990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CH01727/13A CH708710A1 (en) | 2013-10-02 | 2013-10-09 | Deriving multi-channel signals from two or more base signals. |
Country Status (1)
Country | Link |
---|---|
CH (1) | CH708710A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090092258A1 (en) * | 2007-10-04 | 2009-04-09 | Creative Technology Ltd | Correlation-based method for ambience extraction from two-channel audio signals |
DE102008004674A1 (en) * | 2007-12-17 | 2009-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal recording with variable directional characteristics |
US20110040556A1 (en) * | 2009-08-17 | 2011-02-17 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding residual signal |
-
2013
- 2013-10-09 CH CH01727/13A patent/CH708710A1/en not_active Application Discontinuation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090092258A1 (en) * | 2007-10-04 | 2009-04-09 | Creative Technology Ltd | Correlation-based method for ambience extraction from two-channel audio signals |
DE102008004674A1 (en) * | 2007-12-17 | 2009-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal recording with variable directional characteristics |
US20110040556A1 (en) * | 2009-08-17 | 2011-02-17 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding residual signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0750811B1 (en) | Process for coding a plurality of audio signals | |
DE102006050068B4 (en) | Apparatus and method for generating an environmental signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program | |
EP0632944B1 (en) | Process for transmitting or storing digitalized, multi-channel audio signals | |
EP2206113B1 (en) | Device and method for generating a multi-channel signal using voice signal processing | |
DE602004002390T2 (en) | AUDIO CODING | |
DE602005002833T2 (en) | COMPENSATION OF MULTICANAL AUDIO ENERGY LOSSES | |
DE602005002451T2 (en) | DEVICE AND METHOD FOR GENERATING A LEVEL PARAMETER AND DEVICE AND METHOD FOR GENERATING A MULTI-CHANNEL REPRESENTATION | |
DE602004007945T2 (en) | CODING OF AUDIO SIGNALS | |
EP3069530B1 (en) | Method and device for compressing and decompressing sound field data of an area | |
WO2015049332A1 (en) | Derivation of multichannel signals from two or more basic signals | |
DE69827775T2 (en) | TONKANALSMISCHUNG | |
EP2939445B1 (en) | Production of 3d audio signals | |
WO2015049334A1 (en) | Method and apparatus for downmixing a multichannel signal and for upmixing a downmix signal | |
WO2014072513A1 (en) | Non-linear inverse coding of multichannel signals | |
WO2012032178A1 (en) | Apparatus and method for the time-oriented evaluation and optimization of stereophonic or pseudo-stereophonic signals | |
EP2457389A1 (en) | Device and method for improving stereophonic or pseudo-stereophonic audio signals | |
DE112015003108T5 (en) | Operation of the multi-channel audio signal systems | |
EP2357854B1 (en) | Method and device for generating individually adjustable binaural audio signals | |
DE102012025016B3 (en) | Method for determining at least two individual signals from at least two output signals | |
DE102019135690B4 (en) | Method and device for audio signal processing for binaural virtualization | |
WO2015128376A1 (en) | Autonomous residual determination and yield of low-residual additional signals | |
CH708710A1 (en) | Deriving multi-channel signals from two or more base signals. | |
EP2952016B1 (en) | Method for processing a multichannel sound in a multichannel sound system | |
WO2015128379A1 (en) | Coding and decoding of a low frequency channel in an audio multi channel signal | |
WO2016030545A2 (en) | Comparison or optimization of signals using the covariance of algebraic invariants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AZW | Rejection (application) |