WO2015128376A1 - Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen - Google Patents

Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen Download PDF

Info

Publication number
WO2015128376A1
WO2015128376A1 PCT/EP2015/053931 EP2015053931W WO2015128376A1 WO 2015128376 A1 WO2015128376 A1 WO 2015128376A1 EP 2015053931 W EP2015053931 W EP 2015053931W WO 2015128376 A1 WO2015128376 A1 WO 2015128376A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
channel
signals
common
correlation comparison
Prior art date
Application number
PCT/EP2015/053931
Other languages
English (en)
French (fr)
Inventor
Clemens Par
Original Assignee
Stormingswiss Sàrl
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stormingswiss Sàrl filed Critical Stormingswiss Sàrl
Publication of WO2015128376A1 publication Critical patent/WO2015128376A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field

Definitions

  • Multichannel signals and in particular three-dimensional signals such as audio signals place high demands on data volumes to be transmitted or stored which it is possible to efficiently reduce.
  • General known devices or methods for such a data reduction are here parametric methods that extract spatial information, for example, from the known from the prior art Fast Fourier Transform (FFT) and then as a permanent data stream, such as together with a mono or stereo signal as Downmixsignal, transfer.
  • FFT Fast Fourier Transform
  • Such an audio technology is known in particular with MPEG Surround and mathematically represents an adaptive filtering method.
  • the autonomous residual determination represents a simple device or a simple method which leads to drastic bandwidth savings with the utmost transparency.
  • video signals can be efficiently compressed and decompressed-or their residuals efficiently minimized.
  • the subject matter of the invention can be used in the entire signal technique, provided that it is based on a Fourier transformation or an inverse Fourier transformation, and leads there, for example, to drastic bandwidth savings or enables efficient data extraction.
  • the number of downmix channels in audio coding can be kept to a minimum since the mixed channels can in turn be isolated by correlation comparison and thus enable overall efficient storage and transmission of highly complex audio signals.
  • a TpC in pure algebraic form Extract or extract an LFE signal together with the downmix of such formats by means of the simplest filtering techniques (for example by means of IRR filters known from the prior art with subsequent all-pass correction).
  • Figure 21 shows an NHK-22.2 arrangement from which a variety of standards and marketed formats for "audio surround sound" can be derived, but for the sake of consistency, the same nomenclature of the NHK-22.2 standard is always used.
  • the NHK-22.2 system has three horizontal levels, referred to as the bottom layer, the middle layer, and the top layer, and many other audio surround sound standards have two - usually the middle and the upper level - or three of these levels and should be referred to as such for all standards.
  • the individual channel positions of the NHK-22.2 system are briefly introduced.
  • the middle level has the following channel positions (abbreviated in brackets): a front left channel (FL), a front central left channel (FLc), a front central channel (FC), a front central right channel (FRc), a front right channel (FR), a laterally right channel (SiR), a rear right channel (BR), a rear central channel (BC), a rear left channel (BL) and a left side channel (SiL).
  • the upper level has the following channel positions (abbreviated in parentheses): a front left channel (TpFL), a front central channel (TpFC), a front right channel (TpFR), a laterally right channel (TpSiR), a rear right Channel (TpBR), a rear central channel positions (abbreviated in brackets): a front left channel (FL), a front central left channel (FLc), a front central channel (FC), a front central right channel (FRc), a front right channel (FR), a laterally right channel (SiR),
  • TpBC Traffic Control Channel
  • TpBL back left channel
  • TpSiL left side channel
  • the lower level has the following channels (abbreviations in parentheses): a front left channel (BtFL), a front center channel (BtFC), a front right channel (BtFR).
  • BtFL front left channel
  • BtFC front center channel
  • BtFR front right channel
  • LFE1 first low-frequency channel
  • LFE2 second low-frequency channel
  • EP1850639 describes a static filter which generates a stereo signal from a mono signal. This filter can also be applied to multi-channel signals.
  • WO2009138205 describes a static filter which generates a stereo signal from a mono signal. This filter can also be applied to multi-channel signals.
  • WO2011009649 describes an extension of the static filters described in EP1850639 and WO2009138205 for adapting the degree of correlation of the respectively generated stereo signal. This extension can also be applied to multi-channel signals. r
  • WO2011009650 describes extensions of the devices or methods described in EP1850639 and WO2009138205 and WO2011009649 in order to optimize the respectively generated stereo signal with regard to the static parameters. These extensions can also be applied to multi-channel signals.
  • WO2012016992 describes the first practical use of algebraic invariants generally in signaling technology, and more particularly EP1850639, WO2009138205, WO2011009649 and WO2011009650.
  • WO2012032178 describes the time scaling of static filters according to EP1850639, WO2009138205, WO2011009649, WO2011009650 and WO2012016992.
  • WO2014 / 072513 which by way of example with reference to FIG. 17 briefly describes extensions of these static filters for their specific application to multi-channel signals, this as so-called non-linear inverse coding, this also using direct correlation comparison, which can take place, for example, using the UPM1 upmix system of the British company Soundfield directly.
  • MPEG Surround rewrites as a standard the use of so-called parametric methods for the transmission of multi-channel signals based on a mono or stereo signal.
  • T have the degree of correlation +1, which on the one hand represents a mathematically exact solution for time-invariant (stationary) signals, and has a specific residual behavior with time-variant (nonstationary) signals (a residual being the difference between the original, non-stationary signal section and its Fourier transformation represents).
  • +1 time-invariant (stationary) signals
  • nonstationary time-variant (nonstationary) signals
  • FIG. 1 The schematic sequence of such a correlation comparison is shown in FIG. 1 for each channel of the time-dependent downmix signal Li (t), Ri (t), a Fast Fourier Transform (FFT) is performed first, and thus the frequency-dependent complex-valued signal descriptions Li (k) and Ri (k) result. Now the rules for obtaining the real parts and the imaginary parts of Li, Ri and C ⁇ are applied to them. Finally, an Inverse Fast Fourier Transform (IFFT) is applied to the resulting signal descriptions Li (k), R ⁇ (k) and C ⁇ (k). The result is the time-dependent signals Ci (t), Ii (t) and ri (t).
  • IFFT Inverse Fast Fourier Transform
  • Ci Ci * - 2 ⁇
  • This residual plays psychoacoustically, provided that it is the pure reproduction of Li, Ri and Ci according to an inverse discrete Fourier transform (IDFT), from which the Inverse Fast Fourier Transform (IFFT) can be directly derived, within a normative listening situation ( within the "sweet spot", it does not matter because the residual is extinguished, but outside of the "sweet spot", as seen in everyday interceptions and in non-normative speaker setups, there can be clearly audible artifacts that cause it to avoid.
  • IDFT inverse discrete Fourier transform
  • IFFT Inverse Fast Fourier Transform
  • the residual ⁇ itself can be approximately frequency-dependent (the Fourier transform for Li or Ri or Ci is already known, and it is therefore only in the same manner as described for Li or Ri or Ci, the Fourier transform for Li * or Ri * or Ci * ) for each frequency k as follows (in the case of frequency-dependent computation, an inverse discrete Fourier transform (IDFT) for A (k) may be followed, from which the Inverse Fast Fourier Transform (IFFT) is directly derived can be carried out as described for Li or Ri or Ci):
  • IDFT inverse discrete Fourier transform
  • IFFT Inverse Fast Fourier Transform
  • a (k) Li (k) - Li * (k) or
  • the associated residual ⁇ must also be known, which must be determined outside the decoder which, for example, represents a major limitation in terms of optimally reduced bandwidths in audio coding, since the number of channels absolutely to be transmitted to the decoder can not be reduced to the effect that each such correlation comparison must explicitly include such a residual in the data stream.
  • such a residual must be determined as a function of frequency or time, for example if the common signal C ⁇ (t) determined by correlation comparison or the first individual signal Li (t) determined by correlation comparison or the second individual signal R ⁇ (t) determined by correlation comparison is time-dependent.
  • non-residue signals can be obtained by simple subtraction or addition both frequency-dependent and time-dependent:
  • Ci * Ci + 2 ⁇
  • ⁇ 3 ⁇ 4 - ⁇ + ( ⁇ 3 - ⁇ ⁇ + ( ⁇ 2 - ⁇ ⁇ - ⁇ + ⁇ ⁇ ))
  • ⁇ 4 ⁇ 5 - ⁇ 2 + ( ⁇ 4 - ⁇ + ( ⁇ 3 - ⁇ ⁇ + ( ⁇ 2 - ⁇ ⁇ _ ! + ⁇ ⁇ )))
  • ( ⁇ 2 - ⁇ ⁇ - ⁇ + ⁇ ⁇ ) derived.
  • ⁇ 7 ⁇ + a 2 + a 5
  • ⁇ 8 ⁇ 2 + a 3 + a 6
  • ⁇ ⁇ - ⁇ ⁇ ⁇ - ⁇ + a n + a 3 + a 6 + ... + a n - 3 or
  • CH1696 / 13 it is approximately as shown in FIG. 2 whose circumscribed triangle with its vertices designates the number of downmix channels and whose inscribed dashed triangle the number of channels additionally extracted by means of correlation comparison (which are subsequently subtracted from the associated downmix channels in order to approximate all the original channels of the circumscribed triangle), when transmitting the average of all residuals, at least three channels maximum six ""
  • Extract channels that have significantly lower artifacts or discoloration of the timbre and other unmasking effects the vertices of the circumscribed triangle describe the three downmix channels of a six channel multi-channel signal.
  • a vertex of the inscribed triangle describes a, the two adjacent downmix channels mixed channel of the multi-channel signal.
  • Such a further channel lying between two downmix channels can be obtained by a correlation comparison between the two adjacent downmix channels (the vertices of the circumscribed triangle) by extracting this signal contained in both downmix channels, as well as in each case the sum of the two original, external corner signals the downmix with its adjacent signal, which lies in the middle of the nearest corner of the triangle considered to be the respective corner signal (not on the side on which the first correlation comparison was performed!).
  • FIG. 2 has purely combinatorial meaning and should not be confused with specific speaker positions.
  • FIG. Fig. 18 geometrically illustrates the combinatorial application of such a correlation comparison to a corresponding four channel downmix represented by the circumscribed square. For them, the same considerations apply as for FIG. Second
  • the system described can be expanded to any n-edge to infinity, but the calculated mean of all residuals due to the above considerations increasingly leads to artifacts or discoloration of the timbre and other unmasking effects.
  • the Downmixkanäle or Residuale which should serve the most efficient storage and transmission of audio data, for example between an encoder and a decoder, can be with a known from the prior art corresponding lossless or lossy base audio codec (examples of such a base audio Codecs are Opus or the MPEG standards MP3, AAC, HE-AAC, HE-AAC v2 and USAC) additionally compress and decompress, whereby the respectively used base audio codec can be additionally optimized with regard to the overall underlying spatial coding method ("Tuning") ,
  • the invention also makes it possible by means of Fourier transformation, although not the absolute determination of this mean value of all the residuals formed, to be able to produce those signal components which are dependent on frequency Correlation degree +1 to gain from not attributable to the same correlation comparison signals.
  • the above-described signal component with degree of correlation +1 of two residuals ⁇ and ⁇ 2 can be absolutely extracted for each sample, and thus the resolution of the recovered signals essentially depends only on the resolution of the Fourier transformation or subsequent inverse Fourier transformation ,
  • the maximum value A max is extracted for each sample of two signals compared, so to speak, the analytical analogue to the mean of all formed Residuale - with the only difference that the maximum value A max without knowledge the previous signals can be determined.
  • This system can, as the FIG. 3 and 4, ad infinitum expand, and further allows a variety of equivalent combinatorial possibilities with respect to the post-correlation correlation comparisons described herein, as shown in FIG. 3, 4 and 7 illustrate.
  • the result provides very low-color, extracted by correlation comparison signals, especially for the sweet spot.
  • FFT Fast Fourier Transform
  • Such a system can be integrated into a decoder with the least amount of computation, and transmission of the mean value of all residuals can thus be dispensed with, as already mentioned.
  • the residual correction around the mean of all residuals is an alternative, in particular, for creating the widest possible audible range (sweetspot) - but with higher bandwidths when transmitting signals from the encoder to the decoder.
  • additional signals such as the TpC of a NHK-22.2 signal or also the TpC of an Auro signal developed by the Institute for Radio Technology
  • TpC signal of a NHK-22.2 signal or a similar TpC signal developed by the Institut für Rundfunktechnik Auro format - or so-called LFE signals which due to the high-energy, low frequencies and special setup only difficult to mask.
  • the table is read so that the result for correlation comparison 3, for example reads as follows: 0.25 * TpC - r (TpFL) - r ( TpFR) + 0.5 * TpFC - r (0.5 * TpFC) - r (0.5 * TpSiL) - r (0.5 * TpSiR).):
  • step 6 If necessary, perform a residual correction to the result of step 6.
  • step 8 If necessary, perform a residual correction to the result of step 8.
  • step 13 If necessary, perform a residual correction on the result of step 13.
  • step 16 If necessary, perform a residual correction on the result of step 15.
  • TpC TpC - 2 * r '(TpFL) - 2 * r' (TpFR) - 2 * r '(TpBL)
  • the bus bar signal (0.5 * TpFC ') to be assigned is determined by correlation comparison of TpFL' and TpFR 'with subsequent residual correction by the mean of all correlation comparisons of the quadrangle of FIG. 5 or alternatively determined by the autonomous residual of these correlation comparisons (A max ).
  • the bus bar signal (0.5 * TpSiR ') to be assigned is determined by correlation comparison of TpFR' and TpBR 'with subsequent residual correction by the mean of all correlation comparisons of the quadrangle of FIG. 5 or alternatively determined by the autonomous residual of these correlation comparisons (A max ).
  • the bus bar signal (0.5 * TpBC ') to be assigned is determined by correlation comparison of TpBR' and TpBL 'with subsequent residual correction by the mean of all correlation comparisons of the quadrangle of FIG. 5 or alternatively determined by the autonomous residual of these correlation comparisons (A max ).
  • the bus bar signal (0.5 * TpSiL ') to be assigned is determined by correlation comparison of TpBL' and TpFL 'with subsequent residual correction by the mean of all correlation comparisons of the quadrangle of FIG. 5 or ""
  • TpC 'bus bar signal to be assigned is the sum of the correlation comparison of TpFL' and TpBR 'and of TpFR' and TpBL ', respectively, added to the doubled one
  • the factor can be calculated as follows for NHK 22.2 signals: If the top layer is based on the elevation ⁇ , at present mostly 35 °, the level increase for the shortening of the distance for the "phantom sound sources" is calculated with
  • the table of FIG. 12 If the above consideration is based on the Auro formats developed by the Institute for Broadcasting Technology (IRT) according to FIG. 11 are applied, the table of FIG. 12. If the TpC with -6dB at the downmix is added to the speakers TpFL, TpFR, TpBR, TpBL, it will be extracted together with the TpFC with -6dB in a correlation comparison of the resulting channels TpFL 'and TpFR'. Thus, the TpC can be easily calculated by simply adding the result of an optional residual correction, see FIG. 7, supported correlation comparison of the downmix signals TpFL '- TpBR' and TpFR '- TpBL'.
  • IRT Institute for Broadcasting Technology
  • the result is subtracted from the TpFC determined by the correlation comparison as well as from the TpBL signal and the TpBR signal, the result is also a low-residual, masking sound pattern.
  • FIG. 15 with the elevation ⁇ for the top layer of Auro 11.1 according to the formula
  • FIG. 1 shows the principle of the illustrated
  • FIG. FIG. 2 geometrically illustrates the combinatorial application of such a correlation comparison to a corresponding downmix having three channels defined by the circumscribed triangle is illustrated.
  • FIG. 18th For a corresponding downmix with four channels, see FIG. 18th
  • FIG. Figure 3 illustrates the principle of autonomous residual determination by Fourier transform for four input signals.
  • FIG. 4 illustrates the example of an alternative, equivalent embodiment, which illustrates the principle of combinatorial possibilities of equivalent embodiments.
  • FIG. Figure 5 geometrically illustrates the combinatorial application of six correlation comparisons within the top layer of a NHK-22.2 signal to the algebraic determination of a TpC without secondary residual formation.
  • FIG. 6 shows the FIG. 5 associated table of the resulting signals or Residuale.
  • FIG. 7 shows the autonomous residual determination for the extraction of a TpC channel in the top layer of a NHK 22.2 system or an Auro 11.1 arrangement.
  • FIG. 8 shows the masking of an algebraic extraction of the TpC in the formed sound field in crosstalk with the aid of "phantom sound sources" in the top layer of an NHK-22.2 arrangement.
  • FIG. 9 shows the cross-section of a NHK-22.2 system that satisfies the calculated factor of optimum masking FIG. 8 can be seen.
  • FIG. FIG. 10 shows the layout of a NHK-22.2 system that satisfies the calculated factor of optimal masking FIG. 8 can be seen.
  • FIG. Figure 11 geometrically illustrates the combinatorial application of three correlation comparisons within the top layer of an Auro 11.1 signal to the algebraic determination of a TpC without secondary residual formation.
  • FIG. 12 shows FIG. 11 associated table of the resulting signals or Residuale.
  • FIG. 13 shows the masking of an algebraic extraction of a TpC in the formed sound field in crosstalk with the aid of "phantom sound sources" in the top layer of an Auro 11.1 arrangement.
  • FIG. FIG. 14 shows the cross-section of an Auro-11.1 system that satisfies the calculated factors of optimal masking FIG. 13 can be removed.
  • FIG. FIG. 15 shows the outline of an Auro-11.1 system that satisfies the calculated factors of optimal masking FIG. 13 can be removed.
  • FIG. 16 shows, in a simplified representation, the algebraic extraction of a TpC channel of the top layer of an NHK-22.2 signal, which subsequently leads to a masking of the occurring residuals.
  • FIG. 17 shows the example of a nonlinear inverse coding according to the unpublished application CH02300 / 12.
  • FIG. Fig. 18 geometrically illustrates the combinatorial application of a correlation comparison to a corresponding four-channel downmix represented by the circumscribed square.
  • FIG. Fig. 19 shows a decoder, which is based on the total downmix and the transmitted average of all residuals calculated by the encoder chips by means of correlation comparison, according to the rules for obtaining the real and imaginary parts of signals
  • a max is in this case equal to set A max (k) in the frequency domain, for the time domain A (t) is equal to A max (t). Contrary to A (k), A max (k) can be determined directly in the decoder and therefore does not have to be transmitted from the encoder to the decoder, which amounts to a drastic reduction in bandwidth.
  • FIG. Fig. 20 shows the principle of the illustrated correlation comparison according to the rules for obtaining the real and imaginary parts of signals, see Introduction to Disclosure of the Invention. Before this correlation comparison becomes a Fast Fourier Transform
  • FFT Fast Fourier Transform
  • IFFT Inverse Fast Fourier Transform
  • FIG. 21 shows a NHK-22.2 arrangement.
  • the first example of an application of the subject invention, here according to FIG. 5-10, to a NHK 22.2 top layer signal, see FIG. 21, sets the channels for the channels TpFL, TpFR, TpFC, TpC, TpBL, TpBR, TpSiL, TpSiR, TpBC (the "Downmix")
  • TpFL ' TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.25 * TpC
  • TpFR ' TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.25 * TpC
  • TpBL ' TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.25 * TpC
  • TpBR ' TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.25 * TpC, where TpFL', TpFR ', TpBL', TpBR 'represent the vertices of the circumscribed square of FIG. 5 correspond. Now it is not only possible to carry out a correlation comparison for each side of the square according to the rules for obtaining the real and imaginary parts of signals, see Introduction to Disclosure of the Invention, but also for the two diagonals, according to TpFL 'and TpBR' or TpFR 'and TpBL'.
  • TpBL (TpBL + 0.5 * TpBC + A 4 ) - 0.5 * (TpBC + 0.5 * TpC - 2 * A 3 ) - 2 *
  • a max (TpBL + 0.5 * TpSiL + A 3 ) - 0.5 * (TpSiL + 0.5 *
  • a max on the overall signal can be controlled precisely over the length of the discrete Fourier transformation or inverse discrete Fourier transformation used, and represents a precise tool for checking the final timbre.
  • NHK-22.2 top-layer signal can thus be stored in terms of data to be stored or transmitted, for example between an encoder and a decoder, in the sense of FIG. 19 again very clearly with the clearest quality gain.
  • the devices for autonomous residual determination are shown in FIGS. 3, 4 and 7 by a dashed box.
  • the autonomously determined residual is determined by cascaded application of correlation comparisons of signal pairs.
  • the common or the correlated signal component of all input signals of the device for autonomous residual determination is determined.
  • it is also possible to determine the autonomous residual to use any other method for determining the common or correlated signal portion of all input signals of said device.
  • the algorithm presented in FIG. 1 could be extended to three or more signals.
  • the signs of the signal components per frequency of the n signals are compared.
  • the signal component of the signal with the minimum absolute signal component of this frequency is selected for the correlated signal component of this frequency. Otherwise, this signal component is equal to zero.
  • This method is preferably applied to both the real part and the imaginary part. However, many other methods of determining the common or correlated signal portion could be used to autonomously determine the residual of the input signals.
  • An embodiment thus provides the cascaded determination of the correlated signal of the input signals.
  • the cascaded determination has at least the determination of a first correlated signal of a first signal pair of the input signals and at least one further determination of a second correlated signal from a signal pair having a signal based on the first correlated signal and a signal based on a third input signal.
  • Another embodiment relates to all other methods for determining the correlated signal of the input signals, i. those methods that do not have a cascaded determination of the correlated signal of the input signals.
  • TpSiR + 0.5 * TpC (TpSiR + 0.5 * TpC 2 * ⁇ 2 ) + 2 * ⁇ ', max and
  • TpSiL + 0.5 * TpC (TpSiL + 0.5 * TpC 2 * ⁇ 4 ) + 2 * ⁇ ', max or the sum of the signals obtained above
  • TpFC + 0.5 * TpC (TpFC + 0.5 * TpC 2 * ⁇ ) + 2 * ⁇ ', max and
  • TpBC + 0.5 * TpC (TpBC + 0.5 * TpC 2 * ⁇ 3 ) + 2 * ⁇ ', max subtracted. It results in the signals
  • TpSiL + 0.5 * TpC (TpSiL + 0.5 * TpC - 2 * ⁇ 4 ) + 2 * A max multiplied by a factor of 0.5 and also added.
  • TpFC, TpSiR, TpBC and TpSiL not only show an excellent approximation but in addition together with the formed TpC an ideal
  • TpFL ' TpFL + 0.5 * TpFC + 0.5 * TpC
  • TpFR ' TpFR + 0.5 * TpFC + 0.5 * TpC
  • TpBL ' TpBL + 0.5 * TpC
  • TpBR' TpBR + 0.5 * TpC
  • the factors 1 or 0.5 show the factors for the respective channels occurring in the correlation comparison 1 to 3.
  • r represents the residual occurring in the correlation comparison 1 to 3.
  • the table is read such that the result for correlation comparison 3 reads, for example, as follows: 0.5 * TpC-r (TpFL) -r (TpFR) + 0.5 * TpFC - r (0.5 * TpFC).
  • Residual correction is now performed by adding 2 * A max to each of two extracted doubled TpC signals.
  • the TpC signal is calculated to a good approximation by simple addition of the results with subsequent multiplication by 0.5. If half of the result is subtracted from the correlation TpFC, excellent residual masking can be achieved with the following level correction: The TpFC signal is lowered by -3dB. This results in an ideal masking; this in particular if either an increased resolution of the discrete Fourier transformation used for the determination of -A max is selected or by its opposite, namely a discrete Fourier "
  • TpBR rear right channel
  • TpFR front right channel
  • TpBR rear left channel
  • TpC upper central channel
  • TpC central channel
  • Residualsignals the upper central channel is determined. 4. The method of embodiment 3, wherein the upper central channel (TpC) is determined based on the subtraction of the residual signal of the upper central channel from the sum of the output of the first correlation comparison and the second correlation comparison.
  • Audio multichannel signal is determined by correlation comparison of the rear right channel (TpBR) and the rear left channel (TpBL) of the audio downmix signal, wherein the particular rear central channel is corrected by the determined upper central channel.
  • Audio multichannel signal by correlation comparison of the ⁇ right front channel (TpFR) and rear right channel (TpBR) of the audio downmix signal, the particular right central channel being corrected by the particular upper central channel, and / or
  • Audiomultikanalsignals is determined by correlation comparison of the front left channel (TpFL) and the rear left channel (TpBL) of the audio downmix signal, wherein the left-side central channel is corrected by the certain upper central channel.
  • TpFL front left channel
  • TpBL rear left channel
  • Channel of the audio downmix signal and an adjacent, derived from the audio downmix signal central channel is determined
  • Channel of the audio downmix signal and an adjacent, derived from the audio downmix signal central channel is determined
  • Channel of the audio downmix signal and an adjacent, derived from the audio downmix signal central channel is determined
  • TpBC central channel
  • Audio multichannel signal is determined.
  • a method according to any one of Embodiments 1 to 13, wherein a first correlation comparison of the front left channel (TpFL) of the audio downmix signal and the front right channel (TpFR) of the audio downmix signal is carried out;
  • Correlation comparison are summed and the results of the second and fourth correlation comparison are summed.
  • Embodiments 1 to 17 execute.
  • Audio multichannel signal from an audio downmix signal the audio downmix signal being a front right channel
  • TpFR front left channel
  • TpFL front left channel
  • TpBL rear left channel
  • TpBR rear right channel
  • a first correlation comparison device for performing a correlation comparison between the front left channel (TpFL) and the rear right ⁇
  • TpBR TuCH
  • a second correlation comparison device for performing a correlation comparison between the front right channel (TpFR) and the rear left channel (TpBL);
  • Residual signal from at least three input signals is Residual signal from at least three input signals:
  • Multi-channel signal based on the first
  • Correlation comparison output signal based signal and a signal based on the third channel of the downmix signal are Correlation comparison output signal based signal and a signal based on the third channel of the downmix signal
  • Multi-channel signal based on the correction signal.
  • Multi-channel signal based on the correction signal.
  • Multi-channel signal based on the correction signal.
  • Correlation comparison is determined, and wherein the second correlation comparison between a signal based on a signal output from the first correlation comparison and that of the third
  • Profile for high-frequency channels and a second profile for low-frequency channels wherein the sampling rate in the frequency domain is increased by zeropadding compared to the second profile with the first profile or the sampling rate for the second profile
  • Residual signal of at least three input signals characterized by the determination of the common
  • Residualsignals by determining the common signal components of the at least three input signals.
  • Correlation comparison has the comparison of the signs of the frequency components of the two compared signals. rn
  • Input signals is determined, which is the minimum absolute value of the real part and / or the imaginary part, if all the signs of the real parts and / or the imaginary parts of the corresponding frequency component of the at least three input signals are equal.
  • Principally illustrated principles are algorithmically expandable and are not limited to the efficient compression of multi-signals of any, even highest, order, this for the purpose of efficient storage or transmission, for example between an encoder and a decoder.
  • Present systems for determining at least one common signal and / or a first individual signal and / or a second individual signal from two input signals as well as in particular the autonomous residual determination can in principle be used in connection with applications of arbitrary nature with Fourier transforms or inverse Fourier transforms. These applications are basically included in the present invention.
  • any other method for determining a common signal, a first individual signal and a second individual signal from two input signals could be used.
  • a multi-channel signal with n channels can in turn contain a further multi-channel signal with n-1> 2 channels, another multi-channel signal with n-2> 2 channels etc.
  • a further multi-channel signal of higher order can be derived from a multi-channel signal with n> 2 or n-1> 2 or n-2> 2 etc. channels.
  • Embodiments / remaining protection area Embodiments / remaining protection area.
  • Embodiments / remaining protection area Embodiments / remaining protection area.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Verfahren zum Dekodieren oder Upmixen eines Upmixsignals mit zumindest fünf Kanäle aus einem Downmixsignal mit zumindest drei Kanälen: Durchführen zumindest zweier Korrelationsvergleiche zwischen zumindest zwei Kanalpaaren der zumindest drei Kanäle des Downmixsignals, wobei jeder Korrelationsvergleich eines der zumindest zwei Kanalpaare zumindest ein Korrelationsvergleichssignal ergibt. Das zumindest eine Korrelationsvergleichssignal weist ein gemeinsames Signal, ein erstes individuelles Signal und/oder ein zweites individuelles Signal eines der Kanalpaare auf. Das gemeinsame Signal enthält die gemeinsamen Signalanteile dieses Kanalpaars, das erste individuelle Signal enthält die dem ersten Kanal des Kanalpaars spezifischen Signalanteile und das zweite individuelle Signal enthält die dem zweiten Kanal des Kanalpaars spezifischen Signalanteile. Das Verfahren umfasst ferner: Bestimmen eines gemeinsamen Residualsignals auf der Basis der gemeinsamen Signalanteile der Korrelationsvergleichssignale der zumindest zwei Kanalpaare; und Korrigieren zumindest eines der Korrelationsvergleichssignale oder eines daraus gebildeten Signals auf der Basis des gemeinsamen Residualsignals.

Description

AUTONOME RESIDUALBESTIMMUNG UND GEWINNUNG VON RESIDUALARMEN
ZUSATZSIGNALEN
Multikanalsignale und insbesondere dreidimensionale Signale wie beispielsweise Audiosignale stellen hohe Anforderungen an zu übertragende oder zu speichernde Datenmengen, die es möglich effizient zu reduzieren gilt.
Allgemeine bekannte Vorrichtungen oder Verfahren für eine derartige Datenreduktion sind hier parametrische Verfahren, die räumliche Information beispielsweise anhand der aus dem Stand der Technik bekannten Fast Fourier Transform (FFT) extrahieren und anschließend als permanenten Datenstrom, etwa gemeinsam mit einem Mono- oder Stereosignal als Downmixsignal , übertragen. Eine solche Audio-Technologie ist insbesondere mit MPEG Surround bekannt und stellt mathematisch betrachtet ein adaptives Filterverfahren dar.
WO2014/072513, die beispielhaft anhand von FIG. 17 kurz erläutert wird, schlägt dahingegen erstmals den Einsatz der sogenannten nichtlinearen inversen Kodierung vor, dies unter zusätzlichem Einsatz von Korrelationsvergleich; dieser Ansatz kann, da nur noch die Parameter eines räumlichen Modells, dies nicht permanent, als Headerinformation oder Datenpuls übertragen werden müssen, mathematisch als ein statisches Filterverfahren betrachtet werden.
Allerdings gibt WO2014/072513 keine explizite technische Lösung für einen solchen Korrelationsvergleich an, da hier aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren existieren wie beispielsweise das Upmix-System UPM1 des britischen Unternehmens Soundfield, das, gleichfalls auf FFT basierend, insgesamt einen hohen Rechenaufwand erfordert. Die Bildung der Ausgangssignale erfolgt hier allerdings amplitudenabhängig, was den Nachteil wandernder Schallquellen und zeitlich sich verschiebender Artefakte auf den einzelnen Kanälen mit sich bringt, und insgesamt zu deutlichen spektralen Verfärbungen führt, die im Bereich der Audiokodierung sich störend auswirken. Eine einfache Vorrichtung oder ein einfaches Verfahren für einen solchen Korrelationsvergleich, das zudem das Ziel einer möglichst hohen psychoakustischen Transparenz erfüllt, ist mit der unveröffentlichten eigenen Anmeldung CH1696/13 offenbart. Zudem wird nachgewiesen, dass bei Anwendung eines Korrelationsvergleichs auf eine Kette von Signalen eine Korrektur um den Mittelwert aller Residuale dieses Korrelationsvergleichs algebraisch die optimale Lösung darstellt. Allerdings muss bei einem solchen
Korrelationsvergleich mit anschliessender Korrektur um den Mittelwert aller Residuale dieser Mittelwert dem zu übertragenden komprimierten Signal beigefügt werden, was zu einer wesentlichen, letztlich unerwünschten Erhöhung der Bandbreite führt. Auch gestaltet sich die Extraktion weiterer Signale aus Elementen der Signalkette mittels Korrelationsvergleiches schwierig. Im schlechtesten Falle kommt es zu sekundären Residualen, was schlichtweg bedeutet, dass Residuale nochmals einem Korrelationsvergleich unterzogen werden, und sich damit störendste Artefakte bilden. Die vorliegende Erfindung soll demnach einerseits eine autonome Bestimmung von störenden Residualen ermöglichen, ohne solche übertragen zu müssen, und andererseits sollen zusätzliche Signale so gewonnen werden, dass sich einerseits keine sekundären Residuale bilden, und andererseits eine optimale Maskierung der primären Residuale oder sonstigen durch Signalverarbeitung auftretenden Artefakte erreichen lässt .
Insbesondere stellt die autonome Residualbestimmung eine einfache Vorrichtung oder ein einfaches Verfahren dar, welche zu drastischer Bandbreitenersparnis bei allerhöchster Transparenz führt.
Sie bleibt nicht auf Audiosignale beschränkt, obwohl sich insbesondere auf diese ein solches System optimal anwenden lässt. So lassen sich mit dem Erfindungsgegenstand etwa Videosignale effizient komprimieren und dekomprimieren - bzw. deren Residuale effizient minimieren.
Allgemein lässt sich der Erfindungsgegenstand in der gesamten Signaltechnik anwenden, sofern dieser eine Fourier- Transformation bzw. eine inverse Fourier-Transformation zugrundeliegen, und führt dort beispielsweise zu drastischer Bandbreitenersparnis oder ermöglicht eine effiziente Datenextraktion.
Mit vorliegender Erfindung lässt sich beispielsweise in der Audiokodierung die Anzahl der Downmixkanäle auf ein Minimum beschränken, da die zugemischten Kanäle sich wiederum durch Korrelationsvergleich isolieren lassen und somit insgesamt eine effiziente Speicherung und Übertragung hochkomplexer Audiosignale ermöglichen.
Insbesondere lassen sich solche hochkomplexen 3D-Audiosignale, wie sie beispielsweise mit dem Format NHK 22.2 bekannt sind, nunmehr in entsprechende Downmixkanäle zusammenfassen, die teilweise oder insgesamt wiederum einem solchen Korrelationsvergleich unterworfen werden können, und bei denen bei sogar verbesserter Qualität keine Residuale übertragen werden müssen.
Beispielsweise lassen sich innerhalb des Top Layer eines NHK- 22.2-Systems, siehe FIG. 21, oder eines ähnlichen Formats wie der sogenannten Auro-Formate des Instituts für Rundfunktechnik in München, siehe FIG. 11, ein TpC in rein algebraischer Form extrahieren oder ein LFE-Signal gemeinsam mit dem Downmix derartiger Formate mittels einfachster Filtertechniken (beispielsweise mittels aus dem Stand der Technik bekannten IRR-Filtern mit anschliessender Allpass-Korrektur) übertragen und extrahieren.
Fig. 21 zeigt eine NHK-22.2-Anordnung aus der sich eine Vielzahl von Standards und im Markt vertretener Formate für „Audio Surround Sound" ableiten lassen. Aus Gründen der Einheitlichkeit soll aber immer die gleiche Nomenklatur des NHK-22.2-Standards verwendet werden, um keine Verwirrung zu stiften. Im Folgenden wird immer nur von Kanalpositionen gesprochen, wobei damit die Position eines dem Kanal zugeordneten Lautsprechers gemeint ist. Die Positionen in Fig. 21 sollen dabei weder exakt noch einschränkend sein, sondern nur die ungefähre relative Position der Lautsprecher zueinander darstellen. Das NHK-22.2-System weist drei horizontale Ebenen auf, die als untere Ebene (Bottom Layer) , mittlere Ebene (Middle Layer) und obere Ebene (Top Layer) bezeichnet werden. Viele andere Standards für „Audio Surround Sound" weisen zwei - meist die mittlere und die obere Ebene - oder auch drei dieser Ebenen auf und sollen für alle Standards als solche bezeichnet werden. Im Folgenden werden die einzelnen Kanalpositionen des NHK-22.2 Systems kurz eingeführt.
Die mittlere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (FL), einen vorderen zentral linken Kanal (FLc) , einen vorderen zentralen Kanal (FC) , einen vorderen zentral rechten Kanal (FRc) , einen vorderen rechten Kanal (FR) , einen seitlich rechten Kanal (SiR) , einen hinteren rechten Kanal (BR) , einen hinteren zentralen Kanal (BC) , einen hinteren linken Kanal (BL) und einen seitlich linken Kanal (SiL) . Die obere Ebene weist dabei die folgenden Kanalpositionen (Abkürzung in Klammern) auf: einen vorderen linken Kanal (TpFL) , einen vorderen zentralen Kanal (TpFC) , einen vorderen rechten Kanal (TpFR) , einen seitlich rechten Kanal (TpSiR) , einen hinteren rechten Kanal (TpBR) , einen hinteren zentralen
Kanal (TpBC) , einen hinteren linken Kanal (TpBL) und einen seitlich linken Kanal (TpSiL) . Die untere Ebene weist die folgenden Kanäle auf (Abkürzungen in Klammern) : einen vorderen linken Kanal (BtFL) , einen vorderen zentralen Kanal (BtFC) , einen vorderen rechten Kanal (BtFR) . Zusätzlich gibt es noch einen ersten niederfrequenten Kanal (LFE1) und einen zweiten niederfrequenten Kanal (LFE2), welche jeweils für einen Subwoofer bestimmt sind.
Folgende Dokumente sind insbesondere als zum Stand der Technik gehörig zu betrachten:
EP1850639 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden.
WO2009138205 beschreibt einen statischen Filter, der aus einem Monosignal ein Stereosignal erzeugt. Dieser Filter kann auch auf Multikanalsignale angewandt werden.
WO2011009649 beschreibt eine Erweiterung der in EP1850639 und WO2009138205 beschriebenen statischen Filter zur Anpassung des Korrelationsgrads des jeweils erzeugten Stereosignals. Diese Erweiterung kann auch auf Multikanalsignale angewandt werden. r
6
WO2011009650 beschreibt Erweiterungen der in EP1850639 und WO2009138205 und WO2011009649 beschriebenen Vorrichtungen oder Verfahren, um das jeweils erzeugte Stereosignal hinsichtlich der statischen Parameter zu optimieren. Diese Erweiterungen können auch auf Multikanalsignale angewandt werden.
WO2012016992 beschreibt die erstmalige praktische Verwendung von algebraischen Invarianten allgemein in der Signaltechnik und insbesondere auf EP1850639, WO2009138205, WO2011009649 und WO2011009650.
WO2012032178 beschreibt die zeitliche Skalierung von statischen Filtern gemäss EP1850639, WO2009138205, WO2011009649, WO2011009650 und WO2012016992.
Die genannten Dokumente zeigen alle Aspekte einer sogenannten linearen inversen Kodierung auf.
WO2014/072513, die beispielhaft anhand FIG. 17 kurz dargestellt wird, beschreibt Erweiterungen dieser statischen Filter für deren gezielte Anwendung auf Multikanalsignale, dies als sogenannte nichtlineare inverse Kodierung, dies auch unter Anwendung von direktem Korrelationsvergleich, der beispielsweise unter direktem Einsatz des Upmix-Systems UPM1 des britischen Unternehmens Soundfield stattfinden kann.
Die unveröffentlichte Patentanmeldung CH1696/13 beschreibt ein auf Fourier-Transformation bzw. inverser Fourier-
Transformation basierendes, hocheffizientes System für den Korrelationsvergleich von zwei oder mehreren Eingangssignalen und beschreibt die algebraisch optimale Korrektur anhand des Mittelwerts der dabei auftretenden Residuale. Allerdings ist mit diesem Dokument eine autonome Residualbestimmung nicht möglich, und eine algebraische Extraktion von zusätzlichen Signalen unter Vermeidung von sekundären Residualen unbekannt. HAMASAKI KIMIO ET AL : . "The 22.2 Multichannel Sound System and Its Application", AES CONVENTION 118, MAY 2005, beschreibt ein kanalbasiertes Wiedergäbeformat höchster Ordnung und räumlicher Auflösung.
MPEG Surround umschreibt als Standard die Verwendung sogenannter parametrischer Verfahren zur Übertragung von Multikanalsignalen auf Basis eines Mono- oder Stereosignals.
OFFENBARUNG DER ERFINDUNG Einleitung In eigener unveröffentlichter Anmeldung CH1696/13, siehe unten, wird eine Extraktion von Multikanalsignalen anhand einer Fourier-Transformation und inversen Fourier- Transformation beschrieben, und eine Optimierung der resultierenden Signale anhand des bestimmten Mittelwerts dabei auftretender Residuale vorgeschlagen. Allerdings bedeutet dies, dass eine Residualverminderung nur möglich ist, wenn dieser Mittelwert zuvor bekannt ist, also übertragen wurde. Insbesondere gibt das Dokument gibt keine explizite technische Lösung für eine autonome Residualbestimmung im Decoder selbst an, und somit existieren keine aus dem Stand der Technik bekannte Vorrichtungen oder Verfahren dieser Art.
In CH1696/13 wird ein solcher Korrelationsvergleich zweier Signale Li' und R±' , bei welchen respektive identische Signalanteile x(t) und y(t), welche für die Kurzzeit- Kreuzkorrelation
T den Korrelationsgrad +1 aufweisen, beschrieben, der einerseits für zeitinvariante (stationäre) Signale eine mathematisch exakte Lösung darstellt, und bei zeitvarianten (nichtstationären) Signalen ein spezifisches Residualverhalten aufweist (wobei ein Residual die Differenz zwischen dem ursprünglichen, nichtstationären Signalabschnitts und dessen Fourier-Transformation darstellt) . In CH1696/13 werden zwei Kanäle Li', R±' , 1 -S i -S n, welche gleichartige Signalanteile Ci* aufweisen, betrachtet, wobei gilt :
Li' = Li + Ci = Ii' (t) = lx (t) + Ci (t) Ri' = Ri* + Ci* = r±' (t) = r± * (t) + Ci*(t)
Für die zeitabhängigen Signale Ii' (t) und ri' (t) werden nunmehr jeweils die Fourier-Reihen bestimmt. Es gilt demnach für die Synthese, k = -1, 0, 1, ...
it' ω = xk e L
k=-oo
Figure imgf000010_0001
und für die Analyse
Figure imgf000010_0002
und in der Praxis für die diskrete Fourier- ransformationen (DFT) , aus der sich unmittelbar die Fast Fourier Transforms (FFT) ableiten lassen, wobei nunmehr k = 0, N - 1:
Figure imgf000011_0001
W-1
i-jy-mk
Ri' (fc) = ^ r (m)
=0
Die Realteile von Li , Ri und C± lassen sich für stationäre Signale für alle k = 0, N - 1 dann gemäss folgender Regeln wiedergewinnen :
1. Bestimme die Vorzeichen der Realteile von Li ' (k) und Ri ' (k) .
2. Sind für k die Vorzeichen identisch, bestimme
- die Beträge der Realteile von Li ' (k) und R± ' (k) ,
- die Minima bzw. Maxima dieser Beträge der Realteile von Li ' (k) und R± ' (k) .
- Wähle jeweils als Realteil für C±(k) den diesem Minimum zugrundeliegenden Realteil von Li ' (k) oder Ri ' (k) .
- Subtrahiere den Realteil von C±(k) von dem dem Maximum zugrundeliegenden Realteil von Li ' (k) oder Ri ' (k) und wähle, sofern der Realteil von Li ' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für Li(k), andernfalls, sofern der Realteil von Ri ' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Realteil für R± (k) .
- Setze den noch nicht bestimmten Realteil von Li(k) oder R±(k) gleich Null. 3. Sind die Vorzeichen der Realteile von Li' (k) und Ri' (k) nicht identisch, setze Ci(k) gleich Null und setze Li(k)= Li' (k) und Ri (k) = Ri' (k) .
Die Imaginärteile von Li, Ri und Ci lassen sich für stationäre Signale für alle k = 0, N - 1 gemäss folgender Regeln wiedergewinnen : 1. Bestimme die Vorzeichen der Imaginärteile von Li' (k) und
Ri' (k) .
Sind für k die Vorzeichen identisch, bestimme
- die Beträge der Imaginärteile von Li' (k) und
Ri' (k) ,
- die Minima bzw. Maxima dieser Beträge der Imaginärteile von Li' (k) und Ri' (k) .
- Wähle jeweils als Imaginärteil für Ci(k) den diesem Minimum zugrundeliegenden Imaginärteil von Li' (k) oder Ri' (k) .
- Subtrahiere den Imaginärteil von Ci(k) von dem dem Maximum zugrundeliegenden Imaginärteil von Li' (k) oder Ri' (k) und wähle, sofern der Imaginärteil von Li' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Li(k), andernfalls, sofern der Imaginärteil von Ri' (k) diesem Maximum zugrundeliegt, das Resultat dieser Substraktion als Imaginärteil für Ri(k) .
- Setze den noch nicht bestimmten Imaginärteil von Li(k) oder R±(k) gleich Null.
3. Sind die Vorzeichen der Imaginärteile von Li' (k) und
Ri' (k) nicht identisch, setze Ci(k) gleich Null und setze Li(k)= Li' (k) und Ri(k)= R±' (k) . Λ Λ
11
Um abschliessend Li , Ri und C± zu gewinnen, werden für die Synthese für die zeitabhängigen Signale, k = -1, 0, 1,
Figure imgf000013_0001
(t) = ^ hk eik^
(bzw. in der Praxis für die Analyse mittels diskreten Fourier- Transformationen (DFT) , k = 0, N - 1,
.27Γ ,
Li (fc) = ^ Zf(m)
m=0
W-l
.2π ,
fc) = ^ (m) —i-r mk
Ä£ (
m=0
W-l
Q (fc) = ^ cf(m) i-jy-mk
m=Q aus der sich unmittelbar die Fast Fourier Transforms ableiten lassen) für die Synthese die Koeffizienten fk, bestimmt, k = -1, 0, 1, gemäss der Analyse
Figure imgf000013_0002
Λ
12
Figure imgf000014_0001
bzw. für die Synthese gemäss der inversen diskreten Fourier- Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transforms (IFFT) ableiten lassen, k = 0, N - 1, w-i
27Γ
TTlfe
771=0
W-1
27Γ
TTlfe
771=0
W-1
..2277?Γ ,
mk
m=0
Der schematische Ablauf eines solchen Korrelationsvergleichs ist in FIG. 1 beispielhaft dargestellt: Für je einen Kanal des zeitabhängigen Downmixsignals Li(t), Ri(t) wird zuerst eine Fast Fourier Transform (FFT) ausgeführt, und es ergeben sich somit die frequenzabhängigen komplexwertigen Signalbeschreibungen Li(k) und Ri(k) . Auf diese werden nunmehr die Regeln zur Gewinnung der Realteile und der Imaginärteile von Li , Ri und C± angewandt. Auf die resultierenden Signalbeschreibungen Li(k), R±(k) und C±(k) wird abschliessend je eine Inverse Fast Fourier Transform (IFFT) angewandt. Es ergeben sich die zeitabhängigen Signale Ci(t), Ii ( t ) und ri ( t ) .
Für nichtstationäre Signale tritt bei dieser Form des Korrelationsvergleichs ein Residual Δ auf, das generell folgendes Verhalten aufweist:
Li = Li + Δ R± = R± + Δ
Ci = Ci* - 2Δ
Dieses Residual spielt psychoakus tisch, sofern es sich um die reine Wiedergabe von Li, Ri und Ci nach einer inversen diskreten Fourier-Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, innerhalb einer normativen Abhörsituation (innerhalb des „Sweet Spot") handelt, keine Rolle, da das Residual ausgelöscht wird. Ausserhalb des „Sweet Spot", wie dies bei Abhörsituationen des täglichen Lebens und bei nicht normativen LautsprecheraufStellungen vorkommt, kann es jedoch zu deutlich hörbaren Artefakten kommen, die es zu vermeiden gilt.
Abhängig vom Anwendungsfall ist es somit wünschenswert, solche Residuale zu bestimmen, dies insbesondere in einem Decoder, um die Bandbreite des vom Encoder zum Decoder zu übertragenden Signals drastisch zu reduzieren, und insbesondere, um Verfärbungen der Klangfarbe gegenüber dem Stand der Technik drastisch zu minimieren.
Das Residual Δ selbst lässt sich etwa frequenzabhängig (die Fourier-Transformation für Li oder Ri oder Ci ist bereits bekannt, und es ist somit nur noch in derselben Weise, wie für Li oder Ri oder Ci beschrieben, die Fourier-Transformation für Li* oder Ri* oder Ci* auszuführen) für jede Frequenz k wie folgt gewinnen (bei frequenzabhängiger Berechnung ist gegebenenfalls für A(k) im Anschluss eine inverse diskrete Fourier- Transformation (IDFT), aus der sich unmittelbar die Inverse Fast Fourier Transform (IFFT) ableiten lässt, wie für Li oder Ri oder Ci beschrieben, auszuführen) :
A(k) = Li(k) - Li*(k) oder
A(k) Ri(k) - Ri*(k)
oder
A(k) (k) - Ci(k))
Gemäss dem Stand der Technik muss zur Gewinnung eines residualfreien Signals mittels Korrelationsvergleichs aus zwei Kanälen Li' und Ri' , 1 < i < n, welche gleichartige Signalanteile Ci* aufweisen, auch das zugehörige Residual Δ bekannt sein, welches ausserhalb des Decoders bestimmt werden muss, was beispielsweise in der Audiokodierung eine grosse Einschränkung hinsichtlich optimal reduzierter Bandbreiten darstellt, da sich etwa die absolut an den Decoder zu übertragende Kanalanzahl dahingehend nicht vermindern lässt, dass jedem Korrelationsvergleich ein solches Residual explizite im Datenstrom beigefügt werden muss. Dabei muss ein solches Residual frequenzabhängig oder zeitabhängig bestimmt werden, etwa wenn das durch Korrelationsvergleich bestimmte gemeinsame Signal C±(t) oder das durch Korrelationsvergleich bestimmte erste Individualsignal Li(t) oder das durch Korrelationsvergleich bestimmte zweite Individualsignal R±(t) zeitabhängig vorliegt.
Prinzipiell lassen sich solche residualfreien Signale durch simple Substraktion bzw. Addition sowohl frequenzabhängig als auch zeitabhängig gewinnen:
Δ
Ri = Ri - Δ
Ci* = Ci + 2Δ
Allerdings lässt sich zeigen, dass beispielsweise für jeweils benachbarte Kanäle Li, Cn, Ri, Ci? und Bi mit Li' — Li + Cii
RH' = Ri + Cii + Ci2
Figure imgf000017_0001
Bi' = Bi + Ci2 sich nicht aus einem Residual Δι, das aus dem Korrelationsvergleich zwischen Li' und RH' resultiert, in linearer Form das Residual Δ2, das aus dem Korrelationsvergleich zwischen Ri2' und Bi' resultiert, ableiten lässt.
Eine ideale näherungsweise Bestimmung, die zudem die drastische Verminderung der Anzahl der zu übertragenden Residuale darstellt, besteht in der folgenden Überlegung: Wurden n Residuale Δι, Δ2, Δ3, Δ4, ..., Δη bestimmt, siehe beispielsweise FIG. 2 oder 22, und gelten für die Differenzen
Δ2 - Δι = η3 - ηη
Δ3 - Δ2 = η4 - ηι
Δ4 - Δ3 = η5 - r\ 2
Figure imgf000017_0002
Δι - Δη = η2 - ηη_ι dann lassen sich die Beziehungen
Δι = η2 - ηη-ι + Δη Δ2 - Δι = Δ2 - (η2 - ηη_ι + Δη) = η3 - ηη bzw.
Figure imgf000018_0001
Δ3 - Δ2 = Δ3 - (η3 - ηη + (η2 ~ ηη-ι + Δη ) ) = η4 - ηι bzw.
Δ3 = η4 - ηι + (η3 - ηη + (η2 - ηη-ι + Δη ) )
Δ4 - Δ3 = Δ4 - (η4 - ηι + (η3 - ηη + (η2 - ηη-ι + Δη ) ) ) = η5 - η2
bzw .
Δ4 = η5 - η2 + (η4 - ηι + (η3 - ηη + (η2 - ηη_! + Δη ) ) )
Δι - Δη = (η2 - ηη_ι + Δη ) - Δη = η2 - ηη_ι bzw.
Δι = (η2 - ηη-ι + Δη ) ableiten.
Somit ist beispielsweise (η2 - ηη-ι + Δη ) ein Term, der in allen Residualen enthalten ist. Gleiche Überlegung lässt sich auf jedes Δι , i = 1, n, anwenden. Da n in der Praxis klein bleibt, folgt daraus, dass mit jedem so bestimmten Term sich jedes Residual mit hoher Genauigkeiten approximieren lässt.
Setzt man nunmehr
Figure imgf000018_0002
Δ6 - Δ5 = ην - - η4 = a5
Figure imgf000018_0003
Δ8 - Δ7 = η 9 - - η ε = a7
Δ9 - Δ8 = ηιο - η? = a8
Διο - Δ9 = Άιι - η8 = a9 Δι - Δη = η2 ~ ηη-ι= a ergibt sich
Figure imgf000019_0001
bzw . η4 = ηι + a2
η7 = ηι + a2 + a5
ηιο = ηι + a2 + a5 + a8
bzw . η5 = η2 + a3
η8 = η2 + a3 + a6
ηιι = η2 + a3 + a6 + a9
Aus den Beziehungen ηη = ηη + ai + a4 + a7 + ... + an-2 bzw.
ηη-ι = ηη-ι + an + a3 + a6 + ... + an-3 bzw.
ηη-2 = ηη_2 + an-i + a2 + as + ... + an-4 lässt sich nunmehr die „Differenzregel für Residuale"
( ai + a4 + a7 + ... + an-2) + (an + a3 + a6 + ... + an-3) + ( an-i +
a2 + a5 + ... + an-4) = 0 ableiten, was bedeutet, dass ai, a2, Ά3, · · · , an psychoakustisch innerhalb einer normativen Abhörsituation (innerhalb des „Sweet Spot") ein ideales Residualverhalten aufweisen, indem sie sich gegenseitig auslöschen.
Aus obiger „Differenzregel" lässt sich unmittelbar das folgende „Additionstheorem für Residuale" ableiten, nämlich Δι + Δ2 + Δ3 + ... + Δη = n * (η2 - ηη-ι + Δη) was bedeutet, dass der Mittelwert aller Residuale zugleich in diesen enthalten ist und sich auch unschwer, beispielsweise innerhalb eines Encoder, errechnen lässt.
Das Prinzip einer Residualkorrektur beispielsweise für den Top-Layer eines NHK-22.2-Signals zeigt FIG. 19.
Wird nun die Residualkorrektur anstelle anhand der Residuale Δι, Δ2, Δ3, .. ·, Δη nunmehr anhand von deren Mittelwert vorgenommen, lassen sich zwar Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte gezielt minimieren und eine deutliche Verbreiterung des Sweetspots erzielen, allerdings ist mit diesem Verfahren eine Residualbestimmung ausserhalb des Decoders notwendig.
Gemäss CH1696/13 ist es etwa gemäss FIG. 2 möglich, deren umschriebenenes Dreieck mit seinen Ecken die Anzahl der Downmixkanäle bezeichnet und deren eingeschriebenes, strichliertes Dreieck die Anzahl der zusätzlich mittels Korrelationsvergleich extrahierten Kanäle (die von den zugehörigen Downmixkanälen anschliessend subtrahiert werden, um sämtliche ursprünglichen Kanäle des umschriebenen Dreiecks näherungsweise zu erhalten) , bei Übertragung des Mittelwerts aller Residuale, aus wenigstens drei Kanälen maximal sechs „„
19
Kanäle zu extrahieren, die deutlich geringere Artefakte bzw. Verfärbungen der Klangfarbe und sonstige Demaskierungseffekte aufweisen. In anderen Worten beschreiben die Eckpunkte des umschriebenen Dreiecks die drei Downmixkanäle eines Multikanalsignals mit sechs Kanälen. Ein Eckpunkt des eingeschriebenen Dreiecks beschreibt einen, den beiden benachbarten Downmixkanälen zugemischten Kanal des Multikanalsignals. Ein solcher, zwischen zwei Downmixkanälen liegender weiterer Kanal kann durch einen Korrelationsvergleich zwischen den beiden angrenzenden Downmixkanälen (den Eckpunkten des umschriebenen Dreiecks) erhalten werden, indem dieses in beiden Downmixkanälen enthaltene Signal extrahiert wird, als auch jeweils die Summe der beiden ursprünglichen, äusseren Ecksignale vor dem Downmix mit ihrem benachbarten Signal, welches in der Mitte der, dem jeweilig betrachteten Ecksignal nächstgelegenen Seite des Dreiecks liegt (wohlgemerkt nicht auf jener Seite, auf der der erste Korrelationsvergleich durchgeführt wurde!). Wird nun auch für die beiden Downmixkanäle dieser neu betrachteten Seite ein Korrelationsvergleich ausgeführt, wird wiederum das in beiden Downmixkanälen enthaltene Signal extrahiert. Dieses lässt sich von der nächstgelegenen Summe des ersten Korrelationsvergleichs subtrahieren, und ergibt dann das ursprüngliche Ecksignal. Wenn dies für alle drei benachbarten Paare von Downmixkanälen gemacht wird, erhält man wieder die sechs Kanäle des Multikanalsignals. Da neben den Downmix- Signalen, sofern nicht stationär, nun zur exakten Berechnung der sechs Multikanalsignale neben den drei Downmixkanälen auch noch drei Residuale übertragen werden müssten, wäre die Menge der zu übertragenden Daten wieder gleich der Übertragung des Multikanalsignals. Deshalb wird nun der Mittelwert aller drei Residuale übertragen und die aus dem Korrelationsvergleich erhaltenen sechs Kanäle des Multikanalsignals werden auf der Basis dieses gemittelten Residuals korrigiert. 2 Q
Die FIG. 2 hat rein kombinatorische Bedeutung und ist nicht mit konkreten Lautsprecherpositionen zu verwechseln.
FIG. 18 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit vier Kanälen, die durch das umschriebene Quadrat veranschaulicht wird. Für sie gelten gleich Überlegungen wie für FIG. 2.
Das beschriebene System lässt sich auf jedes beliebige n-Eck nach unendlich erweitern, wobei allerdings der errechnete Mittelwert aller Residuale aufgrund obiger Überlegungen zunehmend zu Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten führt.
Die Downmixkanäle bzw. Residuale, die der möglichst effizienten Speicherung und Übertragung von Audiodaten, beispielsweise zwischen einem Encoder und einem Decoder, dienen sollen, lassen sich mit einem aus dem Stand der Technik bekannten entsprechenden verlustfreien oder verlustbehafteten Base Audio Codec (Beispiele eines solchen Base Audio Codecs sind Opus oder die MPEG-Standards MP3, AAC, HE-AAC, HE-AAC v2 und USAC) zusätzlich komprimieren und dekomprimieren, wobei der jeweils verwendete Base Audio Codec hinsichtlich des insgesamt zugrundeliegenden räumlichen Kodierverfahrens zusätzlich optimiert werden kann („Tuning") .
Insbesondere, da eine Reihe von Audiocodecs zur verlustfreien oder verlustbehafteten Komprimierung von Audiosignalen sich bereits die Fourier-Transformation bzw. Fast Fourier Transform (FFT) zunutze machen, können mit geringem Rechenaufwand die oben beschriebenen Regeln zur Gewinnung der Realteile bzw. Imaginärteile von Signalen direkt in diese Audiocodecs integriert werden, bzw. Signale aus derartigen Audiocodecs abgeleitet werden, die diesen Regeln zur Gewinnung der „„
21
Realteile bzw. Imaginärteile unterworfen werden können. Der insgesamt notwendige Rechenaufwand kann so deutlich vermindert werden . Autonome Residualbestimmung durch Fourier-Transformation
Zwei Signale, die dem gleichen beschriebenen
Korrelationsvergleich unterworden wurden, sind nach diesem Korrelationsvergleich aufgrund der dabei gebildeten Residuale „pseudo-stationär" , was bedeutet, dass nach
Korrelationsvergleich ihr Verhalten für denselben Frame, wie er für die Fourier-Transformation bzw. inverse Fourier- Transformation verwendet wurde, jenem eines stationären Signals identisch ist. Grund dafür ist die vorgängige Darstellung im Frequenzbereich, die für nichtstationäre Signale in der Praxis nur eine ungenügende zeitliche Auflösung ermöglicht und zugleich zur unerwünschten Residualbildung führt. Somit kann kein zweiter oben beschriebener Korrelationsvergleich auf den Ausgangssignalen eines solchen Korrelationsvergleichs ausgeführt werden. Pseudo-stationäre Signale sind gegen einen solchen „immun" geworden.
Ebenso ist die Bestimmung des Mittelwerts aller mittels Korrelationsvergleiches gebildeter Residuale algebraisch betrachtet von der Kenntnis der ursprünglichen Signale abhängig. Insbesondere gibt es keine Methode, ohne Kenntnis der ursprünglichen Signale einen solchen Mittelwert algebraisch zu rekonstruieren. Somit ist gemäss Stand der Technik die Übertragung des Mittelwerts gemeinsam mit den Signalen notwendig.
Die Erfindung ermöglicht, dies ebenfalls mittels Fourier- Transformation, zwar nicht die absolute Bestimmung dieses Mittelwerts aller gebildeter Residuale, vermag jedoch frequenzabhängig jene Signalanteile, welche den Korrelationsgrad +1 aufweisen, aus nicht demselbem Korrelationsvergleich zuzuordnenden Signalen zu gewinnen. Somit lässt sich frequenzabhängig der oben beschriebene Signalanteil mit Korrelationsgrad +1 zweier Residuale Δι und Δ2 für jedes Sample absolut extrahieren, und somit ist die Auflösung der rückgewonnenen Signale im Wesentlichen nur von der Auflösung der Fourier-Transformation bzw. anschliessenden inversen Fourier-Transformation abhängig. Es handelt sich um eine Analogie zum Mittelwert aller gebildeter Residuale, wobei hier allerdings der Maximalwert Amax für jedes Sample zweier verglichener Signale extrahiert wird, sozusagen das analytisches Analogon zum Mittelwert aller gebildeter Residuale - mit dem einzigen Unterschied, dass der Maximalwert Amax ohne Kenntnis der vorhergegangenen Signale bestimmt werden kann.
Somit ist ein Korrelationsvergleich auf zwei Ausgangssignale von nicht-identischen Korrelationsvergleichen i, j anzuwenden, welche einen korrelierenden Anteil Ai max in ihren beiden Residualen Δι und Aj aufweisen. In der Praxis bedeutet dies, dass für
Li = Li* + Δ± Ri = Ri* + Δ±
C± = Ci* - 2Δ± und
+ Δ,
Ri Ri + Δ, vorzugsweise eines der folgenden Signalpaare einem weiteren Korrelationsvergleich unterzogen werden:
Li und Lj, oder
Ri und Rj, oder
Lx und Rj, oder
Rx und oder
Ci und c3, oder
Figure imgf000025_0001
-*Li und 0.5*Cj, oder
-*Ri und 0.5*Cj, oder
Li und -0.5*Cj, oder auch
Ri und -0.5*Cj . Jeder der genannten Korrelationsvergleiche liefert dasselbe Ergebnis Aijmax bzw. -Aijmax.
Beispielsweise lassen sich für einen weiteren, mit den Korrelationsvergleichen nichtidentischen Korrelationsvergleich k nunmehr die Paare
Figure imgf000025_0002
-Ri und -Lk, oder -C± und -Ck, oder
-*Li und 0.5*Ck, oder
-*Ri und 0.5*Ck, oder
Li und -0.5*Ck, oder auch
R± und -0.5*Ck lden als auch
Figure imgf000026_0001
"Lj und oder
Figure imgf000026_0002
"Rj und oder
"Cj und oder
-*Lj und 0.5*Ck, oder
-*Rj und 0.5*Ck, oder
Lj und -0.5*Ck, oder auch
Rj und -0.5*Ck.
Es ergeben sich somit für den Korrelationsvergleich der Ausgangssignale der Korrelationsvergleiche i, k die korrelierenden Anteile
Aikmax bzw. -Aikmax und für den Korrelationsvergleich der Ausgangssignale der Korrelationsvergleiche j , k die korrelierenden Anteile bzw. -A kmax- ^
Auf Aij max und Aikmax bzw. -Aij max und -Aikmax oder auch auf Aij max und und -Aj kmax lässt sich nunmehr in gleicher Weise ein Korrelationsvergleich ausführen, womit sich der korrelierende Anteil Ai kmax ergibt, der den Signalanteil mit Korrelationsgrad +1 für die drei vorgängigen
Korrelationsvergleiche darstellt .
Dieses System lässt sich, wie die FIG. 3 und 4 zeigen, ad infinitum erweitern, und lässt im Weiteren eine Vielzahl von äquivalenten kombinatorischen Möglichkeiten hinsichtlich der hier beschriebenen Nachschaltung von Korrelationsvergleichen zu, wie FIG. 3, 4 und 7 illustrieren.
Anstelle nunmehr in der oben beschriebenen Art und Weise die mittels Korrelationsvergleichen gewonnenen Signale um den Mittelwert aller Residuale zu korrigieren, wird an seiner Stelle das Resultat der hier beschriebenen Nachschaltung von Korrelationsvergleichen, beispielsweise für den Fall der FIG. 2 Aij kmax , in die Gleichungssysteme zur Residualkorrektur, siehe oben, eingesetzt. Für den Fall der FIG. 18 wird dieser Vorgang beispielsweise durch die FIG. 19 illustriert.
Das Ergebnis liefert sehr verfärbungsarme, mittels Korrelationsvergleiches extrahierte Signale, dies insbesondere für den Sweetspot.
Bei Signalen mit sehr hochfrequenten Anteilen kann es dabei zu einer unangenehmen Verstärkung der Wellenformen kommen. Dieser lässt sich entweder durch eine erhöhte Auflösung der verwendeten diskreten Fourier-Transformation begegnen, oder auch durch deren Gegenteil, nämlich einer diskreten Fourier- Transformation, aufgrund von deren Dimension deren harmonische Frequenzen deutlich unterhalb genannter hochfrequenter Anteile liegen. Im zweiteren Fall liegt ein ähnliches Vorgehen wie beim Mittelwert aller Residuale vor. Somit lässt sich ^r
26
beispielsweise durch die Länge einer Fast Fourier Transform (FFT) präzise das Signalverhalten steuern.
Ein solches System kann mit geringstem Rechenaufwand in einen Decoder integriert werden, und eine Übertragung des Mittelwerts aller Residuale kann somit, wie bereits bemerkt, entfallen .
Während die vorliegende Methodik vor allem im Sweetspot überraschend natürliche Ergebnisse liefert, ist die Residualkorrektur um den Mittelwert aller Residuale vor allem dann eine Alternative, wenn ein möglichst grosser Hörbereich (Sweetspot) geschaffen werden soll - bei allerdings höheren Bandbreiten bei der Übertragung von Signalen vom Encoder zum Decoder .
Gewinnung von residualarmen Zusatzsignalen
Bei Multikanalsignalen können Zusatzsignale (wie beispielsweise der TpC eines NHK-22.2-Signals oder auch der TpC eines vom Institut für Rundfunktechnik (IRT) entwickelten Auro-Signals ) auftreten, die sich gemäss Stand der Technik nicht vorteilhaft durch optimiertes Residualverhalten hinsichtlich auftretender Artefakte maskieren lassen. Praktische Beispiele solcher Signals sind das TpC-Signal eines NHK-22.2-Signals oder eines gleichartigen TpC-Signals eines vom Institut für Rundfunktechnik entwickelten Auro-Formats - oder auch sogenannte LFE-Signale, die sich aufgrund der energiereichen, tiefen Frequenzen und besonderen Aufstellung nur schwer maskieren lassen.
Im ersten Fall lassen sich jedoch aufgrund eines überraschenden algebraischen Zusammenhangs anhand der Summenbildung der aus den Korrelationsvergleichen der beiden Diagonalen der FIG. 5 abgeleiteten TpC-Signale, dies mit ^ zusätzlichen optionalen Residualkorrekturen, und der abschliessenden Differenzbildung des so gebildeten TpC jeweils mit einem der resultierenden Mittensignale der Korrelationsvergleiche der vier Seiten des Vierecks, siehe FIG. 5, dies mit zusätzlichem optionaler Residualkorrektur, siehe unten, Signale gewinnen, die hinsichtlich der dabei auftretenden primären Residuale sich wechselseitig maskieren.
Grund dafür ist einerseits der Sachverhalt, dass beispielsweise vier symmetrisch um den Kopf angeordnete Ecklautsprecher TpFL, TpFR, TpBL und TpBR, welche ein TpC- Signal mit jeweils -6dB wiedergeben, zu einem Schallfeld bei Übersprechen und zu einer Lokalisierung dieses Signals im Bereich des TpC führen, und andererseits die folgende Herleitung, die auf gezielter algebraischer, maximierter Eliminierung von störenden Signalanteilen und Residualen gemäss folgendem Schema beruht (siehe zugehörige Tabelle der FIG. 6; in der Fig. 6 zeigen die Faktoren 1 oder 0.5 die Faktoren für die jeweils beim Korrelationsvergleich 1 bis 6 auftretenden Kanäle, r stellt das beim Korrelationsvergleich 1 bis 6 auftretenden Residual dar. Somit ist die Tabelle so zu lesen, dass das Ergebnis für Korrelationsvergleich 3 sich beispielsweise wie folgt liest: 0.25 * TpC - r (TpFL) - r ( TpFR) + 0.5 * TpFC - r(0.5 * TpFC) - r(0.5 * TpSiL) - r(0.5 * TpSiR) . ) :
1. Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFL' und TpBR' zur Gewinnung eines näherungsweisen TpC-Signals aus (Zeile 1 in der zugehörigen Tabelle von FIG. 6) .
2. Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFR' und TpBL' zur Gewinnung eines näherungsweisen TpC-Signals aus (Zeile 2 in der zugehörigen Tabelle von FIG. 6) . Bestimme gegebenenfalls das autonome Residual von Schritt 1 und 2 gemäss FIG. 7. Oder alternativ: Lies den Mittelwert aller Residuale, die aus den Schritten 6 und 8 sowie 13 und 15 entstehen, d.h. bestimme das mittlere Residual aus den Korrelationsvergleichen 3 bis 6 in Fig. 5.
Führe eine Residualkorrektur auf das Resultat von Schritt 1 durch.
Führe eine Residualkorrektur auf das Resultat von Schritt 2 durch.
Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpBL' und TpFL' zur Gewinnung eines näherungsweisen (TpSiL + TpC) -Signals aus (Zeile 6 in der zugehörigen Tabelle von FIG. 6) .
Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 6 durch.
Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFR' und TpBR' zur Gewinnung eines näherungsweisen (TpSiR + TpC) -Signals aus (Zeile 4 in der zugehörigen Tabelle von FIG. 6) .
Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 8 durch.
Addiere die anhand von Schritten 1 und 2 gewonnenen Signale .
Addiere die anhand von Schritten 6 bis 9 gewonnenen Signale .
Ziehe die in Schritt 11 gewonnenen Signale von den in Schritt 10 gewonnenen Signalen ab. Es ergibt sich als Resultat das Signal mit minimierten Residualen r' :
0.5 * TpSiL - r' (0.5 * TpSiL) - 0.5 * TpSiR - r' (0.5 * TpSiR) . Führe einen Korrelationsvergleich zwischen den Downmixsignalen TpFL' und TpFR' zur Gewinnung eines ^ näherungsweisen (TpFC + TpC) -Signals aus (Zeile 3 in der zugehörigen Tabelle von FIG. 6) .
14. Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 13 durch.
15. Führe einen Korrelationsvergleich zwischen den
Downmixsignalen TpBR' und TpBL' zur Gewinnung eines näherungsweisen (TpBC + TpC) -Signals aus (Zeile 5 in der zugehörigen Tabelle von FIG. 6) .
16. Führe gegebenenfalls eine Residualkorrektur auf das Resultat von Schritt 15 durch.
17. Addiere die anhand von Schritten 13 bis 16 gewonnenen Signale .
18. Ziehe die in Schritt 17 gewonnenen Signale von den in Schritt 10 gewonnenen Signalen ab. Es ergibt sich als Resultat das Signal mit minimierten Residualen r' :
-0.5 * TpFC - r' (0.5 * TpFC) - 0.5 * TpBC
- r' (0.5 * TpBC) . 19. Addiere die anhand von Schritten 11 und 17 gewonnenen
Signale mit den anhand der Schritte 12 und 18 gewonnenen Signalen. Es ergibt sich mit minimierten primären Residualen das gesuchte TpC-Signal: TpC - 2 * r ' (TpFL) - 2 * r ' ( TpFR) - 2 * r ' (TpBL)
- 2 * r' (TpBR) - 2 * r' (0.5 * TpFC)
- 2 * r' (0.5 * TpSiR) - 2 * r' (0.5 * TpBC)
- 2 * r' (0.5 * TpSiL) .
20. Ziehe die Hälfte des aus Schritt 19 gewonnenen Signals jeweils von den in Schritten 6 bis 9 und 13 bis 16 gewonnenen Signalen ab.
Das insgesamte Vorgehen beschreibt vereinfachend (ohne Schritte 11, 12 und 17, 18 und 19) das Sammelschienenschema 3 Q der FIG. 16, bei dem jeder fett bezeichnete Eingangskanal und jeder resultierende Kanal gesondert abgebildet werden. In Fig. 16 zeigt das Zeichen 100 eine Subtraktion mit dem Faktor n, das Zeichen 101 eine Addition, das Zeichen 102 eine Summation des Resultats und 103 das Ergebnis eines
Korrelationsvergleichs. Für die Eingangskanäle TpFL', TpFR', TpBR' , TpBL' und den bestimmten Mittelwert der Residuale der Extraktion der Kanäle des Vierecks oder alternativ das aus dieser Extraktion resultierende autonome Residual Amax der FIG. 3 oder äquivalent 4 werden für die Extraktion des TpC demnach folgende Sammelschienen bestimmt:
Das (0.5 * TpFC' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpFL' und TpFR' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpSiR' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpFR' und TpBR' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpBC' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpBR' und TpBL' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
Das (0.5 * TpSiL' ) zuzuordnende Sammelschienensignal wird durch Korrelationsvergleich von TpBL' und TpFL' bei anschliessender Residualkorrektur um den Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder „„
31
alternativ um das autonome Residual dieser Korrelationsvergleiche (Amax) bestimmt.
• Das 0.5*TpC' zuzuordnende Sammelschienensignal wird durch die Summe des Korrelationsvergleich von TpFL' und TpBR' bzw. von TpFR' und TpBL', addiert mit dem verdoppelten
Mittelwert aller Korrelationsvergleiche des Vierecks der FIG. 5 oder alternativ nach Subtrahieren des verdoppelten autonomen Residuais dieser Korrelationsvergleiche (Atop) , siehe FIG. 7 gebildet, wobei sich (mit Schritten 11, 12 und 17, 18 und 19) 0.5 * TpC - r ' (TpFL) - r ' ( TpFR) - r ' (TpBL) - r' (TpBR) - r' (0.5 * TpFC) - r' (0.5 * TpSiR) - r' (0.5 * TpBC) - r' (0.5 * TpSiL) ergibt.
Während der so gewonnene TpC als solcher beibehalten wird, kommt es nunmehr bei minimierten primären Residualen zu einem Schallfeld bei Übersprechen und zu „Phantomschallquellen" und somit zu einer „Maskierung" gemäss FIG. 8.
Hierbei erscheinen bei sphärischer Anordnung der Lautsprecher die „Phantomschallquellen" dieser minimierten primärer Residuale gemäss FIG. 9 und 10 angehoben, der Faktor lässt sich bei NHK-22.2-Signalen wie folgt errechnen: Sofern dem Top Layer die Elevation ε zugrunde liegt, derzeit zumeist 35°, errechnet sich die Pegelzunahme für die Verkürzung der Distanz für die „Phantomschallquellen" mit
1/ (sin ( π /4) * cos ε) und somit rechnerisch mit 2.4414. Aufgrund der Zunahme des Pegels mit dem Quadrat der Distanz ist dieses Ergebnis ebenfalls zu quadrieren, es ergibt sich somit 5.9604. Hinzu kommt eine psychoakustisch bedingte Anhebung der „Phantomschallquellen" um rund +3dB, also dem Faktor 1.4142. Rechnerisch ergibt sich somit ein gesamter Faktor von 8.4292 oder +18.5157 dB! An der Tatsache, dass bereits bei Korrektur um den Mittelwert auftretender Residuale eine praktische Korrektur des TpC um +1.6dB genügt, um diesen Faktor vollwertig zu kompensieren, zeigt, wie effizient die dargestellte TpC-Extraktion ist. Diese Korrektur kann nach unten oder oben unterschritten werden, und es empfiehlt sich insgesamt für die Kalibrierung des Decoders eine zusätzliche Kontrolle dieses Parameters unter Abhörbedingungen gemäss ITU-R Recommendation BS.1116-1.
Soll obige Überlegung auf die vom Institut für Rundfunktechnik (IRT) entwickelten Auro-Formate gemäss FIG. 11 angewandt werden, ergibt sich die Tabelle der FIG. 12. Wird der TpC mit jeweils -6dB beim Downmix den Lautsprechern TpFL, TpFR, TpBR, TpBL hinzugefügt, wird dieser bei einem Korrelationsvergleich der resultierenden Kanäle TpFL' und TpFR' gemeinsam mit dem TpFC mit ebenfalls -6dB extrahiert. Somit lässt sich der TpC durch einfache Addition des Resultats eines gegebenenfalls durch autonome Residualkorrektur, siehe FIG. 7, unterstützten Korrelationsvergleichs der Downmixsignale TpFL' - TpBR' und TpFR' - TpBL' errechnen.
Wird nun das Resultat vom durch Korrelationsvergleich ermittelten TpFC sowie vom TpBL-Signal und TpBR-Signal abgezogen, ergibt sich ebenfalls ein residualarmes, maskierendes Klangbild.
Allerdings liegt auch hier eine entsprechende Verstärkung der in FIG. 13 dargestellten „Phantomschallquellen" des gebildeten Schallfeldes bei Übersprechen vor:
In Fig. 9, 10, 14 und 15 zeigt der schwarz gefüllte Kreis im Mittelpunkt des gepunkteten Kreises die Position des Hörers. So errechnet sich deren Korrekturfaktor gemäss FIG. 14 und ^
FIG. 15 mit der Elevation ε für den Top Layer von Auro 11.1 gemäss der Formel
1/ (sin (7 * n/36) * cos ε) was für ε = 7 * n/36 einen Wert von 2.1281 ergibt. Dieser Faktor ist zu quadrieren, es ergibt sich somit 4.5288; hinzu kommt eine Anhebung der „Phantomschallquellen" um +3dB, also den Faktor 1.4142. Somit liegt ein Faktor von 6.4046 vor; dies entspricht +16.1298dB.
Allerdings ist für TpFC ein gesonderter Korrekturfaktor von - 3dB vorzusehen, da dieser ein auf TpFL und TpFR wiedergegebenes Monosignal simulieren soll und trotz der Anhebung der Mittenschallquellen hinsichtlich Residualen +3dB zu laut erschiene!
BESCHREIBUNG DER ZEICHNUNGEN
Verschiedene Ausführungsformen der vorliegenden Erfindun werden im folgenden beispielhaft beschrieben, wobei auf
folgende Zeichnungen Bezug genommen wird: · FIG. 1 zeigt das Prinzip des dargestellten
Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Offenbarung der Erfindung. Vor diesem
Korrelationsvergleich wird eine Fast Fourier Transform (FFT) ausgeführt, nach diesem eine Inverse Fast Fourier
Transform (IFFT) .
• FIG. 2 veranschaulicht geometrisch die kombinatorische Anwendung eines solchen Korrelationsvergleichs auf einen entsprechenden Downmix mit drei Kanälen, die durch das umschriebene Dreieck veranschaulicht wird. Für einen entsprechenden Downmix mit vier Kanälen, siehe FIG. 18.
• FIG. 3 veranschaulicht das Prinzip der autonomen Residualbestimmung durch Fourier-Transformation für vier Eingangssignale .
• FIG. 4 veranschaulicht das Beispiel einer alternativen, gleichwertigen Ausführungsform, welches das Prinzip der kombinatorischen Möglichkeiten gleichwertiger Ausführungsformen verdeutlicht.
• FIG. 5 veranschaulicht geometrisch die kombinatorische Anwendung von sechs Korrelationsvergleichen innerhalb des Top Layer eines NHK-22.2-Signals zur algebraischen Bestimmung eines TpC ohne sekundäre Residualbildung.
• FIG. 6 zeigt die FIG. 5 zugehörige Tabelle der resultierenden Signale bzw. Residuale.
• FIG. 7 zeigt die autonome Residualbestimmung zur Extraktion eines TpC-Kanals im Top Layer einer NHK-22.2- Anlage bzw. einer Auro-11.1-Anordnung.
• FIG. 8 zeigt die Maskierung einer algebraischen Extraktion des TpC im gebildeten Schallfeld bei Übersprechen anhand von „Phantomschallquellen" im Top Layer einer NHK-22.2-Anordnung .
FIG. 9 zeigt den Querschnitt einer NHK-22.2-Anlage, der sich der errechnete Faktor einer optimalen Maskierung gemässt FIG. 8 entnehmen lässt. ^
• FIG. 10 zeigt den Grundriss einer NHK-22.2-Anlage, der sich der errechnete Faktor einer optimalen Maskierung gemässt FIG. 8 entnehmen lässt.
• FIG. 11 veranschaulicht geometrisch die kombinatorische Anwendung von drei Korrelationsvergleichen innerhalb des Top Layer eines Auro-11.1-Signals zur algebraischen Bestimmung eines TpC ohne sekundäre Residualbildung.
• FIG. 12 zeigt die FIG. 11 zugehörige Tabelle der resultierenden Signale bzw. Residuale.
• FIG. 13 zeigt die Maskierung einer algebraischen Extraktion eines TpC im gebildeten Schallfeld bei Übersprechen anhand von „Phantomschallquellen" im Top Layer einer Auro-11.1-Anordnung.
• FIG. 14 zeigt den Querschnitt einer Auro-11.1 -Anlage, der sich die errechneten Faktoren einer optimalen Maskierung gemässt FIG. 13 entnehmen lassen.
• FIG. 15 zeigt den Grundriss einer Auro-11.1 -Anlage, der sich die errechneten Faktoren einer optimalen Maskierung gemässt FIG. 13 entnehmen lassen.
• FIG. 16 zeigt in vereinfachender Darstellung die algebraische Extraktion eines TpC-Kanals des Top Layers eines NHK-22.2-Signals, die in der Folge zu einer Maskierung der auftretenden Residuale führt.
• FIG. 17 zeigt das Beispiel einer nichtlinearen inversen Kodierung gemäss der unveröffentlichten Anmeldung CH02300/12. ^ r
36
• FIG. 18 veranschaulicht geometrisch die kombinatorische Anwendung eines Korrelationsvergleichs auf einen entsprechenden Downmix mit vier Kanälen, die durch das umschriebene Quadrat veranschaulicht wird.
FIG. 19 zeigt einen Decoder, der anhand des gesamten Downmix und des übertragenen Mittelwerts aller von den Encoderbausteinen berechneten Residuale mittels Korrelationsvergleich, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe
Einleitung zur Offenbarung der Erfindung, und mittels Summen- und Differenzbildung die ursprünglichen Eingangssignale des Encoder näherungsweise berechnet. Abschliessend werden die Inverse Fast Fourier Transforms (IFFT) bestimmt. Die Residualkorrektur um den übertragenen Mittelwert aller von den Encoderbausteinen berechneten Residuale mittels Korrelationsvergleich kann unmittelbar durch deren autonomes Residual Amax ersetzt werden. A(k) ist in diesem Falle gleich Amax(k) im Frequenzbereich zu setzen, für den Zeitbereich gilt A(t) gleich Amax(t) . Entgegen A(k) kann Amax(k) unmittelbar im Decoder bestimmt werden und muss deshalb nicht vom Encoder zum Decoder übertragen werden, was einer drastischen Bandbreitenreduzierung gleichkommt.
• FIG. 20 zeigt das Prinzip des dargestellten Korrelationsvergleichs, dies gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung. Vor diesem Korrelationsvergleich wird eine Fast Fourier Transform
(FFT) ausgeführt, nach diesem eine Inverse Fast Fourier Transform (IFFT) .
• FIG. 21 zeigt eine NHK-22.2-Anordnung . DETAILLIERTE BESCHREIBUNG
Anwendung der autonomen Residualbestimmung auf ein NHK-22.2- Top-Layer-Signal (siehe FIG. 5 bis 10) :
Das erste Beispiel einer Anwendung des Erfindungsgegenstands, hier gemäss FIG. 5 bis 10, auf ein NHK-22.2-Top-Layer-Signal, siehe FIG. 21, stellt für die Kanäle TpFL, TpFR, TpFC, TpC, TpBL, TpBR, TpSiL, TpSiR, TpBC die Summenbildung (der „Downmix")
TpFL' = TpFL + 0.5 * TpFC + 0.5 * TpSiL + 0.25 * TpC
TpFR' = TpFR + 0.5 * TpFC + 0.5 * TpSiR + 0.25 * TpC
TpBL' = TpBL + 0.5 * TpBC + 0.5 * TpSiL + 0.25 * TpC
TpBR' = TpBR + 0.5 * TpBC + 0.5 * TpSiR + 0.25 * TpC dar, wobei TpFL' , TpFR' , TpBL' , TpBR' den Eckpunkten des umschriebenen Quadrats der FIG. 5 entsprechen. Es lässt sich nunmehr nicht nur für jede Seite des Quadrats ein Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, ausführen, sondern auch für die beiden Diagonalen, demnach TpFL' und TpBR' bzw. TpFR' und TpBL' .
Durch Korrelationsvergleich von TpFL' und TpBR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, wird nunmehr ein Signal 0.25 * (TpC - Δ5) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) . Siehe hierzu auch FIG. 5 und 6 sowie 16 sowie nachstehenden Abschnitt zur Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal .
Durch Korrelationsvergleich von TpFR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, wird nunmehr ein Signal 0.25 * (TpC - Ae) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) . Siehe hierzu auch FIG. 5 und 6 sowie 16 sowie nachstehenden Abschnitt zur Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal .
Auf beide Ausgangssignale wird nunmehr gemäss FIG. 7 ein weiterer frequenzabhängiger Korrelationsvergleich ausgeführt, d.h. dass vorgängig keine inverse Fourier-Transformation erfolgt. Es ergibt sich -A56max- Sowohl 0.25 * (TpC - Δ5) als auch 0.25 * (TpC - Ae) werden mit 4 multipliziert und diese jeweils mit 4 * A56max addiert. Siehe auch nachstehenden Abschnitt zur Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer- Signal .
Durch Korrelationsvergleich von TpFL' und TpFR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpFC + 0.5 * TpC - Δι) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFL + 0.5 * TpSiL + Δι) und (TpFR + 0.5 * TpSiR + Δι) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Durch Korrelationsvergleich von TpFR' und TpBR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpSiR + 0.5 * TpC - Δ2) extrahiert (das ^ anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFR + 0.5 * TpFC + Δ2) und (TpBR + 0.5 * TpBC + Δ2) . Siehe hierzu FIG. 5, 16, 18, 19 und 20. Durch Korrelationsvergleich von TpBR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpBC + 0.5 * TpC - Δ3) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpBR + 0.5 * TpSiR + Δ3) und (TpBL + 0.5 * TpSiL + Δ3) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Durch Korrelationsvergleich von TpFL' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, werden nunmehr ein Signal 0.5 * (TpSiL + 0.5 * TpC - Δ4) extrahiert (das anschliessend mit dem Faktor 2 multipliziert wird) als auch zwei Signale (TpFL + 0.5 * TpFC + Δ4) und (TpBL + 0.5 * TpBC + Δ4) . Siehe hierzu FIG. 5, 16, 18, 19 und 20.
Mit den so extrahierten Signalen (TpFL + 0.5 TpSiL + Δι) , (TpFR + 0.5 * TpFC + Δ2) , (TpBR + 0.5 * TpSiR + Δ3) , (TpBL + 0.5 * TpBC + Δ4) lassen sich, sofern weder die Residuale Air Δ2, Δ3, Δ4 noch deren Mittelwert bekannt sind, nunmehr eine autonome Residualbestimmung anwenden:
So wird aus den extrahierten Signalen (TpFL + 0.5 * TpSiL + Δι) und (TpFR + 0.5 * TpFC + Δ2) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ai2max extrahiert. Λ
40
So wird aus den extrahierten Signalen (TpFR + 0.5 * TpFC + Δ2) und (TpBR + 0.5 * TpSiR + Δ3) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ä23max extrahiert.
So wird aus den extrahierten Signalen (TpBR + 0.5 * TpSiR + Δ3) und (TpBL + 0.5 * TpBC + Δ4) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ä34max extrahiert.
So wird aus den extrahierten Signalen (TpBL + 0.5 * TpBC + Δ4) und (TpFL + 0.5 * TpSiL + Δι) noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal A4imax extrahiert.
Es wird nunmehr aus den extrahierten Signalen Ai2max und Ä23max noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Ai23max extrahiert .
Es wird nunmehr aus den extrahierten Signalen Ai23max und Ä34max noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Λ
41
Offenbarung der Erfindung, nunmehr ein Signal Ai234max extrahiert .
Es wird nunmehr aus den extrahierten Signalen Ai234max und A4imax noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal Amax extrahiert. Mit Amax ergeben sich folgende fett bezeichnete Residualkorrekturen :
TpFL = (TpFL + 0.5 * TpSiL + Ax) - 0.5 * (TpSiL + 0.5 * TpC - 2 * A4) - 2 * Amax = (TpFL + 0.5 * TpFC + A4) - 0.5 * (TpFC + 0.5 *
Figure imgf000043_0001
TpFR = (TpFR + 0.5 * TpSiR + Ax) - 0.5 * (TpSiR + 0.5 * TpC - 2 * A2) - 2 * Amax = (TpFR + 0.5 * TpFC + A2) - 0.5 * (TpFC + 0.5
* TpC - 2 * Δι) - 2 * Amax
TpBR = (TpBR + 0.5 * TpBC + A2) - 0.5 * (TpBC + 0.5 * TpC - 2 * A3) - 2 * Amax = (TpBR + 0.5 * TpSiR + A3) - 0.5 * (TpSiR + 0.5
TpC - 2 * A2) - 2 * Amax TpBL = (TpBL + 0.5 * TpBC + A4) - 0.5 * (TpBC + 0.5* TpC - 2 * A3) - 2 * Amax = (TpBL + 0.5 * TpSiL + A3) - 0.5 * (TpSiL + 0.5
* TpC - 2 * A4) - 2 * Amax
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC - 2 * Δι) + 2 * Ama TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC - 2 * A2) + 2 * Δ, TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC - 2 * Δ3) + 2 * Amax TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC - 2 * Δ4) + 2 * Amax Dies führt gegenüber Signalen selbst mit Korrektur um den Mittelwert der Residuale Ai r Δ2, Δ3, Δ4 zu nochmals deutlich herabgesetzten Artefakten bzw. Verfärbungen der Klangfarbe und sonstigen Demaskierungseffekten, ohne dass der Mittelwert der Residuale Ai r Δ2, Δ3, Δ4, beispielweise von einem Encoder zu einem Decoder, übertragen werden muss. Somit ergibt sich eine drastische Reduzierung der Bandbreite.
Die Einwirkung von Amax auf das Gesamtsignal lässt sich über die Länge der benutzten diskreten Fourier-Transformation bzw. inversen diskreten Fourier-Transformation präzise steuern und stellt ein präzises Werkzeug zur Kontrolle der schlussendlichen Klangfarbe dar.
Ein NHK-22.2-Top-Layer-Signal lässt sich so hinsichtlich zu speichernder oder zu übertragenden Daten, beispielsweise zwischen einem Encoder und einem Decoder, im Sinne der FIG. 19 nochmals sehr deutlich bei deutlichstem Qualitätsgewinn reduzieren . Alternative autonome Residualbestimmungen:
Die Vorrichtungen zur autonomen Residualbestimmung sind in den Fig. 3, 4 und 7 durch eine gestrichelte Box dargestellt. In diesen Beispielen wird das autonom bestimmte Residual durch kaskadierte Anwendung von Korrelationsvergleichen von Signalpaaren bestimmt. Dadurch wird der gemeinsame bzw. der korrelierte Signalanteil aller Eingangssignale der Vorrichtung zu autonomen Residualbestimmung ermittelt. Alternativ ist es aber zur Bestimmung des autonomen Residuais auch möglich, jedes andere Verfahren zur Bestimmung des gemeinsamen bzw. korrelierten Signalanteils aller Eingangssignale der genannten Vorrichtung zu verwenden. So könnte zum Beispiel der in Fig. 1 vorgestellte Algorithmus auf drei oder mehr Signale erweitert werden. Um zum Beispiel den korrelierten Anteil in n Signalen zu bestimmen, werden die Vorzeichen der Signalanteile pro Frequenz der n Signale verglichen. Haben alle n Signalanteile dieser Frequenz das gleiche Vorzeichen, so wird der Signalanteil des Signal mit dem minimalen absoluten Signalanteil dieser Frequenz für den korrelierten Signalanteil dieser Frequenz gewählt. Andernfalls ist dieser Signalanteil gleich null. Dieses Verfahren wird vorzugsweise sowohl für den Realteil als auch für den Imaginärteil angewandt. Allerdings könnten noch viele andere Verfahren zur Bestimmung des gemeinsamen bzw. korrelierten Signalanteils verwendet werden, um das Residual der Eingangssignale autonom zu bestimmen.
Ein Ausführungsbeispiel stellt somit die kaskadierte Bestimmung des korrelierten Signals der Eingangssignale. Die kaskadierte Bestimmung weist dabei zumindest die Bestimmung eines ersten korrelierte Signals eines ersten Signalpaars der Eingangssignale und zumindest einer weiteren Bestimmung eines zweiten korrelierten Signals aus einem Signalpaar aufweisend ein auf dem erstem korrelierten Signal basierendes Signal und ein auf einem dritten Eingangssignal basierenden Signal auf.
Ein weiteres Ausführungsbeispiel betrifft alle anderen Methoden zur Bestimmung des korrelierten Signals der Eingangssignale, d.h. diejenigen Methoden, die keine kaskadierte Bestimmung des korrelierten Signals der Eingangssignale aufweisen.
Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein NHK-22.2-Top-Layer-Signal (siehe FIG. 5 bis 10) : Sämtliche Operationen führen zu Signalen, welche sowohl die in der Tabelle zu FIG. 6 enthaltenen Grundsignale als auch die genannten Residuale enthalten. Diese sollen gezielt durch die oben beschriebene zusätzliche autonome Residualbestimmung in Kombination mit algebraischen Überlegungen gemäss FIG. 5 bzw. der FIG. 6 zugehörigen Tabelle eliminiert werden.
Sowohl 0.25 * (TpC - Δ5) als auch 0.25 * (TpC - Δ6) werden analog zum vorhergehenden Abschnitt mit 2 multipliziert und mit jeweils 2 * A56max addiert. Beide resultierenden Signale werden nunmehr summiert.
Von dieser Summe wird nunmehr die Summe der oben gewonnenen Signale
TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC 2 * Δ2) + 2 * Δ ',max und
TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC 2 * Δ4) + 2 * Δ ',max bzw. die Summe der oben gewonnenen Signale
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC 2 * Δι) + 2 * Δ ',max und
TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC 2 * Δ3) + 2 * Δ ',max subtrahiert. Es ergeben sich die Signale
- TpSiL - r' (TpSiL) - TpSiR - r' (TpSiR) bzw .
-TpFC - r' (TpFC) - TpBC - r' (TpBC) , welche, mit dem Faktor 0.5 multipliziert, nunmehr summiert werden .
Es werden nunmehr die im vorangehenden Abschnitt gebildeten Signale
TpFC + 0.5 * TpC = (TpFC + 0.5 * TpC - 2 * Δι) + 2 * Amax TpSiR + 0.5 * TpC = (TpSiR + 0.5 * TpC - 2 * Δ2) + 2 * Amax TpBC + 0.5 * TpC = (TpBC + 0.5 * TpC - 2 * Δ3) + 2 * Amax
TpSiL + 0.5 * TpC = (TpSiL + 0.5 * TpC - 2 * Δ4) + 2 * Amax mit dem Faktor 0.5 multipliziert und ebenfalls addiert.
Die Addition der beiden letztgenannten Summen ergibt das gesuchte TpC-Signal mit minimierten primären Residualen
TpC - 2 * r' (TpFl)- 2 * r'T(TpFR) - 2 * r ' (TpBL) - 2 * r' (TpBR) - 2 * r' (0.5 * TpFC) - 2 * r' (0.5 * TpSiR)
- 2 * r' (0.5 * TpBC - 2 * r' (0.5 * TpSiL), welches sich nach Multiplikation mit dem Faktor 0.5 von obigen Formeln so abziehen lässt, dass sich TpFC, TpSiR, TpBC und TpSiL nicht nur in ausgezeichneter Näherung abbilden, sondern zusätzlich gemeinsam mit dem gebildeten TpC eine ideale
Residualmaskierung gemäss dem Überlegungen der FIG. 8 bis 10, siehe oben, ergibt. „
46
Anwendung der residualarmen algebraischen Extraktion eines TpC-Signals auf ein Auro-11.1-Signal (siehe FIG. 11 bis 15):
Gleiche Überlegungen können auch für die sogenannten Auro- Formate des Instituts für Rundfunktechnik (IRT) gelten.
Für das Top-Layer-Signal ergibt sich dabei folgender Downmix:
TpFL' = TpFL + 0.5 * TpFC + 0.5 * TpC
TpFR' = TpFR + 0.5 * TpFC + 0.5 * TpC
TpBL' = TpBL + 0.5 * TpC TpBR' = TpBR + 0.5 * TpC
Für die Korrelationsvergleiche 1 und 2 der Fig. 11 ist eine Korrektur um deren autonomes Residual möglich. Im Decoder wird durch Korrelationsvergleich von TpFL' und TpFR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr die Summe von TpFC und TpC gemäss der FIG. 12 zugehörigen Tabelle mit -6dB extrahiert.
In der Fig. 12 zeigen die Faktoren 1 oder 0.5 die Faktoren für die jeweils beim Korrelationsvergleich 1 bis 3 auftretenden Kanäle. r stellt das beim Korrelationsvergleich 1 bis 3 auftretenden Residual dar. Somit ist die Tabelle so zu lesen, dass das Ergebnis für Korrelationsvergleich 3 sich beispielsweise wie folgt liest: 0.5 * TpC - r (TpFL) - r ( TpFR) + 0.5 * TpFC - r (0.5 * TpFC) .
Ebenso wird im Decoder durch Korrelationsvergleich von TpFL' und TpBR' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr das TpC-Signal gemäss der FIG. 12 zugehörigen Tabelle mit ebenfalls -6dB extrahiert.
Ebenso wird im Decoder durch Korrelationsvergleich von TpFR' und TpBL' gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr das TpC-Signal gemäss der FIG. 12 zugehörigen Tabelle mit ebenfalls -6dB extrahiert.
Es wird nunmehr aus den extrahierten TpC-Signalen noch vor Durchführung einer inversen Fourier-Transformation durch Korrelationsvergleich gemäss der Regeln zur Gewinnung der Real- und Imaginärteile von Signalen, siehe Einleitung zur Offenbarung der Erfindung, nunmehr ein Signal -Amax extrahiert.
Es wird nunmehr eine Residualkorrektur vorgenommen, indem jeweils 2*Amax mit einem beiden extrahierten verdoppelten TpC- Signale addiert.
In einem weiteren Schritt wird das TpC-Signal in guter Näherung durch einfache Addition der Resultate errechnet bei anschliessender Multiplikation mit 0.5. Wird nun die Hälfte des Resultats vom durch Korrelationsvergleich ermittelten TpFC abgezogen, lässt sich eine hervorragende Residualmaskierung mit folgender Pegelkorrektur erzielen: Das TpFC-Signal wird um -3dB abgesenkt. Es ergibt sich somit eine ideale Maskierung; dies insbesondere, sofern entweder eine erhöhte Auflösung der für die Bestimmung von -Amax verwandten diskreten Fourier-Transformation gewählt wird, oder durch deren Gegenteil, nämlich eine diskreten Fourier- „
48
Transformation, aufgrund von deren Dimension deren harmonische Frequenzen deutlich unterhalb den hochfrequenten Signalanteile liegen. Im zweiteren Fall liegt ein ähnliches Vorgehen wie beim Mittelwert aller Residuale vor. Somit lässt sich beispielsweise durch die Länge einer Fast Fourier Transform (FFT) präzise das Signalverhalten steuern.
Im Folgenden sollen verschiedene Ausführungsbeispiele zum Dekodieren und zum Kodieren des TpC Signals vorgestellt werden:
1. Verfahren zum Dekodieren eines Audiomultikanalsignals aus einem Audiodownmixsignal , wobei das Audiodownmixsignal einen vorderen rechten Kanal (TpFR) , einen vorderen linken Kanal (TpFL) , einen hinteren linken Kanal (TpBL) und einen hinteren rechten Kanal (TpBR) aufweist, wobei das Verfahren die folgenden Schritte aufweist;
Durchführen eines ersten Korrelationsvergleichs zwischen dem vorderen linken Kanal (TpFL) und dem
hinteren rechten Kanal (TpBR) ;
Durchführen eines zweiten Korrelationsvergleichs zwischen dem vorderen rechten Kanal (TpFR) und dem hinteren linken Kanal (TpBR) ;
Bestimmen eines oberen zentralen Kanals (TpC) auf der Basis des ersten Korrelationsvergleichs und des zweiten
Korrelationsvergleichs .
2. Verfahren nach Ausführungsbeispiel 1, wobei der obere
zentrale Kanal (TpC) auf der Basis der Summe der Ausgabe des ersten Korrelationsvergleichs und des zweiten
Korrelationsvergleichs bestimmt wird.
3. Verfahren nach Ausführungsbeispiel 1 oder 2, wobei der obere zentrale Kanal (TpC) auf der Basis des ersten
Korrelationsvergleichs und des zweiten „
49
Korrelationsvergleichs und auf der Basis eines
Residualsignals des oberen zentralen Kanals bestimmt wird . 4. Verfahren nach Ausführungsbeispiel 3, wobei der obere zentrale Kanal (TpC) auf der Basis der Subtraktion des Residualsignals des oberen zentralen Kanals von der Summe der Ausgabe des ersten Korrelationsvergleichs und des zweiten Korrelationsvergleichs bestimmt wird.
5. Verfahren nach Ausführungsbeispiel 3 oder 4, wobei das Residualsignal des oberen zentralen Kanals durch
Korrelationsvergleich der Ausgabe des ersten
Korrelationsvergleichs und des zweiten
Korrelationsvergleichs bestimmt wird.
6. Verfahren nach einem der Ausführungsbeispiele 1 bis 5, wobei ein vorderer zentraler Kanal (TpFC) des
Audiomultikanalsignals durch Korrelationsvergleich des vorderen rechten Kanals (TpFR) und des vorderen linken
Kanals (TpFL) des Audiodownmixsignals bestimmt wird, wobei der bestimmte vordere zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird. 7. Verfahren nach einem der Ausführungsbeispiele 1 bis 6, wobei ein hinterer zentraler Kanal (TpBC) des
Audiomultikanalsignals durch Korrelationsvergleich des hinteren rechten Kanals (TpBR) und des hinteren linken Kanals (TpBL) des Audiodownmixsignals bestimmt wird, wobei der bestimmte hintere zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird.
Verfahren nach einem der Ausführungsbeispiele 1 bis 7, wobei
ein rechter zentraler Kanal (TpSiR) des
Audiomultikanalsignals durch Korrelationsvergleich des ^ vorderen rechten Kanals (TpFR) und des hinteren rechten Kanals (TpBR) des Audiodownmixsignals bestimmt wird, wobei der bestimmte rechte zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird, und/oder
ein linker zentraler Kanal (TpSiL) des
Audiomultikanalsignals durch Korrelationsvergleich des vorderen linken Kanals (TpFL) und des hinteren linken Kanals (TpBL) des Audiodownmixsignals bestimmt wird, wobei der seitliche linke zentrale Kanal durch den bestimmten oberen zentralen Kanal korrigiert wird. Verfahren nach einem der Ausführungsbeispiele 6 bis 8, wobei der vordere linke Kanal des
Audiomultikanalsignals auf der Basis des vorderen linken
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird, und
wobei der vordere rechte Kanal des
Audiomultikanalsignals auf der Basis des vorderen rechten
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird
wobei der hintere linke Kanal des
Audiomultikanalsignals auf der Basis des hinteren linken
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird, und
wobei der hintere rechte Kanal des
Audiomultikanalsignals auf der Basis des hinteren rechten
Kanals des Audiodownmixsignals und eines benachbarten, aus dem Audiodownmixsignal abgeleiteten zentralen Kanals bestimmt wird. „
51
Verfahren nach Ausführungsbeispiel 9, wobei der rechte zentrale Kanal (TpSiR) , der linke zentrale Kanal (TpSiL) , der vordere zentrale Kanal (TpFC) und der hintere
zentrale Kanal (TpBC) des Audiomultikanalsignals durch ein gemeinsames Residualsignal dieser Kanäle korrigiert wird .
Verfahren nach Ausführungsbeispiel 10, wobei das
gemeinsame Residualsignal durch kaskadierte paarweise Korrelationsvergleiche von nicht aus denselben
Korrelationsvergleichen abgeleiteten Kanälen des
Audiomultikanalsignals bestimmt wird.
Verfahren nach Ausführungsbeispiel 10, wobei das
gemeinsame Residualsignal mit dem Audiodownmixsignal erhalten wird.
Verfahren nach einem der Ausführungsbeispiele 6 bis 8, wobei die Korrektur durch den oberen zentralen Kanal durch Subtraktion des oberen zentralen Kanals geschieht
Verfahren nach einem der Ausführungsbeispiele 1 bis 13, wobei ein erster Korrelationsvergleich des vorderen linken Kanals (TpFL) des Audiodownmixsignals und des vorderen rechten Kanals (TpFR) des Audiodownmixsignals ausgeführt wird,
wobei ein zweiter Korrelationsvergleich des vorderen rechten Kanals (TpFR) des Audiodownmixsignals und des hinteren rechten Kanals (TpBR) des Audiodownmixsignals ausgeführt wird,
wobei ein dritter Korrelationsvergleich des hinteren rechten Kanals (TpBR) des Audiodownmixsignals und des hinteren linken Kanals (TpBL) des Audiodownmixsignals ausgeführt wird,
wobei ein vierter Korrelationsvergleich des vorderen __ 2 linken Kanals (TpFL) des Audiodownmixsignals und des hinteren linken Kanals (TpBL) des Audiodownmixsignals ausgeführt wird,
wobei die Resultate des ersten und dritten
Korrelationsvergleichs summiert werden und die Resultate des zweiten und vierten Korrelationsvergleichs summiert werden . Verfahren nach einem der Ausführungsbeispiele 1 bis 14, wobei ein Korrelationsvergleich den korrelierten Anteil des verglichenen Signalpaars ausgibt. Verfahren nach einem der Ausführungsbeispiele 1 bis 15, wobei die mindestens drei Eingangssignale in einer
Frequenzraumdarstellung vorliegen und/oder das gemeinsame Residualsignal in einer Frequenzraumdarstellung
ausgegeben wird. Verfahren nach einem der Ausführungsbeispiele 1 bis 16, wobei ein Korrelationsvergleich den Vergleich der
Vorzeichen der Frequenzkomponenten der beiden
verglichenen Signale aufweist. Computerprogramm ausgebildet bei Ausführung auf einem Prozessor, das Verfahren nach einem der
Ausführungsbeispiele 1 bis 17 auszuführen. Dekodiervorrichtung zum Dekodieren eines
Audiomultikanalsignals aus einem Audiodownmixsignals, wobei das Audiodownmixsignal einen vorderen rechten Kanal
(TpFR) , einen vorderen linken Kanal (TpFL) , einen
hinteren linken Kanal (TpBL) und einen hinteren rechten Kanal (TpBR) aufweist, aufweisend;
eine erste Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zwischen dem vorderen linken Kanal (TpFL) und dem hinteren rechten ^
Kanal (TpBR) ;
eine zweite Korrelationsvergleichsvorrichtung zum Durchführen eines Korrelationsvergleichs zwischen dem vorderen rechten Kanal (TpFR) und dem hinteren linken Kanal (TpBL) ;
Ausgabevorrichtung zum Bestimmen eines oberen zentralen Kanals (TpC) auf der Basis des ersten
Korrelationsvergleichs und des zweiten
Korrelationsvergleichs .
Im Folgenden sollen verschiedene Ausführungsbeispiele Bestimmen eines autonomen Residuais vorgestellt werden:
Verfahren zur Bestimmung eines gemeinsamen
Residualsignals aus mindestens drei Eingangssignalen:
Durchführen eines ersten Korrelationsvergleichs zwischen einem ersten Eingangssignal und einem zweiten Eingangssignal ;
Durchführen eines zweiten Korrelationsvergleichs zwischen einem auf einem aus dem ersten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem dritten Eingangssignal
basierenden Signal;
Bestimmen des gemeinsamen Residualsignals auf der Basis des aus dem zweiten Korrelationsvergleichs
ausgegebenen Signals.
2. Verfahren nach dem vorherigen Ausführungsbeispiel, wobei die Bestimmung des ersten und/oder des zweiten
Korrelationsvergleichs den korrelierten Anteil, den ersten individuellen Anteil oder den zweiten
individuellen Anteil des verglichenen Signalpaars ausgibt . Verfahren nach einem der vorherigen Ausführungsbeispiele, wobei die mindestens drei Eingangssignale in einer
Frequenzraumdarstellung vorliegen und/oder das gemeinsame Residualsignal in einer Frequenzraumdarstellung
ausgegeben wird. Verfahren nach einem der vorherigen Ausführungsbeispiele, wobei die Bestimmung des ersten und/oder des zweiten Korrelationsvergleichs den Vergleich der Vorzeichen der Frequenzkomponenten der beiden verglichenen Signale aufweist .
Verfahren zum Dekodieren eines Multikanalsignals aus einem Downmixsignal :
Durchführen eines ersten Korrelationsvergleichs zwischen einem ersten Kanal und einem zweiten Kanal des Downmixsignals ;
Durchführen eines zweiten Korrelationsvergleichs zwischen einem auf einem aus dem ersten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf einem dritten Kanal des
Downmixsignals basierenden Signal;
Bestimmen eines Korrektursignals auf der Basis des aus dem zweiten Korrelationsvergleichs ausgegebenen
Signals ;
Bestimmen eines ersten Kanals, eines zweiten Kanals und eines dritten Kanals des Multikanalsignals auf der Basis des ersten Kanals, des zweiten Kanals und des dritten Kanals des Downmixsignals;
Bestimmen eines ersten zusätzlichen Kanals des
Multikanalsignals auf der Basis des ersten
Korrelationsvergleichs oder auf der Basis eines weiteren Korrelationsvergleichs zwischen einem Kanalpaar des
Downmixsignals ;
Korrigieren zumindest eines des ersten Kanals, des zweiten Kanals, des dritten Kanals oder des weiteren Kanals des Multikanalsignals auf der Basis des
Korrektursignals . 6. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen Kanals des Multikanalsignals auf der Basis des dritten Korrelationsvergleichs;
Durchführen eines vierten Korrelationsvergleichs zwischen dem ersten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des vierten Korrelationsvergleichs;
Korrigieren des zweiten zusätzlichen Kanals und des dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des Korrektursignals. 7. Verfahren nach Ausführungsbeispiel 5 oder 6, wobei der zweite Korrelationsvergleich zwischen dem auf einem aus dem ersten Korrelationsvergleich ausgegebenen Signals basierenden Signal und einem auf einem aus dem dritten oder vierten Korrelationsvergleich ausgegebenen Signals basierenden Signal durchgeführt wird.
8. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen
Kanals des Multikanalsignals auf der Basis des dritten Korrelationsvergleichs ;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen
Kanals des Multikanalsignals auf der Basis des vierten -
56
Korrelations ergleichs ;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des
Downmixsignals und Bestimmen eines vierten zusätzlichen Kanals des Multikanalsignals auf der Basis des fünften KorrelationsVergleichs ;
Durchführen eines sechsten Korrelationsvergleichs zwischen einem auf einem aus dem zweiten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem dritten Kanal des Downmixsignals basierenden Signals;
Durchführen eines siebten Korrelationsvergleichs zwischen einem auf einem aus dem sechsten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf dem vierten Kanal des Downmixsignals basierenden Signals;
Bestimmen eines Korrektursignals auf der Basis des aus dem siebten Korrelationsvergleich ausgegebenen
Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals.
Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen eines zweiten zusätzlichen Kanals des Multikanalsignals auf der Basis des dritten KorrelationsVergleichs ;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals und Bestimmen eines dritten zusätzlichen Kanals des Multikanalsignals auf der Basis des vierten KorrelationsVergleichs ;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des ^
Downmixsignals und Bestimmen eines vierten zusätzlichen Kanals des Multikanalsignals auf der Basis des fünften Korrelations ergleichs ;
Durchführen eines sechsten Korrelationsvergleichs zwischen einem auf einem aus dem vierten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und aus dem fünften Korrelationsvergleich
ausgegebenen Signal basierenden Signal;
Durchführen eines siebten Korrelationsvergleichs zwischen einem auf einem aus dem zweiten
Korrelationsvergleich ausgegebenen Signal basierenden Signal und einem auf einem aus dem sechsten
Korrelationsvergleich ausgegebenen Signal basierenden Signal ;
Bestimmen eines Korrektursignals auf der Basis des aus dem siebten Korrelationsvergleich ausgegebenen
Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals. Verfahren nach Ausführungsbeispiel 5, wobei zwei Kanäle des Multikanalsignals aus dem ersten
Korrelationsvergleich bestimmt werden, das Verfahren weiter aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem zweiten Kanal und dem dritten Kanal des Downmixsignals und Bestimmen zweier Kanäle des
Multikanalsignals aus dem dritten Korrelationsvergleich;
Durchführen eines vierten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des
Downmixsignals und Bestimmen zweier Kanäle des
Multikanalsignals aus dem vierten Korrelationsvergleich;
Durchführen eines fünften Korrelationsvergleichs zwischen dem ersten Kanal und dem vierten Kanal des Downmixsignals und Bestimmen zweier Kanäle des Multikanalsignals aus dem fünften Korrelationsvergleich;
Durchführen eines sechsten, siebten, achten und neunten Korrelationsvergleichs zwischen zwei Kanälen des Multikanalsignals, die nicht aus dem gleichen
Korrelationsvergleich bestimmt wurden;
Durchführen kaskadierter Korrelationsvergleiche zwischen Signalpaaren, die auf den vier Signalen, die aus dem sechsten, siebten, achten und neunten
Korrelationsvergleich ausgegebenen wurden, basieren, und Ausgeben eines Signals aus dem kaskadierten
Korrelationsvergleichen;
Bestimmen eines Korrektursignals auf der Basis des aus dem kaskadierten Korrelationsvergleich ausgegebenen Signal ;
Korrigieren der zusätzlichen Kanäle des
Multikanalsignals auf der Basis des Korrektursignals.
11. Verfahren nach einem der Ausführungsbeispiele 5 bis 10, wobei eine Anzahl von Kanälen des Downmixsignals durch kaskadierte Korrelationsvergleiche verglichen werden, wobei das Ausgangssignal der kaskadierten
Korrelationsvergleiche zur Bestimmung des
Korrektursignals dient. 12. Verfahren nach Ausführungsbeispiel 5, aufweisend
Durchführen eines dritten Korrelationsvergleichs zwischen dem dritten Kanal und einem vierten Kanal des Downmixsignals, wobei der erste zusätzliche Kanal des Multikanalsignals auf der Basis des ersten
Korrelationsvergleichs und des dritten
Korrelationsvergleichs bestimmt wird, und wobei der zweite Korrelationsvergleich zwischen einem auf einem aus dem ersten Korrelationsvergleich ausgegebenen Signal basierenden Signal und dem auf dem aus dem dritten
Korrelationsvergleich ausgegebenen Signal basierenden ^
Signal durchgeführt wird;
Korrigieren des ersten zusätzlichen Kanals des Multikanalsignals auf der Basis des Korrektursignals. 13. Verfahren nach einem der Ausführungsbeispiele 5 bis 12, wobei die ein zusätzlicher Kanal durch die zweifache Subtraktion des Korrektursignals durchgeführt wird.
14. Verfahren nach einem der Ausführungsbeispiele 5 bis 13, aufweisend Transformieren der Kanäle des Downmixsignals in den Frequenzraum vor der Durchführung der
Korrelationsvergleiche .
15. Verfahren nach Ausführungsbeispiel 14, wobei das
Dekodierverfahren ein kanalabhängig einstellbares erstes
Profil für hochfrequente Kanäle und ein zweites Profil für niedrigfrequente Kanäle aufweist, wobei mit dem ersten Profil die Samplingrate im Frequenzraum durch Zeropadding im Vergleich zu dem zweiten Profil erhöht wird oder mit dem zweiten Profil die Samplingrate für die
Transformation in den Frequenzraum niedriger als die Samplingrate des entsprechenden Kanals des Downmixsignals gewählt wird. 16. Verfahren zur Bestimmung eines gemeinsamen
Residualsignals mindestens dreier Eingangssignale, gekennzeichnet durch die Bestimmung des gemeinsamen
Residualsignals durch die Bestimmung der gemeinsamen Signalanteile der mindestens drei Eingangssignale.
17. Verfahren nach Ausführungsbeispiel 16, wobei die
Bestimmung des ersten und/oder des zweiten
Korrelationsvergleichs den Vergleich der Vorzeichen der Frequenzkomponenten der beiden verglichenen Signale aufweist. r n
60
18. Verfahren nach Ausführungsbeispiel 16 oder 17, wobei die gemeinsamen Signalanteile der mindestens drei
Eingangssignale den Vergleich der Vorzeichen der
Frequenzkomponenten der Eingangssignale aufweist.
19. Verfahren nach einem der Ausführungsbeispiele 16 bis 18, wobei ein Realteil und/oder ein Imaginärteil einer
Frequenzkomponente des Signals der gemeinsamen
Signalanteile der mindestens drei Eingangssignale als der Realteil und/oder der Imaginärteil der entsprechenden
Frequenzkomponente eines der mindestens drei
Eingangssignale bestimmt wird, welches den minimalen Absolutwert des Realteils und/oder des Imaginärteils beträgt, wenn alle Vorzeichen der Realteile und/oder der Imaginärteile der entsprechenden Frequenzkomponente der der mindestens drei Eingangssignale gleich sind.
20. Verfahren nach einem der vorherigen Anspruch, wobei
zumindest eines der Eingangssignale oder ein daraus gebildetes Signal durch das gemeinsame Residual
korrigiert wird.
21. Computerprogram ausgebildet bei Ausführung auf einem
Prozessor das Verfahren nach Ausführungsbeispielen 1 bis 15 auszuführen.
Schlussbemerkungen
Insgesamt dargestellte Prinzipien sind algorithmisch beliebig erweiterbar und sind nicht auf die effiziente Komprimierung von Multisignalen beliebiger, ja selbst höchster, Ordnung, dies zum Zwecke der effizienten Speicherung oder Übertragung, beispielsweise zwischen einem Encoder und einem Decoder, beschränkt . „„
61
Vorliegende Systeme zur Bestimmung zumindest eines gemeinsamen Signals und/oder eines ersten Individualsignals und/oder eines zweiten Individualsignals aus zwei Eingangssignalen als auch im Besonderen die autonome Residualbestimmung können grundsätzlich in Zusammenhang mit Anwendungen beliebiger Natur mit Fourier-Transformationen oder inversen Fourier- Transformationen angewandt werden. Diese Anwendungen verstehen sich grundsätzlich als in der vorliegenden Erfindung mit eingeschlossen .
Alternativ könnte jedes andere Verfahren zur Bestimmung eines gemeinsamen Signals, eines ersten Individualsignals und eines zweiten Individualsignals aus zwei Eingangssignalen verwendet werden .
Des Weiteren soll hier auch die Speicherung und/oder Übertragung von Daten (z.B. eine Datei oder andere Speichermittel oder Übertragungsmittel) mit einem
Downmixsignal/Summensignal und/oder mit einem gemittelten oder autonom bestimmten Residual oder mit einem aus mehreren Residualen gemittelten Residual offenbart sein.
Ein Multikanalsignal mit n Kanälen kann wiederum ein weiteres Multikanalsignal mit n-l>2 Kanälen, ein weiteres Multikanalsignal mit n-2>2 Kanälen etc. enthalten.
Umgekehrt kann aus einem Multikanalsignal mit n>2 oder n-l>2 oder n-2>2 etc. Kanälen wiederum ein weiteres Multikanalsignal höherer Ordnung abgeleitet werden.
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH00743/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH00743/14 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der r
62
Ansprüche fallen, sowohl positiv als Ausführungsbeispiel der Erfindung als auch negativ als Disclaimer der Erfindung offenbart sind. Das heisst, der durch die Patentansprüche abgedeckte Schutzbereich kann aufgeteilt werden in die/den in CH00743/14 offenbarte Ausführungsbeispiele und die durch den gewährten Schutzbereich abzüglich der in CH00743/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden
Ausführungsbeispiele/verbleibenden Schutzbereich .
Sollte die durch die Ansprüche geschützte Erfindung Ausführungsbeispiele/Schutzbereiche der unveröffentlichten CH0369/14 aufweisen, so sei hiermit durch Referenz explizit offenbart, dass alle in CH0369/14 offenbarten Ausführungsbeispiele, die unter den Schutzbereich der Ansprüche fallen, sowohl positiv als Ausführungsbeispiel der Erfindung als auch negativ als Disclaimer der Erfindung offenbart sind. Das heisst, der durch die Patentansprüche abgedeckte Schutzbereich kann aufgeteilt werden in die in CH0369/14 offenbarte Ausführungsbeispiele und die/den durch den gewährten Schutzbereich abzüglich der in CH0369/14 offenbarten Ausführungsbeispiele (einzeln, alle zusammen oder in jeder Kombination) verbleibenden
Ausführungsbeispiele/verbleibenden Schutzbereich .

Claims

PATENTA S PRÜCHE
Verfahren zum Dekodieren oder Upmixen eines Upmixsignals mit zumindest fünf Kanäle aus einem Downmixsignal mit zumindest drei Kanälen:
Durchführen zumindest zweier Korrelationsvergleiche zwischen zumindest zwei Kanalpaaren der zumindest drei Kanäle des Downmixsignals , wobei jeder
Korrelationsvergleich eines der zumindest zwei Kanalpaare zumindest ein Korrelationsvergleichssignal ergibt, wobei das zumindest eine Korrelationsvergleichssignal eines der zumindest zwei Kanalpaare ein gemeinsames Signal eines der Kanalpaare und/oder ein erstes individuelles Signal eines der Kanalpaare und/oder ein zweites individuelles Signal eines der Kanalpaare aufweist, wobei das
gemeinsame Signal eines der zumindest zwei Kanalpaare die gemeinsamen Signalanteile dieses Kanalpaars enthält und/oder das erste individuelle Signal eines der
zumindest zwei Kanalpaare die dem ersten Kanal des
Kanalpaars spezifischen Signalanteile enthält und/oder das zweite individuelle Signal eines der zumindest zwei Kanalpaare die dem zweiten Kanal des Kanalpaars
spezifischen Signalanteile enthält;
Bestimmen eines gemeinsamen Residualsignals auf der Basis der gemeinsamen Signalanteile der
Korrelationsvergleichssignale der zumindest zwei
Kanalpaare ;
Korrigieren zumindest eines der
Korrelationsvergleichssignale oder eines daraus
gebildeten Signals auf der Basis des gemeinsamen
Residualsignals .
Verfahren nach Anspruch 1, wobei für die Bestimmung des gemeinsamen Residualsignals die gemeinsamen Signalanteil einer Menge der Korrelationsvergleichssignale verwendet werden, die ein Korrelationsvergleichssignal eines jeden Korrelationsvergleichs der zumindest zwei
Korrelationsvergleiche aufweist. 3. Verfahren nach Anspruch 1 oder 2, wobei die für die
Bestimmung des gemeinsamen Residualsignals verwendeten KorrelationsVergleichssignale
nur erste und/oder zweite individuelle Signale der Kanalpaare gleichen Gewichts oder
nur gemeinsame Signale der Kanalpaare gleichen
Gewichts oder
sowohl zumindest ein individuelles Signal als auch zumindest ein gemeinsames Signal enthalten, wobei im Falle, dass die Korrelationsvergleichssignale sowohl zumindest ein individuelles Signal als auch zumindest ein gemeinsames Signal enthalten, jedes des zumindest einen gemeinsamen Signals relativ zu jedem zumindest einen individuellen Signal mit einem negativen Faktor,
vorzugsweise minus einhalb, gewichtet ist.
4. Verfahren nach einem der Ansprüche 1 bis 3, wobei die
Bestimmung der gemeinsamen Signalanteile der
Korrelationsvergleichssignale den Vergleich der
Vorzeichen der Frequenzkomponenten der
Korrelationsvergleichssignale aufweist.
5. Verfahren nach Anspruch 4, wobei ein Realteil und/oder ein Imaginärteil einer Frequenzkomponente des Signals der gemeinsamen Signalanteile der mindestens drei
Eingangssignale als der Realteil und/oder der
Imaginärteil der entsprechenden Frequenzkomponente eines der mindestens drei Eingangssignale bestimmt wird, welches den minimalen Absolutwert des Realteils und/oder des Imaginärteils beträgt, wenn alle Vorzeichen der
Realteile und/oder der Imaginärteile der entsprechenden Frequenzkomponente der der mindestens drei
Eingangssignale gleich sind.
6. Verfahren nach einem der Ansprüche 1 bis 5, wobei die Bestimmung der gemeinsamen Signalanteile der
Korrelationsvergleichssignale zumindest einen
Korrelationsvergleich oder eine Hintereinanderschaltung von mindestens zwei Korrelationsvergleichen aufweist.
7. Verfahren nach einem der Ansprüche 1 bis 6, wobei die gemeinsamen Signale durch das gemeinsame Residualsignal korrigiert werden.
8. Verfahren nach Anspruch 7, wobei jedes gemeinsame Signal durch die Addition des gemeinsamen Residualsignals oder durch die Addition des mit einem Faktor, vorzugsweise zwei, multiplizierten gemeinsamen Residualsignals korrigiert wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, wobei
zumindest eines der individuellen Signale durch das gemeinsame Signal des Korrelationsvergleichs korrigiert wird, dessen Kanalpaar auch zur Bestimmung des
entsprechenden individuellen Signals verwendet werden kann .
10. Verfahren nach Anspruch 9, wobei
entweder die zur Korrektur verwendeten gemeinsamen Signale bereits durch das gemeinsame Residualsignal korrigiert sind,
oder die individuellen Signale zusätzlich durch das gemeinsame Residual korrigiert werden.
11. Verfahren nach einem der Ansprüche 1 bis 10, wobei
zumindest zwei Kanäle des Upmixsignals auf der Basis der gemeinsamen Signale und des gemeinsamen
Residualsignals bestimmt werden, und/oder zumindest drei Kanäle des Upmixsignals auf der Basis der individuellen Signale und des gemeinsamen
Residualsignals bestimmt werden.
12. Verfahren nach einem der Ansprüche 1 bis 11,
wobei das Upmixsignal acht Kanäle und das
Downmixsignal vier Kanäle aufweist,
wobei vier Korrelationsvergleiche zwischen den vier jeweils benachbarten Kanalpaaren durchgeführt werden, die die acht Korrelationsvergleichssignale mit vier
gemeinsamen Signalen und vier individuellen Signalen ergeben,
wobei das gemeinsame Residualsignal auf der Basis der gemeinsamen Signalanteile von vier der acht
Korrelationsvergleichssignalen ausgegeben von den vier Korrelationsvergleichen ermittelt wird,
wobei die acht Kanäle des Upmixsignals auf der Basis der acht Korrelationsvergleichssignale und dem
gemeinsamen Residualsignal bestimmt werden.
13. Verfahren nach Anspruch 12, wobei
vier Mittenkanäle des Upmixsignals auf der Basis der vier gemeinsamen Signale und dem gemeinsamen
Residualsignal bestimmt werden, und/oder
vier Seitenkanäle des Upmixsignals auf der Basis der vier individuellen Signale, der vier Mittenkanäle und dem gemeinsamen Residualsignal bestimmt werden.
14. Computerprogram ausgebildet bei Ausführung auf einem
Prozessor das Verfahren nach Ansprüchen 1 bis 13
aus zuführen .
15. Dekodiervorrichtung zum Dekodieren oder Upmixen eines Upmixsignals aus einem Downmixsignal:
eine Korrelationsvergleichsvorrichtung zum
Durchführen zumindest zweier Korrelationsvergleiche zwischen zumindest zwei Kanalpaaren der zumindest drei Kanäle des Downmixsignals , wobei jeder
Korrelationsvergleich eines der zumindest zwei Kanalpaare zumindest ein Korrelationsvergleichssignal ergibt, wobei das zumindest eine Korrelationsvergleichssignal eines der zumindest zwei Kanalpaare ein gemeinsames Signal eines der Kanalpaare und/oder ein erstes individuelles Signal eines der Kanalpaare und/oder ein zweites individuelles Signal eines der Kanalpaare aufweist, wobei das
gemeinsame Signal eines der zumindest zwei Kanalpaare die gemeinsamen Signalanteile dieses Kanalpaars enthält und/oder das erste individuelle Signal eines der
zumindest zwei Kanalpaare die dem ersten Kanal des
Kanalpaars spezifischen Signalanteile enthält und/oder das zweite individuelle Signal eines der zumindest zwei Kanalpaare die dem zweiten Kanal des Kanalpaars
spezifischen Signalanteile enthält;
Residualbestimmungsvorrichtung zum Bestimmen eines gemeinsamen Residualsignals auf der Basis der gemeinsamen Signalanteile der Korrelationsvergleichssignale der zumindest zwei Kanalpaare; und
Korrektursignalvorrichtung zum Korrigieren zumindest eines der Korrelationsvergleichssignale oder eines daraus gebildeten Signals auf der Basis des gemeinsamen Signals.
PCT/EP2015/053931 2014-02-28 2015-02-25 Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen WO2015128376A1 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CH3692014 2014-02-28
CH369/14 2014-02-28
CH00997/14A CH709272A2 (de) 2014-02-28 2014-07-01 Autonome Residualbestimmung und Gewinnung von residualarmen Zusatzsignalen.
CH997/14 2014-07-01

Publications (1)

Publication Number Publication Date
WO2015128376A1 true WO2015128376A1 (de) 2015-09-03

Family

ID=53937973

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2015/053931 WO2015128376A1 (de) 2014-02-28 2015-02-25 Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen

Country Status (2)

Country Link
CH (1) CH709272A2 (de)
WO (1) WO2015128376A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
EP3937515A1 (de) 2020-07-06 2022-01-12 Clemens Par Invarianzgesteuerter elektroakustischer übertrager

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013111034A2 (en) * 2012-01-23 2013-08-01 Koninklijke Philips N.V. Audio rendering system and method therefor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013111034A2 (en) * 2012-01-23 2013-08-01 Koninklijke Philips N.V. Audio rendering system and method therefor

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IKHWANA ELFITRI ET AL: "Multichannel Audio Coding Based on Analysis by Synthesis", PROCEEDINGS OF THE IEEE, IEEE. NEW YORK, US, vol. 99, no. 4, 1 April 2011 (2011-04-01), pages 657 - 670, XP011363629, ISSN: 0018-9219, DOI: 10.1109/JPROC.2010.2102310 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
EP3937515A1 (de) 2020-07-06 2022-01-12 Clemens Par Invarianzgesteuerter elektroakustischer übertrager
WO2022008092A1 (de) 2020-07-06 2022-01-13 Clemens Par Invarianzgesteuerter elektroakustischer übertrager

Also Published As

Publication number Publication date
CH709272A2 (de) 2015-08-28

Similar Documents

Publication Publication Date Title
DE102006050068B4 (de) Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE60308876T2 (de) Audiokanalumsetzung
DE102013223201B3 (de) Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
EP2891334B1 (de) Erzeugung von mehrkanalton aus stereo-audiosignalen
DE2244162A1 (de) Verfahren zur simulation der bei einer lautsprecherbeschallung auftretenden hoerereignisse mittels kopfhoerern
WO2015049334A1 (de) Verfahren und vorrichtung zum downmixen eines multikanalsignals und zum upmixen eines downmixsignals
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
DE112007003683B4 (de) Echounterdrückungssystem, Echounterdrückungsverfahren, Klangausgabevorrichtung, Audiosystem, Navigationssystem und mobiles Objekt
WO2012032178A1 (de) Vorrichtung und verfahren zur zeitlichen auswertung und optimierung von stereophonen oder pseudostereophonen signalen
DE19715498A1 (de) Stereobildverbesserungsvorrichtung und -verfahren unter Verwendung von Tabellen
DE102008056704B4 (de) Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
DE102015204253B4 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals sowie Hörgerät
WO2015128376A1 (de) Autonome residualbestimmung und gewinnung von residualarmen zusatzsignalen
DE112006002548T5 (de) Vorrichtung und Verfahren zur Wiedergabe von virtuellem Zweikanal-Ton
DE3142157A1 (de) Signalverarbeitungsschaltung
WO2012016992A2 (de) Vorrichtung und verfahren zur auswertung und optimierung von signalen auf der basis algebraischer invarianten
DE102010015630B3 (de) Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
EP3275212B1 (de) Verfahren zur analyse und dekomposition von stereoaudiosignalen
CH708710A1 (de) Ableitung von Multikanalsignalen aus zwei oder mehreren Grundsignalen.
WO2015128379A1 (de) Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
WO2014117867A1 (de) Verfahren zur mehrkanaltonbearbeitung in einem mehrkanaltonsystem
AT523644B1 (de) Verfahren für die Erzeugung eines Konvertierungsfilters für ein Konvertieren eines multidimensionalen Ausgangs-Audiosignal in ein zweidimensionales Hör-Audiosignal
DE112019004193T5 (de) Audiowiedergabevorrichtung, audiowiedergabeverfahren und audiowiedergabeprogramm
EP2487891B1 (de) Vermeiden eines akustischen Echos bei Vollduplexsystemen

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15707326

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016554677

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REEP Request for entry into the european phase

Ref document number: 2015707326

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2015707326

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 15707326

Country of ref document: EP

Kind code of ref document: A1