WO2014094709A2 - Method for detecting at least two individual signals from at least two output signals - Google Patents

Method for detecting at least two individual signals from at least two output signals Download PDF

Info

Publication number
WO2014094709A2
WO2014094709A2 PCT/DE2013/000788 DE2013000788W WO2014094709A2 WO 2014094709 A2 WO2014094709 A2 WO 2014094709A2 DE 2013000788 W DE2013000788 W DE 2013000788W WO 2014094709 A2 WO2014094709 A2 WO 2014094709A2
Authority
WO
WIPO (PCT)
Prior art keywords
signals
signal
transformation
determined
source
Prior art date
Application number
PCT/DE2013/000788
Other languages
German (de)
French (fr)
Other versions
WO2014094709A3 (en
Inventor
Daniel Kotulla
Original Assignee
Ask Industries Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ask Industries Gmbh filed Critical Ask Industries Gmbh
Priority to JP2015548194A priority Critical patent/JP6163211B2/en
Publication of WO2014094709A2 publication Critical patent/WO2014094709A2/en
Publication of WO2014094709A3 publication Critical patent/WO2014094709A3/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Complex Calculations (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

The invention relates to a method for detecting at least two individual signals from at least two output signals, which are formed of at least two source signals, wherein the mixing ratios of at least two source signals on the output signals are determined. The output signals are multiplied by the factors formed from the mixing ratio, and from the output signals, at least two subtraction signals are determined such that from each subtraction signal, a source signal is eliminated. The subtraction signals are Fourier transformed, whereby transformation signals are produced. From the transformation signals, a residual signal is determined. Based on the transformation signals and the residual signal, at least two individual signals are calculated, and the individual signals are transformed by an inverse Fourier transformation.

Description

Verfahren zur Ermittlung wenigstens zweier Einzelsignale aus wenigstens zwei  Method for determining at least two individual signals from at least two
Ausgangssignalen  output signals
B E S C H R E I B U N G DESCRIPTION
Die Erfindung betrifft ein Verfahren zur Ermittlung wenigstens zweier Einzelsignale gemäß dem Oberbegriff von Anspruch 1. Es ist bekannt, zwei oder mehr Schallquellen so aufzunehmen, dass dadurch ein Stereosignal gebildet werden kann. Hierzu werden Pegeldifferenzen oder Laufzeitdifferenzen ausgenutzt. Durch die Stereosignale soll ein räumlicher Schalleindruck entstehen. The invention relates to a method for determining at least two individual signals according to the preamble of claim 1. It is known to record two or more sound sources so that thereby a stereo signal can be formed. For this, level differences or differences in maturity are used. The stereo signals should create a spatial sound impression.
Bekannte Verfahren der Stereophonie sind das AB-Verfahren, die Intensitäts-Stereophonie in Form des XY-Verfahrens oder des MS-Verfahrens sowie gemischte Verfahren wie das ORTF-Verfahren oder das OSS-Verfahren. Known methods of stereophony are the AB method, the intensity stereophony in the form of the XY method or the MS method and mixed methods such as the ORTF method or the OSS method.
In den letzten Jahren sind immer mehr Klangsysteme auf den Markt gekommen, die mehr als zwei Lautsprecher umfassen. Insbesondere befinden sich derartige Klangsysteme schon seit vielen Jahren beispielsweise in Kraftfahrzeugen, die wenigstens zwei Lautsprecher in den Seitentüren und zwei Lautsprecher in inneren Bereich des Kraftfahrzeuges aufweisen. In recent years, more and more sound systems have come on the market, which include more than two speakers. In particular, such sound systems are already for many years, for example, in motor vehicles having at least two speakers in the side doors and two speakers in the inner region of the motor vehicle.
Daher sind Verfahren entwickelt worden, um mehr als zwei Einzelsignale zur Verfügung zu stellen, wie dies bei der Stereophonie der Fall ist. Dabei gibt es im Wesentlichen zwei unterschiedliche Ansätze: Therefore, methods have been developed to provide more than two individual signals, as is the case with stereophony. There are essentially two different approaches:
Zum einen gibt es Verfahren, die aus einer Vielzahl von Ausgangssignalen jedes Quellsignal herausrechnen können. Als Quellsignal wird dabei jedes Instrument und jede Sing- oder Sprechstimme verstanden. Bei Chören kann aber auch eine Mehrzahl an Sängern als ein Quellsignal aufgefasst werden, beispielsweise kann „der Sopran" als eine Singstimme begriffen werden, obwohl er beispielsweise zwanzig Sängerinnen umfasst. First, there are methods that can calculate out of a variety of output signals of each source signal. The source signal is understood to mean every instrument and every voice or speaking voice. In choirs, however, a plurality of singers can be considered as a source signal, for example, "the soprano" can be understood as a singing voice, although it includes, for example, twenty singers.
Insgesamt gesehen besteht das Problem also darin, aus zwei Ausgangssignalen wie sie bei Stereosignalen vorliegen oder auch mehr Ausgangssignalen eine beliebige Anzahl von Quellsignalen herauszufiltem. All in all, the problem is to filter out any number of source signals from two output signals as they are in stereo signals or even more output signals.
Derartige Verfahren zur Quelltrennung werden unter dem Schlagwort„Blind Separation" geführt. Dabei gibt es im Wesentlichen zwei Arten von Verfahren. Die einen arbeiten mit statistischen Verfahren, wie der Unabhängigkeitsanalyse, der Hauptkomponentenanalyse, der Maximum-A-Postariori-Methode, der Maximum-Likelyhood-Methode. Daneben ist es auch bekannt, rekursive Optimierungsmethoden zu verwenden. Die bekannten Verfahren erlauben dabei entweder eine Ermittlung beliebiger Quellsignale aus einer geringeren Anzahl von Ausgangssignalen mit hohem Rechenaufwand oder setzen zu einer Echtzeitberechnung eine Anzahl von Ausgangssignalen voraus, die größer oder gleich der Anzahl der Quellsignale ist. Such source separation methods are referred to as "blind separation." There are essentially two types of methods statistical methods such as independence analysis, principal component analysis, the maximum-a-postariori method, the maximum likelihood method. In addition, it is also known to use recursive optimization methods. The known methods either allow a determination of any source signals from a smaller number of output signals with high computational complexity or require a real-time calculation, a number of output signals that is greater than or equal to the number of source signals.
Es ist daher Aufgabe der vorliegenden Erfindung, das Verfahren mit den Merkmalen des Oberbegriffs des Anspruchs 1 derart weiterzubilden, dass auch bei einer Anzahl von Ausgangssignalen, die kleiner als die Anzahl der Quellsignale ist, eine Quelltrennung in Echtzeit ermöglicht wird. Diese Aufgabe wird durch die Merkmale des Anspruches 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Unteransprüchen. Als Kern der Erfindung wird es angesehen, dass aus den Ausgangssignalen Subtraktionssignale ermittelt werden, die fouriertransformiert werden und in den so erhaltenen Transformationssignalen Einzelsignale ermittelt werden. Dadurch dass auf statistische Verfahren und rekursive Verfahren verzichtet wird, gelingt eine Ermittlung der Einzelsignale in Echtzeit. Echtzeit bedeutet dabei, dass ein anfallender Datenstrom mit einem marginalen zeitlichen Versatz der bei der Berechnung des ersten Blocks von Signalen entsteht, die widerzugebenden Signale ohne Unterbrechung bereitgestellt werden können. Es ist also möglich, beispielsweise aus einer Aufnahme eine bestimmte Singstimme und beispielsweise das Klavier zu extrahieren, bestimmten Lautsprechern mit einem auszuwählenden Mischungsverhältnis zuzuordnen wobei die Ausgangssignale nicht vorverarbeitet sein müssen. Es soll also beispielsweise möglich sein, in einem Kraftfahrzeug eine CD einzulegen, ein Lied und ggf. die Verteilung der zu extrahierenden Signale wie auch die zu extrahierenden Signale selbst festzulegen, und dass Abspielen des Liedes oder der CD zu beginnen, ohne dass es zu einer merklichen Verzögerung kommt. Die Mischverhältnisse von Quellsignalen auf die Ausgangssignale können mit einer Richtungsbestimmung ermittelt werden. Dafür werden die Ausgangssignale fouriertransformiert und die Amplitudenwerte berechnet. Diese Amplitudenwerte werden zu einem Histogramm zusammengefasst. Dafür werden aus den fouriertransformierten Ausgangssignalen Punktepaare gebildet, wobei die Punktepaare im Histogramm mittels des erhaltenen Winkels zusammengefasst werden. Der Winkel der Punktepaare nimmt dabei Werte zwischen 0° und 90° an und ermittelt sich wie folgt:
Figure imgf000005_0001
It is therefore an object of the present invention to further develop the method with the features of the preamble of claim 1 such that even with a number of output signals which is smaller than the number of source signals, a source separation in real time is made possible. This object is solved by the features of claim 1. Advantageous developments of the invention will become apparent from the dependent claims. As the core of the invention, it is considered that subtraction signals are determined from the output signals, which are Fourier-transformed and individual signals are determined in the transformation signals thus obtained. By eliminating statistical methods and recursive methods, it is possible to determine the individual signals in real time. Real-time means that a resulting data stream with a marginal time offset arises when calculating the first block of signals, the signals to be reproduced can be provided without interruption. It is thus possible, for example, to extract from a recording a certain singing voice and, for example, the piano, to assign certain loudspeakers with a mixing ratio to be selected, whereby the output signals need not be preprocessed. It should thus be possible, for example, to insert a CD in a motor vehicle, to specify a song and possibly the distribution of the signals to be extracted as well as the signals to be extracted, and to start playing the song or the CD without it noticeable delay comes. The mixing ratios of source signals to the output signals can be determined with a direction determination. For this purpose, the output signals are Fourier-transformed and the amplitude values are calculated. These amplitude values are combined into a histogram. For this purpose, pairs of dots are formed from the Fourier-transformed output signals, the pairs of points in the histogram being combined by means of the angle obtained. The angle of the pairs of points assumes values between 0 ° and 90 ° and is calculated as follows:
Figure imgf000005_0001
arctan—  arctan
Dabei bezeichnet XX org das fouriertransformierte erste Ausgangssignal X , X2 org das fouriertransformierte zweite Ausgangssignal X2 und ax sowie ay Vektoren, in denen die Beträge gespeichert werden. Der Buchstabe I ist der Zählindex der Ausgangssignale Xx und X2 bzw. der fouriertransformierten Ausgangssignale XX org und X2 org , anhand dessen dieHere X X org denotes the Fourier-transformed first output signal X, X 2 org the Fourier-transformed second output signal X 2 and a x and a y vectors in which the amounts are stored. The letter I is the counting index of the output signals X x and X 2 and the Fourier transform output signals X X org and X 2 org , on the basis of which the
Punktepaare festgemacht werden. Der erste Wert des fouriertransformierten Ausgangssignals XX org und der erste Wert des fouriertransformierten AusgangssignalsPaired points are moored. The first value of the Fourier-transformed output signal X X org and the first value of the Fourier-transformed output signal
X2 t0rg < die nichts anderes als Vektoren sind, bilden damit das erste Punktepaar, mit I = 1.X 2 t0r g < which are nothing more than vectors, thus form the first pair of points, with I = 1.
Natürlich kann der Zählindex I auch bei 0 beginnen, er läuft dann bis L - 1. L bezeichnet dabei die Anzahl der fouriertransformierten Punkte jeweils der Ausgangssignale X und X2 , beispielsweise 4096. Θ ist ein Winkel zwischen 0° und 90°. und ψι der Betrag des Punktepaares mit Index I. Of course, the count index I can also start at 0, it then runs to L - 1. Here L denotes the number of Fourier transform points of the output signals X and X 2 , for example 4096. Θ is an angle between 0 ° and 90 °. and ψ ι the amount of the pair of points with index I.
Der Vektor ψ, beinhaltet die Summe der Beträge der Vektoren ax sowie ay: The vector ψ contains the sum of the sums of the vectors a x and a y :
Ψι = an + <* Ψι = a n + <*
Die Fouriertransformation wird blockweise durchgeführt. Als Eingangssignal wird jeweils eine Zweierpotenz, also eine Potenz zur Basis 2, verwendet. Es hat sich herausgestellt, dass Potenzen von 10, 11 oder 12, also 1024, 2048 oder 4096 Datenpunkte, besonders effizient sind. Besonders bevorzugt sind 4096 Datenpunkte, da bei diesen die Rechenzeit im Hinblick auf den Rechenaufwand optimiert ist. The Fourier transformation is performed block by block. In each case a power of two, ie a power to the base 2, is used as the input signal. It has been found that powers of 10, 11 or 12, ie 1024, 2048 or 4096 data points, are particularly efficient. Particularly preferred are 4096 data points, since in these the computing time is optimized in terms of computational effort.
Die Einteilung des Histogramms erfolgt bevorzugt in 1 "-Schritten, d. h., dass das Histogramm 90 Elemente enthält. Die Werte vom Winkel Θ werden dabei auf ganze Zahlen gerundet, um den Wertebereich des Histogramms einzugrenzen. The division of the histogram is preferably carried out in 1 "increments, ie the histogram contains 90 elements, the values of the angle Θ being rounded to integers in order to narrow the range of values of the histogram.
Anschließend wird das Histogramm geglättet, um die Erkennung der Maxima zu verbessern. Als Glättungsfunktion wird beispielsweise folgende Funktion verwendet:
Figure imgf000006_0001
Then the histogram is smoothed to improve the detection of the maxima. For example, the following function is used as the smoothing function:
Figure imgf000006_0001
Der Parameter T ist eine ganze Zahl und gibt vor, wie viele Nachbarpunkte in die Glättung einbezogen werden. Es findet also eine Mittelung über mehrere Datenpunkte statt. An den Grenzen des Histogramms, wo keine Nachbarpunkte existieren, wird der Wert 0 an den entsprechenden zu ergänzenden Stellen verwendet. Bei der Berechnung des ersten Zahlenwertes des Histogramms sind also auf der einen Seite achtmal der Wert 0 anzusetzen, während auf der anderen Seite die vorhandenen Zahlenwerte verwendet werden. Im geglätteten Histogramm werden alle lokalen Extremwerte bestimmt und nach Höhe des Zahlenwertes, also nach Häufigkeit sortiert. Jede Stelle im Histogramm entspricht ja wie oben beschrieben einem Winkel, somit entspricht auch jedem Extremwert ein Winkel. Zu den ermittelten Maxima wird der zugehörige Winkel bestimmt und es werden entweder eine vorgegebene Anzahl von Maxima verwendet oder alle Maxima, deren Häufigkeit über einem vorgegebenen Schwellwert liegt. The parameter T is an integer and specifies how many neighbor points are included in the smoothing. So there is an averaging over several data points. At the boundaries of the histogram, where there are no neighboring points, the value 0 is used at the corresponding points to be supplemented. When calculating the first numerical value of the histogram, the value 0 must be set eight times on one side, while the existing numerical values are used on the other side. In the smoothed histogram, all local extreme values are determined and sorted according to the height of the numerical value, ie according to frequency. Each position in the histogram corresponds to an angle as described above, so each angle also corresponds to an angle. The corresponding angle is determined for the maxima determined and either a predefined number of maxima are used or all maxima whose frequency is above a predetermined threshold value.
Der geglättete Histogramm-Vektor ergibt sich damit zu The smoothed histogram vector thus results in
Μ = Σ (Γ)χΜ' Dabei kann das Problem auftreten, dass ein Quellsignal nicht über die gesamte Dauer in den Ausgangssignalen auftritt. Beispielsweie haben bestimmte Instrumente oder Singstimmen Pausen. Damit diese Pausen keine Fehler in der Winkelbestimmung verursachen, ist es möglich, nach der Ermittlung von zwei oder mehr Histrogrammen und einer entsprechenden Winkelbestimmung die folgenden Histogramme mit einer Gewichtungsfunktion, beispielsweise einem Tiefpass, zu multiplizieren. Der Tiefpass kann folgendes Aussehen haben: y(n) = a x x(n)+ b x y{n - 1) , wobei a = 0,1 und b = 0,9 ist. Der Index n ist der Index des Histogramms, d.h. beim erstenΜ = Σ ( Γ ) χ Μ ' The problem may arise that a source signal does not appear in the output signals over the entire duration. For example, certain instruments or voices have pauses. In order for these pauses not to cause errors in the angle determination, it is possible to multiply the following histograms by a weighting function, such as a low pass, after determining two or more histograms and corresponding angle determination. The low-pass can have the following appearance: y (n) = axx (n) + bxy {n-1), where a = 0.1 and b = 0.9. The index n is the index of the histogram, ie the first one
Histogramm bzw. den ersten 4096 Datenpunkten ist n = 1. Durch die Anwendung des Tiefpasses erhält man das Histogramm h , TP . Histogram or the first 4096 data points is n = 1. The application of the low pass results in the histogram h, TP .
Durch diese Gewichtung wird die Winkelerkennung stabilisiert. Ausgehend von den ermittelten Winkeln bestimmen sich die Mischverhältnisse zweier Quellsignale, indem die Winkel γΝ = Index(max(hgl _TP )) . in folgender Gleichung eingesetzt werden:
Figure imgf000007_0001
Liegt ein Maximum des Histogramms beispielsweise bei 18°, so ergibt sich so ein Mischungsverhältnis von V=0,325.
This weighting stabilizes the angle detection. Starting from the determined angles, the mixing ratios of two source signals are determined by the angles γ Ν = index (max ( hgl- TP )). be used in the following equation:
Figure imgf000007_0001
If a maximum of the histogram is, for example, 18 °, this results in a mixing ratio of V = 0.325.
Anhand der Mischungsverhältnisse werden Subtraktionssignale berechnet, die sich bei Ausgangssignalen folgendermaßen ergeben:
Figure imgf000007_0002
Based on the mixing ratios, subtraction signals are calculated, which result for output signals as follows:
Figure imgf000007_0002
X =  X =
X2 - x Xt vN > \ X 2 - x X t v N > \
* N mit N = 1 , 2, ... . N ist der Index des auszufilternden Quellsignals. Abhängig davon, ob das Mischungsverhältnis größer oder kleiner als 1 ist, wird das entsprechende Subtraktionssignal berechnet. Dabei ist es möglich, auch mehr als zwei Ausgangssignale zu verwenden, jedoch führt dies lediglich zu einem erhöhten Rechenaufwand. Liegen nicht nur wie bei einem Stereosignal zwei sondern mehr Ausgangssignale vor, werden zur Extraktion eines Quellsignals daher bevorzugt diejenigen zwei Ausgangssignale ausgewählt, bei der das Quellsignal am stärksten vertreten ist.  * N with N = 1, 2, .... N is the index of the source signal to be filtered out. Depending on whether the mixing ratio is greater or less than 1, the corresponding subtraction signal is calculated. It is possible to use more than two output signals, but this only leads to an increased computational effort. If there are not two but more output signals as in the case of a stereo signal, then those two output signals in which the source signal is most strongly represented are preferably selected for the extraction of a source signal.
Bei den so ermittelten Subtraktionssignalen ist jeweils ein Quellsignal ausgeblendet. In the case of the subtraction signals thus determined, a source signal is hidden in each case.
Diese Subtraktionssignale werden dann fouriertransformiert. Dies geschieht blockweise, wobei nachfolgende Blöcke immer mit einem Abstand beginnen, der der halben Größe der zu vorher transformierenden Datenpunkte entspricht. D. h., dass die erste Hälfte eines Blockes bereits als zweiter Teil des vorhergehenden Blockes fouriertransformiert wurde. These subtraction signals are then Fourier transformed. This happens block by block, whereby subsequent blocks always start with a distance that corresponds to half the size of the previously transforming data points. That is, the first half of a block has already been Fourier transformed as the second part of the previous block.
Dies erlaubt eine kontinuierliche Signalverarbeitung und ist unter dem Namen Overlap-Add- Verfahren bekannt. Zur Minimierung des Leck-Effektes werden die Eingangsblöcke mit einem Fenster, beispielsweise einem Hanning-Fenster multipliziert. Die Fensterfunktion f(n) für N Datenpunkte lautet: This allows continuous signal processing and is known under the name overlap-add method. To minimize the leak effect, the input blocks are multiplied by a window, for example a Hanning window. The window function f (n) for N data points is:
/(«) = iu il - cos mit O < n < N - l / («) = Iu il - cos with O <n <N - l
Aus den fouriertransformierten Subtraktionssignalen X , im folgenden Transformationssignale genannt, wird ein Restsignal ermittelt. Für zwei Transformationssignale X ergibt sich das Restsignal als einfache Subtraktion des zweiten Transformationssignals vom ersten: From the Fourier-transformed subtraction signals X, referred to below as transformation signals, a residual signal is determined. For two transformation signals X, the residual signal results as a simple subtraction of the second transformation signal from the first:
X3 = Xx - X2 . X 3 = X x - X 2 .
Im Folgenden wird weiterhin von zwei Transformationssignalen X und X2 und einem Restsignal X^ ausgegangen, was insgesamt drei Signale ergibt. Zur Extraktion einesIn the following, two transformation signals X and X 2 and a residual signal X ^ are assumed, resulting in a total of three signals. For the extraction of a
Einzelsignals werden daraufhin diese drei Signale miteinander verglichen. Single signal are then compared these three signals.
Für jeden Datenpunkt der Signale , , X2 und X} , üblicherweise weist jedes Signal 4096 Datenpunkte auf, werden aus den Amplituden der drei Signale die Extremwerte berechnet. For each data point of the signals,, X 2 and X } , usually each signal has 4096 data points, the extreme values are calculated from the amplitudes of the three signals.
Ausgegangen wird von einem Array mit 3 x 4096 Datenpunkten. Die Zahl 3 gibt die Anzahl der Transformationssignale und dem Restsignal an und die 4096 die Anzahl der fouriertransformierten Datenpunkte in einem Block. Betrachtet man den ersten Datenpunkt bzw. den ersten Frequenz-Bin der Vektoren Xx , X2 und X , so stehen drei Zahlenwerte zum Vergleich. An der Stelle des minimalen Wertes dieser drei Werte wird der Maximalwert der beiden anderen Werte gesetzt und die anderen Werte werden auf Null gesetzt. The starting point is an array with 3 x 4096 data points. The number 3 indicates the number of transform signals and the residual signal, and the 4096 indicates the number of Fourier transformed data points in a block. Looking at the first data point and the first frequency bin of the vectors X x, X 2 and X, so there are three numerical values for comparison. In place of the minimum value of these three values, the maximum value of the other two values is set and the other values are set to zero.
Ein Zahlenbeispiel zur Verdeutlichung: Sei der erste Wert von Xx 5, der erste Wert von X2 10 und der erste Wert von X3 15. Dann wird 15 an die Stelle von 5 gesetzt und der erste Wert von X2 und J 3 auf 0. Die Werte werden also spaltenweise betrachtet. Man erhält ein Array aus 4096 Spalten und drei Zeilen, bei dem zwei drittel der Werte Null sind. Die Werte ungleich von Null sind unregelmäßig über die Einzelvektoren verteilt. Die Einzelvektoren zu Xl und X2 heißen S, und S2 und sind die Fouriertranformierten der berechneten Quellsignale S! und S2. Der sich ergebende Vektor des Restwertsignals X3 hat keine weitere Bedeutung. Die Ermittlung von Sx und S2 ist durch folgende Formel gegeben: A numerical example for clarification: Let the first value of X x 5, the first value of X 2 10 and the first value of X 3 15 then set 15 to the position of 5 and the first value of X 2 and J 3 0. The values are therefore considered column by column. One obtains an array of 4096 columns and three rows in which two-thirds of the values are zero. The values unequal to zero are distributed irregularly over the individual vectors. The individual vectors to X l and X 2 are called S, and S 2 and are the Fourier transform of the calculated source signals S! and S 2 . The resulting vector of the residual signal X 3 has no further meaning. The determination of S x and S 2 is given by the following formula:
EmM, falls Xm (k) = ErBm (k) E m M if X m (k) = E rBm (k)
S„{k)  S "{k)
sonst  otherwise
m = 1 , 2, 3, 4, 5, ... .  m = 1, 2, 3, 4, 5, ....
Dabei ist k der Zählindex der Datenpunkte bzw. Frequenz-Bins und durchläuft bei 4096 Datenpunkten die Werte 1 bis 2048. Es muss nur die Hälfte der Frequenz-Bins durchlaufen werden, da aus Symmetriegründen im Zuge der Fouriertransformation die Datenpunkte doppelt vorkommen. Im obigen Beispiel war k = 1. K is the counting index of the data points or frequency bins and passes through the values 1 to 2048 for 4096 data points. Only half of the frequency bins need to be traversed, since the data points occur twice for reasons of symmetry in the course of the Fourier transformation. In the example above, k = 1.
Nimmt man die so umgewandelten Zeilen, die zu den Signalen X und X2 gehört haben, nämlich die Einzelsignale Sx und S2 , kann man daraus die berechneten Quellsignale ST undIf one takes the lines thus converted, which have belonged to the signals X and X 2 , namely the individual signals S x and S 2 , one can use them to calculate the calculated source signals ST and
S2 durch eine inverse Fouriertransformation ermitteln. Als Phase kann die Phase der Signale Xx und X2 auch direkt herangezogen werden. Sx und S2 wird also die jeweiligeDetermine S 2 by an inverse Fourier transform. As a phase, the phase of the signals X x and X 2 can also be used directly. S x and S 2 will be the respective
Phase aus den Vektoren Xx und X2 zugeordnet. Die Zuordnung erfolgt natürlich in Abhängigkeit des Zählindexes k. Phase assigned from the vectors X x and X 2 . The assignment is of course dependent on the counting index k.
Die Einzelsignale Sx und S2 bzw. die fouriertransformierten Einzelsignale S! und S2 können sich von den Quellsignalen aufgrund von Rechenungenauigkeiten und Rundungsfehlern leicht unterscheiden. D. h., dass eine vollständige Reproduktion eines Quellsignals zwar nicht gelingt, die Unterschiede sind aber derart gering, dass sie üblicherweise nicht bemerkbar sind. Zur Verbesserung der Trennung der Einzelsignale sind folgende Schritte möglich: The individual signals S x and S 2 or the Fourier-transformed individual signals S ! and S 2 may be slightly different from the source signals due to computational inaccuracies and rounding errors. This means that a complete reproduction of a source signal is not possible, but the differences are so small that they are usually not noticeable. To improve the separation of the individual signals, the following steps are possible:
Um Sprünge in der Minima-Erkennung zu vermeiden kann vorgesehen sein, dass die Festlegung eines Minimums in den Signalen XX , X2 und X3 von der Erkennung vorhergehender Minima abhängt. Beispielsweise kann ein bedingter Tiefpassfiiter verwendet werden:
Figure imgf000009_0001
In order to avoid jumps in the minima detection it can be provided that the definition of a minimum in the signals X X , X 2 and X 3 depends on the detection of preceding minima. For example, a conditional low pass filter may be used:
Figure imgf000009_0001
Phoid ik) ist der zu merkende Wert eines Frequenz-Bins k, wobei k wieder der Zählindex ist. Der Parameter b ist frei zwischen 0 und 1 einstellbar, wobei das Merken der Frequenz bei b = 0 ausgeschaltet ist. P ho i d ik) is the value of a frequency bin k to be memorized, k again being the count index. The parameter b is freely adjustable between 0 and 1, whereby the note of the frequency is switched off at b = 0.
Die Ermittlung von Si und S2 ist dann durch folgende Formel gegeben: ^ (k), Xm {k) = Emm (k) The determination of S i and S 2 is then given by the following formula: ^ (k), X m {k) = E mm (k)
Der Parameter η ( 0 < η < \ ) gibt vor, wie stark das tiefpass-gefilterte Signal in die Einzelsignale Sm , m = 1 , 2, 3, ... eingeht. The parameter η (0 <η <\) specifies how strongly the low-pass filtered signal enters the individual signals S m , m = 1, 2, 3,.
Weiterhin können die Minima der Transformationssignale Xm , m = 1 , 2, 4, 5, ... getrennt mit dem Restwertsignal X, verglichen werden, d.h. dass die Minimabestimmung Em,n(k),Furthermore, the minima of the transformation signals X m , m = 1, 2, 4, 5,... Can be compared separately with the residual value signal X, ie the minimum determination Em, n (k),
Belegung mit 0 oder dem Maximalwert der Spalte Emax(k) usw. jeweils zwischen einem Transformationssignal Xm und dem Restwertsignal X2 durchgeführt wird. So werden die Vektoren Emmi , Emin2, Emaxi und Emax2 ermittelt. Die Minima werden mit einem Faktor ß ( 0 < ß < 2 ) multipliziert. Je nach Wahl des Faktors ergeben sich unterschiedliche Effekte.Assignment with 0 or the maximum value of the column E max (k), etc. each between a transformation signal X m and the residual value signal X 2 is performed. Thus, the vectors Emmi, E min2 , E max i and Em a x2 are determined. The minima are multiplied by a factor ß (0 <ß <2). Depending on the choice of the factor, different effects result.
Für ß < 1 werden unerwünschte Frequenzen unterdrückt und für ß > 1 ergibt sich ein harmonischeres Klangbild. Die Einzelsignale ergeben sich zu For ß <1 unwanted frequencies are suppressed and for ß> 1 results in a more harmonious sound. The individual signals arise too
Figure imgf000010_0001
Figure imgf000010_0001
Zusätzlich können die Signale anhand der Phasenlage getrennt werden. Ist die Amplitude der Transformationssignale Xm {k) im Wesentlichen identisch und hat im RestwertsignalIn addition, the signals can be separated based on the phase angle. If the amplitude of the transformation signals X m {k) is substantially identical and has in the residual value signal
X3 (k) ein Minimum, wird die Phase berücksichtigt. Ist diese gleich, wird das MaximumX 3 (k) a minimum, the phase is taken into account. If this is the same, the maximum becomes
S3 (k) zugeordnet, ansonsten S (k) und S2 (k) . Diese Betrachtung ist natürlich für jeden Frequenz-Bin k gesondert durchzuführen. S 3 (k), otherwise S (k) and S 2 (k). Of course, this consideration is to be performed separately for each frequency bin k.
Es gilt dementsprechend: = jmin{ m ( 3 (*) }It applies accordingly: = jmin { m ( 3 (*)}
Figure imgf000011_0001
Figure imgf000011_0001
0,  0
m = 1 , 2, 4, 5, ...  m = 1, 2, 4, 5, ...
Zusätzlich können weiterhin die fouriertransformierten Ausgangssignale Xm org berücksichtigt werden. Liegt ein Minimum bei Xl org (k) , wird dieses ebenfalls S{ (k) zugeordnet: (k) v Xmfirg (k) = (k)In addition, the Fourier-transformed output signals X m org can furthermore be taken into account. If there is a minimum at X l org (k), this is also assigned to S { (k): (k) v X mfirg (k) = (k)
Figure imgf000011_0002
sonst
Figure imgf000011_0002
otherwise
Die Erfindung ist anhand von Ausführungsbeispielen in den Zeichnungsfiguren näher erläutert. Diese zeigen: The invention is explained in more detail with reference to embodiments in the drawing figures. These show:
ein Blockschaltbild des erfindungsgemäßen Verfahrens für ein Stereosignal, ein Blockschaltbild des erfindungsgemäßen Verfahrens in einer zweiten Ausgestaltung, ein Ablaufschema zur Bestimmung der Mischverhältnisse, ein Ablaufschema zur Quellentrennung, eine Anordnung zur Aufnahme von Stereophoniesignalen, ein Streudiagramm von Datenpaaren, ein Streudiagramm von FT-Daten paaren, ein Histogramm, das Overlap-Add-Verfahren, ein 3D-Amplitudenspektrum zweier Transformations- und eines Restsignals, ein 3D-Aplitudenspektrum der Einzelsignale und Fig. 12 Transformationssignale und Einzelsignale in Vektorform a block diagram of the method according to the invention for a stereo signal, a block diagram of the method according to the invention in a second embodiment, a flow chart for determining the mixing ratios, a flow scheme for source separation, an arrangement for recording stereophonic signals, a scatter plot of data pairs, a scatter plot of FT data pair , a histogram, the overlap-add method, a 3D amplitude spectrum of two transformation and a residual signal, a 3D amplitude spectrum of the individual signals and 12 transformation signals and individual signals in vector form
Fig. 5 zeigt eine Anordnung zur Aufnahme eines Stereosignals. Rein exemplarisch ist eine Anordnung zur Aufnahme der Quellensignale mittels XY-Stereophonie gezeigt, grundsätzlich lässt sich das erfindungsgemäße Verfahren aber nicht nur bei allen weiteren Stereophonieverfahren, sondern auch bei Verfahren einsetzen, bei denen mehr als zwei Ausgangssignale generiert werden. Gezeigt sind vier Signalquellen, die jeweils ein Quellsignal 1 , 2, 3 und 4 erzeugen. Bei Quellsignal 1 handelt es sich beispielsweise um eine Singstimme, also einen Sänger oder eine Sängerin, bei Quellsignal 2 um den Hintergrundchor bestehend aus einer Mehrzahl an Sängern oder Sängerinnen, die jedoch den gleichen Text und die gleichen Noten wiedergeben, bei dem Quellsignal 3 um ein Instrument, beispielsweise ein Klavier und bei Quellsignal 4 um eine Gruppe von Instrumenten, die jedoch wie der Chor die gleichen Noten wiedergeben. Ein Beispiel hierfür wäre ein Satz Geigen, der die gleiche Melodie spielt. Dies soll zeigen, dass ein Quellsignal nicht nur von einem einzelnen Sänger oder einer einzelnen Sängerin gebildet werden kann bzw. von einem einzelnen Instrument, sondern auch von einer Mehrzahl an Sängern oder Instrumenten. Durch die divergierende Richtwirkung der Mikrofone 5 und 6 werden die Quellsignale 1 , 2, 3 und 4 mit unterschiedlichen Pegeln aufgenommen, weswegen das Mischverhältnis der Quellsignale 1 , 2, 3 und 4 immer unterschiedlich ist. Fig. 5 shows an arrangement for receiving a stereo signal. By way of example only, an arrangement for recording the source signals by means of XY stereophony is shown; in principle, however, the method according to the invention can be used not only in all other stereophonic methods, but also in methods in which more than two output signals are generated. Shown are four signal sources, each generating a source signal 1, 2, 3 and 4. Source signal 1 is, for example, a singing voice, ie a singer, with source signal 2 around the background choir consisting of a plurality of singers, who, however, reproduce the same text and the same notes, in the case of the source signal 3 Instrument, for example a piano, and in the case of source signal 4 a group of instruments which, however, like the choir, reproduce the same notes. An example would be a set of violins playing the same melody. This is to show that a source signal can be formed not only by a single singer or a single singer or by a single instrument, but also by a plurality of singers or instruments. Due to the diverging directivity of the microphones 5 and 6, the source signals 1, 2, 3 and 4 are recorded at different levels, which is why the mixing ratio of the source signals 1, 2, 3 and 4 is always different.
Aus den Quellsignalen 1 , 2, 3 und 4 werden so die zwei Ausgangssignale des Stereosignals gewonnen. Die Ausgangssignale sind diejenigen Signale, die den Ausgangspunkt des erfindungsgemäßen Verfahrens bilden, die ursprünglichen Quellsignale stehen so nicht mehr zur Verfügung. From the source signals 1, 2, 3 and 4, the two output signals of the stereo signal are thus obtained. The output signals are those signals which form the starting point of the method according to the invention, the original source signals are no longer available.
Selbstverständlich können auch mehr Quellsignale zur Erzeugung der Ausgangssignale Xm verwendet werden, zur Durchführung des Verfahrens müssen sinnvoller Weise aber wenigstens zwei Quellsignale vorhanden sein. Of course, more source signals can be used to generate the output signals X m , but in order to carry out the method, it is necessary to have at least two source signals.
Im Folgenden wird des Öfteren auf zwei Ausgangssignale X, , X2 Bezug genommen. Das erfindungsgemäße Verfahren ist aber nicht auf Stereosignale beschränkt, grundsätzlich können beliebig viele Ausgangssignale Xm, m = 1 , 2, 3, ... zur Verfügung stehen. In the following, reference is frequently made to two output signals X,, X 2 . The inventive method is not limited to stereo signals, in principle, any number of output signals X m , m = 1, 2, 3, ... are available.
Figur 1 zeigt ein Blockschaltbild des erfindungsgemäßen Verfahrens in einer ersten Ausgestaltung. Dabei werden zwei Ausgangssignale X und X2 herangezogen und das Mischungsverhältnis für zwei Quellsignale, beispielsweise die Quellsignale 1 und 2, bestimmt. Ein mögliches Verfahren zur Bestimmung der Mischungsverhältnisse ist weiter unten ausführlich erläutert. Für das Quellsignal 1 ergibt sich beispielsweie ein Mischungsverhältnis V und für das Quellsignal 2 ein Mischungsverhältnis V2. Aus den Ausgangssignalen X! und X2 werden dann Subtraktionsignale Xx und X2 berechnet, indem die Ausgangssignale Xi und X2 folgendermaßen anhand eines Mischungsverhältnisses subtrahiert werden: FIG. 1 shows a block diagram of the method according to the invention in a first embodiment. In this case, two output signals X and X 2 are used and the Mixing ratio for two source signals, for example, the source signals 1 and 2, determined. A possible method for determining the mixing ratios is explained in detail below. For the source signal 1, for example, a mixing ratio V results and for the source signal 2 a mixing ratio V 2 . From the output signals X ! and X 2 are then Subtraktionsignale X x and X 2 calculated by the output signals Xi and X 2 are subtracted as follows, using a mixing ratio:
Xx - VN x X2_ VN < \ X x - V N x X 2 _V N <\
X =  X =
X2 ~ x X^ VN > \ X 2 ~ x X ^ V N > \
Dabei steht N für den jeweiligen Index des Quellsignals. N stands for the respective index of the source signal.
Die so berechneten Subtraktionssignale Xx und X2 werden nach dem Overlap-Add- Verfahren fouriertransformiert. The thus calculated subtraction signals X x and X 2 are Fourier-transformed according to the overlap-add method.
Die Ausgangssignale Xi und X2 sind selbstverständlich digitale Signale, die dementsprechend aus reinen Folgen von Zahlenwerten oder Datenpunkten entsprechen. Man könnte ein Ausgangssignal auch als einen Vektor mit einer sehr großen Anzahl an Zahlenwerten, üblicherweise viele Zehntausend, darstellen. Dies gilt genauso für die Subtraktionssignale. Um den Rechenbedarf klein zu halten und insbesondere die Zeitdauer bis zur Bereitstellung erster Einzelsignale gering zu halten, werden die Ausgangssignale Xi und X2 bzw. die Subtraktionssignale Xx und X2 blockweise weiterverarbeitet. DieThe output signals Xi and X 2 are of course digital signals, which accordingly correspond to pure sequences of numerical values or data points. One could also represent an output signal as a vector with a very large number of numerical values, usually many tens of thousands. This also applies to the subtraction signals. In order to keep the computational requirements small and in particular to keep the time until the provision of the first individual signals low, the output signals Xi and X 2 and the subtraction signals X x and X 2 are further processed block by block. The
Fouriertransformation wird beispielsweise auf die ersten 4.096 Datenpunkte des Subtraktionssignals Xx bzw. X2 angewandt. Bevorzugt werden Zweierpotenzen von Datenpunkten fouriertransformiert, da bei diesen die schnelle Fouriertransformation (FFT) angewandt werden kann. Die Zahl 4.096 stellt dabei einen Optimalwert dar im Hinblick auf die verbrauchte Rechenzeit und die verwendeten Rechenresourcen. Es können auch kleinere oder größere Datenblöcke genommen werden, beispielweise Datenblöcke von 1024 oder 2048 Datenpunkten. Es handelt sich dabei selbstverständlich immer um aufeinanderfolgende Datenpunkte. Durch die Fouriertransformation der Substraktionssignaie Xx und X2 erhält man die Transformationssignale X und 2. Durch Subtraktion desFourier transformation is applied, for example, to the first 4,096 data points of the subtraction signal X x and X 2, respectively. Preferably, powers of two of data points are Fourier-transformed, since the fast Fourier transformation (FFT) can be used for these. The number 4,096 represents an optimum value with regard to the used computing time and the used computing resources. It is also possible to take smaller or larger data blocks, for example data blocks of 1024 or 2048 data points. Of course, these are always consecutive data points. By the Fourier transform of x Substraktionssignaie X and X 2 to obtain the transformation of signals X and 2. FIG. By subtracting the
Transformationssignals X2 vom Transformationssignal X, erhält man das Restsignal X3 . Transformation signal X 2 from the transformation signal X, one obtains the residual signal X 3rd
Das Restsignal X3 enthält jeweils genau so viele Datenpunkte, wie die Transformationssignale X und 2 , beispielsweise also 4096 Datenpunkte. Da diese Datenpunkte in der Frequenzdomäne vorliegen, werden sie auch üblicherweise Frequenz- Bins genannt. Ein Frequenz-Bin ist also ein Datenpunkt eines Transformations- oder Restsignals. Im Beispielfall weist jedes Transformations-Restsignal also 4096 Frequenz-Bins auf. In den Signalen Χ , X2 und X3 werden dann Minima gesucht, da diese gleichbedeutend mit den ausgeblendeten Signalen sind. Dazu werden für jeden Frequenz-Bin aus den Amplituden der Signale X , X2 und X3 die Minima berechnet und an dieseThe residual signal X 3 contains exactly as many data points as the transformation signals X and 2 , for example 4096 data points. Since these data points are in the frequency domain, they are also typically Called Bins. A frequency bin is therefore a data point of a transformation or residual signal. In the example, each transformation residual signal therefore has 4096 frequency bins. In the signals Χ, X 2 and X 3 then minima are searched, since these are synonymous with the hidden signals. For this purpose, the minima are calculated for each frequency bin from the amplitudes of the signals X, X 2 and X 3 and sent to them
Minimumsstellen die Maximalwerte des jeweiligen Frequenz-Bins gesetzt die anderen Werte für diesen Frequenz-Bin auf Null gesetzt. Die Phasen zu den von Null verschiedenen Werten erhält man aus den Auf diese Weise hält man die Einzelsignale Sx und S2. Diese müssen in den Zeitbereich rücktransformiert werden, wodurch man die berechneten Quellsignale Si und S2 erhält. Minimum digits set the maximum values of the respective frequency bins set the other values for this frequency bin to zero. The phases to the non-zero values are obtained from the In this way one holds the individual signals S x and S 2 . These must be transformed back into the time domain, which gives the calculated source signals Si and S 2 .
Figur 2 zeigt eine Ausgestaltung zur Ermittlung von mehr als zwei berechneten Quellsignalen ST uns S2. Hierfür werden aus den Ausgangssignalen X1 ( X2, X3 und X4 mehr als zwei Mischungsverhältnisse bestimmt, wodurch mehr Subtraktionssignale und damit mehr Transformationssignale erhalten werden. Auch in den so erhaltenen Transformationssignalen Xx , X2 , j 4 und X5 und dem daraus ermittelten Restsignal X3 folgt eine Minimabestimmung und darüber die Ermittlung der Einzelsignal S{ , S2 , S3 und S4 und daraus die Berechnung der berechneten Quellsignale Si, S2, S3 und S4. FIG. 2 shows an embodiment for determining more than two calculated source signals ST us S 2 . For this purpose, from the output signals X 1 (X 2, X 3 and X 4 are determined more than two mixing ratios, thereby more subtraction signals and thus more transformation signals are obtained. Also, in the thus-obtained transform signals X x, X 2, j 4 and X 5, and the residual signal X 3 determined therefrom is followed by a minimization determination and, moreover, by the determination of the individual signals S { , S 2 , S 3 and S 4 and from this the calculation of the calculated source signals Si, S 2 , S 3 and S 4 .
Im Folgenden wird eine Möglichkeit zur Bestimmung der Mischverhältnisse offenbart. Grundsätzlich können alle Verfahren zur Bestimmung der Mischverhältnisse verwendet werden. In the following, a possibility for determining the mixing ratios is disclosed. In principle, all methods for determining the mixing ratios can be used.
Figur 3 zeigt ein Ablaufschema zur Bestimmung der Mischungsverhältnisse anhand einer Richtungsbestimmung. Dabei werden in Schritt S1 die Ausgangssignale Xi und X2 fouriertransformiert, wodurch die transformierten Ausgangssignale XX org und X2 org erhalten werden. In Schritt S2 werden für jeden Datenpunkt bzw. Frequenz-Bin der fouriertransformierten Ausgangssignale XX org und X2t0rg die Amplitudenwerte anhand derFIG. 3 shows a flow chart for determining the mixing ratios on the basis of a direction determination. In this case, the output signals Xi and X 2 are Fourier-transformed in step S1, whereby the transformed output signals X X org and X 2 org are obtained. In step S2, for each data point or frequency bin of the Fourier-transformed output signals X X org and X 2t0rg, the amplitude values are determined on the basis of FIG
Formeln formulas
Figure imgf000014_0001
ermittelt. Im nächsten Schritt S3 erfolgt die Berechnung des Winkels Θ und des Betragswertes ψ, aus den vorausgehend ermittelten Werten. Dabei kann die Berechnung der Betragswerte der fouriertransformierten Ausgangssignale Xl org und X firg datenpunktweise oder auch als Vektor erfolgen, jedenfalls sind daraus Wertepaare von Winkeln Θ und Betragswerten ψ, zu ermitteln.
Figure imgf000014_0001
determined. In the next step S3, the calculation of the angle Θ and the absolute value ψ takes place from the previously determined values. In this case, the magnitude values of the Fourier-transformed output signals X l org and X firg can be calculated on a data point-by- pixel basis or as a vector, at least value pairs of angles Θ and magnitude values ψ are to be determined therefrom.
In Schritt S4 wird aus den Wertepaaren Θ und ψ, ein Histogramm berechnet, welches in Schritt S5 geglättet wird. In step S4, a histogram is calculated from the value pairs Θ and ψ, which is smoothed in step S5.
In Schritt S6 folgt die Bestimmung der Maxima des Histogramms, wobei entweder eine vorgegebene Anzahl oder alle Maxima über einem Schwellwert herangezogen werden. In step S6, the determination of the maximums of the histogram follows, whereby either a predetermined number or all maxima above a threshold value are used.
Diesen Maxima ist jeweils ein Winkel zugeordnet, der aus der oben angegebenen Formel jeweils aus den Maximawerten berechnet wird. In Schritt S7 erfolgt dann die Bestimmung der gesuchten Mischungsverhältnisse anhand der ermittelten Winkel. Each of these maxima is assigned an angle, which is calculated in each case from the maximum values from the formula given above. In step S7, the determination of the desired mixing ratios then takes place on the basis of the determined angles.
Figur 4 zeigt ein Ablaufschema zur Quellentrennung. Ausgehend von den Transformationssignalen Xx , X2 , und ggf. X4 und X5 sowie dem Restwertsignal X3 werden zu jedem Frequenz-Bin die Minima und Maxima berechnet (Schritt SB). In einer weiteren Ausgestaltung können zusätzlich die fouriertransformierten der Ausgangssignale Xl org und X2jorg und ggf. X3 org und X4 org berücksichtigt werden. FIG. 4 shows a flow chart for source separation. Based on the transformation signals X x, X 2, and optionally X 4 and X 5, as well as the residual signal X 3, the minima and maxima for each frequency bin is calculated (step SB). In a further embodiment, the Fourier transform of the output signals X l org and X 2jorg and optionally X 3 org and X 4 org may additionally be taken into account.
In Schritt S9 wird in jedem Frequenz-Bin an der Stelle des Minimalwertes der Maximalwert des Frequenz-Bins bzw. der jeweiligen Spalte gesetzt, allen anderen Werten wird entweder eine Null- oder der Haltewert Ph'old zugeordnet, wie oben beschrieben. In step S9, the maximum value of the frequency bin or the respective column is set in each frequency bin at the location of the minimum value, all other values are assigned either a zero value or the hold value P h ' old , as described above.
Gemäß Schritt 10 wird zu jedem von Null verschiedenen Wert der Einzelsignale S , S2 , S4 und S5 die jeweilige Phase der Transformationssignale X , X2 , X4 und X5 zugeordnet. According to step 10, the respective phase of the transformation signals X, X 2 , X 4 and X 5 is assigned to each non-zero value of the individual signals S, S 2 , S 4 and S 5 .
Die Zuordnung erfolgt dabei anhand der Nummerierung der Frequenz-Bins. Hat das Frequenz-Bin 28 des Einzelsignals 5, einen von Null verschiedenen Wert, so erhält dieses die Phase des Frequenz-Bins 28 des Transformationssignals Χ . Aufgrund derThe assignment is based on the numbering of the frequency bins. If the frequency bin 28 of the individual signal 5 has a value other than zero, this receives the phase of the frequency bin 28 of the transformation signal Χ. Due to the
Verschiebung der Maximalwerte auf die Minimalwerte in jedem Frequenz-Bin und der Nullsetzung der übrigen Werte ist kein einziger Wert eines Einzelsignals gleich dem Wert des zugeordneten Transformationssignals. Trotzdem können die Phasen übernommen werden. Statt einer Nullsetzung der Nicht-Minimunsstellen kann auch der Haltewert ηΡΜά eingesetzt werden. Dies verhindert Sprungstellen in den Einzelsignalen. Figur 6 zeigt ein Streudiagram der Amplituden von zwei gemischten Ausgangssignalen X^ und X2, wobei die Ausgangssignale Xi und X2 gegeneinander verschobene Sinussignale sind. Ein Streudiagramm stellt jeweils Wertepaare dar, wobei die Wertepaare anhand der Nummer des Datenpunktes, sozusagen des Daten-Bins gebildet werden. Der erste Punkt des Datenpunkts des Ausgangssignals X^ weist eine erste Amplitude auf und der erste Datenpunkt des Ausgangssignals X2 eine gleiche oder eine andere Amplitude. Diese beiden Amplituden werden verwendet, um einen Punkt im Streudiagramm 9 festzulegen. Durch die Verwendung einer Vielzahl an Datenpunkten jeweils des Ausgangssignals X^ und des Ausgangssignals X2 entstehen genauso viele Datenpunkten-Paare. Dabei ist auf der Achse 10 die Amplitude des Ausgangssignals X, und auf der Achse 11 die Amplitude des Ausgangssignals X2 angegeben. Durch die Verwendung von beispielsweise 4096 Datenpunkten auf dem Ausgangssignal X^ und dem Ausgangssignals X2 erhält man 4096 Datenpunktenpaare. Diese bilden im Streudiagramm eine Punktwolke 12, die aus einer Vielzahl der einzelnen Datenpunktepaaren ermittelten Punkte 13 gebildet wird. Figur 7 zeigt ein entsprechend gebildetes Streudiagramm 14, wobei die Ausgangssignale X! und X2 jedoch fouriertransformiert wurden und die Amplituden der Signale gemäß
Figure imgf000016_0001
berechnet wurden. Entsprechend ist auf Achse 15 der Betrag der Amplitude von Xl org , also der Fouriertransformierten des Ausgangssignals X1 ( und auf Achse 16 der Betrag der Amplitude von Xlfir aufgetragen. Durch Berechnung der Steigung der Geraden 17 bzw. 18 erhält man jeweils die Mischungsverhältnisse. Auf derart einfache Art und Weise lassen sich die Mischungsverhältnisse aber nur bei in realen Aufnahmen so nicht vorkommenden Sinussignalen ermitteln. Statt der Bildung eines Streudiagramms und der Ermittlung der Steigung der sich ergebenden Geraden wird nach der Fouriertransformation der der Ausgangssignale Xi und X2 aus den Punktepaaren der fouriertransformierten Ausgangssignale Χ und X2i0rg jeweils ein Winkel Θ und ein Vektor ψ berechnet. Statt eines Streudiagramms wird aus den Paaren aus Winkeln Θ und Vektor ψ ein Histogramm ermittelt, in dem die Winkel auf eine ganze Zahl gekürzt werden und daraus entsprechende Häufigkeiten an Winkeln ermitteln werden. Aus jedem Punktepaar ergibt sich so eine einzelne Häufigkeit für das Histogramm.
Shifting the maximum values to the minimum values in each frequency bin and zeroing the remaining values is not a single value of a single signal equal to the value of the associated transformation signal. Nevertheless, the phases can be taken over. Instead of zeroing the non-minimum points, the hold value ηΡ Μά can also be used. This prevents jumps in the individual signals. FIG. 6 shows a scatter plot of the amplitudes of two mixed output signals X 1 and X 2 , wherein the output signals X 1 and X 2 are mutually shifted sinusoidal signals. A scatter plot represents pairs of values, whereby the value pairs are formed on the basis of the number of the data point, so to speak of the data bin. The first point of the data point of the output signal X ^ has a first amplitude and the first data point of the output signal X 2 an equal or a different amplitude. These two amplitudes are used to set a point in the scatter plot 9. By using a multiplicity of data points in each case of the output signal X 1 and of the output signal X 2 , the same number of data-point pairs is produced. In this case, on the axis 10, the amplitude of the output signal X, and indicated on the axis 11, the amplitude of the output signal X 2 . By using, for example, 4096 data points on the output signal X ^ and the output signal X 2 , one obtains 4096 pairs of data points. These form in the scatter diagram a point cloud 12, which is formed from a plurality of the individual pairs of data points 13 determined points. FIG. 7 shows a correspondingly formed scattergram 14, wherein the output signals X ! and X 2, however, were Fourier transformed and the amplitudes of the signals according to
Figure imgf000016_0001
were calculated. Correspondingly, the magnitude of the amplitude of X l org , ie the Fourier transform of the output signal X 1 ( and the magnitude of the amplitude of X lfir are plotted on axis 15. By calculating the slope of the straight lines 17 and 18, the mixing ratios are obtained However, instead of forming a scattergram and determining the slope of the resulting straight line, the output signals Xi and X 2 of the A scattering diagram is used to determine a histogram from the pairs of angles Θ and vector ψ in which the angles are shortened to an integer and corresponding frequencies are derived therefrom Angles from each pair of points this results in a single frequency for the histogram.
Dieses Histogramm wird mit einer Glättungsfunktion geglättet, sodass die Anzahl lokaler Minima und Maxima verringert wird. Als Glättungsfunktion kann beispielsweise die Funktion This histogram is smoothed with a smoothing function, reducing the number of local minima and maxima. As a smoothing function, for example, the function
Figure imgf000017_0001
herangezogen werden, die weiter oben bereits beschrieben wurde. Ein derart geglättetes Histogramm ist in Figur 8 dargestellt. Auf der Achse 19 sind Winkel in Grad angegeben, und zwar von 0° bis 90°, während auf der Achse 20 die jeweiligen Häufigkeiten dargestellt sind. Das Histogramm 21 hat ein absolutes Maximum 22 und mehrere lokale Maximal 23, 24 und 25. Der Anzahl der Häufigkeiten nach sortiert, hat das Maximum 22 den größten Wert, danach folgen die Maxima 25, 24 und 23. Von diesen Maxima wird beginnend bei dem Maximum mit den größten Häufigkeiten entweder eine vorgegebene Anzahl ausgewählt, beispielsweise für zwei Maxima die Maximal 22 und 25. Es können aber auch so lange Maxima ausgewählt werden, solange die Häufigkeit über einem Schwellenwert liegt. Setzt man diesen beispielsweise bei 10 an, so folgen weitere Berechnungen für die Maxima 22, 25 und 24, aber nicht für das Maximum 23, das unter diesem Schwellenwert liegt.
Figure imgf000017_0001
be used, which has already been described above. Such a smoothed histogram is shown in FIG. On the axis 19 are given in degrees, from 0 ° to 90 °, while on the axis 20, the respective frequencies are shown. The histogram 21 has an absolute maximum 22 and several local maximum 23, 24 and 25. The number of frequencies is sorted by the maximum 22 has the largest value, followed by the maxima 25, 24 and 23. From these maxima is starting from the Maximum with the highest frequencies either a predetermined number selected, for example, for two maxima the maximum 22 and 25. However, so long maxima can be selected as long as the frequency is above a threshold. If one uses this, for example, at 10, then further calculations for the maxima 22, 25 and 24, but not for the maximum 23, which is below this threshold.
Jedes Maximum steht für einen Winkel. Das Maximum 22 beispielsweise für 18° und das Maximum 25 für 72°. Every maximum stands for an angle. The maximum 22 for example for 18 ° and the maximum 25 for 72 °.
Die Angabe des Winkels kann dabei gemäß der Formel γΝ = Index(max(hgl TP )) erfolgen. Aus den so bestimmten Winkeln ergibt sich für jeden Winkel jeweils ein Mischverhältnis gemäß der Formel The indication of the angle can take place according to the formula γ Ν = index (max (h gl TP )). From the thus determined angles results for each angle in each case a mixing ratio according to the formula
VN = ton( N ) . N ist der Index des zu extrahierenden Quellsignals. Damit ist die Bestimmung der Mischungsverhältnisse anhand einer Richtungsinformation abgeschlossen. Die Ermittlung der Subtraktionssignale Xl und X2 erfolgt gemäß der weiter oben angegebenen Formel, insbesondere können die Subtraktionssignale Xy und X2 auch blockweise ermittelt werden. Es können also jeweils ein vorgegebener Satz an Datenpunkten, beispielsweise jeweils 4096 Datenpunkte der Ausgangsignale und X2 zu Subtraktionssignalen X und X2 unter Verwendung der Mischverhältnisse berechnet werden. Die Subtraktionssignale Χ und X2 werden gemäß dem in Figur 9 gezeigten Overlap-Add-Verfahren fouriertransformiert. Gezeigt sind Datenblöcke 26, 27, 28 und 29 bestehend aus jeweils 2048 Datenpunkten des Subtraktionssignals Χ bzw. des Subtraktionssignals X2. Der Zahlenwert 2048 ergibt sich dabei daraus, dass es sich um die Hälfte der zur Fouriertransformation verwendeten Datenpunkte handelt. Die Anzahl der Datenpunkte der Datenblöcke 26 bis 29 ergibt sich somit aus der Anzahl der Datenpunkte eines Datenblocks 30 bis 33. V N = ton ( N ). N is the index of the source signal to be extracted. Thus, the determination of the mixing ratios is completed on the basis of a direction information. The determination of the subtraction signals X l and X 2 is carried out according to the formula given above, in particular the subtraction signals X y and X 2 can also be determined in blocks. Thus, in each case a predefined set of data points, for example 4096 data points each of the output signals and X 2 to subtraction signals X and X 2 can be calculated using the mixing ratios. The subtraction signals Χ and X 2 are Fourier-transformed according to the overlap-add method shown in FIG. Shown are data blocks 26, 27, 28 and 29 each consisting of 2048 data points of the subtraction signal Χ and the subtraction signal X 2 . The numerical value 2048 results from the fact that it is half of the data points used for Fourier transformation. The number of data points of the data blocks 26 to 29 thus results from the number of data points of a data block 30 to 33.
Der Datenblock 30 setzt sich aus den Datenblöcken 26 und 27 zusammen und hat dementsprechend die doppelte Anzahl an Datenpunkten eines Datenblocks 26 oder 27. Dieser Datenblock 30 ist der Datenblock, der fouriertransformiert wird. Der Datenblock 31 besteht aus den Datenblöcken 27 und 28, der Datenblock 32 aus den Datenblöcken 28 und dem folgenden Datenblock. Der Datenblock 27 ist also im Datenblock 30 und 31 enthalten, der Datenblock 18 im Datenblock 31 und 32. The data block 30 is composed of the data blocks 26 and 27 and accordingly has twice the number of data points of a data block 26 or 27. This data block 30 is the data block which is Fourier-transformed. The data block 31 consists of the data blocks 27 and 28, the data block 32 of the data blocks 28 and the following data block. The data block 27 is thus contained in the data block 30 and 31, the data block 18 in the data block 31 and 32nd
Vor der Fouriertransformation werden die Datenblöcke 30, 31 , 32 und 33 noch mit einem Hanning-Fenster multipliziert. Dadurch lassen sich Leck-Effekte bei der Fouriertransformation minimieren. Before the Fourier transformation, the data blocks 30, 31, 32 and 33 are multiplied by a Hanning window. As a result, leakage effects in the Fourier transformation can be minimized.
Figur 10 zeigt ein 3D-Amplitudenspektrum der Transformationssignale , , X2 und des Restwertsignals X^ . Auf der Achse 35 ist die jeweilige Nummer eine Frequenz-Bin, also eines durchnummerierten Punktes im Vektor eines Signals gezeigt, während auf Achse 36 der Betragswert angegeben ist. Achse 37 gibt die jeweiligen Betragswerte an. An Stelle 38 liegt das Signal X-. an Stelle 39 das Signal und an Stelle 40 das SignalFIG. 10 shows a 3D amplitude spectrum of the transformation signals,, X 2 and of the residual value signal X 1. On the axis 35, the respective number is a frequency bin, that is a numbered point in the vector of a signal shown, while on axis 36 of the amount value is indicated. Axis 37 indicates the respective amount values. In place 38 is the signal X-. in place 39 the signal and in place 40 the signal
Figure imgf000018_0001
X,
Figure imgf000018_0001
X,
Die in Figur 10 gezeigten Signale wurden aus zwei reinen Sinussignalen ermittelt. Bei realen Signalen sind mehr oder weniger alle Frequenz-Bins gefüllt, zur Veranschaulichung sind die Sinussignale jedoch besonders geeignet. Aus der Darstellung in Figur 10 folgt direkt, dass die Signale X, X, und X, jeweils lediglich drei Peaks aufweisen, die verschieden hoch sind, ansonsten aber lediglich Nullstellen haben. Figur 11 zeigt ein 3D-Amplitudenspektrum der Einzelsignale Sl t S2 sowie dem Restsignalgemisch S3 . Die Achse 35 gibt wiederum den Frequenz-Bin an und die Achse 36 den Betrag. Auf der Achse 42 sind dagegen die erhaltenen Einzelsignale aufgetragen. An Stelle 43 befindet sich das Einzelsignal IsJ , an Stelle 44 das Restsignal \s3\ und an Stelle 45 das Einzelsignal \S2\ . Zu den jeweiligen von Null verschiedenen Stellen der Einzelsignale und sind aus den Transformationssignalen Χ und X2 noch jeweils die Phasen heranzuziehen, um die Einzelsignale und rückwärts fouriertransformieren zu können. The signals shown in FIG. 10 were determined from two pure sinusoidal signals. For real signals, more or less all frequency bins are filled, but for purposes of illustration the sinusoidal signals are particularly suitable. From the illustration in FIG. 10 it follows directly that the signals X, X, and X each have only three peaks which are of different heights but otherwise have only zeros. 11 shows a 3D amplitude spectrum of the individual signals S lt S 2 and the residual signal mixture S 3 . The axis 35 again indicates the frequency bin and the axis 36 the amount. On the other hand, the obtained individual signals are plotted on the axis 42. In place 43 is the single signal IsJ, at position 44, the residual signal \ s 3 \ and 45 instead of the single signal \ S 2 \. To the respective non-zero digits of the individual signals and are from the transformation signals Χ and X 2 still each use the phases in order to be able to Fourier transform the individual signals and backward.
Figur 12 zeigt schematisch die Gewinnung der Einzelsignale aus den Transformationssignalen X , X2 und dem Restwertsignal X3 . Der Vektor 46 gibt dabeiFIG. 12 schematically shows the extraction of the individual signals from the transformation signals X, X 2 and the residual value signal X 3 . The vector 46 is there
Ausschnittsweise des Transformationssignals X wieder, entsprechend Vektor 47 dieSection of the transformation signal X again, according to vector 47 the
Zahlenwerte des Transformationssignals X2 , Vektor 48 die Werte des Restsignals X3 undNumerical values of the transformation signal X 2 , vector 48 the values of the residual signal X 3 and
Vektor 49 die entsprechenden Frequenz-Bins. Vector 49 the corresponding frequency bins.
Aus diesen geht das in Vektor 50 gezeigte Einzelsignal S, , dass in Vektor 51 gezeigte Einzelsignal S2 und das in Vektor 52 gezeigte Restwertsignal S3 folgendermaßen hervor: Für Frequenz-Bin 1 liegt das Minimum in Vektor 48, da die Zahlen 5 und 7 größer als 1 sind. Im Frequenz-Bin 1 der entsprechenden Vektoren 50, 51 und 52 werden daher folgende Werte eingesetzt: an Stelle des Minimalwerts 1 wird der Maximalwert 7 gesetzt. Dieser ist daher am Frequenz-Bin 1 des Vektors 52 zu setzen. Die übrigen Werte in Frequenz-Bin 1 , nämlich in den Vektoren 50 und 51 , werden auf Null gesetzt. Die Minimumsbetrachtung findet also spaltenweise, daten punktweise bzw. frequenz-binweise statt. Diese Ausdrücke sind identisch. From these, the single signal S i shown in vector 50, the single signal S 2 shown in vector 51 and the residual signal S 3 shown in vector 52 result as follows: For frequency bin 1, the minimum lies in vector 48, since the numbers 5 and 7 are greater than 1. The following values are therefore used in the frequency bin 1 of the corresponding vectors 50, 51 and 52: instead of the minimum value 1, the maximum value 7 is set. This is therefore to be set to the frequency bin 1 of the vector 52. The remaining values in frequency bin 1, viz. In vectors 50 and 51, are set to zero. The minimum consideration thus takes place column wise, data pointwise or frequency binwise. These expressions are identical.
Entsprechend werden die Werte der Spalten für Frequenz-Bin 2, 3, 4, 5, usw. berechnet, so dass sich die in Figur 12 gezeigten Werte jeweils ergeben. Accordingly, the values of the columns for frequency bin 2, 3, 4, 5, etc. are calculated so that the values shown in Fig. 12 result respectively.
In Vektor 50 werden die Werte bzw. Mimimumswerte zu Vektor 46 gesammelt, in Vektor 51 diejenigen zu Vektor 47 und in Vektor 52 diejenigen zu Vektor 48. In vector 50, the values or minimum values for vector 46 are collected, in vector 51 those for vector 47 and in vector 52 those for vector 48.
Zu den Vektoren 50 und 51 der Einzelsignale 5, und S2 werden darauffolgend noch die Phasen der Transformationssignale X, und X2 zugeordnet. Rein exemplarisch wird dies für den Frequenz-Bin 4 des Vektors 50 beschrieben. Für Frequenz-Bin 4 des Vektors 50 wird die Phase des Frequenz-Bins 4 aus Vektor 46 genommen, da der Vektor 50 die Minimalstellen des Vektors 46 abbildet, sofern dort Zahlenwerte vorhanden sind. Dementsprechend wird die Phase der identischen Frequenz-Bins übertragen. Bei sämtlichen Ausgestaltungen in den Figuren können statt explizit genannter zweier Ausgangssignale, zweier Transformationssignale oder Einzelsignale auch mehr als zwei Signale verwendet werden, weiterhin können alle in der Beschreibungseinleitung genannten Ausgestaltungen auch im Hinblick auf die Figurenbeschreibung angewandt werden, sofern dies nicht ausdrücklich ausgeschlossen ist. To the vectors 50 and 51 of the individual signals 5, and S 2 , the phases of the transformation signals X, and X 2 are subsequently assigned. Purely by way of example, this is described for the frequency bin 4 of the vector 50. For vector 50 frequency bin 4 becomes the phase of the frequency bin 4 is taken from vector 46, since the vector 50 maps the minimum locations of the vector 46, if numerical values are present there. Accordingly, the phase of the identical frequency bins is transmitted. In all embodiments in the figures, instead of explicitly mentioned two output signals, two transformation signals or individual signals, more than two signals can be used, furthermore all embodiments mentioned in the introduction to the description can also be applied with regard to the description of the figures, unless this is expressly excluded.
B EZU G SZEI C H E N LISTE B EZU G SZEI C H A LIST
1 Quellsignal 27 Datenblock 1 source signal 27 data block
2 Quellsignal 28 Datenblock  2 source signal 28 data block
3 Quellsignal 29 Datenblock  3 source signal 29 data block
4 Quellsignal 30 Datenblock  4 source signal 30 data block
5 Mikrofon 35 31 Datenblock  5 Microphone 35 31 Data block
6 Mikrofon 32 Daten block  6 microphone 32 data block
7 Bestimmung Mischungsverhältnisse 33 Datenblock  7 Determination of mixing ratios 33 Data block
8 Signaltrennung 34 3D-Amplitudenspektrum 8 Signal separation 34 3D amplitude spectrum
9 Streudiagramm 35 Achse 9 scatter plot 35 axis
10 Achse 40 36 Achse  10 axis 40 36 axis
11 Achse 37 Achse  11 axis 37 axis
12 Punktwolke 38 Stelle  12 point cloud 38 point
13 Punkt 39 Stelle  13 point 39 point
14 Streudiagramm 40 Stelle  14 scatter plot 40 digit
15 Achse 45 41 3D-Amplitudenspektrum 15 Axis 45 41 3D amplitude spectrum
16 Achse 42 Achse 16 axis 42 axis
17 Gerade 43 Stelle  17 Just 43 jobs
18 Gerade 44 Stelle  18 Straight 44 place
19 Achse 45 Stelle  19 axis 45 point
20 Achse 50 46 Vektor  20 axis 50 46 vector
21 Histogramm 47 Vektor  21 histogram 47 vector
22 Maximum 48 Vektor  22 maximum 48 vector
23 Maximum 49 Frequenz-Bin  23 maximum 49 frequency bin
24 Maximum 50 Vektor  24 maximum 50 vector
25 Maximum 55 51 Vektor  25 maximum 55 51 vector
26 Datenblock 52 Vektor  26 data block 52 vector

Claims

PATENTANSPRÜCHE
1. Verfahren zur Ermittlung wenigstens zweier Einzelsignale (Sl t S2, S3, S4) aus wenigstens zwei Ausgangssignalen (X^ X2, X3, X4), die aus wenigstens zwei Quellsignalen (1, 2, 3, 4) gebildet sind, 1. A method for determining at least two individual signals (S lt S 2 , S 3 , S 4 ) from at least two output signals (X ^ X 2 , X3, X 4 ), the at least two source signals (1, 2, 3, 4) are formed,
dadurch gekennzeichnet, dass a) die Mischverhältnisse (Vi, V2, V3, V4) von wenigstens zwei Quellsignalen (1, 2, 3, 4) auf die Ausgangssignale (X^ X2, X3, X4) bestimmt werden, characterized in that a) the mixing ratios (Vi, V 2 , V 3 , V 4 ) of at least two source signals (1, 2, 3, 4) to the output signals (X ^ X 2 , X 3 , X 4 ) are determined .
b) die Ausgangssignale (X1t X2, X3, X4) mit aus dem Mischverhältnis (\ , V2, V3, V4) gebildeten Faktoren multipliziert werden und aus den Ausgangssignalen (X^ X2, X3, X4) wenigstens zwei Subtraktionssignale (Χ , X2, X , X4) ermittelt werden, sodass in jedem Subtraktionssignal (Xx, X2, X3, X4) ein Quellsignal (1, 2, 3, 4) eliminiert ist, b) the output signals (X 1t X 2 , X 3 , X 4 ) are multiplied by factors formed from the mixing ratio (\, V 2 , V 3 , V 4 ) and from the output signals (X ^ X 2 , X 3 , X 4 ) at least two subtraction signals (Χ, X 2 , X, X 4 ) are determined so that in each subtraction signal (X x , X 2 , X 3 , X 4 ) a source signal (1, 2, 3, 4) is eliminated,
c) die Subtraktionssignale {X , X2, X3, X4) fouriertransformiert werden, wodurch Transformationssignale {Χ ,Χ2, X4, X5 ) entstehen, c) the subtraction signals {X, X 2 , X 3 , X 4 ) are Fourier-transformed, resulting in transformation signals {Χ, Χ 2 , X 4 , X 5 ),
d) aus den Transformationssignalen (X ,X2, X4, X5) ein Restsignal (X3) bestimmt wird, d) a residual signal (X 3 ) is determined from the transformation signals (X, X 2 , X 4 , X 5 ),
e) wenigstens zwei Einzelsignale (S^ S2, S3, S4) anhand der Transformationssignale (XX,X2, X4, X5) und dem Restsignal (^3) berechnet werden, und e) at least two individual signals (S ^ S 2 , S 3 , S 4 ) are calculated on the basis of the transformation signals (X X , X 2 , X 4 , X 5 ) and the residual signal (^ 3 ), and
f) die Einzelsignale (5,, S2, S3, S4) durch eine inverse Fouriertransformation in berechnete Quellsignale (S^ S2, S3 und S4) transformiert werden. f) the individual signals (5, S 2 , S 3 , S 4 ) are transformed by an inverse Fourier transformation into calculated source signals (S 2 , S 3 and S 4 ).
2. Verfahren nach Anspruch 1 , 2. The method according to claim 1,
dadurch gekennzeichnet, dass die Bestimmung der Mischverhältnisse (V^ V2, V3, V) über eine Richtungsbestimmung erfolgt. characterized in that the determination of the mixing ratios (V ^ V 2 , V 3 , V) takes place via a direction determination.
3. Verfahren nach Anspruch 1 oder 2, 3. The method according to claim 1 or 2,
dadurch gekennzeichnet, dass die Bestimmung der Mischverhältnisse (V1t V2, V3, V4) folgende Schritte aufweist: Fouriertransformation der Ausgangssignale (Χι , X2, X3, X4) , characterized in that the determination of the mixing ratios (V 1t V 2 , V 3 , V 4 ) comprises the following steps: Fourier transformation of the output signals (Χι, X2, X3, X 4 ),
Berechnung der Amplitudenwerte der fouriertransformierten Ausgangssignale
Figure imgf000023_0001
Calculation of the amplitude values of the Fourier-transformed output signals
Figure imgf000023_0001
Ermittlung eines Histogramms (21 ) aus den Amplitudenwerten oder Bestimmung der Steigung der Geraden (17, 18) der Amplitudenwerte in einem Streudiagramm (14). Determining a histogram (21) from the amplitude values or determining the slope of the straight lines (17, 18) of the amplitude values in a scattergram (14).
Verfahren nach Anspruch 3, Method according to claim 3,
dadurch gekennzeichnet, dass das Histogramm (21) mit einer Glättungsfunktion multipliziert wird.  characterized in that the histogram (21) is multiplied by a smoothing function.
Verfahren nach Anspruch 4, Method according to claim 4,
dadurch gekennzeichnet, dass als Glättungsfunktion ein Hanning-Fenster, insbesondere  characterized in that as a smoothing function a Hanning window, in particular
, verwendet wird., is used.
Figure imgf000023_0002
Figure imgf000023_0002
6. Verfahren nach einem der Ansprüche 3 bis 5, 6. The method according to any one of claims 3 to 5,
dadurch gekennzeichnet, dass der Winkelabstand im Histogramm (21 ) beträgt.  characterized in that the angular distance in the histogram (21) is.
7. Verfahren nach einem der Ansprüche 3 bis 6, 7. The method according to any one of claims 3 to 6,
dadurch gekennzeichnet, dass die lokalen Extremwerte, insbesondere die lokalen Maxima (22, 23, 24, 25), des Histogramms (21) bestimmt werden. Verfahren nach Anspruch 7, characterized in that the local extreme values, in particular the local maxima (22, 23, 24, 25), of the histogram (21) are determined. Method according to claim 7,
dadurch gekennzeichnet, dass beginnend mit dem absoluten Maximum (22) jedem Maximum (22, 23, 24, 25) Winkel zugeordnet wird.  characterized in that beginning with the absolute maximum (22) each peak (22, 23, 24, 25) is assigned angle.
9. Verfahren nach Anspruch 8, 9. The method according to claim 8,
dadurch gekennzeichnet, dass die Zuordnung der Winkel bei einer vorgegebenen Anzahl oder bei Unterschreiten eines Schwellenwertes beendet wird.  characterized in that the assignment of the angle is terminated at a predetermined number or falls below a threshold value.
10. Verfahren nach einem der Ansprüche 3 bis 9, dadurch gekennzeichnet, dass ein Histogramm (21) mit einem Tiefpass gewichtet wird. 10. The method according to any one of claims 3 to 9, characterized in that a histogram (21) is weighted with a low pass.
1 1. Verfahren nach Anspruch 10, 1 1. A method according to claim 10,
dadurch gekennzeichnet, dass der Tiefpass aus zeitlich früher ermittelten Histogrammen bestimmt wird.  characterized in that the low pass is determined from temporally earlier determined histograms.
12. Verfahren nach einem der vorangehenden Ansprüche, 12. The method according to any one of the preceding claims,
dadurch gekennzeichnet, dass ein Subtraktionssignal {Xx , X2 , X3 , X4 ) bei zwei Ausgangssignalen (X^ X2) ermittelt wird, indem das mit dem Mischungsverhältnis (VN) multiplizierte zweite Ausgangssignal (X2) vom ersten (X^ subtrahiert wird, wenn das Mischungsverhältnis kleiner als 1 ist und ansonsten das erste Ausgangssignal (Xi) mit dem Kehrwert des Mischungsverhältnisses (1/VN) multipliziert und vom zweiten Ausgangssignal (X2) abgezogen wird. characterized in that a subtraction signal {X x, X 2, X 3, X 4) (for two output signals X ^ X 2) is determined by the multiplied (with the mixing ratio V N) second output signal (X 2) of the first ( X ^ is subtracted when the mixing ratio is less than 1 and otherwise the first output signal (Xi) is multiplied by the reciprocal of the mixing ratio (1 / V N ) and subtracted from the second output signal (X 2 ).
13. Verfahren nach einem der vorangehenden Ansprüche, 13. The method according to any one of the preceding claims,
dadurch gekennzeichnet, dass für die Fouriertransformation eine Zweierpotenz an Datenpunkten, insbesondere 1024, 2048 oder 4096 Datenpunkte verwendet werden.  characterized in that a power of two at data points, in particular 1024, 2048 or 4096 data points are used for the Fourier transformation.
Verfahren nach einem der vorangehenden Ansprüche, Method according to one of the preceding claims,
dadurch gekennzeichnet, dass die Datenpunkte zur Fouriertransformation quasikontinuierlich und nach dem Overlap- Add-Verfahren herangezogen werden.  characterized in that the data points for Fourier transformation are used quasi-continuously and according to the overlap-add method.
Verfahren nach einem der vorangehenden Ansprüche, Method according to one of the preceding claims,
dadurch gekennzeichnet, dass ein Restwertsignal ( X} ) als Subtraktionssignal der Transformationssignale bestimmt wird characterized in that a residual value signal (X } ) is determined as a subtraction signal of the transformation signals
Verfahren nach einem der vorangehenden Ansprüche, Method according to one of the preceding claims,
dadurch gekennzeichnet, dass ein Einzelsignal ( 5, , S2 , S} , S4) mittels einer Extremwertbestimmung wenigstens eines Transformationssignals {Χ , Χ2 , X4 , X5 ) und/oder des Restwertsignals (X3 ) bestimmt wird. characterized in that a single signal (5,, S 2 , S } , S 4 ) by means of an extreme value determination of at least one transformation signal {Χ, Χ 2 , X 4 , X 5 ) and / or the residual value signal (X 3 ) is determined.
Verfahren nach einem der vorangehenden Ansprüche, Method according to one of the preceding claims,
dadurch gekennzeichnet, dass die Frequenzen eines Einzelsignals (£, , S2 , S3 , SA ) durch Minimabestimmung erkannt werden. characterized in that the frequencies of a single signal (£,, S 2 , S 3 , S A ) are detected by minimization.
18. Verfahren nach Anspruch 16 oder 17, 18. The method according to claim 16 or 17,
dadurch gekennzeichnet, dass in den Transformationssignalen (Xl,X2, X4, X5) und dem Restwertsignal (X3) zur Erzeugung der Einzelsignale (S,, S2, S3, S4) für jeden Frequenz-Bin (49) dascharacterized in that in the transformation signals (X 1 , X 2 , X 4 , X 5 ) and the residual value signal (X 3 ) for generating the individual signals (S, S 2 , S 3 , S 4 ) for each frequency bin (49)
Minimum ermittel wird, an dessen Stelle das Maximum des jeweiligen Frequenz-Bins (49) gesetzt wird und die restlichen Werte auf Null gesetzt werden. Minimum is determined, in place of which the maximum of the respective frequency bins (49) is set and the remaining values are set to zero.
19. Verfahren nach Anspruch 18, 19. The method according to claim 18,
dadurch gekennzeichnet, dass zu den Amplitudenwerten der Einzelsignale (_?,, S2, S3, S4) die jeweiligen Phasenwerte der Transformationssignale (Χ , X2 , X5 , X4) ermittelt werden. characterized in that the respective phase values of the transformation signals (Χ, X 2 , X 5 , X 4 ) are determined for the amplitude values of the individual signals (? 1 , 2 2 , S 3 , S 4 ).
Verfahren nach einem der vorangehenden Ansprüche, Method according to one of the preceding claims,
dadurch gekennzeichnet, dass die Anzahl der zu berechnenden Quellsignale (S^ S2, S3 und S4) und/oder das oder die Quellsignale (1, 2, 3, 4) selbst vorgegeben werden. characterized in that the number of the source signals to be calculated (S ^ S 2 , S 3 and S 4 ) and / or the one or more source signals (1, 2, 3, 4) are themselves predefined.
PCT/DE2013/000788 2012-12-20 2013-12-10 Method for detecting at least two individual signals from at least two output signals WO2014094709A2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015548194A JP6163211B2 (en) 2012-12-20 2013-12-10 Method for calculating at least two individual signals from at least two output signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102012025016.9A DE102012025016B3 (en) 2012-12-20 2012-12-20 Method for determining at least two individual signals from at least two output signals
DE102012025016.9 2012-12-20

Publications (2)

Publication Number Publication Date
WO2014094709A2 true WO2014094709A2 (en) 2014-06-26
WO2014094709A3 WO2014094709A3 (en) 2014-08-14

Family

ID=49999650

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2013/000788 WO2014094709A2 (en) 2012-12-20 2013-12-10 Method for detecting at least two individual signals from at least two output signals

Country Status (3)

Country Link
JP (1) JP6163211B2 (en)
DE (1) DE102012025016B3 (en)
WO (1) WO2014094709A2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017106048A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for generating and outputting a multi-channel acoustic signal
DE102017106022A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh A method for outputting an audio signal into an interior via an output device comprising a left and a right output channel
CN110278721B (en) 2018-01-18 2021-10-12 Ask工业有限公司 Method for outputting an audio signal depicting a musical piece into an interior space via an output device
CN111972928B (en) * 2020-08-21 2023-01-24 浙江指云信息技术有限公司 Sleep-aiding pillow with surrounding sound field and adjusting and controlling method thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
JP2009282536A (en) * 2003-05-30 2009-12-03 National Institute Of Advanced Industrial & Technology Method and device for removing known acoustic signal
JP4580210B2 (en) * 2004-10-19 2010-11-10 ソニー株式会社 Audio signal processing apparatus and audio signal processing method
US7912232B2 (en) * 2005-09-30 2011-03-22 Aaron Master Method and apparatus for removing or isolating voice or instruments on stereo recordings

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None

Also Published As

Publication number Publication date
WO2014094709A3 (en) 2014-08-14
JP6163211B2 (en) 2017-07-12
JP2016504622A (en) 2016-02-12
DE102012025016B3 (en) 2014-05-08

Similar Documents

Publication Publication Date Title
DE602004002390T2 (en) AUDIO CODING
DE2345296C3 (en) Decoder for a 4-2-4 matrix display
DE60306512T2 (en) PARAMETRIC DESCRIPTION OF MULTI-CHANNEL AUDIO
EP0750811B1 (en) Process for coding a plurality of audio signals
EP1655998B1 (en) Method for generating stereo signals for spaced sources and corresponding acoustic system
DE69827775T2 (en) TONKANALSMISCHUNG
WO2006039994A2 (en) Method and device for the extraction of a melody on which an audio signal is based
DE102005014477A1 (en) Apparatus and method for generating a data stream and generating a multi-channel representation
EP1280138A1 (en) Method for audio signals analysis
WO2006039995A1 (en) Method and device for harmonic processing of a melodic line
EP2499843B1 (en) Method for mixing microphone signals of a recording using multiple microphones
DE2431161A1 (en) ELECTRONIC MUSICAL INSTRUMENT
WO2005122136A1 (en) Apparatus and method for determining a chord type on which a test signal is based
DE102012025016B3 (en) Method for determining at least two individual signals from at least two output signals
EP2939445B1 (en) Production of 3d audio signals
DE102012017296A1 (en) Generation of multichannel sound from stereo audio signals
EP1023777B1 (en) Method and device for limiting a stream of audio data with a scaleable bit rate
EP1787283A1 (en) Extraction of a melody on which an audio signal is based
WO2015049332A1 (en) Derivation of multichannel signals from two or more basic signals
DE10148351B4 (en) Method and device for selecting a sound algorithm
DE3929481A1 (en) Noise reduction equipment in speech signal processing system - couples microphones by hierarchical neuronal networks to digital processor
EP2601593A2 (en) Device and method for evaluating and optimizing signals on the basis of algebraic invariants
DE3335026C2 (en)
DE1189745B (en) Method for identifying sound events
DE112020001090T5 (en) SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2015548194

Country of ref document: JP

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 13823925

Country of ref document: EP

Kind code of ref document: A2