DE102012025016B3 - Method for determining at least two individual signals from at least two output signals - Google Patents

Method for determining at least two individual signals from at least two output signals Download PDF

Info

Publication number
DE102012025016B3
DE102012025016B3 DE102012025016.9A DE102012025016A DE102012025016B3 DE 102012025016 B3 DE102012025016 B3 DE 102012025016B3 DE 102012025016 A DE102012025016 A DE 102012025016A DE 102012025016 B3 DE102012025016 B3 DE 102012025016B3
Authority
DE
Germany
Prior art keywords
signals
signal
transformation
determined
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102012025016.9A
Other languages
German (de)
Inventor
Daniel Kotulla
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ask Industries GmbH
Original Assignee
Ask Industries GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ask Industries GmbH filed Critical Ask Industries GmbH
Priority to DE102012025016.9A priority Critical patent/DE102012025016B3/en
Priority to JP2015548194A priority patent/JP6163211B2/en
Priority to PCT/DE2013/000788 priority patent/WO2014094709A2/en
Application granted granted Critical
Publication of DE102012025016B3 publication Critical patent/DE102012025016B3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Complex Calculations (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Ermittlung wenigstens zweier Einzelsignale aus wenigstens zwei Ausgangssignalen, die aus wenigstens zwei Quellsignalen gebildet sind, wobei die Mischungsverhältnisse von wenigstens zwei Quellsignalen auf die Ausgangssignale bestimmt werden, die Ausgangssignale mit aus dem Mischverhältnis gebildeten Faktoren multipliziert werden und aus den Ausgangssignalen wenigstens zwei Subtraktionssignale ermittelt werden, sodass in jedem Subtraktionssignal ein Quellsignal eliminiert ist, die Subtraktionssignale fouriertransformiert werden, wodurch Transformationssignale entstehen, aus den Transformationssignalen ein Restsignal bestimmt wird, wenigstens zwei Einzelsignale anhand der Transformationssignale und dem Restsignal berechnet werden, und die Einzelsignale durch eine inverse Fouriertransformation transformiert werden.The invention relates to a method for determining at least two individual signals from at least two output signals which are formed from at least two source signals, the mixing ratios of at least two source signals to the output signals being determined, the output signals being multiplied by factors formed from the mixing ratio and from the output signals at least two subtraction signals are determined so that a source signal is eliminated in each subtraction signal, the subtraction signals are Fourier-transformed, which results in transformation signals, from the transformation signals a residual signal is determined, at least two individual signals are calculated on the basis of the transformation signals and the residual signal, and the individual signals by an inverse Fourier transform can be transformed.

Description

Die Erfindung betrifft ein Verfahren zur Ermittlung wenigstens zweier Einzelsignale gemäß dem Oberbegriff von Anspruch 1. Es ist bekannt, zwei oder mehr Schallquellen so aufzunehmen, dass dadurch ein Stereosignal gebildet werden kann. Hierzu werden Pegeldifferenzen oder Laufzeitdifferenzen ausgenutzt. Durch die Stereosignale soll ein räumlicher Schalleindruck entstehen.The invention relates to a method for determining at least two individual signals according to the preamble of claim 1. It is known to record two or more sound sources so that thereby a stereo signal can be formed. For this, level differences or differences in maturity are used. The stereo signals should create a spatial sound impression.

Bekannte Verfahren der Stereophonie sind das AB-Verfahren, die Intensitäts-Stereophonie in Form des XY-Verfahrens oder des MS-Verfahrens sowie gemischte Verfahren wie das ORTF-Verfahren oder das OSS-Verfahren.Known methods of stereophony are the AB method, the intensity stereophony in the form of the XY method or the MS method and mixed methods such as the ORTF method or the OSS method.

In den letzten Jahren sind immer mehr Klangsysteme auf den Markt gekommen, die mehr als zwei Lautsprecher umfassen. Insbesondere befinden sich derartige Klangsysteme schon seit vielen Jahren beispielsweise in Kraftfahrzeugen, die wenigstens zwei Lautsprecher in den Seitentüren und zwei Lautsprecher in inneren Bereich des Kraftfahrzeuges aufweisen.In recent years, more and more sound systems have come on the market, which include more than two speakers. In particular, such sound systems are already for many years, for example, in motor vehicles having at least two speakers in the side doors and two speakers in the inner region of the motor vehicle.

Daher sind Verfahren entwickelt worden, um mehr als zwei Einzelsignale zur Verfügung zu stellen, wie dies bei der Stereophonie der Fall ist. Dabei gibt es im Wesentlichen zwei unterschiedliche Ansätze:
Zum einen gibt es Verfahren, die aus einer Vielzahl von Ausgangssignalen jedes Quellsignal herausrechnen können. Als Quellsignal wird dabei jedes Instrument und jede Sing- oder Sprechstimme verstanden. Bei Chören kann aber auch eine Mehrzahl an Sängern als ein Quellsignal aufgefasst werden, beispielsweise kann „der Sopran” als eine Singstimme begriffen werden, obwohl er beispielsweise zwanzig Sängerinnen umfasst.
Therefore, methods have been developed to provide more than two individual signals, as is the case with stereophony. There are essentially two different approaches:
First, there are methods that can calculate out of a variety of output signals of each source signal. The source signal is understood to mean every instrument and every voice or speaking voice. In choirs, however, a plurality of singers can be considered as a source signal, for example, "the soprano" can be understood as a singing voice, although it includes, for example, twenty singers.

Insgesamt gesehen besteht das Problem also darin, aus zwei Ausgangssignalen wie sie bei Stereosignalen vorliegen oder auch mehr Ausgangssignalen eine beliebige Anzahl von Quellsignalen herauszufiltern.Overall, therefore, the problem consists in filtering out any number of source signals from two output signals as they are in stereo signals or even more output signals.

Derartige Verfahren zur Quelltrennung werden unter dem Schlagwort „Blind ... Separation” geführt. Dabei gibt es im Wesentlichen zwei Arten von Verfahren. Die einen arbeiten mit statistischen Verfahren, wie der Unabhängigkeitsanalyse, der Hauptkomponentenanalyse, der Maximum-A-Postariori-Methode, der Maximum-Likelyhood-Methode. Daneben ist es auch bekannt, rekursive Optimierungsmethoden zu verwenden. Die bekannten Verfahren erlauben dabei entweder eine Ermittlung beliebiger Quellsignale aus einer geringeren Anzahl von Ausgangssignalen mit hohem Rechenaufwand oder setzen zu einer Echtzeitberechnung eine Anzahl von Ausgangssignalen voraus, die größer oder gleich der Anzahl der Quellsignale ist.Such methods for source separation are led under the keyword "Blind ... Separation". There are essentially two types of procedures. Some work with statistical methods such as independence analysis, principal component analysis, the maximum-a-postariori method, the maximum likelihood method. In addition, it is also known to use recursive optimization methods. The known methods either allow a determination of any source signals from a smaller number of output signals with high computational complexity or require a real-time calculation, a number of output signals that is greater than or equal to the number of source signals.

In der Druckschrift „Audio Engineering Society-Convention Paper 6924” wird ein Verfahren zur unterbestimten Quelltrennung beschrieben. Es wird geschildert, wie Subtraktionssignale gebildet werden können. Auch das bearbeiten der Signale mittels Fourier-Transformation wird hier offenbart.The publication "Audio Engineering Society-Convention Paper 6924" describes a method for underdetermined source separation. It is described how subtraction signals can be formed. The processing of the signals by means of Fourier transformation is also disclosed here.

Auch die US-Patentanmeldung US2007/0076902A1 beschreibt ebenfalls das Trennen von Audio-Signalen. Diese werden im Frequenzbereich mit Restsignalen bearbeitet.US patent application US2007 / 0076902A1 also describes the separation of audio signals. These are processed in the frequency domain with residual signals.

Es ist daher Aufgabe der vorliegenden Erfindung, das Verfahren mit den Merkmalen des Oberbegriffs des Anspruchs 1 derart weiterzubilden, dass auch bei einer Anzahl von Ausgangssignalen, die kleiner als die Anzahl der Quellsignale ist, eine Quelltrennung in Echtzeit ermöglicht wird. Diese Aufgabe wird durch die Merkmale des Anspruches 1 gelöst. Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den Unteransprüchen.It is therefore an object of the present invention to further develop the method with the features of the preamble of claim 1 such that even with a number of output signals which is smaller than the number of source signals, a source separation in real time is made possible. This object is solved by the features of claim 1. Advantageous developments of the invention will become apparent from the dependent claims.

Als Kern der Erfindung wird es angesehen, dass aus den Ausgangssignalen Subtraktionssignale ermittelt werden, die fouriertransformiert werden und in den so erhaltenen Transformationssignalen Einzelsignale ermittelt werden. Dadurch dass auf statistische Verfahren und rekursive Verfahren verzichtet wird, gelingt eine Ermittlung der Einzelsignale in Echtzeit. Echtzeit bedeutet dabei, dass ein anfallender Datenstrom mit einem marginalen zeitlichen Versatz der bei der Berechnung des ersten Blocks von Signalen entsteht, die wiederzugebenden Signale ohne Unterbrechung bereitgestellt werden können. Es ist also möglich, beispielsweise aus einer Aufnahme eine bestimmte Singstimme und beispielsweise das Klavier zu extrahieren, bestimmten Lautsprechern mit einem auszuwählenden Mischungsverhältnis zuzuordnen wobei die Ausgangssignale nicht vorverarbeitet sein müssen. Es soll also beispielsweise möglich sein, in einem Kraftfahrzeug eine CD einzulegen, ein Lied und ggf. die Verteilung der zu extrahierenden Signale wie auch die zu extrahierenden Signale selbst festzulegen, und dass Abspielen des Liedes oder der CD zu beginnen, ohne dass es zu einer merklichen Verzögerung kommt.As the core of the invention, it is considered that subtraction signals are determined from the output signals, which are Fourier-transformed and individual signals are determined in the transformation signals thus obtained. By eliminating statistical methods and recursive methods, it is possible to determine the individual signals in real time. Real-time means that a resulting data stream with a marginal time offset arises when calculating the first block of signals, the signals to be reproduced can be provided without interruption. It is thus possible, for example, to extract from a recording a certain singing voice and, for example, the piano, to assign certain loudspeakers with a mixing ratio to be selected, whereby the output signals need not be preprocessed. It should thus be possible, for example, to insert a CD in a motor vehicle, to specify a song and possibly the distribution of the signals to be extracted as well as the signals to be extracted, and to start playing the song or the CD without it noticeable delay comes.

Die Mischverhältnisse von Quellsignalen auf die Ausgangssignale können mit einer Richtungsbestimmung ermittelt werden. Dafür werden die Ausgangssignale fouriertransformiert und die Amplitudenwerte berechnet. Diese Amplitudenwerte werden zu einem Histogramm zusammengefasst. Dafür werden aus den fouriertransformierten Ausgangssignalen Punktepaare gebildet, wobei die Punktepaare im Histogramm mittels des erhaltenen Winkels zusammengefasst werden. Der Winkel der Punktepaare nimmt dabei Werte zwischen 0° und 90° an und ermittelt sich wie folgt:

Figure DE102012025016B3_0002
The mixing ratios of source signals to the output signals can be determined with a direction determination. For this purpose, the output signals are Fourier-transformed and the amplitude values are calculated. These amplitude values are combined into a histogram. For this purpose, pairs of dots are formed from the Fourier-transformed output signals, the pairs of points in the histogram being combined by means of the angle obtained. The angle of the pairs of points assumes values between 0 ° and 90 ° and is calculated as follows:
Figure DE102012025016B3_0002

Dabei bezeichnet X ~1,org das fouriertransformierte erste Ausgangssignal X1, X ~2,org das fouriertransformierte zweite Ausgangssignal X2 und ax sowie ay Vektoren, in denen die Beträge gespeichert werden. Der Buchstabe l ist der Zählindex der Ausgangssignale X1 und X2 bzw. der fouriertransformierten Ausgangssignale X ~1,org und X ~2,org, anhand dessen die Punktepaare festgemacht werden. Der erste Wert des fouriertransformierten Ausgangssignals X ~1,org und der erste Wert des fouriertransformierten Ausgangssignals X ~2,org, die nichts anderes als Vektoren sind, bilden damit das erste Punktepaar, mit l = 1. Natürlich kann der Zählindex l auch bei 0 beginnen, er läuft dann bis L – 1. L bezeichnet dabei die Anzahl der fouriertransformierten Punkte jeweils der Ausgangssignale X1 und X2, beispielsweise 4096. θ ist ein Winkel zwischen 0° und 90°. und (ψl der Betrag des Punktepaares mit Index l.Here, X ~ 1, org denotes the Fourier-transformed first output signal X 1 , X ~ 2, org the Fourier-transformed second output signal X 2 and a x and a y vectors in which the amounts are stored. The letter l is the counting index of the output signals X 1 and X 2 and the Fourier transformed output signals X ~ 1, org and X ~ 2, org , by means of which the pairs of points are fixed. The first value of the Fourier transformed output signal X ~ 1, org and the first value of the Fourier transformed output signal X ~ 2, org , which are nothing else than vectors, thus form the first pair of points, with l = 1. Of course, the count index l can also be at 0 It then starts running to L-1. L denotes the number of Fourier-transformed points respectively of the output signals X 1 and X 2 , for example 4096. θ is an angle between 0 ° and 90 °. and (ψ l the amount of the pair of points with index l.

Der Vektor ψl beinhaltet die Summe der Beträge der Vektoren ax sowie ay: ψl = axl + ayl The vector ψ l contains the sum of the sums of the vectors a x and a y : ψ l = a + a xl yl

Die Fouriertransformation wird blockweise durchgeführt. Als Eingangssignal wird jeweils eine Zweierpotenz, also eine Potenz zur Basis 2, verwendet. Es hat sich herausgestellt, dass Potenzen von 10, 11 oder 12, also 1024, 2048 oder 4096 Datenpunkte, besonders effizient sind. Besonders bevorzugt sind 4096 Datenpunkte, da bei diesen die Rechenzeit im Hinblick auf den Rechenaufwand optimiert ist.The Fourier transformation is performed block by block. In each case a power of two, ie a power to the base 2, is used as the input signal. It has been found that powers of 10, 11 or 12, ie 1024, 2048 or 4096 data points, are particularly efficient. Particularly preferred are 4096 data points, since in these the computing time is optimized in terms of computational effort.

Die Einteilung des Histogramms erfolgt bevorzugt in 1°-Schritten, d. h., dass das Histogramm 90 Elemente enthält. Die Werte vom Winkel θ werden dabei auf ganze Zahlen gerundet, um den Wertebereich des Histogramms einzugrenzen.The division of the histogram is preferably carried out in 1 ° increments, d. that is, the histogram contains 90 elements. The values of the angle θ are rounded to integers in order to narrow the value range of the histogram.

Anschließend wird das Histogramm geglättet, um die Erkennung der Maxima zu verbessern. Als Glättungsfunktion wird beispielsweise folgende Funktion verwendet:

Figure DE102012025016B3_0003
Then the histogram is smoothed to improve the detection of the maxima. For example, the following function is used as the smoothing function:
Figure DE102012025016B3_0003

Der Parameter T ist eine ganze Zahl und gibt vor, wie viele Nachbarpunkte in die Glättung einbezogen werden. Es findet also eine Mittelung über mehrere Datenpunkte statt. An den Grenzen des Histogramms, wo keine Nachbarpunkte existieren, wird der Wert 0 an den entsprechenden zu ergänzenden Stellen verwendet. Bei der Berechnung des ersten Zahlenwertes des Histogramms sind also auf der einen Seite achtmal der Wert 0 anzusetzen, während auf der anderen Seite die vorhandenen Zahlenwerte verwendet werden. Im geglätteten Histogramm werden alle lokalen Extremwerte bestimmt und nach Höhe des Zahlenwertes, also nach Häufigkeit sortiert. Jede Stelle im Histogramm entspricht ja wie oben beschrieben einem Winkel, somit entspricht auch jedem Extremwert ein Winkel. Zu den ermittelten Maxima wird der zugehörige Winkel bestimmt und es werden entweder eine vorgegebene Anzahl von Maxima verwendet oder alle Maxima, deren Häufigkeit über einem vorgegebenen Schwellwert liegt.The parameter T is an integer and specifies how many neighbor points are included in the smoothing. So there is an averaging over several data points. At the boundaries of the histogram, where there are no neighboring points, the value 0 is used at the corresponding points to be supplemented. When calculating the first numerical value of the histogram, the value 0 must be set eight times on one side, while the existing numerical values are used on the other side. In the smoothed histogram, all local extreme values are determined and sorted according to the height of the numerical value, ie according to frequency. Each position in the histogram corresponds to an angle as described above, so each angle also corresponds to an angle. The corresponding angle is determined for the maxima determined and either a predefined number of maxima are used or all maxima whose frequency is above a predetermined threshold value.

Der geglättete Histogramm-Vektor ergibt sich damit zu The smoothed histogram vector thus results in

Figure DE102012025016B3_0004
Figure DE102012025016B3_0004

Dabei kann das Problem auftreten, dass ein Quellsignal nicht über die gesamte Dauer in den Ausgangssignalen auftritt. Beispielsweie haben bestimmte Instrumente oder Singstimmen Pausen. Damit diese Pausen keine Fehler in der Winkelbestimmung verursachen, ist es möglich, nach der Ermittlung von zwei oder mehr Histrogrammen und einer entsprechenden Winkelbestimmung die folgenden Histogramme mit einer Gewichtungsfunktion, beispielsweise einem Tiefpass, zu multiplizieren. Der Tiefpass kann folgendes Aussehen haben: y(n) = a × x(n) + b × y(n – 1), wobei a = 0,1 und b = 0,9 ist. Der Index n ist der Index des Histogramms, d. h. beim ersten Histogramm bzw. den ersten 4096 Datenpunkten ist n = 1. Durch die Anwendung des Tiefpasses erhält man das Histogramm hgl_TP.The problem may arise that a source signal does not appear in the output signals over the entire duration. For example, certain instruments or voices have pauses. In order for these pauses not to cause errors in the angle determination, it is possible to multiply the following histograms by a weighting function, such as a low pass, after determining two or more histograms and corresponding angle determination. The low pass can look like this: y (n) = a × x (n) + b × y (n-1), where a = 0.1 and b = 0.9. The index n is the index of the histogram, ie n = 1 for the first histogram or the first 4096 data points. The application of the low-pass filter yields the histogram h gl_TP .

Durch diese Gewichtung wird die Winkelerkennung stabilisiert.This weighting stabilizes the angle detection.

Ausgehend von den ermittelten Winkeln bestimmen sich die Mischverhältnisse zweier Quellsignale, indem die Winkel γN = Index(max(hgl_TP)). in folgender Gleichung eingesetzt werden: VN = tan(γN). Starting from the determined angles, the mixing ratios of two source signals are determined by the angles γ N = index (max (h gl_TP )). be used in the following equation: V N = tan (γ N ).

Liegt ein Maximum des Histogramms beispielsweise bei 18°, so ergibt sich so ein Mischungsverhältnis von V = 0,325.If a maximum of the histogram is, for example, 18 °, this results in a mixing ratio of V = 0.325.

Anhand der Mischungsverhältnisse werden Subtraktionssignale berechnet, die sich bei zwei Ausgangssignalen folgendermaßen ergeben:

Figure DE102012025016B3_0005
mit N = 1, 2, .... N ist der Index des auszufilternden Quellsignals.Based on the mixing ratios, subtraction signals are calculated, which result for two output signals as follows:
Figure DE102012025016B3_0005
with N = 1, 2, .... N is the index of the source signal to be filtered out.

Abhängig davon, ob das Mischungsverhältnis größer oder kleiner als 1 ist, wird das entsprechende Subtraktionssignal berechnet. Dabei ist es möglich, auch mehr als zwei Ausgangssignale zu verwenden, jedoch führt dies lediglich zu einem erhöhten Rechenaufwand. Liegen nicht nur wie bei einem Stereosignal zwei sondern mehr Ausgangssignale vor, werden zur Extraktion eines Quellsignals daher bevorzugt diejenigen zwei Ausgangssignale ausgewählt, bei der das Quellsignal am stärksten vertreten ist.Depending on whether the mixing ratio is greater or less than 1, the corresponding subtraction signal is calculated. It is possible to use more than two output signals, but this only leads to an increased computational effort. If there are not two but more output signals as in the case of a stereo signal, then those two output signals in which the source signal is most strongly represented are preferably selected for the extraction of a source signal.

Bei den so ermittelten Subtraktionssignalen ist jeweils ein Quellsignal ausgeblendet.In the case of the subtraction signals thus determined, a source signal is hidden in each case.

Diese Subtraktionssignale werden dann fouriertransformiert. Dies geschieht blockweise, wobei nachfolgende Blöcke immer mit einem Abstand beginnen, der der halben Größe der zu vorher transformierenden Datenpunkte entspricht. D. h., dass die erste Hälfte eines Blockes bereits als zweiter Teil des vorhergehenden Blockes fouriertransformiert wurde.These subtraction signals are then Fourier transformed. This happens block by block, whereby subsequent blocks always start with a distance that corresponds to half the size of the previously transforming data points. That is, the first half of a block has already been Fourier transformed as the second part of the previous block.

Dies erlaubt eine kontinuierliche Signalverarbeitung und ist unter dem Namen Overlap-Add-Verfahren bekannt.This allows continuous signal processing and is known under the name overlap-add method.

Zur Minimierung des Leck-Effektes werden die Eingangsblöcke mit einem Fenster, beispielsweise einem Hanning-Fenster multipliziert. Die Fensterfunktion f(n) für N Datenpunkte lautet:

Figure DE102012025016B3_0006
To minimize the leak effect, the input blocks are multiplied by a window, for example a Hanning window. The window function f (n) for N data points is:
Figure DE102012025016B3_0006

Aus den fouriertransformierten Subtraktionssignalen X ~, im folgenden Transformationssignale genannt, wird ein Restsignal ermittelt. Für zwei Transformationssignale X ~ ergibt sich das Restsignal als einfache Subtraktion des zweiten Transformationssignals vom ersten: X ~3 = X ~1 – X ~2. From the Fourier-transformed subtraction signals X ~, referred to below as transformation signals, a residual signal is determined. For two transform signals X ~, the residual signal results as a simple subtraction of the second transform signal from the first: X ~ 3 = X ~ 1 - X ~ 2 .

Im Folgenden wird weiterhin von zwei Transformationssignalen X ~1 und X ~2 und einem Restsignal X ~3 ausgegangen, was insgesamt drei Signale ergibt. Zur Extraktion eines Einzelsignals werden daraufhin diese drei Signale miteinander verglichen.In the following, it is further assumed that two transformation signals X ~ 1 and X ~ 2 and a residual signal X ~ 3 , resulting in a total of three signals. To extract a single signal, these three signals are then compared.

Für jeden Datenpunkt der Signale X ~1, X ~2 und X ~3, üblicherweise weist jedes Signal 4096 Datenpunkte auf, werden aus den Amplituden der drei Signale die Extremwerte berechnet.For each data point of the signals X ~ 1 X ~ 2 and X ~ 3, usually, each signal 4096 data points are calculated, the extreme values of the amplitudes of the three signals.

Ausgegangen wird von einem Array mit 3 × 4096 Datenpunkten. Die Zahl 3 gibt die Anzahl der Transformationssignale und dem Restsignal an und die 4096 die Anzahl der fouriertransformierten Datenpunkte in einem Block. Betrachtet man den ersten Datenpunkt bzw. den ersten Frequenz-Bin der Vektoren X ~1, X ~2 und X ~3, so stehen drei Zahlenwerte zum Vergleich. An der Stelle des minimalen Wertes dieser drei Werte wird der Maximalwert der beiden anderen Werte gesetzt und die anderen Werte werden auf Null gesetzt.The starting point is an array with 3 × 4096 data points. The number 3 indicates the number of transform signals and the residual signal, and the 4096 indicates the number of Fourier transformed data points in a block. If one considers the first data point or the first frequency bin of the vectors X ~ 1 , X ~ 2 and X ~ 3 , three numerical values stand for comparison. In place of the minimum value of these three values, the maximum value of the other two values is set and the other values are set to zero.

Ein Zahlenbeispiel zur Verdeutlichung:
Sei der erste Wert von X ~1 5, der erste Wert von X ~2 10 und der erste Wert von X ~3 15. Dann wird 15 an die Stelle von 5 gesetzt und der erste Wert von X ~2 und X ~3 auf 0. Die Werte werden also spaltenweise betrachtet. Man erhält ein Array aus 4096 Spalten und drei Zeilen, bei dem zwei drittel der Werte Null sind. Die Werte ungleich von Null sind unregelmäßig über die Einzelvektoren verteilt. Die Einzelvektoren zu X ~1 und X ~2 heißen S ~1 und S ~2 und sind die Fouriertranformierten der berechneten Quellsignale S1 und S2. Der sich ergebende Vektor des Restwertsignals X ~3 hat keine weitere Bedeutung.
A numerical example for clarification:
Let the first value of X ~ 1 5 be the first value of X ~ 2 10 and the first value of X ~ 3 15. Then place 15 in the place of 5 and the first value of X ~ 2 and X ~ 3 0. The values are therefore considered column by column. One obtains an array of 4096 columns and three rows in which two-thirds of the values are zero. The values unequal to zero are distributed irregularly over the individual vectors. The individual vectors for X ~ 1 and X ~ 2 are called S ~ 1 and S ~ 2 and are the Fourier transforms of the calculated source signals S 1 and S 2 . The resulting vector of the residual signal X ~ 3 has no further meaning.

Die Ermittlung von S ~1 und S ~2 ist durch folgende Formel gegeben:

Figure DE102012025016B3_0007
The determination of S ~ 1 and S ~ 2 is given by the following formula:
Figure DE102012025016B3_0007

Dabei ist k der Zählindex der Datenpunkte bzw. Frequenz-Bins und durchläuft bei 4096 Datenpunkten die Werte 1 bis 2048. Es muss nur die Hälfte der Frequenz-Bins durchlaufen werden, da aus Symmetriegründen im Zuge der Fouriertransformation die Datenpunkte doppelt vorkommen. Im obigen Beispiel war k = 1.K is the counting index of the data points or frequency bins and passes through the values 1 to 2048 for 4096 data points. Only half of the frequency bins need to be traversed, since the data points occur twice for reasons of symmetry in the course of the Fourier transformation. In the example above, k = 1.

Nimmt man die so umgewandelten Zeilen, die zu den Signalen X ~1 und X ~2 gehört haben, nämlich die Einzelsignale S ~1 und S ~2, kann man daraus die berechneten Quellsignale S1 und S2 durch eine inverse Fouriertransformation ermitteln. Als Phase kann die Phase der Signale X ~1 und X ~2 auch direkt herangezogen werden. S ~1 und S ~2 wird also die jeweilige Phase aus den Vektoren X ~1 und X ~2 zugeordnet. Die Zuordnung erfolgt natürlich in Abhängigkeit des Zählindexes k.If one takes the lines thus converted, which have belonged to the signals X ~ 1 and X ~ 2 , namely the individual signals S ~ 1 and S ~ 2 , one can use them to determine the calculated source signals S 1 and S 2 by an inverse Fourier transformation. As a phase, the phase of the signals X ~ 1 and X ~ 2 can also be used directly. S ~ 1 and S ~ 2 is thus assigned the respective phase of the vectors X ~ 1 and X ~ 2 . The assignment is of course dependent on the counting index k.

Die Einzelsignale S ~1 und S ~2 bzw. die fouriertransformierten Einzelsignale S1 und S2 können sich von den Quellsignalen aufgrund von Rechenungenauigkeiten und Rundungsfehlern leicht unterscheiden. D. h., dass eine vollständige Reproduktion eines Quellsignals zwar nicht gelingt, die Unterschiede sind aber derart gering, dass sie üblicherweise nicht bemerkbar sind.The individual signals S ~ 1 and S ~ 2 or the Fourier-transformed individual signals S 1 and S 2 may differ slightly from the source signals due to computational inaccuracies and rounding errors. This means that a complete reproduction of a source signal is not possible, but the differences are so small that they are usually not noticeable.

Zur Verbesserung der Trennung der Einzelsignale sind folgende Schritte möglich:
Um Sprünge in der Minima-Erkennung zu vermeiden kann vorgesehen sein, dass die Festlegung eines Minimums in den Signalen X ~1, X ~2 und X ~3 von der Erkennung vorhergehender Minima abhängt. Beispielsweise kann ein bedingter Tiefpassfilter verwendet werden:

Figure DE102012025016B3_0008
To improve the separation of the individual signals, the following steps are possible:
In order to avoid jumps in the minima detection it can be provided that the definition of a minimum in the signals X ~ 1 , X ~ 2 and X ~ 3 depends on the detection of preceding minima. For example, a conditional lowpass filter can be used:
Figure DE102012025016B3_0008

P t / hold (k) ist der zu merkende Wert eines Frequenz-Bins k, wobei k wieder der Zählindex ist. Der Parameter b ist frei zwischen 0 und 1 einstellbar, wobei das Merken der Frequenz bei b = 0 ausgeschaltet ist. P t / hold (k) is the value of a frequency bin k to remember, k again being the count index. The parameter b is freely adjustable between 0 and 1, whereby the note of the frequency is switched off at b = 0.

Die Ermittlung von S ~1 und S ~2 ist dann durch folgende Formel gegeben:

Figure DE102012025016B3_0009
Der Parameter η (0 ≤ η ≤ 1) gibt vor, wie stark das tiefpass-gefilterte Signal in die Einzelsignale S ~m, m = 1, 2, 3, ... eingeht.The determination of S ~ 1 and S ~ 2 is then given by the following formula:
Figure DE102012025016B3_0009
The parameter η (0 ≤ η ≤ 1) specifies how much the low-pass filtered signal enters into the individual signals S m , m = 1, 2, 3,.

Weiterhin können die Minima der Transformationssignale X ~m, m = 1, 2, 4, 5, ... getrennt mit dem Restwertsignal X ~3 verglichen werden, d. h. dass die Minimabestimmung Emin(k), Belegung mit 0 oder dem Maximalwert der Spalte Emax(k) usw. jeweils zwischen einem Transformationssignal X ~m und dem Restwertsignal X ~3 durchgeführt wird. So werden die Vektoren Emin1, Emin2, Emax1 und Emax2 ermittelt. Die Minima werden mit einem Faktor β (0 ≤ β ≤ 2) multipliziert. Je nach Wahl des Faktors ergeben sich unterschiedliche Effekte. Für β < 1 werden unerwünschte Frequenzen unterdrückt und für β > 1 ergibt sich ein harmonischeres Klangbild.Furthermore, the minima of the transformation signals X ~ m , m = 1, 2, 4, 5,... Can be compared separately with the residual value signal X ~ 3 , ie the minimum determination E min (k), zero occupancy or the maximum value of Column E max (k), etc. are each performed between a transform signal X ~ m and the residual value signal X ~ 3 . Thus, the vectors E min1 , E min2 , E max1 and E max2 are determined. The minima are multiplied by a factor β (0 ≤ β ≤ 2). Depending on the choice of the factor, different effects result. For β <1 unwanted frequencies are suppressed and for β> 1 results in a more harmonious sound.

Die Einzelsignale ergeben sich zuThe individual signals arise too

Figure DE102012025016B3_0010
Figure DE102012025016B3_0010

Zusätzlich können die Signale anhand der Phasenlage getrennt werden. Ist die Amplitude der Transformationssignale X ~m(k) im Wesentlichen identisch und hat im Restwertsignal X ~3(k) ein Minimum, wird die Phase berücksichtigt. Ist diese gleich, wird das Maximum S ~3(k) zugeordnet, ansonsten S ~1(k) und S ~2(k). Diese Betrachtung ist natürlich für jeden Frequenz-Bin k gesondert durchzuführen.In addition, the signals can be separated based on the phase angle. If the amplitude of the transform signals X ~ m (k) is substantially identical and has ~ 3 in the residual signal X (k) is a minimum, the phase is considered. If this is the same, the maximum S ~ 3 (k) is assigned, otherwise S ~ 1 (k) and S ~ 2 (k). Of course, this consideration is to be performed separately for each frequency bin k.

Es gilt dementsprechend:

Figure DE102012025016B3_0011
It applies accordingly:
Figure DE102012025016B3_0011

Zusätzlich können weiterhin die fouriertransformierten Ausgangssignale X ~m,org berücksichtigt werden. Liegt ein Minimum bei X ~1,org(k), wird dieses ebenfalls S ~1,org(k) zugeordnet:

Figure DE102012025016B3_0012
In addition, the Fourier-transformed output signals X ~ m, org can furthermore be taken into account. If there is a minimum at X ~ 1, org (k), this is also assigned to S ~ 1, org (k):
Figure DE102012025016B3_0012

Die Erfindung ist anhand von Ausführungsbeispielen in den Zeichnungsfiguren näher erläutert. Diese zeigen: The invention is explained in more detail with reference to embodiments in the drawing figures. These show:

1 ein Blockschaltbild des erfindungsgemäßen Verfahrens für ein Stereosignal, 1 a block diagram of the method according to the invention for a stereo signal,

2 ein Blockschaltbild des erfindungsgemäßen Verfahrens in einer zweiten Ausgestaltung, 2 a block diagram of the method according to the invention in a second embodiment,

3 ein Ablaufschema zur Bestimmung der Mischverhältnisse, 3 a flow chart for determining the mixing ratios,

4 ein Ablaufschema zur Quellentrennung, 4 a flow chart for source separation,

5 eine Anordnung zur Aufnahme von Stereophoniesignalen, 5 an arrangement for recording stereophonic signals,

6 ein Streudiagramm von Datenpaaren, 6 a scatterplot of data pairs,

7 ein Streudiagramm von FT-Datenpaaren, 7 a scatter plot of FT data pairs,

8 ein Histogramm, 8th a histogram,

9 das Overlap-Add-Verfahren, 9 the overlap-add method,

10 ein 3D-Amplitudenspektrum zweier Transformations- und eines Restsignals, 10 a 3D amplitude spectrum of two transformation and one residual signal,

11 ein 3D-Aplitudenspektrum der Einzelsignale und 11 a 3D amplitude spectrum of the individual signals and

12 Transformationssignale und Einzelsignale in Vektorform 12 Transformation signals and individual signals in vector form

5 zeigt eine Anordnung zur Aufnahme eines Stereosignals. Rein exemplarisch ist eine Anordnung zur Aufnahme der Quellensignale mittels XY-Stereophonie gezeigt, grundsätzlich lässt sich das erfindungsgemäße Verfahren aber nicht nur bei allen weiteren Stereophonieverfahren, sondern auch bei Verfahren einsetzen, bei denen mehr als zwei Ausgangssignale generiert werden. 5 shows an arrangement for receiving a stereo signal. By way of example only, an arrangement for recording the source signals by means of XY stereophony is shown; in principle, however, the method according to the invention can be used not only in all other stereophonic methods, but also in methods in which more than two output signals are generated.

Gezeigt sind vier Signalquellen, die jeweils ein Quellsignal 1, 2, 3 und 4 erzeugen. Bei Quellsignal 1 handelt es sich beispielsweise um eine Singstimme, also einen Sänger oder eine Sängerin, bei Quellsignal 2 um den Hintergrundchor bestehend aus einer Mehrzahl an Sängern oder Sängerinnen, die jedoch den gleichen Text und die gleichen Noten wiedergeben, bei dem Quellsignal 3 um ein instrument, beispielsweise ein Klavier und bei Quellsignal 4 um eine Gruppe von Instrumenten, die jedoch wie der Chor die gleichen Noten wiedergeben. Ein Beispiel hierfür wäre ein Satz Geigen, der die gleiche Melodie spielt. Dies soll zeigen, dass ein Quellsignal nicht nur von einem einzelnen Sänger oder einer einzelnen Sängerin gebildet werden kann bzw. von einem einzelnen instrument, sondern auch von einer Mehrzahl an Sängern oder Instrumenten. Durch die divergierende Richtwirkung der Mikrofone 5 und 6 werden die Quellsignale 1, 2, 3 und 4 mit unterschiedlichen Pegeln aufgenommen, weswegen das Mischverhältnis der Quellsignale 1, 2, 3 und 4 immer unterschiedlich ist.Shown are four signal sources, each a source signal 1 . 2 . 3 and 4 produce. For source signal 1 it is, for example, a singing voice, so a singer or a singer, with source signal 2 around the background choir, consisting of a plurality of singers, but playing the same text and notes, in the source signal 3 around an instrument, for example a piano and with source signal 4 a group of instruments that, however, reproduce the same notes as the choir. An example would be a set of violins playing the same melody. This is to show that a source signal can be formed not only by a single singer or a single singer or by a single instrument, but also by a plurality of singers or instruments. Due to the divergent directivity of the microphones 5 and 6 become the source signals 1 . 2 . 3 and 4 recorded at different levels, so the mixing ratio of the source signals 1 . 2 . 3 and 4 always different.

Aus den Quellsignalen 1, 2, 3 und 4 werden so die zwei Ausgangssignale des Stereosignals gewonnen. Die Ausgangssignale sind diejenigen Signale, die den Ausgangspunkt des erfindungsgemäßen Verfahrens bilden, die ursprünglichen Quellsignale stehen so nicht mehr zur Verfügung.From the source signals 1 . 2 . 3 and 4 Thus, the two output signals of the stereo signal are obtained. The output signals are those signals which form the starting point of the method according to the invention, the original source signals are no longer available.

Selbstverständlich können auch mehr Quellsignale zur Erzeugung der Ausgangssignale Xm verwendet werden, zur Durchführung des Verfahrens müssen sinnvoller Weise aber wenigstens zwei Quellsignale vorhanden sein.Of course, more source signals can be used to generate the output signals X m , but in order to carry out the method, it is necessary to have at least two source signals.

Im Folgenden wird des Öfteren auf zwei Ausgangssignale X1, X2 Bezug genommen. Das erfindungsgemäße Verfahren ist aber nicht auf Stereosignale beschränkt, grundsätzlich können beliebig viele Ausgangssignale Xm, m = 1, 2, 3, ... zur Verfügung stehen.In the following, reference is frequently made to two output signals X 1 , X 2 . The inventive method is not limited to stereo signals, in principle, any number of output signals X m , m = 1, 2, 3, ... are available.

1 zeigt ein Blockschaltbild des erfindungsgemäßen Verfahrens in einer ersten Ausgestaltung. Dabei werden zwei Ausgangssignale X1 und X2 herangezogen und das Mischungsverhältnis für zwei Quellsignale, beispielsweise die Quellsignale 1 und 2, bestimmt. Ein mögliches Verfahren zur Bestimmung der Mischungsverhältnisse ist weiter unten ausführlich erläutert. Für das Quellsignal 1 ergibt sich beispielsweie ein Mischungsverhältnis V1 und für das Quellsignal 2 ein Mischungsverhältnis V2. Aus den Ausgangssignalen X1 und X2 werden dann Subtraktionsignale X ^1 und X ^2 berechnet, indem die Ausgangssignale X1 und X2 folgendermaßen anhand eines Mischungsverhältnisses subtrahiert werden:

Figure DE102012025016B3_0013
Dabei steht N für den jeweiligen Index des Quellsignals. 1 shows a block diagram of the method according to the invention in a first embodiment. In this case, two output signals X 1 and X 2 are used and the mixing ratio for two source signals, for example the source signals 1 and 2 , certainly. A possible method for determining the mixing ratios is explained in detail below. For the source signal 1 For example, this results in a mixing ratio V 1 and for the source signal 2 a mixing ratio V 2 . From the output signals X 1 and X 2 are then subtraction signals X ^ 1 and X ^ 2 calculated by the output signals X 1 and X 2 are subtracted as follows from a mixing ratio:
Figure DE102012025016B3_0013
N stands for the respective index of the source signal.

Die so berechneten Subtraktionssignale X ^1 und X ^2 werden nach dem Overlap-Add-Verfahren fouriertransformiert.The thus calculated subtraction signals X ^ 1 and X ^ 2 are Fourier transformed according to the overlap-add method.

Die Ausgangssignale X1 und X2 sind selbstverständlich digitale Signale, die dementsprechend aus reinen Folgen von Zahlenwerten oder Datenpunkten entsprechen. Man könnte ein Ausgangssignal auch als einen Vektor mit einer sehr großen Anzahl an Zahlenwerten, üblicherweise viele Zehntausend, darstellen. Dies gilt genauso für die Subtraktionssignale. Um den Rechenbedarf klein zu halten und insbesondere die Zeitdauer bis zur Bereitstellung erster Einzelsignale gering zu halten, werden die Ausgangssignale X1 und X2 bzw. die Subtraktionssignale X ^1 und X ^2 blockweise weiterverarbeitet. Die Fouriertransformation wird beispielsweise auf die ersten 4.096 Datenpunkte des Subtraktionssignals X ^1 und X ^2 angewandt. Bevorzugt werden Zweierpotenzen von Datenpunkten fouriertransformiert, da bei diesen die schnelle Fouriertransformation (FFT) angewandt werden kann. Die Zahl 4.096 stellt dabei einen Optimalwert dar im Hinblick auf die verbrauchte Rechenzeit und die verwendeten Rechenresourcen. Es können auch kleinere oder größere Datenblöcke genommen werden, beispielweise Datenblöcke von 1024 oder 2048 Datenpunkten. Es handelt sich dabei selbstverständlich immer um aufeinanderfolgende Datenpunkte. Durch die Fouriertransformation der Substraktionssignale X ^1 und X ^2 erhält man die Transformationssignale X ~1 und X ~2. Durch Subtraktion des Transformationssignals X ~2 vom Transformationssignal X ~1 erhält man das Restsignal X ~3.The output signals X 1 and X 2 are of course digital signals, which accordingly correspond to pure sequences of numerical values or data points. One could also represent an output signal as a vector with a very large number of numerical values, usually many tens of thousands. This also applies to the subtraction signals. In order to keep the computational requirements small and in particular to keep the time until the provision of first individual signals low, the output signals X 1 and X 2 and the subtraction signals X ^ 1 and X ^ 2 are further processed block by block. The Fourier transform is applied, for example, to the first 4,096 data points of the subtraction signal X ^ 1 and X ^ 2 . Preferably, powers of two of data points are Fourier-transformed, since the fast Fourier transformation (FFT) can be used for these. The number 4,096 represents an optimum value with regard to the used computing time and the used computing resources. It is also possible to take smaller or larger data blocks, for example data blocks of 1024 or 2048 data points. Of course, these are always consecutive data points. By the Fourier transformation of the subtraction signals X ^ 1 and X ^ 2 , the transformation signals X ~ 1 and X ~ 2 are obtained . By subtracting the transformation signal X ~ 2 from the transformation signal X ~ 1 , the residual signal X ~ 3 is obtained .

Das Restsignal X ~3 enthält jeweils genau so viele Datenpunkte, wie die Transformationssignale X ~1 und X ~2, beispielsweise also 4096 Datenpunkte. Da diese Datenpunkte in der Frequenzdomäne vorliegen, werden sie auch üblicherweise Frequenz-Bins genannt. Ein Frequenz-Bin ist also ein Datenpunkt eines Transformations- oder Restsignals. Im Beispielfall weist jedes Transformations-Restsignal also 4096 Frequenz-Bins auf.The residual signal X ~ 3 contains exactly as many data points as the transformation signals X ~ 1 and X ~ 2 , for example 4096 data points. Because these data points are in the frequency domain, they are also commonly called frequency bins. A frequency bin is therefore a data point of a transformation or residual signal. In the example, each transformation residual signal therefore has 4096 frequency bins.

In den Signalen X ~1, X ~2 und X ~3 werden dann Minima gesucht, da diese gleichbedeutend mit den ausgeblendeten Signalen sind. Dazu werden für jeden Frequenz-Bin aus den Amplituden der Signale X ~1, X ~2 und X ~3 die Minima berechnet und an diese Minimumsstellen die Maximalwerte des jeweiligen Frequenz-Bins gesetzt die anderen Werte für diesen Frequenz-Bin auf Null gesetzt. Die Phasen zu den von Null verschiedenen Werten erhält man aus den Auf diese Weise hält man die Einzelsignale S ~1 und S ~2. Diese müssen in den Zeitbereich rücktransformiert werden, wodurch man die berechneten Quellsignale S1 und S2 erhält.In the signals X ~ 1 , X ~ 2 and X ~ 3 then minima are searched, since these are synonymous with the hidden signals. For this purpose the signals for each frequency bin from the amplitudes X ~ 1 X ~ 2 and X ~ 3 calculates the minima and set the maximum values of the respective frequency bins of these minimum points, the other values for this frequency bin to zero. The phases to the non-zero values are obtained from the In this way one holds the individual signals S ~ 1 and S ~ 2 . These must be transformed back into the time domain, whereby the calculated source signals S 1 and S 2 are obtained.

2 zeigt eine Ausgestaltung zur Ermittlung von mehr als zwei berechneten Quellsignalen S1 uns S2. Hierfür werden aus den Ausgangssignalen X1, X2, X3 und X4 mehr als zwei Mischungsverhältnisse bestimmt, wodurch mehr Subtraktionssignale und damit mehr Transformationssignale erhalten werden. Auch in den so erhaltenen Transformationssignalen X ~1, X ~2, X ~3 und X ~4 und dem daraus ermittelten Restsignal X ~3 folgt eine Minimabestimmung und darüber die Ermittlung der Einzelsignal S ~1, S ~2, S ~3 und S ~4 und daraus die Berechnung der berechneten Quellsignale S1, S2, S3 und S4. 2 shows an embodiment for determining more than two calculated source signals S 1 and S 2 S. For this purpose, more than two mixing ratios are determined from the output signals X 1 , X 2 , X 3 and X 4 , whereby more subtraction signals and thus more transformation signals are obtained. Also in the transformation signals X ~ 1 , X ~ 2 , X ~ 3 and X ~ 4 thus obtained and the residual signal X ~ 3 derived therefrom, a minimization determination follows and above this the determination of the individual signals S ~ 1 , S ~ 2 , S ~ 3 and S ~ 4 and from this the calculation of the calculated source signals S 1 , S 2 , S 3 and S 4 .

Im Folgenden wird eine Möglichkeit zur Bestimmung der Mischverhältnisse offenbart. Grundsätzlich können alle Verfahren zur Bestimmung der Mischverhältnisse verwendet werden.In the following, a possibility for determining the mixing ratios is disclosed. In principle, all methods for determining the mixing ratios can be used.

3 zeigt ein Ablaufschema zur Bestimmung der Mischungsverhältnisse anhand einer Richtungsbestimmung. Dabei werden in Schritt S1 die Ausgangssignale X1 und X2 fouriertransformiert, wodurch die transformierten Ausgangssignale X ~1,org und X ~2,org erhalten werden. In Schritt S2 werden für jeden Datenpunkt bzw. Frequenz-Bin der fouriertransformierten Ausgangssignale X ~1,org und X ~2,org die Amplitudenwerte anhand der Formeln

Figure DE102012025016B3_0014
ermittelt. 3 shows a flowchart for determining the mixing ratios based on a direction determination. In this case, the output signals X 1 and X 2 are Fourier-transformed in step S1, whereby the transformed output signals X ~ 1, org and X ~ 2, org are obtained. In step S2, for each data point or frequency bin of the Fourier-transformed output signals X.about.1, org and X.about.2, the amplitude values are calculated using the formulas
Figure DE102012025016B3_0014
determined.

Im nächsten Schritt S3 erfolgt die Berechnung des Winkels θ und des Betragswertes ψl aus den vorausgehend ermittelten Werten. Dabei kann die Berechnung der Betragswerte der fouriertransformierten Ausgangssignale X ~1,org und X ~2,org datenpunktweise oder auch als Vektor erfolgen, jedenfalls sind daraus Wertepaare von Winkeln θ und Betragswerten ψl, zu ermitteln.In the next step S3, the calculation of the angle θ and of the absolute value ψ 1 takes place from the previously determined values. In this case, the magnitude values of the Fourier-transformed output signals X ~ 1, org and X ~ 2, org can be calculated by data point or vector, at least value pairs of angles θ and magnitude values ψ l are to be determined therefrom.

In Schritt S4 wird aus den Wertepaaren θ und ψl, ein Histogramm berechnet, welches in Schritt S5 geglättet wird.In step S4, a histogram is calculated from the value pairs θ and ψ 1 , which is smoothed in step S5.

In Schritt S6 folgt die Bestimmung der Maxima des Histogramms, wobei entweder eine vorgegebene Anzahl oder alle Maxima über einem Schwellwert herangezogen werden.In step S6, the determination of the maximums of the histogram follows, whereby either a predetermined number or all maxima above a threshold value are used.

Diesen Maxima ist jeweils ein Winkel zugeordnet, der aus der oben angegebenen Formel jeweils aus den Maximawerten berechnet wird. In Schritt S7 erfolgt dann die Bestimmung der gesuchten Mischungsverhältnisse anhand der ermittelten Winkel.Each of these maxima is assigned an angle, which is calculated in each case from the maximum values from the formula given above. In step S7, the determination of the desired mixing ratios then takes place on the basis of the determined angles.

4 zeigt ein Ablaufschema zur Quellentrennung. Ausgehend von den Transformationssignalen X ~1, X ~2, und ggf. X ~4 und X ~5 sowie dem Restwertsignal X ~3 werden zu jedem Frequenz-Bin die Minima und Maxima berechnet (Schritt S8). In einer weiteren Ausgestaltung können zusätzlich die fouriertransformierten der Ausgangssignale X ~1,org und X ~2,org und ggf. X ~3,org und X ~4,org berücksichtigt werden. 4 shows a flow scheme for source separation. Starting from the transformation signals X ~ 1 , X ~ 2 , and possibly X ~ 4 and X ~ 5 and the residual value signal X ~ 3 , the minima and maxima are calculated for each frequency bin (step S8). In a further embodiment, the Fourier transform of the output signals X ~ 1, org and X ~ 2, org and optionally X ~ 3, org and X ~ 4, org may additionally be taken into account.

In Schritt S9 wird in jedem Frequenz-Bin an der Stelle des Minimalwertes der Maximalwert des Frequenz-Bins bzw. der jeweiligen Spalte gesetzt, allen anderen Werten wird entweder eine Null- oder der Haltewert P t / hold zugeordnet, wie oben beschrieben.In step S9, the maximum value of the frequency bin or of the respective column is set in each frequency bin at the location of the minimum value, all other values being either a zero value or the hold value P t / hold assigned as described above.

Gemäß Schritt 10 wird zu jedem von Null verschiedenen Wert der Einzelsignale S ~1, S ~2, S ~4 und S ~5 die jeweilige Phase der Transformationssignale X ~1, X ~2, X ~4 und X ~5 zugeordnet.According to step 10 the respective phase of the transformation signals X ~ 1 , X ~ 2 , X ~ 4 and X ~ 5 is assigned to each non-zero value of the individual signals S ~ 1 , S ~ 2 , S ~ 4 and S ~ 5 .

Die Zuordnung erfolgt dabei anhand der Nummerierung der Frequenz-Bins. Hat das Frequenz-Bin 28 des Einzelsignals S ~1 einen von Null verschiedenen Wert, so erhält dieses die Phase des Frequenz-Bins 28 des Transformationssignals X ~1. Aufgrund der Verschiebung der Maximalwerte auf die Minimalwerte in jedem Frequenz-Bin und der Nullsetzung der übrigen Werte ist kein einziger Wert eines Einzelsignals gleich dem Wert des zugeordneten Transformationssignals. Trotzdem können die Phasen übernommen werden.The assignment is based on the numbering of the frequency bins. If the frequency bin 28 of the individual signal S ~ 1 has a value other than zero, this receives the phase of the frequency bin 28 of the transformation signal X ~ 1 . Due to the shift of the maximum values to the minimum values in each frequency bin and the zeroing of the remaining values, not a single value of a single signal is equal to the value of the associated transformation signal. Nevertheless, the phases can be taken over.

Statt einer Nullsetzung der Nicht-Minimunsstellen kann auch der Haltewert ηPhold eingesetzt werden. Dies verhindert Sprungstellen in den Einzelsignalen.Instead of zeroing the non-minimum points, the hold value ηP hold can also be used. This prevents jumps in the individual signals.

6 zeigt ein Streudiagram der Amplituden von zwei gemischten Ausgangssignalen X1 und X2, wobei die Ausgangssignale X1 und X2 gegeneinander verschobene Sinussignale sind. Ein Streudiagramm stellt jeweils Wertepaare dar, wobei die Wertepaare anhand der Nummer des Datenpunktes, sozusagen des Daten-Bins gebildet werden. Der erste Punkt des Datenpunkts des Ausgangssignals X1 weist eine erste Amplitude auf und der erste Datenpunkt des Ausgangssignals X2 eine gleiche oder eine andere Amplitude. Diese beiden Amplituden werden verwendet, um einen Punkt im Streudiagramm 9 festzulegen. Durch die Verwendung einer Vielzahl an Datenpunkten jeweils des Ausgangssignals X1 und des Ausgangssignals X2 entstehen genauso viele Datenpunkten-Paare. Dabei ist auf der Achse 10 die Amplitude des Ausgangssignals X1 und auf der Achse 11 die Amplitude des Ausgangssignals X2 angegeben. Durch die Verwendung von beispielsweise 4096 Datenpunkten auf dem Ausgangssignal X1 und dem Ausgangssignals X2 erhält man 4096 Datenpunktenpaare. Diese bilden im Streudiagramm eine Punktwolke 12, die aus einer Vielzahl der einzelnen Datenpunktepaaren ermittelten Punkte 13 gebildet wird. 6 shows a scatter plot of the amplitudes of two mixed output signals X 1 and X 2 , wherein the output signals X 1 and X 2 are mutually shifted sinusoidal signals. A scatter plot represents pairs of values, whereby the value pairs are formed on the basis of the number of the data point, so to speak of the data bin. The first point of the data point of the output signal X 1 has a first amplitude and the first data point of the output signal X 2 an equal or a different amplitude. These two amplitudes are used to draw a point in the scatter plot 9 set. The use of a multiplicity of data points in each case of the output signal X 1 and the output signal X 2 results in the same number of data-point pairs. It is on the axis 10 the amplitude of the output signal X 1 and on the axis 11 the amplitude of the output signal X 2 indicated. By using, for example, 4096 data points on the output signal X 1 and the output signal X 2 , one obtains 4096 pairs of data points. These form a point cloud in the scatter diagram 12 , the points obtained from a plurality of the individual pairs of data points 13 is formed.

7 zeigt ein entsprechend gebildetes Streudiagramm 14, wobei die Ausgangssignale X1 und X2 jedoch fouriertransformiert wurden und die Amplituden der Signale gemäß

Figure DE102012025016B3_0015
berechnet wurden. Entsprechend ist auf Achse 15 der Betrag der Amplitude von X ~1,org, also der Fouriertransformierten des Ausgangssignals X1, und auf Achse 16 der Betrag der Amplitude von X ~2,org aufgetragen. Durch Berechnung der Steigung der Geraden 17 bzw. 18 erhält man jeweils die Mischungsverhältnisse. 7 shows a suitably formed scatter plot 14 However, the output signals X 1 and X 2 were Fourier transformed and the amplitudes of the signals according to
Figure DE102012025016B3_0015
were calculated. Accordingly is on the move 15 the magnitude of the amplitude of X ~ 1, org , ie the Fourier transform of the output signal X 1 , and on axis 16 the magnitude of the amplitude of X ~ 2, org applied. By calculating the slope of the line 17 respectively. 18 you get the mixing ratios.

Auf derart einfache Art und Weise lassen sich die Mischungsverhältnisse aber nur bei in realen Aufnahmen so nicht vorkommenden Sinussignalen ermitteln. Statt der Bildung eines Streudiagramms und der Ermittlung der Steigung der sich ergebenden Geraden wird nach der Fouriertransformation der der Ausgangssignale X1 und X2 aus den Punktepaaren der fouriertransformierten Ausgangssignale X ~1,org und X ~2,org jeweils ein Winkel θ und ein Vektor ψ berechnet. Statt eines Streudiagramms wird aus den Paaren aus Winkeln θ und Vektor ψ ein Histogramm ermittelt, in dem die Winkel auf eine ganze Zahl gekürzt werden und daraus entsprechende Häufigkeiten an Winkeln ermitteln werden. Aus jedem Punktepaar ergibt sich so eine einzelne Häufigkeit für das Histogramm.In such a simple way, however, the mixing ratios can only be determined with sinusoidal signals that do not occur in real recordings. Instead of the formation of a scatter diagram and determining the slope of the resulting straight lines is after the Fourier transform of the output signals X 1 and X 2 of the pairs of points of the Fourier-transformed output signals X ~ 1, org, and X ~ 2, org, respectively an angle θ and a vector ψ calculated. Instead of a scatter plot, a histogram is determined from the pairs of angles θ and vector ψ, in which the angles are shortened to an integer and from this, corresponding frequencies at angles are determined. Each pair of points results in a single frequency for the histogram.

Dieses Histogramm wird mit einer Glättungsfunktion geglättet, sodass die Anzahl lokaler Minima und Maxima verringert wird. Als Glättungsfunktion kann beispielsweise die Funktion

Figure DE102012025016B3_0016
herangezogen werden, die weiter oben bereits beschrieben wurde.This histogram is smoothed with a smoothing function, reducing the number of local minima and maxima. As a smoothing function, for example, the function
Figure DE102012025016B3_0016
be used, which has already been described above.

Ein derart geglättetes Histogramm ist in 8 dargestellt. Auf der Achse 19 sind Winkel in Grad angegeben, und zwar von 0° bis 90°, während auf der Achse 20 die jeweiligen Häufigkeiten dargestellt sind. Das Histogramm 21 hat ein absolutes Maximum 22 und mehrere lokale Maximal 23, 24 und 25.Such a smoothed histogram is in 8th shown. On the axis 19 are angles in degrees, from 0 ° to 90 °, while on the axis 20 the respective frequencies are shown. The histogram 21 has an absolute maximum 22 and several local maximums 23 . 24 and 25 ,

Der Anzahl der Häufigkeiten nach sortiert, hat das Maximum 22 den größten Wert, danach folgen die Maxima 25, 24 und 23. Von diesen Maxima wird beginnend bei dem Maximum mit den größten Häufigkeiten entweder eine vorgegebene Anzahl ausgewählt, beispielsweise für zwei Maxima die Maximal 22 und 25. Es können aber auch so lange Maxima ausgewählt werden, solange die Häufigkeit über einem Schwellenwert liegt. Setzt man diesen beispielsweise bei 10 an, so folgen weitere Berechnungen für die Maxima 22, 25 und 24, aber nicht für das Maximum 23, das unter diesem Schwellenwert liegt.The number of frequencies sorted by has the maximum 22 the highest value, then the maxima follow 25 . 24 and 23 , Of these maxima, either a predefined number is selected starting at the maximum with the highest frequencies, for example the maximum for two maxima 22 and 25 , However, maxima can also be selected as long as the frequency is above a threshold value. If you use this, for example 10 on, then follow further calculations for the maxima 22 . 25 and 24 but not for the maximum 23 that is below this threshold.

Jedes Maximum steht für einen Winkel. Das Maximum 22 beispielsweise für 18° und das Maximum 25 für 72°.Every maximum stands for an angle. The maximum 22 for example, for 18 ° and the maximum 25 for 72 °.

Die Angabe des Winkels kann dabei gemäß der Formel γN = Index(max(hgl_TP)) erfolgen. Aus den so bestimmten Winkeln ergibt sich für jeden Winkel jeweils ein Mischverhältnis gemäß der Formel VN = tan(γN). The indication of the angle can according to the formula γ N = index (max (h gl_TP )) respectively. From the thus determined angles results for each angle in each case a mixing ratio according to the formula V N = tan (γ N ).

N ist der Index des zu extrahierenden Quellsignals. Damit ist die Bestimmung der Mischungsverhältnisse anhand einer Richtungsinformation abgeschlossen.N is the index of the source signal to be extracted. Thus, the determination of the mixing ratios is completed on the basis of a direction information.

Die Ermittlung der Subtraktionssignale X ^1 und X ^2 erfolgt gemäß der weiter oben angegebenen Formel, insbesondere können die Subtraktionssignale X ^1 und X ^2 auch blockweise ermittelt werden. Es können also jeweils ein vorgegebener Satz an Datenpunkten, beispielsweise jeweils 4096 Datenpunkte der Ausgangsignale X1 und X2 zu Subtraktionssignalen X ^1 und X ^2 unter Verwendung der Mischverhältnisse berechnet werden. Die Subtraktionssignale X ^1 und X ^2 werden gemäß dem in 9 gezeigten Overlap-Add-Verfahren fouriertransformiert.The determination of the subtraction signals X ^ 1 and X ^ 2 is carried out according to the formula given above, in particular, the subtraction signals X ^ 1 and X ^ 2 can also be determined block by block. Thus, in each case a predefined set of data points, for example 4096 data points each of the output signals X 1 and X 2, can be calculated to form subtraction signals X 1 and X 2 using the mixing ratios become. The subtraction signals X ^ 1 and X ^ 2 are generated according to the in 9 shown overlap-transform Fourier transform.

Gezeigt sind Datenblöcke 26, 27, 28 und 29 bestehend aus jeweils 2048 Datenpunkten des Subtraktionssignals X ^1 bzw. des Subtraktionssignals X ^2. Der Zahlenwert 2048 ergibt sich dabei daraus, dass es sich um die Hälfte der zur Fouriertransformation verwendeten Datenpunkte handelt. Die Anzahl der Datenpunkte der Datenblöcke 26 bis 29 ergibt sich somit aus der Anzahl der Datenpunkte eines Datenblocks 30 bis 33.Shown are data blocks 26 . 27 . 28 and 29 consisting of 2048 data points each of the subtraction signal X ^ 1 and the subtraction signal X ^ 2 . The numerical value 2048 results from the fact that it is half of the data points used for Fourier transformation. The number of data points of the data blocks 26 to 29 thus results from the number of data points of a data block 30 to 33 ,

Der Datenblock 30 setzt sich aus den Datenblöcken 26 und 27 zusammen und hat dementsprechend die doppelte Anzahl an Datenpunkten eines Datenblocks 26 oder 27. Dieser Datenblock 30 ist der Datenblock, der fouriertransformiert wird. Der Datenblock 31 besteht aus den Datenblöcken 27 und 28, der Datenblock 32 aus den Datenblöcken 28 und dem folgenden Datenblock. Der Datenblock 27 ist also im Datenblock 30 und 31 enthalten, der Datenblock 18 im Datenblock 31 und 32.The data block 30 consists of the data blocks 26 and 27 together and therefore has twice the number of data points of a data block 26 or 27 , This data block 30 is the data block that is Fourier transformed. The data block 31 consists of the data blocks 27 and 28 , the data block 32 from the data blocks 28 and the following data block. The data block 27 is in the data block 30 and 31 contain the data block 18 in the data block 31 and 32 ,

Vor der Fouriertransformation werden die Datenblöcke 30, 31, 32 und 33 noch mit einem Hanning-Fenster multipliziert. Dadurch lassen sich Leck-Effekte bei der Fouriertransformation minimieren.Before the Fourier transform, the data blocks become 30 . 31 . 32 and 33 still multiplied by a Hanning window. As a result, leakage effects in the Fourier transformation can be minimized.

10 zeigt ein 3D-Amplitudenspektrum der Transformationssignale X ~1, X ~2 und des Restwertsignals X ~3. Auf der Achse 35 ist die jeweilige Nummer eine Frequenz-Bin, also eines durchnummerierten Punktes im Vektor eines Signals gezeigt, während auf Achse 36 der Betragswert angegeben ist. Achse 37 gibt die jeweiligen Betragswerte an. An Stelle 38 liegt das Signal |X ~2|, an Stelle 39 das Signal |X ~3| und an Stelle 40 das Signal |X ~1|. 10 shows a 3D amplitude spectrum of the transformation signals X ~ 1 , X ~ 2 and the residual value signal X ~ 3 . On the axis 35 the respective number is a frequency bin, ie a numbered dot in the vector of a signal, while on axis 36 the amount value is specified. axis 37 indicates the respective amount values. Instead of 38 is the signal | X ~ 2 |, in place 39 the signal | X ~ 3 | and in place 40 the signal | X ~ 1 |.

Die in 10 gezeigten Signale wurden aus zwei reinen Sinussignalen ermittelt. Bei realen Signalen sind mehr oder weniger alle Frequenz-Bins gefüllt, zur Veranschaulichung sind die Sinussignale jedoch besonders geeignet. Aus der Darstellung in 10 folgt direkt, dass die Signale |X ~1|, |X ~3| und |X ~3| jeweils lediglich drei Peaks aufweisen, die verschieden hoch sind, ansonsten aber lediglich Nullstellen haben.In the 10 shown signals were determined from two pure sine signals. For real signals, more or less all frequency bins are filled, but for purposes of illustration the sinusoidal signals are particularly suitable. From the illustration in 10 follows directly that the signals | X ~ 1 |, | X ~ 3 | and | X ~ 3 | each have only three peaks that are different high, but otherwise have only zeros.

11 zeigt ein 3D-Amplitudenspektrum der Einzelsignale S ~1, S ~2 sowie dem Restsignalgemisch S ~3. Die Achse 35 gibt wiederum den Frequenz-Bin an und die Achse 36 den Betrag. Auf der Achse 42 sind dagegen die erhaltenen Einzelsignale aufgetragen. An Stelle 43 befindet sich das Einzelsignal |S ~1| an Stelle 44 das Restsignal |S ~3| und an Stelle 45 das Einzelsignal |S ~2|. Zu den jeweiligen von Null verschiedenen Stellen der Einzelsignale |S ~1| und |S ~2| sind aus den Transformationssignalen X ~1 und X ~2 noch jeweils die Phasen heranzuziehen, um die Einzelsignale |S ~1| und |S ~2| rückwärts fouriertransformieren zu können. 11 shows a 3D amplitude spectrum of the individual signals S ~ 1 , S ~ 2 and the residual signal mixture S ~ 3 . The axis 35 again indicates the frequency bin and the axis 36 the amount. On the axis 42 On the other hand, the received individual signals are plotted. Instead of 43 is the single signal | S ~ 1 | instead of 44 the residual signal | S ~ 3 | and in place 45 the single signal | S ~ 2 |. To the respective non-zero digits of the individual signals | S ~ 1 | and | S ~ 2 | From the transformation signals X ~ 1 and X ~ 2 the phases are still to be used in each case in order to obtain the individual signals | S ~ 1 | and | S ~ 2 | to be able to Fourier transform backwards.

12 zeigt schematisch die Gewinnung der Einzelsignale aus den Transformationssignalen X ~1 und X ~2 und dem Restwertsignal X ~3. Der Vektor 46 gibt dabei Ausschnittsweise des Transformationssignals X ~1 wieder, entsprechend Vektor 47 die Zahlenwerte des Transformationssignals X ~2, Vektor 48 die Werte des Restsignals X ~3 und Vektor 49 die entsprechenden Frequenz-Bins. 12 schematically shows the extraction of the individual signals from the transformation signals X ~ 1 and X ~ 2 and the residual value signal X ~ 3 . The vector 46 is a fragmentary of the transformation signal X ~ 1 again, according to vector 47 the numerical values of the transformation signal X ~ 2 , vector 48 the values of the residual signal X ~ 3 and vector 49 the corresponding frequency bins.

Aus diesen geht das in Vektor 50 gezeigte Einzelsignal S ~1, dass in Vektor 51 gezeigte Einzelsignal S ~2 und das in Vektor 52 gezeigte Restwertsignal S ~3 folgendermaßen hervor:
Für Frequenz-Bin 1 liegt das Minimum in Vektor 48, da die Zahlen 5 und 7 größer als 1 sind. Im Frequenz-Bin 1 der entsprechenden Vektoren 50, 51 und 52 werden daher folgende Werte eingesetzt: an Stelle des Minimalwerts 1 wird der Maximalwert 7 gesetzt. Dieser ist daher am Frequenz-Bin 1 des Vektors 52 zu setzen. Die übrigen Werte in Frequenz-Bin 1, nämlich in den Vektoren 50 und 51, werden auf Null gesetzt. Die Minimumsbetrachtung findet also spaltenweise, datenpunktweise bzw. fequenz-binweise statt. Diese Ausdrücke sind identisch.
Out of these, that goes into vector 50 shown single signal S ~ 1 that in vector 51 shown single signal S ~ 2 and that in vector 52 shown residue signal S ~ 3 as follows:
For frequency bin 1, the minimum is in vector 48 because the numbers 5 and 7 are greater than 1. In the frequency bin 1 of the corresponding vectors 50 . 51 and 52 Therefore, the following values are used: instead of the minimum value 1, the maximum value 7 is set. This is therefore at the frequency bin 1 of the vector 52 to put. The remaining values in frequency bin 1, namely in the vectors 50 and 51 , are set to zero. The minimum consideration thus takes place column by column, by data point or by frequency bin. These expressions are identical.

Entsprechend werden die Werte der Spalten für Frequenz-Bin 2, 3, 4, 5, usw. berechnet, so dass sich die in 12 gezeigten Werte jeweils ergeben.Similarly, the values of the frequency bin columns 2, 3, 4, 5, etc. are calculated so that the in 12 in each case.

In Vektor 50 werden die Werte bzw. Mimimumswerte zu Vektor 46 gesammelt, in Vektor 51 diejenigen zu Vektor 47 und in Vektor 52 diejenigen zu Vektor 48.In vector 50 the values or mimimum values become vector 46 collected, in vector 51 ones to vector 47 and in vector 52 ones to vector 48 ,

Zu den Vektoren 50 und 51 der Einzelsignale S ~1 und S ~2 werden darauffolgend noch die Phasen der Transformationssignale X ~1 und X ~2 zugeordnet. Rein exemplarisch wird dies für den Frequenz-Bin 4 des Vektors 50 beschrieben. Für Frequenz-Bin 4 des Vektors 50 wird die Phase des Frequenz-Bins 4 aus Vektor 46 genommen, da der Vektor 50 die Minimalstellen des Vektors 46 abbildet, sofern dort Zahlenwerte vorhanden sind. Dementsprechend wird die Phase der identischen Frequenz-Bins übertragen. To the vectors 50 and 51 the individual signals S ~ 1 and S ~ 2 are subsequently assigned the phases of the transformation signals X ~ 1 and X ~ 2 . By way of example, this will be for the frequency bin 4 of the vector 50 described. For frequency bin 4 of the vector 50 the phase of the frequency bin 4 becomes vector 46 taken as the vector 50 the minimal parts of the vector 46 if there are numerical values. Accordingly, the phase of the identical frequency bins is transmitted.

Bei sämtlichen Ausgestaltungen in den Figuren können statt explizit genannter zweier Ausgangssignale, zweier Transformationssignale oder Einzelsignale auch mehr als zwei Signale verwendet werden, weiterhin können alle in der Beschreibungseinleitung genannten Ausgestaltungen auch im Hinblick auf die Figurenbeschreibung angewandt werden, sofern dies nicht ausdrücklich ausgeschlossen ist.In all embodiments in the figures, instead of explicitly mentioned two output signals, two transformation signals or individual signals, more than two signals can be used, furthermore all embodiments mentioned in the introduction to the description can also be used with regard to the description of the figures, unless this is expressly excluded.

BezugszeichenlisteLIST OF REFERENCE NUMBERS

11
Quellsignalsource signal
22
Quellsignalsource signal
33
Quellsignalsource signal
44
Quellsignalsource signal
55
Mikrofonmicrophone
66
Mikrofonmicrophone
77
Bestimmung MischungsverhältnisseDetermination of mixing ratios
88th
Signaltrennungsignal separation
99
Streudiagrammscatterplot
1010
Achseaxis
1111
Achseaxis
1212
Punktwolkepoint cloud
1313
PunktPoint
1414
Streudiagrammscatterplot
1515
Achseaxis
1616
Achseaxis
1717
GeradeJust
1818
GeradeJust
1919
Achseaxis
2020
Achseaxis
2121
Histogrammhistogram
2222
Maximummaximum
2323
Maximummaximum
2424
Maximummaximum
2525
Maximummaximum
2626
Datenblockdata block
2727
Datenblockdata block
2828
Datenblockdata block
2929
Datenblockdata block
3030
Datenblockdata block
3131
Datenblockdata block
3232
Datenblockdata block
3333
Datenblockdata block
3434
3D-Amplitudenspektrum3D amplitude spectrum
3535
Achseaxis
3636
Achseaxis
3737
Achseaxis
3838
StelleJob
3939
StelleJob
4040
StelleJob
4141
3D-Amplitudenspektrum3D amplitude spectrum
4242
Achseaxis
4343
StelleJob
4444
StelleJob
4545
StelleJob
4646
Vektorvector
4747
Vektorvector
4848
Vektorvector
4949
Frequenz-BinFrequency bin
5050
Vektorvector
5151
Vektorvector
5252
Vektorvector

Claims (20)

Verfahren zur Ermittlung wenigstens zweier Einzelsignale (S ~1, S ~2, S ~3, S ~4) aus wenigstens zwei Ausgangssignalen (X1, X2, X3, X4), die aus wenigstens zwei Quellsignalen (1, 2, 3, 4) gebildet sind, dadurch gekennzeichnet, dass a) die Mischverhältnisse (V1, V2, V3, V4) von wenigstens zwei Quellsignalen (1, 2, 3, 4) auf die Ausgangssignale (X1, X2, X3, X4) bestimmt werden, b) die Ausgangssignale (X1, X2, X3, X4) mit aus dem Mischungsverhältnis (V1, V2, V3, V4) gebildeten Faktoren multipliziert werden und aus den Ausgangssignalen (X1, X2, X3, X4) wenigstens zwei Subtraktionssignale (X ^1, X ^2, X ^3, X ^4) ermittelt werden, sodass in jedem Subtraktionssignal (X ^1, X ^2, X ^3, X ^4) ein Quellsignal (1, 2, 3, 4) eliminiert ist, c) die Subtraktionssignale (X ^1, X ^2, X ^3, X ^4) fouriertransformiert werden, wodurch Transformationssignale (X ~1, X ~2, X ~4, X ~5) entstehen, d) aus den Transformationssignalen (X ~1, X ~2, X ~4, X ~5) ein Restsignal (X ~3) bestimmt wird, e) wenigstens zwei Einzelsignale (S ~1, S ~2, S ~3, S ~4) anhand der Transformationssignale (X ~1, X ~2, X ~4, X ~5) und dem Restsignal (X ~3) berechnet werden, und f) die Einzelsignale (S ~1, S ~2, S ~3, S ~4) durch eine inverse Fouriertransformation in berechnete Quellsignale (S1, S2, S3 und S4) transformiert werden.Method for determining at least two individual signals (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) from at least two output signals (X 1 , X 2 , X 3 , X 4 ) which comprise at least two source signals ( 1 . 2 . 3 . 4 ), characterized in that a) the mixing ratios (V 1 , V 2 , V 3 , V 4 ) of at least two source signals ( 1 . 2 . 3 . 4 ) to the output signals (X 1 , X 2 , X 3 , X 4 ) are determined, b) the output signals (X 1 , X 2 , X 3 , X 4 ) from the mixing ratio (V 1 , V 2 , V 3 , V 4 ) are multiplied and from the output signals (X 1 , X 2 , X 3 , X 4 ) at least two subtraction signals (X ^ 1 , X ^ 2 , X ^ 3 , X ^ 4 ) are determined, so that in each subtraction signal (X ^ 1 , X ^ 2 , X ^ 3 , X ^ 4 ) a source signal ( 1 . 2 . 3 . 4 ), c) the subtraction signals (X ^ 1 , X ^ 2 , X ^ 3 , X ^ 4 ) are Fourier transformed, resulting in transformation signals (X ~ 1 , X ~ 2 , X ~ 4 , X ~ 5 ), i ) from the transformation signals (X ~ 1 , X ~ 2 , X ~ 4 , X ~ 5 ) a residual signal (X ~ 3 ) is determined, e) at least two individual signals (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) are calculated from the transform signals (X ~ 1 , X ~ 2 , X ~ 4 , X ~ 5 ) and the residual signal (X ~ 3 ), and f) the individual signals (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) are transformed by an inverse Fourier transformation into calculated source signals (S 1 , S 2 , S 3 and S 4 ). Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Bestimmung der Mischverhältnisse (V1, V2, V3, V4) über eine Richtungsbestimmung erfolgt.A method according to claim 1, characterized in that the determination of the mixing ratios (V 1 , V 2 , V 3 , V 4 ) takes place via a direction determination. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Bestimmung der Mischverhältnisse (V1, V2, V3, V4) folgende Schritte aufweist: – Fouriertransformation der Ausgangssignale (X1, X2, X3, X4), – Berechnung der Amplitudenwerte der fouriertransformierten Ausgangssignale (X ~1,org, X ~2,org, X ~3,org, X ~4,org), und – Ermittlung eines Histogramms (21) aus den Amplitudenwerten oder Bestimmung der Steigung der Geraden (17, 18) der Amplitudenwerte in einem Streudiagramm (14).Method according to claim 1 or 2, characterized in that the determination of the mixing ratios (V 1 , V 2 , V 3 , V 4 ) comprises the following steps: - Fourier transformation of the output signals (X 1 , X 2 , X 3 , X 4 ), Calculation of the amplitude values of the Fourier transformed output signals (X ~ 1, org , X ~ 2, org , X ~ 3, org , X ~ 4, org ), and - determination of a histogram ( 21 ) from the amplitude values or determination of the slope of the straight line ( 17 . 18 ) of the amplitude values in a scatter plot ( 14 ). Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass das Histogramm (21) mit einer Glättungsfunktion multipliziert wird.Method according to claim 3, characterized in that the histogram ( 21 ) is multiplied by a smoothing function. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass als Glättungsfunktion ein Hanning-Fenster, insbesondere
Figure DE102012025016B3_0017
verwendet wird.
Method according to Claim 4, characterized in that the smoothing function is a Hanning window, in particular
Figure DE102012025016B3_0017
is used.
Verfahren nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass der Winkelabstand im Histogramm (21) 1° beträgt.Method according to one of claims 3 to 5, characterized in that the angular distance in the histogram ( 21 ) Is 1 °. Verfahren nach einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, dass die lokalen Extremwerte, insbesondere die lokalen Maxima (22, 23, 24, 25), des Histogramms (21) bestimmt werden.Method according to one of claims 3 to 6, characterized in that the local extreme values, in particular the local maxima ( 22 . 23 . 24 . 25 ), the histogram ( 21 ). Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass beginnend mit dem absoluten Maximum (22) jedem Maximum (22, 23, 24, 25) ein Winkel zugeordnet wird.Method according to claim 7, characterized in that starting with the absolute maximum ( 22 ) every maximum ( 22 . 23 . 24 . 25 ) an angle is assigned. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Zuordnung der Winkel bei einer vorgegebenen Anzahl oder bei Unterschreiten eines Schwellenwertes beendet wird. A method according to claim 8, characterized in that the assignment of the angle is terminated at a predetermined number or falls below a threshold value. Verfahren nach einem der Ansprüche 3 bis 9, dadurch gekennzeichnet, dass das Histogramm (21) mit einem Tiefpass gewichtet wird.Method according to one of claims 3 to 9, characterized in that the histogram ( 21 ) is weighted with a low pass. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass der Tiefpass aus zeitlich früher ermittelten Histogrammen bestimmt wird.A method according to claim 10, characterized in that the low pass is determined from temporally earlier determined histograms. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass das Subtraktionssignal (X ^1, X ^2, X ^3, X ^4) bei zwei Ausgangssignalen (X1, X2) ermittelt wird, indem das mit dem Mischungsverhältnis (VN) multiplizierte zweite Ausgangssignal (X2) vom ersten (X1) subtrahiert wird, wenn das Mischungsverhältnis (VN) kleiner als 1 ist und ansonsten das erste Ausgangssignal (X1) mit dem Kehrwert des Mischungsverhältnisses (1/VN) multipliziert und vom zweiten Ausgangssignal (X2) abgezogen wird.Method according to one of the preceding claims, characterized in that the subtraction signal (X ^ 1 , X ^ 2 , X ^ 3 , X ^ 4 ) at two output signals (X 1 , X 2 ) is determined by the with the mixing ratio (V N), multiplied second output signal (X 2) from the first (X 1) is subtracted when the mixing ratio (V N) is less than 1, and otherwise the first output signal (X 1) with the reciprocal value of the mixture ratio (1 / V N) multiplied and subtracted from the second output signal (X 2 ). Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass für die Fouriertransformationen eine Zweierpotenz an Datenpunkten, insbesondere 1024, 2048 oder 4096 Datenpunkte verwendet werden.Method according to one of the preceding claims, characterized in that a power of two at data points, in particular 1024, 2048 or 4096 data points are used for the Fourier transforms. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass die Datenpunkte zu den Fouriertransformationen quasikontinuierlich und nach dem Overlap-Add-Verfahren herangezogen werden.Method according to one of the preceding claims, characterized in that the data points are used to the Fourier transforms quasi-continuous and after the overlap-add method. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass ein Restwertsignal (X ~3) als Subtraktionssignal der Transformationssignale bestimmt wirdA method according to claim 13, characterized in that a residual value signal (X ~ 3 ) is determined as a subtraction signal of the transformation signals Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass ein Einzelsignal (S ~1, S ~2, S ~3, S ~4) mittels einer Extremwertbestimmung wenigstens eines Transformationssignals (X ~1, X ~2, X ~4, X ~5) und/oder des Restwertsignals (X ~3) bestimmt wird.Method according to one of the preceding claims, characterized in that a single signal (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) by means of an extreme value determination of at least one transformation signal (X ~ 1 , X ~ 2 , X ~ 4 , X ~ 5 ) and / or the residual value signal (X ~ 3 ). Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass die Frequenzen eines Einzelsignals (S ~1, S ~2, S ~3, S ~4) durch Minimabestimmung erkannt werden.Method according to one of the preceding claims, characterized in that the frequencies of a single signal (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) are detected by minimization. Verfahren nach Anspruch 16 oder 17, dadurch gekennzeichnet, dass in den Transformationssignalen (X ~1, X ~2, X ~4, X ~5) und dem Restwertsignal (X ~3) zur Erzeugung der Einzelsignale (S ~1, S ~2, S ~3, S ~4) für jeden Frequenz-Bin (49) das Minimum ermittel wird, an dessen Stelle das Maximum des jeweiligen Frequenz-Bins (49) gesetzt wird und die restlichen Werte auf Null gesetzt werden.A method according to claim 16 or 17, characterized in that in the transformation signals (X ~ 1 , X ~ 2 , X ~ 4 , X ~ 5 ) and the residual value signal (X ~ 3 ) for generating the individual signals (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) for each frequency bin ( 49 ) the minimum is determined, in place of which the maximum of the respective frequency bin ( 49 ) and the remaining values are set to zero. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass zu den Amplitudenwerten der Einzelsignale (S ~1, S ~2, S ~3, S ~4) die jeweiligen Phasenwerte der Transformationssignale (X ~1, X ~2, X ~5, X ~4) ermittelt werden.Method according to Claim 18, characterized in that the amplitude values of the individual signals (S ~ 1 , S ~ 2 , S ~ 3 , S ~ 4 ) are the respective phase values of the transformation signals (X ~ 1 , X ~ 2 , X ~ 5 , X ~ 4 ). Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass die Anzahl der zu berechnenden Quellsignale (S1, S2, S3 und S4) und/oder das oder die Quellsignale (1, 2, 3, 4) selbst vorgegeben werden.Method according to one of the preceding claims, characterized in that the number of source signals to be calculated (S 1 , S 2 , S 3 and S 4 ) and / or the source signal or signals ( 1 . 2 . 3 . 4 ) yourself.
DE102012025016.9A 2012-12-20 2012-12-20 Method for determining at least two individual signals from at least two output signals Active DE102012025016B3 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102012025016.9A DE102012025016B3 (en) 2012-12-20 2012-12-20 Method for determining at least two individual signals from at least two output signals
JP2015548194A JP6163211B2 (en) 2012-12-20 2013-12-10 Method for calculating at least two individual signals from at least two output signals
PCT/DE2013/000788 WO2014094709A2 (en) 2012-12-20 2013-12-10 Method for detecting at least two individual signals from at least two output signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102012025016.9A DE102012025016B3 (en) 2012-12-20 2012-12-20 Method for determining at least two individual signals from at least two output signals

Publications (1)

Publication Number Publication Date
DE102012025016B3 true DE102012025016B3 (en) 2014-05-08

Family

ID=49999650

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102012025016.9A Active DE102012025016B3 (en) 2012-12-20 2012-12-20 Method for determining at least two individual signals from at least two output signals

Country Status (3)

Country Link
JP (1) JP6163211B2 (en)
DE (1) DE102012025016B3 (en)
WO (1) WO2014094709A2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017106048A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for generating and outputting a multi-channel acoustic signal
WO2018172159A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for outputting an audio signal into an interior via an output device comprising a left and a right output channel
WO2019141368A1 (en) 2018-01-18 2019-07-25 Ask Industries Gmbh Method for outputting an audio signal reproducing a piece of music into an interior via an output device
CN111972928A (en) * 2020-08-21 2020-11-24 浙江指云信息技术有限公司 Sleep-aiding pillow with surrounding sound field and adjusting and controlling method thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070076902A1 (en) * 2005-09-30 2007-04-05 Aaron Master Method and Apparatus for Removing or Isolating Voice or Instruments on Stereo Recordings
EP1814358A1 (en) * 2004-10-19 2007-08-01 Sony Corporation Audio signal processing device and audio signal processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
JP2009282536A (en) * 2003-05-30 2009-12-03 National Institute Of Advanced Industrial & Technology Method and device for removing known acoustic signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1814358A1 (en) * 2004-10-19 2007-08-01 Sony Corporation Audio signal processing device and audio signal processing method
US20070076902A1 (en) * 2005-09-30 2007-04-05 Aaron Master Method and Apparatus for Removing or Isolating Voice or Instruments on Stereo Recordings

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BURRED, J. J. et al.: Comparison of Frequency-Warped Representations for Source Separation of Stereo Mixtures. In: Audio Engineering Society, Convention Paper 6924. Presented at the 121st Convention, 2006 October 5-8. San Francisco, CA, USA.http://www.aes.org/e-lib/browse.cfm?elib=13758 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017106048A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for generating and outputting a multi-channel acoustic signal
WO2018172159A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for outputting an audio signal into an interior via an output device comprising a left and a right output channel
DE102017106022A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh A method for outputting an audio signal into an interior via an output device comprising a left and a right output channel
WO2018172213A1 (en) 2017-03-21 2018-09-27 Ask Industries Gmbh Method for generating and outputting an acoustic multichannel signal
CN110431855A (en) * 2017-03-21 2019-11-08 Ask工业有限公司 Method for generating and exporting acoustic multi-channel signal
US11019446B2 (en) 2017-03-21 2021-05-25 Ask Industries Gmbh Method for generating and outputting an acoustic multichannel signal
CN110431855B (en) * 2017-03-21 2021-09-28 Ask工业有限公司 Method for generating and outputting an acoustic multichannel signal
US11153686B2 (en) 2017-03-21 2021-10-19 Ask Industries Gmbh Method for outputting an audio signal into an interior via an output device comprising a left and a right output channel
US11659346B2 (en) 2017-03-21 2023-05-23 Ask Industries Gmbh Method for generating and outputting an acoustic multichannel signal
WO2019141368A1 (en) 2018-01-18 2019-07-25 Ask Industries Gmbh Method for outputting an audio signal reproducing a piece of music into an interior via an output device
US11328741B2 (en) 2018-01-18 2022-05-10 Ask Industries Gmbh Method for outputting an audio signal reproducing a piece of music into an interior via an output device
CN111972928A (en) * 2020-08-21 2020-11-24 浙江指云信息技术有限公司 Sleep-aiding pillow with surrounding sound field and adjusting and controlling method thereof

Also Published As

Publication number Publication date
WO2014094709A2 (en) 2014-06-26
WO2014094709A3 (en) 2014-08-14
JP6163211B2 (en) 2017-07-12
JP2016504622A (en) 2016-02-12

Similar Documents

Publication Publication Date Title
DE602004002390T2 (en) AUDIO CODING
EP1797552B1 (en) Method and device for the extraction of a melody on which an audio signal is based
DE602005005186T2 (en) METHOD AND SYSTEM FOR SOUND SOUND SEPARATION
DE60306512T2 (en) PARAMETRIC DESCRIPTION OF MULTI-CHANNEL AUDIO
DE602004007945T2 (en) CODING OF AUDIO SIGNALS
DE69827775T2 (en) TONKANALSMISCHUNG
WO2006039995A1 (en) Method and device for harmonic processing of a melodic line
EP2499843B1 (en) Method for mixing microphone signals of a recording using multiple microphones
DE102012025016B3 (en) Method for determining at least two individual signals from at least two output signals
EP1280138A1 (en) Method for audio signals analysis
DE2431161A1 (en) ELECTRONIC MUSICAL INSTRUMENT
WO2006039993A1 (en) Method and device for smoothing a melody line segment
WO2005122136A1 (en) Apparatus and method for determining a chord type on which a test signal is based
DE102014002899A1 (en) A method, apparatus, and manufacture for two-microphone array speech enhancement for a motor vehicle environment
EP2939445B1 (en) Production of 3d audio signals
DE102012017296A1 (en) Generation of multichannel sound from stereo audio signals
EP1787283A1 (en) Extraction of a melody on which an audio signal is based
DE10148351B4 (en) Method and device for selecting a sound algorithm
EP3349481A1 (en) Method of distorting the frequency of an audio signal
DE112020001090T5 (en) SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM
DE1189745B (en) Method for identifying sound events
DE112011105624T5 (en) Control device for dynamic range
WO2004047484A1 (en) Device and method for suppressing a feedback
EP1743324B1 (en) Device and method for analysing an information signal
DE112020004506T5 (en) SIGNAL PROCESSING DEVICE, SIGNAL PROCESSING METHOD AND PROGRAM

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R020 Patent grant now final

Effective date: 20150210