EP1033702A2 - Method to separate speech and noises - Google Patents
Method to separate speech and noises Download PDFInfo
- Publication number
- EP1033702A2 EP1033702A2 EP00104304A EP00104304A EP1033702A2 EP 1033702 A2 EP1033702 A2 EP 1033702A2 EP 00104304 A EP00104304 A EP 00104304A EP 00104304 A EP00104304 A EP 00104304A EP 1033702 A2 EP1033702 A2 EP 1033702A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- speech
- language
- frequency
- intervals
- frequencies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Definitions
- the invention relates to a method for separating speech and noises.
- the object of the invention is to provide a method with which reliably separates speech and noise, if possible in real time.
- the method according to the invention comprises the following steps:
- the digitized speech signal to be freed from interference is in its individual sounds using an envelope method disassembled.
- a band is placed around the intensities. This will only compare all other intensities approved within this band.
- the size of the band depends among other things from the intensity or from the Volume down.
- intervals of Language is calculated and a space of the equivalence classes of the Speech sounds are generated.
- the frequencies within a sound are indicated by suitable loop methods compared in pairs. The division then results for each frequency pair Intervals. These intervals are calculated with the Intervals of the equivalence classes compared. Ales result This check shows whether the frequencies considered have harmonious relationships with each other or not. This harmonious relationships have speech frequencies with everyone other speech frequencies within an envelope or one Loud. Only if in the room of the equivalence classes Reference interval is found, the corresponding frequency transferred to the language file. If there is no reference interval the frequency is transferred to the non-language file.
- the ratio of the pitch difference is replaced by a logarithmic relationship between the amplitudes a new Relationship formed and for the separation of noise / speech used. For the result of this relationship, the procedure repeatedly, in the room of the equivalence classes Search reference interval.
- steps 5 to 8 can be carried out by Appropriate group-theoretical procedures linked together and be optimized. They can also be used individually become.
- the voiced speech sounds of our speech organ are those Harmonious sounds.
- the harmonious family relationships between the partials make the unchangeable (invariant) properties of the sounds.
- In the learning process which from the earliest age to speech recognition enables people to learn the invariants with their hearing Sound characteristics. Because it enables information-bearing from non-information-bearing To distinguish sound characteristics.
- the signal In order to be able to process the speech signals in real time, it is required that the signal be sounded sound by sound in turn after can be processed. For an arbitrary cut to prevent the signal from being processed is a individual flexible process needed. For this, the Envelope calculated because it provides the start, end and the duration of the sound.
- the digitized speech signal can be converted using the Differential calculation first the base points of the envelopes won, which include all individual sounds, indifferent how badly the signal is disturbed. All constrictions in the signal are defined as the start and end points of the envelope. The signal can then be processed sound by sound.
- the minima of the envelope form the start and End points of the envelopes.
- the envelopes of the sounds included different frequencies and are therefore temporal different lengths.
- Each wave packet (each sound) contains n summands. Every nth Summand is the nth partial oscillation from the wave packet.
- the original signal is like this with integral transformations transforms it as an amplitude over frequency, and as Frequency over time for each individual's data set Envelope is available for further processing.
- the amplitudes or the intensities for an envelope plotted against frequency are the amplitudes or the intensities for an envelope plotted against frequency.
- the size of the amplitude band depends on the Intensity or volume.
- the Information as intensity over time in the form of frequencies encoded in a two-dimensional field.
- the integral transformations are called linear operators of the Group theory defined and for the unfolding of the signal used. For example, Fourier and Hilbert transformation used. They transform the signal into one required for subsequent processing State in functional spaces, for example in the frequency space.
- a sound system is an ordered pair of elements.
- the frequency interval is a group and the intervals are an injective mapping of the sound system into the set of all positive real numbers.
- a finite subset of the frequencies is called sound.
- An ordered n-tuple of tones is called an ordered n-sound
- Element swaps are specified by a two or more digit relation on the set of all sounds of a sound system.
- the assignment to speech or non-speech applies to an element from the set of the speech signal if and only if there is a reference tone for the intervals of the signal to be checked from the equivalence class of the number theoretical functions of the prime number field.
- the first frequency is through the second, the third and so divided until the end of the envelope. Then the second one divided by the third, the fourth and so on.
- a Envelope can, for example, thousands of frequencies his. The order of the frequencies must never be interchanged become.
- the equivalence classes are in turn calculated using various number-theoretical functions.
- This reference interval can be interpreted as a reference tone. Then many more parameters for speech recognition are used, such as the attack time and the Cooldown of a tone.
- a two-digit relation of the intervals is defined that a reference tone within several coordinates of the Equivalence class space the element from the one to be examined Signal corresponds exactly.
- a reference tone is defined using this relationship.
- This group operation improves the quality of the separation Language of non-language.
- the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared.
- the maximum of the first wave packet is 500 units.
- the amplitude band with 50 units of bandwidth across the entire frequency space is set as the input band for the processing program.
- the Euler's degree function is particularly advantageous as number theory function can be applied.
- the intervals are with number theoretical functions calculated. It arises from n number theoretical functions n-dimensional metric space that comes from the fields of Equivalence classes of symmetry relationships exist. There are n number theoretical functions, for example 10, used to calculate the intervals. This n number-theoretical functions generate intervals that are too an n-dimensional metric space of the equivalence classes let it stretch. These functions may produce all intervals for all human languages.
- interval groups of the language can e.g. by following number theoretical functions are generated:
- n must itself be a function of the system (a 1 , a 2 , ... a n ). This value of a consonance is the quotient of the smallest common multiple and the largest common divisor of the natural numbers describing a sound.
Abstract
Description
Die Erfindung betrifft ein Verfahren zur Trennung von Sprache und Geräuschen.The invention relates to a method for separating speech and noises.
Aufgabe der Erfindung ist es, ein Verfahren zu schaffen, mit der eine zuverlässige Trennung von Sprache und Geräuschen, möglichst in Echtzeit, erreicht wird.The object of the invention is to provide a method with which reliably separates speech and noise, if possible in real time.
Diese Aufgabe wird mit dem Verfahren nach Anspruch 1 gelöst.This object is achieved with the method according to claim 1.
Der diesen Unterlagen beigeheftete Bericht "Trennung Sprache von Nichtsprache auf gruppentheoretischer Basis", Stand vom Dienstag, den 29.02.2000, mit den zugehörigen Testdiagrammen ist Bestandteil der Beschreibung der Erfindung und dient der Ergänzung des Offenbarungsgehalts.The report "Separation of language of non - language based on group theory ", as of Tuesday, February 29th, 2000, with the corresponding test diagrams is part of the description of the invention and is used Completion of the disclosure content.
Das erfindungsgemäße Verfahren umfaßt die folgenden Schritte:The method according to the invention comprises the following steps:
Das von Störungen zu befreiende digitalisierte Sprachsignal wird in seine Einzelklänge mit Hilfe einer Hüllkurvenmethode zerlegt.The digitized speech signal to be freed from interference is in its individual sounds using an envelope method disassembled.
Mittels Integraltransformationen wird das Sprachsignal von der Darstellung Intensität über die Zeit in eine Darstellung Amplitude über die Frequenz und Frequenz über die Zeit transformiert. The speech signal from the Plot intensity over time in a plot Amplitude versus frequency and frequency versus time transformed.
Im Frequenzraum wird ein Band um die Intensitäten gelegt. Hierdurch wird ein Vergleich aller übrigen Intensitäten nur innerhalb dieses Bandes zugelassen. Die Größe des Bandes hängt unter anderem von der Intensität beziehungsweise von der Lautstärke ab.In the frequency domain, a band is placed around the intensities. This will only compare all other intensities approved within this band. The size of the band depends among other things from the intensity or from the Volume down.
Mittels zahlentheoretischer Funktionen werden Intervalle der Sprache berechnet und ein Raum der Äquivalenzklassen der Sprachtöne erzeugt.With the help of number theoretical functions, intervals of Language is calculated and a space of the equivalence classes of the Speech sounds are generated.
Die Frequenzen innerhalb eines Lautes (Hüllkurve) werden durch geeignete Schleifenverfahren miteinander paarweise verglichen. Es entstehen dann für jedes Frequenzpaar aus der Teilung Intervalle. Diese Intervalle werden mit den berechneten Intervallen der Äquivalenzklassen verglichen. Ales Ergebnis dieser Überprüfung ergibt sich, ob die betrachteten Frequenzen miteinander harmonische Beziehungen haben oder nicht. Diese harmonischen Beziehungen haben Sprachfrequenzen mit allen anderen Sprachfrequenzen innerhalb einer Hüllkurve oder eines Lautes. Nur dann, wenn im Raum der Äquivalenzklassen ein Bezugsintervall gefunden wird, wird die entsprechende Frequenz in die Datei Sprache überwiesen. Wenn es kein Bezugsintervall gibt, wird die Frequenz in die Datei Nichtsprache überwiesen.The frequencies within a sound (envelope) are indicated by suitable loop methods compared in pairs. The division then results for each frequency pair Intervals. These intervals are calculated with the Intervals of the equivalence classes compared. Ales result This check shows whether the frequencies considered have harmonious relationships with each other or not. This harmonious relationships have speech frequencies with everyone other speech frequencies within an envelope or one Loud. Only if in the room of the equivalence classes Reference interval is found, the corresponding frequency transferred to the language file. If there is no reference interval the frequency is transferred to the non-language file.
Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht wird, dann wechselwirken die Intervalle der Äquivalenzklassen die ihrerseits kleiner als 1 sind mit den zu vergleichenden Frequenzen des zu untersuchenden Sprachsignals. Dieser Effekt trennt einen Teil der Nichtsprache von Sprache. If the band around the amplitudes is made much smaller than 1 then the intervals of the equivalence classes interact which in turn are less than 1 with those to be compared Frequencies of the speech signal to be examined. This effect separates part of non-language from language.
Aus dem Verhältnis der Tonhöhendifferenz wird durch eine logarithmische Beziehung zwischen den Amplituden eine neue Beziehung gebildet und für die Trennung Geräusch/Sprache genutzt. Für das Ergebnis dieser Beziehung wird die Prozedur wiederholt, in dem Raum der Äquivalenzklassen ein Bezugsintervall zu suchen.The ratio of the pitch difference is replaced by a logarithmic relationship between the amplitudes a new Relationship formed and for the separation of noise / speech used. For the result of this relationship, the procedure repeatedly, in the room of the equivalence classes Search reference interval.
Wenn das Frequenzverhältnis größer als 8 wird, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Wenn man Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor werden, dann handelt es sich um Nichtsprache.If the frequency ratio becomes greater than 8, then one approaches the symmetry limit for harmony or consonance. If Removed frequencies whose intervals are larger than a certain one Become a factor, then it is non-language.
Die einzelnen Trennverfahren (Schritte 5 bis 8) können durch geeignete gruppentheoretische Verfahren miteinander verbunden und optimiert werden. Sie können auch einzeln eingesetzt werden.The individual separation processes (steps 5 to 8) can be carried out by Appropriate group-theoretical procedures linked together and be optimized. They can also be used individually become.
Vorteilhafte Ausführungen des erfindungsgemäßen Verfahrens werden im folgenden beschrieben.Advantageous embodiments of the method according to the invention are described below.
Die stimmhaften Sprachlaute unseres Sprechorgans sind die Harmonische Klänge. Die harmonischen Verwandschaftsbeziehungen zwischen den Teiltönen stellen die unveränderlichen (invarianten) Eigenschaften der Klänge dar. Bei dem Lernprozeß, welcher von frühestem Alter an die Sprachlauterkennung ermöglicht, erlernt der Mensch mit seinem Gehör die invarianten Klangeigenschaften. Denn dadurch wird es in die Lage versetzt, informationstragende von nichtinformationstragenden Klangmerkmalen zu unterscheiden.The voiced speech sounds of our speech organ are those Harmonious sounds. The harmonious family relationships between the partials make the unchangeable (invariant) properties of the sounds. In the learning process, which from the earliest age to speech recognition enables people to learn the invariants with their hearing Sound characteristics. Because it enables information-bearing from non-information-bearing To distinguish sound characteristics.
Um die Sprachsignale in Echtzeit verarbeiten zu können, ist es erforderlich, daß das Signal Klang für Klang einzeln der Reihe nach abgearbeitet werden kann. Um ein willkürliches Abschneiden des Signales für die Verarbeitung zu verhindern, wird ein individuelles flexibles Verfahren gebraucht. Dazu wird die Hüllkurve berechnet, denn sie liefert Anfangs-, Endpunkt und die Klangdauer.In order to be able to process the speech signals in real time, it is required that the signal be sounded sound by sound in turn after can be processed. For an arbitrary cut to prevent the signal from being processed is a individual flexible process needed. For this, the Envelope calculated because it provides the start, end and the duration of the sound.
Aus dem digitalisierten Sprachsignal werden mit Hilfe der Differentialrechnung zunächst die Stützpunkte der Hüllkurven gewonnen, die alle einzelne Klänge einschließen, gleichgültig wie stark gestört das Signal ist. Alle Einschnürungen im Signal werden als Anfangs- und Endpunkte der Hüllkurve definiert. Damit kann dann das Signal Klang für Klang verarbeitet werden.The digitized speech signal can be converted using the Differential calculation first the base points of the envelopes won, which include all individual sounds, indifferent how badly the signal is disturbed. All constrictions in the signal are defined as the start and end points of the envelope. The signal can then be processed sound by sound.
Das Differenzieren der Hüllkurve führt zu den Minima der Hüllkurve. Die Minima der Hüllkurve bilden Anfangs- und Endpunkte der Hüllkurven. Die Hüllkkurven der Klänge enthalten unterschiedlich viele Frequenzen und sind deshalb zeitlich verschieden lang.Differentiating the envelope leads to the minima of Envelope. The minima of the envelope form the start and End points of the envelopes. The envelopes of the sounds included different frequencies and are therefore temporal different lengths.
Darstellung des Sprachsignales im Frequenzraum: Amplitude als Ordinate und Frequenz als AbszisseFourier transform:
Representation of the speech signal in the frequency domain: amplitude as ordinate and frequency as abscissa
Darstellung des Sprachsignales im Frequenzraum: Frequenz als Ordinate und Zeit als AbszisseHilbert transformation:
Representation of the speech signal in the frequency domain: frequency as ordinate and time as abscissa
Jedes Wellenpaket (jeder Klang) enthält n Summanden. Jeder n-te Summand ist die n-te Partialschwingung von dem Wellenpaket.Each wave packet (each sound) contains n summands. Every nth Summand is the nth partial oscillation from the wave packet.
Das Ursprungssignal wird mit Integraltranformationen so transformiert, daß es als Amplitude über die Frequenz, und als Frequenz über die Zeit für den Datensatz jeder einzelnen Hüllkurve zur weiteren Verarbeitung zur Verfügung steht. The original signal is like this with integral transformations transforms it as an amplitude over frequency, and as Frequency over time for each individual's data set Envelope is available for further processing.
Im Fourierraum beispielsweise sind die Amplituden beziehungsweise die Intensitäten jeweils für eine Hüllkurve über die Frequenz aufgetragen. Hier wird mit einem Amplitudenband innerhalb des Frequenzraumes um die Intensitäten ein Vergleich aller übrigen Intensitäten nur innerhalb dieses Bandes zugelassen. Die Größe der Amplitudenbandes hängt von der Intensität beziehungsweise der Lautstärke ab.In the Fourier space, for example, are the amplitudes or the intensities for an envelope plotted against frequency. Here with one Amplitude band within the frequency space around the intensities a comparison of all other intensities only within this Band approved. The size of the amplitude band depends on the Intensity or volume.
Alle zu den Intensitäten gehörenden Frequenzen sind im Funktionenraum der Hilberttransformation als Frequenzen über die Zeit vorhanden.All frequencies belonging to the intensities are in the Functional space of the Hilbert transformation as frequencies over the time is available.
In dem digitalisierten Sprachsignal als Ausgangssignal ist die Information als Intensität über die Zeit in Form von Frequenzen in einem zweidimensionalen Feld kodiert.In the digitized speech signal as the output signal is the Information as intensity over time in the form of frequencies encoded in a two-dimensional field.
Die Integraltransformationen werden als lineare Operatoren der Gruppentheorie definiert und zur Entfaltung des Signals eingesetzt. Beispielsweise werden Fourier- und Hilberttransformation eingesetzt. Sie transformieren das Signal in einen für die nachfolgende Verarbeitung erforderlichen Zustand in Funktionenräume, beispielsweise in den Frequenzraum.The integral transformations are called linear operators of the Group theory defined and for the unfolding of the signal used. For example, Fourier and Hilbert transformation used. They transform the signal into one required for subsequent processing State in functional spaces, for example in the frequency space.
Ein Tonsystem ist ein geordnetes Paar von Elementen.
Dabei ist das Frequenzintervall eine Gruppe und die Intervalle
sind eine injektive Abbildung des Tonsystems in die Menge aller
positiven reellen Zahlen.
Eine endliche Teilmenge aus den Frequenzen heißt Klang.
Ein geordnetes n-Tupel von Tönen wird geordneter n-Klang
genannt A sound system is an ordered pair of elements. The frequency interval is a group and the intervals are an injective mapping of the sound system into the set of all positive real numbers.
A finite subset of the frequencies is called sound.
An ordered n-tuple of tones is called an ordered n-sound
Elementvertauschungen werden durch eine zwei- oder mehrstellige
Relation auf der Menge aller Klänge eines Tonsystems
präzisiert.
Dabei gilt für ein Element aus der Menge des Sprachsignals die
Zuordnung zu Sprache oder Nichtsprache genau dann, wenn zu den
Intervallen des zu prüfenden Signais ein Bezugston aus der
Äquivalenzklasse der zahlentheoretischen Funktionen des
Primzahlkörpers existiert.Element swaps are specified by a two or more digit relation on the set of all sounds of a sound system.
The assignment to speech or non-speech applies to an element from the set of the speech signal if and only if there is a reference tone for the intervals of the signal to be checked from the equivalence class of the number theoretical functions of the prime number field.
Alle Frequenzen des Frequenzraumes des transformierten Sprachsignales müssen überprüft werden, ob sie Symmetriebeziehungen mit anderen Frequenzen der gleichen Hüllkurve haben. In den Symmetriebeziehungen der Elemente liegen invariante Eigenschaften der Sprache verschlüsselt vor.All frequencies of the frequency space of the transformed Voice signals must be checked to see if they Symmetry relationships with other frequencies of the same Have envelope. In the symmetry relationships of the elements there are encrypted invariant properties of the language.
Von dem zu verarbeitendem Signal werden deshalb innerhalb der Hüllkurve alle Frequenzen paarweise der Reihe nach mit allen anderen Frequenzen dividiert, um Intervalle zu bilden. Dies geschieht solange, bis jede Frequenz in der fortlaufenden Reihenfolge nach und nach durch alle anderen Frequenzen in der gleichen Hüllkurve geteilt wurde, um vorübergehend zu einer Verhältniszahl (Intervall) dieses Frequenzpaares zu kommen. Of the signal to be processed are therefore within the Envelope all frequencies in pairs with all divided other frequencies to form intervals. This happens until each frequency in the continuous Sequence through all other frequencies in the same envelope has been divided to temporarily become one Ratio number (interval) of this frequency pair to come.
Die erste Frequenz wird durch die zweite, der dritten und so fort geteilt, bis zum Ende der Hüllkurve. Dann wird die zweite durch die dritte, der vierten und so fort geteilt. In einer Hüllkurve können beispielsweise jeweils tausende Frequenzen sein. Dabei darf nie die Reihenfolge der Frequenzen vertauscht werden.The first frequency is through the second, the third and so divided until the end of the envelope. Then the second one divided by the third, the fourth and so on. In a Envelope can, for example, thousands of frequencies his. The order of the frequencies must never be interchanged become.
Die Trennung von Sprache und Nichtsprache wird mit einer Folge von mehreren Symmetrieoperationen durchgeführt.The separation of language and non-language becomes a consequence performed by several symmetry operations.
Nach jeder Intervallbildung innerhalb des Frequenzraumes des zu überprüfenden Sprachsignals muß ein Bezugsintervall aus den Äquivalenzklassen der berechneten Intervalle gefunden werden.After each interval formation within the frequency range of the checking speech signal must have a reference interval from the Equivalence classes of the calculated intervals can be found.
Die Äquivalenzklassen wiederum werden durch verschiedene
zahlentheoretische Funktionen berechnet. Die Trennwirkung wird
deutlich besser, wenn man die Erfüllung eines Bezugsintervalles
für jede zahlentheoretische Funktion fordert. Wenn dies n
Funktionen sind, (wobei n = natürliche ganze Zahlen sind) dann
spannen diese zahlentheoretischen Funktionen einen n-dimensionalen
metrischen Raum auf.
Wenn das aus dem zu prüfenden Signal gewonnene Intervall in
allen zahlentheoretischen Funktionen genau eine
Bezugskoordinate findet, dann sind alle zahlentheoretischen
Funktionen mindestens einmal erfüllt. Die Koordinaten führen zu
genau einem Bezugsintervall aus dem Raum der Äquivalenzklassen.The equivalence classes are in turn calculated using various number-theoretical functions. The separating effect becomes significantly better if one demands the fulfillment of a reference interval for every number-theoretical function. If these are n functions (where n = natural integers), then these number theoretical functions span an n-dimensional metric space.
If the interval obtained from the signal to be tested finds exactly one reference coordinate in all number-theoretical functions, then all number-theoretical functions are fulfilled at least once. The coordinates lead to exactly one reference interval from the space of the equivalence classes.
Über diesen Bezugston können genau dann weitere Sprachparameter wie beispielsweise Anklingzeit und Abklingzeit eines Lautes abgefragt werden, wenn diesem n-dimensionalen Raum eine Metrik aufgeprägt wird. Dies kann mit Hilfe der Gruppentheorie auf der Basis von Matrizen-Operationen durchgeführt werden. You can then use this reference tone to call other speech parameters such as the sound's decay time and decay time be queried if this n-dimensional space is a metric is imprinted. This can be done with the help of group theory on the Basis of matrix operations are performed.
Dieses Bezugsintervall kann als Bezugston aufgefaßt werden. Dann können viele weitere Parameter für die Spracherkennung herangezogen werden, wie beispielsweise die Anklingzeit und die Abklingzeit eines Tones.This reference interval can be interpreted as a reference tone. Then many more parameters for speech recognition are used, such as the attack time and the Cooldown of a tone.
Gibt es ein Bezugsintervall, dann muß sich das Rechenverfahren diese Elemente so lange merken, bis alle Elemente miteinander verglichen wurden. Erst nach Abschluß dieses Sortierungsprozesses weiß das Verfahren, welche Elemente mit anderen Intervallbeziehungen haben.If there is a reference interval, then the calculation procedure must memorize these elements until all the elements are together were compared. Only after completing this Sorting process, the process knows which elements to use have other interval relationships.
Alle die Frequenzen, die über die Intervalle Beziehungen miteinander haben, stehen schließlich mit allen anderen Frequenzen innerhalb der gleichen Hüllkurve und damit des gleichen Lautes der Sprache in Beziehung. Das Verfahren merkt sich all diese Elemente. Am Ende des Rechenprozesses werden alle solche Elemente in den Speicher für Sprache abgelegt. Alle anderen Frequenzen, die sich nicht in dieses Beziehungssystem einbinden lassen, sind beziehungslose Elemente und kommen in den Speicher für Nichtsprache. Ein Teil der Nichtsprache wird hierdurch bereits von der Sprache getrennt.All the frequencies over the intervals relationships after all, stand with everyone else Frequencies within the same envelope and thus the same sound of language in relation. The process notices yourself all these elements. At the end of the calculation process all such items are stored in the memory for speech. All other frequencies that are not in this relationship system Get involved are unrelated elements and come in the memory for non-language. Becomes part of the non-language hereby already separated from the language.
Elemente, die miteinander durch symmetrische Beziehungen dieser Intervalle verbunden sind, sind Elemente der Sprache. Elemente die in keinem symmetrischen Zusammenhang mit allen anderen Elementen innerhalb der Hüllkurve stehen sind keine Sprache. Sie übertragen keine Information.Elements that are related to each other through symmetrical relationships Intervals connected are elements of language. elements those in no symmetrical context with everyone else Elements within the envelope are not a language. They do not transmit any information.
Es wird eine zweistellige Relation der Intervalle so definiert, daß ein Bezugston innerhalb von mehreren Koordinaten des Äquivalenzklassenraumes dem Element aus dem zu untersuchenden Signal genau entspricht. A two-digit relation of the intervals is defined that a reference tone within several coordinates of the Equivalence class space the element from the one to be examined Signal corresponds exactly.
Die Elemente der existierenden Faktormenge der Frequenzintervalle aus den Äquivalenzklassen werden nun als Harmonien definiert.The elements of the existing set of factors Frequency intervals from the equivalence classes are now as Harmonies defined.
In der folgenden Formel wird die Tonhöhendifferenz mit dem
logarithmischen Verhältnis der Amplituden in Beziehung
gebracht.
Mit Hilfe dieser Beziehung wird ein Bezugston definiert.A reference tone is defined using this relationship.
Dann wiederholt sich das vorhergehende Verfahren.Then the previous procedure is repeated.
Diese Gruppenoperation verbessert die Qualität der Trennung Sprache von Nichtsprache.This group operation improves the quality of the separation Language of non-language.
Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht
wird, dann wechselwirken die Intervalle der Äquivalenzklassen
die ihrerseits kleiner als 1 sind mit den zu vergleichenden
Frequenzen des zu untersuchenden Sprachsignals.
Beispielsweise sei das Maximum des ersten Wellenpaketes bei
500 Einheiten. Um alle zu vergleichenden Amplituden sei das
Amplitudenband mit 50 Einheiten Bandbreite durch den ganzen
Frequenzraum als Eingangsband für das Verarbeitungsprogramm
eingestellt.If the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared.
For example, the maximum of the first wave packet is 500 units. In order to compare all the amplitudes, the amplitude band with 50 units of bandwidth across the entire frequency space is set as the input band for the processing program.
Es entsteht ein neuer Effekt, wenn diesem Verarbeitungsprogramm ein Vorprogramm vorgeschaltet wird, bei dem nur die Bandbreite des Amplitudenbandes viel kleiner als 1 eingestellt, beispielsweise auf 0,05 statt 50.There is a new effect when this processing program a pre-program is used, in which only the bandwidth the amplitude band is set much smaller than 1, for example 0.05 instead of 50.
Dann trennt dieses Verfahren Sprache von Nichtsprache mit Hilfe
der besprochenen Methode des Äquivalenzklassen genau umgekehrt.
Man muß dann die Speicherzuweisung umkehren, da sich dieses
Verfahren umgekehrt verhält.
Dieser Effekt trennt einen Teil der Nichtsprache von Sprache.
Weil das Verfahren sehr schnell ist, bietet es sich an, damit
zu beginnen. Da jedes Verfahren, das Nichtsprache entfernt, die
Arbeit nachfolgender Verfahren beschleunigt, muß man mit dem
schnellsten Verfahren beginnen.Then this procedure separates language from non-language with the help of the discussed method of equivalence classes, exactly the opposite. The memory allocation must then be reversed since this procedure is reversed.
This effect separates part of the non-language from language. Because the procedure is very fast, it is a good idea to start with it. Since any process that removes non-language speeds up the work of subsequent processes, you have to start with the fastest process.
Wenn das Frequenzverhältnis zu groß wird, beispielsweise größer als 8, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Wenn man Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor werden, dann handelt es sich um Nichtsprache.If the frequency ratio becomes too large, for example larger than 8, then one approaches the symmetry limit for harmonic sound or consonance. If you remove frequencies, their intervals become larger than a certain factor, then it is about non-language.
Je mehr richtig berechnete Intervalle in einer Gruppe sind, um so besser wird der Trennprozeß.The more correctly calculated intervals in a group are around so the separation process gets better.
Wenn in einer Gruppe Intervalle doppelt oder mehrfach sind, dann verschlechtert sich der Trennprozeß. If intervals are double or multiple in a group, then the separation process deteriorates.
Je mehr verschiedene zahlentheoretische Funktionen so eingesetzt werden, daß jede sich in einer eigenen Gruppe befindet, um so besser wird der Trennprozeß.The more different number theoretical functions like this be used so that each is in its own group the better the separation process.
Wenn verschiedene zahlentheoretische Funktionen in einer Gruppe zusammengefaßt werden, dann verschlechtert sich der Trennprozeß.If different number theoretical functions in a group are summarized, then the deteriorates Separation process.
Wenn die Intervalle beispielsweise durch nicht geeignete zahlentheoretische Funktionen berechnet werden, dann verschlechtert sich der Trennprozeß.If the intervals are not suitable, for example number theoretical functions are then calculated the separation process deteriorates.
Aus der Musiktheorie kennt man seit Jahrhunderten die Existenz von Intervallen. Schon Kepler suchte nach allgemeinen Harmoniegesetzen. Er suchte nach Weltharmoniegesetzen. Neben vielen ist aber besonders Leonhard Euler zu nennen, der den Zusammenhang zwischen der Zerlegung der natürlichen Zahlen in Produkte von Primzahlpotenzen, den Fermatschen Sätzen und der Zahlentheorie mit zahlentheoretischen Funktionen erkannte.The existence of music theory has been known for centuries of intervals. Kepler was already looking for general ones Laws of harmony. He was looking for world harmony laws. Next Many, however, should be mentioned in particular Leonhard Euler, who Relationship between the decomposition of natural numbers into Products of prime powers, the Fermat theorems and the Number theory with number theoretical functions recognized.
Der Mathematiker Leonhard Euler stellte eine komplizierte zahlentheoretische Funktion (Eulersche Gradusfunktion) zur Berechnung solcher Intervalle auf und berechnete sie für die Zahlen 1 bis 10. Das sind dann 92 Intervalle für die Musikklänge.The mathematician Leonhard Euler presented a complicated one number theoretical function (Euler grading function) for Calculation of such intervals and calculated them for the Numbers 1 to 10. That is 92 intervals for the Music sounds.
Leibnitz und Herder sagten, daß unsere Seele unbewußt zähle.Leibnitz and Herder said that our soul counts unconsciously.
Für das erfindungsgemäße Verfahren zur Spracherkennung kann die Eulersche Gradusfunktion besonders vorteilhaft als zahlentheoretische Funktion angewandt werden.For the method according to the invention for speech recognition, the Euler's degree function is particularly advantageous as number theory function can be applied.
Es gibt weiter zahlentheoretische Funktionen. Dahinter stehen komplizierte Strukturen und Sachverhalte der Zahlentheorie und der Algebra, wie beispielsweise die Gammafunktion. There are also number theoretical functions. Stand behind it complicated structures and facts of number theory and algebra, such as the gamma function.
Die Intervalle werden mit zahlentheoretischen Funktionen berechnet. Es entsteht aus n zahlentheoretischen Funktionen ein n-dimensionaler metrischer Raum, der aus den Feldern der Äquivalenzklassen der Symmetriebeziehungen besteht. Es werden n zahlentheoretische Funktionen, beispielsweise 10, zur Berechnung der Intervalle eingesetzt. Diese n zahlentheoretischen Funktionen erzeugen Intervalle die sich zu einem n-dimensionalen metrischen Raum der Äquivalenzklassen aufspannen lassen. Möglicherweise erzeugen diese Funktionen alle Intervalle für alle menschlichen Sprachen.The intervals are with number theoretical functions calculated. It arises from n number theoretical functions n-dimensional metric space that comes from the fields of Equivalence classes of symmetry relationships exist. There are n number theoretical functions, for example 10, used to calculate the intervals. This n number-theoretical functions generate intervals that are too an n-dimensional metric space of the equivalence classes let it stretch. These functions may produce all intervals for all human languages.
Die Beziehungen zwischen den Elementen wird wichtiger als die Elemente selbst.The relationships between the elements becomes more important than that Elements themselves.
Jede natürliche Zahl n wird aus Primzahlen P1, P2, ... Pn
zusammengesetzt. Dann wird eine Zahl n zu:
n muß somit selbst eine Funktion des Systems (a1, a2, ... an) sein. Dieser Wert einer Konsonanz ist der Quotient aus dem kleinsten gemeinschaftlichen Vielfachen und dem größten gemeinschaftlichen Teiler der einen Klang beschreibenden natürlichen Zahlen.n must itself be a function of the system (a 1 , a 2 , ... a n ). This value of a consonance is the quotient of the smallest common multiple and the largest common divisor of the natural numbers describing a sound.
Die Gradusfunktion für gekürzte Brüche a/b ergibt sich aus
Claims (1)
Die eigentliche Trennung von Sprache und Geräuschen erfolgt anschließend durch eines oder mehreren der folgenden Verfahrensschritte:
Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht wird, dann wechselwirken die Intervalle der Äquivalenzklassen die ihrerseits kleiner als 1 sind mit den zu vergleichenden Frequenzen des zu untersuchenden Sprachsignals. Dieser Effekt trennt einen Teil der Nichtsprache von Sprache.
Wenn das Frequenzverhältnis größer als 8 wird, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Es werden diejenigen Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor sind.
The actual separation of speech and noise is then carried out by one or more of the following process steps:
If the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared. This effect separates part of the non-language from language.
If the frequency ratio becomes greater than 8, then the symmetry limit for harmony or consonance is approached. Those frequencies are removed whose intervals are larger than a certain factor.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1999109150 DE19909150A1 (en) | 1999-03-02 | 1999-03-02 | Method of separating speech and noise |
DE19909150 | 1999-03-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1033702A2 true EP1033702A2 (en) | 2000-09-06 |
EP1033702A3 EP1033702A3 (en) | 2003-01-02 |
Family
ID=7899462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP00104304A Ceased EP1033702A3 (en) | 1999-03-02 | 2000-03-02 | Method to separate speech and noises |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP1033702A3 (en) |
DE (1) | DE19909150A1 (en) |
-
1999
- 1999-03-02 DE DE1999109150 patent/DE19909150A1/en not_active Withdrawn
-
2000
- 2000-03-02 EP EP00104304A patent/EP1033702A3/en not_active Ceased
Non-Patent Citations (1)
Title |
---|
Keine Recherche * |
Also Published As
Publication number | Publication date |
---|---|
DE19909150A1 (en) | 2000-09-07 |
EP1033702A3 (en) | 2003-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1405222B1 (en) | Method and device for producing a fingerprint and method and device for identifying an audio signal | |
DE3306730C2 (en) | ||
DE60018886T2 (en) | Adaptive wavelet extraction for speech recognition | |
DE10232916B4 (en) | Apparatus and method for characterizing an information signal | |
EP1371055B1 (en) | Device for the analysis of an audio signal with regard to the rhythm information in the audio signal using an auto-correlation function | |
DE60009827T2 (en) | TIME CALENDAR MODIFICATION OF AN AUDIO SIGNAL | |
DE112013006650T5 (en) | Multi-layer system for symbol memory based compression of patterns | |
DE2825110A1 (en) | METHOD OF DETECTING CONTINUOUS VOICE SIGNALS | |
DE69930961T2 (en) | DEVICE AND METHOD FOR LANGUAGE SEGMENTATION | |
EP1280138A1 (en) | Method for audio signals analysis | |
EP1388145B1 (en) | Device and method for analysing an audio signal in view of obtaining rhythm information | |
WO2005122136A1 (en) | Apparatus and method for determining a chord type on which a test signal is based | |
DE60133537T2 (en) | AUTOMATIC UMTRAINING OF A LANGUAGE RECOGNITION SYSTEM | |
DE112018004462T5 (en) | QUERY PROCESSING | |
EP0772764B1 (en) | Process and device for determining the tonality of an audio signal | |
EP1755110A2 (en) | Method and device for adaptive reduction of noise signals and background signals in a speech processing system | |
EP1033702A2 (en) | Method to separate speech and noises | |
DE202022100306U1 (en) | A system for classifying melodies using Swaragram representation | |
DE102017101653B3 (en) | System and method for determining at least one frequency of an auditory perception or attenuation of the auditory perception of a person at that frequency | |
DE102007056221B4 (en) | Method for speech recognition | |
DE2363590A1 (en) | VOICE RECOGNITION SYSTEM WITH CHARACTERISTICS ENCODING | |
DE102013106333B4 (en) | SIGNAL GENERATING DEVICE AND METHOD IN A COMMUNICATION SYSTEM | |
DE602004007249T2 (en) | Uniform treatment of resolved and unresolved harmonics | |
EP1170723A2 (en) | Method for the computation of phoneme duration statistics and method for the determination of the duration of isolated phonemes for speech synthesis | |
DE112020004506T5 (en) | SIGNAL PROCESSING DEVICE, SIGNAL PROCESSING METHOD AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
PUAL | Search report despatched |
Free format text: ORIGINAL CODE: 0009013 |
|
AK | Designated contracting states |
Kind code of ref document: A3 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
RIC1 | Information provided on ipc code assigned before grant |
Free format text: 7G 10L 21/02 A, 7G 10L 11/02 B |
|
17P | Request for examination filed |
Effective date: 20030419 |
|
AKX | Designation fees paid |
Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
|
17Q | First examination report despatched |
Effective date: 20050613 |
|
APBN | Date of receipt of notice of appeal recorded |
Free format text: ORIGINAL CODE: EPIDOSNNOA2E |
|
APBR | Date of receipt of statement of grounds of appeal recorded |
Free format text: ORIGINAL CODE: EPIDOSNNOA3E |
|
APAF | Appeal reference modified |
Free format text: ORIGINAL CODE: EPIDOSCREFNE |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: GEHRLEIN, JAN |
|
RIN1 | Information on inventor provided before grant (corrected) |
Inventor name: GEHRLEIN, JAN |
|
APBT | Appeal procedure closed |
Free format text: ORIGINAL CODE: EPIDOSNNOA9E |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED |
|
18R | Application refused |
Effective date: 20110809 |