EP1033702A2 - Method to separate speech and noises - Google Patents

Method to separate speech and noises Download PDF

Info

Publication number
EP1033702A2
EP1033702A2 EP00104304A EP00104304A EP1033702A2 EP 1033702 A2 EP1033702 A2 EP 1033702A2 EP 00104304 A EP00104304 A EP 00104304A EP 00104304 A EP00104304 A EP 00104304A EP 1033702 A2 EP1033702 A2 EP 1033702A2
Authority
EP
European Patent Office
Prior art keywords
speech
language
frequency
intervals
frequencies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP00104304A
Other languages
German (de)
French (fr)
Other versions
EP1033702A3 (en
Inventor
Hehrwart Schröder
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gehrlein Jan
Original Assignee
Schroder Hehrwart
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Schroder Hehrwart filed Critical Schroder Hehrwart
Publication of EP1033702A2 publication Critical patent/EP1033702A2/en
Publication of EP1033702A3 publication Critical patent/EP1033702A3/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Definitions

  • the invention relates to a method for separating speech and noises.
  • the object of the invention is to provide a method with which reliably separates speech and noise, if possible in real time.
  • the method according to the invention comprises the following steps:
  • the digitized speech signal to be freed from interference is in its individual sounds using an envelope method disassembled.
  • a band is placed around the intensities. This will only compare all other intensities approved within this band.
  • the size of the band depends among other things from the intensity or from the Volume down.
  • intervals of Language is calculated and a space of the equivalence classes of the Speech sounds are generated.
  • the frequencies within a sound are indicated by suitable loop methods compared in pairs. The division then results for each frequency pair Intervals. These intervals are calculated with the Intervals of the equivalence classes compared. Ales result This check shows whether the frequencies considered have harmonious relationships with each other or not. This harmonious relationships have speech frequencies with everyone other speech frequencies within an envelope or one Loud. Only if in the room of the equivalence classes Reference interval is found, the corresponding frequency transferred to the language file. If there is no reference interval the frequency is transferred to the non-language file.
  • the ratio of the pitch difference is replaced by a logarithmic relationship between the amplitudes a new Relationship formed and for the separation of noise / speech used. For the result of this relationship, the procedure repeatedly, in the room of the equivalence classes Search reference interval.
  • steps 5 to 8 can be carried out by Appropriate group-theoretical procedures linked together and be optimized. They can also be used individually become.
  • the voiced speech sounds of our speech organ are those Harmonious sounds.
  • the harmonious family relationships between the partials make the unchangeable (invariant) properties of the sounds.
  • In the learning process which from the earliest age to speech recognition enables people to learn the invariants with their hearing Sound characteristics. Because it enables information-bearing from non-information-bearing To distinguish sound characteristics.
  • the signal In order to be able to process the speech signals in real time, it is required that the signal be sounded sound by sound in turn after can be processed. For an arbitrary cut to prevent the signal from being processed is a individual flexible process needed. For this, the Envelope calculated because it provides the start, end and the duration of the sound.
  • the digitized speech signal can be converted using the Differential calculation first the base points of the envelopes won, which include all individual sounds, indifferent how badly the signal is disturbed. All constrictions in the signal are defined as the start and end points of the envelope. The signal can then be processed sound by sound.
  • the minima of the envelope form the start and End points of the envelopes.
  • the envelopes of the sounds included different frequencies and are therefore temporal different lengths.
  • Each wave packet (each sound) contains n summands. Every nth Summand is the nth partial oscillation from the wave packet.
  • the original signal is like this with integral transformations transforms it as an amplitude over frequency, and as Frequency over time for each individual's data set Envelope is available for further processing.
  • the amplitudes or the intensities for an envelope plotted against frequency are the amplitudes or the intensities for an envelope plotted against frequency.
  • the size of the amplitude band depends on the Intensity or volume.
  • the Information as intensity over time in the form of frequencies encoded in a two-dimensional field.
  • the integral transformations are called linear operators of the Group theory defined and for the unfolding of the signal used. For example, Fourier and Hilbert transformation used. They transform the signal into one required for subsequent processing State in functional spaces, for example in the frequency space.
  • a sound system is an ordered pair of elements.
  • the frequency interval is a group and the intervals are an injective mapping of the sound system into the set of all positive real numbers.
  • a finite subset of the frequencies is called sound.
  • An ordered n-tuple of tones is called an ordered n-sound
  • Element swaps are specified by a two or more digit relation on the set of all sounds of a sound system.
  • the assignment to speech or non-speech applies to an element from the set of the speech signal if and only if there is a reference tone for the intervals of the signal to be checked from the equivalence class of the number theoretical functions of the prime number field.
  • the first frequency is through the second, the third and so divided until the end of the envelope. Then the second one divided by the third, the fourth and so on.
  • a Envelope can, for example, thousands of frequencies his. The order of the frequencies must never be interchanged become.
  • the equivalence classes are in turn calculated using various number-theoretical functions.
  • This reference interval can be interpreted as a reference tone. Then many more parameters for speech recognition are used, such as the attack time and the Cooldown of a tone.
  • a two-digit relation of the intervals is defined that a reference tone within several coordinates of the Equivalence class space the element from the one to be examined Signal corresponds exactly.
  • a reference tone is defined using this relationship.
  • This group operation improves the quality of the separation Language of non-language.
  • the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared.
  • the maximum of the first wave packet is 500 units.
  • the amplitude band with 50 units of bandwidth across the entire frequency space is set as the input band for the processing program.
  • the Euler's degree function is particularly advantageous as number theory function can be applied.
  • the intervals are with number theoretical functions calculated. It arises from n number theoretical functions n-dimensional metric space that comes from the fields of Equivalence classes of symmetry relationships exist. There are n number theoretical functions, for example 10, used to calculate the intervals. This n number-theoretical functions generate intervals that are too an n-dimensional metric space of the equivalence classes let it stretch. These functions may produce all intervals for all human languages.
  • interval groups of the language can e.g. by following number theoretical functions are generated:
  • n must itself be a function of the system (a 1 , a 2 , ... a n ). This value of a consonance is the quotient of the smallest common multiple and the largest common divisor of the natural numbers describing a sound.

Abstract

The process is used to separate out the speech signal from background noise and involves a transformation process from intensity v. time to amplitude v. frequency and frequency v. time. An analytical process is used to determine the speech interval and classification. Separation is based upon a comparison process.

Description

Die Erfindung betrifft ein Verfahren zur Trennung von Sprache und Geräuschen.The invention relates to a method for separating speech and noises.

Aufgabe der Erfindung ist es, ein Verfahren zu schaffen, mit der eine zuverlässige Trennung von Sprache und Geräuschen, möglichst in Echtzeit, erreicht wird.The object of the invention is to provide a method with which reliably separates speech and noise, if possible in real time.

Diese Aufgabe wird mit dem Verfahren nach Anspruch 1 gelöst.This object is achieved with the method according to claim 1.

Der diesen Unterlagen beigeheftete Bericht "Trennung Sprache von Nichtsprache auf gruppentheoretischer Basis", Stand vom Dienstag, den 29.02.2000, mit den zugehörigen Testdiagrammen ist Bestandteil der Beschreibung der Erfindung und dient der Ergänzung des Offenbarungsgehalts.The report "Separation of language of non - language based on group theory ", as of Tuesday, February 29th, 2000, with the corresponding test diagrams is part of the description of the invention and is used Completion of the disclosure content.

Das erfindungsgemäße Verfahren umfaßt die folgenden Schritte:The method according to the invention comprises the following steps:

Vorbereitende RechenschrittePreparatory arithmetic steps 1. Schritt:Step 1:

Das von Störungen zu befreiende digitalisierte Sprachsignal wird in seine Einzelklänge mit Hilfe einer Hüllkurvenmethode zerlegt.The digitized speech signal to be freed from interference is in its individual sounds using an envelope method disassembled.

2. Schritt:2nd step:

Mittels Integraltransformationen wird das Sprachsignal von der Darstellung Intensität über die Zeit in eine Darstellung Amplitude über die Frequenz und Frequenz über die Zeit transformiert. The speech signal from the Plot intensity over time in a plot Amplitude versus frequency and frequency versus time transformed.

3. Schritt:3rd step:

Im Frequenzraum wird ein Band um die Intensitäten gelegt. Hierdurch wird ein Vergleich aller übrigen Intensitäten nur innerhalb dieses Bandes zugelassen. Die Größe des Bandes hängt unter anderem von der Intensität beziehungsweise von der Lautstärke ab.In the frequency domain, a band is placed around the intensities. This will only compare all other intensities approved within this band. The size of the band depends among other things from the intensity or from the Volume down.

4.Schritt:Step 4:

Mittels zahlentheoretischer Funktionen werden Intervalle der Sprache berechnet und ein Raum der Äquivalenzklassen der Sprachtöne erzeugt.With the help of number theoretical functions, intervals of Language is calculated and a space of the equivalence classes of the Speech sounds are generated.

Trennung Sprache von NichtspracheSeparation of language from non-language 5. Schritt:5th step:

Die Frequenzen innerhalb eines Lautes (Hüllkurve) werden durch geeignete Schleifenverfahren miteinander paarweise verglichen. Es entstehen dann für jedes Frequenzpaar aus der Teilung Intervalle. Diese Intervalle werden mit den berechneten Intervallen der Äquivalenzklassen verglichen. Ales Ergebnis dieser Überprüfung ergibt sich, ob die betrachteten Frequenzen miteinander harmonische Beziehungen haben oder nicht. Diese harmonischen Beziehungen haben Sprachfrequenzen mit allen anderen Sprachfrequenzen innerhalb einer Hüllkurve oder eines Lautes. Nur dann, wenn im Raum der Äquivalenzklassen ein Bezugsintervall gefunden wird, wird die entsprechende Frequenz in die Datei Sprache überwiesen. Wenn es kein Bezugsintervall gibt, wird die Frequenz in die Datei Nichtsprache überwiesen.The frequencies within a sound (envelope) are indicated by suitable loop methods compared in pairs. The division then results for each frequency pair Intervals. These intervals are calculated with the Intervals of the equivalence classes compared. Ales result This check shows whether the frequencies considered have harmonious relationships with each other or not. This harmonious relationships have speech frequencies with everyone other speech frequencies within an envelope or one Loud. Only if in the room of the equivalence classes Reference interval is found, the corresponding frequency transferred to the language file. If there is no reference interval the frequency is transferred to the non-language file.

6.SchrittStep 6 Trennen von Sprache und Nichtsprache mit Hilfe eines Amplitudenbandes im Frequenzraum.Separate language and non-language with the help of a Amplitude band in the frequency domain.

Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht wird, dann wechselwirken die Intervalle der Äquivalenzklassen die ihrerseits kleiner als 1 sind mit den zu vergleichenden Frequenzen des zu untersuchenden Sprachsignals. Dieser Effekt trennt einen Teil der Nichtsprache von Sprache. If the band around the amplitudes is made much smaller than 1 then the intervals of the equivalence classes interact which in turn are less than 1 with those to be compared Frequencies of the speech signal to be examined. This effect separates part of non-language from language.

7. Schritt:7th step:

Aus dem Verhältnis der Tonhöhendifferenz wird durch eine logarithmische Beziehung zwischen den Amplituden eine neue Beziehung gebildet und für die Trennung Geräusch/Sprache genutzt. Für das Ergebnis dieser Beziehung wird die Prozedur wiederholt, in dem Raum der Äquivalenzklassen ein Bezugsintervall zu suchen.The ratio of the pitch difference is replaced by a logarithmic relationship between the amplitudes a new Relationship formed and for the separation of noise / speech used. For the result of this relationship, the procedure repeatedly, in the room of the equivalence classes Search reference interval.

8. Schritt:Step 8: Trennen von Sprache und Nichtsprache mit Hilfe der SymmetriegrenzeSeparate language and non-language with the help of Limit of symmetry

Wenn das Frequenzverhältnis größer als 8 wird, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Wenn man Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor werden, dann handelt es sich um Nichtsprache.If the frequency ratio becomes greater than 8, then one approaches the symmetry limit for harmony or consonance. If Removed frequencies whose intervals are larger than a certain one Become a factor, then it is non-language.

Die einzelnen Trennverfahren (Schritte 5 bis 8) können durch geeignete gruppentheoretische Verfahren miteinander verbunden und optimiert werden. Sie können auch einzeln eingesetzt werden.The individual separation processes (steps 5 to 8) can be carried out by Appropriate group-theoretical procedures linked together and be optimized. They can also be used individually become.

Vorteilhafte Ausführungen des erfindungsgemäßen Verfahrens werden im folgenden beschrieben.Advantageous embodiments of the method according to the invention are described below.

Die stimmhaften Sprachlaute unseres Sprechorgans sind die Harmonische Klänge. Die harmonischen Verwandschaftsbeziehungen zwischen den Teiltönen stellen die unveränderlichen (invarianten) Eigenschaften der Klänge dar. Bei dem Lernprozeß, welcher von frühestem Alter an die Sprachlauterkennung ermöglicht, erlernt der Mensch mit seinem Gehör die invarianten Klangeigenschaften. Denn dadurch wird es in die Lage versetzt, informationstragende von nichtinformationstragenden Klangmerkmalen zu unterscheiden.The voiced speech sounds of our speech organ are those Harmonious sounds. The harmonious family relationships between the partials make the unchangeable (invariant) properties of the sounds. In the learning process, which from the earliest age to speech recognition enables people to learn the invariants with their hearing Sound characteristics. Because it enables information-bearing from non-information-bearing To distinguish sound characteristics.

Berechnen der einhüllenden Kurve eines Klanges (Hüllkurve)Calculate the envelope curve of a sound (envelope curve)

Um die Sprachsignale in Echtzeit verarbeiten zu können, ist es erforderlich, daß das Signal Klang für Klang einzeln der Reihe nach abgearbeitet werden kann. Um ein willkürliches Abschneiden des Signales für die Verarbeitung zu verhindern, wird ein individuelles flexibles Verfahren gebraucht. Dazu wird die Hüllkurve berechnet, denn sie liefert Anfangs-, Endpunkt und die Klangdauer.In order to be able to process the speech signals in real time, it is required that the signal be sounded sound by sound in turn after can be processed. For an arbitrary cut to prevent the signal from being processed is a individual flexible process needed. For this, the Envelope calculated because it provides the start, end and the duration of the sound.

Aus dem digitalisierten Sprachsignal werden mit Hilfe der Differentialrechnung zunächst die Stützpunkte der Hüllkurven gewonnen, die alle einzelne Klänge einschließen, gleichgültig wie stark gestört das Signal ist. Alle Einschnürungen im Signal werden als Anfangs- und Endpunkte der Hüllkurve definiert. Damit kann dann das Signal Klang für Klang verarbeitet werden.The digitized speech signal can be converted using the Differential calculation first the base points of the envelopes won, which include all individual sounds, indifferent how badly the signal is disturbed. All constrictions in the signal are defined as the start and end points of the envelope. The signal can then be processed sound by sound.

Das Differenzieren der Hüllkurve führt zu den Minima der Hüllkurve. Die Minima der Hüllkurve bilden Anfangs- und Endpunkte der Hüllkurven. Die Hüllkkurven der Klänge enthalten unterschiedlich viele Frequenzen und sind deshalb zeitlich verschieden lang.Differentiating the envelope leads to the minima of Envelope. The minima of the envelope form the start and End points of the envelopes. The envelopes of the sounds included different frequencies and are therefore temporal different lengths.

Transformation des Sprachsignals mit IntegraltransformationenTransformation of the speech signal with integral transformations

  • Fouriertransformation:
    Darstellung des Sprachsignales im Frequenzraum: Amplitude als Ordinate und Frequenz als Abszisse
    Fourier transform:
    Representation of the speech signal in the frequency domain: amplitude as ordinate and frequency as abscissa
  • Hilberttransformation:
    Darstellung des Sprachsignales im Frequenzraum: Frequenz als Ordinate und Zeit als Abszisse
    Hilbert transformation:
    Representation of the speech signal in the frequency domain: frequency as ordinate and time as abscissa
  • Jedes Wellenpaket (jeder Klang) enthält n Summanden. Jeder n-te Summand ist die n-te Partialschwingung von dem Wellenpaket.Each wave packet (each sound) contains n summands. Every nth Summand is the nth partial oscillation from the wave packet.

    Das Ursprungssignal wird mit Integraltranformationen so transformiert, daß es als Amplitude über die Frequenz, und als Frequenz über die Zeit für den Datensatz jeder einzelnen Hüllkurve zur weiteren Verarbeitung zur Verfügung steht. The original signal is like this with integral transformations transforms it as an amplitude over frequency, and as Frequency over time for each individual's data set Envelope is available for further processing.

    Im Fourierraum beispielsweise sind die Amplituden beziehungsweise die Intensitäten jeweils für eine Hüllkurve über die Frequenz aufgetragen. Hier wird mit einem Amplitudenband innerhalb des Frequenzraumes um die Intensitäten ein Vergleich aller übrigen Intensitäten nur innerhalb dieses Bandes zugelassen. Die Größe der Amplitudenbandes hängt von der Intensität beziehungsweise der Lautstärke ab.In the Fourier space, for example, are the amplitudes or the intensities for an envelope plotted against frequency. Here with one Amplitude band within the frequency space around the intensities a comparison of all other intensities only within this Band approved. The size of the amplitude band depends on the Intensity or volume.

    Alle zu den Intensitäten gehörenden Frequenzen sind im Funktionenraum der Hilberttransformation als Frequenzen über die Zeit vorhanden.All frequencies belonging to the intensities are in the Functional space of the Hilbert transformation as frequencies over the time is available.

    Entfaltung des Signals mit IntegraltransformationenUnfolding of the signal with integral transformations

    In dem digitalisierten Sprachsignal als Ausgangssignal ist die Information als Intensität über die Zeit in Form von Frequenzen in einem zweidimensionalen Feld kodiert.In the digitized speech signal as the output signal is the Information as intensity over time in the form of frequencies encoded in a two-dimensional field.

    Die Integraltransformationen werden als lineare Operatoren der Gruppentheorie definiert und zur Entfaltung des Signals eingesetzt. Beispielsweise werden Fourier- und Hilberttransformation eingesetzt. Sie transformieren das Signal in einen für die nachfolgende Verarbeitung erforderlichen Zustand in Funktionenräume, beispielsweise in den Frequenzraum.The integral transformations are called linear operators of the Group theory defined and for the unfolding of the signal used. For example, Fourier and Hilbert transformation used. They transform the signal into one required for subsequent processing State in functional spaces, for example in the frequency space.

    Töne und KlängeTones and sounds

    Ein Tonsystem ist ein geordnetes Paar von Elementen. Dabei ist das Frequenzintervall eine Gruppe und die Intervalle sind eine injektive Abbildung des Tonsystems in die Menge aller positiven reellen Zahlen.
    Eine endliche Teilmenge aus den Frequenzen heißt Klang.
    Ein geordnetes n-Tupel von Tönen wird geordneter n-Klang genannt
    A sound system is an ordered pair of elements. The frequency interval is a group and the intervals are an injective mapping of the sound system into the set of all positive real numbers.
    A finite subset of the frequencies is called sound.
    An ordered n-tuple of tones is called an ordered n-sound

    Ordnen des Sprachsignales durch KongruenzgruppenOrder the speech signal by congruence groups

  • Zahlentheoretische Funktionen aus Primzahlen und Zweierpotenzen bilden Felder für ÄquivalenzklassenNumber theoretical functions from prime numbers and powers of two form fields for equivalence classes
  • Die Äquivalenzklassen werden zu dem Sprachsignal in Form von Äqivalenzrelationen in Beziehung gebracht.The equivalence classes become the speech signal in the form of Equivalence relations related.
  • Algebraische Kongruenzgruppen ordnen das Sprachsignal in Sprache und Nichtsprache in verschiedene Dateien.Algebraic congruence groups arrange the speech signal in Language and non-language in different files.
  • Rückgewinnung des Sprachsignales im Zeitbereich durch IntegralrücktransformationenRecovery of the voice signal in the time domain Integral inverse transformations
  • ÄquivalenzrelationenEquivalence relations

    Elementvertauschungen werden durch eine zwei- oder mehrstellige Relation auf der Menge aller Klänge eines Tonsystems präzisiert.
    Dabei gilt für ein Element aus der Menge des Sprachsignals die Zuordnung zu Sprache oder Nichtsprache genau dann, wenn zu den Intervallen des zu prüfenden Signais ein Bezugston aus der Äquivalenzklasse der zahlentheoretischen Funktionen des Primzahlkörpers existiert.
    Element swaps are specified by a two or more digit relation on the set of all sounds of a sound system.
    The assignment to speech or non-speech applies to an element from the set of the speech signal if and only if there is a reference tone for the intervals of the signal to be checked from the equivalence class of the number theoretical functions of the prime number field.

    Berechnung der Intervalle aus den Frequenzen des SprachsignalsCalculation of the intervals from the frequencies of the speech signal

    Alle Frequenzen des Frequenzraumes des transformierten Sprachsignales müssen überprüft werden, ob sie Symmetriebeziehungen mit anderen Frequenzen der gleichen Hüllkurve haben. In den Symmetriebeziehungen der Elemente liegen invariante Eigenschaften der Sprache verschlüsselt vor.All frequencies of the frequency space of the transformed Voice signals must be checked to see if they Symmetry relationships with other frequencies of the same Have envelope. In the symmetry relationships of the elements there are encrypted invariant properties of the language.

    Von dem zu verarbeitendem Signal werden deshalb innerhalb der Hüllkurve alle Frequenzen paarweise der Reihe nach mit allen anderen Frequenzen dividiert, um Intervalle zu bilden. Dies geschieht solange, bis jede Frequenz in der fortlaufenden Reihenfolge nach und nach durch alle anderen Frequenzen in der gleichen Hüllkurve geteilt wurde, um vorübergehend zu einer Verhältniszahl (Intervall) dieses Frequenzpaares zu kommen. Of the signal to be processed are therefore within the Envelope all frequencies in pairs with all divided other frequencies to form intervals. This happens until each frequency in the continuous Sequence through all other frequencies in the same envelope has been divided to temporarily become one Ratio number (interval) of this frequency pair to come.

    Die erste Frequenz wird durch die zweite, der dritten und so fort geteilt, bis zum Ende der Hüllkurve. Dann wird die zweite durch die dritte, der vierten und so fort geteilt. In einer Hüllkurve können beispielsweise jeweils tausende Frequenzen sein. Dabei darf nie die Reihenfolge der Frequenzen vertauscht werden.The first frequency is through the second, the third and so divided until the end of the envelope. Then the second one divided by the third, the fourth and so on. In a Envelope can, for example, thousands of frequencies his. The order of the frequencies must never be interchanged become.

    Die Trennung von Sprache und Nichtsprache wird mit einer Folge von mehreren Symmetrieoperationen durchgeführt.The separation of language and non-language becomes a consequence performed by several symmetry operations.

    1. Äquivalenzklassen mit Bezugsintervall als Entscheidungskriterium1. Equivalence classes with reference interval as Decision criterion

    Nach jeder Intervallbildung innerhalb des Frequenzraumes des zu überprüfenden Sprachsignals muß ein Bezugsintervall aus den Äquivalenzklassen der berechneten Intervalle gefunden werden.After each interval formation within the frequency range of the checking speech signal must have a reference interval from the Equivalence classes of the calculated intervals can be found.

    Die Äquivalenzklassen wiederum werden durch verschiedene zahlentheoretische Funktionen berechnet. Die Trennwirkung wird deutlich besser, wenn man die Erfüllung eines Bezugsintervalles für jede zahlentheoretische Funktion fordert. Wenn dies n Funktionen sind, (wobei n = natürliche ganze Zahlen sind) dann spannen diese zahlentheoretischen Funktionen einen n-dimensionalen metrischen Raum auf.
    Wenn das aus dem zu prüfenden Signal gewonnene Intervall in allen zahlentheoretischen Funktionen genau eine Bezugskoordinate findet, dann sind alle zahlentheoretischen Funktionen mindestens einmal erfüllt. Die Koordinaten führen zu genau einem Bezugsintervall aus dem Raum der Äquivalenzklassen.
    The equivalence classes are in turn calculated using various number-theoretical functions. The separating effect becomes significantly better if one demands the fulfillment of a reference interval for every number-theoretical function. If these are n functions (where n = natural integers), then these number theoretical functions span an n-dimensional metric space.
    If the interval obtained from the signal to be tested finds exactly one reference coordinate in all number-theoretical functions, then all number-theoretical functions are fulfilled at least once. The coordinates lead to exactly one reference interval from the space of the equivalence classes.

    Über diesen Bezugston können genau dann weitere Sprachparameter wie beispielsweise Anklingzeit und Abklingzeit eines Lautes abgefragt werden, wenn diesem n-dimensionalen Raum eine Metrik aufgeprägt wird. Dies kann mit Hilfe der Gruppentheorie auf der Basis von Matrizen-Operationen durchgeführt werden. You can then use this reference tone to call other speech parameters such as the sound's decay time and decay time be queried if this n-dimensional space is a metric is imprinted. This can be done with the help of group theory on the Basis of matrix operations are performed.

    Dieses Bezugsintervall kann als Bezugston aufgefaßt werden. Dann können viele weitere Parameter für die Spracherkennung herangezogen werden, wie beispielsweise die Anklingzeit und die Abklingzeit eines Tones.This reference interval can be interpreted as a reference tone. Then many more parameters for speech recognition are used, such as the attack time and the Cooldown of a tone.

    Gibt es ein Bezugsintervall, dann muß sich das Rechenverfahren diese Elemente so lange merken, bis alle Elemente miteinander verglichen wurden. Erst nach Abschluß dieses Sortierungsprozesses weiß das Verfahren, welche Elemente mit anderen Intervallbeziehungen haben.If there is a reference interval, then the calculation procedure must memorize these elements until all the elements are together were compared. Only after completing this Sorting process, the process knows which elements to use have other interval relationships.

    Alle die Frequenzen, die über die Intervalle Beziehungen miteinander haben, stehen schließlich mit allen anderen Frequenzen innerhalb der gleichen Hüllkurve und damit des gleichen Lautes der Sprache in Beziehung. Das Verfahren merkt sich all diese Elemente. Am Ende des Rechenprozesses werden alle solche Elemente in den Speicher für Sprache abgelegt. Alle anderen Frequenzen, die sich nicht in dieses Beziehungssystem einbinden lassen, sind beziehungslose Elemente und kommen in den Speicher für Nichtsprache. Ein Teil der Nichtsprache wird hierdurch bereits von der Sprache getrennt.All the frequencies over the intervals relationships after all, stand with everyone else Frequencies within the same envelope and thus the same sound of language in relation. The process notices yourself all these elements. At the end of the calculation process all such items are stored in the memory for speech. All other frequencies that are not in this relationship system Get involved are unrelated elements and come in the memory for non-language. Becomes part of the non-language hereby already separated from the language.

    Elemente, die miteinander durch symmetrische Beziehungen dieser Intervalle verbunden sind, sind Elemente der Sprache. Elemente die in keinem symmetrischen Zusammenhang mit allen anderen Elementen innerhalb der Hüllkurve stehen sind keine Sprache. Sie übertragen keine Information.Elements that are related to each other through symmetrical relationships Intervals connected are elements of language. elements those in no symmetrical context with everyone else Elements within the envelope are not a language. They do not transmit any information.

    2. Verbessertes Trennen von Sprache und Nichtsprache durch eine Verknüpfung der Tonhöhendifferenz mit den Intensitäten2. Improved separation of language and non-language by one Linking the pitch difference with the intensities

    Es wird eine zweistellige Relation der Intervalle so definiert, daß ein Bezugston innerhalb von mehreren Koordinaten des Äquivalenzklassenraumes dem Element aus dem zu untersuchenden Signal genau entspricht. A two-digit relation of the intervals is defined that a reference tone within several coordinates of the Equivalence class space the element from the one to be examined Signal corresponds exactly.

    Die Elemente der existierenden Faktormenge der Frequenzintervalle aus den Äquivalenzklassen werden nun als Harmonien definiert.The elements of the existing set of factors Frequency intervals from the equivalence classes are now as Harmonies defined.

    In der folgenden Formel wird die Tonhöhendifferenz mit dem logarithmischen Verhältnis der Amplituden in Beziehung gebracht. V = exp(abs((Faktor·(ln(f1/f2)))/(Faktor·ln(A1/A2)))); f1/f2 = Integerdivision es bedeuten:

  • V = Intervall aus den Äquivalenzklassen aller zahlentheoretischen Funktionen;
  • f1/f2 = Verhältnis der Frequenzen = Tonhöhenabstand, (A1/A2) = Verhältnis der Intensitäten
  • In the following formula, the pitch difference is related to the logarithmic ratio of the amplitudes. V = exp (abs ((factor x (ln (f1 / f2)) / (factor x ln (A1 / A2)))); f1 / f2 = integer division it mean:
  • V = interval from the equivalence classes of all number theoretical functions;
  • f1 / f2 = ratio of frequencies = pitch spacing, (A1 / A2) = ratio of intensities
  • Mit Hilfe dieser Beziehung wird ein Bezugston definiert.A reference tone is defined using this relationship.

    Dann wiederholt sich das vorhergehende Verfahren.Then the previous procedure is repeated.

    Diese Gruppenoperation verbessert die Qualität der Trennung Sprache von Nichtsprache.This group operation improves the quality of the separation Language of non-language.

    3. Trennen von Sprache und Nichtsprache mit Hilfe einer Amplitudenbandbeziehung im Frequenzraum3. Separate language and non-language with the help of a Amplitude band relationship in the frequency domain

    Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht wird, dann wechselwirken die Intervalle der Äquivalenzklassen die ihrerseits kleiner als 1 sind mit den zu vergleichenden Frequenzen des zu untersuchenden Sprachsignals.
    Beispielsweise sei das Maximum des ersten Wellenpaketes bei 500 Einheiten. Um alle zu vergleichenden Amplituden sei das Amplitudenband mit 50 Einheiten Bandbreite durch den ganzen Frequenzraum als Eingangsband für das Verarbeitungsprogramm eingestellt.
    If the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared.
    For example, the maximum of the first wave packet is 500 units. In order to compare all the amplitudes, the amplitude band with 50 units of bandwidth across the entire frequency space is set as the input band for the processing program.

    Es entsteht ein neuer Effekt, wenn diesem Verarbeitungsprogramm ein Vorprogramm vorgeschaltet wird, bei dem nur die Bandbreite des Amplitudenbandes viel kleiner als 1 eingestellt, beispielsweise auf 0,05 statt 50.There is a new effect when this processing program a pre-program is used, in which only the bandwidth the amplitude band is set much smaller than 1, for example 0.05 instead of 50.

    Dann trennt dieses Verfahren Sprache von Nichtsprache mit Hilfe der besprochenen Methode des Äquivalenzklassen genau umgekehrt. Man muß dann die Speicherzuweisung umkehren, da sich dieses Verfahren umgekehrt verhält.
    Dieser Effekt trennt einen Teil der Nichtsprache von Sprache. Weil das Verfahren sehr schnell ist, bietet es sich an, damit zu beginnen. Da jedes Verfahren, das Nichtsprache entfernt, die Arbeit nachfolgender Verfahren beschleunigt, muß man mit dem schnellsten Verfahren beginnen.
    Then this procedure separates language from non-language with the help of the discussed method of equivalence classes, exactly the opposite. The memory allocation must then be reversed since this procedure is reversed.
    This effect separates part of the non-language from language. Because the procedure is very fast, it is a good idea to start with it. Since any process that removes non-language speeds up the work of subsequent processes, you have to start with the fastest process.

    4. Trennen von Sprache und Nichtsprache mit Hilfe der Symmetriegrenze4. Separate language and non-language using the Limit of symmetry

    Wenn das Frequenzverhältnis zu groß wird, beispielsweise größer als 8, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Wenn man Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor werden, dann handelt es sich um Nichtsprache.If the frequency ratio becomes too large, for example larger than 8, then one approaches the symmetry limit for harmonic sound or consonance. If you remove frequencies, their intervals become larger than a certain factor, then it is about non-language.

    Qualität der TrennungQuality of separation

    Je mehr richtig berechnete Intervalle in einer Gruppe sind, um so besser wird der Trennprozeß.The more correctly calculated intervals in a group are around so the separation process gets better.

    Wenn in einer Gruppe Intervalle doppelt oder mehrfach sind, dann verschlechtert sich der Trennprozeß. If intervals are double or multiple in a group, then the separation process deteriorates.

    Je mehr verschiedene zahlentheoretische Funktionen so eingesetzt werden, daß jede sich in einer eigenen Gruppe befindet, um so besser wird der Trennprozeß.The more different number theoretical functions like this be used so that each is in its own group the better the separation process.

    Wenn verschiedene zahlentheoretische Funktionen in einer Gruppe zusammengefaßt werden, dann verschlechtert sich der Trennprozeß.If different number theoretical functions in a group are summarized, then the deteriorates Separation process.

    Wenn die Intervalle beispielsweise durch nicht geeignete zahlentheoretische Funktionen berechnet werden, dann verschlechtert sich der Trennprozeß.If the intervals are not suitable, for example number theoretical functions are then calculated the separation process deteriorates.

    Existenz der IntervalleExistence of intervals

    Aus der Musiktheorie kennt man seit Jahrhunderten die Existenz von Intervallen. Schon Kepler suchte nach allgemeinen Harmoniegesetzen. Er suchte nach Weltharmoniegesetzen. Neben vielen ist aber besonders Leonhard Euler zu nennen, der den Zusammenhang zwischen der Zerlegung der natürlichen Zahlen in Produkte von Primzahlpotenzen, den Fermatschen Sätzen und der Zahlentheorie mit zahlentheoretischen Funktionen erkannte.The existence of music theory has been known for centuries of intervals. Kepler was already looking for general ones Laws of harmony. He was looking for world harmony laws. Next Many, however, should be mentioned in particular Leonhard Euler, who Relationship between the decomposition of natural numbers into Products of prime powers, the Fermat theorems and the Number theory with number theoretical functions recognized.

    Der Mathematiker Leonhard Euler stellte eine komplizierte zahlentheoretische Funktion (Eulersche Gradusfunktion) zur Berechnung solcher Intervalle auf und berechnete sie für die Zahlen 1 bis 10. Das sind dann 92 Intervalle für die Musikklänge.The mathematician Leonhard Euler presented a complicated one number theoretical function (Euler grading function) for Calculation of such intervals and calculated them for the Numbers 1 to 10. That is 92 intervals for the Music sounds.

    Leibnitz und Herder sagten, daß unsere Seele unbewußt zähle.Leibnitz and Herder said that our soul counts unconsciously.

    Für das erfindungsgemäße Verfahren zur Spracherkennung kann die Eulersche Gradusfunktion besonders vorteilhaft als zahlentheoretische Funktion angewandt werden.For the method according to the invention for speech recognition, the Euler's degree function is particularly advantageous as number theory function can be applied.

    Es gibt weiter zahlentheoretische Funktionen. Dahinter stehen komplizierte Strukturen und Sachverhalte der Zahlentheorie und der Algebra, wie beispielsweise die Gammafunktion. There are also number theoretical functions. Stand behind it complicated structures and facts of number theory and algebra, such as the gamma function.

    Die Intervalle werden mit zahlentheoretischen Funktionen berechnet. Es entsteht aus n zahlentheoretischen Funktionen ein n-dimensionaler metrischer Raum, der aus den Feldern der Äquivalenzklassen der Symmetriebeziehungen besteht. Es werden n zahlentheoretische Funktionen, beispielsweise 10, zur Berechnung der Intervalle eingesetzt. Diese n zahlentheoretischen Funktionen erzeugen Intervalle die sich zu einem n-dimensionalen metrischen Raum der Äquivalenzklassen aufspannen lassen. Möglicherweise erzeugen diese Funktionen alle Intervalle für alle menschlichen Sprachen.The intervals are with number theoretical functions calculated. It arises from n number theoretical functions n-dimensional metric space that comes from the fields of Equivalence classes of symmetry relationships exist. There are n number theoretical functions, for example 10, used to calculate the intervals. This n number-theoretical functions generate intervals that are too an n-dimensional metric space of the equivalence classes let it stretch. These functions may produce all intervals for all human languages.

    Die Beziehungen zwischen den Elementen wird wichtiger als die Elemente selbst.The relationships between the elements becomes more important than that Elements themselves.

    Die Intervallgruppen der Sprache können z.B. durch folgende zahlentheoretische Funktionen erzeugt werden:The interval groups of the language can e.g. by following number theoretical functions are generated: 1. Funktion ist die Eulersche Gradusfunktion1. Function is the Euler Gradus function

    Jede natürliche Zahl n wird aus Primzahlen P1, P2, ... Pn zusammengesetzt. Dann wird eine Zahl n zu: n = P1a1 · P2a2 · . . . Pmam

  • a1, a2, am müssen ganze Zahlen sein.
  • Beispiel: 1440 = 25 · 32 · 51
  • Dabei ist P1 = 2, P2 = 3, P3 = 5
  • A1 = 5; a2 = 2; a3 = 1
  • Euler definierte den Gradus als G(n) = a1 P1 + a2 P2 + am Pm - (a1 + a2 + ... am - 1)
  • Beispiel mit Zahlen: G(1440) = 5 · 2 + 2 · 3 + 1 · 5 - (5 + 2 + 1 - 1) = 10 + 6 + 5 - 7 = 14 als Konsonanzgrad für 1440
  • Für die Intervallmaße muß einem beliebigen Intervall a : b eine Zahl n so zugeordnet werden, daß n sinngemäß als Grad von a : b betrachtet werden kann. Entsprechend muß verfahren werden, wenn eine Verhältniskette a : b : c oder a1 : a2 : ... an vorliegt, also ein Mehrklang.Each natural number n is composed of prime numbers P 1 , P 2 , ... P n . Then a number n becomes: n = P 1 a1 · P 2nd a2 ·. . . P m at the
  • a 1 , a 2 , a m must be integers.
  • Example: 1440 = 2 5 · 3 2 · 5 1
  • P 1 = 2, P 2 = 3, P 3 = 5
  • A 1 = 5; a 2 = 2; a 3 = 1
  • Euler defined the degree as G (n) = a 1 P 1 + a 2nd P 2nd + a m P m - (a 1 + a 2nd + ... a m - 1)
  • Example with numbers: G (1440) = 5 · 2 + 2 · 3 + 1 · 5 - (5 + 2 + 1 - 1) = 10 + 6 + 5 - 7 = 14 as a degree of consonance for 1440
  • For the interval measurements, a number n must be assigned to any interval a: b in such a way that n can be regarded as the degree of a: b. The same procedure must be followed if there is a ratio chain a: b: c or a 1 : a 2 : ... a n , i.e. a multiple sound.

    n muß somit selbst eine Funktion des Systems (a1, a2, ... an) sein. Dieser Wert einer Konsonanz ist der Quotient aus dem kleinsten gemeinschaftlichen Vielfachen und dem größten gemeinschaftlichen Teiler der einen Klang beschreibenden natürlichen Zahlen.n must itself be a function of the system (a 1 , a 2 , ... a n ). This value of a consonance is the quotient of the smallest common multiple and the largest common divisor of the natural numbers describing a sound.

    Die Gradusfunktion für gekürzte Brüche a/b ergibt sich aus G (a/b) = G (a · b) The degree function for shortened fractions a / b results from G (a / b) = G (abb)

    2. Funktion2. Function

    2n /(3x · 5y · 7z)2nd n  / (3rd x  · 5 y  · 7th e.g. ) (3x · 5y · 7z)/ 2n (3rd x  · 5 y  · 7th e.g. ) / 2 n

    3. Funktion3. Function

    (n + 2)/n(n + 2) / n n /(n+2)n / (n + 2)

    4. Funktion4. Function

    (2n + 2)/n(2n + 2) / n n/(2n + 2)n / (2n + 2)

    5. Funktion5. Function

    3x / 5y 3rd x  5th y 5y / 3x 5 y  / 3rd x

    6. Funktion6. Function

    2n / 3x 2nd n  / 3rd x 3x / 2n 3rd x  / 2nd n

    7. Funktion7. Function

    2n / 5y 2nd n  5th y 5y / 2n 5 y  / 2nd n

    8. Funktion8. Function

    3x / 7z 3rd x  / 7th e.g. 7z / 3x 7 e.g.  / 3rd x

    9. Funktion9. Function

    2n / 7z 2nd n  / 7th e.g. 7z / 2n 7 e.g.  / 2nd n

    10. Funktion10. Function

    7z / 5y 5y / 7z

    Figure 00160001
    Figure 00170001
    Figure 00180001
    Figure 00190001
    Figure 00200001
    Figure 00210001
    Figure 00220001
    Figure 00230001
    Figure 00240001
    Figure 00250001
    Figure 00260001
    Figure 00270001
    Figure 00280001
    Figure 00290001
    Figure 00300001
    7 e.g. / 5 y 5 y / 7th e.g.
    Figure 00160001
    Figure 00170001
    Figure 00180001
    Figure 00190001
    Figure 00200001
    Figure 00210001
    Figure 00220001
    Figure 00230001
    Figure 00240001
    Figure 00250001
    Figure 00260001
    Figure 00270001
    Figure 00280001
    Figure 00290001
    Figure 00300001

    Claims (1)

    Verfahren zur Trennung von Sprache und Geräuschen, mit folgenden Verfahrensschritten: Das von Störungen zu befreiende digitalisierte Sprachsignal wird in seine Einzelklänge mit Hilfe einer Hüllkurvenmethode zerlegt. Mittels Integraltransformationen wird das Sprachsignal von der Darstellung Intensität über die Zeit in eine Darstellung Amplitude über die Frequenz und Frequenz über die Zeit transformiert. Im Frequenzraum wird ein Band um die Intensitäten gelegt. Hierdurch wird ein Vergleich aller übrigen Intensitäten nur innerhalb dieses Bandes zugelassen. Die Größe des Bandes hängt unter anderem von der Intensität beziehungsweise von der Lautstärke ab. Mittels zahlentheoretischer Funktionen werden Intervalle der Sprache berechnet und ein Raum der Äquivalenzklassen der Sprachtöne erzeugt.
    Die eigentliche Trennung von Sprache und Geräuschen erfolgt anschließend durch eines oder mehreren der folgenden Verfahrensschritte:
    Die Frequenzen innerhalb eines Lautes (Hüllkurve) werden durch geeignete Schleifenverfahren miteinander paarweise verglichen. Es entstehen dann für jedes Frequenzpaar aus der Teilung Intervalle. Diese Intervalle werden mit den berechneten Intervallen der Äquivalenzklassen verglichen. Ales Ergebnis dieser Überprüfung ergibt sich, ob die betrachteten Frequenzen miteinander harmonische Beziehungen haben oder nicht. Diese harmonischen Beziehungen haben Sprachfrequenzen mit allen anderen Sprachfrequenzen innerhalb einer Hüllkurve oder eines Lautes. Nur dann, wenn im Raum der Äquivalenzklassen ein Bezugsintervall gefunden wird, wird die entsprechende Frequenz in die Datei Sprache überwiesen. Wenn es kein Bezugsintervall gibt, wird die Frequenz in die Datei Nichtsprache überwiesen. Trennen von Sprache und Nichtsprache mit Hilfe eines Amplitudenbandes im Frequenzraum:
    Wenn das Band um die Amplituden sehr viel kleiner als 1 gemacht wird, dann wechselwirken die Intervalle der Äquivalenzklassen die ihrerseits kleiner als 1 sind mit den zu vergleichenden Frequenzen des zu untersuchenden Sprachsignals. Dieser Effekt trennt einen Teil der Nichtsprache von Sprache.
    Aus dem Verhältnis der Tonhöhendifferenz wird durch eine logarithmische Beziehung zwischen den Amplituden eine neue Beziehung gebildet und für die Trennung Geräusch/Sprache genutzt. Für das Ergebnis dieser Beziehung wird die Prozedur wiederholt, in dem Raum der Äquivalenzklassen ein Bezugsintervall zu suchen. Trennen von Sprache und Nichtsprache mit Hilfe der Symmetriegrenze:
    Wenn das Frequenzverhältnis größer als 8 wird, dann nähert man sich der Symmetriegrenze für Wohlklang oder Konsonanz. Es werden diejenigen Frequenzen entfernt, deren Intervalle größer als ein bestimmter Faktor sind.
    Process for the separation of speech and noise, with the following process steps: The digitized speech signal to be freed from interference is broken down into its individual sounds using an envelope method. The speech signal is transformed from the intensity versus time representation to an amplitude versus frequency and frequency versus time representation by means of integral transformations. In the frequency domain, a band is placed around the intensities. This allows a comparison of all other intensities only within this band. The size of the band depends, among other things, on the intensity or volume. Using number-theoretical functions, intervals of the language are calculated and a space of the equivalence classes of the speech tones is generated.
    The actual separation of speech and noise is then carried out by one or more of the following process steps:
    The frequencies within a sound (envelope curve) are compared with one another in pairs using suitable loop methods. Intervals then arise for each frequency pair from the division. These intervals are compared with the calculated intervals of the equivalence classes. The result of this check is whether the considered frequencies have harmonious relationships with each other or not. These harmonic relationships have speech frequencies with all other speech frequencies within an envelope or a sound. The corresponding frequency is only transferred to the language file if a reference interval is found in the room of the equivalence classes. If there is no reference interval, the frequency is transferred to the non-language file. Separating speech and non-speech using an amplitude band in the frequency domain:
    If the band around the amplitudes is made much smaller than 1, then the intervals of the equivalence classes, which in turn are smaller than 1, interact with the frequencies of the speech signal to be examined to be compared. This effect separates part of the non-language from language.
    A logarithmic relationship between the amplitudes creates a new relationship from the ratio of the pitch difference and uses it for the separation of noise and speech. For the result of this relationship, the procedure is repeated to look for a reference interval in the space of the equivalence classes. Separating language and non-language using the symmetry boundary:
    If the frequency ratio becomes greater than 8, then the symmetry limit for harmony or consonance is approached. Those frequencies are removed whose intervals are larger than a certain factor.
    EP00104304A 1999-03-02 2000-03-02 Method to separate speech and noises Ceased EP1033702A3 (en)

    Applications Claiming Priority (2)

    Application Number Priority Date Filing Date Title
    DE1999109150 DE19909150A1 (en) 1999-03-02 1999-03-02 Method of separating speech and noise
    DE19909150 1999-03-02

    Publications (2)

    Publication Number Publication Date
    EP1033702A2 true EP1033702A2 (en) 2000-09-06
    EP1033702A3 EP1033702A3 (en) 2003-01-02

    Family

    ID=7899462

    Family Applications (1)

    Application Number Title Priority Date Filing Date
    EP00104304A Ceased EP1033702A3 (en) 1999-03-02 2000-03-02 Method to separate speech and noises

    Country Status (2)

    Country Link
    EP (1) EP1033702A3 (en)
    DE (1) DE19909150A1 (en)

    Non-Patent Citations (1)

    * Cited by examiner, † Cited by third party
    Title
    Keine Recherche *

    Also Published As

    Publication number Publication date
    DE19909150A1 (en) 2000-09-07
    EP1033702A3 (en) 2003-01-02

    Similar Documents

    Publication Publication Date Title
    EP1405222B1 (en) Method and device for producing a fingerprint and method and device for identifying an audio signal
    DE3306730C2 (en)
    DE60018886T2 (en) Adaptive wavelet extraction for speech recognition
    DE10232916B4 (en) Apparatus and method for characterizing an information signal
    EP1371055B1 (en) Device for the analysis of an audio signal with regard to the rhythm information in the audio signal using an auto-correlation function
    DE60009827T2 (en) TIME CALENDAR MODIFICATION OF AN AUDIO SIGNAL
    DE112013006650T5 (en) Multi-layer system for symbol memory based compression of patterns
    DE2825110A1 (en) METHOD OF DETECTING CONTINUOUS VOICE SIGNALS
    DE69930961T2 (en) DEVICE AND METHOD FOR LANGUAGE SEGMENTATION
    EP1280138A1 (en) Method for audio signals analysis
    EP1388145B1 (en) Device and method for analysing an audio signal in view of obtaining rhythm information
    WO2005122136A1 (en) Apparatus and method for determining a chord type on which a test signal is based
    DE60133537T2 (en) AUTOMATIC UMTRAINING OF A LANGUAGE RECOGNITION SYSTEM
    DE112018004462T5 (en) QUERY PROCESSING
    EP0772764B1 (en) Process and device for determining the tonality of an audio signal
    EP1755110A2 (en) Method and device for adaptive reduction of noise signals and background signals in a speech processing system
    EP1033702A2 (en) Method to separate speech and noises
    DE202022100306U1 (en) A system for classifying melodies using Swaragram representation
    DE102017101653B3 (en) System and method for determining at least one frequency of an auditory perception or attenuation of the auditory perception of a person at that frequency
    DE102007056221B4 (en) Method for speech recognition
    DE2363590A1 (en) VOICE RECOGNITION SYSTEM WITH CHARACTERISTICS ENCODING
    DE102013106333B4 (en) SIGNAL GENERATING DEVICE AND METHOD IN A COMMUNICATION SYSTEM
    DE602004007249T2 (en) Uniform treatment of resolved and unresolved harmonics
    EP1170723A2 (en) Method for the computation of phoneme duration statistics and method for the determination of the duration of isolated phonemes for speech synthesis
    DE112020004506T5 (en) SIGNAL PROCESSING DEVICE, SIGNAL PROCESSING METHOD AND PROGRAM

    Legal Events

    Date Code Title Description
    PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

    Free format text: ORIGINAL CODE: 0009012

    AK Designated contracting states

    Kind code of ref document: A2

    Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

    AX Request for extension of the european patent

    Free format text: AL;LT;LV;MK;RO;SI

    PUAL Search report despatched

    Free format text: ORIGINAL CODE: 0009013

    AK Designated contracting states

    Kind code of ref document: A3

    Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

    AX Request for extension of the european patent

    Free format text: AL;LT;LV;MK;RO;SI

    RIC1 Information provided on ipc code assigned before grant

    Free format text: 7G 10L 21/02 A, 7G 10L 11/02 B

    17P Request for examination filed

    Effective date: 20030419

    AKX Designation fees paid

    Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

    17Q First examination report despatched

    Effective date: 20050613

    APBN Date of receipt of notice of appeal recorded

    Free format text: ORIGINAL CODE: EPIDOSNNOA2E

    APBR Date of receipt of statement of grounds of appeal recorded

    Free format text: ORIGINAL CODE: EPIDOSNNOA3E

    APAF Appeal reference modified

    Free format text: ORIGINAL CODE: EPIDOSCREFNE

    RAP1 Party data changed (applicant data changed or rights of an application transferred)

    Owner name: GEHRLEIN, JAN

    RIN1 Information on inventor provided before grant (corrected)

    Inventor name: GEHRLEIN, JAN

    APBT Appeal procedure closed

    Free format text: ORIGINAL CODE: EPIDOSNNOA9E

    STAA Information on the status of an ep patent application or granted ep patent

    Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

    18R Application refused

    Effective date: 20110809