DE10010037A1 - Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen - Google Patents
Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen FrequenzanteilenInfo
- Publication number
- DE10010037A1 DE10010037A1 DE10010037A DE10010037A DE10010037A1 DE 10010037 A1 DE10010037 A1 DE 10010037A1 DE 10010037 A DE10010037 A DE 10010037A DE 10010037 A DE10010037 A DE 10010037A DE 10010037 A1 DE10010037 A1 DE 10010037A1
- Authority
- DE
- Germany
- Prior art keywords
- frequency
- signal
- speech signal
- speech
- components
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000003595 spectral effect Effects 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Telephone Function (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen, bei dem das technische Problem, für eine Wiedergabe eines gestörten Sprachsignals eine möglichst naturgetreue Wiedergabe zu ermöglichen, durch ein Verfahren gelöst wird, bei dem oberhalb einer Grenzfrequenz omega¶0¶ mindestens zwei benachbart angeordnete Frequenzanteile omega¶fa1¶, omega¶fa2¶... mit erhöhter Amplitude im Sprachsignal bestimmt werden und bei dem die Grundfrequenz omega¶g¶ des Sprachsignals als Frequenzdifferenz zwischen den mindestens zwei benachbarten Frequenzanteilen omega¶fa1¶, omega¶fa2¶... bestimmt wird und bei dem mit Hilfe der ermittelten Grundfrequenz omega¶g¶ und des Sprachsignals der tieffrequente Frequenzbereich unterhalb der Grenzfrequenz omega¶g¶ rekonstruiert wird. DOLLAR A Die Erfindung betrifft auch eine Vorrichtung zur Durchführung des vorgenannten Verfahrens.
Description
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Rekonstruktion
tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen.
Im Stand der Technik der digitalen Verarbeitung von Sprachsignalen mit einem hohen
Lärmpegel im tieffrequenten Bereich wird das Signal dadurch verbessert, daß entweder
Störanteile herausgefiltert werden oder sehr stark gestörte Frequenzbereich aus dem
Signal vollständig herausgefiltert werden.
Aus der US 5,842,160 A ist ein Verfahren zur Verbesserung der Qualität einer digitalen
Sprachübertragung bekannt, bei dem verschiedenen Frequenzbändern je nach
Energiegehalt verschiedene Datenmengen zugeordnet werden. Durch die Art der
Kodierung und Übertragung entstehen niederenergetische Signalbereiche, die zu
Lücken im empfangenen Signalspektrum führen. Diese Lücken werden durch
synthetisch aus den vorhandenen Daten gewonnenen Signale gefüllt, so daß ein
natürlicher klingendes Sprachsignal erreicht wird.
Aus der US 4,091,237 A ist ein Verfahren zur Ermittlung der Stimmgrundfrequenz eines
digitalen Sprachsignals in Echtzeit bekannt. Speziell für Signale mit einem
eingeschränkten Frequenzbereich, wie Telefonsignale, und mit einem hohen
Störgeräuschanteil wird das Sprachsignale verbessert, indem Störgeräusche ausgefiltert
werden. Das Signal wird durch eine Mehrzahl von Bandpaßfiltern aufgesplittet und ein
entsprechendes Histogramm gebildet, aus dem die Stimmgrundfrequenz extrahiert wird.
Ist die Grundfrequenz bekannt, können Störgeräusche daran erkannt werden, daß sie in
keinem harmonischen Verhältnis zur Grundfrequenz stehen. Das zuvor beschriebene
Verfahren dient dazu, die für eine Stimme charakteristische Grundfrequenz zu
bestimmen.
Weiterhin ist aus der DE 37 33 983 ein Verfahren zum Dämpfen von Störsignalen in
einem Hörgerät bekannt, bei dem das Signal digitalisiert und in einzelne
Frequenzbereiche aufgeteilt wird. Frequenzbereiche mit bestimmten Charakteristika, wie
schnelle oder sehr langsame Spektralverteilungsänderungen, werden gedämpft
und/oder es werden die Grenzfrequenzen verschoben. Das so gereinigte Signal wird in
synthetische Sprachsignale umgewandelt.
Den zuvor beschriebenen Verfahren und den damit verbundenen Vorrichtungen liegt der
Nachteil zugrunde, daß das Sprachsignal gar nicht oder nur in unzureichender Form
rekonstruiert wird, um ein möglichst natürliches Ausgangssprachsignal zu erzeugen.
Die zuvor dargestellten Verfahren können unter anderem bei der digitalen
Sprachverstärkung (digital voice enhancement - DVE) eingesetzt werden.
Beispielsweise sind oberhalb jeder Sitzreihe in einem Kraftfahrzeug zwei Mikrophone
angebracht, so daß es bspw. allen Fahrzeuginsassen ermöglicht wird, sich an einem
Telefongespräch zu beteiligen. Das System überträgt dazu die Sprache, die vorn durch
das Mikrophon aufgenommen wurde, auf die hinteren Serienlautsprecher und
umgekehrt. Das System ist somit voll mit dem Freisprechtelefon und dem
Radio/CD/Navigationsgerät gekoppelt. Es verbessert insbesondere bei schneller Fahrt
die Verständigung innerhalb des Fahrzeuges deutlich.
Der Pegel des Fahrzeuginnengeräusches steigt zu tiefen Frequenzen sehr stark an, so
daß die Sprache dort vom Lärm überdeckt wird. Um durch das DVE-System möglichst
wenig Umgebungslärm zu übertragen, denn dadurch würde der Innenlärmpegel unnötig
erhöht, werden bei einem Teil der oben beschriebenen Verfahren alle Frequenzen je
nach Geschwindigkeit unterhalb von bspw. 200 bis 500 Hz abgeschnitten. Die Folge ist,
daß die Sprachgrundfrequenz und die ersten Vielfachen (Harmonischen) im
übertragenen Signal fehlen. Die Sprache klingt somit telefonartig, da typischer Weise ein
Telefonnetz eine Klangübertragung nur oberhalb von 350 Hz ermöglicht.
Neben der Nutzung eines Freisprechtelefons kann mit den Verfahren auch die
Sprachverständigung innerhalb des Fahrzeuges durchgeführt werden. Dabei ist jedoch
eine optimale Klangqualität erforderlich, um eine Akzeptanz bei den Käufern zu erzielen.
Insbesondere bei den Verfahren, die die Sprache von Störgeräuschen befreien, z. B.
spektrale Subtraktion oder Kohärenzfiltern, kommt es dazu, daß die Varianz der
Frequenzkomponete von Rauschen in die Größenordnung der Leistung des
Sprachsignals kommt. Somit ist eine effektive Rauschunterdrückung nicht mehr möglich
und die angewendeten Verfahren greifen nicht mehr.
Der Erfindung liegt daher das technische Problem zugrunde, das aus dem Stand der
Technik bekannte Verfahren sowie die zugehörige Vorrichtung zur Rekonstruktion
tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen dahingehend
weiterzubilden und auszugestalten, daß für eine Wiedergabe des gestörten
Sprachsignals eine möglichst naturgetreue Wiedergabe ermöglicht wird.
Das zuvor aufgezeigte technische Problem wird durch ein Verfahren mit den Merkmalen
des Anspruches 1 gelöst. Zunächst werden oberhalb einer Grenzfrequenz mindestens
zwei benachbart angeordnete Frequenzanteile mit erhöhter Amplitude im Sprachsignal
bestimmt. Danach wird die Grundfrequenz des Sprachsignals als Frequenzdifferenz
zwischen den mindestens zwei benachbarten Frequenzanteilen bestimmt. Schließlich
wird mit Hilfe der ermittelten Grundfrequenz und des Sprachsignals der tieffrequente
Frequenzbereich unterhalb der Grenzfrequenz rekonstruiert. Das somit erzeugte
synthetische Sprachsignal kann dann über eine Wiedergabevorrichtung direkt wieder
ausgegeben werden oder für ein späteres Aussenden gespeichert werden.
Mit anderen Worten werden tieffrequente Signalanteile des Sprachsignals synthetisch
erzeugt, also rekonstruiert, und den restlichen aufgenommenen Sprachsignal
zugemischt. Die Rekonstruktion der tieffrequenten Sprachanteile geschieht dabei auf
der Grundlage der nicht ausgefilterten Sprachsignale. Dazu wird ausgenutzt, daß die
tieffrequenten Sprachanteile von höherfrequenten Anteilen der Harmonischen begleitet
sind, so daß sich die fehlenden Anteile aus dem verbleibenden Signal abschätzen
lassen.
In bevorzugter Weise werden neben der Grundfrequenz auch die Frequenzen der
unterhalb der Grenzfrequenz angeordneten Harmonischen der Grundfrequenz bestimmt
und neben der Grundfrequenz für eine Rekonstruktion des tieffrequenten
Frequenzbereiches verwendet. Somit wird aus dem spektral ausgewerteten Abschnitt
des Sprachsignals die maximale Information bezüglich des ungestörten Sprachsignals
ausgenutzt. Die für die Rekonstruktion herangezogenen Frequenzen werden mit einer
jeweiligen Spektralverteilung und einer vorgegebenen Amplitude zu einem synthetischen
Spektrum zusammengesetzt, das den Frequenzbereich unterhalb der Grenzfrequenz im
Sprachsignal entspricht. Aus diesem Frequenzabschnitt und dem Sprachsignal oberhalb
der Grenzfrequenz wird dann das rekonstruierte Sprachsignal zusammengesetzt. Der
tieffrequente Sprachanteil weist somit kein Rauschsignal mehr auf, da es ausschließlich
aus Frequenzanteilen des Sprachsignals zusammengesetzt ist.
In einer weiteren Ausgestaltung der Erfindung kann der tieffrequente Sprachanteil auch
direkt aus dem Sprachsignal ermittelt werden. Dazu wird ein aus mehreren Bandfiltern
bestehendes Kammfilter auf der Basis der Grundfrequenz und der Frequenzen der
unterhalb der Grenzfrequenz angeordneten Harmonischen eingerichtet, wobei die
Frequenzpositionen der einzelnen Bandfilter den Grenzfrequenzen und der
Harmonischen entsprechen. Mit Hilfe des Kammfilters wird dann das Sprachsignal im
Bereich unterhalb der Grenzfrequenz gefiltert, wodurch die Signalanteile durchgelassen
werden, die zum eigentlichen Sprachsignal gehören. Auch in dieser Weise ist eine
Rekonstruktion eines weitgehend ungestörten Sprachsignals im tieffrequenten Bereich
des Sprachsignals möglich.
Entscheidend für die Qualität der Rekonstruktion des tieffrequenten Sprachanteils ist die
Genauigkeit der ermittelten Grundfrequenz des Sprachsignals. Da sich die
Grundfrequenz während des Sprechens aufgrund der Satzmelodie laufend verändert,
wird eine weitere Verbesserung des Verfahrens dadurch erreicht, daß zu Beginn eines
Sprache enthaltenen Sprachabschnittes aus dem Sprachsignal die Grundfrequenz
bestimmt wird und anschließend diese adaptiv nachgeführt wird. Somit wird im zeitlichen
Verlauf des Sprachsignals jeweils die aktuelle Grundfrequenz bestimmt, so daß die
Rekonstruktion des Sprachsignals möglichst genau an den Stimmverlauf angepaßt
werden kann. Ein Ausführungsbeispiel einer solchen adaptiven Nachführung wird weiter
unten im Detail erläutert.
In weiter bevorzugter Weise wird die Amplitude des mindestens einen unterhalb der
Grenzfrequenz erzeugten Frequenzsignals in Abhängigkeit von den Amplituden der
oberhalb der Grenzfrequenz analysierten Frequenzsignale bestimmt. In weiter
bevorzugter Weise können dabei typische Amplitudenverläufe von Sprachsignalen
Anwendung finden, um nicht nur in den Frequenzanteilen, sondern auch in der
Amplitudenverteilung der Frequenzanteile eine möglichst genaue Anpassung an ein
natürliches Sprachsignal zu erreichen.
Weiter ist bevorzugt, daß die Grenzfrequenz in Abhängigkeit vom Geräuschpegel, also
insbesondere von der Größe des Störsignals bestimmt wird. Somit ist es bei niedrigem
Störsignalpegeln bspw. nur erforderlich, den Sprachsignalanteil unterhalb von 200 Hz zu
rekonstruieren, während es bei hohen Störsignalpegeln notwendig ist, daß Sprachsignal
im Frequenzbereich unterhalb von 500 Hz zu rekonstruieren. Bei einer Anwendung des
Verfahrens in einem fahrenden Kraftfahrzeug kann die Grenzfrequenz auch in
Abhängigkeit von der Fahrgeschwindigkeit bestimmt werden.
Weiterhin besteht eine Weiterbildung darin, daß das Sprachsignal vor einer
Umwandlung einer Störsignalbefreiung unterzogen wird. Dabei können die
herkömmlichen aus dem Stand der Technik bekannten Verfahren angewendet werden,
um eine Vorbehandlung des Sprachsignals durchzuführen. Die Sprachanteile treten
dann im Spektrum deutlicher hervor und können eindeutiger und somit genauer erkannt
und rekonstruiert werden.
Eine Anwendung des zuvor beschriebenen Verfahrens besteht darin, in einem
fahrenden Kraftfahrzeug aufgenommene Sprachsignale wiederzugeben, um dabei einen
möglichst natürlichen Spracheindruck wiederzugeben.
Eine weitere Anwendung des erfindungsgemäßen Verfahrens besteht darin, ein mittels
einer Telefonverbindung übertragenes Sprachsignal wiederzugeben. Das zugrunde
liegende Problem besteht dabei darin, daß die Sprachsignale bei Telefonverbindungen
im Frequenzbereich unterhalb von 350 Hz keine Informationen enthalten. Daher muß für
eine naturgetreue Wiedergabe des Sprachsignals der tieffrequente Sprachanteil aus
dem Frequenzbereich oberhalb von 350 Hz rekonstruiert werden. Dieses kann in
besonders vorteilhafter Weise durch das erfindungsgemäße Verfahren durchgeführt
werden.
Gemäß einer weiteren Lehre der vorliegenden Erfindung wird das oben dargestellte
technische Problem auch durch eine Vorrichtung mit den Merkmalen des Anspruches 12
gelöst, während in den Ansprüchen 13 bis 16 vorteilhafte Ausgestaltungen angegeben
werden. Die Vorrichtung und das damit durchgeführte Verfahren werden im folgenden
anhand von Ausführungsbeispielen näher erläutert, wobei auf die beigefügte Zeichnung
bezug genommen wird. In der Zeichnung zeigen
Fig. 1 eine spektrale Innengeräuschverteilung in einem fahrenden Kraftfahrzeug für
unterschiedliche Fahrgeschwindigkeiten,
Fig. 2 ein Spektrogramm eines im tieffrequenten Bereich von einem Störsignal
überlagerten Sprachsignals,
Fig. 3 ein Spektrogramm des in Fig. 2 dargestellten Sprachsignals ohne Störsignal,
Fig. 4 ein Spektrogramm des in Fig. 3 dargestellten Sprachsignals ohne
Frenquenzanteile unterhalb der Grenzfrequenz von ca. 400 Hz,
Fig. 5 ein Spektrogramm der im Spektralbereich unterhalb der Grenzfrequenz von ca.
400 Hz rekonstruierten Sprachanteile,
Fig. 6 das vollständige rekonstruierte Sprachsignal entsprechend dem in Fig. 3
dargestellten Sprachsignal ohne Störsignalanteil,
Fig. 7 ein Blockschaltbild eines Ausführungsbeispiels einer erfindungsgemäßen
Vorrichtung zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen
Frequenzanteilen,
Fig. 8 eine Einrichtung zur adaptiven Nachführung der Grundfrequenz und
Fig. 9 die spektrale Verteilung der Kennlinien der Bandfilter des Regelelementes zum
Feststellen der frequenzabhängigen Leistungsverteilung im Mischspektrum in
Bezug auf die feststehende Mischungsfrequenz von 2000 Hz.
In den Fig. 1 und 2 ist der Ausgangspunkt der vorliegenden Erfindung dargestellt.
Fig. 1 zeigt ein Frequenz-Amplituden-Diagramm des Innengeräuschpegels in einem
fahrenden Kraftfahrzeug für unterschiedliche Geschwindigkeiten zwischen 60 Km/h und
160 Km/h. Bei dieser Darstellung fällt auf, daß insbesondere bei niedrigen Frequenzen
unterhalb von ca. 500 Hz der Innengeräuschpegel im Vergleich zu den sonstigen
Frequenzen des Innengeräuschsignals stark ansteigt. Da jedoch bei normaler
Stimmlage die Grundfrequenz und die ersten Harmonischen zur Grundfrequenz im
Frequenzbereich unter 1000 Hz und insbesondere unterhalb 500 Hz liegen, ist eine
Bestimmung, also ein Herausfiltern des Sprachsignals aus dem
Innenraumgeräuschsignal erheblich erschwert.
Fig. 2 zeigt ein Sprachsignal, das von einem Untergrundsignal überlagert worden ist, in
einer Zeit-Frequenz-Darstellung als Spektrogramm. Dieses Spektrogramm wird bspw.
durch eine Fouriertransformations (FFT) aus einem Mikrofonsignal erhalten. In Fig. 2
kennzeichnen unterschiedliche Grauwerte der Einzelsegmente des Spektrogramms
unterschiedliche Intensitäten. Man erkennt einerseits deutlich die ansteigende Intensität
(hellere Grauwerte) im Bereich kleiner Frequenzen zum Wert gleich Null hin und
andererseits schmalbandige Frequenzanteile, die weitgehend parallel zueinander über
kurze Zeitabschnitte verlaufen. Diese letztgenannten schmalbandigen Frequenzanteile
stellen Harmonische der Grundfrequenz des entsprechenden Sprachsignals dar, die
- wie im folgenden beschrieben - erfindungsgemäß ausgewertet werden.
Fig. 3 zeigt ein Spektrogramm des in Fig. 2 dargestellten Sprachsignals ohne das
Untergrundgeräusch, so daß auch die tieffrequenzen Sprachanteile als schmalbandige
Frequenzanteile im Spektrogramm unterhalb von 500 Hz zu erkennen sind. Diese
Sprachanteile gilt es zu rekonstruieren.
Fig. 4 zeigt weiterhin das zuvor dargestellte Sprachsignal, bei dem die Sprachanteile
unterhalb einer Grenzfrequenz von ca. 400 Hz abgeschnitten sind. Ein derartiges Signal
entspricht ungefähr dem Sprachsignal, wie es bei einer Telefonverbindung übertragen
wird.
Fig. 5 zeigt ein Beispiel eines rekonstruierten Sprachsignals im Bereich unterhalb der
Grenzfrequenz von ca. 400 Hz und Fig. 6 zeigt das zusammengesetzte rekonstruierte
Sprachsignal aus dem in Fig. 5 dargestellten rekonstruierten Sprachanteil und dem in
Fig. 4 dargestellten Frequenzanteil oberhalb der Grenzfrequenz des ursprüngliche
Spektrums. Wie die rekonstruierten Sprachanteile erhalten werden, wird im folgenden
anhand der Fig. 7 bis 9 im Detail beschrieben.
Fig. 7 zeigt in einem Blockschaltbild eine Vorrichtung zur Rekonstruktion tieffrequenter
Sprachanteile aus mittelhohen Frequenzanteilen. Das Sprachsignal wird einem Mittel 4
zur Bestimmung von Frequenzanteilen ωfa1, ωfa2, . . . von Maxima im Sprachsignal
oberhalb einer vorgegebenen Grenzfrequenz ω0 zugeleitet. Dazu wird das Sprachsignal
zunächst durch ein Bandfilter 6 geleitet, so daß nur die Frequenzanteile zwischen der
Grenzfrequenz ω0 und einer weiteren Frequenz ω1 herausgeschnitten und einer
Weiterverarbeitung zugeleitet wird. ω0 liegt dabei beispielsweise im Bereich von 200 bis
500 Hz, insbesondere bei 350 Hz, während die Frequenz ω1 bspw. im Bereich von 800 Hz
liegt. Der so ausgefilterte Frequenzabschnitt des Sprachsignals wird im
Mischelement 8 gemischt, so daß die Summen- und Differenzfrequenzen der im
herausgeschnittenen Abschnitt des Sprachsignals enthaltenen Frequenzanteile gebildet
werden. Von Interesse sind dabei die Differenzfrequenzen, so daß das aus dem
Mischelement 8 austretende Signal mittels eines Tiefpasses bearbeitet wird, so daß nur
Frequenzanteile unterhalb einer einstellbaren Frequenz ω2 durchgelassen werden. Somit
läßt sich die kleinste Differenzfrequenz bestimmen, die dem Abstand zweier im
Sprachsignal benachbart zueinander angeordneter Spektralanteile entspricht. Da es sich
dabei um zwei Harmonische der Grundfrequenz handelt, stellt die Differenzfrequenz die
Grundfrequenz ωg dar. Diese Grundfrequenz wird anschließend Mitteln 12 zur
Rekonstruktion des Sprachsignals zugeleitet. Über einen weiteren Eingang der Mittel 12
wird das Sprachsignal über eine Verzögerungsstufe 14 und einen Tiefpaß 16 zugeführt.
Somit liegt den Mitteln 12 sowohl der Wert der Grundfrequenz ωg als auch ein
vorgegebener Frequenzabschnitt des Sprachsignals für eine Rekonstruktion des die
Sprache enthaltenden Signals zur Verfügung. Die Verzögerungsstufe 14 dient dabei
einem Ausgleich der Zeitspanne Δt, die für die Bestimmung der Grundfrequenz ωg
benötigt wird und der Tiefpaß 16 dient einer sinnvollen Verringerung der Datenmenge,
die den Mitteln 12 zur Rekonstruktion des Sprachsignals zugeleitet wird.
Die Mittel 12 zur Rekonstruktion des Sprachsignals unterhalb der Grenzfrequenz ω0
weist schaltungstechnisch zwei Alternativen von Verfahrensweisen auf.
Als erste Alternative wird die Grundfrequenz ωg herangezogen, um ein Signal im
rekonstruierten Sprachsignal zu erzeugen, das dem Grundton der Sprache entspricht.
Darüber hinaus können auch die Frequenzen der Harmonischen zur Grundfrequenz ωg
durch einfaches Multiplizieren mit den Zahlen N = 2, 3, 4, . . . ermittelt werden, so daß für
eine Rekonstruktion des Sprachanteils unterhalb der Grenzfrequenz ω0 neben der
Grundfrequenz ωg auch die unterhalb der Grenzfrequenz ω0 angeordneten Frequenzen
ωh1, ωh2, . . . der ersten, zweiten und weiteren Harmonischen verwendet werden. Ziel ist
es dabei, sämtliche Harmonischen im zu rekonstruierenden Frequenzabschnitt des
Sprachsignals zu erzeugen, also zu simulieren. Für eine spektrale Verteilung um jede
dieser Frequenzen wird in Näherung eine Gauß'schen Verteilung oder eine andere
mögliche spektrale Verteilung angenommen, die sich über eine Halbwertsbreite und eine
Amplitude definieren läßt. Dadurch lassen sich die in Fig. 5 dargestellten spektralen
Abschnitte im Spektrogramm erzeugen, die bei dem in Fig. 2 dargestellten verrauschten
Signal nicht oder nur ansatzweise zu erkennen sind.
Als weitere Alternative für eine Rekonstruktion des tieffrequenten Sprachanteils besteht
die Möglichkeit, daß die Mittel 12 einen Kammfilter aufweisen, der eine Mehrzahl von
Bandfiltern aufweist, deren spektrale Durchlaßfunktionen durch die Grundfrequenz ωg
und die Frequenzen ωh1, ωh2, . . . bestimmt werden. Die spektrale Durchlaßfunktion jedes
Bandfilters wird zudem über eine vorgegebene Breite definiert, so daß entsprechende
spektrale Abschnitte aus dem Sprachsignal im Bereich tiefer Frequenzen unterhalb der
Grenzfrequenz ω0 herausgefiltert werden. Da aus dem Spektrogramm nur die Anteile
herausgefiltert werden, die das Sprachsignal enthalten, wird das Sprachsignal aus dem
Spektrogramm rekonstruiert. Wird dabei zusätzlich eine Rauschunterdrückung
durchgeführt, so werden aus den herausgefilterten Signalanteilen auch die
Untergrundgeräusche herausgefiltert, so daß ein nahezu natürliches Sprachsignal
erzeugt wird.
Wie weiterhin in Fig. 7 zu erkennen ist, wird das Sprachsignal über eine weitere
Verzögerungsstufe 18 um eine Zeitdifferenz Δt verzögert, um eine Anpassung an die für
Rekonstruktion des tieffrequenten Sprachanteils notwendige Zeitspanne zu ermöglichen.
Nach Durchlaufen einen Hochpasses 20, in dem das Sprachsignal oberhalb der
Grenzfrequenz ω0 herausgefiltert wird, laufen sowohl dieses hochpaßgefilterte Signal als
auch das rekonstruierte Sprachsignal für Frequenzen ω < ω0 in dem Summenelement 22
zusammen, woraus das in Fig. 6 dargestellte rekonstuierte Spektrogramm erzeugt wird.
Dieses Spektrogramm besteht also einerseits aus dem unterhalb der Grenzfrequenz ω0
rekonstruierten Frequenzanteil sowie aus dem ursprünglichen Frequenzspektrum
oberhalb der Grenzfrequenz ω0. Das so erzeugte Spektrogramm führt nach einer
Umwandlung in ein Lautsprechersignal zu einer nahezu natürlich klingenden
Sprachwiedergabe.
Wie bereits oben erläutert worden, bleibt im allgemeinen die Grundfrequenz ωg in einem
Sprachsignal aufgrund der Sprachmelodie nicht konstant. Daher ist es erforderlich,
ständig die Grundfrequenz ωg neu zu bestimmen. Dieses kann einerseits dadurch
geschehen, daß ständig das zuvor beschriebenen Verfahren durchlaufen wird, das
anhand der Elemente 4, 6, 8 und 10 zuvor beschrieben worden ist. Zum anderen kann
jedoch eine genauere adaptive Nachführung der Grundfrequenz ωg durchgeführt
werden. Dieses ist mit einer Vorrichtung möglich, die in Fig. 8 dargestellt ist.
Die zu Beginn eines Sprachsignals zunächst bestimmte Grundfrequenz ωg wird mit
Hilfe eines Multiplikationselementes 24 auf den N-fachen Wert multipliziert. Somit wird
die (N - 1)te Harmonische zur Grundfrequenz berechnet. Die Frequenz dieser
Harmonischen wird im folgenden als Regelharmonische bezeichnet und die zugehörige
Frequenz mit ωr bezeichnet.
Die Frequenz ωr wird über einen Mehrtorschalter in einen Regelkreis eingebracht. In
einer Initialisierungsphase zu Beginn eines Wortes wird der Ausgang des
Multiplikationselementes 24 vom Mehrtorschalter 26 an das Mischelement 28
übergeben. Nach kurzer Zeit liegt - wie im folgenden beschrieben - ein Schätzwert ωr,neu
vor und der Mehrtorschalter 26 wird so umgeschaltet, daß ωr,neu an das Mischelement 28
weitergegeben wird.
Ziel des Regelkreises besteht darin, die Differenz zwischen der (N - 1)ten Harmonischen
und einer festen Frequenz von bspw. ωm = 2000 Hz zu bestimmen. Im Idealfall ist ωr
exakt die Frequenz der (N - 1)ten Harmonischen. Das Mischelement 28 bildet die
Differenz zwischen ωr und ωm. Ein Sinusgenerator erzeugt ein sinusförmiges Signal mit
der Frequenz, die durch sein Eingangssignal ωd, vorgegeben wird. Dieses wird einem
Mischelement 32 zugeleitet, das das Sprachsignal und dieses sinusförmige Signal
mischt. Nach erfolgter Mischung wird aus dem Mischelement 32 das gemischte Signal
ausgegeben, das einem Regelelement 34 zum Feststellen der frequenzabhängigen
Leistungsverteilung im Mischsignal in Bezug auf die feststehende Frequenz ωm
zugeleitet wird.
Unter der Annahme, daß die dem Mischelement 28 zugeführte Frequenz ωm der
Regelharmonsichen genau zu einer Harmonischen im aktuellen Sprachsignal paßt,
entspricht die Summe aus der Differenzfrequenz ωd, die durch die Differenz mit der
feststehenden Mischungsfrequenz ωm und ωr erzeugt worden ist, und einem der
Regelharmonischen entsprechenden Frequenzanteils des Sprachsignals genau der
Mischungsfrequenz ωm. Dieses spiegelt sich in einer Leistungsverteilung (P-Verteilung)
im Leistungsspektrum wider. Die Leistungsverteilung wird bei der Mischungsfrequenz ωm
maximal sein.
Entspricht die Frequenz ωr der Regelharmonischen jedoch nicht der aktuellen Frequenz
der entsprechenden Harmonischen im Sprachsignal, so wird die Leistungsverteilung ihr
Maximum nicht bei der Frequenz ωm, sondern bei einer um einen Differenzwert Δω
verschobene Positionen annehmen. Somit läßt sich ein Korrekturwert zu Δω bestimmen,
der dem aktuellen Wert der Frequenz ωr der Regelharmonischen hinzu addiert wird.
Daraus entsteht der neue Wert der Frequenz ωr,neu der über den Multiportschalter 26
der Regelschleife erneut zugeführt wird. Anschließend erfolgt erneut eine Mischung im
Mischelement 28 mit nachfolgender Regelabfolge, wie sie zuvor beschrieben worden ist.
Ändert sich somit im Laufe des Sprachsignals die Grundfrequenz und somit auch die
Frequenz der entsprechenden Harmonischen im Sprachsignal, so wird dieses durch die
Regelschleife ausgeglichen, so daß ständig ein aktueller, mit der Grundfrequenz ωr
weitgehend übereinstimmender Wert ωr erzeugt.
Fig. 9 zeigt dazu die Kennlinien einer Mehrzahl von Bandfiltern, die für eine Bestimmung
der Leistungsverteilung im Regelelement 34 vorgesehen sind. Aus Fig. 9 ergibt sich eine
Anzahl von 7 Bandfiltern, die um die feststehende Mischfrequenz ωm = 2000 Hz herum
angeordnet sind. Fällt also beispielsweise die maximale Leistung in den Durchlaßbereich
des mittleren Bandfilters, so wird der Korrekturwert Δω = 0 gesetzt. Liegt dagegen das
Maximum in einem der benachbart angeordneten Bandfilter, so wird ein entsprechender
Korrekturwert Δω ≠ 0 erzeugt, um bei weiter fortgeführter Regelung das Maximum der
spektralen Leistungsverteilung in den Durchlaßbereich des mittleren Bandfilters zu
verschieben.
Der Wert ωr wird aus der Regelschleife über ein Multiplikationselement 38 abgezweigt
und ausgegeben, in dem die aktuelle Frequenz ωr mit dem Faktor 1/N beaufschlagt wird,
um den Wert der Grundfrequenz ωg,adapt zu erzeugen. Somit wird der Wert der
Grundfrequenz ωg ständig adaptiv nachgeführt, wodurch die Rekonstruktion des
tieffrequenten Sprachanteils aus den mittelhohen Frequenzanteilen verbessert und
näher an ein natürliches Sprachsignal herangeführt wird.
Claims (16)
1. Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen
Frequenzanteilen,
- - bei dem oberhalb einer Grenzfrequenz (ω0) mindestens zwei benachbart angeordnete Frequenzanteile (ωfa1, ωfa2, . . .) mit erhöhter Amplitude im Sprachsignal bestimmt werden und
- - bei dem die Grundfrequenz (ωg) des Sprachsignals als Frequenzdifferenz zwischen den mindestens zwei benachbarten Frequenzanteilen (ωfa1, ωfa2, . . .) bestimmt wird und
- - bei dem mit Hilfe der ermittelten Grundfrequenz (ωg) und des Sprachsignals der tieffrequente Frequenzbereich unterhalb der Grenzfrequenz (ωg) rekonstruiert wird.
2. Verfahren nach Anspruch 1, bei dem aus der Grundfrequenz (ωg) die Frequenzen
(ωh1, ωh2, . . .) der unterhalb der Grenzfrequenz (ω0) angeordneten Harmonischen
der Grundfrequenz (ωg) bestimmt und neben der Grundfrequenz (ωg) für das
Rekonstruieren des tieffrequenten Frequenzbereiches verwendet werden.
3. Verfahren nach Anspruch 1, bei dem mit Hilfe eines mehrere Bandfilter
aufweisenden Kammfilters auf der Basis der Grundfrequenz (ωg) und der
Frequenzen der unterhalb der Grenzfrequenz (ω0) angeordneten Harmonischen
die Frequenzpositionen der Bandfilter eingerichtet werden, mit deren Hilfe das
Sprachsignals im Bereich unterhalb der Grenzfrequenz (ω0) gefiltert wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem zu Beginn eines Sprache
enthaltenen Sprachabschnittes aus dem Sprachsignal die Grundfrequenz (ωg)
bestimmt wird und anschließend die Grundfrequenz (ωg) adaptiv nachgeführt wird.
5. Verfahren nach Anspruch 4,
- - bei dem für eine adaptive Nachführung der Grundfrequenz (ωg) aus dem aktuellen Wert der Grundfrequenz (ωg) die Frequenz (ωr) einer Regelharmonischen als N-te Harmonische berechnet wird, bei dem die Differenz zwischen der Frequenz (ωr) der Regelharmonischen und einer feststehenden Mischungsfrequenz (ωm) gebildet wird,
- - bei dem ein sinusförmiges Signal (sin(ωd)) mit der sich aus der Differenzbildung ergebenden Differenz- oder Summenfrequenz (ωd) erzeugt wird, bei dem das sinusförmige Signal (sin(ωd)) mit dem Sprachsignal gemischt und ein Mischsignal erzeugt wird,
- - bei dem im Mischsignal die frequenzabhängige Leistungsverteilung in Bezug auf die feststehende Mischungsfrequenz (ωm) festgestellt wird,
- - bei dem aus der Leistungsverteilung ein Korrekturwert (Δω) für die Frequenz (ωr) der Regelharmonischen berechnet wird,
- - bei dem die Frequenz (ωr) der Regelharmonischen um den Korrekturwert (Δω) verändert und einer erneuten Mischung mit der feststehenden Mischungsfrequenz (ωm) zugeleitet wird und
- - bei dem die Grundfrequenz (ωg) ausgegeben wird, die dem entsprechenden Bruchteil 1/N der Frequenz (ωr) entspricht.
6. Verfahren nach Anspruch 5, bei dem für eine Bestimmung die Leistungsverteilung
das Mischsignal einer Mehrzahl von Bandfiltern (BFn) zugeleitet wird, die
nebeneinanderliegende Frequenzbereiche zentriert um die feste
Mischungsfrequenz herum abdecken,
7. Verfahren nach einem der Ansprüche 1 bis 6, bei dem die Amplitude des
mindestens einen unterhalb der Grenzfrequenz erzeugten Frequenzsignals in
Abhängigkeit von den Amplituden der oberhalb der Grenzfrequenz analysierten
Frequenzsignale bestimmt wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, bei dem die Grenzfrequenz in
Abhängigkeit vom Geräuschpegel bestimmt wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, bei dem das Sprachsignal vor einer
Umwandlung in ein Spektrogramm einer Störsignalbefreiung unterzogen wird.
10. Anwendung eines Verfahrens nach einem der Ansprüche 1 bis 9 für die
Wiedergabe eines in einem fahrenden Kraftfahrzeug aufgenommenen
Sprachsignals.
11. Anwendung eines Verfahrens nach einem der Ansprüche 1 bis 9 für die
Wiedergabe eines Sprachsignals, das mittels einer Telefonverbindung übertragen
wird.
12. Vorrichtung zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen
Frequenzanteilen, insbesondere zur Durchführung eines Verfahren nach einem
der Ansprüche 1 bis 11,
- - mit Mitteln (4) zur Bestimmung von Frequenzanteile (ωfa1, ωfa2, . . .) von Maxima im Sprachsignal oberhalb einer vorgegebenen Grenzfrequenz (ω0),
- - mit Mitteln (8) zum Mischen der Frequenzanteile (ωfa1, ωfa2, . . .) zur Bestimmung der Grundfrequenz (ωg) des Sprachsignals als Differenzfrequenz zwischen jeweils zwei benachbarten Frequenzanteilen (ωfa1, ωfa2, . . .) und
- - mit Mitteln (12) zur Rekonstruktion des Sprachsignals unterhalb der Grenzfrequenz (ω0) aus der ermittelten Grundfrequenz (ωg) und dem Sprachsignal.
13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, daß die Mittel (12) zur
Rekonstruktion des Sprachsignals unterhalb der Grenzfrequenz (ω0) das
Spektrogramm aus der Grundfrequenz (ωg) und den Frequenzen (ωh1, ωh2, . . .) der
unterhalb der Grenzfrequenz (ω0) angeordneten Harmonischen der Grundfrequenz
(ωg) mit einer vorgegebenen Spektralverteilung und einer vorgegebenen
Amplitudenverteilung bestimmt.
14. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, daß die Mittel (12) einen
Kammfilter mit einer Mehrzahl von Bandfiltern aufweisen, wobei die Frequenzen
der Bandfilter auf der Basis der Grundfrequenz (ωg) und ggf. ein oder mehrerer
unterhalb der Grenzfrequenz (ω0) angeordneter Harmonischer der Grundfrequenz
(ωg) einstellbar sind.
15. Vorrichtung nach einem der Ansprüche 12 bis 14, dadurch gekennzeichnet, daß
für ein adaptives Nachführen der Grundfrequenz (ωg) vorgesehen sind,
- - ein Multiplikatorelement (24) zum Erzeugen der N-ten Harmonischen der Grundfrequenz als Frequenz (ωr) einer Regelharmonischen,
- - ein Mischelement (28) zum Mischen der Frequenz (ωr) der Regelharmonischen mit einer feststehenden Mischungsfrequenz (ωm),
- - einem Sinusgenerator (30) zum Mischen der sich aus der Mischung ergebenden Differenz- oder Summenfrequenz (ωd),
- - einem Mischelement (32) zum Mischen des sinusförmigen Signals (sin(ωd)) mit dem Sprachsignal und zum Erzeugen eines Mischsignals erzeugt wird,
- - einem Regelelement (34) zum Feststellen der frequenzabhängigen Leistungsverteilung im Mischsignal in Bezug auf die feststehende Mischungsfrequenz (ωm) und zum Berechnen eines ein Korrekturwert (Δω) für die Frequenz (ωr) der Regelharmonischen aus der Leistungsverteilung,
- - einem Mischelement (36) zum Verändern der Frequenz (ωr) der Regelharmonischen um den Korrekturwert (Δω) und
- - mit einem Multiplikatorelement (38) zum Berechnen des Bruchteils 1/N der Frequenz (ωr) als Grundfrequenz (ωg).
16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, daß das Regelelement
(34) eine Mehrzahl von Bandfiltern aufweist, die zentrisch zur Mischungsfrequenz
(ωm) nebeneinanderliegende Frequenzbereiche abdecken.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10010037A DE10010037B4 (de) | 2000-03-02 | 2000-03-02 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
AT01102129T ATE364221T1 (de) | 2000-03-02 | 2001-02-01 | Verfahren zur rekonstruktion tieffrequenter sprachanteile aus mittelhohen frequenzanteilen |
EP01102129A EP1130577B1 (de) | 2000-03-02 | 2001-02-01 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
DE50112581T DE50112581D1 (de) | 2000-03-02 | 2001-02-01 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10010037A DE10010037B4 (de) | 2000-03-02 | 2000-03-02 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE10010037A1 true DE10010037A1 (de) | 2001-09-06 |
DE10010037B4 DE10010037B4 (de) | 2009-11-26 |
Family
ID=7633152
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10010037A Expired - Fee Related DE10010037B4 (de) | 2000-03-02 | 2000-03-02 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
DE50112581T Expired - Lifetime DE50112581D1 (de) | 2000-03-02 | 2001-02-01 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE50112581T Expired - Lifetime DE50112581D1 (de) | 2000-03-02 | 2001-02-01 | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1130577B1 (de) |
AT (1) | ATE364221T1 (de) |
DE (2) | DE10010037B4 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1814107B1 (de) * | 2006-01-31 | 2011-10-12 | Nuance Communications, Inc. | Verfahren und entsprechendes System zur Erweiterung der spektralen Bandbreite eines Sprachsignals |
CN111863006A (zh) * | 2019-04-30 | 2020-10-30 | 华为技术有限公司 | 一种音频信号处理方法、音频信号处理装置和耳机 |
CN112151065B (zh) * | 2019-06-28 | 2024-03-15 | 力同科技股份有限公司 | 单音信号频率检测方法、装置、设备及计算机存储介质 |
CN113362840B (zh) * | 2021-06-02 | 2022-03-29 | 浙江大学 | 基于内建传感器欠采样数据的通用语音信息恢复装置及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3782959T2 (de) * | 1986-04-01 | 1993-06-24 | Matsushita Electric Ind Co Ltd | Erzeuger von niederfrequenten toenen. |
US5581652A (en) * | 1992-10-05 | 1996-12-03 | Nippon Telegraph And Telephone Corporation | Reconstruction of wideband speech from narrowband speech using codebooks |
DE3321225C2 (de) * | 1982-06-14 | 1997-10-16 | Bose Corp | Schaltungsanordnung zur automatisch wirksamen, dynamischen Entzerrung |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4091237A (en) * | 1975-10-06 | 1978-05-23 | Lockheed Missiles & Space Company, Inc. | Bi-Phase harmonic histogram pitch extractor |
US4700390A (en) * | 1983-03-17 | 1987-10-13 | Kenji Machida | Signal synthesizer |
-
2000
- 2000-03-02 DE DE10010037A patent/DE10010037B4/de not_active Expired - Fee Related
-
2001
- 2001-02-01 EP EP01102129A patent/EP1130577B1/de not_active Expired - Lifetime
- 2001-02-01 AT AT01102129T patent/ATE364221T1/de not_active IP Right Cessation
- 2001-02-01 DE DE50112581T patent/DE50112581D1/de not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3321225C2 (de) * | 1982-06-14 | 1997-10-16 | Bose Corp | Schaltungsanordnung zur automatisch wirksamen, dynamischen Entzerrung |
DE3782959T2 (de) * | 1986-04-01 | 1993-06-24 | Matsushita Electric Ind Co Ltd | Erzeuger von niederfrequenten toenen. |
US5581652A (en) * | 1992-10-05 | 1996-12-03 | Nippon Telegraph And Telephone Corporation | Reconstruction of wideband speech from narrowband speech using codebooks |
Also Published As
Publication number | Publication date |
---|---|
EP1130577B1 (de) | 2007-06-06 |
ATE364221T1 (de) | 2007-06-15 |
DE50112581D1 (de) | 2007-07-19 |
EP1130577A3 (de) | 2002-09-18 |
EP1130577A2 (de) | 2001-09-05 |
DE10010037B4 (de) | 2009-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2719973C2 (de) | ||
DE60212696T2 (de) | Bandbreitenvergrösserung für audiosignale | |
DE60027438T2 (de) | Verbesserung eines verrauschten akustischen signals | |
EP1143416B1 (de) | Geräuschunterdrückung im Zeitbereich | |
DE2818204C2 (de) | Signalverarbeitungsanlage zur Ableitung eines störverringerten Ausgangssignals | |
DE60009206T2 (de) | Rauschunterdrückung mittels spektraler Subtraktion | |
DE19747885B4 (de) | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion | |
DE19948308C2 (de) | Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung | |
DE2526034A1 (de) | Hoerhilfeverfahren und vorrichtung zur durchfuehrung des verfahrens | |
WO2003012779A1 (de) | Verfahren zur analyse von audiosignalen | |
EP1258865A2 (de) | Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen | |
DE69635141T2 (de) | Verfahren zur Erzeugung von Sprachmerkmalsignalen und Vorrichtung zu seiner Durchführung | |
EP1239455A2 (de) | Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung | |
DE3733983A1 (de) | Verfahren zum daempfen von stoerschall in von hoergeraeten uebertragenen schallsignalen | |
DE4343366C2 (de) | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen | |
WO2001047335A2 (de) | Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät | |
DE10010037B4 (de) | Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen | |
DE10025655B4 (de) | Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten | |
DE19832472A1 (de) | Vorrichtung und Verfahren zur Beeinflussung eines Audiosignals in Abhängigkeit von Umgebungsgeräuschen | |
EP1453355A1 (de) | Signalverarbeitung in einem Hörgerät | |
DE3133107A1 (de) | Persoenlicher schallschutz | |
EP4154244A1 (de) | Verfahren zur maskierung von unerwünschten störgeräuschen und fahrzeug | |
DE10150519B4 (de) | Verfahren und Anordnung zur Sprachverarbeitung | |
DE102004020326B4 (de) | Wellenformeinstellsystem für eine Musikdatei | |
DE2904426A1 (de) | Analog-sprach-codierer und decodierer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8110 | Request for examination paragraph 44 | ||
8339 | Ceased/non-payment of the annual fee |