DE19643900C1 - Nachfiltern von Hörsignalen, speziell von Sprachsignalen - Google Patents

Nachfiltern von Hörsignalen, speziell von Sprachsignalen

Info

Publication number
DE19643900C1
DE19643900C1 DE19643900A DE19643900A DE19643900C1 DE 19643900 C1 DE19643900 C1 DE 19643900C1 DE 19643900 A DE19643900 A DE 19643900A DE 19643900 A DE19643900 A DE 19643900A DE 19643900 C1 DE19643900 C1 DE 19643900C1
Authority
DE
Germany
Prior art keywords
post
filter
audio signal
filtering
short delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE19643900A
Other languages
English (en)
Inventor
Rolf Anders Bergstroem
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Priority to DE19643900A priority Critical patent/DE19643900C1/de
Priority to US08/953,919 priority patent/US6058360A/en
Priority to PCT/EP1997/005963 priority patent/WO1998019298A1/en
Priority to AU53143/98A priority patent/AU5314398A/en
Priority to JP52004798A priority patent/JP2001509277A/ja
Application granted granted Critical
Publication of DE19643900C1 publication Critical patent/DE19643900C1/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Description

Diese Erfindung betrifft Nachfilter, um Hörsignale, speziell Sprachsignale, nachzufiltern und betrifft ein Verfahren, um diese Signale nachzufiltern. Spezieller betrifft die Erfindung Kurzverzögerungs-Nachfilter, um Hörsignale, speziell Sprachsi­ gnale, nachzufiltern, und Verfahren zum Nachfiltern dieser Si­ gnale mit einem Kurzverzögerungs-Nachfilter.
Nachfilter werden gewöhnlich verwendet, um Rauschen in Sprach­ signalen durch Verstärken von starken Spektralanteilen und/oder durch unterdrücken von schwachen Bereichen des Si­ gnals zu unterdrücken. Z.B kann solches Rauschen dort entste­ hen, wo analoge Sprachsignale für ein Kodieren in eine digita­ le Darstellung abgetastet werden, wie es vor einer Übertragung von Sprachsignalen in einem mobilen Telekommunikationssystem vorkommen kann oder während eines nachfolgenden Dekodierens eines vorhergehend kodierten Signals. Sehr oft wird solches Kodieren oder Dekodieren auch die Kompression der Signaldaten während des Kodiervorgangs mit nachfolgender Dekompression während des passenden Dekodierens einschließen. Der Verlust eines Teils der in dem ursprünglichen analogen Hörsignal ent­ haltenen Information ist daher im Falle von Kompression und Dekompression unvermeidlich und die Anwendung eines Nachfil­ ters zur Verbesserung der empfundenen Qualität der dekodierten Signale ist wünschenswert. Ein Nachfilter kann auf das kodier­ te Hörsignal, auf das dekodierte Hörsignal oder auf beide an­ gewendet werden, um diese Verbesserung zu erzielen.
Drei Haupttypen von Nachfiltern können unterschieden werden. Diese sind jeweils bekannt als: Kurzverzögerungs- (oder Kurz­ zeitraum) Nachfilter, Langverzögerungs- (oder Langzeitraum) Nachfilter oder Hochfrequenzverstärkungs- (oder Hochpaß) Nach­ filter. Kurzverzögerungs-Nachfilter verstärken allgemein Be­ reiche des Frequenzspektrums eines Hörsignals mit viel Ener­ gie, um eine Verzerrung in den Tälern des Frequenzspektrums zu verhindern. Langverzögerungs-Nachfilter verstärken gewöhnlich Bereiche des Frequenzspektrums, die eine Langzeitperiodizität gemäß der Tonhöhe oder der Hörfrequenz des ursprünglichen Si­ gnals zeigen. Hochfrequenzverstärkungs-Nachfilter werden ver­ wendet, um Hochfrequenzbereiche eines Signalfrequenzspektrums zu verstärken, und somit die Klarheit des Signals wiederherzu­ stellen, da Niedrigfrequenzbereiche im Vergleich zu Hochfre­ quenzbereichen während des Kodierens und Dekodierens allgemein stärker verstärkt werden. Ein Hochfrequenzverstärkungs- Nachfilter kann auch verwendet werden, um durch die Anwendung eines Kurzverzögerungs-Nachfilters erzeugte Hochfrequenzverlu­ ste zu kompensieren. Die drei eben beschriebenen Typen von Nachfiltern können einzeln auf die Hörsignale angewendet wer­ den, oder in einer Kombination von zwei der drei der Typen von Nachfiltern oder in einer Kombination von allen drei Typen zu­ sammen, um die empfundene Qualität des Hörsignals optimal zu verbessern.
Wie oben erwähnt, betrifft die vorliegende Erfindung haupt­ sächlich Kurzverzögerungs-Nachfilter und Verfahren zum Nach­ filtern von Hörsignalen, speziell von Sprachsignalen, mit Kurzverzögerungs-Nachfiltern. Die Auswirkungen eines Kurzver­ zögerungs-Nachfilters auf ein Hörsignal kann durch eine Über­ tragungsfunktion P(z) dargestellt werden, die mit Filterkoef­ fizienten und der Variablen z ausgedrückt wird, wobei z das In­ verse des Einheits-Verzögerungsoperators z-1 ist, welcher in der z-Transformations-Darstellung von Übertragungsfunktionen verwendet wird. Weiterhin kann ein Erzeugungsfilter zum Erzeu­ gen von kodierten Hörsignalen durch eine Übertragungsfunktion H(z) dargestellt werden, ebenfalls ausgedrückt durch Filter­ koeffizienten und die Variable z. Wie in der beigefügten Figur (Fig.) gezeigt, wird zum Erzeugen eines kodierten Hörsignals ein Erregungsgenerator 11 verwendet, um ein Erregungssignal G(z) an einen Erzeugungsfilter 12 zu liefern. Der Erzeugungs­ filter 12 formt das Erregungssignal G(z) in ein synthetisches Hörsignal S(z) gemäß der Übertragungsfunktion H(z) des Erzeu­ gungsfilters um. Wie auch in der Figur gezeigt, kann das so hergestellte Hörsignal S(z) nachfolgend entweder sofort, oder nach einer Übertragung und Dekodierung, zu einem Nachfilter 12 geführt werden, der das synthetische Hörsignal S(z) gemäß der Übertragungsfunktion P(z) des Nachfilters umformt, um ein nachgefiltertes Hörsignal Sp(z) zu erzeugen.
Die Übertragungsfunktion H(z) des Erzeugungsfilters 12 ist oft vom Typ
H(z) = 1/A(z) [Gl. 1]
wobei A(z) ein Polynom ist, das als
ausgedrückt werden kann, wobei m ein Index von 1 bis Ma, der Ordnung des Polynoms, ist und am die Koeffizienten des Po­ lynoms sind und z die Variable ist, wie vorher. Ma, die Ord­ nung des Polynoms, ist typischerweise zwischen 8 und 10.
US-A-4 969 192 von Voicecraft, Inc., Goleta, California, USA beschreibt die Verwendung genau des gleichen Polynoms A(z) aus Gl. 2, das im Erzeugungsfilter 12 verwendet wird, um den Nen­ ner und den Zähler einer Übertragungsfunktion P(z) für den Kurzverzögerungs-Nachfilter 13 zu versehen. Demzufolge ver­ stärkt der Nennerterm einer solchen Übertragungsfunktion die Formanten des Frequenzspektrum des synthetischen Hörsignals S(z), das durch den Erzeugungsfilter versehen wird, während die Täler des Frequenzspektrums wie gewünscht gedämpft werden. Da der Zählerterm die gleiche Form wie der Nennerterm hat, zielt der Zählerterm einer solchen Kurzverzögerungs- Übertragungsfunktion darauf, die Gesamtform des von dem Nen­ nerterm resultierenden Frequenzspektrums zu entfernen.
In der US-A-4 969 192 sind der Nenner- und Zählerterm der Kurzverzögerungs-Übertragungsfunktion P(z) von dem Polynom A(z) der entsprechenden Erzeugungsfilter-Übertragungsfunktion durch jeweilige Chirpfaktoren verschieden, die empirisch be­ stimmte Parameter α und β sind, womit:
P(z) = Ap(z/β)/Ap(z/α) [Gl. 3]
wobei α und β durch 0 < β < α < 1 definiert sind. Diese Chir­ pfaktoren α und β können demnach verwendet werden, um die Pole und Nullstellen der Übertragungsfunktion aus Gl. 3 in Richtung des Ursprungs zu verschieben. Durch Setzen von α oder β = 1 wird der Nenner- bzw. Zählerterm identisch mit A(z) während das Setzen von α = 0 einen Allpaßfilter zur Folge hat. Die Kurzverzögerungs-Übertragungsfunktion in Gl. 3 stellt einen Kompromiß dar, zwischen spektralen Spitzen, die so scharf sind, daß sie einfach wahrnehmbares und damit unerwünschtes Chirpen erzeugen, und so niedrig sind, daß sie keine Verminde­ rung des Rauschens erzielen. US-A-4 969 192 schlägt daher die Verwendung von Werten für α und β von α = 0.8 und β = 0.5 vor, um einen Kompromiß zwischen diesen beiden Extremen zu erzie­ len, wobei ein durch den Nennerterm eingeführtes spektrales Neigen durch den Zählerterm partiell ausgeglichen wird. Die sich aus der Übertragungsfunktion aus Gl. 3 ergebenden gefil­ terten Hörsignale bleiben jedoch gedämpft und benötigen einen Hochfrequenz-Verstärkungsfilter, um die durch einen Kurzverzö­ gerungs-Nachfilter mit einer solchen Übertragungsfunktion ein­ geführten Hochfrequenzverluste zu kompensieren. Da das Zähler­ polynom aus Gl. 3 dem Nennerpolymon nicht präzise nachfolgt, wandert darüber hinaus die gesamte spektrale Neigung des Kurz­ verzögerungs-Nachfilters mit der Zeit, wobei eine wahrnehmbare Veränderung der Klarheit des nachgefilterten Signals wahrnehm­ bar ist.
US-A-5 241 650, zugeordnet Motorola Inc., aus Schaumberg, Il­ linois, versucht die in Gl. 3 dargestellte Kurzverzögerungs- Nachfilter-Übertragungsfunktion aus US-A-4 969 192 zu verbes­ sern. Die in US-A-5 241 650 beschriebene Kurzverzögerungs- Nachfilter-Übertragungsfunktion verwendet den gleichen Nenner­ term wie die Übertragungsfunktion des entsprechenden Erzeu­ gungsfilters, jedoch ist im Gegensatz zu der US-A-4 969 192 der Zählerterm von dem Nennerterm abgeleitet durch: (a) Trans­ formieren des Nennerterms in einen Satz Parameter in einen an­ deren Raum, (b) Bearbeiten des Satzes Parameter in dem anderen Raum, um einen Satz Koeffizienten bereitzustellen und dann (c) Verwenden dieses Satzes von Koeffizienten, um einen Zählerterm bereitzustellen. In einem Ausführungsbeispiel der US-A-5 241 650 wird der Nennerterm in den Autokorrelationsbereich transfor­ miert. In diesem alternativen Bereich wird eine spektrale Glättungstechnik, die eine spektrale Bandbreiten- Erweiterungsfunktion nutzt, verwendet, um die Autokorrelati­ onssequenz der Filterkoeffizienten zu bearbeiten, bevor der Satz Koeffizienten für den Zählerterm über die Levison Rekur­ sion aus der bearbeiteten Autokorrelationssequenz berechnet wird.
US-A-5 241 650 beschreibt, wie der Zählerterm mit der gleichen Vorgehensweise alternativ direkt aus der Übertragungsfunktion des entsprechenden Erzeugungsfilters abgeleitet werden kann, anstatt vom Nennerterm des Kurzverzögerungs-Nachfilters. Da aber der Nennerterm sich von dem in dem Erzeugungsfilter ver­ wendeten Polynom nur durch den Chirpfaktor unterscheidet, ist die Wirkung die gleiche. Beide Fälle haben zur Folge, daß das Zählerpolynom eine spektral geglättete Version des Nennerpo­ lynoms Ap(z/α) ist.
Der in der US-A-5 241 650 beschriebene Kurzverzögerungs- Nachfilter wird im Personal Digital Cellular (PDC) Telekommu­ nikationssystem verwendet, wie im Telekommunications-Systems- RCR Standard, "RCR STD-2" des Research and Development Centre for Radio Systems (RCR) von Juni 1995 beschrieben. Er wird auch in den Telekommunikationssystemen verwendet, die dem IS-54 Standard entsprechen, wie in "Cellular System: Dual-Mode Mobile Station - Base Station Compatibility Standard IS-54" of the Electronic Industries Association (EIA), Dezember 1989 be­ schrieben.
Obwohl ein Kurzverzögerungs-Nachfilter die zeitveränderliche spektrale Neigung eines Kurzverzögerungs-Nachfilters gemäß US-A-4 969 192 verbessert, indem ein Nennerpolynom für die Kurz­ verzögerungs-Nachfilter-Übertragungsfunktion bereitgestellt welches eine spektral geglättete Version des Zählerpolynoms ist, bleibt das Problem bestehen, daß, da der Zählerterm in US-A-4 969 192 entweder von dem Nenner der gleichen Übertra­ gungsfunktion oder von der Übertragungsfunktion des entspre­ chenden Erzeugungsfilters abgeleitet ist, die spektrale Nei­ gung des nachgefilterten Hörsignals sich immer noch zu abrupt ändern kann, um eine wahrnehmbare Modulation in der Klarheit des nachgefilterten Signals zu entfernen.
Es ist daher Aufgabe der vorliegenden Erfindung, einen Kurz­ verzögerungs-Nachfilter bereitzustellen, der die wahrgenommene Qualität von kodierten oder dekodierten Hörsignalen verbes­ sert. Es ist weiter Aufgabe der Erfindung, ein entsprechendes Verfahren zum Nachfiltern von kodierten oder dekodierten Hörsig­ nalen mit einem Kurzverzögerungs-Nachfilter bereitzustellen dem­ zufolge die nachgefilterten Hörsignale sowohl eine verbesserte Signalklarheit als auch eine verminderte Modulation der Si­ gnalklarheit über der Zeit aufweisen.
Diese Aufgabe der Erfindung wird durch die Merkmale der An­ sprüche 1 und 16 gelöst. In einem Gesichtspunkt stellt die vorliegende Erfindung einen Kurzverzögerungs-Nachfilter bereit, um ein kodiertes oder dekodiertes Hörsignal mit der Übertragungs­ funktion F(z) der Form
F(z) = D(z)/E(z) [Gl. 4]
nachzufiltern, wobei E(z) und D(z) Polynome mit der Variablen z sind, wobei z das Inverse des Einheits-Verzögerungsoperators z-1 ist, welcher in der z-Transformationssdarstellung von Übertragungsfunktionen verwendet wird, und worin der Nenner E(z) der Übertragungsfunktionen H(z) des entsprechenden Erzeu­ gungsfilters des Hörsignals abgeleitet ist und der Zähler D(z) sich von dem Nenner E(z) unterscheidet und unter Verwendung eines längeren Zeitabschnitts, als der für den Nenner E(z), abgeleitet ist.
Die Funktionen E(z) und D(z) können Polynome sein. Weiter kön­ nen E(z) und D(z) durch Reflexionskoeffizienten, Linienspek­ tralfrequenzen, logarithmische Bereichsverhältnisse oder ähn­ liches repräsentiert sein.
Die Längen der jeweils zum Ableiten der Funktionen E(z) und D(z) verwendeten Zeitfenster können aus dem Hörsignal abgelei­ tet werden und E(z) und D(z) können auch von den erlaubten spektralen Fluktuationen des Ausgabesignals abhängen. Weiter können die Koeffizienten der Funktionen E(z) und D(z) feste Werte sein oder vom Sprachsignal abhängig gemacht werden, d. h. die Koeffizienten der Funktionen E(z) und D(z) können aus dem Hörsignal zu vorherbestimmten Zeitpunkten berechnet werden.
Weiter können die Koeffizienten des Zählers D(z) durch Filtern der Parameter des Erzeugungsfilter abgleitet werden. Zum Bei­ spiel können die Koeffizienten des Zählers D(z) berechnet wer­ den, durch Transformieren der Koeffizienten des Erzeugungsfil­ ters aus einem ersten Bereich in einen zweiten Bereich, durch Filtern der transformierten Koeffizienten in dem zweiten Be­ reich und durch Zurücktansformieren in den ersten Bereich.
In einem anderen Gesichtspunkt stellt die vorliegende Erfin­ dung ein Verfahren zum Nachfiltern eines kodierten oder deko­ dierten Hörsignals bereit, welches die Schritte umfaßt: bereitstellen ei­ nes kodierten oder dekodierten Hörsignals von einem Erzeu­ gungsfilter mit der Übertragungsfunktion H(z); Puffern des Hörsignals in Blöcke von Vektoren; Filtern der Vektoren mit einem Kurzverzögerungs-Nachfilter mit der Übertragungsfunktion F(z) in der Form:
F(z) = D(z)/E(z)
wobei E(z) und D(z) Polynome sind und worin das Nennerpolynom E(z) das gleiche Polynom wie in der Übertragungsfunktion H(z) des Erzeugungsfilter des Hörsignals ist und das Zählerpolynom D(z) ein Polynom ist, das sich von dem Nennerpolynom E(z) un­ terscheidet und unter Verwendung eines längeren Zeitabschnitts als der für das Nennerpolynom E(z) abgeleitet ist.
Die vorliegende Erfindung wird nun weiter mit Bezug auf die begleitende Fig. (Fig. 1) beschrieben, die schematisch eine An­ ordnung beschreibt, durch die ein kodiertes Hörsignal erzeugt und nachfolgend nachgefiltert wird.
Es ist ein Merkmal der vorliegenden Erfindung, in dem Zähler­ term ein Polynom zu verwenden, das sich von dem in dem Nenner­ term der Übertragungsfunktion eines Kurzverzögerungs- Nachfilters gemäß der vorliegenden Erfindung verwendeten Po­ lynom unterscheidet. Darüber hinaus wird das Polynom im Zäh­ lerterm dieser Übertragungsfunktion unter Verwendung eines längeren Zeitabschnitts als der Nennerterm abgeleitet, wobei schnelle Fluktuationen im spektralen Verlauf des nachgefilter­ ten Signals vermieden werden.
Es kann daher festgestellt werden, daß, da das Nennerpolynom E(z) der Übertragungsfunktion F(z) in einem Kurzverzögerungs- Nachfilter gemäß der vorliegenden Erfindung eng mit der Über­ tragungsfunktion H(z) des entsprechenden Erzeugungsfilter des gefilterten Hörsignals verwandt ist, der Nennerterm Formanten im Frequenzspektrum des Hörsignals verstärken wird, während Täler im Frequenzspektrum wie erwünscht gedämpft werden. Da jedoch das Zählerpolynom nicht länger direkt mit dem Nennerpo­ lynom verwandt ist, kann es so am besten gewählt werden, daß es eine im Hörsignal von dem Nennerterm eingeführte spektrale Neigung entfernt. Weiterhin, da das Nennerpolynom unter Ver­ wendung eines längeren Zeitabschnittes als das Zählerpolynom abgeleitet wurde, werden schnelle Fluktuationen der Klarheit des nachgefilterten Sprachsignals vermieden.
Der längere Zeitabschnitt des Nennerterms kann auf eine von mehreren Wegen erzielt werden. Falls der Nennerterm aus einem Puffer der nachzufilternden synthetischen Sprache abgeleitet wird, dann kann der längere Zeitabschnitt durch Verwendung ei­ nes relativ langen Puffers für den Zähler (relativ zu dem für den Nennerterm verwendeten Puffer) erzielt werden, oder durch einen Mittelungsprozeß über in dem Puffer für den Zähler ver­ wendeten Vektorblöcken. Da jedoch der Zählerterm nicht mit dem Nennerterm in der Übertragungsfunktion für den Kurzverzöge­ rungs-Nachfilter verwandt ist, besteht keine absolute Notwen­ digkeit nach der vorliegenden Erfindung, daß der Nennerterm von dem nachzufilternden Hörsignal abgeleitet werden muß.
Ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist es, den Nennerterm für Verwendung in der Übertragungsfunk­ tion mit einer linearen Prediktionskodierungs- (linear pre­ dictive coding, LPC) Analyse des nachzufilternden Hörsignals abzuleiten. Das Signal kann gefenstert sein. Alternativ kann die Kovarianz/Autokorrelations-Matrix des Signals gefenstert sein. Unter Verwendung von normalen Fenstern für LPC und dann von Filtern der Filter-Parameter. Viele Darstellungen der Pa­ rameter sind möglich.
Die gesamte Kurzverzögerungs-Nachfilter-Übertragungsfunktion kann auf eine ähnliche Weise wie vorherig beschrieben gechirpt sein, wobei ein Chirpfaktor α in den Nenner eingeführt wird und die Pole der Übertragungsfunktion in Richtung des Ursprun­ ges verschoben werden. In solch einem Fall hat die Übertra­ gungsfunktion die Form:
F(z) = D(z)/E(z/α) [Gl. 5]
wobei α in dem Intervall 0 < α < 1 liegt. Falls zusätzlich ein Chirpfaktor β im Zählerterm eingeführt wird, ergibt sich:
F(z) = D(z/β)/E(z/α) [Gl. 6]
da die Zähler- und Nennerpolynome nicht länger direkt mitein­ ander verwandt sind, können α und β nun identische Werte im Intervall 0 < α, β < 1 einnehmen, wobei ein genaues Entfernen durch den Zählerterm der durch den Nennerterm eingeführten spektralen Neigung erlaubt wird.
Es gibt keine Beschränkung dahingehend, daß eine Kurzverzöge­ rungs-Nachfilter gemäß der vorliegenden Erfindung nur auf ein nachzufilterndes Hörsignal angewendet werden sollte. Andere Darstellungen des Signals können anstatt gefiltert werden. Korrelationen zwischen kürzeren Datensegmenten können auch verwendet werden, indem das Filtern auf eine Reihe von kürze­ ren Datenblocks angewendet wird.
Ein Kurzverzögerungs-Nachfilter gemäß der vorliegenden Erfin­ dung kann mit einem Langverzögerungs-Nachfilter und/oder einem Hochfrequenz-Verstärkungsfilter in Kaskade verbunden werden, um eine vollständige Nachfilteranwendung zu schaffen. In sol­ chen Fällen sind die Übertragungsfunktion der Langverzöge­ rungs-Nachfilter und der Hochfrequenz-Verstärkungsfilter wie in den bekannten Anwendungen berechnet. Das bedeutet, daß die Übertragungsfunktion Q(z) für den Langverzögerungs-Nachfilter z. B. die Form
Q(z) = Cg (1 + gz-p)/(1 - 1z-p) [GL. 7]
haben kann, wobei z die gleiche Bedeutung hat wie zuvor, der Wert von p durch eine Tonhöhenanalyse des Hörsignals bestimmt wird, Cg ein adaptiver Skalierungsfaktor ist, und die Koeffi­ zienten gemäß der folgenden Formeln bestimmt werden:
g = Czf(X) [Gl. 8a]
1 = Cpf(X) [Gl. 8b]
wobei Cz und Cp feste Skalierungsfaktoren in dem Intervall 0 < Cz, Cp < 1 sind und wo:
1 falls x < 1
f(x) = x falls Uth x 1 [Gl. 9]
0 falls x < Uth
wobei Uth ein Nichtsprech-Schwellwert und x ein Sprachanzeige­ Parameter ist, der von dem im Langverzögerungs-Nachfilter ver­ wendeten Tonhöhenvorhersagefaktor abhängt.
Der Hochfrequenz-Verstärkungsfilter für eine Verbindung mit dem Kurzverzögerungs-Nachfilter der vorliegenden Erfindung kann, z. B. ein Filter erster Ordnung sein, mit einer Übertra­ gungsfunktion R(z) in der Form:
R(z) = 1 - u z -1 [Gl. 10]
wobei u ein empirisch bestimmter Parameter im Intervall 0 < u < 1 ist und typischerweise Werte von 0,2 bis 0,5 annimmt.
Somit kann ein Kurzverzögerungs-Nachfilter gemäß der vorlie­ genden Erfindung, falls in Verwendung mit einem Langverzöge­ rungs-Nachfilter und/oder Hochfrequenz-Verstärkungs- Nachfilter verwendet, in einem kombinierten Nachfilter für ei­ ne optimale Verbesserung der empfundenen Qualität eines ko­ dierten oder unkodierten Hörsignals verwendet werden.

Claims (31)

1. Ein Kurzverzögerungs-Nachfilter (13), um ein kodiertes oder dekodiertes Hörsignal, speziell ein Sprachsignal, nachzufiltern, wobei der Kurzverzögerungs-Nachfilter eine Übertragungsfunktion F(z) der Form F(z) = D(z)/E(z)hat, wobei E(z) und D(z) Polynome sind, die von der Va­ riablen z abhängen, wobei z das Inverse des Einheits- Verzögerungsoperators z-1 ist, welcher in der z-Transformationsdarstellung von Übertragungsfunktionen verwendet wird, und worin:
  • - der Nenner E(z) von der Übertragungsfunktion H(z) des entsprechenden Erzeugungsfilters (12) des Hörsi­ gnals abgeleitet ist; und
  • - der Zähler D(z) sich von dem Nenner E(z) unterschei­ det und unter Verwendung eines längeren Zeitab­ schnitts als für den Nenner E(z) vom Hörsignal oder vom Erzeugungsfilter abgeleitet ist.
2. Ein Kurzverzögerungs-Nachfilter nach Anspruch 1, worin der Zähler D(z) von einem Puffer des Hörsignals abgelei­ tet ist.
3. Ein Kurzverzögerungs-Nachfilter nach Anspruch 2, worin der Zähler D(z) von dem Puffer mit Hilfe einer linearen Prediktionskodierungs- (linear predictive coding, LPC) Analyse abgeleitet ist.
4. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin die Koeffizienten der Funktionen E(z) und D(z) aus dem Hörsignal zu vorbestimmten Zeit­ punkten berechnet werden.
5. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin Reflexionskoeffizienten zur Dar­ stellung von E(z) und/oder D(z) verwendet werden.
6. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin Linienspektralfrequenzen zur Dar­ stellung von E(z) und/oder D(z) verwendet werden.
7. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin logarithmische Bereichsverhält­ nisse zur Darstellung von E(z) und/oder D(z) verwendet werden.
8. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin die Koeffizienten des Zählers D(z) durch Filtern der Koeffizienten des Erzeugungsfil­ ters abgeleitet werden.
9. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin die Koeffizienten des Zählers D(z) durch Transformieren der Koeffizienten des Erzeu­ gungsfilters aus einem ersten Bereich in einen zweiten Bereich, durch Filtern der transformierten Koeffizienten in dem zweiten Bereich und durch Rücktransformieren zu­ rück in den ersten Bereich erhalten werden.
10. Ein Kurzverzögerungs-Nachfilter nach Anspruch 9, worin D(z) in kleinen Abschnitten berechnet wird und danach ge­ filtert wird.
11. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin das Hörsignal gefenstert wird.
12. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin eine Covari­ anz/Autokorrelationsmatrix des Signals gefenstert wird.
13. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge­ henden Ansprüche, worin die Übertragungsfunktion F(z) des Kurzverzögerungs-Nachfilters die Form F(z) = D(z)/E(z/α)hat, wobei α ein Parameter im Intervall 0 < α < 1 ist und worin die Übertragungsfunktion F(z) durch Verschieben der Pole der Übertragungsfunktion in Richtung des Ursprungs gechirpt ist.
14. Ein Kurzverzögerungs-Nachfilter nach Anspruch 13, worin die Übertragungsfunktion F(z) des Kurzverzögerungs- Nachfilters die Form F(z) = D(z/β) / E(z/α)hat, wobei α und β Parameter im Intervall 0 < α,β < 1 sind und worin die Übertragungsfunktion F(z) durch Ver­ schieben der Nullstellen der Übertragungsfunktion in Richtung des Ursprungs gechirpt ist.
15. Ein Nachfilter, um ein kodiertes oder dekodiertes Hörsi­ gnal, speziell ein Sprachsignal, nachzufiltern, der einen Kurzverzögerungs-Nachfilter nach einem der vorhergehenden Ansprüche in Serie mit einem Langverzögerungs-Nachfilter und/oder einem Hochfrequenz-Verstärkungsfilter umfaßt.
16. Ein Verfahren zum Nachfiltern eines kodierten oder unko­ dierten Hörsignals, speziell eines Sprachsignals, umfas­ send:
  • - Bereitstellen eines kodierten oder unkodierten Hör­ signals von einem Erzeugungsfilter mit einer Über­ tragungsfunktion H(z), wobei z das Inverse des Ein­ heits-Verzögerungsoperators z-1 ist, welcher in der z-Transformationsdarstellung von Übertragungsfunk­ tionen verwendet wird;
  • - Puffern der Hörsignale in Vektorblöcke;
  • - Filtern der Vektoren mit einem Kurzverzögerungs- Nachfilter mit der Übertragungsfunktion F(z) in der Form: F(z) = D(z)/E(z)wobei E(z) und D(z) Polynome mit der Variablen z sind,
und worin:
  • - der Nenner E(z) der Übertragungsfunktionen H(z) des entsprechenden Erzeugungsfilters (12) des Hörsignals abgeleitet ist; und
  • - der Zähler D(z) sich von dem Nenner E(z) unterschei­ det und unter Verwendung eines längeren Zeitab­ schnitts als für den Nenner E(z) vom Hörsignal oder vom Erzeugungsfilter abgeleitet ist.
17. Ein Verfahren zum Nachfiltern eines Hörsignals nach An­ spruch 16, wobei die Koeffizienten der Funktionen E(z) und D(z) aus dem Hörsignal zu vorbestimmten Zeitpunkten berechnet werden.
18. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 17, wobei Reflexionskoeffizienten zur Darstellung von E(z) und/oder D(z) verwendet werden.
19. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 18, wobei Linienspektralfrequenzen zur Darstellung von E(z) und/oder D(z) verwendet werden.
20. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 19, wobei logarithmische Bereichs­ verhältnisse zur Darstellung von E(z) und/oder D(z) ver­ wendet werden.
21. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 20, wobei die Koeffizienten des Zäh­ lers D(z) durch Filtern der Koeffizienten des Erzeugungs­ filters abgeleitet werden.
22. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 21, wobei die Koeffizienten des Zäh­ lers D(z) durch Transformieren der Koeffizienten des Er­ zeugungsfilters aus einem ersten Bereich in einen zweiten Bereich, durch Filtern der transformierten Koeffizienten in dem zweiten Bereich und durch Rücktransformieren zu­ rück in den ersten Bereich erhalten werden.
23. Ein Verfahren zum Nachfiltern eines Hörsignals nach An­ spruch 22, wobei D(z) in kleinen Abschnitten berechnet wird und danach gefiltert wird.
24. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 23, wobei der Zähler D(z) von einem Puffer des Hörsignals abgeleitet ist.
25. Ein Verfahren zum Nachfiltern eines Hörsignals nach An­ spruch 24, worin der Zähler D(z) von dem Puffer mit Hilfe einer linearen Prediktionskodierungs- (linear predictive coding, LPC) Analyse abgeleitet ist.
26. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 25, wobei das Hörsignal gefenstert wird.
27. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 26, wobei eine Covari­ anz/Autokorrelationsmatrix des Signals gefenstert wird.
28. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem der Ansprüche 16 bis 27, wobei die Übertragungsfunktion F(z) des Kurzverzögerungs-Nachfilters mit einem Chirpfak­ tor α versehen wird, so daß die Übertragungsfunktion die Form F(z) = D(z) / E(z/α)hat, wobei α ein Parameter im Intervall 0 < α < 1 ist; und worin die Übertragungsfunktion durch Verschieben der Pole der Übertragungsfunktion in Richtung des Ursprungs gechirpt wird.
29. Ein Verfahren zum Nachfiltern eines Hörsignals nach An­ spruch 28, wobei der Zähler der Übertragungsfunktion mit einem Chirpfaktor β versehen wird, so daß die Übertra­ gungsfunktion F(z) des Kurzverzögerungs-Nachfilters die Form F(z) = D(z/β)/E(z/α)hat, wobei α und β Parameter im Intervall 0 < α,β < 1 sind und worin die Übertragungsfunktion F(z) durch Ver­ schieben der Nullstellen der Übertragungsfunktion in Richtung des Ursprungs gechirpt wird.
30. Ein Verfahren zum Nachfiltern eines Hörsignals nach einer der Ansprüche 16 bis 29, wobei das Hörsignal zusätzlich mit einem Langverzögerungs-Nachfilter und/oder einem Hochfrequenz-Verstärkungsfilter gefiltert wird.
DE19643900A 1996-10-30 1996-10-30 Nachfiltern von Hörsignalen, speziell von Sprachsignalen Expired - Fee Related DE19643900C1 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE19643900A DE19643900C1 (de) 1996-10-30 1996-10-30 Nachfiltern von Hörsignalen, speziell von Sprachsignalen
US08/953,919 US6058360A (en) 1996-10-30 1997-10-20 Postfiltering audio signals especially speech signals
PCT/EP1997/005963 WO1998019298A1 (en) 1996-10-30 1997-10-29 Postfiltering audio signals, especially speech signals
AU53143/98A AU5314398A (en) 1996-10-30 1997-10-29 Postfiltering audio signals, especially speech signals
JP52004798A JP2001509277A (ja) 1996-10-30 1997-10-29 オーディオ信号特にスピーチ信号のポストフィルタリング

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19643900A DE19643900C1 (de) 1996-10-30 1996-10-30 Nachfiltern von Hörsignalen, speziell von Sprachsignalen

Publications (1)

Publication Number Publication Date
DE19643900C1 true DE19643900C1 (de) 1998-02-12

Family

ID=7809665

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19643900A Expired - Fee Related DE19643900C1 (de) 1996-10-30 1996-10-30 Nachfiltern von Hörsignalen, speziell von Sprachsignalen

Country Status (5)

Country Link
US (1) US6058360A (de)
JP (1) JP2001509277A (de)
AU (1) AU5314398A (de)
DE (1) DE19643900C1 (de)
WO (1) WO1998019298A1 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030070177A (ko) * 2002-02-21 2003-08-29 엘지전자 주식회사 원시 디지털 데이터의 잡음 필터링 방법
JP5164970B2 (ja) * 2007-03-02 2013-03-21 パナソニック株式会社 音声復号装置および音声復号方法
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
EP2980799A1 (de) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Verarbeitung eines Audiosignals mit Verwendung einer harmonischen Nachfilterung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5241650A (en) * 1989-10-17 1993-08-31 Motorola, Inc. Digital speech decoder having a postfilter with reduced spectral distortion

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB188820A (en) * 1921-08-27 1922-11-23 Charles Wilson Mcdowall Improvements in or in connection with switch fuses
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4381561A (en) * 1980-10-23 1983-04-26 International Telephone And Telegraph Corporation All digital LSI line circuit for analog lines
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
US4475227A (en) * 1982-04-14 1984-10-02 At&T Bell Laboratories Adaptive prediction
JPS60124153U (ja) * 1984-01-31 1985-08-21 パイオニア株式会社 デ−タ信号読取り装置
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4726037A (en) * 1986-03-26 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Predictive communication system filtering arrangement
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US4852169A (en) * 1986-12-16 1989-07-25 GTE Laboratories, Incorporation Method for enhancing the quality of coded speech
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
WO1991006093A1 (en) * 1989-10-17 1991-05-02 Motorola, Inc. Digital speech decoder having a postfilter with reduced spectral distortion
US5694519A (en) * 1992-02-18 1997-12-02 Lucent Technologies, Inc. Tunable post-filter for tandem coders

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US5241650A (en) * 1989-10-17 1993-08-31 Motorola, Inc. Digital speech decoder having a postfilter with reduced spectral distortion

Also Published As

Publication number Publication date
AU5314398A (en) 1998-05-22
WO1998019298A1 (en) 1998-05-07
US6058360A (en) 2000-05-02
JP2001509277A (ja) 2001-07-10

Similar Documents

Publication Publication Date Title
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE4135070C1 (de)
DE19604273C5 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
EP1388147B1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
EP0290581A1 (de) Verfahren zum übertragen digitalisierter tonsignale.
DE10200653B4 (de) Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
DE60118631T2 (de) Verfahren zum ersetzen verfälschter audiodaten
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE19715126C2 (de) Sprachsignal-Codiervorrichtung
EP0414838A1 (de) Verfahren zur übertragung eines signals.
EP1258865A2 (de) Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
DE60124079T2 (de) Sprachverarbeitung
DE19643900C1 (de) Nachfiltern von Hörsignalen, speziell von Sprachsignalen
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
WO2005078705A1 (de) Audiocodierung
DE4494736C2 (de) Verfahren zur Spektralanalyse eines Eingangssignals sowie Spektral-Analysator zum Ausführen einer Spektralanalyse
DE4343366C2 (de) Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
DE2941452C2 (de) Verfahren zur Codierung von Analogsignalen
WO1993021694A1 (de) Verfahren zum übertragen und/oder speichern digitalisierter, datenreduzierter audiosignale
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE2904426A1 (de) Analog-sprach-codierer und decodierer

Legal Events

Date Code Title Description
8100 Publication of the examined application without publication of unexamined application
D1 Grant (no unexamined application published) patent law 81
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G10L0009000000

Ipc: G10L0019070000