DE19643900C1 - Nachfiltern von Hörsignalen, speziell von Sprachsignalen - Google Patents
Nachfiltern von Hörsignalen, speziell von SprachsignalenInfo
- Publication number
- DE19643900C1 DE19643900C1 DE19643900A DE19643900A DE19643900C1 DE 19643900 C1 DE19643900 C1 DE 19643900C1 DE 19643900 A DE19643900 A DE 19643900A DE 19643900 A DE19643900 A DE 19643900A DE 19643900 C1 DE19643900 C1 DE 19643900C1
- Authority
- DE
- Germany
- Prior art keywords
- post
- filter
- audio signal
- filtering
- short delay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Description
Diese Erfindung betrifft Nachfilter, um Hörsignale, speziell
Sprachsignale, nachzufiltern und betrifft ein Verfahren, um
diese Signale nachzufiltern. Spezieller betrifft die Erfindung
Kurzverzögerungs-Nachfilter, um Hörsignale, speziell Sprachsi
gnale, nachzufiltern, und Verfahren zum Nachfiltern dieser Si
gnale mit einem Kurzverzögerungs-Nachfilter.
Nachfilter werden gewöhnlich verwendet, um Rauschen in Sprach
signalen durch Verstärken von starken Spektralanteilen
und/oder durch unterdrücken von schwachen Bereichen des Si
gnals zu unterdrücken. Z.B kann solches Rauschen dort entste
hen, wo analoge Sprachsignale für ein Kodieren in eine digita
le Darstellung abgetastet werden, wie es vor einer Übertragung
von Sprachsignalen in einem mobilen Telekommunikationssystem
vorkommen kann oder während eines nachfolgenden Dekodierens
eines vorhergehend kodierten Signals. Sehr oft wird solches
Kodieren oder Dekodieren auch die Kompression der Signaldaten
während des Kodiervorgangs mit nachfolgender Dekompression
während des passenden Dekodierens einschließen. Der Verlust
eines Teils der in dem ursprünglichen analogen Hörsignal ent
haltenen Information ist daher im Falle von Kompression und
Dekompression unvermeidlich und die Anwendung eines Nachfil
ters zur Verbesserung der empfundenen Qualität der dekodierten
Signale ist wünschenswert. Ein Nachfilter kann auf das kodier
te Hörsignal, auf das dekodierte Hörsignal oder auf beide an
gewendet werden, um diese Verbesserung zu erzielen.
Drei Haupttypen von Nachfiltern können unterschieden werden.
Diese sind jeweils bekannt als: Kurzverzögerungs- (oder Kurz
zeitraum) Nachfilter, Langverzögerungs- (oder Langzeitraum)
Nachfilter oder Hochfrequenzverstärkungs- (oder Hochpaß) Nach
filter. Kurzverzögerungs-Nachfilter verstärken allgemein Be
reiche des Frequenzspektrums eines Hörsignals mit viel Ener
gie, um eine Verzerrung in den Tälern des Frequenzspektrums zu
verhindern. Langverzögerungs-Nachfilter verstärken gewöhnlich
Bereiche des Frequenzspektrums, die eine Langzeitperiodizität
gemäß der Tonhöhe oder der Hörfrequenz des ursprünglichen Si
gnals zeigen. Hochfrequenzverstärkungs-Nachfilter werden ver
wendet, um Hochfrequenzbereiche eines Signalfrequenzspektrums
zu verstärken, und somit die Klarheit des Signals wiederherzu
stellen, da Niedrigfrequenzbereiche im Vergleich zu Hochfre
quenzbereichen während des Kodierens und Dekodierens allgemein
stärker verstärkt werden. Ein Hochfrequenzverstärkungs-
Nachfilter kann auch verwendet werden, um durch die Anwendung
eines Kurzverzögerungs-Nachfilters erzeugte Hochfrequenzverlu
ste zu kompensieren. Die drei eben beschriebenen Typen von
Nachfiltern können einzeln auf die Hörsignale angewendet wer
den, oder in einer Kombination von zwei der drei der Typen von
Nachfiltern oder in einer Kombination von allen drei Typen zu
sammen, um die empfundene Qualität des Hörsignals optimal zu
verbessern.
Wie oben erwähnt, betrifft die vorliegende Erfindung haupt
sächlich Kurzverzögerungs-Nachfilter und Verfahren zum Nach
filtern von Hörsignalen, speziell von Sprachsignalen, mit
Kurzverzögerungs-Nachfiltern. Die Auswirkungen eines Kurzver
zögerungs-Nachfilters auf ein Hörsignal kann durch eine Über
tragungsfunktion P(z) dargestellt werden, die mit Filterkoef
fizienten und der Variablen z ausgedrückt wird, wobei z das In
verse des Einheits-Verzögerungsoperators z-1 ist, welcher in
der z-Transformations-Darstellung von Übertragungsfunktionen
verwendet wird. Weiterhin kann ein Erzeugungsfilter zum Erzeu
gen von kodierten Hörsignalen durch eine Übertragungsfunktion
H(z) dargestellt werden, ebenfalls ausgedrückt durch Filter
koeffizienten und die Variable z. Wie in der beigefügten Figur
(Fig.) gezeigt, wird zum Erzeugen eines kodierten Hörsignals
ein Erregungsgenerator 11 verwendet, um ein Erregungssignal
G(z) an einen Erzeugungsfilter 12 zu liefern. Der Erzeugungs
filter 12 formt das Erregungssignal G(z) in ein synthetisches
Hörsignal S(z) gemäß der Übertragungsfunktion H(z) des Erzeu
gungsfilters um. Wie auch in der Figur gezeigt, kann das so
hergestellte Hörsignal S(z) nachfolgend entweder sofort, oder
nach einer Übertragung und Dekodierung, zu einem Nachfilter 12
geführt werden, der das synthetische Hörsignal S(z) gemäß der
Übertragungsfunktion P(z) des Nachfilters umformt, um ein
nachgefiltertes Hörsignal Sp(z) zu erzeugen.
Die Übertragungsfunktion H(z) des Erzeugungsfilters 12 ist oft
vom Typ
H(z) = 1/A(z) [Gl. 1]
wobei A(z) ein Polynom ist, das als
ausgedrückt werden kann, wobei m ein Index von 1 bis Ma, der
Ordnung des Polynoms, ist und am die Koeffizienten des Po
lynoms sind und z die Variable ist, wie vorher. Ma, die Ord
nung des Polynoms, ist typischerweise zwischen 8 und 10.
US-A-4 969 192 von Voicecraft, Inc., Goleta, California, USA
beschreibt die Verwendung genau des gleichen Polynoms A(z) aus
Gl. 2, das im Erzeugungsfilter 12 verwendet wird, um den Nen
ner und den Zähler einer Übertragungsfunktion P(z) für den
Kurzverzögerungs-Nachfilter 13 zu versehen. Demzufolge ver
stärkt der Nennerterm einer solchen Übertragungsfunktion die
Formanten des Frequenzspektrum des synthetischen Hörsignals
S(z), das durch den Erzeugungsfilter versehen wird, während
die Täler des Frequenzspektrums wie gewünscht gedämpft werden.
Da der Zählerterm die gleiche Form wie der Nennerterm hat,
zielt der Zählerterm einer solchen Kurzverzögerungs-
Übertragungsfunktion darauf, die Gesamtform des von dem Nen
nerterm resultierenden Frequenzspektrums zu entfernen.
In der US-A-4 969 192 sind der Nenner- und Zählerterm der
Kurzverzögerungs-Übertragungsfunktion P(z) von dem Polynom
A(z) der entsprechenden Erzeugungsfilter-Übertragungsfunktion
durch jeweilige Chirpfaktoren verschieden, die empirisch be
stimmte Parameter α und β sind, womit:
P(z) = Ap(z/β)/Ap(z/α) [Gl. 3]
wobei α und β durch 0 < β < α < 1 definiert sind. Diese Chir
pfaktoren α und β können demnach verwendet werden, um die Pole
und Nullstellen der Übertragungsfunktion aus Gl. 3 in Richtung
des Ursprungs zu verschieben. Durch Setzen von α oder β = 1
wird der Nenner- bzw. Zählerterm identisch mit A(z) während
das Setzen von α = 0 einen Allpaßfilter zur Folge hat. Die
Kurzverzögerungs-Übertragungsfunktion in Gl. 3 stellt einen
Kompromiß dar, zwischen spektralen Spitzen, die so scharf
sind, daß sie einfach wahrnehmbares und damit unerwünschtes
Chirpen erzeugen, und so niedrig sind, daß sie keine Verminde
rung des Rauschens erzielen. US-A-4 969 192 schlägt daher die
Verwendung von Werten für α und β von α = 0.8 und β = 0.5 vor,
um einen Kompromiß zwischen diesen beiden Extremen zu erzie
len, wobei ein durch den Nennerterm eingeführtes spektrales
Neigen durch den Zählerterm partiell ausgeglichen wird. Die
sich aus der Übertragungsfunktion aus Gl. 3 ergebenden gefil
terten Hörsignale bleiben jedoch gedämpft und benötigen einen
Hochfrequenz-Verstärkungsfilter, um die durch einen Kurzverzö
gerungs-Nachfilter mit einer solchen Übertragungsfunktion ein
geführten Hochfrequenzverluste zu kompensieren. Da das Zähler
polynom aus Gl. 3 dem Nennerpolymon nicht präzise nachfolgt,
wandert darüber hinaus die gesamte spektrale Neigung des Kurz
verzögerungs-Nachfilters mit der Zeit, wobei eine wahrnehmbare
Veränderung der Klarheit des nachgefilterten Signals wahrnehm
bar ist.
US-A-5 241 650, zugeordnet Motorola Inc., aus Schaumberg, Il
linois, versucht die in Gl. 3 dargestellte Kurzverzögerungs-
Nachfilter-Übertragungsfunktion aus US-A-4 969 192 zu verbes
sern. Die in US-A-5 241 650 beschriebene Kurzverzögerungs-
Nachfilter-Übertragungsfunktion verwendet den gleichen Nenner
term wie die Übertragungsfunktion des entsprechenden Erzeu
gungsfilters, jedoch ist im Gegensatz zu der US-A-4 969 192
der Zählerterm von dem Nennerterm abgeleitet durch: (a) Trans
formieren des Nennerterms in einen Satz Parameter in einen an
deren Raum, (b) Bearbeiten des Satzes Parameter in dem anderen
Raum, um einen Satz Koeffizienten bereitzustellen und dann (c)
Verwenden dieses Satzes von Koeffizienten, um einen Zählerterm
bereitzustellen. In einem Ausführungsbeispiel der US-A-5 241 650
wird der Nennerterm in den Autokorrelationsbereich transfor
miert. In diesem alternativen Bereich wird eine spektrale
Glättungstechnik, die eine spektrale Bandbreiten-
Erweiterungsfunktion nutzt, verwendet, um die Autokorrelati
onssequenz der Filterkoeffizienten zu bearbeiten, bevor der
Satz Koeffizienten für den Zählerterm über die Levison Rekur
sion aus der bearbeiteten Autokorrelationssequenz berechnet
wird.
US-A-5 241 650 beschreibt, wie der Zählerterm mit der gleichen
Vorgehensweise alternativ direkt aus der Übertragungsfunktion
des entsprechenden Erzeugungsfilters abgeleitet werden kann,
anstatt vom Nennerterm des Kurzverzögerungs-Nachfilters. Da
aber der Nennerterm sich von dem in dem Erzeugungsfilter ver
wendeten Polynom nur durch den Chirpfaktor unterscheidet, ist
die Wirkung die gleiche. Beide Fälle haben zur Folge, daß das
Zählerpolynom eine spektral geglättete Version des Nennerpo
lynoms Ap(z/α) ist.
Der in der US-A-5 241 650 beschriebene Kurzverzögerungs-
Nachfilter wird im Personal Digital Cellular (PDC) Telekommu
nikationssystem verwendet, wie im Telekommunications-Systems-
RCR Standard, "RCR STD-2" des Research and Development Centre
for Radio Systems (RCR) von Juni 1995 beschrieben. Er wird
auch in den Telekommunikationssystemen verwendet, die dem
IS-54 Standard entsprechen, wie in "Cellular System: Dual-Mode
Mobile Station - Base Station Compatibility Standard IS-54" of
the Electronic Industries Association (EIA), Dezember 1989 be
schrieben.
Obwohl ein Kurzverzögerungs-Nachfilter die zeitveränderliche
spektrale Neigung eines Kurzverzögerungs-Nachfilters gemäß
US-A-4 969 192 verbessert, indem ein Nennerpolynom für die Kurz
verzögerungs-Nachfilter-Übertragungsfunktion bereitgestellt
welches eine spektral geglättete Version des Zählerpolynoms
ist, bleibt das Problem bestehen, daß, da der Zählerterm in
US-A-4 969 192 entweder von dem Nenner der gleichen Übertra
gungsfunktion oder von der Übertragungsfunktion des entspre
chenden Erzeugungsfilters abgeleitet ist, die spektrale Nei
gung des nachgefilterten Hörsignals sich immer noch zu abrupt
ändern kann, um eine wahrnehmbare Modulation in der Klarheit
des nachgefilterten Signals zu entfernen.
Es ist daher Aufgabe der vorliegenden Erfindung, einen Kurz
verzögerungs-Nachfilter bereitzustellen, der die wahrgenommene
Qualität von kodierten oder dekodierten Hörsignalen verbes
sert. Es ist weiter Aufgabe der Erfindung, ein entsprechendes
Verfahren zum Nachfiltern von kodierten oder dekodierten Hörsig
nalen mit einem Kurzverzögerungs-Nachfilter bereitzustellen dem
zufolge die nachgefilterten Hörsignale sowohl eine verbesserte
Signalklarheit als auch eine verminderte Modulation der Si
gnalklarheit über der Zeit aufweisen.
Diese Aufgabe der Erfindung wird durch die Merkmale der An
sprüche 1 und 16 gelöst. In einem Gesichtspunkt stellt die
vorliegende Erfindung einen Kurzverzögerungs-Nachfilter bereit, um
ein kodiertes oder dekodiertes Hörsignal mit der Übertragungs
funktion F(z) der Form
F(z) = D(z)/E(z) [Gl. 4]
nachzufiltern, wobei E(z) und D(z) Polynome mit der Variablen
z sind, wobei z das Inverse des Einheits-Verzögerungsoperators
z-1 ist, welcher in der z-Transformationssdarstellung von
Übertragungsfunktionen verwendet wird, und worin der Nenner
E(z) der Übertragungsfunktionen H(z) des entsprechenden Erzeu
gungsfilters des Hörsignals abgeleitet ist und der Zähler D(z)
sich von dem Nenner E(z) unterscheidet und unter Verwendung
eines längeren Zeitabschnitts, als der für den Nenner E(z),
abgeleitet ist.
Die Funktionen E(z) und D(z) können Polynome sein. Weiter kön
nen E(z) und D(z) durch Reflexionskoeffizienten, Linienspek
tralfrequenzen, logarithmische Bereichsverhältnisse oder ähn
liches repräsentiert sein.
Die Längen der jeweils zum Ableiten der Funktionen E(z) und
D(z) verwendeten Zeitfenster können aus dem Hörsignal abgelei
tet werden und E(z) und D(z) können auch von den erlaubten
spektralen Fluktuationen des Ausgabesignals abhängen. Weiter
können die Koeffizienten der Funktionen E(z) und D(z) feste
Werte sein oder vom Sprachsignal abhängig gemacht werden, d. h.
die Koeffizienten der Funktionen E(z) und D(z) können aus dem
Hörsignal zu vorherbestimmten Zeitpunkten berechnet werden.
Weiter können die Koeffizienten des Zählers D(z) durch Filtern
der Parameter des Erzeugungsfilter abgleitet werden. Zum Bei
spiel können die Koeffizienten des Zählers D(z) berechnet wer
den, durch Transformieren der Koeffizienten des Erzeugungsfil
ters aus einem ersten Bereich in einen zweiten Bereich, durch
Filtern der transformierten Koeffizienten in dem zweiten Be
reich und durch Zurücktansformieren in den ersten Bereich.
In einem anderen Gesichtspunkt stellt die vorliegende Erfin
dung ein Verfahren zum Nachfiltern eines kodierten oder deko
dierten Hörsignals bereit, welches die Schritte umfaßt: bereitstellen ei
nes kodierten oder dekodierten Hörsignals von einem Erzeu
gungsfilter mit der Übertragungsfunktion H(z); Puffern des
Hörsignals in Blöcke von Vektoren; Filtern der Vektoren mit
einem Kurzverzögerungs-Nachfilter mit der Übertragungsfunktion
F(z) in der Form:
F(z) = D(z)/E(z)
wobei E(z) und D(z) Polynome sind und worin das Nennerpolynom
E(z) das gleiche Polynom wie in der Übertragungsfunktion H(z)
des Erzeugungsfilter des Hörsignals ist und das Zählerpolynom
D(z) ein Polynom ist, das sich von dem Nennerpolynom E(z) un
terscheidet und unter Verwendung eines längeren Zeitabschnitts
als der für das Nennerpolynom E(z) abgeleitet ist.
Die vorliegende Erfindung wird nun weiter mit Bezug auf die
begleitende Fig. (Fig. 1) beschrieben, die schematisch eine An
ordnung beschreibt, durch die ein kodiertes Hörsignal erzeugt
und nachfolgend nachgefiltert wird.
Es ist ein Merkmal der vorliegenden Erfindung, in dem Zähler
term ein Polynom zu verwenden, das sich von dem in dem Nenner
term der Übertragungsfunktion eines Kurzverzögerungs-
Nachfilters gemäß der vorliegenden Erfindung verwendeten Po
lynom unterscheidet. Darüber hinaus wird das Polynom im Zäh
lerterm dieser Übertragungsfunktion unter Verwendung eines
längeren Zeitabschnitts als der Nennerterm abgeleitet, wobei
schnelle Fluktuationen im spektralen Verlauf des nachgefilter
ten Signals vermieden werden.
Es kann daher festgestellt werden, daß, da das Nennerpolynom
E(z) der Übertragungsfunktion F(z) in einem Kurzverzögerungs-
Nachfilter gemäß der vorliegenden Erfindung eng mit der Über
tragungsfunktion H(z) des entsprechenden Erzeugungsfilter des
gefilterten Hörsignals verwandt ist, der Nennerterm Formanten
im Frequenzspektrum des Hörsignals verstärken wird, während
Täler im Frequenzspektrum wie erwünscht gedämpft werden. Da
jedoch das Zählerpolynom nicht länger direkt mit dem Nennerpo
lynom verwandt ist, kann es so am besten gewählt werden, daß
es eine im Hörsignal von dem Nennerterm eingeführte spektrale
Neigung entfernt. Weiterhin, da das Nennerpolynom unter Ver
wendung eines längeren Zeitabschnittes als das Zählerpolynom
abgeleitet wurde, werden schnelle Fluktuationen der Klarheit
des nachgefilterten Sprachsignals vermieden.
Der längere Zeitabschnitt des Nennerterms kann auf eine von
mehreren Wegen erzielt werden. Falls der Nennerterm aus einem
Puffer der nachzufilternden synthetischen Sprache abgeleitet
wird, dann kann der längere Zeitabschnitt durch Verwendung ei
nes relativ langen Puffers für den Zähler (relativ zu dem für
den Nennerterm verwendeten Puffer) erzielt werden, oder durch
einen Mittelungsprozeß über in dem Puffer für den Zähler ver
wendeten Vektorblöcken. Da jedoch der Zählerterm nicht mit dem
Nennerterm in der Übertragungsfunktion für den Kurzverzöge
rungs-Nachfilter verwandt ist, besteht keine absolute Notwen
digkeit nach der vorliegenden Erfindung, daß der Nennerterm
von dem nachzufilternden Hörsignal abgeleitet werden muß.
Ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung
ist es, den Nennerterm für Verwendung in der Übertragungsfunk
tion mit einer linearen Prediktionskodierungs- (linear pre
dictive coding, LPC) Analyse des nachzufilternden Hörsignals
abzuleiten. Das Signal kann gefenstert sein. Alternativ kann
die Kovarianz/Autokorrelations-Matrix des Signals gefenstert
sein. Unter Verwendung von normalen Fenstern für LPC und dann
von Filtern der Filter-Parameter. Viele Darstellungen der Pa
rameter sind möglich.
Die gesamte Kurzverzögerungs-Nachfilter-Übertragungsfunktion
kann auf eine ähnliche Weise wie vorherig beschrieben gechirpt
sein, wobei ein Chirpfaktor α in den Nenner eingeführt wird
und die Pole der Übertragungsfunktion in Richtung des Ursprun
ges verschoben werden. In solch einem Fall hat die Übertra
gungsfunktion die Form:
F(z) = D(z)/E(z/α) [Gl. 5]
wobei α in dem Intervall 0 < α < 1 liegt. Falls zusätzlich ein
Chirpfaktor β im Zählerterm eingeführt wird, ergibt sich:
F(z) = D(z/β)/E(z/α) [Gl. 6]
da die Zähler- und Nennerpolynome nicht länger direkt mitein
ander verwandt sind, können α und β nun identische Werte im
Intervall 0 < α, β < 1 einnehmen, wobei ein genaues Entfernen
durch den Zählerterm der durch den Nennerterm eingeführten
spektralen Neigung erlaubt wird.
Es gibt keine Beschränkung dahingehend, daß eine Kurzverzöge
rungs-Nachfilter gemäß der vorliegenden Erfindung nur auf ein
nachzufilterndes Hörsignal angewendet werden sollte. Andere
Darstellungen des Signals können anstatt gefiltert werden.
Korrelationen zwischen kürzeren Datensegmenten können auch
verwendet werden, indem das Filtern auf eine Reihe von kürze
ren Datenblocks angewendet wird.
Ein Kurzverzögerungs-Nachfilter gemäß der vorliegenden Erfin
dung kann mit einem Langverzögerungs-Nachfilter und/oder einem
Hochfrequenz-Verstärkungsfilter in Kaskade verbunden werden,
um eine vollständige Nachfilteranwendung zu schaffen. In sol
chen Fällen sind die Übertragungsfunktion der Langverzöge
rungs-Nachfilter und der Hochfrequenz-Verstärkungsfilter wie
in den bekannten Anwendungen berechnet. Das bedeutet, daß die
Übertragungsfunktion Q(z) für den Langverzögerungs-Nachfilter
z. B. die Form
Q(z) = Cg (1 + gz-p)/(1 - 1z-p) [GL. 7]
haben kann, wobei z die gleiche Bedeutung hat wie zuvor, der
Wert von p durch eine Tonhöhenanalyse des Hörsignals bestimmt
wird, Cg ein adaptiver Skalierungsfaktor ist, und die Koeffi
zienten gemäß der folgenden Formeln bestimmt werden:
g = Czf(X) [Gl. 8a]
1 = Cpf(X) [Gl. 8b]
wobei Cz und Cp feste Skalierungsfaktoren in dem Intervall 0 <
Cz, Cp < 1 sind und wo:
1 falls x < 1
f(x) = x falls Uth x 1 [Gl. 9]
0 falls x < Uth
wobei Uth ein Nichtsprech-Schwellwert und x ein Sprachanzeige
Parameter ist, der von dem im Langverzögerungs-Nachfilter ver
wendeten Tonhöhenvorhersagefaktor abhängt.
Der Hochfrequenz-Verstärkungsfilter für eine Verbindung mit
dem Kurzverzögerungs-Nachfilter der vorliegenden Erfindung
kann, z. B. ein Filter erster Ordnung sein, mit einer Übertra
gungsfunktion R(z) in der Form:
R(z) = 1 - u z -1 [Gl. 10]
wobei u ein empirisch bestimmter Parameter im Intervall 0 < u
< 1 ist und typischerweise Werte von 0,2 bis 0,5 annimmt.
Somit kann ein Kurzverzögerungs-Nachfilter gemäß der vorlie
genden Erfindung, falls in Verwendung mit einem Langverzöge
rungs-Nachfilter und/oder Hochfrequenz-Verstärkungs-
Nachfilter verwendet, in einem kombinierten Nachfilter für ei
ne optimale Verbesserung der empfundenen Qualität eines ko
dierten oder unkodierten Hörsignals verwendet werden.
Claims (31)
1. Ein Kurzverzögerungs-Nachfilter (13), um ein kodiertes
oder dekodiertes Hörsignal, speziell ein Sprachsignal,
nachzufiltern, wobei der Kurzverzögerungs-Nachfilter eine
Übertragungsfunktion F(z) der Form
F(z) = D(z)/E(z)hat, wobei E(z) und D(z) Polynome sind, die von der Va
riablen z abhängen, wobei z das Inverse des Einheits-
Verzögerungsoperators z-1 ist, welcher in der
z-Transformationsdarstellung von Übertragungsfunktionen
verwendet wird, und worin:
- - der Nenner E(z) von der Übertragungsfunktion H(z) des entsprechenden Erzeugungsfilters (12) des Hörsi gnals abgeleitet ist; und
- - der Zähler D(z) sich von dem Nenner E(z) unterschei det und unter Verwendung eines längeren Zeitab schnitts als für den Nenner E(z) vom Hörsignal oder vom Erzeugungsfilter abgeleitet ist.
2. Ein Kurzverzögerungs-Nachfilter nach Anspruch 1, worin
der Zähler D(z) von einem Puffer des Hörsignals abgelei
tet ist.
3. Ein Kurzverzögerungs-Nachfilter nach Anspruch 2, worin
der Zähler D(z) von dem Puffer mit Hilfe einer linearen
Prediktionskodierungs- (linear predictive coding, LPC)
Analyse abgeleitet ist.
4. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin die Koeffizienten der Funktionen
E(z) und D(z) aus dem Hörsignal zu vorbestimmten Zeit
punkten berechnet werden.
5. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin Reflexionskoeffizienten zur Dar
stellung von E(z) und/oder D(z) verwendet werden.
6. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin Linienspektralfrequenzen zur Dar
stellung von E(z) und/oder D(z) verwendet werden.
7. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin logarithmische Bereichsverhält
nisse zur Darstellung von E(z) und/oder D(z) verwendet
werden.
8. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin die Koeffizienten des Zählers
D(z) durch Filtern der Koeffizienten des Erzeugungsfil
ters abgeleitet werden.
9. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin die Koeffizienten des Zählers
D(z) durch Transformieren der Koeffizienten des Erzeu
gungsfilters aus einem ersten Bereich in einen zweiten
Bereich, durch Filtern der transformierten Koeffizienten
in dem zweiten Bereich und durch Rücktransformieren zu
rück in den ersten Bereich erhalten werden.
10. Ein Kurzverzögerungs-Nachfilter nach Anspruch 9, worin
D(z) in kleinen Abschnitten berechnet wird und danach ge
filtert wird.
11. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin das Hörsignal gefenstert wird.
12. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin eine Covari
anz/Autokorrelationsmatrix des Signals gefenstert wird.
13. Ein Kurzverzögerungs-Nachfilter nach einem der vorherge
henden Ansprüche, worin die Übertragungsfunktion F(z) des
Kurzverzögerungs-Nachfilters die Form
F(z) = D(z)/E(z/α)hat, wobei α ein Parameter im Intervall 0 < α < 1 ist und
worin die Übertragungsfunktion F(z) durch Verschieben der
Pole der Übertragungsfunktion in Richtung des Ursprungs
gechirpt ist.
14. Ein Kurzverzögerungs-Nachfilter nach Anspruch 13, worin
die Übertragungsfunktion F(z) des Kurzverzögerungs-
Nachfilters die Form
F(z) = D(z/β) / E(z/α)hat, wobei α und β Parameter im Intervall 0 < α,β < 1
sind und worin die Übertragungsfunktion F(z) durch Ver
schieben der Nullstellen der Übertragungsfunktion in
Richtung des Ursprungs gechirpt ist.
15. Ein Nachfilter, um ein kodiertes oder dekodiertes Hörsi
gnal, speziell ein Sprachsignal, nachzufiltern, der einen
Kurzverzögerungs-Nachfilter nach einem der vorhergehenden
Ansprüche in Serie mit einem Langverzögerungs-Nachfilter
und/oder einem Hochfrequenz-Verstärkungsfilter umfaßt.
16. Ein Verfahren zum Nachfiltern eines kodierten oder unko
dierten Hörsignals, speziell eines Sprachsignals, umfas
send:
- - Bereitstellen eines kodierten oder unkodierten Hör signals von einem Erzeugungsfilter mit einer Über tragungsfunktion H(z), wobei z das Inverse des Ein heits-Verzögerungsoperators z-1 ist, welcher in der z-Transformationsdarstellung von Übertragungsfunk tionen verwendet wird;
- - Puffern der Hörsignale in Vektorblöcke;
- - Filtern der Vektoren mit einem Kurzverzögerungs- Nachfilter mit der Übertragungsfunktion F(z) in der Form: F(z) = D(z)/E(z)wobei E(z) und D(z) Polynome mit der Variablen z sind,
und worin:
- - der Nenner E(z) der Übertragungsfunktionen H(z) des entsprechenden Erzeugungsfilters (12) des Hörsignals abgeleitet ist; und
- - der Zähler D(z) sich von dem Nenner E(z) unterschei det und unter Verwendung eines längeren Zeitab schnitts als für den Nenner E(z) vom Hörsignal oder vom Erzeugungsfilter abgeleitet ist.
17. Ein Verfahren zum Nachfiltern eines Hörsignals nach An
spruch 16, wobei die Koeffizienten der Funktionen E(z)
und D(z) aus dem Hörsignal zu vorbestimmten Zeitpunkten
berechnet werden.
18. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 17, wobei Reflexionskoeffizienten
zur Darstellung von E(z) und/oder D(z) verwendet werden.
19. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 18, wobei Linienspektralfrequenzen
zur Darstellung von E(z) und/oder D(z) verwendet werden.
20. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 19, wobei logarithmische Bereichs
verhältnisse zur Darstellung von E(z) und/oder D(z) ver
wendet werden.
21. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 20, wobei die Koeffizienten des Zäh
lers D(z) durch Filtern der Koeffizienten des Erzeugungs
filters abgeleitet werden.
22. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 21, wobei die Koeffizienten des Zäh
lers D(z) durch Transformieren der Koeffizienten des Er
zeugungsfilters aus einem ersten Bereich in einen zweiten
Bereich, durch Filtern der transformierten Koeffizienten
in dem zweiten Bereich und durch Rücktransformieren zu
rück in den ersten Bereich erhalten werden.
23. Ein Verfahren zum Nachfiltern eines Hörsignals nach An
spruch 22, wobei D(z) in kleinen Abschnitten berechnet
wird und danach gefiltert wird.
24. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 23, wobei der Zähler D(z) von einem
Puffer des Hörsignals abgeleitet ist.
25. Ein Verfahren zum Nachfiltern eines Hörsignals nach An
spruch 24, worin der Zähler D(z) von dem Puffer mit Hilfe
einer linearen Prediktionskodierungs- (linear predictive
coding, LPC) Analyse abgeleitet ist.
26. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 25, wobei das Hörsignal gefenstert
wird.
27. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 26, wobei eine Covari
anz/Autokorrelationsmatrix des Signals gefenstert wird.
28. Ein Verfahren zum Nachfiltern eines Hörsignals nach einem
der Ansprüche 16 bis 27, wobei die Übertragungsfunktion
F(z) des Kurzverzögerungs-Nachfilters mit einem Chirpfak
tor α versehen wird, so daß die Übertragungsfunktion die
Form
F(z) = D(z) / E(z/α)hat, wobei α ein Parameter im Intervall 0 < α < 1 ist;
und worin die Übertragungsfunktion durch Verschieben der
Pole der Übertragungsfunktion in Richtung des Ursprungs
gechirpt wird.
29. Ein Verfahren zum Nachfiltern eines Hörsignals nach An
spruch 28, wobei der Zähler der Übertragungsfunktion mit
einem Chirpfaktor β versehen wird, so daß die Übertra
gungsfunktion F(z) des Kurzverzögerungs-Nachfilters die
Form
F(z) = D(z/β)/E(z/α)hat, wobei α und β Parameter im Intervall 0 < α,β < 1
sind und worin die Übertragungsfunktion F(z) durch Ver
schieben der Nullstellen der Übertragungsfunktion in
Richtung des Ursprungs gechirpt wird.
30. Ein Verfahren zum Nachfiltern eines Hörsignals nach einer
der Ansprüche 16 bis 29, wobei das Hörsignal zusätzlich
mit einem Langverzögerungs-Nachfilter und/oder einem
Hochfrequenz-Verstärkungsfilter gefiltert wird.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19643900A DE19643900C1 (de) | 1996-10-30 | 1996-10-30 | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
US08/953,919 US6058360A (en) | 1996-10-30 | 1997-10-20 | Postfiltering audio signals especially speech signals |
PCT/EP1997/005963 WO1998019298A1 (en) | 1996-10-30 | 1997-10-29 | Postfiltering audio signals, especially speech signals |
AU53143/98A AU5314398A (en) | 1996-10-30 | 1997-10-29 | Postfiltering audio signals, especially speech signals |
JP52004798A JP2001509277A (ja) | 1996-10-30 | 1997-10-29 | オーディオ信号特にスピーチ信号のポストフィルタリング |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19643900A DE19643900C1 (de) | 1996-10-30 | 1996-10-30 | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19643900C1 true DE19643900C1 (de) | 1998-02-12 |
Family
ID=7809665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19643900A Expired - Fee Related DE19643900C1 (de) | 1996-10-30 | 1996-10-30 | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
Country Status (5)
Country | Link |
---|---|
US (1) | US6058360A (de) |
JP (1) | JP2001509277A (de) |
AU (1) | AU5314398A (de) |
DE (1) | DE19643900C1 (de) |
WO (1) | WO1998019298A1 (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030070177A (ko) * | 2002-02-21 | 2003-08-29 | 엘지전자 주식회사 | 원시 디지털 데이터의 잡음 필터링 방법 |
JP5164970B2 (ja) * | 2007-03-02 | 2013-03-21 | パナソニック株式会社 | 音声復号装置および音声復号方法 |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
EP2980799A1 (de) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Verarbeitung eines Audiosignals mit Verwendung einer harmonischen Nachfilterung |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5241650A (en) * | 1989-10-17 | 1993-08-31 | Motorola, Inc. | Digital speech decoder having a postfilter with reduced spectral distortion |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB188820A (en) * | 1921-08-27 | 1922-11-23 | Charles Wilson Mcdowall | Improvements in or in connection with switch fuses |
US4301329A (en) * | 1978-01-09 | 1981-11-17 | Nippon Electric Co., Ltd. | Speech analysis and synthesis apparatus |
US4381561A (en) * | 1980-10-23 | 1983-04-26 | International Telephone And Telegraph Corporation | All digital LSI line circuit for analog lines |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
US4475227A (en) * | 1982-04-14 | 1984-10-02 | At&T Bell Laboratories | Adaptive prediction |
JPS60124153U (ja) * | 1984-01-31 | 1985-08-21 | パイオニア株式会社 | デ−タ信号読取り装置 |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4726037A (en) * | 1986-03-26 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Predictive communication system filtering arrangement |
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US4852169A (en) * | 1986-12-16 | 1989-07-25 | GTE Laboratories, Incorporation | Method for enhancing the quality of coded speech |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
WO1991006093A1 (en) * | 1989-10-17 | 1991-05-02 | Motorola, Inc. | Digital speech decoder having a postfilter with reduced spectral distortion |
US5694519A (en) * | 1992-02-18 | 1997-12-02 | Lucent Technologies, Inc. | Tunable post-filter for tandem coders |
-
1996
- 1996-10-30 DE DE19643900A patent/DE19643900C1/de not_active Expired - Fee Related
-
1997
- 1997-10-20 US US08/953,919 patent/US6058360A/en not_active Expired - Lifetime
- 1997-10-29 JP JP52004798A patent/JP2001509277A/ja active Pending
- 1997-10-29 AU AU53143/98A patent/AU5314398A/en not_active Abandoned
- 1997-10-29 WO PCT/EP1997/005963 patent/WO1998019298A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5241650A (en) * | 1989-10-17 | 1993-08-31 | Motorola, Inc. | Digital speech decoder having a postfilter with reduced spectral distortion |
Also Published As
Publication number | Publication date |
---|---|
AU5314398A (en) | 1998-05-22 |
WO1998019298A1 (en) | 1998-05-07 |
US6058360A (en) | 2000-05-02 |
JP2001509277A (ja) | 2001-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69233094T2 (de) | Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden | |
DE19747132C2 (de) | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms | |
DE4135070C1 (de) | ||
DE19604273C5 (de) | Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit | |
DE69533577T2 (de) | Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals | |
DE60303214T2 (de) | Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden | |
DE69432538T2 (de) | Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger | |
EP1388147B1 (de) | Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals | |
EP0290581A1 (de) | Verfahren zum übertragen digitalisierter tonsignale. | |
DE10200653B4 (de) | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom | |
DE60118631T2 (de) | Verfahren zum ersetzen verfälschter audiodaten | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
DE19715126C2 (de) | Sprachsignal-Codiervorrichtung | |
EP0414838A1 (de) | Verfahren zur übertragung eines signals. | |
EP1258865A2 (de) | Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen | |
DE60124079T2 (de) | Sprachverarbeitung | |
DE19643900C1 (de) | Nachfiltern von Hörsignalen, speziell von Sprachsignalen | |
DE19743662A1 (de) | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms | |
WO2005078705A1 (de) | Audiocodierung | |
DE4494736C2 (de) | Verfahren zur Spektralanalyse eines Eingangssignals sowie Spektral-Analysator zum Ausführen einer Spektralanalyse | |
DE4343366C2 (de) | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen | |
DE2941452C2 (de) | Verfahren zur Codierung von Analogsignalen | |
WO1993021694A1 (de) | Verfahren zum übertragen und/oder speichern digitalisierter, datenreduzierter audiosignale | |
DE19742201C1 (de) | Verfahren und Vorrichtung zum Codieren von Audiosignalen | |
DE2904426A1 (de) | Analog-sprach-codierer und decodierer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8100 | Publication of the examined application without publication of unexamined application | ||
D1 | Grant (no unexamined application published) patent law 81 | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G10L0009000000 Ipc: G10L0019070000 |