DE19509149A1 - Codierverfahren - Google Patents
CodierverfahrenInfo
- Publication number
- DE19509149A1 DE19509149A1 DE1995109149 DE19509149A DE19509149A1 DE 19509149 A1 DE19509149 A1 DE 19509149A1 DE 1995109149 DE1995109149 DE 1995109149 DE 19509149 A DE19509149 A DE 19509149A DE 19509149 A1 DE19509149 A1 DE 19509149A1
- Authority
- DE
- Germany
- Prior art keywords
- time
- group
- noisy
- groups
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 10
- 238000013144 data compression Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims abstract description 33
- 239000000872 buffer Substances 0.000 claims abstract 2
- 230000009466 transformation Effects 0.000 claims abstract 2
- 231100000567 intoxicating Toxicity 0.000 claims description 7
- 230000002673 intoxicating effect Effects 0.000 claims description 7
- 238000000844 transformation Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Es wird ein Verfahren vorgestellt, das eine gehörgerechte Extraktion rausch- und impulshafter
Anteile in Teilbändern durchführt. Die sich daraus ergebenden Vorteile in bezug auf die Rechenzeit,
die Genauigkeit der Gehörmodellbildung sowie Anwendungsmöglichkeiten zur Datenkompression
werden diskutiert.
Durch adaptive Filterung mit anschließender Diskreter-Fourier-Transformation läßt sich eine
gehörgerechte Extraktion rausch- und impulshafter Anteile erreichen [11]. Dabei wird das
Audiosignal auf einen Prädiktor (basierend auf dem NLMS-Algorithmus) gegeben, welcher
rauschhafte Signalanteile im Pegel reduziert. Diese Reduktion wird anschließend durch Vergleich der
Kurzzeitspektren des Originalsignals und des rauschgeminderten Signals detektiert. Ist die relative
Pegelabsenkung hinreichend groß, so wird dem zugehörigen Spektralwert ein rauschhafter Charakter
zugewiesen. Eine Anwendungsmöglichkeit stellt beispielsweise die Datenkompression von
Audiosignalen dar. Dazu werden benachbarte und als rauschhaft erkannte Spektralwerte zu Gruppen
zusammengefaßt übertragen, welches zu einer starken Datenreduktion führt, da nicht die
Abtastwerte, sondern lediglich die Frequenzbereichsgrenzen und der mittlere Pegel übermittelt
werden.
Ein wesentliches Problem des Gesamtbandverfahrens stellt das Verhalten des Prädiktors dar, welcher
sich auf signalstärkere Frequenzanteile schneller als auf signalschwache Frequenzanteile einstellt. Als
Folge können pegelschwache tonale Komponenten vom Prädiktor nicht erfaßt werden und damit
evtl. als rauschhaft erkannt werden. Dieses Problem einer begrenzten Dynamik kann kompensiert
werden, indem das Restsignal (Originalsignal abzgl. rauschgemindertem Signal) nochmals einem
Prädiktor zugeführt wird. In diesem Restsignal sind die signalstarken Anteile bereits bedämpft, so
daß sich der Prädiktor auf die schwächeren Spektralanteile einstellen kann. Bei einer dreifachen
Rekursion dieses Verfahrens kann eine für das menschliche Gehör ausreichende Dynamik der
Prädiktion erzielt werden. Allerdings verringert sich bei dieser Vorgehensweise auch der Anteil der
als rauschhaft erkannten Spektralwerte.
Bei der Rauschminderung in Teilbändern wird das Audiosignal auf eine Teilbandfilterbank gegeben.
Jedes einzelne Teilband wird anschließend einem eigenen Prädiktor zugeführt. Nach der Prädiktion
werden die einzelnen Teilbänder wieder zu einem Gesamtband zusammengefaßt. Dieses Prinzip wird
in Bild 1 veranschaulicht.
Als Teilbandfilterbank hat sich dabei eine Polyphasenfilterbank nach Rothweiler [12] als sinnvoll
erwiesen. Bei äußerst geringem Berechnungsaufwand ist eine maximale Unterabtastung möglich. Mit
dem Prototypfilter der Länge 511 und 32 Teilbändern liegt der Rekonstruktionsfehler ca. 110
Dezibel unter dem Maximalpegel und ist damit deutlich geringer als der Quantisierungsfehler eines mit
16 Bit abgetasteten Audiosignales.
Für das Gesamtbandverfahren wurde eine optimale Filterlänge von über 100 Koeffizienten ermittelt.
Im Teilbandverfahren hingegen zeigten Filterlängen von etwa 8 Koeffizienten optimale Ergebnisse.
Eine Rekursion durch Fehlerrückkopplung kann aufgrund der Aufspaltung in Teilbänder
unterbleiben. Daher kann bei maximaler Unterabtastung der für die Prädiktion nötige Rechen
aufwand mindestens um den Faktor
reduziert werden.
Zur Rauschextraktion nach der in [11] vorgestellten Methode kann direkt das Signal verwendet
werden, welches durch die Rauschminderung in den Teilbändern erzeugt wurde. Wird auf die-feine
spektrale Auflösung der FFT beim Gesamtbandverfahren verzichtet und nur jeweils ganzen
Teilbändern rauschhafter oder tonaler Charakter zugewiesen, kann der Berechnungsaufwand deutlich
reduziert werden. Der Verzicht auf die feine spektrale Auflösung stellt im Hinblick auf eine
Datenkompression keinen Nachteil dar, da auch beim FFT-Verfahren immer Gruppen von
Spektralwerten zusammengefaßt werden müssen und durch feste Grenzfrequenzen die Kodierung
wesentlich vereinfacht wird.
Das allgemeine Prinzip der Rauschextraktion in Teilbändern wird in Bild 2 dargestellt.
Zur Bestimmung, ob ein Teilband rauschhafter oder tonaler Natur ist, wird das Teilband sowohl
original als auch rauschgemindert einem Analyzer zugeführt. Jeweils 12 aufeinanderfolgende Abtast
werte werden im Analyzer zu einer Gruppe zusammengefaßt. Für jedes Teilband und jede dieser
Gruppen wird ein Rauschmaß berechnet, welches das Verhältnis von mittlerer Fehlersignalamplitude
zu mittlerer Originalsignalamplitude darstellt. Seien
der i-te originale und
der i-te
prädizierte Abtastwert einer Gruppe eines Teilbandes, so berechnet sich das Rauschmaß Ψ zu:
Übersteigt Ψ einen vorgegebenen Wert, so wird dem Teilband für diese Gruppe rauschhafter
Charakter zugewiesen.
Eine Grenze ergibt sich durch die (notwendige) Trägheit der Prädiktoren. Tritt ein Signalsprung auf,
so benötigt der Prädiktor eine gewisse Zeit, um sich auf dieses Signal einzustellen. Innerhalb dieser
Zeitspanne wird das Signal bedämpft und vom Analyzer als rauschhaft interpretiert. Um dies zu
vermeiden, werden Signalsprünge in den Teilbändern detektiert und gegebenenfalls für eine gewisse
Zeitspanne nach dem Sprung auf eine rauschhafte Kodierung des jeweiligen Teilbands verzichtet
(Signalsprungdetektion, siehe Bild 4).
Werden zu viele Abtastwerte eines Teilbandes zu einer Rauschgruppe zusammengefaßt, so kann eine
hörbare Rauschverschmierung eintreten. Theoretisch dürfte die Länge einer Gruppe die
Zeitauflösungsgrenze des menschlichen Gehöres, die bei etwa 2 ins liegt, nicht überschreiten. Dann
ließen sich jedoch nur etwa 3 Abtastwerte eines Teilbandes zu einer Gruppe zusammenfassen. Daher
werden größere Gruppen gebildet, die aber nur dann auch als rauschhaft akzeptiert werden, wenn
innerhalb der Originalgruppe keine größeren Pegelschwankungen zu detektieren sind
(Homogenitätskontrolle, siehe Bild 4).
Weiterhin wird von jeder Gruppe eine FFT berechnet, und im Spektrum nach ausgeprägten Maxima
gesucht. Sind diese vorhanden, so wird auf eine rauschhafte Verarbeitung zu verzichten (FFT-
Kontrolle, siehe Bild 4).
Um eine Übersteuerung zu vermeiden, wird eine Pegelberechnung durchgeführt. Liegt der Pegel des
Audiosignales nahe dem Vollaussteuerungspegel, so wird auf eine rauschhafte Verarbeitung
verzichtet (Übersteuerungskontrolle, siehe Bild 4).
Das gesamte Verfahren zur Aufspaltung in rauschhafte und tonale Komponenten wird in Bild 4
veranschaulicht.
Die Vorteile des Teilbandverfahrens sind:
- 1. Die Parameter jedes Prädiktors können individuell gewählt werden, d. h. eine Anpassung an die frequenzabhängigen Eigenschaften des Gehörs wird möglich.
- 2. Bei Signalsprüngen müssen nur noch die betroffenen Teilbänder von einer Verarbeitung durch den Rauschextraktionsalgorithmus ausgeschlossen werden. Dies erhöht die Zahl der als rauschhaft erkannten Abtastwerte beträchtlich gegenüber dem Gesamtbandverfahren.
- 3. Die für das Gesamtbandverfahren vorhandene notwendige Rekursion zur Erhöhung der Dynamik kann beim Teilbandverfahren entfallen.
- 4. Durch die Reduktion der Filterlänge kann der Berechnungsaufwand im Teilbandverfahren gesenkt werden.
- 5. Der Rauschverschmierungseffekt, der beim Gesamtbandverfahren eine Übertragung der Einhüllenden erforderlich machte, kann durch Ausschluß einzelner Teilbandgruppen gelöst werden. Im Gesamtbandverfahren führt eine solche Realisierung zu einem deutlichen Rückgang des Anteils der als rauschhaft erkannten Spektralwerte.
Mit dem beschriebenen Verfahren konnte gezeigt werden, daß eine automatische gehörgerechte
Rauschextraktion in Teilbändern möglich ist. Dazu wurde ein Testprogramm implementiert, welches
die als rauschhaft erkannten Teilbandabtastwerte durch Zufallswerte ersetzte. Dabei konnten je nach
Audiomaterial zwischen 20 und 50 Prozent der Teilbandabtastwerte als rauschhaft interpretiert und
ersetzt werden, ohne daß vom Gehör ein Unterschied wahrgenommen werden konnte.
Dieses Verfahren wurde weiterhin in ein Verfahren zur Datenkompression von Audiosignalen
integriert. Dazu wurde ein Teilbandverfahren gewählt, so daß zur Kodierung als auch zur
Dekodierung jeweils nur eine Filterbank realisiert werden mußte. Der durch die Rauschextraktion
bedingte zusätzliche Rechenaufwand beschränkt sich demzufolge lediglich auf die Prädiktoren und
die Analyzer. Da die als rauschhaft erkannten Teilbänder von der weiteren Bearbeitung durch die
Datenkompression ausgeschlossen werden, kann dort Rechenzeit eingespart werden. Die als tonal
erkannten Abtastwerte wurden mit dem MPEG-Verfahren codiert (siehe Bild 3). Der zusätzlich
benötigte Rechenaufwand ist folglich gegenüber dem Gesamtaufwand gering. Mit dem so erzeugten
Datenkompressionsverfahren wurde bei gleicher Datenrate eine bessere Qualität als bei dem MPEG-
Verfahren ohne Rauschextraktion erzielt.
[1] R. Zelinski, P. Noll: Adaptive Transform Coding of Speech Signals, IEEE Trans. on Acoustics,
Speech and Signal Processing, ASSP-25 1977, S. 299-309.
[2] E. Zwicker und H. Fastl, Psychoacoustics, Springer-Verlag.
[3] Detlef Krahe, Grundlagen eines Verfahrens zur Datenreduktion bei qualitativ hochwertigen, digitalen Audiosignalen auf Basis einer adaptiven Transformationscodierung unter Berücksichtigung psychoakustischer Phänomene, Dissertation 1988, Universität - Gesamthochschule - Duisburg.
[4] Donald Schulz, Implementierung eines Verfahrens zur Datenkompression von Audiosignalen, Studienarbeit 1991, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[5] Karlheinz Brandenburg, Ein Beitrag zu den Verfahren und der Qualitätsbeurteilung für hoch wertige Musikcodierung, Dissertation 1989, Universität Erlangen-Nürnberg.
[6] Peter Wolf, Programmierung einer auf das Frequenzauflösungsvermögen des Gehöres angepaßten adaptiven Transformationscodierung für digitale Audiosignale, Diplomarbeit 1992, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[7] Eberhard Hänsler, Statistische Signaie, Grundlagen und Anwendungen, Springer-Verlag.
[8] Varga, Imre, Adaptive Filtering for Noise Reduction in Audio Signals, Audio Engineering Society Preprint Nr. 3247.
[9] Xavier Serra, A system for so und analysis/transformation/synthesis based on a deterministic plus stochastic decomposition, Ph. D., Stanford University 1990.
[10] Ingo Schneider, Implementierung eines Verfahrens zur Datenkompression von akustischen Signalen unter spezieller Berücksichtigung rauschhafter Signalanteile, Studienarbeit THD 1994.
[11] Donald Schulz, Gehörgerechte Extraktion rausch- und impulshafter Anteile bei qualitativ hochwertigen Audiosignalen, Tagungsband der DAGA 1994, S. 1429-1432.
[12] Joseph H. Rothweiler, Polyphase Quadrature Filters- a new subband coding technique, Tagungsband der ICASSP 1983, S. 1280-1283.
[2] E. Zwicker und H. Fastl, Psychoacoustics, Springer-Verlag.
[3] Detlef Krahe, Grundlagen eines Verfahrens zur Datenreduktion bei qualitativ hochwertigen, digitalen Audiosignalen auf Basis einer adaptiven Transformationscodierung unter Berücksichtigung psychoakustischer Phänomene, Dissertation 1988, Universität - Gesamthochschule - Duisburg.
[4] Donald Schulz, Implementierung eines Verfahrens zur Datenkompression von Audiosignalen, Studienarbeit 1991, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[5] Karlheinz Brandenburg, Ein Beitrag zu den Verfahren und der Qualitätsbeurteilung für hoch wertige Musikcodierung, Dissertation 1989, Universität Erlangen-Nürnberg.
[6] Peter Wolf, Programmierung einer auf das Frequenzauflösungsvermögen des Gehöres angepaßten adaptiven Transformationscodierung für digitale Audiosignale, Diplomarbeit 1992, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[7] Eberhard Hänsler, Statistische Signaie, Grundlagen und Anwendungen, Springer-Verlag.
[8] Varga, Imre, Adaptive Filtering for Noise Reduction in Audio Signals, Audio Engineering Society Preprint Nr. 3247.
[9] Xavier Serra, A system for so und analysis/transformation/synthesis based on a deterministic plus stochastic decomposition, Ph. D., Stanford University 1990.
[10] Ingo Schneider, Implementierung eines Verfahrens zur Datenkompression von akustischen Signalen unter spezieller Berücksichtigung rauschhafter Signalanteile, Studienarbeit THD 1994.
[11] Donald Schulz, Gehörgerechte Extraktion rausch- und impulshafter Anteile bei qualitativ hochwertigen Audiosignalen, Tagungsband der DAGA 1994, S. 1429-1432.
[12] Joseph H. Rothweiler, Polyphase Quadrature Filters- a new subband coding technique, Tagungsband der ICASSP 1983, S. 1280-1283.
Claims (7)
1. Verfahren zur Codierung von Audiosignalen, insbesondere zur Steigerung des
Datenkompressionsfaktors unter Verwendung von Filterbänken, Puffern, Prädiktoren,
Codierern, ausgehend von einer Unterteilung des Audiosignals in Teilfilterbändern und unter
Nutzung des MPEG-Audioverfahrens mit oder ohne Zeit-Frequenz-Transformationen,
dadurch gekennzeichnet, daß durch einen Prädiktor die Teilbänder auf Rauschhaftigkeit hin
untersucht werden, daß diejenigen Bänder, die vorzugsweise Rauschen enthalten, nicht durch
ihre Zeitfunktionen, sondern nur durch ihren Mittelwert gekennzeichnet werden.
2. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß die tonalen (nicht rauschhaften) Teilbänder im Zeit- oder
Frequenzbereich durch diskrete und quantisierte Werte codiert sind.
3. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß jedes Teilband einem individuellen Prädiktor zugeführt wird, daß
eine bestimmte Anzahl an Abtastwerten zu einer Gruppe zusammengefaßt wird, daß der
Schätzfehler dieser Gruppe berechnet wird und daß diese Gruppe von Abtastwerten zu den
rauschhaften Gruppen zugeordnet wird, falls dieser Schätzfehler im Verhältnis zum Pegel der
Abtastwerte dieser Gruppe ein gewisses Maß überschreitet.
4. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß zusätzlich in jedem Teilband Signalsprünge und stärkere
Pegelschwankungen detektiert werden und bei ihrem Auftreten auf eine Zuordnung zu den
rauschhaften Gruppen verzichtet wird.
5. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß zur Vermeidung von Übersteuerungen auf eine Zuordnung zu
den rauschhaften Gruppen verzichtet wird, falls die Summe der Leistungen aller Abtastwerte
sämtlicher Teilbandgruppen zu einem Zeitpunkt ein gewisses Maß überschreitet.
6. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß auf eine Zuordnung zu den rauschhaften Gruppen verzichtet
wird, falls in der Kurzzeittransformierten dieser Gruppe ein ausgeprägtes Maximum zu finden
ist.
7. Verfahren nach Anspruch 1,
dadurch gekennzeichnet, daß zur Rekonstruktion des Zeitverlaufs einer rauschhaften Gruppe
deren Mittelwert verwendet wird, um einen Rauschgenerator so einzustellen, daß er denselben
Mittelwert hat und daß dessen Zeitfunktion anstelle der ursprünglichen Zeitfunktion verwendet
wird.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1995109149 DE19509149A1 (de) | 1995-03-14 | 1995-03-14 | Codierverfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1995109149 DE19509149A1 (de) | 1995-03-14 | 1995-03-14 | Codierverfahren |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19509149A1 true DE19509149A1 (de) | 1996-09-19 |
Family
ID=7756615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1995109149 Withdrawn DE19509149A1 (de) | 1995-03-14 | 1995-03-14 | Codierverfahren |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19509149A1 (de) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19747885A1 (de) * | 1997-10-30 | 1999-05-06 | Daimler Chrysler Ag | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
WO2003107328A1 (en) * | 2002-06-17 | 2003-12-24 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7610195B2 (en) | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
US7685218B2 (en) | 2001-04-10 | 2010-03-23 | Dolby Laboratories Licensing Corporation | High frequency signal construction method and apparatus |
US8126709B2 (en) | 2002-03-28 | 2012-02-28 | Dolby Laboratories Licensing Corporation | Broadband frequency translation for high frequency regeneration |
US8396574B2 (en) | 2007-07-13 | 2013-03-12 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
-
1995
- 1995-03-14 DE DE1995109149 patent/DE19509149A1/de not_active Withdrawn
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
DE19747885A1 (de) * | 1997-10-30 | 1999-05-06 | Daimler Chrysler Ag | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
US7685218B2 (en) | 2001-04-10 | 2010-03-23 | Dolby Laboratories Licensing Corporation | High frequency signal construction method and apparatus |
US9412388B1 (en) | 2002-03-28 | 2016-08-09 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal with temporal shaping |
US9412389B1 (en) | 2002-03-28 | 2016-08-09 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal by copying in a circular manner |
US8285543B2 (en) | 2002-03-28 | 2012-10-09 | Dolby Laboratories Licensing Corporation | Circular frequency translation with noise blending |
US10269362B2 (en) | 2002-03-28 | 2019-04-23 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for determining reconstructed audio signal |
US9767816B2 (en) | 2002-03-28 | 2017-09-19 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal with phase adjustment |
US9704496B2 (en) | 2002-03-28 | 2017-07-11 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal with phase adjustment |
US9653085B2 (en) | 2002-03-28 | 2017-05-16 | Dolby Laboratories Licensing Corporation | Reconstructing an audio signal having a baseband and high frequency components above the baseband |
US9548060B1 (en) | 2002-03-28 | 2017-01-17 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal with temporal shaping |
US9466306B1 (en) | 2002-03-28 | 2016-10-11 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal with temporal shaping |
US9412383B1 (en) | 2002-03-28 | 2016-08-09 | Dolby Laboratories Licensing Corporation | High frequency regeneration of an audio signal by copying in a circular manner |
US9343071B2 (en) | 2002-03-28 | 2016-05-17 | Dolby Laboratories Licensing Corporation | Reconstructing an audio signal with a noise parameter |
US9324328B2 (en) | 2002-03-28 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Reconstructing an audio signal with a noise parameter |
US9177564B2 (en) | 2002-03-28 | 2015-11-03 | Dolby Laboratories Licensing Corporation | Reconstructing an audio signal by spectral component regeneration and noise blending |
US8126709B2 (en) | 2002-03-28 | 2012-02-28 | Dolby Laboratories Licensing Corporation | Broadband frequency translation for high frequency regeneration |
US10529347B2 (en) | 2002-03-28 | 2020-01-07 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for determining reconstructed audio signal |
US9947328B2 (en) | 2002-03-28 | 2018-04-17 | Dolby Laboratories Licensing Corporation | Methods, apparatus and systems for determining reconstructed audio signal |
US8457956B2 (en) | 2002-03-28 | 2013-06-04 | Dolby Laboratories Licensing Corporation | Reconstructing an audio signal by spectral component regeneration and noise blending |
US7337118B2 (en) | 2002-06-17 | 2008-02-26 | Dolby Laboratories Licensing Corporation | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
US8050933B2 (en) | 2002-06-17 | 2011-11-01 | Dolby Laboratories Licensing Corporation | Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components |
US8032387B2 (en) | 2002-06-17 | 2011-10-04 | Dolby Laboratories Licensing Corporation | Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components |
EP1736966A2 (de) * | 2002-06-17 | 2006-12-27 | Dolby Laboratories Licensing Corporation | Verfahren zur Erzeugung von Toninformationen |
WO2003107328A1 (en) * | 2002-06-17 | 2003-12-24 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
KR100991450B1 (ko) | 2002-06-17 | 2010-11-04 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 |
EP1736966A3 (de) * | 2002-06-17 | 2007-11-07 | Dolby Laboratories Licensing Corporation | Verfahren zur Erzeugung von Toninformationen |
CN100369109C (zh) * | 2002-06-17 | 2008-02-13 | 杜比实验室特许公司 | 使用频谱孔填充的音频编码系统 |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
USRE43985E1 (en) | 2002-08-30 | 2013-02-05 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7610195B2 (en) | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
US8396574B2 (en) | 2007-07-13 | 2013-03-12 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69326492T2 (de) | Verfahren zur Auswahl des Codier Modus für Stereo Audio-Signale unter Benutzung von Hörbarkeitsmodellen | |
DE69401514T2 (de) | Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung | |
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE69232251T2 (de) | Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung | |
DE69323106T2 (de) | Verfahren und Vorrichtung für perceptuelles Kodieren von Audio-Signalen | |
DE69326484T2 (de) | Vorrichtung und Verfahren zur Datenkompression | |
DE69431622T2 (de) | Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren | |
DE69525836T2 (de) | Kodierung und dekodierung eines breitbandigen digitalen informationssignals | |
DE69401512T2 (de) | Hybride adaptive bitzuteilung für audiokoder und -dekoder | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE69233094T2 (de) | Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden | |
DE69533577T2 (de) | Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals | |
DE69028675T2 (de) | Wahrnehmungsgebundene Kodierung von Audiosignalen | |
DE69132885T2 (de) | CELP-Kodierung niedriger Verzögerung und 32 kbit/s für ein Breitband-Sprachsignal | |
DE69432538T2 (de) | Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger | |
DE69529393T2 (de) | Verfahren zur gewichteten Geräuschfilterung | |
DE69618422T2 (de) | Verfahren zur Sprachdekodierung und tragbares Endgerät | |
DE69006011T3 (de) | Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität. | |
DE69522187T2 (de) | Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung | |
DE69515907T2 (de) | Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem | |
EP1230827B1 (de) | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals | |
DE69015105T2 (de) | Kompressionseinrichtung für transformiertes, digitales Audiosignal mit adaptiver Quantisierung auf Grund eines psycho-akustischen Kriteriums. | |
DE69527223T2 (de) | Verfahren und Vorrichtung zur Kodierung von Daten sowie Datenaufzeichnungsmedium | |
EP0962015B1 (de) | Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen | |
EP0414838A1 (de) | Verfahren zur übertragung eines signals. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |