DE19509149A1 - Codierverfahren - Google Patents

Codierverfahren

Info

Publication number
DE19509149A1
DE19509149A1 DE1995109149 DE19509149A DE19509149A1 DE 19509149 A1 DE19509149 A1 DE 19509149A1 DE 1995109149 DE1995109149 DE 1995109149 DE 19509149 A DE19509149 A DE 19509149A DE 19509149 A1 DE19509149 A1 DE 19509149A1
Authority
DE
Germany
Prior art keywords
time
group
noisy
groups
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1995109149
Other languages
English (en)
Inventor
Donald Dipl Ing Schulz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE1995109149 priority Critical patent/DE19509149A1/de
Publication of DE19509149A1 publication Critical patent/DE19509149A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Description

Es wird ein Verfahren vorgestellt, das eine gehörgerechte Extraktion rausch- und impulshafter Anteile in Teilbändern durchführt. Die sich daraus ergebenden Vorteile in bezug auf die Rechenzeit, die Genauigkeit der Gehörmodellbildung sowie Anwendungsmöglichkeiten zur Datenkompression werden diskutiert.
Rauschextraktion im Gesamtband
Durch adaptive Filterung mit anschließender Diskreter-Fourier-Transformation läßt sich eine gehörgerechte Extraktion rausch- und impulshafter Anteile erreichen [11]. Dabei wird das Audiosignal auf einen Prädiktor (basierend auf dem NLMS-Algorithmus) gegeben, welcher rauschhafte Signalanteile im Pegel reduziert. Diese Reduktion wird anschließend durch Vergleich der Kurzzeitspektren des Originalsignals und des rauschgeminderten Signals detektiert. Ist die relative Pegelabsenkung hinreichend groß, so wird dem zugehörigen Spektralwert ein rauschhafter Charakter zugewiesen. Eine Anwendungsmöglichkeit stellt beispielsweise die Datenkompression von Audiosignalen dar. Dazu werden benachbarte und als rauschhaft erkannte Spektralwerte zu Gruppen zusammengefaßt übertragen, welches zu einer starken Datenreduktion führt, da nicht die Abtastwerte, sondern lediglich die Frequenzbereichsgrenzen und der mittlere Pegel übermittelt werden.
Ein wesentliches Problem des Gesamtbandverfahrens stellt das Verhalten des Prädiktors dar, welcher sich auf signalstärkere Frequenzanteile schneller als auf signalschwache Frequenzanteile einstellt. Als Folge können pegelschwache tonale Komponenten vom Prädiktor nicht erfaßt werden und damit evtl. als rauschhaft erkannt werden. Dieses Problem einer begrenzten Dynamik kann kompensiert werden, indem das Restsignal (Originalsignal abzgl. rauschgemindertem Signal) nochmals einem Prädiktor zugeführt wird. In diesem Restsignal sind die signalstarken Anteile bereits bedämpft, so daß sich der Prädiktor auf die schwächeren Spektralanteile einstellen kann. Bei einer dreifachen Rekursion dieses Verfahrens kann eine für das menschliche Gehör ausreichende Dynamik der Prädiktion erzielt werden. Allerdings verringert sich bei dieser Vorgehensweise auch der Anteil der als rauschhaft erkannten Spektralwerte.
Rauschminderung in Teilbändern
Bei der Rauschminderung in Teilbändern wird das Audiosignal auf eine Teilbandfilterbank gegeben. Jedes einzelne Teilband wird anschließend einem eigenen Prädiktor zugeführt. Nach der Prädiktion werden die einzelnen Teilbänder wieder zu einem Gesamtband zusammengefaßt. Dieses Prinzip wird in Bild 1 veranschaulicht.
Als Teilbandfilterbank hat sich dabei eine Polyphasenfilterbank nach Rothweiler [12] als sinnvoll erwiesen. Bei äußerst geringem Berechnungsaufwand ist eine maximale Unterabtastung möglich. Mit dem Prototypfilter der Länge 511 und 32 Teilbändern liegt der Rekonstruktionsfehler ca. 110 Dezibel unter dem Maximalpegel und ist damit deutlich geringer als der Quantisierungsfehler eines mit 16 Bit abgetasteten Audiosignales.
Für das Gesamtbandverfahren wurde eine optimale Filterlänge von über 100 Koeffizienten ermittelt. Im Teilbandverfahren hingegen zeigten Filterlängen von etwa 8 Koeffizienten optimale Ergebnisse. Eine Rekursion durch Fehlerrückkopplung kann aufgrund der Aufspaltung in Teilbänder unterbleiben. Daher kann bei maximaler Unterabtastung der für die Prädiktion nötige Rechen­ aufwand mindestens um den Faktor
reduziert werden.
Rauschextraktion in Teilbändern
Zur Rauschextraktion nach der in [11] vorgestellten Methode kann direkt das Signal verwendet werden, welches durch die Rauschminderung in den Teilbändern erzeugt wurde. Wird auf die-feine spektrale Auflösung der FFT beim Gesamtbandverfahren verzichtet und nur jeweils ganzen Teilbändern rauschhafter oder tonaler Charakter zugewiesen, kann der Berechnungsaufwand deutlich reduziert werden. Der Verzicht auf die feine spektrale Auflösung stellt im Hinblick auf eine Datenkompression keinen Nachteil dar, da auch beim FFT-Verfahren immer Gruppen von Spektralwerten zusammengefaßt werden müssen und durch feste Grenzfrequenzen die Kodierung wesentlich vereinfacht wird.
Das allgemeine Prinzip der Rauschextraktion in Teilbändern wird in Bild 2 dargestellt.
Zur Bestimmung, ob ein Teilband rauschhafter oder tonaler Natur ist, wird das Teilband sowohl original als auch rauschgemindert einem Analyzer zugeführt. Jeweils 12 aufeinanderfolgende Abtast­ werte werden im Analyzer zu einer Gruppe zusammengefaßt. Für jedes Teilband und jede dieser Gruppen wird ein Rauschmaß berechnet, welches das Verhältnis von mittlerer Fehlersignalamplitude zu mittlerer Originalsignalamplitude darstellt. Seien
der i-te originale und
der i-te prädizierte Abtastwert einer Gruppe eines Teilbandes, so berechnet sich das Rauschmaß Ψ zu:
Übersteigt Ψ einen vorgegebenen Wert, so wird dem Teilband für diese Gruppe rauschhafter Charakter zugewiesen.
Grenzen des Verfahrens
Eine Grenze ergibt sich durch die (notwendige) Trägheit der Prädiktoren. Tritt ein Signalsprung auf, so benötigt der Prädiktor eine gewisse Zeit, um sich auf dieses Signal einzustellen. Innerhalb dieser Zeitspanne wird das Signal bedämpft und vom Analyzer als rauschhaft interpretiert. Um dies zu vermeiden, werden Signalsprünge in den Teilbändern detektiert und gegebenenfalls für eine gewisse Zeitspanne nach dem Sprung auf eine rauschhafte Kodierung des jeweiligen Teilbands verzichtet (Signalsprungdetektion, siehe Bild 4).
Werden zu viele Abtastwerte eines Teilbandes zu einer Rauschgruppe zusammengefaßt, so kann eine hörbare Rauschverschmierung eintreten. Theoretisch dürfte die Länge einer Gruppe die Zeitauflösungsgrenze des menschlichen Gehöres, die bei etwa 2 ins liegt, nicht überschreiten. Dann ließen sich jedoch nur etwa 3 Abtastwerte eines Teilbandes zu einer Gruppe zusammenfassen. Daher werden größere Gruppen gebildet, die aber nur dann auch als rauschhaft akzeptiert werden, wenn innerhalb der Originalgruppe keine größeren Pegelschwankungen zu detektieren sind (Homogenitätskontrolle, siehe Bild 4).
Weiterhin wird von jeder Gruppe eine FFT berechnet, und im Spektrum nach ausgeprägten Maxima gesucht. Sind diese vorhanden, so wird auf eine rauschhafte Verarbeitung zu verzichten (FFT- Kontrolle, siehe Bild 4).
Um eine Übersteuerung zu vermeiden, wird eine Pegelberechnung durchgeführt. Liegt der Pegel des Audiosignales nahe dem Vollaussteuerungspegel, so wird auf eine rauschhafte Verarbeitung verzichtet (Übersteuerungskontrolle, siehe Bild 4).
Das gesamte Verfahren zur Aufspaltung in rauschhafte und tonale Komponenten wird in Bild 4 veranschaulicht.
Gesamtbetrachtung
Die Vorteile des Teilbandverfahrens sind:
  • 1. Die Parameter jedes Prädiktors können individuell gewählt werden, d. h. eine Anpassung an die frequenzabhängigen Eigenschaften des Gehörs wird möglich.
  • 2. Bei Signalsprüngen müssen nur noch die betroffenen Teilbänder von einer Verarbeitung durch den Rauschextraktionsalgorithmus ausgeschlossen werden. Dies erhöht die Zahl der als rauschhaft erkannten Abtastwerte beträchtlich gegenüber dem Gesamtbandverfahren.
  • 3. Die für das Gesamtbandverfahren vorhandene notwendige Rekursion zur Erhöhung der Dynamik kann beim Teilbandverfahren entfallen.
  • 4. Durch die Reduktion der Filterlänge kann der Berechnungsaufwand im Teilbandverfahren gesenkt werden.
  • 5. Der Rauschverschmierungseffekt, der beim Gesamtbandverfahren eine Übertragung der Einhüllenden erforderlich machte, kann durch Ausschluß einzelner Teilbandgruppen gelöst werden. Im Gesamtbandverfahren führt eine solche Realisierung zu einem deutlichen Rückgang des Anteils der als rauschhaft erkannten Spektralwerte.
Ergebnisse
Mit dem beschriebenen Verfahren konnte gezeigt werden, daß eine automatische gehörgerechte Rauschextraktion in Teilbändern möglich ist. Dazu wurde ein Testprogramm implementiert, welches die als rauschhaft erkannten Teilbandabtastwerte durch Zufallswerte ersetzte. Dabei konnten je nach Audiomaterial zwischen 20 und 50 Prozent der Teilbandabtastwerte als rauschhaft interpretiert und ersetzt werden, ohne daß vom Gehör ein Unterschied wahrgenommen werden konnte.
Dieses Verfahren wurde weiterhin in ein Verfahren zur Datenkompression von Audiosignalen integriert. Dazu wurde ein Teilbandverfahren gewählt, so daß zur Kodierung als auch zur Dekodierung jeweils nur eine Filterbank realisiert werden mußte. Der durch die Rauschextraktion bedingte zusätzliche Rechenaufwand beschränkt sich demzufolge lediglich auf die Prädiktoren und die Analyzer. Da die als rauschhaft erkannten Teilbänder von der weiteren Bearbeitung durch die Datenkompression ausgeschlossen werden, kann dort Rechenzeit eingespart werden. Die als tonal erkannten Abtastwerte wurden mit dem MPEG-Verfahren codiert (siehe Bild 3). Der zusätzlich benötigte Rechenaufwand ist folglich gegenüber dem Gesamtaufwand gering. Mit dem so erzeugten Datenkompressionsverfahren wurde bei gleicher Datenrate eine bessere Qualität als bei dem MPEG- Verfahren ohne Rauschextraktion erzielt.
Literatur
[1] R. Zelinski, P. Noll: Adaptive Transform Coding of Speech Signals, IEEE Trans. on Acoustics, Speech and Signal Processing, ASSP-25 1977, S. 299-309.
[2] E. Zwicker und H. Fastl, Psychoacoustics, Springer-Verlag.
[3] Detlef Krahe, Grundlagen eines Verfahrens zur Datenreduktion bei qualitativ hochwertigen, digitalen Audiosignalen auf Basis einer adaptiven Transformationscodierung unter Berücksichtigung psychoakustischer Phänomene, Dissertation 1988, Universität - Gesamthochschule - Duisburg.
[4] Donald Schulz, Implementierung eines Verfahrens zur Datenkompression von Audiosignalen, Studienarbeit 1991, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[5] Karlheinz Brandenburg, Ein Beitrag zu den Verfahren und der Qualitätsbeurteilung für hoch­ wertige Musikcodierung, Dissertation 1989, Universität Erlangen-Nürnberg.
[6] Peter Wolf, Programmierung einer auf das Frequenzauflösungsvermögen des Gehöres angepaßten adaptiven Transformationscodierung für digitale Audiosignale, Diplomarbeit 1992, Technische Hochschule Darmstadt, Fachgebiet Digitaltechnik.
[7] Eberhard Hänsler, Statistische Signaie, Grundlagen und Anwendungen, Springer-Verlag.
[8] Varga, Imre, Adaptive Filtering for Noise Reduction in Audio Signals, Audio Engineering Society Preprint Nr. 3247.
[9] Xavier Serra, A system for so und analysis/transformation/synthesis based on a deterministic plus stochastic decomposition, Ph. D., Stanford University 1990.
[10] Ingo Schneider, Implementierung eines Verfahrens zur Datenkompression von akustischen Signalen unter spezieller Berücksichtigung rauschhafter Signalanteile, Studienarbeit THD 1994.
[11] Donald Schulz, Gehörgerechte Extraktion rausch- und impulshafter Anteile bei qualitativ hochwertigen Audiosignalen, Tagungsband der DAGA 1994, S. 1429-1432.
[12] Joseph H. Rothweiler, Polyphase Quadrature Filters- a new subband coding technique, Tagungsband der ICASSP 1983, S. 1280-1283.

Claims (7)

1. Verfahren zur Codierung von Audiosignalen, insbesondere zur Steigerung des Datenkompressionsfaktors unter Verwendung von Filterbänken, Puffern, Prädiktoren, Codierern, ausgehend von einer Unterteilung des Audiosignals in Teilfilterbändern und unter Nutzung des MPEG-Audioverfahrens mit oder ohne Zeit-Frequenz-Transformationen, dadurch gekennzeichnet, daß durch einen Prädiktor die Teilbänder auf Rauschhaftigkeit hin untersucht werden, daß diejenigen Bänder, die vorzugsweise Rauschen enthalten, nicht durch ihre Zeitfunktionen, sondern nur durch ihren Mittelwert gekennzeichnet werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die tonalen (nicht rauschhaften) Teilbänder im Zeit- oder Frequenzbereich durch diskrete und quantisierte Werte codiert sind.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß jedes Teilband einem individuellen Prädiktor zugeführt wird, daß eine bestimmte Anzahl an Abtastwerten zu einer Gruppe zusammengefaßt wird, daß der Schätzfehler dieser Gruppe berechnet wird und daß diese Gruppe von Abtastwerten zu den rauschhaften Gruppen zugeordnet wird, falls dieser Schätzfehler im Verhältnis zum Pegel der Abtastwerte dieser Gruppe ein gewisses Maß überschreitet.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zusätzlich in jedem Teilband Signalsprünge und stärkere Pegelschwankungen detektiert werden und bei ihrem Auftreten auf eine Zuordnung zu den rauschhaften Gruppen verzichtet wird.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Vermeidung von Übersteuerungen auf eine Zuordnung zu den rauschhaften Gruppen verzichtet wird, falls die Summe der Leistungen aller Abtastwerte sämtlicher Teilbandgruppen zu einem Zeitpunkt ein gewisses Maß überschreitet.
6. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß auf eine Zuordnung zu den rauschhaften Gruppen verzichtet wird, falls in der Kurzzeittransformierten dieser Gruppe ein ausgeprägtes Maximum zu finden ist.
7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß zur Rekonstruktion des Zeitverlaufs einer rauschhaften Gruppe deren Mittelwert verwendet wird, um einen Rauschgenerator so einzustellen, daß er denselben Mittelwert hat und daß dessen Zeitfunktion anstelle der ursprünglichen Zeitfunktion verwendet wird.
DE1995109149 1995-03-14 1995-03-14 Codierverfahren Withdrawn DE19509149A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE1995109149 DE19509149A1 (de) 1995-03-14 1995-03-14 Codierverfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1995109149 DE19509149A1 (de) 1995-03-14 1995-03-14 Codierverfahren

Publications (1)

Publication Number Publication Date
DE19509149A1 true DE19509149A1 (de) 1996-09-19

Family

ID=7756615

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1995109149 Withdrawn DE19509149A1 (de) 1995-03-14 1995-03-14 Codierverfahren

Country Status (1)

Country Link
DE (1) DE19509149A1 (de)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19747885A1 (de) * 1997-10-30 1999-05-06 Daimler Chrysler Ag Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
WO2003107328A1 (en) * 2002-06-17 2003-12-24 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
US7685218B2 (en) 2001-04-10 2010-03-23 Dolby Laboratories Licensing Corporation High frequency signal construction method and apparatus
US8126709B2 (en) 2002-03-28 2012-02-28 Dolby Laboratories Licensing Corporation Broadband frequency translation for high frequency regeneration
US8396574B2 (en) 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19747885B4 (de) * 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
DE19747885A1 (de) * 1997-10-30 1999-05-06 Daimler Chrysler Ag Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
US7685218B2 (en) 2001-04-10 2010-03-23 Dolby Laboratories Licensing Corporation High frequency signal construction method and apparatus
US9412389B1 (en) 2002-03-28 2016-08-09 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal by copying in a circular manner
US9412388B1 (en) 2002-03-28 2016-08-09 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal with temporal shaping
US8285543B2 (en) 2002-03-28 2012-10-09 Dolby Laboratories Licensing Corporation Circular frequency translation with noise blending
US10269362B2 (en) 2002-03-28 2019-04-23 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for determining reconstructed audio signal
US9767816B2 (en) 2002-03-28 2017-09-19 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal with phase adjustment
US9704496B2 (en) 2002-03-28 2017-07-11 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal with phase adjustment
US9653085B2 (en) 2002-03-28 2017-05-16 Dolby Laboratories Licensing Corporation Reconstructing an audio signal having a baseband and high frequency components above the baseband
US9548060B1 (en) 2002-03-28 2017-01-17 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal with temporal shaping
US9466306B1 (en) 2002-03-28 2016-10-11 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal with temporal shaping
US9412383B1 (en) 2002-03-28 2016-08-09 Dolby Laboratories Licensing Corporation High frequency regeneration of an audio signal by copying in a circular manner
US9343071B2 (en) 2002-03-28 2016-05-17 Dolby Laboratories Licensing Corporation Reconstructing an audio signal with a noise parameter
US9324328B2 (en) 2002-03-28 2016-04-26 Dolby Laboratories Licensing Corporation Reconstructing an audio signal with a noise parameter
US9177564B2 (en) 2002-03-28 2015-11-03 Dolby Laboratories Licensing Corporation Reconstructing an audio signal by spectral component regeneration and noise blending
US8126709B2 (en) 2002-03-28 2012-02-28 Dolby Laboratories Licensing Corporation Broadband frequency translation for high frequency regeneration
US10529347B2 (en) 2002-03-28 2020-01-07 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for determining reconstructed audio signal
US9947328B2 (en) 2002-03-28 2018-04-17 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for determining reconstructed audio signal
US8457956B2 (en) 2002-03-28 2013-06-04 Dolby Laboratories Licensing Corporation Reconstructing an audio signal by spectral component regeneration and noise blending
US7337118B2 (en) 2002-06-17 2008-02-26 Dolby Laboratories Licensing Corporation Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US8050933B2 (en) 2002-06-17 2011-11-01 Dolby Laboratories Licensing Corporation Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
US8032387B2 (en) 2002-06-17 2011-10-04 Dolby Laboratories Licensing Corporation Audio coding system using temporal shape of a decoded signal to adapt synthesized spectral components
EP1736966A2 (de) * 2002-06-17 2006-12-27 Dolby Laboratories Licensing Corporation Verfahren zur Erzeugung von Toninformationen
WO2003107328A1 (en) * 2002-06-17 2003-12-24 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100991450B1 (ko) 2002-06-17 2010-11-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
EP1736966A3 (de) * 2002-06-17 2007-11-07 Dolby Laboratories Licensing Corporation Verfahren zur Erzeugung von Toninformationen
CN100369109C (zh) * 2002-06-17 2008-02-13 杜比实验室特许公司 使用频谱孔填充的音频编码系统
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
USRE43985E1 (en) 2002-08-30 2013-02-05 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
US8396574B2 (en) 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness

Similar Documents

Publication Publication Date Title
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
EP1025646B1 (de) Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms
DE69006011T3 (de) Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität.
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE69732159T2 (de) Geschaltete Filterbank für Audiosignalkodierung
DE69933119T2 (de) Verfahren und vorrichtung zur maskierung des quantisierungsrauschens von audiosignalen
EP1230827B1 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
EP0414838B1 (de) Verfahren zur übertragung eines signals
EP0954909A1 (de) Verfahren zum codieren eines audiosignals
DE3506912A1 (de) Verfahren zur uebertragung eines audiosignals
WO1999004505A1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
EP0962015B1 (de) Verfahren und vorrichtungen zum codieren von diskreten signalen bzw. zum decodieren von codierten diskreten signalen
DE69533259T2 (de) Nichtlineares quantisieren eines informationssignales
DE60311619T2 (de) Datenreduktion in Audiokodierern unter Ausnutzung nichtharmonischer Effekte
EP0287578A1 (de) Digitales codierverfahren.
DE60028500T2 (de) Sprachdekodierung
DE19509149A1 (de) Codierverfahren
DE602004004445T2 (de) Vorrichtungen zum Komprimieren und Dekomprimieren von Sprache und Verfahren zum Bereitstellen von skalierbaren Bandbreitestrukturen
DE10310785A1 (de) Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen
EP0464534B1 (de) Transformationskodierer mit adaptiver Fensterfunktion

Legal Events

Date Code Title Description
8139 Disposal/non-payment of the annual fee