DE60210479T2 - Audiokodierer mit unregelmässiger filterbank - Google Patents

Audiokodierer mit unregelmässiger filterbank Download PDF

Info

Publication number
DE60210479T2
DE60210479T2 DE60210479T DE60210479T DE60210479T2 DE 60210479 T2 DE60210479 T2 DE 60210479T2 DE 60210479 T DE60210479 T DE 60210479T DE 60210479 T DE60210479 T DE 60210479T DE 60210479 T2 DE60210479 T2 DE 60210479T2
Authority
DE
Germany
Prior art keywords
matrix
filters
segmentation
group
combined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60210479T
Other languages
English (en)
Other versions
DE60210479D1 (de
Inventor
A. Omar NIAMUT
Richard Heusdens
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE60210479D1 publication Critical patent/DE60210479D1/de
Publication of DE60210479T2 publication Critical patent/DE60210479T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Piezo-Electric Or Mechanical Vibrators, Or Delay Or Filter Circuits (AREA)
  • Analogue/Digital Conversion (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

  • Die vorliegende Erfindung betrifft das Kodieren und Dekodieren von Audiosignalen.
  • 1(a) zeigt ein prinzipielles Blockdiagramm für ein System einschließlich einer herkömmlichen M-Kanal-Analysefilterbank 10 und einer Synthesefilterbank 12. Die Analysefilterbank umfasst eine Kollektion von Digitalfiltern Hk(z), k = 0, ... M – 1, jedes mit einem zugeordneten Ausgangskanal und einem gemeinsamen Eingang x(n). Die Synthesefilterbank umfasst eine Kollektion von Filtern Fk(z), jedes mit einem zugeordneten Eingangskanal und einem gemeinsamen Ausgang y(n). In der Analysefilterbank 10 wird jeder Kanal durch einen Faktor M dezimiert, und in der Synthesefilterbank 12 wird er durch einen Faktor M interpoliert. Wenn der Interpolationsgrad gleich dem Dezimierungsgrad ist, wie in dem Beispiel, dann ist die Filterbank kritisch bemustert, und wenn alle Filter die gleiche Bandbreite aufweisen, dann ist die Filterbank eine gleichförmige Filterbank.
  • Die M-Kanäle, welche durch die Analysefilterbank 10 ausgegeben werden, können auf einer beliebigen Anzahl von Wegen bearbeitet werden. Bildet die Analysefilterbank 10 zum Beispiel einen Teil eines Audiokodierers, dann können für ein gegebenes Aktualisierungsintervall die Kanaldaten und eventuell die Filterbandstruktur in einem Bitstrom kodiert werden, der das Audiosignal x(n) verkörpert. Bildet die Synthesefilterbank 12 einen Teil eines Audiodekoders, dann kann die Synthesefilterbankstruktur mit den Kanaldaten kombiniert werden, um das Signal y(n) zu erzeugen. Alternativ können beide Bänke 10, 12 in einem Audiobearbeitungssystem enthalten sein, wo zum Beispiel das Signal x(n) einer gewissen Art von Nachbearbeitung unterworfen wird, wobei das bearbeitete Signal y(n) auf einem Speichermedium gespeichert oder auf einem Übertragungsmedium übertragen wird.
  • In einer kosinusmodulierten Filter-(CMF)-Bank sind die Analyse- und Synthesefilter kosinusmodulierte Versionen eines einzigen Prototypfilters. Eine bekannte Formel für die Analyse- und Synthesefilter ist:
    Figure 00020001
    wobei α ∊ Z die Modulationsphase ist, und β = 0 für die Kosinusmodulation und β = 1 für die Sinusmodulation gilt.
  • Es ist bekannt, dass gleichförmige CMF-Bänke, die zuweilen als Pseudo-QMF-(Quadratur-Spiegelfilter)-Bänke oder modulierte überlappte Transformationen bezeichnet werden, bei derartigen Anwendungen wie das Kodieren von Digitalsignalen verwendet werden. Der Begriff perfekte Rekonstruktion (PR) wird auf Filterbänke angewendet, in denen die Ausgabe y(n) eine skalierte und verzögerte Version der Eingabe x(n) ist. Die Theorie für den Entwurf von gleichförmigen PR-CMF-Bänken ist gut begründet, und in dem obigen Falle kann die PR-Eigenschaft durch geeignete Wahl von α und des Prototypfilters Po erfüllt werden. Für die Zwecke der vorliegenden Beschreibung dient als Beispiel für Po ein phasenlineares Tiefpassfilter der Länge N mit reellen Koeffizienten mit einem Durchlassband in
    Figure 00020002
    und einem unendlich gedämpften Sperrband, siehe 2, das heißt:
    Figure 00020003
  • Einige Anwendungen erfordern den Einsatz von ungleichförmigen Filterbänken, d.h. Filterbänken, in denen die Filter variierende Bandbreiten aufweisen. In der Audiokodierung ist es zum Beispiel wünschenswert, Filterbänke bereitzustellen, die sich an die Zeit-Frequenz-Energieverteilung und die Kenngrößen des Eingangssignals anpassen können. Der Entwurf von ungleichförmigen Filterbänken ist im Allgemeinen ziemlich komplex, einige neuere Verfahren ermöglichen jedoch das Entwerfen ungleichförmiger CMF-Bänke.
  • Zum Beispiel H.S.Malvar, „Biorthogonal an non-uniform lapped transforms for transform coding with reduced blocking and ringing artefacts", IEEE Trans. Signal Pro cessing, Bd. 46, Nr. 4, S. 1043–1053, April 1998 und H.S.Malvar „Enhancing the performance of sub-band audio coders for speech signals", in Proc. Int. Symp. Circuits and Systems 1998, S. 90–101, Juni 1998 sowie die US-Patentschrift Nr. 6,115,689; Malvar offenbart ein Verfahren für das Konstruieren ungleichförmiger modulierter überlappter Transformationen (MLT). Dies schließt das Kombinieren von Teilbandfiltern einer gleichförmigen MLT ein, und es wird hier als Teilband-Vereinigen bezeichnet. Die kombinierten Teilbandfilter weisen auf Kosten einer Abnahme der Frequenz-Lokalisierung eine bessere Zeitlokalisierung auf als die nicht kombinierten Filter. Da die ungleichförmigen Filterbänke erhalten werden, indem einfach Linearkombinationen von Filtern einer gleichförmigen MLT genommen werden, ermöglicht das Verfahren eine effiziente Realisierung zeitlich veränderlicher Transformationen. Malvar offenbart, dass das Teilband-Vereinigen vorteilhaft zur Verringerung von Rufartefakten, wie z.B. des Nachhalls und des Vorechos, in der Audio- und Sprachkodierung verwendet werden kann. Der Entwurf solcher Transformationen ist jedoch in verschiedener Hinsicht eingeschränkt: es können nur 2- oder 4-Teilband-Filter kombiniert werden, und es wird nur eine feste Zahl von Paaren von Hochfrequenzkoeffizienten kombiniert, d.h. 16 × 2-Filter, 8 × 4-Filter. Außerdem wird kein systematisches Entwurfsverfahren offenbart. Insbesondere im Falle der kombinierten 4-Teilband-Filter wird ein komplizierter Parametersatz gewählt, um die erforderliche Ausgabe zu gewährleisten.
  • Gemäß vorliegender Erfindung wird ein Verfahren entsprechend Anspruch 1 bereitgestellt.
  • Die vorliegende Erfindung stellt ein Teilband-Vereinigungsverfahren bereit, das es ermöglicht, eine beliebige Zahl von Teilbändern auf einem systematischen Wege zu kombinieren. Die bevorzugten Ausführungsformen zeigen, dass ausgehend von einer gleichförmigen CMF-Bank Linearkombinationen der Filterbausteine derart zusammengestellt werden können, dass die entstehenden kombinierten Filter gute Frequenzauswahleigenschaften und ein flaches Ansprechverhalten des Durchlassbandes aufweisen.
  • Es werden nun Ausführungsformen der Erfindung mit Bezug auf die beigefügten Zeichnungen beschrieben, in denen:
  • 1(a) ein Blockdiagramm einer herkömmlichen Analyse/Synthese-Filterbank ist;
  • 1(b) ein Blockdiagramm einer Analyse/Synthese-Filterbank gemäß einer bevorzugten Ausführungsform der Erfindung ist;
  • 2 die Kenngrößen eines Prototypfilters Po veranschaulicht, welcher in der bevorzugten Ausführungsform der Erfindung verwendet wird;
  • 3(a) und (b) Zeitverläufe einer Filterbank der bevorzugten Ausführungsform mit denen einer Filterbank vom Stand der Technik vergleichen, wobei (a) sich auf den Stand der Technik und (b) auf die bevorzugte Ausführungsform bezieht;
  • 4(a) und (b) Amplitudenverläufe einer Filterbank der bevorzugten Ausführungsform mit denen einer Filterbank vom Stand der Technik vergleicht, wobei (a) sich auf den Stand der Technik und (b) auf die bevorzugte Ausführungsform bezieht;
  • 5 eine praktische Ausführungsform einer Filterbank gemäß der vorliegenden Erfindung zeigt.
  • In einer bevorzugten Ausführungsform der vorliegenden Erfindung nach 1(b) umfasst eine maximal dezimierte gleichförmige M-Kanal-CMF-Bank 10, 12 die Filter Hk(z), Fk(z), die durch Kosinusmodulation eines einzigen Prototypfilters Po, im Idealfall wie in 2 dargestellt, abgeleitet werden. Ein Lokalisierungsmodul 14 stellt nach einer Analyse der Zeit-Frequenz-Energieverteilung und aus den Signalkenngrößen des Signals x(n) in einem gegebenen Zeitintervall fest, dass es vorteilhaft ist, zugunsten einer erhöhten Zeitauflösung die Frequenz-Segmentierung zu delokalisieren, um eine verbesserte Qualität des kodierten Signals zu erbringen. (Alternativ kann der Modul 14 feststellen, dass ein Verringern der Gesamtbitrate bei einem Beibehalten der gleichen Qualitätsstufe möglich sein kann, wenn die Frequenz-Segmentierung delokalisiert ist.)
  • So stellt der Modul 14 in dem Beispiel von 1(b) fest, dass x Gruppen von Filtern, die eine beliebige Anzahl p ≤ M benachbarter Filter in der gleichförmigen CMF-Bank umfassen, in Segmentierungsmatrizen S1, ...Sx zu kombinieren sind, um eine ungleichförmige Filterbank zu erhalten.
  • (Obwohl es für die vorliegende Erfindung nicht notwendig ist, wird in der vorliegenden Beschreibung angenommen, dass eine Gesamtzahl von M Ausgangskanälen nach der Segmentierung hergestellt ist.) Das kodierte Signal, das Kanaldaten und Hinweise auf die in jedem gegebenen Zeitintervall zu verwendende Frequenz-Segmentierung enthält, wird in inversen Segmentierungsmatrizen S–1 1, ...S–1 x dekodiert, um Eingaben für eine gleichförmige Synthesefilterbank 12 bereitzustellen.
  • Damit die ungleichförmige Filterbank einen geeigneten Frequenzgang aufweist, müssen die Größencharakteristiken ihrer Filter eine gute Frequenzselektivität und ein flaches Ansprechverhalten des Durchlassbandes aufweisen. Um zu veranschaulichen, dass die Erfindung diese Selektivitäts- und Ansprechverhaltenscharakteristiken bereitstellt, wird ein vereinigtes Filter Hpk(z) als eine Linearkombination von p benachbarten Filtern, die von dem k-ten Filter in einer gleichförmigen CMF-Bank ausgehen, angesehen, d.h.
    Figure 00050001
    wobei bk = ejφK die kombinatorischen Koeffizienten vom Betrag 1 sind. Wenn |Hp,k(z)|2 (oder äquivalent
    Figure 00050002
    ist, dann weist Hp,k(z) ein flaches Ansprechverhalten des Durchlassbandes und eine Durchgangsbandbreite auf, die ähnlich sind zu denen der zugrundeliegenden Teilbandfilter mit gleichförmigen Abständen. Erfüllt das Prototypfilter die Bedingung hinsichtlich der Sperrbandabsenkung (wie das Beispiel für Po), dann gibt es keine spektrale Überlappung zwischen den Filtern Hk(z) und H1(z) für |k – 1| ≥ 2, so dass
    Figure 00050003
    und Null in seinem Sperrband ist.
  • Es wird nichtsdestoweniger ersichtlich, dass das Prototypfilter Po bei praktischen Anwendungen nicht realisiert werden kann, weil es Filter unendlicher Länge erfordert. Deshalb existieren unter praktischen Umständen Überlappungsglieder im Frequenzbereich von nicht benachbarten Filtern, die Welligkeiten im Durchlassband der kombinierten Filter ergeben. Indem jedoch die Sperrbanddämpfung des Prototypfilters hoch gehalten wird, werden diese Welligkeiten auf einem Minimum gehalten.
  • Im Folgenden werden notwendige und hinreichende Bedingungen für die Modulationsphase (d.h. für die gleichförmige Filterbank) und die kombinatorischen Koeffizienten derart angegeben, dass die entstehenden kombinierten Filter tatsächlich das geforderte Frequenzverhalten aufweisen.
  • Für das Prototypfilter Po von 2 und bk = ejφK, k = 0, ...,M – 1 ergibt sich
    Figure 00050004
    für 1 ≤ p ≤ M und 0 ≤ k ≤ M – p dann und nur dann, wenn α = (N – 1) – M(2m + 1), m ∊ Z und |φk – φk+1| = n π,
    Figure 00050005
  • Es kann den Anschein haben, dass die Bedingung für α eine neue Einschränkung für die zugrundeliegende gleichförmige CMF-Bank darstellt, was aber nicht der Fall ist. Die meisten aus der Literatur bekannten CMF-Bänke erfüllen die Bedingung für α, weil sich die Aliasing- und Betragsverzerrung erster Ordnung für ω ∊ {0,π} aufheben. Hin sichtlich der Bedingung für die bk läuft das darauf hinaus, dass kombinatorische Koeffizienten vom Betrag 1 zu wählen sind, die sich nur im Vorzeichen unterscheiden können.
  • Der Kombinationsvorgang kann durch eine Matrixmultiplikation dargestellt werden. Es wird das Beispiel betrachtet, in dem zwei Filter (p = 2) kombiniert werden. Wird eine Matrix A definiert, welche die Impulsantworten der Analysefilter der gleichförmigen CMF-Bank gemäß
    Figure 00060001
    enthält, dann kann eine Matrix A', welche die Impulsantworten der Analysefilter der ungleichförmigen CMF-Bank enthält, durch Matrixmultiplikation A' = S A erzeugt werden, wobei
    Figure 00060002
  • Die kombinatorischen Koeffizienten bk stehen in den Zeilen des Blockdiagonalelements von S, welches in diesem Falle eine Hadamardsche Matrix der Ordnung 2, eine nicht singuläre Matrix, ist.
  • Im Falle p > 2 ist das nicht singuläre Blockdiagonalelement in S von der Ordnung p × p mit den Elementen ±1. In der bevorzugten Ausführungsform ist eine solche nicht singuläre Matrix die p × p-Hauptuntermatrix einer Hadamardschen Matrix einer Ordnung N ≥ p.
  • Somit können gemäß vorliegender Erfindung ungleichförmige PR-CMF-Bänke, die eine gewünschte Filterbankstruktur verkörpern, in einem Kodierer durch eine Matrixmultiplikation der Komponentenfilter und nicht singuläre Blöcke von Hadamardschen Matrizen bereitgestellt werden.
  • In dem Dekoder kann für p = 2n,
    Figure 00060003
    das segmentierte Signal A' = S A mit der Transponierten ST der Matrix S multipliziert werden, um eine skalierte Version des ursprünglichen Signals bereitzustellen. Somit kann die Transformation A S → ST A' durch geeignetes Skalieren der kombinatorischen Koeffizienten bk unitär (orthonormal) gemacht werden, so dass unter der Annahme, dass die ursprüngliche gleichförmige Filterbank unitär ist, auch die ungleichförmige Filterbank unitär ist. Zum Beispiel ist für p = 4 die Matrix S gleich:
    Figure 00070001
  • Wird diese mit ihrer Transponierten multipliziert, dann wird eine Einheitsmatrix mit Elementgrößen von 4 erhalten, und so sollte in diesem Falle ein Koeffizient bk = 1/2 für ein unitäres System verwendet werden. Für p = 2 sollte auf gleiche Weise bk = 1/√2 verwendet werden.
  • Für p ≠ 2n,
    Figure 00070002
    muss die inverse statt der transponierten Matrix beim Synthesevorgang verwendet werden, so dass SS–1 die Einheitsmatrix ergibt. (An sich ist dies beim Berechnen nicht so effizient wie p = 2n.)
  • Die Segmentierungsmatrizen S, S–1 können für eine beliebige gleichförmige Filterbank gestaffelt realisiert werden. 5 veranschaulicht zum Beispiel eine Analysefilterbank 10' in der Form, die in einem MPEG-Kodierer verwendet wird. In diesem Falle ist das Eingabesignal x(n) durch eine abgegriffene Verzögerungsstrecke mit jedem sukzessiv verzögerten Signal, das durch einen Faktor M dezimiert ist, verbunden. Im Vergleich mit dem in den 1(a) und (b) gezeigten Schema bedeutet dieses Schema, dass nur dezimierte Signale gefiltert werden statt umgekehrt. Die dezimierten Signale werden durch jeweilige Paare von Filterfunktionen Gm(–z2) gefiltert, und ihre Ausgabedaten werden in einem Kosinus-Modulationsmodul vernetzt, der M Ausgangskanäle erzeugt.
  • Wie in dem Falle von 1(b), wo ein Lokalisierungsmodul 14 feststellt, dass die Frequenz-Delokalisierung in einem gegebenen Teilband die Qualität des Ansprechverhaltens durch Verbesserung der Zeitauflösung verbessern wird, werden dann eine oder mehrere Gruppen von benachbarten Filterausgangskanälen dementsprechend im Segmentierungsmatrixsystem S kombiniert, das ein oder mehrere Hauptuntermatrizen von Hadamardschen Matrizen umfasst, wie oben beschrieben ist.
  • Somit können für ein beliebiges Aktualisierungsintervall Gruppen von diesen Filterausgangskanälen segmentiert werden, um individuelle Filter zu kombinieren und so die Frequenzselektion zu delokalisieren, aber zur gleichen Zeit die Zeitauflösung des Bitstroms zu verbessern. Die spezifischen Verfahren, die durch den Lokalisierungsmodul 14 zur Bestimmung der optimalen Zeit-Frequenz-Segmentierung verwendet werden, liegen außerhalb des Reichweite der vorliegenden Beschreibung, einige werden aber zum Beispiel bei Malvar besprochen. Im Allgemeinen jedoch schließen diese eine Kostenaufrechnung Verzerrung gegen Bitrate ein, und sie können zur Frequenz-Segmentierung allein oder in Kombination mit einem anpassungsfähigen Zeit-Segmentierungssystem verwendet werden.
  • Um die Ergebnisse von Filterbänken, die gemäß der Erfindung vereinigt sind, mit denen der Filterbänke, die bei Malvar offenbart sind, zu vergleichen, werden 4 Teilbandfilter in einer 64-Kanal-MLT kombiniert. Die resultierenden Zeit- und Frequenzgänge der kombinierten Filter sind in 3 bzw. 4 dargestellt. 3(a) und 4(a) zeigen Ergebnisse, die bei Malvar offenbart sind, während 3(b) und 4(b) Ergebnisse für die vorliegende Erfindung darstellen. Durch Prüfen der Figuren kann ersichtlich werden, dass die vorliegende Erfindung für eine vergleichbare Zeitlokalisierung bessere Frequenzgänge liefert.
  • Somit kann dann, wenn eine vergleichbare Qualitätsstufe zum Beispiel mit Bezug auf Malvar gefordert ist, ein Audiokodierer der die Segmentierungsmatrizen enthält, entsprechend der bevorzugten Ausführungsform der vorliegenden Erfindung seine Bitrate verringern und so Gesamtbandbreite einsparen. Alternativ wird für die gleiche Bitrate eine verbesserte Qualität bereitgestellt.
  • Legende der Zeichnungen
    • 1a
    • Prior Art Stand der Technik
    • Processing Bearbeitung
    • 1b
    • 14 Lokalisierung
    • Process Prozess
    • 4a, 4b
    • Magnitude response (dB) Amplitudengang (dB)
    • Normalized frequency normierte Frequenz
    • 5
    • 14 Lokalisierung
    • cosine-modulation block Kosinus-Modulationsblock

Claims (11)

  1. Verfahren zum Kodieren eines Audiosignals (x(n)), wobei das Verfahren die Schritte umfasst: Bereitstellen des Signals (x(n)) als eine Eingabe in eine gleichförmige Analysefilterbank (10), wobei die Analysefilterbank eine Anzahl von kosinusmodulierten Filtern (Hk(z)) umfasst, wobei jeder Filter ein jeweiliges Ausgabesignal bereitstellt; Bestimmen (14) einer ungleichförmigen Segmentierung der Analysefilterbank, wobei mindestens eine Gruppe von drei oder mehr Filtern für mindestens ein Zeitintervall des Audiosignals zu kombinieren ist; Kombinieren der mindestens einen Gruppe von Filtern mit einer jeweiligen Segmentierungsmatrix (S1...Sx), wobei jede Matrix eine p × p-Hauptuntermatrix einer Hadamardschen Matrix umfasst, wobei p gleich der Anzahl der in einer Gruppe zu kombinierenden Filter ist; und Kodieren der Ausgabe der Filter und der Segmentierungsmatrizen und jeweiliger Hinweise auf die Segmentierung im Bitstrom.
  2. Verfahren nach Anspruch 1, das außerdem den Schritt umfasst: Multiplizieren der Koeffizienten jeder Hadamardschen Matrix mit einem kombinatorischen Koeffizienten (bk), so dass die Matrixkombination orthonormal ist.
  3. Verfahren zum Dekodieren eines Bitstroms, wobei das Verfahren die Schritte umfasst: Lesen des Bitstroms, um eine Anzahl von Datenkanälen bereitzustellen, die Frequenzbändern in einer ungleichförmigen Synthesefilterbank entsprechen; Bestimmen einer ungleichförmigen Segmentierung der Synthesefilterbank aus dem Bitstrom, wobei mindestens eine Gruppe von drei oder mehr Datenkanälen für mindestens ein Zeitintervall des Bitstroms zu kombinieren ist; Kombinieren der mindestens einen Gruppe von Datenkanälen mit einer jeweiligen Segmentierungsmatrix (S–1 1...S–1 x), wobei jede Matrix eine p × p-Hauptuntermatrix einer Hadamardschen Matrix umfasst, wobei p gleich der Anzahl der in einer Gruppe zu kombinierenden Filter ist; und Bereitstellen der Ausgabe der mindestens einen Kombination als jeweilige Kanaleingaben in eine gleichförmige Synthesefilterbank (12), die eine Anzahl von kosinusmodulierten Filtern (Fk(z)) umfasst, wobei die Filter ein gemeinsames Ausgabesignal (y(n)) bereitstellen.
  4. Verfahren nach Anspruch 3, wobei p gleich einer ganzzahligen Potenz von zwei ist und wobei jede Segmentierungsmatrix eine Transponierte einer Hadamardschen Matrix p × p umfasst.
  5. Verfahren nach Anspruch 3, wobei p nicht gleich einer ganzzahligen Potenz von zwei ist und wobei jede Segmentierungsmatrix eine Inverse einer Hadamardschen Matrix p × p umfasst.
  6. Verfahren nach Anspruch 4 oder 5, außerdem den Schritt umfassend: Multiplizieren der Koeffizienten jeder Hadamardschen Matrix mit einem kombinatorischen Koeffizienten (bk), so dass die Matrixkombination unitär ist.
  7. Audiokodierer, umfassend: Mittel zum Bereitstellen eines Audiosignals (x(n)) als eine Eingabe in eine gleichförmige Analysefilterbank (10), wobei die Analysefilterbank eine Anzahl von kosinusmodulierten Filtern (Hk(z)) umfasst, wobei jeder Filter ein jeweiliges Ausgabesignal bereitstellt; Mittel zum Bestimmen (14) einer ungleichförmigen Segmentierung der Analysefilterbank, wobei mindestens eine Gruppe von drei oder mehr Filtern für mindestens ein Zeitintervall des Audiosignals zu kombinieren ist; Mittel zum Kombinieren der mindestens einen Gruppe von Filtern mit einer jeweiligen Segmentierungsmatrix (S1...Sx), wobei jede Matrix eine p × p-Hauptuntermatrix einer Hadamardschen Matrix umfasst, wobei p gleich der Anzahl der in einer Gruppe zu kombinierenden Filter ist; und einen Kodierer zum Bereitstellen der Ausgabe der Filter und der Segmentierungsmatrizen und jeweiliger Hinweise auf die Segmentierung im Bitstrom.
  8. Audioplayer, umfassend: Mittel zum Lesen eines Bitstroms, um eine Anzahl von Datenkanälen bereitzustellen, die den Frequenzbändern in einer ungleichförmigen Synthesefilterbank entsprechen; Mittel zum Bestimmen einer ungleichförmigen Segmentierung der Synthesefilterbank aus dem Bitstrom, wobei mindestens eine Gruppe von drei oder mehr Datenkanälen für mindestens ein Zeitintervall des Bitstroms zu kombinieren ist; Mittel zum Kombinieren der mindestens einen Gruppe von Datenkanälen mit einer jeweiligen Segmentierungsmatrix (S–1 1...S–1 x), wobei jede Matrix eine p × p-Hauptuntermatrix einer Hadamardschen Matrix umfasst, wobei p gleich der Anzahl der in einer Gruppe zu kombinierenden Filter ist; und Mittel zum Bereitstellen der Ausgabe der mindestens einen Kombination als jeweilige Kanaleingaben in eine gleichförmige Synthesefilterbank (12), die eine Anzahl von kosinusmodulierten Filtern (Fk(z)) umfasst, wobei die Filter ein gemeinsames Ausgabesignal (y(n)) bereitstellen.
  9. Audiosystem, einen Audiokodierer nach Anspruch 7 und einen Audioplayer nach Anspruch 8 umfassend.
  10. Bitstrom, der Daten für eine Anzahl vom Kanälen umfasst, die Frequenzbändern in einer ungleichförmigen Synthesefilterbank entsprechen, welche eine Anzahl von kosinusmodulierten Filtern (Fk(z)) umfasst; und einen Hinweis auf eine ungleichförmige Segmentierung der Synthesefilterbank, wobei mindestens eine Gruppe von drei oder mehr Datenkanälen für mindestens ein Zeitintervall des Bitstroms mit einer jeweiligen Segmentierungsmatrix (S–1 1...S–1 x) zu kombinieren ist, wobei jede Matrix eine p × p-Hauptuntermatrix einer Hadamardschen Matrix umfasst, wobei p gleich der Anzahl der in einer Gruppe zu kombinierenden Filter ist.
  11. Speichermedium, in dem ein Bitstrom gemäß Anspruch 10 gespeichert ist.
DE60210479T 2001-08-21 2002-08-14 Audiokodierer mit unregelmässiger filterbank Expired - Fee Related DE60210479T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01203161 2001-08-21
EP01203161 2001-08-21
PCT/IB2002/003316 WO2003019532A1 (en) 2001-08-21 2002-08-14 Audio coding with non-uniform filter bank

Publications (2)

Publication Number Publication Date
DE60210479D1 DE60210479D1 (de) 2006-05-18
DE60210479T2 true DE60210479T2 (de) 2007-04-12

Family

ID=8180810

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60210479T Expired - Fee Related DE60210479T2 (de) 2001-08-21 2002-08-14 Audiokodierer mit unregelmässiger filterbank

Country Status (7)

Country Link
US (1) US20040254797A1 (de)
EP (1) EP1421579B1 (de)
JP (1) JP2005501277A (de)
CN (1) CN1223992C (de)
AT (1) ATE322734T1 (de)
DE (1) DE60210479T2 (de)
WO (1) WO2003019532A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778196B2 (en) * 2005-05-31 2010-08-17 Avaya Inc. Method and apparatus for link performance measurements in a packet-switched network
DE602006017931D1 (de) * 2005-08-02 2010-12-16 Gn Resound As Hörhilfegerät mit Windgeräuschunterdrückung
KR101015037B1 (ko) * 2006-03-29 2011-02-16 돌비 스웨덴 에이비 오디오 디코딩
TWI559680B (zh) * 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
EP3723090B1 (de) 2009-10-21 2021-12-15 Dolby International AB Überabtastung in einer kombinierten umsetzer-filterbank
US10158375B1 (en) 2018-03-21 2018-12-18 Nxp Usa, Inc. PDM bitstream to PCM data converter using Walsh-Hadamard transform

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE3902948A1 (de) * 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5913186A (en) * 1996-03-25 1999-06-15 Prometheus, Inc. Discrete one dimensional signal processing apparatus and method using energy spreading coding
US5805739A (en) * 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder

Also Published As

Publication number Publication date
CN1223992C (zh) 2005-10-19
EP1421579B1 (de) 2006-04-05
JP2005501277A (ja) 2005-01-13
CN1545697A (zh) 2004-11-10
ATE322734T1 (de) 2006-04-15
DE60210479D1 (de) 2006-05-18
EP1421579A1 (de) 2004-05-26
US20040254797A1 (en) 2004-12-16
WO2003019532A1 (en) 2003-03-06

Similar Documents

Publication Publication Date Title
DE69732159T2 (de) Geschaltete Filterbank für Audiosignalkodierung
DE4316297C1 (de) Frequenzanalyseverfahren
DE69107841T2 (de) Transformationskodierer und -dekodierer mit adaptiver blocklänge, adaptiver transformation und adaptivem fenster für hochwertige tonsignale.
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE60207841T2 (de) Alias-reduktion unter verwendung komplex-exponentiell modulierter filterbänke
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
EP1025646B1 (de) Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms
DE60225130T2 (de) Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
DE102008015702B4 (de) Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
DE69006011T3 (de) Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität.
EP1495464B1 (de) Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten
EP1647009B1 (de) Vorrichtung und verfahren zum verarbeiten eines signals
DE10236694A1 (de) Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
DE60118800T2 (de) Einheitsfilterbank zur Audiocodierung
EP1397799B1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
DE69833749T2 (de) Filterbankanordnung und verfahren zur filterung und trennung eines informationssignals in unterschiedlichen frequenzbändern, insbesondere für audiosignale in hörhilfegeräten
EP1654674B1 (de) Vorrichtung und verfahren zum verarbeiten von wenigstens zwei eingangswerten
EP1525576B1 (de) Vorrichtung und verfahren zum erzeugen einer komplexen spektraldarstellung eines zeitdiskreten signals
DE10392425T5 (de) Audiorückkoppelungsverarbeitungssystem
DE60124079T2 (de) Sprachverarbeitung
EP0696848B1 (de) Verfahren zur digitalen Interpolation von Signalen
DE60311891T2 (de) Audiocodierung
DE69206300T2 (de) Verfahren und Einrichtung zur Bearbeitung von Vorechos eines mittels einer Frequenztransformation kodierten digitalen Audiosignals.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee