DE60202881T2 - Wiederherstellung von hochfrequenzkomponenten - Google Patents

Wiederherstellung von hochfrequenzkomponenten Download PDF

Info

Publication number
DE60202881T2
DE60202881T2 DE60202881T DE60202881T DE60202881T2 DE 60202881 T2 DE60202881 T2 DE 60202881T2 DE 60202881 T DE60202881 T DE 60202881T DE 60202881 T DE60202881 T DE 60202881T DE 60202881 T2 DE60202881 T2 DE 60202881T2
Authority
DE
Germany
Prior art keywords
signal
frequency
spectral
coded
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60202881T
Other languages
English (en)
Other versions
DE60202881D1 (de
Inventor
Kristofer KJÖRLING
Per Ekstrand
Holger HÖRICH
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20286143&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE60202881(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of DE60202881D1 publication Critical patent/DE60202881D1/de
Application granted granted Critical
Publication of DE60202881T2 publication Critical patent/DE60202881T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf Quellcodierungssysteme, die eine Hochfrequenzwiederherstellung (HFR), wie z. B. eine Spektralbandreplikation, SBR [WO 98/57436] oder verwandte Verfahren verwenden. Sie verbessert das Verhalten von sowohl Hochqualitätsverfahren (SBR) als auch Niedrigqualitäts-Kopieverfahren [US-Patent 5,127,054]. Sie ist sowohl an Sprachcodierungs- als auch natürliche Audiocodierungs-Systeme anwendbar.
  • Hintergrund der Erfindung
  • Eine Hochfrequenzwiederherstellung (HFR; HFR = high frequency reconstruction) ist eine relativ neue Technik zum Verbessern der Qualität von Audio- und Sprach-Codierungsalgorithmen. Gegenwärtig wurde dieselbe zur Verwendung bei Sprachcodecs eingeführt, wie z. B. dem Breitband-AMR-Codierer für Dritte-Generation-Zellularsysteme und Audiocodierer wie z. B. MP3 oder AAC, wo die traditionellen Signalverlaufcodecs ergänzt werden mit dem Hochfrequenz-Wiederherstellungsalgorithmus-SBR (was zu MP3 PRO oder AAC plus SBR führt).
  • Die Hochfrequenzwiederherstellung ist ein sehr effizientes Verfahren zum Codieren hoher Frequenzen von Audio- und Sprach-Signalen. Da sie alleine keine Codierung ausführen kann, wird sie immer in Kombination mit einem normalen Signalverlauf-basierten Audiocodierer (z. B. AAC, MP3) oder einem Sprachcodierer verwendet. Diese sind verantwortlich für die Codierung der niedrigeren Frequenzen des Spektrums. Die grundlegende Idee der Hochfrequenzwiederherstellung ist, dass die höheren Frequenzen nicht codiert und übertragen werden sondern in dem Decodierer basierend auf dem niedrigeren Spektrum mit der Hilfe einiger zusätzlicher Parameter wiederhergestellt werden (hauptsächlich Daten, die die Hochfrequenz-Spektralhüllkurve des Audiosignals beschreiben), die in einem Niedrigbitraten-Bitstrom übertragen werden (siehe z. B. VALIN J ET AL: „Bandwidth extension of narrowbard speech for low bit-rate wideband coding", PROC. IEEE WORKSHOP ON SPEECH CODING, 17.–20. September 2000, Seiten 130–132), der separat oder als Zusatzdaten des Basiscodierers übertragen werden kann. Die zusätzlichen Parameter könnten auch weggelassen werden, aber heute ist die Qualität, die durch einen solchen Lösungsansatz erreichbar ist, schlechter im Vergleich zu einem System, das zusätzliche Parameter verwendet.
  • Insbesondere für die Audiocodierung verbessert HFR bedeutend die Codierungseffizienz, insbesondere im Qualitätsbereich „klingt gut, ist aber nicht transparent". Dies hat zwei Gründe:
    • – Traditionelle Signalverlaufscodecs, wie z. B. MP3, müssen die Audiobandbreite für sehr niedrige Bitraten reduzieren, da anderweitig der Artefaktpegel in dem Spektrum zu hoch wird. HFR regeneriert diese hohen Frequenzen zu sehr niedrigen Kosten und mit guter Qualität. Da HFR eine kostengünstige Möglichkeit zum Erzeugen von Hochfrequenzkomponenten ermöglicht, kann die Audiobandbreite, die durch Audiocodierer codiert wird, weiter reduziert werden, was zu weniger Artefakten und einem besseren Worst-Case-Verhalten des Gesamtsystems führt.
    • – HFR kann in Kombination mit einer Abwärtsabtastung in dem Codierer/Aufwärtsabtastung in dem Decodierer verwendet werden. Bei diesem häufig verwendeten Szenario analysiert der HFR-Codierer das Gesamtbandbreiten-Audiosignal, aber das Signal, das in den Audiocodierer zugeführt wird, wird abwärts zu einer niedrigeren Abtastrate abgetastet. Ein typisches Beispiel ist die HFR-Rate bei 44,1 kHz, und die Audiocodiererrate bei 22,05 kHz. Das Betreiben des Audiocodierers bei einer niedrigen Abtastrate ist ein Vorteil, da er üblicherweise bei der niedrigeren Abtastrate effizienter ist. Auf der Decodierseite wird das decodierte Audiosignal mit niedriger Abtastrate aufwärts abgetastet und der HFR-Teil wird hinzugefügt – somit können Frequenzen bis zu der Original-Nyquistfrequenz erzeugt werden, obwohl der Audiocodierer z. B. bei der Hälfte der Abtastrate läuft.
  • Ein Grundparameter für ein System, das HFR verwendet, ist die so genannte Überkreuzungsfrequenz (COF; COF = cross over frequency), d. h. die Frequenz, wo die normale Signalverlaufcodierung stoppt und der HFR-Frequenzbereich beginnt. Die einfachste Anordnung ist, die COF auf einer konstanten Frequenz zu haben. Eine fortschrittlichere Lösung, die bereits vorgestellt wurde, ist das dynamische Einstellen der COF auf die Charakteristika des Signals, das codiert werden soll.
  • Ein Hauptproblem der HFR ist, dass ein Audiosignal Komponenten in höheren Frequenzen enthalten kann, die schwierig mit dem aktuellen HFR-Verfahren wiederherzustellen sind, aber einfacher durch eine andere Einrichtung wiederhergestellt werden könnten, z. B. Signalverlaufcodierungsverfahren oder durch eine Synthetiksignalerzeugung. Ein einfaches Beispiel ist das Codieren eines Signals, das nur aus einer Sinuswelle über der COF besteht, 1. Hier ist die COF 5,5 kHz. Da kein nützliches Signal in den niedrigen Frequenzen verfügbar ist, wird das HFR-Verfahren, basierend auf dem Extrapolieren des Unterbandes, um ein Oberband zu erhalten, kein Signal erzeugen.
  • Dementsprechend kann das Sinuswellensignal nicht wiederhergestellt werden. Andere Mittel werden benötigt, um dieses Signal auf nützliche Weise zu codieren. Bei diesem einfachen Fall können HFR-Systeme, die eine flexible Einstellung der COF liefern, bereits das Problem zu einem bestimmten Ausmaß lösen. Wenn die COF über der Frequenz der Sinuswelle eingestellt ist, kann das Signal sehr effizient unter Verwendung des Kerncodierers codiert werden. Somit wird jedoch angenommen, dass dies möglich ist, was vielleicht nicht immer der Fall ist. Wie vorangehend erwähnt wurde, ist einer der Hauptvorteile des Kombinierens von HFR mit Audiocodierung die Tatsache, dass der Kerncodierer bei der Hälfte der Abtastrate arbeiten kann (was eine höhere Kompressionseffizienz ergibt). Bei einem realistischen Szenario, wie z. B. einem 44,1-kHz-System, bei dem der Kern bei 22,05 kHz läuft, kann ein solcher Kerncodierer nur Signale bis zu ungefähr 10,5 kHz codieren. Abgesehen davon jedoch wird das Problem bedeutend komplizierter, sogar für Teile des Spektrums innerhalb der Reichweite des Kerncodierers, wenn komplexere Signale betrachtet werden. Echte Signale können z. B. hörbare sinuswellenähnliche Komponenten bei hohen Frequenzen innerhalb eines komplexen Spektrums enthalten (z. B. kleines Klingeln), 2. Das Einstellen der COF ist keine Lösung in diesem Fall, da ein Großteil der Verstärkung, die durch das HFR-Verfahren erreicht wird, abgeschwächt würde, durch Verwenden des Kerncodierers für einen viel größeren Teil des Spektrums.
  • Zusammenfassung der Erfindung
  • Eine Lösung für die oben ausgeführten Probleme und den Gegenstand dieser Erfindung ist daher die Idee eines hochflexiblen HFR-Systems, das nicht nur das Ändern der COF ermöglicht, sondern ferner eine viel flexiblere Zusammensetzung des decodierten/wiederhergestellten Spektrums ermöglicht, durch eine Frequenz-selektive Zusammensetzung unterschiedlicher Verfahren.
  • Die Grundlage für die Erfindung ist ein Mechanismus in dem HFR-System, der eine Frequenz-abhängige Auswahl von unterschiedlichen Codierungs- oder Wiederherstellungs-Verfahren ermöglicht. Dies könnte z. B. mit dem 64-Band-Filterbank-Analyse-/Synthese-System durchgeführt werden, wie es bei der SBR verwendet wird. Eine komplexe Filterbank, die Alias-freie Ausgleichsfunktionen bereitstellt, kann besonders nützlich sein.
  • Der Hauptschritt der Erfindung ist, dass die Filterbank nun nicht nur verwendet wird, um als ein Filter für die COF und die nachfolgende Hüllkurveneinstellung zu dienen. Sie wird ferner auf hochflexible Weise verwendet, um den Eingang für jeden der Filterbankkanäle aus den nachfolgenden Quellen auszuwählen:
    Signalverlaufcodierung (unter Verwendung des Kerncodierers);
    Transposition (mit nachfolgender Hüllkurveneinstellung);
    Signalverlaufcodierung (unter Verwendung zusätzlicher Codierung über Nyquist hinaus);
    parametrische Codierung;
    ein beliebiges anderes Codierungsl/Wiederherstellungs-Verfahren das bei bestimmten Teilen des Spektrums anwendbar ist;
    oder eine Kombination derselben.
  • Somit kann eine Signalverlaufcodierung oder andere Codierungsverfahren und HFR-Wiederherstellung nun bei jeder beliebigen Spektralanordnung verwendet werden, um die höchstmögliche Qualität und Codierungsverstärkung zu erreichen. Es sollte jedoch offensichtlich sein, dass die Erfindung nicht auf die Verwendung einer Teilband-Filterbank beschränkt ist sondern natürlich mit einer beliebigen Frequenz-selektiven Filterung verwendet werden kann.
  • Die vorliegende Erfindung weist nachfolgende Merkmale auf:
    ein HFR-Verfahren, das das verfügbare Unterband in dem Decodierer verwendet, um ein Oberband zu extrapolieren;
    auf der Codiererseite, unter Verwendung des HFR-Verfahrens zum Bewerten, innerhalb unterschiedlicher Frequenzregionen, wo das HFR-Verfahren, basierend auf dem Frequenzbereich unter der COF, nicht korrekt eine Spektrallinie oder mehrere Spektrallinien ähnlich zu der Spektrallinie oder den Spektrallinien des Originalsignals erzeugt;
    Codieren der Spektrallinie oder der Spektrallinien für die unterschiedlichen Frequenzregionen;
    Übertragen der codierten Spektrallinie oder Spektrallinien für die unterschiedlichen Frequenzregionen von dem Codierer zu dem Decodierer;
    Decodieren der Spektrallinie oder Spektrallinien;
    Hinzufügen der decodierten Spektrallinie oder Spektrallinien zu den unterschiedlichen Frequenzregionen des von dem Ausgangssignal von dem HFR-Verfahren in den Decodierer;
    das Codieren ist ein parametrisches Codieren der Spektrallinie oder Spektrallinien;
    das Codieren ist ein Signalverlaufcodieren der Spektrallinie oder Spektrallinien;
    die Spektrallinie oder Spektrallinien, parametrisch codiert, werden unter Verwendung einer Teilband-Filterband synthetisch hergestellt;
    die Signalverlaufcodierung der Spektrallinie oder Spektrallinien wird durchgeführt durch den zu Grunde liegenden Kerncodierer des Quellcodierungssystems;
    die Signalverlaufcodierung der Spektrallinie oder Spektrallinien wird durchgeführt durch einen beliebigen Signalverlaufcodierer.
  • Kurze Beschreibung der Zeichnungen
  • Die vorliegende Erfindung wird nun mit Hilfe von darstellenden Beispielen beschrieben, die den Schutzbereich oder das Wesen der Erfindung nicht einschränken, Bezug nehmend auf die beiliegenden Zeichnungen, in denen:
  • 1 ein Spektrum eines Originalsignals mit nur einem Sinus über einer 5,5 kHz COF darstellt;
  • 2 ein Spektrum des Originalsignals darstellt, das Klingeln in der Popmusik enthält;
  • 3 eine Erfassung von fehlenden Harmonischen unter Verwendung des Prädiktionsgewinns darstellt;
  • 4 das Spektrum eines Originalsignals darstellt;
  • 5 das Spektrum ohne die vorliegende Erfindung darstellt;
  • 6 das Ausgabespektrum mit der vorliegenden Erfindung darstellt;
  • 7 eine mögliche Codiererimplementierung der vorliegenden Erfindung darstellt;
  • 8 eine mögliche Codiererimplementierung der vorliegenden Erfindung darstellt;
  • 9 ein schematisches Diagramm eines erfinderischen Codierers darstellt;
  • 10 ein schematisches Diagramm eines erfinderischen Codierers darstellt;
  • 11 ein Diagramm ist, das die Organisation des Spektralbereichs in Skalierfaktorbänder und -kanäle in Bezug auf die Überkreuzungsfrequenz und die Abtastfrequenz zeigt; und
  • 12 das schematische Diagramm für den erfinderischen Codierer in Verbindung mit einem HFR-Transpositionsverfahren basierend auf einem Filterbank-Lösungsansatz ist.
  • Beschreibung von bevorzugten Ausführungsbeispielen
  • Die nachfolgend beschriebenen Ausführungsbeispiele sind ausschließlich darstellend für die Prinzipien der vorliegenden Erfindung zur Verbesserung von Hochfrequenz-Wiederherstellungssystemen. Es wird darauf hingewiesen, dass Modifikationen und Abweichungen der Anordnungen und der Details, die hierin beschrieben sind, für Fachleute auf dem Gebiet offensichtlich sind. Es ist daher die Absicht, nur durch den Schutzbereich der anhängigen Patentansprüche und nicht durch die spezifischen Details eingeschränkt zu sein, die mit Hilfe der Beschreibung und Erklärung der Ausführungsbeispiele hierin präsentiert werden.
  • 9 stellt einen erfinderischen Codierer dar. Der Codierer umfasst einen Kerncodierer 702. Es wird hier darauf hingewiesen, dass das erfinderische Verfahren ebenfalls als ein so genanntes Zusatz-Modul für einen existierenden Kerncodierer verwendet werden kann. In diesem Fall umfasst der erfinderische Codierer einen Eingang zum Empfangen eines codierten Eingangssignals, das durch einen separat stehenden Kerncodierer 702 ausgegeben wird.
  • Der erfinderische Codierer in 9 umfasst zusätzlich einen Hochfrequenz-Regenerationsblock 703c, einen Differenzdetektor 703a, einen Differenzbeschreiberblock 703b sowie einen Kombinierer 705.
  • Nachfolgend wird die gegenseitige Funktionsabhängigkeit der oben beschriebenen Einrichtungen beschrieben.
  • Insbesondere ist der erfinderische Codierer zum Codieren eines Audiosignals vorgesehen, das an einem Audiosignaleingang 900 eingegeben wird, um ein codiertes Signal zu erhalten. Das codierte Signal ist vorgesehen zum Decodieren unter Verwendung einer Hochfrequenz-Regenerationstechnik, die geeignet ist zum Erzeugen von Frequenzkomponenten über einer vorbestimmten Frequenz, die ebenfalls die Überkreuzungsfrequenz genannt wird, basierend auf den Frequenzkomponenten unter der vorbestimmten Frequenz.
  • Es wird hier darauf hingewiesen, dass als eine Hochfrequenz-Regenerationstechnik eine breite Vielzahl solcher Techniken verwendet werden kann, die kürzlich bekannt wurden. Diesbezüglich ist der Ausdruck „Frequenzkomponente" in einem umfassenden Sinn zu verstehen. Dieser Ausdruck umfasst zumindest Spektralkoeffizienten, die mit Hilfe einer Zeitbereich/Frequenzbereich-Transformation erhalten werden, wie z. B. einer FFT, einer MDCT oder ähnlichem. Zusätzlich dazu umfasst der Ausdruck „Frequenzkomponente" ferner Bandpasssignale, d. h. Signale, die an dem Ausgang von frequenzselektiven Filtern erhalten werden, wie z. B. einem Tiefpassfilter, einem Bandpassfilter oder einem Hochpassfilter.
  • Unabhängig von der Tatsache, ob der Kerncodierer 702 ein Teil des erfinderischen Codierers ist, oder ob der erfinderische Codierer als ein Zusatzmodul für einen existierenden Kerncodierer verwendet wird, umfasst der Codierer eine Einrichtung zum Liefern eines codierten Eingangssignals, das eine codierte Darstellung eines Eingangssignals ist, und das unter Verwendung eines Codierungsalgorithmus codiert ist. Diesbezüglich wird darauf hingewiesen, dass das Eingangssignal einen Frequenzgehalt des Audiosignals unter einer vorbestimmten Frequenz darstellt, d. h. unter der so genannten Überkreuzungsfrequenz. Um die Tatsache darzustellen, dass der Frequenzgehalt des Eingangssignals nur ein Unterbandteil des Audiosignals umfasst, ist ein Tiefpassfilter 902 in 9 gezeigt. Der erfinderische Codierer kann tatsächlich ein solches Tiefpassfilter aufweisen. Alternativ kann ein solches Tiefpassfilter in dem Kerncodierer 702 umfasst sein. Alternativ kann ein Kerncodierer die Funktion des Verwerfens eines Frequenzbandes des Audiosignals durch eine andere bekannte Einrichtung durchführen.
  • An dem Ausgang des Kerncodierers 702 liegt ein codiertes Eingangssignal vor, das im Hinblick auf seinen Frequenzgehalt ähnlich zu dem Eingangssignal ist aber unterschiedlich von dem Audiosignal, insofern, dass das codierte Eingangssignal keine Frequenzkomponenten über der vorbestimmten Frequenz umfasst.
  • Der Hochfrequenz-Regenerationsblock 703c ist zum Durchführen der Hochfrequenz-Regenerationstechnik an dem Eingangssignal, d. h. dem Signal, das in den Kerncodierer 702 eingegeben wird, oder an einer codierten und wiederum decodierten Version desselben. Falls diese Alternative ausgewählt wird, umfasst der erfinderische Codierer ferner einen Kerndecodierer 903, der das codierte Eingangssignal von dem Kerncodierer empfängt und dieses Signal decodiert, sodass genau dieselbe Situation erhalten wird, die an der Decodierer/Empfänger-Seite vorliegt, auf der eine Hochfrequenz-Regenerationstechnik durchgeführt werden soll, zum Verbessern der Audiobandbreite für codierte Signale, die unter Verwendung einer niedrigen Bitrate übertragen wurden.
  • Der HFR-Block 702 gibt ein regeneriertes Signal aus, das Frequenzkomponenten über der vorbestimmten Frequenz aufweist.
  • Wie in 9 gezeigt ist, wird das regenerierte Signal, das durch den HFR-Block 703c ausgegeben wird, in eine Differenzdetektoreinrichtung 703a eingegeben. Andererseits empfängt die Differenzdetektoreinrichtung ferner das Originalaudiosignal, das an dem Audiosignaleingang 900 eingegeben wird. Die Einrichtung zum Erfassen von Differenzen zwischen dem regenerierten Signal von dem HFR-Block 703c und dem Audiosignal von dem Eingang 900 ist angeordnet zum Erfassen einer Differenz zwischen jenen Signalen, die über einer vorbestimmten Signifikanzschwelle sind. Verschiedene Beispiele für bevorzugte Schwellen, die als eine Signifikanzschwelle funktionieren, werden nachfolgend beschrieben.
  • Der Differenzdetektorausgang ist mit einem Eingang eines Differenzbeschreiberblocks 703b verbunden. Der Differenzbeschreiberblock 703b ist zum Beschreiben von erfassten Differenzen auf eine bestimmte Weise, um zusätzliche Informationen über die erfassten Differenzen zu erhalten. Diese zusätzlichen Informationen sind geeignet, um in eine Kombinierereinrichtung 705 eingegeben zu werden, die das codierte Eingangssignal, die zusätzlichen Informationen und verschiedene andere Signale kombiniert, die erzeugt werden können, um ein codiertes Signal zu erhalten, das zu einem Empfänger übertragen oder auf einem Speicherungsmedium gespeichert werden soll. Ein hervorstechendes Beispiel für zusätzliche Informationen sind Spektralhüllkurveninformationen, die durch einen Spektralhüllkurvenschätzer 704 erzeugt werden. Der Spektralhüllkurvenschätzer 704 ist ange ordnet zum Liefern von Spektralhüllkurveninformationen des Audiosignals über der vorbestimmten Frequenz, d. h. über der Überkreuzungsfrequenz. Diese Spektralhüllkurveninformationen werden in einem HFR-Modul auf der Decodiererseite verwendet, um Spektralkomponenten eines decodierten Audiosignals über der vorbestimmten Frequenz zu generieren.
  • Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist der Spektralhüllkurvenschätzer 704 angeordnet, um nur eine grobe Darstellung der Spektralhüllkurve zu liefern. Genauer gesagt ist es bevorzugt, nur einen Spektralhüllkurvenwert für jedes Skalierfaktorband zu liefern. Die Verwendung von Skalierfaktorbändern ist Fachleuten auf dem Gebiet bekannt. In Verbindung mit Transformationscodierern, wie z. B. MP3 oder MPEG-AAC, umfasst ein Skalierfaktorband verschiedene MDCT-Linien. Die detaillierte Organisation, welche Spektrallinien zu welchen Skalierfaktorband gehören, ist standardisiert, kann jedoch variieren. Allgemein umfasst ein Skalierfaktorband verschiedene Spektrallinien (z. B. MDCT-Linien, wobei MDCT für modifizierte diskrete Cosinustransformation steht) oder Bandpasssignale, wobei die Anzahl derselben von Skalierfaktorband zu Skalierfaktorband variiert. Im Allgemeinen umfasst ein Skalierfaktorband zumindest mehr als zwei und normalerweise mehr als 10 oder 20 Spektrallinien oder Bandpasssignale.
  • Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung umfasst der erfinderische Codierer zusätzlich eine variable Überkreuzungsfrequenz. Die Steuerung dieser Überkreuzungsfrequenz wird durchgeführt durch den erfinderischen Differenzdetektor 703a. Die Steuerung ist derart angeordnet, dass wenn der Differenzdetektor zu der Schlussfolgerung kommt, dass eine höhere Überkreuzungsfrequenz wahrscheinlich zum Reduzieren von Artefakten beitragen würde, die durch eine reine HFR erzeugt werden würden, der Differenzdetektor den Tiefpassfilter 702 und den Spektralhüllkurvenschätzer 704 sowie den Kerncodierer 702 anweisen kann, die Überkreuzungsfrequenz auf höhere Frequenzen zu setzen, zum Ausdehnen der Bandbreite des codierten Eingangssignals.
  • Andererseits kann der Differenzdetektor ferner zum Reduzieren der Überkreuzungsfrequenz in dem Fall angeordnet sein, dass er herausfindet, dass eine bestimmte Bandbreite unter der Überkreuzungsfrequenz akustisch nicht wichtig ist und daher ohne weiteres durch eine HFR-Synthese in dem Decodierer erzeugt werden kann und nicht direkt durch den Kerncodierer codiert werden muss.
  • Bits, die gespeichert werden, durch Verringern der Überkreuzungsfrequenz, können andererseits für den Fall verwendet werden, in dem die Überkreuzungsfrequenz erhöht werden muss, sodass eine Art eine Bitsparoption erhalten werden kann, die für ein psychoakustisches Beschichtungsverfahren bekannt ist. Bei diesen Verfahren können hauptsächlich Tonal-Komponenten, die schwer zu codieren sind, d. h. die viele Bits benötigen, um ohne Artefakte codiert zu werden, mehr Bits verbrauchen, wobei andererseits mit Weißrauschen behaftete Signalabschnitte, die leicht zu codieren sind, d. h. die nur eine geringe Anzahl von Bits benötigen, um ohne Artefakte codiert zu werden, ebenfalls in dem Signal vorliegen und durch eine bestimmte Bitsparsteuerung erkannt werden.
  • Zusammenfassend ist die Überkreuzungsfrequenzsteuerung angeordnet zum Erhöhen oder Verringern der vorbestimmten Frequenz, d. h. der Überkreuzungsfrequenz, ansprechend auf Erkenntnisse, die durch den Differenzdetektor gemacht werden, die im Allgemeinen die Effektivität und das Verhalten des HFR-Blocks 703c bewertet, um die tatsächliche Situation in einem Decodierer zu simulieren.
  • Vorzugsweise ist der Differenzdetektor 703a angeordnet zum Erfassen von Spektrallinien in dem Audiosignal, die nicht in dem regenerierten Signal umfasst sind. Um dies durchzuführen umfasst der Differenzdetektor vorzugsweise einen Prädiktor zum Durchführen von Voraussageoperationen über das regenerierte Signal und das Audiosignal, und eine Einrichtung zum Bestimmen einer Differenz bei erhaltenen Prädiktionsgewinnen für das regenerierte Signal und das Audiosignal. Insbesondere werden Frequenz-verwandte Abschnitte in dem regenerierten Signal und in dem Audiosignal bestimmt, bei denen eine Differenz bei den Prädiktorgewinnen größer als die Gewinnschwelle ist, die bei diesem bevorzugten Ausführungsbeispiel die Signifikanzschwelle ist.
  • Es wird darauf hingewiesen, dass der Differenzdetektor 703a vorzugsweise als ein Frequenz-selektives Element arbeitet, insofern, dass er entsprechende Frequenzbänder in dem regenerierten Signal einerseits und dem Audiosignal andererseits bewertet. Zu diesem Zweck kann der Differenzdetektor Zeitfrequenz-Umwandlungselemente umfassen, zum Umwandeln des Audiosignals und des regenerierten Signals. Im Fall, dass das regenerierte Signal, das durch den HFR-Block 703c erzeugt wird, bereits als eine Frequenz-verwandte Darstellung vorliegt, was bei dem bevorzugten Hochfrequenz-Regenerationsverfahren der Fall ist, das für die vorliegende Erfindung angewendet wird, ist keine solche Zeitbereichs-/Frequenzbereichs-Umwandlungseinrichtung notwendig.
  • In dem Fall, dass ein Zeitbereich-Frequenzbereich-Umwandlungselement verwendet werden muss, wie z. B. zum Umwandeln des Audiosignals, das normalerweise ein Zeitbereichssignal ist, ist ein Filterbanklösungsansatz bevorzugt. Eine Analysefilterbank umfasst eine Bank von geeignet dimensionierten, benachbarten Bandpassfiltern, wobei jedes Bandpassfilter ein Bandpasssignal mit einer Bandbreite ausgibt, die durch die Bandbreite des jeweiligen Bandpassfilters definiert wird. Das Bandpassfiltersignal kann als ein Zeitbereichssignal interpretiert werden, das eine eingeschränkte Bandbreite aufweist, im Vergleich zu dem Signal, von dem es hergeleitet wurde. Die Mittenfrequenz eines Bandpasssignals wird definiert durch die Position des jeweiligen Bandpass filters in der Analysefilterbank, wie in der Technik bekannt ist.
  • Wie später beschrieben wird, ist das bevorzugte Verfahren zum Bestimmen von Differenzen über einer Signifikanzschwelle eine Bestimmung basierend auf Tonalitätsmaßen und insbesondere auf einem Tonal-zu-Rauschen-Verhältnis, da solche Verfahren geeignet sind zum Herausfinden von Spektrallinien in Signalen oder zum Herausfinden von rauschähnlichen Abschnitten in Signalen auf robuste und effiziente Weise.
  • Erfassung von Spektrallinien, die codiert werden sollen
  • Um in der Lage zu sein, die Spektrallinien zu decodieren, die in dem decodierten Ausgangssignal nach der HFR fehlen, ist es wesentlich, diese in dem Codierer zu erfassen. Um dies zu erreichen, muss eine geeignete Synthese der nachfolgenden Decodierer-HFR in dem Codierer durchgeführt werden. Dies impliziert nicht, dass das Ausgangssignal dieser Synthese ein Zeitbereich-Ausgangssignal ähnlich zu dem des Decodierers sein muss. Es ist ausreichend, eine absolute Spektraldarstellung der HFR in dem Decodierer zu beobachten und zu generieren. Dies kann erreicht werden durch Verwenden einer Voraussage in einer QMF-Filterbank mit nachfolgendem Spitzenerfassen der Differenz bei dem Prädiktionsgewinn zwischen dem Original und einem HFR-Gegenstück. Statt einer Spitzenerfassung der Differenz bei dem Prädiktionsgewinn können ebenfalls Differenzen des absoluten Spektrums verwendet werden. Für beide Verfahren werden der frequenzabhängige Prädiktionsgewinn oder das absolute Spektrum der HFR generiert, durch einfaches Neuanordnen der Frequenzverteilung der Komponenten, ähnlich dem was die HFR in dem Decodierer durchführt.
  • Sobald die zwei Darstellungen erhalten wurden, das Originalsignal und das generierte HFR-Signal, kann die Erfassung auf verschiedene Weisen durchgeführt werden.
  • In einer QMF-Filterbank kann eine lineare Voraussage niedrigeren Ordnung durchgeführt werden, z. B. LPC-Ordnung 2, für die unterschiedlichen Kanäle. Unter Berücksichtigung der Energie des vorhergesagten Signals und der Gesamtenergie des Signals kann das Tonal-zu-Rauschen-Verhältnis definiert werden, gemäß
    Figure 00160001
    wobei Ψ = |x(0)|2 + |x(1)|2 + ... + |x(N – 1)|2 die Energie des Signalblocks ist und E die Energie des Voraussagefehlerblocks ist, für einen gegebenen Filterbankkanal. Dies kann für das Originalsignal berechnet werden, und wenn dies gegeben ist, eine Darstellung darüber, wie das Tonal-zu-Rauschen-Verhältnis für unterschiedliche Frequenzbänder in dem HFR-Ausgangssignal in dem Decodierer erhalten werden kann. Die Differenz zwischen den beiden auf einer beliebigen Frequenz-selektiven Basis (größer als die Frequenzauflösung der QMF) kann somit berechnet werden. Dieser Differenzvektor, der die Differenz des Tonal-zu-Rauschen-Verhältnisses darstellt, zwischen dem ursprünglichen und dem erwarteten Ausgangssignal aus der HFR in dem Decodierer, wird nachfolgend verwendet, um zu bestimmen, wo ein zusätzliches Codierungsverfahren erforderlich ist, um die Mängel der gegebenen HFR-Technik zu kompensieren, 3. Hier ist das Tonal-zu-Rauschen-Verhältnis, das dem Frequenzbereich zwischen dem Teilband-Filterbank-Band 15–41 entspricht, für das ursprüngliche und ein generiertes HFR-Ausgangssignal angezeigt. Das Gitter zeigt die Skalierfaktorbänder des Frequenzbereichs an, der auf eine Weise einer Rindenskalierung gruppiert ist. Für jedes Skalierfaktorband wird die Differenz zwischen den größten Komponenten des ur sprünglichen und des HFR-Ausgangssignals berechnet und in der dritten Skizze angezeigt.
  • Die obige Erfassung kann ebenfalls durchgeführt werden unter Verwendung einer beliebigen Spektraldarstellung des Originals und eines generierten HFR-Ausgangssignals, z. B. Spitzenerfassung in einem absoluten Spektrum [„Extrahierung der spektralen Spitzenparameter unter Verwendung einer kurzzeitigen Fourier-Transformationsmodellierung [sic] und ohne Seitenlappenfenster." Ph Depalle, T Hélie, IRCAM] oder ähnlicher Verfahren, und dann Vergleichen der Tonal-Komponenten, die in dem Original erfasst wurden mit den Komponenten, die in dem generierten HFR-Ausgangssignal erfasst wurden.
  • Wenn eine Spektrallinie derart betrachtet wird, dass sie aus dem HFR-Ausgangssignal fehlt, muss sie effizient codiert werden, zu dem Decodierer übertragen werden und zu dem HFR-Ausgangssignal hinzugefügt werden. Verschiedene Lösungsansätze können verwendet werden; eine verschachtelte Signalverlaufcodierung oder z. B. eine parametrische Codierung der Spektrallinie.
  • QMF/Hybrid-Filterbank, verschachtelte Signalverlaufcodierung
  • Wenn die Spektrallinie, die codiert werden soll, unter FS/2 des Kerncodierers positioniert ist, kann sie durch denselben codiert werden. Dies bedeutet, dass der Kerncodierer den gesamten Frequenzbereich bis zu COF codiert und ferner einen definierten Frequenzbereich, der die Tonal-Komponente umgibt, die nicht durch die HFR in dem Decodierer reproduziert wird. Alternativ kann die Tonal-Komponente durch einen beliebigen Signalverlaufcodierer codiert werden, wobei das System bei diesem Lösungsansatz nicht durch die FS/2 des Kerncodierers eingeschränkt ist sondern an dem gesamten Frequenzbereich des Originalsignals wirksam sein kann.
  • Zu diesem Zweck wird die Kerncodierer-Steuerungseinheit 910 in dem erfinderischen Codierer bereitgestellt. In dem Fall, dass der Differenzdetektor 703a eine signifikante Spitze über der vorbestimmten Frequenz aber unter der Hälfte des Werts der Abtastfrequenz (FS/2) bestimmt, adressiert er den Kerncodierer 702 zum Kerncodieren eines Bandpasssignals, das aus dem Audiosignal hergeleitet wird, wobei das Frequenzband des Bandpasssignals die Frequenz umfasst, wo die Spektrallinie erfasst wurde, und abhängig von der tatsächlichen Implementierung auch ein spezifisches Frequenzband, das die erfasste Spektrallinie einbettet. Zu diesem Zweck filtert der Kerncodierer 702 selbst, oder ein steuerbares Bandpassfilter innerhalb des Kerncodierers, den relevanten Abschnitt aus dem Audiosignal heraus, das direkt zu dem Kerncodierer weitergeleitet wird, wie durch die gestrichelte Linie 912 gezeigt ist.
  • In diesem Fall funktioniert der Kerncodierer 702 als der Differenzbeschreiber 703b, insofern, dass er die Spektrallinie über der Überkreuzungsfrequenz codiert, die durch den Differenzdetektor erfasst wurde. Die zusätzlichen Informationen, die durch den Differenzbeschreiber 703b erhalten werden, entsprechen daher dem codierten Signal, das durch den Kerncodierer 702 ausgegeben wird, das sich auf das bestimmte Band des Audiosignals über der vorbestimmten Frequenz aber unter der Hälfte des Werts der Abtastfrequenz (FS/2) bezieht.
  • Um die vorangehend erwähnte Frequenzplanung besser darzustellen, wird Bezug auf 11 genommen. 11 zeigt die Frequenzskala, die bei einer Nullfrequenz beginnt und sich nach rechts in 11 erstreckt. Bei einem bestimmten Frequenzwert ist die vorbestimmte Frequenz 1100 ersichtlich, die auch die Überkreuzungsfrequenz genannt wird. Unter dieser Frequenz ist der Kerncodierer 702 aus 9 aktiv, um das codierte Eingangssignal zu erzeugen. Über der vorbestimmten Frequenz ist nur der Spektral-Hüllkurvenschätzer 704 aktiv, um z. B. einen Spektralhüllkurvenwert für jedes Skalierfaktorband zu erhalten. Aus 11 wird deutlich, dass ein Skalierfaktorband verschiedene Kanäle umfasst, die in dem Fall von bekannten Transformationscodierern Frequenzkoeffizienten oder Bandpasssignalen entsprechen. 11 ist ferner nützlich zum Zeigen der Synthesefilterbankkanäle aus der Synthesefilterbank aus 12, die später beschrieben wird. Zusätzlich dazu wird Bezug auf die Hälfte des Werts der Abtastfrequenz FS/2 genommen, die in dem Fall aus 11 über der vorbestimmten Frequenz liegt.
  • In dem Fall, dass eine erfasste Spektrallinie über FS/2 ist, kann der Kerncodierer 702 nicht als der Differenzbeschreiber 703b arbeiten. In diesem Fall, wie oben ausgeführt ist, müssen vollständig unterschiedliche Codierungsalgorithmen in dem Differenzbeschreiber zum Codieren/Erhalten zusätzlicher Informationen über Spektrallinien in dem Audiosignal angewendet werden, die nicht durch eine normale HFR-Technik reproduziert werden.
  • Nachfolgend wird Bezug auf 10 genommen, um einen erfinderischen Decodierer zum Decodieren eines codierten Signals darzustellen. Das codierte Signal wird an einem Eingang 1000 in einen Datenstrom-Demultiplexer 801 eingegeben. Genauer gesagt umfasst das codierte Signal ein codiertes Eingangssignal (ausgegeben aus dem Kerncodierer 702 in 9), das einen Frequenzgehalt eines Originalaudiosignals (eingegeben in den Eingang 900 aus 9) unter einer vorbestimmten Frequenz darstellt. Das Codieren des Originalsignals wurde in dem Kerncodierer 702 unter Verwendung eines bestimmten bekannten Codierungsalgorithmus durchgeführt. Das codierte Signal an dem Eingang 1000 umfasst zusätzliche Informationen, die erfasste Differenzen zwischen einem regenerierten Signal und dem Originalaudiosignal beschreiben, wobei das regenerierte Signal durch Hochfrequenz-Regenerationstechniken erzeugt wird (implementiert bei dem HFR-Block 703c in 9), aus dem Eingangssignal oder einer codierten und decodierten Version desselben (Ausführungsbeispiel mit dem Kerncodierer 903 in 9).
  • Genauer gesagt umfasst der erfinderische Decodierer eine Einrichtung zum Erhalten eines decodierten Eingangssignals, das erzeugt wird durch Decodieren des codierten Eingangssignals gemäß dem Codierungsalgorithmus. Zu diesem Zweck kann der erfinderische Decodierer einen Kerndecodierer 803 umfassen, wie in 10 gezeigt ist. Alternativ kann der erfinderische Decodierer ferner als ein Zusatzmodul zu einem existierenden Kerndecodierer verwendet werden, sodass die Einrichtung zum Erhalten eines codierten Eingangssignals implementiert werden würde durch Verwenden eines bestimmten Eingangs eines nachfolgend positionierten HFR-Blocks 804, wie in 10 gezeigt ist. Der erfinderische Decodierer umfasst ferner einen Rekonstruierer zum Rekonstruieren von erfassten Differenzen basierend auf den zusätzlichen Informationen, die durch den Differenzbeschreiber 703b erzeugt wurden, der in 9 gezeigt ist.
  • Als eine Schlüsselkomponente umfasst der erfinderische Decodierer zusätzlich eine Hochfrequenz-Regenerationseinrichtung zum Durchführen einer Hochfrequenz-Regenerationstechnik ähnlich zu der Hochfrequenz-Regenerationstechnik, die durch den HFR-Block 703c implementiert wurde, wie in 9 gezeigt ist. Der Hochfrequenz-Regenerationsblock gibt ein regeneriertes Signal aus, das bei einem normalen HFR-Decodierer zum Generieren des Spektralabschnitts des Audiosignals verwendet werden würde, das in dem Codierer verworfen wurde.
  • Gemäß der vorliegenden Erfindung wird ein Produzierer bereitgestellt, der die Funktionalitäten von Block 806 und 807 aus 8 umfasst, sodass das Audiosignal, das durch den Produzierer ausgegeben wird, nicht nur einen rekonstruierten Hochfrequenzabschnitt umfasst, sondern ferner erfasste Differenzen umfasst, vorzugsweise Spektrallinien, die nicht durch den HFR-Block 804 synthetisiert werden können, aber die in dem Originalaudiosignal vorhanden waren.
  • Wie nachfolgend ausgeführt wird, kann der Produzierer 806, 807 das regenerierte Signal verwenden, das durch den HFR-Block 804 ausgegeben wird, und dasselbe einfach mit dem codierten Unterbandsignal kombinieren, das durch den Kerndecodierer 803 ausgegeben wird, und dann Spektrallinien basierend auf den zusätzlichen Informationen einfügen. Alternativ und vorzugsweise führt der Produzierer ferner eine Manipulation der HFR-erzeugten Spektrallinien durch, wie Bezug nehmend auf 12 ausgeführt wird. Im Allgemeinen fügt der Produzierer nicht einfach eine Spektrallinie in das HFR-Spektrum an einer bestimmten Frequenzposition ein, sondern berücksichtigt die Energie der eingefügten Spektrallinie beim Dämpfen von HFR-regenerierten Spektrallinien in der Umgebung der eingefügten Spektrallinien.
  • Die obige Vorgehensweise basiert auf einer Spektralhüllkurvenparameterschätzung, die in dem Codierer durchgeführt wird. Bei einem Spektralband über der vorbestimmten Frequenz, d. h. der Überkreuzungsfrequenz, in dem eine Spektrallinie positioniert ist, schätzt der Spektralhüllkurvenschätzer die Energie in diesem Band. Ein solches Band ist z. B. ein Skalierfaktorband. Da der Spektralhüllkurvenschätzer die Energie in diesem Band ansammelt, unabhängig von der Tatsache, ob die Energie von rauschbehafteten Spektrallinien oder bestimmten hervorstehenden Spitzen stammt, d. h. Tonal-Spektrallinien, umfasst die Spektralhüllkurvenschätzung für das gegebene Skalierfaktorband die Energie der Spektrallinie sowie die Energie der „rauschbehafteten" Spektrallinien in dem gegebenen Skalierfaktorband.
  • Um die Spektralenergie-Schätzungsinformationen, die in Verbindung mit dem codierten Signal übertragen werden, so genau wie möglich zu verwenden, berücksichtigt der erfinderische Decodierer das Energieansammlungsverfahren bei dem Co dierer durch Einstellen der eingefügten Spektrallinie sowie der benachbarten „rauschbehafteten" Spektrallinien in dem gegebenen Skalierfaktorband, sodass die Gesamtenergie, d. h. die Energie aller Linien in diesem Band, der Energie entspricht, die durch die übertragene Spektralhüllkurvenschätzung für dieses Skalierfaktorband vorgegeben ist.
  • 12 zeigt ein schematisches Diagramm für die bevorzugte HFR-Wiederherstellung basierend auf einer Analysefilterbank 1200 und einer Synthesefilterbank 1202. Die Analysefilterbank sowie die Synthesefilterbank bestehen aus mehreren Filterbankkanälen, die ebenfalls in 11 im Hinblick auf ein Skalierfaktorband und die vorbestimmte Frequenz dargestellt sind. Filterbankkanäle über der vorbestimmten Frequenz, was durch 1204 in 12 angezeigt wird, müssen mit Hilfe von Filterbanksignalen wiederhergestellt werden, d. h. Filterbankkanäle unter der vorbestimmten Frequenz, wie in 12 durch die Linien 1206 angezeigt ist. Es wird hier darauf hingewiesen, dass in jedem Filterbankkanal ein Bandpasssignal mit komplexen Bandpasssignalabtastwerten vorhanden ist. Der Hochfrequenzwiederherstellungsblock 804 in 10 und auch der HFR-Block 703c in 9 umfassen ein Transpositions/Hüllkurven-Einstellmodul 1208, das zum Durchführen einer HFR im Hinblick auf bestimmte HFR-Algorithmen angeordnet ist. Es wird darauf hingewiesen, dass der Block auf der Codiererseite nicht notwendigerweise ein Hüllkurveneinstellmodul umfassen muss. Es ist bevorzugt, ein Tonalitätsmaß als eine Frequenzfunktion zu schätzen. Dann, wenn die Tonalität zu sehr abweicht, ist die Differenz bei der absoluten spektralen Hüllkurve irrelevant.
  • Der HFR-Algorithmus kann ein Reine-Harmonische- oder ein Ungefähre-Harmonische-HFR-Algorithmus sein oder kann ein Niedrigkomplexitäts-HFR-Algorithmus sein, der die Transposition von verschiedenen aufeinander folgenden Analysefilterbankkanälen unter der vorbestimmten Frequenz auf bestimmte aufeinander folgende Synthesefilterbankkanäle über der vorbestimmten Frequenz umfasst. Zusätzlich dazu umfasst der Block 1208 vorzugsweise eine Hüllkurveneinstellfunktion, sodass die Größen der transpositionierten Spektrallinien derart eingestellt sind, dass die angesammelte Energie der eingestellten Spektrallinien in einem Skalierfaktorband z. B. dem Spektralhüllkurvenwert des Skalierfaktorbands entspricht.
  • Aus 12 wird deutlich, dass ein Skalierfaktorband verschiedene Filterbankkanäle umfasst. Ein exemplarisches Skalierfaktorband erstreckt sich von einem Filterbankkanal llow zu einem Filterbankkanal lup.
  • Im Hinblick auf das nachfolgende Adaptions-/Sinuseinfügungs-Verfahren wird darauf hingewiesen, dass diese Adaption oder „Manipulation" durch den Produzierer 806, 807 in 10 ausgeführt wird, der einen Manipulierer 1210 zum Manipulieren von HFR-produzierten Bandpasssignalen umfasst. Als ein Eingangssignal empfängt dieser Manipulierer 1210 von dem Rekonstruierer 805 in 10 zumindest die Position der Linie, d. h. vorzugsweise die Zahl ls, bei der der Sinus positioniert sein soll, der generiert werden soll. Zusätzlich dazu empfängt der Manipulierer 1210 vorzugsweise einen geeigneten Pegel für diese Spektrallinie (Sinuswelle) und vorzugsweise ebenfalls Informationen über eine Gesamtenergie des gegebenen Skalierfaktorbandes sfb 1212.
  • Es wird hier darauf hingewiesen, dass ein bestimmter Kanal ls, in den das synthetische Sinussignal eingefügt werden soll, unterschiedlich von den anderen Kanälen in dem gegebenen Skalierfaktorband 1212 behandelt wird, wie nachfolgend ausgeführt wird. Diese „Behandlung" der HFR-regenerierten Kanalsignale, die durch den Block 1208 ausgegeben werden, wird, wie oben ausgeführt wurde, durch den Manipulierer 1210 durchgeführt, der Teil des Produzierers 806, 807 aus 10 ist.
  • Parametrische Codierung von Spektrallinien
  • Ein Beispiel eines Filterbank-basierten Systems, das eine parametrische Codierung von fehlenden Spektrallinien verwendet, wird nachfolgend ausgeführt.
  • Wenn ein HFR-Verfahren verwendet wird, wo das System eine adaptive Grundrauschen-Addition gemäß [PCT/SE00/00159] verwendet, muss nur die Frequenzposition der fehlenden Spektrallinie codiert werden, da der Pegel der Spektrallinie implizit gegeben ist durch die Hüllkurvendaten und die Grundrauschdaten. Die Gesamtenergie für ein gegebenes Skalierfaktorband ist durch die Energiedaten gegeben, und das Tonal/Rauschenergie-Verhältnis ist gegeben durch die Grundrauschpegeldaten. Ferner ist in dem Hochfrequenzbereich die exakte Position der Spektrallinie weniger wichtig, da die Frequenzauflösung des menschlichen Gehörsystems bei höheren Frequenzen eher grob ist. Dies impliziert, dass die Spektrallinien sehr effektiv codiert werden können, im Wesentlichen mit einem Vektor, der für jedes Skalierfaktorband anzeigt, ob ein Sinus bei diesem bestimmten Band in dem Decodierer hinzugefügt werden sollte.
  • Die Spektrallinien können in dem Decodierer auf verschiedene Weisen erzeugt werden. Ein Lösungsansatz verwendet die QMF-Filterbank, die bereits für die Hüllkurveneinstellung des HFR-Signals verwendet wird. Dies ist sehr effizient, da es einfach ist, Sinuswellen in einer Teilbandfilterbank zu erzeugen, vorausgesetzt dass sie in der Mitte eines Filterkanals platziert sind, um kein Aliasing bei benachbarten Kanälen zu erzeugen. Dies ist keine gravierende Einschränkung, da die Frequenzposition der Spektrallinie üblicherweise eher grob quantisiert ist.
  • Wenn die Spektralhüllkurvendaten, die von dem Codierer zu dem Decodierer gesendet werden, durch gruppierte Teilbandfilterbankenergien dargestellt sind, in Zeit und Frequenz, kann der Spektralhüllkurvenvektor zu einer gegebenen Zeit dargestellt sein durch: e = [e(1), e(2), ..., e(M)]und der Grundrauschpegelvektor kann beschrieben werden gemäß: q = [q(1), q(2), ..., q(M)]
  • Hier werden die Energien und die Grundrauschdaten über die QMF-Filterbankbänder gemittelt, die durch einen Vektor beschrieben werden, v = [lsb, ..., usb],der die QMF-Bandeinträge von dem verwendeten untersten QMF-Band (lsb) zu dem höchsten (usb) enthält, dessen Länge M + 1 ist, und bei dem die Grenzen jedes Skalierfaktorbandes (in QMF-Bändern) gegeben sind durch:
    Figure 00250001
    wobei ll die untere Grenze und lu die obere Grenze des Skalierfaktorbandes n ist. Oben wurde der Grundrauschpegeldatenvektor q auf dieselbe Frequenzauflösung abgebildet wie die der Energiedaten e.
  • Wenn ein synthetischer Sinus in einem Filterbankkanal erzeugt wird, muss dies für alle Teilbandfilterbankkanäle berücksichtigt werden, die in diesem bestimmten Skalierfaktorband umfasst sind. Da dies die höchste Frequenzauflösung der Spektralhüllkurve in diesem Frequenzbereich ist. Wenn diese Frequenzauflösung auch zum Signalisieren der Frequenzposition der Spektrallinien verwendet wird, die aus der HFR fehlen und zu dem Ausgangssignal hinzugefügt werden müssen, kann die Erzeugung und Kompensation dieser synthe tischen Sinuskurven gemäß dem Nachfolgenden durchgeführt werden.
  • Zuerst müssen alle Teilbandkanäle innerhalb des aktuellen Skalierfaktorbandes eingestellt werden, sodass die Durchschnittsenergie für das Band bewahrt wird, gemäß:
    Figure 00260001
    wo ll und lu die Grenzen für das Skalierfaktorband sind, wo ein synthetischer Sinus hinzugefügt wird, xre und xim der echte und der imaginäre Teilbandabtastwert sind, l der Kanalindex ist und
    Figure 00260002
    der erforderliche Gewinneinstellfaktor ist, wobei n das aktuelle Skalierfaktorband ist. Es sollte hier erwähnt werden, dass die obige Gleichung für das Spektrallinien-/Bandpass-Signal des Filterbankkanals nicht gültig ist, in dem der Sinus platziert wird.
  • Es sollte hier darauf hingewiesen werden, dass die obige Gleichung nur gültig für die Kanäle in dem gegebenen Skalierfaktorband ist, das sich von llow bis lup erstreckt, mit Ausnahme des Bandpasssignals in dem Kanal mit der Zahl ls. Dieses Signal wird mit Hilfe der nachfolgenden Gleichungsgruppe behandelt.
  • Der Manipulierer 1210 führt die nachfolgende Gleichung für den Kanal mit der Kanalzahl ls durch, d. h. Modulieren des Bandpasssignals in dem Kanal ls mit Hilfe des komplexen Modulationssignals, das eine synthetische Sinuswelle darstellt. Zusätzlich dazu führt der Manipulierer 1210 ein Gewichten des Spektrallinienausgangssignals aus dem HFR-Block 1208 sowie das Bestimmen des Pegels des synthetischen Sinus durch, mit Hilfe des Synthetischer-Sinus-Einstellfaktors gsine. Daher ist die nachfolgende Gleichung nur für einen Filterbankkanal ls gültig, in den ein Sinus platziert wird.
  • Dementsprechend wird der Sinus in den QMF-Kanal ls platziert, wobei l1 ≤ ls < lu, gemäß:
    Figure 00270001
    wobei k der Modulationsvektorindex ist (0 ≤ k < 4) und
    Figure 00270002
    die konjugiert Komplexe für jeden anderen Kanal ist. Dies ist erforderlich, da jeder zweite Kanal in der QMF-Filterbank frequenzinvertiert ist. Der Modulationsvektor zum Platzieren eines Sinus in der Mitte eines komplexen Teilband-Filterbankbandes ist:
    Figure 00270003
    und der Pegel des synthetischen Sinus ist gegeben durch:
    Figure 00270004
  • Das oben Genannte ist angezeigt in 46, wo ein Spektrum des Originals in 4 angezeigt ist und die Spektren des Ausgangssignals mit und ohne das oben Genannte in 56 angezeigt sind. In 5 wird der Ton in dem 8 kHz-Bereich ersetzt durch Breitbandrauschen. In 6 wird ein Sinus in die Mitte des Skalierfaktorbandes in dem 8 kHz-Bereich eingefügt und die Energie für das gesamte Skalierfaktorband wird eingestellt, sodass es die korrekte Durchschnittsenergie für dieses Skalierfaktorband beibehält.
  • Praktische Implementierungen
  • Die vorliegende Erfindung kann sowohl in Hardwarechips als auch DSPs implementiert werden, für verschiedene Arten von Systemen, zur Speicherung oder Übertragung von Signalen, analog oder digital, unter Verwendung beliebiger Codecs. In 7 ist eine mögliche Codiererimplementierung der vorliegenden Erfindung angezeigt. Das analoge Eingangssignal wird in eine digitale Entsprechung 701 umgewandelt und zu dem Kerncodierer 702 sowie zu dem Parameterextraktionsmodul für die HFR 704 zugeführt. Eine Analyse wird durchgeführt 703, um zu bestimmen, welche Spektrallinien nach einer Hochfrequenzwiederherstellung in dem Decodierer fehlen. Diese Spektrallinien werden auf geeignete Weise codiert und in den Bitstrom zusammen mit dem Rest der codierten Daten 705 gemultiplext. 8 zeigt eine mögliche Decodiererimplementierung der vorliegenden Erfindung. Der Bitstrom wird gedemultiplext 801 und das Unterband wird durch den Kerndecodierer 803 decodiert, das Oberband wird unter Verwendung einer geeigneten HFR-Einheit 804 wiederhergestellt und die zusätzlichen Informationen auf den Spektrallinien, die fehlen, nachdem die HFR decodiert 805 und verwendet wurde, um die fehlenden Komponenten 806 zu regenerieren. Die Spektralhüllkurve des Oberbandes wird decodiert 802 und verwendet, um die spektrale Hüllkurve des wiederhergestellten Oberbandes 807 einzustellen. Das Unterband wird verzögert 808, um eine korrekte Zeitsynchronisierung mit dem wiederhergestellten Oberband sicherzustellen, und die zwei werden zusammenaddiert. Das digitale Breitbandsignal wird in ein analoges Breitbandsignal umgewandelt 809.
  • Abhängig von Implementierungsdetails können die erfinderischen Verfahren zum Decodieren oder Codieren in Hardware oder in Software implementiert sein. Die Implementierung kann auf einem digitalen Speicherungsmedium stattfinden, insbesondere einer Platte, einer CD mit elektronisch lesbaren Steuerungssignalen, die mit einem programmierbaren Computersystem zusammenarbeiten können, sodass das entspre chende Verfahren ausgeführt wird. Im Allgemeinen bezieht sich die vorliegende Erfindung auch auf ein Computerprogrammprodukt mit einem Programmcode, der auf einem maschinenlesbaren Träger gespeichert ist, zum Durchführen der erfinderischen Verfahren, wenn das Computerprogrammprodukt auf einem Computer läuft. Anders ausgedrückt ist die vorliegende Erfindung daher ein Computerprogramm mit einem Programmcode zum Durchführen des erfinderischen Verfahrens zum Codieren oder Decodieren, wenn das Computerprogramm auf einem Computer läuft.
  • Es wird darauf hingewiesen, dass die obige Beschreibung sich auf ein komplexes System bezieht. Die erfinderische Decodiererimplementierung funktioniert jedoch ebenfalls in einem Echtwertsystem. In diesem Fall umfassen die Gleichungen, die durch den Manipulierer 1210 durchgeführt werden, nur die Gleichungen für den Echtteil.

Claims (30)

  1. Codierer zum Codieren eines Audiosignals, um ein codiertes Signal zu erhalten, wobei das codierte Signal zum Decodieren unter Verwendung einer Hochfrequenz-Regenerationstechnik vorgesehen ist, die geeignet ist zum Erzeugen von Frequenzkomponenten über einer vorbestimmten Frequenz basierend auf Frequenzkomponenten unter der vorbestimmten Frequenz, wobei der Codierer folgende Merkmale aufweist: eine Einrichtung (702) zum Liefern eines codierten Eingangssignals, das eine codierte Darstellung eines Eingangssignals ist, wobei das Eingangssignal unter Verwendung eines Codierungsalgorithmus codiert wird, und einen Frequenzinhalt des Audiosignals unter der vorbestimmten Frequenz darstellt; einen Hochfrequenzregnerator (703c) zum Durchführen der Hochfrequenz-Regenerationstechnik an dem Eingangssignal oder einer codierten und decodierten Version desselben, um ein regeneriertes Signal zu erhalten, das Frequenzkomponenten über der vorbestimmten Frequenz aufweist; einen Detektor zum Erfassen (703a) von Differenzen zwischen dem regenerierten Signal und dem Audiosignal, die über einer Signifikanzschwelle sind; einen Beschreiber zum Beschreiben (703b) von erfassten Differenzen, um zusätzliche Informationen zu erhalten; und einen Kombinierer (705) zum Kombinieren des codierten Eingangssignals und der zusätzlichen Informationen, um das codierte Signal zu erzeugen.
  2. Codierer gemäß Anspruch 1, bei dem die erfassten Differenzen Spektrallinien in dem Audiosignal sind, die in dem regenerierten Signal nicht umfasst sind.
  3. Codierer gemäß Anspruch 1 oder 2, bei dem die vorbestimmte Frequenz eine Überkreuzungsfrequenz ist, die eine Frequenz bestimmt, bis zu der das Eingangssignal durch den Codierungsalgorithmus codiert ist.
  4. Codierer gemäß einem der vorangehenden Ansprüche, bei dem der Detektor (703a) zum Verwenden einer Mehrzahl von Frequenzbändern für das regenerierte Signal und das Audiosignal angeordnet ist, wobei die Differenzen basierend auf Frequenzbändern des regenerierten Signals und denselben Frequenzbändern des Audiosignals erfasst werden.
  5. Codierer gemäß einem der vorangehenden Ansprüche, bei dem der Detektor (703a) und/oder der Hochfrequenzregnerator einen Zeitbereich-zu-Frequenzbereich-Wandler umfassen.
  6. Codierer gemäß Anspruch 5, bei dem der Zeitbereich-zu-Frequenzbereich-Wandler eine Transformation oder eine Filterbank ist.
  7. Codierer gemäß einem der vorangehenden Ansprüche, bei dem der Detektor (703) folgende Merkmale aufweist: einen Prädiktor zum Durchführen von Voraussagen über das regenerierte Signal und das Audiosignal; und einen Detektor zum Erfassen einer Differenz bei Vorhersageverstärkungen, die durch den Prädiktor erhalten werden, die größer sind als eine Verstärkungsschwelle, die die Signifikanzschwelle bildet.
  8. Codierer gemäß einem der vorangehenden Ansprüche, bei dem der Detektor (703a) zum Erfassen einer Differenz bei den absoluten Spektren des Audiosignals und des regenerierten Signals angeordnet ist, die über der vorbestimmten Differenzschwelle ist, die die Signifikanzschwelle bildet.
  9. Codierer gemäß einem der vorangehenden Ansprüche, bei dem der Detektor (703a) zum Erfassen zum Bestimmen eines frequenzabhängigen Tonalitätsmaßes für das Audiosignal und das regenerierte Signal angeordnet ist, wobei ein Frequenzband erfasst wird, bei dem die Tonalitätsmaße um mehr als eine Schwellendifferenz abweichen, die die Signifikanzschwelle bildet.
  10. Codierer gemäß Anspruch 9, bei dem das Tonalitätsmaß ein Tonal-zu-Rauschen-Verhältnis ist.
  11. Codierer gemäß einem der vorangehenden Ansprüche, bei dem das Audiosignal ein einzelnes Audiosignal ist, das unter Verwendung einer Abtastfrequenz abgetastet wird; bei dem die vorbestimmte Frequenz niedriger ist als die Hälfte des Werts der Abtastfrequenz; bei dem der Detektor (703a) angeordnet ist zum Bestimmen einer Differenz für ein spezifisches Frequenzband über dem vorbestimmten Frequenzband, wobei eine Mittenfrequenz des spezifischen Frequenzbandes niedriger ist als die Hälfte des Werts der Abtastfrequenz, wobei der Codierer ferner folgendes Merkmal aufweist: eine Steuerung (910) zum Steuern eines Codierers, der das codierte Eingangssignal erzeugt, um zusätzlich das Audiosignal im Hinblick auf das spezifische Frequenzband gemäß dem Codierungsalgorithmus zu codieren, um die bestimmte Differenz zu beschreiben, wobei ein Ausgangssignal des Codierers (702) für das spezifische Frequenzband als die zusätzlichen Informationen dient.
  12. Codierer gemäß einem der Ansprüche 1 bis 10, bei dem der Beschreiber (703b) ein Bandpassfilter zum Bandpassfiltern des Audiosignals umfasst, wobei das Bandpassfilter auf ein spezifisches Frequenzband eingestellt ist, das eine erfasste Differenz umfasst, und wobei der Beschreiber (703b) einen Codierer zum Codieren eines Ausgangssignals des Bandpassfilters umfasst, um das zusätzliche Signal zu erhalten, wobei der Codierer einen Codierungsalgorithmus verwendet, der sich von dem Codierungsalgorithmus unterscheidet, mit dem das codierte Eingangssignal codiert wird.
  13. Codierer gemäß einem der Ansprüche 1 bis 11, bei dem der Detektor zum Erfassen von Differenzen zum Erfassen von Spektrallinien angeordnet ist, und bei dem der Beschreiber zum Erzeugen von Informationen über die Frequenzposition der erfassten Spektrallinie angeordnet ist.
  14. Codierer gemäß Anspruch 13, bei dem die Informationen über die Frequenzposition einen Vektor umfassen, der anzeigt, für ein Skalierfaktorband, ob eine Spektrallinie in dem spezifischen Skalierfaktorband hinzugefügt werden muss, wenn das codierte Signal decodiert wird.
  15. Codierer gemäß einem der vorangehenden Ansprüche, bei dem das Audiosignal rahmenweise verarbeitet wird, und bei dem die bestimmte Frequenz von Rahmen zu Rahmen variabel ist.
  16. Codierer gemäß Anspruch 15, bei dem der Differenzdetektor (703a) ferner eine Überkreuzungsfrequenzsteuerung aufweist, zum Variieren der vorbestimmten Frequenz basierend auf einer erfassten Differenz.
  17. Codierer gemäß einem der vorangehenden Ansprüche, bei dem die HFR-Technik angeordnet ist, um Spektralwerte über der vorbestimmten Frequenz aus Spektralwerten unter der vorbestimmten Frequenz zu erzeugen.
  18. Codierer gemäß einem der vorangehenden Ansprüche, bei dem die HFR-Technik angeordnet ist, um eine Gruppe von Spektralwerten oder Bandpasssignalen, die sich auf aufeinanderfolgende Frequenzen beziehen, zu einer Gruppe von Spektralwerten oder Bandpasssignalen über der vorbestimmten Frequenz zu transponieren, die aufeinanderfolgenden Frequenzen entsprechen.
  19. Codierer gemäß Anspruch 17 oder 18, der ferner einen Spektral-Hüllekurven-Schätzer (704) zum Bestimmen einer spektralen Hüllkurve des Audiosignals aufweist, wobei sich die spektrale Hüllkurve auf ein spektrales Teil des Audiosignals über der vorbestimmten Frequenz bezieht.
  20. Codierer gemäß Anspruch 19, bei dem die spektralen Hüllkurvendaten eine Anzahl von Hüllkurvendatenpunkten umfassen, die geringer ist als eine Anzahl von Spektralwerten, wobei ein Datenpunkt für ein Skalierfaktorband vorgesehen ist.
  21. Codierer gemäß einem der vorangehenden Ansprüche, bei dem die Spektralkomponenten komplexe Transformationskoeffizienten oder komplexe Bandpasssignale sind.
  22. Decodierer zum Decodieren eines codierten Signals, wobei das codierte Signal ein codiertes Eingangssignal umfasst, das einen Frequenzinhalt eines Originalaudiosignals unter einer vorbestimmten Frequenz darstellt, wobei die Codierung unter Verwendung eines Codierungsalgorithmus und zusätzlicher Informationen durchgeführt wird, die erfasste Differenzen zwischen einem regenerierten Signal und dem Originalaudiosignal beschreiben, wobei das regenerierte Signal durch eine Hochfrequenz-Regenerierungstechnik aus dem Eingangssignal oder einer codierten und decodierten Version desselben erzeugt wird, wobei der Decodierer folgende Merkmale aufweist: eine Einrichtung (803) zum Erhalten eines decodierten Eingangssignals, das durch Decodieren des codierten Eingangssignals gemäß dem Codierungsalgorithmus erzeugt wird; einen Rekonstruierer (805) zur Rekonstruktion von erfassten Differenzen basierend auf den zusätzlichen Informationen; einen Hochfrequenzregenerator (804) zum Durchführen einer Hochfrequenz-Regenerationstechnik ähnlich zu der Hochfrequenz-Regenerationstechnik zum Erhalten der erfassten Differenzen, um das regenerierte Signal zu erhalten; einen Erzeuger (806, 807) zum Erzeugen eines regenerierten Hochfrequenz-Audiosignals basierend auf dem decodierten Eingangssignal, den rekonstruierten Differenzen und dem regenerierten Signal.
  23. Decodierer gemäß Anspruch 22, bei dem eine erfasste Differenz Spektrallinien in einer spezifizierten Fre quenzregion umfasst und sich die zusätzlichen Informationen auf die spezifische Frequenzregion beziehen, wobei der Rekonstruierer (805) angeordnet ist zum Erzeugen einer Spektrallinie in der spezifizierten Region ansprechend auf die zusätzlichen Informationen.
  24. Decodierer gemäß Anspruch 22 oder 23, bei dem die zusätzlichen Informationen ein Skalierfaktorband spezifizieren, in dem eine Spektrallinie rekonstruiert werden soll, bei dem das codierte Signal ferner Spektralhüllkurvendaten aufweist zum Beschreiben eines spektralen Abschnitts des Audiosignals über der vorbestimmten Frequenz, bei dem der Erzeuger (806, 807) zum Erzeugen einer Spektrallinie in dem Skalierfaktorband angeordnet ist, und bei dem der Erzeuger (806, 807) ferner zum Einstellen von Spektrallinien in dem Skalierfaktorband angeordnet ist, so dass eine gegebene Energie für das Skalierfaktorband, das die erzeugte Spektrallinie umfasst, beibehalten wird.
  25. Decodierer gemäß einem der Ansprüche 22 bis 24, bei dem der Hochfrequenzregenerator (804) eine Synthesefilterbank (1203) mit Synthesefilterbankkanälen umfasst, wobei ein Skalierfaktorband mehr als einen Filterbankkanal umfasst, bei dem das codierte Signal ferner einen Spektralhüllkurvenvektor und einen Rauschbodenpegelvektor umfasst, und bei dem der Rekonstruierer (805) angeordnet ist zum Berechnen eines Pegels der rekonstruierten Spektrallinie basierend auf dem Spektralhüllkurvenvektor.
  26. Decodierer gemäß Anspruch 25, bei dem der Erzeuger (806, 807) zum Bestimmen von Bandpasssignalen für Filterbankkanäle angeordnet ist, in die kein Sinus eingefügt werden soll, in einem Skalierfaktorband gemäß der nachfolgenden Gleichung
    Figure 00370001
    wobei l eine Filterbankkanalnummer ist, wobei ll die niedrigste Filterbankkanalnummer für das Skalierfaktorband ist, wobei lu der höchste Filterbankkanal für das Skalierfaktorband ist, wobei xre der echte Teil eines Bandpasssignalabtastwerts ist, ausgegeben durch den HFR-Block (804), wobei xim ein imaginärer Teil des Bandpasssignalabtastwerts ist, ausgegeben durch den HFR-Block (804), wobei yre und yim der echte Teil und der imaginäre Teil eines eingestellten Bandpasssignals für einen Filterbankkanal sind, und wobei ghfr ein Gewinneinstellfaktor ist, hergeleitet aus dem Rauschbodenpegelvektor.
  27. Decodierer gemäß Anspruch 25 oder 26, bei dem der Rekonstruierer (805) zum Bestimmen eines bestimmten Skalierfaktorbandes ls angeordnet ist, in das ein synthetischer Sinus eingefügt werden soll, und bei dem eine Ebene eines synthetischen Sinus, der eingefügt werden soll, wie folgt definiert ist:
    Figure 00370002
    wobei n eine Nummer des gegebenen Skalierfaktorbandes ist und e der Spektralhüllkurvenvektor ist, und wobei der Erzeuger zum Bestimmen eines Bandpasssignals für den Kanal angeordnet ist, in dem der synthetische Sinus gemäß der nachfolgenden Gleichung platziert werden soll:
    Figure 00380001
    wobei ls eine Filterbankkanalnummer ist, in die ein Sinus eingefügt werden soll, wobei ll die niedrigste Filterbankkanalnummer für das Skalierfaktorband ist, wobei lu der höchste Filterbankkanal für das Skalierfaktorband ist, wobei xre der echte Teil eines Bandpasssignalabtastwerts ist, ausgegeben durch den HFR-Block (804), wobei xim ein imaginärer Teil des Bandpasssignalabtastwerts ist, ausgegeben durch den HFR-Block (804), und wobei yre und yim der echte Teil und der imaginäre Teil eines eingestellten Bandpasssignals für einen Filterbankkanal sind, und wobei ghfr ein Gewinneinstellfaktor ist, hergeleitet aus dem Rauschbodenpegelvektor, wobei φre und φim einen komplexen Modulationsvektor zum Platzieren eines Sinus in ein Bandpasssignal bilden, und wobei k ein Modulationsvektorindex im Bereich zwischen 0 und 4 ist.
  28. Verfahren zum Codieren eines Audiosignals, um ein codiertes Signal zu erhalten, wobei das codierte Signal zum Decodieren unter Verwendung einer Hochfrequenz-Regenerationstechnik vorgesehen ist, die geeignet ist zum Erzeugen von Frequenzkomponenten über einer vorbestimmten Frequenz basierend auf Frequenzkomponenten unter der vorbestimmten Frequenz, wobei das Verfahren folgende Schritte aufweist: Liefern eines codierten Eingangssignals, das eine codierte Darstellung eines Eingangssignals ist, wobei das Eingangssignal unter Verwendung eines Codierungsalgorithmus codiert ist und einen Frequenzinhalt des Audiosignals unter der vorbestimmten Frequenz darstellt; Durchführen der Hochfrequenzregenerationstechnik an dem Eingangssignal oder einer codierten und decodierten Version desselben, um ein regeneriertes Signal mit Frequenzkomponenten über der vorbestimmten Frequenz zu erhalten; Erfassen (703a) von Differenzen zwischen dem regenerierten Signal und dem Audiosignal, die über einer Signifikanzschwelle sind; Beschreiben (703b) von erfassten Differenzen, um zusätzliche Informationen zu erhalten; und Kombinieren des codierten Eingangssignals und der zusätzlichen Informationen, um das codierte Signal zu erzeugen.
  29. Verfahren zum Decodieren eines codierten Signals, wobei das codierte Signal ein codiertes Eingangssignal umfasst, das einen Frequenzinhalt eines Originalaudiosignals unter einer vorbestimmten Frequenz darstellt, wobei das Codieren unter Verwendung eines Codierungsalgorithmus durchgeführt wird, und wobei zusätzliche Informationen erfasste Differenzen zwischen einem regenerierten Signal und dem Originalaudiosignal beschreiben, wobei das regenerierte Signal durch eine Hochfrequenz-Regenerationstechnik aus dem Eingangssignal oder einer codierten und decodierten Version des selben erzeugt wird, wobei das Verfahren folgende Schritte aufweist: Erhalten eines decodierten Eingangssignals, das durch Decodieren des codierten Eingangssignals gemäß dem Codierungsalgorithmus erzeugt wird; Rekonstruieren der erfassten Differenz basierend auf den zusätzlichen Informationen; Durchführen einer Hochfrequenz-Regenerationstechnik ähnlich zu der Hochfrequenz-Regenerationstechnik zum Erhalten der erfassten Differenzen, um das regenerierte Signal zu erhalten; Erzeugen eines regenerierten Hochfrequenz-Audiosignals basierend auf dem decodierten Eingangssignal, den rekonstruierten Differenzen und dem regenerierten Signal.
  30. Computerprogramm mit einem Programmcode zum Ausführen des Verfahrens zum Codieren gemäß Anspruch 21 oder des Verfahrens zum Codieren gemäß Anspruch 22, wenn das Computerprogramm auf einem Computer läuft.
DE60202881T 2001-11-29 2002-11-28 Wiederherstellung von hochfrequenzkomponenten Expired - Lifetime DE60202881T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0104004 2001-11-29
SE0104004 2001-11-29
PCT/EP2002/013462 WO2003046891A1 (en) 2001-11-29 2002-11-28 Methods for improving high frequency reconstruction

Publications (2)

Publication Number Publication Date
DE60202881D1 DE60202881D1 (de) 2005-03-10
DE60202881T2 true DE60202881T2 (de) 2006-01-19

Family

ID=20286143

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60202881T Expired - Lifetime DE60202881T2 (de) 2001-11-29 2002-11-28 Wiederherstellung von hochfrequenzkomponenten

Country Status (12)

Country Link
US (15) US7469206B2 (de)
EP (1) EP1423847B1 (de)
JP (1) JP3870193B2 (de)
KR (1) KR100648760B1 (de)
CN (1) CN1279512C (de)
AT (1) ATE288617T1 (de)
AU (1) AU2002352182A1 (de)
DE (1) DE60202881T2 (de)
ES (1) ES2237706T3 (de)
HK (1) HK1062350A1 (de)
PT (1) PT1423847E (de)
WO (1) WO2003046891A1 (de)

Families Citing this family (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
JP3579047B2 (ja) * 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
JP2005024756A (ja) * 2003-06-30 2005-01-27 Toshiba Corp 復号処理回路および移動端末装置
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
EP3336843B1 (de) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Sprachcodierungsverfahren und sprachcodierungsvorrichtung
KR20070012832A (ko) * 2004-05-19 2007-01-29 마츠시타 덴끼 산교 가부시키가이샤 부호화 장치, 복호화 장치 및 이들의 방법
US8255231B2 (en) * 2004-11-02 2012-08-28 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
EP1840874B1 (de) * 2005-01-11 2019-04-10 NEC Corporation Vorrichtung, verfahren und programm zur audiokodierung
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
WO2007037361A1 (ja) 2005-09-30 2007-04-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
WO2007099580A1 (ja) * 2006-02-28 2007-09-07 Matsushita Electric Industrial Co., Ltd. マルチメディアデータ再生装置および方法
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
JP2010503881A (ja) * 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
DE102007003187A1 (de) * 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
WO2008114080A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation Audio decoding
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
JP5183741B2 (ja) * 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
EP2212884B1 (de) * 2007-11-06 2013-01-02 Nokia Corporation Codierer
CA2704807A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
CN102568489B (zh) * 2007-11-06 2015-09-16 诺基亚公司 编码器
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
WO2009109373A2 (en) * 2008-03-04 2009-09-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
ES2684297T3 (es) 2008-07-11 2018-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Método y discriminador para clasificar diferentes segmentos de una señal de audio que comprende segmentos de voz y música
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
ES2396927T3 (es) * 2008-07-11 2013-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para decodificar una señal de audio codificada
MY155538A (en) * 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
BRPI0910792B1 (pt) * 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
CN101685637B (zh) * 2008-09-27 2012-07-25 华为技术有限公司 音频编码方法及装置和音频解码方法及装置
AU2013203159B2 (en) * 2008-12-15 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and bandwidth extension decoder
PL4053838T3 (pl) * 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
EP2360687A4 (de) * 2008-12-19 2012-07-11 Fujitsu Ltd Sprachbanderweiterungseinrichtung und sprachbanderweiterungsverfahren
PL3598447T3 (pl) 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
PL3246919T3 (pl) 2009-01-28 2021-03-08 Dolby International Ab Ulepszona transpozycja harmonicznych
EP2645367B1 (de) * 2009-02-16 2019-11-20 Electronics and Telecommunications Research Institute Kodier-/Dekodierverfahren für Tonsignale mit adaptiver sinusoidaler Kodierung und Vorrichtung dafür
US8983831B2 (en) * 2009-02-26 2015-03-17 Panasonic Intellectual Property Corporation Of America Encoder, decoder, and method therefor
BRPI1009467B1 (pt) 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (de) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines synthetischen Audiosignals und zur Kodierung eines Audiosignals
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
TWI591625B (zh) 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
CN103559891B (zh) * 2009-09-18 2016-05-11 杜比国际公司 改进的谐波转置
EP2481048B1 (de) * 2009-09-25 2017-10-25 Nokia Technologies Oy Audiokodierung
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048010A1 (en) 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
WO2011048741A1 (ja) * 2009-10-20 2011-04-28 日本電気株式会社 マルチバンドコンプレッサ
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
TR201904117T4 (tr) * 2010-04-16 2019-05-21 Fraunhofer Ges Forschung Kılavuzlu bant genişliği uzantısı ve gözü kapalı bant genişliği uzantısı kullanılarak bir geniş bantlı sinyal üretilmesine yönelik aparat, yöntem ve bilgisayar programı.
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
PL2596497T3 (pl) * 2010-07-19 2014-10-31 Dolby Int Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
CN107993673B (zh) * 2012-02-23 2022-09-27 杜比国际公司 确定噪声混合因子的方法、系统、编码器、解码器和介质
RU2725416C1 (ru) * 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
EP2950308B1 (de) * 2013-01-22 2020-02-19 Panasonic Corporation Generator für bandbreitenerweiterungsparameter, codierer, decodierer, verfahren zur generierung von bandbreitenerweiterungsparametern, codierverfahren und decodierungsverfahren
EP3054446B1 (de) * 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierer, audiodecodierer, verfahren zur bereitstellung codierter audioinformationen, verfahren zur bereitstellung decodierter audioinformationen, computerprogramm und codierte darstellung mit einer signaladaptiven bandbreitenerweiterung
AU2014211520B2 (en) 2013-01-29 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-frequency emphasis for LPC-based coding in frequency domain
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
RU2665228C1 (ru) * 2013-04-05 2018-08-28 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
EP2830063A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Dekodieren eines kodierten Audiosignals
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9858941B2 (en) * 2013-11-22 2018-01-02 Qualcomm Incorporated Selective phase compensation in high band coding of an audio signal
US20150170655A1 (en) * 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
BR112016020988B1 (pt) 2014-03-14 2022-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
EP2980792A1 (de) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines verbesserten Signals mit unabhängiger Rausch-Füllung
CA2964906A1 (en) 2014-10-20 2016-04-28 Audimax, Llc Systems, methods, and devices for intelligent speech recognition and processing
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3182411A1 (de) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verarbeitung eines codierten audiosignals
AU2017219696B2 (en) * 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US9666191B1 (en) * 2016-03-17 2017-05-30 Vocalzoom Systems Ltd. Laser-based system and optical microphone having increased bandwidth
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
EP3288031A1 (de) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur codierung eines audiosignals mit einem kompensationswert
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
KR20180002888U (ko) 2017-03-29 2018-10-10 박미숙 무좀 예방용 양말
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
BR112020012654A2 (pt) * 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
CN114242089A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
AU2019258524B2 (en) * 2018-04-25 2024-03-28 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN111766443B (zh) * 2020-06-02 2022-11-01 江苏集萃移动通信技术研究所有限公司 基于窄带频谱缝合的分布式宽带电磁信号监测方法及系统
CN111916090B (zh) * 2020-08-17 2024-03-05 北京百瑞互联技术股份有限公司 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备
CN117275446B (zh) * 2023-11-21 2024-01-23 电子科技大学 一种基于声音事件检测的交互式有源噪声控制系统及方法

Family Cites Families (213)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3947827A (en) * 1974-05-29 1976-03-30 Whittaker Corporation Digital storage system for high frequency signals
US4053711A (en) 1976-04-26 1977-10-11 Audio Pulse, Inc. Simulation of reverberation in audio signals
US4166924A (en) 1977-05-12 1979-09-04 Bell Telephone Laboratories, Incorporated Removing reverberative echo components in speech signals
FR2412987A1 (fr) 1977-12-23 1979-07-20 Ibm France Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede
US4330689A (en) 1980-01-28 1982-05-18 The United States Of America As Represented By The Secretary Of The Navy Multirate digital voice communication processor
GB2100430B (en) 1981-06-15 1985-11-27 Atomic Energy Authority Uk Improving the spatial resolution of ultrasonic time-of-flight measurement system
DE3171311D1 (en) 1981-07-28 1985-08-14 Ibm Voice coding method and arrangment for carrying out said method
US4700390A (en) * 1983-03-17 1987-10-13 Kenji Machida Signal synthesizer
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4672670A (en) 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
US4700362A (en) 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation A-D encoder and D-A decoder system
EP0139803B1 (de) 1983-10-28 1987-10-14 International Business Machines Corporation Verfahren zur Wiederherstellung von verlorengegangenen Informationen in einem digitalen Sprachübertragungssystem und Übertragungssystem welches dieses Verfahren anwendet
US4706287A (en) 1984-10-17 1987-11-10 Kintek, Inc. Stereo generator
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4748669A (en) 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
DE3683767D1 (de) 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
JPH0690209B2 (ja) 1986-06-13 1994-11-14 株式会社島津製作所 反応管の攪拌装置
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
GB8628046D0 (en) 1986-11-24 1986-12-31 British Telecomm Transmission system
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5285520A (en) 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
FR2628918B1 (fr) 1988-03-15 1990-08-10 France Etat Dispositif annuleur d'echo a filtrage en sous-bandes de frequence
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH0212299A (ja) 1988-06-30 1990-01-17 Toshiba Corp 音場効果自動制御装置
JPH02177782A (ja) 1988-12-28 1990-07-10 Toshiba Corp モノラルtv音声復調回路
US5297236A (en) 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
DE68916944T2 (de) 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
US5309526A (en) 1989-05-04 1994-05-03 At&T Bell Laboratories Image processing system
CA2014935C (en) 1989-05-04 1996-02-06 James D. Johnston Perceptually-adapted image coding system
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5261027A (en) 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
US4974187A (en) 1989-08-02 1990-11-27 Aware, Inc. Modular digital signal processing system
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
US4969040A (en) 1989-10-26 1990-11-06 Bell Communications Research, Inc. Apparatus and method for differential sub-band coding of video signals
JPH03214956A (ja) 1990-01-19 1991-09-20 Mitsubishi Electric Corp テレビ会議装置
JPH03217782A (ja) 1990-01-19 1991-09-25 Matsushita Refrig Co Ltd 冷蔵庫の棚装置
JPH0685607B2 (ja) 1990-03-14 1994-10-26 関西電力株式会社 薬液注入防護工法
JP2906646B2 (ja) 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5293449A (en) 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JP3158458B2 (ja) 1991-01-31 2001-04-23 日本電気株式会社 階層表現された信号の符号化方式
GB9104186D0 (en) 1991-02-28 1991-04-17 British Aerospace Apparatus for and method of digital signal processing
US5235420A (en) 1991-03-22 1993-08-10 Bell Communications Research, Inc. Multilayer universal video coder
JP2990829B2 (ja) 1991-03-29 1999-12-13 ヤマハ株式会社 効果付与装置
JP3050978B2 (ja) 1991-12-18 2000-06-12 沖電気工業株式会社 音声符号化方法
JPH05191885A (ja) 1992-01-10 1993-07-30 Clarion Co Ltd 音響信号イコライザ回路
WO1993016433A1 (en) * 1992-02-07 1993-08-19 Seiko Epson Corporation Hardware emulation accelerator and method
US5559891A (en) 1992-02-13 1996-09-24 Nokia Technology Gmbh Device to be used for changing the acoustic properties of a room
US5765127A (en) 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
GB9211756D0 (en) 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
US5278909A (en) 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
US5436940A (en) 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
FR2696874B1 (fr) 1992-10-13 1994-12-09 Thomson Csf Modulateur d'onde électromagnétique à puits quantiques.
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
CA2106440C (en) 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH06202629A (ja) 1992-12-28 1994-07-22 Yamaha Corp 楽音の効果付与装置
JPH06215482A (ja) 1993-01-13 1994-08-05 Hitachi Micom Syst:Kk オーディオ情報記録媒体、およびこのオーディオ情報記録媒体を用いる音場生成装置
JP3496230B2 (ja) 1993-03-16 2004-02-09 パイオニア株式会社 音場制御システム
US5664059A (en) * 1993-04-29 1997-09-02 Panasonic Technologies, Inc. Self-learning speaker adaptation based on spectral variation source decomposition
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE4331376C1 (de) 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
US5533052A (en) 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
WO1995015041A1 (en) 1993-11-26 1995-06-01 Philips Electronics N.V. A transmission system, and a transmitter and a receiver for use in such a system
JPH07160299A (ja) 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
JP3404837B2 (ja) 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
JP2616549B2 (ja) 1993-12-10 1997-06-04 日本電気株式会社 音声復号装置
KR960012475B1 (ko) 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
KR960003455A (ko) 1994-06-02 1996-01-26 윤종용 입체영상용 액정 셔터 안경
US5787387A (en) 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JPH08181284A (ja) 1994-09-13 1996-07-12 Hewlett Packard Co <Hp> 保護素子およびその製造方法
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US5839102A (en) 1994-11-30 1998-11-17 Lucent Technologies Inc. Speech coding parameter sequence reconstruction by sequence classification and interpolation
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
FR2729024A1 (fr) 1994-12-30 1996-07-05 Matra Communication Annuleur d'echo acoustique avec filtrage en sous-bandes
US5701390A (en) 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP3416331B2 (ja) 1995-04-28 2003-06-16 松下電器産業株式会社 音声復号化装置
US5915235A (en) * 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
US5692050A (en) 1995-06-15 1997-11-25 Binaura Corporation Method and apparatus for spatially enhancing stereo and monophonic signals
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JPH0946233A (ja) 1995-07-31 1997-02-14 Kokusai Electric Co Ltd 音声符号化方法とその装置、音声復号方法とその装置
JPH0955778A (ja) 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
US5774837A (en) 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5687191A (en) 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US5732189A (en) 1995-12-22 1998-03-24 Lucent Technologies Inc. Audio signal coding with a signal adaptive filterbank
TW307960B (en) 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
JP3519859B2 (ja) 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
JP3529542B2 (ja) 1996-04-08 2004-05-24 株式会社東芝 信号の伝送/記録/受信/再生方法と装置及び記録媒体
EP0798866A2 (de) 1996-03-27 1997-10-01 Kabushiki Kaisha Toshiba Digitales Datenverarbeitungssystem
US5848164A (en) 1996-04-30 1998-12-08 The Board Of Trustees Of The Leland Stanford Junior University System and method for effects processing on audio subband data
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
US5951235A (en) * 1996-08-08 1999-09-14 Jerr-Dan Corporation Advanced rollback wheel-lift
CA2184541A1 (en) 1996-08-30 1998-03-01 Tet Hin Yeap Method and apparatus for wavelet modulation of signals for transmission and/or storage
GB2317537B (en) 1996-09-19 2000-05-17 Matra Marconi Space Digital signal processing apparatus for frequency demultiplexing or multiplexing
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US5875122A (en) 1996-12-17 1999-02-23 Intel Corporation Integrated systolic architecture for decomposition and reconstruction of signals using wavelet transforms
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP4326031B2 (ja) 1997-02-06 2009-09-02 ソニー株式会社 帯域合成フィルタバンク及びフィルタリング方法並びに復号化装置
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6236731B1 (en) 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
IL120788A (en) * 1997-05-06 2000-07-16 Audiocodes Ltd Systems and methods for encoding and decoding speech for lossy transmission networks
US6370504B1 (en) 1997-05-29 2002-04-09 University Of Washington Speech recognition on MPEG/Audio encoded files
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1144179C (zh) 1997-07-11 2004-03-31 索尼株式会社 声音信号解码方法和装置、声音信号编码方法和装置
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6144937A (en) 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6124895A (en) 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US20010040930A1 (en) 1997-12-19 2001-11-15 Duane L. Abbey Multi-band direct sampling receiver
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JPH11262100A (ja) 1998-03-13 1999-09-24 Matsushita Electric Ind Co Ltd オーディオ信号の符号化/復号方法および装置
AU3372199A (en) 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
KR100474826B1 (ko) 1998-05-09 2005-05-16 삼성전자주식회사 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치
US6782132B1 (en) * 1998-08-12 2004-08-24 Pixonics, Inc. Video coding and reconstruction apparatus and methods
JP3354880B2 (ja) 1998-09-04 2002-12-09 日本電信電話株式会社 情報多重化方法、情報抽出方法および装置
JP3352406B2 (ja) * 1998-09-17 2002-12-03 松下電器産業株式会社 オーディオ信号の符号化及び復号方法及び装置
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP2000099061A (ja) 1998-09-25 2000-04-07 Sony Corp 効果音付加装置
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
GB2344036B (en) 1998-11-23 2004-01-21 Mitel Corp Single-sided subband filters
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US6507658B1 (en) 1999-01-27 2003-01-14 Kind Of Loud Technologies, Llc Surround sound panner
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
JP2000267699A (ja) 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US6363338B1 (en) 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6937665B1 (en) 1999-04-19 2005-08-30 Interuniversitaire Micron Elektronica Centrum Method and apparatus for multi-user transmission
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US6426977B1 (en) 1999-06-04 2002-07-30 Atlantic Aerospace Electronics Corporation System and method for applying and removing Gaussian covering functions
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP2003505967A (ja) 1999-07-27 2003-02-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ フィルタリング装置
JP4639441B2 (ja) 1999-09-01 2011-02-23 ソニー株式会社 ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法
DE19947098A1 (de) 1999-09-30 2000-11-09 Siemens Ag Verfahren zur Ermittlung der Kurbelwellenstellung
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
WO2001037263A1 (en) * 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6947509B1 (en) 1999-11-30 2005-09-20 Verance Corporation Oversampled filter bank for subband processing
JP2001184090A (ja) 1999-12-27 2001-07-06 Fuji Techno Enterprise:Kk 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体
EP1114814A3 (de) * 1999-12-29 2003-01-22 Haldor Topsoe A/S Verfahren zur Minderung von Iodverbindungen aus einem Prozessablauf
KR100359821B1 (ko) * 2000-01-20 2002-11-07 엘지전자 주식회사 움직임 보상 적응형 영상 압축과 복원방법 및 그 장치와디코더
US6732070B1 (en) 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
EP1139336A3 (de) * 2000-03-30 2004-01-02 Matsushita Electric Industrial Co., Ltd. Bestimmung der Quantisierungsfaktoren für einen Audio-Teilbandkodierer
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6879652B1 (en) 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
KR100809310B1 (ko) 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
US20020040299A1 (en) * 2000-07-31 2002-04-04 Kenichi Makino Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data
WO2002013572A2 (en) 2000-08-07 2002-02-14 Audia Technology, Inc. Method and apparatus for filtering and compressing sound signals
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
EP1211636A1 (de) 2000-11-29 2002-06-05 STMicroelectronics S.r.l. Filtereinrichtung und Verfahren zur Reduzierung von Geräusch in elektrischen Signalen, insbesondere akustische Signale und Bilder
JP4649735B2 (ja) 2000-12-14 2011-03-16 ソニー株式会社 符号化装置および方法、並びに記録媒体
WO2002056297A1 (en) 2001-01-11 2002-07-18 Sasken Communication Technologies Limited Adaptive-block-length audio coder
US6931373B1 (en) 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US6722114B1 (en) * 2001-05-01 2004-04-20 James Terry Poole Safe lawn mower blade alternative system
US7356464B2 (en) 2001-05-11 2008-04-08 Koninklijke Philips Electronics, N.V. Method and device for estimating signal power in compressed audio using scale factors
US6473013B1 (en) 2001-06-20 2002-10-29 Scott R. Velazquez Parallel processing analog and digital converter
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CA2354808A1 (en) 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
CA2354858A1 (en) 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
EP1292036B1 (de) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Verfahren und Vorrichtung zur Decodierung von digitalen Signalen
US7362818B1 (en) 2001-08-30 2008-04-22 Nortel Networks Limited Amplitude and phase comparator for microwave power amplifier
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
DE60204038T2 (de) * 2001-11-02 2006-01-19 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zum codieren bzw. decodieren eines audiosignals
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US7095907B1 (en) 2002-01-10 2006-08-22 Ricoh Co., Ltd. Content and display device dependent creation of smaller representation of images
US6771177B2 (en) 2002-01-14 2004-08-03 David Gene Alderman Warning device for food storage appliances
US20100042406A1 (en) 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
US20030215013A1 (en) * 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
US6904146B2 (en) 2002-05-03 2005-06-07 Acoustic Technology, Inc. Full duplex echo cancelling circuit
JP3579047B2 (ja) 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
AU2003252727A1 (en) 2002-08-01 2004-02-23 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band repliction
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US6792057B2 (en) 2002-08-29 2004-09-14 Bae Systems Information And Electronic Systems Integration Inc Partial band reconstruction of frequency channelized filters
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
EP1543307B1 (de) 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audiodecodierungsvorrichtung und -verfahren
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
US7191235B1 (en) * 2002-11-26 2007-03-13 Cisco Technology, Inc. System and method for communicating data in a loadbalancing environment
US20040252772A1 (en) 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US20040162866A1 (en) 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US6982377B2 (en) 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム

Also Published As

Publication number Publication date
US9812142B2 (en) 2017-11-07
US20170178647A1 (en) 2017-06-22
CN1571993A (zh) 2005-01-26
US9761234B2 (en) 2017-09-12
US8112284B2 (en) 2012-02-07
WO2003046891A1 (en) 2003-06-05
DE60202881D1 (de) 2005-03-10
AU2002352182A1 (en) 2003-06-10
US9779746B2 (en) 2017-10-03
US9761237B2 (en) 2017-09-12
US20190385624A1 (en) 2019-12-19
KR20040066114A (ko) 2004-07-23
US9761236B2 (en) 2017-09-12
JP3870193B2 (ja) 2007-01-17
US20130226597A1 (en) 2013-08-29
US20170178655A1 (en) 2017-06-22
US20110295608A1 (en) 2011-12-01
US20090326929A1 (en) 2009-12-31
US20170178646A1 (en) 2017-06-22
US20090132261A1 (en) 2009-05-21
EP1423847B1 (de) 2005-02-02
KR100648760B1 (ko) 2006-11-23
ATE288617T1 (de) 2005-02-15
US10403295B2 (en) 2019-09-03
US20170178654A1 (en) 2017-06-22
JP2005510772A (ja) 2005-04-21
US9818417B2 (en) 2017-11-14
US9818418B2 (en) 2017-11-14
US8019612B2 (en) 2011-09-13
US20170178656A1 (en) 2017-06-22
US7469206B2 (en) 2008-12-23
US20050096917A1 (en) 2005-05-05
US9431020B2 (en) 2016-08-30
US8447621B2 (en) 2013-05-21
HK1062350A1 (en) 2004-10-29
US9792923B2 (en) 2017-10-17
EP1423847A1 (de) 2004-06-02
PT1423847E (pt) 2005-05-31
US20170178658A1 (en) 2017-06-22
US20160358616A1 (en) 2016-12-08
CN1279512C (zh) 2006-10-11
US20160232912A1 (en) 2016-08-11
US11238876B2 (en) 2022-02-01
US20170178657A1 (en) 2017-06-22
ES2237706T3 (es) 2005-08-01

Similar Documents

Publication Publication Date Title
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE60013785T2 (de) VERBESSERTE SUBJEKTIVE QUALITäT VON SBR (SPECTRAL BAND REPLICATION)UND HFR (HIGH FREQUENCY RECONSTRUCTION) KODIERVERFAHREN DURCH ADDIEREN VON GRUNDRAUSCHEN UND BEGRENZUNG DER RAUSCHSUBSTITUTION
DE69731677T2 (de) Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
DE69737489T2 (de) Formung des erkennbaren Rauschsignals in der Zeitdomäne mittels LPC-Voraussage im Frequenzraum
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE102005032724B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE69634645T2 (de) Verfahren und Vorrichtung zur Sprachkodierung
DE602004002390T2 (de) Audiocodierung
DE69816810T2 (de) Systeme und verfahren zur audio-kodierung
DE69821089T2 (de) Verbesserung von quellenkodierung unter verwendung von spektralbandreplikation
DE602005002256T2 (de) Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion
DE19921122C1 (de) Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
DE112010005020B4 (de) Sprachsignal-Wiederherstellungsvorrichtung und Sprachsignal-Wiederherstellungsverfahren
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
DE60124079T2 (de) Sprachverarbeitung
WO2006114368A1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
EP1016319A1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten
DE60105576T2 (de) Verfahren und vorrichtung zur spektralen anreicherung
DE60102975T2 (de) Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition