DE60103424T2 - Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden - Google Patents

Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden Download PDF

Info

Publication number
DE60103424T2
DE60103424T2 DE60103424T DE60103424T DE60103424T2 DE 60103424 T2 DE60103424 T2 DE 60103424T2 DE 60103424 T DE60103424 T DE 60103424T DE 60103424 T DE60103424 T DE 60103424T DE 60103424 T2 DE60103424 T2 DE 60103424T2
Authority
DE
Germany
Prior art keywords
frequency
crossover frequency
audio signal
envelope
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60103424T
Other languages
English (en)
Other versions
DE60103424D1 (de
Inventor
Fredrik Henn
Andreas Ehret
Michael Schug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Stockholm Se AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Publication of DE60103424D1 publication Critical patent/DE60103424D1/de
Application granted granted Critical
Publication of DE60103424T2 publication Critical patent/DE60103424T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Optical Communication System (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Transmitters (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung bezieht sich auf digitale Audiocodierungssysteme, die Hochfrequenz-Rekonstruktionsverfahren (HFR-Verfahren) verwenden. Sie ermöglicht eine konsequentere Kerncodec-Leistungsfähigkeit, und es wird. eine verbesserte Audioqualität des kombinierten Kerncodec- und HFR-Systems erzielt.
  • HINTERGRUND DER ERFINDUNG
  • Audioquellencodierungstechniken können in zwei Klassen unterteilt werden: natürliches Audiocodieren und Sprachcodieren. Natürliches Audiocodieren wird üblicherweise für Musik oder willkürliche Signale bei mittleren Bitraten verwendet. Sprachcodecs sind im Grunde auf eine Sprachwiedergabe beschränkt, können jedoch andererseits bei sehr niedrigen Bitraten verwendet werden. Bei beiden wird das Signal allgemein in zwei Hauptsignalkomponenten geteilt, eine spektrale Hüllkurve und ein entsprechendes Restsignal. Codecs, die eine derartige Unterteilung verwenden, nutzen die Tatsache aus, dass die spektrale Hüllkurve viel effizienter codiert werden kann als das Restsignal. Bei Systemen, bei denen Hochfrequenz-Rekonstruktionsverfahren verwendet werden, wird kein Restsignal, das dem Hochband entspricht, übertragen. Statt dessen wird auf der Decoderseite von dem durch den Kerncodec abgedeckten Niedrigband ein Hochband erzeugt und geformt, um die gewünschte spektrale Hochband-Hüllkurve zu erhalten. Bei doppelendigen HFR-Systemen, wie sie beispielsweise in der internationalen Patentanmeldung WO 98157436 offenbart sind, werden Hüllkurvendaten übertragen, die dem oberen Frequenzbereich entsprechen, wohingegen bei einendigen HFR-Systemen die Hochbandhüllkurve von dem Niedrigband abgeleitet ist. In beiden Fällen legen Audiocodecs des Standes der Technik eine zeitlich unveränderliche Übergangsfrequenz zwischen dem Kerncodec-Frequenzbereich und dem HFR-Frequenzbereich an. Somit wird die Übergangsfrequenz bei einer gegebenen Bitrate so ausgewählt, dass für ein typisches Programmmaterial ein guter Kompromiss zwischen durch den Kerncodec eingeführten Artefakten und durch das HFR-System eingeführten Artefakten erzielt wird. Selbstverständlich kann eine derartige statische Einstellung für ein bestimmtes Signal vom Optimum weit entfernt sein: der Kerncodec ist entweder überbeansprucht, was zu höheren Niedrigbandartefakten führt als notwendig, was innerhalb des HFR-Verfahrens auch die Hochbandqualität verschlechtert, oder wird nicht bis zu seinem vollen Potential genutzt, d, h. es wird ein größerer HFR-Frequenzbereich verwendet als notwendig. Daher erreichen bekannte Systeme lediglich gelegentlich die maximale Leistungsfähigkeit des gemeinsamen Codierungssystems. Ferner wird die Möglichkeit, den Überschneidungspunkt zu Übergängen zwischen Regionen mit grundverschiedenen spektralen Eigenschaften, z. B. tonalen und rauschartigen Regionen, auszurichten, nicht genutzt.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung liefert ein durch die unabhängigen Ansprüche 6, 8 definiertes neues Verfahren und eine durch die unabhängigen Ansprüche 1, 7 definierte Vorrichtung zur Verbesserung von Codierungssystemen, bei denen Hochfrequenz-Rekonstruktionsverfahren (HFR) verwendet werden. Die Erfindung weicht von der traditionellen Verwendung einer feststehenden Übergangsfrequenz zwischen dem Niedrigband, bei dem herkömmliche Codierungsschemata (wie z. B. MPEG Layer-3 oder AAC) verwendet werden, und dem Hochband, bei dem HFR-Codierungsschemata verwendet werden, durch eine kontinuierliche Schätzung und Anwendung der Übergangsfrequenz ab, die den optimalen Kompromiss zwischen Artefakten liefert, die durch den Niedrigbandcodec bzw. das HFR-System eingeführt werden. Gemäß der Erfindung kann die Wahl auf einer Maßzahl des Schwierigkeitsgrades, ein Signal mit dem Kerncodec zu codieren, auf einer Kurzzeit-Bitnachfrageerfassung und auf einer Spektraltonalitätsanalyse oder jeglicher Kombination derselben beruhen. Die Maßzahl der Schwierigkeit kann von der wahrnehmbaren Entropie oder der psychoakustisch relevanten Kerncodecverzerrung abgeleitet sein. Da sich die optimale Wahl mit der Zeit häufig ändert, führt das Anlegen einer variablen Übergangsfrequenz zu einer beträchtlich verbesserten Audioqualität, die ferner weniger von Programmmaterialcharakteristika abhängig ist. Die Erfindung ist auf einendige und doppelendige HFR-Systeme anwendbar.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorliegende Erfindung wird nun anhand von veranschaulichenden Beispielen, die den Schutzumfang oder die Wesensart der Erfindung nicht einschränken, unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, bei denen:
  • 1 ein Graph ist, der die Begriffe Niedrigband, Hochband und Übergangsfrequenz veranschaulicht;
  • 2 ein Graph ist, der eine Kerncodec-Arbeitslastmaßzahl veranschaulicht;
  • 3 ein Graph ist, der Variationen eines Konstante-Bitrate-Codecs bezüglich Kurzzeit-Bitnachfragen veranschaulicht;
  • 4 ein Graph ist, der eine Teilung eines Signals in tonale und rauschartige Frequenzbereiche veranschaulicht;
  • 5 ein Blockdiagramm eines HFR-basierten Codierers ist, der durch ein Übergangsfrequenz-Steuermodul verbessert ist;
  • 6 ein Blockdiagramm ist, das das Übergangsfrequenz-Steuermodul im Detail veranschaulicht; und
  • 7 ein Blockdiagramm des entsprechenden HFR-basierten Decoders ist.
  • BESCHREIBUNG VON BEVORZUGTEN AUSFÜHRUNGSBEISPIELEN
  • Die nachfolgend beschriebenen Ausführungsbeispiele sind für die Prinzipien der vorliegenden Erfindung lediglich veranschaulichend. Es versteht sich, dass Modifikationen und Variationen der hierin beschriebenen Anordnungen und Details für andere Fachleute offensichtlich sind. Somit wird beabsichtigt, dass die Erfindung lediglich durch den Schutzumfang der beigefügten Patentansprüche begrenzt wird und nicht durch die spezifischen Einzelheiten, die anhand der Beschreibung und Erläuterung der Ausführungsbeispiele hierin präsentiert werden.
  • Bei einem System, bei dem das Niedrigband bzw. der Niedrigfrequenzbereich 101, wie er in 1 gegeben ist, durch einen Kerncodec codiert ist und der Hochband bzw. der Hochfrequenzbereich 102 durch ein geeignetes HFR-Verfahren abgedeckt ist, kann die Grenze zwischen den zwei Bereichen als die Übergangsfrequenz 103 definiert sein. Da die Codierungsschemata auf einer blockweisen Rahmen-um-Rahmen-Basis arbeiten, ist eines frei, die Übergangsfrequenz für jeden verarbeiteten Rahmen zu verändern. Gemäß der vorliegenden Erfindung ist es möglich, einen Erfassungsalgorithmus einzurichten, der die Übergangsfrequenz derart anpasst, dass die optimale Qualität für das kombinierte Codierungssystem erzielt wird. Dessen Implementierung wird nachfolgend als Übergangsfrequenz-Steuermodul bezeichnet.
  • Wenn man berücksichtigt, dass die Audioqualität des Kerncodecs auch die Basis für die Qualität des rekonstruierten Hochbandes ist, ist es offensichtlich, dass eine hohe und konstante Audioqualität in dem Niedrigbandbereich erwünscht ist. Durch Verringern der Übergangsfrequenz ist der Frequenzbereich, mit dem es der Kerncodec zu tun hat, kleiner und somit leichter zu codieren. Durch Messen des Schwierigkeitsgrades des Codierens eines Rahmens und des entsprechenden Einstellens der Übergangsfrequenz kann eine konstantere Audioqualität des Kerncodierers erreicht werden.
  • Als Beispiel dafür, wie der Schwierigkeitsgrad gemessen werden kann, kann die Wahrnehmungsentropie (ISO/IEC 13818-7, Anhang B.2.1] verwendet werden: Hier wird ein auf einer Spektralanalyse beruhendes psychoakustisches Modell angewendet. Üblicherweise sind die Spektrallinien der Analysefilterbank in Bänder gruppiert, wobei die Anzahl von Linien innerhalb eines Bandes von der Bandmittenfrequenz abhängt und gemäß der hinreichend bekannten Bark-Skala ausgewählt wird, wobei auf eine der Wahrnehmung nach konstante Frequenzauflösung für alle Bänder abgezielt wird. Durch Verwenden eines psychoakustischen Modells, das Effekte wie z. B. eine spektrale oder zeitliche Maskierung nutzt, werden Hörbarkeitsschwellen für jedes Band erhalten. Die Wahrnehmungsentropie innerhalb eines Bandes ist dann durch
    Figure 00050001
    und
    i = Spektrallinienindex in aktuellem Band
    s(i) = Spektralwert der Linie i
    L(b) = Anzahl von Linien in aktuellem Band
    t(b) = psychoakustische Schwelle für aktuelles Band
    b =Bandindex
    l =Anzahl von Linien in aktuellem Band, so dass
    r(i) > 1,0
    und lediglich Begriffe wie z. B. r(i) > 1,0 bei der Summierung verwendet werden.
  • Durch Summieren der Wahrnehmungsentropien aller Bänder, die in dem Niedrigbandfrequenzbereich codiert werden müssen, wird eine Maßzahl der Codierungsschwierigkeit für den aktuellen Rahmen erhalten.
  • Ein ähnlicher Lösungsansatz besteht darin, die Verzerrungsenergie am Ende des Kerncodec-Codierungsprozesses zu berechnen, indem die Verzerrungsenergie jedes Bandes gemäß
    Figure 00060001
    summiert wird, wobei
    Figure 00060002
    und
    nq(b) = Quantisierungsrauschen-Energie
    t(b) =psychoakustische Schwelle
    b =Bandindex
    B =Anzahl von Bändern
  • Ferner kann die Verzerrungsenergie durch eine Lautstärkekurve gewichtet werden, um die tatsächliche Verzerrung bezüglich ihrer psychoakustischen Relevanz zu gewichten. Als Beispiel kann die Summierung bei Gleichung 2 zu
    Figure 00070001
    modifiziert werden, wobei eine Vereinfachung einer Lautstärkefunktion nach Zwicker verwendet wird [„Psychoacoustics", Eberhard Zwicker und Hugo Fastl, Springer-Verlag, Berlin 1990].
  • Eine Codierungsschwierigkeits- oder Arbeitslastmaßzahl kann dann als Funktion der Gesamtverzerrung definiert sein. 2 liefert ein Beispiel der Verzerrungsenergie eines wahrnehmbaren Audiocodecs und einer entsprechenden Arbeitslastmaßzahl, wenn eine nichtlineare Rekursion zum Berechnen der Arbeitslast verwendet wurde. Man kann beobachten, dass die Arbeitslast hohe Abweichungen über die Zeit zeigt und von den Eingangsmaterialcharakteristika abhängig ist.
  • Eine hohe Wahrnehmungsentropie oder hohe Verzerrungsenergie weist darauf hin, dass ein Signal bei einer begrenzten Bitrate psychoakustisch schwer zu codieren ist und dass wahrscheinlich hörbare Artefakte in dem Niedrigband auftreten werden. In diesem Fall signalisiert das Übergangsfrequenz-Steuermodul, eine niedrigere Übergangsfrequenz zu verwenden, um es dem wahrnehmbaren Audiocodierer leichter zu machen, mit dem gegebenen Signal umzugehen. Gleichzeitig weist eine niedrige Wahrnehmungsentropie oder niedrige Verzerrungsenergie auf ein leicht zu codierendes Signal hin. Somit soll die Übergangsfrequenz höher gewählt werden, um einen breiteren Frequenzbereich für das Niedrigband zu ermöglichen, wodurch Artefakte, die aufgrund der beschränkten Fähigkeiten jegliches existierenden HFR-Verfahrens wahrscheinlich in das Hochband eingeführt werden, verrin gert werden. Beide Lösungsansätze ermöglichen ferner eine Verwendung eines Analyse-durch-Synthese-Lösungsansatzes, indem der aktuelle Rahmen erneut codiert wird, falls in der Analysephase eine Anpassung der Übergangsfrequenz signalisiert wurde. Da bei den meisten hochmodernen Audiocodecs jedoch überlappende Transformationen verwendet werden, kann die Leistungsfähigkeit des Systems verbessert werden, indem mit der Zeit eine Glättung der Analyseeingangsparameter angewendet wird, um ein zu häufiges Umschalten der-Übergangsfrequenz zu vermeiden, was Blockierungseffekte verursachen könnte. Falls die tatsächliche Implementierung in Bezug auf die Verarbeitungsverzögerung nicht optimiert werden muss, kann der Erfassungsalgorithmus ferner verbessert werden, indem eine größere Vorausschau in der Zeit verwendet wird, was die Möglichkeit bietet, Zeitpunkte zu finden, zu denen Verschiebungen mit einem Minimum von Umschaltungsartefakten durchgeführt werden können. Nicht-Echtzeit-Anwendungen stellen einen Spezialfall hierfür dar, bei dem auf Wunsch die gesamte zu codierende Datei analysiert werden kann.
  • Im Fall eines CBR-Audiocodec (CBR = constant bit rate, konstante Bitrate) kann eine Kurzzeit-Bitnachfrage-Variationsanalyse als zusätzlicher Eingangsparameter bei der Übergangsentscheidung verwendet werden: hochmoderne Audiocodierer wie z. B. MPEG Layer-3 oder MPEG-2 AAC verwenden eine Bitsparkassentechnik, um Kurzzeit-Spitzen-Bitfehl-Abweichungen von der Durchschnittszahl von verfügbaren Bits pro Rahmen zu kompensieren. Der Gefülltheitsgrad einer derartigen Bitsparkasse gibt an, ob der Kerncodierer in der Lage ist, gut mit einem bevorstehenden, schwierig zu codierenden Rahmen umzugehen oder nicht. Ein praktisches Beispiel der Anzahl von genutzten Bits pro Rahmen und des Bitsparkassen-Gefülltheitsgrades über der Zeit ist in 3 gegeben. Falls der Bitreservoir-Gefülltheitsgrad also hoch ist, ist der Kerncodierer in der Lage, einen schwierigen Rahmen zu handhaben, und es besteht kein Bedarf, eine niedrigere Übergangsfrequenz zu wählen. Analog dazu kann, falls der Bitreservoir-Gefülltheitsgrad niedrig ist, die sich ergebende Audioqualität bei den folgenden Rahmen beträchtlich verbessert werden, indem die Übergangsfrequenz verringert wird, um die Kerncodierer-Bitnachfrage zu verringern, so dass die Bitsparkasse aufgrund des kleineren Frequenzbereichs, der codiert werden muss, aufgefüllt werden kann. Wiederum kann eine große Vorausschau das Erfassungsverfahren verbessern, da das Verhalten des Bitsparkassen-Gefülltheitsgrades lange im voraus vorhergesagt werden kann.
  • Neben der Codierungsschwierigkeit des aktuellen Rahmens wird ein weiterer wichtiger Parameter, auf den die Wahl der Übergangsfrequenz zu stützen ist, wie folgt beschrieben: Eine große Anzahl von Audiosignalen wie z. B. Sprache oder Musikinstrumente zeigen die Eigenschaft, dass der Spektralbereich in einen gepitchten oder tonalen Bereich und einen rauschartigen Bereich unterteilt werden kann. 4 zeigt das Spektrum eines Audioeingangssignals, bei dem diese Eigenschaft völlig offensichtlich ist. Unter Verwendung von Tonalitäts- und/oder Rauschanalyseverfahren in dem Spektralbereich können zwei Bereiche erfasst werden, die als tonal bzw. rauschartig klassifiziert werden können. Die Tonalität kann so berechnet werden, wie dies beispielsweise in dem AAC-Standard gegeben ist [ISO/IEC 13818–7: 1997(E), S. 96 – 98, Abschnitt B.2.1.4 „Steps in threshold calculation"]. Weitere bekannte Tonalitäts- oder Rauscherfassungsalgorithmen wie z. B. Spektralflachheitsmessung sind ebenfalls für den Zweck geeignet. Somit wird die Übergangsfrequenz zwischen diesen Bereichen als die Übergangsfrequenz im Kontext der vorliegenden Erfindung verwendet, um den tonalen und rauschartigen Spektralbereich besser zu trennen und sie separat in den Kerncodierer bzw. das HFR-Verfahren einzuspeisen. Somit kann die Gesamtaudioqualität des kombinierten Codecsystems in derartigen Fällen beträchtlich verbessert werden.
  • Offensichtlich sind die obigen Verfahren gleichermaßen auf doppelendige und einendige HFR-Systeme anwendbar. Im letzteren Fall wird lediglich ein Niedrigband einer variierenden Bandbreite, das durch den Kerncodec codiert ist, übertragen. Der HFR-Decoder extrapoliert anschließend eine Hüllkurve von der Niedrigband-Grenzfrequenz und nach oben. Ferner ist die vorliegende Erfindung auf Systeme anwendbar, bei denen das Hochband durch willkürliche Verfahren erzeugt wird, die sich von demjenigen, das zum Codieren des Niedrigbandes verwendet wird, unterscheiden.
  • Die HFR-Startfrequenz an die variierende Bandbreite des Niedrigbandsignals anzupassen, wäre eine sehr mühselige Aufgabe, wenn herkömmliche Transpositionsverfahren wie z. B. die Frequenzverschiebung angewendet würden. Diese Verfahren beinhalten allgemein ein Filtern des Niedrigbandsignals, um ein Tiefpass- oder Bandpasssignal zu extrahieren, das anschließend in der Zeitdomäne moduliert wird, was eine Frequenzverschiebung bewirkt. Somit würde eine Anpassung ein Umschalten von Tiefpass- oder Bandpassfiltern und Änderungen der Modulationsfrequenz beinhalten. Ferner bewirkt ein Wechseln eines Filters Diskontinuitäten in dem Ausgangssignal, was die Verwendung von Fensterungsverfahren vorantreibt. Bei einem filterbankbasierten System wird das Filtern jedoch automatisch durch Extraktion von Teilbandsignalen aus einem Satz von aufeinanderfolgenden Filterbändern erreicht. Ein Äquivalent zu der Zeitdomänenmodulation wird dann mittels eines Neupatchens bzw. Neuverbindens der extrahierten Teilbandsignale innerhalb der Filterbank erhalten. Das Neupatchen wird ohne weiteres an die variierende Übergangsfrequenz angepasst, und das zuvor erwähnte Fenstern ist in der Teilbanddomäne inhärent, so dass die Änderung von Verschiebungsparametern bei geringer zusätzlicher Komplexität erzielt wird.
  • 5 zeigt ein Beispiel der Codiererseite eines HFRbasierten Codecs, der gemäß der vorliegenden Erfindung verbessert ist. Das analoge Eingangssignal wird in einen A/D-Wandler 501 eingespeist, der ein digitales Signal bildet. Das digitale Audiosignal wird in einen Kerncodierer 502 eingespeist, wo eine Quellcodierung durchgeführt wird. Ferner wird das digitale Signal in einen HFR-Hüllkurvencodierer 503 eingespeist. Das Ausgangssignal des HFR-Hüllkurvencodierers stellt die Hüllkurvendaten dar, die das Hochband 102 abdecken, das bei der Übergangsfrequenz 103 beginnt, wie bei 1 veranschaulicht. Die Anzahl von Bits, die für die Hüllkurvendaten in dem Hüllkurvencodierer benötigt werden, wird an den Kerncodierer weitergeleitet, damit sie von den gesamten verfügbaren Bits für einen gegebenen Rahmen subtrahiert werden kann. Der Kerncodierer codiert dann den verbleibenden Niedrigbandfrequenzbereich bis zu der Übergangsfrequenz. Wie durch die vorliegende Erfindung gelehrt wird, wird zu dem Codierer ein Übergangsfrequenz-Steuermodul 504 hinzugefügt. Eine Zeit- und/oder Frequenzdomänendarstellung des Eingangssignals sowie Kerncodec-Statussignale werden in das Übergangsfrequenz-Steuermodul eingespeist. Das Ausgangssignal des Moduls 504 wird in Form der optimalen Wahl der Übergangsfrequenz in Kern- und Hüllkurvencodierer eingespeist, um die Frequenzbereiche, die codiert werden sollen, zu signalisieren. Der Frequenzbereich für jedes der zwei Codierungsschemata wird ebenfalls codiert, beispielsweise durch ein effizientes Tabellennachschlageschema. Falls sich der Frequenzbereich zwischen zwei aufeinanderfolgenden Rahmen nicht ändert, kann dies durch ein einzelnes Bit signalisiert werden, um den Bitraten-Zusatzaufwand so gering wie möglich zu halten. Somit müssen die Frequenzbereiche nicht explizit in jedem Rahmen übertragen werden. Die codierten Daten beider Codierer werden anschließend in den Multiplexer eingespeist, wobei ein serieller Bitstrom gebildet wird, der übertragen oder gespeichert wird.
  • 6 liefert ein Beispiel von Teilsystemen innerhalb des Übergangsfrequenz-Steuermoduls 504 bzw. 601. Ein Codiererarbeitslastmessanalysemodul 602 untersucht, wie schwierig der aktuelle Rahmen für den Kerncodierer zu codieren ist, wobei es beispielsweise den Wahrnehmungsentropie- oder den Verzerrungsenergie-Lösungsansatz, wie oben beschrieben, verwendet. Vorausgesetzt, dass der Kerncodec eine Bitsparkasse verwendet, kann ein Puffer-Gefülltheitsgrad-Analysemodul enthalten sein, 603. Ein Tonalitätsanalysemodul 604 signalisiert eine Zielübergangsfrequenz, die der tonalen/Rausch-Übergangsfrequenz entspricht, wenn anwendbar. Alle Eingangsparameter in das gemeinsame Entscheidungsmodul 606 werden gemäß der tatsächlichen Implementierung der verwendeten Kern- und HFR-Codecs kombiniert und ausgeglichen, wenn die zu verwendende Übergangsfrequenz berechnet wird, um die maximale Gesamtleistungsfähigkeit zu erhalten.
  • Die entsprechende Decoderseite ist in 7 gezeigt. Der Demultiplexer 701 trennt die Bitstromsignale in Kerncodecdaten, die in den KernDecoder 702 eingespeist werden, in Hüllkurvendaten, die in den HFR-Hüllkurvendecoder 703 eingespeist werden. Der Kerndecoder erzeugt ein Signal, das den Niedrigbandfrequenzbereich abdeckt. Desgleichen decodiert der HFR-Hüllkurvendecoder die Daten zu einer Darstellung der spektralen Hüllkurve für den Hochbandfrequenzbereich. Die decodierten Hüllkurvendaten werden anschließend in das Gewinnsteuermodul 704 eingespeist. Das Niedrigbandsignal von dem Kerndecoder wird an das Transpositionsmodul 705 weitergeleitet, das auf der Basis der Übergangsfrequenz ein repliziertes Hochbandsignal aus dem Niedrigband erzeugt. Das Hochbandsignal wird in das Gewinnsteuermodul eingespeist, um die Hochbandspektralhüllkurve an die der übertragenen Hüllkurve anzupassen. Das Ausgangssignal ist somit ein hüllkurvenangepasstes Hochbandaudiosignal. Dieses Signal wird zu dem Ausgangssignal von der Verzögerungseinheit 706 hinzugefügt, die mit dem Niedrigbandaudiosignal gespeist wird, wohingegen die Verzögerung die Verarbeitungszeit des Hochbandsignals kompensiert. Schließlich wird das erhaltene digitale Breitbandsignal in dem D/A-Wandler 707 in ein analoges Audiosignal umgewandelt.

Claims (8)

  1. Eine Vorrichtung zum Codieren eines Audiosignals, um ein codiertes Audiosignal zu erhalten, das durch einen Decoder verwendet werden soll, der ein Hochfrequenz-Rekonstruktionsmodul zum Durchführen einer Hochfrequenz-Rekonstruktion für einen Frequenzbereich über einer Übergangsfrequenz aufweist, wobei die Vorrichtung folgende Merkmale aufweist: einen Kerncodierer (502) zum Codieren eines unteren Frequenzbandes des Audiosignals bis zu der Übergangsfrequenz, wobei die Übergangsfrequenz variabel ist und wobei der Kerncodierer auf einer blockweisen Rahmen-Um-Rahmen-Basis betreibbar ist; und ein Übergangsfrequenzsteuermodul (504) zum Schätzen, abhängig von einem Maß des Schwierigkeitsgrades zum Codieren des Audiosignals durch den Kerncodierer (502) und/oder abhängig von einer Grenze zwischen einem tonalen und einem rauschartigen Frequenzbereich des Audiosignals, einer Übergangsfrequenz, die durch den Kerncodierer (502) für einen Rahmen einer Serie von aufeinanderfolgenden Rahmen ausgewählt werden soll, so daß die Übergangsfrequenz über die Zeit für die Serie von aufeinanderfolgenden Rahmen adaptiv variabel ist.
  2. Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einer Wahrnehmungsentropie des Audiosignals beruht.
  3. Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einer Verzerrungsenergie nach dem Codieren mit dem Kerncodierer beruht.
  4. Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einem Status einer Bitsparkasse, die dem Kerncodierer zugeordnet ist, beruht.
  5. Eine Vorrichtung gemäß einem der Ansprüche 1 bis 4, bei der jegliche Kombination der Wahrnehmungsentropie, der Kerncodiererverzerrung und des Kerncodierer-Bitsparkassenstatus verwendet wird, um die Übergangsfrequenz zu erhalten, die durch den Kerncodierer (502) für einen Rahmen ausgewählt werden soll.
  6. Ein Verfahren zum Codieren eines Audiosignals, um ein codiertes Audiosignal zu erhalten, das durch einen Decoder verwendet werden soll, der ein Hochfrequenz-Rekonstruktionsmodul zum Durchführen einer Hochfrequenz-Rekonstruktion für einen Frequenzbereich über einer Übergangsfrequenz aufweist, wobei das Verfahren folgende Schritte aufweist: Kerncodieren eines unteren Frequenzbands des Audiosignals bis zu einer Übergangsfrequenz, wobei die Übergangsfrequenz variabel ist und wobei das Kerncodieren auf einer blockweisen Rahmen-Om-Rahmen-Basis stattfindet; und Schätzen, abhängig von einem Maß des Schwierigkeitsgrades zum Codieren des Audiosignals bei dem Schritt des Kerncodierens und/oder abhängig von einer Grenze zwischen einem tonalen und einem rauschartigen Frequenzbereich des Audiosignals, einer Übergangsfrequenz, die bei dem Schritt des Kerncodierens für einen Rahmen einer Serie von aufeinanderfolgenden Rahmen ausgewählt werden soll, so daß die Übergangsfrequenz über die Zeit für die Serie von aufeinanderfolgenden Rahmen adaptiv variiert wird.
  7. Eine Vorrichtung zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal unter Verwen dung einer variablen Übergangsfrequenz codiert wurde, wobei das codierte Audiosignal Informationen über eine Übergangsfrequenz umfaßt, die über die Zeit adaptiv variabel ist, wobei die Vorrichtung zum Decodieren folgende Merkmale aufweist: einen Bitstrom-Demultiplexer (701) zum Extrahieren von Kerndecoderdaten, Hüllkurvendaten und der Informationen über die variable Übergangsfrequenz; einen Kerndecoder (702) zum Empfangen der Kerndecoderdaten von dem Bitstrom-Demultiplexer und zum Ausgeben von Niedrigbanddaten, die eine zeitlich variierende Übergangsfrequenz aufweisen; einen Hochfrequenz-Regenerationshüllkurvendecoder (703) zum Empfangen der Hüllkurvendaten von dem Bitstrom-Demultiplexer (701) und zum Erzeugen eines Spektralhüllkurvenausgangssignals; ein Transpositionsmodul (705) zum Empfangen der Informationen über die variable Übergangsfrequenz und zum Erzeugen eines replizierten Hochbandsignals aus den Niedrigbanddaten auf der Basis der Informationen über die variable Übergangsfrequenz; ein Verstärkungssteuermodul (704), das auf den Hochfrequenz-Regenerationshüllkurvendecoder anspricht, zum Einstellen des replizierten Hochbandsignals auf eine Spektralhüllkurve, die durch den Hochfrequenz-Regenerationshüllkurvendecoder ausgegeben wird, um ein hüllkurveneingestelltes Hochbandsignal zu erhalten; und einen Addierer zum Addieren einer verzögerten Version der Niedrigbanddaten und des hüllkurveneingestellten Hochbandsignals, um ein digitales Breitbandsignal zu erhalten.
  8. Ein Verfahren zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal unter Verwendung einer variablen Übergangsfrequenz codiert wurde, wobei das codierte Audiosignal Informationen über eine Übergangsfrequenz umfaßt, die über die Zeit adaptiv variabel ist, wobei das Verfahren zum Decodieren folgende Schritte aufweist: Extrahieren (701) von Kerndecoderdaten, Hüllkurvendaten und der Informationen über die variable Übergangsfrequenz von dem codierten Audiosignal; Empfangen der Kerndecoderdaten von einem Bitstrom-Demultiplexer und Ausgeben von Niedrigbanddaten, die eine zeitlich variierende Übergangsfrequenz aufweisen, mittels eines Kerndecoders (702); Empfangen der Hüllkurvendaten und Erzeugen eines Spektralhüllkurvenausgangs mittels eines Hochfrequenz-Regenerationshüllkurvendecoders (703); Empfangen der Informationen über die variable Übergangsfrequenz und Erzeugen eines replizierten Hochbandsignals aus den Niedrigbanddaten auf der Basis der Informationen über die variable Übergangsfrequenz mittels eines Transpositionsmoduls (705); Einstellen des replizierten Hochbandsignals auf eine Spektralhüllkurve, die durch den Hochfrequenz-Regenerationshüllendecoder (703) ausgegeben wird, um ein hüllkurveneingestelltes Hochbandsignal zu erhalten, mittels eines Verstärkungssteuermoduls (704); und Addieren einer verzögerten Version der Niedrigbanddaten und des hüllkurveneingestellten Hochbandsignals, um ein digitales Breitbandsignal zu erhalten.
DE60103424T 2000-11-15 2001-11-14 Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden Expired - Lifetime DE60103424T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0004187 2000-11-15
SE0004187A SE0004187D0 (sv) 2000-11-15 2000-11-15 Enhancing the performance of coding systems that use high frequency reconstruction methods
PCT/SE2001/002533 WO2002041302A1 (en) 2000-11-15 2001-11-14 Enhancing the performance of coding systems that use high frequency reconstruction methods

Publications (2)

Publication Number Publication Date
DE60103424D1 DE60103424D1 (de) 2004-06-24
DE60103424T2 true DE60103424T2 (de) 2005-06-16

Family

ID=20281835

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60103424T Expired - Lifetime DE60103424T2 (de) 2000-11-15 2001-11-14 Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden

Country Status (15)

Country Link
US (1) US7050972B2 (de)
EP (1) EP1334484B1 (de)
JP (6) JP3983668B2 (de)
KR (1) KR100551862B1 (de)
CN (1) CN1232950C (de)
AT (1) ATE267445T1 (de)
AU (1) AU2002215282A1 (de)
DE (1) DE60103424T2 (de)
DK (1) DK1334484T3 (de)
ES (1) ES2218462T3 (de)
HK (1) HK1058096A1 (de)
PT (1) PT1334484E (de)
SE (1) SE0004187D0 (de)
TR (1) TR200401631T4 (de)
WO (1) WO2002041302A1 (de)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR100605824B1 (ko) 2002-05-13 2006-07-31 삼성전자주식회사 부호분할다중접속 이동통신시스템의 방송서비스 방법
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
WO2008031458A1 (en) * 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
ES2403410T3 (es) 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
EP2077550B8 (de) 2008-01-04 2012-03-14 Dolby International AB Audiokodierer und -dekodierer
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
CA2730200C (en) 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
MX2011000382A (es) 2008-07-11 2011-02-25 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.
AU2009267507B2 (en) 2008-07-11 2012-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and discriminator for classifying different segments of a signal
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
PL4231291T3 (pl) 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
JP5446258B2 (ja) 2008-12-26 2014-03-19 富士通株式会社 オーディオ符号化装置
EP2380172B1 (de) 2009-01-16 2013-07-24 Dolby International AB Durch kreuzprodukt erweiterte harmonische transposition
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
EP2466580A1 (de) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Codierer und Verfahren zur prädiktiven Codierung, Decodierer und Verfahren zur Decodierung, System und Verfahren zur prädiktiven Codierung und Decodierung und prädiktiv codiertes Informationssignal
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
EP2830062B1 (de) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Verfahren und vorrichtung für hochfrequente codierung/decodierung zur bandbreitenerweiterung
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
CN104781877A (zh) * 2012-10-31 2015-07-15 株式会社索思未来 音频信号编码装置以及音频信号解码装置
RU2612589C2 (ru) 2013-01-29 2017-03-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
ES2688134T3 (es) * 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
JP6305694B2 (ja) 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
BR112015032013B1 (pt) * 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
KR102329309B1 (ko) 2013-09-12 2021-11-19 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
KR102250472B1 (ko) * 2016-03-07 2021-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
CN114946192A (zh) * 2020-01-15 2022-08-26 杜比国际公司 利用比特率切换自适应流式传输媒体内容
KR20230049660A (ko) * 2020-07-30 2023-04-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호를 인코딩하거나 인코딩된 오디오 장면을 디코딩하기 위한 장치, 방법 및 컴퓨터 프로그램

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4158751A (en) * 1978-02-06 1979-06-19 Bode Harald E W Analog speech encoder and decoder
JPS595297A (ja) * 1982-07-01 1984-01-12 日本電気株式会社 帯域分割型ボコ−ダ
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP3297750B2 (ja) * 1992-03-18 2002-07-02 ソニー株式会社 符号化方法
JP3218679B2 (ja) * 1992-04-15 2001-10-15 ソニー株式会社 高能率符号化方法
US5404377A (en) * 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
JP3277692B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
US5646961A (en) * 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
JPH09172376A (ja) * 1995-12-20 1997-06-30 Hitachi Ltd 量子化ビット割当て装置
JP3255022B2 (ja) * 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
US6490562B1 (en) * 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5928342A (en) * 1997-07-02 1999-07-27 Creative Technology Ltd. Audio effects processor integrated on a single chip with a multiport memory onto which multiple asynchronous digital sound samples can be concurrently loaded
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
WO2002029784A1 (en) * 2000-10-02 2002-04-11 Clarity, Llc Audio visual speech processing

Also Published As

Publication number Publication date
JP5933965B2 (ja) 2016-06-15
CN1232950C (zh) 2005-12-21
EP1334484B1 (de) 2004-05-19
JP6207404B2 (ja) 2017-10-04
TR200401631T4 (tr) 2004-09-21
SE0004187D0 (sv) 2000-11-15
JP2014089472A (ja) 2014-05-15
KR20030076576A (ko) 2003-09-26
DE60103424D1 (de) 2004-06-24
ATE267445T1 (de) 2004-06-15
WO2002041302A1 (en) 2002-05-23
JP4991397B2 (ja) 2012-08-01
US20020103637A1 (en) 2002-08-01
DK1334484T3 (da) 2004-08-09
AU2002215282A1 (en) 2002-05-27
ES2218462T3 (es) 2004-11-16
KR100551862B1 (ko) 2006-02-13
JP2007293354A (ja) 2007-11-08
JP2012093774A (ja) 2012-05-17
US7050972B2 (en) 2006-05-23
JP3983668B2 (ja) 2007-09-26
PT1334484E (pt) 2004-09-30
JP2018185530A (ja) 2018-11-22
JP2016189015A (ja) 2016-11-04
EP1334484A1 (de) 2003-08-13
JP6368740B2 (ja) 2018-08-01
CN1475010A (zh) 2004-02-11
HK1058096A1 (en) 2004-04-30
JP2004514180A (ja) 2004-05-13
JP6592148B2 (ja) 2019-10-16

Similar Documents

Publication Publication Date Title
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60217522T2 (de) Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE60110679T3 (de) Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz
DE602004008613T2 (de) Treueoptimierte kodierung mit variabler rahmenlänge
EP2022043B1 (de) Informationssignalcodierung
DE60214599T2 (de) Skalierbare audiokodierung
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE60012198T2 (de) Kodierung der hüllkurve des spektrums mittels variabler zeit/frequenz-auflösung
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE19921122C1 (de) Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
DE60117471T2 (de) Breitband-signalübertragungssystem
DE19959156C2 (de) Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
EP1825461A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
DE60027956T2 (de) Sprachkodierung mit variabler BIT-Rate
DE60131766T2 (de) Wahrnehmungsbezogen verbesserte codierung akustischer signale
DE69932861T2 (de) Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE10297751B4 (de) Audiocodierverfahren und Vorrichtung, die die Harmonischen-Extraktion verwenden
DE60124079T2 (de) Sprachverarbeitung
DE602004007550T2 (de) Verbesserte frequenzbereichs-fehlerverbergung
DE69533259T2 (de) Nichtlineares quantisieren eines informationssignales
DE60112407T2 (de) Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten

Legal Events

Date Code Title Description
8327 Change in the person/name/address of the patent owner

Owner name: CODING TECHNOLOGIES AB, STOCKHOLM, SE

8364 No opposition during term of opposition