DE60103424T2 - Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden - Google Patents
Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden Download PDFInfo
- Publication number
- DE60103424T2 DE60103424T2 DE60103424T DE60103424T DE60103424T2 DE 60103424 T2 DE60103424 T2 DE 60103424T2 DE 60103424 T DE60103424 T DE 60103424T DE 60103424 T DE60103424 T DE 60103424T DE 60103424 T2 DE60103424 T2 DE 60103424T2
- Authority
- DE
- Germany
- Prior art keywords
- frequency
- crossover frequency
- audio signal
- envelope
- core
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000008569 process Effects 0.000 title description 2
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 230000001419 dependent effect Effects 0.000 claims abstract description 4
- 230000003595 spectral effect Effects 0.000 claims description 19
- 230000017105 transposition Effects 0.000 claims description 4
- 230000008929 regeneration Effects 0.000 claims 4
- 238000011069 regeneration method Methods 0.000 claims 4
- 230000003111 delayed effect Effects 0.000 claims 2
- 230000001172 regenerating effect Effects 0.000 claims 1
- 238000013459 approach Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 101150095491 AACS gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Optical Communication System (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Transmitters (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
- TECHNISCHES GEBIET
- Die vorliegende Erfindung bezieht sich auf digitale Audiocodierungssysteme, die Hochfrequenz-Rekonstruktionsverfahren (HFR-Verfahren) verwenden. Sie ermöglicht eine konsequentere Kerncodec-Leistungsfähigkeit, und es wird. eine verbesserte Audioqualität des kombinierten Kerncodec- und HFR-Systems erzielt.
- HINTERGRUND DER ERFINDUNG
- Audioquellencodierungstechniken können in zwei Klassen unterteilt werden: natürliches Audiocodieren und Sprachcodieren. Natürliches Audiocodieren wird üblicherweise für Musik oder willkürliche Signale bei mittleren Bitraten verwendet. Sprachcodecs sind im Grunde auf eine Sprachwiedergabe beschränkt, können jedoch andererseits bei sehr niedrigen Bitraten verwendet werden. Bei beiden wird das Signal allgemein in zwei Hauptsignalkomponenten geteilt, eine spektrale Hüllkurve und ein entsprechendes Restsignal. Codecs, die eine derartige Unterteilung verwenden, nutzen die Tatsache aus, dass die spektrale Hüllkurve viel effizienter codiert werden kann als das Restsignal. Bei Systemen, bei denen Hochfrequenz-Rekonstruktionsverfahren verwendet werden, wird kein Restsignal, das dem Hochband entspricht, übertragen. Statt dessen wird auf der Decoderseite von dem durch den Kerncodec abgedeckten Niedrigband ein Hochband erzeugt und geformt, um die gewünschte spektrale Hochband-Hüllkurve zu erhalten. Bei doppelendigen HFR-Systemen, wie sie beispielsweise in der internationalen Patentanmeldung WO 98157436 offenbart sind, werden Hüllkurvendaten übertragen, die dem oberen Frequenzbereich entsprechen, wohingegen bei einendigen HFR-Systemen die Hochbandhüllkurve von dem Niedrigband abgeleitet ist. In beiden Fällen legen Audiocodecs des Standes der Technik eine zeitlich unveränderliche Übergangsfrequenz zwischen dem Kerncodec-Frequenzbereich und dem HFR-Frequenzbereich an. Somit wird die Übergangsfrequenz bei einer gegebenen Bitrate so ausgewählt, dass für ein typisches Programmmaterial ein guter Kompromiss zwischen durch den Kerncodec eingeführten Artefakten und durch das HFR-System eingeführten Artefakten erzielt wird. Selbstverständlich kann eine derartige statische Einstellung für ein bestimmtes Signal vom Optimum weit entfernt sein: der Kerncodec ist entweder überbeansprucht, was zu höheren Niedrigbandartefakten führt als notwendig, was innerhalb des HFR-Verfahrens auch die Hochbandqualität verschlechtert, oder wird nicht bis zu seinem vollen Potential genutzt, d, h. es wird ein größerer HFR-Frequenzbereich verwendet als notwendig. Daher erreichen bekannte Systeme lediglich gelegentlich die maximale Leistungsfähigkeit des gemeinsamen Codierungssystems. Ferner wird die Möglichkeit, den Überschneidungspunkt zu Übergängen zwischen Regionen mit grundverschiedenen spektralen Eigenschaften, z. B. tonalen und rauschartigen Regionen, auszurichten, nicht genutzt.
- ZUSAMMENFASSUNG DER ERFINDUNG
- Die vorliegende Erfindung liefert ein durch die unabhängigen Ansprüche 6, 8 definiertes neues Verfahren und eine durch die unabhängigen Ansprüche 1, 7 definierte Vorrichtung zur Verbesserung von Codierungssystemen, bei denen Hochfrequenz-Rekonstruktionsverfahren (HFR) verwendet werden. Die Erfindung weicht von der traditionellen Verwendung einer feststehenden Übergangsfrequenz zwischen dem Niedrigband, bei dem herkömmliche Codierungsschemata (wie z. B. MPEG Layer-3 oder AAC) verwendet werden, und dem Hochband, bei dem HFR-Codierungsschemata verwendet werden, durch eine kontinuierliche Schätzung und Anwendung der Übergangsfrequenz ab, die den optimalen Kompromiss zwischen Artefakten liefert, die durch den Niedrigbandcodec bzw. das HFR-System eingeführt werden. Gemäß der Erfindung kann die Wahl auf einer Maßzahl des Schwierigkeitsgrades, ein Signal mit dem Kerncodec zu codieren, auf einer Kurzzeit-Bitnachfrageerfassung und auf einer Spektraltonalitätsanalyse oder jeglicher Kombination derselben beruhen. Die Maßzahl der Schwierigkeit kann von der wahrnehmbaren Entropie oder der psychoakustisch relevanten Kerncodecverzerrung abgeleitet sein. Da sich die optimale Wahl mit der Zeit häufig ändert, führt das Anlegen einer variablen Übergangsfrequenz zu einer beträchtlich verbesserten Audioqualität, die ferner weniger von Programmmaterialcharakteristika abhängig ist. Die Erfindung ist auf einendige und doppelendige HFR-Systeme anwendbar.
- KURZE BESCHREIBUNG DER ZEICHNUNGEN
- Die vorliegende Erfindung wird nun anhand von veranschaulichenden Beispielen, die den Schutzumfang oder die Wesensart der Erfindung nicht einschränken, unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, bei denen:
-
1 ein Graph ist, der die Begriffe Niedrigband, Hochband und Übergangsfrequenz veranschaulicht; -
2 ein Graph ist, der eine Kerncodec-Arbeitslastmaßzahl veranschaulicht; -
3 ein Graph ist, der Variationen eines Konstante-Bitrate-Codecs bezüglich Kurzzeit-Bitnachfragen veranschaulicht; -
4 ein Graph ist, der eine Teilung eines Signals in tonale und rauschartige Frequenzbereiche veranschaulicht; -
5 ein Blockdiagramm eines HFR-basierten Codierers ist, der durch ein Übergangsfrequenz-Steuermodul verbessert ist; -
6 ein Blockdiagramm ist, das das Übergangsfrequenz-Steuermodul im Detail veranschaulicht; und -
7 ein Blockdiagramm des entsprechenden HFR-basierten Decoders ist. - BESCHREIBUNG VON BEVORZUGTEN AUSFÜHRUNGSBEISPIELEN
- Die nachfolgend beschriebenen Ausführungsbeispiele sind für die Prinzipien der vorliegenden Erfindung lediglich veranschaulichend. Es versteht sich, dass Modifikationen und Variationen der hierin beschriebenen Anordnungen und Details für andere Fachleute offensichtlich sind. Somit wird beabsichtigt, dass die Erfindung lediglich durch den Schutzumfang der beigefügten Patentansprüche begrenzt wird und nicht durch die spezifischen Einzelheiten, die anhand der Beschreibung und Erläuterung der Ausführungsbeispiele hierin präsentiert werden.
- Bei einem System, bei dem das Niedrigband bzw. der Niedrigfrequenzbereich
101 , wie er in1 gegeben ist, durch einen Kerncodec codiert ist und der Hochband bzw. der Hochfrequenzbereich102 durch ein geeignetes HFR-Verfahren abgedeckt ist, kann die Grenze zwischen den zwei Bereichen als die Übergangsfrequenz103 definiert sein. Da die Codierungsschemata auf einer blockweisen Rahmen-um-Rahmen-Basis arbeiten, ist eines frei, die Übergangsfrequenz für jeden verarbeiteten Rahmen zu verändern. Gemäß der vorliegenden Erfindung ist es möglich, einen Erfassungsalgorithmus einzurichten, der die Übergangsfrequenz derart anpasst, dass die optimale Qualität für das kombinierte Codierungssystem erzielt wird. Dessen Implementierung wird nachfolgend als Übergangsfrequenz-Steuermodul bezeichnet. - Wenn man berücksichtigt, dass die Audioqualität des Kerncodecs auch die Basis für die Qualität des rekonstruierten Hochbandes ist, ist es offensichtlich, dass eine hohe und konstante Audioqualität in dem Niedrigbandbereich erwünscht ist. Durch Verringern der Übergangsfrequenz ist der Frequenzbereich, mit dem es der Kerncodec zu tun hat, kleiner und somit leichter zu codieren. Durch Messen des Schwierigkeitsgrades des Codierens eines Rahmens und des entsprechenden Einstellens der Übergangsfrequenz kann eine konstantere Audioqualität des Kerncodierers erreicht werden.
- Als Beispiel dafür, wie der Schwierigkeitsgrad gemessen werden kann, kann die Wahrnehmungsentropie (ISO/IEC 13818-7, Anhang B.2.1] verwendet werden: Hier wird ein auf einer Spektralanalyse beruhendes psychoakustisches Modell angewendet. Üblicherweise sind die Spektrallinien der Analysefilterbank in Bänder gruppiert, wobei die Anzahl von Linien innerhalb eines Bandes von der Bandmittenfrequenz abhängt und gemäß der hinreichend bekannten Bark-Skala ausgewählt wird, wobei auf eine der Wahrnehmung nach konstante Frequenzauflösung für alle Bänder abgezielt wird. Durch Verwenden eines psychoakustischen Modells, das Effekte wie z. B. eine spektrale oder zeitliche Maskierung nutzt, werden Hörbarkeitsschwellen für jedes Band erhalten. Die Wahrnehmungsentropie innerhalb eines Bandes ist dann durch und
i = Spektrallinienindex in aktuellem Band
s(i) = Spektralwert der Linie i
L(b) = Anzahl von Linien in aktuellem Band
t(b) = psychoakustische Schwelle für aktuelles Band
b =Bandindex
l =Anzahl von Linien in aktuellem Band, so dass
r(i) > 1,0
und lediglich Begriffe wie z. B. r(i) > 1,0 bei der Summierung verwendet werden. - Durch Summieren der Wahrnehmungsentropien aller Bänder, die in dem Niedrigbandfrequenzbereich codiert werden müssen, wird eine Maßzahl der Codierungsschwierigkeit für den aktuellen Rahmen erhalten.
- Ein ähnlicher Lösungsansatz besteht darin, die Verzerrungsenergie am Ende des Kerncodec-Codierungsprozesses zu berechnen, indem die Verzerrungsenergie jedes Bandes gemäß summiert wird, wobei und
nq(b) = Quantisierungsrauschen-Energie
t(b) =psychoakustische Schwelle
b =Bandindex
B =Anzahl von Bändern - Ferner kann die Verzerrungsenergie durch eine Lautstärkekurve gewichtet werden, um die tatsächliche Verzerrung bezüglich ihrer psychoakustischen Relevanz zu gewichten. Als Beispiel kann die Summierung bei Gleichung 2 zu modifiziert werden, wobei eine Vereinfachung einer Lautstärkefunktion nach Zwicker verwendet wird [„Psychoacoustics", Eberhard Zwicker und Hugo Fastl, Springer-Verlag, Berlin 1990].
- Eine Codierungsschwierigkeits- oder Arbeitslastmaßzahl kann dann als Funktion der Gesamtverzerrung definiert sein.
2 liefert ein Beispiel der Verzerrungsenergie eines wahrnehmbaren Audiocodecs und einer entsprechenden Arbeitslastmaßzahl, wenn eine nichtlineare Rekursion zum Berechnen der Arbeitslast verwendet wurde. Man kann beobachten, dass die Arbeitslast hohe Abweichungen über die Zeit zeigt und von den Eingangsmaterialcharakteristika abhängig ist. - Eine hohe Wahrnehmungsentropie oder hohe Verzerrungsenergie weist darauf hin, dass ein Signal bei einer begrenzten Bitrate psychoakustisch schwer zu codieren ist und dass wahrscheinlich hörbare Artefakte in dem Niedrigband auftreten werden. In diesem Fall signalisiert das Übergangsfrequenz-Steuermodul, eine niedrigere Übergangsfrequenz zu verwenden, um es dem wahrnehmbaren Audiocodierer leichter zu machen, mit dem gegebenen Signal umzugehen. Gleichzeitig weist eine niedrige Wahrnehmungsentropie oder niedrige Verzerrungsenergie auf ein leicht zu codierendes Signal hin. Somit soll die Übergangsfrequenz höher gewählt werden, um einen breiteren Frequenzbereich für das Niedrigband zu ermöglichen, wodurch Artefakte, die aufgrund der beschränkten Fähigkeiten jegliches existierenden HFR-Verfahrens wahrscheinlich in das Hochband eingeführt werden, verrin gert werden. Beide Lösungsansätze ermöglichen ferner eine Verwendung eines Analyse-durch-Synthese-Lösungsansatzes, indem der aktuelle Rahmen erneut codiert wird, falls in der Analysephase eine Anpassung der Übergangsfrequenz signalisiert wurde. Da bei den meisten hochmodernen Audiocodecs jedoch überlappende Transformationen verwendet werden, kann die Leistungsfähigkeit des Systems verbessert werden, indem mit der Zeit eine Glättung der Analyseeingangsparameter angewendet wird, um ein zu häufiges Umschalten der-Übergangsfrequenz zu vermeiden, was Blockierungseffekte verursachen könnte. Falls die tatsächliche Implementierung in Bezug auf die Verarbeitungsverzögerung nicht optimiert werden muss, kann der Erfassungsalgorithmus ferner verbessert werden, indem eine größere Vorausschau in der Zeit verwendet wird, was die Möglichkeit bietet, Zeitpunkte zu finden, zu denen Verschiebungen mit einem Minimum von Umschaltungsartefakten durchgeführt werden können. Nicht-Echtzeit-Anwendungen stellen einen Spezialfall hierfür dar, bei dem auf Wunsch die gesamte zu codierende Datei analysiert werden kann.
- Im Fall eines CBR-Audiocodec (CBR = constant bit rate, konstante Bitrate) kann eine Kurzzeit-Bitnachfrage-Variationsanalyse als zusätzlicher Eingangsparameter bei der Übergangsentscheidung verwendet werden: hochmoderne Audiocodierer wie z. B. MPEG Layer-3 oder MPEG-2 AAC verwenden eine Bitsparkassentechnik, um Kurzzeit-Spitzen-Bitfehl-Abweichungen von der Durchschnittszahl von verfügbaren Bits pro Rahmen zu kompensieren. Der Gefülltheitsgrad einer derartigen Bitsparkasse gibt an, ob der Kerncodierer in der Lage ist, gut mit einem bevorstehenden, schwierig zu codierenden Rahmen umzugehen oder nicht. Ein praktisches Beispiel der Anzahl von genutzten Bits pro Rahmen und des Bitsparkassen-Gefülltheitsgrades über der Zeit ist in
3 gegeben. Falls der Bitreservoir-Gefülltheitsgrad also hoch ist, ist der Kerncodierer in der Lage, einen schwierigen Rahmen zu handhaben, und es besteht kein Bedarf, eine niedrigere Übergangsfrequenz zu wählen. Analog dazu kann, falls der Bitreservoir-Gefülltheitsgrad niedrig ist, die sich ergebende Audioqualität bei den folgenden Rahmen beträchtlich verbessert werden, indem die Übergangsfrequenz verringert wird, um die Kerncodierer-Bitnachfrage zu verringern, so dass die Bitsparkasse aufgrund des kleineren Frequenzbereichs, der codiert werden muss, aufgefüllt werden kann. Wiederum kann eine große Vorausschau das Erfassungsverfahren verbessern, da das Verhalten des Bitsparkassen-Gefülltheitsgrades lange im voraus vorhergesagt werden kann. - Neben der Codierungsschwierigkeit des aktuellen Rahmens wird ein weiterer wichtiger Parameter, auf den die Wahl der Übergangsfrequenz zu stützen ist, wie folgt beschrieben: Eine große Anzahl von Audiosignalen wie z. B. Sprache oder Musikinstrumente zeigen die Eigenschaft, dass der Spektralbereich in einen gepitchten oder tonalen Bereich und einen rauschartigen Bereich unterteilt werden kann.
4 zeigt das Spektrum eines Audioeingangssignals, bei dem diese Eigenschaft völlig offensichtlich ist. Unter Verwendung von Tonalitäts- und/oder Rauschanalyseverfahren in dem Spektralbereich können zwei Bereiche erfasst werden, die als tonal bzw. rauschartig klassifiziert werden können. Die Tonalität kann so berechnet werden, wie dies beispielsweise in dem AAC-Standard gegeben ist [ISO/IEC 13818–7: 1997(E), S. 96 – 98, Abschnitt B.2.1.4 „Steps in threshold calculation"]. Weitere bekannte Tonalitäts- oder Rauscherfassungsalgorithmen wie z. B. Spektralflachheitsmessung sind ebenfalls für den Zweck geeignet. Somit wird die Übergangsfrequenz zwischen diesen Bereichen als die Übergangsfrequenz im Kontext der vorliegenden Erfindung verwendet, um den tonalen und rauschartigen Spektralbereich besser zu trennen und sie separat in den Kerncodierer bzw. das HFR-Verfahren einzuspeisen. Somit kann die Gesamtaudioqualität des kombinierten Codecsystems in derartigen Fällen beträchtlich verbessert werden. - Offensichtlich sind die obigen Verfahren gleichermaßen auf doppelendige und einendige HFR-Systeme anwendbar. Im letzteren Fall wird lediglich ein Niedrigband einer variierenden Bandbreite, das durch den Kerncodec codiert ist, übertragen. Der HFR-Decoder extrapoliert anschließend eine Hüllkurve von der Niedrigband-Grenzfrequenz und nach oben. Ferner ist die vorliegende Erfindung auf Systeme anwendbar, bei denen das Hochband durch willkürliche Verfahren erzeugt wird, die sich von demjenigen, das zum Codieren des Niedrigbandes verwendet wird, unterscheiden.
- Die HFR-Startfrequenz an die variierende Bandbreite des Niedrigbandsignals anzupassen, wäre eine sehr mühselige Aufgabe, wenn herkömmliche Transpositionsverfahren wie z. B. die Frequenzverschiebung angewendet würden. Diese Verfahren beinhalten allgemein ein Filtern des Niedrigbandsignals, um ein Tiefpass- oder Bandpasssignal zu extrahieren, das anschließend in der Zeitdomäne moduliert wird, was eine Frequenzverschiebung bewirkt. Somit würde eine Anpassung ein Umschalten von Tiefpass- oder Bandpassfiltern und Änderungen der Modulationsfrequenz beinhalten. Ferner bewirkt ein Wechseln eines Filters Diskontinuitäten in dem Ausgangssignal, was die Verwendung von Fensterungsverfahren vorantreibt. Bei einem filterbankbasierten System wird das Filtern jedoch automatisch durch Extraktion von Teilbandsignalen aus einem Satz von aufeinanderfolgenden Filterbändern erreicht. Ein Äquivalent zu der Zeitdomänenmodulation wird dann mittels eines Neupatchens bzw. Neuverbindens der extrahierten Teilbandsignale innerhalb der Filterbank erhalten. Das Neupatchen wird ohne weiteres an die variierende Übergangsfrequenz angepasst, und das zuvor erwähnte Fenstern ist in der Teilbanddomäne inhärent, so dass die Änderung von Verschiebungsparametern bei geringer zusätzlicher Komplexität erzielt wird.
-
5 zeigt ein Beispiel der Codiererseite eines HFRbasierten Codecs, der gemäß der vorliegenden Erfindung verbessert ist. Das analoge Eingangssignal wird in einen A/D-Wandler501 eingespeist, der ein digitales Signal bildet. Das digitale Audiosignal wird in einen Kerncodierer502 eingespeist, wo eine Quellcodierung durchgeführt wird. Ferner wird das digitale Signal in einen HFR-Hüllkurvencodierer503 eingespeist. Das Ausgangssignal des HFR-Hüllkurvencodierers stellt die Hüllkurvendaten dar, die das Hochband102 abdecken, das bei der Übergangsfrequenz103 beginnt, wie bei1 veranschaulicht. Die Anzahl von Bits, die für die Hüllkurvendaten in dem Hüllkurvencodierer benötigt werden, wird an den Kerncodierer weitergeleitet, damit sie von den gesamten verfügbaren Bits für einen gegebenen Rahmen subtrahiert werden kann. Der Kerncodierer codiert dann den verbleibenden Niedrigbandfrequenzbereich bis zu der Übergangsfrequenz. Wie durch die vorliegende Erfindung gelehrt wird, wird zu dem Codierer ein Übergangsfrequenz-Steuermodul504 hinzugefügt. Eine Zeit- und/oder Frequenzdomänendarstellung des Eingangssignals sowie Kerncodec-Statussignale werden in das Übergangsfrequenz-Steuermodul eingespeist. Das Ausgangssignal des Moduls504 wird in Form der optimalen Wahl der Übergangsfrequenz in Kern- und Hüllkurvencodierer eingespeist, um die Frequenzbereiche, die codiert werden sollen, zu signalisieren. Der Frequenzbereich für jedes der zwei Codierungsschemata wird ebenfalls codiert, beispielsweise durch ein effizientes Tabellennachschlageschema. Falls sich der Frequenzbereich zwischen zwei aufeinanderfolgenden Rahmen nicht ändert, kann dies durch ein einzelnes Bit signalisiert werden, um den Bitraten-Zusatzaufwand so gering wie möglich zu halten. Somit müssen die Frequenzbereiche nicht explizit in jedem Rahmen übertragen werden. Die codierten Daten beider Codierer werden anschließend in den Multiplexer eingespeist, wobei ein serieller Bitstrom gebildet wird, der übertragen oder gespeichert wird. -
6 liefert ein Beispiel von Teilsystemen innerhalb des Übergangsfrequenz-Steuermoduls504 bzw.601 . Ein Codiererarbeitslastmessanalysemodul602 untersucht, wie schwierig der aktuelle Rahmen für den Kerncodierer zu codieren ist, wobei es beispielsweise den Wahrnehmungsentropie- oder den Verzerrungsenergie-Lösungsansatz, wie oben beschrieben, verwendet. Vorausgesetzt, dass der Kerncodec eine Bitsparkasse verwendet, kann ein Puffer-Gefülltheitsgrad-Analysemodul enthalten sein,603 . Ein Tonalitätsanalysemodul604 signalisiert eine Zielübergangsfrequenz, die der tonalen/Rausch-Übergangsfrequenz entspricht, wenn anwendbar. Alle Eingangsparameter in das gemeinsame Entscheidungsmodul606 werden gemäß der tatsächlichen Implementierung der verwendeten Kern- und HFR-Codecs kombiniert und ausgeglichen, wenn die zu verwendende Übergangsfrequenz berechnet wird, um die maximale Gesamtleistungsfähigkeit zu erhalten. - Die entsprechende Decoderseite ist in
7 gezeigt. Der Demultiplexer701 trennt die Bitstromsignale in Kerncodecdaten, die in den KernDecoder702 eingespeist werden, in Hüllkurvendaten, die in den HFR-Hüllkurvendecoder703 eingespeist werden. Der Kerndecoder erzeugt ein Signal, das den Niedrigbandfrequenzbereich abdeckt. Desgleichen decodiert der HFR-Hüllkurvendecoder die Daten zu einer Darstellung der spektralen Hüllkurve für den Hochbandfrequenzbereich. Die decodierten Hüllkurvendaten werden anschließend in das Gewinnsteuermodul704 eingespeist. Das Niedrigbandsignal von dem Kerndecoder wird an das Transpositionsmodul705 weitergeleitet, das auf der Basis der Übergangsfrequenz ein repliziertes Hochbandsignal aus dem Niedrigband erzeugt. Das Hochbandsignal wird in das Gewinnsteuermodul eingespeist, um die Hochbandspektralhüllkurve an die der übertragenen Hüllkurve anzupassen. Das Ausgangssignal ist somit ein hüllkurvenangepasstes Hochbandaudiosignal. Dieses Signal wird zu dem Ausgangssignal von der Verzögerungseinheit706 hinzugefügt, die mit dem Niedrigbandaudiosignal gespeist wird, wohingegen die Verzögerung die Verarbeitungszeit des Hochbandsignals kompensiert. Schließlich wird das erhaltene digitale Breitbandsignal in dem D/A-Wandler707 in ein analoges Audiosignal umgewandelt.
Claims (8)
- Eine Vorrichtung zum Codieren eines Audiosignals, um ein codiertes Audiosignal zu erhalten, das durch einen Decoder verwendet werden soll, der ein Hochfrequenz-Rekonstruktionsmodul zum Durchführen einer Hochfrequenz-Rekonstruktion für einen Frequenzbereich über einer Übergangsfrequenz aufweist, wobei die Vorrichtung folgende Merkmale aufweist: einen Kerncodierer (
502 ) zum Codieren eines unteren Frequenzbandes des Audiosignals bis zu der Übergangsfrequenz, wobei die Übergangsfrequenz variabel ist und wobei der Kerncodierer auf einer blockweisen Rahmen-Um-Rahmen-Basis betreibbar ist; und ein Übergangsfrequenzsteuermodul (504 ) zum Schätzen, abhängig von einem Maß des Schwierigkeitsgrades zum Codieren des Audiosignals durch den Kerncodierer (502 ) und/oder abhängig von einer Grenze zwischen einem tonalen und einem rauschartigen Frequenzbereich des Audiosignals, einer Übergangsfrequenz, die durch den Kerncodierer (502 ) für einen Rahmen einer Serie von aufeinanderfolgenden Rahmen ausgewählt werden soll, so daß die Übergangsfrequenz über die Zeit für die Serie von aufeinanderfolgenden Rahmen adaptiv variabel ist. - Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einer Wahrnehmungsentropie des Audiosignals beruht.
- Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einer Verzerrungsenergie nach dem Codieren mit dem Kerncodierer beruht.
- Eine Vorrichtung gemäß Anspruch 1, bei der das Maß auf einem Status einer Bitsparkasse, die dem Kerncodierer zugeordnet ist, beruht.
- Eine Vorrichtung gemäß einem der Ansprüche 1 bis 4, bei der jegliche Kombination der Wahrnehmungsentropie, der Kerncodiererverzerrung und des Kerncodierer-Bitsparkassenstatus verwendet wird, um die Übergangsfrequenz zu erhalten, die durch den Kerncodierer (
502 ) für einen Rahmen ausgewählt werden soll. - Ein Verfahren zum Codieren eines Audiosignals, um ein codiertes Audiosignal zu erhalten, das durch einen Decoder verwendet werden soll, der ein Hochfrequenz-Rekonstruktionsmodul zum Durchführen einer Hochfrequenz-Rekonstruktion für einen Frequenzbereich über einer Übergangsfrequenz aufweist, wobei das Verfahren folgende Schritte aufweist: Kerncodieren eines unteren Frequenzbands des Audiosignals bis zu einer Übergangsfrequenz, wobei die Übergangsfrequenz variabel ist und wobei das Kerncodieren auf einer blockweisen Rahmen-Om-Rahmen-Basis stattfindet; und Schätzen, abhängig von einem Maß des Schwierigkeitsgrades zum Codieren des Audiosignals bei dem Schritt des Kerncodierens und/oder abhängig von einer Grenze zwischen einem tonalen und einem rauschartigen Frequenzbereich des Audiosignals, einer Übergangsfrequenz, die bei dem Schritt des Kerncodierens für einen Rahmen einer Serie von aufeinanderfolgenden Rahmen ausgewählt werden soll, so daß die Übergangsfrequenz über die Zeit für die Serie von aufeinanderfolgenden Rahmen adaptiv variiert wird.
- Eine Vorrichtung zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal unter Verwen dung einer variablen Übergangsfrequenz codiert wurde, wobei das codierte Audiosignal Informationen über eine Übergangsfrequenz umfaßt, die über die Zeit adaptiv variabel ist, wobei die Vorrichtung zum Decodieren folgende Merkmale aufweist: einen Bitstrom-Demultiplexer (
701 ) zum Extrahieren von Kerndecoderdaten, Hüllkurvendaten und der Informationen über die variable Übergangsfrequenz; einen Kerndecoder (702 ) zum Empfangen der Kerndecoderdaten von dem Bitstrom-Demultiplexer und zum Ausgeben von Niedrigbanddaten, die eine zeitlich variierende Übergangsfrequenz aufweisen; einen Hochfrequenz-Regenerationshüllkurvendecoder (703 ) zum Empfangen der Hüllkurvendaten von dem Bitstrom-Demultiplexer (701 ) und zum Erzeugen eines Spektralhüllkurvenausgangssignals; ein Transpositionsmodul (705 ) zum Empfangen der Informationen über die variable Übergangsfrequenz und zum Erzeugen eines replizierten Hochbandsignals aus den Niedrigbanddaten auf der Basis der Informationen über die variable Übergangsfrequenz; ein Verstärkungssteuermodul (704 ), das auf den Hochfrequenz-Regenerationshüllkurvendecoder anspricht, zum Einstellen des replizierten Hochbandsignals auf eine Spektralhüllkurve, die durch den Hochfrequenz-Regenerationshüllkurvendecoder ausgegeben wird, um ein hüllkurveneingestelltes Hochbandsignal zu erhalten; und einen Addierer zum Addieren einer verzögerten Version der Niedrigbanddaten und des hüllkurveneingestellten Hochbandsignals, um ein digitales Breitbandsignal zu erhalten. - Ein Verfahren zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal unter Verwendung einer variablen Übergangsfrequenz codiert wurde, wobei das codierte Audiosignal Informationen über eine Übergangsfrequenz umfaßt, die über die Zeit adaptiv variabel ist, wobei das Verfahren zum Decodieren folgende Schritte aufweist: Extrahieren (
701 ) von Kerndecoderdaten, Hüllkurvendaten und der Informationen über die variable Übergangsfrequenz von dem codierten Audiosignal; Empfangen der Kerndecoderdaten von einem Bitstrom-Demultiplexer und Ausgeben von Niedrigbanddaten, die eine zeitlich variierende Übergangsfrequenz aufweisen, mittels eines Kerndecoders (702 ); Empfangen der Hüllkurvendaten und Erzeugen eines Spektralhüllkurvenausgangs mittels eines Hochfrequenz-Regenerationshüllkurvendecoders (703 ); Empfangen der Informationen über die variable Übergangsfrequenz und Erzeugen eines replizierten Hochbandsignals aus den Niedrigbanddaten auf der Basis der Informationen über die variable Übergangsfrequenz mittels eines Transpositionsmoduls (705 ); Einstellen des replizierten Hochbandsignals auf eine Spektralhüllkurve, die durch den Hochfrequenz-Regenerationshüllendecoder (703 ) ausgegeben wird, um ein hüllkurveneingestelltes Hochbandsignal zu erhalten, mittels eines Verstärkungssteuermoduls (704 ); und Addieren einer verzögerten Version der Niedrigbanddaten und des hüllkurveneingestellten Hochbandsignals, um ein digitales Breitbandsignal zu erhalten.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0004187 | 2000-11-15 | ||
SE0004187A SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Enhancing the performance of coding systems that use high frequency reconstruction methods |
PCT/SE2001/002533 WO2002041302A1 (en) | 2000-11-15 | 2001-11-14 | Enhancing the performance of coding systems that use high frequency reconstruction methods |
Publications (2)
Publication Number | Publication Date |
---|---|
DE60103424D1 DE60103424D1 (de) | 2004-06-24 |
DE60103424T2 true DE60103424T2 (de) | 2005-06-16 |
Family
ID=20281835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE60103424T Expired - Lifetime DE60103424T2 (de) | 2000-11-15 | 2001-11-14 | Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden |
Country Status (15)
Country | Link |
---|---|
US (1) | US7050972B2 (de) |
EP (1) | EP1334484B1 (de) |
JP (6) | JP3983668B2 (de) |
KR (1) | KR100551862B1 (de) |
CN (1) | CN1232950C (de) |
AT (1) | ATE267445T1 (de) |
AU (1) | AU2002215282A1 (de) |
DE (1) | DE60103424T2 (de) |
DK (1) | DK1334484T3 (de) |
ES (1) | ES2218462T3 (de) |
HK (1) | HK1058096A1 (de) |
PT (1) | PT1334484E (de) |
SE (1) | SE0004187D0 (de) |
TR (1) | TR200401631T4 (de) |
WO (1) | WO2002041302A1 (de) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPR433901A0 (en) | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
WO2003046891A1 (en) * | 2001-11-29 | 2003-06-05 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
KR100605824B1 (ko) | 2002-05-13 | 2006-07-31 | 삼성전자주식회사 | 부호분할다중접속 이동통신시스템의 방송서비스 방법 |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004009949B4 (de) * | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
KR100956877B1 (ko) * | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
PT1875463T (pt) | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
JP4907522B2 (ja) * | 2005-04-28 | 2012-03-28 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
WO2008031458A1 (en) * | 2006-09-13 | 2008-03-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for a speech/audio sender and receiver |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
ES2403410T3 (es) | 2007-08-27 | 2013-05-17 | Telefonaktiebolaget L M Ericsson (Publ) | Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
EP2077550B8 (de) | 2008-01-04 | 2012-03-14 | Dolby International AB | Audiokodierer und -dekodierer |
CN101281748B (zh) * | 2008-05-14 | 2011-06-15 | 武汉大学 | 用编码索引实现的空缺子带填充方法及编码索引生成方法 |
MX2011000370A (es) * | 2008-07-11 | 2011-03-15 | Fraunhofer Ges Forschung | Un aparato y un metodo para decodificar una señal de audio codificada. |
CA2730200C (en) | 2008-07-11 | 2016-09-27 | Max Neuendorf | An apparatus and a method for generating bandwidth extension output data |
MX2011000382A (es) | 2008-07-11 | 2011-02-25 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion. |
AU2009267507B2 (en) | 2008-07-11 | 2012-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and discriminator for classifying different segments of a signal |
US8326640B2 (en) * | 2008-08-26 | 2012-12-04 | Broadcom Corporation | Method and system for multi-band amplitude estimation and gain control in an audio CODEC |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
PL4231291T3 (pl) | 2008-12-15 | 2024-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
JP5446258B2 (ja) | 2008-12-26 | 2014-03-19 | 富士通株式会社 | オーディオ符号化装置 |
EP2380172B1 (de) | 2009-01-16 | 2013-07-24 | Dolby International AB | Durch kreuzprodukt erweiterte harmonische transposition |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
BR122019023924B1 (pt) | 2009-03-17 | 2021-06-01 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
TWI675367B (zh) * | 2009-05-27 | 2019-10-21 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
ES2719102T3 (es) * | 2010-04-16 | 2019-07-08 | Fraunhofer Ges Forschung | Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega |
US9117459B2 (en) | 2010-07-19 | 2015-08-25 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
EP2466580A1 (de) * | 2010-12-14 | 2012-06-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Codierer und Verfahren zur prädiktiven Codierung, Decodierer und Verfahren zur Decodierung, System und Verfahren zur prädiktiven Codierung und Decodierung und prädiktiv codiertes Informationssignal |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
EP2830062B1 (de) * | 2012-03-21 | 2019-11-20 | Samsung Electronics Co., Ltd. | Verfahren und vorrichtung für hochfrequente codierung/decodierung zur bandbreitenerweiterung |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
CN104781877A (zh) * | 2012-10-31 | 2015-07-15 | 株式会社索思未来 | 音频信号编码装置以及音频信号解码装置 |
RU2612589C2 (ru) | 2013-01-29 | 2017-03-09 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Низкочастотное акцентирование для основанного на lpc кодирования в частотной области |
ES2688134T3 (es) * | 2013-04-05 | 2018-10-31 | Dolby International Ab | Codificador y decodificador de audio para codificación de forma de onda intercalada |
KR20230020553A (ko) * | 2013-04-05 | 2023-02-10 | 돌비 인터네셔널 에이비 | 스테레오 오디오 인코더 및 디코더 |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
JP6305694B2 (ja) | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
BR112015032013B1 (pt) * | 2013-06-21 | 2021-02-23 | Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. | Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio |
KR102329309B1 (ko) | 2013-09-12 | 2021-11-19 | 돌비 인터네셔널 에이비 | Qmf 기반 처리 데이터의 시간 정렬 |
CN104681029B (zh) * | 2013-11-29 | 2018-06-05 | 华为技术有限公司 | 立体声相位参数的编码方法及装置 |
US20150194157A1 (en) * | 2014-01-06 | 2015-07-09 | Nvidia Corporation | System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals |
KR102250472B1 (ko) * | 2016-03-07 | 2021-05-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합 |
CN114946192A (zh) * | 2020-01-15 | 2022-08-26 | 杜比国际公司 | 利用比特率切换自适应流式传输媒体内容 |
KR20230049660A (ko) * | 2020-07-30 | 2023-04-13 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호를 인코딩하거나 인코딩된 오디오 장면을 디코딩하기 위한 장치, 방법 및 컴퓨터 프로그램 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4158751A (en) * | 1978-02-06 | 1979-06-19 | Bode Harald E W | Analog speech encoder and decoder |
JPS595297A (ja) * | 1982-07-01 | 1984-01-12 | 日本電気株式会社 | 帯域分割型ボコ−ダ |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP3297750B2 (ja) * | 1992-03-18 | 2002-07-02 | ソニー株式会社 | 符号化方法 |
JP3218679B2 (ja) * | 1992-04-15 | 2001-10-15 | ソニー株式会社 | 高能率符号化方法 |
US5404377A (en) * | 1994-04-08 | 1995-04-04 | Moses; Donald W. | Simultaneous transmission of data and audio signals by means of perceptual coding |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
JP3557674B2 (ja) * | 1994-12-15 | 2004-08-25 | ソニー株式会社 | 高能率符号化方法及び装置 |
US5646961A (en) * | 1994-12-30 | 1997-07-08 | Lucent Technologies Inc. | Method for noise weighting filtering |
JPH09172376A (ja) * | 1995-12-20 | 1997-06-30 | Hitachi Ltd | 量子化ビット割当て装置 |
JP3255022B2 (ja) * | 1996-07-01 | 2002-02-12 | 日本電気株式会社 | 適応変換符号化方式および適応変換復号方式 |
US6490562B1 (en) * | 1997-04-09 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd. | Method and system for analyzing voices |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5928342A (en) * | 1997-07-02 | 1999-07-27 | Creative Technology Ltd. | Audio effects processor integrated on a single chip with a multiport memory onto which multiple asynchronous digital sound samples can be concurrently loaded |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6385548B2 (en) * | 1997-12-12 | 2002-05-07 | Motorola, Inc. | Apparatus and method for detecting and characterizing signals in a communication system |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
WO2002029784A1 (en) * | 2000-10-02 | 2002-04-11 | Clarity, Llc | Audio visual speech processing |
-
2000
- 2000-11-15 SE SE0004187A patent/SE0004187D0/xx unknown
-
2001
- 2001-11-14 AU AU2002215282A patent/AU2002215282A1/en not_active Abandoned
- 2001-11-14 WO PCT/SE2001/002533 patent/WO2002041302A1/en active IP Right Grant
- 2001-11-14 JP JP2002543428A patent/JP3983668B2/ja not_active Expired - Fee Related
- 2001-11-14 AT AT01983888T patent/ATE267445T1/de active
- 2001-11-14 EP EP01983888A patent/EP1334484B1/de not_active Expired - Lifetime
- 2001-11-14 DK DK01983888T patent/DK1334484T3/da active
- 2001-11-14 CN CNB018189725A patent/CN1232950C/zh not_active Expired - Lifetime
- 2001-11-14 DE DE60103424T patent/DE60103424T2/de not_active Expired - Lifetime
- 2001-11-14 PT PT01983888T patent/PT1334484E/pt unknown
- 2001-11-14 KR KR1020037006583A patent/KR100551862B1/ko active IP Right Grant
- 2001-11-14 ES ES01983888T patent/ES2218462T3/es not_active Expired - Lifetime
- 2001-11-14 TR TR2004/01631T patent/TR200401631T4/xx unknown
- 2001-11-15 US US09/987,657 patent/US7050972B2/en not_active Expired - Lifetime
-
2003
- 2003-11-27 HK HK03108655A patent/HK1058096A1/xx not_active IP Right Cessation
-
2007
- 2007-05-30 JP JP2007142978A patent/JP4991397B2/ja not_active Expired - Lifetime
-
2011
- 2011-12-08 JP JP2011269144A patent/JP5933965B2/ja not_active Expired - Lifetime
-
2014
- 2014-01-09 JP JP2014002174A patent/JP6207404B2/ja not_active Expired - Lifetime
-
2016
- 2016-06-08 JP JP2016114496A patent/JP6368740B2/ja not_active Expired - Lifetime
-
2018
- 2018-07-09 JP JP2018129571A patent/JP6592148B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP5933965B2 (ja) | 2016-06-15 |
CN1232950C (zh) | 2005-12-21 |
EP1334484B1 (de) | 2004-05-19 |
JP6207404B2 (ja) | 2017-10-04 |
TR200401631T4 (tr) | 2004-09-21 |
SE0004187D0 (sv) | 2000-11-15 |
JP2014089472A (ja) | 2014-05-15 |
KR20030076576A (ko) | 2003-09-26 |
DE60103424D1 (de) | 2004-06-24 |
ATE267445T1 (de) | 2004-06-15 |
WO2002041302A1 (en) | 2002-05-23 |
JP4991397B2 (ja) | 2012-08-01 |
US20020103637A1 (en) | 2002-08-01 |
DK1334484T3 (da) | 2004-08-09 |
AU2002215282A1 (en) | 2002-05-27 |
ES2218462T3 (es) | 2004-11-16 |
KR100551862B1 (ko) | 2006-02-13 |
JP2007293354A (ja) | 2007-11-08 |
JP2012093774A (ja) | 2012-05-17 |
US7050972B2 (en) | 2006-05-23 |
JP3983668B2 (ja) | 2007-09-26 |
PT1334484E (pt) | 2004-09-30 |
JP2018185530A (ja) | 2018-11-22 |
JP2016189015A (ja) | 2016-11-04 |
EP1334484A1 (de) | 2003-08-13 |
JP6368740B2 (ja) | 2018-08-01 |
CN1475010A (zh) | 2004-02-11 |
HK1058096A1 (en) | 2004-04-30 |
JP2004514180A (ja) | 2004-05-13 |
JP6592148B2 (ja) | 2019-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60103424T2 (de) | Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden | |
DE60024501T2 (de) | Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution | |
DE60217522T2 (de) | Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung | |
DE60310716T2 (de) | System für die audiokodierung mit füllung von spektralen lücken | |
DE60202881T2 (de) | Wiederherstellung von hochfrequenzkomponenten | |
EP0290581B1 (de) | Verfahren zum übertragen digitalisierter tonsignale | |
DE60110679T3 (de) | Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz | |
DE602004008613T2 (de) | Treueoptimierte kodierung mit variabler rahmenlänge | |
EP2022043B1 (de) | Informationssignalcodierung | |
DE60214599T2 (de) | Skalierbare audiokodierung | |
EP0954909B1 (de) | Verfahren zum codieren eines audiosignals | |
DE60012198T2 (de) | Kodierung der hüllkurve des spektrums mittels variabler zeit/frequenz-auflösung | |
DE60214027T2 (de) | Kodiervorrichtung und dekodiervorrichtung | |
DE19921122C1 (de) | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals | |
DE60117471T2 (de) | Breitband-signalübertragungssystem | |
DE19959156C2 (de) | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals | |
EP1825461A1 (de) | Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen | |
DE60027956T2 (de) | Sprachkodierung mit variabler BIT-Rate | |
DE60131766T2 (de) | Wahrnehmungsbezogen verbesserte codierung akustischer signale | |
DE69932861T2 (de) | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung | |
DE10297751B4 (de) | Audiocodierverfahren und Vorrichtung, die die Harmonischen-Extraktion verwenden | |
DE60124079T2 (de) | Sprachverarbeitung | |
DE602004007550T2 (de) | Verbesserte frequenzbereichs-fehlerverbergung | |
DE69533259T2 (de) | Nichtlineares quantisieren eines informationssignales | |
DE60112407T2 (de) | Verfahren und vorrichtung zur konvertierung eines audiosignals zwischen unterschiedlichen datenkompressionsformaten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8327 | Change in the person/name/address of the patent owner |
Owner name: CODING TECHNOLOGIES AB, STOCKHOLM, SE |
|
8364 | No opposition during term of opposition |