DE19628292B4 - Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten - Google Patents

Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten Download PDF

Info

Publication number
DE19628292B4
DE19628292B4 DE19628292A DE19628292A DE19628292B4 DE 19628292 B4 DE19628292 B4 DE 19628292B4 DE 19628292 A DE19628292 A DE 19628292A DE 19628292 A DE19628292 A DE 19628292A DE 19628292 B4 DE19628292 B4 DE 19628292B4
Authority
DE
Germany
Prior art keywords
spectral values
stereo
stereo audio
coding
audio spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19628292A
Other languages
English (en)
Other versions
DE19628292A1 (de
Inventor
Uwe Dipl.-Ing. Gbur
Martin Dipl.-Ing. Dietz
Bodo Dipl.-Ing. Teichmann
Karlheinz Dr.-Ing. Brandenburg
Heinz Dr.-Ing. Gerhäuser
Jürgen Dr.-Ing. Herre
John Johnston
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
AT&T Labs Inc
Nokia of America Corp
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Lucent Technologies Inc
AT&T Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=7799742&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE19628292(B4) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Lucent Technologies Inc, AT&T Labs Inc filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to DE19628292A priority Critical patent/DE19628292B4/de
Priority to KR1019980710868A priority patent/KR100316582B1/ko
Priority to PCT/EP1997/002874 priority patent/WO1998003036A1/de
Priority to CA002260090A priority patent/CA2260090C/en
Priority to JP50553798A priority patent/JP3622982B2/ja
Priority to PT97925036T priority patent/PT910927E/pt
Priority to AT97925036T priority patent/ATE188832T1/de
Priority to DK97925036T priority patent/DK0910927T3/da
Priority to ES97925036T priority patent/ES2143868T3/es
Priority to DE59701014T priority patent/DE59701014D1/de
Priority to EP97925036A priority patent/EP0910927B1/de
Priority to US09/214,656 priority patent/US6771777B1/en
Priority to AU30318/97A priority patent/AU712196B2/en
Publication of DE19628292A1 publication Critical patent/DE19628292A1/de
Priority to NO19990106A priority patent/NO317570B1/no
Priority to GR20000400139T priority patent/GR3032444T3/el
Publication of DE19628292B4 publication Critical patent/DE19628292B4/de
Application granted granted Critical
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Verfahren zum Codieren von Stereoaudiospektralwerten, mit folgenden Schritten:
Gruppieren der Stereoaudiospektralwerte in Skalenfaktorbänder (28), denen Skalenfaktoren zugeordnet sind;
Bilden von Abschnitten, die jeweils aus mindestens einem Skalenfaktorband (28) bestehen;
Codieren der Stereoaudiospektralwerte innerhalb wenigstens eines Abschnitts mit einer dem wenigstens einen Abschnitt zugeordneten Codiertabelle aus einer Mehrzahl von Codiertabellen, denen jeweils eine Codiertabellennummer zugeordnet ist, wobei die Codiertabellennummer der verwendeten Codiertabelle als Seiteninformationen zu den codierten Stereoaudiospektralwerten übertragen wird,
wobei wenigstens eine zusätzliche Codiertabellennummer vorgesehen ist, die nicht auf eine Codiertabelle verweist, sondern für den Abschnitt, dem dieselbe zugeordnet ist, relevante Informationen anzeigt, wobei einem Abschnitt entweder die Codiertabellennummer oder die zusätzliche Codiertabellennummer zugeordnet ist.

Description

  • Die vorliegende Erfindung bezieht sich auf das Codieren und Decodieren von Stereoaudiospektralwerten und insbesondere auf das Anzeigen der Tatsache, daß eine Stereo-Intensity-Codierung aktiv ist.
  • Moderne Audiocodierverfahren bzw. -Decodierverfahren, die beispielsweise nach dem Standard MPEG-Layer 3 arbeiten, sind in der Lage, die Datenrate von digitalen Audiosignalen beispielsweise um einen Faktor zwölf zu komprimieren, ohne die Qualität derselben merkbar zu verschlechtern.
  • Neben einem hohen Codierungsgewinn in den einzelnen Kanälen, wie z.B. dem linken Kanal L und dem rechten Kanal R, wird im Stereofall auch die Redundanz und Irrelevanz der beiden Kanäle untereinander ausgenutzt. Bekannte und bereits verwendete Verfahren sind das sogenannte MS-Stereo-Verfahren (MS = Mitte-Seite) und das Intensity-Stereo-Verfahren (IS-Verfahren).
  • Das für Fachleute bekannte MS-Stereo-Verfahren nutzt im wesentlichen die Redundanz der beiden Kanäle untereinander aus, wobei dabei eine Summe der beiden Kanäle und eine Differenz der beiden Kanäle berechnet wird, welche dann jeweils als modifizierte Kanaldaten für den linken bzw. rechten Kanal übertragen werden. Die in dem Codierer entfernte Redundanz zwischen den beiden Kanalen wird im Decodierer wieder hinzugefügt. Das heißt, daß das MS-Stereoverfahren exakt rekonstruierend ist.
  • Im Gegensatz dazu nutzt das Intensity-Stereo-Verfahren vornehmlich die Stereoirrelevanz aus. Bezüglich der Stereoirrelevanz ist zu sagen, daß die räumliche Wahrnehmung des menschlichen Gehörsystems von der Frequenz der wahrgenommenen Audiosignale abhängt. Bei niedrigeren Frequenzen werden sowohl Betrags- als auch Phaseninformationen beider Stereosignale durch das menschliche Gehörsystem bewertet, wobei die Wahrnehmung von Hochfrequenzkomponenten hauptsächlich auf der Analyse der Energie-Zeit-Hüllkurven beider Kanäle begründet ist. Somit sind die exakten Phaseninformationen der Signale in beiden Kanälen für die räumliche Wahrnehmung nicht relevant. Diese Eigenschaft des menschlichen Gehörs wird verwendet, um die Stereoirrelevanz zur weiteren Datenreduktion von Audiosignalen durch das Intensity-Stereo-Verfahren zu verwenden.
  • Da das Stereo-Intensity-Verfahren bei hohen Frequenzen keine genaue Ortsinformation aufzulösen vermag, ist es daher möglich, ab einer im Codierer bestimmten Intensity-Grenzfrequenz statt zweier Stereokanäle L, R eine gemeinsame Energieeinhüllende für beide Kanäle zu übertragen. Zusätzlich zu dieser gemeinsamen Energieeinhüllenden werden grob quantisierte Richtungsinformationen zusätzlich als Seiteninformationen übertragen.
  • Da also bei der Verwendung der Intensity-Stereo-Codierung ein Kanal nur teilweise übertragen wird, kann die Biteinsparung bis zu 50% betragen. Es ist jedoch zu beachten, daß das IS-Verfahren im Decodierer nicht exakt rekonstruierend ist.
  • Bei dem IS-Verfahren, das bisher in dem Standard MPEG-Layer 3 verwendet wird, wird über ein sogenanntes Modus Erweiterungs Bit (mode_extension_bit) angezeigt, daß das IS-Verfahren in einem Block von Stereoaudiospektralwerten überhaupt aktiv ist, wobei jeder Block ein ihm zugeordnetes Modus_Erweiterungs_Bit aufweist.
  • In 1 befindet sich eine Prinzipdarstellung des bekannten IS-Verfahrens. Stereoaudiospektralwerte für einen Kanal L 10 und für einen Kanal R 12 werden an einem Summationspunkt 14 summiert, um eine Energieeinhüllende I = Li + Ri der beiden Kanäle zu erhalten. Li und Ri stellen hier die Stereoaudiospektralwerte des Kanals L bzw. der Kanals R in einem beliebigen Skalenfaktorband dar. Wie bereits erwähnt wurde, ist die Verwendung des IS-Verfahrens nur oberhalb einer bestimmten IS-Grenzfrequenz erlaubt, um keine Codierstörungen in die codierten Stereoaudiospektralwerte einzuführen. Deshalb müssen in einem Bereich von 0 Hz bis zu der IS-Grenzfrequenz der linke und der rechte Kanal separat codiert werden. Die Bestimmung der IS-Grenzfrequenz als solche wird in einem separaten Algorithmus durchgeführt, der keinen Teil dieser Erfindung darstellt. Ab dieser Grenzfrequenz codiert der Codierer das Summensignal des linken Kanals 10 und des rechten Kanals 12, das an dem Summationspunkt 14 gebildet wird.
  • Zusätzlich zu der Energieeinhüllenden, d.h. dem Summensignal aus linkem und rechtem Kanal, die beispielsweise in dem codierten linken Kanal übertragen werden kann, sind ferner Skalierungsinformationen 16 für den Kanal L sowie Skalierungsinformationen 18 für den Kanal R für eine Decodierung notwendig. Bei dem Intensity-Stereo-Verfahren, wie es beispielsweise im MPEG Layer 2 implementiert ist, werden Skalenfaktoren für den linken und den rechten Kanal übertragen. An dieser Stelle sei jedoch angemerkt, daß bei dem IS-Verfahren im MPEG Layer 3 für IS-codierte Stereoaudiospektralwerte Intensity-Richtungsinformationen lediglich im rechten Kanal übertragen werden, mit denen dann, wie es weiter hinten dargelegt ist, die Stereoaudiospektralwerte wieder decodiert werden.
  • Die Skalierungsinformationen 16 und 18 werden als Seiteninformationen jeweils zusätzlich zu den codierten Spektralwerten des Kanals L sowie des Kanals R übertragen. Ein Decodierer liefert an einem decodierten Kanal L' 20 bzw. an einem decodierten Kanal R' 22 decodierte Audiosignalwerte, wobei die Skalierungsinformationen 16 für den Kanal R sowie die Skalierungsinformationen 18 für den Kanal L mit den decodierten Stereoaudiospektralwerten der jeweiligen Kanäle an einem L-Multiplizierer 24 bzw. an einem R-Multiplizierer 26 multipliziert werden, um die ursprünglich codierten Stereoaudiospektralwerte wieder zu decodieren.
  • Vor dem Anwenden einer IS-Codierung oberhalb einer bestimmten IS-Grenzfrequenz oder einer MS-Codierung unterhalb dieser Grenzfrequenz werden die Stereoaudiospektralwerte für jeden Kanal zu sogenannten Skalenfaktorbändern gruppiert. Diese Bänder sind an die Wahrnehmungseigenschaften des Gehörs angepaßt. Jedes dieser Bänder kann mit einem zusätzlichen Faktor, dem sogenannten Skalenfaktor, verstärkt werden, der als Seiteninformationen für den jeweiligen Kanal übertragen wird und der einen Teil der Skalierungsinformationen 16 sowie der Skalierungsinformationen 18 aus 1 darstellt. Diese Faktoren bewirken eine Formung eines durch eine Quantisierung eingeführten Störgeräusches, derart, daß dasselbe unter Berücksichtigung psychoakustischer Gesichtspunkte "maskiert" und damit unhörbar wird.
  • 2a zeigt ein Format des codierten rechten Kanals R, der beispielsweise bei einem Audiocodierverfahren MPEG-Layer 3 verwendet wird. Auch alle weiteren Ausführungen bezüglich der Intensity-Stereo-Codierung beziehen sich auf das Verfahren nach dem Standard MPEG Layer 3. In der ersten Zeile in 2a sind die einzelnen Skalenfaktorbänder 28, in die die Stereoaudiospektralwerte gruppiert sind, schematisch gezeigt. Die in 2a gezeichnete gleiche Bandbreite der Skalenfaktorbänder dient lediglich der Übersichtlichkeit der Darstellung und wird in der Praxis aufgrund der psychoakustischen Eigenschaften des Gehörsystems nicht auftreten.
  • In der zweiten Zeile von 2a befinden sich codierte Stereoaudiospektralwerte sp, die unterhalb einer IS-Grenzfrequenz 32 ungleich Null sind, wobei die Stereoaudiospektralwerte in dem rechten Kanal über der IS-Grenzfrequenz, wie bereits erwähnt, zu Null (Zero_Part) gesetzt werden nsp (nsp = Nullspektrum).
  • In der dritten Zeile von 2a befinden sich ein Teil der Seiteninformationen 34 für den rechten Kanal. Dieser gezeigte Teil der Seiteninformationen 34 besteht zum einen aus den Skalenfaktoren skf für den Bereich unterhalb der IS-Grenzfrequenz sowie aus Richtungsinformationen rinfo 36 für den Bereich über der IS-Grenzfrequenz 32. Diese Richtungsinformationen werden verwendet, um bei dem Intensity-Stereo-Verfahren noch eine grobe Ortsauflösung des IS-codierten Frequenzbereichs zu gewährleisten. Diese Richtungsinformationen rinfo 36, die auch Intensity-Positionen (is_pos) genannt werden, werden also anstelle der Skalenfaktoren im rechten Kanal übertragen. Es sei noch einmal angemerkt, daß unterhalb der IS-Grenzfrequenz im rechten Kanal nach wie vor die den Skalenfaktorbändern 28 entsprechenden Skalenfaktoren 34 vorhanden sind. Die Intensity-Positionen 36 zeigen die wahrgenommene Stereoabbildungsposition (das Verhältnis von links zu rechts) der Signalquelle innerhalb der jeweiligen Skalenfaktorbänder 28 an. In jedem Skalenfaktorband 28 über der IS-Grenzfrequenz werden die decodierten Werte der übertragenen Stereoaudiospektralwerte nach dem Verfahren MPEG Layer 3 durch die folgenden Skalierungsfaktoren kL für den linken Kanal und kR für den rechten Kanal skaliert: kL = is_ratio/(1 + is_ratio) (1)und kR = 1/(1 + is_ratio) (2)
  • Die Gleichung für is_ratio lautet folgendermaßen: is_ratio = tan(is_pos·π/12) (3)
  • Der Wert is_pos ist ein mit 3 Bit quantisierter Wert, wobei nur die Werte von 0 bis 6 gültige Positionswerte darstellen. Aus den folgenden beiden Gleichungen können aus dem I-Signal (I = Li + Ri) der linke und der rechte Kanal wieder zurückgerechnet werden: Ri = I·is_ratio/(1 + is_ratio) = I·kL (4) Li = I·1/(1 + is_ratio) = I·kR (5)
  • Ri und Li stellen die Intensity-Stereo-decodierten Stereoaudiospektralwerte dar. An dieser Stelle sei angemerkt, daß das Format des linken Kanals zu dem in 2a gezeigten Format des rechten Kanals analog ist, wobei jedoch im linken Kanal oberhalb der IS-Grenzfrequenz 32 statt dem Nullspektrum das kombinierte Spektrum I = Li + Ri zu finden ist, und wobei ferner keine Richtungsinformationen is_pos für den linken Kanal sondern gewöhnliche Skalenfaktoren vorhanden sind. Der Übergang von den quantisierten Summenspektralwerten ungleich Null zu den Nullwerten im rechten Kanal kann dem Decodierer beim Standard MPEG Layer 3 implizit die IS-Grenzfrequenz anzeigen.
  • Im Codierer wird der übertragene Kanal L also als die Summe des linken und des rechten Kanals berechnet, wobei die übertragenen Richtungsinformationen durch folgende Gleichung bestimmt werden können: is_pos = nint[arctan(√EL/√ER)·12/π] (6)
  • Dabei stellt die Funktion nint[x] die Funktion "nächste Ganzzahl" dar, wobei EL und ER die Energien in den jeweiligen Skalenfaktorbändern des linken bzw. rechten Kanals sind. Diese Formulierung des Codierers/Decodierers führt zu einer annähernden Rekonstruktion von Signalen in dem linken und in dem rechten Kanal.
  • Wie bereits erwähnt wurde, werden bei bekannten Audiocodierverfahren die Stereoaudiospektralwerte in die Skalenfaktorbänder gruppiert, wobei diese Bänder an die Wahrnehmungseigenschaften des Gehörs angepaßt sind. Bei dem Audiocodierverfahren nach dem Standard MPEG-Layer 3 werden diese Skalenfaktorbänder nun in genau drei Regionen unterteilt. Damit sollen nun Bereiche mit gleicher Signalstatistik gruppiert werden. Dies ist zu der nun stattfindenden Redundanzreduktion mittels der bekannten Huffman-Codierung vorteilhaft. Für jede dieser Regionen aus Skalenfaktorbändern 28 wird nun eine einer Mehrzahl von Huffman-Tabellen ausgewählt, bei der der Gewinn durch die Redundanzreduktion mittels der Huffman-Codierung mittels der ausgewählten Huffman-Tabelle am größten ist. Diese Tabelle wird in dem Bitstrom der codierten Daten mittels eines 5-Bit-Wertes für jede Region angezeigt. Es existieren 30 verschiedene Tabellen, wobei die Tabellen 4 und 14 nicht belegt sind.
  • Das nicht-rückwärts-kompatible NBC-Codierverfahren, welches sich gerade in der Standardisierung befindet, unterscheidet sich von dem Standardaudiocodierverfahren MPEG Layer 3 nun unter anderem darin, daß in der Bitstromsyntax für dieses Verfahren nicht nur genau drei Regionen aus Skalenfaktorbändern erlaubt sind, sondern daß sogenannte Abschnitte oder "sections" in beliebiger Anzahl vorhanden sein können und eine beliebige Anzahl von Skalenfaktorbändern aufweisen können. Einem Abschnitt wird nun in Analogie zum vorher beschriebenen Verfahren im MPEG Layer 3 zum Erreichen einer maximalen Redundanzreduktion eine dementsprechende Huffman-Tabelle aus einer Mehrzahl derartiger Tabellen zugeordnet, welche dann zur Decodierung verwendet werden soll. Im Extremfall besteht ein Abschnitt beispielsweise nur aus einem einzigen Skalenfaktorband. In der Praxis wird dies jedoch eher nicht auftreten, da die dann notwendigen Seiteninformationen viel zu groß sein würden. Beim NBC-Verfahren existieren insgesamt 16 Huffman-Codiertabellennummern, die als 4-Bit-Werte übertragen werden. Damit kann eine der zwölf existierenden Codiertabellennummern ausgewählt werden.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, Verfahren zum Codieren bzw. Decodieren von Stereoaudiospektralwerten zu schaffen, bei denen für die Codierung bzw. Decodierung relevante Informationen mit einem minimalen Aufwand an Seiteninformationen signalisiert werden.
  • Diese Aufgabe wird durch ein Verfahren zum Codieren von Stereoaudiospektralwerten gemäß Anspruch 1 sowie durch ein Verfahren zum Decodieren von teilweise im Intensity-Stereo-Verfahren codierten Stereoaudiospektralwerten gemäß Anspruch 2 gelöst.
  • Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß zusätzliche Codiertabellennummern, die nicht zum Verweisen auf Codiertabellen verwendet werden, andere für einen Abschnitt relevante Informationen anzeigen können. Die "zusätzlichen" Codiertabellennummern sind die Codiertabellennummern, die nicht auf Codiertabellen verweisen. Durch eine 4-Bit-Codierung von zwölf verschiedenen Codiertabellennummern sind die Nummern 13, 14 und 15 für eine Belegung mit anderen Informationen gewissermaßen frei verfügbar. Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden zwei (Nr. 14 und Nr. 15) der drei (Nr. 13, Nr. 14 und Nr. 15) zusätzlichen Codiertabellennummern verwendet, um zum einen auf eine in einem Abschnitt vorhandene Intensity-Codierung und zum anderen auf die gegenseitige Phasenlage von IS-codierten Stereoaudiospektralwerten in zwei Stereokanälen hinzuweisen.
  • Die noch nicht verwendete zusätzliche Codiertabellennummer 13 kann verwendet werden, um auf eine adaptive Huffman-Codierung hinzuweisen.
  • Beworzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeichnungen erläutert. Es zeigen:
  • 1 den Signalfluß bei einem Codierungs/Decodierungs-Schema nach dem Intensity-Stereo-Verfahren;
  • 2a ein Format der Daten bei Vorliegen einer Stereo-Intensity-Codierung für den rechten Kanal für den Standard MPEG Layer 3;
  • 2b ein Format der Daten bei Vorliegen einer Stereo-Intensity-Codierung für den rechten Kanal für das MPEG-NBC-Verfahren; und
  • 3 ein schematisches Blockschaltbild eines Decodierers, der die vorliegende Erfindung ausführt.
  • Ein Verfahren zum Codieren von Stereoaudiospektralwerten sowie das Verfahren zum Decodieren von teilweise im Intensity-Stereo-Verfahren codierten Stereoaudiospektralwerten gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung verwenden eine neuartige Signalisierung des Vorhandenseins der Intensity-Stereo-Codierung innerhalb eines Abschnitts. Gemäß der vorliegenden Erfindung sind ebenfalls 16 Codiertabellennummern vorhanden. Im Gegensatz zum Stand der Technik entsprechen jedoch lediglich die ersten 12 Codiertabellennummern (Nr. 1 bis Nr. 12) wirklichen Codiertabellen. Mit Hilfe der letzten und der vorletzten Codiertabellennummer wird nun signalisiert, daß innerhalb des Abschnitts, dem diese Codiertabellennummer zugeordnet ist, das Stereo-Intensity-Verfahren eingesetzt wird.
  • 2b zeigt ein Format der Daten für den rechten Kanal R bei Vorliegen einer Stereo-Intensity-Codierung, wobei das MPEG2-NBC-Verfahren verwendet wird. Der Unterschied zu 2a, bzw. zu dem Verfahren MPEG Layer 3, besteht darin, daß ein Anwender jetzt die Flexibilität besitzt, auch oberhalb der IS-Grenzfrequenz 32 eine Intensity-Stereo-Codierung der Stereoaudiospektralwerte für jeweils einen Abschnitt selektiv ein- bzw. auszuschalten. Damit ist die IS-Grenzfrequenz im Vergleich zum MPEG Layer 3 eigentlich keine richtige Grenzfrequenz mehr, da beim NBC-Verfahren auch oberhalb der IS-Grenzfrequenz die IS-Codierung wieder aus- bzw. angeschaltet werden kann. Dies war beim Layer 3 nicht möglich, d.h. die Stereoaudiospektralwerte über der IS-Grenzfrequenz mußten bei Vorliegen einer IS-Codierung für einen Abschnitt auf jeden Fall auch ganz bis zum oberen Ende des Spektralbereichs IS-codiert werden. Das neue NBC-Verfahren muß nun nicht für den gesamten Spektralbereich oberhalb der IS-Grenze die IS-Codierung aktivieren, sondern dasselbe erlaubt auch das Ausschalten der IS-Codierung, so dies signalisiert ist. Da nach der Bitstromsyntax für einen Abschnitt ohnehin eine Codiertabellennummer übertragen werden muß, vermehren sich bei der beschriebenen erfindungsgemäßen Signalisierung auch nicht die Seiteninformationen ("overhead").
  • Die in einem Abschnitt mit IS-Codierung für den rechten Kanal übertragenen Skalenfaktoren stellen nun ebenfalls analog zum Stand der Technik die Richtungsinformationen 36 dar, wobei diese Werte selbst ebenfalls einer Differenz- und Huffman-Codierung unterzogen werden. Im rechten Kanal stehen, wie es bereits erwähnt wurde, in den Skalenfaktorbändern die nicht IS-codiert sind, keine Stereoaudiospektralwerte, sondern ein Nullspektrum. Der linke Kanal enthält in IS-codierten Abschnitten das Summensignal des linken und des rechten Kanals. Das Summensignal wird jedoch derart normiert, daß seine Energie innerhalb der jeweiligen Skalenfaktorbänder nach der IS-Decodierung der Energie des linken Kanals entspricht. Daher kann der linke Kanal im Falle einer verwendeten IS-Codierung in der Decodiervorrichtung auch unverändert übernommen werden und muß nicht durch eine Rückskalierungsvorschrift extra ermittelt werden. Die Stereoaudiospektralwerte des rechten Kanals können nun aus den Stereoaudiospektralwerten des linken Kanals unter Verwendung der Richtungsinformationen is_pos 36, die in den Seiteninformationen des rechten Kanals vorhanden sind, zurückgerechnet werden.
  • Wie eingangs beschrieben wurde, ergibt das Stereo-Intensity-Verfahren gemäß dem Stand der Technik zwei kohärente Signale für den linken bzw. rechten Kanal, die sich lediglich in ihrer Amplitude, d.h. Intensität, in Abhängigkeit von den Richtungsinformationen is_pos 36 unterscheiden (Gleichungen (4) und (5)).
  • Bei der vorliegenden Erfindung kann nun, da das Vorhanden sein der Stereo-Intensitäts-Codierung mittels zwei "unwirklichen" Codiertabellennummern signalisiert wird, eine Phasenbeziehung der beiden Kanäle zueinander einbezogen werden. Weisen die Kanäle die gleiche Phasenlage auf, so lautet die in dem Decodierer auszuführende erfindungsgemäße Rückrechnungsvorschrift folgendermaßen: Ri = 0,5 ^ (0,25·is_pos(sfb))·Li, (7)während im Falle einer Gegenphasigkeit das Spektrum mit –1 multipliziert wird, wodurch sich für die Berechnung des rechten Kanals folgende Gleichung ergibt: Ri = (–1) 0,5 ^ (0,25·is_pos(sfb))·Li. (8)
  • Ri bezeichnet in den beiden vorherigen Gleichungen die rückgerechneten, d.h. decodierten, Stereoaudiospektralwerte des rechten Kanals. sfb bezeichnet das Skalenfaktorband 28, dem die Richtungsinformationen is_pos 36 zugeordnet sind. Li bezeichnet die Stereoaudiospektralwerte des linken Kanals, die im Decoder unverändert übernommen werden.
  • Die Codiertabellennummer 15 zeigt nun an, ob die erste Rückrechnungsvorschrift verwendet werden soll, während die Codiertabellennummer 14 anzeigt, daß die zweite Rückrechnungsvorschrift verwendet werden soll, d.h. daß die beiden Kanäle gegenphasig sind. Für Fachleute ist es offensichtlich, daß die Ausdrücke Gleichphasigkeit und Gegenphasigkeit im Sinne dieser Anmeldung breit verwendet werden. So kann beispielsweise ein Phasendiskriminator vorgesehen sein, der ab einem bestimmten Phasendiskriminatorausgangswert, der beispielsweise 90° sein kann, bestimmt, daß die Signale gegenphasig sind, wobei dieselben bei einem Phasenunterschied von kleiner 90° als gleichphasig angesehen werden.
  • Bei dem beschriebenen ersten Ausführungsbeispiel kann also für einen Abschnitt, der aus mindestens einem Skalenfaktorband besteht, durch die Codiertabellennummern 14 oder 15 die Phasenlage der beiden Kanäle zueinander bestimmt werden. Die Seiteninformationen, die durch IS- und Phasensignalisierung verursacht werden, betragen für einen Abschnitt 8 Bit, die sich aus vier Bit für die Abschnittslänge und vier Bit für die Codiertabellennummer 14 oder 15 zusammensetzen. Soll nun ein Audiosignal codiert werden, das in Skalenfaktorbändern seiner Stereoaudiospektralwerte häufige Änderungen der Phasenlage aufweist, so muß gemäß dem ersten Ausführungsbeispiel bei jeder Umkehrung der Phasenlage von Skalenfaktorband zu Skalenfaktorband ein neuer Abschnitt ("section") begonnen werden. Ein Signal mit einer häufig wechselnden Phasenlage erzeugt also sehr viele Abschnitte, da jeder Abschnitt durch die ihm zugeordnete Codiertabellennummer nur entweder Gleichphasigkeit oder Gegenphasigkeit seiner Stereoaudiospektralwerte in den beiden Kanälen anzeigen kann. Ein ungünstiges Signal wird demnach zu einer großen Anzahl von Abschnitten und damit zu einer großen Menge an Seiteninformationen führen.
  • Ein zweites Ausführungsbeispiel der vorliegenden Erfindung erlaubt eine skalenfaktorbandweise Phasenlagencodierung in einem Abschnitt, in dem die Intensity-Codierung aktiv ist. Durch dieses Verfahren gemäß dem zweiten Ausführungsbeispiel der vorliegenden Erfindung gelingt damit unter Verwendung einer MS-Maske, die nachfolgend beschrieben wird, eine skalenfaktorbandweise Phasenlagencodierung ohne eine Vergrößerung der Anzahl von Abschnitten sowie ohne einen zusätzlichen Mehraufwand.
  • Für Fachleute ist es offensichtlich, daß sich das Mitte-Seite-Verfahren und das Intensity-Stereo-Verfahren in einem Skalenfaktorband gegenseitig ausschließen. Diese beiden Verfahren sind also orthogonal.
  • Wird eine MS-Codierung von Stereoaudiospektralwerten in einem Bitstrom verwendet, so wird ein Signalisierungsbit in den Seiteninformationen entsprechend eingestellt sein, das die MS-Codierung global anschaltet. Ein Setzten dieses Bits besagt, daß eine MS-Bitmaske übertragen wird, mit der es möglich ist, eine MS-Codierung selektiv für jedes Skalenfaktorband (scfbd) an- oder auszuschalten. Für jedes Skalenfaktorband ist in der MS-Bitmaske ein Bit reserviert, weshalb die Länge der Bitmaske der Skalenfaktorbandanzahl entspricht.
  • In den Skalenfaktorbändern, in denen IS aktiv ist, ist die MS-Skalenfaktorinformation nicht nötig, da die MS-Codierung hier nicht aktiviert sein darf. Die MS-Bitmaske kann in diesem Bereich für andere Signalisierungen verwendet werden. Es ist also möglich, mittels der MS-Bitmaske Details der IS-Codierung anzuzeigen. In Übereinstimmung mit dem ersten Ausführungsbeispiel werden bei der IS-Codierung die Informationen bezüglich der Phasenlage der Kanäle in einem Abschnitt mittels der Codiertabellennummern 14 und 15 angegeben. Die Codiertabellennummern zeigen ferner an, daß in einem Abschnitt die IS-Codierung überhaupt aktiv ist.
  • In Abweichung vom ersten Ausführungsbeispiel wird bei dem zweiten Ausführungsbeispiel der vorliegenden Erfindung die MS-Bitmaske dafür verwendet, um in einem Abschnitt Skalenfaktorbänder mit unterschiedlichen Phasenlagen zuzulassen. Die MS-Bitmaske dient nun dazu, in Relation zu der Codiertabellennummer, die signalisiert, daß eine IS-Codierung in einem Abschnitt aktiv ist, die Phasenlage der einzelnen Skalenfaktorbänder in diesem Abschnitt anzuzeigen. Ist ein Bit in der MS-Bitmaske für ein Skalenfaktorband nicht gesetzt (d.h. Null), so werden die durch die Codiertabellennummer für den Abschnitt, in dem sich das Skalenfaktorband befindet, angezeigten Phaseninformationen beibehalten, während bei einem gesetzten (d.h. Eins-) Bit in der MS-Bitmaske für das Skalenfaktorband die durch die Codiertabellennummer für den Abschnitt, in dem sich das Skalenfaktorband befindet, angezeigte Phasenlage der beiden Kanäle invertiert wird. Im Prinzip handelt es sich also um eine EXKLUSIV-ODER-Verknüpfung zwischen der durch die Codiertabellennummer angezeigten Phasenlage und der MS-Bitmaske.
  • Im einzelnen lauten die aus Codiertabellennummer und MS-Bitmaske berechneten Phasenbeziehungen der beiden Stereokanäle L und R in einem Skalenfaktorband, das sich in einem Abschnitt befindet, in dem die IS-Codierung verwendet wird, folgendermaßen:
    Figure 00140001
    Tabelle 1
  • Das beschriebene zweite Ausführungsbeispiel der vorliegenden Erfindung erlaubt also das Auftreten von Skalenfaktorbändern mit Stereoaudiospektralwerten mit unterschiedlichen Phasenlagen in einem Abschnitt, wodurch weniger Abschnitte als beim ersten Ausführungsbeispiel zum Codieren gebildet werden müssen. Damit müssen auch weniger Seiteninformationen übertragen werden.
  • In Abweichung von dem oben beschriebenen Ausführungsbeispiel können mit den zusätzlichen Codiertabellennummern auch andere für einen Abschnitt relevante Informationen angezeigt werden.
  • Weitere für einen Abschnitt relevante Informationen können beispielsweise ein Hinweis auf die Verwendung einer adaptiven Huffman-Codierung in einem Abschnitt sein. Bei einer adaptiven Huffman-Codierung kann in Abhängigkeit von der Signalstatistik eine adaptierte Huffman-Tabelle erzeugt werden. Die Codiertabellennummer 13 weist die Codiervorrichtung an, keine der zwölf festen Huffman-Tabellen zu verwenden, sondern eine adaptierte Huffman-Tabelle zu verwenden, die dem Decoder a priori nicht bekannt ist. Dies ist dann von Vorteil, wenn die Signalstatistik in einem Abschnitt nicht optimal mit einer der zwölf fest vorgegebenen Codiertabellen codiert, d.h. komprimiert, werden kann. Die Codierung ist also nicht mehr auf die zwölf festen Huffman-Tabellen festgelegt, sondern kann eine optimal an die Signalstatistik adaptierte Tabelle erzeugen und verwenden. Die Informationen über die adaptive Codiertabelle werden als zusätzliche Seiteninformationen übertragen.
  • Eine Decodiervorrichtung benötigt diese zusätzlichen Seiteninformationen, um sich aus denselben die bei der Codierung verwendete adaptierte Huffman-Tabelle zurückzurechnen, um die Huffman-codierten Stereoaudiospektralwerte wieder korrekt decodieren zu können.
  • 3 zeigt ein vereinfachtes Blockschaltbild eines Decodierers, der das Verfahren zum Decodieren gemäß der vorliegenden Erfindung ausführen kann. Teilweise im Intensity-Stereo-Verfahren codierte Audiospektralwerte werden jeweils inversen Quantisierern 38 und 40 zugeführt, wobei die inversen Quantisierer die bei der Codierung eingeführte Quantisierung wieder rückgängig machen. Anschließend gelangen die dequantisierten Stereoaudiospektralwerte in einen MS-Decodierer 42. Dieser MS-Decodierer 42 macht die im Codierer eingeführte Mitte-Seite-Codierung rückgängig. Ein IS-Decodierer 44 verwendet nun die vorher beschriebenen Rückrechnungsvorschriften (7) und (8), um wieder die ursprünglichen Stereoaudiospektralwerte auch für die IS-codierten Skalenfaktorbänder zu erhalten. Jeweilige Rücktransformationseinrichtungen für den linken bzw. rechten Kanal führen nun eine Umsetzung der Stereoaudiospektralwerte in Stereoaudiozeitwerte L(t), R(t) durch. Für Fachleute ist es offensichtlich, daß die Rücktransformationseinrichtungen 46 und 48 beispielsweise durch eine inverse MDCT ausgeführt werden können.

Claims (10)

  1. Verfahren zum Codieren von Stereoaudiospektralwerten, mit folgenden Schritten: Gruppieren der Stereoaudiospektralwerte in Skalenfaktorbänder (28), denen Skalenfaktoren zugeordnet sind; Bilden von Abschnitten, die jeweils aus mindestens einem Skalenfaktorband (28) bestehen; Codieren der Stereoaudiospektralwerte innerhalb wenigstens eines Abschnitts mit einer dem wenigstens einen Abschnitt zugeordneten Codiertabelle aus einer Mehrzahl von Codiertabellen, denen jeweils eine Codiertabellennummer zugeordnet ist, wobei die Codiertabellennummer der verwendeten Codiertabelle als Seiteninformationen zu den codierten Stereoaudiospektralwerten übertragen wird, wobei wenigstens eine zusätzliche Codiertabellennummer vorgesehen ist, die nicht auf eine Codiertabelle verweist, sondern für den Abschnitt, dem dieselbe zugeordnet ist, relevante Informationen anzeigt, wobei einem Abschnitt entweder die Codiertabellennummer oder die zusätzliche Codiertabellennummer zugeordnet ist.
  2. Verfahren zum Decodieren von codierten Stereoaudiospektralwerten, die Seiteninformationen aufweisen, mit folgenden Schritten: Erfassen je einer Codiertabellennummer aufgrund der Seiteninformationen für jeden Abschnitt der codierten Stereoaudiospektralwerte; Decodieren der Stereoaudiospektralwerte eines Abschnitts mit einer Codiertabellennummer, die nicht auf eine Codiertabelle verweist, sondern für den Abschnitt, dem dieselbe zugeordnet ist, relevante Informationen anzeigt, gemäß der angezeigten Informationen; und Decodieren der Stereoaudiospektralwerte eines weiteren Abschnitts, dessen Codiertabellennummer auf eine entsprechende Codiertabelle verweist, unter Verwendung dieser Codiertabelle.
  3. Verfahren gemäß einem der Ansprüche 1 oder 2, bei dem mindestens eine zusätzliche Codiertabellennummer auf eine Codierung nach dem Intensity-Stereo-Verfahren der Stereoaudiospektralwerte des zugeordneten Abschnitts hinweist.
  4. Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, bei dem mindestens eine zusätzliche Codiertabellennummer auf eine adaptive Huffman-Codierung der Stereoaudiospektralwerte des zugeordneten Abschnitts hinweist.
  5. Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, bei dem die wenigstens eine zusätzliche Codiertabellennummer für einen Abschnitt, der nach dem Stereo-Intensity-Verfahren codiert ist, ferner eine Phasenbeziehung zwischen zwei Stereokanälen anzeigt.
  6. Verfahren nach Anspruch 5, bei dem eine von zwei zusätzlichen Codiertabellennummern eine gleiche Phasenlage der zwei Stereokanäle anzeigt, wobei folgende Rückrechnungsvorschrift zum Intensity-Decodieren gilt: Ri = 0,5 ^ (0, 25·is_pos(sfb))·Li, wobei is_pos Intensity-Richtungsinformationen für das vorhandene Skalenfaktorband darstellt, während Li und Ri die normierten Summensignale der Stereoaudiospektralwerte des linken (L) und des rechten (R) Kanals sind.
  7. Verfahren nach Anspruch 5 oder 6, bei dem eine von zwei zusätzlichen Codiertabellennummern eine gleiche Phasenlage der zwei Stereokanäle anzeigt, wobei folgende Rückrechnungsvorschrift zum Intensity-Decodieren gilt: Ri = (–1)·0,5 ^ (0,25·is_pos(sfb))·Li wobei is_pos Intensity-Richtungsinformationen für das vorhandene Skalenfaktorband darstellt, während Li und Ri die normierten Summensignale der Stereoaudiospektralwerte des linken (L) und des rechten (R) Kanals sind.
  8. Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, bei dem das Intensity-Stereo-Verfahren in einem linken Kanal ein normiertes Summensignal der Stereoaudiospektralwerte des linken und des rechten Kanals und als Seiteninformationen Skalenfaktoren bildet, während in dem rechten Kanal das Spektrum Null ist und Intensity-Richtungsinformationen als Seiteninformationen codiert werden.
  9. Verfahren gemäß einem beliebigen der vorhergehenden Ansprüche, bei dem eine Bitmaske, die ein Bit für jedes Skalenfaktorband aufweist, verwendet wird, wobei ein Bit der Bitmaske für ein Skalenfaktorband in einem Abschnitt, dem eine der zusätzlichen Codiertabellennummern zugeordnet ist, mit der zusätzlichen Codiertabellennummer verknüpft wird, um ein Phasenbeziehung für zwei Stereokanäle zu bestimmen.
  10. Verfahren gemäß Anspruch 9, bei dem die Bitmaske eine MS-Bitmaske ist und die zusätzlichen Codiertabellennummern mit der MS-Bitmaske skalenfaktorbandweise mittels einer EXKLUSIV-ODER-Verknüpfung verknüpft werden.
DE19628292A 1996-07-12 1996-07-12 Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten Expired - Lifetime DE19628292B4 (de)

Priority Applications (15)

Application Number Priority Date Filing Date Title
DE19628292A DE19628292B4 (de) 1996-07-12 1996-07-12 Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
ES97925036T ES2143868T3 (es) 1996-07-12 1997-06-03 Procedimiento para codificar y decodificar valores espectrales estereo audio.
EP97925036A EP0910927B1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten
CA002260090A CA2260090C (en) 1996-07-12 1997-06-03 Method of coding and decoding stereo audio spectral values
JP50553798A JP3622982B2 (ja) 1996-07-12 1997-06-03 ステレオ音響スペクトル値の符号化・解読方法
PT97925036T PT910927E (pt) 1996-07-12 1997-06-03 Processo para codificacao e descodificacao de valores espectrais de audio-estereofonia
AT97925036T ATE188832T1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten
DK97925036T DK0910927T3 (da) 1996-07-12 1997-06-03 Fremgangsmåde til kodning og dekodning af stereoaudiospektralværdier
KR1019980710868A KR100316582B1 (ko) 1996-07-12 1997-06-03 스테레오포닉스펙트럼값의부호화및복호화프로세스
DE59701014T DE59701014D1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten
PCT/EP1997/002874 WO1998003036A1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten
US09/214,656 US6771777B1 (en) 1996-07-12 1997-06-03 Process for coding and decoding stereophonic spectral values
AU30318/97A AU712196B2 (en) 1996-07-12 1997-06-03 Method of coding and decoding stereo audio spectral values
NO19990106A NO317570B1 (no) 1996-07-12 1999-01-11 Koding og dekoding av spektralverdier for stereofoni
GR20000400139T GR3032444T3 (en) 1996-07-12 2000-01-20 Process for coding and decoding stereophonic spectral values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19628292A DE19628292B4 (de) 1996-07-12 1996-07-12 Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten

Publications (2)

Publication Number Publication Date
DE19628292A1 DE19628292A1 (de) 1998-01-15
DE19628292B4 true DE19628292B4 (de) 2007-08-02

Family

ID=7799742

Family Applications (2)

Application Number Title Priority Date Filing Date
DE19628292A Expired - Lifetime DE19628292B4 (de) 1996-07-12 1996-07-12 Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE59701014T Expired - Lifetime DE59701014D1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE59701014T Expired - Lifetime DE59701014D1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten

Country Status (14)

Country Link
US (1) US6771777B1 (de)
EP (1) EP0910927B1 (de)
JP (1) JP3622982B2 (de)
KR (1) KR100316582B1 (de)
AT (1) ATE188832T1 (de)
AU (1) AU712196B2 (de)
CA (1) CA2260090C (de)
DE (2) DE19628292B4 (de)
DK (1) DK0910927T3 (de)
ES (1) ES2143868T3 (de)
GR (1) GR3032444T3 (de)
NO (1) NO317570B1 (de)
PT (1) PT910927E (de)
WO (1) WO1998003036A1 (de)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) * 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
DE60132853D1 (de) * 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7469206B2 (en) 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7016547B1 (en) * 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
PT2282310E (pt) 2002-09-04 2012-04-13 Microsoft Corp Codificação entrópica por adaptação de modos de codificação entre codificação por nível e codificação por comprimento/nível de sequência
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN1922655A (zh) * 2004-07-06 2007-02-28 松下电器产业株式会社 音频信号编码装置、音频信号解码装置、方法及程序
EP1866911B1 (de) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Skalierbare mehrkanal-audiokodierung
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101444102B1 (ko) 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
JP6061121B2 (ja) 2011-07-01 2017-01-18 ソニー株式会社 オーディオ符号化装置、オーディオ符号化方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59188764A (ja) * 1983-04-11 1984-10-26 Hitachi Ltd メモリ装置
DE3943879B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
JP3131249B2 (ja) 1991-08-23 2001-01-31 日本放送協会 混合音声信号受信装置
EP0559348A3 (de) * 1992-03-02 1993-11-03 AT&T Corp. Rateurregelschleifenprozessor für einen wahrnehmungsgebundenen Koder/Dekoder
CA2090052C (en) 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
JP3292522B2 (ja) 1992-11-25 2002-06-17 京セラ株式会社 携帯電話機
JP3150475B2 (ja) * 1993-02-19 2001-03-26 松下電器産業株式会社 量子化方法
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4331367C2 (de) * 1993-09-15 1996-04-18 Lewin Martin Innenmuffe zur Dichtung von Rohrstößen in Rohrleitungen
US5488665A (en) 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3435674B2 (ja) 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
US5864802A (en) * 1995-09-22 1999-01-26 Samsung Electronics Co., Ltd. Digital audio encoding method utilizing look-up table and device thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Standard "ISO/IEC 11172-3, Part 3: Audio, First Edition 1.8.93, S. I-VI und 1-9 *

Also Published As

Publication number Publication date
GR3032444T3 (en) 2000-05-31
KR20000022435A (ko) 2000-04-25
DE59701014D1 (de) 2000-02-17
JP3622982B2 (ja) 2005-02-23
NO990106D0 (no) 1999-01-11
PT910927E (pt) 2000-04-28
EP0910927B1 (de) 2000-01-12
JP2000505266A (ja) 2000-04-25
NO317570B1 (no) 2004-11-15
DK0910927T3 (da) 2000-05-08
NO990106L (no) 1999-03-10
CA2260090C (en) 2000-10-17
WO1998003036A1 (de) 1998-01-22
ATE188832T1 (de) 2000-01-15
CA2260090A1 (en) 1998-01-22
US6771777B1 (en) 2004-08-03
EP0910927A1 (de) 1999-04-28
DE19628292A1 (de) 1998-01-15
AU712196B2 (en) 1999-10-28
KR100316582B1 (ko) 2002-02-28
AU3031897A (en) 1998-02-09
ES2143868T3 (es) 2000-05-16

Similar Documents

Publication Publication Date Title
DE19628292B4 (de) Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE4135070C1 (de)
DE10200653B4 (de) Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
EP1016319B1 (de) Verfahren und vorrichtung zum codieren eines zeitdiskreten stereosignals
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
WO2005013491A2 (de) Audiodateiformatumwandlung
DE4222623A1 (de) Übertragung und Speicherung von mehrkanaligen Tonsignalen bei Anwendung von bitratenreduzierenden Codierverfahren
EP0414838A1 (de) Verfahren zur übertragung eines signals.
DE102006055737A1 (de) Verfahren zur skalierbaren Codierung von Stereo-Signalen
EP0642719A1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer voneinander abhängiger kanäle.
DE4430864C2 (de) Verfahren zum unbemerktem Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines quellencodierten, datenreduzierten Audiosignals
EP1155498B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und vorrichtung und verfahren zum lesen eines datenstroms
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE19747119C2 (de) Verfahren und Vorrichtungen zum Codieren bzw. Decodieren eines Audiosignals bzw. eines Bitstroms
EP1354314A2 (de) Verfahren und vorrichtung zum erzeugen eines skalierbaren datenstroms und verfahren und vorrichtung zum decodieren eines skalierbaren datenstroms unter berücksichtigung einer bitsparkassenfunktion
DE19840853B4 (de) Verfahren und Vorrichtungen zum Codieren eines Audiosignals

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R071 Expiry of right