DE10310785B4 - Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen - Google Patents

Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen Download PDF

Info

Publication number
DE10310785B4
DE10310785B4 DE10310785A DE10310785A DE10310785B4 DE 10310785 B4 DE10310785 B4 DE 10310785B4 DE 10310785 A DE10310785 A DE 10310785A DE 10310785 A DE10310785 A DE 10310785A DE 10310785 B4 DE10310785 B4 DE 10310785B4
Authority
DE
Germany
Prior art keywords
audio signals
transmission
digital coding
signals according
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10310785A
Other languages
English (en)
Other versions
DE10310785A1 (de
Inventor
Liu Chi-Min
Lee Wen-Chieh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Yang Ming Chiao Tung University NYCU
Original Assignee
National Chiao Tung University NCTU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Chiao Tung University NCTU filed Critical National Chiao Tung University NCTU
Publication of DE10310785A1 publication Critical patent/DE10310785A1/de
Application granted granted Critical
Publication of DE10310785B4 publication Critical patent/DE10310785B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen mit den folgenden Schritten:
(a1) Abbilden von Eingangsaudiosignalen in eine Sequenz von Frequenzproben, die eine spektrale Zusammensetzung der Audiosignale repräsentieren;
(a2) Unterteilen der Frequenzproben in Frequenzbänder;
(b) Quantisieren der Sequenz von Frequenzproben in quantisierte Werte in Übereinstimmung mit einem Bit-Zuordnungsvorgang, wobei der Bit-Zuordnungsvorgang einen Parameterprediktor einsetzt zur Evaluierung von Quantisierungsparametern unter Bezugnahme auf einen Maskierungsschwellenwert, wobei der Quantisierer ein ungleichförmiger Quantisierer ist und wobei der Zusammenhang von Skalenfaktor und Maskierungsschwelle durch Einsetzen eines analytischhergeleiteten Näherungswertes für das Quantisierungsrauschen des ungleichförmigen Quantisierers bestimmt ist;
(c) Codieren der quantisierten Werte unter Einsatz eines Symbolcodierers zur Bildung codierter Daten mit einer Anzahl von Bits und
(d) Packen der codierten Daten in eine Sequenz von Daten entsprechend einem spezifizierten Audioprotokoll.

Description

  • Die vorliegende Erfindung bezieht sich allgemein auf ein Verfahren und dessen Architektur einer digitalen Codierung zur Übertragung und zum Packen von Signalen und im besonderen auf die Bit-Zuordnung beim Codieren von Audiosignalen.
  • HINTERGRUND DER ERFINDUNG
  • Die wahrnehmbare Audiocodierung wie etwa MPEG-Schichten 1–3, fortgeschrittene Audiocodierung oder T/F (Zeit/Frequenz)-Codierung wurde weitgehend eingesetzt bei handelsüblichen elektronischen Geräten, Telekommunikationsgeräten und Rundfunkgeräten. Unter diesen wahrnehmbaren Audiocodierern ist die Bit-Zuordnung eine der Hauptaufgaben, welche zu der hohen Komplexität und zum Schlüsselmodul führt, welche die codierte Qualität bestimmen.
  • Aus der DE 101 19 980 C1 ist ein Verfahren zur Codierung von Audiodaten bekannt. Ein linearer Zusammenhang zwischen Skalenfaktor und Logarithmus der Rauschenergie wird jedoch lediglich aus Versuchsreihen ermittelt und daraus werden dann empirisch bestimmte Korrekturfaktoren abgeleitet.
  • Aus der DE 44 28 193 A1 ist ein Verfahren zum Kodieren von Tonsignalen bekannt. Ein abgetastetes Tonsignal wird in ein Frequenzbereichssignal umgewandelt, das in eine Vielzahl von kritischen Bändern unterteilt ist. Jedem kritischen Band wird die Anzahl von Quantisierungsbits zugeordnet, die es erlaubt, dass der MMR-Wert für das entsprechende kritische Band ein Minimum hat. Das Frequenzbereichssignal wird durch die zugeordnete Anzahl von Quantisierungsbits quantisiert. Die Anzahl der Quantisierungsbits wird durch ein Gewicht festgelegt, welches aus dem kritischen Band und den Bändern gleich dem kritischen Band ider den frequenzmäßig niedriger liegenden Bändern bestimmt wird. Im Quantisierungsschritt werden die Quantisierungsbits den kritischen Bändern in der Reihenfolge vom kritischen Band mit der höchsten Frequenz zum kritischen Band mit der niedrigsten Frequenz zugeordnet.
  • Die 1 zeigt das Blockdiagramm eines Codierungsverfahrens bei der wahrnehmbaren Audiocodierung. Ein T/F-Abbilder 101 transformiert die Audiosignale S(n) in Frequenzsegmente S(m, f) von der Zeitdomäne in die Frequenzdomäne auf einer Window-by-Window-Basis. Verschiedene Codierer 103 wurden bei dem Codierungsverfahren verwendet, um hohe Kompressionsausmaße zu erzielen. Der Ausgang X(m, f) ist die Frequenzdomänensequenz nach dem Codieren mit dem Window-Segmentindex m und dem Frequenzindex f. Ein Quantisierer 105 quantisiert X(m, f) in eine endliche Zahl von Niveaus repräsentiert durch X'(m, f) mit dem Ziel der Minimierung der subjektiven Ungleichheiten, die durch das Quantisierungsgeräusch eingeführt werden. Die Quantisierungsniveaus werden durch die Quantisierungsparameter gesteuert.
  • Die Audiokompression klassifiziert allgemein die Frequenzlinien in Gruppen, die als Quantisierungsbänder bezeichnet werden. Die Anzahl der Linien, die in einem Quantisierungsband gruppiert sind, wird entsprechend den kritischen Bändern und den gewährbaren Bits bestimmt, die erforderlich sind, um die Quantisierungsparameter zu übertragen. VLC (variable Längencodierung) 107 repräsentiert die quantisierte Frequenz X'(m, f) über eine variable Längencodierung unter Inbetrachtziehung der statistischen Eintretungswahrscheinlichkeit des übertragenen Signals. Eine Packungseinheit 109 packt die endgültige codierte Sequenz in eine Sequenz, die definiert ist durch ein spezifiziertes Audioprotokoll. Ein psychoakustisches Modell 111 analysiert die Signale und stellt ein SMR (Signal-zu- Maskierungs-Verhältnis) für die Quantisierungsbänder von dem Signalanalyseergebnis zur Verfügung. Ein Bit-Zuordner 113 bestimmt die Quantisierungsparameter unter Bezugnahme auf die Maskierungsschwellenwerte, die durch das pyschoakustische Modell 111 und das verfügbare Bit-Budget 115 bereitgestellt werden.
  • Ein nicht-uniformer Quantisierer quantisiert die Spektrallinien unter der Steuerung des Bit-Zuordners, der über die Quantisierungsart entscheidet unter Inbetrachtziehung der sich ergebenden Audioqualität und der erforderlichen Bits. Dementsprechend ist die Steuerung über die Qualität und die Bit-Zahl das fundamentale Erfordernis der Bit-Zuordnung. Die US-PS 5 579 430 beschreibt ein digitales Codierungsverfahren in Bezug auf das OCF-(optimale Codierung der Frequenzdomäne)-Verfahren. Dies verbessert das OCF-Verfahren in einer solchen Weise, dass die Codierung von Musik mit einer Qualität, die vergleichbar ist einer CD-Qualität, möglich ist bei einer Datengeschwindigkeit von etwa 2 Bits/ATW und mit einer guten Kurzwellenradioqualität bei Datengeschwindigkeiten von 1,5 Bits/ATW. Eine weitere US-PS 5 924 060 beschreibt ein digitales Codierungsverfahren für die Übertragung und/oder Speicherung von akustischen Signalen, welches die Datengeschwindigkeit um einen Faktor von 4 bis 6 reduziert, ohne subjektiv die Qualität des musikalischen Signals zu verschlechtern.
  • Für MPEG-Schichten 1 und 2 wird ein uniformer Quantisierer eingesetzt zur Steuerung der Qualität und der Bit-Anforderung. Somit ist die Bit-Zuordnung einfach die Beimessung der gesamten Zahl verfügbarer Bits für die Quantisierung der Sub-Band-Signale der Hörbarkeit des Quantisierungsgeräusches zu minimieren. Für Codierer, wie etwa MPEG-Schicht 3, MPEG-2, AAC und MPEG4 T/F-Codierung ist die Steuerung über die Qualität und die Bitrate schwierig. Dies liegt hauptsächlich an der Tatsache, dass sie alle nicht-uniforme Quantisierer einsetzen, deren Quantisierungsgeräusch variiert im Hinblick auf die Eingangswerte. Mit anderen Worten, versagt die Steuerung der Qualität durch die Zuordnung der Quantisierungsparameter entsprechend dem wahrnehmbaren zulässigen Geräusch. Darüber hinaus ordnet die variable Längencodierung, die bei MPEG-Schicht 3 und MPEG-2 AAC eingesetzt wird, verschiedene Bit-Längen verschiedenen Werten zu, was bedeutet, dass die aufgebrauchten Bits von den Quantisierungsergebnissen erhalten werden sollen und können nicht allein von den Quantisiererparametern kommen. Somit ist die Bit-Zuordnung eine der Hauptaufgaben, die zu einer höheren Komplexität des Codierers führt.
  • Die obigen Nachteile führen zu dem Problem bei der Evaluierung der Quantisierungsparameter. Ein iteratives Verfahren mit doppelt verschachtelter Schleife, welches als OCF bezeichnet wird, wurde vorgeschlagen, um das Problem zu lösen. Wie in 2 dargestellt, evaluiert es die Quantisierungsparameter durch zwei Iterationsschleifen, die Geschwindigkeitssteuerschleife und die Qualitätssteuerschleife. Die Geschwindigkeitssteuerschleife stellt iterativ die Parameterwerte ein, so dass sie zu dem begrenzten Bits passen, die man erhält bei der Durchführung der Quantisierung und Huffman-Codierung für Spektrallinien. Die Qualitätssteuerschleife stellt iterativ die Parameterwerte ein, dass sie zu einem wahrnehmbaren Kriterium des Quantisierungsgeräusches passen, welches evaluiert werden muss durch die Durchführung der Umkehrquantisierung.
  • Die Komplexität des Verfahrens für einen Rahmen mit F-Spektrallinien kann beschrieben werden als O(F·R·η + F·Q·γ), wobei Q und R jeweils die Anzahl der Qualitätssteueriterationen und Geschwindigkeitssteueriterationen sind, während η und γ die Berechnungskomplexität ist zur Behandlung einer Spektrallinie in der Geschwindigkeitssteuerschleife bzw. der Qualitätssteuerschleife. Die Geschwindigkeitssteuerschleifenkomplexität η kommt von der Quantisierung und der VLC-Codierung einer Spektrallinie, während die Qualitätssteuerschleifenkomplexität γ von der Dequantisierungs- und Geräuschmessung kommt. Sowohl die Komplexität η als auch γ sind hoch. Auch die Anzahl der Iterationen Q und R hängen ab von den Eingangswerten der Quantisierungsparameter und der Einstellverfahren. Die Komplexität ist sogar größer als die gesamte Komplexität der Hybridtransformation und dem psychoakustischen Modell, welches in 1 dargestellt ist.
  • Die Zuordnung von Bits zu Quantisierungsbändern in der Qualitätssteuerschleife bestimmt die Qualität des codierten Audiosignals. Es gab zwei Näherungen zur Zuordnung der Bits. Eine Näherung liegt darin, dass Bit nur dem Band mit dem schlechtesten Geräusch-zu-Maskierungs-Verhältnis in jeder Iterationen in der Schleife zuzuordnen. Die Näherung führt zu einer großen Zahl von Iterationen in der Qualitätssteuerschleife, welches eine sehr hohe Komplexität bedeutet. Eine weitere Näherung ordnet die Bits allen den Bändern mit einem Geräusch-zu-Maskierungs-Verhältnis höher als eines in jeder der Iteration zu bis alle verfügbaren Bits verbraucht sind. Diese Näherung besitzt eine viel niedrigere Komplexität als die erste Näherung. Das Problem liegt jedoch darin, ob die Qualität der Näherung zufrieden stellend ist.
  • Die erste Näherung kann das Geräusch so formen, dass der Maskierungsschwellenwert parallel zum Geräuschschwellenwert liegt, worin ein weithin akzeptiertes Kriterium liegt. Die zweite Näherung, die in dem Probencode liegt, der durch ISO bereitgestellt wird, führt normalerweise zu einer besseren subjektiven Qualität. Die Probleme des doppeltverschachtelten Schleifenverfahrens liegen darin, dass es möglicherweise nicht zu einem konvergenten Zustand führt. Da es zwei getrennte Regeln gibt, die die Qualität und Bits, die in den beiden Schleifen konsumiert werden, steuern, kann dies zu unendlichen Schleifen führen, die allgemein als Blockierungsproblem bezeichnet werden. Ein allgemeines Verfahren zur Behandlung des Blockierungsproblems liegt daran, dass man eine Begrenzung der maximalen Zahl von Iterationen einstellt und ein heuristisches Parameterabstimmverfahren verwendet zur Handhabung der Qualität und der Schleifenzahl. Die Qualität kann jedoch für diese Verfahren nicht garantiert werden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung wurde entwickelt zur Überwindung der Nachteile des herkömmlichen digitalen Codierungsverfahrens. Die Hauptaufgabe liegt darin, ein Verfahren für eine digitale Codierung zur Übertragung und Packung von Audiosignalen mit hoher Qualität und viel geringerer Rechnerkomplexität zur Verfügung zu stellen.
  • Gemäß der Erfindung werden Audioeingangssignale zunächst in einer Sequenz von Frequenzproben abgebildet, um eine spektrale Zusammensetzung der Audiosignale zu repräsentieren. Die Frequenzproben werden in Frequenzbänder unterteilt. Die Sequenz der Frequenzproben wird in Übereinstimmung mit einem Bit-Zuordnungsverfahren und einem Parameterprediktor quantisiert, der die Quantisierungsparameter durch direkten Bezug auf einen Maskierungsschwellenwert evaluiert, wobei der Quantisierer ein ungleichförmiger Quantisierer ist und wobei der Zusammenhang von Skalenfaktor und Maskierungsschwelle durch Einsetzen eines analytisch-hergeleiteten Näherungswertes für das Quantisierungsrauschen des ungleichförmigen Quantisierers bestimmt ist. Diese quantisierten Werte werden mit einer variablen Längencodierung codiert oder direkt auf ein spezifiziertes Protokoll verpackt. Wenn die Gesamtlänge der codierten Daten die Zahl der verfügbaren Bits überschreitet, wird eine Parametereinstellung vorgenommen und die Quantisierungsschrittgröße wird erhöht. Dieses Verfahren wird wiederholt, bis die Anzahl der verfügbaren Bits größer ist als die Zahl der für die Codierung erforderlichen Bits. Schließlich wird die endgültige codierte Sequenz in eine Sequenz gepackt, die definiert durch ein spezifiziertes Audioprotokoll ist.
  • Das Verfahren der vorliegenden Erfindung nimmt einen nicht-uniformen Quantisierer der MPEG Schicht 3 für die Detailderivation und untersucht die Komplexität und Audioqualität des wahrnehmbaren Codierungsverfahrens. Dementsprechend setzt es ein abschnittsweises Geräusch-zu-Maskierungs-Verhältnis für die Derivation ein und stellt eine geschlossene Gleichung für die Beziehung zwischen Bits/Schrittgröße und Quantisierungsgeräusch zur Verfügung. Das Verfahren ist nicht auf die MPEG-Schicht 3 beschränkt, sondern es ist auf die meisten wahrnehmbaren Codierer anwendbar, wie MPEG AAC (advanced Audiocodierung).
  • Eine weitere Aufgabe der vorliegenden Erfindung liegt in der Bereitstellung der Architektur für solch ein digitales Codierungsverfahren. Die Architektur umfasst einen Abbilder, einen Unterteiler, einen Quantisierer, einen VLC-Codierer, einen Parameterprediktor, eine Packungseinheit, einen Einsteller sowie einen Vergleicher, der durch Signalprozessoren realisiert werden kann, um das Verfahren gemäß der vorliegenden Erfindung auszuführen.
  • Gemäß der vorliegenden Erfindung werden die Quantisierungsparameter evaluiert direkt von den Qualitätskriterien für die elegante Verschlechterung unter Inbetrachtziehung der Quantisierungsbandbreite und der erforderlichen Bits in den ungleichen Frequenzlinien mit Hilfe einer Geschwindigkeitssteuerschleife für ein Audiocodierungsverfahren mit niedriger Bitrate. Für die variable Bitratencodierung kann die Iteration in der Geschwindigkeitssteuerschleife vollständig entfernt werden.
  • Die voranstehenden und andere Aufgaben, Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden nach einem sorgfältigen Studium einer detaillierten Beschreibung, die nachfolgend bereitgestellt wird unter Bezugnahme auf die beigefügten Zeichnungen deutlicher.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 stellt das Blockdiagramm eines Codierverfahrens einer modernen Audiocodierung dar,
  • 2 stellt das Bit-Zuordnungsverfahren für ein OCF-Verfahren dar,
  • 3a stellt den Ablauf des Audiocodierungsverfahrens gemäß der vorliegenden Erfindung dar,
  • 3b stellt den Vorgang des Audiocodierungsverfahrens mit niedriger Bitrate gemäß der vorliegenden Erfindung dar,
  • 3c stellt den Vorgang des Audiocodierungsverfahrens mit variabler Bitrate gemäß der vorliegenden Erfindung dar,
  • 4a stellt eine realisierte Architektur der 3a gemäß der vorliegenden Erfindung dar,
  • 4b und 4c stellen die realisierten Architekturen der 3b bzw. 3c dar
  • 5 stellt die durchschnittliche Iterationszahl für jedes Korn in der MPEG-Schicht 3 dar mit unterschiedlichen Testmaterial für die vorliegende Erfindung bzw. das MPEG-Bit-Zuordnungsverfahren
  • 6 stellt die objektive Auswertung des Verfahrens der Erfindung dar, verglichen mit dem Bit-Zuordnungsverfahren, welches in der ISO-Aufzeichnung vorgeschlagen wird,
  • 7 stellt eine Liste dar mit einer Untergruppe von Testsignalen, die zum Einsatz gebracht wurden, während des objektiven und des subjektiven Tests.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • Die 3a stellt den Vorgang des Audiocodierungsverfahrens gemäß der vorliegenden Erfindung dar. Unter Bezugnahme auf 3a werden die Eingangsaudiosignale zunächst abgebildet in einer Sequenz von Frequenzproben, die eine spektrale Zusammensetzung der Audiosignale repräsentieren. Diese Sequenz der Frequenzproben wird dann quantisiert, um Symbole zu erhalten mit einer geringeren Präzision entsprechend einem Bit-Zuordnungsverfahren. Ein Parameterprediktor kommt zum Einsatz, um die Quantisierungsparameter zu evaluieren durch direkten Bezug auf einen Maskierungsschwellenwert für das Geräuschausmaß, welches ein menschliches Hörsystem hören kann. Die Parameter, die die Signalniveauauflösung für ein Kompressionssystem bestimmen, werden vorausgesagt.
  • Diese quantisierten Symbole werden codiert mit einem VLC-Codierer. Der nächste Schritt ist die Überprüfung, ob eine vorbeschriebene Anzahl von verfügbaren Bits genug oder nicht genug ist für die codierten Daten. Wenn die Anzahl von verfügbaren Bits nicht größer ist als die Gesamtlänge der codierten Daten wird eine Parametereinstellung vorgenommen, und die Quantisierungsschrittgröße wird erhöht. Dieser Vorgang wird wiederholt, bis die Anzahl der erforderlichen Bits für die Codierung die Zahl von verfügbaren Bits erreicht. Am Ende wird die endgültig codierte Sequenz gepackt in eine Sequenz, die definiert ist durch eine spezifiziertes Audioprotokoll.
  • Für die Audiocodierung einer niedrigen Bitrate kann die hohe Frequenz gesperrt werden vor der Evaluierung der Quantisierungsparameter in dem Parameterprediktor. Die 3b stellt den Vorgang des Audiocodierungsverfahrens bei niedriger Bitrate dar. Wie die 3b zeigt, wird, während die Anzahl von erforderlichen Bits für die Codierung mit niedriger Geschwindigkeit die Anzahl verfügbarer Bits überschreitet, die Abtrennfrequenz eingestellt und übertragen, so daß die Hochfrequenzkomponenten gesperrt werden vor der Evaluierung der Quantisierungsparameter. Die Quantisierungsschrittgröße kann ebenfalls eingestellt werden, falls dies erstrebenswert ist. Für die Audiocodierung einer variablen Bitrate können die verfügbaren Bits eingestellt werden, entsprechend der geforderten Qualität. In diesem Fall kann die Iteration in der Geschwindigkeitssteuerschleife vollständig entfernt werden. Die 3c stellt den Vorgang des Audiocodierungsverfahrens mit variabler Bitrate dar, wobei die Iteration in der Geschwindigkeitssteuerschleife von der 3a entfernt ist.
  • Die Verfahren, wie sie in den 3a3c der vorliegenden Erfindung gezeigt sind, können realisiert werden mit Signalprozessoren. Die detaillierten Architekturen der Realisierung werden nachfolgend beschrieben. In Übereinstimmung mit 3a umfaßt die realisierte Architektur, wie sie in 4a gezeigt ist, einen Abbilder 401 zum Empfang und Transformierung einer Eingangssequenz von Audiosignalen in eine Sequenz von Frequenzproben, um hierdurch eine Spektralzusammensetzung der Audiosignale zu repräsentieren. Ein Quantisierer 402 quantisiert die Sequenz der Frequenzproben um eine endliche Zahl von Niveaus in Übereinstimmung mit einem Bit-Zuordnungsverfahren. Ein Parameterprediktor 405 kommt zum Einsatz, um die Quantisierungsparameter zu evaluieren durch direkten Bezug auf einen Maskierungsschwellenwert, und ein Optimumcodierer 403 codiert die quantisierten Niveaus. Ein Einsteller 407 stellt die Quantisierungsparameter ein, wenn die Anzahl der verfügbaren Bits nicht genug ist für die codierten Daten, und ein Komperator 408 vergleicht eine vorbeschriebene Anzahl von verfügbaren Bits und die erforderliche Länge der codierten Daten, um zu überprüfen, ob die Anzahl der verfügbaren Bits genug ist oder nicht genug ist für die codierten Daten. Eine Packungseinheit 409 packt die endgültige codierte Sequenz in einer Sequenz, die definiert ist durch ein spezifiziertes Audioprotokoll.
  • Die 4b und 4c zeigen die realisierten Architekturen der 3b bzw. 3c. Unter Bezugnahme auf 4b kommt ein Einsteller 413 zum Einsatz, um die Sperrfrequenz einzustellen, und überträgt diese auf eine Hochfrequenz-Sperreinheit 411 im Fall einer Audiocodierung mit niedriger Bitrate. Der Einsteller 413 kann auch die Quantisierungsschrittgröße einstellen, die zum Einsatz kommt im Quantisierer 102. Die Hochfrequenz-Sperreinheit 411 wird eingefügt zwischen den Abbilder 401 und dem Quantisierer 402 zum Empfang der eingestellten Sperrfrequenz, wobei diese übertragen wird auf den Parameterprediktor 405. Im Fall der Codierung mit variabler Bitrate werden die Elemente, die sich auf die Iteration in der Geschwindigkeitssteuerschleife beziehen einfach entfernt, wie dies in 4c gezeigt ist.
  • Bei der Erfindung wird eine deterministische Formel, die. auf einem konstanten. Maskierungs-zu-Quantisierungsgeräusch-Verhältnis (MNR) p basiert abgeleitet zur Berechnung der Quantisierungsparameter, für. den Parameterprediktor in dem Bit- Zuordnungsverfahren. Sie stellt eine geschlossene Gleichung dar für den Geräuschprediktor für einen nicht-uniformen Quantisierer. Die vorliegende Erfindung nimmt MPEG-Schicht 3 als detaillierte Ableitung und Experimentierbeispiel. Für einen MPEG ACC-Quantisierer ist ein ähnliches Verfahren anwendbar.
  • Die Bit-Zuordnung gemäß der vorliegenden Erfindung erfüllt die An forderungen an Bitrate und Geräuschformung für jedes Subband durch Einschrittvoraussage: Ein Optimumglobalfaktor und ein Maßstabsfaktor für jedes Subband werden evaluiert durch direkten Bezug auf einen Maskierungsschwellenwert. Der Globalfaktor steuert die Gesamtzahl der verbrauchten Bits und der Skalenfaktor steuert das Quantisierungsgeräusch des zugeordneten Bandes relativ zu anderen Bändern. Die nachfolgenden Absätze erläutern die Bit-Zuordnungskriterien und leiten dann in größeren Detail den Geräuschprediktor und die Grenzen an einem Skalenfaktor an unter der Eingrenzung von dem Nullband und negativen Geräusch-zu-Maskierungs-Verhältnis (NMR).
  • Bit-Zuordnungskriterien
  • Zunächst wird das Minimum über den segmentalen NMR betrachtet:
    Figure 00110001
    dabei sind σ2 N(i) und σ2 M(i) die Geräuschenergie und die Maskierungsenergie, die dem kritischen Band i zugeordnet sind. R(i) ist die Bitrate zur Minimierung der segmentalen NMR. In einem R(i) Bits/Proben-PCM-Codierer wird die Quantisationsfehlerabweichung gegeben durch N(i) = ρ2–2R(i)σ2x(i) (2)
  • So wird die Minimierung
    Figure 00120001
    eingegrenzt durch die Gesamtbitrate, d.h.
  • Figure 00120002
  • Entsprechend dem Verfahren von Lagrange-Multiplikatoren muß die Lösung die folgende Gleichung erfüllen:
  • Figure 00120003
  • So sollte R(j) zugeordnet werden, so daß das Geräusch-zu-Maskierungs-Verhältnis proportional ist zu B(j).
  • Das heißt σ2N(j) = κσ2M(j) B(j), für alle j. (6)
  • Das Geräuschniveau sollte zum Maskierungsschwellenwert proportional gehalten werden, multipliziert mit einer Bandbreite, um das beste segmentale NMR zu erhalten.
  • Als zweites wird das Geräuschniveau für die Quantisierungsbänder ausgewählt in Anbetracht des Maskierungsschwellenwertes und der kritischen Bandbreite in einem Quantisierungsband. Mit anderen Worten soll σ2 N(q) und σ2 N(j) das segmentale NMR minimieren. σ2N(q) = κσ2M(q) B(q) (7)wobei q der Index des Quantisierungsbandes ist. Das Problem ist äquivalent zum Herausfinden von B(q), um sich am besten der Energie zu nähern, die definiert ist, um das segmentale NMR zu minimieren; das ist
  • Figure 00130001
  • Dabei geht man davon aus, daß die Maskierungsenergien der kritischen Bänder in den Quantisierungsbändern gleichförmig sind, wobei die Auswahl nach der Berechnung wie folgt ist
  • Figure 00130002
  • Als drittens werden, um zu vermeiden, daß die Bits den Bändern zugeordnet werden mit einem höheren Maskierungsniveau als das Geräuschniveau, die Kriterien zum Minimieren des segmentalen NMR modifiziert, so daß die Bän der mit negativem NMR auf 1 gerundet werden sollten. Das heißt, daß das Quantifizierungsgeräusch für jedes Band eine niedrigere Grenze besitzen sollte. Andererseits führt das Geräusch höher als der Maskierungsschwellenwert zu einem Phänomen dahingehend, daß das zugeordnete Band auf Null gerundet wird, welches man als Nullbänder bezeichnet. Die Nullbänder können ohne weiteres wahrgenommen werden. Somit sollten die Quantisierungsniveaus dahingehend begrenzt werden, daß sie nicht größer sind als die Signalenergie.
  • Zusammenfassend sollte die Bit-Zuordnung mit dem Geräusch parallel zur Multiplikation zwischen dem Maskierungsniveau und der Bandbreite ausgeführt werden, unter den Eingrenzungen vom Nullband und dem negativen NMR.
  • Geräuschprediktor
  • Ein MPEG-Schicht 3-Quantisierer wird als Beispiel genommen für die Ableitung des Geräuschprediktors. Vom MPEG-Schicht 3-Standard ist die vereinfachte Formel für den ungleichförmigen Quantisierer der Schicht 3
    Figure 00140001
    wobei die Quantisierungsschrittgröße ist
  • Figure 00140002
  • Von dem MPEG-Standard kann die Formel des ungleichförmigen Quantisierers auch ausgedrückt werden als
    Figure 00140003
    wobei der Skalenfaktor ist scaleq = 1/2(1 + scalefac_scale)(scalefacq + preflag·pretabq)für jedes Quantisierungsband q; scalefac_scale ist 0 oder 1, scalefacq liegt im Bereich von 0 ≈ 15; und der vorverstärkte Marker ist preflaggr·pretabq; die Gesamtverstärkung ist gaingr = 1/2(global_gaingr~210) für jedes Korn des MPEG-Schicht 3-Rahmens. Durch Vernachlässigung von 0,0946 kann die Gleichung (12) abgeleitet werden als
    Figure 00150001
    wobei die Schrittgröße ist
    Figure 00150002
  • Als nächstes besitzen das Eingangssignal xri und das rekonstruierte Signal xri die folgenden beiden Formeln
  • Figure 00150003
  • Der Quantisierungsfehler des nichtgleichförmigen Quantisierers ei ist gleich der Differenz des Eingangssignals xri und des rekonstruierten Signals xri:
  • Figure 00150004
  • Man geht davon aus, daß
    Figure 00160001
    Durch Tyler-Expansion mit der Näherung erster Größenordnung von f(ε)≈ 1 + f'(ε)ε, führt dies zu
  • Figure 00160002
  • Es soll davon ausgegangen werden, daß die quantisierten Signale εi und der quantisierte Fehler des gleichförmigen Quantisierers εi unabhängig voneinander sind, dabei ist die Erwartung des Quantisierungsfehlers des nichtgleichförmigen Quantisierers εi wie folgt:
  • Figure 00160003
  • Wenn das Spektrum der Quantisierungsbänder gleichförmig ist, kann das Geräusch der Linien die Durchschnittsenergie des Quantisierungsbandes sein, d.h. E(e2i ) = E(e2q ) (16) Da E[εi 2] = 1/12 wird (15)
    Figure 00160004
    substituiert man (7) in (16) ergibt sich E(e2q ) = κσ2M(q) B(q) (18)
  • Schließlich ist, wenn man Tq = σ2 M(q)B(q) definiert, die Differenz zwischen der Gesamtverstärkung und dem Skalenfaktor angenähert,
  • Figure 00170001
  • Da der Skalenfaktor scaleq im Bereich von 0 bis 16 liegt und die minimale Skala für diese Quantisierungsbänder Null sein muß, ist somit die Gesamtverstärkung
    Figure 00170002
    und die Skalenfaktoren für alle Subbänder werden erhalten. Wie ersichtlich ist, variiert die Gesamtverstärkung mit der Bitrate bezogen auf die Konstante κ und der Skalenfaktor variiert für jedes Subband entsprechend dem Maskierungsschwellwert und den Eingangssignalen.
  • Grenzen der Skalenfaktoren
  • Wie zuvor erwähnt wurde, sollten die Bits zugeordnet werden unter nicht-negativem NMR und Beschränkung auf Nullbänder. Für nicht-negatives NMR wird das Geräuschniveau so eingestellt, daß es der Maskierungsschwellenwert ist, d.h. Tq = σ2 M(q) und κ = 1. Dies führt zu der oberen Grenze des Uscaleq relativ zur Gesamtskala.
  • Figure 00170003
  • Das heißt,
  • Figure 00170004
  • Die Verstärkung gaingr wird entsprechend der verfügbaren Bits eingestellt.
  • Die unteren Grenzen können abgeleitet werden unter Beschränkung auf die Nullbänder. Die Nullbänder treten ein, wenn das Geräusch größer ist als die Signalenergie, d.h.
  • Figure 00180001
  • Somit ist die untere Abgrenzung auf der Skala scaleq ≥ Dscaleq = gaingr – ½log2E[|XRq|0.5] (23)
  • Die 5 erläutert die durchschnittliche Iterationszahl bei unterschiedlichem Testmaterial für die vorliegende Erfindung bzw. den MPEG-Bit-Zuordnungsprozeß, wobei Q die Qualitätssteueriterationen sind und R die Geschwindigkeitssteueriterationen. Entsprechend der Darstellung in 5 hat das Zuordnungsverfahren der vorliegenden Erfindung die Iterationen entfernt, die erforderlich sind für die Qualitätssteueriteration, und die Geschwindigkeitssteueriterationen reduziert um einen Faktor von mehr als 3.
  • Die 6 erläutert die objektive Auswertung des Verfahrens der Erfindung, verglichen mit dem Bit-Zuordnungsverfahren in ISO. Hier übernimmt die Erfindung das PEAQ-(wahrnehmbare Auswertung von Audioqualität)-System, welches das System ist, welches empfohlen wird von der ITU-R Task Group 10/4. ISO ist der ursprüngliche Quellencode. ISO1 wird verbessert durch Übernahme des Endzustandes, der in Lame eingesetzt wird. Das Experiment basiert auf dem Stereomodus und dem psychoakustischen Modell 2. Da außerdem der MS-Schalter und das Bit-Reservoir nicht in Beziehung stehen zum Bit-Zuordnungsverfahren wurden die beiden Mechanismen in dem Experiment abgeschaltet. Die objektive Differenzbemessung (ODG) ist die Ausgangsvariable von den objektiven Meßverfahren. Die ODG-Werte sollten idealerweise im Bereich von 0 bis –4 liegen, wobei 0 einer nicht-wahrnehmbaren Beeinträchtigung entspricht und –4 einer Beeinträchtigung, die als sehr störend empfunden wird. Wie die 6 zeigt, ist die Qualität von dem Verfahren der vorliegenden Erfindung besser als bei dem in der Darstellung vorgeschlagene Verfahren.
  • Die Konfiguration, die bei dieser Erfindung für PEAQ übernommen wurde, ist die Basisversion. Die Basisversion setzt das Ohrenmodell auf der FFT-Basis ein. Dieses benutzt die folgenden Modellausgangsvariablen: BandwidthRefB, BandwidthTestB, Total NMRB, WinModDiff1B, ADBB, EHSB, AvgModDiff1B, AvgModDiff2B, RmsNoiseLoudB, MFPDB und RelDistFramesB. Diese elf Modellausgangsvariablen werden abgebildet auf einen Einfachqualitätsindex unter Einsatz eines künstlichen neuralen Netzwerks mit drei Knoten in der verborgenen Schicht.
  • Die 7 stellt eine Liste mit einer Teilmenge von Testsignalen zur Verfügung, die eingesetzt wurden während des objektiven und subjektiven Tests. Indem man die gleichen Iterationsendzustände, die nicht ansteigenden Geräuschskalenfaktorbänder, Anpassung an die Skalenfaktortabelle usw. [website http://www.mp3dev.org/mp3.] einstellt, kann der ISO-Algorithmus verbessert werden durch das in Lame erwähnte Verfahren (welches allgemein bezeichnet wird als der mp3-Codierer mit bester Qualität). Die beiden ineinander verschachtelten Streifen, die übernommen wurden für den Vergleich, basieren auf dem Iterationsalgorithmus der in Lame eingesetzt wird.
  • Zusammenfassend transformiert ein Verfahren einer digitalen Codierung Eingangsaudiosignale in eine Sequenz von Frequenzproben, welche eine Spektralzusammensetzung der Audiosignale repräsentieren, und quantisiert die Sequenz von Frequenzproben in quantisierte Werte entsprechend einem Bit-Zuordnungsverfahren, welches einen Parameterprediktor einsetzt, um die Quantisierungsparameter zu evaluieren durch Bezugnahme auf einen Maskierungsschwellenwert. Die quantisierten Werte werden codiert in einer Anzahl von Bits von codierten Daten. Eine iterative Geschwindigkeitssteuerschleife stellt die Quantisierungsparameter ein wie auch die Quantisierungsschrittgröße, wenn die Anzahl von Bits in den codierten Daten eine vorbestimmte Anzahl von verfügbaren Bits für die codierten Daten überschreitet. Das Verfahren kann auch hohe Frequenzkomponenten der Eingangsaudiosignale sperren, entsprechend einer Sperrfrequenz, die bestimmt wird durch die iterative Geschwindigkeitssteuerschleife vor dem Quantisieren der Sequenz von Frequenzproben.
  • Obwohl die vorliegende Erfindung beschrieben wurde unter Bezugnahme auf die bevorzugten Ausführungsformen leuchtet ein, daß die Erfindung nicht auf die beschriebenen Details beschränkt ist. Verschiedene Substitionen und Modifikationen sind in der vorangehenden Beschreibung vorgeschlagen worden und andere liegen im Bereich der Sachkenntnis für Sachverständige auf diesem Gebiet. Dementsprechend sollen alle Substitutionen und Modifikationen in den Rahmen der Erfindung eingeschlossen sein, wie sie in den folgenden Ansprüchen definiert ist.

Claims (22)

  1. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen mit den folgenden Schritten: (a1) Abbilden von Eingangsaudiosignalen in eine Sequenz von Frequenzproben, die eine spektrale Zusammensetzung der Audiosignale repräsentieren; (a2) Unterteilen der Frequenzproben in Frequenzbänder; (b) Quantisieren der Sequenz von Frequenzproben in quantisierte Werte in Übereinstimmung mit einem Bit-Zuordnungsvorgang, wobei der Bit-Zuordnungsvorgang einen Parameterprediktor einsetzt zur Evaluierung von Quantisierungsparametern unter Bezugnahme auf einen Maskierungsschwellenwert, wobei der Quantisierer ein ungleichförmiger Quantisierer ist und wobei der Zusammenhang von Skalenfaktor und Maskierungsschwelle durch Einsetzen eines analytischhergeleiteten Näherungswertes für das Quantisierungsrauschen des ungleichförmigen Quantisierers bestimmt ist; (c) Codieren der quantisierten Werte unter Einsatz eines Symbolcodierers zur Bildung codierter Daten mit einer Anzahl von Bits und (d) Packen der codierten Daten in eine Sequenz von Daten entsprechend einem spezifizierten Audioprotokoll.
  2. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 1, dadurch gekennzeichnet, dass der Symbolcodierer einen VLC-Codierer umfasst.
  3. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 1, dadurch gekennzeichnet, dass der Parameterprediktor in dem Bit-Zuordnungsvorgang eine deterministische Formel einsetzt, basierend auf einem innerhalb jedes Frequenzbandes kon stanten Maskierungs-zu-Quantisierungsgeräusch-Verhältnis (MNR) zur Berechnung und Einstellung von den Skalenfaktoren der Frequenzbänder.
  4. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 3, dadurch gekennzeichnet, dass der Bit-Zuordnungsvorgang in Schritt (b) darüber hinaus die folgenden Schritte umfasst, Einstellen des Gesamtfaktors entsprechend einer vorbestimmten Zahl von verfügbaren Bits für die codierten Daten und Festlegen einer oberen Grenze und einer unteren Grenze des Bandskalenfaktors entsprechend dem Gesamtfaktor für ein Quantisierungsband.
  5. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 4, dadurch gekennzeichnet, dass die obere Grenze durch ein nicht-negatives Geräusch-zu-Markierungs-Verhältnis eingeschränkt wird.
  6. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 5, dadurch gekennzeichnet, dass die untere Grenze durch Nullbänder begrenzt wird.
  7. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 3, dadurch gekennzeichnet, dass der Bandskalenfaktor für jedes Subband gemäß dem Maskierungsschwellenwert und den Eingangsaudiosignalen variiert.
  8. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 3 dadurch gekennzeichnet, dass der Gesamtfaktor variiert mit einer bitratenbezogenen Konstante.
  9. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 1, dadurch gekennzeichnet, dass vor dem Schritt (b) eine iterative Geschwindigkeitssteuerschleife angeordnet ist, wobei die iterative Geschwindigkeitssteuerschleife die folgenden Schritte umfasst: (c1) Fortsetzen des Schrittes (b), wenn die Anzahl von Bits, die in den codierten Daten enthalten sind, eine vorbestimmte Anzahl von verfügbaren Bits für die codierten Daten nicht überschreitet, ansonsten Fortsetzung des Schrittes (c2); (c2) Einstellen der Quantisierungsparameter und der Quantisierungsschrittgröße, die in Schritt (b) eingesetzt wird, und Rückkehren zum Schritt (b).
  10. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 9 dadurch gekennzeichnet, dass dann, wenn die Anzahl der Bits, die in den codierten Daten enthalten sind, eine vorbestimmte Zahl von verfügbaren Bits für diese codierten Daten überschreitet, mindestens ein entsprechender Gesamtfaktor und ein Bandskalenfaktor eingestellt werden und die Quantisierungsschrittgröße in Schritt (c2) erhöht wird.
  11. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 9 dadurch gekennzeichnet, dass der Symbolcodierer einen VLC-Codierer umfasst.
  12. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 9 dadurch gekennzeichnet, dass der Schritt (b) darüber hinaus einen Schritt des Sperrens hoher Frequenz für eine niedrige Bitrate einer Audiocodierung vor dem Quantisieren der Sequenz von Frequenzproben umfasst.
  13. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 12, dadurch gekennzeichnet, dass der Schritt (c2) der iterativen Geschwindigkeitssteuerschleife darüber hinaus das Einstellen einer Sperrfrequenz für den Schritt der Sperrung hoher Frequenz einschließt.
  14. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 9, dadurch gekennzeichnet, dass der Pa rameterprediktor in dem Bit-Zuordnungsvorgang eine deterministische Formel einsetzt, basierend auf einem konstanten Maskierungs-zu-Quantisierungsgeräusch-Verhältnis (MNR) zur Berechnung und Einstellung von den Skalenfaktoren der Frequenzbänder.
  15. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 14, dadurch gekennzeichnet, dass der Bit-Zuordnungsvorgang im Schritt (b) darüber hinaus die Schritte der Einstellung des Gesamtfaktors gemäß einer vorbestimmten Anzahl von verfügbaren Bits für die codierten Daten umfasst sowie das Einstellen einer oberen Grenze und einer unteren Grenze des Bandskalenfaktors entsprechend dem Gesamtfaktor für ein Quantisierungsband.
  16. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 15, dadurch gekennzeichnet, dass die obere Grenze durch ein nicht-negatives Geräusch-zu-Markierungs-Verhältnis eingeschränkt ist.
  17. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 15, dadurch gekennzeichnet, dass die untere Grenze durch Nullbänder eingeschränkt ist.
  18. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 14, dadurch gekennzeichnet, dass der Bandskalenfaktor für jedes Subband entsprechend dem Maskierungsstellenwert und den Eingangsaudiosignalen variiert.
  19. Verfahren einer digitalen Codierung zur Übertragung und Packung von Audiosignalen gemäß Anspruch 14, dadurch gekennzeichnet, dass der Gesamtfaktor mit einer bitratenbezogenen Konstante variiert.
  20. Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen, gekennzeichnet durch: einen Abbilder zum Transformieren von Eingangsaudiosignalen in eine Sequenz von Frequenzproben, die eine spektrale Zusammensetzung der Audiosignale repräsentieren; einen Unterteiler, welcher die Frequenzproben in Frequenzbänder unterteilt; einen Parameterprediktor, welcher die Quantisierungsparameter quantisiert unter Bezugnahme auf einen Maskierungsschwellenwert; einen Quantisierer, der die Sequenz von Frequenzproben quantisiert in quantisierte Werte in Übereinstimmung mit den Quantisierungsparametern, wobei der Quantisierer ein ungleichförmiger Quantisierer ist und wobei der Zusammenhang von Skalenfaktor und Maskierungsschwelle durch Einsetzen eines analytisch-hergeleiteten Näherungswertes für das Quantisierungsrauschen des ungleichförmigen Quantisierers bestimmt ist; einen variablen Längencodierer, der die quantisierten Werte in codierte Daten quantisiert mit einer Anzahl von Bits und eine Packungseinheit, die die codierten Daten in eine Sequenz von Daten packt, entsprechend einem spezifizierten Audioprotokoll.
  21. Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen gemäß Anspruch 20, darüber hinaus umfassend: einen Komparator zum Vergleichen der Anzahl von Bits in den codierten Daten mit einer vorbestimmten Anzahl von für diese codierten Daten verfügbaren Bits sowie einen Einsteller zum Einstellen der Quantisierungsparameter, wenn diese Anzahl von Bits, die in den codierten Daten enthalten sind, die vorbestimmte Anzahl von für diese codierten Daten verfügbaren Bits überschreitet.
  22. Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen gemäß Anspruch 21, gekennzeichnet durch eine Hochfrequenzsperreinheit, die zwischen dem Abbilder und dem Quantisierer angeschlossen ist, wobei die Hochfrequenzsperreinheit einen Eingang zur Aufnahme einer Sperrfrequenz von dem Einsteller aufweist.
DE10310785A 2002-06-26 2003-03-12 Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen Expired - Fee Related DE10310785B4 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/184,157 2002-06-26
US10/184,157 US20040002859A1 (en) 2002-06-26 2002-06-26 Method and architecture of digital conding for transmitting and packing audio signals
US10/184157 2002-06-26

Publications (2)

Publication Number Publication Date
DE10310785A1 DE10310785A1 (de) 2004-07-29
DE10310785B4 true DE10310785B4 (de) 2007-07-26

Family

ID=29779282

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10310785A Expired - Fee Related DE10310785B4 (de) 2002-06-26 2003-03-12 Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen

Country Status (3)

Country Link
US (1) US20040002859A1 (de)
JP (1) JP2004029761A (de)
DE (1) DE10310785B4 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0110132D0 (en) * 2001-04-25 2001-06-20 Central Research Lab Ltd System to detect compression of audio signals
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US7640157B2 (en) * 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7406412B2 (en) * 2004-04-20 2008-07-29 Dolby Laboratories Licensing Corporation Reduced computational complexity of bit allocation for perceptual coding
KR101315075B1 (ko) * 2005-02-10 2013-10-08 코닌클리케 필립스 일렉트로닉스 엔.브이. 사운드 합성
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
JP5224666B2 (ja) * 2006-09-08 2013-07-03 株式会社東芝 オーディオ符号化装置
JP4396683B2 (ja) * 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size
EP3696812B1 (de) * 2014-05-01 2021-06-09 Nippon Telegraph and Telephone Corporation Kodierer, dekodierer, kodierungsverfahren, dekodierungsverfahren, kodierungsprogramm, dekodierungsprogramm und aufzeichnungsmedium
CN105989836B (zh) * 2015-03-06 2020-12-01 腾讯科技(深圳)有限公司 一种语音采集方法、装置及终端设备
US11416742B2 (en) * 2017-11-24 2022-08-16 Electronics And Telecommunications Research Institute Audio signal encoding method and apparatus and audio signal decoding method and apparatus using psychoacoustic-based weighted error function
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10580424B2 (en) 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10119980C1 (de) * 2001-04-24 2002-11-07 Bosch Gmbh Robert Verfahren zur Codierung von Audiodaten
DE4428193C2 (de) * 1993-10-30 2003-02-06 Samsung Electronics Co Ltd Verfahren zum Kodieren von Tonsignalen

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5924060A (en) * 1986-08-29 1999-07-13 Brandenburg; Karl Heinz Digital coding process for transmission or storage of acoustical signals by transforming of scanning values into spectral coefficients
DE3943879B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
JP2000323993A (ja) * 1999-05-11 2000-11-24 Mitsubishi Electric Corp Mpeg1オーディオレイヤiii復号処理装置およびコンピュータをmpeg1オーディオレイヤiii復号処理装置として機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4428193C2 (de) * 1993-10-30 2003-02-06 Samsung Electronics Co Ltd Verfahren zum Kodieren von Tonsignalen
DE10119980C1 (de) * 2001-04-24 2002-11-07 Bosch Gmbh Robert Verfahren zur Codierung von Audiodaten

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GROSS,A.: MP3 und AAC.:21.06.2002 *
ISO/IEC 11172-3:1993,Kap.C.1.5.3 - C.1.5.4.4.8 *
ISO/IEC 13818-7:1997,April 1998,Kap.B.2.4-12.3.3 *

Also Published As

Publication number Publication date
JP2004029761A (ja) 2004-01-29
US20040002859A1 (en) 2004-01-01
DE10310785A1 (de) 2004-07-29

Similar Documents

Publication Publication Date Title
DE10310785B4 (de) Verfahren und Architektur einer digitalen Codierung zum Übertragen und Packen von Audiosignalen
DE69705642T2 (de) Audio-kodierverfahren mit veränderlicher kodelänge unter verwendung einer mehrzahl von teilband-bitverteilungsmoden
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE69329796T2 (de) Verfahren zur kodierung, dekodierung und kompression von audiodaten
DE69326484T2 (de) Vorrichtung und Verfahren zur Datenkompression
DE69320872T2 (de) Kompression und Dehnung von digitalen Signalen
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
DE69225100T2 (de) Reduzierung der Zusaztinformation bei Teilbandkodierungsverfahren
DE69431622T2 (de) Verfahren und gerät zum kodieren von mit mehreren bits kodiertem digitalem ton durch subtraktion eines adaptiven zittersignals, einfügen von versteckten kanalbits und filtrierung, sowie kodiergerät zur verwendung bei diesem verfahren
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE60222692T2 (de) Vorwärtskopplungsprädiktion von skalierungsfaktoren auf der basis zulässiger verzerrungen für die rauschformung bei der komprimierung auf psychoakustischer basis
DE69428030T2 (de) Digitales signalkodierungsgerät, dazugehöriges dekodiergerät und aufzeichnungsträger
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
DE69219718T2 (de) Digitales Datenkodierungs-und Dekodierungsgerät mit hoher Wirksamkeit
DE69431025T2 (de) Signalkodier- oder -dekodiergerät und Aufzeichnungsmedium
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
EP0954909A1 (de) Verfahren zum codieren eines audiosignals
DE60113602T2 (de) Audiokodierer mit psychoakustischer Bitzuweisung
DE60017825T2 (de) Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
DE69015105T2 (de) Kompressionseinrichtung für transformiertes, digitales Audiosignal mit adaptiver Quantisierung auf Grund eines psycho-akustischen Kriteriums.
DE69510147T2 (de) Perzeptueller Teilbandkodierer

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: ZEITLER, VOLPERT, KANDLBINDER, 80539 MUENCHEN

8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee