DE102006050053A1 - Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung - Google Patents

Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung Download PDF

Info

Publication number
DE102006050053A1
DE102006050053A1 DE102006050053A DE102006050053A DE102006050053A1 DE 102006050053 A1 DE102006050053 A1 DE 102006050053A1 DE 102006050053 A DE102006050053 A DE 102006050053A DE 102006050053 A DE102006050053 A DE 102006050053A DE 102006050053 A1 DE102006050053 A1 DE 102006050053A1
Authority
DE
Germany
Prior art keywords
quantization
prediction
values
signal
cartesian
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102006050053A
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sennheiser Electronic GmbH and Co KG
Original Assignee
Matschkal Bernd Dipl-Ing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matschkal Bernd Dipl-Ing filed Critical Matschkal Bernd Dipl-Ing
Priority to DE102006050053A priority Critical patent/DE102006050053A1/de
Publication of DE102006050053A1 publication Critical patent/DE102006050053A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/04Differential modulation with several bits, e.g. differential pulse code modulation [DPCM]
    • H03M3/042Differential modulation with several bits, e.g. differential pulse code modulation [DPCM] with adaptable step size, e.g. adaptive differential pulse code modulation [ADPCM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Es ist Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur blockweisen Digitalisierung von Audiosignalen vorzusehen. DOLLAR A Verfahren zur blockweisen Digitalisierung von Analogsignalen mit den Schritten: DOLLAR A Transformation der Ananlogsignale von kartesischen Koordinaten in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen. Eine Digitale Repräsentation analoger Wellenformen bietet zahlreiche Vorteile bzgl. effizienter und robuster Übertragung, Signalverarbeitung und Speicherung. Zu diesem Zweck wird das analoge Signal üblicherweise quantisiert und mittels PCM-Encodierung und nachgeschalteter Datenkompression weiterverarbeitet. Je nach Zweck der digitalen Repräsentation existiert ein breites Spektrum an Datenkompressionsverfahren: insbesondere auf der Konsumentenseite werden oftmals spezielle Eigenschaften des (menschlichen) Zuhörers ausgenutzt um eine Irrelevanzreduktion innerhalb des Quallensignals durchzuführen und somit zu einer sehr effizienten Ubertragung oder Speicherung mit einer ausreichenden Qualität des rekonstruierten Signals zu gelangen. Seitens der Erzeugung (z.B. digitales Mikrophon), werden häufig wesentlich stärkere Anforderungen an die digitale Kompression des aufgenommenen Signals gestellt: üblicherweise wird das Signal nachverarbeitet und abgemischt was im Falle einer vorgeschalteten Irrelevanzreduktion einen nichtvorhersagbaren Qualitätsverlust zur Folge haben kann (psychoakustische Maskierungseffekte). Zudem erlauben einige Anwendungen (z.B. die Audioübertragung für Bühnen-Monitoring-Systeme) nur eine Verzögerung von wenigen Abtastperioden. Darüberhinaus können Gewinne, die mittels Ausnutzung von Irrelevanz erzielt wurden nicht im Sinne eines Störabstandes (SNR: Signal-to-Noise Ratio) gemessen werden. Aufwändige Hörtests mit eigens dafür ausgebildeten Personen stellen hierfür die einzige verlässliche Möglichkeit dar.
  • In [1] wird ein wellenformerhaltendes (wir verwenden den Ausdruck „wellenformerhaltend" anstelle des oft gebräuchlichen Begriffs „verlustlos", weil die Digitalisierung eines analogen Signals bei einer endlichen Datenrate prinzipiell nicht „verlustlos" ist.) Verfahren, i.e. sphärisch logarithmische Quantisierung (SLQ) beschrieben, welches einerseits die Gewinne von mehrdimensionaler und logarithmischer Quantisierung vereinigt und andererseits in der Lage ist, weitere SNR-Gewinne mittels linearer Prädiktion auszunutzen. Diese Quantisierung bietet einen vorteilhaften Austausch von Rate und Störung und ist insbesondere durch ihren extrem großen Dynamikbereich sowie ihre sehr geringe strukturbedingte Verzögerung von nur wenigen (typischerweise bis zu 16) Abtastperioden gekennzeichnet. Da diese Methode wellenformerhaltend ist, kann die erzielte Qualität als SNR gemessen werden.
  • Da sphärisch logarithmische Quantisierung D Abtastwerte zu einem Vektor kombiniert um sie anschließend gemeinsam zu quantisieren, ist sie der Familie der Vektorquantisierungsverfahren zuzuordnen. Um zusätzliche Gewinne durch lineare (Rückwärts-)Prädiktion zu erzielen, wird eine Kombination aus sphärisch logarithmischer Quantisierung und differentieller Pulscodemodulation (DPCM) verwendet, ähnlich dem Verfahren „analysis by synthesis", welches von den CELP-Wellenformcodierungsverfahren her bestens bekannt ist (siehe dazu ([2]). Mittels eines sehr einfachen Gradientenabstiegsverfahrens wird eine Suche nach dem Rekonstruktionsvektor mit der geringsten Störung durchgeführt. In [3] wird eine Lösung für die Indexzuordnung der optimalen Quantisierungszelle gezeigt, welche allerdings aufgrund verschachtelter Lookup-Tabellen – je nach Speicheraufwand – einer Beschränkung in Rate und Dimensionalität und damit in der Leistungsfähigkeit unterworfen ist.
  • Hier wird eine sukzessives Quantisierung beschrieben, welche den Gegensatz zwischen DPCM und Vektorquantisierung auf elegante und effektive Weise und bei geringem Rechenaufwand löst. Darüber hinaus wird ein Weg der Indexberechnung für die optimale Quantisierungszelle beschrieben, der nicht auf den Einsatz der verketteten Lookup-Tabellen basiert, aber trotzdem kompatibel zu der Kombination mit DPCM ist.
  • Nachfolgend wird die sphärisch logarithmische Quantisierung näher beschrieben.
  • Die Anwendung der sphärisch logarithmischen Quantisierung auf einen Vektor x := (x1, ..., xD) mit D Abtastwerten führt zunächst eine Transformation in Polarkoordinaten u := (φ, ..., φD-1, r) durch. Die D – 1 Winkel φi wie auch der Radius r sind durch die folgenden Gleichungen festgelegt (j: imaginäre Einheit, arg (.) Argument-Funktion die den Winkel einer komplexen Zahl im Bogenmaß ermittelt): φ1 = arg(xD + jxD-1) ∊[–π, +π] (1)
    Figure 00030001
  • Es gilt zu beachten, dass hier der „zeitlich umgekehrte"' Vektor x für die Transformation in sphärische Koordinaten zu verwenden ist, die Notwendigkeit hierfür wird ab Seite 8, letzter Absatz bis Seite 13, zweiter Absatz näher erläutert.
  • Für die Rekonstruktion der kartesischen Koordinaten des Vektors u ergibt sich xi = r·bD-i·sin(φD-i), i ∊ {1, ..., D – 1} (4) xD = r·b1·cos(φ1) = r·b0 (5)mit den Radien bi der „Breitenkreise" einer Einheitskugel (Radius 1): bD-1 = 1 (6)
    Figure 00040001
  • Um die Eigenschaften einer logarithmischen Quantisierung, d.h. Unabhängigkeit des SNR von der Varianz des Signals und seiner speziellen (Kurzzeit-) Wahrscheinlichkeitsdichtefunktion (WDF) zu erzielen, wird in [1] vorgeschlagen, die gewöhnliche logarithmische Quantisierung gemäß dem A-law für den Radius (Amplitude) einzusetzen. Für die Winkelvariablen φi kommt eine einfache gleichmäßige Quantisierung zur Anwendung – allerdings mit den Quantisierungsintervallen als Funktionen der bereits quantisierten Winkelvariablen höherer Dimensionen φ ^l ∊ {i + 1, i + 2, ..., D – 1}, die für die Rekonstruktion verwendet werden.
  • Die gleichmäßige Quantisierung der Winkel entspricht in etwa der Quantisierung der Oberfläche einer D-dimensionalen Kugel in (D – 1)-dimensionale (Hyper-) Würfel (z.B. gewöhnliche Quadrate für D = 3) solange die Anzahl an Quantisierungszellen sehr groß ist (siehe 1).
  • Diese suboptimale Quantisierung der Kugeloberfläche resultiert in einem Verlust von lediglich
    Figure 00050001
    für D → ∞, was einem Ratenverlust von etwa 1/4 bit/Abtastwert entspricht, welchen wir zugunsten geringer Komplexität hinnehmen.
  • Δr(r) bezeichne die Kantenlänge jeder Quantisierungszelle auf der Oberfläche einer D-dimensionalen Kugel. Da das SNR innerhalb des logarithmischen Bereiches des A-law Quantisierers unabhängig vom Radius r ist, kann der Radius getrennt von der Kugeloberfläche quantisiert werden. Daher kann für die Oberflächenquantisierung ohne Beschränkung der Allgemeinheit r = 1 gewählt werden, entsprechend einer Einheitskugel, deren Oberfläche mit Quantisierungszellen bedeckt ist, siehe 1.
  • R sei die durchschnittliche Anzahl der Bits pro Abtastwert (Rate) und M := 2R die Anzahl der Quantisierungsstufen, die pro Abtastwert zur Verfügung stehen. Die MD Quantisierungsstufen (die pro Quantisierungsschritt zur Verfügung stehen) können in MD Quantisierungsintervalle für den Radius und Mφ Quantisierungsintervalle für die Oberfläche der D-dimensionalen Einheits-(hyper-) Kugel in optimaler Weise aufgeteilt werden. Für die Kantenlänge der Quantisierungszelle erhält man:
    Figure 00050002
    Figure 00060001
  • Hierbei bezeichnet A den üblichen Parameter der logarithmischen Quantisierung gemäß des A-law sowie βD die Oberfläche einer D-dimensionalen Einheitskugel, wobei hier die Gamma-Funktion (Γ(x + 1) = x!, x ∊ IR+) Anwendung findet.
  • Da die Oberfläche unserer Einheitskugel gleichmäßig mit D – 1 -dimensionalen Hyperwürfeln bedeckt ist, von denen jeder einzelne eine Fläche von ΔD-1 (d.h. ein „D – 1-dimensionales Volumen") zur Gesamtoberfläche der Kugel beiträgt, können wir die Anzahl der Quantisierungszellen, die für die Quantisierung der Kugeloberfläche zur Verfügung stehen mit Hilfe von (8) berechnen:
    Figure 00060002
  • [5] befasst sich ebenfalls mit dem Problem der gleichmäßigen Verteilung von Quantisierungszellen auf der Kugeloberfläche, wobei eine passende Kantenlänge ausgehend von einem suboptimalen Startwert iterativ ermittelt wird und keinerlei Aspekte der Radiusquantisierung in die Berechnung mit einfließen.
  • 1 zeigt eine Darstellung der Quantisierungszellen auf der Oberfläche der Einheitskugel. 1 zeigt somit beispielsweise für D = 3 und R = 4 bit/Abtastwert wie die Oberfläche der Einheitskugel von unserem Quantisierer in MD-1 horizontale Schichten unterteilt werden kann, deren jeweilige Rekonstruktionswinkel wir im Folgenden mit φ ^D-1 bezeichnen werden. Abhängig von φ ^D-1 , kann nun jede Schicht wiederum in MD-2 (φ ^D-1 ) Unterschichten aufgeteilt werden, wobei jede Unterschicht zu einem Rekonstruktionswinkel φ ^D-2 gehört. Diese Vorgehensweise kann bis M1 fortgesetzt werden; hier gilt es jedoch zu beachten, dass die Anzahl Mi an Quantisierungsintervallen in der Schicht i abhängig von den in allen höheren Dimensionen i + 1, ..., D – 1 ausgewählten Quantisierungsintervallen (bzw. deren Rekonstruktionswinkeln) ist.
  • Es ist somit Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur blockweisen Digitalisierung von Audiosignalen vorzusehen.
  • Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 gelöst.
  • Die Erfindung betrifft den Gedanken, dass zu Gunsten einer weiteren Erhöhung des SNR mittels Ausnutzung von Korrelationen innerhalb des Quellensignals, kann DPCM mit Rückwärtsprädiktion gemäß 2 verwendet werden. Prädiktionsgewinne können infolge DPCM direkt in SNR-Gewinne überführt werden, sofern DPCM mit Rückwärtsprädiktion mit logarithmischer Quantisierung kombiniert wird. Da SLQ das effizienteste unter den bekannten logarithmischen Quantisierungsverfahren ist, bietet die Kombination von SLQ und DPCM mit Rückwärtsprädiktion ein nahezu optimales logarithmisches Quantisierungsverfahren. Leider kommt hier das gleiche Problem wie für jedes andere Vektorquantisierungsverfahren, welches mit DPCM und Rückwärtsprädiktion kombiniert wird, zum tragen: für die Berechnung des aktuellen Prädiktionsfehlerwertes x[k] müssen alle vorhergehenden rekonstruierten Abtastwerte q ^[k – i], i = 1, 2, ..., zur Verfügung stehen und für einen hohen Prädiktionsgewinn sind die in naher Vergangenheit liegenden Werte (i = 1, i = 2) unverzichtbar. Allerdings scheint diese Forderung mit der gemeinsamen Quantisierung von Blöcken der Länge D im Widerspruch zu stehen.
  • Die Vorteile und Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf die Zeichnung näher erläutert.
  • 1 zeigt eine Darstellung der Quantisierungszellen auf der Oberfläche der Einheitskugel,
  • 2 zeigt ein Blockschaltbild eines DPCM Encoders gemäß einem Ausführungsbeispiel,
  • 3 zeigt eine Darstellung der Drehung der Quantisierungszellen,
  • 4 zeigt eine Darstellung der Berechnung der Oberfläche einer Schicht mittels Subtraktion zweier Teiloberflächen,
  • 5 zeigt eine Darstellung der Aufsummierung der Anzahl der Zellen in jeder Schicht,
  • 6 zeigt eine graphische Darstellung der Abhängigkeit des Signalrauschverhältnisses zu einer sphärisch-logarithmischen Quantisierung in Kombination mit DPCM,
  • 7 zeigt eine Darstellung eines segmentellen Signalpegels,
  • 8 zeigt ein Blockdiagramm einer vektoriellen Vorwärtsprädikation,
  • 9 zeigt eine Darstellung der Wahl der Winkelstufe, und
  • 10 zeigt einen Graphen mit der Abhängigkeit des Signalrauschverhältnisses zu der Suche des letzten Winkels in den Nachbarzellen.
  • Im Folgenden wird ein Verfahren für eine sukzessive sphärisch logarithmische Quantisierung beschrieben, die lineare Prädiktion des ursprünglichen Signalvektors q := (q1, ..., qD) beinhaltet. Zunächst ist es erforderlich, die Signalamplitude des in den sphärischen Bereich zu transformierenden Vektors x, d.h. den Radius r gemäß (3), abzuschätzen. Dies geschieht mittels Vorwärtsprädiktion für die aktuellen D Abtastwerte; d.h. durch Deaktivierung der Kette „Sphärische Quantisierung" und „Kartesische Rekonstruktion" in 2 bzw. dem Einspeisen von q[k], k = l·D, l·D + 1, ..., l·D + D – 1 in das Prädiktorfilter anstelle von q ^[k].
  • Der Vektor q := (q1, ..., qi, ...qD) wird nun gemäß 2 Abtastwert für Abtastwert quantisiert, beginnend mit i = 1. Der Abtastwert xi wird in den sphärischen Quantisierer eingespeist, welcher zunächst den entsprechenden unquantisierten Winkel φD-1 unter Anwendung von (4) liefert:
    Figure 00090001
  • Unter der Annahme, dass die Anzahl der für die Quantisierung dieses Winkels zur Verfügung stehenden Quantisierungsintervalle bekannt ist (wir werden diesen Punkt zwecks besserer Lesbarkeit detailliert unten diskutieren), wird die Einheitskugel in MD-i Schichten unterteilt (siehe 1). Nun wird diejenige Schicht, die den unquantisierten Winkel
    Figure 00090002
    enthält, ausgewählt und mit dem Index νD-i bezeichnet; νD-i = 0 entspricht der untersten und νD-i = MD-i – 1 der obersten Schicht:
    Figure 00090003
    mit [x] ∊
    Figure 00090004
    : größte ganze Zahl ≤ x mit x ∊
    Figure 00090005
    .
  • Der entsprechende Rekonstruktionswinkel (welcher auf die Mitte der ausgewählten Schicht zeigt), ergibt sich somit zu
    Figure 00100001
  • Wir verwenden nun den quantisierten Radius bD-i des „Breitenkreises" der ausgewählten Schicht, um die i-te kartesische Komponente von y zu rekonstruieren yi = r·b ^D-i·sin(φ ^D-i), i ∊ {1, ..., D – 2} (15)welche daraufhin gemäß 2 weiterverarbeitet wird. Die Erhöhung von i um 1 führt zu dem nächsten Abtastwert von x, bzw. xi.
  • Es gilt zu beachten, dass die unquantisierten „Breitenkreisradien" bD-i durch die Gln. (6) und (7) beschrieben sind, wobei die entsprechenden quantisierten Radien mittels b ^D-1 = 1 (16)
    Figure 00100002
    berechnet werden können.
  • An dieser Stelle ist zu betonen, dass die Gewinne infolge linearer Prädiktion nur erzielt werden können, wenn die Quantisierung die chronologisch korrekte Reihenfolge der ursprünglichen Abtastwerte beibehält. Daher verwendet unsere schrittweise Quantisierung den zeitlich umgedrehten Signalvektor von x für die Transformation in sphärische Koordinaten, siehe Gln. (1) bis (3). Mit der passenden Rekonstruktion der kartesichen Komponenten, siehe Gln. (4) bis (5), beginnend bei dem „letzten" Winkel φD-1, wird somit unmittelbar der erste quantisierte Abtastwert y1, usw. erhalten!
  • Diese Vorgehensweise ist durchzuführen, solange i ≤ D – 2 gilt, da die letzte Schicht (d.h. i = D – 1) einem zur (xD, xD-1)-Ebene parallelen Kreis entspricht. In diesem Fall hängen sowohl yD-1 als auch yD vom gleichen Winkel φ ^D-1 ab. Dies ist nicht kompatibel mit unserer sukzessiven Quantisierungs- und Prädiktionsvorgehensweise gemäß 2, da wir hier zuerst die quantisierte Komponente yD-1 benötigen, um anschließend den prädizierten Abtastwert xD ermitteln zu können, welcher wiederum zu der quantisierten Komponente yD führt.
  • Um nun yD-1 unabhängig von yD quantisieren zu können, müssen wir die Anordnung der Quantisierungszellen innerhalb der (xD, xD-1)-Ebene um π / 2 im Gegenuhrzeigersinn drehen, sodass eine bzgl. der xD-1-Achse symmetrische Quantisierung von φ1 erzielt wird, siehe 3.
  • Wir müssen also schreiben
  • Figure 00110001
  • An dieser Stelle müssen wir die Notation φ ~1 und φ ~1 anstelle von φ1 und φ ^1 verwenden, da wir zum aktuellen Zeitpunkt noch eine Zweideutigkeit des Winkels (φ1 = φ ~1 , oder φ1 = π – φ ~1 ) vorliegen haben, die vom Vorzeichen von xD abhängt.
  • Wir werden diese Zweideutigkeit an späterer Stelle beseitigen.
  • In jedem Fall lautet die nächste kartesische Komponente von y
    Figure 00120001
    die nun für die nachfolgende Verarbeitung durch das Prädiktorfilter gemäß 2 zur Verfügung steht. Die Prädiktorfilterung liefert xD, dessen Vorzeichen nun darüber entscheidet, ob die Winkel φ ~1 bzw.
    Figure 00120002
    noch korrigiert werden müssen, oder nicht:
    Figure 00120003
  • Um diesen Sachverhalt zu veranschaulichen, wird zunächst angenommen, dass die Gln. (18) und (19) zu einem quantisierten Winkel
    Figure 00120004
    führen, wie er in 3 dargestellt ist. In diesem Fall sind die mit „0" und „4" bezeichneten Rekonstruktionswinkel mögliche Kandidaten, da sie beide die gleiche Komponente xD-1 besitzen. Sobald das Vorzeichen von xD bekannt ist, kann eine eindeutige Entscheidung hierüber getroffen werden.
  • Die letzte kartesische Komponente von y lautet nun yD = r·b ^1·cos(φ ^1), (23)und die auf der letzten Schicht ausgewählte Quantisierungszelle kann nun mit einem Index
    Figure 00120005
    beschrieben werden.
  • Wie bereits erwähnt, benötigt das oben vorgestellte Verfahren die exakte Amplitude des Signalvektors x hinter der Rückwärtsprädiktion (d.h. den Radius r am Eingang der „Sphärischen Quantisierung", siehe 2. Da die eingangs durchgeführte Abschätzung mittels Vorwärtsprädiktion nicht ausreichend exakt ist, muss der vorgestellte Algorithmus für einige (etwa 10 bis 20) diskrete Radiuswerte r ~ ∊ [r – Δ, r + Δ]. Ziel ist es, einen Wert r ~ zu finden, für welchen die Metrik
    Figure 00130001
    minimiert wird. Da diese Suche nicht notwendigerweise eine iterative Vorgehensweise voraussetzt, kann sie in einer Hardware-Implementierung sehr einfach parallelisiert werden.
  • Nachfolgend wird sowohl die Zuordnung eines Index N ∊ {0, 1, ..., MD – 1} zu der zu übertragenden Quantisierungszelle als auch die empfangsseitige Rekonstruktion diskutiert. Da die Zuordnung eines Index ND ∊ {0, 1, ..., MD – 1} zum Radius unabhängig vom Index Nφ ∊ {0, 1, ..., Mφ – 1} der gewählten Quantisierungszelle auf der Einheitskugel ist, können wir uns auf das Problem der Indexzuordnung zu den Zellen auf der Einheitskugel konzentrieren. Selbstverständlich muss
    Figure 00130002
    gefordert werden.
  • Eine übliche Vorgehensweise der Vektorquantisierung ist es, alle Codebuchvektoren (Rekonstruktionsvektoren) sequentiell zu nummerieren und im Speicher eines Rechnersystems zu halten. Nach Auswahl eines geeigneten Codebuchvektors (Rekonstruktionsvektors) wird die zugehörige Nummer übertragen. Da die Leistungsfähigkeit von SLQ besonders bei höheren Dimensionalitäten D zum Tragen kommt (z.B. D = 16), resultiert hier insbesondere bei größeren Raten (z.B. R > 3 bit/Abtastwert) eine sehr große Anzahl Mφ an Quantisierungszellen auf der Kugeloberfläche. Die Vorgehensweise der Speicherung aller möglichen Quantisierungszellen gerät hier sehr bald an die Grenzen der relevanten Rechnersysteme (verfügbares RAM, Random Access Memory).
  • Anstelle sämtliche Rekonstruktionsvektoren in einem Speicher zu halten, wird ein sukzessives Verfahren verwendet, dass mittels analytischer Flächenberechnungen von Kugel-(teil-)oberflächen den zu übertragenden Quantisierungszellenindex ermittelt.
  • Hierzu wird die Oberfläche der D-dimensionalen Einheitskugel sukzessive in
    Figure 00140001
    Schichten (beginnend bei Stufe 1, d.h. i = 1) aufgeteilt und entsprechend den Indizes νD-i = 0, ..., MD-i – 1 vom unteren Pol bis zum oberen Pol der Kugel fortlaufend nummeriert. Jede Schicht beinhaltet einen Rekonstruktionswinkel, siehe (14), welchen wir mit
    Figure 00140002
    bezeichnen und der die Anzahl
    Figure 00140003
    an Quantisierungszellen (d.h. D – i-dimensionale Hyperwürfel) beinhaltet. Um zu einer gleichmäßigen Verteilung der Quantisierungszellen auf der Kugeloberfläche zu gelangen, ist
    Figure 00140004
    proportional zu der quantisierten Oberfläche der jeweiligen Schicht zu wählen.
  • 4 zeigt eine Darstellung der Berechnung der Oberfläche einer Schicht mittels Subtraktion zweier Teiloberflächen. Die Oberfläche einer Schicht νD-i wird mittels Subtraktion zweier Teiloberflächen, bezeichnet mit S+ und S, berechnet.
  • Um zu einer eindeutigen Indexrepräsentation trotz Rundungseffekten zu gelangen, werden die beiden zu subtrahierenden Oberflächen auf ein ganzzahliges Vielfaches der Fläche einer Quantisierungszelle (d.h. der Oberfläche unseres D – i-dimensionalen Hyperwürfels) quantisiert.
  • Es sei SD-i+1D-i) die Teiloberfläche gemäß 4 einer D – i + 1-dimensionalen Einheitskugel zwischen dem unteren Pol der Kugel (d.h. φD-i = – π / 2) und dem Winkel φD-i:
    Figure 00150001
    mit dem Oberflächenelement ρ = cosD-i-1D-i)·cosD-i-2D-i-1)·...·cos(φ2). (29)
  • Mit dem Radius b ~D-i der Kugel und einer Quantisierungszellenfläche von ΔD-i können wir nun die Anzahl
    Figure 00150002
    an Quantisierungszellen berechnen, die für die Verteilung pro Schicht zur Verfügung stehen
    Figure 00160001
  • In einem ersten Schritt des Encodierungsprozesses, müssen wir den Radius b ~D-1 = 1. (31)verwenden. Sobald φD-i durch die Anwendung von (14) im Zuge des Encodierungsprozesses quantisiert wurde, können wir νD-i entsprechend der gewählten Schicht (bzw. dem Rekonstruktionswinkel φ ^D-i ) festhalten.
  • Der Radius b ~D-i-1 , der nun für den nächsten Schritt bei der Encodierung verwendet werden muss, kann nun als der Radius einer D – i-dimensionalen Kugel interpretiert werden, welche die gleiche (quantisierte) Oberfläche besitzt, als die ausgewählte Schicht unserer D – i + 1 -dimensionalen Kugel dividiert durch Δ:
    Figure 00160002
    und damit
    Figure 00160003
  • Dies kann sehr einfach durch die Tatsache verdeutlicht werden, dass ein senkrechter Schnitt durch eine D – i-dimensionale Kugel mit einer D – i – 1-dimensionalen Kugel identisch ist. Schneidet man also z.B. durch eine 3-dimensionale Kugel, so erhält man einen Kreis.
  • Nun führen wir den nächsten Schritt durch, d.h. wir erhöhen i um 1 und, solange i ≤ D – 2 gilt, setzen wir die Aufteilung der aktuellen Schicht in MD-i Unterschichten in rekursiver Weise gemäß (27) fort.
  • Bei i = D – 1 haben wir die letzte Schicht erreicht, sie besteht aus
    Figure 00170001
    Quantisierungszellen.
  • Der Index Nφ, welcher die auf der Oberfläche der Einheitskugel ausgewählte Zelle bezeichnet, kann nun einfach durch eine Aufsummierung der Quantisierungszellen berechnet werden, die in den D – 1 Schichten bzw. Unterschichten zwischen dem unteren Pol und der jeweils ausgewählten Schicht νD-i einer jeden „Unterkugel" verteilt wurden, siehe 5.
  • Figure 00170002
  • Der Zellenindex Nφ für die Oberflächenzelle der Kugel wird nun mit dem Index ND der (skalaren) Radiusquantisierung zu einem Gesamtindex kombiniert N = Nφ·MD + ND, (36) und anschließend übertragen.
  • Die Auflösung des übertragenen Index N in Nφ und ND kann in sehr einfacher Weise mittels einer Modulo-Operation durchgeführt werden ND = NmodMD (37)
    Figure 00180001
    wobei der modulo-Operator mod x, x ∊ IN eine ganze Zahl in das Intervall [0, ..., x – 1] abbildet.
  • Die Wiedergewinnung von νD-i,i ∊ {1, ..., D – 1} erfordert nun einige Berechnungen, ähnlich wie bei der Encodierung: der Decoder verarbeitet sukzessive die Stufen für i = 1, ..., D – 1 und liefert in jeder Stufe einen „verbleibenden Oberflächenindex" ND-i, beginnend mit N ~d-1 := Nφ. (39)
  • In der ersten Stufe des Decodierprozesses (d.h. i = 1), werden die
    Figure 00180002
    für alle möglichen Rekonstruktionswinkel der gegenwärtig aktuellen Schicht mittels (30) berechnet. Der rekonstruierte Index kann nun durch die Erfüllung der folgenden Gleichung eindeutig festgelegt werden:
    Figure 00180003
  • Nun wird der zugehörigen Rekonstruktionswinkel φ ^D-i unter Verwendung von (27) und (14) berechnet. Der für die nächste Stufe der Decodierung verbleibenden Index ergibt sich somit zu
    Figure 00190001
  • Nun wird i um 1 erhöht und solange i ≤ D – 2 gilt, fahren wir in gleicher Weise fort, indem wir mit (40) den aktuellen Wert νD-i ermitteln.
  • Sind wir bei i = D – 1 angelangt, so verbleibt ν1 = N ~1 (42)
    Figure 00190002
  • Die Rekonstruktion der kartesischen Komponenten des Signals aus den Rekonstruktionswinkeln erfolgt nun mittels (4) und (5).
  • Die Simulation von gemeinsamer sphärisch logarithmischer Quantisierung und DPCM wurde für die Ouvertüre und die Arie „Der Vogelfänger bin ich ja" der Oper „Zauberflöte" von Wolfgang Amadeus Mozart (siehe [4]) durchgeführt. Die Arie „Vogelfänger" ist mit einem mittleren Signalpegel von –32,15 dB aufgenommen und bietet ein herausforderndes Beispiel für Audiocodierungsverfahren aufgrund ihrer Signaldynamik sowie ihrer Klangfarben (Vorspiel, Gesang, Rohrflöte). Der mittlere Signalpegel der Ouvertüre beträgt –27,20 dB, sie ist durch einen großen Dynamikbereich charakterisiert, der von unterhalb –70 dB bis hinauf zu –17 dB reicht, siehe auch 7.
  • Zuerst wurde das Signal encodiert, dann wieder decodiert und anschließend wurde das SNR durch Vergleich mit dem originalen CD-Signal ermittelt. 6 zeigt Simulationsergebnisse für R = 3 bit/Abtastwert, A = 102726 sowie verschiedenen Dimensionszahlen D. Der Störabstand ist hier jeweils über das gesamte Musikstück gemittelt. Durch den Einsatz eines universellen Prädiktorfilters mit geringer Prädiktorordnung (P = 2), können diese Simulationsergebnisse als repräsentativ für eine Vielzahl von Audiosignalen betrachtet werden. Das SNR erhöht sich mit D und nähert sich der Rate-Distortion-Schranke bei D = 16 auf 3.34 dB für gaußsche Zufallsvariablen (d.h. unabhängig vom Prädiktionsgewinn) – das theoretische Maximum (D → ∞) liegt 1.53 dB unter der Rate-Distortion-Schranke.
  • In 7 ist der segmentelle Signalpegel sowie das segmentelle SNR für das Beispiel der Ouvertüre dargestellt; jedes Segment besteht aus 6000 Abtastwerten, dies entspricht 0.136 s bei einer Abtastrate von 44.1 kHz. Hierbei wurde sphärisch logarithmische Quantisierung in D = 16 Dimensionen bei A = 102726 und dem selben universellen Prädiktor der Ordnung 2 wie im ersten Beispiel eingesetzt.
  • Die obere Kurve zeigt den großen Dynamikbereich der Ouvertüre: insbesondere zu Beginn und in der Mitte dieses populären Musikstücks können die bekannten lauten Töne, unterbrochen von Generalpausen über mehrere Takte hinweg, beobachtet werden. Es gilt hier zu beachten, dass trotz der niedrigen Rate von R = 3 bit/Abtastwert ein 10 log10 (SNR) > 30 dB (bzgl. der Original-CD) selbst in den Generalpausen aufrechterhalten wird.
  • Die vorliegende Erfindung stellt eine Weiterentwicklung der in [1] und [3] beschriebenen Quantisierung dar. Die entscheidenden Verbesserungen betreffen die sukkzessive Quantisierung der einzelnen Dimensionen durch die bei Reduzierung der erforderlichen Rechenzeit und des erforderlichen Speichers eine Quantisierung bei wesentlich höheren Dimensionszahlen ermöglicht wird. Ein Punkt der vorliegenden Erfindung ist die Kombination der sphärisch logarithmischen Quantisierung mit DPCM.
  • [5] beschreibt ein Quantisierungsverfahren das Teilaspekte aus [1] aufgreift, wie beispielsweise das Ziel einer gleichmäßigen Verteilung von Quantisierungszellen auf der Oberfläche einer Einheitskugel. Da das dort vorgestellte Verfahren sich auf die Quantisierung der Oberfläche konzentriert, findet keinerlei Austausch der zur Verfügung stehenden Quantisierungsstufen zwischen Radius- und Oberflächenquantisierung statt. Das in [1] vorgestellte Verfahren beschreibt, wie dieser Austausch in optimaler Weise durchzuführen ist bzw. wie die Kantenlänge der Quantisierungszelle im Sinne eines optimalen Austausches zu wählen ist. Die Ermittlung der für die Einteilung der Kugeloberfläche in Quantisierungszellen erforderlichen Kantenlänge erfolgt in [5] auf iterative Weise, ausgehend von einem suboptimalen Startwert. Darüberhinaus beschränkt sich das in [5] dargestellte Verfahren auf gauß'sche Quellen – auf eine Ausnutzung von Korrelationen innerhalb des Quellensignals (beispielsweise durch Prädiktion) wird nicht eingegangen.
  • Die vorliegende Erfindung beschreibt hingegen ein neuartiges Verfahren der Codierung des Zellenindex mittels analytischer Berechnung von (Teil-) Oberflächen der Kugel. Sie ermöglicht eine vollständige Ausnutzung der zur Verfügung stehenden Quantisierungszellenanzahl trotz unvermeidbarer Rundungseffekte, da die bei höheren Schichten nicht nutzbaren Quantisierungszellen (bzw. die nicht nutzbare Quantisierungszellenfläche) in später bearbeiteten Dimensionen für die Codierung verwendet werden können.
  • Da es sich bei der SLQ um ein Vektorquantisierungsverfahren handelt, soll im Folgenden eine vektorielle Betrachtung des gesamten Verfahrens erfolgen.
  • Zunächst soll die Vorwärtsprädiktion für einen zu verarbeitenden Block von Signalwerten {q1, ..., qD} untersucht werden. Sofern keine Quantisierung involviert ist, so kann dies als lineares Gleichungssystem aufgefasst werden: x1 = q1·a1 + w1 x2 = q2·a1 + q1·a2 + w2 x3 = q3·a1 + q2·a2 + q1·a3 + w3 xi = qi·a1 + qi-1·a2 + ... + q1·ai + wi wobei xi die Werte des Prädiktionsfehlers, ai die Koeffizienten des Prädiktionsfehlerfilters bezeichnet, F(z) = 1 – H(z)z–1 gilt sowie wi die Filterzustände beschreibt. Da lineare Systeme durch Matrizen und Zustandsvektoren dargestellt werden können, werden diese Gleichungen nun vektoriell umschrieben: x = Fq + w. (44)
  • Nachdem aber die verwendete Quantisierung hochgradig nichtlinear ist, können lineare Gleichungen nur eingeschränkt zur Darstellung des gesamten Systems verwendet werden. Beispielsweise lässt sich aber der vorwärtsprädizierte Radius rνp aus obiger Gleichung sehr einfach ermitteln, da hierfür bekanntlich keinerlei Quantisierung zu berücksichtigen ist. rνp = ||x|| (45)
  • Betrachtet man nun die Empfängerseite, an der ebenfalls quantisierte Werte y auftreten, so ergibt sich durch die Umkehrung des beschriebenen Vorgangs die Gleichung q ^ = F–1(y – w). (46)
  • Da die Filterkoeffizienten sowohl am Sender als auch am Empfänger bekannt sind, können diese mit dem Quellvektor q zu einem Vektor ν zusammengefügt werden. ν = q + F–1w. (47)
  • Nun kann (46) mit den quantisierten Vektoren kompakt dargestellt werden: ν ^ = F–1y. (48)
  • Die Quantisierungsgeräuschleistung entspricht nun der quadratischen Abweichung des Vektors ν ^ vom unquantisierten Vektor ν, sodass das Problem der Suche nach einer geeigneten Quantisierungszelle, jetzt vektoriell durch eine Minimierung dieses quadratischen Fehlers E(.) umschrieben werden kann: E(ν ^) =||(ν ^ – ν)||2 = (ν ^ – ν ^)T(ν ^ – ν). (49)
  • Unter Verwendung von (48) erhält man E(Y) = ||(ν ^ – ν)||2 = yT(F–1)TF–1y – yT(F–1)Tν – νTF–1y + ||ν||2. (50)
  • Die Anwendung des Gradienten
    Figure 00230001
    liefert die Richtungableitung des Fehlers für einen gegebenen Vektor y. ∇E(y) = 2(F–1)TF–1y – 2(F–1)Tν (52)
  • Dieser Gradient kann nun als Ausgangspunkt für weitere Ansätze wie beispielsweise ein Gradientenabstiegsverfahren genutzt werden.
  • Möglich ist z.B. die iterative Bestimmung eines lokalen Fehlerminimums auf der Hypersphäre, das dann zur Quantisierung der Winkel dient, wodurch der Rechenaufwand mittels paralleler Radiussuche entfällt.
  • Eine weitere Möglichkeit ist eine Kombination mit der vorgestellten, schrittweisen Berechnung, in welcher der Gradient als Auswahlkriterium für einen möglicherweise günstigeren Winkelindex im i-ten Schritt dient. Hierzu erweist sich die Verwendung eines polaren Gradienten, der die Richtungsableitung nach den Winkeln anstelle der kartesischen Koordinaten beschreibt, als sehr vorteilhaft.
  • Hinsichtlich der Fehlerminimierung können auch andere Ansätze wie die Lagrange'sche Optimierung zum Einsatz kommen. Eine Einschränkung, die hierbei verwendet werden kann, ist die Beschränkung auf die Oberfläche der Hypersphäre mit quantisiertem Radius, gegeben durch ||y||2 = yT y = r ^2(53)
  • Des Weiteren kann durch diese vektoriellen Beschreibung das Koordinatensystem beliebig gedreht werden. Da eine Drehung den Betrag beibehält und dadurch leistungsinvariant bzgl. des Signals und des Quantisierungsfehlers ist, kann z.B. die Matrix F–1 durch QR-Zerlegung in eine obere Dreiecks-Matrix umgeformt werden. Eine beidseitige Multiplikation durch die Dreh-Matrix Q–1 = QT ist zulässig, da der Fehler in ν ^ betragsmäßig nicht verändert wird. ν ^ = F–1y = QRy (54) ν ^Q–1 = Ry (55)
  • Auf diese Art und Weise können wir jetzt durch die Matrix R = Q–1 F–1 von zukünftigen Werten auf vergangene Werte prädizieren, müssen dementsprechend aber für eine schrittweise Berechnung wieder unser polares Koordinatensystem umstellen.
  • In die Suche nach einer geeigneten Zelle kann noch ein weiterer Mechanismus eingebracht werden, um eine zusätzliche Verbesserung des Störabstandes zu erzielen:
    Eine Korrektur des letzten Winkels in Abhängigkeit von der letzten kartesischen Koordinate xD. Diese wird bereits mit dem letzten Winkel φD-1, festgelegt, welcher wiederum aus der vorletzten kartesischen Koordinate xD_1 ermittelt wurde. Im unquantisierten Fall stellt dies kein Problem dar: ist der verwendete Radius optimal, so kann die letzte Koordinate auch aus
    Figure 00250001
    bestimmt werden, wobei ihr Vorzeichen abhängig vom Quadranten des letzten Winkels ist. Dies ist äquivalent zur Aussage, dass der Punkt (xD-1, xD) auf dem letzten Breitenkreis mit Radius b1 liegt. Bei einer Rückwärtsprädiktion ist allerdings davon auszugehen, dass das verwendete Koordinatensystem fehlerbehaftet ist, und somit der Wert nicht korrekt berechnet werden kann. Eine Ursache hierfür stellt bereits die Verwendung von abweichenden, quantisierten Werten dar. Demnach werden die letzten beiden rekonstruierten Werte nicht notwendigerweise auf einem gemeinsamen Kreis liegen, wie es eigentlich durch die Winkelbeziehung von Sinus und Cosinus gefordert wird. Der durch xD-1 berechnete Winkel wird somit nur ungefähr die richtige Richtung angeben.
  • Abhilfe schafft hier eine Suche im letzten Winkel, die aus der Umgebung des durch xD-1 berechneten Winkels diejenige Zelle mit dem kleinsten Fehler auswählt, siehe 9. Der Rechenaufwand dieser Winkelkorrektur ist durch die Anzahl δν der zu durchsuchenden Nachbarzellen skalierbar.
  • Geht man davon aus, dass jeder Berechnungsschritt in der i-ten Dimension ungefähr gleich aufwendig ist und der Aufwand durch eine Suche im letzten Winkel linear mit der Anzahl der Nachbarzellen steigt, so fällt eine Suche im letzten Winkel besonders für große D nicht sonderlich ins Gewicht, verbessert aber durch den erzielten SNR-Gewinn die Leistungsfähigkeit des Systems. Wie aus 10 erkennbar ist, kann durch eine Suche im Abstand von mehr als der doppelten Quantisierungszellenkantenlänge der Störabstand nicht wesentlich gesteigert werden. Daher ist die Wahl einer Reichweite von zwei Nachbarzellen ausreichend.
  • Sphärisch Logarithmische Quantisierung ist ein Vektorquantisierungsverfahren zur effizienten Digitalisierung analoger Signale mit einem hohen Dynamikbereich sowie einem hohen Störabstand unter bestmöglicher Beibehaltung der ursprünglichen Wellenform. Kurze Vektoren mit Abtastwerten werden in sphärischen Koordinaten repräsentiert, während die Ausnutzung von Korrelationen innerhalb des Quellensignals mittels differentieller Pulscodemodulation (DPCM) erfolgt. Diese Erfindung beinhaltet eine Lösung für das Problem, dieses Vektorquantisierungsverfahren mit DPCM zu kombinieren. Eine schrittweise sphärische Quantisierung erlaubt eine extreme Reduktion des Rechenaufwandes im Vergleich zu bekannten Verfahren. Darüberhinaus wird ein neues Verfahren für eine optimale Indizierung der Quantisierungszellen, welche die Oberfläche einer mehrdimensionalen Kugel bedecken, vorgestellt – sowohl seitens des Encoders, als auch seitens des Decoders.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei die Signalwerte für die Transformation in sphärische Koordinaten so angeordnet werden, dass für die Bestimmung der quantisierten Werte durch Quantisierung von Winkeln und Betrag (sphärische Quantisierung) nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei für den Betrag des in Kugelkoordinaten quantisierten Blocks von Signalwerten eine Schätzung durch Vorwärtsprädik tion vorgenommen wird und die Rückwärtsprädiktion für mehrere unterschiedliche Beträge in der Nähe dieses Schätzwertes parallel ausgeführt wird.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei der ermittelten Quantisierungszelle ein Quantisierungsindex zugeordnet wird als Teilfläche auf der Einheitskugel vom unteren Pol (Südpol, d.h. alle Elevationswinkel sind –90 Grad) bis zur aktuellen Quantisierungszelle im Verhältnis zur gesamten Oberfläche und multipliziert mit der Gesamtzahl der Zellen.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Ferner werden die Abgrenzungen der einzelnen Quantisierungszellen durch Drehung der Ebenen des Koordinatensystems angeordnet, dass für die Quantisierung des aktuellen Wertes nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Ferner wird der Azimuthwinkel derart quantisiert, dass die geringstmögliche Fehlerleistung in den von ihm abhängenden Rekonstruktionswerten erzielt wird, dass die Quantisierung des Azimuthwinkels hinsichtlich dem Erreichen der geringsten möglichen Fehlerleistung der letzten beiden Werte eines jeden Blockes durchgeführt wird.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Die Auswahl der zu verwendenden Quantisierungszelle mittels eines Gradientenabstiegsverfahrens bzgl. der Fehlerleistung wird unter Verwendung der vergangenen und dem aktuellen Eingangswert durchgeführt.
  • Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), infolge Quantisierunseffekte freibleibende Indexzahlen werden durch entsprechend feinere Quantisierung beim nachfolgenden Winkel weiterverwertet, sodass keine Indexzahlen ungenutzt verbleiben.
  • LITERATUR ZUM STAND DER TECHNIK
    • [1] J. B. Huber, B. Matschkal. Spherical logarithmic Quantization and its Application for DPCM 5th International ITG Conference on Source and Channel Coding (SCC), pp. 349-356, Erlangen, Germany, January 2004.
    • [2] N. S. Jayant, P. Noll. Digital Coding of Waveforms. Prentice-Hall, Englewood Cliffs, New Jersey, 1984.
    • [3] Johannes B. Huber, Bernd Matschkal. Spherical Logarithmic Quantization and its Application for DPCM Facta Universitatis (Nis), Series: Electronics and Energetics, Vol. 17, No. 2, pp. 165-184, August 2004.
    • [4] Philips Classics Productions 1994 (DDD): Mozart: "Die Zauberflöte". Polygram Records #442569-2, Tracks 1 and 3.
    • [5] Z. Utkovski, A. Utkovski, T. Eriksson. High-Dimensional Spherical Quantization of Gaussian Sources 9th Canadian Workshop on Information Theory (CWIT), pp. 211-214, Montreal, Quebec, June 2005.
  • Weiterer Stand der Technik:
    • K. Tröndle, R. Weiß. Einführung in die Pulscodemodulation. Oldenbourg Verlag, Munich, 1974.
    • T. Berger. Lossy Source Coding. IEEE Transactions on Information Theory, pp. 2693-2723, Oct. 1998.
    • R. M. Gray, David L. Neuhoff Quantization. IEEE Transactions on Information Theory}, pp. 2325-2383, Oct. 1998.
    • J. H. Conway and N. J. A. Sloane. Sphere Packings, Lattices, and Groups. Springer-Verlag, 3rd edition.
    • Robert F. H. Fischer. Precoding and Signal Shaping for Digital Transmission, pp. 258-281, John Wiley & Sons, Inc., New York, 2002. ISBN 0471 22410 3.
    • Panter, P. F., and W. Dite. Quantizing Distortion in Pulse-Count Modulation with Nonuniform Spacing of Levels. Proc. IRE, p. 44, Jan. 1951.
    • Erik Agrell, Thomas Eriksson, Alexander Vardy, Kenneth Zeger. Closest Point Search in Lattices. IEEE Transactions on Information Theory, pp. 2201-2214, Aug. 2002
    • Manfred Herbert. Lattice-Quantisierung von Sprach- und Sprachmodellsignalen. Ausgewählte Arbeiten über Nachrichtensysteme, Nr. 79, Editor: H. -W. Schüßler, Erlangen 1991.
    • L. Pakula and S. Kay. Simple Proofs of the Minimum Phase Property of the Prediction Error Filter, IEEE Transactions on ASSP, vol. 31, 1983.
    • Volder, Jack. The CORDIC Trigonometric Computing Technique. IRE Trans. Electronic Computing, Vol EC-8, pp. 330-334, Sept. 1959.
    • Audio examples are available at http://www.LNT.de/LIT/audio-example

Claims (8)

  1. Verfahren zur blockweisen Digitalisierung von Analogsignalen mit den Schritten: Transformation der Analogsignale von kartesischen Koordinaten in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.
  2. Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach Anspruch 1, mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei die Signalwerte für die Transformation in sphärische Koordinaten so angeordnet werden, dass für die Bestimmung der quantisierten Werte durch Quantisierung von Winkeln und Betrag (sphärische Quantisierung) nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
  3. Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach Anspruch 1 oder 2 mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei für den Betrag des in Kugelkoordinaten quantisierten Blocks von Signal eine Schätzung durch Vorwärtsprädiktion vorgenommen wird und die Rückwärtsprädiktion für mehrere unterschiedliche Beträge in der Nähe dieses Schätzwertes parallel ausgeführt wird.
  4. Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach einem der Ansprüche 1 bis 3, mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei der ermittelten Quantisierungszelle ein Quantisierungsindex zugeordnet wird als Teilfläche auf der Einheitskugel vom unteren Pol (Südpol, d.h. alle Elevationswinkel sind –90 Grad) bis zur aktuellen Quantisierungszelle im Verhältnis zur gesamten Oberfläche und multipliziert mit der Gesamtzahl der Zellen.
  5. Verfahren nach einem der Ansprüche 1 bis 4, wobei die Abgrenzungen der einzelnen Quantisierungszellen durch Drehung der Ebenen des Koordinatensystems so angeordnet werden, dass für die Quantisierung des aktuellen Wertes nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei der Azimuthwinkel derart quantisiert wird, dass die geringstmögliche Fehlerleistung in den von ihm abhängenden Rekonstruktionswerten erzielt wird.
  7. Verfahren nach einem der Ansprüche 1 bis 5, wobei die Auswahl der zu verwendenden Quantisierungszelle mittels eines Gradientenabstiegsverfahrens bzgl. der Fehlerleistung unter Verwendung der vergangenen und dem aktuellen Eingangswert durchgeführt wird.
  8. Verfahren nach einem der Ansprüche 1 bis 7, wobei infolge Quantisierunseffekte freibleibende Indexzahlen durch entsprechend feinere Quantisierung beim nachfolgenden Winkel weiterverwertet werden, sodass keine Indexzahlen ungenutzt verbleiben.
DE102006050053A 2005-10-24 2006-10-24 Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung Withdrawn DE102006050053A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102006050053A DE102006050053A1 (de) 2005-10-24 2006-10-24 Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102005051904.0 2005-10-24
DE102005051904 2005-10-24
DE102006050053A DE102006050053A1 (de) 2005-10-24 2006-10-24 Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung

Publications (1)

Publication Number Publication Date
DE102006050053A1 true DE102006050053A1 (de) 2007-05-03

Family

ID=37913033

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006050053A Withdrawn DE102006050053A1 (de) 2005-10-24 2006-10-24 Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung

Country Status (1)

Country Link
DE (1) DE102006050053A1 (de)

Similar Documents

Publication Publication Date Title
Tao et al. Significantly improving lossy compression for scientific data sets based on multidimensional prediction and error-controlled quantization
DE69815650T2 (de) Sprachkodierer
Mayekar et al. RATQ: A universal fixed-length quantizer for stochastic optimization
Toderici et al. Variable rate image compression with recurrent neural networks
DE60311782T2 (de) Verfahren zum Decodieren von in einem Telekommunikationssysstem gesendeten Symbolen
DE19534943B4 (de) Vorrichtung zur Komprimierung unter Verwendung von eingebetteten Kleinwellen
DE69531471T2 (de) Mehrkanalsignalkodierung unter Verwendung gewichteter Vektorquantisierung
DE102017122240A1 (de) Kommunikationseffizientes gemeinschaftliches Lernen
EP1647009B1 (de) Vorrichtung und verfahren zum verarbeiten eines signals
DE69930848T2 (de) Skalierbarer audiokodierer und dekodierer
US6128346A (en) Method and apparatus for quantizing a signal in a digital system
DE19540652C2 (de) Vorrichtung und Verfahren zum Dekodieren eines kohärenten, differenziell codierten, mehrstufig phasenumtastungsmodulierten (DEPSK) Signals
EP1652309B1 (de) Verfahren und vorrichtung zur digitalisierung sowie zur datenkomprimierung analoger signale
EP1654674B1 (de) Vorrichtung und verfahren zum verarbeiten von wenigstens zwei eingangswerten
DE112013000908B4 (de) Stabilitätskorrektur für einen Shuffler eines SIGMA-DELTA-ADU
WO2002103684A1 (de) Verfahren und vorrichtung zum verarbeiten von zeitdiskreten audio-abtastwerten
DE102014106389A1 (de) Rauschformer n-ter ordnung
DE102013020730B4 (de) Verfahren und Vorrichtung zur iterativen Berechnung eines Wertes
DE102006050053A1 (de) Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung
DE69912063T2 (de) Übertragungssystem, welches einen verbesserten signalkodierer und -dekodierer verwendet
Barnes et al. Residual vector quantizers with jointly optimized code books
T Hashim et al. Color image compression using DPCM with DCT, DWT and quadtree coding scheme
CN115361559A (zh) 图像编码方法、图像解码方法、装置以及存储介质
Hwang et al. Multistage storage-and entropy-constrained tree-structured vector quantization
Gashnikov Decision-Tree-Based Interpolation for Multidimensional Signal Compression

Legal Events

Date Code Title Description
8181 Inventor (new situation)

Inventor name: MATSCHKAL, BERND, DIPL.-ING., 90513 ZIRNDORF, DE

Inventor name: BERGNER, FRANK, 91058 ERLANGEN, DE

Inventor name: HUBER, JOHANNES B., PROF. DR.-ING., 91094 LANG, DE

8181 Inventor (new situation)

Inventor name: MATSCHKAL, BERND, DIPL.-ING., 90513 ZIRNDORF, DE

Inventor name: HUBER, JOHANNES B., PROF. DR.-ING., 91094 LANG, DE

Inventor name: BERGNER, FRANK, 91058 ERLANGEN, DE

8127 New person/name/address of the applicant

Owner name: SENNHEISER ELECTRONIC GMBH & CO. KG, 30900 WED, DE

R012 Request for examination validly filed

Effective date: 20130604

R120 Application withdrawn or ip right abandoned