DE102006050053A1

DE102006050053A1 - Effiziente Signalverarbeitung für Sphärisch Logarithmische Quantisierung

Info

Publication number: DE102006050053A1
Application number: DE102006050053A
Authority: DE
Original assignee: Matschkal Bernd Dipl-Ing
Current assignee: Sennheiser Electronic GmbH and Co KG
Priority date: 2005-10-24
Filing date: 2006-10-24
Publication date: 2007-05-03

Abstract

Es ist Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur blockweisen Digitalisierung von Audiosignalen vorzusehen. DOLLAR A Verfahren zur blockweisen Digitalisierung von Analogsignalen mit den Schritten: DOLLAR A Transformation der Ananlogsignale von kartesischen Koordinaten in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.

Description

Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen. Eine Digitale Repräsentation analoger Wellenformen bietet zahlreiche Vorteile bzgl. effizienter und robuster Übertragung, Signalverarbeitung und Speicherung. Zu diesem Zweck wird das analoge Signal üblicherweise quantisiert und mittels PCM-Encodierung und nachgeschalteter Datenkompression weiterverarbeitet. Je nach Zweck der digitalen Repräsentation existiert ein breites Spektrum an Datenkompressionsverfahren: insbesondere auf der Konsumentenseite werden oftmals spezielle Eigenschaften des (menschlichen) Zuhörers ausgenutzt um eine Irrelevanzreduktion innerhalb des Quallensignals durchzuführen und somit zu einer sehr effizienten Ubertragung oder Speicherung mit einer ausreichenden Qualität des rekonstruierten Signals zu gelangen. Seitens der Erzeugung (z.B. digitales Mikrophon), werden häufig wesentlich stärkere Anforderungen an die digitale Kompression des aufgenommenen Signals gestellt: üblicherweise wird das Signal nachverarbeitet und abgemischt was im Falle einer vorgeschalteten Irrelevanzreduktion einen nichtvorhersagbaren Qualitätsverlust zur Folge haben kann (psychoakustische Maskierungseffekte). Zudem erlauben einige Anwendungen (z.B. die Audioübertragung für Bühnen-Monitoring-Systeme) nur eine Verzögerung von wenigen Abtastperioden. Darüberhinaus können Gewinne, die mittels Ausnutzung von Irrelevanz erzielt wurden nicht im Sinne eines Störabstandes (SNR: Signal-to-Noise Ratio) gemessen werden. Aufwändige Hörtests mit eigens dafür ausgebildeten Personen stellen hierfür die einzige verlässliche Möglichkeit dar.

In [1] wird ein wellenformerhaltendes (wir verwenden den Ausdruck „wellenformerhaltend" anstelle des oft gebräuchlichen Begriffs „verlustlos", weil die Digitalisierung eines analogen Signals bei einer endlichen Datenrate prinzipiell nicht „verlustlos" ist.) Verfahren, i.e. sphärisch logarithmische Quantisierung (SLQ) beschrieben, welches einerseits die Gewinne von mehrdimensionaler und logarithmischer Quantisierung vereinigt und andererseits in der Lage ist, weitere SNR-Gewinne mittels linearer Prädiktion auszunutzen. Diese Quantisierung bietet einen vorteilhaften Austausch von Rate und Störung und ist insbesondere durch ihren extrem großen Dynamikbereich sowie ihre sehr geringe strukturbedingte Verzögerung von nur wenigen (typischerweise bis zu 16) Abtastperioden gekennzeichnet. Da diese Methode wellenformerhaltend ist, kann die erzielte Qualität als SNR gemessen werden.

Da sphärisch logarithmische Quantisierung D Abtastwerte zu einem Vektor kombiniert um sie anschließend gemeinsam zu quantisieren, ist sie der Familie der Vektorquantisierungsverfahren zuzuordnen. Um zusätzliche Gewinne durch lineare (Rückwärts-)Prädiktion zu erzielen, wird eine Kombination aus sphärisch logarithmischer Quantisierung und differentieller Pulscodemodulation (DPCM) verwendet, ähnlich dem Verfahren „analysis by synthesis", welches von den CELP-Wellenformcodierungsverfahren her bestens bekannt ist (siehe dazu ([2]). Mittels eines sehr einfachen Gradientenabstiegsverfahrens wird eine Suche nach dem Rekonstruktionsvektor mit der geringsten Störung durchgeführt. In [3] wird eine Lösung für die Indexzuordnung der optimalen Quantisierungszelle gezeigt, welche allerdings aufgrund verschachtelter Lookup-Tabellen – je nach Speicheraufwand – einer Beschränkung in Rate und Dimensionalität und damit in der Leistungsfähigkeit unterworfen ist.

Hier wird eine sukzessives Quantisierung beschrieben, welche den Gegensatz zwischen DPCM und Vektorquantisierung auf elegante und effektive Weise und bei geringem Rechenaufwand löst. Darüber hinaus wird ein Weg der Indexberechnung für die optimale Quantisierungszelle beschrieben, der nicht auf den Einsatz der verketteten Lookup-Tabellen basiert, aber trotzdem kompatibel zu der Kombination mit DPCM ist.

Nachfolgend wird die sphärisch logarithmische Quantisierung näher beschrieben.

Die Anwendung der sphärisch logarithmischen Quantisierung auf einen Vektor x := (x₁, ..., x_D) mit D Abtastwerten führt zunächst eine Transformation in Polarkoordinaten u := (φ, ..., φ_D-1, r) durch. Die D – 1 Winkel φ_i wie auch der Radius r sind durch die folgenden Gleichungen festgelegt (j: imaginäre Einheit, arg (.) Argument-Funktion die den Winkel einer komplexen Zahl im Bogenmaß ermittelt): φ1 = arg(xD + jxD-1) ∊[–π, +π] (1)

Es gilt zu beachten, dass hier der „zeitlich umgekehrte"' Vektor x für die Transformation in sphärische Koordinaten zu verwenden ist, die Notwendigkeit hierfür wird ab Seite 8, letzter Absatz bis Seite 13, zweiter Absatz näher erläutert.

Für die Rekonstruktion der kartesischen Koordinaten des Vektors u ergibt sich xi = r·bD-i·sin(φD-i), i ∊ {1, ..., D – 1} (4) xD = r·b1·cos(φ1) = r·b0 (5)mit den Radien b_i der „Breitenkreise" einer Einheitskugel (Radius 1): bD-1 = 1 (6)

Um die Eigenschaften einer logarithmischen Quantisierung, d.h. Unabhängigkeit des SNR von der Varianz des Signals und seiner speziellen (Kurzzeit-) Wahrscheinlichkeitsdichtefunktion (WDF) zu erzielen, wird in [1] vorgeschlagen, die gewöhnliche logarithmische Quantisierung gemäß dem A-law für den Radius (Amplitude) einzusetzen. Für die Winkelvariablen φ_i kommt eine einfache gleichmäßige Quantisierung zur Anwendung – allerdings mit den Quantisierungsintervallen als Funktionen der bereits quantisierten Winkelvariablen höherer Dimensionen φ ^l ∊ {i + 1, i + 2, ..., D – 1}, die für die Rekonstruktion verwendet werden.

Die gleichmäßige Quantisierung der Winkel entspricht in etwa der Quantisierung der Oberfläche einer D-dimensionalen Kugel in (D – 1)-dimensionale (Hyper-) Würfel (z.B. gewöhnliche Quadrate für D = 3) solange die Anzahl an Quantisierungszellen sehr groß ist (siehe 1).

Diese suboptimale Quantisierung der Kugeloberfläche resultiert in einem Verlust von lediglich

für D → ∞, was einem Ratenverlust von etwa 1/4 bit/Abtastwert entspricht, welchen wir zugunsten geringer Komplexität hinnehmen.

Δr(r) bezeichne die Kantenlänge jeder Quantisierungszelle auf der Oberfläche einer D-dimensionalen Kugel. Da das SNR innerhalb des logarithmischen Bereiches des A-law Quantisierers unabhängig vom Radius r ist, kann der Radius getrennt von der Kugeloberfläche quantisiert werden. Daher kann für die Oberflächenquantisierung ohne Beschränkung der Allgemeinheit r = 1 gewählt werden, entsprechend einer Einheitskugel, deren Oberfläche mit Quantisierungszellen bedeckt ist, siehe 1.

R sei die durchschnittliche Anzahl der Bits pro Abtastwert (Rate) und M := 2^R die Anzahl der Quantisierungsstufen, die pro Abtastwert zur Verfügung stehen. Die M^D Quantisierungsstufen (die pro Quantisierungsschritt zur Verfügung stehen) können in M_D Quantisierungsintervalle für den Radius und M_φ Quantisierungsintervalle für die Oberfläche der D-dimensionalen Einheits-(hyper-) Kugel in optimaler Weise aufgeteilt werden. Für die Kantenlänge der Quantisierungszelle erhält man:

Hierbei bezeichnet A den üblichen Parameter der logarithmischen Quantisierung gemäß des A-law sowie β_D die Oberfläche einer D-dimensionalen Einheitskugel, wobei hier die Gamma-Funktion (Γ(x + 1) = x!, x ∊ IR⁺) Anwendung findet.

Da die Oberfläche unserer Einheitskugel gleichmäßig mit D – 1 -dimensionalen Hyperwürfeln bedeckt ist, von denen jeder einzelne eine Fläche von Δ^D-1 (d.h. ein „D – 1-dimensionales Volumen") zur Gesamtoberfläche der Kugel beiträgt, können wir die Anzahl der Quantisierungszellen, die für die Quantisierung der Kugeloberfläche zur Verfügung stehen mit Hilfe von (8) berechnen:

[5] befasst sich ebenfalls mit dem Problem der gleichmäßigen Verteilung von Quantisierungszellen auf der Kugeloberfläche, wobei eine passende Kantenlänge ausgehend von einem suboptimalen Startwert iterativ ermittelt wird und keinerlei Aspekte der Radiusquantisierung in die Berechnung mit einfließen.

1 zeigt eine Darstellung der Quantisierungszellen auf der Oberfläche der Einheitskugel. 1 zeigt somit beispielsweise für D = 3 und R = 4 bit/Abtastwert wie die Oberfläche der Einheitskugel von unserem Quantisierer in M_D-1 horizontale Schichten unterteilt werden kann, deren jeweilige Rekonstruktionswinkel wir im Folgenden mit φ ^D-1 bezeichnen werden. Abhängig von φ ^D-1 , kann nun jede Schicht wiederum in M_D-2 (φ ^D-1 ) Unterschichten aufgeteilt werden, wobei jede Unterschicht zu einem Rekonstruktionswinkel φ ^D-2 gehört. Diese Vorgehensweise kann bis M₁ fortgesetzt werden; hier gilt es jedoch zu beachten, dass die Anzahl M_i an Quantisierungsintervallen in der Schicht i abhängig von den in allen höheren Dimensionen i + 1, ..., D – 1 ausgewählten Quantisierungsintervallen (bzw. deren Rekonstruktionswinkeln) ist.

Es ist somit Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur blockweisen Digitalisierung von Audiosignalen vorzusehen.

Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 gelöst.

Die Erfindung betrifft den Gedanken, dass zu Gunsten einer weiteren Erhöhung des SNR mittels Ausnutzung von Korrelationen innerhalb des Quellensignals, kann DPCM mit Rückwärtsprädiktion gemäß 2 verwendet werden. Prädiktionsgewinne können infolge DPCM direkt in SNR-Gewinne überführt werden, sofern DPCM mit Rückwärtsprädiktion mit logarithmischer Quantisierung kombiniert wird. Da SLQ das effizienteste unter den bekannten logarithmischen Quantisierungsverfahren ist, bietet die Kombination von SLQ und DPCM mit Rückwärtsprädiktion ein nahezu optimales logarithmisches Quantisierungsverfahren. Leider kommt hier das gleiche Problem wie für jedes andere Vektorquantisierungsverfahren, welches mit DPCM und Rückwärtsprädiktion kombiniert wird, zum tragen: für die Berechnung des aktuellen Prädiktionsfehlerwertes x[k] müssen alle vorhergehenden rekonstruierten Abtastwerte q ^[k – i], i = 1, 2, ..., zur Verfügung stehen und für einen hohen Prädiktionsgewinn sind die in naher Vergangenheit liegenden Werte (i = 1, i = 2) unverzichtbar. Allerdings scheint diese Forderung mit der gemeinsamen Quantisierung von Blöcken der Länge D im Widerspruch zu stehen.

Die Vorteile und Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf die Zeichnung näher erläutert.
1 zeigt eine Darstellung der Quantisierungszellen auf der Oberfläche der Einheitskugel,
2 zeigt ein Blockschaltbild eines DPCM Encoders gemäß einem Ausführungsbeispiel,
3 zeigt eine Darstellung der Drehung der Quantisierungszellen,
4 zeigt eine Darstellung der Berechnung der Oberfläche einer Schicht mittels Subtraktion zweier Teiloberflächen,
5 zeigt eine Darstellung der Aufsummierung der Anzahl der Zellen in jeder Schicht,
6 zeigt eine graphische Darstellung der Abhängigkeit des Signalrauschverhältnisses zu einer sphärisch-logarithmischen Quantisierung in Kombination mit DPCM,
7 zeigt eine Darstellung eines segmentellen Signalpegels,
8 zeigt ein Blockdiagramm einer vektoriellen Vorwärtsprädikation,
9 zeigt eine Darstellung der Wahl der Winkelstufe, und
10 zeigt einen Graphen mit der Abhängigkeit des Signalrauschverhältnisses zu der Suche des letzten Winkels in den Nachbarzellen.
Im Folgenden wird ein Verfahren für eine sukzessive sphärisch logarithmische Quantisierung beschrieben, die lineare Prädiktion des ursprünglichen Signalvektors q := (q₁, ..., q_D) beinhaltet. Zunächst ist es erforderlich, die Signalamplitude des in den sphärischen Bereich zu transformierenden Vektors x, d.h. den Radius r gemäß (3), abzuschätzen. Dies geschieht mittels Vorwärtsprädiktion für die aktuellen D Abtastwerte; d.h. durch Deaktivierung der Kette „Sphärische Quantisierung" und „Kartesische Rekonstruktion" in 2 bzw. dem Einspeisen von q[k], k = l·D, l·D + 1, ..., l·D + D – 1 in das Prädiktorfilter anstelle von q ^[k].
Der Vektor q := (q₁, ..., q_i, ...q_D) wird nun gemäß 2 Abtastwert für Abtastwert quantisiert, beginnend mit i = 1. Der Abtastwert x_i wird in den sphärischen Quantisierer eingespeist, welcher zunächst den entsprechenden unquantisierten Winkel φ_D-1 unter Anwendung von (4) liefert:
Unter der Annahme, dass die Anzahl der für die Quantisierung dieses Winkels zur Verfügung stehenden Quantisierungsintervalle bekannt ist (wir werden diesen Punkt zwecks besserer Lesbarkeit detailliert unten diskutieren), wird die Einheitskugel in M_D-i Schichten unterteilt (siehe 1). Nun wird diejenige Schicht, die den unquantisierten Winkel
enthält, ausgewählt und mit dem Index ν_D-i bezeichnet; ν_D-i = 0 entspricht der untersten und ν_D-i = M_D-i – 1 der obersten Schicht:
mit [x] ∊
: größte ganze Zahl ≤ x mit x ∊
.
Der entsprechende Rekonstruktionswinkel (welcher auf die Mitte der ausgewählten Schicht zeigt), ergibt sich somit zu
Wir verwenden nun den quantisierten Radius b_D-i des „Breitenkreises" der ausgewählten Schicht, um die i-te kartesische Komponente von y zu rekonstruieren yi = r·b ^D-i·sin(φ ^D-i), i ∊ {1, ..., D – 2} (15)welche daraufhin gemäß 2 weiterverarbeitet wird. Die Erhöhung von i um 1 führt zu dem nächsten Abtastwert von x, bzw. x_i.
Es gilt zu beachten, dass die unquantisierten „Breitenkreisradien" b_D-i durch die Gln. (6) und (7) beschrieben sind, wobei die entsprechenden quantisierten Radien mittels b ^D-1 = 1 (16)
berechnet werden können.
An dieser Stelle ist zu betonen, dass die Gewinne infolge linearer Prädiktion nur erzielt werden können, wenn die Quantisierung die chronologisch korrekte Reihenfolge der ursprünglichen Abtastwerte beibehält. Daher verwendet unsere schrittweise Quantisierung den zeitlich umgedrehten Signalvektor von x für die Transformation in sphärische Koordinaten, siehe Gln. (1) bis (3). Mit der passenden Rekonstruktion der kartesichen Komponenten, siehe Gln. (4) bis (5), beginnend bei dem „letzten" Winkel φ_D-1, wird somit unmittelbar der erste quantisierte Abtastwert y₁, usw. erhalten!
Diese Vorgehensweise ist durchzuführen, solange i ≤ D – 2 gilt, da die letzte Schicht (d.h. i = D – 1) einem zur (x_D, x_D-1)-Ebene parallelen Kreis entspricht. In diesem Fall hängen sowohl y_D-1 als auch y_D vom gleichen Winkel φ ^D-1 ab. Dies ist nicht kompatibel mit unserer sukzessiven Quantisierungs- und Prädiktionsvorgehensweise gemäß 2, da wir hier zuerst die quantisierte Komponente y_D-1 benötigen, um anschließend den prädizierten Abtastwert x_D ermitteln zu können, welcher wiederum zu der quantisierten Komponente y_D führt.
Um nun y_D-1 unabhängig von y_D quantisieren zu können, müssen wir die Anordnung der Quantisierungszellen innerhalb der (x_D, x_D-1)-Ebene um π / 2 im Gegenuhrzeigersinn drehen, sodass eine bzgl. der x_D-1-Achse symmetrische Quantisierung von φ₁ erzielt wird, siehe 3.
Wir müssen also schreiben
An dieser Stelle müssen wir die Notation φ ~1 und φ ~1 anstelle von φ₁ und φ ^1 verwenden, da wir zum aktuellen Zeitpunkt noch eine Zweideutigkeit des Winkels (φ1 = φ ~1 , oder φ1 = π – φ ~1 ) vorliegen haben, die vom Vorzeichen von x_D abhängt.
Wir werden diese Zweideutigkeit an späterer Stelle beseitigen.
In jedem Fall lautet die nächste kartesische Komponente von y
die nun für die nachfolgende Verarbeitung durch das Prädiktorfilter gemäß 2 zur Verfügung steht. Die Prädiktorfilterung liefert x_D, dessen Vorzeichen nun darüber entscheidet, ob die Winkel φ ~1 bzw.
noch korrigiert werden müssen, oder nicht:
Um diesen Sachverhalt zu veranschaulichen, wird zunächst angenommen, dass die Gln. (18) und (19) zu einem quantisierten Winkel
führen, wie er in 3 dargestellt ist. In diesem Fall sind die mit „0" und „4" bezeichneten Rekonstruktionswinkel mögliche Kandidaten, da sie beide die gleiche Komponente x_D-1 besitzen. Sobald das Vorzeichen von x_D bekannt ist, kann eine eindeutige Entscheidung hierüber getroffen werden.
Die letzte kartesische Komponente von y lautet nun yD = r·b ^1·cos(φ ^1), (23)und die auf der letzten Schicht ausgewählte Quantisierungszelle kann nun mit einem Index
beschrieben werden.
Wie bereits erwähnt, benötigt das oben vorgestellte Verfahren die exakte Amplitude des Signalvektors x hinter der Rückwärtsprädiktion (d.h. den Radius r am Eingang der „Sphärischen Quantisierung", siehe 2. Da die eingangs durchgeführte Abschätzung mittels Vorwärtsprädiktion nicht ausreichend exakt ist, muss der vorgestellte Algorithmus für einige (etwa 10 bis 20) diskrete Radiuswerte r ~ ∊ [r – Δ, r + Δ]. Ziel ist es, einen Wert r ~ zu finden, für welchen die Metrik
minimiert wird. Da diese Suche nicht notwendigerweise eine iterative Vorgehensweise voraussetzt, kann sie in einer Hardware-Implementierung sehr einfach parallelisiert werden.
Nachfolgend wird sowohl die Zuordnung eines Index N ∊ {0, 1, ..., M^D – 1} zu der zu übertragenden Quantisierungszelle als auch die empfangsseitige Rekonstruktion diskutiert. Da die Zuordnung eines Index N_D ∊ {0, 1, ..., M_D – 1} zum Radius unabhängig vom Index N_φ ∊ {0, 1, ..., M_φ – 1} der gewählten Quantisierungszelle auf der Einheitskugel ist, können wir uns auf das Problem der Indexzuordnung zu den Zellen auf der Einheitskugel konzentrieren. Selbstverständlich muss
gefordert werden.
Eine übliche Vorgehensweise der Vektorquantisierung ist es, alle Codebuchvektoren (Rekonstruktionsvektoren) sequentiell zu nummerieren und im Speicher eines Rechnersystems zu halten. Nach Auswahl eines geeigneten Codebuchvektors (Rekonstruktionsvektors) wird die zugehörige Nummer übertragen. Da die Leistungsfähigkeit von SLQ besonders bei höheren Dimensionalitäten D zum Tragen kommt (z.B. D = 16), resultiert hier insbesondere bei größeren Raten (z.B. R > 3 bit/Abtastwert) eine sehr große Anzahl M_φ an Quantisierungszellen auf der Kugeloberfläche. Die Vorgehensweise der Speicherung aller möglichen Quantisierungszellen gerät hier sehr bald an die Grenzen der relevanten Rechnersysteme (verfügbares RAM, Random Access Memory).
Anstelle sämtliche Rekonstruktionsvektoren in einem Speicher zu halten, wird ein sukzessives Verfahren verwendet, dass mittels analytischer Flächenberechnungen von Kugel-(teil-)oberflächen den zu übertragenden Quantisierungszellenindex ermittelt.
Hierzu wird die Oberfläche der D-dimensionalen Einheitskugel sukzessive in
Schichten (beginnend bei Stufe 1, d.h. i = 1) aufgeteilt und entsprechend den Indizes ν_D-i = 0, ..., M_D-i – 1 vom unteren Pol bis zum oberen Pol der Kugel fortlaufend nummeriert. Jede Schicht beinhaltet einen Rekonstruktionswinkel, siehe (14), welchen wir mit
bezeichnen und der die Anzahl
an Quantisierungszellen (d.h. D – i-dimensionale Hyperwürfel) beinhaltet. Um zu einer gleichmäßigen Verteilung der Quantisierungszellen auf der Kugeloberfläche zu gelangen, ist
proportional zu der quantisierten Oberfläche der jeweiligen Schicht zu wählen.
4 zeigt eine Darstellung der Berechnung der Oberfläche einer Schicht mittels Subtraktion zweier Teiloberflächen. Die Oberfläche einer Schicht ν_D-i wird mittels Subtraktion zweier Teiloberflächen, bezeichnet mit S⁺ und S^–, berechnet.
Um zu einer eindeutigen Indexrepräsentation trotz Rundungseffekten zu gelangen, werden die beiden zu subtrahierenden Oberflächen auf ein ganzzahliges Vielfaches der Fläche einer Quantisierungszelle (d.h. der Oberfläche unseres D – i-dimensionalen Hyperwürfels) quantisiert.
Es sei S_D-i+1(φ_D-i) die Teiloberfläche gemäß 4 einer D – i + 1-dimensionalen Einheitskugel zwischen dem unteren Pol der Kugel (d.h. φ_D-i = – π / 2) und dem Winkel φ_D-i:
mit dem Oberflächenelement ρ = cosD-i-1(φD-i)·cosD-i-2(φD-i-1)·...·cos(φ2). (29)
Mit dem Radius b ~D-i der Kugel und einer Quantisierungszellenfläche von Δ^D-i können wir nun die Anzahl
an Quantisierungszellen berechnen, die für die Verteilung pro Schicht zur Verfügung stehen
In einem ersten Schritt des Encodierungsprozesses, müssen wir den Radius b ~D-1 = 1. (31)verwenden. Sobald φ_D-i durch die Anwendung von (14) im Zuge des Encodierungsprozesses quantisiert wurde, können wir ν_D-i entsprechend der gewählten Schicht (bzw. dem Rekonstruktionswinkel φ ^D-i ) festhalten.
Der Radius b ~D-i-1 , der nun für den nächsten Schritt bei der Encodierung verwendet werden muss, kann nun als der Radius einer D – i-dimensionalen Kugel interpretiert werden, welche die gleiche (quantisierte) Oberfläche besitzt, als die ausgewählte Schicht unserer D – i + 1 -dimensionalen Kugel dividiert durch Δ:
und damit
Dies kann sehr einfach durch die Tatsache verdeutlicht werden, dass ein senkrechter Schnitt durch eine D – i-dimensionale Kugel mit einer D – i – 1-dimensionalen Kugel identisch ist. Schneidet man also z.B. durch eine 3-dimensionale Kugel, so erhält man einen Kreis.
Nun führen wir den nächsten Schritt durch, d.h. wir erhöhen i um 1 und, solange i ≤ D – 2 gilt, setzen wir die Aufteilung der aktuellen Schicht in M_D-i Unterschichten in rekursiver Weise gemäß (27) fort.
Bei i = D – 1 haben wir die letzte Schicht erreicht, sie besteht aus
Quantisierungszellen.
Der Index N_φ, welcher die auf der Oberfläche der Einheitskugel ausgewählte Zelle bezeichnet, kann nun einfach durch eine Aufsummierung der Quantisierungszellen berechnet werden, die in den D – 1 Schichten bzw. Unterschichten zwischen dem unteren Pol und der jeweils ausgewählten Schicht ν_D-i einer jeden „Unterkugel" verteilt wurden, siehe 5.
Der Zellenindex N_φ für die Oberflächenzelle der Kugel wird nun mit dem Index N_D der (skalaren) Radiusquantisierung zu einem Gesamtindex kombiniert N = Nφ·MD + ND, (36) und anschließend übertragen.
Die Auflösung des übertragenen Index N in N_φ und N_D kann in sehr einfacher Weise mittels einer Modulo-Operation durchgeführt werden ND = NmodMD (37)
wobei der modulo-Operator mod x, x ∊ IN eine ganze Zahl in das Intervall [0, ..., x – 1] abbildet.
Die Wiedergewinnung von ν_D-i,i ∊ {1, ..., D – 1} erfordert nun einige Berechnungen, ähnlich wie bei der Encodierung: der Decoder verarbeitet sukzessive die Stufen für i = 1, ..., D – 1 und liefert in jeder Stufe einen „verbleibenden Oberflächenindex" N_D-i, beginnend mit N ~d-1 := Nφ. (39)
In der ersten Stufe des Decodierprozesses (d.h. i = 1), werden die
für alle möglichen Rekonstruktionswinkel der gegenwärtig aktuellen Schicht mittels (30) berechnet. Der rekonstruierte Index kann nun durch die Erfüllung der folgenden Gleichung eindeutig festgelegt werden:
Nun wird der zugehörigen Rekonstruktionswinkel φ ^D-i unter Verwendung von (27) und (14) berechnet. Der für die nächste Stufe der Decodierung verbleibenden Index ergibt sich somit zu
Nun wird i um 1 erhöht und solange i ≤ D – 2 gilt, fahren wir in gleicher Weise fort, indem wir mit (40) den aktuellen Wert ν_D-i ermitteln.
Sind wir bei i = D – 1 angelangt, so verbleibt ν1 = N ~1 (42)
Die Rekonstruktion der kartesischen Komponenten des Signals aus den Rekonstruktionswinkeln erfolgt nun mittels (4) und (5).
Die Simulation von gemeinsamer sphärisch logarithmischer Quantisierung und DPCM wurde für die Ouvertüre und die Arie „Der Vogelfänger bin ich ja" der Oper „Zauberflöte" von Wolfgang Amadeus Mozart (siehe [4]) durchgeführt. Die Arie „Vogelfänger" ist mit einem mittleren Signalpegel von –32,15 dB aufgenommen und bietet ein herausforderndes Beispiel für Audiocodierungsverfahren aufgrund ihrer Signaldynamik sowie ihrer Klangfarben (Vorspiel, Gesang, Rohrflöte). Der mittlere Signalpegel der Ouvertüre beträgt –27,20 dB, sie ist durch einen großen Dynamikbereich charakterisiert, der von unterhalb –70 dB bis hinauf zu –17 dB reicht, siehe auch 7.
Zuerst wurde das Signal encodiert, dann wieder decodiert und anschließend wurde das SNR durch Vergleich mit dem originalen CD-Signal ermittelt. 6 zeigt Simulationsergebnisse für R = 3 bit/Abtastwert, A = 102726 sowie verschiedenen Dimensionszahlen D. Der Störabstand ist hier jeweils über das gesamte Musikstück gemittelt. Durch den Einsatz eines universellen Prädiktorfilters mit geringer Prädiktorordnung (P = 2), können diese Simulationsergebnisse als repräsentativ für eine Vielzahl von Audiosignalen betrachtet werden. Das SNR erhöht sich mit D und nähert sich der Rate-Distortion-Schranke bei D = 16 auf 3.34 dB für gaußsche Zufallsvariablen (d.h. unabhängig vom Prädiktionsgewinn) – das theoretische Maximum (D → ∞) liegt 1.53 dB unter der Rate-Distortion-Schranke.
In 7 ist der segmentelle Signalpegel sowie das segmentelle SNR für das Beispiel der Ouvertüre dargestellt; jedes Segment besteht aus 6000 Abtastwerten, dies entspricht 0.136 s bei einer Abtastrate von 44.1 kHz. Hierbei wurde sphärisch logarithmische Quantisierung in D = 16 Dimensionen bei A = 102726 und dem selben universellen Prädiktor der Ordnung 2 wie im ersten Beispiel eingesetzt.
Die obere Kurve zeigt den großen Dynamikbereich der Ouvertüre: insbesondere zu Beginn und in der Mitte dieses populären Musikstücks können die bekannten lauten Töne, unterbrochen von Generalpausen über mehrere Takte hinweg, beobachtet werden. Es gilt hier zu beachten, dass trotz der niedrigen Rate von R = 3 bit/Abtastwert ein 10 log₁₀ (SNR) > 30 dB (bzgl. der Original-CD) selbst in den Generalpausen aufrechterhalten wird.
Die vorliegende Erfindung stellt eine Weiterentwicklung der in [1] und [3] beschriebenen Quantisierung dar. Die entscheidenden Verbesserungen betreffen die sukkzessive Quantisierung der einzelnen Dimensionen durch die bei Reduzierung der erforderlichen Rechenzeit und des erforderlichen Speichers eine Quantisierung bei wesentlich höheren Dimensionszahlen ermöglicht wird. Ein Punkt der vorliegenden Erfindung ist die Kombination der sphärisch logarithmischen Quantisierung mit DPCM.
[5] beschreibt ein Quantisierungsverfahren das Teilaspekte aus [1] aufgreift, wie beispielsweise das Ziel einer gleichmäßigen Verteilung von Quantisierungszellen auf der Oberfläche einer Einheitskugel. Da das dort vorgestellte Verfahren sich auf die Quantisierung der Oberfläche konzentriert, findet keinerlei Austausch der zur Verfügung stehenden Quantisierungsstufen zwischen Radius- und Oberflächenquantisierung statt. Das in [1] vorgestellte Verfahren beschreibt, wie dieser Austausch in optimaler Weise durchzuführen ist bzw. wie die Kantenlänge der Quantisierungszelle im Sinne eines optimalen Austausches zu wählen ist. Die Ermittlung der für die Einteilung der Kugeloberfläche in Quantisierungszellen erforderlichen Kantenlänge erfolgt in [5] auf iterative Weise, ausgehend von einem suboptimalen Startwert. Darüberhinaus beschränkt sich das in [5] dargestellte Verfahren auf gauß'sche Quellen – auf eine Ausnutzung von Korrelationen innerhalb des Quellensignals (beispielsweise durch Prädiktion) wird nicht eingegangen.
Die vorliegende Erfindung beschreibt hingegen ein neuartiges Verfahren der Codierung des Zellenindex mittels analytischer Berechnung von (Teil-) Oberflächen der Kugel. Sie ermöglicht eine vollständige Ausnutzung der zur Verfügung stehenden Quantisierungszellenanzahl trotz unvermeidbarer Rundungseffekte, da die bei höheren Schichten nicht nutzbaren Quantisierungszellen (bzw. die nicht nutzbare Quantisierungszellenfläche) in später bearbeiteten Dimensionen für die Codierung verwendet werden können.
Da es sich bei der SLQ um ein Vektorquantisierungsverfahren handelt, soll im Folgenden eine vektorielle Betrachtung des gesamten Verfahrens erfolgen.
Zunächst soll die Vorwärtsprädiktion für einen zu verarbeitenden Block von Signalwerten {q₁, ..., q_D} untersucht werden. Sofern keine Quantisierung involviert ist, so kann dies als lineares Gleichungssystem aufgefasst werden: x1 = q1·a1 + w1 x2 = q2·a1 + q1·a2 + w2 x3 = q3·a1 + q2·a2 + q1·a3 + w3 xi = qi·a1 + qi-1·a2 + ... + q1·ai + wi wobei x_i die Werte des Prädiktionsfehlers, a_i die Koeffizienten des Prädiktionsfehlerfilters bezeichnet, F(z) = 1 – H(z)z^–1 gilt sowie w_i die Filterzustände beschreibt. Da lineare Systeme durch Matrizen und Zustandsvektoren dargestellt werden können, werden diese Gleichungen nun vektoriell umschrieben: x = Fq + w. (44)
Nachdem aber die verwendete Quantisierung hochgradig nichtlinear ist, können lineare Gleichungen nur eingeschränkt zur Darstellung des gesamten Systems verwendet werden. Beispielsweise lässt sich aber der vorwärtsprädizierte Radius r_νp aus obiger Gleichung sehr einfach ermitteln, da hierfür bekanntlich keinerlei Quantisierung zu berücksichtigen ist. rνp = ||x|| (45)
Betrachtet man nun die Empfängerseite, an der ebenfalls quantisierte Werte y auftreten, so ergibt sich durch die Umkehrung des beschriebenen Vorgangs die Gleichung q ^ = F–1(y – w). (46)
Da die Filterkoeffizienten sowohl am Sender als auch am Empfänger bekannt sind, können diese mit dem Quellvektor q zu einem Vektor ν zusammengefügt werden. ν = q + F–1w. (47)
Nun kann (46) mit den quantisierten Vektoren kompakt dargestellt werden: ν ^ = F–1y. (48)
Die Quantisierungsgeräuschleistung entspricht nun der quadratischen Abweichung des Vektors ν ^ vom unquantisierten Vektor ν, sodass das Problem der Suche nach einer geeigneten Quantisierungszelle, jetzt vektoriell durch eine Minimierung dieses quadratischen Fehlers E(.) umschrieben werden kann: E(ν ^) =||(ν ^ – ν)||2 = (ν ^ – ν ^)T(ν ^ – ν). (49)
Unter Verwendung von (48) erhält man E(Y) = ||(ν ^ – ν)||2 = yT(F–1)TF–1y – yT(F–1)Tν – νTF–1y + ||ν||2. (50)
Die Anwendung des Gradienten
liefert die Richtungableitung des Fehlers für einen gegebenen Vektor y. ∇E(y) = 2(F–1)TF–1y – 2(F–1)Tν (52)
Dieser Gradient kann nun als Ausgangspunkt für weitere Ansätze wie beispielsweise ein Gradientenabstiegsverfahren genutzt werden.
Möglich ist z.B. die iterative Bestimmung eines lokalen Fehlerminimums auf der Hypersphäre, das dann zur Quantisierung der Winkel dient, wodurch der Rechenaufwand mittels paralleler Radiussuche entfällt.
Eine weitere Möglichkeit ist eine Kombination mit der vorgestellten, schrittweisen Berechnung, in welcher der Gradient als Auswahlkriterium für einen möglicherweise günstigeren Winkelindex im i-ten Schritt dient. Hierzu erweist sich die Verwendung eines polaren Gradienten, der die Richtungsableitung nach den Winkeln anstelle der kartesischen Koordinaten beschreibt, als sehr vorteilhaft.
Hinsichtlich der Fehlerminimierung können auch andere Ansätze wie die Lagrange'sche Optimierung zum Einsatz kommen. Eine Einschränkung, die hierbei verwendet werden kann, ist die Beschränkung auf die Oberfläche der Hypersphäre mit quantisiertem Radius, gegeben durch ||y||2 = yT y = r ^2(53)
Des Weiteren kann durch diese vektoriellen Beschreibung das Koordinatensystem beliebig gedreht werden. Da eine Drehung den Betrag beibehält und dadurch leistungsinvariant bzgl. des Signals und des Quantisierungsfehlers ist, kann z.B. die Matrix F^–1 durch QR-Zerlegung in eine obere Dreiecks-Matrix umgeformt werden. Eine beidseitige Multiplikation durch die Dreh-Matrix Q^–1 = Q^T ist zulässig, da der Fehler in ν ^ betragsmäßig nicht verändert wird. ν ^ = F–1y = QRy (54) ν ^Q–1 = Ry (55)
Auf diese Art und Weise können wir jetzt durch die Matrix R = Q^–1 F^–1 von zukünftigen Werten auf vergangene Werte prädizieren, müssen dementsprechend aber für eine schrittweise Berechnung wieder unser polares Koordinatensystem umstellen.
In die Suche nach einer geeigneten Zelle kann noch ein weiterer Mechanismus eingebracht werden, um eine zusätzliche Verbesserung des Störabstandes zu erzielen:
Eine Korrektur des letzten Winkels in Abhängigkeit von der letzten kartesischen Koordinate x_D. Diese wird bereits mit dem letzten Winkel φ_D-1, festgelegt, welcher wiederum aus der vorletzten kartesischen Koordinate x_D_₁ ermittelt wurde. Im unquantisierten Fall stellt dies kein Problem dar: ist der verwendete Radius optimal, so kann die letzte Koordinate auch aus
bestimmt werden, wobei ihr Vorzeichen abhängig vom Quadranten des letzten Winkels ist. Dies ist äquivalent zur Aussage, dass der Punkt (x_D-1, x_D) auf dem letzten Breitenkreis mit Radius b₁ liegt. Bei einer Rückwärtsprädiktion ist allerdings davon auszugehen, dass das verwendete Koordinatensystem fehlerbehaftet ist, und somit der Wert nicht korrekt berechnet werden kann. Eine Ursache hierfür stellt bereits die Verwendung von abweichenden, quantisierten Werten dar. Demnach werden die letzten beiden rekonstruierten Werte nicht notwendigerweise auf einem gemeinsamen Kreis liegen, wie es eigentlich durch die Winkelbeziehung von Sinus und Cosinus gefordert wird. Der durch x_D-1 berechnete Winkel wird somit nur ungefähr die richtige Richtung angeben.
Abhilfe schafft hier eine Suche im letzten Winkel, die aus der Umgebung des durch x_D-1 berechneten Winkels diejenige Zelle mit dem kleinsten Fehler auswählt, siehe 9. Der Rechenaufwand dieser Winkelkorrektur ist durch die Anzahl δ_ν der zu durchsuchenden Nachbarzellen skalierbar.
Geht man davon aus, dass jeder Berechnungsschritt in der i-ten Dimension ungefähr gleich aufwendig ist und der Aufwand durch eine Suche im letzten Winkel linear mit der Anzahl der Nachbarzellen steigt, so fällt eine Suche im letzten Winkel besonders für große D nicht sonderlich ins Gewicht, verbessert aber durch den erzielten SNR-Gewinn die Leistungsfähigkeit des Systems. Wie aus 10 erkennbar ist, kann durch eine Suche im Abstand von mehr als der doppelten Quantisierungszellenkantenlänge der Störabstand nicht wesentlich gesteigert werden. Daher ist die Wahl einer Reichweite von zwei Nachbarzellen ausreichend.
Sphärisch Logarithmische Quantisierung ist ein Vektorquantisierungsverfahren zur effizienten Digitalisierung analoger Signale mit einem hohen Dynamikbereich sowie einem hohen Störabstand unter bestmöglicher Beibehaltung der ursprünglichen Wellenform. Kurze Vektoren mit Abtastwerten werden in sphärischen Koordinaten repräsentiert, während die Ausnutzung von Korrelationen innerhalb des Quellensignals mittels differentieller Pulscodemodulation (DPCM) erfolgt. Diese Erfindung beinhaltet eine Lösung für das Problem, dieses Vektorquantisierungsverfahren mit DPCM zu kombinieren. Eine schrittweise sphärische Quantisierung erlaubt eine extreme Reduktion des Rechenaufwandes im Vergleich zu bekannten Verfahren. Darüberhinaus wird ein neues Verfahren für eine optimale Indizierung der Quantisierungszellen, welche die Oberfläche einer mehrdimensionalen Kugel bedecken, vorgestellt – sowohl seitens des Encoders, als auch seitens des Decoders.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei die Signalwerte für die Transformation in sphärische Koordinaten so angeordnet werden, dass für die Bestimmung der quantisierten Werte durch Quantisierung von Winkeln und Betrag (sphärische Quantisierung) nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei für den Betrag des in Kugelkoordinaten quantisierten Blocks von Signalwerten eine Schätzung durch Vorwärtsprädik tion vorgenommen wird und die Rückwärtsprädiktion für mehrere unterschiedliche Beträge in der Nähe dieses Schätzwertes parallel ausgeführt wird.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei der ermittelten Quantisierungszelle ein Quantisierungsindex zugeordnet wird als Teilfläche auf der Einheitskugel vom unteren Pol (Südpol, d.h. alle Elevationswinkel sind –90 Grad) bis zur aktuellen Quantisierungszelle im Verhältnis zur gesamten Oberfläche und multipliziert mit der Gesamtzahl der Zellen.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Ferner werden die Abgrenzungen der einzelnen Quantisierungszellen durch Drehung der Ebenen des Koordinatensystems angeordnet, dass für die Quantisierung des aktuellen Wertes nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Ferner wird der Azimuthwinkel derart quantisiert, dass die geringstmögliche Fehlerleistung in den von ihm abhängenden Rekonstruktionswerten erzielt wird, dass die Quantisierung des Azimuthwinkels hinsichtlich dem Erreichen der geringsten möglichen Fehlerleistung der letzten beiden Werte eines jeden Blockes durchgeführt wird.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion). Die Auswahl der zu verwendenden Quantisierungszelle mittels eines Gradientenabstiegsverfahrens bzgl. der Fehlerleistung wird unter Verwendung der vergangenen und dem aktuellen Eingangswert durchgeführt.
Die vorliegende Erfindung betrifft ein Verfahren zur blockweisen Digitalisierung von Analogsignalen mit Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), infolge Quantisierunseffekte freibleibende Indexzahlen werden durch entsprechend feinere Quantisierung beim nachfolgenden Winkel weiterverwertet, sodass keine Indexzahlen ungenutzt verbleiben.
LITERATUR ZUM STAND DER TECHNIK

[1] J. B. Huber, B. Matschkal. Spherical logarithmic Quantization and its Application for DPCM 5th International ITG Conference on Source and Channel Coding (SCC), pp. 349-356, Erlangen, Germany, January 2004.
[2] N. S. Jayant, P. Noll. Digital Coding of Waveforms. Prentice-Hall, Englewood Cliffs, New Jersey, 1984.
[3] Johannes B. Huber, Bernd Matschkal. Spherical Logarithmic Quantization and its Application for DPCM Facta Universitatis (Nis), Series: Electronics and Energetics, Vol. 17, No. 2, pp. 165-184, August 2004.
[4] Philips Classics Productions 1994 (DDD): Mozart: "Die Zauberflöte". Polygram Records #442569-2, Tracks 1 and 3.
[5] Z. Utkovski, A. Utkovski, T. Eriksson. High-Dimensional Spherical Quantization of Gaussian Sources 9th Canadian Workshop on Information Theory (CWIT), pp. 211-214, Montreal, Quebec, June 2005.

Weiterer Stand der Technik:

K. Tröndle, R. Weiß. Einführung in die Pulscodemodulation. Oldenbourg Verlag, Munich, 1974.
T. Berger. Lossy Source Coding. IEEE Transactions on Information Theory, pp. 2693-2723, Oct. 1998.
R. M. Gray, David L. Neuhoff Quantization. IEEE Transactions on Information Theory}, pp. 2325-2383, Oct. 1998.
J. H. Conway and N. J. A. Sloane. Sphere Packings, Lattices, and Groups. Springer-Verlag, 3rd edition.
Robert F. H. Fischer. Precoding and Signal Shaping for Digital Transmission, pp. 258-281, John Wiley & Sons, Inc., New York, 2002. ISBN 0471 22410 3.
Panter, P. F., and W. Dite. Quantizing Distortion in Pulse-Count Modulation with Nonuniform Spacing of Levels. Proc. IRE, p. 44, Jan. 1951.
Erik Agrell, Thomas Eriksson, Alexander Vardy, Kenneth Zeger. Closest Point Search in Lattices. IEEE Transactions on Information Theory, pp. 2201-2214, Aug. 2002
Manfred Herbert. Lattice-Quantisierung von Sprach- und Sprachmodellsignalen. Ausgewählte Arbeiten über Nachrichtensysteme, Nr. 79, Editor: H. -W. Schüßler, Erlangen 1991.
L. Pakula and S. Kay. Simple Proofs of the Minimum Phase Property of the Prediction Error Filter, IEEE Transactions on ASSP, vol. 31, 1983.
Volder, Jack. The CORDIC Trigonometric Computing Technique. IRE Trans. Electronic Computing, Vol EC-8, pp. 330-334, Sept. 1959.
Audio examples are available at http://www.LNT.de/LIT/audio-example

Claims

Verfahren zur blockweisen Digitalisierung von Analogsignalen mit den Schritten: Transformation der Analogsignale von kartesischen Koordinaten in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei trotz blockweiser Verarbeitung die Digitalisierung für die einzelnen Signalwerte in kartesischen Koordinaten ohne Beeinflussung durch die nachfolgenden Signalwerte erfolgt, wodurch eine verzögerungsfreie Erzeugung von Prädiktionswerten aus bereits quantisierten Signalwerten ermöglicht wird und für die Verbindung von blockweiser Quantisierung mit DPCM keine Restriktion bzgl. der Blocklänge entsteht.
Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach Anspruch 1, mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei die Signalwerte für die Transformation in sphärische Koordinaten so angeordnet werden, dass für die Bestimmung der quantisierten Werte durch Quantisierung von Winkeln und Betrag (sphärische Quantisierung) nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach Anspruch 1 oder 2 mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei für den Betrag des in Kugelkoordinaten quantisierten Blocks von Signal eine Schätzung durch Vorwärtsprädiktion vorgenommen wird und die Rückwärtsprädiktion für mehrere unterschiedliche Beträge in der Nähe dieses Schätzwertes parallel ausgeführt wird.
Verfahren zur blockweisen Digitalisierung von Analogsignalen, insbesondere nach einem der Ansprüche 1 bis 3, mit den Schritten: Transformation von kartesischen in Kugelkoordinaten und Anwendung einer Signalprädiktion mit Gewinnung der Prädiktionswerte aus den bereits quantisierten Signalwerten (Differentielle Pulscodemodulation (DPCM) mit Rückwärtsprädiktion), wobei der ermittelten Quantisierungszelle ein Quantisierungsindex zugeordnet wird als Teilfläche auf der Einheitskugel vom unteren Pol (Südpol, d.h. alle Elevationswinkel sind –90 Grad) bis zur aktuellen Quantisierungszelle im Verhältnis zur gesamten Oberfläche und multipliziert mit der Gesamtzahl der Zellen.
Verfahren nach einem der Ansprüche 1 bis 4, wobei die Abgrenzungen der einzelnen Quantisierungszellen durch Drehung der Ebenen des Koordinatensystems so angeordnet werden, dass für die Quantisierung des aktuellen Wertes nur vergangene und der aktuelle Eingangswert, jedoch nicht nachfolgende Eingangswerte benötigt werden.
Verfahren nach einem der Ansprüche 1 bis 5, wobei der Azimuthwinkel derart quantisiert wird, dass die geringstmögliche Fehlerleistung in den von ihm abhängenden Rekonstruktionswerten erzielt wird.
Verfahren nach einem der Ansprüche 1 bis 5, wobei die Auswahl der zu verwendenden Quantisierungszelle mittels eines Gradientenabstiegsverfahrens bzgl. der Fehlerleistung unter Verwendung der vergangenen und dem aktuellen Eingangswert durchgeführt wird.
Verfahren nach einem der Ansprüche 1 bis 7, wobei infolge Quantisierunseffekte freibleibende Indexzahlen durch entsprechend feinere Quantisierung beim nachfolgenden Winkel weiterverwertet werden, sodass keine Indexzahlen ungenutzt verbleiben.