HINTERGRUND DER ERFINDUNG
Gebiet der Erfindung
-
Die vorliegende Erfindung bezieht sich auf eine
Videosignal-Codiervorrichtung zum Komprimieren und
Codieren eines Videosignals, indem es in Blöcke geteilt
wird und eine orthogonale Transformation an jedem
Block durchgeführt wird.
Beschreibung des Standes der Technik
-
Wenn in digitale Signale umgewandelte Videodaten
direkt auf einem Band oder einem anderen
Aufzeichnungsmedium aufgezeichnet werden, ist das Volumen der
Daten so groß, daß es gewöhnlich die Grenze der
Datenmenge, welche das Aufzeichnungsmedium speichern kann,
überschreitet. Daher ist es erforderlich, wenn ein
digitales Videosignal auf einem Band oder einem
anderen Aufzeichnungsmedium aufgezeichnet wird, es zu
verdichten, so daß das Datenvolumen die Grenze nicht
überschreitet. Um dies zu erreichen, war es bekannt,
das Videosignal durch Verwendung einer hochwirksamen
Codiervorrichtung zu verdichten.
-
Ein Beispiel für eine derartige hochwirksame
Codierung, die in weitem Umfang angewendet wurde, ist da
Codierverfahren mit orthogonaler Transformation, bei
welchem durch orthogonale Transformation des
ursprünglichen Signals erhaltene
Transformationskoeffizienten zum Codieren quantisiert werden. Dieses
Verfahren ist bekannt, um einen hohen Codierwirkungsgrad
zu erhalten. Wenn ein Videosignal durch dieses
Verfahren codiert wird, wird das Videosignal zuerst in
Blöcke geteilt, die aus jeweils n · n Pixeln bestehen
(wobei n eine ganze Zahl ist), wird eine orthogonale
Transformation an jedem Block durchgeführt, um ihn in
einen Transformationskoeffizienten zu transformieren,
der n · n Frequenzbereiche darstellt, und dann wird
der Transformationskoeffizient quantisiert. Wenn
jedoch alle Blöcke mit derselben Anzahl von Bits
quantisiert werden, kann eine adäquate Bildqualität für
die Videoblöcke in flachen Bereichen erhalten werden,
aber ein Rauschen tritt in den Videoblöcken auf, die
Kantenbereiche enthalten, da Fehler in der Nähe der
Kantenbereiche verstreut sind.
-
Ein Beispiel für eine Codiervorrichtung, die das
obige Problem überwindet, ist in der Japanischen
Patentanmeldungs-Offenlegungsschrift Nr. JP-A-2 105 792
offenbart. Fig. 1 zeigt ein Blockschaltbild der in
der Patentveröffentlichung offenbarten
Codiervorrichtung. Die gezeigte Codiervorrichtung wird nachfolgend
mit Bezug auf Fig. 1 beschrieben. Ein Videosignal
wird in eine Blockbildungsschaltung 51 eingegeben, in
welcher es in Blöcke geteilt wird, und jeder Block
wird dann zu einer Orthogonaltransformationsschaltung
52 für eine orthogonale Transformation geliefert. Der
durch die orthogonale Transformation erhaltene
Transformationskoeffizient wir durch eine
Quantisierungsschaltung 53 quantisiert. Die Quantisierungsschaltung
53 hat die Fähigkeit, eine Quantisierung unter
Verwendung einer variablen Anzahl von Quantisierungsbits
zu quantisieren. Eine
Kantenbereichs-Erfassungsschaltung 54 ist zum Erfassen der Kanten des Videosignals
vorgesehen, während eine
Flachbereichs-Erfassungsschaltung 55 vorgesehen ist, um festzustellen, ob der
Block einen flachen oder ebenen Bereich darstellt.
Auf der Grundlage der Ausgangssignale der
Kantenbereichs-Erfassungsschaltung 54 und der Flachbereichs-
Erfassungsschaltung 55 stellt eine
Blockidentifizierungsschaltung 56 fest, ob der Block einen
Kantenbereich sowie einen Flachbereich enthält, und das
Ergebnis hiervon wird zu der Quantisierungsschaltung 53
geführt, um die Anzahl von Quantisierungsbits zu
bestimmen. Wenn der gesamte Block flach ist oder wenn
der gesamte Block eine komplizierte Struktur hat,
wird bestimmt, daß ein kleinerer Bitcode für die
Quantisierung verwendet wird, da Rauschen nicht
merklich sichtbar ist. Wenn andererseits der Block einen
Kantenbereich sowie einen Flachbereich enthält, wird
bestimmt, daß ein höherer Bitcode für die
Quantisierung verwendet wird, um die Erzeugung von Rauschen in
dem Flachbereich zu verhindern. Somit werden bei der
in der obigen Patentveröffentlichung offenbarten
Codiervorrichtung, um das vorerwähnte Problem zu
überwinden, die Transformationskoeffizienten für Blöcke,
die sowohl Kanten- als auch Flachbereiche enthalten,
unter Verwendung eines höheren Bitcodes quantisiert,
um das Rauschen zu reduzieren und hierdurch die
Bildqualität nach der Decodierung zu verbessern. Die
bestimmenden Faktoren, die zur Erfassung der Kanten-
oder Flachbereiche in einem Block verwendet werden,
enthalten eine Varianz innerhalb des Blocks, den
maximalen Wert des Blocks, den dynamischen Bereich des
Blocks usw. Diese Faktoren werden zusammen als der
Aktivitätsindex bezeichnet. Bei der obigen
Codiervorrichtung nach dem Stand der Technik wird die Anzahl
von Quantisierungsbits (Quantisierungspegel) für
jeden Block auf der Basis des Aktivitätsindexes
ausgewählt.
-
Das Ausgangssignal der Quantisierungsschaltung 53 in
Fig. 1 wird gewöhnlich unter Verwendung einer
Entropiecodierung wie einer Huffman-Codierung in einen
Code variabler Länge für die Übertragung codiert. Die
Bitlänge eines Blocks nach der Codierung mit
variabler Länge variiert von Block zu Block, und in dem
Fall eines Aufzeichnungsmediums wie einem digitalen
Videobandaufzeichnungsgerät mit wendelförmiger
Abtastung (VTR) mit einer festen Spurlänge ist
zweckmäßig, die Anzahl von pro Spur aufzuzeichnenden
Datenblöcken zu ergreifen. Daher ist es eine übliche
Praxis, zumindest die Anzahl von pro Spur
aufzuzeichnenden Datenblöcken vorzubestimmen. Auch wenn
blockkorrigierende Codes (z. B. BCH-Codes, Reed-Solomon-Codes
usw.) als fehlerkorrigierende Codes verwendet werden,
kann dies so durchgeführt werden, daß die Datenlänge
von Codes mit variabler Länge für jeden
fehlerkorrigierenden Block festgelegt wird. Gewöhnlich wird bei
der Codierung von Videosignalen ein Halbbild oder
Vollbild in N Segmente (wobei N eine ganze Zahl ist)
geteilt, wobei jedes Segment als eine Einheit dient,
und die maximale Datenmenge wird für jede der N
Einheiten eingestellt.
-
Jedoch kann in einem Kanal, wie einem digitalen VTR,
in welchem die Datenlänge für die Codes mit variabler
Länge festgelegt ist, die Datenlänge des Codes mit
variabler Länge von Code zu Code nach der Codierung
mit variabler Länge variieren, abhängig von der Art
des verarbeiteten Bildes, und die gesamte Codelänge
nach der Codierung mit variabler Länge kann die
festgelegte Länge des Kanals überschreiten, was zu einem
Überlauf führt. Wenn dies geschieht, wird die
Übertragung aufgrund des Datenflusses abgeschnitten, und
daher werden nicht nur die übergelaufenen Daten,
sondern auch die nachfolgenden Daten nicht übertragen.
Dies stellt das Problem der Unfähigkeit einer
korrekten Durchführung der Decodierung des ursprünglichen
Signals dar.
-
Eine Codierung mit variabler Länge eines
Fernsehbildes wird üblicherweise durchgeführt in der Folge von
links nach rechts und von oben nach unten auf dem
Fernsehschirm. Daher besteht das Problem darin, daß
das vorerwähnte Abschneiden wahrscheinlich in der
Mitte des Fernsehschirms auftritt, in der die
Merkmalselemente des Bildes enthalten sind.
-
IEEE TRANSACTIONS ON ACOUSTICS AND SPEECH AND SIGNAL
PROCESSING; Band 37, Nr. 11, November 1989, NY, US,
Seiten 1743-1749, NGAN et al.: "Adaptive Cosine
Transform Coding of Images in Perceptual Domain"
offenbart bereits eine Videosignal-Codiervorrichtung
zum Verdichten und Codieren eines digitalen
Videosignals, um codierte Daten zu erhalten, die innerhalb
einer vorbestimmten Datenmenge verdichtet sind. Die
Vorrichtung umfaßt Mittel zum Strukturieren von
Blöcken, die jeweils aus mehreren Pixeln in dem
Videosignal bestehen, Mittel zum Durchführen einer
orthogonalen Transformation an jedem der strukturierten
Blöcke, um einen Transformationskoeffizienten zu
erhalten, Mittel zum Quantisieren des
Transformations
koeffizienten, Mittel zum Codieren der quantisierten
Daten, um codierte Daten zu erhalten, Mittel zum
Speichern der erhalten codierten Daten, und Mittel
zum Steuern der Quantisierungsmittel auf der
Grundlage der Menge der in den Speichermitteln gespeicherten
codierten Daten.
-
PAJP, Band 12, Nr. 124 (E 601) zeigt ein Bildsignal-
Übertragungssystem, welches ein glattes sich
bewegendes Wiedergabebild mit verbesserten visuellen
Eigenschaften erhält, indem beide Oberflächen in mehrere
Bereiche geteilt werden, eine Priorität für die
jeweiligen Bereiche ausgeübt wird und mehr
Informationen des Bereichs mit der höheren Priorität als
Informationen des Bereichs mit der niedrigeren Priorität
übertragen werden.
-
PAJP, Band 12, Nr. 355 (E 661) beschreibt eine
Bildverdichtungsvorrichtung, welche, um die Anzahl von
Quantisierungsfehlern zu reduzieren und die
Verarbeitungszeit zu verkürzen, eine
Vorverarbeitungsvorrichtung, welche ursprüngliche Bilddaten vorverarbeitet,
und einen Wiederordnungsabschnitt, welcher ein
orthogonal transformiertes Ausgangssignal wieder in
Blöcken derselben Frequenzkomponente anordnet, aufweist.
-
Weiterhin bezieht sich EP-A-0 322 955 auf einen
Empfänger für ein Fernsehsignal mit hoher Auflösung, bei
welchem das Signal vor der Übertragung einer
Subabtastung auf einer Block-für-Block-Basis entsprechend
der Bewegung unterzogen wird. Das empfangene
subabgetastete Signal wird zu einer Schiebevorrichtung
geführt, welche die Pixel von Blöcken in einer Weise
verschiebt, welche umgekehrt zu der vor der
Übertragung durchgeführten ist.
ZUSAMMENFASSUNG DER ERFINDUNG
-
Es ist die Aufgabe der Erfindung, eine Videosignal-
Codiervorrichtung zu schaffen, welche in der Lage
ist, die codierte Datenlänge auf eine vorbestimmte
Länge zu fixieren, worin Verzerrungen, welche sich
aus Übertragungsabschneidungen ergeben, nicht leicht
sichtbar sind, selbst wenn die Codelänge der zu
übertragenden Daten fixiert ist.
-
Gemäß einem ersten Ausführungsbeispiel der
vorliegenden Erfindung weist eine Videosignal-
Codiervorrichtung zum Komprimieren und Codieren eines
digitalen Videosignals auf: Eine
Blockstrukturiervorrichtung zum Strukturieren des Videosignals in einer
Matrixanordnung von Blöcken, die jeweils aus mehren
Pixeln bestehen, eine Transformationsvorrichtung zum
Durchführen einer orthogonalen Transformation an
jedem der Blöcke um einen Transformationskoeffizienten
zu erhalten, und eine Codiervorrichtung zum Codieren
des erhaltenen Transformationskoeffizienten, um
codierte Daten zu erhalten, welche Vorrichtung
gekennzeichnet ist durch eine
Einheitenstrukturiervorrichtung zum Strukturieren von Einheiten, die jeweils
mehrere Blöcke aufweisen, vor der orthogonalen
Transformation durch die Transformationsvorrichtung, in
einer solchen Weise, daß irgendein gegebener Block
und vier dem gegebenen Block am nächsten befindliche
Blöcke zu verschiedenen Einheiten gehören, die die
Größe haben, die die Blöcke des Farbsignals auf dem
Schirm einnehmen.
-
Gemäß einem bevorzugten Ausführungsbeispiel enthält
das digitale Videosignal ein Farbsignal, und die
Einheitenstrukturiervorrichtung weist eine
Umordnungsvorrichtung auf zum Strukturieren durch Umordnen der
Blöcke in einer solchen Weise, daß irgendein
gegebener Block und vier dem gegebenen Block am nächsten
befindliche Blöcke zu verschiedenen Einheiten
gehören, wobei die Größe der Umordnungseinheit von der
Größe abhängt, die die Blöcke des Farbsignals auf dem
Schirm einnehmen.
-
Gemäß einem weiteren bevorzugten Ausführungsbeispiel
umfaßt die Videosignal-Codiervorrichtung eine
Bestimmungsvorrichtung zum Bestimmen der Reihenfolge, in
welcher die Blöcke zu codieren sind, wobei die
Reihenfolge innerhalb jeder Einheit so ist, daß die
Codierung so durchgeführt wird, daß mit den Blöcken
begonnen wird, die sich näher an der Mitte des Schirms
befinden, und dann zu den Blöcken weitergegangen
wird, die sich näher an den Seiten des Schirms
befinden; und eine Steuervorrichtung zum Steuern der Menge
der codierten Daten auf einer Einheit-für-Einheit-
Basis.
-
Die obigen und weiteren Aufgaben und Merkmale der
Erfindung werden deutlicher aus der folgenden
detaillierten Beschreibung mit den begleitenden
Zeichnungen.
KURZBESCHREIBUNG DER ZEICHNUNGEN
-
Fig. 1 ist ein Diagramm, das die Konfiguration
einer Videosignal-Codiervorrichtung nach dem
Stand der Technik zeigt.
-
Fig. 2 ist ein Diagramm, das die Konfiguration
einer Videosignal-Codiervorrichtung mit einer
Codierschaltung für variable Längen und
einem Pufferspeicher zeigt.
-
Fig. 3 ist ein Diagramm, das ein Beispiel für die
Codierung während der Verarbeitung zeigt.
-
Fig. 4 ist ein Diagramm, das die Abtastfolge
während des Codierens zeigt.
-
Fig. 5 ist ein Diagramm, das eine alternative
Konfiguration der Vorrichtung nach Fig. 2
zeigt.
-
Fig. 6 ist ein Diagramm, das Codelängenvariationen
zeigt, die durch Umordnen egalisiert werden.
-
Fig. 7 ist ein Diagramm, das Umordnungseinheiten
für ein Abtastverhältnis von 4 : 1 : 1 zeigt.
-
Fig. 8 ist ein Diagramm, das Umordnungseinheiten
für ein Abtastverhältnis von 4 : 2 : 0 zeigt.
-
Fig. 9 ist ein Diagramm, das Beispiel für die
Umordnung zeigt.
-
Fig. 10 ist ein Diagramm, das Umordnungseinheiten
für ein Abtastverhältnis von 4 : 1 : 0 zeigt.
-
Fig. 11 ist ein Diagramm, das die Konfiguration
einer Videosignal-Codiervorrichtung gemäß
einem ersten Ausführungsbeispiel der Erfindung
zeigt.
-
Fig. 12 ist ein Diagramm, das die Operation des
Umordnens bei dem ersten Ausführungsbeispiel
erläutert.
-
Fig. 13 ist ein Diagramm, das das Prinzip der
Umordnung bei dem ersten Ausführungsbeispiel
er
läutert.
-
Fig. 14 ist ein Diagramm, das ein Beispiel des
Umordnens bei dem ersten Ausführungsbeispiel
zeigt.
-
Fig. 15 ist ein Diagramm, das ein anderes Beispiel
des Umordnens bei dem ersten
Ausführungsbeispiel zeigt.
-
Fig. 16 ist ein Diagram, das noch ein anderes
Beispiel des Umordnens bei dem ersten
Ausführungsbeispiel zeigt.
-
Fig. 17 ist ein Diagramm, das die Konfiguration
einer Umordnungsschaltung bei dem ersten
Ausführungsbeispiel zeigt.
-
Fig. 18 ist ein Diagramm, das die Konfiguration
einer Videosignal-Codiervorrichtung gemäß
einem zweiten Ausführungsbeispiel der
Erfindung zeigt.
-
Fig. 19 ist ein Diagramm, das eine alternative
Konfiguration des zweiten Ausführungsbeispiels
zeigt.
-
Fig. 20 ist ein Diagramm, das ein Beispiel für das
Umordnen bei dem zweiten Ausführungsbeispiel
zeigt.
-
Fig. 21 ist ein Diagramm, das ein anderes Beispiel
für das Umordnen bei dem zweiten
Ausführungsbeispiel zeigt.
-
Fig. 22 ist ein Diagramm, das noch ein anderes
Bei
spiel für das Umordnen bei dem zweiten
Ausführungsbeispiel zeigt.
-
Fig. 23 ist ein Diagram, das noch ein anderes
Beispiel für das Umordnen bei dem zweiten
Ausführungsbeispiel zeigt.
-
Fig. 24 ist ein Diagramm, das ein weiteres Beispiel
für das Umordnen bei dem zweiten
Ausführungsbeispiel zeigt.
-
Fig. 25 ist ein Diagramm, das noch ein weiteres
Beispiel für das Umordnen bei dem zweiten
Ausführungsbeispiel zeigt.
-
In Fig. 2 zeigt die Bezugszahl 1 eine
Blockbildungsschaltung zum Teilen des eingegebenen digitalen
Videosignals in Blöcke, die jeweils aus mehreren Pixeln
bestehen, an. Jeder Block wird von der
Blockbildungsschaltung 1 zu einer DCT-Schaltung 2 geführt. Die
DCT-Schaltung 2 führt eine diskrete
Kosinustransformation (DCT) an jedem Block durch und liefert den
erhaltenen Transformationskoeffizienten
(DCT-Koeffizient) zu einer Wichtungsschaltung 3. Die
Wichtungsschaltung 3 führt eine Wichtung an jedem
DCT-Koeffizienten durch und liefert den gewichteten
DCT-Koeffizienten zu einer Quantisierungsschaltung 4. Die
Quantisierungsschaltung 4 quantisiert den gewichteten
DCT-Koeffizienten mit der Anzahl von
Quantisierungsbits, die durch eine Steuervorrichtung 8 bestimmt
wurden, und liefert den quantisierten
DCT-Koeffizienten über einen Schalter 7 zu einer
Codierschaltung 5 für variable Längen. Die Codierschaltung 5 für
variable Längen codierte den quantisierten DCT-
Koeffizienten in einen Code von variabler Länge und
überträgt die codierten Daten von variabler Länge zu
einem Pufferspeicher 6. Der Pufferspeicher 6 wird aus
einem RAM oder dergleichen gebildet und hat eine
Speicherkapazität, die der Datenlänge einer Spur
äquivalent ist. Der Schalter 7 schaltet den
Dateneingang für die Codierschaltung 5 für variable Längen
ein und aus. Die Steuervorrichtung 8 steuert die
Anzahl von Quantisierungsbits für die
Quantisierungsschaltung 4 sowie die Schaltoperationen des Schalters
7 auf der Grundlage der Menge der in dem
Pufferspeicher 6 gespeicherten Daten.
-
Die Arbeitsweise wird nun beschrieben.
-
Die durch Abtasten des Videosignals erhaltenen Daten
werden von der Blockbildungsschaltung 1 in Blöcke
geteilt, die jeweils aus beispielsweise acht Pixeln
sowohl in der horizontalen als auch in der vertikalen
Richtung bestehen. Die DCT-Schaltung 2 führt eine DCT
an jedem Block durch, und der erhaltene DCT-
Koeffizient wird dann einer Wichtung durch die
Wichtungsschaltung 3 unterzogen. Zu dieser Zeit wird die
Wichtung so durchgeführt, daß Wichtungsfaktoren für
DCT-Koeffizienten in höheren Frequenzbereichen
kleinere Werte sind. Dies ergibt sich daraus, daß die
visuelle Auflösung für höhere Frequenzbereiche absinkt,
was eine hochwirksame Codierung ohne merkbare
Verschlechterung ermöglicht. Als Nächstes wird der
gewichtete DCT Koeffizient durch die
Quantisierungsschaltung 4 quantisiert. Quantisierte n-Bit-Daten
können beispielsweise wie in Fig. 3 gezeigt
ausgedrückt werden. Diese Daten werden durch die
Codierschaltung 5 für variable Längen in einen Code
variabler Länge codiert, indem eine eindimensionale
Abtastung, wie in Fig. 4 gezeigt, durchgeführt wird. Die
Codierschaltung 5 für variable Längen ist eine
Schaltung zum Codieren von Daten in einen Code, dessen
Länge beispielsweise von der Reihe von Nullwerten
(Null-Run-Länge) und Nichtnullwerten abhängt, und
gewöhnlich werden die Huffman-Codierung und ähnliche
Verfahren in weitem Umfang angewendet. Das
Ausgangssignal der Codierschaltung 5 für variable Längen wird
in dem Pufferspeicher 6 gespeichert für die
Übertragung zu dem Übertragungskanal.
-
Jedoch ändert sich die Länge des von der
Codierschaltung 5 für variable Längen ausgegebenen Codes mit
variabler Länge entsprechend dem Bildmuster und kann
abhängig von der Situation die maximal übertragbare
Codelänge überschreiten oder nicht erreichen. Die
Steuervorrichtung 8 sagt ein Auftreten von
überschüssigen Daten voraus durch Vergleich des in den
Pufferspeicher 6 eingeschriebenen Adressenwertes mit der
begrenzten Datenlänge und gibt Signale aus zum
Steuern der Anzahl von Quantisierungsbits für die
Quantisierungsschaltung 4 und der Schaltoperationen des
Schalters 7.
-
Daher kann, selbst wenn das Datenvolumen in einem
bestimmten Bereich des Bildes auf dem Fernsehschirm
augenblicklich zunimmt, der Pufferspeicher 6 eine
ausreichende Kapazität für die Datenspeicherung
bereitstellen, und es tritt keine Situation auf, die zu
einem Überlauf führt oder die bewirkt, daß die
Steuervorrichtung 8 die Übertragung direkt unterbricht.
-
Fig. 5 ist ein Blockschaltbild, das eine alternative
Konfiguration zeigt. Bei dieser alternativen
Konfiguration steuert die Steuervorrichtung 8 nur die
Schaltoperationen des Schalters 7.
-
Wenn Daten auf einem VTR-Band aufgezeichnet werden,
hängt die Codemenge in großem Maße von dem
aufzu
zeichnenden Bildmuster ab. Es ist zweckmäßig, die
Datenlänge auf eine Länge zu fixieren, die durch Teilen
der Spurlänge durch eine ganze Zahl berechnet wurde.
Es ist gewöhnlich sehr zweckmäßig, die Datenlänge
durch Teilen eines Halbbildes oder eines Vollbildes
oder m Vollbilder in n Einheiten zu fixieren. Fig. 6
zeigt beispielsweise die erzeugte Codemenge, wenn ein
Vollbild in zehn Einheiten geteilt wird. Das Symbol -
Δ - in Fig. 6 stellt die Codemenge dar. Wie gezeigt
ist, überschreiten vier der zehn Einheiten in großem
Umfang die übertragbare Grenze, während die anderen
sechs Einheiten weit unter der Grenze sind. Wenn eine
Unterbrechungssteuerung bei den vier Einheiten mit
einem großen Ausmaß durchgeführt wird, ist die
Codemenge zu reduzieren, wobei der Rauschabstand in einem
bestimmten Grad geopfert wird, während andererseits
eine Verbesserung des Rauschabstandes für die
verbleibenden sechs Einheiten durch das Hinzufügen
zusätzlicher Daten usw. erwartet wird. Wenn die
Codemenge zwischen den Einheiten gesteuert wird, kann
eine derartige Vorspannung bei der Codemengenverteilung
unberücksichtigt bleiben, da die von den vier
Einheiten überlaufende Codemenge unter Verwendung der
anderen sechs Einheiten übertragen werden kann
(tatsächlich unter Verwendung von Einheiten in dem nächsten
Vollbild).
-
Jedoch dient eine Verarbeitung, die zu viele
Einheiten abdeckt, nur dazu, die Hardwarekonfiguration zu
komplizieren und ergibt keine nennenswerten Vorteile.
Es ist daher wichtig, die Verarbeitung so
durchzuführen, daß sie innerhalb jeder Einheit beendet ist.
D. h. es ist wichtig, die Vorspannung in der Codemenge
innerhalb jeder Einheit zu minimieren. Eine
Möglichkeit hierfür besteht darin, die erzeugte Codemenge
zwischen den Einheiten auszugleichen durch Umordnen
der Blöcke, so daß irgendein gegebener DCT-Block und
vier DCT-Blöcke, die dem gegebenen DCT-Block am
nächsten sind, zu verschiedenen Einheiten gehören. Die
als ein Ergebnis einer solchen Umordnung erzeugte
Codemenge ist durch das Symbol - O - in Fig. 6
gezeigt. Wie aus Fig. 6 ersichtlich ist, dient die
Umordnung dazu, die erzeugte Codemenge im Wesentlichen
auszugleichen. Die Steuerung der Codemenge innerhalb
jeder Einheit nach dem Ausgleich ist äußerst
vorteilhaft bezüglich der folgenden Punkte. Da die
Codemengensteuerung nur innerhalb jeder Einheit durchgeführt
wird, ist die Ausbildung der Hardware sehr einfach.
Selbst wenn die Codemengensteuerung innerhalb jeder
Einheit durchgeführt wird, tritt nicht die
Notwendigkeit auf, die Geschwindigkeit für einen besonderen
Bereich innerhalb eines Vollbildes zu reduzieren, was
dazu führt, daß eine Konzentration der
Verschlechterung des Rauschabstandes auf einen besonderen Bereich
des Schirms verhindert wird.
-
Wenn spezielle Wiedergabearten betrachtet werden, ist
es zweckmäßiger, wenn die Codemenge gesteuert wird
nach der Durchführung der vorerwähnten Umordnung
durch Bildung von Gruppen der DCT-Blöcke des
Farbsignals, die eine geringere Anzahl von Abtastungen
haben. Genauer gesagt, wenn das Abtastverhältnis
zwischen den Helligkeits- und den Farbsignalen
beispielsweise gleich 4 : 1 : 1 ist, werden horizontal
aufeinander folgende CDT-Blöcke wie in Fig. 7 gezeigt zu
einer Umordnungseinheit gruppiert, und die Umordnung
wird bei dieser Einheit durchgeführt, nach welcher
die Codemenge innerhalb dieser Einheit gesteuert
wird. In dem Fall von speziellen Wiedergabearten
können manche Blöcke nicht wiedergebbar sein, aber wenn
die Umordnung bei der vorstehend konfigurierten
Einheit durchgeführt wird, ist eine Wiedergabe möglich,
wobei sowohl das Helligkeits- als auch das Farbsignal
ausgeglichen sind. Ohne eine derartige Umordnung kann
beispielsweise der zweite DCT-Block von links des
Helligkeitssignals fallen gelassen werden, was zu
einer schwerwiegenden Verschlechterung der Bildqualität
im speziellen Wiedergabebetrieb führt.
-
Wenn weiterhin das Abtastverhältnis zwischen dem
Helligkeits- und Farbsignal gleich 4 : 2 : 0 ist
(Farblinien-Folgeverarbeitung), wird die vorbeschriebene
Umordnung durchgeführt, indem zwei horizontal
benachbarte und zwei vertikal benachbarte DCT-Blöcke in
eine Umordnungseinheit gruppiert werden. Mit dieser
Gruppierung wird die Bereichsgröße, welche ein DCT-
Block des Farbsignals auf dem Schirm einnimmt, gleich
der Umordnungseinheit des Helligkeitssignals. Mit
diesem als einer Umordnungseinheit wird die Umordnung
wie in Fig. 9 gezeigt durchgeführt. Fig. 9 zeigt ein
Beispiel der Umordnung in dem Fall der in Fig. 8
gezeigten Umordnungseinheit, wenn das Abtastverhältnis
zwischen dem Helligkeits- und dem Farbsignal gleich
4 : 2 : 0 ist und wenn ein Halbbild in fünf Einheiten
geteilt ist. Fig. 10 ist ein Beispiel der Umordnung,
wenn das Abtastverhältnis zwischen dem Helligkeits-
und dem Farbsignal gleich 4 : 1 : 0 ist.
-
Die bevorzugten Ausführungsbeispiele der vorliegenden
Erfindung werden nun mit Bezug auf begleitenden
Zeichnungen beschrieben.
(Ausführungsbeispiel 1)
-
Wenn mehrere Blöcke zu einer Einheit gruppiert sind,
war es übliche Praxis, die Codierung Einheit für
Einheit durchzuführen, wobei von einer bestimmten
Position des Schirms ausgegangen wurde (z. B. von der
obe
ren linken Ecke des Schirms). Daher variiert die
Codemenge in großem Maße von Einheit zu Einheit, und
es tritt das Problem auf, daß der
Übertragungswirkungsgrad abnimmt, wenn die obere Grenze der
Datenmenge so eingestellt ist, daß sie den Einheiten mit
einer größeren Codemenge angepaßt ist. Das erste
Ausführungsbeispiel und das nachfolgende zweite
Ausführungsbeispiel der Erfindung sind vorgesehen, um ein
derartiges Problem zu überwinden.
-
Fig. 11 ist ein Blockschaltbild, das die
Konfiguration einer Videosignal-Codiervorrichtung gemäß dem
ersten Ausführungsbeispiel der Erfindung zeigt. In Fig.
11 bezeichnen die Bezugszahlen, 2, 3, 4 und 5 eine
DCT-Schaltung, eine Wichtungsschaltung, eine
Quantisierungsschaltung bzw. eine Codierschaltung für
variable Längen. Diese Schaltungen sind identische mit
den in Fig. 5 gezeigten. In der vorderen Stufe der
DCT-Schaltung 2 ist eine Blockbildungs-
/Umordnungsschaltung 41 vorgesehen zum Teilen eines
digitalen Videosignals in Blöcke mit mehreren Pixeln
und zum Umordnen der so erhaltenen Blöcke. Die
Blockdaten werden von der Blockbildungs-
/Umordnungsschaltung 41 zu der DCT-Schaltung 2
geliefert. Die Quantisierungsschaltung 4 quantisiert den
gewichteten DCT-Koeffizienten mit der Anzahl von
Quantisierungsbits, die von einer
Quantisierungsbitzahl-Bestimmungsschaltung 43 bestimmt wurde, und
liefert den quantisierten DCT-Koeffizienten zu der
Codierschaltung 5 für variable Länge. Die
Codierschaltung 5 für variable Längen codiert den
quantisierten DCT-Koeffizienten in einen Code variabler
Länge und liefert die Codedaten variabler Länge zu
einem Pufferspeicher 42.
-
Die Arbeitsweise wird nun beschrieben:
-
Ein digitales Videosignal wird in Abtastlinienfolge
in die Blockbildungs-/Umordnungsschaltung 41
eingegeben, in welcher das Signal in Blöcke von n · n Pixeln
innerhalb eines Halbbildes oder eines Vollbildes
geteilt und dann beispielsweise entsprechend dem in
Fig. 12 gezeigten Umordnungsformat umgeordnet werden.
Ein Block in Fig. 12 entspricht einem DCT-Block und
das äußere Vollbild entspricht dem des
Fernsehschirms. Wenn das Helligkeitssignal, das dem NTSC-
System entspricht, mit einer Geschwindigkeit von
beispielsweise 13,5 MHz abgetastet wird, überdeckt die
wirksame Abtastfläche pro Vollbild 720 Pixel in der
horizontalen Richtung und 486 Pixel in der vertikalen
Richtung. Wenn ein Vollbild beispielsweise in Blöcke
von 8 · 8 Pixeln geteilt wird, verbleiben jeweils
sechs Pixel in der vertikalen Richtung; daher wird
hier angenommen, daß ein Bildsignal von 720 · 480
Pixeln codiert wird, wobei die Daten für die drei
obersten und untersten horizontalen Abtastzeilen des
Schirms weggelassen werden. Da das Videosignal in
Blöcke von 8 · 8 Pixeln geteilt ist, bedeutet dies 90
· 60 Blöcke, d. h. insgesamt 5400 Blöcke. D. h. wenn
die Blockadresse in der horizontalen Richtung
innerhalb eines Vollbildes als i und die in der vertikalen
Richtung als j bezeichnet werden, werden i als
1 ≤ i ≤ 90 und j als 1 ≤ j ≤ 60 ausgedrückt.
-
Weiterhin sind die 5400 Blöcke in N Einheiten
gruppiert. In Fig. 12 ist N = 5 und die alphabetischen
Buchstaben in A1, B1, usw., die jedem Block
zugewiesen sind, zeigen die Namen der Einheiten an. Da N = 5
ist, gibt es fünf Einheitsnamen A bis E. Die
numerischen Teile in A1, B1, usw. sind Zahlen, die die
Codierfolge innerhalb jeder Einheit anzeigen.
-
In Fig. 12 wird als eine allgemeine Regel die
Codierung von links nach rechts und von oben nach unten
auf dem Schirm durchgeführt. In dem gezeigten
Beispiel beginnt, da 90 Blöcke in der horizontalen
Richtung vorhanden sind, die zweite Zeile von oben in
Fig. 12 mit der Nummer 19, welche gegeben ist durch
Teilen von 90 durch N (gleich 5) und Addieren von 1
zu dem Quotienten. Daher kann die Blockadresse (i, j)
für die k-te Codierung in der u-ten Einheit durch die
folgende Gleichung (1) ausgedrückt werden
(vorausgesetzt, daß (1, 1) die obere linke Ecke des Schirms und
(90, 60) die untere rechte Ecke anzeigen).
-
i = NXmod(k - 1, 90/N)
-
+ mod(u + [(k - 1 ) X N/90] - 1, N) + 1} (1)
-
j = [(k - 1)X N/90] + 1 (1)
-
[a]: Größte ganze Zahl, die a nicht überschreitet
-
Wenn beispielsweise u = 2 und k = 20 sind, ist die
Blockadresse gegeben durch:
-
i = 5 X mod(20 - 1, 18) + mod [2 + [(19 · 5)/90] - 1,
5] + 1 = 5 X 1 + mod (2, 5) + 1 = 5 + 2 + 1 = 8
j = [(19 X 5)/90] + 1 = 2
-
Somit wird die Blockadresse (8, 2) erhalten. Auch
zeigt u = 2 an, daß der Name der Einheit gleich B
ist, und in Fig. 12 bezeichnet die Adresse (8, 2) den
Block B20. In gleicher Weise kann die Adresse
beispielsweise des Blocks C57 wie folgt gefunden werden:
-
i = 5 X mod(57-1, 18) + mod [3 + [(56 · 5)/90] - 1,
5) + 1 = 5 X 2 + mod(3 + 3 - 1, 5) + 1 = 10 + 0 + 1 = 11
j = 4
-
woraus sich die Adresse (11, 4) ergibt. D. h. Fig. 12
zeigt die Anordnung von Blöcken nach der Durchführung
der Umordnung, wie durch Gleichung (1) ausgedrückt
ist.
-
Nach der obigen Umordnung wird jeder Block
aufeinanderfolgend für eine DCT-Transformation zu der DCT-
Schaltung 2 geführt, und es wird dann eine Wichtung
durch die Wichtungsschaltung 3 durchgeführt. Die
Quantisierungsbitzahl-Bestimmungsschaltung 43
berechnet den Aktivitätsindex jedes Blockes, auf dessen
Grundlage die Anzahl von Quantisierungsbits für den
Block bestimmt wird, wobei die Information zu der
Quantisierungsschaltung 4 geführt wird. Der
gewichtete DCT-Koeffizient wird durch die
Quantisierungsschaltung 4 quantisiert unter Verwendung der so
bestimmten Anzahl von Quantisierungsbits, und die
quantisierten Daten werden dann von der Codierschaltung 5
für variable Längen codiert unter Verwendung solcher
Verfahren wie der Huffman-Codierung, wobei die
codierten Daten zu dem Pufferspeicher 42 übertragen
werden, um in diesem gespeichert zu werden.
-
Bei der obigen Umordnung werden die durch die zu
codierenden Blöcke dargestellten Muster zufällig
verstreut, und daher wird die Codelänge zwischen den
Einheiten ausgeglichen, wenn die Anzahl von Blöcken
größer als ein bestimmter Grad ist. Gemäß einer von
dem Erfinder durchgeführten Simulation wurde
gefunden, daß, wenn die Einheiten durch die Umordnung wie
in Fig. 12 gezeigt zugeordnet sind, der die Streuung
der Codemenge anzeigende Steuerwert auf 1/5 bis 1/10
reduziert wird im Vergleich zu dem Fall, in welchem
eine bestimmte Position auf dem Schirm in einer
Einheit zusammen gruppiert ist ohne Umordnung.
-
Als Nächstes werden die Merkmale dieser Umordnung
betrachtet. Wenn die Wirkungen betrachtet werden,
welche die Umordnung auf die Codemenge hat, liegt der
Punkt darin, eine Konzentration der Blöcke desselben
Musters in der derselben Einheit zu vermeiden, was zu
dem folgen Punkt führt, wenn er in Verbindung mit
Pixeln betrachtet wird. Blöcke, die einem betrachteten
Block benachbart sind, haben oft ein ähnliches
Muster, daher wird die Verarbeitung so durchgeführt,
daß benachbarte Blöcke verschiedenen Einheiten
zugeordnet werden. Diese Verarbeitung wird nachfolgen
beschrieben, unter Verwendung des Konzepts der
Nachbarschaft.
-
Jedes der neun Quadrate in Fig. 13 stellt einen DCT-
Block dar. Es gibt acht Blöcke (A bis F in Fig. 13),
die einem betrachteten Block benachbart sind. Dies
Blöcke werden als die acht benachbarten Blöcke
bezeichnet, von denen die vier Blöcke A, B, C und D,
die dem betrachteten Block am nächsten sind, als die
vier benachbarten Blöcke bezeichnet werden. Bezug
nehmend auf Fig. 12 kann gesehen werden, daß, wenn
ein gegebener Block betrachtet wird, keiner seiner
vier benachbarten Blöcke zu derselben Einheit wie der
betrachtete Block gehören. Von seinen acht
benachbarten Blöcken gibt es nur zwei Blöcke, die zu derselben
Einheit gehören. Die vier benachbarten Blöcke, welche
räumlich dem betrachteten Block am nächsten sind,
werden somit so zugeordnet, daß sie zu verschiedenen
Einheit gehören, um zu verhindern, daß ähnliche
Muster in einer Einheit konzentriert sind. Dies dient
zum Ausgleich der Codemenge.
-
Diese Wirkung kann nicht nur durch die Gleichung (1)
erzielt werden, sondern durch viele andere Verfahren.
Die Fig. 14 bis 16 zeigen nur einige wenige
Beispiele der vielen Verfahren. In den in den Fig. 14 bis
16 gezeigten Beispielen der Umordnung gibt es keine
vier benachbarten Blöcke, die zu derselben Einheit
gehören. Die Blockadresse (i, j) in Fig. 14 wird
durch die folgende Gleichung ausgedrückt.
-
i = [mod(k - 1,90)/N]N + [N + 1/2]
-
+ (-1)mod(k, N) X [mod(k, N)/2]
-
j = mod(mod(k - 1, 90) + u - 1, N)
-
+ 1 + N X[k - 1/90]
-
Um beispielsweise die Adresse des Blocks D98 zu
finden, da u = 4 und k = 98 sind,
-
i = [{mod(97, 90)}/5] · 5 + 3 + (-1)³ · [{mod(98,
5)}/2] = 5 + 3 - 1 = 7
-
j = mod (7 + 4 - 1, 5) + 1 + 5 X 1 = 0 + 1 + 5 = 6
-
was die Adresse (7, 6) ergibt. Die Blockadresse (i,
j) in fig. 15 wird durch die folgende Gleichung
ausgedrückt.
-
i = mod(mod(k - 1,90) + u, N)
+ [mod(k - 1, 90)/N] X N
-
j = [k - 1/90] X N + [N + 1/2] + (-1)mod(k - 1, N)
X [mod(mod(k - 1,90), N) + 1/2]
-
Um beispielsweise die Adresse des Blocks E102 zu
finden, da u = 5 und k = 102 sind,
-
i = mod(11 + 5, 5) + [11/5] X 5 = 1 + 10 = 11
-
j = 1 X 5 + 3 + (-1) X [{mod(11, 5) + 1}/2] = 5 + 3 -
1 = 7
-
was die Adresse (11, 7) ergibt. In gleicher Weise
existiert eine Gleichung, welche die in Fig. 16
gezeigte Umordnung realisiert, zusammen mit
verschiedenen anderen Gleichungen, welche verschiedene andere
Umordnungsformate erzielen.
-
Die Schaltung, welche die obigen
Umordnungsoperationen durchführt, kann durch die in Fig. 17 gezeigte
Konfiguration realisiert werden. In der Figur
bezeichnet die Bezugszahl 46 eine Blockadressen-
Berechnungsschaltung zum Berechnen der horizontalen
Blockadresse (i) und der vertikalen Blockadresse (j)
unter Verwendung der oben gegebenen Gleichungen, und
die durch die Blockadressen-Berechnungsschaltung 46
erhaltene Blockadresse wird zu der Schreib-
/Leseadressen-Erzeugungsschaltung 45 geliefert. Auf
der Grundlage der gelieferten Blockadresse gibt die
Schreib-/Leseadressen-Erzeugungsschaltung 45 eine
Schreib-/Leseadresse zu einem RAM 44 aus. In dem RAM
44 ist jeder Block entsprechend der Adresse
angeordnet, wodurch die Umordnung wie in den Fig. 12, 14,
15 und 16 gezeigt erhalten wird.
(Ausführungsbeispiel 2)
-
Bei der obigen Umordnung wird die Codemenge im
Wesentlichen zwischen den Einheiten innerhalb eines
Halbbildes oder eines Vollbildes ausgeglichen, aber
in dem Fall eines zeitveränderlichen Bildes kann das
Bildmuster sich nach mehreren Sekunden vollständig
ändern, was bewirkt, daß die Codemenge jeder Einheit
innerhalb eines Halbbildes oder eines Vollbildes
zunimmt oder abnimmt. Wenn die Codemenge in jeder
Einheit zunimmt, kann diese die maximal übertragbare
Datenmenge überschreiten. Dies stellt ein
schwerwiegendes Problem dar, insbesondere in dem Fall eines VTR
mit wendelförmiger Abtastung, da, wie vorher
beschrieben ist, jede Spur so in Längen geteilt ist,
daß jede Länge das Ergebnis der Teilung der Spurlänge
durch eine ganze Zahl ist, wobei jede begrenzte feste
Menge Codes für eine feste Anzahl von Blöcken
zugewiesen ist. Das zweite Ausführungsbeispiel der
Erfindung ist so ausgebildet, daß es dieses Problem
überwindet. Im Folgenden wird das zweite
Ausführungsbeispiel beschrieben.
-
Die Fig. 18 und 19 sind Blockschaltbilder, die
jeweils die Konfiguration einer Videosignal-
Codiervorrichtung gemäß dem zweiten
Ausführungsbeispiel zeigen. In Fig. 18 werden die
Quantisierungsschaltung 4 und die Codierschaltung 5 für variable
Längen gesteuert unter Verwendung der Informationen
über den Speichergebrauch in dem Pufferspeicher 42.
In Fig. 19 werden die Quantisierungsbitzahl-
Bestimmungsschaltung 43 und die Codierschaltung 5 für
variable Längen unter Verwendung der Informationen
über den Speichergebrauch in dem Pufferspeicher 42
gesteuert.
-
Der Pufferspeicher 42 hat die Kapazität, um Daten des
Volumens zu speichern, das der Grenzcodemenge
angepaßt ist. Wenn sich der Pufferspeicher 42 seiner
vollen Kapazität nähert, nimmt die Wahrscheinlichkeit
zu, daß Codes erzeugt werden, die die übertragbare
Grenze überschreiten, und daher wird eine Steuerung
durchgeführt, um die Anzahl von Quantisierungsbits zu
reduzieren, die Codierung mit variablen Längen
abzuschneiden usw. Jedoch ist eine solche Steuerung nur
erfolgreich hinsichtlich der Reduzierung der
Codemenge durch Opfern der Bildqualität nach der
Decodierung. Als eine Folge der vorerwähnten Umordnung
besteht beispielsweise ein Möglichkeit, daß eine
derartige Steuerung bewirkt wird, während der mittlere
Bereich des Schirms verarbeitet wird. Da die
Wahrscheinlichkeit groß ist, daß eine derartige Steuerung
bei den Blöcken nahe dem Ende jeder Einheit
durchgeführt wird, arbeitet die Blockbildungs-
/Umordnungsschaltung 41 in einer solchen Weise, daß
die nahe dem Ende jedes Blocks eingetretenen Blöcke
an der Kante des Schirms positioniert sind. Ein
Beispiel für eine derartige Umordnung ist in Fig. 20
gezeigt.
-
In Fig. 20 kann gesehen werden, daß Blöcke mit
kleineren Nummern nahe der Mitte des Schirms
zusammengeballt sind, während Blöcke mit größeren Nummern auf
beiden des Schirms zusammengeballt sind. Weiterhin
gehören in Fig. 20, welche die Umordnung mit N = 5
zeigt, keiner von irgendeinem betrachteten Block und
die vier benachbarten Blöcke zu derselben Einheit.
Wenn die Blockadresse des k-ten Blocks in der u-ten
Einheit als (i, j) bezeichnet wird, wird die in Fig.
20 gezeigte Umordnung durch die folgende Gleichung
ausgedrückt.
-
i = 90/2 - (-1)({(k - 1)N/60)
-
j = [60 + N/2N] - 1 X N + 1
-
-(-1) mod{(k - 1), (60/N)}
-
X N X[mod[(k - 1 · 60/N)] + 1]
-
+ mod[[(k - 1)N/60] + u -1, N]
-
Um beispielsweise die Adresse des Blocks C134 zu
finden, da u = 3 und k = 134,
-
i = 45 - (-1)¹¹ X [6] = 45 + 6 = 51
-
j = [[65/10] - 1] X 5 + 1 - (-1)¹ X 5 X 1 + mod(11 +
3 -1, 5) = 26 + 5 + 3 = 34
-
was die Adresse (51, 34) ergibt.
-
Es gibt viele Beispiele einer derartigen Umordnung,
die anders als das vorstehend Beschriebene sind, von
denen einige in den Fig. 21 bis 25 gezeigt sind. In
den Fig. 23 bis 25 startet die vertikale
Blockadresse vom oberen Rand des Schirms; es wurde durch
Simulation bestätigt, daß eine Verzerrung wahrscheinlich
auf beiden Seiten des Schirms auftritt wie in dem
Fall von Fig. 20. Die Umordnung nach Fig. 24 ist
ähn
lich der nach Fig. 23 mit der Ausnahme, daß N = 10
ist, wodurch 10 Einheitsnamen A bis K (I wird nicht
verwendet, da es mit 1 verwechselt werden kann)
erhalten werden. Auch ist die Umordnung nach Fig. 25
ähnlich der nach Fig. 23 mit der Ausnahme, daß N = 3
ist. Die in Fig. 23 gezeigte Umordnung wird durch die
folgende Gleichung ausgedrückt.
-
i = 90/2 - (-1)[{(k - 1) · N)/60]
-
j = N X mod(k - 1, 60/N) + 1
-
+ mod[(k - 1) · N/60] + u - 1, N
-
Um in Fig. 23 beispielsweise die Adresse des Blocks
E147 zu finden, da u = 5 und k = 147,
-
i = 45 - (-1)¹² X [(12 + 1)/2] = 45 - 6 = 39
-
j = 5 X 2 + 1 + mod(12 + 5 - 1, 5) = 11 + 1 = 12
-
was die Adresse (39, 12) ergibt.
-
Durch die vorbeschriebene Umordnung wird eine
Verzerrung, die sich aus der Codemengensteuerung ergibt, zu
beiden Seiten des Schirms getrieben. Bei der obigen
Gleichung kann, wenn N = 2 ist, die Möglichkeit
auftreten, daß einige der vier benachbarten Blöcke zu
derselben Einheit gehören, aber dies ist das Problem,
das als ein Ergebnis der so durchgeführten Umordnung
auftritt, wenn die Blöcke näher den Seiten des
Schirms positioniert werden, wenn k zunimmt. Da
solche Blöcke nur in begrenzten Bereichen des Schirms
auftreten, beeinträchtigen sie nicht wesentlich die
Verteilung der Codemenge. Bei einem gewöhnlichen
digitalen VTR stellt dies beim tatsächlichen Gebrauch
kein Problem dar, da N üblicherweise auf 3 oder eine
größere Zahl gesetzt wird unter Berücksichtigung
spezieller Wiedergabebetriebsarten usw. In jeder der
obigen, die Umordnung illustrierenden Figuren basiert
die Arbeitsweise auf der Teilung durch N als dem
Modulus, aber es ist darauf hinzuweisen, daß ähnliche
Wirkungen erhalten werden können, wenn die Teilungen
durchgeführt werden durch Anwendung eines integralen
Vielfachen von N oder eines Quotienten einer ganzen
Zahl durch eine ganze Zahl von N als dem Modulus.
Wenn beispielsweise N = 10 ist, wird gewöhnlich 10
als der Modulus genommen, aber entweder 20 oder 5 {10
X (1/2)} können als der Modulus genommen werden.
-
Bei dem obigen ersten und zweiten Ausführungsbeispiel
wird die Umordnung in Einheiten von Blöcken
durchgeführt, aber alternativ kann die Umordnung
beispielsweise durchgeführt werden durch Gruppieren von (t X
s) Blöcken in einer Einheit.
-
Bei den obigen Ausführungsbeispielen wurde die
orthogonale Transformation beschrieben, indem die DCT als
ein Beispiel genommen wurde, aber es ist darauf
hinzuweisen, daß andere orthogonale Transformationen als
die DCT beispielsweise die Hadamard-Transformation,
die K-L-Transformation usw. ebenfalls angewendet
werden können. Auch kann die Wichtungsschaltung 3 in
einer Konfiguration weggelassen werden, bei welcher die
Quantisierungsbreite der Quantisierungsschaltung 4 in
Abhängigkeit von der Frequenz variiert.