-
HINTERGRUND
DER ERFINDUNG
-
Gebiet der Erfindung
-
Diese
Erfindung betrifft eine Vorrichtung zur Aufzeichnung/Wiedergabe
digitaler Signale wie etwa ein Videobandaufzeichnungsgerät (nachfolgend
abgekürzt
als "VTR"), ein Bildplattenwiedergabegerät oder ein
Tonbandaufzeichnungsgerät,
in welcher Video- und Audiosignale in der digitalen Form aufgezeichnet
und wiedergegeben werden, und insbesondere auf eine Vorrichtung,
welche zur Kompressionskodierung eine Bewegungskompensationsvorhersage
bezüglich
eines Videosignals durchführt.
-
Beschreibung
des Stands der Technik
-
In
einem digitalen Heim-VTR bzw. einem digitalen VTR zur Verwendung
im häuslichen
Bereich ist im Hinblick auf Kosten und Geräteabmessungen eine Datenkompression
unentbehrlich. Nachfolgend wird daher eine Datenkompression hauptsächlich am Beispiel
eines digitalen Heim-VTR beschrieben.
-
1 ist
ein schematisches Blockdiagramm, welches den Aufbau eines digitalen
Heim-VTR zeigt. Die Bezugsziffer 900 bezeichnet einen Eingangsanschluß, durch
welchen ein analoges Videosignal wie etwa ein Fernsehsignal eingegeben
wird. Die Bezugsziffer 901 bezeichnet einen A/D-Wandler, welcher
das analoge Videosignal in ein digitales Videosignal umwandelt, 902 bezeichnet
einen Datenkompressor, welcher das digitale Videosignal komprimiert, um
die Informationsmenge des Signals zu reduzieren, 903 bezeich net
einen Fehlerkorrekturkodierer, welcher dem kodierten Signal Fehlerkorrekturcodes hinzufügt, so daß Fehler
in der Wiedergabe korrigiert werden, 904 bezeichnet einen
Aufnahmemodulator, welcher, um die Aufzeichnung durchzuführen, das
Signal zu für
die Aufzeichnung geeigneten Codes moduliert, 905 bezeichnet
einen Aufnahmeverstärker, welcher
das Aufnahmesignal verstärkt,
und 906 bezeichnet ein Magnetband, auf welchem das Aufnahmesignal
zum Zwecke der Speicherung aufgezeichnet wird. Die Bezugsziffer 907 bezeichnet
einen Vorverstärker,
welcher ein von dem Magnetband 906 wiedergegebenes Signal
verstärkt, 908 bezeichnet einen
Wiedergabedemodulator, welcher das wiedergegebene Signal demoduliert, 909 bezeichnet
einen Fehlerkorrekturdekodierer, welcher an dem wiedergegebenen
und demodulierten Signal unter Verwendung der Fehlerkorrekturcodes
eine Fehlerkorrektur durchführt, 910 bezeichnet
einen Datenexpander, welcher die komprimierten Daten in ihre ursprüngliche
Form rekonstruiert, 911 einen D/A-Wandler, welcher das digitale Videosignal
in ein analoges Videosignal umwandelt, und 912 bezeichnet
einen Ausgangsanschluß.
-
Als
nächstes
wird der Datenkompressor (Hochleistungskodierer) 902 beschrieben. 2 ist ein
Blockdiagramm des Hochleistungskodierers, welcher eine Einwegbewegungskompensationszwischenrahmenvorhersage
verwendet. Die Bezugsziffer 1 bezeichnet einen Eingangsanschluß für ein digitales
Videosignal, 2 bezeichnet eine Blockbildungsschaltung,
welche das eingegebene digitale Videosignal segmentiert, 3 bezeichnet
einen Subtrahierer, welcher als einen Differenzblock ein Differenzsignal zwischen
einem Eingangsblock und einem Vorhersageblock ausgibt, 4 bezeichnet
ein Differenzleistungsberechnungsglied, welches die Leistung des
Differenzblock berechnet, 5 bezeichnet ein Originalleistungsberechnungsglied,
welches die Wechselstromleistung des Eingangsblocks berechnet, 6 bezeich net ein
Bestimmungsglied, welches die Differenzleistung mit der ursprünglichen
Wechselstromleistung vergleicht, um zu bestimmen, ob die momentane
Betriebsart ein Vorhersagemodus oder ein Intramodus ist, 7 bezeichnet
einen ersten Schalter, welcher wahlweise einen kodierten Block in Übereinstimmung
mit der festgestellten Betriebsart ausgibt, 8 bezeichnet eine
DCT-Schaltung, welche an den kodierten Blöcken die diskrete Cosinustransformation
(nachfolgend mit "DCT" abgekürzt), welche
eine Orthogonaltransformation ist, durchführt, 9 bezeichnet
eine Quantisierungsschaltung, welche einen DCT-Koeffizient quantisiert, 10 bezeichnet
einen ersten Kodierer, welcher die für einen Übertragungsweg geeignete Kodierung
durchführt,
und 11 bezeichnet den Übertragungsweg.
-
Bezugsziffer 12 bezeichnet
eine inverse Quantisierungsschaltung, welche eine Umkehrquantisierung
bezüglich
des quantisierten DCT-Koeffizienten durchführt, 13 bezeichnet
eine inverse DCT-Schaltung, welche die ungekehrte DCT bezüglich des
invers quantisierten DCT-Koeffizienten durchführt, 14 bezeichnet
einen Addierer, welcher dem dekodierten Block, welcher ein Ausgangssignal der
Umkehr-DCT-Schaltung 13 ist, einen Vorhersageblock hinzufügt, um einen
Ausgangsblock zu erzeugen, 15 bezeichnet einen Bildspeicher,
welcher Ausgangsblöcke
speichert, um eine Bewegungskompensationsvorhersage durchzuführen, 16 bezeichnet eine
MC-Schaltung, welche eine Bewegungsschätzung aus einem Bewegungskompensationssuchblock,
welcher aus einem in dem Bildspeicher 15 gespeicherten
früheren
Bild segmentiert ist, und dem aktuellen Eingangsblock durchführt und
eine Bewegungskompensationsvorhersage durchführt, 17 bezeichnet
eine MIX-Schaltung, welche einen Bewegungsvektor mit einem durch
das Bestimmungsglied 6 bestimmten Betriebsartsignal kombiniert, 18 bezeichnet
einen zweiten Kodierer, welcher den Ausgang der MIX-Schaltung 17 kodiert,
und 19 bezeichnet einen zweiten Schalter, welcher die Vorhersageblöcke in Übereinstimmung
mit der durch das Bestimmungsglied 6 bestimmten Betriebsart
schaltet. Das Differenzleistungsberechnungsglied 4, das
Originalleistungsberechnungsglied 5, das Bestimmungsglied 6,
die Umkehr-Quantisierungsschaltung 12, die Umkehr-DCT-Schaltung 13,
der Addierer 14, der Bildspeicher 15, die MC-Schaltung 16 und
der zweite Schalter 19 bilden eine lokale Dekodierschleife 20.
-
Nun
wird die Wirkungsweise beschrieben. Unabhängig von einem Intrafeld, in
welchem eine Bewegungskompensationsvorhersage nicht durchgeführt wird,
oder einem Vorhersagefeld (Zwischenfeld), in welchem eine Bewegungskompensationsvorhersage
durchgeführt
wird, werden eingegebene digitale Videosignale durch die Blockbildungsschaltung 2 in
Eingangsblocks in der Einheit von m [Pixel] × n [Zeilen] unterteilt (wobei
m und n positive ganze Zahlen sind) und segmentiert. Um einen Differenzblock
zu erhalten, berechnet der Subtrahierer 3 die Differenz
in der Einheit von Pixeln zwischen einem Eingangsblock und einem
Vorhersageblock. Sodann werden der Eingangsblock und der Differenzblock
in den ersten Schalter 7 eingegeben. Das Differenzleistungsberechnungsglied 4 berechnet
die Differenzleistung des Differenzblocks. Andererseits berechnet das
Originalleistungsberechnungsglied 5 die ursprüngliche
Wechselstromleistung des Eingangsblocks. Die zwei berechneten Leistungen
werden durch das Bestimmungsglied 6 miteinander verglichen,
um den ersten Schalter 7 so zu steuern, daß der Block,
welcher die kleinere Leistung aufweist, als das Objekt der Kodierung
ausgewählt
wird. Genauer gesagt gibt, wenn die Differenzleistung kleiner als
die ursprüngliche
Wechselstromleistung ist, das Bestimmungsglied 6 ein Vorhersagemodus-Signal
aus, wenn dagegen die ursprüngliche
Wechselstromleistung kleiner als die Differenzleistung ist, gibt
das Bestimmungsglied 6 ein Intramodus-Signal aus.
-
Der
erste Schalter 7 gibt in Übereinstimmung mit dem durch
das Bestimmungsglied 6 bestimmten Betriebsartsignal den
Eingangsblock oder den Differenzblock als einen kodierten Block
aus. Wenn sich das verarbeitete Bild in dem Intrafeld befindet,
arbeitet der erste Schalter 7 allerdings so, daß alle kodierten
Blöcke
als Eingangsblocks ausgegeben werden. 3 illustriert
diese Schaltoperation. Die normale Betriebsart ist ein Modus, in
welchem in einem Schritt einer Bewegungskompensationsvorhersage,
welche gemäß der Darstellung
in 4 in vier Feldern fertiggestellt wird, ein erstes
Feld F1 der vier Felder immer ein Intrafeld ist und die nachfolgenden
zweiten, dritten und vierten Felder F2, F3 und F4 Vorhersagefelder
sind.
-
Der
durch den ersten Schalter 7 ausgewählte kodierte Block wird durch
die DCT-Schaltung 8 in DCT-Koeffizienten umgewandelt und
dann den Bewertungs- und Schwellwertprozessen in der Quantisierungsschaltung 9 unterworfen,
um jeweils entsprechend den Koeffizienten auf vorbestimmte Bit-Werte
quantisiert zu werden. Die quantisierten DCT-Koeffizienten werden durch den ersten
Kodierer 10 in für
den Übertragungsweg 11 geeignete
Codes umgewandelt und dann an den Übertragungsweg 11 ausgegeben.
-
Die
quantisierten DCT-Koeffizienten treten auch in die lokale Dekodierschleife 20 ein,
und die Bildwiedergabe für
die nächste
Bewegungskompensationsvorhersage wird durchgeführt. Die quantisierten DCT-Koeffizienten,
welche in die lokale Dekodierschleife 20 eingetreten sind,
werden den inversen Bewertungs- und inversen Quantisierungsprozessen in
der Umkehr-Quantisierungsschaltung 12 unterworfen. Sodann
werden die DCT-Koeffizienten durch die Umkehr-DCT-Schaltung 13 in
einen dekodierten Block umgewandelt. Der Addierer 14 addiert
in der Einheit von Pixeln den dekodierten Block zu einem Vorhersageblock,
um das Bild zu rekonstruieren. Dieser Vorhersageblock ist der gleiche
wie der in dem Subtrahierer 3 verwendete. Der Ausgang des
Addierers 14 wird als ein Ausgangsblock in eine vorbestimmte
Adresse des Bildspeichers 15 geschrieben. Die Speicherkapazität des Bildspeichers 15 hängt von
der Art des eingesetzten Vorhersageverfahrens ab. Angenommen, daß der Bildspeicher 15 aus
einer Mehrzahl von Feldspeichern besteht, wird der rekonstruierte
Ausgangsblock in eine vorbestimmte Adresse geschrieben. Ein Block,
welcher von einem aus früheren
Ausgangsblocks rekonstruierten Bild segmentiert wird und sich in
dem Bewegungsschätzungssuchbereich
befindet, wird von dem Bildspeicher 15 an die MC-Schaltung 16 ausgegeben.
Die Größe des Blocks
in dem Bewegungsschätzungssuchbereich
ist i [Pixel] × j
[Zeilen] (wobei i ≥ m,
j ≥ n, und
i und j positive ganze Zahlen sind). Daten in dem Suchbereich von
dem Bildspeicher 15 und einem Eingangsblock von der Blockbildungsschaltung 2 werden
in die MC-Schaltung 16 als Daten eingegeben, wodurch Bewegungsvektoren
extrahiert werden. Als ein Verfahren zum Extrahieren von Bewegungsvektoren
gibt es verschiedene Verfahren wie etwa das Gesamtsuchblockabgleichsverfahren
und das Baumsuchblockabgleichsverfahren. Diese Verfahren sind wohlbekannt,
und daher wird diesbezüglich
auf eine Beschreibung verzichtet.
-
Die
durch die MC-Schaltung 16 extrahierten Bewegungsvektoren
werden in die MIX-Schaltung 17 eingegeben und darin mit
dem durch das Bestimmungsglied 6 bestimmten Betriebsartsignal
kombiniert. Die kombinierten Signale werden durch den zweiten Kodierer 18 in
für den Übertragungsweg 11 geeignete
Codes umgewandelt und dann zusammen mit dem entsprechenden kodierten
Block an den Übertragungsweg 11 ausgegeben.
Die MC-Schaltung 16 gibt als einen Vorhersageblock Signale
aus, welche von dem Suchbe reich in der Größe (m [Pixel] × n [Zeilen]),
welche gleich der des Eingangsblocks ist, segmentiert sind. Der
aus der MC-Schaltung 16 auszugebende Vorhersageblock wird
aus der früheren
Videoinformation hergestellt. Der Vorhersageblock wird dem zweiten
Schalter 19 zugeführt
und in Übereinstimmung
mit dem Feld des aktuell verarbeiteten Bildes und dem Betriebsartsignal
des dekodierten Blocks aus dem jeweiligen Ausgangsanschluß des Schalters
ausgegeben. Insbesondere wird der Vorhersageblock in Übereinstimmung
mit dem verarbeiteten Feld aus einem der Ausgangsanschlüsse des
zweiten Schalters 19 an den Subtrahierer 3 ausgegeben,
und aus dem anderen Ausgangsanschluß in Übereinstimmung mit dem Betriebsartsignal
des aktuell dekodierten Blocks und dem verarbeiteten Feld.
-
Als
ein in solch einem Schaltungsblock verwendetes Vorhersageverfahren
kann zum Beispiel das in 4 gezeigte Verfahren eingesetzt
werden. In diesem Verfahren wird ein Intrafeld nach jeweils drei
Feldern eingefügt,
und die drei Zwischenfelder werden als Vorhersagefelder festgelegt.
In 4 ist das erste Feld F1 ein Intrafeld, und das
zweite, dritte und vierte Feld F2, F3 und F4 sind Vorhersagefelder. In
der Vorhersage mittels dieses Verfahrens wird das zweite Feld F2
aus dem ersten Feld F1, welches ein Intrafeld ist, vorhergesagt,
das dritte Feld F3 wird in ähnlicher
Weise aus dem ersten Feld F1 vorhergesagt, und das vierte Feld F4
wird aus dem rekonstruierten zweiten Feld F2 vorhergesagt.
-
Zuerst
wird das erste Feld F1 in dem Feld einer Blockbildung unterworfen
und der DCT unterzogen. Sodann wird das erste Feld F1 den Bewertungs- und
Schwellwertprozessen unterworfen und quantisiert und danach kodiert.
In der lokalen Dekodierschleife 20 werden die quantisierten
Signale des ersten Feldes F1 dekodiert oder rekonstruiert. Das rekonstruierte
Bild wird in der Bewegungs kompensationsvorhersage für das zweite
und dritte Feld F2 und F3 verwendet. Sodann wird die Bewegungskompensationsvorhersage
für das
zweite Feld F2 unter Verwendung des ersten Feldes F1 durchgeführt. Nachdem
der erhaltene Differenzblock der DCT unterzogen wurde, wird eine
Kodierung in ähnlicher
Weise wie für
das erste Feld F1 durchgeführt.
In diesem Fall wird, wenn die Wechselstromleistung des Eingangsblocks
kleiner als die Leistung des Differenzblock ist, der Eingangsblock
anstelle des Differenzblocks der DCT unterzogen, und danach wird
die Kodierung in ähnlicher
Weise wie bei dem ersten Feld F1 durchgeführt. Das zweite Feld F2 wird
in der lokalen Dekodierschleife 20 in Übereinstimmung mit dem Betriebsartsignal
jedes Blocks dekodiert und rekonstruiert. und dann in der Bewegungskompensationsvorhersage
für das
vierte Feld F4 verwendet. In ähnlicher
Weise wie bei dem zweiten Feld F2 werden unter Verwendung des ersten
Feldes F1 Bewegungskompensationsvorhersage und Kodierung an dem dritten
Feld F3 durchgeführt.
Die Bewegungskompensationsvorhersage wird an dem vierten F4 unter Verwendung
des in dem Bildspeicher 15 rekonstruierten zweiten Feldes
F2 durchgeführt,
und sodann wird das vierte Feld F4 in ähnlicher Weise wie bei dem
dritten Feld F3 kodiert. Auch in dem dritten und vierten Feld F3
und F4 wird, wenn die Wechselstromleistung des Eingangsblocks kleiner
als die Leistung des Differenzblocks ist, der Eingangsblock anstelle des
Differenzblocks der DCT unterworfen, und danach wird die Kodierung
in ähnlicher
Weise wie bei dem ersten Feld F1 durchgeführt.
-
Zum
Beispiel wird erwartet, daß der
in 1 gezeigte digitale Heim-VTR die hohe Bildqualität und hohe
Tonqualität
erreicht. Um dies zu realisieren, ist es unabdingbar, die Datenkompression,
d. h., die Leistung des Hochleistungskodierers zu verbessern. Daher
treten in dem oben beschriebenen herkömmlichen Vorhersageverfahren
die nachfolgenden Probleme auf.
-
In
einem solchen Vorhersageverfahren tritt, nachdem die Bewegungskompensationsvorhersage unter
Verwendung der Videodaten des einen vorherigen Feldes oder Rahmens
durchgeführt
wird, ein erstes Problem auf, daß die Kapazität des Feldspeichers oder
Rahmenspeichers vergrößert wird
und die Hardware in ihrer Größe zunimmt.
-
In
dem herkömmlichen
Vorhersageverfahren ist es, wenn ein Szenenwechsel einmal in der
Einheit von Rahmen auftritt, schwierig, während des Kodierens des Bildes
nach dem Szenenwechsel die Kompression gemäß Bewegungskompensationsvorhersage
aus dem Referenzbild, welches vor dem Szenenwechsel erhalten worden
war, durchzuführen, wodurch
ein zweites Problem hervorgerufen wird, daß die Gesamtmenge der Codes
vergrößert wird. Falls
eine Zwischenrahmen-Bewegungskompensationsvorhersage insgesamt sequenziell
in der Zeitrichtung durchgeführt
wird, kann es möglich
sein, das Anwachsen der Datenmenge auf ein Minimum zu unterdrücken, auch
wenn ein Szenenwechsel eintritt. In dem Fall des Kodierens von Zeilensprungbildern ohne
Szenenwechsel und mit wenig Bewegung gibt es allerdings eine Tendenz,
daß die
Datenmenge insgesamt vergrößert wird.
In einem Vorhersageverfahren, in welchem dritte und vierte Felder
F3 und F4 gemäß der Darstellung
in 5 aus ersten, zweiten und dritten Feldern F1,
F2 und F3 angepaßt
geschaltet werden, gibt es einen Nachteil, daß die Kapazität des Feldspeichers
oder Rahmenspeichers vergrößert wird
und die Hardware in ihrer Größe zunimmt. 6 zeigt
zum Beispiel die Datenmenge und S/N-Verhältnis eines Luminanzsignals,
wenn ein Bild A mit Szenenwechseln durch das Vorhersageverfahren
von 4 oder das Vorhersageverfahren von 5 verarbeitet
wird. In dem Bild A tritt ein Szenenwechsel in der Einheit von Rahmen
ein.
-
6 zeigt
auch die Datenmenge und das S/N-Verhältnis eines Luminanzsignals
in dem Fall, daß ein
Bild B ohne Szenenwechsel durch das Vorhersageverfahren von 4 oder
das Vorhersageverfahren von 5 verarbeitet
wird. In diesem Fall ist für
das Bild A mit Szenenwechseln das Vorhersageverfahren von 5 vorteilhaft,
und für
das Bild B ohne Szenenwechsel ist das Vorhersageverfahren von 4 vorteilhaft.
-
In
dem Fall, daß das
Kodieren durch Durchführen
einer Vorhersage wie in dem Stand der Technik bewerkstelligt wird,
gibt es ein drittes Problem, daß,
wenn ein Szenenwechsel in einem Schritt eines Bewegungskompensationsvorhersageprozesses auftritt,
die Qualität
des Bildes unmittelbar nach dem Szenenwechsel verschlechtert wird.
Dieses Problem wird hervorgerufen, da wegen des Szenenwechsels eine
Bewegungskompensationsvorhersage, welche in umfangreicher Weise
Zeitkorrelation verwendet, unzufriedenstellend durchgeführt wird,
wodurch die erzeugte Informationsmenge vergrößert wird. Die auf diese Weise
erzeugte Informationsmenge ist vergleichbar mit der Informationsmenge
eines gewöhnlichen
Intrafeldes auf diesem Niveau. Für
die erzeugte Informationsmenge wird das Feld, welches diese Informationsmenge
aufweist, als das Vorhersagefeld verwendet, und daher wird die Informationsmenge auf
das Niveau der Informationsmenge des Vorhersagefeldes komprimiert,
mit dem Ergebnis, daß die Bildqualität des Feldes
nach einem Szenenwechsel beträchtlich
verschlechtert wird. 7 zeigt eine Änderung
der Informationsmenge von Bildern für fünf Sekunden, wenn eine Kodierung
durch ein herkömmliches
Vorhersageverfahren durchgeführt
wird. In diesem Fall beträgt
der Durchschnitt für
fünf Sekunden weniger
als 20 [Mbps], aber bei einer Position A liegt ein Szenenwechsel
vor, wodurch die Informationsmenge vergrößert wird. Die Änderung
des S/N-Verhältnisses
in diesem Fall wird in 8 gezeigt. Obwohl keine große Ver schlechterung
in dem Abschnitt des Szenenwechsels vorliegt, bewirkt die Abnahme der
Informationsmenge, daß sich
das S/N-Verhältnis verschlechtert.
Wenn dieses Feld in der nächsten
Bewegungskompensationsvorhersage verwendet wird, ist es notwendig,
eine Bewegungskompensationsvorhersage an dem Bild mit der verschlechterten Bildqualität und der
reduzierten Zeitkorrelation durchzuführen, mit dem Ergebnis, daß die erzeugte
Informationsmenge wiederum vergrößert wird.
Dieser Teufelskreis dauert an, bis das nächste Wiederholfeld verarbeitet
wird. Falls eine Verschlechterung der Bildqualität in dieser Weise auftritt,
obwohl es unmittelbar nach einem Szenenwechsel geschieht, bedeutet
dies, daß eine
digitale Videoaufzeichnungs-/Wiedergabevorrichtung, welche eine
hohe Bildqualität aufweisen
muß, darin
versagt, die Leistungsfähigkeit in
der besten Weise zu verwenden. Bei einem Heim-VTR, welcher zum Beispiel
eine der digitalen Videoaufzeichnungs-/Wiedergabevorrichtungen ist, sind
Funktionen wie etwa eine Trickwiedergabe und Editierung bzw. Schnitt
unentbehrlich, und wenn eine solche Funktion durchgeführt wird,
tritt eine merkliche Verschlechterung der Bildqualität ein.
-
Als
herkömmliche
Heim-VTRs vom Schrägspur-Abtastungstyp
gibt es VTRs vom VHS-, β-
und 8 mm-Typ. Nachfolgend wird ein 8 mm-VTR als ein Beispiel eines
Stands der Technik beschrieben. 9 zeigt
anhand eines Diagramms das Bandformat gemäß dem 8 mm-VTR-Standard, und 10 zeigt
anhand eines Diagramms das Format einer Spur. 11 zeigt
anhand eines Diagramms die Beziehung zwischen einer Rotationskopftrommel
und einem darum gewundenen Magnetband, und 12 zeigt
anhand eines Graphs die Frequenzzuteilung jedes Signals gemäß dem 8
mm-VTR-Standard. In einem 8 mm-VTR für das NTSC-System oder das PAL-System
wird ein Videosignal durch ein Farbunterverfahren, welches ein grundlegendes
Aufnahmeverfahren für
Heim-VTRs ist, aufgezeichnet. Das Luminanzsignal wird mit einem
Träger
von 4,2 bis 5,4 MHz frequenzmoduliert, der Chrominanzsignal-Hilfsträger wird
in ein niederfrequentes Signal von 743 kHz umgewandelt, und die
beiden Signale werden der Frequenzmultiplexaufzeichnung unterzogen.
Das Aufzeichnungsformat auf einem Band ist wie in 9 gezeigt.
Alle für
einen VTR benötigten
Signale einschließlich
wenigstens eines Videosignals (Luminanzsignal, Farbsignal), Audiosignalen
und Spurverfolgungssignalen werden durch den rotierenden Videokopf
der Mehrfach-Frequenzaufzeichnung unterzogen. Die Frequenzbänder werden
in 12 gezeigt.
-
In 9 sind
Magnetspuren 401 und 402 eines Videosignalspurabschnitts 410 Spuren
für ein
Videosignal, und jede entspricht einem Feld. Magnetspuren 403 und 404,
welche in einem Audiosignalspurabschnitt 411 durch schräge Linien
gekennzeichnet sind, sind Magnetspuren für Audiosignale. Eine Suchlaufspur 405 und
eine Audiospur 406 für
einen feststehenden Kopf sind jeweils an beiden Kanten des Bandes
festgelegt. Nachdem die Steuerspur an der Bandkante in einem 8 mm-VTR
nicht verwendet wird, kann diese Spur als die Suchlauf spur zum Durchführen der
Suche nach bestimmten Punkten, Adressieren der Inhalte der Aufnahme
oder dergleichen verwendet werden. Die Breite einer Spur (Spurteilung)
beträgt
20,5 μm
und ist etwas größer als
die in dem Spar-Aufnahmemodus des β-Typs und des VHS-Typs (19,5 μm bei β –7, 19,2 μm in dem
6-Stunden-Modus
bei VHS). Es wird kein Leitband zum Verhindern des Auftretens eines
Kopiereffektes zwischen Spuren festgelegt. Stattdessen wird eine
Azimutaufnahme unter Verwendung zweier Köpfe eingesetzt, um den Kopiereffekt
zu unterdrücken.
-
Als
nächstes
wird ein bestimmtes Beispiel für den
Betrieb einer herkömmlichen
Vorrichtung unter Bezugnahme auf 13 bis 16 beschrieben. 13 ist ein Blockdiagramm eines herkömmlichen VTR.
Ein an einem Videosignaleingangsanschluß 201 gegebenes Videosignal
wird in eine Videosignalverarbeitungsschaltung 203 und
auch in einen eine Synchronsignaltrennschaltung 204 eingegeben.
Das Ausgangssignal der Videosignalverarbeitungsschaltung 203 wird
durch Logikgatter 205 und 206 in Addierer 213 und 214 eingespeist.
Demgegenüber
wird ein vertikales Synchronsignal, welches ein Ausgang der Synchronsignaltrennschaltung 204 ist,
in Verzögerungsschaltungen 207 und 208 eingegeben.
Der Ausgang Q der Verzögerungsschaltung 207,
welche sich mit der Synchronsignaltrennschaltung 204 vereinigt,
um eine Kopfschaltimpulserzeugungseinrichtung zu bilden, wird als
ein Gatterimpuls an das erste Logikgatter 205 und auch
an ein viertes Logikgatter 212, welches weiter unten beschrieben
wird, angelegt. Der Ausgang Q wird
als ein Gatterimpuls an das zweite Logikgatter 206 und
auch an ein drittes Logikgatter 211, welches weiter unten
beschrieben wird, angelegt. Das Ausgangssignal der Verzögerungsschaltung 208 wird
an eine Zeitbasiskompressionsschaltung 209 und auch an
einen Löschstromgenerator 240 angelegt.
-
Ein
an einem Audiosignaleingangsanschluß 202 gegebenes Audiosignal
wird durch die Zeitbasiskompressionsschaltung 209, eine
Modulierschaltung 210 und einen Schalter 241 zum
Umschalten zwischen Aufnahme und Löschung an das dritte und vierte
Logikgatter 211 und 212 angelegt. Der Ausgang
des Löschstromgenerators 240 wird
durch den Schalter 241 an das dritte und vierte Logikgatter 211 und 212 angelegt.
Die Ausgangssignale des dritten und vierten Logikgatters 211 und 212 werden
jeweils an die Addierer 213 und 214 angelegt.
Das Ausgangssignal des Addierers 213 wird durch einen Umschalter 215 zum
Umschalten zwischen Aufnahme und Löschung an einen Rotationsumformer 217 gegeben.
Das Ausgangssignal des Rotati onsumformers 217 wird durch
eine Drehwelle 219 und eine Rotationskopfstange 220 an
einen Rotationsmagnetkopf 221 gegeben, so daß ein Aufnahmestrom
oder ein Löschstrom
in ein Magnetband 223 fließt.
-
Das
Ausgangssignal des Addierers 214 wird durch einen Schalter 216,
welcher zum Umschalten zwischen Aufnahme und Löschung verwendet wird und mit
dem Schalter 215 fest verbunden ist, an einen Rotationsumformer 218 gegeben.
Das Ausgangssignal des Rotationsumformers 218 wird durch die
Drehwelle 219 und die Rotationskopfstange 220 an
einen anderen Rotationsmagnetkopf 222 gegeben, so daß ein Aufnahmestrom
oder ein Löschstrom in
das Magnetband 223 fließt. Das Magnetband 223 wird
durch Führungspfosten 224 und 225,
welche beiderseits einer die eingebauten Rotationsmagnetköpfe 221 und 222 aufweisenden
Tischführungstrommel 226 angeordnet
sind, geführt
und wird durch eine wohlbekannte Magnetbandantriebsvorrichtung (nicht dargestellt),
welche aus Capstans und Andruckrollen besteht, mit einer konstanten
Geschwindigkeit in Pfeilrichtung 227 angetrieben. Die Tischführungstrommel 226 kann
einen wohlbekannten Aufbau besitzen, und daher wird diesbezüglich auf
eine spezifische Beschreibung verzichtet.
-
In
dem Wiedergabeverfahren wird ein durch den Rotationsmagnetkopf 221 wiedergegebenes
Signal durch die Rotationskopfstange 220, die Drehwelle 219,
den Rotationsumformer 217 und den Schalter 216 an
eine Trennschaltung 228 angelegt. Andererseits wird ein
durch den Rotationsmagnetkopf 222 wiedergegebenes Signal
durch die Rotationskopfstange 220, die Drehwelle 219,
den Rotationsumformer 218 und den Schalter 216 an
eine Trennschaltung 229 angelegt. Einer der Ausgänge der
Trennschaltung 228 und einer der Ausgänge der Trennschaltung 229 werden
in einen Addierer 230 eingegeben. Der andere Ausgang der
Trennschaltung 228 und der andere Ausgang der Trennschaltung 229 werden
an einen Addierer 231 angelegt. Das Ausgangssignal des
Addierers 230 wird durch eine Videosignalverarbeitungsschaltung 232 an
einen Videosignalausgangsanschluß 233 angelegt. Andererseits
wird das Ausgangssignal des Addierers 231 durch eine Zeitbasiskorrekturschaltung 234,
ein Demodulierschaltung 235 und eine Zeitbasisexpanderschaltung 236 an
einen Audiosignalausgangsanschluß 237 angelegt.
-
Nun
wird die Wirkungsweise beschrieben. Ein an dem Videosignaleingangsanschluß 201 gegebenes
Videosignal wird durch die Videosignalverarbeitungsschaltung 203 in
ein FM-Signal umgewandelt. Wenn das Videosignal ein Chrominanzsignal beinhaltet,
wird das Chrominanzsignal in ein Niederfrequenzsignal von weniger
als etwa 1,2 MHz umgewandelt. Ein Problem, daß zum Beispiel als Mittel zum
Auslöschen
eines benachbarten Farbsignals die Phase des Chrominanzsignals um
90 Grad verschoben wird oder alle 1H (horizontales Abtastintervall)
invertiert wird, wird es nicht geben. Dies ist eine Technik zum
Beseitigen eines Kopiereffektes zwischen Spuren unter Verwendung
der Zeilenkorrelation des Chrominanzsignals. Das derart verarbeitete
Videosignal wird an das erste und zweite Logikgatter 205 und 206 angelegt.
-
Nachdem
andererseits das Videosignal auch an die Synchronsignaltrennschaltung 204 gegeben wird,
wird auf der Seite des Ausgangs des Schaltkreises ein Vertikalsynchronsignal
erhalten. Das Vertikalsynchronsignal wird an die Verzögerungsschaltungen 207 und 208 angelegt.
Die Verzögerungsschaltung 207 besitzt
die Funktionen des Teilens eines Eingangssignals in eine halbe Frequenz
und des Verzögerns
eines Signals. Von den Ausgängen
Q und Q der Verzögerungsschaltung 207 werden
Impulssignale Q und Q (vgl. 14(b) und 14(c))
zum Umschalten der Köpfe
an das erste bzw. zweite Logikgatter 205 bzw. 206 angelegt.
-
Um
die Phasenbeziehung zwischen diesen Impulssignalen Q und Qund dem eingegebenen Videosignal
zu klären,
ist die Wellenform des eingegebenen Videosignals in 14(a) gezeigt.
Von den Ausgängen
des ersten und zweiten Logikgatters 205 und 206 werden
die verarbeiteten Videosignale gemäß der Darstellung in 15(a) und 15(b) während der
Perioden, in welchen sich die Impulssignale Q und Q auf einem Pegel H befinden, ausgegeben.
Diese Signale werden einem modulierten komprimierten Audiosignal
und Löschsignal,
welche später
beschrieben werden, durch Addierer 213 und 214 hinzugefügt und dann
an Schalter 215 und 216 angelegt. Das komprimierte
Audiosignal wird durch die Modulierschaltung 210 einer
für das
Band- und Kopfsystem geeigneten Modulation (vorzugsweise Impulscodemodulation
(PCM), FM, PM, AM oder dergleichen, oder in bestimmten Fällen AC-Vormagnetisierungsaufnahme
ohne Modulation) unterzogen. Insbesondere PCM ist vorteilhaft, da
ein hohes S/N-Verhältnis
erwartet werden kann und wohlbekannte Fehlerkorrekturmittel für Signalausfall (drop-out)
etc. verwendet werden können.
Das modulierte komprimierte Audiosignal wird durch den Schalter 241 an
das dritte und vierte Logikgatter 211 und 212,
an welche die Impulssignale Q und Q jeweils
angelegt werden, gegeben. Diese Logikgatter 211 und 212 geben
das komprimierte Audiosignal an die Addierer 213 und 214 während der
Perioden, in welchen sich die Impulssignale Q und Qauf dem Pegel H befinden, aus.
-
Der
Löschstromgenerator 240 erzeugt
einen Löschstrom
einer bestimmten Frequenz (zum Beispiel 100 kHz). Die Zeitabstimmung
des Beginns der Oszillation des Löschstroms wird durch ein Triggersignal
T, welches durch Verzögern
des Vertikalsynchronsignals in der Verzögerungsschaltung 208 erhalten
wird, gesteuert. Der Löschstrom
wird durch den Schalter 241 an das dritte und vierte Logikgatter 211 und 212,
an welche die Impulssignale Q und Q jeweils
angelegt werden, ausgegeben und an die Addierer 213 und 214 angelegt.
In gleicher Weise wie die Aufzeichnung komprimierter Audiosignale
werden Löschsignale
während
der Perioden, in welchen sich Impulssignale Q und Q auf dem Pegel H befinden, durch die Logikgatter 211 und 212 ausgegeben. 16(a) und 16(b) zeigen
die Wellenformen der Ausgangsströme
der Addierer 213 und 214, d. h., zeitgemultiplexter
Signale eines verarbeiteten Videosignals A und eines verarbeiteten
Audiosignals B oder des Löschsignals.
Diese Signale werden über die
oben genannten Wege an die Rotationsmagnetköpfe 221 und 222 angelegt,
wodurch das magnetische Muster eines in 9 gezeigten
Bandes erzielt wird.
-
Während des
Wiedergabeprozesses werden die beweglichen Kontakte der Schalter 215 und 216 an
feststehenden Kontakten P positioniert. Dies erlaubt es, das durch
die Rotationsmagnetköpfe 221 und 222 wiedergegebene
Zweikanal-Wiedergabesignal jeweils durch die Rotationskopfstange 220,
die Drehwelle 219, die Rotationsumformer 217 oder 218 und
die Schalter 215 oder 216 zu übertragen und in Trennschaltungen 228 und 229 auf
der Zeitbasis jeweils in ein Videosignal und ein Audiosignal zu
trennen. Die getrennten Videosignale werden durch den Addierer 230 in
ein zeitlich kontinuierliches Einkanal-Videosignal umgewandelt und
dann an die Videosignalverarbeitungsschaltung 232 angelegt.
Die Videosignalverarbeitungsschaltung 232 rekonstruiert das
ursprüngliche
Videosignal aus dem Eingangssignal und gibt das rekonstruierte Signal
an den Videosignalausgangsanschluß 233 aus. Andererseits
werden die getrennten Audiosignale durch den Addierer 231 in
einen einzigen Signalkanal umgewandelt und dann in die Zeitbasiskorrekturschaltung 234 angelegt.
Die Zeitbasiskorrekturschaltung 234 besteht aus einer Halbleiterspeichervorrichtung
wie etwa einem CCD (Ladungskopplungsspeicher) oder einem BBD (Eimerkettenspeicher)
und eliminiert eine Zeitbasisvariationen (sogenannter Jitter und
Bitversatz) des Band- und Kopfsystems. Das Ausgangssignal der Zeitbasiskorrekturschaltung 234 wird
durch die Demodulierschaltung 235 auf das ursprüngliche
komprimierte Audiosignal demoduliert. Das demodulierte Signal wird
dann durch die Zeitbasisexpanderschaltung 236, welche aus
einer Halbleiterspeichereinrichtung etwa einem CCD oder einem BBD
besteht, in das ursprüngliche
Audiosignal umgewandelt und an den Audiosignalausgangsanschluß 237 ausgegeben.
-
Wie
oben beschrieben, werden in einem 8 mm-VTR Videosignale und Audiosignale
für ein
Feld auf einer Spur eines Bandes aufgezeichnet und von dieser wiedergegeben.
-
17 ist ein Blockdiagramm, welches die Konfiguration
einer herkömmlichen
Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt.
In 17 wird ein digitaler VTR des Verfahrens D1 oder
D2 gezeigt, welcher für
kommerzielle Zwecke oder den Einsatz im Sendebetrieb verwendet wird
wird. Die Bezugsziffer 101 bezeichnet einen A/D-Wandler,
welcher ein analoges Videosignal in ein digitales Videosignal umwandelt, 102 bezeichnet einen
Fehlerkorrekturkodierer, welcher Fehlerkorrekturcodes hinzufügt, 103 bezeichnet
einen Modulator, welcher das Digitalsignal zu einem für die Aufzeichnung
auf einem Magnetband geeigneten Signal moduliert, 104 bezeichnet
eine Rotationskopftrommel, 105 bezeichnet ein Magnetband, 106 bezeichnet
einen Magnetkopf für
Aufnahme und Wiedergabe, 107 bezeichnet einen Demodulator,
welcher das wiedergegebene Signal demoduliert, 108 bezeichnet
einen Fehlerkorrekturdekodierer, welcher einen Übertragungsfehler erfaßt und korrigiert,
und 109 bezeichnet einen D/A-Wandler, welcher das digitale
Videosignal in analoge Videosignale umwandelt.
-
18 zeigt die Bandformate der zwei Verfahren. In
beiden Verfahren werden ein Videosignal und ein 4-Kanal-Audiosignal an verschiedenen
Positionen in der gleichen Spur aufgezeichnet. In dem Verfahren
D1 wird ein Audiosignal in der Mitte einer Spur aufgezeichnet, und
in dem Verfahren D2 an den Enden einer Spur. Wenn ein Videosignal
und ein Audiosignal in der gleichen Spur aufgezeichnet werden, können Komponenten
wie etwa ein Magnetkopf und eine Verstärkerschaltung, welche zur Aufzeichnung und
Wiedergabe notwendig sind, gemeinsam für ein Videosignal und ein Audiosignal
verwendet werden, und des weiteren können ein Paritätscode,
welcher für
die später
beschriebene Fehlerkorrektur benötigt wird,
und eine Schaltung zum Erzeugen des Paritätscodes gemeinsam verwendet
werden.
-
19 zeigt die Gesamtspezifikationen der Verfahren
D1 und D2, 20 zeigt die Spezifikationen
der Bandformate, und 21 zeigt die Spezifikationen
der Bandantriebssysteme. Die berücksichtigte Flächenaufnahmedichte
mit Leitbändern
beträgt
21,5 μm2/bit in dem Verfahren D1, und 16,6 μm2/bit in dem Verfahren D2. In dem Verfahren
D1 werden Leitbänder
zwischen Aufnahmespuren festgelegt, doch in dem Verfahren D2 gibt
es keine Leitbänder.
Daher ist die Spurdichte des Verfahrens D2 um etwa 15 % höher als
die des Verfahrens D1, was einen Beitrag zur Langzeitaufnahme durch
das Verfahren D2 leistet. Wenn es andererseits keine Leitbänder gibt,
ist es eher wahrscheinlich, zusätzlich
zu einem Signal der ursprünglich
zur Wiedergabe vorgesehenen Spur ein Signal einer Nachbarspur wiederzugeben.
Um mit diesem Kopiereffekt zwischen Spuren in dem Wiedergabeprozeß fertig
zu werden, verwendet das Verfahren D2 das Azimutaufnahmesystem.
Im allgemeinen werden ein Aufnahmemagnetkopf und ein Wiedergabemagnetkopf
so positioniert, daß ihre
Kopfspalte gleiche Winkel mit einer Magnetspur ausbilden. Falls
die zwei Kopfspalte so angeordnet sind, daß sie einen Winkel miteinander
bilden, zeigt der Pegel eines wiedergegebenen Signals eine Dämpfungscharakteristik.
Der Azimutwinkel θ in
dem Verfahren D2 beträgt
ungefähr ±15 Grad,
wie in 20 gezeigt. Daher wird, auch
wenn ein Signal von einer Nachbarspur in wiederzugeben Signale gemischt wird,
die unnötige
Komponente abgeschwächt.
Demgemäß wird,
auch wenn keine Leitbänder
existieren, die Wirkung des Kopiereffekts reduziert. Nachdem allerdings
der Verlust aufgrund des Azimutwinkels für DC-Komponenten nicht erwartet
werden kann, dürfen
aufzuzeichnende Signale keine DC-Komponenten aufweisen. Daher verwendet
das Verfahren D2 ein Modulationssystem, welches keine DC-Komponenten
beinhaltet.
-
Bei
einer Digitalaufnahme ist es nicht notwendig, ein Videosignal während der
gesamten Zeitdauer aufzuzeichnen. In einer Austastlücke besitzt ein
Videosignal eine konstante Wellenform ohne Rücksicht auf die Inhalte eines
Bildes. Nachdem diese Wellenform nach der Wiedergabe synthetisiert werden
kann, wird sowohl im Verfahren D1 als auch D2 die Aufzeichnung nur
während
der effektiven Videozeitdauer durchgeführt. Auch ein Farbsynchronsignal,
welches in einer Austastlücke
eines NTSC-Signals auftaucht, kann nach der Wiedergabe synthetisiert
werden. Dies kommt daher, daß die
Abtastphase in dem Verfahren D2 auf die I- und Q-Achse festgelegt
wird und die Phase des Farbsynchronsignals (der Q-Achse um (180+33)
Grad nacheilend) unter Verwendung eines wiedergegebenen Abtasttakts
bestimmt werden kann.
-
22 zeigt die Bereiche, in welchen Pixel in den
Verfahren D1 und D2 tatsächlich
aufgezeichnet werden können.
Diese effektiven Pixel werden in mehrere Segmente geteilt. In dem
Verfahren D1 bilden Pixel von 50 Abtastzeilen ein Segment, und in dem
Verfahren D2 bilden Pixel von 85 Abtastzeilen ein Segment. Anders
gesagt, Pixel eines Feldes bilden fünf Segmente in dem Verfahren
D1 und drei Segmente in dem Verfahren D2.
-
Wenn
ein Videosignal in einem Segment aufzuzeichnen ist, wird es in dem
Verfahren D1 in vier Kanäle
und in dem Verfahren D2 in zwei Kanäle geteilt. Daher beträgt die Anzahl
von Pixel je Kanal eines Segments in dem Verfahren D1 {(720 + 360 × 2)/4} × 50 = 360 × 50 = 18.000
und in dem Verfahren D2 (768/2) × 85 = 384 × 85 = 32.640. Kanäle werden so
zugeteilt, daß sie
gleichmäßig auf
einem Bildschirm verteilt sind. Demgemäß werden, auch wenn die Eigenschaften
eines bestimmten Kanals verschlechtert werden, durch diese Verschlechterung hervorgerufene
Codefehler nicht in einem einzigen Abschnitt des Bildschirms konzentriert,
so daß sie unauffällig bleiben.
Daher ist die Wirkung der Korrektur an Fehlern, welche nicht korrigiert
worden sind, auch enorm.
-
Sowohl
in dem Verfahren D1 als auch D2 werden zwei Arten von Fehlerkorrekturcodes,
welche jeweils ein äußerer Code
und ein innerer Code genannt werden, zusammen verwendet. In einem
tatsächlichen
Prozeß zum
Erzeugen innerer und äußerer Codes
wird ein Arbeitsgang einer Neuordnung der Sequenz des Codes durchgeführt. Dieser
Arbeitsgang wird Shuffling genannt. Das Shuffling zerstreut die
Auswirkung von Codefehlern, verbessert das Korrekturvermögen und
reduziert die Anzeigeverschlechterung, welche durch unkorrigierte
Fehler hervorgerufen werden. Das Shuffling-Verfahren besteht aus
dem Shuffling für
eine Abtastlinie, welche vor der Erzeugung eines äußeren Codes
durchgeführt
wird, und dem Shuffling, welches in einem Sektor nach dem Hinzufügen eines äußeren Codes
und vor der Erzeugung eines inneren Codes durchgeführt wird.
Wie oben beschrieben, werden in einem VTR nach dem Verfahren D1
oder D2 Videosignale und Audiosignale für ein Feld in eine Mehrzahl
von Spuren auf einem Band aufgezeichnet.
-
Um
alle Information von Standard-Fernsehsignalen der derzeit verwendeten
NTSC- und PAL-Systeme aufzuzeichnen, wird bei einem Heim-VTR die
Trägerfrequenz
eines FM-Luminanzsignal angehoben, und die Bandbreite und Abweichung
werden vergrößert, um
die Auflösung
und das C/N-Verhältnis
zu verbessern. Allerdings ist es einem Heim-VTR noch immer nicht
möglich,
in S/N-Verhältnis,
Wellenform-Reproduzierbarkeit, etc. mit einem VTR für kommerzielle
Anwendungen gleichzuziehen. Es wird erwartet, die Größenminimierung
eines VTR zu erreichen, und es gibt die Forderung nach weiteren
Leistungsverbesserungen als auch der Verwirklichung eines VTR, welcher
leicht und kompakt ist. Daher ist es schwierig, die erforderliche
Leistung nur durch Verbessern der vorliegenden Techniken zu erreichen.
Andererseits wurden in dem Bereich von VTRs für kommerzielle Anwendungen
und Einsatz im Sendebetrieb schnelle Fortschritte in Digitalisierung einer
Vorrichtung gemacht, so daß mehrfache
Funktionen und hohe Leistung in den Vorrichtungen erreicht werden,
und die meisten VTRs für
den Einsatz im Sendebetrieb werden durch digitale VTRs ersetzt. Allerdings
verbraucht ein digitaler VTR eine große Menge an Band, was ein Hindernis
für das
Erreichen einer Verlängerung
der Aufzeichungsdauer und der Größenminimierung
ist.
-
In
der letzten Zeit wurden in Anbetracht der Redundanz der in einem
Bild enthaltenen Information aktiv Studien über die Kompression aufgezeichneter Information
durchgeführt,
und die Anwendung der Ergebnisse dieser Studien auf einen VTR wird
geprüft. Es
wird erwartet, einen VTR zu verwirklichen, welcher kompakt und leicht
ist, eine hohe Bildqualität aufweist
und für
eine lange Zeitdauer betrieben werden kann, während gleichzeitig auf grund
einer Aufnahme hoher Dichte und einer Informationskompression, welche
der Digitalaufnahme inhärent
sind, eine hohe Bildqualität
und eine Verminderung des Bandverbrauchs erreicht wird.
-
23 zeigt eine Kommunikationsvorrichtung eines
Hochleistungs-Kompressionsverfahrens für kodierte Videoinformation
(gemäß CCITT
H. 261, etc.), welche in dem Gebiet der Kommunikation einschließlich eines
Bildtelefons und einer Videokonferenz verwendet wird. Die Bezugsziffer 101 bezeichnet
einen A/D-Wandler, welcher ein analoges Videosignal in ein digitales
Videosignal umwandelt, 110 bezeichnet einen Hochleistungs-Codekodierer,
welcher ein Videosignal kompressionskodiert, 112 bezeichnet einen
Pufferspeicher, welcher zum Verteilen erzeugter komprimierter Codes
bei einer konstanten Geschwindigkeit verwendet wird, 102 bezeichnet
einen Fehlerkorrekturkodierer, welcher Fehlerkorrekturcodes hinzufügt, 103 bezeichnet
einen Modulator, welcher das Digitalsignal zu einem für die Kommunikation
geeigneten Übertragungssignal
moduliert, 114 bezeichnet einen Übertragungsweg, 107 bezeichnet einen
Demodulator, welcher ein empfangenes Signal in ein Digitalsignal
demoduliert, 108 bezeichnet einen Fehlerkorrekturdekodierer,
welcher einen Übertragungsfehler
erfaßt
und korrigiert, 113 bezeichnet einen Pufferspeicher, welcher
zum Zuführen
von komprimierten Codes, welche bei einer konstanten Geschwindigkeit
erhalten worden sind, in Übereinstimmung
mit der Anforderung von der nächsten
Stufe verwendet wird, 111 bezeichnet einen Hochleistungs-Codedekodierer,
welcher das komprimierte Videosignal in das Originalsignal expandiert,
und 109 bezeichnet einen D/A-Wandler, welcher das digitale Videosignal
in ein analoges Videosignal umwandelt.
-
Die
Redundanz eines eingegebenen Videosignals variiert immer, und daher
variiert auch die Menge von Codes, welche unter Verwendung dieser Redundanz
kompressionskodiert werden. Allerdings ist die Menge an Information,
welche durch den Übertragungsweg 114 übertragen
werden kann, begrenzt. Um die Leistungsfähigkeit bestmöglich zu
nutzen, wird die Variation der Codemenge unter Verwendung des Pufferspeichers 113 gepuffert,
und die Informationsmenge wird gesteuert, um innerhalb eines vorbestimmten
Bereichs zu liegen, so daß Überlauf
oder Unterlauf eines Speichers nicht auftritt. 24 zeigt den Betrieb des Puffers, welcher auf
der Empfangsseite durchgeführt
wird. Daten, welche mit einer konstanten Rate empfangen worden sind,
werden in dem Pufferspeicher gespeichert, and wenn die Datenmenge
das Niveau B0 erreicht, beginnt das Dekodieren der Codes. Zu dem
Zeitpunkt, zu dem Daten von d1 für
die Anzeige des ersten Bildes verbraucht worden sind und das Dekodieren
des zweiten Bild beginnt, ist die Menge der aufgespeicherten Daten
B1. In gleicher Weise werden Datenaufspeicherung und Datenverbrauch
abwechselnd wiederholt. Die Menge der verbrauchten Daten variiert
abhängig
von dem angezeigten Bild, aber die durchschnittliche Menge an verbrauchten
Daten ist gleich der Empfangsrate. Der Betrieb der Empfangsseite
wurde beschrieben. Der Betrieb der Sendeseite wird auf dem genau
umgekehrten Weg wie der der Empfangsseite durchgeführt.
-
Nachdem
die Kommunikationsvorrichtung wie oben beschrieben gesteuert wird,
ist die Beziehung zwischen Feldern eines eingegebenen Videosignals
und übertragen
Codes nicht klar definiert. Anders als eine Anwendung auf dem Gebiet
der Kommunikation muß ein
VTR für
einen VTR typische und eine spezielle, von normaler Wiedergabe unterschiedliche
Wiedergabe wie etwa eine Standbildwiedergabe, langsame Wiedergabe
und schnelle Wiedergabe, Zusammenschnitt und Einfügeschnitt
umfassende Funktionen durchführen.
Daher ist es wünschenswert,
die Beziehung zwischen Feldern und Spuren klar zu definieren. Um
einen VTR in der Praxis herzustellen, ist es wesentlich, ein Aufnahmeformat
auszuwählen,
welches diese Probleme lösen kann.
-
Als
ein Verfahren zum Komprimieren eines bewegten Bildes wie etwa eines
Fernsehsignals gibt es ein Verfahren unter Verwendung eines Intrafeldes (oder
Intrarahmens), in welchem das Kodieren innerhalb eines individuellen
Feldes (oder Rahmens) unabhängig
von einem anderen Feld (oder Rahmen), und eines Vorhersagefeldes
(oder Vorhersagerahmens), in welchem die Vorhersagekodierung unter Verwendung
der Information eines anderen Feldes (oder Rahmens) durchgeführt wird,
fertiggestellt wird. Im Allgemeinen ist die Informationsmenge des
Intrafeldes (oder Intrarahmens), in welchem die Vorhersage zwischen
Feldern (oder Rahmen) nicht verwendet wird, ein Zwei- oder ein Mehrfaches
der Codemenge des Vorhersagefeldes (oder Vorhersagerahmens), in welchem
die Kodierung unter Verwendung der Vorhersage zwischen Ebenen durchgeführt wird.
Wenn Aufnahmegebiete gleicher Größe (Anzahl
von Spuren) dem Intrafeld (oder Intrarahmen) und dem Vorhersagefeld
(oder Vorhersagerahmen) zugeteilt werden, tritt daher ein viertes
Problem auf, daß in
dem Intrafeld (oder Intrarahmen) das Aufnahmegebiet nicht ausreichend
ist und das Aufnahmegebiet in dem Vorhersagefeld (oder Vorhersagerahmen)
einen nutzlosen Anteil aufweist.
-
US-A-4
651 206 offenbart eine Anordnung zum Kodieren von Fernsehvideodaten
durch Erzeugen von Bewegungsvektoren, die in dem Fernsehsignal enthaltene
Bewegungen repräsentieren,
und in Reaktion hierauf eines Vorhersagefehlersignals, welches Abweichungen
von Rahmen zu Rahmen in dem Fernsehsignal angibt. DE-3831277-A beschreibt
die Verwendung eines Hybridkodierers, welcher unter Verwendung des
Zwischenrahmenprinzips, das die Korrelation zwischen aufeinanderfolgenden
Videorahmen verwendet, und des Zwischenrahmenprinzips, bei welchem
die Korrelation der Videodaten innerhalb eines Videorahmens eingesetzt
wird, arbeitet. Auf Übertragung
eines durch den Kodierer bereitgestellten Signals werden die durch
das Zwischenrahmenprinzip kodierten Rahmenextrakte durch vorherige
oder nachfolgende Kodewörter
charakterisiert. EP-A-0 267 581 offenbart eine Anordnung zum Kodieren
sich bewegender Bildsignale, bei welchem eine Zwischenrahmenkorrelation
verwendet wird, um ein Vorhersagefehlersignal für jeden Block eines Bildrahmens
zu erzeugen, und das Vorhersagefehlersignal evaluiert wird, um zu
bestimmen, ob der Block gemäß dem Vorhersagefehlersignal
kodiert werden sollte. Wenn dies der Fall ist, wird das vorhergesagte
Fehlersignal quantisiert und übertragen. EP-A-0
353 758 beschreibt ein digitales Videobandaufzeichnungsgerät, bei welchem
Videofelder in einem ganzzahligen Vielfachen von Aufzeichnungssegmenten
oder Spuren aufgezeichnet werden.
-
KURZFASSUNG
DER ERFINDUNG
-
Gesichtspunkte
der Erfindung werden in den begleitenden Ansprüchen dargelegt.
-
In
einer Videoinformations-Aufzeichnungs/Wiedergabevorrichtung gemäß einer
bevorzugten Ausführungsform
der Erfindung werden Eingangssignale von n Feldern (oder n Rahmen)
in einen Aufzeichnungseinheitsblock gesammelt und in Spuren einer
vorbestimmten Anzahl, welche aus der Menge der aufzuzeichnenden
Information und der Aufnahmekapazität einer Spur berechnet wird,
aufgezeichnet. Die Kompressionskodierung wird an Blöcken durchgeführt, welche
in die Aufzeichnungseinheit in einer Art und Weise gesammelt werden,
daß wenigstens
ein Intrafeld (oder Intrarahmen) in der Einheit enthalten ist. Eingegebene
Fernsehsignale von n Feldern (oder n Rahmen) werden als ein Aufzeichnungseinheitsblock
der Kompressionskodierung durch einen Hochleistungskodierer unterzogen. Die
kompressionskodierten Fernsehsignale von n Feldern (oder n Rahmen)
werden geteilt, um in Aufzeichnungsgebieten von m Spuren aufgezeichnet
zu werden. Die wiedergegeben Signale von m Spuren werden durch einen
Hochleistungsdekodierer in Fernsehsignale von n Feldern (oder n
Rahmen) zurückverwandelt.
-
Die
oben genannten und weitere Merkmale der Erfindung werdem aus der
nachfolgenden ausführlichen
Beschreibung mit den begleitenden Zeichnungen vollständiger offenbar.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
1 ist
ein Blockdiagramm, welches die Konfiguration eines digitalen VTR
zeigt;
-
2 ist
ein Blockdiagramm, welches die Konfiguration einer herkömmlichen Bewegungskompensationsvorhersageverarbeitungsvorrichtung
zeigt;
-
3 zeigt
den Ablauf einer Blockauswahl in der herkömmlich Bewegungskompensationsvorhersageverarbeitungsvorrichtung;
-
4 zeigt
anhand eines Diagramms die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß;
-
5 zeigt
anhand eines Diagramms die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß;
-
6 zeigt
Codemengen und S/N-Verhältnisse
in herkömmlicher
Bewegungskompensationsvorhersage;
-
7 zeigt
die Änderung
der Informationsmenge für
fünf Sekunden,
falls ein Referenzbild nicht geschaltet wird;
-
8 zeigt
die Variation des S/N-Verhältnisses
für fünf Sekunden
in dem Fall, daß ein
Referenzbild nicht geschaltet wird;
-
9 zeigt
anhand eines Diagramms das Bandformat gemäß dem 8 mm-VTR-Standard;
-
10 zeigt
anhand eines Diagramms das Format einer Spur gemäß dem 8 mm-VTR-Standard;
-
11 zeigt
anhand eines Diagramms die Beziehung zwischen einer Rotationskopftrommel und
einem darum gewundenen Magnetband, welche in einem 8 mm-VTR verwendet
werden;
-
12 zeigt
anhand eines Graphs die Frequenzzuteilung jedes Signals in dem 8 mm-VTR-Standard;
-
13 ist ein Blockdiagramm, welches die Konfiguratin
einer herkömmlichen
Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt;
-
14 ist
eine Zeittafel, welche die Phasenbeziehung zwischen Impulssignalen
zum Schalten eines Kopfes und eingegebenen Videosignalen in der Vorrichtung
zur Aufzeichnung/Wiedergabe von Videoinformation nach 13 zeigt;
-
15 ist eine Wellenformtafel, welche Videosignale
zeigt, die durch Logikgatter in der Vorrichtung zur Aufzeichnung/Wiedergabe
von Videoinformation nach 13 verarbeitet
werden;
-
16 ist eine Wellenformtafel, welche auf zeitlicher
Basis gemultiplexte Signale in der Vorrichtung zur Aufzeichnung/Wiedergabe
von Videoinformation nach 13 zeigt;
-
17 ist ein Blockdiagramm, welches die Konfiguration
einer anderen herkömmlichen
Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt;
-
18 zeigt anhand eines Diagramms die Bandformate
von VTRs nach den Verfahren D1 und D2;
-
19 zeigt die Gesamtspezifikationen von VTRs nach
den Verfahren D1 und D2;
-
20 zeigt die Spezifikationen der Bandformate von
VTRs nach den Verfahren D1 und D2;
-
21 zeigt die Spezifikationen der Bandantriebssysteme
von VTRs nach den Verfahren D1 und D2;
-
22 zeigt anhand eines Diagramms die durch VTRs
nach den Verfahren D1 und D2 aufgezeichneten Pixelbereiche;
-
23 ist ein Blockdiagramm, welche die Konfiguration
einer Kommunikationsvorrichtung eines Hochleistungskompressionsverfahrens
für Videoinformation
zeigt;
-
24 illustriert die Wirkungsweise des Puffers der
Hochleistungscodekommunikationsvorrichtung;
-
25 ist ein Blockdiagramm, welches die Konfiguration
eines Hochleistungskodierers zeigt, der in der Vorrichtung gemäß der Erfindung
verwendet werden kann;
-
26 ist ein Diagramm, welches die Beziehung zwischen
Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
-
27 ist ein Diagramm, welches die Konfiguration
eines anderen Hochleistungskodierers zeigt;
-
28 ist ein Diagramm, welches die Beziehung zwischen
Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
-
29 zeigt Simulationsergebnisse, die in dem Fall
erhalten werden, daß ein
Szenenwechsel vorhanden ist;
-
30 zeigt Simulationsergebnisse, die in dem Fall
erhalten werden, daß kein
Szenenwechsel vorhanden ist;
-
31 ist ein Blockdiagramm, welches die Konfiguration
eines weiteren Hochleistungskodierers zeigt;
-
32 ist ein Flußdiagramm der Betriebsweise
des Hochleistungskodierers von 31;
-
33 ist ein Flußdiagramm eines Intrafeld-Prozesses
in 32;
-
34 ist ein Flußdiagramm eines Vorhersagefeldprozesses
in 32;
-
35 zeigt die Änderung
der Informationsmenge für
fünf Sekunden
in dem Fall, daß ein
Referenzbild umgeschaltet wird;
-
36 zeigt die Veränderung des Rauschabstands
für fünf Sekunden
in dem Fall, daß ein Referenzbild
umgeschaltet wird;
-
37 ist ein Flußdiagramm eines anderen Vorhersagefeldprozesses
in 32;
-
38 ist ein Flußdiagramm eines weiteren Vorhersagefeldprozesses
in 32;
-
39 ist ein Flußdiagramm eines Referenzbildumschaltbeurteilungsprozesses
in 38;
-
40 ist ein Blockdiagramm, welches die Konfiguration
eines noch weiteren Hochleistungskodierers zeigt;
-
41 zeigt den Vorgang eines Auswählens von
Blöcken
in dem Hochleistungskodierer von 40;
-
42 ist ein Diagramm, welches ein Umschalten zwischen
einem Referenzbild und einem Intrabild in dem Hochleistungskodierers
von 40 zeigt;
-
43 ist ein Flußdiagramm einer Betriebsweise
des Hochleistungskodierer von 40;
-
44 ist ein Flußdiagramm eines Vorhersagefeldprozesses
in 43;
-
45 ist ein Diagramm, welches ein anderes Umschalten
zwischen einem Referenzbild und einem Intrabild in dem Hochleistungskodierers
von 40 zeigt;
-
46 ist ein Flußdiagramm eines anderen Vorgangs
des Hochleistungskodierers von 40;
-
47 ist ein Diagramm, welches die Beziehung
zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
-
48 ist ein Diagramm, welches die Beziehung
zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
-
49 ist ein Diagramm, welches das Umschalten eines
Referenzbildes zeigt;
-
50 ist ein Blockdiagramm, welches die Konfiguration
einer Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation
gemäß der Erfindung
zeigt;
-
51 ist ein Diagramm, welches ein Beispiel
für das
von der Vorrichtung von 50 produzierte
Bandformat gemäß der Erfindung
zeigt;
-
52 ist ein Blockdiagramm, welches die interne
Konfiguration des Hochleistungskodierers der in 50 gezeigten Vorrichtung zeigt;
-
53 zeigt anhand eines Graphs ein Beispiel für die Variation
der Menge der für
jeden Rahmen erzeugten Daten; und
-
54 ist ein Diagramm, welches die Beziehung zwischen
in jedem Feld aufgezeichneter Information und dem Schreiben in Spuren
gemäß der Erfindung
illustriert.
-
BESCHREIBUNG DER BEVORZUGTEN
AUSFÜHRUNGSFORMEN
-
Zuerst
werden verschiedene Ausführungsformen
von Kodierern für
eine Aufzeichnungsvorichtung beschrieben werden.
-
Ausführungsform 1
-
Nachstehend
wird eine erste Ausführungsform
mit Bezug auf 25 beschrieben werden. In 25 bezeichnet 1 einen Eingangsanschluß für ein digitales
Videosignal, 2 bezeichnet eine Blockbildungsschaltung,
welche ein durch den Digital-Videosignal-Eingangsanschluß 1 eingegebenens
digitales Videosignal in Blöcke
bringt, 30 bezeichnet eine Bewegungskompensationsvorhersageschaltung, welche
zwischen dem von der Blockbildungsschaltung 2 ausgegebenen
Block und einem Intrafeld eine Bewegungskompensationsvorhersage
durchführt und
ein Differenzsignal zwischen einem Eingabeblock und einem Vorhersageblock
ausgibt, 31 bezeichnet ein Bestimmungsglied, welches das
eine mit der kleineren Summe von Absolutwerten von dem Eingangssignal
aus der Blockbildungsschaltung 2 und einem Vorhersagedifferenzsignal
aus der Bewegungskompensationsvorhersageschaltung 30 auswählt, 32 bezeichnet
einen ersten Schalter, welche von der Blockbildungsschaltung 2 und
dem Bestimmungsglied 31 ausgegebene Blöcke in Abhängigkeit von der bestimmten
Betriebsart selektiv ausgibt, 33 bezeichnet eine Orthogonaltransformationsschaltung,
welche die Orthogonaltransformation an einem von dem ersten Schalter 32 ausgegebenen kodierten
Block ausführt, 34 bezeichnet
eine Quantisierungsschaltung 34, welche den Ausgang der Orthogonaltransformationsschaltung 33 quantisiert, 11 ist
ein Übertragungsweg. 35 bezeichnet
einen zweiten Schalter, welcher die von der Quantisierungsschaltung 34 ausgegebenen
Quantisierungsergebnisse nur in dem Fall eines Intrafeldes auswählt und
ausgibt, 36 bezeichnet eine Umkehrquantisierungsschaltung,
welche den Ausgang des zweiten Schalters 35 invers quantisiert, 37 bezeichnet
eine Umkehrorthogonaltransformationsschaltung, welche eine umgekehrte
Orthogonaltransformation an dem Ausgang der Umkehrquantisierungsschaltung 36 ausführt, und 38 bezeichnet
einen Videospeicher, welcher ein Feld des wiedergegebenen Bildes
eines von der Umkehrorthogonaltransformationsschaltung 37 ausgegebenen
Intrafeldes speichert und ein Referenzbild in einem Suchbereich
des Vorhersagefeldes an die Bewegungskompensationsvorhersageschaltung 30 ausgibt.
-
Als
ein in einem solchen Schaltungblock verwendetes Vorhersageverfahren
kann zu Beispiel das in 26 gezeigte
Verfahren eingesetzt werden. In diesem Verfahren wird alle vier
Felder ein Intrafeld eingefügt,
und die drei Felder dazwischen bilden Vorhersagefelder. In 26 ist ein erstes Feld F1 ein Intrafeld, und ein
zweites, drittes und viertes Feld F2, F3 und F4 sind Vorhersagefelder.
In diesem Verfahren werden das zweite, dritte und vierte Feld F2,
F3 und F4 aus dem ersten Feld F1 vorhergesagt. Zuerst wird das erste
Feld F1, welches ein Intrafeld ist, in dem Feld einer Blockbildung
unterworfen, und unter Ausführung
der Orthogonaltransformation wird der Block quantisiert und dann
kodiert. In der lokalen Dekodierungsschleife werden die quantisierten
Signale des ersten Feldes F1 dekodiert und rekonstruiert. Das rekonstruierte
Bild wird in der Bewegungskompensationsvorhersage für das zweite,
dritte und vierte Feld F2, F3 und F4 verwendet. Dann wird eine Bewegungskompensationsvorhersage
an dem zweiten Feld F2 unter Verwendung des ersten Feldes F1 durchgeführt. Nachdem
eine Orthogonaltransformation an den erhaltenen Differenzblöcken durchgeführt ist,
wird in einer änlichen
Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt. In
diesem Fall wird, wenn die Summe der Absolutwerte der eingegebenen
Blöcke
kleiner als die der Differenzblöcke ist,
eine Orthogonaltransformation an den eingegebenen Blöcken an stelle
der Differenzblöcke
ausgeführt,
und danach wird in einer ähnlichen
Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt. In
einer ähnlichen
Weise wie bei dem zweiten Feld F2 werden unter Verwendung des ersten
Feldes F1 auch das dritte und vierte Feld F3 und F4 einer Bewegungskompensationsvorhersageverarbeitung unterzogen
und kodiert. Auch bei dem dritten und vierten Feld F3 und F4 wird,
wenn die Summe von Absolutwerten der Wechselstromleistungen der
Eingabeblöcke
kleiner als die der Differenzblöcke
ist, eine Orthogonaltransformation an den Eingabeblöcken anstelle
der Differenzblöcke
ausgeführt,
und danach wird in einer ähnlichen
Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt.
-
Nun
wird die Betriebsweise beschreiben werden. Ungeachtet des Feldes
(ein Intrafeld oder ein Vorhersagefeld) werden durch den Digital-Videosignal-Eingangsanschluß
1 eingegebene
digitale Videosignale durch die Blockbildungsschaltung
2 in
der Einheit von beispielsweise 8 Pixeln × 8 Zeilen einer Blockbildung
unterworfen. Die Bewegungskompensationsvorhersageschaltung
30 führt an Eingabeblöcken, die
von der Blockbildungsschaltung
2 ausgegeben werden, in
dem Fall eines Vorhersagefeldes ein Bewegungskompensationsvorhersage
durch, während
die wiedergegebenen Videodaten eines in dem Videospeicher
38 gespeicherten
Intrafeldes als ein Referenzbild verwendet werden. die Bewegungskompensationsvorhersageschaltung
30 führt unter
Festlegung des Suchbereichs einer Bewegungsschätzung zu beispielsweise 10
Pixeln × 16 Zeilen
eine Bewegungsschätzung
durch, um einen Bewegungsvektor zu erhalten, und erhält ferner
das Differenzsignal zwischen dem Referenzbild und dem Eingabebild
in Übereinstimmung
mit dem in der Bewegungschätzung
erhaltenen Bewegungsvektor. Das Differenzsignal wird zusammen mit
dem Bewegungsvektor an das Bestimmungsglied
31 ausgegeben.
Das Bestimmungsglied
31 erhält die Summe von Absolutwerten
von Kom ponenten von jedem der von der Blockbildungsschaltung
2 ausgegebenen Eingabeblöcke und
der von der Bewegungskompensationsvorhersageschaltung
30 ausgegebenen
Differenzblöcke.
Wenn die Eingangsblöcke
durch I(i,j) (i, j = 1 bis 8) angegeben sind, die Summe ihrer Absolutwerte
durch Is angegeben ist, die Differenzblöcke durch P(i,j) (i, j = 1
bis 8) angegeben sind, und die Summe ihrer Absolutwerte durch Ps
angegeben ist, können
Is und Ps durch die folgenden Ausdrücke ausgedrückt werden:
-
Wenn
Ps < Is, wird bestimmt,
daß die
Informationsmenge der Differenzblöcke kleiner als die der Eingabesignalblöcke ist,
und dann werden die Differenzblöcke
zusammen mit den Bewegungsvektoren an den ersten Schalter 32 ausgegeben.
Wenn dagegen Ps ≥ Is,
wird bestimmt, daß die
Informationsmenge der Eingabesignalblöcke kleiner als die der Differenzsignalblöcke ist,
und dann werden die Eingabeblöcke
zusammen mit einem erzwungenen Intrasignal, welches angibt, daß der Block
der erzwungene Intrablock ist, anstelle des Bewegungsvektors an
den ersten Schalter 32 ausgegeben.
-
Der
erste Schalter 32 wählt
den Ausgang der Blockbildungsschaltung 2 in dem Fall eines
Intramodus und den Ausgang des Bestimmungsglieds 31 in
dem Fall eines Vorhersagemodus aus und legt den ausgewählten Ausgang
an die Orthogonaltransformationsschaltung 33 an. Die Orthogonaltransformationsschaltung 33 führt zum
Beispiel die zwei dimensionale DCT an jedem der 8×8-Blöcke aus, die hierin eingegeben
werden. Die Quantisierungsschaltung 34 führt eine
Kodierung variabler Länge
durch und quantisiert die von der Orthogonaltransformationsschaltung 33 ausgegebenen
Orthogonaltransformationskoeffizienten. Darüber hinaus quantisiert die
Quantisierungsschaltung 34 in dem Fall eines Vorhersagemodus
zusätzlich
zu den Orthogonaltransformationskoeffizienten auch die Bewegungsvektoren
oder die erzwungenen Intrasignale und gibt sie zusammen an einen Übertragungsweg 11 aus.
Andererseits gibt der zweite Schalter 35 nur in dem Fall
des Intrafeldes die Orthogonaltransformationskoeffizienten, die
durch die Quantisierungsschaltung 34 quantisiert worden sind,
an die Umkehrquantisierungsschaltung 36 aus, um Referenzdaten
für die
Bewegungskompensationsvorhersage zu erzeugen. Die Umkehrquantisierungsschaltung 36 führt an den
Daten, die durch die Quantisierungsschaltung 34 einer Kodierung
mit variabler Länge
unterzogen worden sind, ein Umkehrquantisierung und eine Dekodierung
variabler Länge durch,
und die dekodierten Daten werden an die Umkehrorthogonaltransformationsschaltung 37 ausgegeben.
Die Umkehrorthogonaltransformationsschaltung 37 führt zum
Beispiel die inverse zweidimensionale DCT an den Daten aus, um die
Blöcke des
Intrafeldes zu rekonstruieren. Die Blöcke des Intrafeldes, die durch
die Umkehrorthogonaltransformationsschaltung 37 rekonstruiert
worden sind, werden in dem Videospeicher 38 gespeichert.
Der Videospeicher 38 speichert die rekonstruierten Bilder
des Intrafeldes für
ein Feld als die Referenzdaten in dem Fall der Bewegungskompensationsvorhersage
und gibt die Referenzbilder innerhalb des Bewegungsvektor-Erfassungsbereichs
an die Bewegungskompensationsvorhersageschaltung 30 aus.
-
In
der oben beschriebenen Ausführungsform besitzt
ein Block für
die Orthogonaltransformation die Größe von 8 Pixeln × 8 Zeilen.
Diese Größe beträgt nicht
notwendi gerweise 8 Pixel × 8
Zeilen, sondern der Block kann die Größe von n Pixeln × m Zeilen
haben. In ähnlicher
Weise ist es nicht notwendig, den Suchbereich für Bewegungsvektoren auf 16
Pixel × 16
Zeilen festzulegen, sondern der Suchbereich kann auf k Pixel × s Zeilen
festgelegt werden {k ≥ n, s ≥ m). In der
vorgenannten Ausführungsform
wird die Vorhersagekodierung alle vier Felder fertiggestellt. Es
ist nicht notwendig, die Vorhersagekodierung alle vier Felder fertigzustellen,
vielmehr kann die Vorhersagekodierung jede beliebige Anzahl von
Feldern fertiggestellt werden. Darüberhinaus ist es nicht notwendig,
die Vorhersagekodierung jede beliebige Anzahl von Feldern fertigzustellen,
sondern die die Vorhersagekodierung kann jede beliebige Anzahl von Rahmen
fertiggestellt werden. Gemäß der vorstehenden
Ausführungsform
wird in dem Bestimmungsglied 31 der Ausgang mit der kleineren
Summe von Absolutwerten von den Ausgängen der Blockbildungsschaltung 2 und
der Bewegungskompensationsvorhersageschaltung 30 ausgewählt, um
an den ersten Schalter 32 ausgegeben zu werden. Alternativ kann
ohne Durchführung
der Bewegungskompensationsbestimmung nur der Ausgang der Bewegungskompensationsvorhersageschaltung 30 an
den ersten Schalter 32 ausgegeben werden.
-
Ausführungsform 2
-
Gemäß oben beschriebener
Ausführungsform
1 wird in dem Bestimmungsglied 31 der Ausgang mit der kleineren
Summe von Absolutwerten von den Ausgängen der Blockbildungsschaltung 2 und
der Bewegungskompensationsvorhersageschaltung 30 ausgewählt, um
an den ersten Schalter 32 ausgegeben zu werden. In einem
Feld, bei dem das Bestimmungsglied 31 den erzwungenen Intramodus häufiger als
den Vorhersagemodus auswählt,
kann beurteilt werden, daß ein
Szenenwechsel in dem Feld aufgetreten ist, und unter der Annahme,
daß sich
das gesamte Feld in dem Intramodus be findet, kann eine Kodierung
durchgeführt
werden. Eine Ausführungsform,
die konstruiert ist, um diesen Vorgang durchzuführen, ist die nachstehend beschriebene Ausführungsform
2.
-
27 ist ein Blockdiagramm, welches die Konfiguration
der zweiten Ausführungsform
zeigt. In der Figur bezeichnet 40 ein Bestimmungsglied,
welches den einen mit der kleineren Summe von Absolutwerten von
einem Eingangsblock aus der Blockbildungsschaltung 2 und
einem Vorhersagedifferenzblock aus der Bewegungskompensationsvorhersageschaltung 30 auswählt und
beurteilt, daß ein
Feld, in welchem der Eingangsblock aus der Blockbildungsschaltung 2 häufiger ausgewählt wird,
ein Intrafeld ist, 41 bezeichnet einen ersten Feldspeicher 41,
welcher die von der Blockbildungsschaltung 2 ausgegebenen
Eingabeblöcke
als Daten eines Intrafeldes speichert, 42 bezeichnet einen
zweiten Feldspeicher, welcher die Blöcke eines von dem Bestimmungsglied 40 ausgegebenen
Vorhersagefeldes speichert, und 43 bezeichnet eine ersten
Schalter, welcher in dem Intramodus und wenn das Bestimmungsglied 40 beurteilt,
daß der
erzwungene Intramodus häufiger
auftritt als der Vorhersagemodus, den Ausgang des ersten Feldspeichers 41 auswählt und
ihn an die Orthogonaltransformationsschaltung 33 ausgibt,
und welcher in einem anderen Fall als den oben erwähnten zwei
Fällen
den Ausgang des zweiten Feldspeichers 42 auswählt.
-
Dann
wird die Betriebsweise beschrieben werden. In dem Prozeß zwichen
dem Digital-Videosignal-Eingangsanschluß 1 und der Bewegungskompensationsvorhersageschaltung 30 wird
eine Operation in der gleichen Weise wie die in der ersten Ausführungsform
ausgeführt,
und daher wird die Beschreibung weggelassen. Das Bestimmungsglied 40 wählt den
einen mit der kleineren Summe von Absolutwerten von Komponenten
von aus der Blockbildungsschaltung 2 aus gegebenen Eingabeblöcken und
aus der Bewegungskompensationsvorhersageschaltung 30 ausgegebenen
Differenzblöcken
aus und gibt ihn aus. Wenn der Ausgang von der Bewegungskompensationsvorhersageschaltung 30 ausgewählt wird, gibt
das Bestimmungsglied 40 Bewegungsvektoren und Blöcke eines
Differenzsignals aus. Wenn der Ausgang von der Blockbildungsschaltung 2 ausgewählt wird,
werden Bewegungsvektoren zusammen mit einem Signal ausgegeben, welches
einen erzwungenen Intrablock anzeigt. Wenn die Anzahl von erzwungenen
Intrablöcken
in einem Feld einen Wert n erreicht oder überschreitet, beurteilt das
Bestimmungsglied 40, daß ein Szenenwechsel aufgetreten ist,
und gibt ein Steuerungssignal derart aus, daß das gesamte gegenwärtige Feld
durch den Intramodus zu kodieren ist.
-
Der
Ausgang des Bestimmungsglieds 40 wird als Daten des Vorhersagemodus
in dem zweiten Feldspeicher 42 gespeichert, und nachdem
Daten für ein
Feld gespeichert worden sind, werden sie an den ersten Schalter 43 ausgegeben.
Demgegenüber
wird der Ausgang der Blockbildungsschaltung 2 als Daten des
Intramodus in dem ersten Feldspeicher 41 gespeichert, und
nachdem Daten für
ein Feld gespeichert worden sind, werden sie an den ersten Schalter 43 ausgegeben.
In dem Intramodus und wenn das Bestimmungsglied 40 bestimmt,
den Intramodus auf dem Feld zu erzwingen, wählt der erste Schalter 43 den
Ausgang des ersten Feldspeichers 41 aus, und in einem anderen
Fall wählt
er den Ausgang des zweiten Feldspeichers 42 aus. Der Ausgang
des ersten Schalters 43 wird der Orthogonaltransformationsschaltung 33 zugeführt. In
dem nachfolgenden Prozeß von
der Orthogonaltransformationsschaltung 33 bis zu dem Videospeicher 38 wird
die Operation in der gleichen Weise ausgeführt wie die in der ersten Ausführungsform,
und daher wird eine Beschreibung weggelassen. Wenn allerdings durch
das Bestimmungsglied 40 bestimmt wird, daß ein Szenenwechsel
auftritt, ist es erforder lich, auch den Inhalt des Videospeichers 38 zu
aktualisieren. In diesem Fall arbeitet daher der zweiter Schalter 35 in
der gleichen Weise wie in dem Intramodus, um den Ausgang der Quantisierungsschaltung 34 der
Umkehrquantisierungsschaltung 36 zuzuführen.
-
Nachstehend
werden Beispiele beschrieben werden, in welchen eine Kodierung und
Dekodierung jeweils durch drei Arten von Vorhersagekodierungsverfahren
durchgeführt
wird, die in 26, 4 und 28 gezeigt
sind. In dem in 28 gezeigten Vorhersagekodierungsverfahren
wird eine Vorhersage zwischen Feldern in einem Feld durchgeführt, und ein
drittes Feld F3 wird aus dem ersten Feld F1 vorhergesagt. Mit Bezug
auf die in 26, 4 und 28 jeweils
als Verfahren 1, 2 und 3 gezeigten Kodierungsverfahren zeigt 29 Ergebnisse von Simulationsprozessen, welche
an Probebildern für
fünf Sekunden,
in welchen ein Szenenwechsel vorliegt, ausgeführt wurden. In ähnlicher
Weise zeigt 30 Ergebnisse von Simulationsprozessen,
welche an Probebildern für
fünf Sekunden,
in welchen kein Szenenwechsel vorliegt, ausgeführt wurden. Für diese Probebilder
werden Komponentensignale 4:2:2 (Y: 720 × 240, Cb und Cr: 360 × 240, 60
Felder/s) verwendet. Wie aus den in 29 und 30 gezeigten
Ergebnissen ersehen, ist für
Bilder mit einem Szenenwechsel Verfahren 3 vom Standpunkt des Rausabstandes
vorteilhaft, aber für
Bilder ohne Szenenwechsel gibt es zwischen Verfahren 1 bis 3 wenig Unterschied.
Demzufolge wird, wenn ein Szenenwechsel auftritt, das Intrafeld
erzwungenermaßen eingesetzt,
und ein Hochleistungskodierer, dessen Gerätegröße geringer als die eines herkömmlichen prädiktiven
Kodierers ist, kann verwirklicht werden.
-
In
der oben beschriebenen Ausführungsform 2
wird der Intramodus alle n Felder erzeugt, und die nachfolgenden
(n – 1)
Felder werden aus einem Intrafeld vorhersageko diert, des weiteren
wird, wenn ein Szenenwechsel auftritt, das Intrafeld erzwungenermaßen erzeugt,
und die verbleibenden Felder werden aus dem erzwungenen Intramodus
vorhergesagt. Es ist nicht notwendig, daß ein Intrafeld alle n Felder
vorliegt. Alternativ können,
wenn ein erzwungenes Intrafeld erzeugt wird, die nach dem erzwungenen
Intrafeld kommenden (n – 1)
Felder vorhersagekodiert werden. In der zuvor beschriebenen Ausführungsform
wird die Vorhersagekodierung in der Einheit von Feldern durchgeführt. Es
ist nicht erforderlich, die Vorhersagekodierung in der Einheit von Feldern
durchzuführen,
sondern die Vorhersagekodierung kann in der Einheit von Rahmen durchgeführt werden.
-
Wie
oben beschrieben, kann, nachdem die Hochleistungskodierer von Ausführungsformen
1 und 2 alle n Felder ein Intrafeld erzeugen und in den anderen
Feldern eine Bewegungskompensationsvorhersage unter Verwendung dieses
Intrafeldes als ein Referenzbild durchführen, die Hardwaregröße einschließlich einer
Berechnungsschaltung zum Erhalten von Bewegungsvektoren reduziert
werden.
-
Ausführungsform 3
-
31 ist ein Blockdiagramm, welches die Konfiguration
eines Hochleistungskodierers in Ausführungsform 3 zeigt. In 31 bezeichnen 1–14 und 16–20 die
denen der herkömmlichen
Vorrichtung in 2 identischen Elemente. Die
Bezugsziffer 50 bezeichnet einen Moduszähler, welcher die Anzahl von Blöcken des
Intramodus zählt, 51 bezeichnet
eine Richtungsumschaltschaltung, welche eine vorbestimmte Anzahl
von Blöcken
mit der von dem Moduszähler
ausgegebenen Anzahl von Blöcken
in dem Intramodus vergleicht und welche das Referenzbild für das nächste Feld
bestimmt, und 52 bezeichnet einen Videospeicher, welcher
ausgegebene Blöcke
speichert, um eine Bewegungs kompensationsvorhersage durchzuführen und
welcher das Referenzbild für das
nächste
Feld als den Suchbereich ausgibt.
-
Nun
wird die Betriebsweise beschrieben werden. Ungeachtet eines Intrafeldes
oder eines Vorhersagefeldes werden eingegebene digitale Videosignale
durch die Blockbildungsschaltung 2 in Eingabeblöcke einer
Einheit, welche aus m [Pixeln] × n [Zeilen]
besteht, segmentiert. Um einen Differenzblock zu erhalten, berechnet
ein Subtrahierglied 3 die Differenz in der Einheit von
Pixeln zwischen einem Eingabeblock und einem Vorhersageblock. Auf
diese Weise werden ein Eingabeblock und ein Differenzblock einem
ersten Schalter 7 zugeführt.
Um die Leistung zu berechnen, wird der Differenzblock auch einem
Differenzleistungsberechnungsglied 4 zugeführt, und
die Differenzleistung wird berechnet. Um die Wechselstromleistung
zu berechnen, wird der Eingabeblock auch einem Originalleistungsberechnungsglied 5 zugeführt, und
die ursprüngliche
Leistung wird berechnet. Die Ausgänge des Differenzleistungsberechnungsgliedes 4 und
des Originalleistungsberechnungsgliedes 5 werden dem Bestimmungsglied 6 zugeführt, welches
wiederum die eine mit der geringeren Leistung von den zwei Leistungen auswählt, wobei
das Ergebnis an den ersten Schalter 7 als das Modussignal
ausgegeben wird. Genauer gesagt wird, wenn die Differenzleistung
kleiner als die ursprüngliche
Wechselstromleistung ist, das Vorhersagemodussignal ausgegeben,
so daß der
erste Schalter 7 in den Vorhersagemodus gestellt wird,
um den Differenzblock als einen kodierten Block auszugeben. Wenn
die ursprüngliche
Leistung geringer als die Differenzleistung ist, wird das Intramodus-Signal ausgegeben,
so daß der
erste Schalter 7 in den Intramodus gestellt wird, um den
Eingabeblock als einen kodierten Block auszugeben.
-
Das
Betriebsart- bzw. Modussignal von dem Bestimmungsglied 6 wird
in den Moduszähler 50 eingegeben.
Nachdem das eingegebene Modussignal für jeden Block eines Vorhersagefeldes
generiert wird, zählt
der Moduszähler 50 die
Anzahl von Blöcken,
die den Intramodus oder den Vorhersagemodus auswählen, von den Blöcken eines
Feldes und gibt die Anzahl von Blöcken, die einen Intramodus oder
den Vorhersagemodus auswählen,
an die Richtungsumschaltschaltung 51 aus. Die Richtungsumschaltschaltung 51 vergleicht
eine vorbestimmte Anzahl von Blöcken
(welche kleiner als die Gesamtzahl von Blöcken eines Feldes ist) mit
der von dem Moduszähler 50 eingegebenen
Anzahl von Blöcken,
die einen Intramodus oder Vorhersagemodus auswählen, und gibt ein Referenzbild-Umschaltsignal
an den Videospeicher 52 aus. Wenn die vorbestimmte Anzahl
von Blöcken
größer (oder
kleiner) als die Anzahl von Blöcken,
die einen Intramodus (oder einen Vorhersagemodus) auswählen, ist,
gibt die Richtungsumschaltschaltung 51 an den Videospeicher 52 ein Referenzbild-Umschaltsignal
derart aus, daß das
Referenzbild nicht umgeschaltet wird. Wenn die vorbestimmte Anzahl
von Blöcken
kleiner (oder größer) als die
Anzahl von Blöcken
ist, die einen Intramodus (oder einen Vorhersagemodus) auswählen, gibt
die Richtungsumschaltschaltung 51 an den Videospeicher 52 ein
Referenzbild-Umschaltsignal derart aus, daß das Referenzbild umgeschaltet
wird.
-
Der
erste Schalter 7 gibt in Abhängigkeit von dem durch das
Bestimmungsglied 6 bestimmte Betriebsartsignal einen Eingabeblock
oder einen Differenzblock als einen kodierten Block aus. In diesem Fall,
gibt, wenn der Eingabeblock das Intrafeld ist, der erste Schalter 7 sicher
den Eingabeblock als kodierten Block aus. Die kodierten Blöcke treten
in die DCT-Schaltung 8 ein, um in DCT-Koeffizienten umgewandelt
zu werden. Die DCT-Koeffizienten werden den Gewichtungs- und Schwellenwertprozessen
in der Quantisierungsschaltung 9 unterzogen, um in vorbestimmte
Bit-Zahlten quantisiert zu werden, die jeweils den Koeffizienten
entsprechen. Die DCT-Koeffizienten, die in die jeweiligen vorbestimmten Bit-Zahlen
quantisiert worden sind, werden durch den ersten Kodierer 10 in
für einen Übertragungsweg 11 geeignete
Codes umgewandelt und dann an den Übertragungsweg 11 ausgegeben.
-
Die
DCT-Koeffizienten, an denen Gewichtungs- und Schwellenwertprozesse
und eine Quantisierung durch die Quantisierungsschaltung 9 durchgeführt worden
sind, treten auch in die lokale Dekodierungsschleife 20 ein
und werden in der Umkehrquantisierungsschaltung 12 inversen
Gewichtungs- und inversen Quantisierungsprozessen unterzogen. Dann
werden die DCT-Koeffizienten, an denen Umkehrgewichtungs- und Umkehrquantisierungsprozesse
in der lokalen Dekodierungsschleife 20 durchgeführt worden
sind, durch die Umkehr-DCT-Schaltung 13 in einen dekodierten
Block umgewandelt. Das Addierglied 14 addiert den dekodierten
Block zu einem Vorhersageblock in der Einheit von Pixeln. Dieser
Vorhersageblock ist der gleiche wie der in dem Subtrahierglied 3 verwendete.
Das Ergebnis der Addition durch das Addierglied 14 wird
als ein Ausgabeblock in eine vorbestimmte Adresse des Videospeichers 52 geschrieben.
Der Videospeicher 52 schaltet das Referenzbild in Reaktion
auf das Referenzbild-Schaltsignal von der Richtungsumschaltschaltung 51 um
und gibt den Bewegungsschätzungssuchbereich
an die MC-Schaltung 16 aus. Die Größe des Blocks in dem Bewegungsschätzungssuchbereich
beträgt
zum Beispiel i [Pixel] × j
[Zeilen] (wobei i ≥ m,
j ≥ n). Ein
Block in dem von dem Videospeicher 52 ausgegebenen Bewegungsschätzungssuchbereich
und ein Eingabeblock von der Blockbildungsschaltung 2 werden
in die MC-Schaltung 16 eingegeben.
Die MC-Schaltung 16 führt
die Bewegungsschätzung
an jedem Block aus, um Bewegungsvektoren des Eingabeblocks zu extrahieren.
-
Die
durch die Bewegungsschätzung
in der MC-Schaltung 16 extrahierten Bewegungsvektoren werden
in die MIX-Schaltung 17 eingegeben.
Die MIX-Schaltung 17 kombiniert die Bewegungsvektoren von
der MC-Schaltung 16 mit dem durch das Bestimmungsglied 6 bestimmten
Modussignal. Die Bewegungsvektoren und das Modussignal, die in der MIX-Schaltung 17 miteinander
kombiniert worden sind, werden durch den zweiten Kodierer 18 in
für den Übertragungsweg 11 geeignete
Codes umgewandelt und dann zusammen mit den entsprechenden kodierten
Blöcken
an den Übertragungsweg 11 ausgegeben.
Der Vorhersageblock wird von der MC-Schaltung 16 aus in
der Form eines Blocks ausgegeben, der in Blockform einer Größe von (m
[Pixel] × n
[Zeilen]), die gleich der des Eingabeblocks von dem Bewegungsschätzbereich
ist, gebracht ist. Dieser Vorhersageblock wird dem zweiten Schalter 19 zugeführt und
von dem entsprechenden Ausgangsanschluß des Schalters in Übereinstimmung
mit dem Feld des gegenwärtig
verarbeiteten Eingabeblocks und dem Modussignal des dekodierten
Blocks ausgegeben. Insbesondere wird der Vorhersageblock von einem
der Ausgangsanschlüsse
des zweiten Schalters 19 in Übereinstimmung mit dem verarbeiteten
Feld an das Subtrahierglied 3 und von dem anderen Ausgangsanschluß in Übereinstimmung
mit dem Modussignal des gegenwärtigen
dekodierten Blocks und dem verarbeiteten Feld ausgegeben.
-
In
dem Fall, daß ein
Szenenwechsel in der Einheit von Rahmen auftritt, wenn das in 4 gezeigte
Vorhersageverfahren für
ein gewöhnliches Bild
verwendet wird, steigt die Anzahl von Blöcken, die einen Intramodus
bei Kodierung des Bildes unmittelbar nach dem Szenenwechsel auswählen, an,
und das danach verwendete Referenzbild kann umgeschaltet werden,
wie in 28 gezeigt.
-
Die
Betriebsweise in Ausführungsform
3 wird nachstehend mit Bezug auf die Flußdiagramme in 32, 33 und 34 zusammengefaßt. 32 ist ein Flußdiagramm, welches den gesamten Vorgang
in Ausführungsform
3 zeigt, 33 ist ein Flußdiagramm,
welches einen Intrafeld-Prozeß von Schritt
S103 in 32 zeigt, und 34 ist ein Flußdiagramm, welches einen Vorhersagefeldprozeß von Schritt
S104 in 32 zeigt.
-
Zuerst
wird die Feldnummer fn, die das Feld in der Bewegungskompensationsvorhersageprozeßeinheit
angibt, auf 0 gesetzt (Schritt S101). Diese Feldnummer fn wird mit
Bezug auf 4 beschrieben werden. Intrafeld
F1, das zuerst in der Bewegungskompensationsvorhersageprozeßeinheit kommt,
wird durch die Feldnummer fn = 0 identifiziert, Intrafeld F2 wird
durch die Feldnummer fn = 1 identifiziert, das nächste Intrafeld F3 wird durch
die Feldnummer fn = 2 identifiziert, und das Intrafeld F4, das zuletzt
in der Bewegungskompensationsvorhersageprozeßeinheit kommt, wird durch
die Feldnummer fn = 3 identifiziert. Nachdem ein Bewegungskompensationsprozeß gerade
gestartet worden ist, ist das zuerst zu verarbeitende Feld sicher
das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit
und ein Intrafeld, und daher wird die Feldnummer fn in Schritt S101
auf 0 gesetzt (fn = 0). In einem späteren Vorhersagefeldprozeß wird ein Referenzbildumschaltflag
Rfn, welches als ein Flag zum Bestimmen, ob ein Szenenwechsel vorliegt,
fungiert, gesetzt, aber in diesem Schritt wird das Flag Rfn zu Initialisierung
auf 0 gesetzt (Rfn = 0).
-
Dann
wird die Feldnummer fn geprüft,
um zu bestimmen, ob sie 0 ist oder ob das Feld das erste Feld in
der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld
ist (Schritt S102). Falls die Feldnummer fn 0 ist (fn = 0), wird
dieses Feld als ein Intrafeld verarbeitet (Schritt S103). Falls dagegen
die Feldnummer fn nicht 0 ist (fn ≠ 0),
wird dieses Feld als ein Vorhersagefeld verarbeitet. Diese Prozesse
werden später
im Detail beschrieben werden. Nachdem jedes Feld verarbeitet ist,
wird die Feldnummer fn erhöht,
um das nächste
Feld anzuzeigen (Schritt S105). In einem tatsächlichen Gerät kann eine
solche Feldnummer durch ein Mikrocomputer-Signal oder dergleichen
gesteuert werden.
-
Es
wird beurteilt, ob die Feldnummer fn, die das nächste Feld anzeigt, eine Nummer
ist, die ein Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit
anzeigt (Schritt S106). Falls zum Beispiel, wie in 4,
wobei, nachdem die Bewegungskompensationsprozeßeinheit innerhalb von vier
Feldern vervollständigt
worden ist und die Feldnummer fn eines Intrafeldes auf 0 gesetzt
worden ist, fn = 4, bedeutet das, daß eine Abfolge von Bewegungskompensationsvorhersageeinheiten
vervollständigt
worden ist. Falls fn < 4,
wird beurteilt, daß das
nächste
Feld noch immer innerhalb der Bewegungskompensationsprozeßeinheit
liegt, und der Prozeß wird
wiederholt.
-
Wenn
eine Abfolge der Bewegungskompensationsvorhersageprozeßeinheiten
vervollständigt worden
ist, wird beurteilt, ob alle erforderlichen Felder verarbeitet worden
sind (Schritt S107). Diese Beurteilung kann zum Beispiel durch Prüfen des
Betriebs eines Endschalters des Hochleistungskodierers bewerkstelligt
werden. Falls das nächste
Feld zu verarbeiten ist, um die nächste Bewegungskompensationsvorhersageprozeßeinheit
zu kodieren, werden die Variablen initialisiert, und die Verarbeitung wird
wiederholt. Falls der Betrieb des Hochleistungskodierers abgeschlossen
worden ist, wird die die Kodierung beendet.
-
Der
Intrafeld-Prozeß wird
mit Bezug auf des Flußdiagramm
in 33 beschrieben werden. Das Feld, das in Schritt
S102 in 32 als als ein Intrafeld zu
verarbeitend bestimmt wird, wird in die vorbestimmte Größe von m
[Pixel] × n
[Zeilen] in dem verarbeiteten Feld segmentiert (Schritt S201). Dann
wird eine Orthogonaltransformation wie etwa eine DCT an den Blöcken dieser
Größe durchgeführt (Schritt S202).
Die Daten, an denen eine Orthogonaltransformation durchgeführt worden
ist, werden in eine vorbestimmte Bit-Zahl quantisiert, welche für jede Abfolge
festgelegt wird (Schritt S203). In einer Orthogonaltransformation
wie etwa einer DCT wird allgemein eine Quantisierung derart durchgeführt, daß eine größere Bit-Zahl einer Gleichspannung
und niederwertigen Segmenten einer Wechselspannung zugeordnet werden
und eine kleinere Bit-Zahl einer höherwertigen Sequenz einer Wechselspannung
zugeordnet wird. Die quantisierten Daten werden in zur Übertragung
geeignete Codes umgewandelt (Schritt S204), und die kodierten Daten
werden übertragen (Schritt 205).
Es wird zum Beispiel durch Zählen
der verarbeiteten Blöcke
beurteilt, ob die Verarbeitung eines Feldes abgeschlossen worden
ist (Schritt S206). Falls die Verarbeitung eines Feldes noch nicht
abgeschlossen worden ist, wird die Verarbeitung für den nächsten Block
fortgesetzt. Falls die Verarbeitung eines Feldes abgeschlossen worden
ist, wird der Intrafeld-Prozeß beendet.
-
Der
Vorhersagefeldprozeß wird
mit Bezug auf das Flußdiagramm
in 34 beschrieben werden. Das Feld, das in Schritt
S102 in 32 als als ein Vorhersagefeld
zu verarbeitend bestimmt wird, wird geprüft, um zu beurteilen, ob in
der Verarbeitung des vorherigen Feldes in dem Referenzbildumschaltflag
Rfn-1 = 0 oder ob in der Verarbeitung des dem gegenwärtig verarbeiteten
Feldes vorhergehenden Feldes ein Szenenwechsel erfaßt worden
ist (Schritt S301). Falls Rfn-1 = 0, wird eine Bewegungskompensationsvorhersage
unter Verwendung des Referenzbildes in der gleichen Position wie
zuvor durchgeführt (Schritt S302).
Falls Rfn-1 = 1, bedeutet das, daß bei Verarbeitung der Feldnummer
fn-1 ein Szenenwechsel erfaßt
worden ist. Daher wird in der Bewegungskompensationsvorhersage für die Feldnummer
fn das Referenzbild auf ein Bild eines Feldes in einer von der vorherigen
Position unterschiedlichen Position umgeschaltet, und eine Bewegungskompensationsvorhersage
wird unter Verwendung des neuen Referenzbildes durchgeführt (Schritt
S303).
-
Dann
wird eine Variable COUNT zum Zählen der
Anzahl von Blöcken,
die einen Intramodus in einem zu verarbeitenden Feld auswählen, auf
0 gesetzt (Schritt S304). Die Variable COUNT wird später im Detail
beschrieben werden. Ein eingegebenes Bild wird in die vorbestimmte
Größe von m
[Pixel] × n [Zeilen]
in dem verarbeiteten Feld segmentiert (Schritt S305). Die in die
Größe von m × n segmentierten
Blöcke
werden einer Bewegungskompensationsvorhersage unterzogen (Schritt
S306). Unter Verwendung des in Schritt S302 oder S303 festgelegten Referenzbildes
wird die Differenz in der Einhait von Pixeln zwischen einem vorbestimmten
Bereich eines vergangenen Bildes und einem neu geteilten Block als
ein Differenzblock in das Differenzleistungsberechnungsglied 4 eingegeben,
und eine Differenzleistung P1 wird berechnet (Schritt S307). Durch
Verwenden eines solchen voreingestellten Referenzbildes kann die
durch eine Bewegungskompensationsvorhersage erzeugte Informationsmenge
reduziert werden. Dann wird der neu segmentierte Block in das Originalleistungsberechnungsglied 5 eingegeben, um
eine ursprüngliche
Wechselstromleistung P2 zu berechnen (Schritt S308).
-
Die
berechneten Leistungen P1 und P2 werden im Betrag miteinander verglichen
(Schritt S309). Wenn die Differenzleistung P1 kleiner als die ursprüngliche
Wechselstromleistung P2 ist, wird der Differenzblock (der Differenzwert
des der Bewegungskompensationsvorhersage unter zogenen Blocks) ausgewählt (Schritt
S310). Wenn die Differenzleistung P1 größer als die ursprüngliche
Wechselstromleistung P2 ist, wird der Eingabeblock (das Original,
welches noch immer in Blockform ist) ausgewählt (Schritt 311),
und die Anzahl von Malen, die ein Eingabeblock als ein kodierter
Block ausgewählt wird,
oder die Anzahl von Blöcken
in einem Feld, welche als ein Intramodus zu verarbeiten sind, wird
gezählt
(Schritt S312). Eine Variable, die in diesem Schritt als ein Zähler fungiert,
ist COUNT, die in Schritt S304 auf 0 gesetzt worden ist. Dieser
Zähler wird
sicher auf 0 gesetzt, wenn die Verarbeitung in der Einheit von Feldern
beginnt, und zählt
die Anzahl von Blöcken,
die in der Verarbeitung des einen Feldes einen Intramodus auswählen.
-
Jeder
ausgewählte
Block wird der Orthogonaltransformation unterzogen (Schritt 313)
und in eine vorbestimmte Bit-Zahl quantisiert, die für jede Abfolge
festgelegt wird (Schritt S314). In einer Orthogonaltransformation
wie etwa einer DCT wird eine Quantisierung derart durchgeführt, daß eine größere Bit-Zahl
einer Gleichspannung und niederwertigen Sequenzen einer Wechselspannung
zugeordnet wird und eine kleinere Bit-Zahl einer höherwertigen
Sequenz einer Wechselspannung zugeordnet wird. Die quantisierten
Daten werden in zur Übertragung
geeignete Codes umgewandelt (Schritt S315), und die kodierten Daten
werden übertragen
(Schritt 316). Es wird zum Beispiel die Anzahl der verarbeiteten
Blöcke
gezählt,
um zu beurteilen, ob die Verarbeitung eines Feldes abgeschlossen
worden ist (Schritt S317). Falls die Verarbeitung eines Feldes noch
nicht abgeschlossen worden ist, wird die Verarbeitung für den nächsten Block
fortgesetzt.
-
Falls
die Verarbeitung eines Feldes abgeschlossen worden ist, wird die
Anzahl von Eingabeblöcken,
die als kodierte Blöcke
in der Verarbeitung dieses einen Feldes verarbeitet worden sind,
oder die Anzahl von Blöcken,
die einen Intramodus ausgewählt
haben, mit einem vorgewählten
Schwellenwert TH verglichen (Schritt S318). Der Schwellenwert TH ist
eine vorbestimmte Zahl, die geringer als die Anzahl von Blöcken in
einem Feld ist. Wenn die Gesamtzahl von Blöcken in einem Feld zum Beispiel 2700
beträgt,
wird der Schwellenwert TH auf 1000 gesetzt, was kleiner als 2700
ist. Falls die die Anzahl von Malen, die Eingabeblöcke als
kodierte Blöcke ausgewählt werden,
angebende Variable COUNT kleiner als der Schwellenwert TH ist, liegt
zwischen dem Feld (Feldnummer fn), welches gerade verarbeitet worden
ist, und dem Referenzbild, welches in einer Bewegungskompensationsvorhersage
dieses Bildes verwendet worden ist, kein Szenenwechsel vor, und
das Referenzbildumschaltflag Rfn wird auf 0 gesetzt (Rfn = 0), so
daß das
Referenzbild in einer gewöhnlichen
Position als das Referenzbild für
die Bewegungskompensation des nächsten
Feldes (Feldnummer fn+1) verwendet wird (Schritt S319). Falls die
die Anzahl von Malen, die Eingabeblöcke als kodierte Blöcke ausgewählt werden,
angebende Variable COUNT größer als
der Schwellenwert TH ist, liegt zwischen dem Feld (Feldnummer fn),
welches gerade verarbeitet worden ist, und dem Referenzbild, welches
in einer Bewegungskompensationsvorhersage dieses Bildes verwendet
worden ist, ein Szenenwechsel vor, und das Referenzbild für die Bewegungskompensation
des nächsten
Feldes (Feldnummer fn+1) wird von dem Referenzbild in einer normalen
Position zu einem Feld in einer von der bis dahin eingenommenen
Position verschiedenen Position, zum Beispiel das Feld, welches
gerade verarbeitet worden ist und an einem Ort positioniert ist, an
dem bis dahin ein Referenzbild nicht vorlag, umgeschaltet. Zu diesem
Zweck wird das Referenzbildumschaltflag Rfn auf 1 gesetzt (Rfn =
1) (Schritt S320). Auf diese Weise wird das Referenzbildumschaltflag
Rfn gesetzt und der Vorhersagefeldprozeß wird beendet.
-
35 zeigt die Änderung
der Informationsmenge für
fünf Sekunden
in dem Fall, daß die
Vorhersagekodierung gemäß der Ausführungsform
3 durchgeführt
wird, und 36 zeigt die Veränderung
des Rauschabstandes für
fünf Sekunden
in diesem Fall. Obwohl in Punkt B ein Szenenwechsel vorliegt, wird im
Vergleich mit einem in 7 gezeigten Punkt A das Anwachsen
der Informationsmenge unterdrückt. Darüberhinaus
gibt es keine auffällige
Verschlechterung des Rauschabstandes.
-
Ausführungsformen 4 und 5
-
In
Ausführungsform
3 werden, um einen kodierten Block aus einem Differenzblock und
einem Eingabeblock auszuwählen,
deren Leistungen berechnet und miteinander verglichen, und die Anzahl von
einen Intramodus auswählenden
Blöcken
wird gezählt.
-
Gemäß Ausführungsform
4 wird, um einen kodierten Block aus einem Differenzblock und einem Eingabeblock
auszuwählen,
die Entropie in jedem Block berechnet, und die Entropie des Differenzblocks
wird mit der des Eingabeblock in gleicher Weise wie in Ausführungsform
3 durch das Bestimmungsglied 6 verglichen, um zu bestimmen,
welcher Block als ein kodierter Block auszuwählen ist.
-
Gemäß Ausführungsform
5 wird, um einen kodierten Block aus einem Differenzblock und einem Eingabeblock
auszuwählen,
eine Addierung von Absolutwerten von Pixeln in jedem Block durchgeführt, die
r-te Potenz der Summe von Absolutwerten des Eingabeblocks und die
des Differenzblocks werden berechnet, und die r-te Potenz der Summe
von Absolutwerten des Differenzblocks wird mit der des- Eingabeblocks
in gleicher weise wie in Ausführungsform 3
durch das Bestimmungsglied 6 verglichen, um zu be stimmen,
welcher Block als ein kodierter Block auszuwählen ist.
-
Ausführungsform 6
-
In
Ausführungsform
3 vergleicht das Bestimmungsglied 6 die Leistung eines
Eingabeblocks mit der eines Differenzblocks. Gemäß Ausführungsform 6 wird, wenn die
Leistung eines Eingabeblocks mit der eines Differenzblocks zu vergleichen
ist, wenigstens eine der Leistungen des Eingangs- und des Differenzblocks
mit einem Offset versehen, und dann werden die zwei Leistungen miteinander
verglichen. Zum Beispiel wird die Leistung des Eingabeblocks mit
einem positiven Offset versehen und dann mit der Leistung des Differenzblocks
verglichen. Wenn es keinen großen
Leistungsunterschied zwischen dem Eingangs- und dem Differenzblock
gibt, erlaubt diese Konfiguration, die Anzahl von die Differenzleistung auswählenden
Blöcken
zu erhöhen,
wodurch verhindert wird, daß ein
Intramodus in übermäßiger Weise erzeugt
wird.
-
37 ist ein Flußdiagramm eines Vorhersagefeldprozesses
in Ausführungsform
6. In 37 sind durch die gleichen
Schrittnummern wie die in 34 verwendeten
bezeichneten Abschnitte mit denen von 34 identisch.
Die Prozesse von Schritt S301 bis Schritt S308 sind die gleichen
wie in Ausführungsform
3. Eine von einem Differenzblock berechnete Differenzleistung P1
wird mit einem Wert verglichen, der durch Addieren eines vorbestimmten Offsets α zu einer
von einem Eingabeblock (ursprünglichen
Block) berechneten ursprünglichen Wechselstromleistung
P2 erhalten wird (Schritt S330). Dies macht es im Vergleich zu Ausführungsform
3 schwierig, P1 < P2
+ α zu erhalten,
so daß die Anzahl
von einen Intramodus auswählenden
Blöckert reduziert
wird. Demzufolge wird verhindert, daß ein Intramodus in übermäßiger Weise
erzeugt wird, und die er zeugte Informationsmenge kann stabil auf
einem konstanten Niveau gehalten werden. Die nachfolgenden Prozesse
von Schritt S310 bis S320 sind die gleichen wie in Ausführungsform
3.
-
Ausführungsformen 7 und 8
-
Gemäß Ausführungsform
7 wird, wenn die Entropie eines Differenzblocks mit der eines Eingabeblocks
in ähnlicher
Weise wie in Ausführungsform 4
verglichen wird, wenigstens eine der Entropien des Eingangs- oder
des Differenzblocks mit einem Offset versehen, und dann werden die
zwei Werte miteinander verglichen. Zum Beispiel wird die Entropie
des Eingabeblocks mit einem positiven Offset versehen und dann mit
der Entropie des Differenzblocks verglichen. Wenn es keinen großen Unterschied
zwischen der Entropie des Eingabeblocks und der Entropie des Differenzblocks
gibt, erlaubt diese Konfiguration, die Anzahl von die Differenzleistung
auswählenden
Blöcken
zu erhöhen,
wodurch verhindert wird, daß ein Intramodus
in übermäßiger Weise
erzeugt wird.
-
Gemäß Ausführungsform
8 wird, wenn die Summe von Absolutwerten eines Differenzblocks mit der
eines Eingabeblocks in ähnlicher
Weise wie in Ausführungsform
5 verglichen wird, wenigstens eine der r-ten Potenz der Summe von
Absolutwerten des Eingabeblocks und der des Differenzblocks mit
einem Offset versehen, und dann werden die zwei Werte miteinander
verglichen. Zum Beispiel wird die r-te Potenz der Summe der Absolutwerte
des Eingabeblocks mit einem positiven Offset versehen und dann mit
der r-ten Potenz
der Summe der Absolutwerte des Differenzblocks verglichen. Wenn
es keinen größeren Unterschied
zwischen der r-ten Potenz der Summe von Absolutwerten des Eingangs-
und der des Differenzblocks als den Offset gibt, erlaubt diese Konfiguration,
die Anzahl von die Diffe renzleistung auswählenden Blöcken zu erhöhen, wodurch verhindert wird,
daß ein
Intramodus in übermäßiger Weise
erzeugt wird.
-
Ausführungsform 9
-
In
Ausführungsform
3 zählt
der Moduszähler 50 die
Anzahl aller einen Intramodus auswählenden Blöcke unter Blöcken für ein Feld.
In Ausführungsform
9 werden Blöcke
für ein
Feld nicht gezählt,
sondern zu einer Zeit, da ein Modussignal in einer vorbestimmten
Anzahl von Blöcken
während
eines Feldes bestimmt wird, wird das Verhältnis der Anzahl von einen
Intramodus auswählenden
Blöcken
zu der Gesamtzahl von Blöcken
oder der Anzahl von Blöcken, in
welchen ein Modussignal bestimmt worden ist, der Richtungsumschaltschaltung 51 zugeführt. Auf
der Grundlage dieses Verhältnisses
wird von der Richtungsumschaltschaltung 51 ein Referenzbild-Umschaltsignal
ausgegeben. Diese Konfiguration erlaubt es, das Referenzbild für das nächste Feld
auch dann zu bestimmen, wenn eine Kodierung aller Blöcke für ein Feld
noch nicht abgeschlossen worden ist.
-
38 ist ein Flußdiagramm eines Vorhersagefeldprozesses
in Ausführungsform
3. In 38 sind Abschnitte, die durch
die gleichen Schrittnummern wie die in 34 verwendeten
bezeichnet sind, mit denen von 34 identisch.
Die Prozesse von Schritt S301 bis S303 sind die gleichen wie in
Ausführungsform
3. Nachdem das Referenzbild zur Bewegungskompensationsvorhersage
für das
nächste Feld
festgelegt ist (Schritte S302 und S303), werden die Variable COUNT
zum Zählen
der Male, die ein Intramodus in einem Feld während der Verarbeitung des
Feldes erzeugt wird, oder der Anzahl von Blöcken, die Eingabeblöcke als
kodierte Blöcke
auswählen,
und eine Variable B zum Zählen
der Anzahl von Blöcken,
die in der Verarbeitung des einen Feldes bis dahin verarbeitet worden
sind, auf 0 gesetzt (Schritt S340). Die nachfolgenden Schritte S305
bis S316 sind die gleichen wie die in Ausführungsform 3. Nach Kodierung
wird die Anzahl von Blöcken,
die bis dahin verarbeitet worden sind, durch Inkrementieren der Variable
B eine nach der anderen gezählt
(Schritt S341). Die Variable B ändert
sich von 0 bis zu der maximalen Anzahl von Blöcken, die in einem Feld vorliegen
können.
Die Referenzbildumschaltbestimmungsverarbeitung zum Bestimmen, ob
das Referenzbild zur Bewegungskompensationsvorhersage des nächsten Feldes
umzuschalten ist, wird durchgeführt
(Schritt S342). Der nächste
Schritt S317 ist der gleiche wie der in Ausführungsform 3.
-
39 ist ein Flußdiagramm des Referenzbildumschaltbestimmungsprozesses
in Schritt S342 in 38. Der Prozeß wird mit
Bezug auf 39 beschrieben werden. Es wird
beurteilt, ob das Referenzbildumschaltflag Rfn 0 ist (Schritt S351).
Falls das Flag Rfn nicht 0 ist, wird der Prozeß beendet. Falls das Flag Rfn
0 ist, wird das Verhältnis von
COUNT zum Zählen
der Male, daß Eingabeblöcke als
kodierte Blöcke
sind, zu der Variablen B zum Zählen
von Blöcken,
die in der Verarbeitung des einen Feldes bis dahin verarbeitet worden
sind, mit dem Schwellenwert TH verglichen (Schritt S352). Falls
das Verhältnis
kleiner als der Schwellenwert TH ist, wird der Prozeß beendet.
Falls das Verhältnis
größer als
der Schwellenwert TH ist, wird das Flag Rfn auf 1 gesetzt (Schritt
S353), und der Prozeß wird
beendet.
-
Ausführungsform 10
-
Ausführungsform
10 wird mit Bezug auf 40 beschrieben werden, welche
die Konfiguration der Ausführungsform
zeig. In 40 sind die Bezugsziffern 1, 3 bis 6, 8 bis 16, 18 und 20 die
gleichen wie die in der herkömmlichen
Vorrichtung in 2 verwendeten. Die Bezugsziffer 60 bezeichnet
einen Videospeicher, in welchem eingegebene Bilder gespeichert werden, 61 bezeichnet
eine SW-Erfassungsschaltung, welche einen Szenenwechsel in einem
Bild erfaßt
und ein dieses anzeigendes Signal ausgibt, 62 bezeichnet
einen ersten Schalter, welcher von einem aus einem ursprünglichen
Bild segmentierten Eingabeblock zu einem aus einem Vorhersageblock
aufgrund einer Bewegungskompensationsvorhersage erzeugten Differenzblock
umschaltet, 63 bezeichnet eine MIX-Schaltung, in welcher
ein Bewegungsvektor, das Modussignal eines Blocks aus dem Bestimmungsglied 6 und
das Szenenwechsel-(SW)-Erfassungssignal aus der SW-Erfassungsschaltung 61 kombiniert
werden, und 64 bezeichnet einen zweiten Schalter, welcher
einen Vorhersageblock umschaltet.
-
Nun
wird die Betriebsweise beschrieben werden. Es wird angenommen, daß eine Bewegungskompensationsvorhersage
zum Beispiel wie in 4 gezeigt durchgeführt und
innerhalb von vier Feldern abgeschlossen wird. Digitale Videosignale, die
durch den Eingangsanschluß 1 eingegeben
werden, werden in dem Videospeicher 60 gespeichert. Der
Videospeicher 60 weist einen Speicher für wenigstens zwei Felder auf,
und während
Speicherns von Videosignalen eines der zwei Felder werden Blöcke von
Videodaten zur Szenenwechselerfassung oder Verarbeitung in eine
vorbestimmte Größe von dem
anderen Feld ausgegeben. Insbesondere sendet der Videospeicher 60 zuerst
digitale Videosignale an die SW-Erfassungsschaltung 61,
und Eigenschaften eines Bildes, die zum Beispiel aus vorgegebenen Parametern
erhalten werden, und das Vorliegen eines Szenenwechsels werden erfaßt. Dann
werden digitale Videosignale von einem der Ausgänge des Videospeichers 60 ausgegeben,
während
sie in Blöcke
der Größe von beispielsweise
m [Pixel] × n
[Zeilen] (wobei m und n positive ganze Zahlen sind) gebracht werden.
Die Größe von m
[Pixel] × n
[Zeilen] entspricht der Blockgröße zum Durchführen der zweidimensionalen
Orthogonaltransformation und auch der Blockgröße eines Vorhersageblocks auf
der Grundlage der Bewegungskompensationsvorhersage.
-
Ein
Eingabeblock, der nur durch Blockbildung eines von dem Videospeicher 60 ausgegebenen
Originals erhalten wird, und ein Differenzblock, welcher eine Differenz
zwischen dem Eingabeblock und einem Vorhersageblock, der einer Bewegungskompensationsvorhersage
unterzogen worden ist, durch das Subtrahierglied 3 ist,
werden in den ersten Schalter 62 eingegeben. Der Eingabeblock
und der Differenzblock werden jeweils in das Originalleistungsberechnungsglied 5 und
das Differenzleistungsberechnungsglied 4 eingegeben, um
die Leistung jedes Blocks zu erhalten. Das Originalleistungsberechnungsglied 5 berechnet
die Wechselstromleistung des Eingabeblocks, und das Differenzleistungsberechnungsglied 4 berechnet
die Leistung des Differenzblocks. Die berechnete Wechselstromleistung des
Eingabeblocks und die berechnete Leistung des Differenzblocks werden
in das Bestimmungsglied 6 eingegeben. Wenn die Leistung
des Differenzblocks kleiner als die des Eingabeblocks ist, gibt
das Bestimmungsglied 6 ein Vorhersagemodussignal aus, und wenn
die Leistung des Eingabeblocks kleiner als die des Differenzblocks
ist, gibt das Bestimmungsglied 6 ein Intramodus-Signal
aus. Diese Signale werden als Modussignale dem ersten Schalter 62,
der MIX-Schaltung 63 und dem zweiten Schalter 64 zugeführt.
-
Der
erste Schalter 62, dem der Eingangs- und der Differenzblock
eingegeben werden, gibt einen der Blöcke als einen kodierten Block
aus. Zu diesem Zweck empfängt
der erste Schalter 62 das Szenenwechsel-Erfassungssignal
von der SW-Erfassungsschaltung 61 und auch das Modussignal
von dem Bestimmungsglied 6, um den Umschaltmodus zu be stimmen,
und gibt entweder den Eingangs- oder den Differenzblock als den
kodierten Block aus. Die Schaltzustände zu dieser Zeit sind in 41 gezeigt. Nachdem der Prozeßschritt der Bewegungskompensationsvorhersage
innerhalb von vier Feldern abgeschlossen ist, wie in 4 gezeigt,
ist in dem gewöhnlichen
Modus ein Intrafeld das erste Feld, ein Vorhersagefeld macht dann
von dem zweiten Feld bis zu dem vierten Feld weiter, ein Intrafeld
ist wieder das erste Feld, und das Vorgenannte wird kontinuierlich
fortgesetzt. Bezüglich
der in 41 gezeigten Erfassung des
Vorliegens und Nichtvorliegens eines Szenenwechsels wird, wenn das
Szenenwechsel-Erfassungssignal von der SW-Erfassungsschaltung 61 die
Erfassung eines Szenenwechsels anzeigt, ein Signal des Vorliegens
ausgegeben, und wenn das Szenenwechsel-Erfassungssignal keine Erfassung
eines Szenenwechsels anzeigt, wird ein Signal des Nichtvorliegens
ausgegeben. Der Diskriminanzmodus bedeutet das Modussignal, das
ein Ausgang des Bestimmungsgliedes 6 ist und oben beschrieben
wurde. Das Symbol "X" in 41 bedeutet, daß der Zustand ungeachtet der
Erfassung eines Szenenwechsels oder des Diskriminanzmodus nicht
beeinflußt
wird. Wie in 41 gezeigt, bestimmt der erste
Schalter 62 einen Auswahlblock und gibt den Auswahlblock als
einen kodierten Bock aus.
-
Der
kodierte Block, der durch den ersten Schalter ausgewählt und
ausgegeben worden ist, wird durch die DCT-Schaltung 8 einer zweidimensionalen
Orthogonaltransformation unterzogen. Die orthogonaltransformierten
Daten werden in der Quantisierungsschaltung 9 den Gewichtungs-
und Schwellenwertprozessen oder dergleichen unterzogen, um in eine
vorbestimmte Bit-Zahl in der jeweiligen Abfolge quantisiert zu werden.
Die durch die Quantisierungsschaltung 9 quantisierten Daten
werden durch den ersten Kodierer- 10 in für den Übertragungsweg 11 geeignete
Codes umgewandelt und dann an den Übertragungsweg 11 übertragen.
-
Die
durch die Quantisierungsschaltung 9 quantisierten Daten
werden auch in die lokale Dekodierungsschleife 20 eingegeben,
so daß eine
Bewegungskompensationsvorhersage durchgeführt wird. Die in die lokale
Dekodierungsschleife 20 eingegebenen Daten werden in der
Umkehrquantisierungsschaltung 12 inversen Quantisierungs-
und inversen Gewichtungsprozessen unterzogen und dann durch die
Umkehr-DCT-Schaltung 13 einer
inversen Orthogonaltransformation unterzogen. Ein dekodierter Block,
welcher ein Ausgang der Umkehr-DCT-Schaltung 13 ist, wird
in dem Addierglied 14 in der Einheit von Pixeln zu dem
Vorhersageblock addiert, um ein wiedergegebenes Bild zu werden.
Der in diesem Prozeß verwendete
Vorhersageblock ist mit dem in dem Addierglied 14 verwendeten
identisch. Der Block, welcher ein wiedergegebenes Bild in dem Subtrahierer 3 geworden
ist, wird in eine vorbestimmte Adresse des Videospeichers 15 geschrieben.
-
Die
Größe des Videospeichers 15 hängt von der
Art des eingesetzten Vorhersageverfahrens ab. In dieser Ausführungsform
wird angenommen, daß der
Videospeicher 15 aus einer Mehrzahl von Feldspeichern besteht
und daß durch
die lokale Dekodierungsschleife 20 rekonstruierte Ausgabeblöcke in einer
vorbestimmten Adresse gespeichert werden. Diese gespeicherten Bilder
werden als Daten des Suchbereichts zur Bewegungskompensationsvorhersage
verwendet. Ein Block, der aus einem Bild, welches aus vergangenen
Ausgabeblöcken
rekonstruiert ist, segmentiert ist und sich in einem Bewegungsschätzungssuchbereich
befindet, wird von dem Videospeicher 15 an die MC-Schaltung 16 ausgegeben.
Die Größe des Blocks
des Bewegungsschätzungssuchbereichs
beträgt
i [Pixel] × j
[Zeilen] (wobei i ≥ m,
j ≥ n, und
i und j positive ganze Zahlen sind). Daten in dem Suchbereich zur
Bewegungskompensationsvorhersage von dem Videospeicher 15 und ein
Eingabeblock von dem Videospeicher 60 werden in die MC-Schaltung 16 als Referenzdaten
eingegeben, wodurch Bewegungsvektoren extrahiert werden.
-
Die
durch die MC-Schaltung 16 extrahierten Bewegungsvektoren
werden in die MIX-Schaltung 63 eingegeben und darin mit
dem durch das Bestimmungsglied 6 bestimmten Modussignal
und dem SW-Erfassungssignal aus der SW-Erfassungsschaltung 61 kombiniert.
Die kombinierten Signale werden durch den zweiten Kodierer 18 in
für den Übertragungsweg 11 geeignete
Codes umgewandelt und dann zusammen mit dem entsprechenden kodierten Block
an den Übertragungsweg 11 ausgegeben.
Die MC-Schaltung 16 gibt in Blöcke gebrachte Signale aus,
welche aus dem Suchbereich in der Größe (m [Pixel] × n [Zeilen])
gleich der des Eingabeblocks segmentiert sind, als einen Vorhersageblock
aus. Der von der MC-Schaltung 16 ausgegebene Vorhersageblock
wird aus vergangener Videoinformation erzeugt. Der Vorhersageblock
wird dem zweiten Schalter 64 zugeführt und in Übereinstimmung mit dem gegenwärtig verarbeiteten
Feld, dem Modussignal des dekodierten Blocks und dem SW-Erfassungssignal
aus der SW-Erfassungsschaltung 61 ausgegeben. Insbesondere
wird der Vorhersageblock in Übereinstimmung
mit dem verarbeiteten Feld und dem SW-Erfassungssignal von einem
der Ausgangsanschlüsse
des zweiten Schalters 64 und in Übereinstimmung mit dem Modussignal
des gegenwärtigen
dekodierten Blocks, dem SW-Erfassungssignal und dem verarbeiteten
Feld von dem anderen Ausgangsanschluß an den Subtrahierer 3 ausgegeben.
-
Der
Bewegungskompensationsvorhersageprozeß ist in 42 gezeigt. In 42 wird
angenommen, daß ein
Szenenwechsel zwischen dem zweiten Feld F2 und dem dritten Feld
F3 auftritt. Nachdem es keinen Szenenwechsel zwischen dem ersten
Feld F1 und dem zweiten Feld F2 gibt, wird das zweite Feld F2 aus
dem ersten Feld F1 vorhergesagt. Der Szenenwechsel zwischen dem
zweiten Feld F2 und dem dritten Feld F3 wird erfaßt, und
das dritte Feld F3 wird in gleicher Weise wie das erste Feld F1
ein Intrafeld. Dann wird das vierte Feld F4 aus dem dritten Feld
F3 vorhergesagt. Die Vorhersage wird niemals auf der Grundlage eines
Bildes vorgenommen, das vor einem Szenenwechsel vorliegt. Nachdem
der Bewegungskompensationsvorhersageprozeß für das vierte Feld F4 abgeschlossen
ist, wird wieder die Bewegungskompensationsvorhersage durchgeführt, wobei
das nächste
Feld als ein Intrafeld verwendet wird. Daher tritt sicher ein Intrafeld alle
vier Felder auf, wenn der Bewegungskompensationsvorhersageprozeß einmal
beginnt, und wenn ein Szenenwechsel auftritt, liegt auch in dem Bewegungskompensationsvorhersageprozeß ein Intrafeld
vor.
-
Die
Betriebsweise in Ausführungsform
10 wird mit Bezug auf die Flußdiagramme
von 43 und 44 zusammengefaßt werden. 43 ist ein Flußdiagramm, welches den gesamten
Ablauf in Ausführungsform
10 zeigt, und 44 ist ein Flußdiagramm
des Vorhersagefeldprozesses in Schritt S406 in 43.
-
Zuerst
wird die ein Feld in einer Bewegungskompensationsvorhersageprozeßeinheit anzeigende
Feldnummer auf 0 gesetzt (Schritt S401). Diese Festlegung der Feldnummer
ist die gleiche wie in Ausführungsform
3. Nachdem der Bewegungskompensationsprozeß gerade begonnen wurde, ist
das anfänglich
zu verarbeitende Feld sicher das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit
und ein Intrafeld, und daher wird die Feldnummer fn in Schritt S401
auf 0 gesetzt. Ein Szenenwechselerfassungsflag Cfn, welches als ein
Flag fungiert, um zu beurteilen, ob ein Szenenwechsel vorliegt,
wird in Schritt S401 zur Initialisierung auf 0 gesetzt.
-
Dann
werden die Eigenschaften eines Eingabebildes mit denen eines vergangenen
Bildes durch einen bestimmten Parameter verglichen, um das Vorliegen
eines Szenenwechsels zu erfassen (Schritt S402). Zum Beispiel wird
das Vorliegen eines Szenenwechsels durch Vergleichen der Varianz
von Werten von Pixeln in einigen vorbestimmten Bereichen des vergangenen
Bildes mit der Varianz von Werten von Pixeln in einigen vorbestimmten
Bereichen des gegenwärtig
verarbeiteten Bildes verglichen. Wenn ein Szenenwechsel erfaßt wird,
wird das Szenenwechselerfassungsflag Cfn auf 1 gesetzt (Cfn = 1),
und wenn kein Szenenwechsel erfaßt wird, wird das Szenenwechselerfassungsflag
Cfn auf 0 gesetzt (Cfn = 0).
-
Dann
wird die Feldnummer fn geprüft;
um zu beurteilen, ob sie 0 ist oder ob das Feld das erste Feld in
der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld
ist (Schritt S403). Falls die Feldnummer fn 0 ist (fn = 0), wird
dieses Feld als ein Intrafeld verarbeitet (Schritt S405). Wenn dagegen
die Feldnummer fn nicht 0 ist (fn ≠ 0), schreitet
der Prozeß zu
dem nächsten
Schritt S404 fort. Es wird beurteilt, ob das Szenenwechselerfassungsflag
Cfn 0 ist (Cfn = 0) oder es einen Szenenwechsel zwischen dem verarbeiteten
Feld und dem zum Kodieren des Feldes mit Bewegungskompensationsvorhersage
erforderlichen Referenzbild gibt (Schritt S404). Falls das Flag
Cfn 0 ist (Cfn = 0), liegt kein Szenenwechsel vor, und das zu verarbeitende Feld
wird als ein Vorhersagefeld verarbeitet (Schritt S406). Falls das
Flag Cfn 1 ist (Cfn = 1), liegt ein Szenenwechsel vor, und daher
wird das zu verarbeitende Feld als ein Intrafeld verarbeitet (Schritt
S405). Daher wird auch dann, wenn ein Feld in der Bewegungskompensationsvorhersageprozeßeinheit ist
und die Feldnummer nicht 0 ist, das Feld als ein Intrafeld verarbeitet,
wenn ein Szenenwechsel erfaßt wird
und das Flag Cfn 1 ist.
-
Nach
Verarbeitung jedes Feldes wird die Feldnummer fn inkrementiert,
um das nächste
Feld anzuzeigen (Schritt S407). In einem tatsächlichen Gerät kann eine
solche Feldnummer durch ein Signal von einem Mikrocomputer oder
dergleichen gesteuert werden.
-
Dann
wird beurteilt, ob die das nächste
Feld anzeigende Feldnummer fn einen Nummer ist, die ein Feld innerhalb
der Bewegungskompensationsvorhersageprozeßeinheit anzeigt (Schritt S408). Falls
die Feldnummer fn eine Nummer ist, die nicht ein Feld innerhalb
der Bewegungskompensationsvorhersageprozeßeinheit ist, zum Beispiel
in 4 (falls fn = 4, 4), zeigt
dies an, daß eine
Abfolge von Bewegungskompensationsvorhersageprozeßeinheiten
abgeschlossen worden ist, weil die Bewegungskompensationsvorhersageprozeßeinheit innerhalb
von vier Feldern abgeschlossen worden ist und die Feldnummer fn
eines Intrafeld auf 0 gesetzt worden ist. Falls fn < 4, wird beurteilt,
daß das
nächste
Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit
ist, und der Prozeß wird
von der Erfassung des Szenenwechsels für den Prozeß des nächsten Feldes erneut begonnen.
Wenn die Bewegungskompensationsvorhersageprozeßeinheit abgeschlossen worden
ist, wird beurteilt, ob alle der erforderlichen Felder verarbeitet
worden sind (Schritt S409). Diese Beurteilung kann zum Beispiel
durch Prüfen
des Betriebs eines Endschalters des Hochleistungskodierers vorgenommen
werden. Falls das nächste
Feld zu verarbeiten ist, werden, um die nächste Bewegungskompensationsvorhersageprozeßeinheit
zu kodieren, die Variablen initialisiert, und der Prozeß wird von
der Erfassung des Szenenwechsels erneut begonnen. Falls der Vorgang
des Hochleistungskodierers abgeschlossen ist, wird beendet.
-
Als
nächstes
wird der Vorhersagefeldprozeß (Schritt
S406 in 43) in Ausführungsform 10 mit Bezug auf
das Flußdiagramm
von 44 beschrieben werden. Das
Feld, welches in Schritt S404 in 43 bestimmt
worden ist, um als ein Vorhersagefeld verarbeitet zu werden, wird
in Blöcke
einer vorbestimmten Größe von m
[Pixel] × n
[Zeilen] in dem verarbeiteten Feld gebracht (Schritt S451). Die
in die Größe von m × n segmentierten
Blöcke
werden einer Bewegungskompensationsvorhersage unterzogen (Schritt
S452). Die Differenzleistung P1 wird aus einem Differenzblock berechnet,
welcher die Differenz in der Einheit von Pixeln zwischen einem vorbestimmten
Bereich eines vergangenen Bildes und dem Block, der gerade segmentiert
worden ist, ist. Die ursprüngliche
Wechselstromleistung P2, die in dem Zustand Blocks gehalten wird,
wird berechnet (Schritt S454).
-
Die
berechneten Leistungen P1 und P2 werden im Betrag miteinander verglichen
(Schritt S455). wenn die Differenzleistung P1 kleiner als die ursprüngliche
Wechselstromleistung P2 ist, wird der Differenzblock (der Differenzwert
des der Bewegungskompensationsvorhersage unterzogenen Blocks) ausgewählt (Schritt
S456). Wenn die Differenzleistung P1 größer als die ursprüngliche
Wechselstromleistung P2 ist, wird der Eingabeblock (das Original,
welches in Blockform gebracht und keinem weiteren Prozeß unterzogen
worden ist) ausgewählt (Schritt
S457). Jeder ausgewählte
Block wird der Orthogonaltransformation unterzogen (Schritt S458), und
in eine vorbestimmte, für
jede Abfolge festgelegte Bit-Zahl quantisiert (Schritt S459). In
einer Orthogonaltransformation wie zum Beispiel etwa DCT wird eine
Quantisierung derart durchgeführt,
daß ein
größerer Bit-Wert
einer Gleichspannung und niederwertigen Wechselstrom-Sequenzen zugeordnet
wird und ein kleinerer Bit-Wert einer höherwertigen Wechselstrom-Sequenz
zugeordnet wird. Die quantisierten Daten werden in für eine Übertragung
geeignete Codes umgewandelt (Schritt S460), und die kodierten Daten
werden übertragen
(Schritt S461). Zum Beispiel wird durch Zählen der Anzahl von verarbeitetn Blöcken beurteilt,
ob der Prozeß eines
Feldes abgeschlossen worden ist (Schritt S462). Fall der Prozeß eines
Feldes noch nicht abgeschlossen worden ist, wird der Prozeß für den nächsten Block
verfolgt. Falls der Prozeß des
einen Feldes abgeschlossen worden ist, wird der Vorhersagefeldprozeß beendet.
-
Gemäß Ausführungsform
10 wird, wenn ein Szenenwechsel in einem Bewegungskompensationsvorhersageschritt
auftritt, wie in 42 gezeigt, das Feld unmittelbar
nach dem Szenenwechsel als ein Intrafeld festgelegt, wodurch eine
subjektive Einschätzung
des Bildes unmittelbar nach dem Szenenwechsel verbessert werden
kann.
-
Ausführungsform 11
-
In
Ausführungsform
10 ist auch dann, wenn ein Szenenwechsel in einem Schritt eines Bewegungskompensationsvorhersageprozesses auftritt
und das Bild unmittelbar nach dem Szenenwechsel als ein Intrafeld
festgelegt wird, die zeitlich festgelegte Länge in dem Bewegungskompensationsvorhersageprozeßschritt
für vier
Felder festgelegt. Insbesondere erscheint sicher alle vier Felder ein
Intrafeld, wenn der Bewegungskompensationsvorhersageprozeß einmal
beginnt, und wenn ein Szenenwechsel auftritt, liegt auch in dem Bewegungskompensationsvorhersageschritt
ein Intrafeld vor. Dies ist eine Konfiguration, in der ein Vorhersagefeld
durch ein Intrafeld ersetzt wird.
-
Gemäß Ausführungsform
11 wird, wenn ein Szenenwechsel auftritt, wie in 45 gezeigt, und das Feld unmittelbar nach dem
Szenenwechsel als ein Intrafeld festgelegt wirde, das Intrafeld
als das erste Feld in der Bewegungs kompensationsvorhersageprozeßeinheit
festgelegt. Das heißt,
die zeitlich festgelegte Länge
in dem Bewegungskompensationsvorhersageschritt ist veränderlich. Üblicherweise wird
die zeitlich festgelegte Länge
in dem Bewegungskompensationsvorhersageschritt für vier Felder festgelegt, wie
in 45 gezeigt. Wenn in dem Bewegungskompensationsvorhersageschritt ein
Szenenwechsel auftritt, wird das Feld unmittelbar nach dem Szenenwechsel
als ein neues Intrafeld festgelegt, und die Bewegungskompensationsvorhersage
wird, beginnend mit diesem Feld, in der Einheit von vier Feldern
durchgeführt.
Wenn in diesem Bewegungskompensationsvorhersageschritt ein Szenenwechsel
auftritt, wird das Feld unmittelbar nach diesem Szenenwechsel in ähnlicher
Weise als ein neues Intrafeld festgelegt, und die Bewegungskompensationsvorhersage
wird, beginnend mit diesem Feld, in der Einheit von vier Feldern
durchgeführt.
-
46 ist ein Flußdiagramm, welches den gesamten
Ablauf in Ausführungsform
11 zeigt. In 46 sind mit den gleichen Schrittnummern
wie den in 43 verwendete Abschnitte mit
denen in 43 identisch. Die Prozesse
von Schritt S401 bis Schritt S406 sind die gleichen wie in Ausführungsform
10. Der Intrafeld-Prozeß und
der Vorhersagefeldprozeß in
Schritten S405 und S406 sind die gleichen wie in der Ausführungsform
10. Bezügliche
eines Feldes, welches in Schritt S405 als ein Intrafeld verarbeitet
worden ist, wird die Feldnummer fn auf 0 gesetzt (fn = 0), um die
Bewegungskompensationsvorhersageprozeßeinheit, in der das erste
Feld dieses verarbeitete Feld ist, umzuschalten (Schritt S490).
In Ausführungsform
10 wird auch dann, wenn ein Feld zum Beispiel als ein Intrafeld
verarbeitet wird, die Feldnummer fn sequentiell in der Reihenfolge
von 0 → 1 → 2 → 3 → 0 ... geändert, wie
in 45 gezeigt. In Ausführungsform 11 wird, wenn ein
Feld, das nicht das erste Feld in der Bewegungskom pensationsvorhersageprozeßeinheit
ist, als ein Intrafeld verarbeitet wird, die Feldnummer fn dieses
Feldes erzwungenermaßen
auf 0 gesetzt, und dieses Feld wird als das erste Feld der neuen
Bewegungskompensationsvorhersageprozeßeinheit festgelegt. Dies ermöglicht,
daß die
zeitlich festgelegte Länge
in der Bewegungskompensationsvorhersageprozeßeinheit veränderlich
ist. Wenn ein Szenenwechsel mit einer zeitlich kürzeren Frequenz als der zeitlich
festgelegten Länge
auftritt, wird die zeitlich festgelegte Länge in der Bewegungskompensationsvorhersageprozeßeinheit
eine Abfolge kurzer Längen.
Die Prozesse von Schritt S407 bis Schritt S409 sind die gleichen wie
in Ausführungsform
10.
-
Gemäß Ausführungsform
11 wird das Bild unmittelbar nach dem Szenenwechsel als ein Intrafeld
festgelegt, wodurch eine subjektive Einschätzung des Bildes verbessert
wird. Wenn der Zeitabstand zwischen Szenenwechseln länger als
die zeitlich festgelegte Länge
in der Bewegungskompensationsvorhersageprozeßeinheit und die Frequenz von Szenenwechseln
niedrig ist, ist die Anzahl von Feldern eines Intrafeldes kleiner
als in Ausführungsform 3,
so daß die
Informationsmenge reduziert werden kann.
-
Ausführungsform 12
-
In
Ausführungsformen
10 und 11 wird ein Prozeß durchgeführt, während ein
Feld (oder Rahmen), in welchem ein Szenenwechsel erfaßt wird,
als ein Intrafeld (oder Intrarahmen) festgelegt wird. Alternativ
kann ohne Festlegen als ein Intrafeld (oder Intrarahmen) das Referenzbild
des Feldes (oder Rahmens) als ein Intrafeld (oder Intrarahmen),
welches zu der nächsten
Bewegungskompensationsvorhersageprozeßeinheit gehört, festgelegt
werden.
-
Ausführungsform
12 wird mit Bezug auf 47 beschrieben
werden. 47(a) zeigt einen üblichen
Bewegungskompensationsvorhersageprozeß, der durch das Verfahren
in 4 durchgeführt wird.
In diesem Beispiel fungieren Felder F10 und F14 als ein Intrafeld.
Die Bewegungskompensationsvorhersage wird durchgeführt, während diese
Felder F10 und F14 als das erste Feld der Bewegungskompensationsvorhersageprozeßeinheit festgelegt
werden. Dann werden, wenn ein Szenenwechsel zwischen Feld F11 und
Feld F12 auftritt, wie in 47(b) gezeigt,
und der Szenenwechsel in Feld F12 erfaßt wird, Felder von Feld F12
bis zu dem letzten Feld (in diesem Beispiel Feld F13) der Bewegungskompensationsvorhersageprozeßeinheit einschließlich Feld
F12 mit der nächsten Bewegungskompensationsvorhersageprozeßeinheit kombiniert,
und Felder F12 und F13 werden einer Bewegungskompensationsvorhersage
unterzogen, in welcher ein zu der nächsten Bewegungskompensationsvorhersageprozeßeinheit
gehörendes
Intrafeld als das Referenzbild verwendet wird. In der nächsten,
mit diesen Feldern kombinierten Bewegungskompensationsvorhersageprozeßeinheit werden
eine normale Bewegungskompensationsvorhersage und die Bewegungskompensationsvorhersage
für das
kombinierte Feld wie oben durchgeführt.
-
Ausführungsform 13
-
In
Ausführungsform
12 ist die Bewegungskompensationsvorhersageprozeßeinheit manchmal länger als
die gewöhnliche.
Gemäß Ausführungsform
13 werden P Felder (oder P Rahmen), welche mit einem Feld (oder
Rahmen), in dem ein Szenenwechsel erfaßt wird, beginnen und welche eine
der Länge
einer üblichen
Bewegungskompensationsvorhersageprozeßeinheit entsprechende Gesamtlänge aufweisen,
einer Bewegungskompensationsvorhersage unterzogen.
-
Ausführungsform
13 wird mit Bezug auf 48 beschrieben
werden. 48(a) zeigt einen üblichen
Bewegungskompensationsvorhersageprozeß, der durch das Verfahren
in 4 durchgeführt wird.
In diesem Beispiel fungieren Felder F10 und F14 als ein Intrafeld.
Während
diese Felder F10 und F14 als das erste Feld einer Bewegungskompensationsvorhersageprozeßeinheit
festgelegt werden, wird eine Bewegungskompensationsvorhersage durchgeführt. Dann
wird, wenn ein Szenenwechsel zwischen Feld F11 und Feld F12 auftritt,
wie in 48(b) gezeigt, und der Szenenwechsel
in Feld F12 erfaßt wird,
eine Abfolge von vier Feldern (dies, weil eine Bewegungskompensationsvorhersageprozeßeinheit aus
vier Feldern besteht), die mit Feld F12 beginnt, in welchem der
Szenenwechsel erfaßt
wird, in eine Bewegungskompensationsvorhersageprozeßeinheit ausgebildet.
Feld F14, das in einem üblichen
Fall das erste Feld der nächsten
Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld
sein kann, wird als ein Intrafeld in der gegenwärtigen Bewegungskompensationsvorhersageprozeßeinheit festgelegt,
und dann wird eine Bewegungskompensationsvorhersage durchgeführt. Wenn
die Bewegungskompensationsvorhersage für vier Felder, beginnend mit
Feld F12, oder die für
Felder F12 bis F15 abgeschlossen ist, beginnt die übliche Bewegungskompensationsvorhersage
wieder bei Feld F16, wie es vorher war.
-
Ausführungsform 14
-
In
Ausführungsformen
3 bis 13 wird ein Umschalten mit Bezug auf einen Szenenwechsel erläutert. Ein
Referenzbild kann in Übereinstimmung
mit der Anzahl von Intra-Betriebsarten, die erzwungenermaßen in Blöcken erzeugt
worden sind, umgeschaltet werden. Demgemäß kann sogar in einem Bild,
in dem viele erzwungene Intra-Betriebsarten auftauchen, oder in
einem Fall, daß ein
Objekt, das in einem Feld vorher nicht existiert hat, in dem gegenwärti gen Feld
plötzlich
auftaucht, oder ein Objekt, das in einem Feld vorher existiert hat,
aus dem gegenwärtigen
Bild plötzlich
verschwindet, ein Referenzbild durch ein ähnliches Verfahren umgeschaltet
werden.
-
Ausführungsform 15
-
In
Ausführungsformen
3 bis 13 wird zum Beispiel ein Prozeß, in welchem eine Bewegungskompensationsvorhersage
wie in 4 gezeigt durchgeführt wird, auf einen Prozeß umgeschaltet,
in welchem eine Bewegungskompensationsvorhersage wie in 28 gezeigt durchgeführt wird. Vor dem Umschalten
kann eine Bewegungskompensationsvorhersage beliebiger Art durchgeführt werden,
wie in 49 gezeigt. Nach der Erfassung
eines Szenenwechsels oder dergleichen wird der Prozeß in eine
Bewegungskompensationsvorhersage umgeschaltet, in welcher die erzeugte
Informationsmenge auf ein niedrigeres Niveau als dem vor dem Umschalten
reduziert wird, wie in 28 gezeigt.
-
Ausführungsform 16
-
In
Ausführungsformen
3 bis 15 wird der Bewegungskompensationsvorhersageprozeß in der Einheit
von vier Feldern durchgeführt.
Die Anzahl von Feldern, welche als die Einheit verwendet werden kann,
ist nicht notwendigerweise vier. Der Prozeß kann in einer Einheit einer
beliebigen Anzahl von Feldern, auf welchen der Bewegungskompensationsvorhersageprozeß durchgeführt werden
kann, durchgeführt
werden.
-
Gemäß Ausführungsformen
3 bis 16 wird ohne große
Vergrößerung der
Speichermenge durch zusätzliches
Bereitstellen einer Geräteumgebung wie
zuvor beschrieben, selbst wenn ein Szenenwechsel in der Bewegungskompensationsvorhersageprozeßeinheit
auftritt, ein Referenzbild von dem ursprünglich festgelegten Referenzbild
umgeschaltet wird, um den durch den Szenenwechsel verursachten Einfluß zu minimieren,
etc., das Bild unmittelbar nach dem Szenenwechsel als ein Referenzbild
zur Bewegungskompensationsvorhersage festgelegt, und nach der Erfassung
des Szenenwechsels werden Felder vor dem Szenenwechsel nicht als
das Referenzbild zur Bewegungskompensationsvorhersage verwendet,
wodurch eine Übertragung
vorgenommen werden kann, während
die Erhöhung
der Codemenge aufgrund des Szenenwechsels auf ein Minimum unterdrückt wird,
und ohne die Bildqualität
zu verschlechtern.
-
Wenn
eine Bewegungskompensationsvorhersage vor und nach einem Szenenwechsel
durchgeführt
wird, wird für
gewöhnlich
die Informationsmenge des Vorhersagebildes vermehrt. Daher kann durch
Verarbeiten des Feldes als ein Intrabild mit einer dieser Informationsmenge
gleichen Informationsmenge eine subjektive Einschätzung des
Bildes verbessert werden. Während
ein Bild unmittelbar nach einem Szenenwechsel durch Erfassen des
Szenenwechsel als ein Intrabild festgelegt wird, kann eine Kodierung
zwischen Feldern oder Rahmen so durchgeführt werden, daß eine subjektive
Einschätzung des
Bildes unmittelbar nach dem Szenenwechsel verbessert werden kann.
Wenn ein Szenenwechsel auftritt, wird das Bild unmittelbar nach
dem Szenenwechsel als ein Intrabild gehandhabt, und eine Bewegungskompensationsvorhersage
wird mit dem Intrabild, welches das erste Bild ist, durchgeführt, wodurch
die Anzahl erzeugter Intrabilder reduziert werden kann und die Menge
an erzeugter Information nicht notwendigerweise erhöht wird.
-
Ausführungsform 17
-
50 ist ein Blockdiagramm, welches die Konfiguration
einer Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation
gemäß der Erfindung
zeigt. In 50 sind die Bezugsziffern 101 bis 111 die
gleichen wie die in der herkömmlichen Vorrichtung
in 17 oder 23 verwendeten.
-
Nachstehend
wird der Aufzeichnungsprozeß beschrieben.
Ein in den A/D-Wandler 101 eingegebenes Videosignal wird
in ein digitales Videosignal umgewandelt und an den Hochleistungskodierer 110 ausgegeben.
Der Hochleistungskodierer 110 führt die Redundanzverminderung
unter Verwendung einer Autokorrelation der Videoinformation, des menschlichen
Sehverhaltens und der Datenerzeugungsfrequenzvorgabe durch, um die
Information (deren Einzelheiten später beschrieben werden) zu komprimieren.
Der Ausgang des Hochleistungskodierers 110 wird an den
Fehlerkorrekturkodierer 102 angelegt, in welchem ihm Fehlerkorrekturcodes
zum Korrigieren von Übertragungsfehlern
hinzugefügt werden.
In diesem Prozeß werden
hinzuzufügende Codes,
welche ein hohes Fehlerkorrekturvermögen und eine kleine Informationsmenge
aufweisen, verwendet, um eine hochdichte Aufnahme durchzuführen, und
weil auch ein kleiner Fehler in komprimierter Information einen
Einfluß über einen
weiten Bereich ausübt.
Die Daten, zu welchen Fehlerkorrekturcodes hinzugefügt worden
sind, werden durch den Modulator 103 zu einem für Magnetköpfe 106 und
das Magnetband 105 geeigneten Signal moduliert. Der Modulator 103 führt auch
andere Operationen wie etwa Unterdrückung von Gleichstrom- und
niederfrequenten Komponenten für
die Azimutaufnahme und das Hinzufügen eines Spurverfolgungssignals,
welches die Aufzeichnungsfunktion der Magnetköpfe 106 unterstützt, durch.
Das Aufnahmesignal, welches durch den Modulator 103 moduliert
worden ist, wird durch die Magnetköpfe 106 auf dem Magnetband 105 aufgezeichnet.
Die Magnetköpfe 106 sind
auf der Rotationskopftrommel 104 so befestigt, daß sie durch
die Rotation der Trommel 104 gedreht werden. Auf dem Magnetband 105 wird
die sogenannte Schrägspurabstastaufzeichnung
durchgeführt.
-
Als
nächstes
wird der Wiedergabeprozeß beschrieben.
Das Signal, welches durch die Schrägspurabstastung auf dem Magnetband 105 aufgezeichnet
worden ist, wird durch die auf der Rotationskopftrommel 104 befestigten
Magnetköpfe 106 abgenommen
und dann durch den Demodulator 107 demoduliert. Das demodulierte
Signal wird durch den Fehlerkorrekturdekodierer 108 der
Fehlererfassung und Fehlerkorrektur unterzogen. Die fehlerkorrigierten
Daten werden durch den Hochleistungsdekodierer 111 expandiert,
so daß sie
von den komprimierten Codes in das ursprüngliche digitale Videosignal
geändert
werden. Das rekonstruierte digitale Videosignal wird durch den D/A-Wandler 109 in
ein analoges Videosignal umgewandelt und dann ausgegeben.
-
51 zeigt anhand eines Diagramms ein Beispiel
für das
Bandformat in Ausführungsform
17. Videoinformation von vier Feldern ({720 + 360 × 2} × 480 × 4/2 =
11,06 Mbit) wird auf etwa 1,3 Mbit kompressionskodiert und dann
zusammen mit einem Audiosignal und Fehlerkorrekturcodes in zehn
Spuren aufgezeichnet. In der leitbandlosen Aufzeichnung unter Verwendung
des Azimutverfahrens beträgt
die Flächenaufnahmedichte
2,5 μm2/bit.
-
52 ist ein Blockdiagramm, welches die interne
Konfiguration des Hochleistungskodierers 110 in 50 zeigt. In 52 bezeichnet 301 einen Subtrahierer,
welcher die Differenz zwischen einem eingegebenen Originalsignal
und einem Vorhersagesignal ausgibt, 302 bezeichnet einen
ersten Schalter, welcher entweder das eingegebene Originalsignal oder
den Ausgang des Subtrahierers 301 auswählt, 303 bezeichnet
eine DCT-Schaltung, welche die DCT-Orthogonaltransformation durchführt, 304 bezeichnet eine
Quantisierungsschaltung, welche zu kodierende Daten quantisiert,
und 305 bezeichnet einen Kodierer für variable Längen, welcher
Daten einer hohen Frequenz einen kurzen Code zuordnet, um die statistische
Datenredundanz zu beseitigen. Die Elemente 306 bis 311 bilden
einen lokalen Dekodierer zum Gewinnen eines Vorhersagesignals. Die Bezugsziffer 306 bezeichnet
eine Umkehrquantisierungsschaltung, welche die quantisierten Daten
wiederherstellt, 307 bezeichnet eine Umkehr-DCT-Schaltung,
welche die inverse DCT ausführt, 308 bezeichnet
einen Addierer, welcher das Vorhersagesignal dem Differenzsignal
hinzufügt,
um das Originalsignal zu rekonstruieren, 309 bezeichnet einen
Bildspeicher, welcher lokal rekonstruierte Videodaten speichert, 310 bezeichnet
eine Bewegungskompensationsschaltung, welche Bewegung aus dem eingegebenen
Originalsignal erfaßt
und die nächsten
Vorhersagedaten ausgibt, und 311 bezeichnet einen zweiten
Schalter, welcher in den Addierer 308 einzugebende Daten
schaltet.
-
Der
Betrieb des Hochleistungskodierers 110 wird nachfolgend
beschrieben. Das Anfangsfeld eines Aufzeichnungseinheitsblocks wird
als ein Intrafeld, welches die Zwischenebenenvorhersage nicht verwendet,
kodiert. Nachdem der erste Schalter 302 den oberen Kontakt
auswählt,
wird ein eingegebenes digitales Videosignal durch die DCT-Schaltung 303 einer
Orthogonaltransformation unterworfen. Die transformierten Daten
werden durch die Quantisierungsschaltung 304 quantisiert
und durch den Kodierer für
variable Längen 305 in
einen längenvariablen Code
wie etwa einen Huffman-Code kodiert, um ausgegeben zu werden. Zur
selben Zeit werden die quantisierten Daten durch die Umkehrquantisierungsschaltung 306 invers
quantisiert und dann der Umkehr-DCT-Schaltung 307 zugeführt. In
der Umkehr-DCT-Schaltung 307 werden die orthogonal transformierten
Daten in die Original-Videodaten invertiert und dann an den Addierer 308 ausgegeben. In
dem Intrafeld wählt
der zweite Schalter 311 auch den oberen Kontakt aus, so
daß der
eine Eingang des Addierers 308 Null ist. Daher wird der
Ausgang der Umkehr-DCT-Schaltung 307 unverändert an
den Bildspeicher 309 angelegt, um darin gespeichert zu werden.
-
Beim
Kodieren des nächsten
Feldes wird Zwischenebenenvorhersage verwendet. Bei Zwischenebenenvorhersage
wählen
sowohl der erste als auch der zweite Schalter 302 und 311 ihren
unteren Anschluß.
Ein eingegebenes digitales Videosignal tritt in den Subtrahierer 301 und
die Bewegungskompensationsschaltung 310 ein. Die Bewegungskompensationsschaltung 310 vergleicht
das gespeicherte Bild mit dem eingegebenen Bild und gibt Bewegungsvektoren
des eingegebenen Bildes und eines Vorhersagebildes aus, um in der
Vorhersagekodierung verwendet zu werden. Der Subtrahierer 301 berechnet
die Differenz zwischen dem Eingangsbild und dem Vorhersagebild und
gibt es als ein Vorhersagedifferenzsignal an die DCT-Schaltung 303 aus. Verglichen
mit einem rohen Videosignal weist ein Vorhersagedifferenzsignal
eine kleinere Informationsmenge auf, wobei die Vorhersagegenauigkeit
ansteigt. Zum Beispiel ist ein Vorhersagedifferenzsignal für ein völlig stillstehendes
Bild Null. In gleicher Weise wie das Anfangsfeld werden die in die
DCT-Schaltung 303 eingegebenen Daten durch die DCT-Schaltung 303 und
die Quantisierungsschaltung 304 der Orthogonaltransformation
und Quantisierung unterworfen und dann durch den längenvariablen
Kodierer 305 in Längenvariable
Codes umgewandelt, um ausgegeben zu werden. Andererseits werden
die quantisierten Daten durch die Umkehrquantisierungsschaltung 306 an
die Umkehr-DCT-Schaltung 307 angelegt, um der inversen
Quantisierung und inversen Orthogonaltransformation unterworfen
zu werden, und dann an den Addierer 308 gesendet. Nachdem
das in dem Prozeß des
Gewinnens der Vorhersagedifferenz verwendete Vorhersagebild an den
anderen Eingangsanschluß des
Addie rers 308 angelegt wird, ist der Ausgang des Addierers 308 gleich
dem Eingangsbild. Der Ausgang des Addierers 308 wird in dem
Bildspeicher 309 gespeichert. In gleicher Weise wie oben
beschrieben wird der Prozeß des
Kodierens von n Feldern fortgeführt.
-
53 zeigt ein Beispiel für die Variation der Menge der
für jeden
Rahmen erzeugten Codes. In diesem Beispiel ist zu bemerken, daß ein Intrafeld, welches
nicht die Zwischenebenenvorhersage verwendet, nach jeweils sieben
Feldern angeordnet ist, wodurch die Informationsmenge erhöht wird. 54 zeigt ein Beispiel für die Beziehung zwischen in
jedem Feld aufgezeichneter Information und dem Schreiben in Spuren.
In diesem Beispiel werden Daten von vier Feldern in zehn Spuren
aufgezeichnet. Die Datenmenge eines Feldes kann kein integrales Mehrfaches
der Aufnahmekapazität
einer Spur sein.
-
Es
ist nicht immer notwendig, Daten in zehn Spuren aufzuzeichnen, Daten
können
auch in acht oder sechs Spuren abhängig von der aufzuzeichnenden
Informationsmenge aufgezeichnet werden.
-
Wie
oben beschrieben, kann in Ausführungsform
17, nachdem Signale einer Mehrzahl von Feldern oder Rahmen in einer
Aufzeichnungseinheit, welche in einer vorbestimmten Anzahl von Spuren aufzuzeichnen
ist, gesammelt werden, jedes der aufgezeichneten Felder durch Durchführen der
Wiedergabeverarbeitung auf einer vorbestimmten Anzahl von Spuren
rekonstruiert werden. Daher können
die Ausführungsformen
die spezielle in einem VTR benötigte
Wiedergabe und Editierung bewältigen. Nachdem
die in der Aufzeichnung zu verwendende Anzahl von Spuren abhängig von
der aufzuzeichnenden Informationsmenge ausgewählt wird, gibt es keine vergeudete
Spur, wodurch Aufzeichnung und Wiedergabe für eine lange Zeitdauer durchgeführt werden können. Nachdem
es des weiteren nicht notwendig ist, aufzuzeichnende Information
so zu steuern, daß sie
der Aufnahmekapazität
jeder Spur angeglichen wird, gibt es keinen nutzlosen Anteil in
jeder Spur, mit dem Ergebnis, daß das Aufzeichnen effizient
durchgeführt
werden kann. Nachdem darüberhinaus
ein Intrabild, welches keine Zwischenebenenvorhersage verwendet,
sicher in jeder Aufzeichnungseinheit vorliegt, kann ein rekonstruiertes
Bild auch in einer speziellen Wiedergabe wie etwa einem Schnellsuchlauf
leicht erhalten werden, und die Menge der aufzuzeichnenden Information
kann, verglichen mit einem Vorhersagebild, welches die Zwischenebenenvorhersage
verwendet, reduziert werden.
-
Man
beachte, daß anstelle
von Intrafeldern Intrarahmen verwendet werden können.