DE69333896T2

DE69333896T2 - Vorrichtung und Verfahren zum Aufzeichnen/Wiedergeben von Videoinformation

Info

Publication number: DE69333896T2
Application number: DE69333896T
Authority: DE
Inventors: Tomohiro Nagaokakyo-shi Kyoto Ueda; Takashi Nagaokakyo-Shi Kyoto Itow; Yoshinori Nagaokakyo-shi Kyoto Asamura; Ken Nagaokakyo-shi Kyoto Onishi; Hidetoshi Nagaokakyo-Shi Kyoto Mishima
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1992-01-29
Filing date: 1993-01-28
Publication date: 2006-07-27
Anticipated expiration: 2013-01-29
Also published as: DE69333900D1; EP1971130A1; EP1137280A1; EP1296521A3; DE69333900T2; DE69330919D1; EP1555830A2; EP0554086A3; EP1555830A3; EP1137280B1; EP1555817A2; EP1555817B1; DE69334232D1; EP0554086A2; EP1971130B1; EP1304884A3; EP1296521A2; EP0554086B1; US5909252A; EP1304884A2

Description

HINTERGRUND DER ERFINDUNG
Gebiet der Erfindung
Diese Erfindung betrifft eine Vorrichtung zur Aufzeichnung/Wiedergabe digitaler Signale wie etwa ein Videobandaufzeichnungsgerät (nachfolgend abgekürzt als "VTR"), ein Bildplattenwiedergabegerät oder ein Tonbandaufzeichnungsgerät, in welcher Video- und Audiosignale in der digitalen Form aufgezeichnet und wiedergegeben werden, und insbesondere auf eine Vorrichtung, welche zur Kompressionskodierung eine Bewegungskompensationsvorhersage bezüglich eines Videosignals durchführt.
Beschreibung des Stands der Technik
In einem digitalen Heim-VTR bzw. einem digitalen VTR zur Verwendung im häuslichen Bereich ist im Hinblick auf Kosten und Geräteabmessungen eine Datenkompression unentbehrlich. Nachfolgend wird daher eine Datenkompression hauptsächlich am Beispiel eines digitalen Heim-VTR beschrieben.
1 ist ein schematisches Blockdiagramm, welches den Aufbau eines digitalen Heim-VTR zeigt. Die Bezugsziffer 900 bezeichnet einen Eingangsanschluß, durch welchen ein analoges Videosignal wie etwa ein Fernsehsignal eingegeben wird. Die Bezugsziffer 901 bezeichnet einen A/D-Wandler, welcher das analoge Videosignal in ein digitales Videosignal umwandelt, 902 bezeichnet einen Datenkompressor, welcher das digitale Videosignal komprimiert, um die Informationsmenge des Signals zu reduzieren, 903 bezeich net einen Fehlerkorrekturkodierer, welcher dem kodierten Signal Fehlerkorrekturcodes hinzufügt, so daß Fehler in der Wiedergabe korrigiert werden, 904 bezeichnet einen Aufnahmemodulator, welcher, um die Aufzeichnung durchzuführen, das Signal zu für die Aufzeichnung geeigneten Codes moduliert, 905 bezeichnet einen Aufnahmeverstärker, welcher das Aufnahmesignal verstärkt, und 906 bezeichnet ein Magnetband, auf welchem das Aufnahmesignal zum Zwecke der Speicherung aufgezeichnet wird. Die Bezugsziffer 907 bezeichnet einen Vorverstärker, welcher ein von dem Magnetband 906 wiedergegebenes Signal verstärkt, 908 bezeichnet einen Wiedergabedemodulator, welcher das wiedergegebene Signal demoduliert, 909 bezeichnet einen Fehlerkorrekturdekodierer, welcher an dem wiedergegebenen und demodulierten Signal unter Verwendung der Fehlerkorrekturcodes eine Fehlerkorrektur durchführt, 910 bezeichnet einen Datenexpander, welcher die komprimierten Daten in ihre ursprüngliche Form rekonstruiert, 911 einen D/A-Wandler, welcher das digitale Videosignal in ein analoges Videosignal umwandelt, und 912 bezeichnet einen Ausgangsanschluß.
Als nächstes wird der Datenkompressor (Hochleistungskodierer) 902 beschrieben. 2 ist ein Blockdiagramm des Hochleistungskodierers, welcher eine Einwegbewegungskompensationszwischenrahmenvorhersage verwendet. Die Bezugsziffer 1 bezeichnet einen Eingangsanschluß für ein digitales Videosignal, 2 bezeichnet eine Blockbildungsschaltung, welche das eingegebene digitale Videosignal segmentiert, 3 bezeichnet einen Subtrahierer, welcher als einen Differenzblock ein Differenzsignal zwischen einem Eingangsblock und einem Vorhersageblock ausgibt, 4 bezeichnet ein Differenzleistungsberechnungsglied, welches die Leistung des Differenzblock berechnet, 5 bezeichnet ein Originalleistungsberechnungsglied, welches die Wechselstromleistung des Eingangsblocks berechnet, 6 bezeich net ein Bestimmungsglied, welches die Differenzleistung mit der ursprünglichen Wechselstromleistung vergleicht, um zu bestimmen, ob die momentane Betriebsart ein Vorhersagemodus oder ein Intramodus ist, 7 bezeichnet einen ersten Schalter, welcher wahlweise einen kodierten Block in Übereinstimmung mit der festgestellten Betriebsart ausgibt, 8 bezeichnet eine DCT-Schaltung, welche an den kodierten Blöcken die diskrete Cosinustransformation (nachfolgend mit "DCT" abgekürzt), welche eine Orthogonaltransformation ist, durchführt, 9 bezeichnet eine Quantisierungsschaltung, welche einen DCT-Koeffizient quantisiert, 10 bezeichnet einen ersten Kodierer, welcher die für einen Übertragungsweg geeignete Kodierung durchführt, und 11 bezeichnet den Übertragungsweg.
Bezugsziffer 12 bezeichnet eine inverse Quantisierungsschaltung, welche eine Umkehrquantisierung bezüglich des quantisierten DCT-Koeffizienten durchführt, 13 bezeichnet eine inverse DCT-Schaltung, welche die ungekehrte DCT bezüglich des invers quantisierten DCT-Koeffizienten durchführt, 14 bezeichnet einen Addierer, welcher dem dekodierten Block, welcher ein Ausgangssignal der Umkehr-DCT-Schaltung 13 ist, einen Vorhersageblock hinzufügt, um einen Ausgangsblock zu erzeugen, 15 bezeichnet einen Bildspeicher, welcher Ausgangsblöcke speichert, um eine Bewegungskompensationsvorhersage durchzuführen, 16 bezeichnet eine MC-Schaltung, welche eine Bewegungsschätzung aus einem Bewegungskompensationssuchblock, welcher aus einem in dem Bildspeicher 15 gespeicherten früheren Bild segmentiert ist, und dem aktuellen Eingangsblock durchführt und eine Bewegungskompensationsvorhersage durchführt, 17 bezeichnet eine MIX-Schaltung, welche einen Bewegungsvektor mit einem durch das Bestimmungsglied 6 bestimmten Betriebsartsignal kombiniert, 18 bezeichnet einen zweiten Kodierer, welcher den Ausgang der MIX-Schaltung 17 kodiert, und 19 bezeichnet einen zweiten Schalter, welcher die Vorhersageblöcke in Übereinstimmung mit der durch das Bestimmungsglied 6 bestimmten Betriebsart schaltet. Das Differenzleistungsberechnungsglied 4, das Originalleistungsberechnungsglied 5, das Bestimmungsglied 6, die Umkehr-Quantisierungsschaltung 12, die Umkehr-DCT-Schaltung 13, der Addierer 14, der Bildspeicher 15, die MC-Schaltung 16 und der zweite Schalter 19 bilden eine lokale Dekodierschleife 20.
Nun wird die Wirkungsweise beschrieben. Unabhängig von einem Intrafeld, in welchem eine Bewegungskompensationsvorhersage nicht durchgeführt wird, oder einem Vorhersagefeld (Zwischenfeld), in welchem eine Bewegungskompensationsvorhersage durchgeführt wird, werden eingegebene digitale Videosignale durch die Blockbildungsschaltung 2 in Eingangsblocks in der Einheit von m [Pixel] × n [Zeilen] unterteilt (wobei m und n positive ganze Zahlen sind) und segmentiert. Um einen Differenzblock zu erhalten, berechnet der Subtrahierer 3 die Differenz in der Einheit von Pixeln zwischen einem Eingangsblock und einem Vorhersageblock. Sodann werden der Eingangsblock und der Differenzblock in den ersten Schalter 7 eingegeben. Das Differenzleistungsberechnungsglied 4 berechnet die Differenzleistung des Differenzblocks. Andererseits berechnet das Originalleistungsberechnungsglied 5 die ursprüngliche Wechselstromleistung des Eingangsblocks. Die zwei berechneten Leistungen werden durch das Bestimmungsglied 6 miteinander verglichen, um den ersten Schalter 7 so zu steuern, daß der Block, welcher die kleinere Leistung aufweist, als das Objekt der Kodierung ausgewählt wird. Genauer gesagt gibt, wenn die Differenzleistung kleiner als die ursprüngliche Wechselstromleistung ist, das Bestimmungsglied 6 ein Vorhersagemodus-Signal aus, wenn dagegen die ursprüngliche Wechselstromleistung kleiner als die Differenzleistung ist, gibt das Bestimmungsglied 6 ein Intramodus-Signal aus.
Der erste Schalter 7 gibt in Übereinstimmung mit dem durch das Bestimmungsglied 6 bestimmten Betriebsartsignal den Eingangsblock oder den Differenzblock als einen kodierten Block aus. Wenn sich das verarbeitete Bild in dem Intrafeld befindet, arbeitet der erste Schalter 7 allerdings so, daß alle kodierten Blöcke als Eingangsblocks ausgegeben werden. 3 illustriert diese Schaltoperation. Die normale Betriebsart ist ein Modus, in welchem in einem Schritt einer Bewegungskompensationsvorhersage, welche gemäß der Darstellung in 4 in vier Feldern fertiggestellt wird, ein erstes Feld F1 der vier Felder immer ein Intrafeld ist und die nachfolgenden zweiten, dritten und vierten Felder F2, F3 und F4 Vorhersagefelder sind.
Der durch den ersten Schalter 7 ausgewählte kodierte Block wird durch die DCT-Schaltung 8 in DCT-Koeffizienten umgewandelt und dann den Bewertungs- und Schwellwertprozessen in der Quantisierungsschaltung 9 unterworfen, um jeweils entsprechend den Koeffizienten auf vorbestimmte Bit-Werte quantisiert zu werden. Die quantisierten DCT-Koeffizienten werden durch den ersten Kodierer 10 in für den Übertragungsweg 11 geeignete Codes umgewandelt und dann an den Übertragungsweg 11 ausgegeben.
Die quantisierten DCT-Koeffizienten treten auch in die lokale Dekodierschleife 20 ein, und die Bildwiedergabe für die nächste Bewegungskompensationsvorhersage wird durchgeführt. Die quantisierten DCT-Koeffizienten, welche in die lokale Dekodierschleife 20 eingetreten sind, werden den inversen Bewertungs- und inversen Quantisierungsprozessen in der Umkehr-Quantisierungsschaltung 12 unterworfen. Sodann werden die DCT-Koeffizienten durch die Umkehr-DCT-Schaltung 13 in einen dekodierten Block umgewandelt. Der Addierer 14 addiert in der Einheit von Pixeln den dekodierten Block zu einem Vorhersageblock, um das Bild zu rekonstruieren. Dieser Vorhersageblock ist der gleiche wie der in dem Subtrahierer 3 verwendete. Der Ausgang des Addierers 14 wird als ein Ausgangsblock in eine vorbestimmte Adresse des Bildspeichers 15 geschrieben. Die Speicherkapazität des Bildspeichers 15 hängt von der Art des eingesetzten Vorhersageverfahrens ab. Angenommen, daß der Bildspeicher 15 aus einer Mehrzahl von Feldspeichern besteht, wird der rekonstruierte Ausgangsblock in eine vorbestimmte Adresse geschrieben. Ein Block, welcher von einem aus früheren Ausgangsblocks rekonstruierten Bild segmentiert wird und sich in dem Bewegungsschätzungssuchbereich befindet, wird von dem Bildspeicher 15 an die MC-Schaltung 16 ausgegeben. Die Größe des Blocks in dem Bewegungsschätzungssuchbereich ist i [Pixel] × j [Zeilen] (wobei i ≥ m, j ≥ n, und i und j positive ganze Zahlen sind). Daten in dem Suchbereich von dem Bildspeicher 15 und einem Eingangsblock von der Blockbildungsschaltung 2 werden in die MC-Schaltung 16 als Daten eingegeben, wodurch Bewegungsvektoren extrahiert werden. Als ein Verfahren zum Extrahieren von Bewegungsvektoren gibt es verschiedene Verfahren wie etwa das Gesamtsuchblockabgleichsverfahren und das Baumsuchblockabgleichsverfahren. Diese Verfahren sind wohlbekannt, und daher wird diesbezüglich auf eine Beschreibung verzichtet.
Die durch die MC-Schaltung 16 extrahierten Bewegungsvektoren werden in die MIX-Schaltung 17 eingegeben und darin mit dem durch das Bestimmungsglied 6 bestimmten Betriebsartsignal kombiniert. Die kombinierten Signale werden durch den zweiten Kodierer 18 in für den Übertragungsweg 11 geeignete Codes umgewandelt und dann zusammen mit dem entsprechenden kodierten Block an den Übertragungsweg 11 ausgegeben. Die MC-Schaltung 16 gibt als einen Vorhersageblock Signale aus, welche von dem Suchbe reich in der Größe (m [Pixel] × n [Zeilen]), welche gleich der des Eingangsblocks ist, segmentiert sind. Der aus der MC-Schaltung 16 auszugebende Vorhersageblock wird aus der früheren Videoinformation hergestellt. Der Vorhersageblock wird dem zweiten Schalter 19 zugeführt und in Übereinstimmung mit dem Feld des aktuell verarbeiteten Bildes und dem Betriebsartsignal des dekodierten Blocks aus dem jeweiligen Ausgangsanschluß des Schalters ausgegeben. Insbesondere wird der Vorhersageblock in Übereinstimmung mit dem verarbeiteten Feld aus einem der Ausgangsanschlüsse des zweiten Schalters 19 an den Subtrahierer 3 ausgegeben, und aus dem anderen Ausgangsanschluß in Übereinstimmung mit dem Betriebsartsignal des aktuell dekodierten Blocks und dem verarbeiteten Feld.
Als ein in solch einem Schaltungsblock verwendetes Vorhersageverfahren kann zum Beispiel das in 4 gezeigte Verfahren eingesetzt werden. In diesem Verfahren wird ein Intrafeld nach jeweils drei Feldern eingefügt, und die drei Zwischenfelder werden als Vorhersagefelder festgelegt. In 4 ist das erste Feld F1 ein Intrafeld, und das zweite, dritte und vierte Feld F2, F3 und F4 sind Vorhersagefelder. In der Vorhersage mittels dieses Verfahrens wird das zweite Feld F2 aus dem ersten Feld F1, welches ein Intrafeld ist, vorhergesagt, das dritte Feld F3 wird in ähnlicher Weise aus dem ersten Feld F1 vorhergesagt, und das vierte Feld F4 wird aus dem rekonstruierten zweiten Feld F2 vorhergesagt.
Zuerst wird das erste Feld F1 in dem Feld einer Blockbildung unterworfen und der DCT unterzogen. Sodann wird das erste Feld F1 den Bewertungs- und Schwellwertprozessen unterworfen und quantisiert und danach kodiert. In der lokalen Dekodierschleife 20 werden die quantisierten Signale des ersten Feldes F1 dekodiert oder rekonstruiert. Das rekonstruierte Bild wird in der Bewegungs kompensationsvorhersage für das zweite und dritte Feld F2 und F3 verwendet. Sodann wird die Bewegungskompensationsvorhersage für das zweite Feld F2 unter Verwendung des ersten Feldes F1 durchgeführt. Nachdem der erhaltene Differenzblock der DCT unterzogen wurde, wird eine Kodierung in ähnlicher Weise wie für das erste Feld F1 durchgeführt. In diesem Fall wird, wenn die Wechselstromleistung des Eingangsblocks kleiner als die Leistung des Differenzblock ist, der Eingangsblock anstelle des Differenzblocks der DCT unterzogen, und danach wird die Kodierung in ähnlicher Weise wie bei dem ersten Feld F1 durchgeführt. Das zweite Feld F2 wird in der lokalen Dekodierschleife 20 in Übereinstimmung mit dem Betriebsartsignal jedes Blocks dekodiert und rekonstruiert. und dann in der Bewegungskompensationsvorhersage für das vierte Feld F4 verwendet. In ähnlicher Weise wie bei dem zweiten Feld F2 werden unter Verwendung des ersten Feldes F1 Bewegungskompensationsvorhersage und Kodierung an dem dritten Feld F3 durchgeführt. Die Bewegungskompensationsvorhersage wird an dem vierten F4 unter Verwendung des in dem Bildspeicher 15 rekonstruierten zweiten Feldes F2 durchgeführt, und sodann wird das vierte Feld F4 in ähnlicher Weise wie bei dem dritten Feld F3 kodiert. Auch in dem dritten und vierten Feld F3 und F4 wird, wenn die Wechselstromleistung des Eingangsblocks kleiner als die Leistung des Differenzblocks ist, der Eingangsblock anstelle des Differenzblocks der DCT unterworfen, und danach wird die Kodierung in ähnlicher Weise wie bei dem ersten Feld F1 durchgeführt.
Zum Beispiel wird erwartet, daß der in 1 gezeigte digitale Heim-VTR die hohe Bildqualität und hohe Tonqualität erreicht. Um dies zu realisieren, ist es unabdingbar, die Datenkompression, d. h., die Leistung des Hochleistungskodierers zu verbessern. Daher treten in dem oben beschriebenen herkömmlichen Vorhersageverfahren die nachfolgenden Probleme auf.
In einem solchen Vorhersageverfahren tritt, nachdem die Bewegungskompensationsvorhersage unter Verwendung der Videodaten des einen vorherigen Feldes oder Rahmens durchgeführt wird, ein erstes Problem auf, daß die Kapazität des Feldspeichers oder Rahmenspeichers vergrößert wird und die Hardware in ihrer Größe zunimmt.
In dem herkömmlichen Vorhersageverfahren ist es, wenn ein Szenenwechsel einmal in der Einheit von Rahmen auftritt, schwierig, während des Kodierens des Bildes nach dem Szenenwechsel die Kompression gemäß Bewegungskompensationsvorhersage aus dem Referenzbild, welches vor dem Szenenwechsel erhalten worden war, durchzuführen, wodurch ein zweites Problem hervorgerufen wird, daß die Gesamtmenge der Codes vergrößert wird. Falls eine Zwischenrahmen-Bewegungskompensationsvorhersage insgesamt sequenziell in der Zeitrichtung durchgeführt wird, kann es möglich sein, das Anwachsen der Datenmenge auf ein Minimum zu unterdrücken, auch wenn ein Szenenwechsel eintritt. In dem Fall des Kodierens von Zeilensprungbildern ohne Szenenwechsel und mit wenig Bewegung gibt es allerdings eine Tendenz, daß die Datenmenge insgesamt vergrößert wird. In einem Vorhersageverfahren, in welchem dritte und vierte Felder F3 und F4 gemäß der Darstellung in 5 aus ersten, zweiten und dritten Feldern F1, F2 und F3 angepaßt geschaltet werden, gibt es einen Nachteil, daß die Kapazität des Feldspeichers oder Rahmenspeichers vergrößert wird und die Hardware in ihrer Größe zunimmt. 6 zeigt zum Beispiel die Datenmenge und S/N-Verhältnis eines Luminanzsignals, wenn ein Bild A mit Szenenwechseln durch das Vorhersageverfahren von 4 oder das Vorhersageverfahren von 5 verarbeitet wird. In dem Bild A tritt ein Szenenwechsel in der Einheit von Rahmen ein.
6 zeigt auch die Datenmenge und das S/N-Verhältnis eines Luminanzsignals in dem Fall, daß ein Bild B ohne Szenenwechsel durch das Vorhersageverfahren von 4 oder das Vorhersageverfahren von 5 verarbeitet wird. In diesem Fall ist für das Bild A mit Szenenwechseln das Vorhersageverfahren von 5 vorteilhaft, und für das Bild B ohne Szenenwechsel ist das Vorhersageverfahren von 4 vorteilhaft.
In dem Fall, daß das Kodieren durch Durchführen einer Vorhersage wie in dem Stand der Technik bewerkstelligt wird, gibt es ein drittes Problem, daß, wenn ein Szenenwechsel in einem Schritt eines Bewegungskompensationsvorhersageprozesses auftritt, die Qualität des Bildes unmittelbar nach dem Szenenwechsel verschlechtert wird. Dieses Problem wird hervorgerufen, da wegen des Szenenwechsels eine Bewegungskompensationsvorhersage, welche in umfangreicher Weise Zeitkorrelation verwendet, unzufriedenstellend durchgeführt wird, wodurch die erzeugte Informationsmenge vergrößert wird. Die auf diese Weise erzeugte Informationsmenge ist vergleichbar mit der Informationsmenge eines gewöhnlichen Intrafeldes auf diesem Niveau. Für die erzeugte Informationsmenge wird das Feld, welches diese Informationsmenge aufweist, als das Vorhersagefeld verwendet, und daher wird die Informationsmenge auf das Niveau der Informationsmenge des Vorhersagefeldes komprimiert, mit dem Ergebnis, daß die Bildqualität des Feldes nach einem Szenenwechsel beträchtlich verschlechtert wird. 7 zeigt eine Änderung der Informationsmenge von Bildern für fünf Sekunden, wenn eine Kodierung durch ein herkömmliches Vorhersageverfahren durchgeführt wird. In diesem Fall beträgt der Durchschnitt für fünf Sekunden weniger als 20 [Mbps], aber bei einer Position A liegt ein Szenenwechsel vor, wodurch die Informationsmenge vergrößert wird. Die Änderung des S/N-Verhältnisses in diesem Fall wird in 8 gezeigt. Obwohl keine große Ver schlechterung in dem Abschnitt des Szenenwechsels vorliegt, bewirkt die Abnahme der Informationsmenge, daß sich das S/N-Verhältnis verschlechtert. Wenn dieses Feld in der nächsten Bewegungskompensationsvorhersage verwendet wird, ist es notwendig, eine Bewegungskompensationsvorhersage an dem Bild mit der verschlechterten Bildqualität und der reduzierten Zeitkorrelation durchzuführen, mit dem Ergebnis, daß die erzeugte Informationsmenge wiederum vergrößert wird. Dieser Teufelskreis dauert an, bis das nächste Wiederholfeld verarbeitet wird. Falls eine Verschlechterung der Bildqualität in dieser Weise auftritt, obwohl es unmittelbar nach einem Szenenwechsel geschieht, bedeutet dies, daß eine digitale Videoaufzeichnungs-/Wiedergabevorrichtung, welche eine hohe Bildqualität aufweisen muß, darin versagt, die Leistungsfähigkeit in der besten Weise zu verwenden. Bei einem Heim-VTR, welcher zum Beispiel eine der digitalen Videoaufzeichnungs-/Wiedergabevorrichtungen ist, sind Funktionen wie etwa eine Trickwiedergabe und Editierung bzw. Schnitt unentbehrlich, und wenn eine solche Funktion durchgeführt wird, tritt eine merkliche Verschlechterung der Bildqualität ein.
Als herkömmliche Heim-VTRs vom Schrägspur-Abtastungstyp gibt es VTRs vom VHS-, β- und 8 mm-Typ. Nachfolgend wird ein 8 mm-VTR als ein Beispiel eines Stands der Technik beschrieben. 9 zeigt anhand eines Diagramms das Bandformat gemäß dem 8 mm-VTR-Standard, und 10 zeigt anhand eines Diagramms das Format einer Spur. 11 zeigt anhand eines Diagramms die Beziehung zwischen einer Rotationskopftrommel und einem darum gewundenen Magnetband, und 12 zeigt anhand eines Graphs die Frequenzzuteilung jedes Signals gemäß dem 8 mm-VTR-Standard. In einem 8 mm-VTR für das NTSC-System oder das PAL-System wird ein Videosignal durch ein Farbunterverfahren, welches ein grundlegendes Aufnahmeverfahren für Heim-VTRs ist, aufgezeichnet. Das Luminanzsignal wird mit einem Träger von 4,2 bis 5,4 MHz frequenzmoduliert, der Chrominanzsignal-Hilfsträger wird in ein niederfrequentes Signal von 743 kHz umgewandelt, und die beiden Signale werden der Frequenzmultiplexaufzeichnung unterzogen. Das Aufzeichnungsformat auf einem Band ist wie in 9 gezeigt. Alle für einen VTR benötigten Signale einschließlich wenigstens eines Videosignals (Luminanzsignal, Farbsignal), Audiosignalen und Spurverfolgungssignalen werden durch den rotierenden Videokopf der Mehrfach-Frequenzaufzeichnung unterzogen. Die Frequenzbänder werden in 12 gezeigt.
In 9 sind Magnetspuren 401 und 402 eines Videosignalspurabschnitts 410 Spuren für ein Videosignal, und jede entspricht einem Feld. Magnetspuren 403 und 404, welche in einem Audiosignalspurabschnitt 411 durch schräge Linien gekennzeichnet sind, sind Magnetspuren für Audiosignale. Eine Suchlaufspur 405 und eine Audiospur 406 für einen feststehenden Kopf sind jeweils an beiden Kanten des Bandes festgelegt. Nachdem die Steuerspur an der Bandkante in einem 8 mm-VTR nicht verwendet wird, kann diese Spur als die Suchlauf spur zum Durchführen der Suche nach bestimmten Punkten, Adressieren der Inhalte der Aufnahme oder dergleichen verwendet werden. Die Breite einer Spur (Spurteilung) beträgt 20,5 μm und ist etwas größer als die in dem Spar-Aufnahmemodus des β-Typs und des VHS-Typs (19,5 μm bei β –7, 19,2 μm in dem 6-Stunden-Modus bei VHS). Es wird kein Leitband zum Verhindern des Auftretens eines Kopiereffektes zwischen Spuren festgelegt. Stattdessen wird eine Azimutaufnahme unter Verwendung zweier Köpfe eingesetzt, um den Kopiereffekt zu unterdrücken.
Als nächstes wird ein bestimmtes Beispiel für den Betrieb einer herkömmlichen Vorrichtung unter Bezugnahme auf 13 bis 16 beschrieben. 13 ist ein Blockdiagramm eines herkömmlichen VTR. Ein an einem Videosignaleingangsanschluß 201 gegebenes Videosignal wird in eine Videosignalverarbeitungsschaltung 203 und auch in einen eine Synchronsignaltrennschaltung 204 eingegeben. Das Ausgangssignal der Videosignalverarbeitungsschaltung 203 wird durch Logikgatter 205 und 206 in Addierer 213 und 214 eingespeist. Demgegenüber wird ein vertikales Synchronsignal, welches ein Ausgang der Synchronsignaltrennschaltung 204 ist, in Verzögerungsschaltungen 207 und 208 eingegeben. Der Ausgang Q der Verzögerungsschaltung 207, welche sich mit der Synchronsignaltrennschaltung 204 vereinigt, um eine Kopfschaltimpulserzeugungseinrichtung zu bilden, wird als ein Gatterimpuls an das erste Logikgatter 205 und auch an ein viertes Logikgatter 212, welches weiter unten beschrieben wird, angelegt. Der Ausgang Q wird als ein Gatterimpuls an das zweite Logikgatter 206 und auch an ein drittes Logikgatter 211, welches weiter unten beschrieben wird, angelegt. Das Ausgangssignal der Verzögerungsschaltung 208 wird an eine Zeitbasiskompressionsschaltung 209 und auch an einen Löschstromgenerator 240 angelegt.
Ein an einem Audiosignaleingangsanschluß 202 gegebenes Audiosignal wird durch die Zeitbasiskompressionsschaltung 209, eine Modulierschaltung 210 und einen Schalter 241 zum Umschalten zwischen Aufnahme und Löschung an das dritte und vierte Logikgatter 211 und 212 angelegt. Der Ausgang des Löschstromgenerators 240 wird durch den Schalter 241 an das dritte und vierte Logikgatter 211 und 212 angelegt. Die Ausgangssignale des dritten und vierten Logikgatters 211 und 212 werden jeweils an die Addierer 213 und 214 angelegt. Das Ausgangssignal des Addierers 213 wird durch einen Umschalter 215 zum Umschalten zwischen Aufnahme und Löschung an einen Rotationsumformer 217 gegeben. Das Ausgangssignal des Rotati onsumformers 217 wird durch eine Drehwelle 219 und eine Rotationskopfstange 220 an einen Rotationsmagnetkopf 221 gegeben, so daß ein Aufnahmestrom oder ein Löschstrom in ein Magnetband 223 fließt.
Das Ausgangssignal des Addierers 214 wird durch einen Schalter 216, welcher zum Umschalten zwischen Aufnahme und Löschung verwendet wird und mit dem Schalter 215 fest verbunden ist, an einen Rotationsumformer 218 gegeben. Das Ausgangssignal des Rotationsumformers 218 wird durch die Drehwelle 219 und die Rotationskopfstange 220 an einen anderen Rotationsmagnetkopf 222 gegeben, so daß ein Aufnahmestrom oder ein Löschstrom in das Magnetband 223 fließt. Das Magnetband 223 wird durch Führungspfosten 224 und 225, welche beiderseits einer die eingebauten Rotationsmagnetköpfe 221 und 222 aufweisenden Tischführungstrommel 226 angeordnet sind, geführt und wird durch eine wohlbekannte Magnetbandantriebsvorrichtung (nicht dargestellt), welche aus Capstans und Andruckrollen besteht, mit einer konstanten Geschwindigkeit in Pfeilrichtung 227 angetrieben. Die Tischführungstrommel 226 kann einen wohlbekannten Aufbau besitzen, und daher wird diesbezüglich auf eine spezifische Beschreibung verzichtet.
In dem Wiedergabeverfahren wird ein durch den Rotationsmagnetkopf 221 wiedergegebenes Signal durch die Rotationskopfstange 220, die Drehwelle 219, den Rotationsumformer 217 und den Schalter 216 an eine Trennschaltung 228 angelegt. Andererseits wird ein durch den Rotationsmagnetkopf 222 wiedergegebenes Signal durch die Rotationskopfstange 220, die Drehwelle 219, den Rotationsumformer 218 und den Schalter 216 an eine Trennschaltung 229 angelegt. Einer der Ausgänge der Trennschaltung 228 und einer der Ausgänge der Trennschaltung 229 werden in einen Addierer 230 eingegeben. Der andere Ausgang der Trennschaltung 228 und der andere Ausgang der Trennschaltung 229 werden an einen Addierer 231 angelegt. Das Ausgangssignal des Addierers 230 wird durch eine Videosignalverarbeitungsschaltung 232 an einen Videosignalausgangsanschluß 233 angelegt. Andererseits wird das Ausgangssignal des Addierers 231 durch eine Zeitbasiskorrekturschaltung 234, ein Demodulierschaltung 235 und eine Zeitbasisexpanderschaltung 236 an einen Audiosignalausgangsanschluß 237 angelegt.
Nun wird die Wirkungsweise beschrieben. Ein an dem Videosignaleingangsanschluß 201 gegebenes Videosignal wird durch die Videosignalverarbeitungsschaltung 203 in ein FM-Signal umgewandelt. Wenn das Videosignal ein Chrominanzsignal beinhaltet, wird das Chrominanzsignal in ein Niederfrequenzsignal von weniger als etwa 1,2 MHz umgewandelt. Ein Problem, daß zum Beispiel als Mittel zum Auslöschen eines benachbarten Farbsignals die Phase des Chrominanzsignals um 90 Grad verschoben wird oder alle 1H (horizontales Abtastintervall) invertiert wird, wird es nicht geben. Dies ist eine Technik zum Beseitigen eines Kopiereffektes zwischen Spuren unter Verwendung der Zeilenkorrelation des Chrominanzsignals. Das derart verarbeitete Videosignal wird an das erste und zweite Logikgatter 205 und 206 angelegt.
Nachdem andererseits das Videosignal auch an die Synchronsignaltrennschaltung 204 gegeben wird, wird auf der Seite des Ausgangs des Schaltkreises ein Vertikalsynchronsignal erhalten. Das Vertikalsynchronsignal wird an die Verzögerungsschaltungen 207 und 208 angelegt. Die Verzögerungsschaltung 207 besitzt die Funktionen des Teilens eines Eingangssignals in eine halbe Frequenz und des Verzögerns eines Signals. Von den Ausgängen Q und Q der Verzögerungsschaltung 207 werden Impulssignale Q und Q (vgl. 14(b) und 14(c)) zum Umschalten der Köpfe an das erste bzw. zweite Logikgatter 205 bzw. 206 angelegt.
Um die Phasenbeziehung zwischen diesen Impulssignalen Q und Qund dem eingegebenen Videosignal zu klären, ist die Wellenform des eingegebenen Videosignals in 14(a) gezeigt. Von den Ausgängen des ersten und zweiten Logikgatters 205 und 206 werden die verarbeiteten Videosignale gemäß der Darstellung in 15(a) und 15(b) während der Perioden, in welchen sich die Impulssignale Q und Q auf einem Pegel H befinden, ausgegeben. Diese Signale werden einem modulierten komprimierten Audiosignal und Löschsignal, welche später beschrieben werden, durch Addierer 213 und 214 hinzugefügt und dann an Schalter 215 und 216 angelegt. Das komprimierte Audiosignal wird durch die Modulierschaltung 210 einer für das Band- und Kopfsystem geeigneten Modulation (vorzugsweise Impulscodemodulation (PCM), FM, PM, AM oder dergleichen, oder in bestimmten Fällen AC-Vormagnetisierungsaufnahme ohne Modulation) unterzogen. Insbesondere PCM ist vorteilhaft, da ein hohes S/N-Verhältnis erwartet werden kann und wohlbekannte Fehlerkorrekturmittel für Signalausfall (drop-out) etc. verwendet werden können. Das modulierte komprimierte Audiosignal wird durch den Schalter 241 an das dritte und vierte Logikgatter 211 und 212, an welche die Impulssignale Q und Q jeweils angelegt werden, gegeben. Diese Logikgatter 211 und 212 geben das komprimierte Audiosignal an die Addierer 213 und 214 während der Perioden, in welchen sich die Impulssignale Q und Qauf dem Pegel H befinden, aus.
Der Löschstromgenerator 240 erzeugt einen Löschstrom einer bestimmten Frequenz (zum Beispiel 100 kHz). Die Zeitabstimmung des Beginns der Oszillation des Löschstroms wird durch ein Triggersignal T, welches durch Verzögern des Vertikalsynchronsignals in der Verzögerungsschaltung 208 erhalten wird, gesteuert. Der Löschstrom wird durch den Schalter 241 an das dritte und vierte Logikgatter 211 und 212, an welche die Impulssignale Q und Q jeweils angelegt werden, ausgegeben und an die Addierer 213 und 214 angelegt. In gleicher Weise wie die Aufzeichnung komprimierter Audiosignale werden Löschsignale während der Perioden, in welchen sich Impulssignale Q und Q auf dem Pegel H befinden, durch die Logikgatter 211 und 212 ausgegeben. 16(a) und 16(b) zeigen die Wellenformen der Ausgangsströme der Addierer 213 und 214, d. h., zeitgemultiplexter Signale eines verarbeiteten Videosignals A und eines verarbeiteten Audiosignals B oder des Löschsignals. Diese Signale werden über die oben genannten Wege an die Rotationsmagnetköpfe 221 und 222 angelegt, wodurch das magnetische Muster eines in 9 gezeigten Bandes erzielt wird.
Während des Wiedergabeprozesses werden die beweglichen Kontakte der Schalter 215 und 216 an feststehenden Kontakten P positioniert. Dies erlaubt es, das durch die Rotationsmagnetköpfe 221 und 222 wiedergegebene Zweikanal-Wiedergabesignal jeweils durch die Rotationskopfstange 220, die Drehwelle 219, die Rotationsumformer 217 oder 218 und die Schalter 215 oder 216 zu übertragen und in Trennschaltungen 228 und 229 auf der Zeitbasis jeweils in ein Videosignal und ein Audiosignal zu trennen. Die getrennten Videosignale werden durch den Addierer 230 in ein zeitlich kontinuierliches Einkanal-Videosignal umgewandelt und dann an die Videosignalverarbeitungsschaltung 232 angelegt. Die Videosignalverarbeitungsschaltung 232 rekonstruiert das ursprüngliche Videosignal aus dem Eingangssignal und gibt das rekonstruierte Signal an den Videosignalausgangsanschluß 233 aus. Andererseits werden die getrennten Audiosignale durch den Addierer 231 in einen einzigen Signalkanal umgewandelt und dann in die Zeitbasiskorrekturschaltung 234 angelegt. Die Zeitbasiskorrekturschaltung 234 besteht aus einer Halbleiterspeichervorrichtung wie etwa einem CCD (Ladungskopplungsspeicher) oder einem BBD (Eimerkettenspeicher) und eliminiert eine Zeitbasisvariationen (sogenannter Jitter und Bitversatz) des Band- und Kopfsystems. Das Ausgangssignal der Zeitbasiskorrekturschaltung 234 wird durch die Demodulierschaltung 235 auf das ursprüngliche komprimierte Audiosignal demoduliert. Das demodulierte Signal wird dann durch die Zeitbasisexpanderschaltung 236, welche aus einer Halbleiterspeichereinrichtung etwa einem CCD oder einem BBD besteht, in das ursprüngliche Audiosignal umgewandelt und an den Audiosignalausgangsanschluß 237 ausgegeben.
Wie oben beschrieben, werden in einem 8 mm-VTR Videosignale und Audiosignale für ein Feld auf einer Spur eines Bandes aufgezeichnet und von dieser wiedergegeben.
17 ist ein Blockdiagramm, welches die Konfiguration einer herkömmlichen Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt. In 17 wird ein digitaler VTR des Verfahrens D1 oder D2 gezeigt, welcher für kommerzielle Zwecke oder den Einsatz im Sendebetrieb verwendet wird wird. Die Bezugsziffer 101 bezeichnet einen A/D-Wandler, welcher ein analoges Videosignal in ein digitales Videosignal umwandelt, 102 bezeichnet einen Fehlerkorrekturkodierer, welcher Fehlerkorrekturcodes hinzufügt, 103 bezeichnet einen Modulator, welcher das Digitalsignal zu einem für die Aufzeichnung auf einem Magnetband geeigneten Signal moduliert, 104 bezeichnet eine Rotationskopftrommel, 105 bezeichnet ein Magnetband, 106 bezeichnet einen Magnetkopf für Aufnahme und Wiedergabe, 107 bezeichnet einen Demodulator, welcher das wiedergegebene Signal demoduliert, 108 bezeichnet einen Fehlerkorrekturdekodierer, welcher einen Übertragungsfehler erfaßt und korrigiert, und 109 bezeichnet einen D/A-Wandler, welcher das digitale Videosignal in analoge Videosignale umwandelt.
18 zeigt die Bandformate der zwei Verfahren. In beiden Verfahren werden ein Videosignal und ein 4-Kanal-Audiosignal an verschiedenen Positionen in der gleichen Spur aufgezeichnet. In dem Verfahren D1 wird ein Audiosignal in der Mitte einer Spur aufgezeichnet, und in dem Verfahren D2 an den Enden einer Spur. Wenn ein Videosignal und ein Audiosignal in der gleichen Spur aufgezeichnet werden, können Komponenten wie etwa ein Magnetkopf und eine Verstärkerschaltung, welche zur Aufzeichnung und Wiedergabe notwendig sind, gemeinsam für ein Videosignal und ein Audiosignal verwendet werden, und des weiteren können ein Paritätscode, welcher für die später beschriebene Fehlerkorrektur benötigt wird, und eine Schaltung zum Erzeugen des Paritätscodes gemeinsam verwendet werden.
19 zeigt die Gesamtspezifikationen der Verfahren D1 und D2, 20 zeigt die Spezifikationen der Bandformate, und 21 zeigt die Spezifikationen der Bandantriebssysteme. Die berücksichtigte Flächenaufnahmedichte mit Leitbändern beträgt 21,5 μm²/bit in dem Verfahren D1, und 16,6 μm²/bit in dem Verfahren D2. In dem Verfahren D1 werden Leitbänder zwischen Aufnahmespuren festgelegt, doch in dem Verfahren D2 gibt es keine Leitbänder. Daher ist die Spurdichte des Verfahrens D2 um etwa 15 % höher als die des Verfahrens D1, was einen Beitrag zur Langzeitaufnahme durch das Verfahren D2 leistet. Wenn es andererseits keine Leitbänder gibt, ist es eher wahrscheinlich, zusätzlich zu einem Signal der ursprünglich zur Wiedergabe vorgesehenen Spur ein Signal einer Nachbarspur wiederzugeben. Um mit diesem Kopiereffekt zwischen Spuren in dem Wiedergabeprozeß fertig zu werden, verwendet das Verfahren D2 das Azimutaufnahmesystem. Im allgemeinen werden ein Aufnahmemagnetkopf und ein Wiedergabemagnetkopf so positioniert, daß ihre Kopfspalte gleiche Winkel mit einer Magnetspur ausbilden. Falls die zwei Kopfspalte so angeordnet sind, daß sie einen Winkel miteinander bilden, zeigt der Pegel eines wiedergegebenen Signals eine Dämpfungscharakteristik. Der Azimutwinkel θ in dem Verfahren D2 beträgt ungefähr ±15 Grad, wie in 20 gezeigt. Daher wird, auch wenn ein Signal von einer Nachbarspur in wiederzugeben Signale gemischt wird, die unnötige Komponente abgeschwächt. Demgemäß wird, auch wenn keine Leitbänder existieren, die Wirkung des Kopiereffekts reduziert. Nachdem allerdings der Verlust aufgrund des Azimutwinkels für DC-Komponenten nicht erwartet werden kann, dürfen aufzuzeichnende Signale keine DC-Komponenten aufweisen. Daher verwendet das Verfahren D2 ein Modulationssystem, welches keine DC-Komponenten beinhaltet.
Bei einer Digitalaufnahme ist es nicht notwendig, ein Videosignal während der gesamten Zeitdauer aufzuzeichnen. In einer Austastlücke besitzt ein Videosignal eine konstante Wellenform ohne Rücksicht auf die Inhalte eines Bildes. Nachdem diese Wellenform nach der Wiedergabe synthetisiert werden kann, wird sowohl im Verfahren D1 als auch D2 die Aufzeichnung nur während der effektiven Videozeitdauer durchgeführt. Auch ein Farbsynchronsignal, welches in einer Austastlücke eines NTSC-Signals auftaucht, kann nach der Wiedergabe synthetisiert werden. Dies kommt daher, daß die Abtastphase in dem Verfahren D2 auf die I- und Q-Achse festgelegt wird und die Phase des Farbsynchronsignals (der Q-Achse um (180+33) Grad nacheilend) unter Verwendung eines wiedergegebenen Abtasttakts bestimmt werden kann.
22 zeigt die Bereiche, in welchen Pixel in den Verfahren D1 und D2 tatsächlich aufgezeichnet werden können. Diese effektiven Pixel werden in mehrere Segmente geteilt. In dem Verfahren D1 bilden Pixel von 50 Abtastzeilen ein Segment, und in dem Verfahren D2 bilden Pixel von 85 Abtastzeilen ein Segment. Anders gesagt, Pixel eines Feldes bilden fünf Segmente in dem Verfahren D1 und drei Segmente in dem Verfahren D2.
Wenn ein Videosignal in einem Segment aufzuzeichnen ist, wird es in dem Verfahren D1 in vier Kanäle und in dem Verfahren D2 in zwei Kanäle geteilt. Daher beträgt die Anzahl von Pixel je Kanal eines Segments in dem Verfahren D1 {(720 + 360 × 2)/4} × 50 = 360 × 50 = 18.000 und in dem Verfahren D2 (768/2) × 85 = 384 × 85 = 32.640. Kanäle werden so zugeteilt, daß sie gleichmäßig auf einem Bildschirm verteilt sind. Demgemäß werden, auch wenn die Eigenschaften eines bestimmten Kanals verschlechtert werden, durch diese Verschlechterung hervorgerufene Codefehler nicht in einem einzigen Abschnitt des Bildschirms konzentriert, so daß sie unauffällig bleiben. Daher ist die Wirkung der Korrektur an Fehlern, welche nicht korrigiert worden sind, auch enorm.
Sowohl in dem Verfahren D1 als auch D2 werden zwei Arten von Fehlerkorrekturcodes, welche jeweils ein äußerer Code und ein innerer Code genannt werden, zusammen verwendet. In einem tatsächlichen Prozeß zum Erzeugen innerer und äußerer Codes wird ein Arbeitsgang einer Neuordnung der Sequenz des Codes durchgeführt. Dieser Arbeitsgang wird Shuffling genannt. Das Shuffling zerstreut die Auswirkung von Codefehlern, verbessert das Korrekturvermögen und reduziert die Anzeigeverschlechterung, welche durch unkorrigierte Fehler hervorgerufen werden. Das Shuffling-Verfahren besteht aus dem Shuffling für eine Abtastlinie, welche vor der Erzeugung eines äußeren Codes durchgeführt wird, und dem Shuffling, welches in einem Sektor nach dem Hinzufügen eines äußeren Codes und vor der Erzeugung eines inneren Codes durchgeführt wird. Wie oben beschrieben, werden in einem VTR nach dem Verfahren D1 oder D2 Videosignale und Audiosignale für ein Feld in eine Mehrzahl von Spuren auf einem Band aufgezeichnet.
Um alle Information von Standard-Fernsehsignalen der derzeit verwendeten NTSC- und PAL-Systeme aufzuzeichnen, wird bei einem Heim-VTR die Trägerfrequenz eines FM-Luminanzsignal angehoben, und die Bandbreite und Abweichung werden vergrößert, um die Auflösung und das C/N-Verhältnis zu verbessern. Allerdings ist es einem Heim-VTR noch immer nicht möglich, in S/N-Verhältnis, Wellenform-Reproduzierbarkeit, etc. mit einem VTR für kommerzielle Anwendungen gleichzuziehen. Es wird erwartet, die Größenminimierung eines VTR zu erreichen, und es gibt die Forderung nach weiteren Leistungsverbesserungen als auch der Verwirklichung eines VTR, welcher leicht und kompakt ist. Daher ist es schwierig, die erforderliche Leistung nur durch Verbessern der vorliegenden Techniken zu erreichen. Andererseits wurden in dem Bereich von VTRs für kommerzielle Anwendungen und Einsatz im Sendebetrieb schnelle Fortschritte in Digitalisierung einer Vorrichtung gemacht, so daß mehrfache Funktionen und hohe Leistung in den Vorrichtungen erreicht werden, und die meisten VTRs für den Einsatz im Sendebetrieb werden durch digitale VTRs ersetzt. Allerdings verbraucht ein digitaler VTR eine große Menge an Band, was ein Hindernis für das Erreichen einer Verlängerung der Aufzeichungsdauer und der Größenminimierung ist.
In der letzten Zeit wurden in Anbetracht der Redundanz der in einem Bild enthaltenen Information aktiv Studien über die Kompression aufgezeichneter Information durchgeführt, und die Anwendung der Ergebnisse dieser Studien auf einen VTR wird geprüft. Es wird erwartet, einen VTR zu verwirklichen, welcher kompakt und leicht ist, eine hohe Bildqualität aufweist und für eine lange Zeitdauer betrieben werden kann, während gleichzeitig auf grund einer Aufnahme hoher Dichte und einer Informationskompression, welche der Digitalaufnahme inhärent sind, eine hohe Bildqualität und eine Verminderung des Bandverbrauchs erreicht wird.
23 zeigt eine Kommunikationsvorrichtung eines Hochleistungs-Kompressionsverfahrens für kodierte Videoinformation (gemäß CCITT H. 261, etc.), welche in dem Gebiet der Kommunikation einschließlich eines Bildtelefons und einer Videokonferenz verwendet wird. Die Bezugsziffer 101 bezeichnet einen A/D-Wandler, welcher ein analoges Videosignal in ein digitales Videosignal umwandelt, 110 bezeichnet einen Hochleistungs-Codekodierer, welcher ein Videosignal kompressionskodiert, 112 bezeichnet einen Pufferspeicher, welcher zum Verteilen erzeugter komprimierter Codes bei einer konstanten Geschwindigkeit verwendet wird, 102 bezeichnet einen Fehlerkorrekturkodierer, welcher Fehlerkorrekturcodes hinzufügt, 103 bezeichnet einen Modulator, welcher das Digitalsignal zu einem für die Kommunikation geeigneten Übertragungssignal moduliert, 114 bezeichnet einen Übertragungsweg, 107 bezeichnet einen Demodulator, welcher ein empfangenes Signal in ein Digitalsignal demoduliert, 108 bezeichnet einen Fehlerkorrekturdekodierer, welcher einen Übertragungsfehler erfaßt und korrigiert, 113 bezeichnet einen Pufferspeicher, welcher zum Zuführen von komprimierten Codes, welche bei einer konstanten Geschwindigkeit erhalten worden sind, in Übereinstimmung mit der Anforderung von der nächsten Stufe verwendet wird, 111 bezeichnet einen Hochleistungs-Codedekodierer, welcher das komprimierte Videosignal in das Originalsignal expandiert, und 109 bezeichnet einen D/A-Wandler, welcher das digitale Videosignal in ein analoges Videosignal umwandelt.
Die Redundanz eines eingegebenen Videosignals variiert immer, und daher variiert auch die Menge von Codes, welche unter Verwendung dieser Redundanz kompressionskodiert werden. Allerdings ist die Menge an Information, welche durch den Übertragungsweg 114 übertragen werden kann, begrenzt. Um die Leistungsfähigkeit bestmöglich zu nutzen, wird die Variation der Codemenge unter Verwendung des Pufferspeichers 113 gepuffert, und die Informationsmenge wird gesteuert, um innerhalb eines vorbestimmten Bereichs zu liegen, so daß Überlauf oder Unterlauf eines Speichers nicht auftritt. 24 zeigt den Betrieb des Puffers, welcher auf der Empfangsseite durchgeführt wird. Daten, welche mit einer konstanten Rate empfangen worden sind, werden in dem Pufferspeicher gespeichert, and wenn die Datenmenge das Niveau B0 erreicht, beginnt das Dekodieren der Codes. Zu dem Zeitpunkt, zu dem Daten von d1 für die Anzeige des ersten Bildes verbraucht worden sind und das Dekodieren des zweiten Bild beginnt, ist die Menge der aufgespeicherten Daten B1. In gleicher Weise werden Datenaufspeicherung und Datenverbrauch abwechselnd wiederholt. Die Menge der verbrauchten Daten variiert abhängig von dem angezeigten Bild, aber die durchschnittliche Menge an verbrauchten Daten ist gleich der Empfangsrate. Der Betrieb der Empfangsseite wurde beschrieben. Der Betrieb der Sendeseite wird auf dem genau umgekehrten Weg wie der der Empfangsseite durchgeführt.
Nachdem die Kommunikationsvorrichtung wie oben beschrieben gesteuert wird, ist die Beziehung zwischen Feldern eines eingegebenen Videosignals und übertragen Codes nicht klar definiert. Anders als eine Anwendung auf dem Gebiet der Kommunikation muß ein VTR für einen VTR typische und eine spezielle, von normaler Wiedergabe unterschiedliche Wiedergabe wie etwa eine Standbildwiedergabe, langsame Wiedergabe und schnelle Wiedergabe, Zusammenschnitt und Einfügeschnitt umfassende Funktionen durchführen. Daher ist es wünschenswert, die Beziehung zwischen Feldern und Spuren klar zu definieren. Um einen VTR in der Praxis herzustellen, ist es wesentlich, ein Aufnahmeformat auszuwählen, welches diese Probleme lösen kann.
Als ein Verfahren zum Komprimieren eines bewegten Bildes wie etwa eines Fernsehsignals gibt es ein Verfahren unter Verwendung eines Intrafeldes (oder Intrarahmens), in welchem das Kodieren innerhalb eines individuellen Feldes (oder Rahmens) unabhängig von einem anderen Feld (oder Rahmen), und eines Vorhersagefeldes (oder Vorhersagerahmens), in welchem die Vorhersagekodierung unter Verwendung der Information eines anderen Feldes (oder Rahmens) durchgeführt wird, fertiggestellt wird. Im Allgemeinen ist die Informationsmenge des Intrafeldes (oder Intrarahmens), in welchem die Vorhersage zwischen Feldern (oder Rahmen) nicht verwendet wird, ein Zwei- oder ein Mehrfaches der Codemenge des Vorhersagefeldes (oder Vorhersagerahmens), in welchem die Kodierung unter Verwendung der Vorhersage zwischen Ebenen durchgeführt wird. Wenn Aufnahmegebiete gleicher Größe (Anzahl von Spuren) dem Intrafeld (oder Intrarahmen) und dem Vorhersagefeld (oder Vorhersagerahmen) zugeteilt werden, tritt daher ein viertes Problem auf, daß in dem Intrafeld (oder Intrarahmen) das Aufnahmegebiet nicht ausreichend ist und das Aufnahmegebiet in dem Vorhersagefeld (oder Vorhersagerahmen) einen nutzlosen Anteil aufweist.
US-A-4 651 206 offenbart eine Anordnung zum Kodieren von Fernsehvideodaten durch Erzeugen von Bewegungsvektoren, die in dem Fernsehsignal enthaltene Bewegungen repräsentieren, und in Reaktion hierauf eines Vorhersagefehlersignals, welches Abweichungen von Rahmen zu Rahmen in dem Fernsehsignal angibt. DE-3831277-A beschreibt die Verwendung eines Hybridkodierers, welcher unter Verwendung des Zwischenrahmenprinzips, das die Korrelation zwischen aufeinanderfolgenden Videorahmen verwendet, und des Zwischenrahmenprinzips, bei welchem die Korrelation der Videodaten innerhalb eines Videorahmens eingesetzt wird, arbeitet. Auf Übertragung eines durch den Kodierer bereitgestellten Signals werden die durch das Zwischenrahmenprinzip kodierten Rahmenextrakte durch vorherige oder nachfolgende Kodewörter charakterisiert. EP-A-0 267 581 offenbart eine Anordnung zum Kodieren sich bewegender Bildsignale, bei welchem eine Zwischenrahmenkorrelation verwendet wird, um ein Vorhersagefehlersignal für jeden Block eines Bildrahmens zu erzeugen, und das Vorhersagefehlersignal evaluiert wird, um zu bestimmen, ob der Block gemäß dem Vorhersagefehlersignal kodiert werden sollte. Wenn dies der Fall ist, wird das vorhergesagte Fehlersignal quantisiert und übertragen. EP-A-0 353 758 beschreibt ein digitales Videobandaufzeichnungsgerät, bei welchem Videofelder in einem ganzzahligen Vielfachen von Aufzeichnungssegmenten oder Spuren aufgezeichnet werden.
KURZFASSUNG DER ERFINDUNG
Gesichtspunkte der Erfindung werden in den begleitenden Ansprüchen dargelegt.
In einer Videoinformations-Aufzeichnungs/Wiedergabevorrichtung gemäß einer bevorzugten Ausführungsform der Erfindung werden Eingangssignale von n Feldern (oder n Rahmen) in einen Aufzeichnungseinheitsblock gesammelt und in Spuren einer vorbestimmten Anzahl, welche aus der Menge der aufzuzeichnenden Information und der Aufnahmekapazität einer Spur berechnet wird, aufgezeichnet. Die Kompressionskodierung wird an Blöcken durchgeführt, welche in die Aufzeichnungseinheit in einer Art und Weise gesammelt werden, daß wenigstens ein Intrafeld (oder Intrarahmen) in der Einheit enthalten ist. Eingegebene Fernsehsignale von n Feldern (oder n Rahmen) werden als ein Aufzeichnungseinheitsblock der Kompressionskodierung durch einen Hochleistungskodierer unterzogen. Die kompressionskodierten Fernsehsignale von n Feldern (oder n Rahmen) werden geteilt, um in Aufzeichnungsgebieten von m Spuren aufgezeichnet zu werden. Die wiedergegeben Signale von m Spuren werden durch einen Hochleistungsdekodierer in Fernsehsignale von n Feldern (oder n Rahmen) zurückverwandelt.
Die oben genannten und weitere Merkmale der Erfindung werdem aus der nachfolgenden ausführlichen Beschreibung mit den begleitenden Zeichnungen vollständiger offenbar.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 ist ein Blockdiagramm, welches die Konfiguration eines digitalen VTR zeigt;
2 ist ein Blockdiagramm, welches die Konfiguration einer herkömmlichen Bewegungskompensationsvorhersageverarbeitungsvorrichtung zeigt;
3 zeigt den Ablauf einer Blockauswahl in der herkömmlich Bewegungskompensationsvorhersageverarbeitungsvorrichtung;
4 zeigt anhand eines Diagramms die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß;
5 zeigt anhand eines Diagramms die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß;
6 zeigt Codemengen und S/N-Verhältnisse in herkömmlicher Bewegungskompensationsvorhersage;
7 zeigt die Änderung der Informationsmenge für fünf Sekunden, falls ein Referenzbild nicht geschaltet wird;
8 zeigt die Variation des S/N-Verhältnisses für fünf Sekunden in dem Fall, daß ein Referenzbild nicht geschaltet wird;
9 zeigt anhand eines Diagramms das Bandformat gemäß dem 8 mm-VTR-Standard;
10 zeigt anhand eines Diagramms das Format einer Spur gemäß dem 8 mm-VTR-Standard;
11 zeigt anhand eines Diagramms die Beziehung zwischen einer Rotationskopftrommel und einem darum gewundenen Magnetband, welche in einem 8 mm-VTR verwendet werden;
12 zeigt anhand eines Graphs die Frequenzzuteilung jedes Signals in dem 8 mm-VTR-Standard;
13 ist ein Blockdiagramm, welches die Konfiguratin einer herkömmlichen Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt;
14 ist eine Zeittafel, welche die Phasenbeziehung zwischen Impulssignalen zum Schalten eines Kopfes und eingegebenen Videosignalen in der Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation nach 13 zeigt;
15 ist eine Wellenformtafel, welche Videosignale zeigt, die durch Logikgatter in der Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation nach 13 verarbeitet werden;
16 ist eine Wellenformtafel, welche auf zeitlicher Basis gemultiplexte Signale in der Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation nach 13 zeigt;
17 ist ein Blockdiagramm, welches die Konfiguration einer anderen herkömmlichen Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation zeigt;
18 zeigt anhand eines Diagramms die Bandformate von VTRs nach den Verfahren D1 und D2;
19 zeigt die Gesamtspezifikationen von VTRs nach den Verfahren D1 und D2;
20 zeigt die Spezifikationen der Bandformate von VTRs nach den Verfahren D1 und D2;
21 zeigt die Spezifikationen der Bandantriebssysteme von VTRs nach den Verfahren D1 und D2;
22 zeigt anhand eines Diagramms die durch VTRs nach den Verfahren D1 und D2 aufgezeichneten Pixelbereiche;
23 ist ein Blockdiagramm, welche die Konfiguration einer Kommunikationsvorrichtung eines Hochleistungskompressionsverfahrens für Videoinformation zeigt;
24 illustriert die Wirkungsweise des Puffers der Hochleistungscodekommunikationsvorrichtung;
25 ist ein Blockdiagramm, welches die Konfiguration eines Hochleistungskodierers zeigt, der in der Vorrichtung gemäß der Erfindung verwendet werden kann;
26 ist ein Diagramm, welches die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
27 ist ein Diagramm, welches die Konfiguration eines anderen Hochleistungskodierers zeigt;
28 ist ein Diagramm, welches die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
29 zeigt Simulationsergebnisse, die in dem Fall erhalten werden, daß ein Szenenwechsel vorhanden ist;
30 zeigt Simulationsergebnisse, die in dem Fall erhalten werden, daß kein Szenenwechsel vorhanden ist;
31 ist ein Blockdiagramm, welches die Konfiguration eines weiteren Hochleistungskodierers zeigt;
32 ist ein Flußdiagramm der Betriebsweise des Hochleistungskodierers von 31;
33 ist ein Flußdiagramm eines Intrafeld-Prozesses in 32;
34 ist ein Flußdiagramm eines Vorhersagefeldprozesses in 32;
35 zeigt die Änderung der Informationsmenge für fünf Sekunden in dem Fall, daß ein Referenzbild umgeschaltet wird;
36 zeigt die Veränderung des Rauschabstands für fünf Sekunden in dem Fall, daß ein Referenzbild umgeschaltet wird;
37 ist ein Flußdiagramm eines anderen Vorhersagefeldprozesses in 32;
38 ist ein Flußdiagramm eines weiteren Vorhersagefeldprozesses in 32;
39 ist ein Flußdiagramm eines Referenzbildumschaltbeurteilungsprozesses in 38;
40 ist ein Blockdiagramm, welches die Konfiguration eines noch weiteren Hochleistungskodierers zeigt;
41 zeigt den Vorgang eines Auswählens von Blöcken in dem Hochleistungskodierer von 40;
42 ist ein Diagramm, welches ein Umschalten zwischen einem Referenzbild und einem Intrabild in dem Hochleistungskodierers von 40 zeigt;
43 ist ein Flußdiagramm einer Betriebsweise des Hochleistungskodierer von 40;
44 ist ein Flußdiagramm eines Vorhersagefeldprozesses in 43;
45 ist ein Diagramm, welches ein anderes Umschalten zwischen einem Referenzbild und einem Intrabild in dem Hochleistungskodierers von 40 zeigt;
46 ist ein Flußdiagramm eines anderen Vorgangs des Hochleistungskodierers von 40;
47 ist ein Diagramm, welches die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
48 ist ein Diagramm, welches die Beziehung zwischen Feldern in einem Bewegungskompensationsvorhersageprozeß zeigt;
49 ist ein Diagramm, welches das Umschalten eines Referenzbildes zeigt;
50 ist ein Blockdiagramm, welches die Konfiguration einer Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation gemäß der Erfindung zeigt;
51 ist ein Diagramm, welches ein Beispiel für das von der Vorrichtung von 50 produzierte Bandformat gemäß der Erfindung zeigt;
52 ist ein Blockdiagramm, welches die interne Konfiguration des Hochleistungskodierers der in 50 gezeigten Vorrichtung zeigt;
53 zeigt anhand eines Graphs ein Beispiel für die Variation der Menge der für jeden Rahmen erzeugten Daten; und
54 ist ein Diagramm, welches die Beziehung zwischen in jedem Feld aufgezeichneter Information und dem Schreiben in Spuren gemäß der Erfindung illustriert.
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
Zuerst werden verschiedene Ausführungsformen von Kodierern für eine Aufzeichnungsvorichtung beschrieben werden.
Ausführungsform 1
Nachstehend wird eine erste Ausführungsform mit Bezug auf 25 beschrieben werden. In 25 bezeichnet 1 einen Eingangsanschluß für ein digitales Videosignal, 2 bezeichnet eine Blockbildungsschaltung, welche ein durch den Digital-Videosignal-Eingangsanschluß 1 eingegebenens digitales Videosignal in Blöcke bringt, 30 bezeichnet eine Bewegungskompensationsvorhersageschaltung, welche zwischen dem von der Blockbildungsschaltung 2 ausgegebenen Block und einem Intrafeld eine Bewegungskompensationsvorhersage durchführt und ein Differenzsignal zwischen einem Eingabeblock und einem Vorhersageblock ausgibt, 31 bezeichnet ein Bestimmungsglied, welches das eine mit der kleineren Summe von Absolutwerten von dem Eingangssignal aus der Blockbildungsschaltung 2 und einem Vorhersagedifferenzsignal aus der Bewegungskompensationsvorhersageschaltung 30 auswählt, 32 bezeichnet einen ersten Schalter, welche von der Blockbildungsschaltung 2 und dem Bestimmungsglied 31 ausgegebene Blöcke in Abhängigkeit von der bestimmten Betriebsart selektiv ausgibt, 33 bezeichnet eine Orthogonaltransformationsschaltung, welche die Orthogonaltransformation an einem von dem ersten Schalter 32 ausgegebenen kodierten Block ausführt, 34 bezeichnet eine Quantisierungsschaltung 34, welche den Ausgang der Orthogonaltransformationsschaltung 33 quantisiert, 11 ist ein Übertragungsweg. 35 bezeichnet einen zweiten Schalter, welcher die von der Quantisierungsschaltung 34 ausgegebenen Quantisierungsergebnisse nur in dem Fall eines Intrafeldes auswählt und ausgibt, 36 bezeichnet eine Umkehrquantisierungsschaltung, welche den Ausgang des zweiten Schalters 35 invers quantisiert, 37 bezeichnet eine Umkehrorthogonaltransformationsschaltung, welche eine umgekehrte Orthogonaltransformation an dem Ausgang der Umkehrquantisierungsschaltung 36 ausführt, und 38 bezeichnet einen Videospeicher, welcher ein Feld des wiedergegebenen Bildes eines von der Umkehrorthogonaltransformationsschaltung 37 ausgegebenen Intrafeldes speichert und ein Referenzbild in einem Suchbereich des Vorhersagefeldes an die Bewegungskompensationsvorhersageschaltung 30 ausgibt.
Als ein in einem solchen Schaltungblock verwendetes Vorhersageverfahren kann zu Beispiel das in 26 gezeigte Verfahren eingesetzt werden. In diesem Verfahren wird alle vier Felder ein Intrafeld eingefügt, und die drei Felder dazwischen bilden Vorhersagefelder. In 26 ist ein erstes Feld F1 ein Intrafeld, und ein zweites, drittes und viertes Feld F2, F3 und F4 sind Vorhersagefelder. In diesem Verfahren werden das zweite, dritte und vierte Feld F2, F3 und F4 aus dem ersten Feld F1 vorhergesagt. Zuerst wird das erste Feld F1, welches ein Intrafeld ist, in dem Feld einer Blockbildung unterworfen, und unter Ausführung der Orthogonaltransformation wird der Block quantisiert und dann kodiert. In der lokalen Dekodierungsschleife werden die quantisierten Signale des ersten Feldes F1 dekodiert und rekonstruiert. Das rekonstruierte Bild wird in der Bewegungskompensationsvorhersage für das zweite, dritte und vierte Feld F2, F3 und F4 verwendet. Dann wird eine Bewegungskompensationsvorhersage an dem zweiten Feld F2 unter Verwendung des ersten Feldes F1 durchgeführt. Nachdem eine Orthogonaltransformation an den erhaltenen Differenzblöcken durchgeführt ist, wird in einer änlichen Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt. In diesem Fall wird, wenn die Summe der Absolutwerte der eingegebenen Blöcke kleiner als die der Differenzblöcke ist, eine Orthogonaltransformation an den eingegebenen Blöcken an stelle der Differenzblöcke ausgeführt, und danach wird in einer ähnlichen Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt. In einer ähnlichen Weise wie bei dem zweiten Feld F2 werden unter Verwendung des ersten Feldes F1 auch das dritte und vierte Feld F3 und F4 einer Bewegungskompensationsvorhersageverarbeitung unterzogen und kodiert. Auch bei dem dritten und vierten Feld F3 und F4 wird, wenn die Summe von Absolutwerten der Wechselstromleistungen der Eingabeblöcke kleiner als die der Differenzblöcke ist, eine Orthogonaltransformation an den Eingabeblöcken anstelle der Differenzblöcke ausgeführt, und danach wird in einer ähnlichen Weise wie bei dem ersten Feld F1 eine Kodierung durchgeführt.
Nun wird die Betriebsweise beschreiben werden. Ungeachtet des Feldes (ein Intrafeld oder ein Vorhersagefeld) werden durch den Digital-Videosignal-Eingangsanschluß 1 eingegebene digitale Videosignale durch die Blockbildungsschaltung 2 in der Einheit von beispielsweise 8 Pixeln × 8 Zeilen einer Blockbildung unterworfen. Die Bewegungskompensationsvorhersageschaltung 30 führt an Eingabeblöcken, die von der Blockbildungsschaltung 2 ausgegeben werden, in dem Fall eines Vorhersagefeldes ein Bewegungskompensationsvorhersage durch, während die wiedergegebenen Videodaten eines in dem Videospeicher 38 gespeicherten Intrafeldes als ein Referenzbild verwendet werden. die Bewegungskompensationsvorhersageschaltung 30 führt unter Festlegung des Suchbereichs einer Bewegungsschätzung zu beispielsweise 10 Pixeln × 16 Zeilen eine Bewegungsschätzung durch, um einen Bewegungsvektor zu erhalten, und erhält ferner das Differenzsignal zwischen dem Referenzbild und dem Eingabebild in Übereinstimmung mit dem in der Bewegungschätzung erhaltenen Bewegungsvektor. Das Differenzsignal wird zusammen mit dem Bewegungsvektor an das Bestimmungsglied 31 ausgegeben. Das Bestimmungsglied 31 erhält die Summe von Absolutwerten von Kom ponenten von jedem der von der Blockbildungsschaltung 2 ausgegebenen Eingabeblöcke und der von der Bewegungskompensationsvorhersageschaltung 30 ausgegebenen Differenzblöcke. Wenn die Eingangsblöcke durch I(i,j) (i, j = 1 bis 8) angegeben sind, die Summe ihrer Absolutwerte durch Is angegeben ist, die Differenzblöcke durch P(i,j) (i, j = 1 bis 8) angegeben sind, und die Summe ihrer Absolutwerte durch Ps angegeben ist, können Is und Ps durch die folgenden Ausdrücke ausgedrückt werden:
Wenn Ps < Is, wird bestimmt, daß die Informationsmenge der Differenzblöcke kleiner als die der Eingabesignalblöcke ist, und dann werden die Differenzblöcke zusammen mit den Bewegungsvektoren an den ersten Schalter 32 ausgegeben. Wenn dagegen Ps ≥ Is, wird bestimmt, daß die Informationsmenge der Eingabesignalblöcke kleiner als die der Differenzsignalblöcke ist, und dann werden die Eingabeblöcke zusammen mit einem erzwungenen Intrasignal, welches angibt, daß der Block der erzwungene Intrablock ist, anstelle des Bewegungsvektors an den ersten Schalter 32 ausgegeben.
Der erste Schalter 32 wählt den Ausgang der Blockbildungsschaltung 2 in dem Fall eines Intramodus und den Ausgang des Bestimmungsglieds 31 in dem Fall eines Vorhersagemodus aus und legt den ausgewählten Ausgang an die Orthogonaltransformationsschaltung 33 an. Die Orthogonaltransformationsschaltung 33 führt zum Beispiel die zwei dimensionale DCT an jedem der 8×8-Blöcke aus, die hierin eingegeben werden. Die Quantisierungsschaltung 34 führt eine Kodierung variabler Länge durch und quantisiert die von der Orthogonaltransformationsschaltung 33 ausgegebenen Orthogonaltransformationskoeffizienten. Darüber hinaus quantisiert die Quantisierungsschaltung 34 in dem Fall eines Vorhersagemodus zusätzlich zu den Orthogonaltransformationskoeffizienten auch die Bewegungsvektoren oder die erzwungenen Intrasignale und gibt sie zusammen an einen Übertragungsweg 11 aus. Andererseits gibt der zweite Schalter 35 nur in dem Fall des Intrafeldes die Orthogonaltransformationskoeffizienten, die durch die Quantisierungsschaltung 34 quantisiert worden sind, an die Umkehrquantisierungsschaltung 36 aus, um Referenzdaten für die Bewegungskompensationsvorhersage zu erzeugen. Die Umkehrquantisierungsschaltung 36 führt an den Daten, die durch die Quantisierungsschaltung 34 einer Kodierung mit variabler Länge unterzogen worden sind, ein Umkehrquantisierung und eine Dekodierung variabler Länge durch, und die dekodierten Daten werden an die Umkehrorthogonaltransformationsschaltung 37 ausgegeben. Die Umkehrorthogonaltransformationsschaltung 37 führt zum Beispiel die inverse zweidimensionale DCT an den Daten aus, um die Blöcke des Intrafeldes zu rekonstruieren. Die Blöcke des Intrafeldes, die durch die Umkehrorthogonaltransformationsschaltung 37 rekonstruiert worden sind, werden in dem Videospeicher 38 gespeichert. Der Videospeicher 38 speichert die rekonstruierten Bilder des Intrafeldes für ein Feld als die Referenzdaten in dem Fall der Bewegungskompensationsvorhersage und gibt die Referenzbilder innerhalb des Bewegungsvektor-Erfassungsbereichs an die Bewegungskompensationsvorhersageschaltung 30 aus.
In der oben beschriebenen Ausführungsform besitzt ein Block für die Orthogonaltransformation die Größe von 8 Pixeln × 8 Zeilen. Diese Größe beträgt nicht notwendi gerweise 8 Pixel × 8 Zeilen, sondern der Block kann die Größe von n Pixeln × m Zeilen haben. In ähnlicher Weise ist es nicht notwendig, den Suchbereich für Bewegungsvektoren auf 16 Pixel × 16 Zeilen festzulegen, sondern der Suchbereich kann auf k Pixel × s Zeilen festgelegt werden {k ≥ n, s ≥ m). In der vorgenannten Ausführungsform wird die Vorhersagekodierung alle vier Felder fertiggestellt. Es ist nicht notwendig, die Vorhersagekodierung alle vier Felder fertigzustellen, vielmehr kann die Vorhersagekodierung jede beliebige Anzahl von Feldern fertiggestellt werden. Darüberhinaus ist es nicht notwendig, die Vorhersagekodierung jede beliebige Anzahl von Feldern fertigzustellen, sondern die die Vorhersagekodierung kann jede beliebige Anzahl von Rahmen fertiggestellt werden. Gemäß der vorstehenden Ausführungsform wird in dem Bestimmungsglied 31 der Ausgang mit der kleineren Summe von Absolutwerten von den Ausgängen der Blockbildungsschaltung 2 und der Bewegungskompensationsvorhersageschaltung 30 ausgewählt, um an den ersten Schalter 32 ausgegeben zu werden. Alternativ kann ohne Durchführung der Bewegungskompensationsbestimmung nur der Ausgang der Bewegungskompensationsvorhersageschaltung 30 an den ersten Schalter 32 ausgegeben werden.
Ausführungsform 2
Gemäß oben beschriebener Ausführungsform 1 wird in dem Bestimmungsglied 31 der Ausgang mit der kleineren Summe von Absolutwerten von den Ausgängen der Blockbildungsschaltung 2 und der Bewegungskompensationsvorhersageschaltung 30 ausgewählt, um an den ersten Schalter 32 ausgegeben zu werden. In einem Feld, bei dem das Bestimmungsglied 31 den erzwungenen Intramodus häufiger als den Vorhersagemodus auswählt, kann beurteilt werden, daß ein Szenenwechsel in dem Feld aufgetreten ist, und unter der Annahme, daß sich das gesamte Feld in dem Intramodus be findet, kann eine Kodierung durchgeführt werden. Eine Ausführungsform, die konstruiert ist, um diesen Vorgang durchzuführen, ist die nachstehend beschriebene Ausführungsform 2.
27 ist ein Blockdiagramm, welches die Konfiguration der zweiten Ausführungsform zeigt. In der Figur bezeichnet 40 ein Bestimmungsglied, welches den einen mit der kleineren Summe von Absolutwerten von einem Eingangsblock aus der Blockbildungsschaltung 2 und einem Vorhersagedifferenzblock aus der Bewegungskompensationsvorhersageschaltung 30 auswählt und beurteilt, daß ein Feld, in welchem der Eingangsblock aus der Blockbildungsschaltung 2 häufiger ausgewählt wird, ein Intrafeld ist, 41 bezeichnet einen ersten Feldspeicher 41, welcher die von der Blockbildungsschaltung 2 ausgegebenen Eingabeblöcke als Daten eines Intrafeldes speichert, 42 bezeichnet einen zweiten Feldspeicher, welcher die Blöcke eines von dem Bestimmungsglied 40 ausgegebenen Vorhersagefeldes speichert, und 43 bezeichnet eine ersten Schalter, welcher in dem Intramodus und wenn das Bestimmungsglied 40 beurteilt, daß der erzwungene Intramodus häufiger auftritt als der Vorhersagemodus, den Ausgang des ersten Feldspeichers 41 auswählt und ihn an die Orthogonaltransformationsschaltung 33 ausgibt, und welcher in einem anderen Fall als den oben erwähnten zwei Fällen den Ausgang des zweiten Feldspeichers 42 auswählt.
Dann wird die Betriebsweise beschrieben werden. In dem Prozeß zwichen dem Digital-Videosignal-Eingangsanschluß 1 und der Bewegungskompensationsvorhersageschaltung 30 wird eine Operation in der gleichen Weise wie die in der ersten Ausführungsform ausgeführt, und daher wird die Beschreibung weggelassen. Das Bestimmungsglied 40 wählt den einen mit der kleineren Summe von Absolutwerten von Komponenten von aus der Blockbildungsschaltung 2 aus gegebenen Eingabeblöcken und aus der Bewegungskompensationsvorhersageschaltung 30 ausgegebenen Differenzblöcken aus und gibt ihn aus. Wenn der Ausgang von der Bewegungskompensationsvorhersageschaltung 30 ausgewählt wird, gibt das Bestimmungsglied 40 Bewegungsvektoren und Blöcke eines Differenzsignals aus. Wenn der Ausgang von der Blockbildungsschaltung 2 ausgewählt wird, werden Bewegungsvektoren zusammen mit einem Signal ausgegeben, welches einen erzwungenen Intrablock anzeigt. Wenn die Anzahl von erzwungenen Intrablöcken in einem Feld einen Wert n erreicht oder überschreitet, beurteilt das Bestimmungsglied 40, daß ein Szenenwechsel aufgetreten ist, und gibt ein Steuerungssignal derart aus, daß das gesamte gegenwärtige Feld durch den Intramodus zu kodieren ist.
Der Ausgang des Bestimmungsglieds 40 wird als Daten des Vorhersagemodus in dem zweiten Feldspeicher 42 gespeichert, und nachdem Daten für ein Feld gespeichert worden sind, werden sie an den ersten Schalter 43 ausgegeben. Demgegenüber wird der Ausgang der Blockbildungsschaltung 2 als Daten des Intramodus in dem ersten Feldspeicher 41 gespeichert, und nachdem Daten für ein Feld gespeichert worden sind, werden sie an den ersten Schalter 43 ausgegeben. In dem Intramodus und wenn das Bestimmungsglied 40 bestimmt, den Intramodus auf dem Feld zu erzwingen, wählt der erste Schalter 43 den Ausgang des ersten Feldspeichers 41 aus, und in einem anderen Fall wählt er den Ausgang des zweiten Feldspeichers 42 aus. Der Ausgang des ersten Schalters 43 wird der Orthogonaltransformationsschaltung 33 zugeführt. In dem nachfolgenden Prozeß von der Orthogonaltransformationsschaltung 33 bis zu dem Videospeicher 38 wird die Operation in der gleichen Weise ausgeführt wie die in der ersten Ausführungsform, und daher wird eine Beschreibung weggelassen. Wenn allerdings durch das Bestimmungsglied 40 bestimmt wird, daß ein Szenenwechsel auftritt, ist es erforder lich, auch den Inhalt des Videospeichers 38 zu aktualisieren. In diesem Fall arbeitet daher der zweiter Schalter 35 in der gleichen Weise wie in dem Intramodus, um den Ausgang der Quantisierungsschaltung 34 der Umkehrquantisierungsschaltung 36 zuzuführen.
Nachstehend werden Beispiele beschrieben werden, in welchen eine Kodierung und Dekodierung jeweils durch drei Arten von Vorhersagekodierungsverfahren durchgeführt wird, die in 26, 4 und 28 gezeigt sind. In dem in 28 gezeigten Vorhersagekodierungsverfahren wird eine Vorhersage zwischen Feldern in einem Feld durchgeführt, und ein drittes Feld F3 wird aus dem ersten Feld F1 vorhergesagt. Mit Bezug auf die in 26, 4 und 28 jeweils als Verfahren 1, 2 und 3 gezeigten Kodierungsverfahren zeigt 29 Ergebnisse von Simulationsprozessen, welche an Probebildern für fünf Sekunden, in welchen ein Szenenwechsel vorliegt, ausgeführt wurden. In ähnlicher Weise zeigt 30 Ergebnisse von Simulationsprozessen, welche an Probebildern für fünf Sekunden, in welchen kein Szenenwechsel vorliegt, ausgeführt wurden. Für diese Probebilder werden Komponentensignale 4:2:2 (Y: 720 × 240, Cb und Cr: 360 × 240, 60 Felder/s) verwendet. Wie aus den in 29 und 30 gezeigten Ergebnissen ersehen, ist für Bilder mit einem Szenenwechsel Verfahren 3 vom Standpunkt des Rausabstandes vorteilhaft, aber für Bilder ohne Szenenwechsel gibt es zwischen Verfahren 1 bis 3 wenig Unterschied. Demzufolge wird, wenn ein Szenenwechsel auftritt, das Intrafeld erzwungenermaßen eingesetzt, und ein Hochleistungskodierer, dessen Gerätegröße geringer als die eines herkömmlichen prädiktiven Kodierers ist, kann verwirklicht werden.
In der oben beschriebenen Ausführungsform 2 wird der Intramodus alle n Felder erzeugt, und die nachfolgenden (n – 1) Felder werden aus einem Intrafeld vorhersageko diert, des weiteren wird, wenn ein Szenenwechsel auftritt, das Intrafeld erzwungenermaßen erzeugt, und die verbleibenden Felder werden aus dem erzwungenen Intramodus vorhergesagt. Es ist nicht notwendig, daß ein Intrafeld alle n Felder vorliegt. Alternativ können, wenn ein erzwungenes Intrafeld erzeugt wird, die nach dem erzwungenen Intrafeld kommenden (n – 1) Felder vorhersagekodiert werden. In der zuvor beschriebenen Ausführungsform wird die Vorhersagekodierung in der Einheit von Feldern durchgeführt. Es ist nicht erforderlich, die Vorhersagekodierung in der Einheit von Feldern durchzuführen, sondern die Vorhersagekodierung kann in der Einheit von Rahmen durchgeführt werden.
Wie oben beschrieben, kann, nachdem die Hochleistungskodierer von Ausführungsformen 1 und 2 alle n Felder ein Intrafeld erzeugen und in den anderen Feldern eine Bewegungskompensationsvorhersage unter Verwendung dieses Intrafeldes als ein Referenzbild durchführen, die Hardwaregröße einschließlich einer Berechnungsschaltung zum Erhalten von Bewegungsvektoren reduziert werden.
Ausführungsform 3
31 ist ein Blockdiagramm, welches die Konfiguration eines Hochleistungskodierers in Ausführungsform 3 zeigt. In 31 bezeichnen 1–14 und 16–20 die denen der herkömmlichen Vorrichtung in 2 identischen Elemente. Die Bezugsziffer 50 bezeichnet einen Moduszähler, welcher die Anzahl von Blöcken des Intramodus zählt, 51 bezeichnet eine Richtungsumschaltschaltung, welche eine vorbestimmte Anzahl von Blöcken mit der von dem Moduszähler ausgegebenen Anzahl von Blöcken in dem Intramodus vergleicht und welche das Referenzbild für das nächste Feld bestimmt, und 52 bezeichnet einen Videospeicher, welcher ausgegebene Blöcke speichert, um eine Bewegungs kompensationsvorhersage durchzuführen und welcher das Referenzbild für das nächste Feld als den Suchbereich ausgibt.
Nun wird die Betriebsweise beschrieben werden. Ungeachtet eines Intrafeldes oder eines Vorhersagefeldes werden eingegebene digitale Videosignale durch die Blockbildungsschaltung 2 in Eingabeblöcke einer Einheit, welche aus m [Pixeln] × n [Zeilen] besteht, segmentiert. Um einen Differenzblock zu erhalten, berechnet ein Subtrahierglied 3 die Differenz in der Einheit von Pixeln zwischen einem Eingabeblock und einem Vorhersageblock. Auf diese Weise werden ein Eingabeblock und ein Differenzblock einem ersten Schalter 7 zugeführt. Um die Leistung zu berechnen, wird der Differenzblock auch einem Differenzleistungsberechnungsglied 4 zugeführt, und die Differenzleistung wird berechnet. Um die Wechselstromleistung zu berechnen, wird der Eingabeblock auch einem Originalleistungsberechnungsglied 5 zugeführt, und die ursprüngliche Leistung wird berechnet. Die Ausgänge des Differenzleistungsberechnungsgliedes 4 und des Originalleistungsberechnungsgliedes 5 werden dem Bestimmungsglied 6 zugeführt, welches wiederum die eine mit der geringeren Leistung von den zwei Leistungen auswählt, wobei das Ergebnis an den ersten Schalter 7 als das Modussignal ausgegeben wird. Genauer gesagt wird, wenn die Differenzleistung kleiner als die ursprüngliche Wechselstromleistung ist, das Vorhersagemodussignal ausgegeben, so daß der erste Schalter 7 in den Vorhersagemodus gestellt wird, um den Differenzblock als einen kodierten Block auszugeben. Wenn die ursprüngliche Leistung geringer als die Differenzleistung ist, wird das Intramodus-Signal ausgegeben, so daß der erste Schalter 7 in den Intramodus gestellt wird, um den Eingabeblock als einen kodierten Block auszugeben.
Das Betriebsart- bzw. Modussignal von dem Bestimmungsglied 6 wird in den Moduszähler 50 eingegeben. Nachdem das eingegebene Modussignal für jeden Block eines Vorhersagefeldes generiert wird, zählt der Moduszähler 50 die Anzahl von Blöcken, die den Intramodus oder den Vorhersagemodus auswählen, von den Blöcken eines Feldes und gibt die Anzahl von Blöcken, die einen Intramodus oder den Vorhersagemodus auswählen, an die Richtungsumschaltschaltung 51 aus. Die Richtungsumschaltschaltung 51 vergleicht eine vorbestimmte Anzahl von Blöcken (welche kleiner als die Gesamtzahl von Blöcken eines Feldes ist) mit der von dem Moduszähler 50 eingegebenen Anzahl von Blöcken, die einen Intramodus oder Vorhersagemodus auswählen, und gibt ein Referenzbild-Umschaltsignal an den Videospeicher 52 aus. Wenn die vorbestimmte Anzahl von Blöcken größer (oder kleiner) als die Anzahl von Blöcken, die einen Intramodus (oder einen Vorhersagemodus) auswählen, ist, gibt die Richtungsumschaltschaltung 51 an den Videospeicher 52 ein Referenzbild-Umschaltsignal derart aus, daß das Referenzbild nicht umgeschaltet wird. Wenn die vorbestimmte Anzahl von Blöcken kleiner (oder größer) als die Anzahl von Blöcken ist, die einen Intramodus (oder einen Vorhersagemodus) auswählen, gibt die Richtungsumschaltschaltung 51 an den Videospeicher 52 ein Referenzbild-Umschaltsignal derart aus, daß das Referenzbild umgeschaltet wird.
Der erste Schalter 7 gibt in Abhängigkeit von dem durch das Bestimmungsglied 6 bestimmte Betriebsartsignal einen Eingabeblock oder einen Differenzblock als einen kodierten Block aus. In diesem Fall, gibt, wenn der Eingabeblock das Intrafeld ist, der erste Schalter 7 sicher den Eingabeblock als kodierten Block aus. Die kodierten Blöcke treten in die DCT-Schaltung 8 ein, um in DCT-Koeffizienten umgewandelt zu werden. Die DCT-Koeffizienten werden den Gewichtungs- und Schwellenwertprozessen in der Quantisierungsschaltung 9 unterzogen, um in vorbestimmte Bit-Zahlten quantisiert zu werden, die jeweils den Koeffizienten entsprechen. Die DCT-Koeffizienten, die in die jeweiligen vorbestimmten Bit-Zahlen quantisiert worden sind, werden durch den ersten Kodierer 10 in für einen Übertragungsweg 11 geeignete Codes umgewandelt und dann an den Übertragungsweg 11 ausgegeben.
Die DCT-Koeffizienten, an denen Gewichtungs- und Schwellenwertprozesse und eine Quantisierung durch die Quantisierungsschaltung 9 durchgeführt worden sind, treten auch in die lokale Dekodierungsschleife 20 ein und werden in der Umkehrquantisierungsschaltung 12 inversen Gewichtungs- und inversen Quantisierungsprozessen unterzogen. Dann werden die DCT-Koeffizienten, an denen Umkehrgewichtungs- und Umkehrquantisierungsprozesse in der lokalen Dekodierungsschleife 20 durchgeführt worden sind, durch die Umkehr-DCT-Schaltung 13 in einen dekodierten Block umgewandelt. Das Addierglied 14 addiert den dekodierten Block zu einem Vorhersageblock in der Einheit von Pixeln. Dieser Vorhersageblock ist der gleiche wie der in dem Subtrahierglied 3 verwendete. Das Ergebnis der Addition durch das Addierglied 14 wird als ein Ausgabeblock in eine vorbestimmte Adresse des Videospeichers 52 geschrieben. Der Videospeicher 52 schaltet das Referenzbild in Reaktion auf das Referenzbild-Schaltsignal von der Richtungsumschaltschaltung 51 um und gibt den Bewegungsschätzungssuchbereich an die MC-Schaltung 16 aus. Die Größe des Blocks in dem Bewegungsschätzungssuchbereich beträgt zum Beispiel i [Pixel] × j [Zeilen] (wobei i ≥ m, j ≥ n). Ein Block in dem von dem Videospeicher 52 ausgegebenen Bewegungsschätzungssuchbereich und ein Eingabeblock von der Blockbildungsschaltung 2 werden in die MC-Schaltung 16 eingegeben. Die MC-Schaltung 16 führt die Bewegungsschätzung an jedem Block aus, um Bewegungsvektoren des Eingabeblocks zu extrahieren.
Die durch die Bewegungsschätzung in der MC-Schaltung 16 extrahierten Bewegungsvektoren werden in die MIX-Schaltung 17 eingegeben. Die MIX-Schaltung 17 kombiniert die Bewegungsvektoren von der MC-Schaltung 16 mit dem durch das Bestimmungsglied 6 bestimmten Modussignal. Die Bewegungsvektoren und das Modussignal, die in der MIX-Schaltung 17 miteinander kombiniert worden sind, werden durch den zweiten Kodierer 18 in für den Übertragungsweg 11 geeignete Codes umgewandelt und dann zusammen mit den entsprechenden kodierten Blöcken an den Übertragungsweg 11 ausgegeben. Der Vorhersageblock wird von der MC-Schaltung 16 aus in der Form eines Blocks ausgegeben, der in Blockform einer Größe von (m [Pixel] × n [Zeilen]), die gleich der des Eingabeblocks von dem Bewegungsschätzbereich ist, gebracht ist. Dieser Vorhersageblock wird dem zweiten Schalter 19 zugeführt und von dem entsprechenden Ausgangsanschluß des Schalters in Übereinstimmung mit dem Feld des gegenwärtig verarbeiteten Eingabeblocks und dem Modussignal des dekodierten Blocks ausgegeben. Insbesondere wird der Vorhersageblock von einem der Ausgangsanschlüsse des zweiten Schalters 19 in Übereinstimmung mit dem verarbeiteten Feld an das Subtrahierglied 3 und von dem anderen Ausgangsanschluß in Übereinstimmung mit dem Modussignal des gegenwärtigen dekodierten Blocks und dem verarbeiteten Feld ausgegeben.
In dem Fall, daß ein Szenenwechsel in der Einheit von Rahmen auftritt, wenn das in 4 gezeigte Vorhersageverfahren für ein gewöhnliches Bild verwendet wird, steigt die Anzahl von Blöcken, die einen Intramodus bei Kodierung des Bildes unmittelbar nach dem Szenenwechsel auswählen, an, und das danach verwendete Referenzbild kann umgeschaltet werden, wie in 28 gezeigt.
Die Betriebsweise in Ausführungsform 3 wird nachstehend mit Bezug auf die Flußdiagramme in 32, 33 und 34 zusammengefaßt. 32 ist ein Flußdiagramm, welches den gesamten Vorgang in Ausführungsform 3 zeigt, 33 ist ein Flußdiagramm, welches einen Intrafeld-Prozeß von Schritt S103 in 32 zeigt, und 34 ist ein Flußdiagramm, welches einen Vorhersagefeldprozeß von Schritt S104 in 32 zeigt.
Zuerst wird die Feldnummer fn, die das Feld in der Bewegungskompensationsvorhersageprozeßeinheit angibt, auf 0 gesetzt (Schritt S101). Diese Feldnummer fn wird mit Bezug auf 4 beschrieben werden. Intrafeld F1, das zuerst in der Bewegungskompensationsvorhersageprozeßeinheit kommt, wird durch die Feldnummer fn = 0 identifiziert, Intrafeld F2 wird durch die Feldnummer fn = 1 identifiziert, das nächste Intrafeld F3 wird durch die Feldnummer fn = 2 identifiziert, und das Intrafeld F4, das zuletzt in der Bewegungskompensationsvorhersageprozeßeinheit kommt, wird durch die Feldnummer fn = 3 identifiziert. Nachdem ein Bewegungskompensationsprozeß gerade gestartet worden ist, ist das zuerst zu verarbeitende Feld sicher das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld, und daher wird die Feldnummer fn in Schritt S101 auf 0 gesetzt (fn = 0). In einem späteren Vorhersagefeldprozeß wird ein Referenzbildumschaltflag Rfn, welches als ein Flag zum Bestimmen, ob ein Szenenwechsel vorliegt, fungiert, gesetzt, aber in diesem Schritt wird das Flag Rfn zu Initialisierung auf 0 gesetzt (Rfn = 0).
Dann wird die Feldnummer fn geprüft, um zu bestimmen, ob sie 0 ist oder ob das Feld das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld ist (Schritt S102). Falls die Feldnummer fn 0 ist (fn = 0), wird dieses Feld als ein Intrafeld verarbeitet (Schritt S103). Falls dagegen die Feldnummer fn nicht 0 ist (fn ≠ 0), wird dieses Feld als ein Vorhersagefeld verarbeitet. Diese Prozesse werden später im Detail beschrieben werden. Nachdem jedes Feld verarbeitet ist, wird die Feldnummer fn erhöht, um das nächste Feld anzuzeigen (Schritt S105). In einem tatsächlichen Gerät kann eine solche Feldnummer durch ein Mikrocomputer-Signal oder dergleichen gesteuert werden.
Es wird beurteilt, ob die Feldnummer fn, die das nächste Feld anzeigt, eine Nummer ist, die ein Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit anzeigt (Schritt S106). Falls zum Beispiel, wie in 4, wobei, nachdem die Bewegungskompensationsprozeßeinheit innerhalb von vier Feldern vervollständigt worden ist und die Feldnummer fn eines Intrafeldes auf 0 gesetzt worden ist, fn = 4, bedeutet das, daß eine Abfolge von Bewegungskompensationsvorhersageeinheiten vervollständigt worden ist. Falls fn < 4, wird beurteilt, daß das nächste Feld noch immer innerhalb der Bewegungskompensationsprozeßeinheit liegt, und der Prozeß wird wiederholt.
Wenn eine Abfolge der Bewegungskompensationsvorhersageprozeßeinheiten vervollständigt worden ist, wird beurteilt, ob alle erforderlichen Felder verarbeitet worden sind (Schritt S107). Diese Beurteilung kann zum Beispiel durch Prüfen des Betriebs eines Endschalters des Hochleistungskodierers bewerkstelligt werden. Falls das nächste Feld zu verarbeiten ist, um die nächste Bewegungskompensationsvorhersageprozeßeinheit zu kodieren, werden die Variablen initialisiert, und die Verarbeitung wird wiederholt. Falls der Betrieb des Hochleistungskodierers abgeschlossen worden ist, wird die die Kodierung beendet.
Der Intrafeld-Prozeß wird mit Bezug auf des Flußdiagramm in 33 beschrieben werden. Das Feld, das in Schritt S102 in 32 als als ein Intrafeld zu verarbeitend bestimmt wird, wird in die vorbestimmte Größe von m [Pixel] × n [Zeilen] in dem verarbeiteten Feld segmentiert (Schritt S201). Dann wird eine Orthogonaltransformation wie etwa eine DCT an den Blöcken dieser Größe durchgeführt (Schritt S202). Die Daten, an denen eine Orthogonaltransformation durchgeführt worden ist, werden in eine vorbestimmte Bit-Zahl quantisiert, welche für jede Abfolge festgelegt wird (Schritt S203). In einer Orthogonaltransformation wie etwa einer DCT wird allgemein eine Quantisierung derart durchgeführt, daß eine größere Bit-Zahl einer Gleichspannung und niederwertigen Segmenten einer Wechselspannung zugeordnet werden und eine kleinere Bit-Zahl einer höherwertigen Sequenz einer Wechselspannung zugeordnet wird. Die quantisierten Daten werden in zur Übertragung geeignete Codes umgewandelt (Schritt S204), und die kodierten Daten werden übertragen (Schritt 205). Es wird zum Beispiel durch Zählen der verarbeiteten Blöcke beurteilt, ob die Verarbeitung eines Feldes abgeschlossen worden ist (Schritt S206). Falls die Verarbeitung eines Feldes noch nicht abgeschlossen worden ist, wird die Verarbeitung für den nächsten Block fortgesetzt. Falls die Verarbeitung eines Feldes abgeschlossen worden ist, wird der Intrafeld-Prozeß beendet.
Der Vorhersagefeldprozeß wird mit Bezug auf das Flußdiagramm in 34 beschrieben werden. Das Feld, das in Schritt S102 in 32 als als ein Vorhersagefeld zu verarbeitend bestimmt wird, wird geprüft, um zu beurteilen, ob in der Verarbeitung des vorherigen Feldes in dem Referenzbildumschaltflag Rfn-1 = 0 oder ob in der Verarbeitung des dem gegenwärtig verarbeiteten Feldes vorhergehenden Feldes ein Szenenwechsel erfaßt worden ist (Schritt S301). Falls Rfn-1 = 0, wird eine Bewegungskompensationsvorhersage unter Verwendung des Referenzbildes in der gleichen Position wie zuvor durchgeführt (Schritt S302). Falls Rfn-1 = 1, bedeutet das, daß bei Verarbeitung der Feldnummer fn-1 ein Szenenwechsel erfaßt worden ist. Daher wird in der Bewegungskompensationsvorhersage für die Feldnummer fn das Referenzbild auf ein Bild eines Feldes in einer von der vorherigen Position unterschiedlichen Position umgeschaltet, und eine Bewegungskompensationsvorhersage wird unter Verwendung des neuen Referenzbildes durchgeführt (Schritt S303).
Dann wird eine Variable COUNT zum Zählen der Anzahl von Blöcken, die einen Intramodus in einem zu verarbeitenden Feld auswählen, auf 0 gesetzt (Schritt S304). Die Variable COUNT wird später im Detail beschrieben werden. Ein eingegebenes Bild wird in die vorbestimmte Größe von m [Pixel] × n [Zeilen] in dem verarbeiteten Feld segmentiert (Schritt S305). Die in die Größe von m × n segmentierten Blöcke werden einer Bewegungskompensationsvorhersage unterzogen (Schritt S306). Unter Verwendung des in Schritt S302 oder S303 festgelegten Referenzbildes wird die Differenz in der Einhait von Pixeln zwischen einem vorbestimmten Bereich eines vergangenen Bildes und einem neu geteilten Block als ein Differenzblock in das Differenzleistungsberechnungsglied 4 eingegeben, und eine Differenzleistung P1 wird berechnet (Schritt S307). Durch Verwenden eines solchen voreingestellten Referenzbildes kann die durch eine Bewegungskompensationsvorhersage erzeugte Informationsmenge reduziert werden. Dann wird der neu segmentierte Block in das Originalleistungsberechnungsglied 5 eingegeben, um eine ursprüngliche Wechselstromleistung P2 zu berechnen (Schritt S308).
Die berechneten Leistungen P1 und P2 werden im Betrag miteinander verglichen (Schritt S309). Wenn die Differenzleistung P1 kleiner als die ursprüngliche Wechselstromleistung P2 ist, wird der Differenzblock (der Differenzwert des der Bewegungskompensationsvorhersage unter zogenen Blocks) ausgewählt (Schritt S310). Wenn die Differenzleistung P1 größer als die ursprüngliche Wechselstromleistung P2 ist, wird der Eingabeblock (das Original, welches noch immer in Blockform ist) ausgewählt (Schritt 311), und die Anzahl von Malen, die ein Eingabeblock als ein kodierter Block ausgewählt wird, oder die Anzahl von Blöcken in einem Feld, welche als ein Intramodus zu verarbeiten sind, wird gezählt (Schritt S312). Eine Variable, die in diesem Schritt als ein Zähler fungiert, ist COUNT, die in Schritt S304 auf 0 gesetzt worden ist. Dieser Zähler wird sicher auf 0 gesetzt, wenn die Verarbeitung in der Einheit von Feldern beginnt, und zählt die Anzahl von Blöcken, die in der Verarbeitung des einen Feldes einen Intramodus auswählen.
Jeder ausgewählte Block wird der Orthogonaltransformation unterzogen (Schritt 313) und in eine vorbestimmte Bit-Zahl quantisiert, die für jede Abfolge festgelegt wird (Schritt S314). In einer Orthogonaltransformation wie etwa einer DCT wird eine Quantisierung derart durchgeführt, daß eine größere Bit-Zahl einer Gleichspannung und niederwertigen Sequenzen einer Wechselspannung zugeordnet wird und eine kleinere Bit-Zahl einer höherwertigen Sequenz einer Wechselspannung zugeordnet wird. Die quantisierten Daten werden in zur Übertragung geeignete Codes umgewandelt (Schritt S315), und die kodierten Daten werden übertragen (Schritt 316). Es wird zum Beispiel die Anzahl der verarbeiteten Blöcke gezählt, um zu beurteilen, ob die Verarbeitung eines Feldes abgeschlossen worden ist (Schritt S317). Falls die Verarbeitung eines Feldes noch nicht abgeschlossen worden ist, wird die Verarbeitung für den nächsten Block fortgesetzt.
Falls die Verarbeitung eines Feldes abgeschlossen worden ist, wird die Anzahl von Eingabeblöcken, die als kodierte Blöcke in der Verarbeitung dieses einen Feldes verarbeitet worden sind, oder die Anzahl von Blöcken, die einen Intramodus ausgewählt haben, mit einem vorgewählten Schwellenwert TH verglichen (Schritt S318). Der Schwellenwert TH ist eine vorbestimmte Zahl, die geringer als die Anzahl von Blöcken in einem Feld ist. Wenn die Gesamtzahl von Blöcken in einem Feld zum Beispiel 2700 beträgt, wird der Schwellenwert TH auf 1000 gesetzt, was kleiner als 2700 ist. Falls die die Anzahl von Malen, die Eingabeblöcke als kodierte Blöcke ausgewählt werden, angebende Variable COUNT kleiner als der Schwellenwert TH ist, liegt zwischen dem Feld (Feldnummer fn), welches gerade verarbeitet worden ist, und dem Referenzbild, welches in einer Bewegungskompensationsvorhersage dieses Bildes verwendet worden ist, kein Szenenwechsel vor, und das Referenzbildumschaltflag Rfn wird auf 0 gesetzt (Rfn = 0), so daß das Referenzbild in einer gewöhnlichen Position als das Referenzbild für die Bewegungskompensation des nächsten Feldes (Feldnummer fn+1) verwendet wird (Schritt S319). Falls die die Anzahl von Malen, die Eingabeblöcke als kodierte Blöcke ausgewählt werden, angebende Variable COUNT größer als der Schwellenwert TH ist, liegt zwischen dem Feld (Feldnummer fn), welches gerade verarbeitet worden ist, und dem Referenzbild, welches in einer Bewegungskompensationsvorhersage dieses Bildes verwendet worden ist, ein Szenenwechsel vor, und das Referenzbild für die Bewegungskompensation des nächsten Feldes (Feldnummer fn+1) wird von dem Referenzbild in einer normalen Position zu einem Feld in einer von der bis dahin eingenommenen Position verschiedenen Position, zum Beispiel das Feld, welches gerade verarbeitet worden ist und an einem Ort positioniert ist, an dem bis dahin ein Referenzbild nicht vorlag, umgeschaltet. Zu diesem Zweck wird das Referenzbildumschaltflag Rfn auf 1 gesetzt (Rfn = 1) (Schritt S320). Auf diese Weise wird das Referenzbildumschaltflag Rfn gesetzt und der Vorhersagefeldprozeß wird beendet.
35 zeigt die Änderung der Informationsmenge für fünf Sekunden in dem Fall, daß die Vorhersagekodierung gemäß der Ausführungsform 3 durchgeführt wird, und 36 zeigt die Veränderung des Rauschabstandes für fünf Sekunden in diesem Fall. Obwohl in Punkt B ein Szenenwechsel vorliegt, wird im Vergleich mit einem in 7 gezeigten Punkt A das Anwachsen der Informationsmenge unterdrückt. Darüberhinaus gibt es keine auffällige Verschlechterung des Rauschabstandes.
Ausführungsformen 4 und 5
In Ausführungsform 3 werden, um einen kodierten Block aus einem Differenzblock und einem Eingabeblock auszuwählen, deren Leistungen berechnet und miteinander verglichen, und die Anzahl von einen Intramodus auswählenden Blöcken wird gezählt.
Gemäß Ausführungsform 4 wird, um einen kodierten Block aus einem Differenzblock und einem Eingabeblock auszuwählen, die Entropie in jedem Block berechnet, und die Entropie des Differenzblocks wird mit der des Eingabeblock in gleicher Weise wie in Ausführungsform 3 durch das Bestimmungsglied 6 verglichen, um zu bestimmen, welcher Block als ein kodierter Block auszuwählen ist.
Gemäß Ausführungsform 5 wird, um einen kodierten Block aus einem Differenzblock und einem Eingabeblock auszuwählen, eine Addierung von Absolutwerten von Pixeln in jedem Block durchgeführt, die r-te Potenz der Summe von Absolutwerten des Eingabeblocks und die des Differenzblocks werden berechnet, und die r-te Potenz der Summe von Absolutwerten des Differenzblocks wird mit der des- Eingabeblocks in gleicher weise wie in Ausführungsform 3 durch das Bestimmungsglied 6 verglichen, um zu be stimmen, welcher Block als ein kodierter Block auszuwählen ist.
Ausführungsform 6
In Ausführungsform 3 vergleicht das Bestimmungsglied 6 die Leistung eines Eingabeblocks mit der eines Differenzblocks. Gemäß Ausführungsform 6 wird, wenn die Leistung eines Eingabeblocks mit der eines Differenzblocks zu vergleichen ist, wenigstens eine der Leistungen des Eingangs- und des Differenzblocks mit einem Offset versehen, und dann werden die zwei Leistungen miteinander verglichen. Zum Beispiel wird die Leistung des Eingabeblocks mit einem positiven Offset versehen und dann mit der Leistung des Differenzblocks verglichen. Wenn es keinen großen Leistungsunterschied zwischen dem Eingangs- und dem Differenzblock gibt, erlaubt diese Konfiguration, die Anzahl von die Differenzleistung auswählenden Blöcken zu erhöhen, wodurch verhindert wird, daß ein Intramodus in übermäßiger Weise erzeugt wird.
37 ist ein Flußdiagramm eines Vorhersagefeldprozesses in Ausführungsform 6. In 37 sind durch die gleichen Schrittnummern wie die in 34 verwendeten bezeichneten Abschnitte mit denen von 34 identisch. Die Prozesse von Schritt S301 bis Schritt S308 sind die gleichen wie in Ausführungsform 3. Eine von einem Differenzblock berechnete Differenzleistung P1 wird mit einem Wert verglichen, der durch Addieren eines vorbestimmten Offsets α zu einer von einem Eingabeblock (ursprünglichen Block) berechneten ursprünglichen Wechselstromleistung P2 erhalten wird (Schritt S330). Dies macht es im Vergleich zu Ausführungsform 3 schwierig, P1 < P2 + α zu erhalten, so daß die Anzahl von einen Intramodus auswählenden Blöckert reduziert wird. Demzufolge wird verhindert, daß ein Intramodus in übermäßiger Weise erzeugt wird, und die er zeugte Informationsmenge kann stabil auf einem konstanten Niveau gehalten werden. Die nachfolgenden Prozesse von Schritt S310 bis S320 sind die gleichen wie in Ausführungsform 3.
Ausführungsformen 7 und 8
Gemäß Ausführungsform 7 wird, wenn die Entropie eines Differenzblocks mit der eines Eingabeblocks in ähnlicher Weise wie in Ausführungsform 4 verglichen wird, wenigstens eine der Entropien des Eingangs- oder des Differenzblocks mit einem Offset versehen, und dann werden die zwei Werte miteinander verglichen. Zum Beispiel wird die Entropie des Eingabeblocks mit einem positiven Offset versehen und dann mit der Entropie des Differenzblocks verglichen. Wenn es keinen großen Unterschied zwischen der Entropie des Eingabeblocks und der Entropie des Differenzblocks gibt, erlaubt diese Konfiguration, die Anzahl von die Differenzleistung auswählenden Blöcken zu erhöhen, wodurch verhindert wird, daß ein Intramodus in übermäßiger Weise erzeugt wird.
Gemäß Ausführungsform 8 wird, wenn die Summe von Absolutwerten eines Differenzblocks mit der eines Eingabeblocks in ähnlicher Weise wie in Ausführungsform 5 verglichen wird, wenigstens eine der r-ten Potenz der Summe von Absolutwerten des Eingabeblocks und der des Differenzblocks mit einem Offset versehen, und dann werden die zwei Werte miteinander verglichen. Zum Beispiel wird die r-te Potenz der Summe der Absolutwerte des Eingabeblocks mit einem positiven Offset versehen und dann mit der r-ten Potenz der Summe der Absolutwerte des Differenzblocks verglichen. Wenn es keinen größeren Unterschied zwischen der r-ten Potenz der Summe von Absolutwerten des Eingangs- und der des Differenzblocks als den Offset gibt, erlaubt diese Konfiguration, die Anzahl von die Diffe renzleistung auswählenden Blöcken zu erhöhen, wodurch verhindert wird, daß ein Intramodus in übermäßiger Weise erzeugt wird.
Ausführungsform 9
In Ausführungsform 3 zählt der Moduszähler 50 die Anzahl aller einen Intramodus auswählenden Blöcke unter Blöcken für ein Feld. In Ausführungsform 9 werden Blöcke für ein Feld nicht gezählt, sondern zu einer Zeit, da ein Modussignal in einer vorbestimmten Anzahl von Blöcken während eines Feldes bestimmt wird, wird das Verhältnis der Anzahl von einen Intramodus auswählenden Blöcken zu der Gesamtzahl von Blöcken oder der Anzahl von Blöcken, in welchen ein Modussignal bestimmt worden ist, der Richtungsumschaltschaltung 51 zugeführt. Auf der Grundlage dieses Verhältnisses wird von der Richtungsumschaltschaltung 51 ein Referenzbild-Umschaltsignal ausgegeben. Diese Konfiguration erlaubt es, das Referenzbild für das nächste Feld auch dann zu bestimmen, wenn eine Kodierung aller Blöcke für ein Feld noch nicht abgeschlossen worden ist.
38 ist ein Flußdiagramm eines Vorhersagefeldprozesses in Ausführungsform 3. In 38 sind Abschnitte, die durch die gleichen Schrittnummern wie die in 34 verwendeten bezeichnet sind, mit denen von 34 identisch. Die Prozesse von Schritt S301 bis S303 sind die gleichen wie in Ausführungsform 3. Nachdem das Referenzbild zur Bewegungskompensationsvorhersage für das nächste Feld festgelegt ist (Schritte S302 und S303), werden die Variable COUNT zum Zählen der Male, die ein Intramodus in einem Feld während der Verarbeitung des Feldes erzeugt wird, oder der Anzahl von Blöcken, die Eingabeblöcke als kodierte Blöcke auswählen, und eine Variable B zum Zählen der Anzahl von Blöcken, die in der Verarbeitung des einen Feldes bis dahin verarbeitet worden sind, auf 0 gesetzt (Schritt S340). Die nachfolgenden Schritte S305 bis S316 sind die gleichen wie die in Ausführungsform 3. Nach Kodierung wird die Anzahl von Blöcken, die bis dahin verarbeitet worden sind, durch Inkrementieren der Variable B eine nach der anderen gezählt (Schritt S341). Die Variable B ändert sich von 0 bis zu der maximalen Anzahl von Blöcken, die in einem Feld vorliegen können. Die Referenzbildumschaltbestimmungsverarbeitung zum Bestimmen, ob das Referenzbild zur Bewegungskompensationsvorhersage des nächsten Feldes umzuschalten ist, wird durchgeführt (Schritt S342). Der nächste Schritt S317 ist der gleiche wie der in Ausführungsform 3.
39 ist ein Flußdiagramm des Referenzbildumschaltbestimmungsprozesses in Schritt S342 in 38. Der Prozeß wird mit Bezug auf 39 beschrieben werden. Es wird beurteilt, ob das Referenzbildumschaltflag Rfn 0 ist (Schritt S351). Falls das Flag Rfn nicht 0 ist, wird der Prozeß beendet. Falls das Flag Rfn 0 ist, wird das Verhältnis von COUNT zum Zählen der Male, daß Eingabeblöcke als kodierte Blöcke sind, zu der Variablen B zum Zählen von Blöcken, die in der Verarbeitung des einen Feldes bis dahin verarbeitet worden sind, mit dem Schwellenwert TH verglichen (Schritt S352). Falls das Verhältnis kleiner als der Schwellenwert TH ist, wird der Prozeß beendet. Falls das Verhältnis größer als der Schwellenwert TH ist, wird das Flag Rfn auf 1 gesetzt (Schritt S353), und der Prozeß wird beendet.
Ausführungsform 10
Ausführungsform 10 wird mit Bezug auf 40 beschrieben werden, welche die Konfiguration der Ausführungsform zeig. In 40 sind die Bezugsziffern 1, 3 bis 6, 8 bis 16, 18 und 20 die gleichen wie die in der herkömmlichen Vorrichtung in 2 verwendeten. Die Bezugsziffer 60 bezeichnet einen Videospeicher, in welchem eingegebene Bilder gespeichert werden, 61 bezeichnet eine SW-Erfassungsschaltung, welche einen Szenenwechsel in einem Bild erfaßt und ein dieses anzeigendes Signal ausgibt, 62 bezeichnet einen ersten Schalter, welcher von einem aus einem ursprünglichen Bild segmentierten Eingabeblock zu einem aus einem Vorhersageblock aufgrund einer Bewegungskompensationsvorhersage erzeugten Differenzblock umschaltet, 63 bezeichnet eine MIX-Schaltung, in welcher ein Bewegungsvektor, das Modussignal eines Blocks aus dem Bestimmungsglied 6 und das Szenenwechsel-(SW)-Erfassungssignal aus der SW-Erfassungsschaltung 61 kombiniert werden, und 64 bezeichnet einen zweiten Schalter, welcher einen Vorhersageblock umschaltet.
Nun wird die Betriebsweise beschrieben werden. Es wird angenommen, daß eine Bewegungskompensationsvorhersage zum Beispiel wie in 4 gezeigt durchgeführt und innerhalb von vier Feldern abgeschlossen wird. Digitale Videosignale, die durch den Eingangsanschluß 1 eingegeben werden, werden in dem Videospeicher 60 gespeichert. Der Videospeicher 60 weist einen Speicher für wenigstens zwei Felder auf, und während Speicherns von Videosignalen eines der zwei Felder werden Blöcke von Videodaten zur Szenenwechselerfassung oder Verarbeitung in eine vorbestimmte Größe von dem anderen Feld ausgegeben. Insbesondere sendet der Videospeicher 60 zuerst digitale Videosignale an die SW-Erfassungsschaltung 61, und Eigenschaften eines Bildes, die zum Beispiel aus vorgegebenen Parametern erhalten werden, und das Vorliegen eines Szenenwechsels werden erfaßt. Dann werden digitale Videosignale von einem der Ausgänge des Videospeichers 60 ausgegeben, während sie in Blöcke der Größe von beispielsweise m [Pixel] × n [Zeilen] (wobei m und n positive ganze Zahlen sind) gebracht werden. Die Größe von m [Pixel] × n [Zeilen] entspricht der Blockgröße zum Durchführen der zweidimensionalen Orthogonaltransformation und auch der Blockgröße eines Vorhersageblocks auf der Grundlage der Bewegungskompensationsvorhersage.
Ein Eingabeblock, der nur durch Blockbildung eines von dem Videospeicher 60 ausgegebenen Originals erhalten wird, und ein Differenzblock, welcher eine Differenz zwischen dem Eingabeblock und einem Vorhersageblock, der einer Bewegungskompensationsvorhersage unterzogen worden ist, durch das Subtrahierglied 3 ist, werden in den ersten Schalter 62 eingegeben. Der Eingabeblock und der Differenzblock werden jeweils in das Originalleistungsberechnungsglied 5 und das Differenzleistungsberechnungsglied 4 eingegeben, um die Leistung jedes Blocks zu erhalten. Das Originalleistungsberechnungsglied 5 berechnet die Wechselstromleistung des Eingabeblocks, und das Differenzleistungsberechnungsglied 4 berechnet die Leistung des Differenzblocks. Die berechnete Wechselstromleistung des Eingabeblocks und die berechnete Leistung des Differenzblocks werden in das Bestimmungsglied 6 eingegeben. Wenn die Leistung des Differenzblocks kleiner als die des Eingabeblocks ist, gibt das Bestimmungsglied 6 ein Vorhersagemodussignal aus, und wenn die Leistung des Eingabeblocks kleiner als die des Differenzblocks ist, gibt das Bestimmungsglied 6 ein Intramodus-Signal aus. Diese Signale werden als Modussignale dem ersten Schalter 62, der MIX-Schaltung 63 und dem zweiten Schalter 64 zugeführt.
Der erste Schalter 62, dem der Eingangs- und der Differenzblock eingegeben werden, gibt einen der Blöcke als einen kodierten Block aus. Zu diesem Zweck empfängt der erste Schalter 62 das Szenenwechsel-Erfassungssignal von der SW-Erfassungsschaltung 61 und auch das Modussignal von dem Bestimmungsglied 6, um den Umschaltmodus zu be stimmen, und gibt entweder den Eingangs- oder den Differenzblock als den kodierten Block aus. Die Schaltzustände zu dieser Zeit sind in 41 gezeigt. Nachdem der Prozeßschritt der Bewegungskompensationsvorhersage innerhalb von vier Feldern abgeschlossen ist, wie in 4 gezeigt, ist in dem gewöhnlichen Modus ein Intrafeld das erste Feld, ein Vorhersagefeld macht dann von dem zweiten Feld bis zu dem vierten Feld weiter, ein Intrafeld ist wieder das erste Feld, und das Vorgenannte wird kontinuierlich fortgesetzt. Bezüglich der in 41 gezeigten Erfassung des Vorliegens und Nichtvorliegens eines Szenenwechsels wird, wenn das Szenenwechsel-Erfassungssignal von der SW-Erfassungsschaltung 61 die Erfassung eines Szenenwechsels anzeigt, ein Signal des Vorliegens ausgegeben, und wenn das Szenenwechsel-Erfassungssignal keine Erfassung eines Szenenwechsels anzeigt, wird ein Signal des Nichtvorliegens ausgegeben. Der Diskriminanzmodus bedeutet das Modussignal, das ein Ausgang des Bestimmungsgliedes 6 ist und oben beschrieben wurde. Das Symbol "X" in 41 bedeutet, daß der Zustand ungeachtet der Erfassung eines Szenenwechsels oder des Diskriminanzmodus nicht beeinflußt wird. Wie in 41 gezeigt, bestimmt der erste Schalter 62 einen Auswahlblock und gibt den Auswahlblock als einen kodierten Bock aus.
Der kodierte Block, der durch den ersten Schalter ausgewählt und ausgegeben worden ist, wird durch die DCT-Schaltung 8 einer zweidimensionalen Orthogonaltransformation unterzogen. Die orthogonaltransformierten Daten werden in der Quantisierungsschaltung 9 den Gewichtungs- und Schwellenwertprozessen oder dergleichen unterzogen, um in eine vorbestimmte Bit-Zahl in der jeweiligen Abfolge quantisiert zu werden. Die durch die Quantisierungsschaltung 9 quantisierten Daten werden durch den ersten Kodierer- 10 in für den Übertragungsweg 11 geeignete Codes umgewandelt und dann an den Übertragungsweg 11 übertragen.
Die durch die Quantisierungsschaltung 9 quantisierten Daten werden auch in die lokale Dekodierungsschleife 20 eingegeben, so daß eine Bewegungskompensationsvorhersage durchgeführt wird. Die in die lokale Dekodierungsschleife 20 eingegebenen Daten werden in der Umkehrquantisierungsschaltung 12 inversen Quantisierungs- und inversen Gewichtungsprozessen unterzogen und dann durch die Umkehr-DCT-Schaltung 13 einer inversen Orthogonaltransformation unterzogen. Ein dekodierter Block, welcher ein Ausgang der Umkehr-DCT-Schaltung 13 ist, wird in dem Addierglied 14 in der Einheit von Pixeln zu dem Vorhersageblock addiert, um ein wiedergegebenes Bild zu werden. Der in diesem Prozeß verwendete Vorhersageblock ist mit dem in dem Addierglied 14 verwendeten identisch. Der Block, welcher ein wiedergegebenes Bild in dem Subtrahierer 3 geworden ist, wird in eine vorbestimmte Adresse des Videospeichers 15 geschrieben.
Die Größe des Videospeichers 15 hängt von der Art des eingesetzten Vorhersageverfahrens ab. In dieser Ausführungsform wird angenommen, daß der Videospeicher 15 aus einer Mehrzahl von Feldspeichern besteht und daß durch die lokale Dekodierungsschleife 20 rekonstruierte Ausgabeblöcke in einer vorbestimmten Adresse gespeichert werden. Diese gespeicherten Bilder werden als Daten des Suchbereichts zur Bewegungskompensationsvorhersage verwendet. Ein Block, der aus einem Bild, welches aus vergangenen Ausgabeblöcken rekonstruiert ist, segmentiert ist und sich in einem Bewegungsschätzungssuchbereich befindet, wird von dem Videospeicher 15 an die MC-Schaltung 16 ausgegeben. Die Größe des Blocks des Bewegungsschätzungssuchbereichs beträgt i [Pixel] × j [Zeilen] (wobei i ≥ m, j ≥ n, und i und j positive ganze Zahlen sind). Daten in dem Suchbereich zur Bewegungskompensationsvorhersage von dem Videospeicher 15 und ein Eingabeblock von dem Videospeicher 60 werden in die MC-Schaltung 16 als Referenzdaten eingegeben, wodurch Bewegungsvektoren extrahiert werden.
Die durch die MC-Schaltung 16 extrahierten Bewegungsvektoren werden in die MIX-Schaltung 63 eingegeben und darin mit dem durch das Bestimmungsglied 6 bestimmten Modussignal und dem SW-Erfassungssignal aus der SW-Erfassungsschaltung 61 kombiniert. Die kombinierten Signale werden durch den zweiten Kodierer 18 in für den Übertragungsweg 11 geeignete Codes umgewandelt und dann zusammen mit dem entsprechenden kodierten Block an den Übertragungsweg 11 ausgegeben. Die MC-Schaltung 16 gibt in Blöcke gebrachte Signale aus, welche aus dem Suchbereich in der Größe (m [Pixel] × n [Zeilen]) gleich der des Eingabeblocks segmentiert sind, als einen Vorhersageblock aus. Der von der MC-Schaltung 16 ausgegebene Vorhersageblock wird aus vergangener Videoinformation erzeugt. Der Vorhersageblock wird dem zweiten Schalter 64 zugeführt und in Übereinstimmung mit dem gegenwärtig verarbeiteten Feld, dem Modussignal des dekodierten Blocks und dem SW-Erfassungssignal aus der SW-Erfassungsschaltung 61 ausgegeben. Insbesondere wird der Vorhersageblock in Übereinstimmung mit dem verarbeiteten Feld und dem SW-Erfassungssignal von einem der Ausgangsanschlüsse des zweiten Schalters 64 und in Übereinstimmung mit dem Modussignal des gegenwärtigen dekodierten Blocks, dem SW-Erfassungssignal und dem verarbeiteten Feld von dem anderen Ausgangsanschluß an den Subtrahierer 3 ausgegeben.
Der Bewegungskompensationsvorhersageprozeß ist in 42 gezeigt. In 42 wird angenommen, daß ein Szenenwechsel zwischen dem zweiten Feld F2 und dem dritten Feld F3 auftritt. Nachdem es keinen Szenenwechsel zwischen dem ersten Feld F1 und dem zweiten Feld F2 gibt, wird das zweite Feld F2 aus dem ersten Feld F1 vorhergesagt. Der Szenenwechsel zwischen dem zweiten Feld F2 und dem dritten Feld F3 wird erfaßt, und das dritte Feld F3 wird in gleicher Weise wie das erste Feld F1 ein Intrafeld. Dann wird das vierte Feld F4 aus dem dritten Feld F3 vorhergesagt. Die Vorhersage wird niemals auf der Grundlage eines Bildes vorgenommen, das vor einem Szenenwechsel vorliegt. Nachdem der Bewegungskompensationsvorhersageprozeß für das vierte Feld F4 abgeschlossen ist, wird wieder die Bewegungskompensationsvorhersage durchgeführt, wobei das nächste Feld als ein Intrafeld verwendet wird. Daher tritt sicher ein Intrafeld alle vier Felder auf, wenn der Bewegungskompensationsvorhersageprozeß einmal beginnt, und wenn ein Szenenwechsel auftritt, liegt auch in dem Bewegungskompensationsvorhersageprozeß ein Intrafeld vor.
Die Betriebsweise in Ausführungsform 10 wird mit Bezug auf die Flußdiagramme von 43 und 44 zusammengefaßt werden. 43 ist ein Flußdiagramm, welches den gesamten Ablauf in Ausführungsform 10 zeigt, und 44 ist ein Flußdiagramm des Vorhersagefeldprozesses in Schritt S406 in 43.
Zuerst wird die ein Feld in einer Bewegungskompensationsvorhersageprozeßeinheit anzeigende Feldnummer auf 0 gesetzt (Schritt S401). Diese Festlegung der Feldnummer ist die gleiche wie in Ausführungsform 3. Nachdem der Bewegungskompensationsprozeß gerade begonnen wurde, ist das anfänglich zu verarbeitende Feld sicher das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld, und daher wird die Feldnummer fn in Schritt S401 auf 0 gesetzt. Ein Szenenwechselerfassungsflag Cfn, welches als ein Flag fungiert, um zu beurteilen, ob ein Szenenwechsel vorliegt, wird in Schritt S401 zur Initialisierung auf 0 gesetzt.
Dann werden die Eigenschaften eines Eingabebildes mit denen eines vergangenen Bildes durch einen bestimmten Parameter verglichen, um das Vorliegen eines Szenenwechsels zu erfassen (Schritt S402). Zum Beispiel wird das Vorliegen eines Szenenwechsels durch Vergleichen der Varianz von Werten von Pixeln in einigen vorbestimmten Bereichen des vergangenen Bildes mit der Varianz von Werten von Pixeln in einigen vorbestimmten Bereichen des gegenwärtig verarbeiteten Bildes verglichen. Wenn ein Szenenwechsel erfaßt wird, wird das Szenenwechselerfassungsflag Cfn auf 1 gesetzt (Cfn = 1), und wenn kein Szenenwechsel erfaßt wird, wird das Szenenwechselerfassungsflag Cfn auf 0 gesetzt (Cfn = 0).
Dann wird die Feldnummer fn geprüft; um zu beurteilen, ob sie 0 ist oder ob das Feld das erste Feld in der Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld ist (Schritt S403). Falls die Feldnummer fn 0 ist (fn = 0), wird dieses Feld als ein Intrafeld verarbeitet (Schritt S405). Wenn dagegen die Feldnummer fn nicht 0 ist (fn ≠ 0), schreitet der Prozeß zu dem nächsten Schritt S404 fort. Es wird beurteilt, ob das Szenenwechselerfassungsflag Cfn 0 ist (Cfn = 0) oder es einen Szenenwechsel zwischen dem verarbeiteten Feld und dem zum Kodieren des Feldes mit Bewegungskompensationsvorhersage erforderlichen Referenzbild gibt (Schritt S404). Falls das Flag Cfn 0 ist (Cfn = 0), liegt kein Szenenwechsel vor, und das zu verarbeitende Feld wird als ein Vorhersagefeld verarbeitet (Schritt S406). Falls das Flag Cfn 1 ist (Cfn = 1), liegt ein Szenenwechsel vor, und daher wird das zu verarbeitende Feld als ein Intrafeld verarbeitet (Schritt S405). Daher wird auch dann, wenn ein Feld in der Bewegungskompensationsvorhersageprozeßeinheit ist und die Feldnummer nicht 0 ist, das Feld als ein Intrafeld verarbeitet, wenn ein Szenenwechsel erfaßt wird und das Flag Cfn 1 ist.
Nach Verarbeitung jedes Feldes wird die Feldnummer fn inkrementiert, um das nächste Feld anzuzeigen (Schritt S407). In einem tatsächlichen Gerät kann eine solche Feldnummer durch ein Signal von einem Mikrocomputer oder dergleichen gesteuert werden.
Dann wird beurteilt, ob die das nächste Feld anzeigende Feldnummer fn einen Nummer ist, die ein Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit anzeigt (Schritt S408). Falls die Feldnummer fn eine Nummer ist, die nicht ein Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit ist, zum Beispiel in 4 (falls fn = 4, 4), zeigt dies an, daß eine Abfolge von Bewegungskompensationsvorhersageprozeßeinheiten abgeschlossen worden ist, weil die Bewegungskompensationsvorhersageprozeßeinheit innerhalb von vier Feldern abgeschlossen worden ist und die Feldnummer fn eines Intrafeld auf 0 gesetzt worden ist. Falls fn < 4, wird beurteilt, daß das nächste Feld innerhalb der Bewegungskompensationsvorhersageprozeßeinheit ist, und der Prozeß wird von der Erfassung des Szenenwechsels für den Prozeß des nächsten Feldes erneut begonnen. Wenn die Bewegungskompensationsvorhersageprozeßeinheit abgeschlossen worden ist, wird beurteilt, ob alle der erforderlichen Felder verarbeitet worden sind (Schritt S409). Diese Beurteilung kann zum Beispiel durch Prüfen des Betriebs eines Endschalters des Hochleistungskodierers vorgenommen werden. Falls das nächste Feld zu verarbeiten ist, werden, um die nächste Bewegungskompensationsvorhersageprozeßeinheit zu kodieren, die Variablen initialisiert, und der Prozeß wird von der Erfassung des Szenenwechsels erneut begonnen. Falls der Vorgang des Hochleistungskodierers abgeschlossen ist, wird beendet.
Als nächstes wird der Vorhersagefeldprozeß (Schritt S406 in 43) in Ausführungsform 10 mit Bezug auf das Flußdiagramm von 44 beschrieben werden. Das Feld, welches in Schritt S404 in 43 bestimmt worden ist, um als ein Vorhersagefeld verarbeitet zu werden, wird in Blöcke einer vorbestimmten Größe von m [Pixel] × n [Zeilen] in dem verarbeiteten Feld gebracht (Schritt S451). Die in die Größe von m × n segmentierten Blöcke werden einer Bewegungskompensationsvorhersage unterzogen (Schritt S452). Die Differenzleistung P1 wird aus einem Differenzblock berechnet, welcher die Differenz in der Einheit von Pixeln zwischen einem vorbestimmten Bereich eines vergangenen Bildes und dem Block, der gerade segmentiert worden ist, ist. Die ursprüngliche Wechselstromleistung P2, die in dem Zustand Blocks gehalten wird, wird berechnet (Schritt S454).
Die berechneten Leistungen P1 und P2 werden im Betrag miteinander verglichen (Schritt S455). wenn die Differenzleistung P1 kleiner als die ursprüngliche Wechselstromleistung P2 ist, wird der Differenzblock (der Differenzwert des der Bewegungskompensationsvorhersage unterzogenen Blocks) ausgewählt (Schritt S456). Wenn die Differenzleistung P1 größer als die ursprüngliche Wechselstromleistung P2 ist, wird der Eingabeblock (das Original, welches in Blockform gebracht und keinem weiteren Prozeß unterzogen worden ist) ausgewählt (Schritt S457). Jeder ausgewählte Block wird der Orthogonaltransformation unterzogen (Schritt S458), und in eine vorbestimmte, für jede Abfolge festgelegte Bit-Zahl quantisiert (Schritt S459). In einer Orthogonaltransformation wie zum Beispiel etwa DCT wird eine Quantisierung derart durchgeführt, daß ein größerer Bit-Wert einer Gleichspannung und niederwertigen Wechselstrom-Sequenzen zugeordnet wird und ein kleinerer Bit-Wert einer höherwertigen Wechselstrom-Sequenz zugeordnet wird. Die quantisierten Daten werden in für eine Übertragung geeignete Codes umgewandelt (Schritt S460), und die kodierten Daten werden übertragen (Schritt S461). Zum Beispiel wird durch Zählen der Anzahl von verarbeitetn Blöcken beurteilt, ob der Prozeß eines Feldes abgeschlossen worden ist (Schritt S462). Fall der Prozeß eines Feldes noch nicht abgeschlossen worden ist, wird der Prozeß für den nächsten Block verfolgt. Falls der Prozeß des einen Feldes abgeschlossen worden ist, wird der Vorhersagefeldprozeß beendet.
Gemäß Ausführungsform 10 wird, wenn ein Szenenwechsel in einem Bewegungskompensationsvorhersageschritt auftritt, wie in 42 gezeigt, das Feld unmittelbar nach dem Szenenwechsel als ein Intrafeld festgelegt, wodurch eine subjektive Einschätzung des Bildes unmittelbar nach dem Szenenwechsel verbessert werden kann.
Ausführungsform 11
In Ausführungsform 10 ist auch dann, wenn ein Szenenwechsel in einem Schritt eines Bewegungskompensationsvorhersageprozesses auftritt und das Bild unmittelbar nach dem Szenenwechsel als ein Intrafeld festgelegt wird, die zeitlich festgelegte Länge in dem Bewegungskompensationsvorhersageprozeßschritt für vier Felder festgelegt. Insbesondere erscheint sicher alle vier Felder ein Intrafeld, wenn der Bewegungskompensationsvorhersageprozeß einmal beginnt, und wenn ein Szenenwechsel auftritt, liegt auch in dem Bewegungskompensationsvorhersageschritt ein Intrafeld vor. Dies ist eine Konfiguration, in der ein Vorhersagefeld durch ein Intrafeld ersetzt wird.
Gemäß Ausführungsform 11 wird, wenn ein Szenenwechsel auftritt, wie in 45 gezeigt, und das Feld unmittelbar nach dem Szenenwechsel als ein Intrafeld festgelegt wirde, das Intrafeld als das erste Feld in der Bewegungs kompensationsvorhersageprozeßeinheit festgelegt. Das heißt, die zeitlich festgelegte Länge in dem Bewegungskompensationsvorhersageschritt ist veränderlich. Üblicherweise wird die zeitlich festgelegte Länge in dem Bewegungskompensationsvorhersageschritt für vier Felder festgelegt, wie in 45 gezeigt. Wenn in dem Bewegungskompensationsvorhersageschritt ein Szenenwechsel auftritt, wird das Feld unmittelbar nach dem Szenenwechsel als ein neues Intrafeld festgelegt, und die Bewegungskompensationsvorhersage wird, beginnend mit diesem Feld, in der Einheit von vier Feldern durchgeführt. Wenn in diesem Bewegungskompensationsvorhersageschritt ein Szenenwechsel auftritt, wird das Feld unmittelbar nach diesem Szenenwechsel in ähnlicher Weise als ein neues Intrafeld festgelegt, und die Bewegungskompensationsvorhersage wird, beginnend mit diesem Feld, in der Einheit von vier Feldern durchgeführt.
46 ist ein Flußdiagramm, welches den gesamten Ablauf in Ausführungsform 11 zeigt. In 46 sind mit den gleichen Schrittnummern wie den in 43 verwendete Abschnitte mit denen in 43 identisch. Die Prozesse von Schritt S401 bis Schritt S406 sind die gleichen wie in Ausführungsform 10. Der Intrafeld-Prozeß und der Vorhersagefeldprozeß in Schritten S405 und S406 sind die gleichen wie in der Ausführungsform 10. Bezügliche eines Feldes, welches in Schritt S405 als ein Intrafeld verarbeitet worden ist, wird die Feldnummer fn auf 0 gesetzt (fn = 0), um die Bewegungskompensationsvorhersageprozeßeinheit, in der das erste Feld dieses verarbeitete Feld ist, umzuschalten (Schritt S490). In Ausführungsform 10 wird auch dann, wenn ein Feld zum Beispiel als ein Intrafeld verarbeitet wird, die Feldnummer fn sequentiell in der Reihenfolge von 0 → 1 → 2 → 3 → 0 ... geändert, wie in 45 gezeigt. In Ausführungsform 11 wird, wenn ein Feld, das nicht das erste Feld in der Bewegungskom pensationsvorhersageprozeßeinheit ist, als ein Intrafeld verarbeitet wird, die Feldnummer fn dieses Feldes erzwungenermaßen auf 0 gesetzt, und dieses Feld wird als das erste Feld der neuen Bewegungskompensationsvorhersageprozeßeinheit festgelegt. Dies ermöglicht, daß die zeitlich festgelegte Länge in der Bewegungskompensationsvorhersageprozeßeinheit veränderlich ist. Wenn ein Szenenwechsel mit einer zeitlich kürzeren Frequenz als der zeitlich festgelegten Länge auftritt, wird die zeitlich festgelegte Länge in der Bewegungskompensationsvorhersageprozeßeinheit eine Abfolge kurzer Längen. Die Prozesse von Schritt S407 bis Schritt S409 sind die gleichen wie in Ausführungsform 10.
Gemäß Ausführungsform 11 wird das Bild unmittelbar nach dem Szenenwechsel als ein Intrafeld festgelegt, wodurch eine subjektive Einschätzung des Bildes verbessert wird. Wenn der Zeitabstand zwischen Szenenwechseln länger als die zeitlich festgelegte Länge in der Bewegungskompensationsvorhersageprozeßeinheit und die Frequenz von Szenenwechseln niedrig ist, ist die Anzahl von Feldern eines Intrafeldes kleiner als in Ausführungsform 3, so daß die Informationsmenge reduziert werden kann.
Ausführungsform 12
In Ausführungsformen 10 und 11 wird ein Prozeß durchgeführt, während ein Feld (oder Rahmen), in welchem ein Szenenwechsel erfaßt wird, als ein Intrafeld (oder Intrarahmen) festgelegt wird. Alternativ kann ohne Festlegen als ein Intrafeld (oder Intrarahmen) das Referenzbild des Feldes (oder Rahmens) als ein Intrafeld (oder Intrarahmen), welches zu der nächsten Bewegungskompensationsvorhersageprozeßeinheit gehört, festgelegt werden.
Ausführungsform 12 wird mit Bezug auf 47 beschrieben werden. 47(a) zeigt einen üblichen Bewegungskompensationsvorhersageprozeß, der durch das Verfahren in 4 durchgeführt wird. In diesem Beispiel fungieren Felder F10 und F14 als ein Intrafeld. Die Bewegungskompensationsvorhersage wird durchgeführt, während diese Felder F10 und F14 als das erste Feld der Bewegungskompensationsvorhersageprozeßeinheit festgelegt werden. Dann werden, wenn ein Szenenwechsel zwischen Feld F11 und Feld F12 auftritt, wie in 47(b) gezeigt, und der Szenenwechsel in Feld F12 erfaßt wird, Felder von Feld F12 bis zu dem letzten Feld (in diesem Beispiel Feld F13) der Bewegungskompensationsvorhersageprozeßeinheit einschließlich Feld F12 mit der nächsten Bewegungskompensationsvorhersageprozeßeinheit kombiniert, und Felder F12 und F13 werden einer Bewegungskompensationsvorhersage unterzogen, in welcher ein zu der nächsten Bewegungskompensationsvorhersageprozeßeinheit gehörendes Intrafeld als das Referenzbild verwendet wird. In der nächsten, mit diesen Feldern kombinierten Bewegungskompensationsvorhersageprozeßeinheit werden eine normale Bewegungskompensationsvorhersage und die Bewegungskompensationsvorhersage für das kombinierte Feld wie oben durchgeführt.
Ausführungsform 13
In Ausführungsform 12 ist die Bewegungskompensationsvorhersageprozeßeinheit manchmal länger als die gewöhnliche. Gemäß Ausführungsform 13 werden P Felder (oder P Rahmen), welche mit einem Feld (oder Rahmen), in dem ein Szenenwechsel erfaßt wird, beginnen und welche eine der Länge einer üblichen Bewegungskompensationsvorhersageprozeßeinheit entsprechende Gesamtlänge aufweisen, einer Bewegungskompensationsvorhersage unterzogen.
Ausführungsform 13 wird mit Bezug auf 48 beschrieben werden. 48(a) zeigt einen üblichen Bewegungskompensationsvorhersageprozeß, der durch das Verfahren in 4 durchgeführt wird. In diesem Beispiel fungieren Felder F10 und F14 als ein Intrafeld. Während diese Felder F10 und F14 als das erste Feld einer Bewegungskompensationsvorhersageprozeßeinheit festgelegt werden, wird eine Bewegungskompensationsvorhersage durchgeführt. Dann wird, wenn ein Szenenwechsel zwischen Feld F11 und Feld F12 auftritt, wie in 48(b) gezeigt, und der Szenenwechsel in Feld F12 erfaßt wird, eine Abfolge von vier Feldern (dies, weil eine Bewegungskompensationsvorhersageprozeßeinheit aus vier Feldern besteht), die mit Feld F12 beginnt, in welchem der Szenenwechsel erfaßt wird, in eine Bewegungskompensationsvorhersageprozeßeinheit ausgebildet. Feld F14, das in einem üblichen Fall das erste Feld der nächsten Bewegungskompensationsvorhersageprozeßeinheit und ein Intrafeld sein kann, wird als ein Intrafeld in der gegenwärtigen Bewegungskompensationsvorhersageprozeßeinheit festgelegt, und dann wird eine Bewegungskompensationsvorhersage durchgeführt. Wenn die Bewegungskompensationsvorhersage für vier Felder, beginnend mit Feld F12, oder die für Felder F12 bis F15 abgeschlossen ist, beginnt die übliche Bewegungskompensationsvorhersage wieder bei Feld F16, wie es vorher war.
Ausführungsform 14
In Ausführungsformen 3 bis 13 wird ein Umschalten mit Bezug auf einen Szenenwechsel erläutert. Ein Referenzbild kann in Übereinstimmung mit der Anzahl von Intra-Betriebsarten, die erzwungenermaßen in Blöcken erzeugt worden sind, umgeschaltet werden. Demgemäß kann sogar in einem Bild, in dem viele erzwungene Intra-Betriebsarten auftauchen, oder in einem Fall, daß ein Objekt, das in einem Feld vorher nicht existiert hat, in dem gegenwärti gen Feld plötzlich auftaucht, oder ein Objekt, das in einem Feld vorher existiert hat, aus dem gegenwärtigen Bild plötzlich verschwindet, ein Referenzbild durch ein ähnliches Verfahren umgeschaltet werden.
Ausführungsform 15
In Ausführungsformen 3 bis 13 wird zum Beispiel ein Prozeß, in welchem eine Bewegungskompensationsvorhersage wie in 4 gezeigt durchgeführt wird, auf einen Prozeß umgeschaltet, in welchem eine Bewegungskompensationsvorhersage wie in 28 gezeigt durchgeführt wird. Vor dem Umschalten kann eine Bewegungskompensationsvorhersage beliebiger Art durchgeführt werden, wie in 49 gezeigt. Nach der Erfassung eines Szenenwechsels oder dergleichen wird der Prozeß in eine Bewegungskompensationsvorhersage umgeschaltet, in welcher die erzeugte Informationsmenge auf ein niedrigeres Niveau als dem vor dem Umschalten reduziert wird, wie in 28 gezeigt.
Ausführungsform 16
In Ausführungsformen 3 bis 15 wird der Bewegungskompensationsvorhersageprozeß in der Einheit von vier Feldern durchgeführt. Die Anzahl von Feldern, welche als die Einheit verwendet werden kann, ist nicht notwendigerweise vier. Der Prozeß kann in einer Einheit einer beliebigen Anzahl von Feldern, auf welchen der Bewegungskompensationsvorhersageprozeß durchgeführt werden kann, durchgeführt werden.
Gemäß Ausführungsformen 3 bis 16 wird ohne große Vergrößerung der Speichermenge durch zusätzliches Bereitstellen einer Geräteumgebung wie zuvor beschrieben, selbst wenn ein Szenenwechsel in der Bewegungskompensationsvorhersageprozeßeinheit auftritt, ein Referenzbild von dem ursprünglich festgelegten Referenzbild umgeschaltet wird, um den durch den Szenenwechsel verursachten Einfluß zu minimieren, etc., das Bild unmittelbar nach dem Szenenwechsel als ein Referenzbild zur Bewegungskompensationsvorhersage festgelegt, und nach der Erfassung des Szenenwechsels werden Felder vor dem Szenenwechsel nicht als das Referenzbild zur Bewegungskompensationsvorhersage verwendet, wodurch eine Übertragung vorgenommen werden kann, während die Erhöhung der Codemenge aufgrund des Szenenwechsels auf ein Minimum unterdrückt wird, und ohne die Bildqualität zu verschlechtern.
Wenn eine Bewegungskompensationsvorhersage vor und nach einem Szenenwechsel durchgeführt wird, wird für gewöhnlich die Informationsmenge des Vorhersagebildes vermehrt. Daher kann durch Verarbeiten des Feldes als ein Intrabild mit einer dieser Informationsmenge gleichen Informationsmenge eine subjektive Einschätzung des Bildes verbessert werden. Während ein Bild unmittelbar nach einem Szenenwechsel durch Erfassen des Szenenwechsel als ein Intrabild festgelegt wird, kann eine Kodierung zwischen Feldern oder Rahmen so durchgeführt werden, daß eine subjektive Einschätzung des Bildes unmittelbar nach dem Szenenwechsel verbessert werden kann. Wenn ein Szenenwechsel auftritt, wird das Bild unmittelbar nach dem Szenenwechsel als ein Intrabild gehandhabt, und eine Bewegungskompensationsvorhersage wird mit dem Intrabild, welches das erste Bild ist, durchgeführt, wodurch die Anzahl erzeugter Intrabilder reduziert werden kann und die Menge an erzeugter Information nicht notwendigerweise erhöht wird.
Ausführungsform 17
50 ist ein Blockdiagramm, welches die Konfiguration einer Vorrichtung zur Aufzeichnung/Wiedergabe von Videoinformation gemäß der Erfindung zeigt. In 50 sind die Bezugsziffern 101 bis 111 die gleichen wie die in der herkömmlichen Vorrichtung in 17 oder 23 verwendeten.
Nachstehend wird der Aufzeichnungsprozeß beschrieben. Ein in den A/D-Wandler 101 eingegebenes Videosignal wird in ein digitales Videosignal umgewandelt und an den Hochleistungskodierer 110 ausgegeben. Der Hochleistungskodierer 110 führt die Redundanzverminderung unter Verwendung einer Autokorrelation der Videoinformation, des menschlichen Sehverhaltens und der Datenerzeugungsfrequenzvorgabe durch, um die Information (deren Einzelheiten später beschrieben werden) zu komprimieren. Der Ausgang des Hochleistungskodierers 110 wird an den Fehlerkorrekturkodierer 102 angelegt, in welchem ihm Fehlerkorrekturcodes zum Korrigieren von Übertragungsfehlern hinzugefügt werden. In diesem Prozeß werden hinzuzufügende Codes, welche ein hohes Fehlerkorrekturvermögen und eine kleine Informationsmenge aufweisen, verwendet, um eine hochdichte Aufnahme durchzuführen, und weil auch ein kleiner Fehler in komprimierter Information einen Einfluß über einen weiten Bereich ausübt. Die Daten, zu welchen Fehlerkorrekturcodes hinzugefügt worden sind, werden durch den Modulator 103 zu einem für Magnetköpfe 106 und das Magnetband 105 geeigneten Signal moduliert. Der Modulator 103 führt auch andere Operationen wie etwa Unterdrückung von Gleichstrom- und niederfrequenten Komponenten für die Azimutaufnahme und das Hinzufügen eines Spurverfolgungssignals, welches die Aufzeichnungsfunktion der Magnetköpfe 106 unterstützt, durch. Das Aufnahmesignal, welches durch den Modulator 103 moduliert worden ist, wird durch die Magnetköpfe 106 auf dem Magnetband 105 aufgezeichnet. Die Magnetköpfe 106 sind auf der Rotationskopftrommel 104 so befestigt, daß sie durch die Rotation der Trommel 104 gedreht werden. Auf dem Magnetband 105 wird die sogenannte Schrägspurabstastaufzeichnung durchgeführt.
Als nächstes wird der Wiedergabeprozeß beschrieben. Das Signal, welches durch die Schrägspurabstastung auf dem Magnetband 105 aufgezeichnet worden ist, wird durch die auf der Rotationskopftrommel 104 befestigten Magnetköpfe 106 abgenommen und dann durch den Demodulator 107 demoduliert. Das demodulierte Signal wird durch den Fehlerkorrekturdekodierer 108 der Fehlererfassung und Fehlerkorrektur unterzogen. Die fehlerkorrigierten Daten werden durch den Hochleistungsdekodierer 111 expandiert, so daß sie von den komprimierten Codes in das ursprüngliche digitale Videosignal geändert werden. Das rekonstruierte digitale Videosignal wird durch den D/A-Wandler 109 in ein analoges Videosignal umgewandelt und dann ausgegeben.
51 zeigt anhand eines Diagramms ein Beispiel für das Bandformat in Ausführungsform 17. Videoinformation von vier Feldern ({720 + 360 × 2} × 480 × 4/2 = 11,06 Mbit) wird auf etwa 1,3 Mbit kompressionskodiert und dann zusammen mit einem Audiosignal und Fehlerkorrekturcodes in zehn Spuren aufgezeichnet. In der leitbandlosen Aufzeichnung unter Verwendung des Azimutverfahrens beträgt die Flächenaufnahmedichte 2,5 μm²/bit.
52 ist ein Blockdiagramm, welches die interne Konfiguration des Hochleistungskodierers 110 in 50 zeigt. In 52 bezeichnet 301 einen Subtrahierer, welcher die Differenz zwischen einem eingegebenen Originalsignal und einem Vorhersagesignal ausgibt, 302 bezeichnet einen ersten Schalter, welcher entweder das eingegebene Originalsignal oder den Ausgang des Subtrahierers 301 auswählt, 303 bezeichnet eine DCT-Schaltung, welche die DCT-Orthogonaltransformation durchführt, 304 bezeichnet eine Quantisierungsschaltung, welche zu kodierende Daten quantisiert, und 305 bezeichnet einen Kodierer für variable Längen, welcher Daten einer hohen Frequenz einen kurzen Code zuordnet, um die statistische Datenredundanz zu beseitigen. Die Elemente 306 bis 311 bilden einen lokalen Dekodierer zum Gewinnen eines Vorhersagesignals. Die Bezugsziffer 306 bezeichnet eine Umkehrquantisierungsschaltung, welche die quantisierten Daten wiederherstellt, 307 bezeichnet eine Umkehr-DCT-Schaltung, welche die inverse DCT ausführt, 308 bezeichnet einen Addierer, welcher das Vorhersagesignal dem Differenzsignal hinzufügt, um das Originalsignal zu rekonstruieren, 309 bezeichnet einen Bildspeicher, welcher lokal rekonstruierte Videodaten speichert, 310 bezeichnet eine Bewegungskompensationsschaltung, welche Bewegung aus dem eingegebenen Originalsignal erfaßt und die nächsten Vorhersagedaten ausgibt, und 311 bezeichnet einen zweiten Schalter, welcher in den Addierer 308 einzugebende Daten schaltet.
Der Betrieb des Hochleistungskodierers 110 wird nachfolgend beschrieben. Das Anfangsfeld eines Aufzeichnungseinheitsblocks wird als ein Intrafeld, welches die Zwischenebenenvorhersage nicht verwendet, kodiert. Nachdem der erste Schalter 302 den oberen Kontakt auswählt, wird ein eingegebenes digitales Videosignal durch die DCT-Schaltung 303 einer Orthogonaltransformation unterworfen. Die transformierten Daten werden durch die Quantisierungsschaltung 304 quantisiert und durch den Kodierer für variable Längen 305 in einen längenvariablen Code wie etwa einen Huffman-Code kodiert, um ausgegeben zu werden. Zur selben Zeit werden die quantisierten Daten durch die Umkehrquantisierungsschaltung 306 invers quantisiert und dann der Umkehr-DCT-Schaltung 307 zugeführt. In der Umkehr-DCT-Schaltung 307 werden die orthogonal transformierten Daten in die Original-Videodaten invertiert und dann an den Addierer 308 ausgegeben. In dem Intrafeld wählt der zweite Schalter 311 auch den oberen Kontakt aus, so daß der eine Eingang des Addierers 308 Null ist. Daher wird der Ausgang der Umkehr-DCT-Schaltung 307 unverändert an den Bildspeicher 309 angelegt, um darin gespeichert zu werden.
Beim Kodieren des nächsten Feldes wird Zwischenebenenvorhersage verwendet. Bei Zwischenebenenvorhersage wählen sowohl der erste als auch der zweite Schalter 302 und 311 ihren unteren Anschluß. Ein eingegebenes digitales Videosignal tritt in den Subtrahierer 301 und die Bewegungskompensationsschaltung 310 ein. Die Bewegungskompensationsschaltung 310 vergleicht das gespeicherte Bild mit dem eingegebenen Bild und gibt Bewegungsvektoren des eingegebenen Bildes und eines Vorhersagebildes aus, um in der Vorhersagekodierung verwendet zu werden. Der Subtrahierer 301 berechnet die Differenz zwischen dem Eingangsbild und dem Vorhersagebild und gibt es als ein Vorhersagedifferenzsignal an die DCT-Schaltung 303 aus. Verglichen mit einem rohen Videosignal weist ein Vorhersagedifferenzsignal eine kleinere Informationsmenge auf, wobei die Vorhersagegenauigkeit ansteigt. Zum Beispiel ist ein Vorhersagedifferenzsignal für ein völlig stillstehendes Bild Null. In gleicher Weise wie das Anfangsfeld werden die in die DCT-Schaltung 303 eingegebenen Daten durch die DCT-Schaltung 303 und die Quantisierungsschaltung 304 der Orthogonaltransformation und Quantisierung unterworfen und dann durch den längenvariablen Kodierer 305 in Längenvariable Codes umgewandelt, um ausgegeben zu werden. Andererseits werden die quantisierten Daten durch die Umkehrquantisierungsschaltung 306 an die Umkehr-DCT-Schaltung 307 angelegt, um der inversen Quantisierung und inversen Orthogonaltransformation unterworfen zu werden, und dann an den Addierer 308 gesendet. Nachdem das in dem Prozeß des Gewinnens der Vorhersagedifferenz verwendete Vorhersagebild an den anderen Eingangsanschluß des Addie rers 308 angelegt wird, ist der Ausgang des Addierers 308 gleich dem Eingangsbild. Der Ausgang des Addierers 308 wird in dem Bildspeicher 309 gespeichert. In gleicher Weise wie oben beschrieben wird der Prozeß des Kodierens von n Feldern fortgeführt.
53 zeigt ein Beispiel für die Variation der Menge der für jeden Rahmen erzeugten Codes. In diesem Beispiel ist zu bemerken, daß ein Intrafeld, welches nicht die Zwischenebenenvorhersage verwendet, nach jeweils sieben Feldern angeordnet ist, wodurch die Informationsmenge erhöht wird. 54 zeigt ein Beispiel für die Beziehung zwischen in jedem Feld aufgezeichneter Information und dem Schreiben in Spuren. In diesem Beispiel werden Daten von vier Feldern in zehn Spuren aufgezeichnet. Die Datenmenge eines Feldes kann kein integrales Mehrfaches der Aufnahmekapazität einer Spur sein.
Es ist nicht immer notwendig, Daten in zehn Spuren aufzuzeichnen, Daten können auch in acht oder sechs Spuren abhängig von der aufzuzeichnenden Informationsmenge aufgezeichnet werden.
Wie oben beschrieben, kann in Ausführungsform 17, nachdem Signale einer Mehrzahl von Feldern oder Rahmen in einer Aufzeichnungseinheit, welche in einer vorbestimmten Anzahl von Spuren aufzuzeichnen ist, gesammelt werden, jedes der aufgezeichneten Felder durch Durchführen der Wiedergabeverarbeitung auf einer vorbestimmten Anzahl von Spuren rekonstruiert werden. Daher können die Ausführungsformen die spezielle in einem VTR benötigte Wiedergabe und Editierung bewältigen. Nachdem die in der Aufzeichnung zu verwendende Anzahl von Spuren abhängig von der aufzuzeichnenden Informationsmenge ausgewählt wird, gibt es keine vergeudete Spur, wodurch Aufzeichnung und Wiedergabe für eine lange Zeitdauer durchgeführt werden können. Nachdem es des weiteren nicht notwendig ist, aufzuzeichnende Information so zu steuern, daß sie der Aufnahmekapazität jeder Spur angeglichen wird, gibt es keinen nutzlosen Anteil in jeder Spur, mit dem Ergebnis, daß das Aufzeichnen effizient durchgeführt werden kann. Nachdem darüberhinaus ein Intrabild, welches keine Zwischenebenenvorhersage verwendet, sicher in jeder Aufzeichnungseinheit vorliegt, kann ein rekonstruiertes Bild auch in einer speziellen Wiedergabe wie etwa einem Schnellsuchlauf leicht erhalten werden, und die Menge der aufzuzeichnenden Information kann, verglichen mit einem Vorhersagebild, welches die Zwischenebenenvorhersage verwendet, reduziert werden.
Man beachte, daß anstelle von Intrafeldern Intrarahmen verwendet werden können.

Claims

Videoinformationsaufzeichnungsvorrichtung zum Aufzeichnen eines digitalisierten Videosignals auf einem Medium, welche aufweist: Mittel (2) zum Segmentieren der digitalisierten Videosignale in Blöcke einer vorbestimmten Größe und Kodieren des digitalen Videosignals; Mittel (2, 30) zum Erzeugen eines Intrafeldes oder eines Intrarahmens, in welchem eine Bewegungskompensationsvorhersage für wenigstens ein Feld oder einen Rahmen in einer aus Videosignalen von n Feldern oder Rahmen ausgebildeten Prozesseinheit, wobei n eine beliebige Ganzzahl ist, welche nicht kleiner als 2 ist, nicht ausgeführt wird, um ein Videosignal zu erhalten, und Ausführen einer Bewegungskompensationsvorhersage mit dem Intrafeld oder dem Intrarahmen an jeweiligen Blöcken, die ein anderes Feld oder einen anderen Rahmen bilden, um ein Videosignal hiervon zu erhalten, Mittel zum Auswählen entweder der Bewegungskompensationsvorhersage oder einer erzwungenen Intramoduskodierung für einen Block, der ein Feld oder einen Rahmen bildet, an welchem die Bewegungskompensationsvorhersage auszuführen ist, und, wenn die erzwungene Intramoduskodierung ausgewählt wird, Übertragen zur Aufzeichnung eines den Intramodus anzeigenden Signals zusammen mit den kodierten Daten, die durch die Intramoduskodierung kodiert sind; und eine Aufzeichnungseinrichtung (103, 104, 106) zum Aufzeichnen von Prozesseinheiten jeweils in jeweiligen Aufzeichnungssegmenten, die durch Teilen eines Videoin formationsaufzeichnungsmediums in eine Mehrzahl von Segmenten einer vorbestimmten Datenlänge hergestellt sind, wobei jede Prozesseinheit in einer ganzen Zahl von Aufzeichnungssegmenten aufgezeichnet wird, wobei die Zahl in Übereinstimmung mit der Informationsmenge in der Prozesseinheit variiert.
Videoinformationsaufzeichnungsverfahren zum Aufzeichnen eines digitalisierten Videosignals auf einem Medium, mit den Schritten: Segmentieren der digitalisierten Videosignale in Blöcke einer vorbestimmten Größe und Kodieren des digitalen Videosignals; Erzeugen eines Intrafeldes oder eines Intrarahmens, in welchem eine Bewegungskompensationsvorhersage für wenigstens ein Feld oder einen Rahmen in einer aus Videosignalen von n Feldern oder Rahmen ausgebildeten Prozesseinheit, wobei n eine beliebige Ganzzahl ist, welche nicht kleiner als 2 ist, nicht ausgeführt wird, um ein Videosignal zu erhalten, und Ausführen einer Bewegungskompensationsvorhersage mit dem Intrafeld oder dem Intrarahmen an jeweiligen Blöcken, die ein anderes Feld oder einen anderen Rahmen bilden, um ein Videosignal hiervon zu erhalten, Auswählen entweder der Bewegungskompensationsvorhersage oder einer erzwungenen Intramoduskodierung für einen Block, der ein Feld oder einen Rahmen bildet, an welchem die Bewegungskompensationsvorhersage auszuführen ist, und, wenn die erzwungene Intramoduskodierung ausgewählt wird, Übertragen zur Aufzeichnung eines den Intramodus anzeigenden Signals zusammen mit den kodierten Daten, die durch die Intramoduskodierung kodiert sind; und Aufzeichnen von Prozesseinheiten jeweils in jeweiligen Aufzeichnungssegmenten, die durch Teilen eines Videoinformationsaufzeichnungsmediums in eine Mehrzahl von Segmenten einer vorbestimmten Datenlänge hergestellt sind, wobei jede Prozesseinheit in einer ganzen Zahl von Aufzeichnungssegmenten aufgezeichnet wird, wobei die Zahl in Übereinstimmung mit der Informationsmenge in der Prozesseinheit variiert.
Videoinformationsaufzeichnungsmedium, auf welchem ein digitalisiertes Videosignal aufgezeichnet wird, das aus einer Mehrzahl von durch Teilen eines Videoinformationsaufzeichnungsmediums in Segmente einer vorbestimmten Länge hergestellten Aufzeichnungssegmenten besteht, wobei: ein Intrafeld oder ein Intrarahmen erzeugt wird, in welchem eine Bewegungskompensationsvorhersage für wenigstens ein Feld oder einen Rahmen in einer aus Videosignalen von n Feldern oder Rahmen ausgebildeten Prozesseinheit, wobei n eine beliebige Ganzzahl ist, welche nicht kleiner als 2 ist, nicht ausgeführt wird, um ein Videosignal zu erhalten, in dem Fall, in dem das digitalisierte Videosignal in Blöcke einer vorbestimmten Größe segmentiert und kodiert ist, und ein Signal, welches einen Intramodus anzeigt, und kodierte Daten, die durch den Intramodus kodiert sind, aufgezeichnet werden, wenn eine Bewegungskompensationvorhersage mit dem Intrafeld oder dem Intrarahmen an jeweiligen Blöcken, die ein Videosignal eines anderen Feldes oder Rahmens für ein Videosignal hiervon bilden, auszuführen ist, eine Auswahl aus entweder der Bewegungskompensationsvorhersage oder einer erzwungenen Intramoduskodierung für einen ein Feld oder einen Rahmen, an welchem die Bewegungskompensationsvorhersage auszuführen ist, bildenden Block getroffen wird und die erzwungene Intramoduskodierung ausgewählt wird, wobei die als die Prozesseinheit aufgezeichnete Informationsmenge variabel ist und jede Prozesseinheit in jeweiligen Aufzeichnungssegmenten eines ganzzahligen Vielfachen in Übereinstimmung mit der darin enthaltenen Informationsmenge aufgezeichnet wird.
Eine Kombination, die ein Videoinformationsaufzeichnungsmedium gemäß Anspruch 3 mit einer Videoinformationswiedergabevorrichtung zum Wiedergeben von auf dem Videoinformationsaufzeichnungsmedium aufgezeichneten Videoinformationen aufweist, wobei die Videoinformationswiedergabevorrichtung aufweist: Mittel (104, 106) zum Auslesen eines kodierten Videosignals, welches der Prozesseinheit entspricht, aus dem Aufzeichnungsmedium und zum Erfassen des aufgezeichneten Signals, welches den Intramodus anzeigt; und Mittel (111) zum Extrahieren und Dekodieren eines Videosignals aus dem so ausgelesenen, kodierten Videosignal auf der Basis des aufgezeichneten, den Intramodus anzeigenden Signals.