-
Die
vorliegende Erfindung bezieht sich auf ein Verfahren und ein Gerät zum hocheffektiven
Codieren zur effizienten Umsetzung eines Zeilensprungvideosignals
in einen Strom komprimierten Codes zum Zwecke des Sendens oder des
Speicherns. Insbesondere bezieht sich die Erfindung auf die Codierverarbeitung,
die ein bidirektional bewegtes Prädiktionscodieren auf ein Zeilensprungvideosignal
anwendet.
-
Im
folgenden wird der Ausdruck "Bild" benutzt als allgemeiner
Ausdruck für
den Bezug auf die Inhalte eines Teilbildes oder eines Zeilensprungsignals
oder für
ein Vollbild einer Zeile-für-Zeile-Abtastung
(das heißt,
keine Zeilensprungabtastung) vom Videosignal.
-
Ein
Verfahren hocheffizienten Videocodierens für ein Zeilensprungvideosignal
ist bekannt, wodurch eines in jedem von m aufeinanderfolgenden Vollbildern
(wobei m eine Ganzzahl von 2 oder höher ist) codiert wird, entweder
unabhängig
durch internes Codieren oder durch unidirektionales prädiktives
Codieren, während
die restlichen Vollbilder (bezieht sich auf die B Vollbilder) durch
bidirektionales prädiktives Codieren
unter Verwendung vorhergehender und nachfolgender der zuvor genannten
speziellen Vollbilder (das heißt,
I- oder P-Vollbilder) codiert werden.
-
Derartiges
prädiktives
Codieren eines Videosignals ist allgemein bekannt und beispielsweise
beschrieben im japanischen offengelegten Patent mit der Nummer HEI
2-192378 vom selben Anwender der vorliegenden Erfindung. Die Technik
wird auch mit dem MPEG-1-System (ISO/IEC-11172) und dem MPEG-2-System
(ISO/IEC-13818) verwendet.
-
Aus
dem Obigen versteht sich, daß nach
einem derartigen Verfahren drei unterschiedliche Bildarten eingerichtet
werden, gemäß der Form
und der Codierung, die angewandt wird, das heißt, die I-Vollbilder, die P-Vollbilder
und die B-Vollbilder, und daß nur
die I-Vollbilder und die P-Vollbilder als Bezugsvollbilder zum Codieren
dienen.
-
Es
wird angenommen, daß die
Bildperiode 1/30 s beträgt,
das erste und das zweite Teilbild jeweils ein Vollbild eines Zeilensprungvideosignals zeitversetzt
sind um 1/60 s und auch wechselweise versetzt sind um eine Abtastzeilenposition
in Vertikalrichtung des Bildes. Im Ergebnis kann eine genaue Vorhersage
für den
Zweck der Bildcodierung nicht erreicht werden durch Anwenden eines
einfachen Zwischenbildprädiktionsverfahrens.
In einem solchen Falle wird ein Verfahren angewandt, wie MPEG-2-Norm
und andere, wodurch die Verarbeitung in Einheiten von Teilbildern
erfolgt, wobei eine Vielzahl von Teilbildern verwendet werden, ein
Bezugsbild zu erstellen, oder wodurch die Verarbeitung grundsätzlich ausgeführt wird
in Einheiten von Vollbildern, aber mit Prädiktion, die umgeschaltet ist
zum Ausführen
einer Lokalprädiktion
in Einheiten von Teilbildern, wenn dies erforderlich ist.
-
Insbesondere
im Falle der MPEG-2-Norm muß jede
der zuvor genannten Bildarten (das heißt, I, P, B) eingerichtet werden
in Einheiten von Vollbildern. Selbst wenn die Prädiktionsverarbeitung ausgeführt wird
in Einheiten von Teilbildern, müssen
die I-Bilder und die B-Bilder jeweils als aufeinanderfolgende Paare
von Teilbildern behandelt werden.
-
Welches
Verfahren auch immer verwendet wird, wenn Bewegung zwischen den
Inhalten der aufeinanderfolgenden Teilbilder festgestellt wird,
erfolgt die Prädiktion
in Einheiten von Teilbildern. Aufgrund der Abtastzeilenkonfiguration
des Zeilensprungsignals werden in diesem Falle große Beträge von Überlappungskomponenten
erzeugt und codiert aufgrund des Ein-Zeilen-Vertikalversatzes zwischen aufeinanderfolgenden Zeilensprungteilbildern.
Selbst wenn im Ergebnis die Bildbewegung nur aus einer Parallelverschiebung
eines Bildes besteht, werden vergleichsweise große Beträge von Prädiktionsfehlerwerten erzeugt
und codiert, so daß die
prädiktive
Codierverarbeitung exzessiv hohe Codemengen erzeugt, das heißt, der
Gegenstand des Erzielens hoher Effizienz von Datenkompression durch
Codieren wird nicht erreicht.
-
5 ist
ein Beispiel der Konfiguration eines Videocodiergerätes nach
dem Stand der Technik, das die bidirektionale Prädiktion zum Codieren der B-Teilbilder
verwendet. Es wird angenommen, daß die Prädiktion in Einheiten von Teilbildern
erfolgt, daß aber
die Bildarten I, P und B in Einheiten von Zeilensprungvollbildern
eingerichtet werden, wie zuvor beschrieben.
-
Das
Zeilensprungvideosignal, das dem Videoeingangsanschluß 7 eingegeben
wird, gelangt an den Eingangssignalauswahlschalter 56,
der gesteuert wird zum Betrieb synchron mit den aufeinanderfolgenden
Teilbildern im eingegebenen Videosignal, so daß die I- und P-Bilder an einen
Subtrahierer 51 geliefert werden, während die B-Vollbilder an ein
Vollbildverzögerungselement 71 gelangen.
Angemerkt sei, daß der
Ausdruck "Videosignal", der hier verwendet
wird, ein digitales Videosignal bedeutet.
-
Eines
aus der Vielzahl aller m aufeinanderfolgenden Vollbilder im eingegebenen
Videosignal wird ausgewählt
als ein I- oder ein P-Vollbild, (wobei m im allgemeinen den Wert
von 2 oder 3 hat). Das Verhältnis
der I-Vollbilder zu den P-Vollbildern
ist eine Sache der ausgelegten Auswahl. Der Subtrahierer 51 subtrahiert
ein Zwischenbildprädiktionssignal
(das heißt,
bestehend aus aufeinanderfolgenden vorhergesagten Werten für jeweilige
Pixel eines Vollbildes), die erzeugt werden von einem Zwischenbildprädiktionsabschnitt 57 für das I-
oder das P-Vollbildsignal, das dorthin geliefert wird, und liefert
die sich ergebenden Differenzwert, das heißt die Prädiktionsfehlerwerte, an einen
DCT-Abschnitt 52. Der DCT- Abschnitt 52 führt eine
diskrete Kosinustransformationsverarbeitung bezüglich aufeinanderfolgende Sätze von
Prädiktionsfehlerwerten
aus, die jeweiligen Blöcken
von 8 × 8
(oder von 16 × 16)
Pixeln eines Bildes entsprechen, und die dadurch gewonnenen Transformationskoeffizienten
werden an einen Quantisierer 53 geliefert. Der Quantisierer
quantisiert die Koeffizienten unter Verwendung einer vorbestimmten
Quantisierungsschrittweite, und die sich ergebende feststehende
Länge codierter
Koeffizienten wird geliefert an einen längenvariablen Codierer 54 und
an einen Entquantisierer 55.
-
Der
längenvariable
Codierer 54 führt
Gliederungsumsetzung der zweidimensionalen 8 × 8 Sätze von Koeffizienten aus in
eine eindimensionale Sequenz unter Verwendung einer Zickzacksequenzverarbeitung
und codiert das Ergebnis durch Huffman-Codierung, das heißt unter
Verwendung von Anzahl von Durchläufen
von Koeffizientenwerten von Null oder von Koeffizientenwerten, die
sich von Null unterscheiden. Die resultierenden Codesequenzen werden
in I- und P-Vollbilder eingegeben, die jeweils umgesetzt worden
sind, und werden dem Multiplexverfahren unterzogen mit den Codesequenzen,
die für
die B-Bilder gewonnen werden, durch den Multiplexer 13,
und der sich ergebende Codestrom wird geliefert an den Codeabgabeanschluß 14.
-
Der
Entquantisierer 55 und der inverse DCT-Abschnitt 60 führen die
inverse Verarbeitung so aus, daß der
Quantisierer und der DCT-Abschnitt 52, durch den die Zwischenbildprädiktionsfehlerwerte wiedergegeben
werden, und die Werte, die solchermaßen gewonnen sind, zum Prädiktionssignal
vom Addierer 59 addiert werden, um Werte zu gewinnen, die
aufeinanderfolgende rekonstruierte Bilder ausdrücken, die geliefert werden
in den Bildspeicher 58. Die rekonstruierten Bilder, die
solchermaßen
im Bildspeicher 58 gespeichert sind, werden danach ausgelesen
und an den Zwischenbildprädiktionsabschnitt 57 zu
passenden Zeiten geliefert.
-
Der
Zwischenbildprädiktionsabschnitt 57 erzeugt
unterschiedliche Prädiktionssignale
gemäß den jeweiligen
Bildarten (das heißt,
I, P oder B), liefert die Prädiktionssignale,
hergeleitet aus den I- und P-Vollbildern, an den Subtrahierer 51 und
liefert die Prädiktionssignale,
hergeleitet aus den B-Vollbildern, an einen Eingang des Subtrahierers 17.
-
Da
für ein
I-Vollbild keine Prädiktion
erfolgt, sind die Prädiktionssignalwerte
für ein
I-Vollbild immer gleich Null. Im Falle eines P-Vollbildes wird das Prädiktionssignal
gewonnen auf der Grundlage des vorangehenden I- oder P-Vollbildes.
Im Falle eines B-Vollbildes wird das Prädiktionssignal gewonnen auf
der Grundlage eines vorangehenden und nachfolgenden I- oder P-Vollbildes.
-
Da
mit diesem Verfahren die Prädiktion
in Einheiten von Teilbildern erfolgt, können sowohl gradzahlige Teilbilder
als auch ungradzahlige Teilbilder eines rekonstruierten Vollbildes
als Bezugsbilder verwendet werden. Das Teilbild, das aus dem kleinsten
Betrag vom Prädiktionsfehler
hervorgeht, wird als Bezug für
das Herleiten des Prädiktionssignals
verwendet.
-
Wenn
ein B-Vollbildsignal vom Schalter 56 ausgewählt ist,
wendet der Vollbildverzögerungsabschnitt 61 eine
Verzögerung
von (m – 1)
Vollbildern an, und das verzögerte
B-Vollbildsignal wird dann dem Subtrahierer 17 zugeführt. Da
die Bildart in Einheiten von Vollbildern eingerichtet ist, muß die Verzögerung in
Einheiten von Vollbildperioden erfolgen. Das sich ergebende verzögerte Bildsignal
(das heißt aufeinanderfolgende
Pixelwerte) werden dem Subtrahierer 17 synchron mit den
vorhergesagten Werten eingegeben, die aus dem Zwischenbildprädiktionsabschnitt 57 kommen,
um jeweilige Prädiktionsfehlerwerte
für das
B-Vollbild zu erhalten,
die vom DCT-Abschnitt 18, dem Quantisierer 19 und
dem Codierer 20 variabler Länge in derselben Weise codiert sind
in derselben Weise wie für
den DCT-Abschnitt 52, den Quantisierer 53 und
den Codierer 54 variabler Länge.
-
Da
die B-Vollbilder nicht als Bezugsbilder zur Zwischenbildprädiktion
dienen, enthält
das Codiersystem für
die B-Vollbilder keinerlei lokalen Decodierabschnitt.
-
In 5 sind
das Verarbeitungssystem für die
I- und die P-Vollbilder
und das Verarbeitungssystem für
die B-Vollbilder jeweils getrennt. Da sich jedoch die Verarbeitung,
die von diesen ausgeführt wird,
grundsätzlich
gleicht (der Subtraktionsstufe folgend), wäre es ebenso möglich, alle
Verarbeitung mit einem einzigen System auszuführen durch geeigneten Multiplexbetrieb.
-
Die
Codesequenzen, die für
die B-Vollbilder gewonnen werden, multiplext der Multiplexer 13 mit den
Codesequenzen, die für
die I- und P-Vollbilder in unterschiedlicher Reihenfolge hergeleitet
sind aus der Reihenfolge der Vollbilder des ursprünglich eingegebenen
Videosignals. Das heißt,
die Reihenfolge muß verändert werden,
so daß sichergestellt
ist, daß die
Codesequenz für
jedes B-Vollbild nicht vom Codeausgangsanschluß 14 gesendet wird,
bis die Codesequenzen für
die I- oder P-Vollbilder, die verwendet wurden bei der prädiktiven
Codierung des B-Vollbildes, gesendet wurden.
-
Ein
Videodecodiergerät
gemäß dem Videocodiergerät von 5 ist
nachstehend beschrieben unter Bezug auf das Systemblockdiagramm
von 6. In 6 wird ein eingegebener Codestrom (das
heißt,
bestehend aus aufeinanderfolgenden Codesequenzen für jeweilige
Bilder I, P, B, die das Videocodiergerät von 5 erzeugt
hat) geliefert an einen Codeeingangsanschluß 33, um vom Demultiplexer 34 getrennt
zu werden in die Codesequenzen für die
I- und P-Vollbilder und die Codesequenzen für die B-Vollbilder.
-
Die
Codesequenzen für
die I- und die P-Vollbilder werden geliefert an einen Decoder 62 variabler Länge, um
auf das feststehende Codelängenformat wiederhergestellt
zu werden, dann werden rekonstruierte Prädiktionsfehlerwerte für ein Vollbild
vom Entquantisierer 75 und vom inversen DCT-Abschnitt 80 hergeleitet
und zu Prädiktionswerten
für dieses
Vollbild vom Addierer 79 zusammengesetzt, um Pixelwerte
zu gewinnen, die die rekonstruierten Bilder ausdrücken, die
in einem Bildspeicher 63 gespeichert sind.
-
Der
Zwischenbildprädiktionsabschnitt 64 erzeugt
Prädiktionssignale
und liefert diese an den Addierer 79 (im Falle der I- und
P-Vollbilder) und an den Addierer 41 (im Falle der B-Vollbilder).
Der Zwischenbildprädiktionsabschnitt 64 unterscheidet
sich im Betrieb vom Zwischenbildprädiktionsabschnitt 56 insofern,
daß die
Bewegungsabschätzung
oder die Prädiktionsmodusauswahl
nicht erfolgt, und arbeitet nur gemäß der gesendeten Information,
so daß der
ausgeführte
Verarbeitungsumfang viel größer ist
als der vom Zwischenbildprädiktionsabschnitt 57 ausgeführte.
-
Die
Codesequenzen für
B-Vollbilder werden decodiert vom Decoder 38 variabler
Länge,
vom Entquantisierer 39 und einem inversen DCT-Abschnitt 40,
um die rekonstruierten Prädiktionsfehlerwerte
zu gewinnen, die den zugehörigen
vorhergesagten Pixelwerten von einem Addierer 41 hinzugefügt wurden,
wodurch die rekonstruierten B-Vollbilder erzielt werden.
-
Der
Ausgabeauswahlschalter 42 wählt die Werte für die rekonstruierten
I- und P-Vollbilder aus, liest aus dem Bildspeicher 63 und
die rekonstruierten B-Bilder, die der Addierer 41 erzeugt
hat, um an den Bildausgabeanschluß 43 geliefert zu
werden. Dies erfolgt so, daß die
Reihenfolge, in der die werte für
jeweilige Vollbilder geliefert werden an den Bildausgabeanschluß 43,
identisch sind mit der Bildsequenz des Originalvideosignals (vor
der Codierung), was besser ist als die Reihenfolge, in der die codierten Datensequenzen
für die
Vollbilder vom Videocodiergerät
abgegeben werden.
-
Die
Pixelwerte für
jedes Vollbild werden an den Abgabeauswahlschalter 42 vom
Bildspeicher 63 geliefert, oder sie werden gewonnen vom
Addierer 41, wie ein Wertesatz für das erste Teilbild, das einem Wertesatz
für das
zweite Teilbild des Vollbildes folgt, so daß ein Zeilensprungvideosignal
aus dem Ausgangsanschluß 43 gewonnen
wird.
-
Mit
dem Zeilensprungvideocodiergerät
nach dem Stand der Technik kommt das Problem auf, daß selbst
wenn es nur einen kleinen Betrag an Bildbewegung gibt, es unmöglich wird,
eine genaue Zwischenbildprädiktion
auszuführen,
aufgrund der Aliasingkomponenten, die im Zeilensprungbildsignal
enthalten sind. Wie schon zuvor erwähnt, selbst wenn nur eine Parallelverschiebung
des Bildes erfolgt, wird ein wesentlicher Betrag des Zwischenbildprädiktionsfehlers
erzeugt. Wenn andererseits alle Zeilensprungbilder (das heißt, jedes
Teilbild eines jeden Vollbildes) umzusetzen sind zum progressiven
Abtasten von Bildern (das heißt,
für jeweilige
progressiv abgetastete Vollbilder) und dann codiert werden, könnte das
obige Problem umgangen werden. Da jedoch die Gesamtzahl von Abtastzeilen
eines jeden Bildes verdoppelt ist, muß der Umfang der Codierungs-
und der Decodierungsverarbeitung ausgeführt werden, und zwar entsprechend
verdoppelt, so daß praktisch
das Gerät
schwierig wird.
-
Es
ist eine Aufgabe der vorliegenden Erfindung, ein Videocodiergerät und ein
Videocodierverfahren anzugeben, und ein Videocodiergerät und ein Videodecodierverfahren,
und ein Codieraufzeichnungsmedium, wodurch die obigen Probleme des Standes
der Technik überwunden
werden können.
-
Ein
weiteres Problem, das beim Stand der Technik aufkommt, besteht darin,
daß wenn
ein Zeilensprungvideosignal gewonnen wird durch Wiedergabe aus einem
Aufzeichnungsmedium oder aus einer Sendequelle, die rekonstruierten
Zeilensprungbilder nicht geeignet sind zur Anzeige auf einem Monitor
des Progressivabtasttyps, wie er allgemein verwendet wird zur Anzeige
von Text, von Bildern und anderem, im Teilbild der Computer und
der Datenverarbeitung.
-
Es
ist folglich eine weitere Aufgabe der vorliegenden Erfindung, ein
Decodiergerät
zu schaffen, um auf einem Code betrieben zu werden, der erzeugt wird
von einem Videocodiergerät
gemäß der vorliegenden
Erfindung, wie zuvor beschrieben, wodurch ein abgegebenes decodiertes
Videosignal gewonnen wird, das ein Progressivabtastungsvideosignal
ist, und wodurch jedes der Teilbilder eines Originalzeilensprungvideosignals
umgesetzt wurde in ein Progressivabtastungsvollbild des abgegebenen
Videosignals aus dem Videodecodiergerät.
-
Um
die Probleme des Standes der Technik zu lösen, die zuvor aufgeführt wurden,
schafft die vorliegende Erfindung ein Videocodiergerät und ein
-verfahren und entsprechend ein Videodecodiergerät und -verfahren, wodurch ein
Zeilensprungvideosignal codiert und danach decodiert werden kann
als Serie von Codesequenzen, die Bilder ausdrücken, die jeweils codiert sind,
entweder durch Intrabildcodierung (das heißt, I-Bilder), durch unidirektionale
Prädiktionscodierung
(das heißt,
P-Bilder) oder durch bidirektionale prädiktive Codierung (das heißt, B-Bilder), womit
der Unterschied nach dem Stand der Technik darin besteht, daß:
- (a) die I-, P- und B-Bilder ausgewählt werden
in Einheiten von Teilbildern des Zeilensprungvideosignals, besser
als Vollbilder, und
- (b) jedes der Teilbilder, das ausgewählt ist als ein I- oder als
ein P-Bild, das heißt,
das verwendet wird als Bezugsbild bei der Prädiktionscodierung, wird umgesetzt
in ein Progressivabtastungsvollbild, das doppelt soviel Abtastzeilen
von den Teilbildern des Originalvideosignals hat.
-
Das
heißt,
eine verbesserte Prädiktion
wird erreicht durch periodische Auswahl spezieller Teilbilder eines
Zeilensprungvideosignals, das umzusetzen ist in jeweilige Progressivabtastungsvollbilder,
womit eine Codierung und Decodierung eines jeden derartigen progressiv
abgetasteten Vollbildes durch unabhängiges Codierung oder durch
unidirektionales prädiktives
Codieren erfolgt, während
die restlichen Teilbilder unverändert
bleiben als Zeilensprungabtastteilbilder, und durch Ausführen der
bidirektionalen Prädiktivcodierung
und -decodierung eines solchen Zeilensprungabtastteilbildes unter
Verwendung vorangehender und nachfolgender progressiv abgetasteter Vollbilder
als Bezugsvollbilder.
-
Da
im Ergebnis die Anzahl von Abtastzeilen eines jeden Teilbildes ausgewählt wird
als ein B-Bild zum Codieren unverändert übrig bleibt, führt die
Umsetzung der I- und P-Bilder in die progressiv abgetasteten Vollbilder
nicht zu dem Ergebnis einer exzessiven Codemenge, die erzeugt wird.
Jedoch kann der Codierabstand (das heißt, zwischen jedem Bild oder Teilbild,
das codiert wird, und den progressiv abgetasteten Vollbildern, die
verwendet werden als Bezugsbilder für diese Codierung) können dadurch
in effektiver Weise halbiert werden, verglichen mit Verfahren des
Standes der Technik, eine wesentlich verbesserte Kombination von
Codiereffizienz und -genauigkeit von Bewegungsprädiktion kann erzielt werden,
als je im Stand der Technik möglich
war.
-
Genauer
gesagt, die Erfindung stellt ein Videocodiergerät bereit und ein -verfahren,
ein Videodecodiergerät
und -verfahren und ein codiertes Videoaufzeichnungsmedium, wie in
den anliegenden Patentansprüchen
angegeben.
-
Die
vorliegende Erfindung kann im Ergebnis ein Videocodierverfahren
und -gerät
und ein Videodecodierverfahren und -gerät schaffen, wodurch ein Zeilensprungvideosignal
codiert werden kann mit einem sehr hohen Grad an Codiereffizienz,
und des weiteren wodurch der sich ergebende Code, nachdem er gesendet
und empfangen wurde, oder aufgezeichnet und wiedergegeben, decodiert
werden kann zum Wiederherstellen des Originalvideosignals als ein
Zeilensprungsignal oder als ein Progressivabtastungsvideosignal,
in dem jedes Teilbild des ursprünglich
codierten Videosignals umgesetzt ist in ein progressiv abgetastetes
Vollbild (doppelte Anzahl von Abtastzeilen eines Zeilensprungteilbildes),
das direkt angezeigt werden kann durch verschiedene Arten von Datenverarbeitungsanzeigegeräten usw.,
die nur für
ein progressiv abgetastetes Videosignal verwendet werden können.
-
KURZE BESCHREIBUNG
DER ZEICHNUNG
-
1 ist
ein allgemeines Systemblockdiagramm eines Ausführungsbeispiels eines Videocodiergerätes nach
der vorliegenden Erfindung;
-
2 ist
ein konzeptionelles Diagramm zur Darstellung der Beziehungen zwischen
den Abtastzeilenkonfigurationen aufeinanderfolgender I-, P-Progressivabtastungsvollbilder
und B-Teilbildern, die codiert werden durch das in 11 gezeigte
Ausführungsbeispiel;
-
3 ist
ein allgemeines Systemblockdiagramm eines ersten Ausführungsbeispiels
von einem Videodecodiergerät
nach der vorliegenden Erfindung zur Verwendung in Verbindung mit
dem Videocodiergerät
von 1;
-
4 ist
ein konzeptionelles Diagramm zur Darstellung der relativen Beträge der Codierverarbeitungszeitperioden,
die verfügbar
sind für
die I-, P- beziehungsweise B-Bilder, wenn das Videocodiergerät, Ausführungsbeispiel
von 1, abgewandelt wird zur Verwendung eines einzigen
Codiersystems für das
gemeinsame Codieren der I-, P- und B-Bilder durch Zeitmultiplexbetrieb;
-
5 ist
ein allgemeines Systemblockdiagramm eines Beispiels des Standes
der Technik von einem Videocodiergerät;
-
6 ist
ein allgemeines Systemblockdiagramm eines Beispiels nach dem Stand
der Technik von einem Videodecodiergerät zur Verwendung in Verbindung
mit dem Videocodiergerät
von 5;
-
7 ist
ein allgemeines Systemblockdiagramm eines zweiten Ausführungsbeispiels
von einem Videodecodiergerät
gemäß der vorliegenden
Erfindung zur Verwendung in Verbindung mit dem Videocodiergerät von 1,
wodurch ein codiertes Teilbildzeilensprungvideosignal umgesetzt
wird durch einen Codier/Decodierprozeß in ein Progressivabtastungsvideosignal;
und
-
8 ist
ein konzeptionelles Diagramm zur Darstellung der Beziehungen zwischen
den Abtastzeilenkonfigurationen von aufeinanderfolgenden I-, P-
und B-Progressivabtastungsvollbildern, die das Videodecodiergerät vom Ausführungsbeispiel
gemäß 7 erzeugt.
-
BESCHREIBUNG
BEVORZUGTER AUSFÜHRUNGSBEISPIELE
-
Ein
Ausführungsbeispiel
eines bewegungskompensierten Codiergerätes nach der vorliegenden Erfindung
ist nachstehend anhand unter Bezug auf das Systemblockdiagramm von 1 beschrieben. Elemente,
die in 1 identisch in ihrer Funktion und in ihrem Betrieb
zu Elementen des Videocodiergerätes,
Beispiel in 5, nach dem Stand der Technik sind,
sind mit identischen Vorzeichen wie jene in 5 versehen.
Grundsätzlich
unterscheidet sich das Gerät
von 1 von demjenigen in 5 dadurch,
daß es
einen Progressivabtastungsumsetzabschnitt 1 besitzt und
einen Abtastzeilendezimierungsabschnitt 15. Das Vollbildverzögerungselement 61 des
Gerätes
nach dem Stand der Technik von 5 ist ebenfalls
geändert
in ein Teilbildverzögerungselement 16,
und die Arbeitsweise des Eingangssignalauswahlschalters 8 vom
Zwischenbildprädiktionsabschnitt
unterscheidet sich jeweils von jenem des Eingangssignalauswahlschalters 56 beziehungsweise des
Zwischenbildprädiktionsabschnitts 57 vom
Codiergerät,
Beispiel in 5, nach dem Stand der Technik.
-
Die
mit diesem Ausführungsbeispiel
ausgeführte
Verarbeitung ist nachstehend beschrieben als Vergleich zum Videocodiergerät, Beispiel
von 5, nach dem Stand der Technik. Mit diesem Ausführungsbeispiel
werden die Bildverarbeitungseinheiten jeweils Teilbilder des eingegebenen
Zeilensprungvideosignals, das an den Videosignaleingangsanschluß 7 geliefert
wird, und die Bildart (das heißt,
I, P, B) wird ebenfalls eingerichtet in Einheiten dieser Zeilensprungteilbilder.
Die Zeitachsentrennung zwischen aufeinanderfolgenden I-, P- oder
B-Bildern ist somit die Teilbildperiode, das heißt, 1/60 s.
-
Die
Hauptmerkmale von diesem Ausführungsbeispiel
sind folgende. Die Teilbilder des eingegebenen Videosignals, die
zu verarbeiten sind als I- und P-Bilder werden jeweils der Umsetzungsverarbeitung
unterzogen, um die Abtastzeilendichte zu erhöhen, das heißt, Interpolieren
von Abtastzeilen erfolgt zur Verdoppelung der Anzahl von Abtastzeilen pro
Teilbild, und dadurch wird die Umsetzung in progressiv abgetastete
Vollbilder erzielt. Die Teilbilder vom eingegebenen Videosignal
werden als B-Bilder verarbeitet, sie bleiben unverändert, das
heißt,
sie werden codiert in Einheiten von Teilbildern, in gleicher Weise
wie für
die B-Teilbilder nach dem Stand der Technik beschrieben, siehe Beispiel
von 5.
-
2 zeigt
die Anordnung von Abtastzeilen der sich ergebenden Bildarten. Mit
dem Fernsehsystem mit Standardauflösung beträgt die effektive Anzahl von
Abtastzeilen 480 pro Vollbild, 240 pro Teilbild. Da jedes der I-
und P-Bilder umgesetzt wird, um die doppelte Anzahl von Abtastzeilen
vom Originalteilbild zu bekommen, muß der Umfang der Codierverarbeitung
für jedes
dieser doppelt ausgeführt werden.
-
Das
Codieren der I- und P-Progressivabtastungsvollbilder wird nicht
ausgeführt
wie im Beispiel des Standes der Technik, das heißt, basierend auf der Zweiteilbilder/Vollbild-Konfiguration. Anstelle dessen
versteht es sich klar aus der in 2 dargestellten
Abtastzeilenkonfiguration, daß die
Prädiktion für jedes
P-Progressivabtastungsvollbild auf der Grundlage eines vorangehenden
I- oder P-Progressivabtastvollbildes
erfolgt, und ausgeführt
wird für
jedes B-Teilbild auf der Grundlage vorangehender und nachfolgender
I- oder P-Progressivabtastungsvollbilder. Somit ist ersichtlich,
daß die
Codierverarbeitung vereinfacht wird im Vergleich zum Verfahren des Standes
der Technik, wie es im Beispiel von 5 dargestellt
ist.
-
Im
Falle der Prädiktionsverarbeitung,
die angewandt wird bei jedem Zeilensprungabtastteilbild, das zu
codieren ist als B-Teilbild,
ist die Operation die folgende. Ein Satz von Prädiktionssignalwerten wird erzeugt
vom Zwischenbildprädiktionsabschnitt 9 (synchron
mit der Eingabe in den Subtrahierer 17 von Pixelwerten
für das
Teilbild, das zu codieren ist) auf der Grundlage spezifischer I-
oder P-Progressivabtastungsvollbilder,
die dem Zeilensprungteilbild nachfolgen oder vorangehen. Da dieser
Satz hergeleitet ist unter Verwendung von progressivabgetasteten Vollbildern,
enthält
er die doppelte Anzahl von Prädiktionssignalwerten,
die erforderlich ist zum Codieren eines Zeilensprungteilbildes,
das heißt,
der Satz enthält
jeweilige Untersätze
an Werten, die den Abtastzeilen entsprechen, die aus dem Zeilensprungteilbild fortgelassen
sind. Aus diesem Grund wird jeder derartige Satz von Prädiktionssignalwerten
der Dezimierungsverarbeitung unterzogen durch den Abtastzeilendezimierabschnitt 15,
um jeden dieser Untersätze von
Prädiktionssignalwerten
gemäß den jeweiligen Abtastzeilen
zu eliminieren, die nicht im codierten Teilbild auftreten.
-
Offensichtlich
ist es, daß die
Arbeitsweise des Abtastzeilendezimierabschnitts 15 gemäß der Tatsache
gesteuert werden muß,
ob das Teilbild, das codiert wird, die geradzahligen oder die ungeradzahligen
Abtastzeilen des Zeilensprungabtastvollbildes enthält, so daß geeignete
Untersätze
von Prädiktionssignalwerten
eliminiert werden. Das heißt,
der Abtastzeilendezimierungsabschnitt 15 muß aus dem Satz
von Prädiktionssignalwerten
auslesen, die geliefert werden vom Zwischenbildprädiktionsabschnitt 9,
jene Werte, die zu den Abtastzeilen des Teilbildes passen, das zu
codieren ist. Da es jedoch unbedingt erforderlich ist für verschiedene
Arten der Geräte
des Standes der Technik, die ein Zeilensprungvideosignal bearbeiten,
Mittel zum Selektieren zwischen geradzahligen und ungeradzahligen
Teilbildern enthalten müssen
(das heißt,
das erste und das zweite Teilbild eines Vollbildes) basierend auf
den Synchronisiersignalen, die in einem Zeilensprungvideosignal enthalten
sind, und zum Steuern der Arbeitsweise des Gerätes gemäß der Tatsache, ob ein geradzahliges
oder ungeradzahliges Teilbild verarbeitet wird, so daß die Technologie
allgemein bekannt ist, und eine detaillierte Beschreibung derartiger
Selektier- und Steueroperationen ist hier fortgelassen.
-
Unter
Bezug auf 2 wird als Beispiel angenommen,
daß die
I- und P-Progressivabtastvollbilder mit Bezugszeichen 200, 203 versehen
sind und verwendet werden zum Herleiten von Prädiktionssignalwerten zum Codieren
des Zeilensprungabtastteilbildes 201 als ein B-Teilbild,
wobei die ersten Abtastzeilen der Teilbilder 201, 202 aufgezeigt
sind mit 201a, 202a, dann wird das Ergebnis der
Arbeitsweise des Zwischenbildprädiktionsabschnitts 9 und
des Abtastzeilendezimierabschnitts 15 folgender sein. Vom kompletten
Satz der Prädiktionssignalwerte,
die der Zwischenbildprädiktionsabschnitt 9 erzeugt
(das heißt,
ein Satz, der passend ist zum Codieren eines progressiv abgetasteten
Vollbildes) treten nicht alle Untersätze, die den Abtastzeilen entsprechen,
im Teilbild 201 auf, und werden eliminiert vom Abtastzeilendezimierabschnitt 15.
-
Offensichtlich
ist es, daß mit
einem derartigen Verfahren die Probleme, die nach dem Stand der Technik
aufkommen, wenn das Codieren aufgrund des Ein-Zeilen-Vertikalversatzes
und des Ein-Teilbild-Periodenzeitachsenversatzes
zwischen den Zeilensprungteilbildern eines I-Vollbildes oder eines P-Vollbildes aufkommt,
eliminiert werden kann.
-
Die
Arbeitsweise vom Eingangsauswahlschalter 8 ist synchronisiert
mit nachfolgenden Teilbildern des eingegebenen Videosignals. Wie
schon erwähnt,
ist die Technologie bezüglich
einer derartigen Steuerung allgemein bekannt, so daß eine detaillierte Beschreibung
eines spezifischen Schaltsteuergerätes fortgelassen wird.
-
Typischerweise
werden Werte von m im Bereich von 3 bis 6 geeignet sein, das heißt, Werte,
die größer sind
als jene, die der Stand der Technik verwendet, und das Verhältnis von
I-Vollbildern im
Gesamtstrom von I-, P-, B-Bildern kann entsprechend größer gemacht
werden, als es nach dem Stand der Technik möglich ist, ohne daß der Prädiktionsabstand
exzessiv groß wird,
so daß der
Umfang codierter Daten wesentlich reduziert werden kann, verglichen
mit dem Stand der Technik. Wenn jedoch im entgegengesetzten Falle
beispielsweise derselbe Wert m, der nach dem Beispiel des Standes
der Technik verwendet wird, dann würde der Prädiktionsabstand halbiert im
Vergleich mit dem Beispiel des Standes der Technik, so daß ein entsprechender
Anstieg der Bewegungsvorsagegenauigkeit erzielbar wäre.
-
Der
Progressivabtastumsetzabschnitt 1 kann figuriert sein,
wie es aus der japanischen offengelegten Patentanmeldung HEI 8-130716 hervorgeht,
wodurch die Bewegungsprädiktion
in Einheiten kleiner Blöcke
geschieht unter Verwendung vorhergehender und nachfolgender Teilbilder,
mit Interpolation von Abtastzeilen, die aus dem Teilbild aufgrund
der Zeilensprungabtastung fortgelassen worden sind. Da die Inhalte
(das heißt,
Pixelwerte) vorangehender und nachfolgender Zeilensprunghalbbilder
erforderlich sind bei dieser Interpolationsoperation, versteht es
sich, daß der
Progressivabtastumsetzabschnitt 1 beliebige erforderliche
Verzögerungselemente
hierfür
enthält,
wie beispielsweise einen Teilbildspeicher.
-
Die
Arbeitsweise vom Subtrahierer 2, dem DCT-Abschnitt 3,
dem Quantisierer 4 und dem Codierer 5 variabler
Länge ist
grundsätzlich
identisch mit dem zugehörigen
Element des Beispiels nach dem Stand der Technik. Da es jedoch ein
Progressivabtastvollbild in jeder Teilbildperiode vom Originalvideosignal
gibt, das heißt,
1/60 s, ist es erforderlich, die Verarbeitung mit der doppelten
Geschwindigkeit gegenüber
dem Stand der Technik auszuführen,
wenn die Echtzeitverarbeitung erreicht werden soll.
-
Dasselbe
gilt auch für
den Betrieb des Entquantisierers 6 des inversen DCT-Abschnitts 12 und des
Addierers 11, die den lokalen Decodierabschnitt bilden.
Die Arbeitsgeschwindigkeit des Bildspeichers 10 ist dieselbe
wie diejenige vom inversen DCT- Abschnitt 12,
jedoch ist die Speicherkapazität
dieselbe wie im Beispiel nach dem Stand der Technik. Es ist zu erwähnen, daß mit dem
Beispiel des Standes der Technik 2 Zeilensprungteilbilder
pro I-Vollbild oder P-Vollbild gegeben sind, wohingegen die vorliegende Erfindung
bei jedem I-Vollbild oder P-Vollbild ein einzelnes Progressivabtastvollbild
mit der doppelten Anzahl von Abtastzeilen eines Zeilensprungteilbildes vorsieht.
-
Da
mit der vorliegenden Erfindung der Zwischenbildprädiktionsabschnitt 9 die
Verarbeitung einfach ein Einheiten von progressiv abgetasteten Vollbildern
vornehmen kann, läßt sich
der Betrieb einfacher gestalten als im Beispiel des Standes der
Technik. Genauer gesagt, die Bewegungsschätzung erfolgt im Zwischenbildprädiktionsabschnitt 9 durch
Betreiben von Blöcken
in 16 × 16
Pixeln oder in 8 × 8
Pixeln, und die Bewegungskompensation erfolgt gemäß den festgestellten
Bewegungsvektoren. Im allgemeinen ist die Genauigkeit der Bewegungskompensation
innerhalb von 1/2 eines Pixels.
-
Im
Falle von B-Teilbildern muß eine
Verzögerung
von (m – 1)
Teilbildern bei einem Bildsignal vom Teilbildverzögerungselement 16 angewandt
werden. Da die Bildarten (das heißt, I, P, B) eingerichtet sind in
Einheiten von Zeilensprungabtastteilbildern des eingegebenen Videosignals,
wie zuvor beschrieben, wird die auf das Teilbildverzögerungselement 16 angewandte
Verzögerung
in Einheiten von Teilbildperioden erfolgen. Für den Progressivabtastumsetzabschnitt 1 zum
Ausführen
der Zwischenteilbildinterpolation zum Erzeugen der I- und P-Progressivabtastvollbilder
muß jedoch
zusätzlich
eine Verzögerung
eines Teilbildes zwischen den eingegebenen Videosignalwerten für ein Teilbild
zum Progressivabtastumsetzabschnitt 1 auftreten und die
Ausgabe sich ergebender Videosignalwerte für ein Progressivabtastvollbild.
Somit ist es erforderlich, einen zugehörigen Verzögerungsbetrag für die B-Teilbilder
zur Kompensierung anzulesen. Im Ergebnis muß die vom Teilbildverzögerungselement 16 angelegte
Gesamtverzögerung
m Teilbildperioden sein (das heißt, m/60 s).
-
Die
Arbeitsweise eines jeden Subtrahierers 17, des DCT-Abschnitts 18,
des Quantisierers 19 und des Codierers 20 variabler
Länge ist
grundsätzlich identisch
mit derjenigen beim Beispiel nach dem Stand der Technik, aber die
Verarbeitung erfolgt in Einheiten von Teilbildern. Das heißt, das
Prädiktionssignal,
das der Subtrahierer 17 liefert, wie zuvor beschrieben,
zum Herleiten der Differenzwerte (das heißt, Werte vom Prädiktionsfehler)
für ein
B-Teilbild wird aus dem vorhergehenden und nachfolgende I- oder
P-Progressivabtastvollbilder hergeleitet, die von jenen des B-Teilbildes
um eine oder mehr Teilbildperioden beabstandet sind.
-
Es
versteht sich, daß eine
derartige Form des Betriebs grundsätzlich insofern unterschiedlich ist
gegenüber
demjenigen des Stands der Technik, da die Bildarten (das heißt I, P,
B) in Einheiten von Teilbildern eingerichtet sind, daß isolierte
I-Bilder und P-Bilder auftreten werden, wie in 2 gezeigt.
Mit dem Verfahren nach dem Stand der Technik, wie beim Gerät von 5,
werden folglich Paare von I-Bildern (ausgedrückt als Zeilensprungteilbilder)
sowie auch Paare von P-Bildern auftreten.
-
Das
Verarbeitungssystem, das vom Subtrahierer 2, dem DCT-Abschnitt 3,
dem Quantisierer 4 und dem längenvariablen Codierer 5 gemäß 1 gebildet
ist, ist getrennt aufgebaut vom Verarbeitungssystem, das gebildet
ist aus dem Subtrahierer 17, dem DCT-Abschnitt 18,
dem Quantisierer 19 und dem längenvariablen Codierer 20.
Da jedoch die Verarbeitung, die diese beiden Systeme ausführen, grundsätzlich dieselbe
ist, könnten
diese kombiniert werden in ein einziges System durch Verwendung des
Zeitmultiplexbetriebs.
-
Da
in diesem Falle der erforderliche Verarbeitungsumfang für ein I-Vollbild
oder P-Vollbild die doppelte Menge an Verarbeitung erfordert wie
bei einem B-Teilbild, können
die Beziehungen zwischen den Verarbeitungszeiten zum Codieren der
I-, P- und B-Teilbilder in der im Beispiel konzipierten "Verarbeitung a" in 4 sein.
Da die Verarbeitungszeitintervalle, die für jedes der I- und P-Vollbilder doppelt
so hoch ist wie die für
ein B-Teilbild erforderliche, ist es notwendig, die Verarbeitungszeit
für ein
B-Teilbild kürzer
als eine Teilbildperiode zu gestalten (das heißt also kürzer als 1/60 s). Mit dem gezeigten
Beispiel wird ein Wert von 3 für
m angenommen, wobei die Codierungsverarbeitung für jedes B-Teilbild innerhalb von
0,75 einer Teilperiode abgeschlossen sein muß, während die Codierverarbeitung
für jedes
I- oder P-Teilbild innerhalb 1,5 Teilperioden abgeschlossen sein
muß.
-
Wie
andererseits in der japanischen offengelegten Patentanmeldung Nummer
HEI 6-311505 gezeigt, kann die Unterabtastung der Prädiktionsfehlerwerte,
gewonnen für
die B-Teilbilder, angewandt werden, um den Verarbeitungsumfang zu
halbieren, den die Stufen ausführen,
die dem DCT-Abschnitt 18 folgen. Erneut wird in diesem
Falle angenommen, daß für m der
Wert 3 benutzt wird, wie durch das Beispiel "Verarbeitung b" in 4 aufgezeigt,
wodurch dann die Echtzeitcodierungsverarbeitung für die I-
und P-Teilbilder möglich
wird, das heißt,
zwei Teilbildperioden sind zum Ausführen einer derartigen Verarbeitung
verfügbar
in derselben Weise wie bei der Konfiguration von 1.
-
Als
spezifische Konfiguration kann ein Unterabtaster gleichzeitig in
Horizontalrichtung eines jeden B-Teilbildes zwischen den Subtrahierer
und den DCT-Abschnitt einer solch kombinieren Konfiguration eingefügt werden
(das heißt,
die jeweils die Funktionen des Subtrahierers 2, 17 und
die DCT-Abschnitte 3, 18 im
Ausführungsbeispiel
von 2 ausführen).
-
3 zeigt
ein Beispiel eines Videodecodiergerätes gemäß dem Videocodiergerät von 1 zum
Decodieren des Ausgabecodes, erzeugt durch dieses Videocodiergerät, das heißt, wenn
der gesendete Code empfangen wird oder der aufgezeichnete Code wiederhergestellt
wird.
-
Elemente,
die in 3 identisch zu den Elementen des Beispiels 6 nach
dem Stand der Technik sind, sind mit identischen Bezugszeichen versehen. Die
Konfiguration von 3 unterscheidet sich von derjenigen
des Beispiels von 6 nach dem Stand der Technik
dadurch, daß Abtastzeilendezimierungsabschnitte 81 und 36 enthalten
sind. Auch die Arbeitsweise des Zwischenbildprädiktionsabschnitts 35 unterscheidet
sich von dem Beispiel gemäß 6 nach
dem Stand der Technik, während
zusätzlich
die Verarbeitung, die jeder längenvariable
Decoder 31, der Entquantisierer 6, der inverse
DCT-Abschnitt 12 und der Addierer 11 in Hinsicht
auf I- und P-Bilder ausführt,
in Einheiten von Zeile-für-Zeile-abgetasteten
Vollbildern.
-
Der
Code, der vom Eingangsanschluß 33 eingegeben
wird, erfährt
eine Trennung vom Demultiplexer 34 in die I- und P-Vollbildcodesequenzen
und die B-Vollbildcodesequenzen. Die I- und P-Vollbildcodesequenzen werden
der Decodierverarbeitung unterzogen vom längenvariablen Decoder 31,
dem Entquantisierer 6, dem inversen DCT-Abschnitt 12 und
dem Addierer 11 in derselben Weise wie beim Beispiel von 6 nach
dem Stand der Technik, wodurch Sätze
von Pixelwerten gewonnen werden, um rekonstruierte Bilder als jeweilige
Zeile-für-Zeile-Abtastungsvollbilder
auszudrücken,
die dann in einen Bildspeicher 32 gespeichert werden.
-
Um
eine vollständige
Echtzeitverarbeitung zu erreichen, ist es erforderlich, daß die Verarbeitung eines
jeden Zeile-für-Zeile-Abtastungsvollbildes
innerhalb einer Teilbildperiode abgeschlossen wird, das heißt in 1/60
s.
-
Der
Zwischenbildprädiktionsabschnitt 35 erzeugt
ein Prädiktionssignal
(drückt
aufeinanderfolgend rekonstruierte Prädiktionsfehlerwerte aus) auf der
Grundlage der decodierten Zeile-für-Zeile-Abtastungsvollbilder,
die im Speicher 32 gespeichert sind, liefert dies an den
Addierer 11 zum Herleiten von Pixelwerten für rekonstruierte
I- und P-Zeile-für-Zeile-Abtastungsvollbilder
und liefert ein Prädiktionssignal
an einen Abtastzeilendezimierabschnitt 81 zum Decodieren
der B-Teilbilder.
Der Zwischenbildprädiktionsabschnitt 35 arbeitet
in grundsätzlich
gleicher Weise wie der Zwischenbildprädiktionsabschnitt 9 von 1.
Der Zwischenbildprädiktionsabschnitt 35 unterscheidet
sich jedoch von dem Zwischenbildprädiktionsabschnitt 9 darin,
daß er
keine Bewegungsabschätzung
oder Prädiktionsmodusauswahl
ausführt.
Der Umfang der Verarbeitung, den der Zwischenbildprädiktionsabschnitt 35 ausführt, ist
somit wesentlich geringer als der, den der Zwischenbildprädiktionsabschnitt 9 ausführt.
-
Die
B-Bildcodesequenzen, geliefert vom Demultiplexer 34 (der
den jeweiligen Zeilensprungabtastteilbildern entspricht, wie unter
Bezug auf 1 beschrieben), werden decodiert
vom längenvariablen Decoder 38,
dem Quantisierer 39, dem inversen DCT-Abschnitt 40 und
durch Hinzufügen
von Prädiktionssignalwerten
im Addierer 41, um jeweilige rekonstruierte B-Teilbildsignale
zu gewinnen (das heißt aufeinanderfolgend
rekonstruierte Pixelwerte für
die B-Teilbilder).
-
Die
Arbeitsweise vom Abtastzeilendezimierabschnitt 81 dieses
Ausführungsbeispiels
ist durch Auswahl passender Sätze
von Prädiktionssignalwerten
aus jenen, die vom Zwischenbildprädiktionsabschnitt 35 in
Bezug zu den Abtastzeilen des B-Teilbildes erzeugt wurden, die zu
decodieren sind, identisch zu derjenigen des Abtastzeilendezimierabschnitts 15 von 1,
welcher zuvor detailliert beschrieben worden ist. Als Ergebnis des
Lieferns dieser Prädiktionssignalwerte
an den Addierer 41 in Verbindung mit den decodierten Prädiktionsfehlerwerten für jedes
B-Teilbild, die vom inversen DCT-Abschnitt 40 kommen, werden
jeweilige Sätze
rekonstruierter Pixelwerte gewonnen, die diese B-Teilbilder ausdrücken, das
heißt,
die zugehörigen
Zeilensprungteilbilder des Originalvideosignals werden dadurch vom Addierer 41 gewonnen
und an den Ausgabeauswahlschalter 42 geliefert.
-
Darüber hinaus
werden Sätze
rekonstruierter Pixelwerte entsprechend den jeweiligen I-, P-Progressivabtastvollbildern
aus dem Bildspeicher 32 über die als 32b in 3 bezeichnete
Ausgabeleitung gelesen. Jeder dieser Sätze wird an den Abtastzeilendezimierabschnitt 36 geliefert,
der spezifische Untersätze
von Pixelwerten eliminiert, die den Abtastzeilen entsprechen, die
fortgelassen werden müssen,
um ein Progressivabtastvollbild zu einem geeigneten Zeilensprungabtastteilbild
umzusetzen (das heißt
ungradzahlig oder gradzahlig). Die Werte, die dieses Teilbild ausdrücken, werden
dann an den Ausgabeauswahlschalter 42 geliefert.
-
Der
Ausgabeauswahlschalter 42 wird in Verbindung mit der Steuerung
von ausgelesenen Werten aus dem Bildspeicher 32 gesteuert,
um die Sätze
von Werten für
rekonstruierte Teilbilder zu transferieren, die aus den I- und P-Progressivabtastbildern
hergeleitet sind, und den Sätzen
von Werten für
die rekonstruierten B-Teilbilder zum Videoausgangsanschluß 43 in
derselben Reihenfolge von Zeilensprungabtastteilbildern, wie diejenigen
des Originalvideosignals vor dem Codieren. Ein rekonstruiertes Ausgangszeilensprungvideosignal
wird dadurch gewonnen, wobei die Teilbilder restauriert sind in
der Zeitachsenreihenfolge des Originalvideosignals, besser als diejenige der
Codesequenzen, die jeweilige I-, P- und B-Bilder darstellen, die
vom Videocodiergerät
von 1 abgegeben werden.
-
Angemerkt
sei, daß die
Abtastzeilendezimierabschnitte 81 und 36 die Verarbeitung
ausführen,
die sich von der Unterabtastverarbeitung darin unterscheidet, daß keinerlei
Filterverarbeitung vor der Dezimieroperation erfolgt. Dies liegt
daran, daß die
rekonstruierten Zeile-für-Zeile-Abtastungsbilder hergeleitet
sind aus den Originalzeilensprungbildern, die umgesetzt worden sind
in die Progressivabtastform, so daß die Vertikalabtastfrequenzkennlinie
bereits beschränkt
ist auf einen Grad, der passend ist für ein Zeilensprungsignal, vor
der Dezimierverarbeitung.
-
Aus
der obigen Beschreibung geht klar hervor, daß das Videodecodiergerät des Ausführungsbeispiels
von 3 in Verbindung mit dem Videocodiergerät des Ausführungsbeispiels
von 1 ein System ermöglicht zum Senden oder Aufzeichnen
eines Zeilensprungvideosignals als codierte Daten mit sehr hoher
Codiereffizienz. Dies ergibt sich aus den folgenden Gründen. Da
die I-, P- und B-Bilder jeweils Teilbildern (vom Originalzeilensprungvideosignal)
zugehörig
sind, vielmehr als Einheiten von 2-Teilbild-Vollbildern, wenn die
jeweiligen Proportionen von I-, P- und B-Bildern identisch zu denen
gemacht wurden, die mit dem System nach dem Stand der Technik, wie
dasjenige der 5, 6, verwendet werden,
dann würde
der Codierabstand (das heißt, wie
dargestellt, durch die Zeitachsentrennung zwischen den als I-Bilder
ausgewählten
Bildern) halbiert und die Bewegungsprädiktionsgenauigkeit entsprechend
verdoppelt. Anders gesagt, mit der vorliegenden Erfindung wird es
möglich,
das Verhältnis
von B-Bildern in Beziehung auf die I- und P-Bilder zu verdoppeln,
während
derselbe Grad an Prädiktionsgenauigkeit
beibehalten wird. Da der Codeumfang, der erzeugt wird für ein B-Bild,
geringer ist als derjenige für
ein P-Bild und sehr viel weniger als für ein I-Bild, kann eine erhöhte Codiereffizienz
erzielt werden.
-
In
derselben Weise wie zuvor für
das Videocodiergerät
in 1 beschrieben, wird es möglich, das Videodecodiergerät von 3 abzuwandeln,
um eine Verarbeitung sowohl für
die I- als auch die P-Progressivabtastbilder und auch für die B-Teilbilder durch
ein einziges System durch einen geeigneten Zeitmultiplexbetrieb
auszuführen.
In diesem Falle könnte
das Gerät
so konfiguriert sein, daß eine
Unterabtastung der rekonstruierten Prädiktionsfehlerwerte für die B-Teilbilder
ausgeführt
wird durch Einfügen
eines Unterabtastbetriebs entlang der Horizontalrichtung eines jeden
Teilbildes, das heißt
mit dem eingefügten
Unterabtaster (während
eines jeden Intervalls, in dem ein B-Teilbild decodiert wird) zwischen
inversen DCT-Abschnitt,
der gemeinsam zum Decodieren von I-, P- und B-Bildern verwendet
würde,
und dem Addierer, der die Ausgangswerte vom inversen DCT-Abschnitt
empfängt.
Auf diese Weise wird es möglich,
die verfügbare
Zeit zum Decodieren eines jeden I- und P-Progressivabtastbildes
zu erhöhen,
ebenso wie zuvor anhand 4 für den Fall der Codierverarbeitung
beschrieben.
-
7 zeigt
ein zweites Ausführungsbeispiel eines
Decodiergerätes
zum Betrieb bezüglich
codierter Videodaten, die das Codiergerät von 1 erzeugt.
In 7 sind Elemente, die mit jenen Elementen des Standes
der Technik von 6 identisch sind, mit denselben
Bezugszeichen versehen. Die Konfiguration von 7 unterscheidet
sich von derjenigen des Beispiels von 6 nach dem
Stand der Technik dadurch, daß ein
Abtastzeileninterpolationsabschnitt 44 vorgesehen ist,
während
zusätzlich
zum Betrieb des Zwischenbildprädiktionsabschnitts 35 ein Unterschied
von demjenigen des Beispiels von 6 nach dem
Stand der Technik besteht, und des weiteren ist die vom längenvariablen
Decoder 31, dem Quantisierer 6, dem inversen DCT-Abschnitt 12 und dem
Addierer 11 ausgeführte
Verarbeitung in Hinsicht auf die I- und P-Bilder in Einheiten zeilenweise abgetasteter
Vollbilder erfolgt, in derselben Weise wie für das Videodecodiergerät des Ausführungsbeispiels
von 3, das zuvor beschrieben wurde.
-
Der
Code, der aus dem Codeeingangsanschluß 33 eingegeben wird,
erfährt
eine Trennung vom Demultiplexer 34 in die I- und P-Vollbildcodesequenzen,
das heißt
für jeweilige
Progressivabtastvollbilder, und die B-Teilbildcodesequenzen für jeweilige
Zeilensprungabtastteilbilder. Die I- und P-Vollbildcodesequenzen werden der Decodierverarbeitung
vom längenvariablen
Decoder 31, dem Quantisierer 6, dem inversen DCT-Abschnitt 12 und
dem Addierer in derselben Weise unterzogen wie zum Beispiel von 6 nach
dem Stand der Technik, um dadurch Sätze rekonstruierter Pixelwerte
zu gewinnen, die jeweilige I- und P-Progressivabtastvollbilder ausdrücken, die
der Bildspeicher 32 speichert.
-
Um
eine vollständige
Echtzeitverarbeitung zu erreichen, ist es erforderlich, daß die Decodierverarbeitung
eines jeden Zeile- für-Zeile-Abtastungsvollbildes
innerhalb einer Teilbildperiode abgeschlossen wird (das heißt innerhalb
1/60 s).
-
Der
Zwischenbildprädiktionsabschnitt 35 erzeugt
ein Prädiktionssignal
in derselben Weise wie zum Ausführungsbeispiel
von 3 beschrieben, auf der Grundlage von im Speicher 32 gespeicherten Zeile-für-Zeile-Abtastungsvollbildern,
und liefert diese an den Addierer 11 zum Herleiten von
Pixelwerten für
die rekonstruierten I- und P-Zeile-für-Zeile-Abtastungsvollbilder.
Darüber
hinaus liefert der Zwischenbildprädiktionsabschnitt 35 ein
Prädiktionssignal
an den Addierer 41, um Pixelwerte für rekonstruierte Zeile-für-Zeile-Abtastungsvollbilder
herzuleiten, die gewonnen werden aus decodierten B-Teilbildern,
wie nachstehend zu beschreiben ist.
-
Die
B-Vollbildcodesequenzen werden decodiert vom längenvariablen Decoder 38,
dem Quantisierer 39 und dem inversen DCT-Abschnitt 40,
um jeweilige Sätze
rekonstruierter Prädiktionsfehlerwerte für die B-Teilbilder
zu gewinnen, das heißt,
diese Verarbeitung erfolgt in Einheiten von Zeilensprungabtastteilbildern.
Jeder Satz rekonstruierter Prädiktionsfehlerwerte,
die dadurch für
ein Teilbild gewonnen werden, werden dann der Abtastzeileninterpolation (Überabtastung)
in Vertikalrichtung durch den Abtastzeileninterpolationsabschnitt 44 unterzogen,
um einen entsprechenden Satz rekonstruierter Prädiktionsfehlerwerte für ein Zeile-für-Zeile-Abtastungsvollbild
zu erzielen. Das heißt,
der Satz von Prädiktionsfehlerwerten
gemäß einem
240-Zeilen-Teilbild
wird umgesetzt in einen Satz von Prädiktionsfehlerwerten entsprechend
480 Zeilen im Zeile-für-Zeile-Abtastungsvollbild
durch Erzeugen und Einfügen
von 240 Untersätzen
interpolierter Prädiktionsfehlerwerte,
die den jeweiligen interpolierten Abtastzeilen entsprechen, bevor
die Lieferung an den Addierer 41 erfolgt.
-
Diese
Verarbeitung erfolgt innerhalb eines jeden Teilbildes durch Überabtastung
und wird im Vergleich zu derjenigen durch Zeile-für-Zeile-Abtastungsumsetzabschnitt 1 ausgeführten in einer
einfachen Form der Verarbeitung vom Videocodiergerät gemäß 1 durchgeführt.
-
Die
Prädiktionssignalwerte,
die der Zwischenbildprädiktionsabschnitt 35 abgibt,
werden addiert im Addierer 41 zu den Prädiktionsfehlerwerten, die in
das Zeile-für-Zeile-Abtastungsvollbildformat vom
Abtastzeileninterpolationsabschnitt 44 umgesetzt worden
sind, um dadurch Sätze
rekonstruierter Pixelwerte für
jeweilige Zeile-für-Zeile-Abtastungsvollbilder
zu gewinnen, die aus den decodierten B-Teilbildern hergeleitet sind.
-
Der
Ausgabeauswahlabschalter 42 empfängt die Bilder, die als jeweilige
rekonstruierte I- und P-Zeile-für-Zeile-Abtastungsvollbilder
ausgedrückt sind,
die aus dem Bildspeicher 32 zu geeigneten Zeitvorgaben
gelesen werden (wie für
das Ausführungsbeispiel
von 3 beschrieben), und die Bilder werden als jeweilige
Zeile-für-Zeile-Abtastungsvollbilder ausgedrückt, hergeleitet
aus Teilbildern, die der Addierer 41 abgibt, und diese
zeilenweise abgetasteten Bilder werden zum Ausgangsanschluß in der
passenden Reihenfolge zum Erzeugen eines Zeile-für-Zeile-Abtastungsvideosignals
abgegeben, in dem die Sequenz der Zeile-für-Zeile-Abtastungsbilder identisch
ist zu denen des ursprünglich
codierten Zeilensprungvideosignals, und dessen Vollbildperiode die
Hälfte
der Vollbildperiode derjenigen des Originalvideosignals ist. Das
heißt,
in derselben Weise wie zum Ausführungsbeispiel
von 3 beschrieben, ist die Reihenfolge, in der die
Daten jeweils rekonstruierter Bilder ausgedrückt werden, zu liefern an den
Videoausgangsanschluß 43,
identisch mit der Zeitachsenreihenfolge der jeweiligen codierten
Bilder (ausgedrückt
durch Zeilensprungteilbilder) vom ursprünglichen Videosignal, besser
als I-, P-, B-Codesequenzen, die das Videocodiergerät empfängt.
-
8 ist
ein Diagramm zur konzeptionellen Veranschaulichung der aufeinanderfolgenden
Zeile-für-Zeile-Abtastungsvollbilder,
die dadurch an den Videoausgangsanschluß 43 geliefert werden.
Jeweilige unterschiedliche Symbole sind in 8 verwendet,
um Abtastzeilen aufzuzeigen, die in allen drei unterschiedlichen
Wegen hergeleitet werden, das heißt Abtastzeilen (aufgezeigt
durch Kreise), die rekonstruiert sind aus den Originalabtastzeilen
der Zeilensprungteilbilder vom Videosignal, Abtastzeilen (aufgezeigt
durch Diamanten), die eingefügt
sind in die Operation des Zeile-für-Zeile-Abtastungsumsetzabschnitts 1 vom
Videocodiergerät
gemäß 1,
und Abtastzeilen (aufgezeigt durch Sterne), die eingefügt sind
als Ergebnis des Betriebs vom Abtastzeileninterpolationsabschnitt 44 in
Verbindung mit dem Addierer 41 im Videodecodiergerät von 7.
-
Aus
der obigen Beschreibung geht klar hervor, daß mit dem Videodecodiergerät, ein Ausführungsbeispiel
von 7, durch effektives Anwenden der Zwischenbildprädiktionsverarbeitung
und dem Einführen
der Überabtastverarbeitung
in den rekonstruierten Prädiktionsfehlerwerten,
die aus den B-Teilbildern hergeleitet sind, es möglich wird, dieselbe Art für die Zeile-für-Zeile-Abtastungsumsetzverarbeitung zu
erzielen (für
die B-Bilder von den I-, P, B-Bildarten) wie diejenige, die bezüglich der
I- und P-Bilder durch den Zeile-für-Zeile-Abtastungsumsetzabschnitt 1 vom
Ausführungsbeispiel
gemäß 1 ausgeführt werden.
Mit dem Ausführungsbeispiel
von 7 wird es jedoch überflüssig, jedes der B-Teilbilder
in ein Zeile-für-Zeile-Abtastungsvollbild
vor dem Codieren und dem Senden umzusetzen. Das Videodecodiergerät des Ausführungsbeispiels
von 7 in Verbindung mit dem Videodecodiergerät von 1 ermöglicht somit
ein äußerst praktisches
und effizientes System, das realisiert werden soll, wodurch ein
Zeilensprungvideosignal der hocheffizienten Codierung unterzogen
werden kann und der sich ergebende Code gesendet oder aufgezeichnet
wird, und wodurch der resultierende oder empfangene Code wieder
decodiert werden kann, um ein Zeile-für-Zeile-Abtastungsvideosignal
zu erhalten.
-
Ein
weiterer Aspekt der vorliegenden Erfindung ist derjenige, daß ein digital
codiertes Videoaufzeichnungsmedium mit hoher Effizienz der Codierung
realisiert werden kann. Insbesondere kann dies erzielt werden durch
Multiplexen der Bildcodesequenzen, die das Videocodiergerät von 1 mit den
Codesequenzen für
Audio- und Steuerinformationen erzeugt unter Verwendung der MPEG-Systemnormen,
Hinzufügen
von Fehlerkorrekturcodes zum resultierenden Code, Modulieren eines
Aufzeichnungssignals mit dem sich ergebenden Code und dann Aufzeichnen
des modulierten Aufzeichnungssignals auf ein Aufzeichnungsmedium.
-
Das
heißt,
dieser Aspekt der Erfindung kann ein codiertes Videoaufzeichnungsmedium
bereitstellen, das ein Aufzeichnungsmedium realisiert mit darauf
aufgezeichneten Zeilensprungvideoinformationen, die der hocheffizienten
Codierung unterzogen worden sind. Dies wird erreicht durch Aufzeichnen auf
das Aufzeichnungsmedium von jeweiligen Codesequenzen, von denen
alle hergeleitet werden aus einem zugehörigen Teilbild oder einem digitalen
Zeilensprungvideosignal, mit den Codesequenzen, die aus ersten und
zweiten Codesequenzen bestehen, wodurch jede der ersten Codesequenzen
durch Umsetzen eines von jedem der m Teilbilder vom Zeilensprungvideosignal
umgesetzt wird in ein Zeile-für-Zeile-Abtastungsvollbild
mit der doppelten Anzahl von Abtastzeilen gegenüber einem Zeilensprungteilbild
(wobei m eine Ganzzahl von 2 oder höher ist), und Ausführen des
Codierens eines jeden zeilenweise abgetasteten Vollbildes entweder
durch Intravollbildcodierung oder durch unidirektionale Intervollbild-Prädiktionscodierung
unter Verwendung eines Zeile-für-Zeile-Abtastungsvollbildes
als Bezugsvollbild, und wodurch jede der zweiten Codesequenzen durch
bidirektionale Zwischenbildprädiktionscodierung
von einem der restlichen Teilbilder des Videosignals erzeugt wird
(das heißt,
das unverändert übrig geblieben
ist als ein Zeilensprungabtastungsteilbild) unter Verwendung vorhergehender
und nachfolgender Zeile-für-Zeile-Abtastungsvollbilder als
Bezugsteilbilder.
-
Die
Aufzeichnung läßt sich
mit hoher Geschwindigkeit durchführen
im Falle des Aufzeichnungsmediums als Nur-Lese-Typ unter Verwendung eines
Stempels und so weiter. Der reproduzierte Code, der aus einem derartigen
codierten Aufzeichnungsmedium gelesen wird, läßt sich decodieren, um entweder
das Originalzeilensprungvideosignal zu erhalten unter Verwendung
des Ausführungsbeispiels vom
ersten Videodecodiergerät
nach der Erfindung, oder zum Gewinnen eines Progressivabtastvideosignals
unter Verwendung des zweiten Videodecodiergerätes vom zuvor beschriebenen
Ausführungsbeispiel.
-
Aus
der obigen Beschreibung der Ausführungsbeispiele
geht klar hervor, daß mit
der vorliegenden Erfindung eines in m Teilbildern eines digitalen
Zeilensprungvideosignals (wobei m eine Ganzzahl von 2 oder höher ist)
umgesetzt wird in ein Zeile-für-Zeile-Abtastungsvollbild
und codiert oder decodiert wird entweder unabhängig innerhalb des Vollbildes
oder durch unidirektionale Prädiktion,
während andere
Teilbilder, die unverändert
als Zeilensprungteilbilder übrig
bleiben, codiert und decodiert werden durch bidirektionale Prädiktion
unter Verwendung vorhergehender und nachfolgender Zeile-für-Zeile-Abtastungsvollbilder.
Das heißt,
alle Bezugsbilder, die für
die Zwischenbildprädiktion
verwendet werden, bestehen aus Zeile-für-Zeile-Abtastungsvollbildern. Im Ergebnis
treten Zeitachsenabweichungen auf, wenn Zeilensprungteilbilder (das
heißt,
mit jedem Teilbild mit einem Vertikalversatz von einer Abtastzeile
vom vorangehenden Teilbild) als Bezugsbilder Verwendung finden zum
Zwecke der Zwischenbildprädiktionscodierung,
die eliminiert werden kann, und die Kriterien für korrektes Abtasten jeweiliger
Abtastzeilen eines Bildes können
zufriedenstellend sein, so daß keine
Aliasingkomponenten im sich ergebenden Code erzeugt werden. Somit
kann eine verbesserte Codekompression erzielt werden, da das Codieren von
Aliasingkomponenten als Ergebnis der Zwischenbildcodierung eliminiert
wird.
-
Ein
anderer Vorteil ist der folgende. Wenn beim Stand der Technik Intrabildcodierung
eines I-Vollbildes erfolgt, muß das
Codieren zwei aufeinanderfolgende Teilbilder benutzen, die wechselweise um
eine Teilbildperiode längs
der Zeitachse versetzt sind und auch um eine Abtastzeile längs der Vertikalbildrichtung.
Im Ergebnis werden Aliasingkomponenten erzeugt durch eine derartige
Intravollbildcodierung. Mit der vorliegenden Erfindung, wie sie
zuvor beschrieben wurde, wird jedoch jedes I-Bild, auf das das Intravollbildcodieren
angewandt wird, aus einem einzelnen Zeile-für-Zeile-Abtastungsvollbild
bestehen. Von daher wird das Problem des Erzeugens von Aliasingkomponenten
erneut durch das Verfahren nach der vorliegenden Erfindung beseitigt.
-
Da
darüber
hinaus die Bezugsbilder zur Zwischenbildcodierung immer aus Zeile-für-Zeile-Abtastungsvollbildern
bestehen, das heißt
mit der Abtastzeilendichte, die die doppelte gegenüber einem
Teilbild ist, wird die Genauigkeit der Bewegungsschätzung in
Vertikalrichtung eines Bildes folglich verdoppelt, so daß Bewegungskompensation
genauer erfolgt, als es nach Verfahren des Standes der Technik möglich ist.
-
Wenn
beispielsweise der Wert von m (das heißt, zur Auswahl eines von m
aufeinanderfolgenden Teilbilder oder Vollbildern, wie zuvor beschrieben)
zum selben gemacht wird wie derjenige, der nach dem Beispiel des
Standes der Technik verwendet wird von einem Videocodiergerät, dann
werden, wegen der vorliegenden Erfindung, die Bildarten (das heißt I, P,
B) in Einheiten von Teilbildern eingerichtet, der Zwischenbildprädiktionsabstand
würde halbiert im
Falle eines Videocodiergerätes
nach der vorliegenden Erfindung. Die Prädiktionsfehlerwerte würden folglich
kleiner werden. Wenn andererseits der Zwischenbildprädiktionsabstand
derselbe wäre
wie derjenige nach dem Stand der Technik beim Beispiel des Videocodiergerätes, dann
kann durch Vergleich mit dem Videocodiergerät des Beispiels nach dem Stand
der Technik der Wert m verdoppelt und daher das Verhältnis von
B-Bildern größer werden
mit dem Gerät
der vorliegenden Erfindung. Da die B-Vollbilder durch bidirektionale
Prädiktion
codiert werden und einen geringeren Codeumfang als die P- und I-Vollbilder
erfordern, kann folglich ein höherer
Codekompressionsgrad erzielt werden.
-
Darüber hinaus
wird nach einem anderen Aspekt der vorliegenden Erfindung trotz
der tatsächlichen
Umsetzungsverarbeitung zum Umsetzen von Zeilensprungabtastungsteilbildern
in Zeile-für-Zeile-Abtastungsvollbilder
nur eines von insgesamt m Teilbilder ausgeführt, so daß es mit der vorliegenden Erfindung
möglich
wird (wie sie zuvor in Bezug auf das Videodecodiergerät des Ausführungsbeispiel von 7 beschrieben
wurde), das Decodiersystem in der Weise zu konfigurieren, daß, obwohl
ein Teilbildzeilensprungvideosignal codiert wird, das letztlich decodierte
Videosignal ein Zeile-für-Zeile-Abtastungsvideosignal
ist, bei dem jedes Vollbild einem Teilbild des ursprünglichen
Zeilensprungvideosignals entspricht, so daß die Vollbildfrequenz doppelt
so hoch ist wie die beim ursprünglichen
Videosignal. Auf diese Weise kann das decodierte Videosignal eine Form
haben, die direkt auf verschiedene Arten von Anzeigegeräten, wie
Computermonitore, Flüssigkristallanzeigen,
PDP-Anzeigen und so weiter anwendbar ist, zu jenen Arten von Geräten, die
nur Zeile-für-Zeile-Abtastbilder
anzeigen können,
und eine hohe Anzeigequalität
ist sichergestellt.
-
Ein
Codiergerät
enthält
einen Wähler
(8) zum periodischen Auswählen von Teilbildern in einem
Zeilensprungvideosignal, das umzusetzen ist in jeweilige Zeile-für-Zeile-Abtastungsvollbilder
durch einen Abtastumsetzer (1), der die Anzahl von Abtastzeilen pro
Teilbild verdoppelt. Das Gerät
codiert drei Vollbilder durch Intravollbildcodierung oder unidirektionale Prädiktionscodierung
unter Verwendung vorhergehender Vollbilder und codiert die restlichen
Teilbilder vom Videosignal durch bidirektionale Prädiktion
unter Verwendung von vorhergehenden und nachfolgenden Zeile-für-Zeile-Abtastungsvollbildern
als Bezug. Der sich ergebende Code läßt sich durch einen inversen
Prozeß decodieren,
um das Zeilensprungvideosignal wiederzugewinnen, oder jedes decodierte
Teilbild kann umgesetzt werden in ein Zeile-für-Zeile-Abtastungsvollbild, um dadurch
die Abgabe eines zeilenweise abgetasteten Videosignals zu ermöglichen. Eine
verbesserte Genauigkeit der Bewegungsprädiktion für die Zwischenbildcodierung
läßt sich
dadurch erzielen, und das Erzeugen codierter Aliasingkomponenten
wird unterdrückt,
da alle Bezugsbilder und zeilenweise abgetasteten Vollbilder sind,
besser als Paare von Teilbildern, die Zeilensprungabtastvollbilder
einrichten.