-
(1) Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft ein Verfahren zum Codieren und Decodieren
von digitalen Bewegtbildsignalen zur Verwendung bei Bildtelefonen, Videokonferenzen
und dergleichen.
-
(2) Beschreibung des Stands
der Technik
-
Bei
einem üblichen
Verfahren zum Codieren von digitalen Bewegtbildsignalen wird ein
Vollbild des eingegebenen Bewegtbildes in mehrere Blöcke unterteilt,
die jeweils aus N × M
Pixeln bestehen, und es werden Prozesse einer Bewegungsdetektion,
-vorhersage, orthogonalen Transformation, Quantisierung, Codierung
mit variabler Wortlänge
und so weiter an jedem Block durchgeführt.
-
Bei
einem üblichen
Verfahren zum Decodieren von digitalen Bewegtbildsignalen werden
Blöcke, die
jeweils aus N × M
Pixeln bestehen, in einer umgekehrten Prozedur wieder hergestellt,
das heißt Prozesse
einer Decodierung mit variabler Wortlänge, Rückquantisierung, orthogonalen
Rücktransformation,
Bewegungskompensation usw.
-
Das
obige übliche
Codierverfahren und Decodierverfahren zum Codieren und Decodieren
von digitalen Bewegtbildsignalen ermöglicht eine Beseitigung von
Redundanz, die in Bewegtbildsignalen enthalten ist, und eine effiziente
Kommunikation und Speicherung eines Bewegtbildes mit weniger Information.
-
Bei
dem üblichen
Codierverfahren und Decodierverfahren zum Codieren und Decodieren
von digitalen Bewegtbildsignalen werden die Prozesse an jedem Pixelblock
durchgeführt,
wie es oben festgestellt wurde. Es ist üblich, dass ein Satz von Pixelblöcken ein
Teilbild bildet, und ein Satz von Teilbildern ein Vollbild bildet,
die Einheiten sind, die in dem üblichen
Codier- und Decodierverfahren verarbeitet werden.
-
Nachstehend
wird ein Codieren und Decodieren jedes Blocks, Teilbilds und Vollbilds
anhand eines Beispiels eines üblichen
Codier- und Decodierverfahrens zum Codieren und Decodieren von digitalen
Bewegtbildsignalen anhand der ITU-T Empfehlung H.261 (nachstehend
einfach als H.261) bezeichnet, die im März 1993 abgegeben wurde, beschrieben.
-
Die
H.261 definiert ein Codierverfahren und ein Decodierverfahren zum
separaten Codieren und Decodieren von Helligkeitssignalen oder Farbdifferenzsignalen
eines digitalen Bewegtbildsignals. Jedoch wird aus Gründen der
Zweckmäßigkeit
die Beschreibung von nur den Helligkeitssignalen vorgenommen. Im
Grunde sind das Codierverfahren und das Decodierverfahren zum Codieren
und Decodieren der Helligkeitssignale nicht von denjenigen für die Farbdifferenzsignale
verschieden.
-
Wie
es in 1 gezeigt ist, besteht ein Vollbild 101 von
digitalen Bewegtbildsignalen gemäß H.261
aus 352 × 288
Pixeln. Das Vollbild 101 ist in zwölf Teilbilder 102 unterteilt,
die GOBs (Group of Blocks oder Blockgruppen) genannt werden und
jeweils aus 176 × 48
Pixeln bestehen (nachstehend wird das Teilbild in der Beschreibung
des Standes der Technik als GOB bezeichnet). Ferner ist die GOB 102 (Teilbild)
in dreiunddreißig Blöcke 103 unterteilt,
die Makroblöcke
genannt werden und jeweils aus 16 × 16 Pixeln bestehen.
-
Das
Codierverfahren nach H.261 definiert, dass codierte Information
für ein
Vollbild in Übereinstimmung
mit einer räumlichen
hierarchischen Struktur, wie das Vollbild 101, die GOBs 102 und
die Makroblöcke 103,
die oben beschrieben sind, gebracht wird, wie es in 2 gezeigt
ist.
-
In 2 zeigt
ein in einem Rechteck eingeschlossener Teil codierte Information,
und die Anzahl von Codierbits ist unter jedem der Rechtecke gezeigt. In 2 zeigen
Pfeile Verknüpfungen
der codierten Information. Eine Reihe aus einer codierten Bewegtbildsignalfolge
wie diese wird Bit-Strom 104 genannt.
-
In
dem Bit-Strom 104 nach H.261, der in 2 gezeigt
ist, wird ein Teil, der die gesamte codierte Information für einen
Makroblock 103 enthält, eine
Makroblockschicht 103S genannt, ein Teil, der die gesamte
codierte Information für
eine GOB 102 enthält,
wird GOB-Schicht 102S genannt, und ein Teil, der die gesamte
codierte Information für
ein Vollbild 101 enthält,
wird Vollbildschicht 101S genannt.
-
Die
Bedeutungen der codierten Information in jeder der in 2 gezeigten
Schichten sind nachstehend angegeben:
Vollbildschicht 101S
PSC
(20 Bits): eine Vollbildkennung 105; ein einzigartiger
Code, durch den ein Codierverfahren immer identifiziert werden kann
und der als "0000
0000 0000 0000 0001" ausgedrückt wird;
TR
(5 Bits): eine Vollbildnummer 106; gibt eine zeitliche
Stellung an, in der dieses Vollbild 101 angezeigt werden
sollte;
PTYPE (6 Bits): Vollbildtypinformation 107;
unterschiedliche Information über
das Vollbild 101;
PEI (1 Bit): Erweiterungsdateneinfügeinformation 108;
eine Markierung, die die Anwesenheit der folgenden PSPARE 109 darstellt;
PSPARE
(8 Bits): Erweiterungsdaten; GOB-Schicht 102S (Teilbild)
CBSC
(16 Bits): eine GOB-Kennung 110; ein einzigartiger Code,
durch den ein Decodierverfahren immer identifiziert werden kann
und der als "0000
0000 0000 0000" ausgedrückt wird,
GN
(4 Bits): eine GOB-Nummer 111; gibt eine räumliche
Stellung dieser GOB 102 in dem Vollbild 101 an;
GQUANT
(5 Bits): Quantisierungscharakteristikinformation 112;
gibt eine Quantisierungscharakteristik an, wenn ein Makroblock 103 in
der GOB 102 codiert wird;
GEI (1 Bit): Erweiterungsdateneinfügeinformation 113;
eine Markierung, die die Anwesenheit der folgenden GSPARE 114 darstellt;
GSPARE
(8 Bits): Erweiterungsdaten 114.
-
Übrigens
wird die codierte Information 115 der Makroblockschicht,
die die niedrigste Hierarchie in 2 ist, in
dem Codierverfahren der Bewegungsdetektion-Vorhersage, orthogonalen
Transformation, Quantisierung, Codierung mit variabler Wortlänge usw.,
wie oben beschrieben, dessen Codierbitzahl nicht fest ist, erzeugt.
Die Anzahl von Codierbits der Makroblockschicht 103S nimmt
im Allgemeinen zu, wenn ein räumliches
Niveau von Pixeln, die in dem Makroblock 103 enthalten
sind, sich in großem
Maße ändert oder
ein Zeitniveau von Pixeln, die in dem Makroblock 103 enthalten
sind, und die gleichen räumlichen
Stellungen aufweisen, sich in großem Maße ändert. Ein solcher Makroblock 103 wird
nachstehend als schwierig zu codierender Makroblock 103 bezeichnet.
-
Wenn
im Gegensatz dazu ein Niveau von Pixeln, die in dem Makroblock 103 enthalten
sind, in Bezug auf Raum und Zeit stetig ist, nimmt die Anzahl von
Codierbits der Makroblockschicht 103S merklich ab oder
wird manchmal Null. Ein derartiger Makroblock 103 wird
nachstehend als leicht zu codierender Makroblock 103 bezeichnet.
-
Bei
dem Decodierverfahren nach H.261 wird zunächst PSC 105, der
eine Kennung der Vollbildschicht 101S ist, aus dem Bit-Strom 104 herausgefunden. Übrigens
spricht man von einem Zustand, bei dem ein decodierbarer Code erfolgreich
herausgefunden worden ist, davon, dass eine Synchronisation hergestellt
wird. Wenn der PSC 105 aus dem Bit-Strom herausgefunden
worden ist und eine Synchronisation der Vollbildschicht 101S hergestellt
worden ist, kann dann identifiziert werden, dass der Bit-Strom 104,
bis der nächste
PSC 105 erscheint, codierte Information für ein Vollbild
ist. Ferner kann eine zeitliche Stellung, in der das Vollbild 101,
das aus 352 X 288 Pixeln besteht und durch Decodieren des Bit-Stromes 104 für dieses
eine Vollbild erhalten wird, erhalten werden, indem die Vollbildnummer 106 im
Anschluss an den PSC 105 untersucht wird.
-
Nach
der Herstellung der Vollbildschicht wird ein GBSC 110,
der eine Kennung der GOB-Schicht 102S ist, aus dem folgenden
Bit-Strom 104 bei dem Codierverfahren nach H.261 herausgefunden.
Wenn eine Synchronisation der GBSC-Schicht hergestellt ist, kann
identifiziert werden, dass der Bit-Strom 104, bis der nächste GBSC 110 erscheint,
codierte Information für
eine GOB 102 ist. Ferner kann eine räumliche Stellung der GOB 102,
die aus 176 × 48
Pixeln besteht, die erhalten wird, indem der Bit-Strom 104 für diese eine GOB 102 in
einem Vollbild 101, in welchem die GOB 102 angeordnet
sein sollte, decodiert wird, erhalten werden, indem eine GN 111 untersucht wird,
die eine GOB-Nummer im Anschluss an den GBSC 110 ist.
-
Bei
dem Decodierverfahren nach H.261 wird ein Bit-Strom 104 einer
folgenden Makroblockschicht 103S nach der Herstellung der
GOB-Schicht 102s decodiert. Das Decodierverfahren der Makroblockschicht 103S ist
eine Prozedur, um einen Makroblock 103, der aus 16 × 16 Pixeln
besteht, bei Prozessen einer Codierung mit variabler Wortlänge, Rückquantisierung,
orthogonalen Rücktransformation,
Bewegungskompensation usw. wieder herzustellen, wie es vorher beschrieben
wurde. Es ist hier anzu merken, dass die Makroblockschicht 103S keinen
einzigartigen Code aufweist, durch den ein Decodierverfahren immer
identifiziert werden kann, unähnlich
wie der PSC 105 oder BGSC 110, und codierte Information von
jedem Makroblock aus Bits undefinierter Länge eines Codes mit variabler
Wortlänge
besteht.
-
Wie
es in 3 gezeigt ist, wird in der GOB-(Teilbild-)Schicht 102S die
codierte Information von dem ersten Makroblock 1151 bis
zum dreiunddreißigsten
Makroblock 11533 als eine Reihe
von Codes mit variabler Wortlänge
ohne einen einzigartigen Code ausgedrückt. Wenn ein Decodieren der
makroblockcodierten Information von einem Punkt aus eingeleitet
wird, der durch A in 3 angegeben ist und sukzessive
in der Reihenfolge von den ersten, den zweiten, ..., den n-ten,
..., den dreiunddreißigsten
Makroblöcken
durchgeführt
wird, ist es möglich,
alle Makroblöcke 103 in
der GOB-Schicht 102S wieder herzustellen. Wenn jedoch das
Decodieren der makroblockcodierten Information von einem Punkt aus
eingeleitet wird, der durch B oder C in 3 angegeben ist,
ist es unmöglich,
einen Punkt zu identifizieren, von dem aus codierte Information 115 von
einem Makroblock startet, was zu einem Versagen der Herstellung
einer Synchronisation führt.
In diesem Fall wird das Decodieren oder Wiederherstellen des gesamten
Makroblocks 103 undurchführbar, bis der nächste GBSC 110 erscheint.
Mit anderen Worten stellt der GBSC 110 auch einen Startpunkt
zum Decodieren der Makroblockschicht 103S dar.
-
Schließlich wird
dem Decodierverfahren nach H.261 die GOB 102, die ein Satz
von wieder hergestellten Makroblöcken 103 ist,
in einer räumlichen
Stellung innerhalb eines Vollbildes 101, die durch GN 111 gelenkt
wird, angeordnet, und das Vollbild 100, das ein Satz der
wieder hergestellten GOBs 102 ist, wird in einer Zeitstellung,
die durch TR 106 gelenkt wird, angeordnet.
-
Wie
oben ist es möglich,
ein Vollbild 101 eines digitalen Bewegtbildes korrekt in
Relation zu Raum und Zeit nach H.261 zu decodieren.
-
Jedoch
hat das obige übliche
Verfahren zum Codieren und Decodieren digitaler Bewegtbildsignale einen
Nachteil, dass, wenn ein Teil eines Bit-Stroms 104 fehlt oder in diesem
ein Fehler auftritt, es unmöglich
werden kann, alle Teilbilder (GOBs) 102 in Bezug auf die
Zeit genau zu decodieren, bis eine Synchronisation der nächsten Vollbildschicht 101S hergestellt ist.
-
Der
Grund für
das Obige ist, dass bei dem üblichen
Decodierverfahren Codes, die jederzeit in dem Bit-Strom 104 identifiziert
werden können,
nur der PSC 105, der eine Vollbildkennung ist, und der GBSC 110,
der eine Teilbildkennung ist, sind. Wenn ein Teil des Bit-Stroms 104 fehlt
oder in diesem ein Fehler auftritt, ist es unmöglich, eine Synchronisation der
Decodierung wiederzugewinnen, bis der nächste GBSC 110 erscheint,
so dass das Decodieren undurchführbar
wird. Selbst wenn der nächste
GBSC 110 erscheint, kann der Bit-Strom 104 dieser
Teilbildschicht 102S in Bezug auf die Zeit nicht korrekt
decodiert werden. Dies ist aus 4 zu verstehen.
-
4 zeigt
ein Beispiel, bei dem die fünfte GOB 1025 in dem n-ten Vollbild 101n bis
die sechste GOB 1026 in dem (n+1)-ten
Vollbild 101n+1 in Bezug auf die
Zeit aufgrund von einem Fehlen oder Fehlern des Bit-Stroms 104,
die in dem Burst auftreten, nicht decodiert werden können. Bei
diesem Beispiel fehlen nicht nur der PSC 105 gemäß dem (n+1)-ten
Vollbild in Bezug auf die Zeit, sondern auch der folgende TR 106,
oder beide sind fehlerhaft. Es ist deshalb möglich, die GOB 102 in
Bezug auf den Raum korrekt zu decodieren, indem eine Synchronisation
von dem GBSC 110 gemäß der siebten
GOB 102 in dem (n+1)-ten Vollbild 101n+1 in
Bezug auf die Zeit hergestellt wird, und die folgende GN 111 decodiert
wird, es ist jedoch unmöglich,
zu spezifizieren, ob diese Stellungen der GOB 102 im n-ten
Vollbild oder im (n+1)-ten Vollbild in Bezug auf die Zeit liegen.
-
Hinsichtlich
des Decodierens der achten GOB 1028 bis
der zwölften
GOB 10212 in dem (n+1)-ten Vollbild
in Bezug auf die Zeit ist es unmöglich,
zu spezifizieren, ob diese Stellung der GOBs 102 in dem
n-ten Vollbild oder in dem (n+1)-ten Vollbild in Bezug auf die Zeit
liegt.
-
Wenn
folglich ein Teil des Bit-Stroms 104 fehlt oder ein Fehler
in diesem auftritt, wird es unmöglich,
alle GOBs 102 in Bezug auf die Zeit korrekt zu decodieren,
bis eine Synchronisation der nächsten
Vollbildschicht 1015 hergestellt
ist.
-
Ferner
hat das übliche
Verfahren zum Codieren und Decodieren digitaler Bewegtbildsignale
einen weiteren Nachteil, dass, wenn die GOB 102, die ein
sich bewegendes Bild in Bezug auf die Zeit umfasst, nicht decodiert
werden kann, die Bildqualität des
wiedergegebenen Bildes stark verschlechtert wird.
-
Dieses
Problem wird anhand von 5 ausführlicher beschrieben. 5 zeigt
ein Vollbild, das decodierte Signale eines bewegten Bildes umfasst, wobei
sich eine Person in der Mitte des Vollbildes bewegt. In 5 ist
ein Teil, der sich in Bezug auf die Zeit bewegt, durch schräge Linien
angegeben, und der restliche Teil ist ein Hintergrund, der in Bezug
auf die Zeit in Ruhe ist. Eine Szene wie diese ist bei Videokonferenzen,
Bildtelefonen oder dergleichen üblich.
-
In 5 wird
davon ausgegangen, dass irgendeiner von der ersten GOB 1021 bis der vierten GOB 1024 nicht decodiert werden kann. Die ersten bis
vierten GOBs 1021 bis 1024 umfassen ein Bild, das in Bezug auf
die Zeit in Ruhe ist. Wenn beispielsweise die zweite GOB 1022 nicht decodiert werden kann, wird
ein geschickter Arbeitsgang durchgeführt, um bei der Decodierung
die zweite GOB 1022 des gegenwärtigen Vollbildes 101 durch
die zweite GOB 1022 des vorhergehenden
Vollbildes 101-1 zu ersetzen. Mit
diesem Arbeitsgang kann die Verschlechterung der Bildqualität in der
zweiten GOB 1022 des gegenwärtigen Vollbildes 101 kaum
festgestellt werden.
-
Jedoch
ist es ein Problem, wenn die fünften bis
zwölften
GOBs 1025 bis 10212 ,
die in 5 gezeigt sind, nicht decodiert werden können. Die
fünften
bis zwölften
GOBs 1025 bis 10212 umfassen
ein sich in Bezug auf die Zeit bewegendes Bild. Dies bedeutet beispielsweise,
dass ein Bild in der neunten GOB 1029 des
vorhergehenden Vollbildes 101-1 in Bezug
auf die Zeit stark verschieden von der neunten GOB 1029 des gegenwärtigen Vollbildes 101 ist. Wenn
das Decodieren des neunten GOB 1029 undurchführbar ist,
wird eine Verschlechterung der Bildqualität des neunten GOB 1029 des gegenwärtigen Vollbildes 101 offensichtlich
festgestellt, selbst wenn der oben erwähnte geschickte Arbeitsgang
beim Decodieren durchgeführt
wird.
-
Wenn
dementsprechend ein Decodieren der GOB 102, die ein sich
in Bezug auf die Zeit bewegendes Bild umfasst, undurchführbar wird,
wird die Qualität
eines wiedergegebenen Bildes stark verschlechtert.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Im
Lichte der obigen Probleme ist es eine Aufgabe der vorliegenden
Erfindung, ein Verfahren zum Codieren und Decodieren von digitalen
Bewegtbildsignalen bereitzustellen, das Teilbilder (GOB) im Anschluss
an ein problematisches Teilbild in Bezug auf die Zeit geeignet decodieren
kann, wenn ein Teil eines Bit-Stromes fehlt oder ein Fehler in dem Bit-Strom
auftritt.
-
Um
die Aufgabe zu erfüllen,
ist die vorliegende Erfindung derart ausgeführt, dass bei dem Verfahren
zum Codieren und Decodieren von digitalen Bewegtbildsignalen dieser
Erfindung die Anzahl an Blöcken,
die in einem Teilbild enthalten sind, gemäß einer Summe von Mengen von
erzeugter Information der Blöcke,
die in dem Teilbild enthalten sind, verändert wird, so dass jedes aller
Teilbilder, die in dem Vollbild enthalten sind, eine gleiche Summe
von Mengen der erzeugten Information der Blöcke, die in dem Teilbild enthalten
sind, aufweist.
-
Gemäß dem Verfahren
zum Codieren und Decodieren von digitalen Bewegtbildsignalen dieser Erfindung
wird die Anzahl an Blöcken,
die in einem Teilbild enthalten sind, gemäß einer Summe von Mengen von
erzeugter Information der Blöcke,
die in dem Teilbild enthalten sind, verändert, so dass jedes aller
Teilbilder, die in dem Vollbild enthalten sind, eine gleiche Summe
von Mengen der erzeugten Information der Blöcke, die in dem Teilbild enthalten
sind, aufweist. Folglich ist eine räumliche Größe von jedem Teilbild nicht
fest. Ein Teilbild, das einen Block mit einer großen Anzahl
von Codierbits aufweist, weist eine kleinere Größe auf, wohingegen ein Teilbild,
das einen Block mit einer kleinen Anzahl von Codierbits aufweist,
eine größere Größe aufweist.
Es ist daher möglich,
eine Verschlechterung eines wiedergegebenen Bilds zu unterdrücken, sogar,
wenn ein Teilbild nicht decodiert werden kann, da ein Teilbild,
das einen Block enthält,
der eine Bewegung in Bezug auf die Zeit umfasst und schwierig zu
codieren ist, eine kleinere Größe in Bezug
auf den Raum aufweist.
-
KURZBESCHREIBUNG
DER ZEICHNUNGEN
-
1 zeigt
Einheiten, die in einem üblichen Codierverfahren
zum Codieren von Bewegtbildsignalen zu codieren sind;
-
2 zeigt
einen Bit-Strom, der in dem üblichen
Codierverfahren zum Codieren von Bewegtbildsignalen erzeugt wird;
-
3 zeigt
eine GOB-Schicht in dem Bit-Strom in 2, der in
dem üblichen
Codierverfahren zum Codieren von Bewegtbildsignalen erzeugt wird;
-
4 veranschaulicht
einen Effekt eines Fehlens oder eines Fehlers von einem Teil eines Bit-Stroms,
der in dem üblichen
Codier- und Decodierverfahren zum Codieren und Decodieren von Bewegtbildsignalen
auftritt;
-
5 veranschaulicht
einen Effekt eines Fehlens oder eines Fehlers von einem Teil eines Bit-Stroms,
der in dem üblichen
Codier- und Decodierverfahren zum Codieren und Decodieren von Bewegtbildsignalen
auftritt;
-
6 zeigt
einen Bit-Strom, der in einem Verfahren zum Codieren von digitalen
Bewegtbildsignalen gemäß ersten
und zweiten Ausführungsformen dieser
Erfindung erzeugt wird;
-
7 ist
ein Flussdiagramm, das das Verfahren zum Decodieren von digitalen
Bewegtbildsignalen gemäß der ersten
Ausführungsform
dieser Erfindung veranschaulicht;
-
8 veranschaulicht
das Verfahren zum Codieren von digitalen Bewegtbildsignalen gemäß der zweiten
Ausführungsform
dieser Erfindung; und
-
9 zeigt
eine Struktur von Teilbildern gemäß der zweiten Ausführungsform
dieser Erfindung.
-
BESCHREIBUNG
DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
-
Nachstehend
wird eine Beschreibung von Ausführungsformen
gemäß der vorliegenden
Erfindung anhand der Zeichnungen vorgenommen.
-
Nun
wird ein Verfahren zum Codieren und Decodieren von digitalen Bewegtbildsignalen
gemäß einer
ersten Ausführungsform
beschrieben, welches ein Teilbild als eine Einheit in Bezug auf
die Zeit korrekt decodieren kann, selbst wenn ein Teil eines Bit-Stromes
fehlt oder in diesem ein Fehler auftritt.
-
Bei
dem Codierverfahren gemäß dieser
Ausführungsform
besteht ein Vollbild von digitalen Bewegtbildsignalen aus beispielsweise
352 × 288
Pixeln. Das Vollbild wird in zwölf
Teilbilder unterteilt, die jeweils aus beispielsweise 176 × 48 Pixeln
bestehen. Ferner wird das Teilbild in dreiunddreißig Blöcke 13 unterteilt,
die jeweils aus beispielsweise 16 × 16 Pixeln bestehen.
-
Das
Codierverfahren gemäß dieser
Ausführungsform
bringt codierte Information für
ein Vollbild mit einer räumlichen
hierarchischen Struktur in Übereinstimmung,
die aus einem Vollbild 11, Teilbildern 12 und
Blöcken 13 gebildet
ist, um einen Bit-Strom 14 zu erzeugen, wie er beispielsweise
in 6 gezeigt ist.
-
Die
Bedeutungen von codierter Information für jede Schicht, die in 6 gezeigt
ist, sind nachstehend angegeben:
Vollbildschicht 11S
PSC
(20 Bits): eine Vollbildkennung 15; ein einzigartiger Code,
durch den ein Decodierverfahren immer identifiziert werden kann
und der als "0000
0000 0000 0001 0000" ausgedrückt wird;
Teilbildschicht 12S
SFSC
(16 Bits): eine Teilbildkennung 16; ein einzigartiger Code,
durch den ein Decodierverfahren immer identifiziert werden kann
und der als "0000
0000 0000 0001" ausgedrückt wird;
SFNT
(5 Bits): eine Teilbildzeitnummer 17; gibt eine zeitliche
Stellung an, in der dieses Teilbild 12 angezeigt werden
sollte;
SFNS (4 Bits): eine Teilbildraumnummer 18;
gibt eine räumliche
Stellung an, in der das Teilbild 12 angezeigt werden sollte;
SFQUANT
(5 Bits): Quantisierungscharakteristikinformation 19; stellt
eine Quantisierungscharakteristik dar, wenn ein Block 13 in
dem Teilbild 12 codiert wird.
-
Übrigens
wird codierte Information 20 in der Blockschicht 13S,
die die niedrigste Hierarchie in 6 ist, in
einem Codierverfahren einer Bewegungsdetektion, -vorhersage, orthogonalen
Transformation, Quantisierung, Codierung mit variabler Wortlänge usw.,
dessen Codierbitzahl nicht fest ist, erzeugt.
-
Nun
wird anhand von 7 ein Decodierverfahren gemäß dieser
Ausführungsform
beschrieben. Zunächst
wird ein FSC 15, der eine Kennung einer Vollbildschicht 11S ist,
aus einem Bit-Strom 14 herausgefunden, um eine Synchronisation
der Vollbildschicht 11S herzustellen.
-
Nach
der Herstellung der Synchronisation der Vollbildschicht 11S wird
ein SFSC 16, der eine Kennung einer Teilbildschicht 12S ist,
aus dem folgenden Bit-Strom 14 herausgefunden, um eine
Synchronisation der Teilbildschicht 12S herzustellen. Dann
werden eine Teilbildzeitnummer SFNT 17 und eine Teilbildraumnummer
SFNS 18 im Anschluss an den SFSC 16 untersucht.
Als nächstes
wird ein Bit-Strom 14 einer Blockschicht 13S decodiert.
Ein Verfahren zum Decodieren dieser Blockschicht 13S ist
eine Prozedur, um den Block in Prozessen von beispielsweise einer
Decodierung mit variabler Wortlänge,
einer Rückquantisierung,
einer orthogonalen Rücktransformation,
einer Bewegungskompensation usw. wiederherzustellen. Schließlich wird
das Teilbild 12, das ein Satz der wiederhergestellten Blöcke 13 ist,
in zeitlichen und räumlichen
Stellungen angeordnet, die durch die SFNT 17 und die SFNS 18 angewiesen
werden. Wenn eine Synchronisation der Decodierung aufgrund des Fehlens
eines Teils des Bit-Stromes 14 oder eines Fehlers in diesem
verloren geht, wird eine Suche für
den SFSC 16, der eine Kennung der Teilbildschicht 12S ist,
gestartet. Ein Fehlen oder ein Fehler des Bit-Stromes 14 kann
beispielsweise daraus detektiert werden, dass ein decodierter Wert
einen Bereich übersteigt,
der im Voraus spezifiziert wird, oder dass ein unerwartetes Codewort
erscheint, wenn der Bit-Strom 14 decodiert wird. Wenn der
SFSC 16 detektiert wird und eine Synchronisation der Teilbildschicht 12S hergestellt
wird, werden die SFNT 17 und die SFNS 18 wie oben
festgestellt untersucht, die Blockschicht 13S wird decodiert
und wiederhergestellt, und das Teilbild 12, das ein Satz der
wiederhergestellten Blöcke 13 ist,
wird in zeitlichen und räumlichen
Stellungen angeordnet, die durch die SFNT 17 und die SFNS 18 angewiesen werden.
-
Gemäß der ersten
Ausführungsform
dieser Erfindung geht eine Synchronisation der Decodierung verloren
und das Decodieren wird undurchführbar,
wenn ein Teil des Bit-Stromes 14 fehlt oder ein Fehler
in dem Bit-Strom 14 auftritt,
jedoch wird ein korrektes Decodieren unmittelbar nach einem problematischen
Teilbild 12 möglich.
-
Wie
es bei der obigen ersten Ausführungsform
beispielhaft beschrieben worden ist, ist es alternativ möglich, dass
das Vollbild 11, das Teilbild 12 und der Block
unterschiedliche Größen und
Formen aufweisen. Eine Bit-Länge von
jeder codierten Information kann zusätzlich verschieden sein von
derjenigen der oben codierten Information, oder die Vollbildschicht 19 kann
weggelassen werden.
-
Gemäß einer
zweiten Ausführungsform
dieser Erfindung wird nun eine Beschreibung eines Verfahrens zum
Codieren von digitalen Bewegtbildsignalen vorgenommen, das eine
Verschlechterung eines wiedergegebenen Bildes bis auf ein kleines
Ausmaß unterdrücken kann,
wenn ein Teilbild, das ein sich in Bezug auf die Zeit bewegendes
Bild umfasst, nicht decodiert werden kann. Es ist übrigens
möglich, hier
ein Decodierverfahren anzuwenden, das ähnlich ist wie das der ersten
Ausführungsform.
-
Bei
dem Codierverfahren dieser Erfindung besteht ein Vollbild 11 von
digitalen Bewegtbildsignalen aus beispielsweise 352 × 288 Pixeln.
Das Vollbild 11 wird in Blöcke unterteilt, die jeweils
aus 16 × 16
Pixeln bestehen. Mit anderen Worten besteht ein Vollbild 11 aus
22 Blöcken × 18 Blockzeilen 21.
Die Blockzeile 21 entspricht dem oben erwähnten Teilbild 12.
-
Bei
dem Codierverfahren dieser Ausführungsform
wird jeder Block 13' von
der obersten Blockzeile 21 codiert, wie es in 8 gezeigt
ist, um codierte Information zu erzeugen. Die codierte Information
von jedem Block 13' wird
in einem Codierverfahren von beispielsweise einer Bewegungsdetektion,
-vorhersage, orthogonalen Transformation, Quantisierung, Codierung
mit variabler Wortlänge, usw.,
dessen Anzahl von Codierbits nicht fest ist, erzeugt. Insbesondere
ist die Anzahl von Codierbits eines Blocks 13', der schwierig
zu codieren ist, groß, wohingegen
die Anzahl von Codierbits eines Blocks 13', der leicht zu codieren ist, klein
ist. Bei dem Codierverfahren dieser Ausführungsform bildet ein Satz von
Blöcken 13 oder 13' ein Teilbild 12 (oder
eine Blockzeile 21), die eine Codiereinheit ist, jedoch
ist die Anzahl von Blöcken 13 oder 13', die in einem
Teilbild 12 oder 12' enthalten
sind, nicht fest.
-
Nun
werden eine Art und Weise eines Erzeugens eines Bit-Stromes 14 bei
dem Codierverfahren dieser Erfindung und eine Struktur einer Teilbildschicht 12S anhand
von 6 beschrieben. Wenn ein Vollbild codiert wird,
wird eine Kennung einer Vollbildschicht codiert, und ein FSC 15 wird
in einem Bit-Strom 14 angeordnet. Als nächstes werden die Kennung der
Teilbildschicht 12S, eine Zeitnummer und eine Raumnummer
dieses Teilbildes und eine Quantisierungscharakteristik dieses Teilbildes
miteinander codiert, und die Codeworte eines SFSC 16, einer
SFNT 17, einer SFNS 18 und eines SFQUANT 19 werden
in dem Bit-Strom 14 angeordnet. Gleichzeitig wird ein bezüglich einer
Blockcodierbitzahl integrierter Wert B-add auf Null gesetzt. Im
Anschluss daran wird ein Block 13 codiert, und codierte
Information des Blocks 13, die aus variablen Codes besteht, wird
in dem Bit-Strom 14 angeordnet. Damit einhergehend wird
die Codierbitzahl B dieses Blocks 13 zu B-add addiert.
Es wird nämlich
eine Gleichung B-add = B-add + B berechnet. Ähnlich werden sukzessive Blöcke 13 codiert,
codierte Information 20 von jedem Block 13 wird
in dem Bit-Strom 14 angeordnet und eine Berechnung von
B-add = B-add + B wird jedes Mal wiederholt. Falls der B-add ein
Teilbildintervall SFd übersteigt,
wenn ein Codieren eines bestimmten Blockes 12 abgeschlossen
ist, werden eine Kennung des Teilbildes, eine Zeitnummer und eine
Raumnummer dieses Teilbildes und eine Quantisierungscharakteristik
dieses Teilbildes codiert und Codeworte eines SFSC 16,
einer SFNT 17, einer SFNS und eines SFQUANT 19 werden
in dem Bit-Strom 14 angeordnet. Gleichzeitig wird ein in
Bezug auf das Blockcodierbit integrierter Wert B-add auf Null gesetzt.
Mit anderen Worten wird begonnen, von diesem Punkt aus eine neue
Teilbildschicht 12S zu bilden.
-
Das
Teilbildintervall SFd wird auf beispielsweise 540 Bits gesetzt.
Falls ein Teilbild mit beispielsweise 6400 Bits bei dem Codierverfahren
dieser Erfindung codiert wird, gibt es deshalb 12 Teilbilder 12 in
einem Vollbild, weil 6400/540 = 11,85.
-
Bei
dem Codierverfahren gemäß dieser
Ausführungsform
wird die Anzahl von Blöcken 13,
die in einem Teilbild 12 enthalten sind, gemäß einer
Menge von erzeugter Information der Blöcke, die in einem Teilbild
enthalten sind, verändert,
wodurch eine räumliche
Größe des Teilbildes 12 verändert wird, wie
es oben festgestellt wurde. Insbesondere wird ein Teilbild 12,
das einen Block enthält,
der schwierig zu codieren ist, klein, wohingegen ein Teilbild 12,
das einen Block 13 enthält,
der leicht zu codieren ist, groß wird. 9 zeigt
ein Beispiel einer Struktur von Teilbildern, die bei dem Codierverfahren
dieser Ausführungsform
gebildet wird.
-
Gemäß der zweiten
Ausführungsform
dieser Erfindung wird ein Teilbild 12, das einen Block 13 umfasst,
der eine Bewegung in Bezug auf die Zeit enthält und der somit schwierig
zu codieren ist, in Bezug auf den Raum kleiner eingerichtet. Wenn
ein derartiges Teilbild 12 nicht decodiert werden kann,
ist es möglich,
eine Verschlechterung der Qualität
eines wiedergegebenen Bildes auf ein kleines Ausmaß zu unterdrücken. In
einem Bereich in einem Vollbild, in dem keine Bewegung in Bezug
auf die Zeit vorhanden ist und eine Verschlechterung der Bildqualität kaum festgestellt
wird, selbst wenn das Decodieren undurchführbar ist, wird die Größe eines
Teilbildes in Bezug auf den Raum groß, was ein geringeres Volumen
von Nebeninformation, wie beispielsweise die Teilbildkennung SFSC 16,
die Teilbildnummer SFNT 16 und die Teilbildnummer SFNT 17 erlaubt.
Dies kann verhindern, dass der Codierwirkungsgrad herabgesetzt wird.
-
Nachdem
die zweite Ausführungsform
beispielhaft beschrieben worden ist, ist es alternativ möglich, dass
das Vollbild 11, das Teilbild 12 und der Block 13 unterschiedliche
Größen und
Formen aufweisen. Es ist auch möglich,
Werte einer Menge von Codes von einem Vollbild und einem Teilbildintervall SFD
anzuwenden, die verschieden sind von jenen, die bei dem obigen Beispiel
angewandt wurden.
-
Wie
es aus den obigen Ausführungsformen deutlich
wird, ermöglicht
diese Erfindung ein korrektes Decodieren jedes Teilbildes 12 als
eine Einheit in Bezug auf die Zeit, selbst wenn ein Teil des Bit-Stromes 14 fehlt
oder in diesem ein Fehler auftritt.
-
Ferner
ist es gemäß dieser
Erfindung möglich,
eine Verschlechterung der Qualität
des wiedergegebenen Bildes auf ein kleines Ausmaß zu unterdrücken, falls
ein Teilbild 13, das einen Block umfasst, der in Bezug
auf die Zeit in Bewegung ist, nicht decodiert werden kann.
-
Außerdem wird
zugelassen, dass in einem Bereich in einem Vollbild, in dem keine
Bewegung in Bezug auf die Zeit vorhanden ist und eine Verschlechterung
der Qualität
der wiedergegebenen Bildqualität
kaum festgestellt wird, selbst wenn das Decodieren undurchführbar ist,
Nebeninformation des Bereiches in einem kleinen Volumen vorhanden ist,
so dass es möglich
ist, zu verhindern, dass der Codierwirkungsgrad herabgesetzt wird.