ES2317286T3 - Procedimiento y dispositivo para codificar y decodificar. - Google Patents
Procedimiento y dispositivo para codificar y decodificar. Download PDFInfo
- Publication number
- ES2317286T3 ES2317286T3 ES05776246T ES05776246T ES2317286T3 ES 2317286 T3 ES2317286 T3 ES 2317286T3 ES 05776246 T ES05776246 T ES 05776246T ES 05776246 T ES05776246 T ES 05776246T ES 2317286 T3 ES2317286 T3 ES 2317286T3
- Authority
- ES
- Spain
- Prior art keywords
- cif
- block
- block structure
- resolution
- baselineskip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Procedimiento para la codificación de video de secuencias de imágenes en el que las imágenes de la secuencia de imágenes se codifican escaladamente tal que los datos de vídeo que resultan contienen informaciones que aseguran una representación de las imágenes en múltiples escalones de resolución diferentes por cada imagen, viniendo definido el correspondiente escalón de resolución por la cantidad de los puntos de imagen por cada representación de imagen de las imágenes, realizándose la codificación basada en bloques y generándose una estructura de bloques que puede subdividir la imagen en el correspondiente escalón de resolución en bloques, bloques parciales y subbloques, describiendo esta subdivisión un eventual movimiento contenido en la secuencia de imágenes y subdividiéndose la estructura de bloques partiendo de un bloque en bloques parciales y en parte los bloques parciales (MB1_QCIF..MB4_QCIF,MB1_CIF..MB4_CIF,MB1_4CIF..MB4..4CI) en sucesivos subbloques de división más fina con las siguientes etapas: a) temporalmente se genera para un primer escalón de resolución una primera estructura de bloques (MV_QCIF; MV_CIF) y para un segundo escalón de resolución una segunda estructura de bloques (MV_CIF; MV_4CIF), presentando el primer escalón de resolución una cantidad de puntos de imagen inferior a la del segundo escalón de resolución, b) la segunda estructura de bloques (MV_CIF; MV_4CIF) se compara con la primera estructura de bloques (MV_QCIF; MV_CIF) tal que las diferencias en la subdivisión de las estructuras de bloques se detectan como diferencias de estructura, c) sobre la base de las características de las diferencias de estructura, se comprueba qué parte de la segunda estructura de bloques ha de tomarse en una segunda estructura de bloques modificada (MV''_CIF; MV''_4CIF) y la segunda estructura de bloques modificada se genera sobre la base de la comprobación, d) la segunda estructura de bloques modificada (MV''_CIF; MV''_4CIF) se toma como base para la codificación de la secuencia de imágenes.
Description
Procedimiento y dispositivo para codificar y
decodificar.
La invención se refiere a un procedimiento para
la codificación de video según el preámbulo de la reivindicación 1,
un procedimiento para la decodificación según el concepto genérico
de la reivindicación 14, así como codificador para la codificación
de video según el concepto genérico de la reivindicación 15 y un
dispositivo decodificador según el concepto genérico de la
reivindicación 16.
Los datos de video digitales se comprimen por lo
general para una memorización o transmisión, para reducir
significativamente el enorme volumen de datos. La compresión se
realiza entonces tanto eliminando la redundancia de señales
contenida en los datos de video como también eliminando las partes
de señal irrelevantes no perceptibles por el ojo humano. Esto se
logra por lo general mediante un procedimiento de codificación
híbrido, en el que la imagen a codificar primeramente se predice en
el tiempo y el error de predicción que queda se transforma a
continuación en la gama de frecuencias, por ejemplo mediante una
transformación cosenoidal discreta y allí se cuantifica y se
codifica mediante un código de longitud variable. La información de
movimiento y los coeficientes espectrales cuantificados se
transmiten finalmente.
Cuanto mejor sea esta predicción de la siguiente
información de imagen a transmitir, tanto más pequeño será el error
de predicción que quede tras la predicción y tanto más reducida será
la velocidad de datos que tenga que emplearse a continuación para
la codificación de este error. Una tarea esencial en la compresión
de datos de video consiste por lo tanto en obtener una predicción
lo más exacta posible de la imagen a codificar a partir de la
información de imagen ya transmitida previamente.
La predicción de una imagen se realizó hasta
ahora dividiendo la imagen primeramente por ejemplo en piezas
regulares, típicamente bloques cuadrados del tamaño 8x8 ó 16x16
puntos de imagen, y realizándose a continuación para cada uno de
estos bloques de imagen una predicción a partir de la información de
imagen ya conocida en el receptor mediante compensación de
movimientos. (Desde luego pueden resultar también bloques de
diferente tamaño). Tal proceder puede deducirse de la figura 1.
Entonces pueden diferenciarse dos casos básicos de predicción:
- -
- Predicción unidireccional: La compensación de movimientos se realiza aquí exclusivamente sobre la base de la imagen transmitida antes y da lugar a las llamadas "P-Frames" (estructuras P).
- -
- Predicción bidireccional: La predicción de la imagen se realiza mediante superposición de dos imágenes, de las cuales una es anterior en el tiempo y la otra es posterior en el tiempo y que da lugar a las llamadas "B-Frames" (estructuras B). Es de observar al respecto que ambas imágenes de referencia ya han sido transmitidas.
En función de estos dos casos posibles de
predicción, resultan para filtrados compensados en movimiento en el
tiempo ("Motion Compensated Temporal Filtering, MTCF") cinco
modos de orientación en el procedimiento de MSRA [1], tal como se
deduce de la figura 2.
La videocodificación escalable basada en MCTF se
emplea para asegurar una buena calidad de video para una gama muy
amplia de velocidades de bits. No obstante los algoritmos MCTF hoy
conocidos muestran al respecto resultados inaceptables para
velocidades de bits reducidas, lo cual es atribuible a que existe
demasiado poca textura (informaciones de bloque) en relación con
las informaciones que hacen referencia a las informaciones de
movimiento (estructuras de bloque y vectores de movimiento) de un
video definido por una secuencia de imágenes.
Por lo tanto, se necesita una forma escalable de
información de movimiento para lograr una relación óptima entre
textura y datos de movimiento para cada velocidad de bits y también
resolución. Para ello se conoce por [1] una solución de MSRA
(Microsoft Research Asia) que representa el estado actual de los
algoritmos MCTF.
Allí propone la solución MSRA representar los
movimientos por niveles, separándolos en sucesivas estructuras más
finas. El procedimiento MSRA logra así que la calidad de las
imágenes mejore en general para bajas velocidades de bits.
No obstante, esta solución tiene el
inconveniente de que da lugar a algunos desplazamientos en la imagen
reconstruida, que son atribuibles a un desplazamiento entre las
informaciones de movimiento y la textura.
El documento ZHANG X Y COLAB. "Adaptive
Quadtree Coding Of Motion-Compensated Image
Sequences for Use on the Broadband ISDN" (Codificación adaptiva
de árbol cuádruple de secuencias de imágenes compensadas en
movimiento para su uso en la banda ancha ISDN), actas IEEE sobre
circuitos y sistemas para la tecnología del video, vol. 3, núm. 3,
1 junio 1993 (ver al respecto en particular las páginas
222-223, párrafo II; FIGURAS 1-4)
corresponde al estado más próximo de la técnica y describe un
procedimiento escalable para la codificación de video basada en una
representación Quadtree (de árbol cuádruple) escalable.
La tarea que sirve como base a la invención es
indicar un procedimiento para codificar y decodificar, así como un
codificador y decodificador que aseguren una codificación de video
mejorada.
Esta tarea se resuelve partiendo del
procedimiento para la codificación según el preámbulo de la
reivindicación 1, mediante sus particularidades
características.
Además, se resuelve esta tarea mediante un
procedimiento para la decodificación según el concepto genérico de
la reivindicación 14, el codificador según el concepto genérico de
la reivindicación 15, así como el decodificador según el concepto
genérico de la reivindicación 16, mediante sus particularidades.
Mediante este procedimiento se minimiza la
diferencia entre informaciones de textura y además pueden
codificarse estas informaciones con un coste mínimo. Además,
desaparece el desplazamiento para los casos en los que se ha
elegido el campo vectorial de movimiento más basto, con lo que queda
asegurada una mejora de la calidad de la imagen incluso para bajas
velocidades de bits, así como para bajas resoluciones.
Preferiblemente se captan para ello, para la
detección de diferencias, los subbloques añadidos, captándose para
la averiguación de diferencias alternativa o complementariamente las
características de los subbloques.
Si se capta como característica de los
subbloques el tamaño de bloque de los subbloques, se obtiene un
indicador muy bueno en la práctica relativo al grado de precisión
de las estructuras de bloque generadas.
Si se incluye para el cálculo de diferencias
sólo aquel bloque parcial de la primera estructura de bloques que
corresponde al bloque parcial de la segunda estructura de bloques,
pueden reducirse aún más las diferencias de las informaciones de
textura.
Aquí se incluyen preferiblemente sólo aquellos
subbloques de la segunda estructura de bloques en la segunda
estructura de bloques modificada cuyo tamaño de bloque alcanza un
valor de umbral definido. De esta manera se logra que no tenga que
transmitirse una estructura de bloques completa, es decir, un campo
vectorial de movimiento completo, sino solamente la parte más
significativa de la estructura. Esto da lugar por un lado a una
reducción de la información a transmitir y además, pese a esta
reducción, a una eliminación o bien reducción del desplazamiento
relativo a la imagen codificada con artefactos. En la práctica es
entonces especialmente ventajosa la utilización de un valor de
umbral definible, ya que por ejemplo los valores óptimos obtenidos
mediante simulación o ensayos experimentales pueden ajustarse aquí,
pudiendo esperarse de ellos en base a los resultados de la
simulación o bien experimentos resultados muy buenos.
Preferiblemente se define entonces el valor de
umbral tal que el mismo indica una relación entre el tamaño de
bloque de un subbloque de la segunda estructura de bloques y un
tamaño de bloque contenido en una zona utilizada para comparación
de la primera estructura de bloques que está asociada al subbloque
más pequeño de la zona.
Además, se prevé en un perfeccionamiento señalar
que los subbloques tomados pueden ser no diádicos.
Puede lograrse una mejora adicional de los
resultados en cuanto a la representación de la imagen codificada
cuando como primera estructura de bloques de un tercer escalón de
resolución se utiliza la segunda estructura de bloques modificada
del segundo escalón de resolución, presentando el segundo escalón de
resolución una cantidad de puntos de imagen inferior al tercer
escalón de resolución. Con ello se utilizan por lo tanto otras
posibles estructuras de bloques para cada escalón más alto de
resolución para generar la segunda estructura de bloques
modificada, utilizándose en ellas la segunda estructura de bloques
modificada del escalón de resolución precedente en cada caso para
la comparación correspondiente a la invención.
También es ventajoso para una decodificación que
la codificación se realice de tal manera que los subbloques no
incluidos en la segunda estructura de bloques modificada se marquen
en cada caso.
Para ello se prevé preferiblemente que la
marcación se realice mediante la utilización de un modo de
orientación denominado not_refind (no reencuentro).
La tarea que sirve de base a la invención se
resuelve también mediante el procedimiento para decodificar una
secuencia de imágenes codificada, generándose una representación
escalada de las secuencias de imágenes teniendo en cuenta la
segunda estructura de bloques modificada contenida en la secuencia
de imágenes y generada según el procedimiento correspondiente a la
invención para la codificación.
También contribuye a la solución de la tarea el
codificador correspondiente a la invención, que presenta medios
para realizar el procedimiento, así como el correspondiente
decodificador, que presenta medios para decodificar una secuencia
de imágenes codificadas según el procedimiento.
Otros detalles de la invención, así como
ventajas, se describirán en base a las figuras 1 a 5 con referencia
a un ejemplo de ejecución de la invención. Al respecto muestra:
figura 1 el modelo de una estimación del
movimiento para generar información de movimiento escalable,
figura 2 los modos de orientación necesarios
para ello,
figura 3 los tamaños de subbloques que se
utilizan al respecto,
figura 4 la representación esquemática de
estructuras de bloques generadas según la invención,
figura 5 la comparación de una imagen codificada
según el procedimiento correspondiente a la invención con una
imagen codificada según el estado de la técnica.
En la figura 1 se representa esquemáticamente la
solución MSRA conocida por el estado de la técnica, que se describe
para una mejor comprensión de la invención, ya que la misma se
utiliza en el ejemplo de ejecución descrito al menos en partes.
Según MSRA se realiza la citada estimación de
movimiento multinivel en cada nivel (layer) temporal. La estimación
de movimiento se realiza entonces para una resolución espacial fija
con diversos tamaños de macrobloque, para que el campo vectorial de
movimiento que resulta se adapte a la resolución decodificada. Por
ejemplo cuando el escalón de resolución original es un formato
codificado en CIF y el escalón de resolución decodificado se
realiza como formato QCIF, la estimación de movimiento se realiza
sobre el plano de resolución del formato CIF o bien de la
resolución CIF, realizándose esto con un tamaño de bloque de 32x32
como base y con un tamaño de macrobloque de 8x8 como tamaño de
bloque mínimo. Cuando por el contrario el formato decodificado es un
formato CIF, se escala el tamaño de los macrobloques en el factor 2
hacia abajo, tal como puede observarse en la figura 1.
Tal como puede observarse además en la figura 1,
se transmiten en el ramal inferior del procesamiento allí
representado para la decodificación del bloque existente en el
formato QCIF los vectores de movimiento originales, mientras que
para cada nivel más alto, por ejemplo aquél que sirve para
decodificar el bloque CIF, solamente se utiliza la información
diferencial respecto a los vectores de movimiento. Entonces puede
servir un vector de movimiento individual de un nivel inferior para
la predicción de varios vectores del nivel más alto cuando el
bloque se fracciona en bloques parciales más pequeños.
Los distintos modos señalan entonces la
dirección de la compensación del movimiento, tal como ya se ha
indicado y se representa en la figura 2, mientras que en la figura
3 se observa que las estructuras de bloques se codifican según el
procedimiento MSRA, por el mismo método que se utiliza en el
estándar MPEG-4 AVC (Advanced Video Coding,
codificación avanzada de video) [2].
Para elegir la estructura de bloques y la
dirección de la compensación del movimiento, que han de codificarse,
se prevé según los principios MSRA utilizar una llamada función de
costes que se ha definido para esta función y que se conoce bajo el
concepto "Rate Distortion Optimisation" (optimización de la
tasa de distorsión).
En la representación multinivel del movimiento
según MSRA, se generan diversas descripciones del movimiento que
están adaptadas a las distintas resoluciones locales para el mismo
nivel temporal (Frame Rate, frecuencia de reproducción de
imágenes). Entonces se considera la estimación de movimiento que
pertenece a las resoluciones más elevadas como información
enriquecedora (enhancement layer/information), sobre la base de una
detección de la información de movimiento basta. Puesto que el
bloque de error residual generado por el campo de vector de
movimiento basto contiene mucha energía, sólo se transmite aquel
bloque de error residual que se genera tras la compensación de
movimiento más precisa. Esto da lugar, sobre todo cuando se elige la
información de movimiento más basta, a artefactos muy fuertes en la
imagen de error residual reconstruida, teniendo lugar esto incluso
con velocidades de bits altas.
En la figura 4 se representa cómo las
estructuras de bloques temporales generadas según la invención dan
lugar, utilizando el procedimiento correspondiente a la invención, a
estructuras de bloques que en definitiva deben ser
transmitidas.
Se observan tres estructuras de bloques
temporales MV_QCIF, MV_CIF y MV_4CIF. Al respecto cada una de estas
estructuras de bloques está asignada según la invención a un
respectivo escalón de resolución, designándose bajo escalón de
resolución el formato de la resolución con el que puede
representarse una señal de video codificada según el procedimiento
correspondiente a la invención que está compuesta por secuencias de
imágenes.
Para el presente ejemplo de ejecución se trata
entonces del Common Intermediate Format (CIF), formato intermedio
común, el formato QCIF, así como el formato 4CIF.
QCIF es entonces un primer escalón de
resolución, es decir, el escalón de resolución más bajo elegido para
el procedimiento correspondiente a la invención, con lo que al
mismo se le asigna en el marco de la invención también una primera
estructura de bloques MV_QCIF, mientras que CIF es un segundo
escalón de resolución, para el que se genera en el marco de la
invención una segunda estructura de bloques MV_CIF.
La generación de la estructura de bloques se
realiza entonces en el marco de un algoritmo de estimación del
movimiento, por ejemplo utilizando el ya indicado procedimiento MCIF
y/o MSRA.
Es de señalar por lo demás que las estructuras
de bloques temporales MV_QCIF, MV_CIF y MV_4CIF presentan
estructuras de subbloques que se afinan sucesivamente, que están
caracterizadas porque partiendo en cada caso de bloques parciales
definidos MB1_QCIF...MB4_QCIF de estructura de bloques temporal
MV_QCIF, MV_CIF y MV_4CIF, se añaden otros subbloques que resultan
cada vez más afinados.
Además, en la representación puede observarse
que las estructuras temporales de bloques MV_QCIF, MV_CIF y MV_4CIF
tienen la misma resolución local, y que esto permanece constante a
pesar de que aumenta la cantidad de puntos de imagen al pasar de un
escalón de resolución a otro escalón de resolución.
En la figura 4 pueden observarse por lo demás
las estructuras de bloques MV'_QCIF, MV'_CIF y MV'_4CIF a transmitir
o bien, en definitiva, por ejemplo para una aplicación streaming
(utilizar antes de la descarga), transmitidas, que son generadas
utilizando el procedimiento correspondiente a la invención a partir
de las estructuras temporales de bloques MV_QCIF, MV_CIF y MV_4CIF
comparando en cada caso una estructura de bloques perteneciente a un
escalón de resolución elevado con una estructura de bloques
perteneciente al siguiente escalón de resolución más bajo y
generándose como resultado una estructura de bloques modificada
perteneciente al escalón de resolución considerado, que presenta
estructuras de subbloques que sólo contienen un subconjunto parcial
de la estructura de bloques temporal perteneciente al mismo escalón
de resolución, no tratándose aquí de un subconjunto auténtico que
excluiría el caso de que la estructura de subbloques de la
estructura de bloques modificada sea idéntica a la estructura de
subbloques de la correspondiente estructura de bloques temporal,
sino que más bien incluso también puede presentarse este caso
especial según el procedimiento correspondiente a la invención,
tratándose solamente de un subconjunto (sencillo) conocido por
ejemplo por las matemáticas.
Este algoritmo correspondiente a la invención se
describirá a continuación con algo más de detalle.
En el marco de la invención se comienza con la
generación de una estructura de bloques perteneciente al escalón de
resolución más bajo. A partir de esta primera estructura de bloques
MV_QCIF resulta según la invención entonces directamente la
estructura de bloques modificada MV'_QCIF, ya que para este caso,
naturalmente, no puede realizarse ninguna comparación con una
estructura de bloques precedente. La estructura de bloques
modificada MV'_QCIF que entonces resulta tiene por tanto la misma
estructura de subbloques que presenta la primera estructura de
bloques MV_QCIF.
En el marco de la invención se genera en una
etapa siguiente para el siguiente escalón de resolución más alto,
en este caso CIF, una segunda estructura de bloques MV_CIF. Es de
señalar al respecto que en la segunda estructura de bloques MV_CIF
se han añadido otros subbloques, que dan lugar a una estructura de
subbloques más fina, tal como presenta al respecto en comparación
la primera estructura de bloques MV_QCIF. Los subbloques o bien
estructuras de subbloques que se han añadido, se han representado en
la figura con trazo de líneas y puntos.
Por lo tanto, en el marco de la invención se
realiza en la siguiente etapa una comparación en la que los
subbloques que se han añadido se comprueban en cuanto a sí
presentan un tamaño de bloque que es más de cuatro veces más
pequeño que el tamaño de bloque más pequeño de la correspondiente
zona parcial de la primera estructura de
bloques.
bloques.
Si esto es así, entonces se toma la
correspondiente estructura de subbloques en una segunda estructura
de bloques modificada MV'_CIF, mientras que en los casos en los que
el subbloque a investigar presenta una precisión inferior, se
renuncia a tomar la estructura de subbloques en la segunda
estructura de bloques modificada a transmitir.
Para poder describir esto mejor, se han extraído
en la figura 4 a modo de ejemplo dos de los subbloques contenidos en
la segunda estructura de bloques MV_CIF, a saber, un primer
subbloque SB1 y un segundo subbloque
SB2.
SB2.
El primer subbloque SB1 se encuentra en un
primer bloque parcial MB1_CIF de la segunda estructura de bloques
MV_CIF. Correspondientemente se investiga en un primer bloque
parcial MB1_QCIF de la primera estructura de bloques MV_QCIF
correspondiente al primer bloque parcial MB1_CIF de la segunda
estructura de bloques MV_CIF, cuál es el tamaño de subbloque más
pequeño que aquí se presenta. En el presente ejemplo viene definido
este tamaño de bloque mínimo por un primer subbloque mínimo
MIN_SB1. Tal como puede observarse, corresponde el tamaño del
primer subbloque al tamaño del primer subbloque mínimo, con lo que
en este caso no hay ningún afinamiento. Correspondientemente no se
toma según la invención en la segunda estructura de bloques MV_CIF a
transmitir la estructura de subbloques que sirve de base al primer
subbloque, con lo que en la representación de la figura 4 de la
segunda estructura de bloques modificada MV_CIF falta la trama de
punto y raya en el correspondiente
lugar.
lugar.
Entre otros se incluye también un segundo
subbloque SB2 para la comparación. Puesto que el segundo subbloque
SB2 está incluido en un cuarto bloque parcial MB4_CIF de la segunda
estructura de bloques MV_CIF, se busca correspondientemente en un
cuarto subbloque MB4_QCIF de la primera estructura de bloques
MV_QCIF un tamaño de bloque mínimo. Esto viene dado por un segundo
subbloque mínimo MIN_SB2, que en este caso divide exactamente el
cuarto bloque parcial MB4_QCIF de la primera estructura de bloques
MV_QCIF. Tal como puede observarse, representa en este caso el
tamaño del segundo subbloque SB2 la octava parte del tamaño del
segundo subbloque mínimo MIN_SB2, con lo que incluso se da un
afinamiento de ocho veces en comparación con la primera estructura
de bloques MV_QCIF. Por lo tanto, en el marco de la invención se
toma la estructura de subbloques que define el segundo subbloque
también en la segunda estructura de bloques modificada MV'_CIF. Lo
mismo sucede para todos aquellos bloques de la segunda estructura
de bloques MV_CIF, tal como puede observarse en la representación
según la figura 4 en las estructuras dibujadas con trazo discontinuo
de la segunda estructura de bloques modificada
MV'_CIF.
MV'_CIF.
Tal como muestra una comparación entre la
segunda estructura de bloques MV_CIF y la segunda estructura de
bloques modificada MV'_CIF, no se han tomado todas las estructuras
de bloque de la segunda estructura de bloques MV'_CIF. Para que
pueda representarse ahora correctamente una secuencia de imágenes
codificada de esta manera, se añade en la codificación de las
estructuras de bloques que deben ser transmitidas un distintivo de
aquellos subbloques que no han sido incluidos en la estructura de
bloques modificada. El procedimiento correspondiente a la invención
encuentra también aplicación en otros escalones de resolución de la
misma manera. Por ejemplo se genera según el presente ejemplo de
ejecución para el formato 4CIF igualmente una estructura de bloques
MV_4CIF. Según la invención, se utiliza la misma a continuación a su
vez como una segunda estructura de bloques, mientras que la primera
estructura de bloques viene dada por la precedente segunda
estructura de bloques MV_CIF. La segunda estructura de bloques
modificada MV'4CIF que resulta de la comparación entre ambas
estructuras de bloques, se ha afinado entonces en la representación
de la figura 4 a su vez sólo mediante una parte de las estructuras
de subbloque añadidas que en la representación se han dibujado con
trazo a puntos.
Alternativa o complementariamente puede
utilizarse para la comparación, en lugar de una estructura de
bloques temporal, una segunda estructura de bloques ya generada
transmitida, es decir, modificada, como primera estructura de
bloques.
Al respecto no es necesario en el marco de la
invención generar para todos los escalones de resolución codificados
en la secuencia de imágenes de estructuras de bloques a trasmitir
según la invención, sino por ejemplo sólo en las resoluciones
parciales de las citadas resoluciones, es decir, por ejemplo sólo
para CIF en el caso de que se haya utilizado QCIF, CIF ó 4CIF o
bien sólo para CIF en el caso de que se hayan utilizado QCIF y CIF.
Más bien es suficiente en la práctica utilizar esto con escalones de
resolución media en comparación con todos los escalones de
resolución existentes, ya que para un nivel de resolución medio
resulta la mejor performance (calidad), porque allí puede evitarse
un Up and Down Sampling (muestreo hacia arriba y hacia abajo) de
las estructuras de bloques y de los vectores de movimiento. Aquí se
ajusta mediante un parámetro en cada caso la velocidad de datos
para la información de movimiento para los distintos escalones de
resolución locales, con lo que resulta en cada escalón de
resolución una relación óptima entre la velocidad de datos para la
información de movimientos y la información de textura.
La invención no queda limitada entonces al
ejemplo de ejecución descrito en base a la figura 4, sino que
incluye todas las realizaciones incluidas en el marco del
conocimiento especializado que corresponden al núcleo
correspondiente a la invención:
Esto es así en el campo vectorial de movimiento
completo generado, en particular según MSRA (estructuras de bloques
temporales MV_QCIF, MV_CIF y MV_4CIF), que está definido o bien
existe por el lado del codificador, aún cuando no hayan de
transmitirse completamente, sino más bien solamente la parte más
significativa de este campo vectorial de movimiento.
Una ventaja esencial del algoritmo
correspondiente a la invención es entonces la mejora de la calidad
de la imagen también con bajas velocidades de bits, así como
también para bajas resoluciones.
Esto puede observarse por ejemplo en ambas
imágenes de la figura 5. La imagen representada en la parte
izquierda muestra al respecto una imagen codificada según el
formato CIF, que ha sido codificada a 15 Hz y 128 bps con un campo
vectorial de movimiento completo conocido por el estado de la
técnica, representándose en el lado derecho por el contrario una
imagen codificada con el mismo formato y la misma velocidad de bits,
que no obstante en comparación con la imagen precedente ha sido
decodificada generada con los métodos de afinamiento
correspondientes a la invención.
Una comparación entre ambas imágenes da como
resultado que la imagen codificada según la invención presenta
claramente menos artefactos (de codificación).
Estos artefactos se han reducido fuertemente por
lo tanto gracias al procedimiento correspondiente a la invención,
ya que básicamente se limita así el desplazamiento entre la
información de movimiento y la textura, afinándose según la
invención precisamente sólo aquella parte del segundo campo
vectorial de movimiento que difiere más fuertemente o muy
fuertemente del campo vectorial de movimiento basto.
Este proceder debe comunicarse naturalmente a un
decodificador que decodifica los datos. Para ello se prevé según el
algoritmo correspondiente a la invención introducir un nuevo modo de
orientación que podría denominarse por ejemplo "not_refind"
(no reencuentro). Cuando ahora el decodificador decodifica este modo
de orientación, sabe el decodificador que han de utilizarse los
vectores de movimiento y la estructura de bloques que corresponden
al nivel de estimación del movimiento precedente, es decir, por
ejemplo el correspondiente al procedimiento MSRA. Por lo tanto, en
un caso así no se utiliza un afinamiento adicional de los vectores
de movimiento.
[1] Jizheng Xu, Ruiqin Xiong, Bo
Feng, Gary Sullivan, Ming-Chieh
Lee, Feng Wu, Shipeng Li, "3D subband video
coding using Barbell lifting" (codificación de vídeo en subbanda
3D utilizando elevación Barbell'', ISO/IEC JTC1/SC29/WG11 MPEG,
Encuentro 68º, M10569/s05, Munich, marzo 2004.
[2] ITU-T e ISO/IEC JTC1,
"Advanced Video Coding for Generic Audiovisual Services"
(codificación avanzada de vídeo para servicios audiovisuales
genéricos'', Recomendación ITU-T H.264 - ISO/IEC
14496-10 AVC, 2003.
Claims (16)
1. Procedimiento para la codificación de video
de secuencias de imágenes en el que las imágenes de la secuencia de
imágenes se codifican escaladamente tal que los datos de vídeo que
resultan contienen informaciones que aseguran una representación de
las imágenes en múltiples escalones de resolución diferentes por
cada imagen, viniendo definido el correspondiente escalón de
resolución por la cantidad de los puntos de imagen por cada
representación de imagen de las imágenes, realizándose la
codificación basada en bloques y generándose una estructura de
bloques que puede subdividir la imagen en el correspondiente escalón
de resolución en bloques, bloques parciales y subbloques,
describiendo esta subdivisión un eventual movimiento contenido en la
secuencia de imágenes y subdividiéndose la estructura de bloques
partiendo de un bloque en bloques parciales y en parte los bloques
parciales (MB1_QCIF..MB4_QCIF,MB1_CIF..MB4_CIF,MB1_4CIF..MB4..4CI)
en sucesivos subbloques de división más fina con las siguientes
etapas:
- a)
- temporalmente se genera para un primer escalón de resolución una primera estructura de bloques (MV_QCIF; MV_CIF) y para un segundo escalón de resolución una segunda estructura de bloques (MV_CIF; MV_4CIF), presentando el primer escalón de resolución una cantidad de puntos de imagen inferior a la del segundo escalón de resolución,
- b)
- la segunda estructura de bloques (MV_CIF; MV_4CIF) se compara con la primera estructura de bloques (MV_QCIF; MV_CIF) tal que las diferencias en la subdivisión de las estructuras de bloques se detectan como diferencias de estructura,
- c)
- sobre la base de las características de las diferencias de estructura, se comprueba qué parte de la segunda estructura de bloques ha de tomarse en una segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) y la segunda estructura de bloques modificada se genera sobre la base de la comprobación,
- d)
- la segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) se toma como base para la codificación de la secuencia de imágenes.
\vskip1.000000\baselineskip
2. Procedimiento según la reivindicación 1,
caracterizado porque para detectar las
diferencias se captan subbloques añadidos.
\vskip1.000000\baselineskip
3. Procedimiento según la reivindicación 1 ó
2,
caracterizado porque para la detección de
diferencias se captan características de los subbloques.
\vskip1.000000\baselineskip
4. Procedimiento según la reivindicación 3,
caracterizado porque como característica
de los subbloques se capta el tamaño de bloque de los
subbloques.
\vskip1.000000\baselineskip
5. Procedimiento según una de las
reivindicaciones precedentes,
caracterizado porque para la detección de
las diferencias sólo se incluye el bloque parcial (MB1_QCIF..
MB4_QCIF; MB1_CIF..MB4_CIF) de la primera estructura de bloques (MV_QCIF; MV_CIF) que corresponde al bloque parcial (MB1_CIF..MB4 CIF; MB1_4CIF..MB4_4CIF) de la segunda estructura de bloques (MV_CIF; MV4_CIF).
MB4_QCIF; MB1_CIF..MB4_CIF) de la primera estructura de bloques (MV_QCIF; MV_CIF) que corresponde al bloque parcial (MB1_CIF..MB4 CIF; MB1_4CIF..MB4_4CIF) de la segunda estructura de bloques (MV_CIF; MV4_CIF).
\vskip1.000000\baselineskip
6. Procedimiento según una de las
reivindicaciones precedentes,
caracterizado porque la generación de la
segunda estructura de bloques modificada se realiza sobre la base
de una decisión de valor límite.
\vskip1.000000\baselineskip
7. Procedimiento según una de las
reivindicaciones 3 a 6,
caracterizado porque sólo se toman
aquellos subbloques de la segunda estructura de bloques
(MV_CIF;
MV_4CIF) en la segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) cuyo tamaño de bloque alcanza un valor de umbral definible.
MV_4CIF) en la segunda estructura de bloques modificada (MV'_CIF; MV'_4CIF) cuyo tamaño de bloque alcanza un valor de umbral definible.
\newpage
8. Procedimiento según la reivindicación 7,
caracterizado porque el valor de umbral
se define tal que el mismo indica una relación entre el tamaño de
bloques de un subbloque de la segunda estructura de bloques (MV_CIF;
MV_4CIF) y un tamaño de bloque incluido en una zona incluida a
efectos comparativos de la primera estructura de bloques (MV_QCIF;
MV_CIF) que está asignada al subbloque más pequeño de la zona.
\vskip1.000000\baselineskip
9. Procedimiento según una de las
reivindicaciones precedentes,
caracterizado porque los subbloques
tomados pueden no estar divididos diádicamente.
\vskip1.000000\baselineskip
10. Procedimiento según una de las
reivindicaciones precedentes,
caracterizado porque como primera
estructura de bloques (MV_CIF) de un tercer escalón de resolución,
se utiliza la segunda estructura de bloques modificada (MV'_4CIF)
del segundo escalón de resolución, presentando el segundo escalón
de resolución una cantidad de puntos de imagen inferior a la del
tercer escalón de resolución.
\vskip1.000000\baselineskip
11. Procedimiento según una de las
reivindicaciones 7 a 10,
caracterizado porque la codificación se
realiza tal que en la segunda estructura de bloques modificada
(MV_CIF; MV_4CIF) se marcan en cada caso subbloques no tomados.
\vskip1.000000\baselineskip
12. Procedimiento según una de las
reivindicaciones 9 a 11,
caracterizado porque la codificación se
realiza de tal manera que se marcan en cada caso subbloques
divididos no diádicamente.
\vskip1.000000\baselineskip
13. Procedimiento según la reivindicación
precedente,
caracterizado porque la marcación se
realiza utilizando un modo de orientación designado.
\vskip1.000000\baselineskip
14. Procedimiento para decodificar una secuencia
de imágenes codificada,
caracterizado porque teniendo en cuenta
las segundas estructuras de bloques modificadas generadas según un
procedimiento correspondiente a una de las reivindicaciones
precedentes, contenidas en la secuencia de imágenes, se genera una
representación escalada de la secuencia de imágenes.
\vskip1.000000\baselineskip
15. Codificador para generar una secuencia de
imágenes codificada,
caracterizado por medios para realizar el
procedimiento según una de las reivindicaciones 1 a 13.
\vskip1.000000\baselineskip
16. Decodificador caracterizado por
medios para decodificar una secuencia de bits codificada generada
según el procedimiento correspondiente a una de las
reivindicaciones 1 a 13.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102004038110A DE102004038110B3 (de) | 2004-08-05 | 2004-08-05 | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung |
DE102004038110 | 2004-08-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2317286T3 true ES2317286T3 (es) | 2009-04-16 |
Family
ID=35116126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05776246T Active ES2317286T3 (es) | 2004-08-05 | 2005-07-27 | Procedimiento y dispositivo para codificar y decodificar. |
Country Status (8)
Country | Link |
---|---|
US (1) | US8428140B2 (es) |
EP (1) | EP1774790B1 (es) |
KR (1) | KR101217050B1 (es) |
CN (1) | CN101002476B (es) |
AT (1) | ATE418843T1 (es) |
DE (2) | DE102004038110B3 (es) |
ES (1) | ES2317286T3 (es) |
WO (1) | WO2006015947A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004041664A1 (de) | 2004-08-27 | 2006-03-09 | Siemens Ag | Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung |
JP4646146B2 (ja) * | 2006-11-30 | 2011-03-09 | ソニー株式会社 | 画像処理装置、画像処理方法、およびプログラム |
JP4826546B2 (ja) * | 2007-06-18 | 2011-11-30 | ソニー株式会社 | 画像処理装置、画像処理方法、及びプログラム |
CN102918840B (zh) | 2009-10-01 | 2016-05-25 | Sk电信有限公司 | 使用分割层进行图像编码/解码的方法和装置 |
CN102413035B (zh) * | 2011-08-16 | 2013-11-20 | 北京首钢自动化信息技术有限公司 | 一种实现快速数据采集的方法 |
CN102361458B (zh) * | 2011-08-16 | 2013-09-04 | 北京首钢自动化信息技术有限公司 | 一种在快速数据管理系统实现高效数据压缩的方法 |
US20130286227A1 (en) * | 2012-04-30 | 2013-10-31 | T-Mobile Usa, Inc. | Data Transfer Reduction During Video Broadcasts |
JP6080405B2 (ja) * | 2012-06-29 | 2017-02-15 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
ITTO20130032A1 (it) * | 2013-01-15 | 2014-07-16 | St Microelectronics Srl | Procedimento ed apparecchiatura per calcolare piramidi di immagini e prodotto informatico relativo |
US9496894B1 (en) * | 2015-10-21 | 2016-11-15 | GE Lighting Solutions, LLC | System and method for data compression over a communication network |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5107345A (en) * | 1990-02-27 | 1992-04-21 | Qualcomm Incorporated | Adaptive block size image compression method and system |
US5414469A (en) * | 1991-10-31 | 1995-05-09 | International Business Machines Corporation | Motion video compression system with multiresolution features |
US5253058A (en) * | 1992-04-01 | 1993-10-12 | Bell Communications Research, Inc. | Efficient coding scheme for multilevel video transmission |
JPH0730896A (ja) * | 1993-06-25 | 1995-01-31 | Matsushita Electric Ind Co Ltd | 動きベクトル符号化及び復号化方法 |
US5486863A (en) * | 1994-04-29 | 1996-01-23 | Motorola, Inc. | Method for determining whether to intra code a video block |
WO1997017797A2 (en) | 1995-10-25 | 1997-05-15 | Sarnoff Corporation | Apparatus and method for quadtree based variable block size motion estimation |
JP3210862B2 (ja) * | 1996-06-27 | 2001-09-25 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
US6614845B1 (en) * | 1996-12-24 | 2003-09-02 | Verizon Laboratories Inc. | Method and apparatus for differential macroblock coding for intra-frame data in video conferencing systems |
US6728775B1 (en) * | 1997-03-17 | 2004-04-27 | Microsoft Corporation | Multiple multicasting of multimedia streams |
CN1156171C (zh) * | 1997-04-07 | 2004-06-30 | 松下电器产业株式会社 | 提高处理效率的图象声音处理装置 |
JP3844844B2 (ja) * | 1997-06-06 | 2006-11-15 | 富士通株式会社 | 動画像符号化装置及び動画像符号化方法 |
US6115070A (en) * | 1997-06-12 | 2000-09-05 | International Business Machines Corporation | System and method for DCT domain inverse motion compensation using shared information |
KR100226722B1 (ko) * | 1997-07-30 | 1999-10-15 | 구자홍 | 동영상 움직임 벡터 추정 방법 |
KR100563756B1 (ko) * | 1997-11-05 | 2006-03-24 | 소니 가부시끼 가이샤 | 디지탈 신호 변환 방법 및 디지탈 신호 변환 장치 |
US6937659B1 (en) * | 1997-11-14 | 2005-08-30 | Ac Capital Management, Inc. | Apparatus and method for compressing video information |
US6560280B1 (en) * | 1998-02-02 | 2003-05-06 | Vcon Ltd. | Video transmission system |
US6343098B1 (en) * | 1998-02-26 | 2002-01-29 | Lucent Technologies Inc. | Efficient rate control for multi-resolution video encoding |
US6574274B2 (en) * | 1998-02-27 | 2003-06-03 | Sony Corporation | Picture signal processing system, decoder, picture signal processing method, and decoding method |
US6192079B1 (en) * | 1998-05-07 | 2001-02-20 | Intel Corporation | Method and apparatus for increasing video frame rate |
US6310919B1 (en) * | 1998-05-07 | 2001-10-30 | Sarnoff Corporation | Method and apparatus for adaptively scaling motion vector information in an information stream decoder |
AU4701999A (en) * | 1998-06-19 | 2000-01-05 | Equator Technologies, Inc. | Decoding an encoded image having a first resolution directly into a decoded image having a second resolution |
US6421466B1 (en) * | 1999-09-29 | 2002-07-16 | Neomagic Corp. | Hierarchical motion estimation with levels of varying bit width for digital video compression |
US6671320B1 (en) * | 2000-06-16 | 2003-12-30 | Lucent Technologies Inc. | CIF to QCIF video bitstream down conversion |
US6614442B1 (en) * | 2000-06-26 | 2003-09-02 | S3 Graphics Co., Ltd. | Macroblock tiling format for motion compensation |
FI120125B (fi) * | 2000-08-21 | 2009-06-30 | Nokia Corp | Kuvankoodaus |
US6944226B1 (en) * | 2000-10-03 | 2005-09-13 | Matsushita Electric Corporation Of America | System and associated method for transcoding discrete cosine transform coded signals |
KR100783396B1 (ko) * | 2001-04-19 | 2007-12-10 | 엘지전자 주식회사 | 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법 |
US20050207663A1 (en) * | 2001-07-31 | 2005-09-22 | Weimin Zeng | Searching method and system for best matching motion vector |
DE60141961D1 (de) * | 2001-09-10 | 2010-06-10 | Texas Instruments Inc | Verfahren und Vorrichtung zur Bewegungsvektorenabschätzung |
US7643559B2 (en) * | 2001-09-14 | 2010-01-05 | Ntt Docomo, Inc. | Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program |
JP3874179B2 (ja) * | 2002-03-14 | 2007-01-31 | Kddi株式会社 | 符号化動画像変換装置 |
KR101108661B1 (ko) * | 2002-03-15 | 2012-01-25 | 노키아 코포레이션 | 비디오 시퀀스에서의 움직임 부호화 방법 |
EP1427216A1 (en) * | 2002-07-02 | 2004-06-09 | Matsushita Electric Industrial Co., Ltd. | Image encoding method and image decoding method |
US7020201B2 (en) * | 2002-11-20 | 2006-03-28 | National Chiao Tung University | Method and apparatus for motion estimation with all binary representation |
KR20040046892A (ko) | 2002-11-28 | 2004-06-05 | 엘지전자 주식회사 | 움직임 벡터 예측 부호화 및 복호화 방법 |
JP4536325B2 (ja) * | 2003-02-04 | 2010-09-01 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
US7471725B2 (en) * | 2003-03-26 | 2008-12-30 | Lsi Corporation | Segmented motion estimation with no search for small block sizes |
KR100510136B1 (ko) * | 2003-04-28 | 2005-08-26 | 삼성전자주식회사 | 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치 |
US20040258154A1 (en) * | 2003-06-19 | 2004-12-23 | Microsoft Corporation | System and method for multi-stage predictive motion estimation |
US7400317B2 (en) * | 2003-08-29 | 2008-07-15 | Avago Technologies Ecbu Ip Pte Ltd | Finger navigation system using captive surface |
US20050047504A1 (en) * | 2003-09-03 | 2005-03-03 | Sung Chih-Ta Star | Data stream encoding method and apparatus for digital video compression |
US7330509B2 (en) * | 2003-09-12 | 2008-02-12 | International Business Machines Corporation | Method for video transcoding with adaptive frame rate control |
US7203237B2 (en) * | 2003-09-17 | 2007-04-10 | Texas Instruments Incorporated | Transcoders and methods |
US7324595B2 (en) * | 2003-09-22 | 2008-01-29 | Lsi Logic Corporation | Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction |
US7346111B2 (en) * | 2003-12-10 | 2008-03-18 | Lsi Logic Corporation | Co-located motion vector storage |
KR20050061762A (ko) * | 2003-12-18 | 2005-06-23 | 학교법인 대양학원 | 부호화 모드 결정방법, 움직임 추정방법 및 부호화 장치 |
KR100596705B1 (ko) * | 2004-03-04 | 2006-07-04 | 삼성전자주식회사 | 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템 |
US20060002474A1 (en) * | 2004-06-26 | 2006-01-05 | Oscar Chi-Lim Au | Efficient multi-block motion estimation for video compression |
US20060146933A1 (en) * | 2004-12-30 | 2006-07-06 | Paul Lu | Method and system for video motion processing in a microprocessor |
-
2004
- 2004-08-05 DE DE102004038110A patent/DE102004038110B3/de not_active Expired - Fee Related
-
2005
- 2005-07-27 US US11/659,211 patent/US8428140B2/en active Active
- 2005-07-27 CN CN2005800265213A patent/CN101002476B/zh not_active Expired - Fee Related
- 2005-07-27 KR KR1020077002042A patent/KR101217050B1/ko not_active IP Right Cessation
- 2005-07-27 WO PCT/EP2005/053675 patent/WO2006015947A1/de active Application Filing
- 2005-07-27 AT AT05776246T patent/ATE418843T1/de not_active IP Right Cessation
- 2005-07-27 DE DE502005006339T patent/DE502005006339D1/de active Active
- 2005-07-27 EP EP05776246A patent/EP1774790B1/de not_active Not-in-force
- 2005-07-27 ES ES05776246T patent/ES2317286T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
WO2006015947A1 (de) | 2006-02-16 |
US8428140B2 (en) | 2013-04-23 |
KR20070046825A (ko) | 2007-05-03 |
CN101002476B (zh) | 2011-06-08 |
KR101217050B1 (ko) | 2012-12-31 |
US20080292002A1 (en) | 2008-11-27 |
CN101002476A (zh) | 2007-07-18 |
ATE418843T1 (de) | 2009-01-15 |
DE102004038110B3 (de) | 2005-12-29 |
DE502005006339D1 (de) | 2009-02-05 |
EP1774790A1 (de) | 2007-04-18 |
EP1774790B1 (de) | 2008-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2317286T3 (es) | Procedimiento y dispositivo para codificar y decodificar. | |
JP6648315B2 (ja) | 量子化ブロック逆量子化方法 | |
KR101947142B1 (ko) | 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치 | |
KR101292091B1 (ko) | 적응적 화면내 예측 부호화 및 복호화 방법 | |
KR101596829B1 (ko) | 비디오 신호의 디코딩 방법 및 장치 | |
ES2700623T3 (es) | Aparato para decodificar una imagen | |
KR101483750B1 (ko) | 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치 | |
JP5300921B2 (ja) | 符号化および復号のための方法および装置 | |
US20100239002A1 (en) | Method and an apparatus for processing a video signal | |
BR112013016043B1 (pt) | Método de decodificação de vídeo e decodificador de vídeo para prediçãode valores de pixel de pixels alvo em um bloco alvo sob um modo plano | |
BR122015015910A2 (pt) | métodos e aparelho para transformar a seleção em codificação e decodificação de vídeo | |
KR102011491B1 (ko) | 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 | |
KR20190052097A (ko) | 영상 처리 방법 및 이를 위한 장치 | |
TW202205860A (zh) | 在合併模式中對視頻資料解碼的方法、在合併模式中對視頻資料編碼的方法及儲存編碼視頻資訊的非暫態電腦可讀取媒體 | |
KR20150036261A (ko) | 3차원 비디오를 표현하는 비트 스트림을 코딩하는 장치 | |
EP4258658A1 (en) | Prediction method, encoder, decoder and storage medium | |
WO2012081162A1 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
US20110243227A1 (en) | Moving picture decoding method and device, and moving picture encoding method and device | |
KR20070074453A (ko) | 영상 신호의 인코딩 및 디코딩 방법 | |
CN101409830B (zh) | Dct系数块相似性判断、图像加解密方法及装置 | |
KR101529903B1 (ko) | 블록기반 깊이정보 맵의 코딩 방법과 장치, 및 이를 이용한 3차원 비디오 코딩 방법 | |
KR102242723B1 (ko) | 비디오 신호의 디코딩 방법 및 장치 | |
CN104506860A (zh) | 视频编码的参考图像选择方法及系统 | |
JP2011223316A (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP2011223315A (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |