MXPA06002367A

MXPA06002367A - Proceso y arreglo para codificar imagenes de video.

Info

Publication number: MXPA06002367A
Application number: MXPA06002367A
Authority: MX
Inventors: Thomas Wiegand
Original assignee: Thomson Licensing
Priority date: 2003-09-03
Filing date: 2004-08-23
Publication date: 2006-06-20
Also published as: KR20060133953A; EP1661410A1; WO2005022924A1; CN1846446B; CN1846446A; US8014447B2; EP1513350A1; JP2007504727A; US20080298464A1

Abstract

Los codificadores y descodificadores de hoy en dia requieren la eleccion inteligente entre muchas opciones de codificacion. Esta eleccion no puede ser eficientemente realizada utilizando el control del codificador de Lagrangiano, pero el control del codificador de Lagrangiano unicamente proporciona resultados dados un parametro de Lagrangiano particular, que corresponde a alguna velocidad de transmision desconocida. Por otra parte, los algoritmos de control de velocidad proporcionan resultados de codificacion a una velocidad de bitios dada pero sin el funcionamiento de optimizacion del control del codificador de Lagrangiano. La combinacion del control de velocidad y la optimizacion de Lagrangiano para codificacion de video hibrida, es investigada. Es sugerido un nuevo procedimiento para incorporar estos dos metodos conocidos en el control de codificador de video utilizando la decision en el modo de macrobloques y la adaptacion del cuantificador. El funcionamiento de distorsion de velocidad de procedimiento propuesto es validado y analizado via los resultados experimentales. Se muestra que para la mayoria de las velocidades de bitios, el control de velocidad combinado y la optimizacion de Lagrangiano que produce un numero constante de bitios por imagen logra funcionamiento de distorsion de velocidad similar que el caso de la pendiente constante utilizando unicamente la optimizacion de Lagrangiano.

Description

PROCESO Y ARREGLO PARA CODIFICAR IMÁGENES DE VÍDEO DESCRIPCIÓN DE L¾ INVENCIÓN La presente invención se refiere a un proceso y a un arreglo para codificar imágenes de vídeo. Particularmente, ésta se refiere al control operacional de la capa de macrobloques, y es utilizable para codificar secuencias de vídeo. La especificación de la mayoría de los estándares de codificación de vídeo, híbridos, en bloques que incluyen MPEG-2 visual [1], H.263 [2), MPEG-4 visual [3] y H.264/AVC [4] proporcionan únicamente la sintaxis de la corriente de bitios y el proceso de descodificación con el fin de permitir la interoperabilidad. El proceso de codificación es dejado fuera del alcance para permitir implementaciones flexibles. No obstante, el control operacional del codificador de la fuente es un problema clave en la compresión de vídeo. Para la codificación de una fuente de vídeo, tiene que ser determinada una variedad de parámetros de codificación tales como los ¦ parámetros de cuantificación, los modos de macrobloques y de bloques, los lectores de movimiento y los coeficientes de transformación cuantificados . Por una parte, los valores elegidos determinan la eficiencia de la distorsión de velocidad de la corriente de bitios producida, para un descodificador dado. Por otra parte, estos parámetros también determinan la proporción de velocidad de transmisión requerida y el retraso de descodificación. En las comunicaciones de video en tiempo real sobre un canal de velocidad fija, la mezcla general del control del descodificador operacxonal es obtener la mejor calidad de video posible, mientras que se mantienen las condiciones dadas sobre la velocidad de transmisión y el retraso de descodificación. Debido al gran espacio de parámetros involucrado, éste es un problema no trivial. Además, se requiere que el control operacxonal del codificador sea lo menos complejo, de modo que .éste puede ser aplicado en aplicaciones de tiempo real. Un procedimiento ampliamente aceptado para la codificación optimizada de distorsiones de velocidad es la técnica de asignación de bitios de Lagrangiano. La popularidad de este procedimiento es debido a su efectividad y la simplicidad. Dado un parámetro de cuantificación fijo QP para un macrobloque, el modo macrobloque asi como los modos de bloques asociados y los vectores de movimiento, son determinados al reducir al mínimo una función del costo de Lagrangiano D + A(QP)-R, en el cual una medida de distorsión D es ponderada contra un término de proporción o velocidad R utilizando un multiplicador Lagrangiano ?. El multiplicador Lagrangiano ? depende únicamente del parámetro de cuantificación QP de macrobloques, dado. Este control del codificador Lagrangiano fue exitosamente aplicado a H-263, MPEG-4 Visual y H.264/AVC por los autores [5, 5, 7, 8]. En todos los casos, esta estrategia de codificación mejorada proporcionan ganancias de funcionamiento visibles, en comparación a las estrategias de codificación previas de H.263, MPEG-4 y H.264/AVC, respectivamente, cuando la fuente de video, fue codificada utilizando un parámetro de cuantificación fijo QP. Un algoritmo de control de velocidad de macrobloque simple y eficiente para operar los codificadores de video híbridos, basados en bloques, fue presentado en [9] . Dado el número objetivo de bitios para una imagen y las señales de error de predicción de todos los macrobloques dentro de esta imagen, los parámetros de cuantificación QP de macrobloques son ajustados de una manera que el número objetivo de los batios es ajustado de manera muy precisa mientras que la distorsión de la imagen es minimizada. La combinación de estas dos estrategias de control del codificador, la técnica de asignación de bit-ios de Lagrangiano y el algoritmo de control de velocidad basado en macrobloques, no es directo, ya que las siguientes interdependencias tienen que ser tomadas en consideración: Para el control de velocidad, la determinación de los parámetros de cuantificación QP de macrobloques, depende de la señal residual y de este modo de los vectores de movimiento estimados así como de los modos de codificación de macrobloques y bloques elegidos. Para la optimización Lagrangiana, la estimación del movimiento y la decisión del modo de macrobloque/bloque están basados en una minimización de una función de costo de Lagrangiano en la cual una medida de distorsión es ponderada contra un término de velocidad utilizando un multiplicador de Lagrangiano ?. Ya que el multiplicador de Lagrangiano ? (QP) es una función de.l parámetro de cuantificación QP, la señal residual también depende del parámetro de cuan~ificación . Además, el funcionamiento del control operacxonal del codificador debe siempre ser observado en conjunto con las consideraciones de complejidad que incluyen evitar cuantificaciones múltiples como lo sugieren los dos incisos anteriores, debido a la interdependencia de los parámetros QP y ?.

De este modo, el problema técnico que va a ser resuelto por la invención es proporcionar un proceso y un arreglo para codificar imágenes de video, asi como un programa de computadora apropiado y un medio de almacenamiento apropiado, que proporciona la eficiencia de distorsión de velocidad de la técnica de asignación de bitios de la Lagrangiano, asi como la propiedad de control de velocidad. Esta asignación de tarea es resuelta de acuerdo a la invención por medio de las características de las reivindicaciones 1, 10 11 y 12. La presente invención resuelve este problema de una manera tal que es llevado el pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de la codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis. Un arreglo para codificar imágenes de vídeo comprende al menos un chip y/o procesador, en donde el chip y/o procesador es (son) instalados de una manera tal que puede se ejecutado un proceso para la codificación de imágenes de vídeo, de una manera de modo que es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en los pasos de pre- análisis . En algunos casos, el proceso para la codificación de las imágenes de video es venta osamente llevado a cabo por un programa de computadora. Tal programa de computadora hace posible que una computadora corra un proceso para codificar imágenes de video, después de que éste ha sido almacenado en la memoria de las computadoras, en donde el programa de computadora contiene el código de codificación para ejecutar un proceso de · codificación de imágenes de video, donde es llevado a cabo un pre-análisis de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis.

Por ejemplo, tal programa de computadora puede ser hecho disponible (libre de cargo o gratis) como un archivo de datos descárgatele en una red de comunicación o una red para transferencia de datos. Los' programas de computadora hechos, disponibles de esta manera puede ser adquirido mediante un proceso ya que un programa de computadora como se describe en la reivindicación 11 es descargado desde una red para transferencia de datos, por ejemplo la internet asi, hacia una unidad de procesamiento de datos, es decir que está conectada a la red. Para llevar a cabo una codificación para imágenes de video, se utiliza ventajosamente un medio de almacenamiento legible en computadora, sobre el cual es almacenado un programa, que hace posible que la computadora ejecute un proceso para codificar las imágenes de video, después de que éste ha sido almacenado en la memoria de la computadora, en donde el programa de la computadora contiene el código de programación para ejecutar un proceso para codificar las imágenes de video, donde es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques , al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre- análisis. En una modalidad preferida de la invención, una medición de energía de la señal residual del macrobloque que representa la diferencia entre las muestras de macrobloques originales, es utilizada como un parámetro de control, que es determinado con base en un parámetro estimado en el paso de pre-análisis . En otra modalidad preferida de la invención, la medición de energía de la señal residual que es utilizada como parámetro de control, es calculada como el promedio de las varianzas de las señales residuales de los bloques de luminancia y cromináncia dentro de un macrobloque, que se utilizan para codificación de transformación de acuerdo a: donde NB y NP son el número de bloques (luminancia y cromináncia) utilizados para la codificación de transformación dentro de un bloque, y el número de muestras dentro de tal bloque, respectivamente, di,j es la señal residual del bloque j dentro del macrobloque i, y dij representa el promedio de di,j. En una modalidad preferida adicional de la invención, la señal de predicción de los macrobloques en las imágenes íntracodificadas, se asume que consiste de muestras con el valor de cero, y de este modo la señal residual corresponde a las muestras de macrobloques originales, para las imágenes codificadas predictivas, la señal de predicción de los macrobloques utilizados para determinar los parámetros de control es estimada por la predicción compensada en movimiento utilizando uno o más vectores de desplazamiento, y los índices de referencia que son estimados en el paso de pre-análisis. En una modalidad preferida adicional de la invención, el paso de pre-análisis incluye la estimación de los vectores de desplazamiento m y los índices de referencia r al minimizar la función de costo de Lagrangiano { ,^argmia{DÜFD{m,r)+ iwliM -RMV(m,r)} , Donde (.v,.y)efl determina el término de distorsión, s (..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original, y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, RMV (m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de desplazamiento [mx, my]T y el índice de referencia r, B es el área, del macrobloque, la división de macrobloque, o la división de sub-macrobloque para la cual son estimados el vector de desplazamiento y el índice de referencia, y motion > 0 es el multiplicador de Lagrangiano. En una modalidad preferida adicional de la invención, el multiplicador de Lagrangiano utilizado para la estimación del vector de desplazamiento en el paso de pre-análisis es ajustado de acuerdo con para H.264/AVC - >85.2-((£P -12)/3) donde QP representa el parámetro de cuantificación promedio de la última imagen codificada del mismo tipo de imagen. En una modalidad preferida adicional de la invención la estimación del vector de desplazamiento en el paso de pre-análisis es realizada para el macrobloque completo que cubre un área de 16 x 16 muestras de luminancia, y el índice de referencia r no es estimado, pero es determinado de una manera tal que éste se refiere a la imagen de referencia temporalmente más cercana que es almacenada en la memoria intermedia de imágenes descodificadas .

Utilizando la invención es posible realizar un control operacional del codificador para codificadores- descodificadores de video, híbridos, basados en bloques, lo que proporciona la eficiencia de distorsión de velocidad de los codificadores optimizados por distorsión de velocidad [5, 6, 7, 8] así como un control de velocidad preciso adecuado para aplicaciones interactivas de bajo retraso. Los resultados de la simulación para MPEG-4 Visual y H.264/AVC muestran que la estrategia de codificación propuesta logra virtualmente el mismo funcionamiento de distorsión de velocidad que los codificadores optimizados de distorsión de velocidad sin control de velocidad. La invención se refiere al control operacional de la capa de macrobloques . Se asume que un control de velocidad global dado ajusta el número objetivo de bitios para una imagen, de modo que las condiciones sobre la velocidad de transmisión y el retraso de descodificación son mantenidas. El control operacional de la capa de macrobloques determina los parámetros de cuantificación, los modos de macrobloques o bloques, los vectores de movimiento, y los coeficientes de transformación cuantificados , de una manera que este número objetivo de bitios ajusta tan precisamente como sea posible, mientras que la distorsión de la imagen es minimizada.

Los siguientes ejemplos son proporcionados para describir la invención con detalle adicional. Estos ejemplos están destinados a ilustrar y no a limitar la invención .

Figura 1 Funcionamiento de distorsión de velocidad de la presente estrategia de codificación propuesta (puntos) en comparación a la estrategia de codificación optimizada por distorsión de velocidad [8] sin el control de velocidad (linea sólida) para la secuencia de Foreman (QCIF, 10 imágenes por segundo) , Figura 2 Funcionamiento de distorsión de velocidad de la presente estrategia de codificación propuesta (puntos) en comparación a la estrategia. de codificación optimizada por distorsión de velocidad [8] sin el control de velocidad (linea sólida) para la secuencia de Tempete (CIF, 30 imágenes por segundo) , Figura 3 Velocidad de bitios promedio, obtenidas en comparación a la velocidad de bitios objetivo para la estrategia de codificación propuesta. En las siguientes secciones, esta invención es descrita por un control de codificador operacional utilizando el proceso de codificación y el de la invención para imágenes de video. El control operacional del codificador, descrito combina las ventajas de ambos procedimientos, la eficiencia de distorsión de velocidad de la técnica de asignación de bitios de Lagrangiano, así como la propiedad de control de velocidad de [9] . En [5] , se ha observado que la estimación de movimiento de Lagrangiano tiene un impacto muy pequeño sobre el funcionamiento de distorsión de velocidad cuando se utiliza para la codificación de línea base de H.263. Esto es debido a que la velocidad de bitios consumida por los vectores de movimiento asignados a los 16 x 16 bloques, es muy pequeña y el impacto de una elección inadecuada de ? para el proceso de estimación de movimiento, es muy pequeño. Por lo tanto, en la presente estrategia de codificación, · la determinación de los parámetros de codificación QP de macrobloques está basada en una estimación inicial de la señal residual utilizando 16 x 16 bloques únicamente. Para eso, el parámetro de ? de Lagrangiano es ajustada empleando el parámetro de cuantificación promedio QP de la última imagen codificada del mismo tipo de imagen. Los parámetros de cuantificación QP (y de este modo los parámetros de Lagrangiano ? correspondientes) son seleccionados de manera similar al procedimiento de [9] utilizando las señales de error de predicción estimada y el presupuesto de bitios remanentes. Con base en estos parámetros, los vectores de movimiento así como los modos de macrobloques y bloques son elegidos mediante la minimización de las funciones de costo de Lagrangiano, correspondientes. Ya que el objetivo de la presente invención es la combinación adecuada de dos procedimientos concernientes al control operacional de la capa de macrobloques , el algoritmo de control operacional completo es brevemente descrito para evitar un mal entendimiento del concepto. La contribución principal es una solución simple de bajo costo del problema de interdependencia entre la técnica de asignación de bitios de Lagrangiano y el procedimiento de control de velocidad. Este problema es resuelto por la introducción de un paso de pre-análisis/pre-estimación, de bajo costo utilizando únicamente 16 x 16 bloques, y una imagen de referencia simple. Como consecuencia, algunos detalles algorítmicos c'omo el procedimiento de control de velocidad [9] tuvieron que ser adaptados. En las siguientes secciones 1 y 2 el algoritmo completo del control operacional de la capa de macrobloques, es descrito. Los resultados experimentales que comparan el funcionamiento del algoritmo propuesto con el procedimiento de pendiente constate utilizando únicamente la optimización de Lagrangiano, se dan en la sección 3. 1. Inicialización del control operacional de capa de macrobloques El número objetivo de bitios para una imagen Rtotai es ajustado por un algoritmo de control de velocidad global. El presupuesto de bitios RB para transmitir los elementos de sintaxis de la capa de macrobloques de esa imagen, es inicializado como RB = Rtotai ~ Rencabezador (1) donde Rencabezado representa el número promedio de bitios necesarios para codificar la imagen y/o empalmar la información de encabezado del tipo de imagen dada. Para imágenes codificadas predictivas, un paso de estimación de movimiento inicial para 16 x 16 bloques y la imagen de referencia temporalmente más cercana, es realizada para todos los macrobloques i de la imagen. Los vectores de movimiento inicial correspondientes m¡ son obtenidos al minimizar la función de costo de Lagrangiano con el término de distorsión que es dado como s (..., t) y s' (...,t-At) representan las señales de luminancia de la imagen original y la imagen de referencia descodificada, respectivamente. RM (i, m) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento [mx, my]T, M es el intervalo de búsqueda del vector de movimiento, y Bi representa el área del pésimo macrobloque. Para este paso de estimación inicial, el multiplicador de Lagrangiano ?p,????? es establecido utilizando el parámetro de cuantificación promedio QP de la última imagen codificada del mismo tipo de imagen: Con base en esta estimación inicial o sobre el dato de la fuente original (para las imágenes intra) , es calculada una medición de varianza para cada macrobloque acuerdo a esta invención - (6) NB y NP son el número de bloques (luminancia y crominancia) utilizados para la codificación de transformación dentro de un macrobloque, y el número de muestras dentro de tal bloque, respectivamente. dj.,j representa la señal residual del bloque j del macrobloque i, su promedio es denotado por dij . Para imágenes intra, ésta señal residual corresponde a las muestras de macrobloques originales, para las imágenes codificadas predictivas, éste representa la señal de error de predicción. Con base en las medidas de varianza, un factor de ponderación <¾. es asignado a cada macrobloque i de acuerdo a [9]) donde N es el número de macrobloques dentro de la imagen. Los siguientes parámetros son ajustados a sus valores iniciales [9] : medición de complejidad remanente: S¡-^¡ai-ai macrobloque remanente : i = N presupuesto de bitios remanentes: ?? = RB parámetros de modelo: Ki = KN (última imagen del mismo tipo) Ci = CN (última imagen del mismo tipo) Para la primera imagen de una secuencia, los arámetros modelo Kx y Ci son ajustados a algunos valores redefinidos .

Control operacional de la capa de maerobloques 2.1 Ajuste de parámetro de cuantificación objetivo El tamaño del paso de cuantificación objetivo Qi para ésimo maerobloque, es ajustado de acuerdo a (ver [9] ) donde Qmin y Qmax son el tamaño mínimo y máximo del paso de cuantificación, apoyado por la sintaxis. Con base en el tamaño del paso de cuantificación objetivo, el parámetro de cuantificación objetivo QPj.* es ajustado de acuerdo a (ver [9]) max(QPM -ÁQPllus3í .m^., + ^QP^ Q{Q¡))) (9) donde QPÍ-I es el parámetro de cuantificación del ultimo maerobloque, y AQPmax es el cambio máximo permitido de cuantificador (dado por la sintaxis definido por el usuario) . La función fQ ( .. ) especifica el mapeo de los tamaños del paso de cuantificación sobre los parámetros de cuantificación; éste depende de la sintaxis subyacente. 2.2 Estimación del movimiento de macrobloques y decisión de modo Los multiplicadores de Lagrangiano utilizados para la estimación de movimiento y la decisión del modo de macrobloque i son ajustados de acuerdo a [5] , con base en el parámetro de cuantificación objetivo elegido como sigue: H.263,MPEG-4: {XM0í¡o ^ moáe¡l = 0.85-£i>*2 (10) H.264/AVC: (hí0¡iüJ = A„,„de>J,= 0.85 · 2?((ß *,- -l2)/3) (11) Para todos los modos de macrobloque/bloque compensados en movimiento, los vectores de movimiento asociados mi y los índices de referencia (H.263 Anexo U y H.264/AVC) son obtenidos al reducir al mínimo la función de Lagrangiano (ver (2)). [m ¡,t] = arg min{üD¿rD{i,m,r) + !mi,on. ¦ Rm(i,m,r)} (12; con el término de distorsión que es dado como (13) En éste, R denota el grupo de imágenes de referencia almacenadas en la memoria intermedia de imágenes descodificadas, M especifica el intervalo de búsqueda de los vectores de movimiento dentro de una imagen de referencia, tr es el tiempo de muestreo de una imagen de referencia referido por el Índice de referencia r, s (..., t) y s' (..., tr) representan las señales de luminancia de la imagen original y la imagen de referencia descodificada, respectivamente, y í½v (i/ r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento xa = [n½, my]T así como el índice de referencia r. La determinación' de los modos de macrobloque (o bloque) para el macrobloque dado (bloque) sigue básicamente el mismo procedimiento. ? partir de un grupo dado de posibles modos de macrobloque/bloque Smode, es elegido el modo Pi que reduce al mínimo la siguiente función costo de Lagrangiano ps¾l0£[í (14) La medición de distorsión representa la suma de las diferencias cuadradas entre las muestras originales de macrobloques/bloque s y las muestras reconstruidas s' , (15) donde B especifica el grupo de muestras correspondientes de macrobloque/bloque . Rau (i, plQP±+) es el número de bitios asociados con la elección del modo p y el parámetro de cuantificación QPi*, esto incluye los bitios para el encabezado de macrobloque, de los vectores de movimiento de los índices de referencia, así como los coeficientes de •transformación cuantificados de todos los bloques de luminancia y crominancia. 2.3 Ajuste final del parámetro de cuantificación El parámetro de cuantificación QPi utilizado para transmitir los elementos de sintaxis de macrobloques dependen del modo de macrobloque elegido y de sus parámetros asociados como * los coeficientes de transformación cuantificados . Si la sintaxis permite un cambio del cuantificador para los parámetros de macrobloques elegidos, es elegido un parámetro de cuantificación de QP = QPi*, de otro modo, el parámetro de cuantificación desde el último macroblogué es tomado: QP± = 2.4 Actualización modelo para el control operacional de capa de macrobloque Después de que se termina la codificación de un macrobloque, los parámetros modelo del control operacional del codificador, son actualizados. En un primer paso, los denominados parámetros de macrobloques KMB y CMB son' calculados de acuerdo a esta invención donde Qi** denota el tamaño del paso de cuantificación que corresponde al parámetro de cuantificación objetivo QPi*: Q¡ = fg (QP¡ ) . Rall es el número de bitios utilizados para codificar el macrobloque considerado, incluyendo todos los elementos de sintaxis, y í¾v es el número de bitios asociados con el vector de movimiento A¡ , qUe ha sido estimado en los pasos de inicialización (sección 1) . Los parámetros del modelo promedio de la imagen actualmente codificada, KF y CF, están de acuerdo a (ver [9] ) CF = CP . (i-l)/i + CMB/i (18) { jK = jK + 1 (19) KF = KF . (jK -l)/jk + MB/ K (20) } Con base en estos parámetros, los parámetros modelo utilizados para codificar el siguiente macrobloque, son actualizados como sigue (ver [9] ) : medición de complejidad restante: -Si+i = S¿ - a¿ · <y± macrobloque restante: Ni+i ·= Ni - 1 presupuesto de bitio restante: Bi+i = B¿ - Raii,i parámetros modelo: KÍ+I = KF . i/N+K¿ . (N-i)/N (21) Ci+i = CF - i/N+Ki . (N-i)/N (22) 3. Resultados experimentales La eficiencia de la nueva estrategia de codificación es demostrada para el estándar de codificación de video H264/AVC al compararlo con la estrategia de codificación que utiliza únicamente la optimización Lagrangiana (para un valor fijo del parámetro de cuantificación para la secuencia completa) . Ambos codificadores utilizan únicamente una imagen intra al comienzo de la secuencia, todas las siguientes imágenes son codificadas como imágenes P codificadas predictivas . En ambos casos, se utilizan cinco imágenes de referencia. La estimación de movimiento es realizada mediante una búsqueda logarítmica de píxeles enteros sobre el intervalo de muestras [-32...32]x [-32...32] y un refinamiento subsecuente de medio y un cuarto de pixel. La codificación de entropía es codificada utilizando la codificación aritmética binaria adaptativa en contexto (CABAC) . Para la nueva estrategia de codificación se utilizó la siguiente técnica de control de velocidad global simple. Dado el número N de imágenes que van a ser codificadas, la velocidad de bitio promedio R en kbitios/segundo, y la velocidad de imágenes F en Hz, el número, objetivo de bitios B2* para la primera imagen intra i = 1 es determinada por Para todas las imágenes P restantes i > 1, el presupuesto de bitios objetivo es ajustado a donde BK denota el número de bitios efectivamente consumidos por la k-ésima imagen. En las figuras 1 y 2, el funcionamiento de distorsión de velocidad de ambos codificadores es comparado por dos secuencias de prueba con diferentes características. Las curvas muestran el PSNR promedio del componente de luminancia versus la velocidad de bitios promedio medida de la corriente de bitios completa. Se puede observar que la presente estrategia de codificación propuesta proporciona eventualmente la misma eficiencia de distorsión de velocidad que el codificador optimizado de distorsión de velocidad sin el control de velocidad [8] , mientras que la velocidad de bitios objetivo es acertada de manera precisa. Las velocidades de bitios promedio obtenidas para el codificador propuesto son mostradas en la Tabla 1 junto con las velocidades de bitios objetivo.

Referencias [1] ITU-T e ISO/IEC JTC1, "Generic coding of moving pictures and associated audio Information - Parte 2: Video," ITÜ-T Recommendation H.262 - ISO/IEC 13818- 2 (MPEG-2) , Nov. 199 . ] [2] ITU-T, "Video coding for low bitrate communication, " ITU-T Recommendation H.263; versión 1, Nov. 1995; versión 2, Enero 1998. [3] ISO/IEC JTC1, "Coding of audio-visual objects - Part 2: Visual," ISO/IEC 14496-2 (MPEG-4 visual versión 1), Abril 1999; Amendment 1 (versión 2), Feb. 2000. [4] T . Wiegand, G. Sullivan, A. Luthra, "Draft ITÜ-T Recommendation and Final Draft International Standard of Joint Video Specification (ITÜ-T Rec. H.264 | ISO/IEC 14496-10 AVC) , "Joint Video- Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, JVT-G050rl, Mayo 2003. [5] T. Wiegand, B. D. Andrews, "An Improved H.263 Coder Using Rate-Distortion Optimization, " Doc . ITU- T/SG17/Q15-D-13, Abril. 1998. [6] G. J. Sullivan, T. Wiegand, "Rate-Distortion Optimization for Video Compression, "in IEEE Signal Processing Magazine, vol . 15, no. 6, pp. 74-90, Nov. 1998. [7] H. Schwarz, T. Wiegand, "An Improved MPEG-4 Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG- M49, April 2001, Austin, Texas, Estados Unidos [8] H. Schwarz, T. Wiegand, "An Improved H.26L Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG-D146, Junio 2001, Porto Seguro, Brasil. [9] ' J. Ribas-Corbera, S. Lei, "Rate Control in DCT Video Coding for Low-Delay Communications , "in IEEE Transactions on Circuit and Systems for Video Technology, yol. 9, no. 1, Feb. 1999.

Claims

REIVINDICACIONES

1. Proceso para codificar imágenes de vídeo, caracterizado porque es llevado a cabo un pre-análisís de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis .

2. Proceso de conformidad con la reivindicación 1, caracterizado porque una medición de energía de la señal residual del macrobloque que representa la -diferencia entre las muestras de macrobloques originales, es utilizada como un parámetro de control, que es determinado con base en un parámetro estimado en el paso de pre-análisis.

3. Proceso de conformidad con la reivindicación 2, caracterizado porque la medición de la energía de la señal residual es calculada como el promedio de las varianzas de las señales residuales de los bloques de luminancia y crominancia dentro de los macrobloques i que son utilizados para transformar la codificación de acuerdo donde NB y NP son el número de bloques (luminancia y crominancia) utilizados para la codificación de transformación dentro de un bloque, y el número de muestras dentro de tal bloque, respectivamente, di;j es la señal residual del bloque j dentro del macrobloque i, y d±j representa el promedio de di,j.

4. Proceso de conformidad con cualquiera de las i reivindicaciones anteriormente mencionadas, caracterizado porque para las imágenes codificadas predictivas, la señal de predicción de los macrobloques utilizados para determinar los parámetros de control es estimada por la predicción compensada en movimiento utilizando uno o más vectores de desplazamiento, y los índices de referencia que son estimados en el paso de pre-análisis.

5. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque el paso de pre-análisis incluye la estimación de los vectores de desplazamiento m y los índices de referencia r al minimizar la función de costo de Lagrangiano [ra, r]=argmin{¾.D (m, r)+ ,(TO(tó)¡ - RUY(m,r)} , Donde determina el término de distorsión, s (..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original, y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, RMv (m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de desplazamiento [rr , my] T y el índice de referencia r, B es el área del macrobloque, la división de macrobloque, o la división de sub-macrobloque para la cual son estimados el vector de desplazamiento y el índice de referencia, y 0 es el multiplicador de Lagrangiano.

6. Proceso de conformidad con la reivindicación 5, caracterizado porque el multiplicador de Lagrangiano ^ot on utilizado para la estimación del vector de desplazamiento en el paso de pre-análisis es ajustado de acuerdo con A = ).$5 - ?>? para H.263, MPEG-4 o A— para H.264/AVC donde QP representa el parámetro de cuantificacion promedio de la última imagen codificada del mismo tipo de imagen.

7. Proceso de conformidad con cualquiera.de las reivindicaciones anteriormente mencionadas, caracterizado porque la estimación del vector de desplazamiento en el paso de pre-análisis es realizada para el macrobloque completo que cubre un área de 16 x 16 muestras de luminancia, y el índice de referencia r, no es estimado, pero es determinado de una manera tal que éste se refiere a la imagen de referencia temporalmente más cercana que es almacenada en la memoria intermedia de imágenes descodificadas .

8. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque durante el proceso de codificación para cada macrobloque i es determinado un parámetro de cuantificación objetivo QP¿* en dependencias de los parámetros de control estimados en el paso de preanálisis.

9. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque el proceso de codificación de macrobloques comprende los siguientes pasos dado el parámetro de cuantificación objetivo QPj.*: calcular los multiplicadores de Lagrangiano utilizados para la estimación de movimiento y la decisión de modo del macrobloque i de acuerdo a: ( «)" A-d*,- = 0.S5 - 2 ((^. -12) 3) para H.264/AVC, para todos los modos de macrobloque/bloque es compensado en movimiento determinando los vectores de movimiento mi y el Índice de referencia ri al minimizar la función de Lagrangiano [m . , ? ] = arg m {DDF0 (¿s m, r) + • RMy (i,m,r)} , con el término de disorción que es dado como DDFD (i, m, r) , donde s (·..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, R denota el grupo de imágenes de referencia almacenadas en la memoria intermedia de imágenes descodificadas, M especifica el intervalo de búsqueda de los vectores de movimiento dentro de una imagen de referencia, tr es el tiempo de muestreo de una imagen de referencia referida, por el índice de referencia r, B es el área del bloque o macrobloque correspondiente, y RMV (i, m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento m = [mx, my]T asi como el índice de referencia r. la determinación de los modos de codificación de macrobloque/bloque pi de un macrobloque i al minimizar la función de costo de Lagrangiano p, = argmm^ p | Q^) + maie ¦ RÍríl(i,p j QP*)} Puntille donde DRSC{i,p \ QP*) es definido como s(...) y s' (...) representan el arreglo de muestra de macrobloque originales y su reconstrucción, respectivamente, B especifica el grupo de muestras- de macrobloques/bloques correspondientes, Rail (i/ pIQPi* es el número de bitios asociados con la elección del modo p y el parámetro de cuantificación QPj.* incluyendo los bitios para los modos de macrobloque/bloque, los vectores de movimiento y los índices de referencia así como los coeficientes de transformación cuantificados de todos los bloques de luminancia y crominancia, y Smode es el grupo dado de posibles modos de macrobloques/bloques

10. Arreglo con al menos un chip y/o procesador, en donde el chip y/o procesador es (son) instalados de una manera tal que. puede se ejecutado un proceso para la codificación de imágenes de video, de una manera de modo que es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques , al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un . segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros .de control determinados en los pasos de pre-análisis.

11. Programa de computadora que hace posible que una computadora corra un proceso para codificar imágenes de video, después de que éste ha sido almacenado en la memoria de las computadoras, en donde el programa de computadora contiene el código de codificación para ejecutar un proceso de codificación de imágenes de video, donde, es llevado a cabo un pre-análisis de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los ' parámetros de control determinados en el paso de pre-•análisis .

12. Medio de almacenamiento legible en computadora, sobre el cual es almacenado un programa, que hace posible que la computadora ejecute un proceso para codificar las imágenes de video, después de que éste ha sido almacenado en la memoria de la computadora, en donde el programa de la computadora contiene el código de programación para ejecutar un proceso para codificar las imágenes de video, donde es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis.

13. Proceso en el que un programa de computadora como se describe en la reivindicación 11 es descargado de una red para la transferencia de datos, por ejemplo, la internet, hacia una- unidad de procesamiento de datos, que está conectada a la red. RESUMEN Los codificadores y descodificadores de hoy én día requieren la elección inteligente entre muchas opciones de codificación. Esta elección no puede ser eficientemente realizada utilizado el control del codificador de Lagrangiano, pero el control del codificador de Lagrangiano únicamente proporciona resultados dados un parámetro de Lagrangiano particular, que corresponde a alguna velocidad de transmisión desconocida. Por otra parte, los algoritmos de control de velocidad proporcionan resultados de codificación a una velocidad de bitios dada pero sin el funcionamiento de optimización del control del codificador de Lagrangiano. La combinación del control de velocidad y la optimización de Lagrangiano para codificación de video híbrida, es investigada. Es sugerido un nuevo procedimiento para incorporar estos dos métodos conocidos en el control de codificador de vídeo utilizando la decisión en el modo de macrobloques y la adaptación del cuantificador . El funcionamiento de distorsión de velocidad de procedimiento propuesto es validado y analizado vía los resultados experimentales. Se muestra que para la mayoría de las velocidades de bitios, el control de velocidad combinado y la optimización de Lagrangiano que produce un número constante de bitios por imagen logra funcionamiento de distorsión de velocidad similar que el caso de la pendiente constante utilizando únicamente la optimización de Lagrangiano.