MXPA06002367A - Proceso y arreglo para codificar imagenes de video. - Google Patents

Proceso y arreglo para codificar imagenes de video.

Info

Publication number
MXPA06002367A
MXPA06002367A MXPA06002367A MXPA06002367A MXPA06002367A MX PA06002367 A MXPA06002367 A MX PA06002367A MX PA06002367 A MXPA06002367 A MX PA06002367A MX PA06002367 A MXPA06002367 A MX PA06002367A MX PA06002367 A MXPA06002367 A MX PA06002367A
Authority
MX
Mexico
Prior art keywords
macroblock
coding
lagrangian
image
control
Prior art date
Application number
MXPA06002367A
Other languages
English (en)
Inventor
Thomas Wiegand
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of MXPA06002367A publication Critical patent/MXPA06002367A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Los codificadores y descodificadores de hoy en dia requieren la eleccion inteligente entre muchas opciones de codificacion. Esta eleccion no puede ser eficientemente realizada utilizando el control del codificador de Lagrangiano, pero el control del codificador de Lagrangiano unicamente proporciona resultados dados un parametro de Lagrangiano particular, que corresponde a alguna velocidad de transmision desconocida. Por otra parte, los algoritmos de control de velocidad proporcionan resultados de codificacion a una velocidad de bitios dada pero sin el funcionamiento de optimizacion del control del codificador de Lagrangiano. La combinacion del control de velocidad y la optimizacion de Lagrangiano para codificacion de video hibrida, es investigada. Es sugerido un nuevo procedimiento para incorporar estos dos metodos conocidos en el control de codificador de video utilizando la decision en el modo de macrobloques y la adaptacion del cuantificador. El funcionamiento de distorsion de velocidad de procedimiento propuesto es validado y analizado via los resultados experimentales. Se muestra que para la mayoria de las velocidades de bitios, el control de velocidad combinado y la optimizacion de Lagrangiano que produce un numero constante de bitios por imagen logra funcionamiento de distorsion de velocidad similar que el caso de la pendiente constante utilizando unicamente la optimizacion de Lagrangiano.

Description

PROCESO Y ARREGLO PARA CODIFICAR IMÁGENES DE VÍDEO DESCRIPCIÓN DE L¾ INVENCIÓN La presente invención se refiere a un proceso y a un arreglo para codificar imágenes de vídeo. Particularmente, ésta se refiere al control operacional de la capa de macrobloques, y es utilizable para codificar secuencias de vídeo. La especificación de la mayoría de los estándares de codificación de vídeo, híbridos, en bloques que incluyen MPEG-2 visual [1], H.263 [2), MPEG-4 visual [3] y H.264/AVC [4] proporcionan únicamente la sintaxis de la corriente de bitios y el proceso de descodificación con el fin de permitir la interoperabilidad. El proceso de codificación es dejado fuera del alcance para permitir implementaciones flexibles. No obstante, el control operacional del codificador de la fuente es un problema clave en la compresión de vídeo. Para la codificación de una fuente de vídeo, tiene que ser determinada una variedad de parámetros de codificación tales como los ¦ parámetros de cuantificación, los modos de macrobloques y de bloques, los lectores de movimiento y los coeficientes de transformación cuantificados . Por una parte, los valores elegidos determinan la eficiencia de la distorsión de velocidad de la corriente de bitios producida, para un descodificador dado. Por otra parte, estos parámetros también determinan la proporción de velocidad de transmisión requerida y el retraso de descodificación. En las comunicaciones de video en tiempo real sobre un canal de velocidad fija, la mezcla general del control del descodificador operacxonal es obtener la mejor calidad de video posible, mientras que se mantienen las condiciones dadas sobre la velocidad de transmisión y el retraso de descodificación. Debido al gran espacio de parámetros involucrado, éste es un problema no trivial. Además, se requiere que el control operacxonal del codificador sea lo menos complejo, de modo que .éste puede ser aplicado en aplicaciones de tiempo real. Un procedimiento ampliamente aceptado para la codificación optimizada de distorsiones de velocidad es la técnica de asignación de bitios de Lagrangiano. La popularidad de este procedimiento es debido a su efectividad y la simplicidad. Dado un parámetro de cuantificación fijo QP para un macrobloque, el modo macrobloque asi como los modos de bloques asociados y los vectores de movimiento, son determinados al reducir al mínimo una función del costo de Lagrangiano D + A(QP)-R, en el cual una medida de distorsión D es ponderada contra un término de proporción o velocidad R utilizando un multiplicador Lagrangiano ?. El multiplicador Lagrangiano ? depende únicamente del parámetro de cuantificación QP de macrobloques, dado. Este control del codificador Lagrangiano fue exitosamente aplicado a H-263, MPEG-4 Visual y H.264/AVC por los autores [5, 5, 7, 8]. En todos los casos, esta estrategia de codificación mejorada proporcionan ganancias de funcionamiento visibles, en comparación a las estrategias de codificación previas de H.263, MPEG-4 y H.264/AVC, respectivamente, cuando la fuente de video, fue codificada utilizando un parámetro de cuantificación fijo QP. Un algoritmo de control de velocidad de macrobloque simple y eficiente para operar los codificadores de video híbridos, basados en bloques, fue presentado en [9] . Dado el número objetivo de bitios para una imagen y las señales de error de predicción de todos los macrobloques dentro de esta imagen, los parámetros de cuantificación QP de macrobloques son ajustados de una manera que el número objetivo de los batios es ajustado de manera muy precisa mientras que la distorsión de la imagen es minimizada. La combinación de estas dos estrategias de control del codificador, la técnica de asignación de bit-ios de Lagrangiano y el algoritmo de control de velocidad basado en macrobloques, no es directo, ya que las siguientes interdependencias tienen que ser tomadas en consideración: Para el control de velocidad, la determinación de los parámetros de cuantificación QP de macrobloques, depende de la señal residual y de este modo de los vectores de movimiento estimados así como de los modos de codificación de macrobloques y bloques elegidos. Para la optimización Lagrangiana, la estimación del movimiento y la decisión del modo de macrobloque/bloque están basados en una minimización de una función de costo de Lagrangiano en la cual una medida de distorsión es ponderada contra un término de velocidad utilizando un multiplicador de Lagrangiano ?. Ya que el multiplicador de Lagrangiano ? (QP) es una función de.l parámetro de cuantificación QP, la señal residual también depende del parámetro de cuan~ificación . Además, el funcionamiento del control operacxonal del codificador debe siempre ser observado en conjunto con las consideraciones de complejidad que incluyen evitar cuantificaciones múltiples como lo sugieren los dos incisos anteriores, debido a la interdependencia de los parámetros QP y ?.
De este modo, el problema técnico que va a ser resuelto por la invención es proporcionar un proceso y un arreglo para codificar imágenes de video, asi como un programa de computadora apropiado y un medio de almacenamiento apropiado, que proporciona la eficiencia de distorsión de velocidad de la técnica de asignación de bitios de la Lagrangiano, asi como la propiedad de control de velocidad. Esta asignación de tarea es resuelta de acuerdo a la invención por medio de las características de las reivindicaciones 1, 10 11 y 12. La presente invención resuelve este problema de una manera tal que es llevado el pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de la codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis. Un arreglo para codificar imágenes de vídeo comprende al menos un chip y/o procesador, en donde el chip y/o procesador es (son) instalados de una manera tal que puede se ejecutado un proceso para la codificación de imágenes de vídeo, de una manera de modo que es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en los pasos de pre- análisis . En algunos casos, el proceso para la codificación de las imágenes de video es venta osamente llevado a cabo por un programa de computadora. Tal programa de computadora hace posible que una computadora corra un proceso para codificar imágenes de video, después de que éste ha sido almacenado en la memoria de las computadoras, en donde el programa de computadora contiene el código de codificación para ejecutar un proceso de · codificación de imágenes de video, donde es llevado a cabo un pre-análisis de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis.
Por ejemplo, tal programa de computadora puede ser hecho disponible (libre de cargo o gratis) como un archivo de datos descárgatele en una red de comunicación o una red para transferencia de datos. Los' programas de computadora hechos, disponibles de esta manera puede ser adquirido mediante un proceso ya que un programa de computadora como se describe en la reivindicación 11 es descargado desde una red para transferencia de datos, por ejemplo la internet asi, hacia una unidad de procesamiento de datos, es decir que está conectada a la red. Para llevar a cabo una codificación para imágenes de video, se utiliza ventajosamente un medio de almacenamiento legible en computadora, sobre el cual es almacenado un programa, que hace posible que la computadora ejecute un proceso para codificar las imágenes de video, después de que éste ha sido almacenado en la memoria de la computadora, en donde el programa de la computadora contiene el código de programación para ejecutar un proceso para codificar las imágenes de video, donde es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques , al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre- análisis. En una modalidad preferida de la invención, una medición de energía de la señal residual del macrobloque que representa la diferencia entre las muestras de macrobloques originales, es utilizada como un parámetro de control, que es determinado con base en un parámetro estimado en el paso de pre-análisis . En otra modalidad preferida de la invención, la medición de energía de la señal residual que es utilizada como parámetro de control, es calculada como el promedio de las varianzas de las señales residuales de los bloques de luminancia y cromináncia dentro de un macrobloque, que se utilizan para codificación de transformación de acuerdo a: donde NB y NP son el número de bloques (luminancia y cromináncia) utilizados para la codificación de transformación dentro de un bloque, y el número de muestras dentro de tal bloque, respectivamente, di,j es la señal residual del bloque j dentro del macrobloque i, y dij representa el promedio de di,j. En una modalidad preferida adicional de la invención, la señal de predicción de los macrobloques en las imágenes íntracodificadas, se asume que consiste de muestras con el valor de cero, y de este modo la señal residual corresponde a las muestras de macrobloques originales, para las imágenes codificadas predictivas, la señal de predicción de los macrobloques utilizados para determinar los parámetros de control es estimada por la predicción compensada en movimiento utilizando uno o más vectores de desplazamiento, y los índices de referencia que son estimados en el paso de pre-análisis. En una modalidad preferida adicional de la invención, el paso de pre-análisis incluye la estimación de los vectores de desplazamiento m y los índices de referencia r al minimizar la función de costo de Lagrangiano { ,^argmia{DÜFD{m,r)+ iwliM -RMV(m,r)} , Donde (.v,.y)efl determina el término de distorsión, s (..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original, y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, RMV (m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de desplazamiento [mx, my]T y el índice de referencia r, B es el área, del macrobloque, la división de macrobloque, o la división de sub-macrobloque para la cual son estimados el vector de desplazamiento y el índice de referencia, y motion > 0 es el multiplicador de Lagrangiano. En una modalidad preferida adicional de la invención, el multiplicador de Lagrangiano utilizado para la estimación del vector de desplazamiento en el paso de pre-análisis es ajustado de acuerdo con para H.264/AVC - >85.2-((£P -12)/3) donde QP representa el parámetro de cuantificación promedio de la última imagen codificada del mismo tipo de imagen. En una modalidad preferida adicional de la invención la estimación del vector de desplazamiento en el paso de pre-análisis es realizada para el macrobloque completo que cubre un área de 16 x 16 muestras de luminancia, y el índice de referencia r no es estimado, pero es determinado de una manera tal que éste se refiere a la imagen de referencia temporalmente más cercana que es almacenada en la memoria intermedia de imágenes descodificadas .
Utilizando la invención es posible realizar un control operacional del codificador para codificadores- descodificadores de video, híbridos, basados en bloques, lo que proporciona la eficiencia de distorsión de velocidad de los codificadores optimizados por distorsión de velocidad [5, 6, 7, 8] así como un control de velocidad preciso adecuado para aplicaciones interactivas de bajo retraso. Los resultados de la simulación para MPEG-4 Visual y H.264/AVC muestran que la estrategia de codificación propuesta logra virtualmente el mismo funcionamiento de distorsión de velocidad que los codificadores optimizados de distorsión de velocidad sin control de velocidad. La invención se refiere al control operacional de la capa de macrobloques . Se asume que un control de velocidad global dado ajusta el número objetivo de bitios para una imagen, de modo que las condiciones sobre la velocidad de transmisión y el retraso de descodificación son mantenidas. El control operacional de la capa de macrobloques determina los parámetros de cuantificación, los modos de macrobloques o bloques, los vectores de movimiento, y los coeficientes de transformación cuantificados , de una manera que este número objetivo de bitios ajusta tan precisamente como sea posible, mientras que la distorsión de la imagen es minimizada.
Los siguientes ejemplos son proporcionados para describir la invención con detalle adicional. Estos ejemplos están destinados a ilustrar y no a limitar la invención .
Figura 1 Funcionamiento de distorsión de velocidad de la presente estrategia de codificación propuesta (puntos) en comparación a la estrategia de codificación optimizada por distorsión de velocidad [8] sin el control de velocidad (linea sólida) para la secuencia de Foreman (QCIF, 10 imágenes por segundo) , Figura 2 Funcionamiento de distorsión de velocidad de la presente estrategia de codificación propuesta (puntos) en comparación a la estrategia. de codificación optimizada por distorsión de velocidad [8] sin el control de velocidad (linea sólida) para la secuencia de Tempete (CIF, 30 imágenes por segundo) , Figura 3 Velocidad de bitios promedio, obtenidas en comparación a la velocidad de bitios objetivo para la estrategia de codificación propuesta. En las siguientes secciones, esta invención es descrita por un control de codificador operacional utilizando el proceso de codificación y el de la invención para imágenes de video. El control operacional del codificador, descrito combina las ventajas de ambos procedimientos, la eficiencia de distorsión de velocidad de la técnica de asignación de bitios de Lagrangiano, así como la propiedad de control de velocidad de [9] . En [5] , se ha observado que la estimación de movimiento de Lagrangiano tiene un impacto muy pequeño sobre el funcionamiento de distorsión de velocidad cuando se utiliza para la codificación de línea base de H.263. Esto es debido a que la velocidad de bitios consumida por los vectores de movimiento asignados a los 16 x 16 bloques, es muy pequeña y el impacto de una elección inadecuada de ? para el proceso de estimación de movimiento, es muy pequeño. Por lo tanto, en la presente estrategia de codificación, · la determinación de los parámetros de codificación QP de macrobloques está basada en una estimación inicial de la señal residual utilizando 16 x 16 bloques únicamente. Para eso, el parámetro de ? de Lagrangiano es ajustada empleando el parámetro de cuantificación promedio QP de la última imagen codificada del mismo tipo de imagen. Los parámetros de cuantificación QP (y de este modo los parámetros de Lagrangiano ? correspondientes) son seleccionados de manera similar al procedimiento de [9] utilizando las señales de error de predicción estimada y el presupuesto de bitios remanentes. Con base en estos parámetros, los vectores de movimiento así como los modos de macrobloques y bloques son elegidos mediante la minimización de las funciones de costo de Lagrangiano, correspondientes. Ya que el objetivo de la presente invención es la combinación adecuada de dos procedimientos concernientes al control operacional de la capa de macrobloques , el algoritmo de control operacional completo es brevemente descrito para evitar un mal entendimiento del concepto. La contribución principal es una solución simple de bajo costo del problema de interdependencia entre la técnica de asignación de bitios de Lagrangiano y el procedimiento de control de velocidad. Este problema es resuelto por la introducción de un paso de pre-análisis/pre-estimación, de bajo costo utilizando únicamente 16 x 16 bloques, y una imagen de referencia simple. Como consecuencia, algunos detalles algorítmicos c'omo el procedimiento de control de velocidad [9] tuvieron que ser adaptados. En las siguientes secciones 1 y 2 el algoritmo completo del control operacional de la capa de macrobloques, es descrito. Los resultados experimentales que comparan el funcionamiento del algoritmo propuesto con el procedimiento de pendiente constate utilizando únicamente la optimización de Lagrangiano, se dan en la sección 3. 1. Inicialización del control operacional de capa de macrobloques El número objetivo de bitios para una imagen Rtotai es ajustado por un algoritmo de control de velocidad global. El presupuesto de bitios RB para transmitir los elementos de sintaxis de la capa de macrobloques de esa imagen, es inicializado como RB = Rtotai ~ Rencabezador (1) donde Rencabezado representa el número promedio de bitios necesarios para codificar la imagen y/o empalmar la información de encabezado del tipo de imagen dada. Para imágenes codificadas predictivas, un paso de estimación de movimiento inicial para 16 x 16 bloques y la imagen de referencia temporalmente más cercana, es realizada para todos los macrobloques i de la imagen. Los vectores de movimiento inicial correspondientes m¡ son obtenidos al minimizar la función de costo de Lagrangiano con el término de distorsión que es dado como s (..., t) y s' (...,t-At) representan las señales de luminancia de la imagen original y la imagen de referencia descodificada, respectivamente. RM (i, m) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento [mx, my]T, M es el intervalo de búsqueda del vector de movimiento, y Bi representa el área del pésimo macrobloque. Para este paso de estimación inicial, el multiplicador de Lagrangiano ?p,????? es establecido utilizando el parámetro de cuantificación promedio QP de la última imagen codificada del mismo tipo de imagen: Con base en esta estimación inicial o sobre el dato de la fuente original (para las imágenes intra) , es calculada una medición de varianza para cada macrobloque acuerdo a esta invención - (6) NB y NP son el número de bloques (luminancia y crominancia) utilizados para la codificación de transformación dentro de un macrobloque, y el número de muestras dentro de tal bloque, respectivamente. dj.,j representa la señal residual del bloque j del macrobloque i, su promedio es denotado por dij . Para imágenes intra, ésta señal residual corresponde a las muestras de macrobloques originales, para las imágenes codificadas predictivas, éste representa la señal de error de predicción. Con base en las medidas de varianza, un factor de ponderación <¾. es asignado a cada macrobloque i de acuerdo a [9]) donde N es el número de macrobloques dentro de la imagen. Los siguientes parámetros son ajustados a sus valores iniciales [9] : medición de complejidad remanente: S¡-^¡ai-ai macrobloque remanente : i = N presupuesto de bitios remanentes: ?? = RB parámetros de modelo: Ki = KN (última imagen del mismo tipo) Ci = CN (última imagen del mismo tipo) Para la primera imagen de una secuencia, los arámetros modelo Kx y Ci son ajustados a algunos valores redefinidos .
Control operacional de la capa de maerobloques 2.1 Ajuste de parámetro de cuantificación objetivo El tamaño del paso de cuantificación objetivo Qi para ésimo maerobloque, es ajustado de acuerdo a (ver [9] ) donde Qmin y Qmax son el tamaño mínimo y máximo del paso de cuantificación, apoyado por la sintaxis. Con base en el tamaño del paso de cuantificación objetivo, el parámetro de cuantificación objetivo QPj.* es ajustado de acuerdo a (ver [9]) max(QPM -ÁQPllus3í .m^., + ^QP^ Q{Q¡))) (9) donde QPÍ-I es el parámetro de cuantificación del ultimo maerobloque, y AQPmax es el cambio máximo permitido de cuantificador (dado por la sintaxis definido por el usuario) . La función fQ ( .. ) especifica el mapeo de los tamaños del paso de cuantificación sobre los parámetros de cuantificación; éste depende de la sintaxis subyacente. 2.2 Estimación del movimiento de macrobloques y decisión de modo Los multiplicadores de Lagrangiano utilizados para la estimación de movimiento y la decisión del modo de macrobloque i son ajustados de acuerdo a [5] , con base en el parámetro de cuantificación objetivo elegido como sigue: H.263,MPEG-4: {XM0í¡o ^ moáe¡l = 0.85-£i>*2 (10) H.264/AVC: (hí0¡iüJ = A„,„de>J,= 0.85 · 2?((ß *,- -l2)/3) (11) Para todos los modos de macrobloque/bloque compensados en movimiento, los vectores de movimiento asociados mi y los índices de referencia (H.263 Anexo U y H.264/AVC) son obtenidos al reducir al mínimo la función de Lagrangiano (ver (2)). [m ¡,t] = arg min{üD¿rD{i,m,r) + !mi,on. ¦ Rm(i,m,r)} (12; con el término de distorsión que es dado como (13) En éste, R denota el grupo de imágenes de referencia almacenadas en la memoria intermedia de imágenes descodificadas, M especifica el intervalo de búsqueda de los vectores de movimiento dentro de una imagen de referencia, tr es el tiempo de muestreo de una imagen de referencia referido por el Índice de referencia r, s (..., t) y s' (..., tr) representan las señales de luminancia de la imagen original y la imagen de referencia descodificada, respectivamente, y í½v (i/ r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento xa = [n½, my]T así como el índice de referencia r. La determinación' de los modos de macrobloque (o bloque) para el macrobloque dado (bloque) sigue básicamente el mismo procedimiento. ? partir de un grupo dado de posibles modos de macrobloque/bloque Smode, es elegido el modo Pi que reduce al mínimo la siguiente función costo de Lagrangiano ps¾l0£[í (14) La medición de distorsión representa la suma de las diferencias cuadradas entre las muestras originales de macrobloques/bloque s y las muestras reconstruidas s' , (15) donde B especifica el grupo de muestras correspondientes de macrobloque/bloque . Rau (i, plQP±+) es el número de bitios asociados con la elección del modo p y el parámetro de cuantificación QPi*, esto incluye los bitios para el encabezado de macrobloque, de los vectores de movimiento de los índices de referencia, así como los coeficientes de •transformación cuantificados de todos los bloques de luminancia y crominancia. 2.3 Ajuste final del parámetro de cuantificación El parámetro de cuantificación QPi utilizado para transmitir los elementos de sintaxis de macrobloques dependen del modo de macrobloque elegido y de sus parámetros asociados como * los coeficientes de transformación cuantificados . Si la sintaxis permite un cambio del cuantificador para los parámetros de macrobloques elegidos, es elegido un parámetro de cuantificación de QP = QPi*, de otro modo, el parámetro de cuantificación desde el último macroblogué es tomado: QP± = 2.4 Actualización modelo para el control operacional de capa de macrobloque Después de que se termina la codificación de un macrobloque, los parámetros modelo del control operacional del codificador, son actualizados. En un primer paso, los denominados parámetros de macrobloques KMB y CMB son' calculados de acuerdo a esta invención donde Qi** denota el tamaño del paso de cuantificación que corresponde al parámetro de cuantificación objetivo QPi*: Q¡ = fg (QP¡ ) . Rall es el número de bitios utilizados para codificar el macrobloque considerado, incluyendo todos los elementos de sintaxis, y í¾v es el número de bitios asociados con el vector de movimiento A¡ , qUe ha sido estimado en los pasos de inicialización (sección 1) . Los parámetros del modelo promedio de la imagen actualmente codificada, KF y CF, están de acuerdo a (ver [9] ) CF = CP . (i-l)/i + CMB/i (18) { jK = jK + 1 (19) KF = KF . (jK -l)/jk + MB/ K (20) } Con base en estos parámetros, los parámetros modelo utilizados para codificar el siguiente macrobloque, son actualizados como sigue (ver [9] ) : medición de complejidad restante: -Si+i = S¿ - a¿ · <y± macrobloque restante: Ni+i ·= Ni - 1 presupuesto de bitio restante: Bi+i = B¿ - Raii,i parámetros modelo: KÍ+I = KF . i/N+K¿ . (N-i)/N (21) Ci+i = CF - i/N+Ki . (N-i)/N (22) 3. Resultados experimentales La eficiencia de la nueva estrategia de codificación es demostrada para el estándar de codificación de video H264/AVC al compararlo con la estrategia de codificación que utiliza únicamente la optimización Lagrangiana (para un valor fijo del parámetro de cuantificación para la secuencia completa) . Ambos codificadores utilizan únicamente una imagen intra al comienzo de la secuencia, todas las siguientes imágenes son codificadas como imágenes P codificadas predictivas . En ambos casos, se utilizan cinco imágenes de referencia. La estimación de movimiento es realizada mediante una búsqueda logarítmica de píxeles enteros sobre el intervalo de muestras [-32...32]x [-32...32] y un refinamiento subsecuente de medio y un cuarto de pixel. La codificación de entropía es codificada utilizando la codificación aritmética binaria adaptativa en contexto (CABAC) . Para la nueva estrategia de codificación se utilizó la siguiente técnica de control de velocidad global simple. Dado el número N de imágenes que van a ser codificadas, la velocidad de bitio promedio R en kbitios/segundo, y la velocidad de imágenes F en Hz, el número, objetivo de bitios B2* para la primera imagen intra i = 1 es determinada por Para todas las imágenes P restantes i > 1, el presupuesto de bitios objetivo es ajustado a donde BK denota el número de bitios efectivamente consumidos por la k-ésima imagen. En las figuras 1 y 2, el funcionamiento de distorsión de velocidad de ambos codificadores es comparado por dos secuencias de prueba con diferentes características. Las curvas muestran el PSNR promedio del componente de luminancia versus la velocidad de bitios promedio medida de la corriente de bitios completa. Se puede observar que la presente estrategia de codificación propuesta proporciona eventualmente la misma eficiencia de distorsión de velocidad que el codificador optimizado de distorsión de velocidad sin el control de velocidad [8] , mientras que la velocidad de bitios objetivo es acertada de manera precisa. Las velocidades de bitios promedio obtenidas para el codificador propuesto son mostradas en la Tabla 1 junto con las velocidades de bitios objetivo.
Referencias [1] ITU-T e ISO/IEC JTC1, "Generic coding of moving pictures and associated audio Information - Parte 2: Video," ITÜ-T Recommendation H.262 - ISO/IEC 13818- 2 (MPEG-2) , Nov. 199 . ] [2] ITU-T, "Video coding for low bitrate communication, " ITU-T Recommendation H.263; versión 1, Nov. 1995; versión 2, Enero 1998. [3] ISO/IEC JTC1, "Coding of audio-visual objects - Part 2: Visual," ISO/IEC 14496-2 (MPEG-4 visual versión 1), Abril 1999; Amendment 1 (versión 2), Feb. 2000. [4] T . Wiegand, G. Sullivan, A. Luthra, "Draft ITÜ-T Recommendation and Final Draft International Standard of Joint Video Specification (ITÜ-T Rec. H.264 | ISO/IEC 14496-10 AVC) , "Joint Video- Team (JVT) of ISO/IEC MPEG and ITU-T VCEG, JVT-G050rl, Mayo 2003. [5] T. Wiegand, B. D. Andrews, "An Improved H.263 Coder Using Rate-Distortion Optimization, " Doc . ITU- T/SG17/Q15-D-13, Abril. 1998. [6] G. J. Sullivan, T. Wiegand, "Rate-Distortion Optimization for Video Compression, "in IEEE Signal Processing Magazine, vol . 15, no. 6, pp. 74-90, Nov. 1998. [7] H. Schwarz, T. Wiegand, "An Improved MPEG-4 Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG- M49, April 2001, Austin, Texas, Estados Unidos [8] H. Schwarz, T. Wiegand, "An Improved H.26L Coder Using Lagrangian Coder Control," ITU-T/SG16/Q6/VCEG-D146, Junio 2001, Porto Seguro, Brasil. [9] ' J. Ribas-Corbera, S. Lei, "Rate Control in DCT Video Coding for Low-Delay Communications , "in IEEE Transactions on Circuit and Systems for Video Technology, yol. 9, no. 1, Feb. 1999.

Claims (13)

REIVINDICACIONES
1. Proceso para codificar imágenes de vídeo, caracterizado porque es llevado a cabo un pre-análisís de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis .
2. Proceso de conformidad con la reivindicación 1, caracterizado porque una medición de energía de la señal residual del macrobloque que representa la -diferencia entre las muestras de macrobloques originales, es utilizada como un parámetro de control, que es determinado con base en un parámetro estimado en el paso de pre-análisis.
3. Proceso de conformidad con la reivindicación 2, caracterizado porque la medición de la energía de la señal residual es calculada como el promedio de las varianzas de las señales residuales de los bloques de luminancia y crominancia dentro de los macrobloques i que son utilizados para transformar la codificación de acuerdo donde NB y NP son el número de bloques (luminancia y crominancia) utilizados para la codificación de transformación dentro de un bloque, y el número de muestras dentro de tal bloque, respectivamente, di;j es la señal residual del bloque j dentro del macrobloque i, y d±j representa el promedio de di,j.
4. Proceso de conformidad con cualquiera de las i reivindicaciones anteriormente mencionadas, caracterizado porque para las imágenes codificadas predictivas, la señal de predicción de los macrobloques utilizados para determinar los parámetros de control es estimada por la predicción compensada en movimiento utilizando uno o más vectores de desplazamiento, y los índices de referencia que son estimados en el paso de pre-análisis.
5. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque el paso de pre-análisis incluye la estimación de los vectores de desplazamiento m y los índices de referencia r al minimizar la función de costo de Lagrangiano [ra, r]=argmin{¾.D (m, r)+ ,(TO(tó)¡ - RUY(m,r)} , Donde determina el término de distorsión, s (..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original, y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, RMv (m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de desplazamiento [rr , my] T y el índice de referencia r, B es el área del macrobloque, la división de macrobloque, o la división de sub-macrobloque para la cual son estimados el vector de desplazamiento y el índice de referencia, y 0 es el multiplicador de Lagrangiano.
6. Proceso de conformidad con la reivindicación 5, caracterizado porque el multiplicador de Lagrangiano ^ot on utilizado para la estimación del vector de desplazamiento en el paso de pre-análisis es ajustado de acuerdo con A = ).$5 - ?>? para H.263, MPEG-4 o A— para H.264/AVC donde QP representa el parámetro de cuantificacion promedio de la última imagen codificada del mismo tipo de imagen.
7. Proceso de conformidad con cualquiera.de las reivindicaciones anteriormente mencionadas, caracterizado porque la estimación del vector de desplazamiento en el paso de pre-análisis es realizada para el macrobloque completo que cubre un área de 16 x 16 muestras de luminancia, y el índice de referencia r, no es estimado, pero es determinado de una manera tal que éste se refiere a la imagen de referencia temporalmente más cercana que es almacenada en la memoria intermedia de imágenes descodificadas .
8. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque durante el proceso de codificación para cada macrobloque i es determinado un parámetro de cuantificación objetivo QP¿* en dependencias de los parámetros de control estimados en el paso de preanálisis.
9. Proceso de conformidad con cualquiera de las reivindicaciones anteriormente mencionadas, caracterizado porque el proceso de codificación de macrobloques comprende los siguientes pasos dado el parámetro de cuantificación objetivo QPj.*: calcular los multiplicadores de Lagrangiano utilizados para la estimación de movimiento y la decisión de modo del macrobloque i de acuerdo a: ( «)" A-d*,- = 0.S5 - 2 ((^. -12) 3) para H.264/AVC, para todos los modos de macrobloque/bloque es compensado en movimiento determinando los vectores de movimiento mi y el Índice de referencia ri al minimizar la función de Lagrangiano [m . , ? ] = arg m {DDF0 (¿s m, r) + • RMy (i,m,r)} , con el término de disorción que es dado como DDFD (i, m, r) , donde s (·..., t) y s' (..., tr) representan el arreglo de muestra de luminancia de la imagen original y la imagen de referencia descodificada dada por el índice de referencia r, respectivamente, R denota el grupo de imágenes de referencia almacenadas en la memoria intermedia de imágenes descodificadas, M especifica el intervalo de búsqueda de los vectores de movimiento dentro de una imagen de referencia, tr es el tiempo de muestreo de una imagen de referencia referida, por el índice de referencia r, B es el área del bloque o macrobloque correspondiente, y RMV (i, m, r) especifica el número de bitios necesarios para transmitir todos los componentes del vector de movimiento m = [mx, my]T asi como el índice de referencia r. la determinación de los modos de codificación de macrobloque/bloque pi de un macrobloque i al minimizar la función de costo de Lagrangiano p, = argmm^ p | Q^) + maie ¦ RÍríl(i,p j QP*)} Puntille donde DRSC{i,p \ QP*) es definido como s(...) y s' (...) representan el arreglo de muestra de macrobloque originales y su reconstrucción, respectivamente, B especifica el grupo de muestras- de macrobloques/bloques correspondientes, Rail (i/ pIQPi* es el número de bitios asociados con la elección del modo p y el parámetro de cuantificación QPj.* incluyendo los bitios para los modos de macrobloque/bloque, los vectores de movimiento y los índices de referencia así como los coeficientes de transformación cuantificados de todos los bloques de luminancia y crominancia, y Smode es el grupo dado de posibles modos de macrobloques/bloques
10. Arreglo con al menos un chip y/o procesador, en donde el chip y/o procesador es (son) instalados de una manera tal que. puede se ejecutado un proceso para la codificación de imágenes de video, de una manera de modo que es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques , al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un . segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros .de control determinados en los pasos de pre-análisis.
11. Programa de computadora que hace posible que una computadora corra un proceso para codificar imágenes de video, después de que éste ha sido almacenado en la memoria de las computadoras, en donde el programa de computadora contiene el código de codificación para ejecutar un proceso de codificación de imágenes de video, donde, es llevado a cabo un pre-análisis de imágenes, en donde para al menos una parte de los macrobloques al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los ' parámetros de control determinados en el paso de pre-•análisis .
12. Medio de almacenamiento legible en computadora, sobre el cual es almacenado un programa, que hace posible que la computadora ejecute un proceso para codificar las imágenes de video, después de que éste ha sido almacenado en la memoria de la computadora, en donde el programa de la computadora contiene el código de programación para ejecutar un proceso para codificar las imágenes de video, donde es llevado a cabo un pre-análisis de las imágenes, en donde para al menos una parte de los macrobloques, al menos uno de los parámetros de control que ayudan al proceso de codificación es determinado con base en al menos un parámetro estimado, en un segundo paso, la imagen es codificada con los parámetros de codificación calculados con base en los parámetros de control determinados en el paso de pre-análisis.
13. Proceso en el que un programa de computadora como se describe en la reivindicación 11 es descargado de una red para la transferencia de datos, por ejemplo, la internet, hacia una- unidad de procesamiento de datos, que está conectada a la red. RESUMEN Los codificadores y descodificadores de hoy én día requieren la elección inteligente entre muchas opciones de codificación. Esta elección no puede ser eficientemente realizada utilizado el control del codificador de Lagrangiano, pero el control del codificador de Lagrangiano únicamente proporciona resultados dados un parámetro de Lagrangiano particular, que corresponde a alguna velocidad de transmisión desconocida. Por otra parte, los algoritmos de control de velocidad proporcionan resultados de codificación a una velocidad de bitios dada pero sin el funcionamiento de optimización del control del codificador de Lagrangiano. La combinación del control de velocidad y la optimización de Lagrangiano para codificación de video híbrida, es investigada. Es sugerido un nuevo procedimiento para incorporar estos dos métodos conocidos en el control de codificador de vídeo utilizando la decisión en el modo de macrobloques y la adaptación del cuantificador . El funcionamiento de distorsión de velocidad de procedimiento propuesto es validado y analizado vía los resultados experimentales. Se muestra que para la mayoría de las velocidades de bitios, el control de velocidad combinado y la optimización de Lagrangiano que produce un número constante de bitios por imagen logra funcionamiento de distorsión de velocidad similar que el caso de la pendiente constante utilizando únicamente la optimización de Lagrangiano.
MXPA06002367A 2003-09-03 2004-08-23 Proceso y arreglo para codificar imagenes de video. MXPA06002367A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03090282A EP1513350A1 (en) 2003-09-03 2003-09-03 Process and arrangement for encoding video pictures
PCT/EP2004/009391 WO2005022924A1 (en) 2003-09-03 2004-08-23 Process and arrangement for encoding video pictures

Publications (1)

Publication Number Publication Date
MXPA06002367A true MXPA06002367A (es) 2006-06-20

Family

ID=34130266

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06002367A MXPA06002367A (es) 2003-09-03 2004-08-23 Proceso y arreglo para codificar imagenes de video.

Country Status (7)

Country Link
US (1) US8014447B2 (es)
EP (2) EP1513350A1 (es)
JP (1) JP2007504727A (es)
KR (1) KR20060133953A (es)
CN (1) CN1846446B (es)
MX (1) MXPA06002367A (es)
WO (1) WO2005022924A1 (es)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735253B1 (en) 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
US7143434B1 (en) 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
US7339992B2 (en) 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US7720154B2 (en) * 2004-11-12 2010-05-18 Industrial Technology Research Institute System and method for fast variable-size motion estimation
WO2006096612A2 (en) * 2005-03-04 2006-09-14 The Trustees Of Columbia University In The City Of New York System and method for motion estimation and mode decision for low-complexity h.264 decoder
JP5173409B2 (ja) * 2005-03-22 2013-04-03 パナソニック株式会社 符号化装置および符号化装置を備えた動画像記録システム
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
KR101329860B1 (ko) * 2006-09-28 2013-11-14 톰슨 라이센싱 효과적인 레이트 제어 및 비디오 인코딩 품질의 향상을 위한 ρ-도메인 프레임 레벨 비트 할당 방법
US8804829B2 (en) * 2006-12-20 2014-08-12 Microsoft Corporation Offline motion description for video generation
US20080225947A1 (en) * 2007-03-13 2008-09-18 Matthias Narroschke Quantization for hybrid video coding
US8908765B2 (en) 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
WO2009126785A2 (en) 2008-04-10 2009-10-15 The Trustees Of Columbia University In The City Of New York Systems and methods for image archaeology
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
CN101742299B (zh) * 2008-11-21 2012-06-27 中国科学院空间科学与应用研究中心 一种符合ccsds标准的图像无损压缩处理系统及方法
US8671069B2 (en) 2008-12-22 2014-03-11 The Trustees Of Columbia University, In The City Of New York Rapid image annotation via brain state decoding and visual pattern mining
DK2476255T3 (en) 2009-09-10 2018-08-06 Guangdong Oppo Mobile Telecommunications Corp Ltd ACCELERATION TECHNIQUES FOR DISTORTION GRADE OPTIMIZED QUANTIZATION
CN104661026B (zh) * 2009-10-21 2018-03-27 Sk电信有限公司 图像编码和解码装置和方法
KR101040087B1 (ko) * 2010-01-13 2011-06-09 전자부품연구원 H.264 svc를 위한 효율적인 부호화 방법
US20120057640A1 (en) 2010-09-02 2012-03-08 Fang Shi Video Analytics for Security Systems and Methods
JP5426506B2 (ja) * 2010-09-06 2014-02-26 日本電信電話株式会社 適応量子化方法,適応量子化装置および適応量子化プログラム
CN107529708B (zh) 2011-06-16 2019-05-07 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
CN102256126A (zh) * 2011-07-14 2011-11-23 北京工业大学 混合图像的编码方法
UA114674C2 (uk) 2011-07-15 2017-07-10 ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі Ініціалізація контексту в ентропійному кодуванні
US9781449B2 (en) * 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
US9338463B2 (en) 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
JP5828967B2 (ja) * 2012-01-17 2015-12-09 インフォブリッジ ピーティーイー. エルティーディー. エッジオフセットを適用する方法
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
JP6300033B2 (ja) * 2012-12-26 2018-03-28 ソニー株式会社 画像処理装置および方法
CN103313058B (zh) * 2013-06-08 2016-08-17 中国计量学院 针对芯片实现的hevc视频编码多模块优化方法和系统
KR102281282B1 (ko) * 2013-12-26 2021-07-23 삼성전자주식회사 서브블록 기반 예측을 수행하는 인터 레이어 비디오 복호화 방법 및 그 장치 및 서브블록 기반 예측을 수행하는 인터 레이어 비디오 부호화 방법 및 그 장치
GB2523736B (en) * 2014-02-19 2020-03-25 Advanced Risc Mach Ltd Rate control in video encoding
TWI508531B (zh) * 2014-06-04 2015-11-11 Hon Hai Prec Ind Co Ltd 視訊編碼裝置及方法
US20150373326A1 (en) * 2014-06-19 2015-12-24 Magnum Semiconductor, Inc. Apparatuses and methods for parameter selection during rate-distortion optimization
CN104320657B (zh) * 2014-10-31 2017-11-03 中国科学技术大学 Hevc无损视频编码的预测模式选择方法及相应的编码方法
US10432952B2 (en) * 2015-11-19 2019-10-01 Qualcomm Incorporated System and methods for fixed-point approximations in display stream compression (DSC)
CN108696750A (zh) * 2017-04-05 2018-10-23 深圳市中兴微电子技术有限公司 一种预测模式的判决方法及装置
US20220201317A1 (en) * 2020-12-22 2022-06-23 Ssimwave Inc. Video asset quality assessment and encoding optimization to achieve target quality requirement
CN112929663B (zh) * 2021-04-08 2022-07-15 中国科学技术大学 一种基于知识蒸馏的图像压缩质量增强方法
CN113706368A (zh) * 2021-10-29 2021-11-26 湖北亿咖通科技有限公司 图像数据处理方法和装置、电子设备、存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0645930B1 (en) * 1993-04-09 2000-06-14 Sony Corporation Method and apparatus for coding image
JP3358620B2 (ja) * 1993-04-09 2002-12-24 ソニー株式会社 画像符号化方法及び画像符号化装置
JPH07177464A (ja) * 1993-12-16 1995-07-14 Pioneer Video Corp リアルタイム画像圧縮処理装置
JPH07322267A (ja) * 1994-05-25 1995-12-08 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化装置
JPH09322176A (ja) * 1995-12-20 1997-12-12 Sanyo Electric Co Ltd 符号化モード選択方法、動画像符号化装置、符号化方法、記録方法、及び伝送方法
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
JP3630565B2 (ja) * 1998-08-26 2005-03-16 沖電気工業株式会社 動画像の符号化方法及び装置
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
EP1189451A1 (en) * 2000-09-13 2002-03-20 Kabushiki Kaisha Toshiba Digital video encoder
JP4644939B2 (ja) * 2001-01-17 2011-03-09 日本電気株式会社 動画像符号化装置および動画像符号化方法

Also Published As

Publication number Publication date
KR20060133953A (ko) 2006-12-27
EP1661410A1 (en) 2006-05-31
WO2005022924A1 (en) 2005-03-10
CN1846446B (zh) 2010-12-29
CN1846446A (zh) 2006-10-11
US8014447B2 (en) 2011-09-06
EP1513350A1 (en) 2005-03-09
JP2007504727A (ja) 2007-03-01
US20080298464A1 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
MXPA06002367A (es) Proceso y arreglo para codificar imagenes de video.
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
US8891619B2 (en) Rate control model adaptation based on slice dependencies for video coding
EP2090108B1 (en) Method and apparatus for encoding and/or decoding video data using adaptive prediction order for spatial and bit depth prediction
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
US20080056354A1 (en) Transcoding Hierarchical B-Frames with Rate-Distortion Optimization in the DCT Domain
EP1992169B1 (en) Method and apparatus for bit rate control in scalable video signal encoding using a rate-distortion optimisation
US20070274396A1 (en) Complexity adaptive skip mode estimation for video encoding
EP1574071A1 (en) Method of selecting among n &#34;spatial video codecs&#34; the optimum codec for a same input signal
Mansour et al. Rate and distortion modeling of CGS coded scalable video content
Grois et al. Optimization methods for H. 264/AVC video coding
Pang et al. Dependent joint bit allocation for H. 264/AVC statistical multiplexing using convex relaxation
Yi et al. Rate control using enhanced frame complexity measure for H. 264 video
KR100718468B1 (ko) 영상 축소 트랜스 코딩 방법 및 장치
Lee et al. Low bit rates video coding using hybrid frame resolutions
Yang et al. Real time implementation of rate-distortion optimized coding mode selection for H. 263 video coders
Atta Optimal bit allocation for subband video coding
Hung et al. Inter-frame post-processing for intra-coded video
He et al. Improved fine granular scalable coding with interlayer prediction
Liu et al. Content-adaptive motion estimation for efficient video compression
Pantoja et al. A two-level rate control approach for video transcoding
Pantoja et al. Low complexity rate control for VC-1 to H. 264 transcoding
KR101307469B1 (ko) 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법
Zhong et al. A low complexity macroblock layer rate control scheme base on weighted-window for h. 264 encoder
Wang et al. Enhanced SAITD Cost Function for H. 264/AVC Intra 4× 4 Mode Decision

Legal Events

Date Code Title Description
FA Abandonment or withdrawal