CODIFICACIÓN DE LUMA-CROMA COM UNO O MAS PROMOSTICADORES ESPACIALES DISTINTOS
REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS
Esta Solicitud reclama el beneficio de la Solicitud Provisional de E U A serie No 60/671,255, presentada el 13 de abril, 2005 y la solicitud Provisional de E U A Serie No 60/700,834, presentada el 20 de julio, 2005 ambas que se incorporan aquí por referencia en sus respectivas totalidades Además, esta solicitud se refiere a las Solicitudes de Patente de E U.A Cédula de Apoderado Nos PU050051, PU060023 titulada 'MÉTODO Y APARATO PARA CODIFICACIÓN DE VIDEO', y PU060029, PU060030 titulada "MÉTODO Y APARATO PARA DESCODIFICACION DE VIDEO"; cada una presentada concurrentemente
CAMPO DE LA INVENCIÓN
La presente invención se refiere generalmente a codificadores y descodificadores de video y, más particularmente, a métodos y aparatos para codificar y descodificar video.
ANTECEDENTES DE LA INVENCIÓN
Actualmente, formato de 4 4.4 de la Unión de
Telecomunicaciones Internacional, Sector de Telecomunicaciones (ITU-T) estándar H 264 (aquí denominado posteriormente el estándar "H 264') sólo codifica uno de tres canales como luma, con los otros dos canales codificados como croma utilizando herramienta menos eficientes Cuando una entrada a un codificador/descodificador está en formato 4 44 con resolución completa en cada componente de entrada, que codifica dos de los tres componentes de entrada con algoritmo de codificación croma menos efectivo resulta en el uso de más bits en esos dos canales Este problema particular es más notable en marcos internos Por ejemplo, el estándar H 264 que corre en el modo Solo Interno es menos eficiente que JPEG2k para calidad de compresión total a 40 db (PSNR) y superior Por consiguiente, sería deseable y altamente ventajoso tener métodos y aparatos para codificación y descodificación de video que superen las desventajas antes descritas de la técnica anterior
BREVE DESCRIPCIÓN DE LA INVENCIÓN
Estas y otros retrocesos y desventajas de la técnica anterior se dirigen por la presente invención, que se dirige a métodos y aparatos para codificación y descodificacion de video De acuerdo con un aspecto de la presente invención, se proporciona un codificador de video para codificar datos de señal de video para un bloque de imagen El codificador de video incluye un codificador para codificar los datos de señal de video que utilizan
pronosticadores únicos para cada uno de componentes de color de los datos de señal de video De acuerdo con otro aspecto de la presente invención, se proporciona un método para codificar datos de señal de video para un bloque de imagen El método incluye codificar los datos de señal de video al utilizar pronosticadores únicos para cada componente de color de los datos de señal de video De acuerdo incluso con otro aspecto de la presente invención, se proporciona un descodificador de video para descodificar datos de señal de video para un bloque de imagen El descodificador de video incluye un descodificador para descodificar los datos de señal de video que utilizan pronosticadores únicos para cada componente de color de los datos de señal de video De acuerdo incluso con otro aspecto de la presente invención, se proporciona un método para descodificar datos de señal de video que utilizan pronosticadores únicos para cada componente de color de los datos de señal de video Estos y otros aspectos, características y ventajas de la presente invención serán evidentes a partir de la siguiente descripción detallada de modalidades ilustrativas, que se van a leer en conexión don los dibujos acompañantes
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La presente invención puede entenderse mejor de acuerdo con
las siguientes figuras ilustrativas, en las cuales La Figura 1 es un diagrama de bloque que ilustra un aparato de codificación de video ilustrativa al que se pueden aplicar los presentes principios, La Figura 2 es un diagrama de bloque que ilustra un aparato de descodificación de video ilustrativa al que se pueden aplicar los presentes principios, La Figura 3 es un diagrama de flujo que ilustra un procedimiento de codificación de video ilustrativo con una pre-codificación, bloque de transformación de color, de acuerdo con los presentes principios, La Figura 4 es un diagrama de flujo que ilustra un procedimiento de descodificación de video ilustrativo con una post-codificacion, bloque de transformación de color inverso, de acuerdo con los presentes principios La Figura 5 es un diagrama de bloque que ilustra un modelo simplificado de transformación de color residual (RCT), Las Figuras 6A y 6B son gráficas de velocidad de bit contra PSNR promedio para ATV solo interior de acuerdo con los presentes principios, Las Figuras 7A y 7B son gráficas de velocidad de bit contra PSNR promedio para CT solo interior de acuerdo con los presentes principios, Las Figuras 8A y 8B son gráficas de velocidad de bit de veros PSNR promedio para DT solo interior de acuerdo con los presentes
principios, Las Figuras 9A y 9B son gráficas de velocidad de bit contra PSNR promedio para MIR_HD sólo interior de acuerdo con los presentes principios, Las Figuras 10A y 10B son gráficas de velocidad de bit contra
PSNR promedio para RT solo interior de acuerdo con los presentes principios, Las Figuras 11 A y 11B son gráficas de velocidad de bit contra PSNR promedio para STBJHD solo interior de acuerdo con los presentes principios, La Figura 12 es una tabla que ilustra sintaxis de parámetro de secuencia H 264 de acuerdo con los presentes principios, La Figura 13 es una tabla que ilustra sintaxis de datos residuales H 264 de acuerdo con los presentes principios, La Figura 14 es un diagrama de flujo que ilustra un procedimiento de codificación de video ilustrativo con una pre-codificacion, bloque de transformación de color, de acuerdo con los presentes principios, La Figura 15 es un diagrama de flujo que ilustra un procedimiento de descodif icación de video ilustrativo con una post-descodificacion, bloque de paso de transformación de color inverso, de acuerdo con los presentes principios, y La Figura 16 es una tabla que ilustra la sintaxis de predicción de macrobloque H 264 de acuerdo con los presentes principios
DESCRIPCIÓN DETALLADA
La presente invención se dirige a métodos y aparatos para datos de señal de video de codificación y descodificación de video. Se debe apreciar que mientras la presente invención se describe principalmente con respecto a datos de señal de video muestreados al utilizar el formato 4:4:4 de la Unión de Telecomunicaciones Internacional, Sector de Telecomunicaciones (ITU-T) estándar H.264, la presente invención también puede aplicarse a datos de señal de video muestreados al utilizar otros formatos (por ejemplo, el formato 4:2:2 y/o 4:2:0) del estándar H.264 asi como otros estándares de compresión de video que mantienen el alcance de la presente invención . Se debe apreciar que los métodos y aparatos de acuerdo con los presentes principios no requieren el uso de nueva (herramienta(s) para el algoritmo de compresión loma o croma, en vez de eso, las herramientas de codificación loma existentes pueden utilizarse. Por consiguiente, un resultado ventajoso de esto es que el desempeño de codificación del formato 4:4:4 puede mezclarse mientras conserva la compatibilidad de retroceso y minimiza cualquier cambio al estándar H.264 existente (u otro aplicable). De acuerdo con los principios de la presente invención como se configura en una modalidad, un algoritmo de codificación luma se utiliza para codificar todos los tres canales de componente de, por ejemplo, contenido 4:4:4. Las ventajas de esta modalidad incluyen
una mejora en el desempeño de codificación total para comprimir contenido 4 4 4 con respecto a la técnica anterior Actualmente, en el estándar H 264 existente solo uno de los tres canales se codifica como luma, y los otros dos se codifican como croma al utilizar menor herramientas eficientes Ademas, de acuerdo con los principios de la presente invención como se configura en una modalidad la transformación de color se realiza como un paso de pre-procesamiento De esa forma, de acuerdo con esta modalidad, una transformación de Color Residual (RCT) no se realiza dentro del giro de compresión Ventajas de esta modalidad incluyen proporcionar la arquitectura de codificador/descodificador consistente entre todos los formaros de color Ademas, de acuerdo con los principios de la presente invención como se configura en una modalidad, el mismo modo de predicción de movimiento/espacial se utiliza para todos los tres componentes Las ventajas de esta modalidad incluyen reducir complejidad de codificador/descodificador y compatibilidad de retroceso También de acuerdo con otra modalidad, en vez de utilizar el mismo pronosticador para todos los tres componentes, puede utilizarse un grupo (o subgrupo) de tres (3) pronosticadores espaciales para los tres componentes Las ventajas de esta modalidad incluyen una mejora en el desempeño de codificación total para comprimir contenido de 4 4 4 con respecto a la técnica anterior Se debe apreciar que las vanas modalidades antes y
subsecuentemente descritas aquí pueden implementarse como modalidades aisladas o pueden combinarse en cualquier forma como se aprecia fácilmente por un experto en las técnicas relacionadas De esa forma, por ejemplo, en una primera modalidad combinada, un algoritmo de codificación luma se utiliza ventajosamente para codificar todos los tres canales de componente, transformación de color se realiza como un paso de pre-procesamiento, y un pronosticador individual se utiliza para todos los tres canales de componente En una segunda modalidad combinada, un algoritmo de codificación luma se utiliza ventajosamente para codificar todos los tres canales de componente, se realiza transformación de color como un paso de pre-procesamiento, y puede utilizarse un grupo (subgrupo) de tres (3) pronosticadores espaciales restringidos para los tres canales de componente Por supuesto, como se notó anteriormente, también pueden implementarse otras combinaciones de las vanas modalidades dado las enseñanzas de los presentes principios aquí proporcionados, mientras mantienen el alcance de la presente invención La presente descripción ilustra los principios de la presente invención De esa forma se debe apreciar que aquellos expertos en la técnica serán capaces de notar varias disposiciones, que aunque no se describen explícitamente o muestran aquí, representan los principios de la invención y se incluyen dentro de su espíritu y alcance Todos los ejemplos y lenguaje condicional aquí mencionado se
pretenden para propósitos pedagógicos para ayudar al lector a entender los principios de la invención y los conceptos contribuidos por el inventor para adicionar la técnica, y pretenden interpretarse como siendo sin limitación para tales ejemplos y condiciones específicamente mencionados Ademas, todas las declaraciones aquí que mencionan principios, aspectos, y modalidades de la invención, así como ejemplos específicos de la misma, se pretenden para abarcar tanto equivalentes estructurales como funcionales de la misma Adicionalmente, se pretende que tales equivalentes incluyan tanto equivalentes actualmente conocidos asi como equivalentes desarrollados en el futuro, es decir, cualquiera de los elementos desarrollados que realizan la misma función, sin importar la estructura De esa forma, por ejemplo, se apreciará por aquellos expertos en la técnica que los diagramas de bloque presentados aquí representan vistas conceptuales de sistema de circuitos ilustrativo que representa los principios de la invención, similarmente, se apreciara que cualquiera de los cuadros de flujo, diagramas de flujo, diagramas de transición de estado, seudo código, y similares representan vanos procedimientos que pueden representarse sustancialmente en medios legibles por computadora y ejecutarse así por una computadora o procesador, si tal computadora o procesador se muestra o no explícitamente Las funciones de los vanos elementos mostrados en la figuras
pueden proporcionarse a través del uso de hardware dedicado así como hardware capaz de ejecutar software en asociación con software apropiado Cuando se proporciona por un procesador, las funciones pueden proporcionarse por un procesador dedicado individual, por un procesador compartido individual, o por una pluralidad de procesadores individuales, algunos de los cuales pueden ser compartidos Ademas, el uso explícito del término "procesador" o 'controlador ' no debe interpretarse para referirse exclusivamente a hardware capas de ejecutar software, y puede incluir implícitamente, sin limitación, hardware de procesador de señal digital ('DSP"), memoria solo de lectura ("ROM") para almacenar software, memoria de acceso aleatorio ("RAM"), y almacenamiento no volátil Otro hardware, convencional y/o de costumbre, también puede incluirse Similarmente, cualquiera de los interruptores mostrado en las figurad son solo conceptuales Su función puede llevarse a cabo a través de la operación de lógica de programa, a través de lógica dedicada, a través de la interacción de control de programa y lógica dedicada, o incluso manualmente, la técnica particular es seleccionable por el implementador como se entiende más específicamente a partir del contexto En las reivindicaciones de la misma, cualquier elemento expresado como un medio para realizar una función especificada pretende abarcar cualquier forma para realizar esa función que incluye, por ejemplo, a) una combinación de elementos de circuito
que realiza esa función o b) software en cualquier forma, que incluye, por lo tanto, firmware, microcodigo o la función similares, combinados con sistema de circuito apropiado para ejecutar ese software para realizar la función La invención como se definió por tales reivindicaciones reside en el hecho que las funcionalidades proporcionadas por los varios medios mencionados se combinan y juntan en la forma en la que las reivindicaciones lo piden De esa forma se considera que cualquier medio que proporciona esas funcionalidades es equivalente a los aquí mostrados Cambiando ahora a la Figura 1, se indica generalmente un aparato de codificación de video ilustrativo por el número de referencia 199 El aparato de codificación de video 199 incluye un codificador de video 100 y un módulo de transformación de color de pre-codificación 105 El modulo de transformación de color de pre-codificacion 105 es para realizar pre-procesam lento de color de señales de video antes de ingresar el mismo al codificador de video 100 El pre-procesamiento de color realizado por la pre-codificación, el módulo de transformación de color 105 además se describe aquí más adelante Se debe apreciar que el módulo de transformación de color 105 de pre-codificación puede omitirse en algunas modalidades Una entrada del modulo de transformación de color de pre-codificación ?O5 y una entrada del codificador de video 100 están disponibles como entradas del aparato de codificación de video 199 Una salida del módulo de transformación de color de pre-
codificación 105 se conecta en una comunicación de señal con la entrada del codificador de video 100 La entrada del codificador de video 100 se conecta en comunicación de señal con una entrada de no-inversiop de una unión de suma 110 La salida de la unión de suma 110 se conecta en comunicación de señal con un transformador/cuantificador 120 La salida del transformador/cuantificador 120 se conecta en comunicación de señal con un codificador de entropía 140 Una salida del codificador de entropía 140 está disponible como una salida del codificador de entropía 100 y también como una salida del aparato de codificación de video 199 La salida del transformador/cuantificador 120 además se conecta en comunicación de señal con un transformador/cuantificador inverso 150 Una salida del transformador/cuantificador inverso 150 se conecta en comunicación de señal con una entrada del filtro de desbloqueo 160 Una salida del filtro de desbloqueo 160 se conecta en comunicación de señal con almacenamientos de imagen de referencia 170 Una primera salida de los almacenamientos de imagen de referencia 170 se conecta en comunicación de señal con una primera entrada de un estimador de predicción de movimiento y espacial 180 La entrada al codificador de video 100 ademas se conecta en comunicación de señal con una segunda entrada del estimador de predicción de movimiento y espacial 180 La salida del estimador de predicción de movimiento y espacial 180 se conecta en comunicación de señal con una segunda
entrada del compensador de movimiento y espacial 190 La salida del compensador de movimiento y espacial 190 se conecta en comunicación de señal con una entrada de inversión de la unión de suma 110 Cambiando a la Figura 2 se indica generalmente un aparato de descodificacion de video ilustrativo por el número de referencia 299 El aparato de descodificacion de video 299 incluye un descodificador de video 200 y un post-descodificador, modulo de transformación de color inverso 293 Una entrada del descodificador de video 200 está disponible como una entrada del aparato de descodificación de video 299 La entrada al descodificador de video 200 se conecta en comunicación de señal con una entrada del descodificador de entropía 210 Una primera salida del descodificador de entropía 210 se conecta en comunicación de señal con una entrada de un cuantificador/transformador inverso 220 Una salida del cuantificador/transformador inverso 220 se conecta en comunicación de señal con una primera entrada de una unión de suma 240 La salida de la unión de suma 240 se conecta en comunicación de señal con un filtro de desbloqueo 290 Una salida del filtro de desbloqueo 290 se conecta en comunicación de señal con almacenamientos de imagen de referencia 250 El almacenamiento de imagen de referencia 250 es un compensador de predicción 260 Una salida del compensador de predicción espacial de movimiento 260 se conecta en comunicación de señal con una segunda entrada de la
unión de suma 240 Una segunda salida del descodificador de entropía 210 se conecta en comunicación de señal con una segunda entrada den compensador de movimiento 260 La salida del filtro de desbloqueo 290 esta disponible como una salida del descodificador de video 200 y también como una salida del aparato de descodificación de video 299 Ademas una entrada del modulo de transformación de color inverso de post-descodificacion 293 puede estar disponible como una salida del aparato de descodificacion de video 299 En tal caso, la salida del descodificador de video 200 puede conectarse en comunicación de señal con una entrada del modulo de transformación de color inverso de post-descodificacion 293, que es un modulo de post-procesamiento con respecto al descodificador de video 200 Una salida del modulo de transformación de color inverso de post-descodificacion 293 proporciona una señal transformado de color inverso post-procesada con respecto a la salida del descodificador de video 200 Se debe apreciar que el uso del modulo de transformación de color inverso de post-descodificación 293 es opcional Ahora se presenta una descripción para codificación de 44 4 aumentada de acuerdo con los principios de la presente invención Una primera modalidad descrita de acuerdo con los principios de la presente invención Una primera modalidad descrita se combina con una modalidad combinada en la cual el algoritmo de codificación luma se utiliza para todos los componentes de color, el mismo modo
de predicción espacial se utiliza para todos los componentes de color, y la Transformación de Color Residual (RCT) se omite desde dentro del giro de compresión También se proporcionan resultados de prueba para esta modalidad combinada Subsecuentemente después de esto, se describe una segunda modalidad combinada en donde el algoritmo de codificación luma se utiliza para todos los componentes de color, un grupo (o subgrupo) de pronosticadores espaciales se utiliza para todos los componentes de color (en vez de un modo de predicción espacial individual), y la Transformación de Color Residual (RCT) se omite desde el interior del giro de compresión De esa forma, una diferencia entre la primera y la segunda modalidades combinadas es el uso de un modo de predicción espacial individual para todos los componentes de color en la primera modalidad combinada contra el uso de un grupo (subgrupo) de pronosticadores espaciales restringidos para todos los componentes de color en la segunda modalidad combinada Por supuesto, como se noto anteriormente, las modalidades aquí descritas pueden implementarse como modalidades aisladas o pueden combinarse en cualquier forma, como se aprecia fácilmente por un experto en la técnica y técnicas relacionadas Por ejemplo, de acuerdo con los principios de la presente invención como se configuran en una modalidad, sólo un modo de predicación espacial se utiliza, sin combinación con otras modalidades, tal como la omisión de RCT del giro de compresión Se debe apreciar que dadas las enseñanzas de los presentes principios aquí proporcionados,
estas y otras variaciones, implementaciones, y combinaciones de las modalidades de la presente invención serán fácilmente valorables por un experto en la técnica y técnicas relacionadas, mientras mantiene el alcance de la presente invención Cambiando a la Figura 3, un procedimiento de codificación de video ilustrativo con un bloque de transformación de color de pre-codificación, se indican generalmente por los números de referencia 300 y 301, respectivamente Se debe apreciar que el bloque de transformación de color de pre-codificacion 301 incluye bloques 306, 306 y 310 Además, se debe apreciar que el bloque de transformación de color de pre-codificacion 301 es opcional y, de esa forma, puede omitirse en algunas modalidades de la presente invención El bloque de transformación de color de pre-codificación 301 incluye un bloque de límite de giro 306 que comienza un giro para cada bloque en una imagen, y pasa control a un bloque de función 308 El bloque de función 308 realiza pre-procesamiento de color de los datos de señal de video del bloque de imagen actual, y pasa control a un bloque de límite de giro 310 El bloque límite de giro 310 termina el giro Además, el bloque de límite de giro 310 pasa control a un bloque de límite de giro 312, este último incluido en el procedimiento de codificación de video 300 El bloque de límite de giro 312 comienza un giro para cada bloque en la imagen, y pasa control a un bloque de función 315 El bloque de función 315 forma una predicción de movimiento
compensado o espacial del bloque de imagen actual que utiliza un pronosticado común para cada componente de color del bloque de imagen actual, y pasa control a un bloque de función 320 El bloque de función 320 resta el movimiento compensado o predicción espacial del bloque de imagen actual para formar un residual de predicción, y pasa control a un bloque de función 330 El bloque de función 330 transforma y cuantifica el residual de predicción, y pasa control a un bloque de función 335 El bloque de función 335 transforma a la inversa y cuantifica el residual de predicción para formar un residual de predicción codificado, y pasa control a un bloque de función 345 El bloque de función 345 agrega el residual codificado a la predicción para formar un bloque de imagen codificado, y pasa control a un bloque de giro de extremo 350 El bloque de giro de extremo 350 termina el giro y pasa control a un bloque de extremo 355 Cambiando a la Figura 4 un procedimiento de descodificación de video ilustrativo con un bloque de transformación de color inverso de post-descodificacion, se indican generalmente por los números de referencia 400 y 460, respectivamente Se debe apreciar que el bloque de transformación de color inverso de post-descodificacion 460 incluye bloques 462, 464, 466, y 468 Ademas, se debe apreciar que el bloque de transformación de color inverso de post-descodificación 460 es opcional y, de esa forma, pueden omitirse en algunas modalidades de la presente invención
1 El procedimiento de descodificacion 400 incluye un bloque de limite de giro 410 que comienza un giro para un bloque actual en una imagen, y pasa control a un bloque de función 415 El bloque de función 415 descodifica por entropía en residual codificado, y pasa control a un bloque de función 420 El bloque de función 420 transforma a la inversa y cuantifica el residual descodificado para formar un residual codificado, y pasa control a un bloque de función 430 El bloque de función 430 agrega el residual codificado a la predicción formada de un pronosticador común para cada componente de color para formar un bloque de imagen codificado, y pasa control a un bloque de limite de giro 435 El bloque de limite de giro 435 termina el giro y pasa control a un bloque de fin 440 En algunas modalidades, el bloque de límite de giro 435 opcionalmente pasa control al bloque de transformación de color inverso de post-descodificacion 460, en particular, el bloque de límite de giro 462 incluido en el bloque de transformación de color inverso de post-descodificacion 460 El bloque de limite de giro 462 comienza un giro para cada bloque en una imagen, y pasa control a un bloque de función 464 El bloque de función 464 realiza un post-procesamiento de color inverso de los datos de señal de video del bloque de imagen actual, y pasa control a un bloque de limite de giro 466 El bloque de limite de giro 466 termina el giro, y pasa control al bloque de fin 468 En el formato 4 4 4 H 264 cada canal de componente tiene resolución completa De esa forma de acuerdo con la primera
modalidad combinada mencionada anteriormente, el algoritmo de codificación luma se utiliza en cada componente de color para lograr la eficiencia de compresión total máxima Por consiguiente, en la modalidad, para cuadros interiores, cada componente de color puede comprimirse, por ejemplo, al utilizar esos modelos de predicción enlistados en la Tabla 8-2, Tabla 8-3, Tabla 8-4 en ISO/IEC 14496 10Codificacion de Video Avanzada 3ra Edición (ITU-T Rec H 264), ISO/IEC JTC1/SC29/WG11 y ITU-T SG16 Q.6, Documento N6540, Julio 2004 Además, en la modalidad, el mismo modo de predicción espacial se utiliza para todos los tres componentes de píxel, para además reducir la complejidad del codificador/descodificador y mejorar desempeño Por ejemplo, el modo de predicción establecido por los parámetros prev_? ntra4x4_pred_modo_marca , remjntra4x4_pred_modo, pre vj ntradx8_pred_modo_marca, y remjntra8x8_pred_modo para el luma en el encabezado de predicción de macrobloque puede utilizarse por todos los tres componentes. Por lo tanto, no se necesitan elementos de sintaxis y bits extra. Para los marcos B y P (pronosticadores), los píxeles de referencia en ubicaciones de fracción pueden calcularse por los métodos de interpolación descritos en la Sección 8 4 2 2 1 del estándar H.264 para todos los tres canales Los cambios de sintaxis y semánticos detallados al estándar H 264 actual además se describen aquí más adelante Se agregó la Transformación de Color Residual (RCT) al
codificador/descodificador en el Perfil 4 4 4 alto Como un resultado, la estructura de compresión para el formato 4 4 4 es diferente de uno actualmente utilizado en todos los otros perfiles en el estándar H 264 para formatos 4 2 0 y 4 2 2 Esto resulta en alguna complejidad extra a la implementacion Ademas, similar a cualquier otra de las transformaciones de color YCOCG no siempre mejora el desempeño de compresión total La efectividad de YCOCG es altamente dependiente de contenido De esa forma, para mejorar la compresión total y voluminosidad, en la modalidad, la transformación de color se coloca fuera del giro de predicción como una parte del bloque de preprocesamiento Al hacer esto, seleccionar una transformación de color óptimo para una tarea de compresión específica es una emisión operacional y la mejor respuesta para una secuencia de entrada particular puede encontrarse entre un numero de opciones De acuerdo con una modalidad en donde todos los componentes utilizan los mismos pronosticadores espaciales para los marcos internos y los mismos filtros de interpolación para los marcos B y P (pronosticadores o ínter-codificados), que tienen la transformación de color realizada en los residuos de predicción es idéntica a realizar la transformación de color en las imágenes de fuente fuera del codificador/descodificador cuando se ignoran errores de redondeo/truncamiento Esto se discutirá en mayor detalle más adelante De esa forma, el bloque RCT se remueve de la estructura de codificación para hacer la estructura de codificación consistente entre todos los formatos de color
Cambiando a la Figura 5, un modelo simplificado de RCT generalmente se indica por el numero de referencia 500 El modelo RCT 500 incluye un generador de píxel de referencia 510, una unión de suma 520, y un módulo de transformación lineal 530 Entradas al generador de pixel de referencia 510 se configuran para recibir información de movimiento/borde y vectores [Xi], [X2] [Xp] Una salida del generador de pixel de referencia 510 se conecta en comunicación de señal con una entrada de inversión de la unión de suma 520, que proporciona el vector de predicción [Xp] al mismo Una entrada no invertida de la unión de suma 520 se configura para recibir vector de entrada [X n]. Una salida de la unión de suma 520 se conecta en comunicación de señal con una entrada del módulo de transformación lineal 530, que proporciona vector [Xd] al mismo Una salida del modulo de transformación lineal 530 se configura para proporcionar vector [Yd] En el modelo simplificado de RCT 500, la transformación de color representada por una matriz 3x3 [A] (una transformación lineal) se define como sigue.
(D
Los [X?n], [Xd], [Xp], [Xi], [X2] [Xn] son vectores de 3x1 que representan los píxeles en el dominio RGB [Yd] es un vector de 3x1 que representa el resultado de la transformación de color Por lo
tanto,
[Y ] = [A][Xd] = [A][X?n]-[A][Xp] (2)
Ya que en la modalidad, los mismos pronosticadores espaciales y filtros de interpolación se utilizan para todos los tres componentes en un macrobloque de acuerdo con los principios de la presente invención como se configura en una modalidad, el píxel de referencia [Xp] puede expresarse como sigue
en donde un vector nxl [C] representa las operaciones lineales involucradas en los pronosticadores espaciales y filtros de interpolación definidos en el estándar H 264 Aquí, se presume que el píxel de referencia se calcula al utilizar un número total de n píxeles colindantes [X , [X2], [Xn] Sustituir [Xp] en la ecuación (3) en la ecuación (2) resulta en lo siguiente
Ignorar los errores de redondeo/truncamiento y asumir el mismo modo de predicción se selecciona en cualquier dominio RGB o Y resulta en lo siguiente
Por lo tanto,
De esa forma, la ecuación (6) claramente muestra que utilizar
YUV como la entrada al codificador/descodificador de acuerdo con los principios de la presente invención como se configura en esta modalidad, es idéntico a realizar RCT También, de acuerdo con los principios de la presente invención como se configura en una modalidad, se agrega un nuevo perfil 44.4 al estándar H 264, denominado aquí como "Perfil 4.4:4 avanzado con pe rf i l_? c= 166" Este nuevo perfil jdc puede agregarse en el encabezado de parámetro de secuencia, y puede utilizarse en el encabezado de capa de macrobloque, así como el encabezado de datos residual
Para soportar utilizar el algoritmo luma para codificar todos los tres componentes de color, pueden hacerse algunos cambios a la sintaxis de datos residual Además, también pueden hacerse cambios a la semántica de algunos elementos en el encabezado de macrobloque, encabezado de datos de residuo, y así sucesivamente En general, la sintaxis existente para luma en la especificación H 264 permanecerá sin cambios y puede utilizarse para codificar uno de los tres componentes Los cambios son compatibles en retroceso. La sintaxis detallada y cambios semánticos se describen aquí posteriormente Ahora se proporcionará una descripción con respecto a resultados de simulación realizados de acuerdo con los principios de la presente invención como se configura en varias modalidades Cambiando a las Figuras 6A y 6B, las gráficas de velocidad de bit contra PSNR promedio para ATV interior solamente se indican generalmente por los números de referencia 600 y 650, respectivamente Cambiando a las Figuras 7A y 7B, las gráficas de velocidad de bit contra PSNR promedio para CT interior solamente se indican generalmente por los números de referencia 700 y 750, respectivamente. Cambiando a las Figuras 8A y 8B, las gráficas de velocidad de bit contra PSNR promedio para DT interior solamente se indican generalmente por los números de referencia 800 y 850, respectivamente.
Cambiando a las Figuras 9A y 9B, las gráficas de velocidad de bit contra PSNR promedio para MIRJHD interior solamente se indican generalmente por los números de referencia 900 y 950, respectivamente Cambiando a las Figuras 10A y 10B, las gráficas de velocidad de bit contra PSNR promedio para RT interior solamente se indican generalmente por los números de referencia 1000 y 1050, respectivamente. Cambiando a las Figuras 11 A y 11 B , las gráficas de velocidad de bit contra PSNR promedio para STB HD interior solamente se indican generalmente por los números de referencia 1100 y 1150, respectivamente En particular, las Figuras 6A, 7A, 8A, 9A, 10, y 11 A ilustran resultados de prueba para el perfil 4 4 4 Avanzado (indicado y procedido por el termino "nuevo") contra los resultados de aproximación correspondientes a los mismos Además, las Figuras 6B, 7B, 8B, 9B, 10B, y 11 B ilustran resultados se prueba para el perfil 4.4.4 Avanzado propuesto (indicado y procedido por el término "nuevo") contra JPEK2k En todas las Figuras 6A, 6B a 11 A, 11 B, el PSNR se indica en decibeles (dB) y la velocidad de bit se indica en bits por segundo (bps) ATV, CT, DT, MIR, RT, STB son los nombres de los clips de prueba Todas las secuencias de prueba JVT/FRExt descritas en JVT-J042, Secuencias de Prueba Originadas de Película, se utilizaron en
las pruebas Todos son material de película de bit 10 de 4 44 y clip tiene 58 marcos Los perfiles 4 4 4 avanzados propuestos se implementaron en el software de Referencia JVT JM9 6 Tanto la estructura de codificación solo interior como IBBP se utilizaron en las pruebas El parámetro de cuantificación se estableció a 6, 12, 18, 24, 30 y 42 para cada una de las curvas R-D Se utilizo la sección de modo optimizado RD El Perfil 4 4 4 Avanzado propuesto también se comparó con los resultados que se hicieron al correr el software de referencia con el FotmatoYUV = (4 0 0) en cada componente de entrada individual Tres cuentas de bit comprimidas individuales separadas se agregaron simplemente juntas, para obtener los bits totales comprimidos para calcular la velocidad de bit comprimida Con respecto a JPEG2k, el software KaKadu V2 2 2 se utilizó en las pruebas Los resultados de prueba se generaron al utilizar 5 niveles de descompresión de onda pequeña con el filtro de onda pequeña bi-ortogonal de tapa 9/7 Solo existió un mosaico por marco y la Optimizacion RD para una velocidad objetiva dada también se utilizó Todas las medidas PSNR se hicieron en el dominio RGB. El PSNRT promedio definido como
(PSNR(rojo) + PSNR(verde) + PSNR(azul))/3, se utiliza para comparar la calidad de compresión total Esto es principalmente debido a que los datos comprimidos de JPEG2k se calculan al utilizar un algoritmo
de control de velocidad proporcionado por el software. Para algunos casos, los valores de PSNR RGB están un poco alejados uno de otro, especialmente cuando se utiliza la transformación de color JPEG2k La comparación de compresión se realizó como sigue: o Nuevol el Perfil 4.4 4 Avanzado propuesto con un modo de predicción individual, o Nuevo3 el Perfil 4 4.4 Avanzado propuesto con tres modos de predicción RCT-APAGADO: entrada RGB con RCT = apagado. RCT-ENCENDIDO entrada RGB con RCT = encend ido o YCOCG conversión RGB a YCOCG se hizo fuera del codificador/descodificador Después el YCOCG convertido se utilizó como la entrada al software JVT o R + G + B- Método propuesto aproximado al comprimir señales R, G, y B separadamente o Y + CO + CG' Método propuesto aproximado al comprimir las señales Y, CO, y CG convertidas separadamente, o J2k_RGB- La compresión JPEG2k se hizo en el dominio RGB. La transformación de color JPEG2k se apagó. o J2k_YUV La compresión JPEG2k se hizo en el dominio YUV.
Se utilizó la transformación de color JPEG2k. De acuerdo con los resultados de prueba, una implementación de acuerdo con los principios de la presente invención como se configuró en una modalidad, en general, es muy similar a JPEG2k en términos de eficiencia de compresión total. En algunos casos,
incluso es ligeramente mejor Ademas, una implementacion de acuerdo con los principios de la presente invención como se configura en una modalidad, proporciona significativamente mayor desempeño (compresión) que el Perfil 4 4 4 Alto actual para calidad sobre 40 dB (PSNR) Específicamente, el Nuevol-YCOCG o Nuevo3-YCOCG es mejor que YCOCG en RCT-ENCENDIDO, Nuevol-RGB o Nuevo3-RGB es mejor que RCT-APAGADO En un PSNR igual que o mayor que 45 dB (PSNR), la mejora promedio en el PSNR promedio es mayor que 1 5 dB En el ultimo ejemplo la mejora puede traducirse a mayor que 25% de ahorros de bit en un PSNR igual que 45 dB De acuerdo con los resultados de prueba, parece que las transformaciones de color ayudarán al desempeño de codificación cuando el contenido esta mas saturado de color, tal como TP, RT Es decir, si el color es neutral y menos saturado, codificación en el dominio RGB puede ser la elección correcta La observación anterior es independiente de que transformación de color se utiliza Al comparar los resultados del Nuevol-YCOCG o Nuevo3-YCOCG y JPEG-2k_YUV, se observo que el desempeño de una transformación de color específica en términos de mejorar la eficiencia de codificación es muy dependiente de contenido Ninguna transformación de color individual es siempre la mejor Por lo tanto, nuestros datos confirmaron que tener una transformación de color, tal como RCT, dentro del giro de codificación (descodificación) puede no ser una buena idea En vez de eso, realizar la
transformación de color, si es necesario, fuera del codificador/descodificador puede hacer que el sistema de compresión completo proporcione mejor y mayor desempeño Al comparar YCOCG con RCT-ENCENDIDO, los resultados de prueba no muestran ninguna mejora de eficiencia de codificación de RCT, además, se debe notar que correr el software de referencia con el RCT encendido significativamente aumenta el tiempo de codificación El tiempo de funcionamiento no fue mayor que 2 5 veces Ahora se proporcionara una sintaxis de asunto dada y cambios semánticos de acuerdo con los principios de la presente invención como se configura en una modalidad Cambiando a la Figura 12, se indica generalmente una tabla para sintaxis de parámetro de secuencia H 264 por el número de referencia 1200 Los cambios a la sintaxis de acuerdo con los principios de la presente invención como se configuran en una modalidad, se indican en texto itálico Cambiando ahora a la Figura 13, una tabla para sintaxis de datos residuales H 264 se indica generalmente por el número de referencia 1300 Adiciones/ca bios a la sintaxis de acuerdo con los principios de la presente invención como se configura en una modalidad, se indican por texto itálico En la tabla 1300, la sección luma en el encabezado de datos residuales junto con modificaciones de texto necesarias se repiten dos veces para soportar el lumal y luma 2, respectivamente
Como se notó anteriormente, la primera modalidad combinada antes descrita se evaluó y probó al implementar los principios de la presente invención en el software de referencia JVT JM9.6. Los resultados de prueba marcados con Nuevo1-RGB o Nuevol-YCOCG representan la primera modalidad combinada. Como se notó anteriormente, de acuerdo con los principios de la presente invención como se configura en una modalidad, un grupo (o subgrupo) de tres (3) pronosticadores espaciales restringidos se utilizan para los canales de componente (por ejemplo, para formatos RGB, YUB, YCrCb,, y así sucesivamente), en vez de un modo de predicción espacial individual. Además, como se notó anteriormente, esta modalidad puede combinarse con otras modalidades aquí descritas, tal como, por ejemplo, el uso del algoritmo de codificación sólo luma para codificar todos los tres canales de componente de contenido y/o el uso de transformación de color como un paso de pre-procesamiento. Ahora se proporcionará una descripción con respecto a la segunda modalidad combinada que involucra el uso de un grupo (o subgrupo) de tres (3) pronosticadores espaciales restringidos para los componentes de color, el uso sólo del algoritmo de codificación luma para codificar todos los tres componentes de color, y el uso de transformación de color como un paso de pre-procesamiento (es decir, ningún RCT dentro del giro de compresión). Algunas variaciones de esta modalidad también se describirán aquí Cambiando a la Figura 14, un procedimiento de codificación de
video ilustrativo con una pre-codificacion, el paso de transformación de color se indica generalmente por los números de referencia 1400 y 1401, respectivamente Se debe apreciar que la pre-codificacion, bloque de transformación de color 1401 incluye bloques 1406, 1408, y 1410 Ademas, se va apreciar que el bloque de transformación de color 1401 de pre-codificacion es opcional y, de esa forma, puede omitirse en algunas modalidades de la presente invención El bloque de transformación de color 1401 de pre-codificación incluye un bloque de limite de giro 1406 que comienza un giro para cada bloque en una imagen, y pasa control a un bloque de función 1408 El bloque de función 1408 realiza el pre-procesamiento de color de los datos de señal de video del bloque de imagen actual, y pasa control a un bloque de limite de giro 1410 El bloque de límite de giro 1410 termina el giro Ademas, el bloque de límite de giro 1410 pasa control a un bloque de limite de giro 1412, este último se incluye en el procedimiento de codificación de video 1400 El bloque de limite de giro 1412 comienza un giro para cada bloque en la imagen, y pasa control a un bloque de función 1415 El bloque de función 1415 forma un movimiento compensado o predicción espacial del bloque de imagen actual que utiliza un pronosticador común para cada componente de color del bloque de imagen actual, y pasa control al bloque de función 1420 El bloque de función 1420 resta el movimiento compensado o predicción espacial del bloque de imagen actual para formar un residuo de
predicción, y pasa control a un bloque de función 1430. El bloque de función 1430 transforma y cuantifica el residual de predicción, y pasa control a un bloque de función 1430 El bloque de función 1435 transforma y cuantifica el residual de predicción, y pasa control a un bloque de función 1435 El bloque de función 1435 transforma a la inversa y cuantifica el residual de predicción para formar un residual de predicción codificado, y pasa control a un bloque de función 1445 El bloque de función 1445 agrega el residual codificado a la predicción para formar un bloque de imagen codificado, y pasa control a un bloque de giro de extremo 1450 El bloque de giro de extremo 1450 termina el giro y pasa control a un bloque de extremo 1455 Cambiando a la Figura 15, un procedimiento de descodificación de video ilustrativo con una post-descodificación, paso de transformación de color inverso se indica generalmente por los números de referencia 1500 y 1560, respectivamente Se debe apreciar que la post-descodif icación, bloque de transformación de color inverso 1560 incluye bloques 1562, 1564, 1566, y 1568 Ademas, se debe apreciar que la post-descodificación, bloque de transformación de color inverso 1560 es opcional y, de esa forma, puede omitirse en algunas modalidades de la presente invención El procedimiento de descodificación 1500 incluye un bloque de límite de giro 1510 que comienza un giro para un bloque actual en una imagen, y pasa control a un bloque de función 1515 El bloque
de función 1515 descodifica por entropía el residual codificada, y pasa control al bloque de función 1520 El bloque de función 1520 transforma a la inversa y cuantifica el residual descodif icado para formar un residual codificado, y pasa control a un bloque de función 1530 El bloque de función 1530 agrega el residual codificado a la predicción formada de un pronosticador común para cada componente de color para formar un bloque de imagen codificada, y pasa control a un bloque de limite de giro 1535. El bloque de límite de giro 1535 termina el giro y pasa control a un bloque de extremo 1540 En algunas modalidades, el bloque de limite de giro 1535 opcionalmente pasa control a la post-descodificacion, bloque de transformación de color inverso 1560, en particular, el bloque de limite de giro 1562 incluido en la post-descodificación, bloque de transformación de color inverso 1560 El bloque de limite de giro 1562 comienza un giro para cada bloque en una imagen, y pasa control para un bloque de función 1564 El bloque de función 1564 realiza un post-procesamiento de color inverso de los datos de señal de video del bloque de imagen actual, y pasa control al bloque de límite de giro 1566 El bloque de límite de giro 1566 termina el giro, y pasa control a un bloque de extremo 1568 Como se noto anteriormente, se describe un nuevo perfil ( perf i l_?dc= 166) para Perfil 4 4 4 Avanzado Este nuevo perfil también puede utilizarse para la segunda modalidad combinada, con cambios semánticos y de sintaxis correspondientes como se describe
aquí posteriormente para la segunda modalidad combinada Este perfiljdc nuevo se agrega el Grupo de Parámetro de Secuencia y se utilizará principalmente en los encabezados subsecuentes para indicar que el formato de entrada es 4 4 4 y todos los tres canales de entrada se codifican similarmente como luma Para minimizar los cambios necesarios al estándar H 264, no se describe ningún tipo de macrobloque nuevo para el Perfil 444 Avanzado En vez de eso, todos los tipos de macrobloque junto con los parámetros de codificación asociados enlistados en la Tabla 7-11, Tabla 7-13, y Tabla 7-14 del estándar H 264 aún son válidos. Para el caso de macrobloques interiores, todos los tres canales de entrada, luma, Cr, y Cb, se codificarán basándose en el MbPArtePredModo definido en la Tabla 7-11 del estándar H 264 Por ejemplo, un macrobloque Intra_4x4 en el Perfil 444 Avanzado significa que cada canal de componente de entrada puede codificarse al utilizar todos los 9 modos de predicción posibles dada la Tabla 8-2 del estándar H 264 Para referencia, en el Perfil 4 44 Alto actual, dos de los canales para un macrobloque Intra_4x4 se tratarán como croma y solo uno de los 4 modos de predicción internos posibles en la Tabla 8-5 del estándar H 264 se utilizará Para los macrobloques B y P, los cambios hechos para el Perfil Avanzado 4.4.4 ocurren en el procedimiento de interpolación para el cálculo del valor de píxel de referencia en la ubicación de píxel de fracción Aquí, el procedimiento descrito en la Sección 8 4 2 2 1 del estándar H 264, el procedimiento de interpolación de muestra Luma, se aplicará para
luma, Cr, y Cb. De nuevo para referencia, el Perfil 4:4:4 Alto actual utiliza Sección 8 4.2 2 2 del estándar H.264. El procedimiento de interpolación de muestra croma, para dos de los canales de entrada. En el caso cuando el CABAC se elige como el modo de codificación de entropía, dos grupos separados de modelos de contexto idénticos a aquellos actualmente definidos para luma se crearán para Cr y Cb También pueden actualizarse independientemente durante el curso de codificación. Finalmente, en la modalidad, ya que no hay bloque RCT en el giro de codificación, la Marca de Transformación de Color de Residuo se remueve del parámetro de secuencia establecido en el Perfil 4:4:4 Avanzado. Hasta este punto, muchos de los cambios de sintaxis ocurren en los datos de residuo como se muestra en la Figura 13, en donde la sintaxis original para luma se repite dos veces para soportar CR y Cb en los perfiles 4:4:4 Avanzados propuestos. Con respecto a la tabla de capa de macrobloque H 264 (no mostrada), los cambios semánticos a la sintaxis correspondiente incluyen lo siguiente patrón_bloque_cod?f?cado (Agregar). Cuando
¡dc_formato_croma es igual a 3 y está presente patrón_bloque_cod?f?cado, el Croma de Patrón de Bloque Codificado debe establecerse a 0. Además, el Luma de Patrón de Bloque codificado especifica, para cada uno de los doce bloques 8x8 luma, Cb, y Cr del macrobloque, uno de los siguientes casos: (1) Todos los
niveles de coeficiente de transformación de los doce bloques luma 4x4 en el luma 8x8, Cb 8x8 y bloques Cr 8x8 son iguales a cero, (2) Uno o más niveles de coeficiente de transformación de uno o más de los bloques luma 4x4 en el muña 8x8, bloques Cb 8x8, y Cr 8x8 no deben valorarse a cero Ahora se proporcionará una selección de modo de predicción espacial concerniente para los bloques internos de acuerdo con la segunda modalidad combinada (o la única modalidad que se relaciona al uso del grupo (o subgrupo) de los tres pronosticadores espaciales) Para cada componente para elegir su mejor MbPartePredModo y el mejor modo de predicción espacial subsecuente independientemente, como en el caso mientras codifica cada canal de entrada de forma separada, algunos nuevos tipos de bloque interior pueden agregarse a la Tabla 7-11 del estándar H.264. Como resultado, la gran cantidad de cambios al estándar H 264 se hará. En una modalidad que se relaciona con la segunda modalidad combinada, los t?pos_mb actuales permanecen sin cambios y se proporciona una solución alternativa En la modalidad, los tres canales de entrada se restringen para codificarse con el mismo MbPartePredMode o tipo de macrobloque. Después, se agrega una pequeña cantidad de nuevos elementos en la sintaxis de Predicción de Macrobloque para soportar tres modos de predicción separados Por lo tanto, cada componente aún puede elegir teóricamente su mejor modo de predicción espacial independientemente con el fin de
minimizar el error de predicción para cada canal de componente Por ejemplo, se asume que un macrobloque Intra 4x4 se elige como el mbtipo, luma, Cr, o Cb aún pueden encontrar su mejor modo de predicción espacial en la Tabla 8-2 en la Sección 8 3 1 1 del estándar H 264 tal como, por ejemplo, lntra_4x4_Vert?cal para luma, lntra_4_4_Hor?zontal para Cr, e lntra_4x4_D?agonal_Abajo_lzqu?erda para Cb Otro acercamiento, que se relaciona con la primera modalidad combinada descrita anteriormente, es para limitar, todos los tres canales de entrada para compartir el mismo modo de predicción Esto puede hacerse al utilizar la información de predicción que actualmente se transporta por los elementos de sintáis existentes, tal como prev_?ntra4x4_pre_modo_marca, rem_?ntra4x4_pred_modo, prejntra8x8_pred_modo_marca, y rem_?ntradx8_pred_modo, en la sintaxis de Predicción de Macrobloque Esta opción resultará en menos cambio al estándar H 264 y alguna pérdida ligera de la eficiencia de codificación también Basándose en los resultados de prueba, utilizar tres modos de predicción puede mejorar el desempeño de codificación total por aproximadamente 0 2 dB sobre la primera modalidad combinada Cambiando a la Figura 16, una tabla para una sintaxis de predicción de macrobloque H 264 se indica generalmente por el número de referencia 1700 Para referencia, la Sintaxis de Predicción de Macrobloque para soportar el uso de tres modos de predicción se enlista posteriormente, en donde
prev_?ntra4x4_pred_modo_marca0 y rem_?ntra4x4_pred_modo0 son para luma, prev_jntra4x4_pred_modo_marca1 y rem_?ntra4x4_pred_modo1 son para Cr, prev_?ntra4x4_pred_modT_marca2 y rem_?ntra4x4_pred_modo2 son para Cb, Una descripción ahora se proporcionará son respecto a resultados se simulación realizados de acuerdo con los principios de la presente invención como configurados en una modalidad, para la segunda modalidad combinada Todas las secuencias de prueba JVT/FRExt descritas en JVT-J042, Secuencia de Prueba Originada de Película, JVT-J039 (Viper) Todos son materiales de 10 bits 44 4 y cada clip tiene 58 marcos El algoritmo propuesto se implemento en el software de Referencia JM9 6 y el software modificado se utilizo en las pruebas Tanto solamente interno y IBRrBP se probaron Aquí "Br" significa las imágenes B grabadas El caso solo interior se hizo para todas las secuencias con el parámetro de cuantificacion igual a 6, 12, 18, 24, 30, 36 y 42 Debido a la gran cantidad de tiempo involucrado en la simulación, la estructura GOP IBRrBP sólo se hizo para los clips de película con un parámetro de cuantificacion igual a 12, 18, 24, 30 y 36 De acuerdo con la discusión en el AHG 4 4 4, se utilizaron los siguientes parámetros clave en las pruebas- Modo de Símbolo = 1 Opt?m?zac?on RD = 1
Marca de Presentación de Matriz de Clasificación = 0 Marca de Presentación de Matriz Equivalente = 1 Archivo de Matriz eq ui valenteQ = "q_equ?valente cfg" Aleatorio Adaptable = 1 Periodo Rnd de Adaptación = 1 Croma Rnd de Adaptac?on= 1 Factor X RndW de Adaptación = 8 Escala de Búsqueda = 64 Usar FME = 1 Con respecto a JPEG2k se utilizo software KaKadu V2 2 3 en las pruebas Los resultados de prueba se generaron al utilizar 5 niveles de descompresión de onda pequeña con el filtro de onda pequeña bi-ortogonal de tapa9/7 Solo hubo un mosaico por marco y también se utilizo la Optimizacion RD para una velocidad de objetivo dado Las medidas de PSNR se calcularon principalmente en el dominio de color original de los contenidos de fuente que es RGB para clips descritos anteriormente El PSNR promedio, definido como
(PSNR(rojo) + PSNR(verde) + PSNR(azul))/3, se utilizo para comparar la calidad de compresión total La comparación de compresión se realizo como sigue Nuevol el perfil 4 44 Avanzado con un modo de predicción individual Nuevo3 el perfil 4 4 4 Avanzado propuesto con tres modos de predicción
RCT-APAGADO entrada de RGB con RCT = apagado RCT-ENCENDIDO entrada de RGB con RCT = encend?do YCOCG conversión RGB a YCOCG se realizó fuera del codificador/descodificador Después el YCOCG convertido se utilizó como la entrada al software JVT R + G + B método propuesto aproximado al comprimir las señales R, G, y B separadamente Y + CO + CG método propuesto aproximado al comprimir las señales Y, CO, y CG separadamente JPEG2k_RGB la compresión de JPEG2k se hizo en el dominio
RGB La transformación de color JPEG2k se apagó JPEG2k_YUV La compresión de JPEG2k se hizo en el dominio YL)V Se utilizó la transformación de color de JPEG2k Para el caso solo Interior, el Perfil 44 4 Avanzado de acuerdo con los presentes principios es muy similar a JPEG2k en términos de eficiencia de compresión En algunos casos, incluso es un poco mejor El acercamiento de acuerdo con los principios de la presente invención, es claramente mejor que el Perfil 444 Alto En un PSNR igual a o mayor que 45 dB (PSNR), la mejora promedio en el PSNR promedio es mas que 1 5 dB En algunos casos, la mejora puede traducirse a mas de 25% de ahorros de bit en un PSNR igual que 45 dB Incluso con el mismo tipo de bloque, utilizar tres modos de predicción es ligeramente mejor que uno individual. Sin embargo,
pueden utilizarse más sintaxis y cambios semánticos. Ahora se proporcionara una descripción de algunas de las muchas ventajas/características proporcionadas por los principios de las modalidades de la presente invención. Los resultados de prueba demuestran que el Perfil 4:4:4
Avanzado, que utiliza las mejoras correspondientes a los principios de la presente invención, entrega desempeño mejorado cuando se compara con el Perfil 4:4:4 Alto. La ganancia de desempeño es significativa. Además, mover la transformación de color fuera del codificador/descodificador hará a la arquitectura del codificador/descodificador consistente entre todos los formatos de color. Como un resultado, hará la ¡mplementación más fácil y reducirá los costos. También hará al codificador/descodificador más voluminoso en términos de seleccionar la transformación de color óptimo para lograr mejor eficiencia de codificación. También, el acercamiento propuesto o agrega ninguna de las herramientas de codificación nuevas y requiere sólo algunos cambios ligeros a la sintaxis y semánticas. De esa forma de acuerdo con los principios de la presente invención como se configura en una modalidad, se proporciona un método y aparato para codificar/descodificar video. Las modificaciones al estándar H.264 existente se proporcionar y mejoran el desempeño más allá de lo actualmente disponible. Además, el desempeño se mejora más allá de JPEG-200 para aplicaciones de alta calidad. De acuerdo con los principios de la
presente invención cuando se configura en una modalidad, las mejoras de desempeño de codificación 4:4:4 significativas en el estándar H.264 pueden lograrse al utilizar el algoritmo de codificación luma para codificar todos los tres componentes de color de contenido 4:4:4. Es decir, no se necesitan nuevas herramientas para el algoritmo de compresión de luma (o croma, que no se utiliza). En vez de eso, se utilizan las herramientas de codificación de luma existentes. Además, pueden implementarse cambios de sintaxis y semánticos al perfil 4:4:4 actual de acuerdo con los presentes principios para soportar la codificación luma de todos los tres canales de componente. En pruebas conducidas de acuerdo con una modalidad de la presente invención, cuando el contenido de fuente tiene muchas texturas y bordes espaciales, las herramientas de predicción espacial utilizadas en luma claramente exhiben su desempeño superior a aquellas utilizadas en croma. Para algunas de las secuencias de prueba, cuando se codifica cada componente de color como luma, más de 30% de reducción de bit se observó en una calidad comprimida mayor que o igual a 45dB (PSNR Promedio). Se debe apreciar que mientras la presente invención se describió aquí principalmente con respecto a datos de señal de video muestreados que utilizan el formato 4:4:4 del estándar H.264, la presente invención también puede implementarse fácilmente con respecto a los datos de señal de video muestreados al utilizar otros formatos (por ejemplo, el formato 4:2:0 y/o el formato 4:2:2) del estándar H.264, así como otros estándares de compresión. Dadas las
enseñanzas de la presente invención aquí proporcionadas, estas y otras variaciones de la presente invención también pueden implementarse fácilmente por un experto en la técnica y técnicas relacionadas, mientras mantiene el alcance de la presente invención Estas y otras características y ventajas de la presente invención pueden valorarse fácilmente por un experto en la técnica pertinente basándose en las enseñanzas aquí Se debe entender que las enseñanzas de la presente invención pueden implementarse en vanas formas de hardware, software, firmware, procesadores de proposito especial, o combinaciones de los mismos Muy preferiblemente, las enseñanzas de la presente invención se implementan como combinación de hardware y software Además el software puede implementarse como un programa de aplicación tangiblemente representado en una unidad de almacenamiento de programa El programa de aplicación puede cargarse a, ejecutarse por, una máquina que comprende cualquier arquitectura adecuada Preferiblemente, la maquina se implementa en una plataforma de computadora que tiene hardware tal como una o más unidades de procesamiento central ('CPU ), una memoria de acceso aleatorio ("RAM"), e infernases de entrada/salida ("l/O") La plataforma de computadora también puede incluir un sistema operativo y código de microinstruccion Los vanos procedimientos y funciones aquí descritas pueden ser parte del código de microinstrucción o parte del programa de aplicación, o cualquier combinación de los mismos, que se ejecutan por una CPU Ademas, pueden conectarse vanas otras
unidades periféricas a la plataforma de computadora tal como una unidad de almacenamiento de datos adicionales y una unidad de impresión Ademas se debe entender que, debido a que algunos componentes de sistema constituyente y métodos ilustrados en los dibujos acompañantes preferiblemente se implementan en software, las conexiones reales entre los componentes de sistema o los bloques de función de procedimiento pueden diferir dependiendo de la forma en la cual se programa la presente invención Dado las enseñanzas aquí, un experto en la técnica pertinente será capas de contemplar estar e implementaciones o configuraciones similares de la presente invención Aunque las modalidades ilustrativas se describieron aquí con referencia a los dibujos anexos, se debe entender que la presente invención no esta limitada a esas modalidades precisas, y que pueden realizarse vanos cambios y modificaciones a la misma por un experto en la técnica pertinente sin apartarse del alcance y espíritu de la presente invención Todos tales cambios y modificaciones pretenden estar incluidos dentro del alcance de la presente invención como se menciona en las reivindicaciones anexas