PT1449383E

PT1449383E - Compensaão global de movimento para imagens de vdeo

Info

Publication number: PT1449383E
Application number: PT02789126T
Authority: PT
Inventors: Rickard Sjiberg; Torbjirn Einarsson; Per Frijdh
Original assignee: Ericsson Telefon Ab L M
Priority date: 2001-11-30
Filing date: 2002-11-29
Publication date: 2010-07-15
Also published as: CN1633812A; BR0214328A; CA2467496A1; DK1449383T3; US20030123738A1; JP4440640B2; EP1449383B1; AU2002353749B2; WO2003047268A3; KR100984612B1; CY1110811T1; CA2467496C; JP2005510983A; CN100380973C; BRPI0214328B1; KR20040062660A; RU2004119839A; WO2003047268A2; ZA200403131B; RU2307478C2

Description

ΕΡ 1 449 383/PT DESCRIÇÃO "Compensação global de movimento para imagens de vídeo"

ANTECEDENTES DO INVENTO 0 invento descrito e reivindicado aqui pertence geralmente a um método para a compressão de dados de sinal de video. Mais particularmente, o invento pertence a um método do tipo acima, o qual emprega a compensação global de movimento. Ainda mais particularmente, algumas concretizações do invento pertencem a um método do tipo acima em que os macroblocos são agrupados em lâminas e a informação de compensação global de movimento é transmitida com lâminas codificadas.

Prevê-se que as concretizações do invento possam ser utilizada em ligação com descodificadores de televisão de sinais de TV digital de alta definição (HDTV) e de definição normalizada (SDTV), como parte de sistemas de videoconferência e em computadores, incluindo PC, laptops e semelhantes para descodificação de vídeo. As concretizações também podiam ser também utilizadas em dispositivos móveis, tais como telefones móveis e PDA, como parte de um descodificador num projector de cinema digital, e em sistemas de gravadores de vídeo de reprodutores e de entretenimento doméstico. No entanto, não se pretende a limitar o invento tais concretizações.

Os sinais de vídeo digitais, de forma não comprimida, contêm em geral grandes quantidades de dados. No entanto, o conteúdo de informação real necessária é consideravelmente mais pequena, devido às altas correlações temporais e espaciais. Por conseguinte, a compressão de vídeo, ou a codificação, é utilizada para reduzir a quantidade dos dados que é efectivamente requerida para certas tarefas, tais como o armazenamento dos sinais de vídeo ou para transmitir os mesmos de uma localização para outra. No processo de codificação pode ser utilizada redundância temporal, fazendo as denominadas previsões com compensação de movimento, em que as regiões de um quadro de vídeo são previstas a partir de regiões semelhantes de um quadro anterior. Isto é, podem 2 ΕΡ 1 449 383/ΡΤ existir partes de um quadro que contêm pouca ou nenhuma alteração das partes correspondentes do quadro anterior. Tais regiões podem, portanto, ser ignoradas ou não codificadas, a fim de maximizar a eficiência de compressão. Por outro lado, se não poder ser encontrada uma boa coincidência com um quadro anterior, as previsões dentro de um quadro podem ser utilizadas para reduzir a redundância espacial. Com um sistema de previsão com sucesso, o erro de previsão será pequeno e a quantidade de informação que tem de ser codificado bastante reduzida. Além disso, pela transformação os pixéis para um domínio da frequência, por exemplo, utilizando a transformada de cosseno discreta, as correlações espaciais proporcionam ganhos de eficiência adicionais.

Aqui, os termos "imagem" e "quadro" são utilizados indiferentemente para referir a um quadro de dados de imagem numa sequência de vídeo.

As altas correlações temporais são características do vídeo. Portanto, muitos esforços de optimização da compressão de vídeo são focados na realização de previsões temporais precisas das regiões de um quadro. Quanto melhor for a previsão, menos são os bits necessários para codificar a discrepância. A própria previsão é codificada como instruções de como traduzir, ou mesmo colocar à escala ou rodar, uma região previamente codificada. Se muitas regiões de um quadro tiverem movimento semelhante, como numa ampliação zonal ("pan") ou zoom, podem resultar melhorias na eficiência de compressão da codificação separada de um movimento global, o qual se aplica então a todas ou algumas regiões do quadro. Esta técnica é frequentemente referida como a compensação global de movimento (GMC).

Existem várias razões, no entanto, pelas quais não se deve tratar todo o quadro quando é utilizada a compensação global de movimento. A primeira razão é a resiliência dos erros. A fim de evitar a propagação dos erros a partir das partes corrompidas de uma imagem, a previsão é frequentemente constrangida no interior de segmentos limitados denominados lâminas. Cada lâmina de um quadro deve, por conseguinte, ser auto-suficiente em relação à informação global de movimento. Uma outra razão é que a compensação global de movimento pode 3

ΕΡ 1 449 383/PT não ser relevante para um quadro completo, mesmo que pequenas partes do quadro possam beneficiar da compensação global de movimento aplicada a cada parte separadamente.

Ainda a codificação de imagem em função da compensação de movimento

Um típico codificador/descodificador (codec) de video, tal como as recomendações H.261 e H.263 de ITU-T, MPEG-1 parte 2, MPEG-2 parte 2 (H.262), ou MPEG-4 parte 2, opera codificando sequencialmente uma sequência de vídeo quadro a quadro. A estrutura é ainda dividida em blocos que são codificados sequencialmente linha por linha, começando no canto esquerdo de topo e terminando no canto direito de fundo. Um tamanho de bloco típico é o de um macrobloco (MB), que cobre 16x16 pixéis de luminância. 0 primeiro quadro na sequência é codificado como uma imagem estática, denominada intra-quadro. Um tal quadro é autónomo e não depende dos quadros codificados anteriormente. No entanto, os mesmos não são utilizados apenas no início da sequência, mas podem também ser utilizados com vantagem nos casos em que o vídeo muda de forma abrupta, tal como os cortes de cena, ou onde é desejável ter um ponto de acesso aleatório, a partir do qual um descodificador pode iniciar a descodificação sem ter de descodificar a parte anterior do corrente de bits. Os valores de pixel de macroblocos intra-codificados são usualmente transformados num domínio de frequências, que utiliza, por exemplo, a transformada discreta de co-senos e os coeficientes de transformada quantificados, a fim de reduzir o tamanho da corrente de bits resultante.

Pelo contrário, um intra-quadro é codificado como uma imagem de diferença com compensação de movimento em relação a um quadro anterior. Pela utilização de um quadro já descodificado (quadro reconstruído) como referência, o codificador de vídeo pode sinalizar para cada macrobloco um conjunto de vectores de movimento (MVS) e os coeficientes. Os vectores de movimento (um ou vários dependentes de como o macrobloco é partido) informam o descodificador de como traduzir espacialmente as regiões correspondentes do quadro 4

ΕΡ 1 449 383/PT de referência a fim de fazer uma previsão para o macrobloco em consideração. Isso é referido como a compensação de movimento. A diferença entre a previsão e o original é codificada em termos de coeficientes de transformação. No entanto, nem todos os macroblocos de um intra-quadro necessitam de serem compensados em movimento. Se a mudança do macrobloco de referência para o macrobloco de corrente for pequena, o macrobloco pode ser codificado no modo de COPY, ou seja, em si mesmo não codificado, mas sinalizado para ser copiado. Ver a secção 5.3.1 de as recomendações H.263 de ITU-T "Coded macroblock indication (Indicação de macrobloco codificada) (COD) (1 bit)" para um exemplo de uma implementação do modo de COPY. Por outro lado, se os macroblocos diferirem substancialmente, pode ser melhor codificar o mesmo como um intra-macrobloco.

Compensação global de movimento em H.263

Em vez de tratar a compensação de movimento apenas numa base de bloco, pode ser vantajoso extrair o movimento global de um quadro separadamente e codificar os desvios a partir do movimento global para cada bloco. Numa sequência de passagem ou de zoom, ou quando um grande objecto se move através do quadro, o informação global de movimento é provavelmente mantida num mínimo por um tal esquema. Uma técnica bem conhecida é adicionar um passo adicional no processo de codificação antes de ser codificado um intra-quadro. 0 anexo P "Nova amostragem da imagem de referência" de H.263 proporciona um método para "distorcer" a imagem de referência dada pelos quatro vectores deslocamento v00, vH0, vov e vHV, que especificam os deslocamentos dos pixéis de canto de um quadro. A FIG. 1 mostra um quadro de referência, com estes vectores, que se prolongam, respectivamente, dos pixéis de canto 8. Os deslocamentos de todos os outros pixéis são dados por uma interpolação bilinear destes vectores, que é: v(x,y) = i +

f V

Ec d: 5 ΕΡ 1 449 383/ΡΤ onde (χ, y) é a localização inicial de um pixel, H e V representam as localizações dos pixéis de canto no quadro de referência, e r° = rx = ry _ rxy = v00 VH° vov = v00 - v00 - v00 - vH0 - vov + vHV Para uma descrição pormenorizada fórmulas pode ser feita referência à

Quando esta compensação global de movimento é utilizada para um quadro subsequente ou intra-quadro, o referencial é amostrado de novo, pixel por pixel, utilizando a interpolação acima. Após a nova amostragem ter sido executada, o codificador pode continuar com a codificação do intra-quadro, com base no quadro de referência amostrado de novo.

Compensação global de movimento na parte 2 de MPEG-4 A compensação global de movimento é também especificada na norma visual MPEG-4 que utiliza os denominados S(GMC)-VOP. Aqui, a compensação global de movimento é aplicada pixel por pixel como para o anexo P de H.263. No entanto, pode ser ainda escolhido num nível de macrobloco se o quadro de referência de movimento global compensado (interpolado) quadro dever ser ou não utilizado.

Compensação global de movimento proposta para H.26L 0 ITU-T está actualmente a desenvolver uma nova norma de codificação de vídeo, a recomendação H.26L, a qual é também provavelmente para ser publicada em conjunto como uma norma internacional pela ISO/IEC denominada MPEG-4 AVC (ISO/IEC 14496-10). A H.26L corrente segue a norma geral atrás mencionada de concepção de codificação de vídeo com quadros e macroblocos, em que cada imagem é codificada por um cabeçalho de imagem seguido por macroblocos. Esta norma é explicada em seguida, em ligação com FIGS. 8 e 9.

Uma desvantagem significativa na utilização da compensação global de movimento para um quadro de vídeo é a 6 ΕΡ 1 449 383/ΡΤ perda de resistência e flexibilidade de erros provocadas pelo tratamento dos quadros completos. Assim, se os vectores globais de movimento forem codificadas apenas uma vez para uma imagem, por exemplo, no início da imagem e esta parte da corrente de bits for perdida durante a transmissão, toda a imagem vai provavelmente ser corrompida. Por conseguinte, os vectores de movimento para os blocos através de toda a imagem não podem ser descodificados e devem ser ocultados. Tais erros podem-se também propagar no tempo, uma vez que a próxima imagem pode ser também uma intra-imagem, utilizando assim uma imagem corrompida como referência. Um outro problema, no que se refere, mais especificamente, à concepção de codificação de vectores global de movimento proposta (GMVC) para a norma H.26L, é que não podem ser especificados os diferentes movimentos globais para as partes de um quadro.

Em WO 00/70879 é descrito um método para codificação de vídeo digital para as normas MPEG que utiliza um dispositivo de estima adpativo

SUMÁRIO DO INVENTO

Como um benefício adicional, o invento apresenta um novo modo de compensação global de movimento, conhecido como a compensação global de movimento implícita (IGMC). Este modo pode ser utilizado como uma ferramenta em muitos cenários codificação que requerem um modo MB mais útil do que o modo de COPY, a fim de minimizar o número total de bits necessários para os vectores de movimento. No modo de COPY do vector de movimento é sempre zero. Pelo contrário, o IGMC utiliza vectores de movimento implícitos que estão previstos. O invento pode estar dirigido a um método de compressão de dados de vídeo para utilização com blocos de imagens, derivados pela divisão de um quadro de vídeo numa sequência de blocos. Numa concretização preferida, os blocos são macroblocos compreendendo 16x16 pixéis (luminância) e em que um diversos modos possíveis de codificação de macroblocos é um modo de compensação global de movimento implícita (IGMC). Este modo é utilizado para copiar os pixéis a partir de uma imagem anterior de um bloco disposto, deslocado por um vector 7

ΕΡ 1 449 383/PT de movimento que está previsto a partir de blocos de imagens vizinhos do quadro corrente.

DESCRIÇÃO RESUMIDA DOS DESENHOS A FIG. 1 é um diagrama esquemático que ilustra a compensação global de movimento de um quadro de acordo com a norma de compressão de vídeo H.263. A FIG. 2 é um diagrama esquemático que mostra um sistema simplificado para a compressão, transmissão e descodificação de informação de vídeo de acordo com as concretizações do invento. A FIG. 3 é um diagrama de blocos que mostram os componentes certos para o compressor do sistema, mostrado na FIG. 2. A FIG. 4 é um esquema que ilustra a divisão de um quadro de uma sequência de vídeo em lâminas, que compreendem, respectivamente, macroblocos. A FIG. 5 é um diagrama esquemático que ilustra os vectores de movimento, associados aos respectivos blocos de pixéis de um macrobloco.

As FIGS. 6 e 7 são diagramas esquemáticos mostrando cada uma lâmina, que compreende uma sequência de macroblocos para ilustração das concretizações do invento. A FIG. 8 é um diagrama esquemático que representa a sintaxe da corrente de bits da concepção H.26L nos níveis de imagens e de macroblocos. A FIG. 9 é um diagrama esquemático que representa a compensação global de movimento proposta em H.26L nos níveis de imagens e de macroblocos. A FIG. 10 é um diagrama esquemático que mostra uma lâmina que compreende 4x4 macroblocos para ilustração das concretizações do invento que pertencem à norma de compressão de vídeo H.26L. 8 ΕΡ 1 449 383/ΡΤ

DESCRIÇÃO DETALHADA DAS CONCRETIZAÇÕES PREFERIDAS

Referindo a FIG. 2, é mostrada uma fonte 10 de informação de vídeo, tal como uma câmara de vídeo. A informação, que compreende uma sucessão de quadros de vídeo, é acoplada a um codificador ou compressor de vídeo 12, que comprime os quadros sucessivos de dados de acordo com uma concretização de um invento, como descrito aqui. Uma corrente de bits que representa os dados comprimidos é transmitida através de um canal de comunicações 22, o qual pode ser um canal de comunicações sem fios, a partir de um transmissor 14 para um receptor 16. Os dados recebidos são aplicados a um descodificador de 18 para recuperar a informação de vídeo.

Referindo a FIG. 3, são mostrados certos componentes convencionais de um compressor 12 para processamento de um macrobloco de 16x16 pixéis 20, derivados pela divisão de um quadro numa sequência de quadros de vídeo, tal como é mostrado na FIG. 4. Os componentes mostrados na FIG. 3 incluem um módulo de transformada, tal como um módulo de transformada discreta de Fourier 24, um quantificador 26 e um codificador binário 28.

Como é sabido na arte, o módulo de transformada 24 recebe uma matriz de números inteiros, que compreende os respectivos níveis de escala de cinzentos (luminância) e níveis de cor (crominância) dos pixéis de macrobloco 20. O módulo 24 aplica a transformada aos níveis de pixéis para gerar uma matriz de saída dos coeficientes de transformada. Como é de igual modo sabido, quantificador 26 divide cada coeficiente de transformada por um correspondente tamanho de passo ou nível quantificação. A saída do quantificador 26 é dirigida para o codificador binário 28, o qual gera uma correspondente corrente dos bits digitais 30 para a transmissão através do canal 22.

Referindo agora a FIG. 4, é mostrado um quadro 32, que compreende um dos quadros numa sequência de vídeo 34. A FIG. 4 mostra ainda o quadro 32 dividido num número de lâminas de 36a a 36d, onde cada lâmina 36a a 36d compreende por uma sequência de macroblocos 38. Cada macrobloco compreende uma 9 ΕΡ 1 449 383/ΡΤ matriz de pixéis vindos do quadro 32. Como descrito aqui a seguir em pormenor, uma lâmina 36 pode conter informação de GMC pertencente aos seus macroblocos 38 e/ou ao quadro 32, de acordo com as concretizações do invento. A FIG. 4 mostra também lâmina 36a mais em pormenor, para enfatizar que um limite de lâmina pode aparecer após qualquer macrobloco de um quadro. A lâmina 36b é mostrada de modo a incluir os macroblocos localizados em diversas filas 37 do quadro. Para além disso, a lâmina 36b tem inicio a uns poucos macroblocos do limite de quadro esquerdo da lâmina e termina a uns poucos macroblocos antes do limite do quadro direito na última fila da lâmina. Assim, algumas lâminas farão a ponte através de mais do que uma fila 37, e uma fila 37 pode conter mais do que uma lâmina, tal como a fila de fundo com lâminas de 36c e 36d.

Referindo a FIG. 5, os blocos de pixéis 40a' a 40d' de um quadro anterior são utilizados para fazer a previsão dos blocos 40a a 40d do quadro corrente. Os vectores de movimento 42a a 42d fazem a descrição da localização a partir da qual os pixéis vindos do primeiro quadro devem ser copiados para os blocos 40a a 40d do quadro corrente. Isto ilustra que os blocos de pixéis 40a a 40d pode ser facilmente determinados ou reconstruídos pela utilização de um quadro anteriormente descodificado, em conjunto com os vectores de movimento 42a a 42d.

Referindo a FIG. 6, na mesma é mostrada uma lâmina codificada 40 gerada pela codificação de uma lâmina 36b mostrada na FIG. 4. A lâmina codificada 40 compreende macroblocos ou blocos de imagens 42, e está provida com um cabeçalho 44. Numa concretização do invento, um sinal é aplicado a lâmina codificada 40, por exemplo, pela inclusão do sinal no cabeçalho 44, para indicar se ou não a compensação global de movimento (GMC) vai ser utilizada na reconstrução da correspondente lâmina original 36. Se a GMC é para ser utilizada na construção da lâmina, o cabeçalho 44 inclui também informações GMC. Tal informação de GMC útil compreende ou representa a informação do vector de movimento a partir do qual os vectores de movimento para cada um dos blocos 42 da lâmina 40 podem ser reconstruídos no 10

ΕΡ 1 449 3 83/PT descodificador. Assim, todos os vectores de movimento na lâmina 40 podem ser derivados exclusivamente a partir da informação contida na lâmina 40.

Numa outra concretização útil, todas as lâminas 40 codificadas a partir de respectivas lâminas 36 do quadro de video 32, referido acima, contêm a mesma informação de GMC. Por exemplo, a informação de GMC pode compreender um conjunto codificado de vectores GM r° rx, ry e rxy acima descritos em ligação com a FIG. 1. Estes vectores são referenciados em todo o quadro de video distorcido, como mostrado na FIG. 1, e são derivados a partir dos vectores deslocamento de pixéis de canto mostrados no mesmo de acordo com as relações acima descritas. A resiliência é significativamente aumentada, pela repetição desta informação em cada lâmina codificada uma vez que a informação deve alcançar o descodificador, mesmo que algumas das lâminas se tivessem perdido no canal de transmissão. Os vectores de GM codificados poderiam ser utilizados com a interpolação bilinear, de acordo com a equação (1) estabelecida atrás, para calcular a compensação global de movimento para cada pixel contido na lâmina 40.

Numa concretização adicional, cada lâmina codificada 40 deve ter informação de GMC que compreende os vectores globais de movimento r°, rx, ry, e rxy, em que os vectores são referenciados em relação à caixa delimitadora da lâmina em vez de em relação a todo o quadro. Referindo ainda a FIG. 6, na mesma é mostrada a caixa delimitadora 46 da lâmina 40 que compreende o rectângulo mais pequeno que pode conter a lâmina. A FIG. 6 mostra os pixéis de canto 46a a 46d nos respectivos cantos da caixa delimitadora 46, especificando, neste caso, os vectores v00, vH0, vov e vHV o deslocamento dos respectivos pixéis de canto da caixa delimitadora, em vez do quadro completo. Os quatro vectores r°, rx, ry e rxy podem ser determinados a partir dos vectores de pixéis de canto por meio das mesmas relações estabelecidas atrás em ligação com H.263 para deslocamento de pixéis de canto de um quadro completo. A partir dos quatro vectores codificados para a delimitação 46, a compensação global de movimento para cada pixel contido na lâmina 40 pode ser facilmente calculado utilizando a interpolação bilinear, de acordo com a equação (1). Será facilmente evidente que nesta concretização, que as 11

ΕΡ 1 449 383/PT diferentes lâminas codificadas 40 conterão informação de GMC diferente.

Referindo a FIG. 7, na mesma é de novo mostrada lâmina codificada 40 com a caixa delimitadora 46. No entanto, são apenas mostrados dois vectores globais de movimento 48a e 48b, que são codificadas como informação de GMC para a lâmina 40. Estes vectores referem-se aos pixéis mais à esquerda e mais à direita, respectivamente, caixa delimitadora 46. A compensação global de movimento para os respectivos pixéis da lâmina 40 pode ser determinada da mesma. Para os pixéis ao longo de um eixo vertical, os vectores globais de movimento são os mesmos, enquanto que ao longo de um eixo horizontal são interpolados linearmente a partir de dois vectores globais de movimento codificados 48a e 48b.

Numa concretização adicional, toda a informação de GMC numa lâmina pode ser repetida no nível de imagem ou de quadro, tal como no cabeçalho do quadro 32.

Referindo a FIG. 8, na mesma é mostrada a sintaxe da corrente de bits da norma H.26L nos níveis de imagens e de macrobloco. Em H.26L os macroblocos de um intra-quadro têm um dos diversos modos, os quais incluem actualmente 7 intra-modos (16x16, 16x8, 8x16, 8x8, 8x4, 4x8 e 4x4), um intra-modo para 4x4 e 23 intra-modos para 16x16. Aqui NxM refere-se ao tamanho dos blocos em que o macrobloco é dividido. Para os intra-MB, cada bloco tem um MV e os intra-MB, cada bloco é previsto como uma unidade. Além disso, existe um modo de COPY, que não utiliza os coeficientes de MV. Este é o modo mais barato para o sinal. Na verdade, é utilizada a codificação que corre o comprimento para sinalizar um número de cópia macroblocos (ignorados) com uma palavra-chave. A compensação global de movimento tem sido proposta para a norma H.26L. A mesma assemelha-se à GMC utilizada no anexo P de H.263 no modo que são definidos os vectores globais de movimento. A principal diferença, no entanto, é que a imagem de referência não é amostrada de novo e que os vectores de movimento interpolados não se aplicam aos pixéis, mas em vez disso aos blocos de pixéis. O vector de movimento de um bloco 12

ΕΡ 1 449 383/PT de imagens com o seu pixel superior esquerdo como (xy) pode ser derivado como 12 ΕΡ 1 449 383/PT v(x,y) = r + H-4, r + y {V-4. ry + H-4 V-4, ,*y

Eq, (2) onde r°, rx, rv e rxy estão relacionados com os v00, vH0, vov e v™ como para o anexo P de H.263. No entanto, estes vectores de movimento aplicam a blocos de imagens composto de 4x4 pixéis. Em particular, os vectores. v00, v110, vov e vHV aplicam aos blocos de canto do quadro com os seus pixéis superiores esquerdos em (0,0), (H-4.0), (0, V-4) e (H-4, V-4), respectivamente. E proposta a codificação de vectores globais de movimento (GMVC) para H.26L para ser aplicada apenas a determinados modos de macrobloco da imagem. Se o mesmo é ou não utilizado é assinalado para cada intra-quadro no cabeçalho da imagem de uma bandeira (bandeira GMVC). Se a GMVC estiver ligada os quatro GMV r°, rx, rv e rxy seguem a bandeira. Estes são utilizados para a imagem corrente, sempre que um modo de utilização de GMVC é assinalado num macrobloco. A sintaxe proposta é mostrada na FIG. 9.

Os modos de macrobloco para os macroblocos num quadro com a GMVC permitida ter dois novos modos. O modo de COPY é substituído por GMVC_COPY e não há um modo adicional denominado GMVC_16. Ambos os modos são intra-modos 4x4, i. e. o macrobloco é dividido em blocos de imagens de 4x4 pixéis. Os vectores de movimento para cada bloco são dados pelos GMV interpolados, como dados pela fórmula atrás. Para GMVC_COPY OS coeficientes não são codificados, isto é, a imagem de referência com compensação de movimento é copiada, enquanto que para GMVC_16, os coeficientes são também adicionados.

Referindo a FIG. 10, na mesma é mostrada uma lâmina codificada 50 que compreende os macroblocos 52, em que cada macrobloco 52 é dividido em blocos de imagens de 4x4 54, de acordo com a norma H.26L. Na FIG. 10, os vectores de GM interpolados são aplicados aos blocos 4x4 54 em vez de aos pixéis. Referindo ainda a FIG. 10, na mesma são mostrados os blocos de canto 54a a 54d que têm associados os vectores 13

ΕΡ 1 449 383/PT globais de movimento 56a a 56d, que especificam os seus deslocamentos. Os blocos de canto 54a a 54d definem os cantos de uma caixa delimitadora rectangular 58 que contém a lâmina 50. Os vectores de movimento 56 a 56d são representados pela informação de GMC contida no cabeçalho 60 da lâmina 50. A partir da informação pertencente aos vectores de GM 56 a 56d, pode ser calculada a compensação global de movimento para cada um dos 54 blocos de 4x4 da lâmina 50, por meio de interpolação linear, de acordo com a equação (2) atrás.

Numa concretização adicional, a compensação global de movimento para cada um dos blocos da imagem 54 pode ser calculada a partir de dois vectores de GM codificados (não mostrados), que especificam o deslocamento dos blocos 4x4 mais à esquerda e mais à direita contidos no interior da caixa delimitadora 58. Ainda numa outra concretização, a compensação global de movimento para cada bloco 54 pode ser derivada de um único vector de GM codificado que compreende a informação de GMC contida no cabeçalho 60.

Numa outra concretização, em que uma lâmina GMC é permitida em GMC, i. e. contém um sinal que indica a informação de GMC, a informação compreende um sinal de modo COPY. Em resposta a este sinal em relação a um macrobloco particular da lâmina, o codificador copiará o macrobloco correspondente a partir da imagem de referência com compensação global de movimento, isto é, a partir do quadro distorcido, como mostrado na FIG. 1. Nesta concretização os coeficientes, que pertencem ao macrobloco, podem ou não podem ser também codificados.

Numa concretização de acordo com o presente invento se refere a como a compensação global de movimento implícita (IGMC) não explícita no vector de movimento é enviada com a lâmina codificada 40. Em vez disso, o modo COPY de macroblocos (aka SKIP) é interpretado de novo como um modo de intra-macroblocos sem coeficientes ou vectores de movimento explicitamente codificados. O vector de movimento utilizado para compensar o movimento macrobloco é previsto a partir dos blocos vizinhos. Mais especificamente, na aplicação desta concretização a um bloco de imagens particular no quadro corrente, um bloco disposto num quadro anterior, deslocado 14 ΕΡ 1 449 383/ΡΤ por um vector de movimento é copiado a partir do quadro anterior. 0 vector de movimento é previsto a partir dos blocos vizinhos no quadro corrente, ou seja, a partir de blocos que são adjacentes ou próximos do bloco de imagens particular. 0 modo IGMC pode ser utilizado para substituir o modo COPY na codificação de um bloco de imagens.

Como uma caracteristica adicional da concretização de IGMC, uma corrente de bits que representa um bloco de imagens codificado pode incluir um elemento de sintaxe que pode ser interpretado de modo a indicar uma IGMC ou o modo COPY. Uma comutação entre os modos de cópia e IGMC pode ser sinalizado implicitamente, por meio de outros elementos de código. Em alternativa, essa opção pode ser assinalada explicitamente por uma palavra de código.

Numa modificação desta concretização, um vector de movimento extra é enviado para cada lâmina, para ser utilizado na previsão do primeiro intra-bloco da lâmina.

Obviamente, são possíveis muitas outras modificações e variações do presente invento, à luz dos ensinamentos acima. É, por conseguinte, para ser entendido que, no âmbito do conceito divulgado, o invento pode ser posto em prática de outra forma que como foi descrito especificamente.

Lisboa, 2010-07-08

Claims

ΕΡ 1 449 383/ΡΤ 1/2 REIVINDICAÇÕES 1 - Método para descompressão de dados de vídeo para quadros de vídeo, que compreende uma pluralidade de blocos de imagens, em que cada bloco de imagens deve ser descodificado de acordo com um de uma pluralidade de modos de codificação, em que um da dita pluralidade de modos é um modo COPY, que implica que um bloco disposto a partir de um quadro anterior seja assinalado para ser copiado para um quadro corrente com o vector de moção de zero, caracterizado por o método compreender os passos de: - descodificação de uma corrente de bits de dados, que representa um bloco de imagens codificado de um quadro corrente, onde a corrente de bits é descodificada de acordo com um modo de IGMC, ou de acordo com o modo COPY, em que o dito modo de IGMC compreende: - a previsão de um vector de movimento a partir dos blocos de imagens vizinhos do referido quadro corrente; e - a descodificação do bloco de imagens codificado pela cópia a partir de um quadro anterior de um bloco disposto, deslocado pelo vector de movimento previsto.
2 - Método de acordo com a reivindicação 1, em que: uma comutação entre os referidos modos de IGMC e COPY é assinalado explicitamente por uma palavra código.
3 - Método de acordo com a reivindicação 3, em que: uma comutação entre os referidos modos de IGMC e COPY é assinalado implicitamente pelos elementos de código anteriormente descodificados.
4 - Método de acordo com a reivindicação 1, em que: a referida previsão de vector de movimento é calculada, para cada componente do vector individualmente, como a média de três vectores de movimento vizinhos. ΕΡ 1 449 383/ΡΤ 2/2
5 - Descodificador de vídeo para codificar de novo os quadros de vídeo, que compreende uma pluralidade de blocos de imagens, em que cada bloco de imagens deve ser descodificado de acordo com um de uma pluralidade de modos de codificação, em que um da referida pluralidade de modos é um modo COPY que implica que um bloco disposto a partir de um quadro anterior é assinalado para ser copiado para um quadro corrente com um vector de movimento de zero, caracterizado por o descodificador de vídeo compreender meios para codificar de novo uma corrente de bits de dados, que representa um bloco de imagens codificado de um quadro corrente, em que a corrente de bits de dados é descodificada de acordo com um modo de IGMC ou de acordo com o modo de cópia; em que o descodificador de vídeo compreende ainda meios para recodificação do bloco de imagens, codificado de acordo com o modo de IGMC pelo cálculo de um vector de movimento previsto pela previsão de vectores de movimento a partir dos blocos de imagens vizinhos do referido quadro corrente; e a descodificação de um bloco de imagens codificado pela cópia a partir de um quadro anterior de um bloco disposto deslocado pelo vector de movimento previsto.
6 - Descodificador de vídeo de acordo com a reivindicação anterior, em que o descodificador inclui meios de cálculo do referido vector de movimento previsto, para cada componente do vector individualmente, como a média de três vectores de movimento vizinhos. Lisboa, 2010-07-08