PT2559005E

PT2559005E - Herança em amostra de arranjo em subdivisão multitree

Info

Publication number: PT2559005E
Application number: PT117146522T
Authority: PT
Inventors: Detlev Marpe; Thomas Wiegand; Philipp Helle; Simon Oudin
Original assignee: Ge Video Compression Llc
Priority date: 2010-04-13
Filing date: 2011-04-13
Publication date: 2015-12-01
Also published as: WO2011128365A1; CN106454377B; EP3442233B1; CN106060558B; JP2019004505A; US11553212B2; KR102388012B1; JP6708714B2; JP2019017081A; JP2017135726A; JP2014195278A; US10440400B2; TW202337208A; CN102939618A; HUE049045T2; TW201204048A; US20210037265A1; CN106454371B; US10432980B2; KR20170000399A

Description

DESCRIÇÃO

HERANÇA EM AMOSTRA DE ARRANJO EM SUBDIVISÃO MULTITREE A presente invenção refere-se a esquemas de codificação para um arranjo de amostras de informação que representam um sinal de informação amostrado espacialmente, tal como um video ou imagem estática.

Na codificação de imagem e video, as imagens ou conjuntos particulares de arranjos de amostra para as imagens são geralmente decompostos em blocos, que estão associados a determinados parâmetros de codificação. As imagens geralmente consistem em arranjos de amostras múltiplas. Além disso, uma imagem pode também ser associada a arranjos de amostras auxiliares adicionais, o que pode, por exemplo, especificar a transparência da informação ou mapas de profundidade. Os arranjos de amostra de uma imagem (incluindo arranjos de amostras auxiliares) podem ser agrupados num ou mais dos denominados grupos de plano, em que cada grupo de plano consiste num ou mais arranjos de amostra. Os grupos de plano de uma imagem podem ser codificados de forma independente, ou, se a imagem estiver associada a mais de um grupo de plano, com a predição de outros grupos de plano da mesma imagem. Cada grupo de plano normalmente é decomposto em blocos. Os blocos (ou os blocos correspondentes dos arranjos de amostra), são previstos por uma predição de inter-imagem ou predição intra-imagem. Os blocos podem ter diferentes tamanhos, podendo ser ou quadrados ou retangulares. A partição de uma imagem em blocos pode ser tanto fixada pela sintaxe, ou pode ser (pelo menos parcialmente) sinalizada dentro do fluxo de bits. Muitas vezes, elementos de sintaxe são transmitidos de forma que sinalizem a subdivisão para blocos de tamanhos predefinidos. Tais elementos de sintaxe podem especificar se e como um bloco é subdividido em blocos menores e parâmetros de codificação associados, por exemplo, para efeitos de predição. Para todas as amostras de um bloco (ou os correspondentes blocos de arranjos de amostra), a descodificação dos parâmetros de codificação associados é especificada de uma determinada maneira. No exemplo, todas as amostras num bloco são previstas usando o mesmo conjunto de parâmetros de predição, tais como os índices de referência (identificando uma imagem de referência no conjunto de imagens já codificadas), parâmetros de movimento (especificando uma medida para o movimento de blocos entre uma imagem de referência e a imagem atual), parâmetros para especificar o filtro de interpolação, modos de intra-predição, etc. Os parâmetros de movimento podem ser representados por vetores de deslocamento com um componente horizontal e vertical, ou por meio de parâmetros de movimento de ordem mais elevada, tais como os parâmetros de movimento relacionados consistindo de seis componentes. Também é possível que mais do que um conjunto de parâmetros de predição particulares (tais como os índices de referência e parâmetros de movimento) estejam associados a um único bloco. Neste caso, para cada conjunto destes parâmetros de predição particulares, um sinal de predição único intermediário para o bloco (ou os blocos de arranjos de amostras correspondentes) é gerado, e o sinal de predição final é construído por uma combinação incluindo a sobreposição dos sinais de predição intermediários. Os parâmetros ponderados correspondentes e eventualmente também uma constante de deslocamento (que é adicionada à soma ponderada) podem ser fixados para uma imagem, ou uma imagem de referência, ou um conjunto de imagens de referência, ou podem ser incluídos no conjunto de parâmetros de predição para o bloco correspondente. A diferença entre os blocos originais (ou os blocos de arranjos de amostras correspondentes) e os seus sinais de predição, também referidos como o sinal residual, é geralmente transformada e quantificada. Muitas vezes, uma transformação bidimensional é aplicada ao sinal residual (ou aos arranjos de amostras correspondentes do bloco residual). Para a codificação de transformação, os blocos (ou os blocos de arranjos de amostras correspondentes), para os quais um determinado conjunto de parâmetros de predição foi utilizado, podem ainda ser divididos, antes de aplicar a transformação. Os blocos de transformação podem ser iguais ou menores do que os blocos que são usados para a predição. Também é possível que um bloco de transformação inclua mais do que um dos blocos que são usados para a predição. Diferentes blocos de transformação podem ter tamanhos diferentes e os blocos de transformação podem representar blocos quadrados ou retangulares. Após a transformação, os coeficientes de transformação resultantes são quantificados e os assim chamados níveis de coeficientes de transformação são obtidos. Os níveis de coeficientes de transformação, bem como os parâmetros de predição, e, se estiver presente, a informação da subdivisão são codificados por entropia.

Nos padrões de codificação de imagem e vídeo, as possibilidades de subdividir uma imagem (ou um grupo de plano) em blocos que são fornecidos pela sintaxe são muito limitadas. Normalmente, só pode ser especificado se, e (potencialmente como) um bloco de um tamanho predefinido pode ser subdividido em blocos menores. Como exemplo, o tamanho do maior bloco de H.264 é 16x16. Os blocos de 16x16 são também referidos como macroblocos e cada imagem está particionada em macroblocos numa primeira etapa. Para cada macrobloco 16x16, pode ser sinalizado se é codificado como bloco de 16x16, ou como dois blocos de 16x8, ou como dois blocos 8x16, ou como quatro blocos de 8x8. Se um bloco de 16x16 for subdividido em quatro blocos 8x8, cada um destes blocos de 8x8 pode ser codificado como um bloco de 8x8, ou como dois blocos 8x4, ou como dois blocos 4x8, ou como quatro blocos 4x4. 0 conjunto de possibilidades reduzidas para especificar a partição em blocos em padrões de codificação de imagem e vídeo do estado da técnica tem a vantagem de que a taxa de informação suplementar para sinalizar a informação da subdivisão pode ser mantida pequena, mas tem a desvantagem de que a taxa de bits requerida para a transmissão dos parâmetros de predição para os blocos pode tornar-se significativa, conforme explicado a seguir. A taxa de informação suplementar para sinalizar as informações de predição representa geralmente uma quantidade significativa da taxa de bits total de um bloco. E a eficiência de codificação pode ser aumentada quando a referida informação suplementar é reduzida, o que, por exemplo, pode ser alcançado através de tamanhos maiores de bloco. Imagens reais ou imagens de uma sequência de vídeo consistem em objetos de forma arbitrária com propriedades específicas. Como um exemplo, os objetos ou partes de objetos são caracterizados por uma textura única ou um movimento único. E, geralmente, o mesmo conjunto de parâmetros de predição pode ser aplicado para um determinado objeto, ou parte de um objeto. Mas os limites do objeto geralmente não coincidem com os limites de blocos possíveis para blocos de predição de grandes dimensões (por exemplo, macroblocos 16x16 em H.264). Um codificador determina geralmente a subdivisão (entre o conjunto limitado de possibilidades) que resulta no mínimo de uma medida de custo da taxa de distorção em particular. Para objetos moldados arbitrariamente, isso pode resultar num grande número de pequenos blocos. E uma vez que cada um destes blocos pequenos está associado com um conjunto de parâmetros de predição, que precisam ser transmitidos, a taxa de informação suplementar pode se tornar uma parte significativa da taxa total de bits. Porém, uma vez que muitos dos pequenos blocos ainda representam áreas do mesmo objeto ou parte de um objeto, os parâmetros de predição para certo número de blocos obtidos são iguais ou muito semelhantes.

Isto é, a subdivisão ou organização de uma imagem em porções menores ou mosaicos ou blocos influencia substancialmente a eficiência da codificação e complexidade de codificação. Como descrito acima, uma subdivisão de uma imagem para um maior número de blocos menores permite um ajuste mais fino espacialmente dos parâmetros de codificação, em que permite uma melhor adaptabilidade dos parâmetros de codificação ao material de imagem/vídeo. Por outro lado, definir os parâmetros de codificação numa granularidade mais fina representa uma carga maior sobre a quantidade de informação suplementar necessária, a fim de informar o descodificador sobre as configurações necessárias. Além disso, deve ser notado que qualquer liberdade para o codificador para (posteriormente) subdividir a imagem/video espacialmente em blocos aumenta imensamente a quantidade de possíveis configurações de parâmetros de codificação e, assim, em geral, torna a procura pela configuração do parâmetro de codificação que conduz a um melhor compromisso de taxa/distorção ainda mais difícil. 0 documento US 4 980 764 descreve um conceito antiquado de codificação e descodificação de sequências de imagens. No lado da codificação, o conceito começa imediatamente a partir da partição de imagens nos chamados blocos elementares de tamanho fixo, ou seja, 8 pixels por 8 linhas dentro de cada quadro. Nesta medida, cada imagem é formada por 180 blocos horizontalmente e verticalmente por 72 blocos. Para cada bloco, o codificador determina uma em cada quatro operações de processamento, entre as quais uma operação de processamento usa compensação de movimento, em que para cada bloco da última operação de processamento, um vetor de movimento associado de 15 possíveis vetores de movimento é determinado, também. O codificador então pesquisa por regiões homogéneas longe de blocos elementares de agrupamento hierárquico da mesma operação de processamento para formar blocos de 2x2 e campos 4x4, a fim de sinalizar a operação de processamento selecionada para esses campos e blocos de 2x2 coletivamente em vez de individualmente. Para todos os campos e blocos de 2x2, a verificação da homogeneidade está estendida para os vetores de movimento: tais campos e blocos de 2x2 são sujeitos a uma verificação de homogeneidade, a fim de determinar se a sinalização dos vetores de movimento dos seus blocos elementares tem de ter lugar na melhor granularidade definida pelos blocos elementares, ou se alguma granularidade mais grosseira pode ser utilizada. A imagem assim descrita é descrita por meio de uma sequência de palavras de 6 bits que descrevem as decisões de homogeneidade recém-delineadas e operações de processamento selecionadas e vetores de movimento sequencialmente para os superblocos ou campos compostos por blocos elementares 4x4. Exemplarmente, a primeira palavra define o superbloco para se decompor em três blocos homogéneos 2x2 e quatro blocos elementares. Para cada um dos sete blocos resultantes, a operação de processamento escolhida é sinalizada pelas sete palavras seguintes. Dois dos blocos de 2x2 são exemplarmente do tipo de operação de processamento de movimento compensado. Por conseguinte, para cada um destes blocos de 2x2, é assinalado por uma respetiva palavra se este bloco de 2x2 é homogéneo, no que respeita aos vetores de movimento associados com os seus blocos elementares, ou não. No exemplo apresentado, um bloco de 2x2 do tipo de operação de processamento de compensação de movimento é homogéneo, tanto quanto os vetores de movimento estão em causa e, consequentemente, apenas uma palavra é sinalizada no fluxo de dados que designa o respetivo vetor de movimento a partir dos 15 possíveis vetores de movimento disponíveis, enquanto o outro bloco de 2x2 do tipo de operação de processamento de movimento compensado é exemplarmente não homogéneo no que respeita aos vetores de movimento e, consequentemente, mais quatro palavras são sinalizadas no fluxo de dados, a fim de indicar os quatro vetores de movimento para os quatro blocos elementares correspondentes dentro do bloco 2x2 separadamente.

Bozinovic N. et ai. em "Modeling Motion for Spatial Scalability" (XP031386332) descrevem um quadro para a estimativa das áreas de movimento espacialmente escaláveis em codificadores de vídeo de ondas escaláveis. Em particular, dois esquemas diferentes de estimativa de movimento são apresentados. Segundo uma deles, a correspondência do bloco de tamanh variável hierárquico é empregada, a fim de codificar preditivamente vetores de movimento seguindo de forma sequencial a estrutura de decomposição quadtree. Ambos os preditores espacial e de resolução transversal são permitidos. A decisão sobre um modo de predição especial é controlada pela variação das estimativas de movimento e profundidade atual na árvore de partição. A partição de macroblocos da próxima resolução mais baixa é usada para inicializar o estado de quatro macroblocos na camada atual. De acordo com um modo de predição de movimento, os vetores de movimento de escala anterior são utilizados para prever um vetor de movimento de um bloco atual.

Kim J. W. et ai. em "VIDEO CODING WITH R-D CONSTRAINED HIERARCHICAL VARIABLE BLOCK SIZE (VBS) BOTION ESTIMATION" (XP000914354) descrevem codificação de video com estimativa de movimento de tamanho do bloco variável hierárquico constranqido por R-D (VBS) . De acordo com este documento, apenas os vetores de movimento que diferem significativamente dos seus homólogos no nivel superior da estrutura de VBS quadtree hierárquica estão marcados para transmissão. Para cada bloco de nivel, um sinalizador de bits é transmitido para designar a transmissão do seu vetor de movimento. Assim, utilizando a estrutura VBS quadtree hierárquica, o vetor de movimento que codifica a eficiência é melhorado, enquanto o número de vetores de movimento a serem transmitidos é reduzido. Descreve-se que, para os blocos de nivel mais baixo, os vetores de movimento podem ser codificados com a predição de vetor de movimento com respeito ao vetor de movimento de nivel mais alto.

Santillano Herrero et ai. em "Hierarchical Image- Based Segmentation Applied to HDTV" descrevem um método para segmentação de imagens em regiões com movimento coerente, de acordo com um modelo baseado em movimento, antes da fase de estimativa de movimento. As restrições de HDTV são levadas em consideração através de uma abordagem multi-resolução. Uma grande vantagem de uma abordagem baseada no modelo para o problema da segmentação baseada em movimento em regiões é que a segmentação pode ser realizada de uma maneira hierárquica. Isto significa que o processo de segmentação inicia-se com um modelo de movimento tão simples quanto possível (isto é, de velocidade constante) e depois de um ciclo completo de iteração, um modelo de movimento mais elaborado pode ser considerado. Critérios de homogeneidade de movimento são baseados em informações de movimento parcial explicito e expressos como testes de razão de probabilidade. Um procedimento split-and-merge atua como guia para o processo geral de segmentação. É um objetivo fornecer um esquema de codificação para a codificar um arranjo de amostras da informação que representam um sinal de informação espacialmente amostrado, tais como, mas não limitado a, imagens de um video ou imagens fixas, o que permite a obtenção de um melhor compromisso entre a complexidade de codificação e o índice de distorção da taxa alcançável, e/ou alcançar um melhor índice da taxa de distorção.

Este objetivo é atingido por um descodificador de acordo com a reivindicação 1, um codificador de acordo com a reivindicação 11, métodos de acordo com as reivindicações 10 e 12, um programa de computador de acordo com a reivindicação 13 e um fluxo de dados de acordo com a reivindicação 14.

Uma ideia subjacente à presente invenção é a de que um melhor compromisso entre a complexidade de codificação e o índice da taxa de distorção alcançável, e/ou alcançar um melhor índice da taxa de distorção pode ser obtido quando a subdivisão multi-tree não só é utilizada a fim de subdividir um espaço contínuo, ou seja, o arranjo de amostras, para as regiões da folha, mas se as regiões intermediárias são utilizadas para partilhar parâmetros de codificação entre os blocos de folhas correspondentes colocados. Por esta medida, os procedimentos de codificação executados em mosaicos - regiões de folha local -, podem estar associados com parâmetros de codificação individuais, sem ter que, no entanto, explicitamente transmitir os parâmetros de codificação inteiros para cada região de folha em separado. Em vez disso, semelhanças podem ser efetivamente exploradas usando a subdivisão multi-tree.

De acordo com uma forma de realização, o arranjo de amostras de informação que representam o sinal de informação espacialmente amostrado em regiões de raiz da árvore, então em primeiro lugar com subdivisão, de acordo com a informação de subdivisão multi-tree extraída a partir de um fluxo de dados, pelo menos um subconjunto de regiões da raiz da árvore em regiões menores simplesmente ligadas de diferentes tamanhos por multi-partição recursiva do subconjunto de regiões da raiz da árvore. Para permitir encontrar um bom compromisso entre uma subdivisão muito fina e uma subdivisão muito grossa num sentido de taxa- distorção, numa complexidade de codificação razoável, o tamanho da região máxima das regiões de raízes de árvores em que o arranjo de amostras da informação é espacialmente dividido, está incluído dentro do fluxo de dados e é extraído do fluxo de dados no lado da descodificação. Consequentemente, um descodificador pode compreender um dispositivo de extração para extrair um tamanho máximo de região e informações de subdivisão multi-tree a partir de um fluxo de dados, um subdivisor configurado para dividir espacialmente um arranjo de amostras de informação que representa um sinal de informação espacialmente amostrado em regiões de raízes de árvore do tamanho máximo da região e subdivisão, de acordo com a informação da subdivisão multi-tree, pelo menos, um subconjunto de regiões da raiz da árvore em regiões menores simplesmente ligadas de diferentes tamanhos por multi-partição recursiva do subconjunto de regiões de raiz da árvore, e um reconstrutor configurado para reconstruir o arranjo de amostras de informação a partir do fluxo de dados usando a subdivisão em regiões menores simplesmente ligadas.

De acordo com uma forma de realização, o fluxo de dados contém também o nível máximo de hierarquia até ao qual o subconjunto de regiões da raiz da árvore são submetidas ao multi-partição recursiva. Por esta medida, a sinalização da informação de subdivisão multi-tree se torna mais fácil e precisa menos bits para codificação.

Além disso, o reconstrutor pode ser configurado para executar uma ou mais das seguintes medidas até uma granularidade que depende da subdivisão intermediária: decisão de qual modo de predição usar entre, pelo menos, o modo de intra e inter-predição; transformação do domínio espetral para o espacial, realização e/ou definição dos parâmetros de configuração para uma inter-predição; realização e/ou definição dos parâmetros para uma intra-predição.

Além disso, o extrator pode ser configurado para extrair os elementos de sintaxe associados com as regiões de folhas dos blocos de árvore particionados numa ordem transversal de prioridade de profundidade a partir do fluxo de dados. Por essa medida, o extrator é capaz de explorar as estatísticas dos elementos de sintaxe já codificados de regiões de folhas vizinhas com uma maior probabilidade de usar uma ordem transversal de prioridade de largura.

De acordo com outra forma de realização, outro subdivisor é utilizado para subdividir, de acordo com ainda outra informação da subdivisão multi-tree, pelo menos um subconjunto de regiões menores simplesmente ligadas em regiões ainda menores simplesmente ligadas. A primeira fase de subdivisão pode ser utilizada pelo reconstrutor para realizar a predição da área de amostras de informação, ao passo que a segunda fase de subdivisão pode ser utilizada pelo reconstrutor para executar a retransformação do domínio espetral para o espacial. Definindo a subdivisão residual a ser relativamente subordinada à subdivisão de predição torna a codificação da subdivisão total um pouco menos demorada e, por outro lado, a restrição e a liberdade para a subdivisão residual resultante da subordinação tem meramente efeitos negativos menores sobre a eficiência de codificação desde a maioria de suas partes de imagens com os parâmetros de compensação de movimento semelhantes são maiores do que as partes semelhantes com propriedades espetrais.

De acordo com ainda outra forma de realização, outra região de tamanho máximo está contida no fluxo de dados, o outro tamanho máximo da região definindo o tamanho das sub-regiões da raiz da árvore dentro do qual as regiões menores simplesmente ligadas são, em primeiro lugar divididas antes de subdividir pelo menos um subconjunto das sub-regiões de raiz da árvore de acordo com outra informação de subdivisão multi-tree em regiões menores simplesmente ligadas. Isto, por sua vez, permite um ajuste independente das dimensões máximas da região da subdivisão de predição por um lado e a subdivisão residual, por outro lado, e, por conseguinte, permite encontrar um melhor compromisso de taxa/distorção.

De acordo com ainda outra forma de realização da presente invenção, o fluxo de dados compreende um primeiro subconjunto de elementos de sintaxe disjuntos de um segundo subconjunto de elementos de sintaxe que formam a informação de subdivisão multi-tree, em que uma fusão no lado de descodificação seja capaz de combinar, de acordo com o primeiro subconjunto de elementos de sintaxe, regiões vizinhas pequenas espacialmente simplesmente ligadas da subdivisão multi-tree para obter uma subdivisão intermediária do arranjo de amostras. 0 reconstrutor pode ser configurado para reconstruir o arranjo de amostras utilizando a subdivisão intermediária. Por esta medida, é mais fácil para o codificador adaptar a subdivisão eficaz à distribuição espacial das propriedades do arranjo da informação de amostras encontrando um compromisso de velocidade/distorção ótimo. Por exemplo, se o tamanho da região máxima é grande, a informação da subdivisão multi-tree é suscetível de se tornar mais complexa devido às regiões de raízes de árvores se tornarem maiores. Por outro lado, no entanto, se o tamanho da região máxima for pequeno, torna-se mais provável que as regiões vizinhas de raízes de árvores pertençam ao conteúdo da informação com propriedades semelhantes, de modo que estas regiões de raízes de árvores também possam ter sido processadas em conjunto. A fusão preenche esta lacuna entre os extremos acima mencionados, o que permite uma subdivisão quase ideal de granularidade. Do ponto de vista do codificador, os elementos de sintaxe que se fundem permitem um procedimento de codificação mais relaxado ou computacionalmente menos complexo, uma vez que se o codificador utilizar erradamente uma subdivisão muito fina, este erro pode ser compensado pelo codificador posteriormente, subsequentemente, pela configuração da fusão de elementos de sintaxe com ou sem adaptação de apenas uma pequena parte dos elementos de sintaxe tendo sido fixados antes de definir os elementos de sintaxe que se fundem.

De acordo com ainda outra forma de realização, o tamanho da região máxima e a informação da subdivisão multi-tree é utilizado para a subdivisão residual, em vez da subdivisão de predição.

Uma ordem transversal de prioridade de profundidade para o tratamento das regiões simplesmente ligadas de uma subdivisão quadtree de um arranjo de amostras de informação que representam um sinal da informação espacialmente amostrada é usada de acordo com uma forma de realização ao invés de uma ordem transversal de prioridade de largura. Através do uso da ordem transversal de prioridade de profundidade, cada região simplesmente ligada tem uma maior probabilidade de ter regiões vizinhas simplesmente ligadas que tenham já sido percorridas de modo que a informação sobre estas regiões vizinhas simplesmente ligadas possa ser explorada de forma positiva na reconstrução da região atual respetiva simplesmente ligada.

Quando o arranjo de amostras de informação é em primeiro lugar dividido num arranjo regular de regiões de raiz da árvore de tamanho de hierarquia de ordem zero subdividindo então pelo menos um subconjunto de regiões da raiz da árvore em regiões menores simplesmente ligadas de diferentes tamanhos, o reconstrutor pode usar uma digitalização em ziguezague a fim de verificar as regiões de raizes de árvores onde, para cada região da raiz da árvore a ser particionada, são tratadas as regiões de folha simplesmente ligadas em ordem transversal de prioridade de profundidade antes de entrar para a próxima região da raiz da árvore na ordem de digitalização em ziguezague. Além disso, as regiões de folhas de acordo com a ordem transversal de prioridade de profundidade simplesmente ligadas do mesmo nivel de hierarquia podem ser também atravessadas por uma ordem de digitalização em ziguezague. Assim, o aumento da probabilidade de ter regiões de folha vizinhas simplesmente ligadas é mantido.

De acordo com uma forma de realização, embora os sinalizadores associados com os nós da estrutura multi-tree sejam sequencialmente arranjados numa primeira ordem transversal de prioridade de profundidade, a codificação sequencial dos sinalizadores utiliza contextos de estimativa de probabilidade que são os mesmos para os sinalizadores associados com os nós da estrutura multi-tree situada no mesmo nivel de hierarquia da estrutura multi-tree, mas diferente para nós da estrutura multitree situados dentro de níveis de hierarquia diferentes da estrutura multi-tree, permitindo assim um bom compromisso entre o número de contextos a ser prestado e a adaptação às estatísticas de símbolos atuais dos sinalizadores por outro lado.

De acordo com uma forma de realização, os contextos de estimativa de probabilidade para um sinalizador predeterminado utilizado também dependem dos sinalizadores que precedem o sinalizador predeterminado de acordo com a ordem transversal de prioridade de profundidade e correspondendo a áreas da região da raiz da árvore que têm uma relação de localização predeterminada em relação à área a qual corresponde o sinalizador predeterminado. Semelhante à ideia subjacente ao aspeto do processo, a utilização da ordem transversal de prioridade de profundidade garante uma alta probabilidade de que sinalizadores que já tenham sido codificados compreendam também os sinalizadores correspondentes às zonas vizinhas da área correspondente ao sinalizador predeterminado de modo que este conhecimento possa ser utilizado para adaptar melhor o contexto a ser usado para o sinalizador predeterminado.

Os sinalizadores que podem ser utilizados para estabelecer o contexto de um sinalizador predeterminado, podem ser os correspondentes às áreas de descanso para o topo e/ou a esquerda da área à qual o sinalizador predeterminado corresponde. Além disso, os sinalizadores usados para a seleção do contexto podem ser restringidos aos sinalizadores pertencentes ao mesmo nivel de hierarquia como o nó com o qual o sinalizador predeterminado está associado.

De acordo com uma forma de realização, a sinalização codificada compreende uma indicação de um nivel de hierarquia mais alto e uma sequência de sinalizadores associados com os nós da estrutura multi-tree de desigualdade para o maior nivel de hierarquia, cada sinalizador indicando se o nó associado é um nó intermediário ou nó descendente, e uma descodificação sequencial, numa primeira ordem transversal de prioridade de profundidade ou de largura, da sequência de sinalizadores do fluxo de dados ocorre com nós intercalados do nivel de hierarquia mais alto e automaticamente indicando os mesmos nós de folha, reduzindo assim a taxa de codificação.

De acordo com outra forma de realização, a sinalização codificada da estrutura multi-tree pode compreender a indicação do nivel de hierarquia mais alto. Por esta medida, é possível restringir a existência de sinalizadores de níveis de hierarquia diferentes de nível de hierarquia mais alto como outro partição de blocos do nível de hierarquia mais elevado é excluído de qualquer maneira.

No caso da subdivisão multi-tree espacial sendo parte de uma subdivisão secundária de nós da folha e regiões de raiz da árvore não-particionadas de uma subdivisão multi-tree primária, o contexto usado para codificar os sinalizadores da subdivisão secundária pode ser selecionado de modo que os contextos são os mesmos para os sinalizadores associados às áreas do mesmo tamanho.

De acordo com outras formas de realização, uma fusão favorável ou agrupamento de regiões simplesmente ligadas em que o arranjo de amostras de informação é subdividido, é codificado com um número reduzido de dados. Para este fim, para as regiões ligadas simplesmente, uma relação relativa de localização predeterminada é definida permitindo uma identificação, para uma região predeterminada simplesmente ligada, de regiões simplesmente ligadas dentro da pluralidade de regiões simplesmente ligadas predeterminadas que têm a relação relativa de localização predeterminada para a região simplesmente ligada. Ou seja, se o número for igual a zero, um indicador de fusão para a região predeterminada simplesmente ligada pode estar ausente no fluxo de dados. Além disso, se o número de regiões simplesmente ligadas que possuem a relação de localização predeterminada em relação à região predeterminada simplesmente ligada for um, os parâmetros de codificação da região simplesmente ligada podem ser aprovados ou podem ser utilizados para a predição dos parâmetros de codificação para a região predeterminada simplesmente ligada sem a necessidade de qualquer elemento de sintaxe adicional. Caso contrário, ou seja, se o número de regiões simplesmente ligadas que possuem a relação de localização predeterminada em relação às regiões predeterminadas simplesmente ligadas for maior que um, a introdução de um elemento de sintaxe adicional pode ser suprimida, mesmo se os parâmetros de codificação associados a estas regiões identificadas simplesmente ligadas forem idênticos entre si.

De acordo com uma forma de realização, se os parâmetros de codificação das regiões vizinhas simplesmente ligadas são desiguais entre si, um identificador de referência vizinho pode identificar um subconjunto apropriado do número de regiões simplesmente ligadas com a relação predeterminada relativamente à localização da região predeterminada simplesmente ligada e este subconjunto apropriado é usado quando adota os parâmetros de codificação, ou a predição dos parâmetros de codificação da região predeterminada simplesmente ligada.

De acordo com ainda outras formas de realização, uma subdivisão espacial de uma área de amostras que representam uma amostragem espacial do sinal de informação bidimensional numa pluralidade de regiões simplesmente ligadas de diferentes tamanhos por multi-partição recursiva é executada de acordo com um primeiro subconjunto de elementos de sintaxe contidos no fluxo de dados, seguido por uma combinação de regiões espacialmente vizinhas simplesmente ligadas, dependendo de um segundo subconjunto de elementos de sintaxe dentro do fluxo de dados sendo dissociada do primeiro subconjunto, para obter uma subdivisão intermediária do arranjo de amostras em conjuntos disjuntos de regiões simplesmente ligadas, cuja união é a pluralidade de regiões simplesmente ligadas. A subdivisão intermediária é usada na reconstrução do arranjo de amostras a partir do fluxo de dados. Isto permite uma otimização em relação à subdivisão tornando-a menos critica devido ao facto de uma subdivisão muito fina poder ser compensada pela fusão depois. Além disso, a combinação da subdivisão permite a realização da fusão de subdivisões intermediárias que não seria possível por meio de multi-partição recursivo somente para que a concatenação da subdivisão e da fusão com o uso de conjuntos disjuntos de elementos de sintaxe permita uma melhor adaptação da subdivisão intermediária eficaz ou ao conteúdo real do sinal de informação bidimensional. Comparado com as vantagens, a sobrecarga adicional resultante do subconjunto adicional de elementos de sintaxe para indicar os detalhes que se fundem, é insignificante.

Formas de realização preferidas da presente invenção são descritas a seguir com relação às seguintes Figs, entre as quais:

Fig. 1 mostra um diagrama de blocos de um codificador de acordo com uma forma de realização do presente pedido;

Fig. 2 mostra um diagrama de blocos de um descodificador de acordo com uma forma de realização do presente pedido;

As Figs. 3a-c mostram esquematicamente um exemplo ilustrativo de uma subdivisão quadtree, em que a Fig. 3a mostra um primeiro nível de hierarquia, Fig. 3b mostra um segundo nível de hierarquia e Fig. 3c mostra um terceiro nível de hierarquia;

Fig. 4 mostra esquematicamente uma estrutura de árvore para a subdivisão quadtree ilustrativa das Figs. 3a a 3c de acordo com uma forma de realização;

Figs. 5a, b ilustram esquematicamente a subdivisão quadtree das Figs. 3a a 3c e da estrutura de árvore com índices que indexam os blocos de folhas individuais;

Figs. 6a, b mostram esquematicamente cadeias binárias ou sequências de sinalizadores representando a estrutura da árvore da Fig. 4 e a subdivisão quadtree da Fig. 3a a 3c, respetivamente, de acordo com formas de realização diferentes;

Fig. 7 mostra um fluxograma, que mostra os passos executados por um extrator de fluxo de dados de acordo com uma forma de realização;

Fig. 8 mostra um fluxograma que ilustra a funcionalidade de um extrator de fluxo de dados de acordo com outra forma de realização;

Fig. 9a, b mostram diagramas esquemáticos ilustrando subdivisões de quadtree com blocos vizinhos candidatos para um bloco predeterminado a ser destacado, de acordo com uma forma de realização;

Fig. 10 mostra um fluxograma de uma funcionalidade de um extrator de fluxo de dados de acordo com outra forma de realização;

Fig. 11 mostra esquematicamente uma composição de uma imagem de planos e grupos de plano e ilustra uma codificação utilizando adaptação/ predição inter-plano de acordo com uma forma de realização;

Fig. 12a e 12b ilustram esquematicamente uma estrutura de subárvore e a subdivisão correspondente, a fim de ilustrar o esquema de herança de acordo com uma forma de realização;

Fig. 12c e 12d ilustram esquematicamente uma estrutura de subárvore, a fim de ilustrar o esquema de herança com aprovação e predição, respetivamente, de acordo com formas de realização;

Fig. 13 mostra um fluxograma que mostra os passos executados por um codificador de realização de um esquema de herança de acordo com uma forma de realização;

Fig. 14a e 14b mostram uma subdivisão primária e uma subdivisão subordinada para ilustrar uma possibilidade de implementar um esquema de herança em conexão com a inter-predição de acordo com uma forma de realização;

Fig. 15 mostra um diagrama de blocos que ilustra um processo de descodificação, em conexão com o esquema de herança de acordo com uma forma de realização;

Fig. 16 mostra um diagrama esquemático ilustrando a ordem de digitalização entre as sub-regiões de uma subdivisão multi-tree de acordo com uma forma de realização, com as sub-regiões que são objeto de intra-predição;

Fig. 17a,b mostra diagramas esquemáticos que ilustram diferentes possibilidades de subdivisões de acordo com outras formas de realização.

Na seguinte descrição das Figs., elementos que ocorrem em várias dessas Figs, estão indicadas por números de referência comuns e uma explicação repetida destes elementos é evitada. Em vez disso, as explicações em relação a um elemento apresentado dentro de uma Fig. aplicam-se igualmente a outras Figs, em que o respetivo elemento ocorre, desde que a explicação apresentada com essas outras Figs, indique desvios dos mesmos.

Além disso, a descrição a seguir tem inicio com formas de realização de um codificador e descodificador, que são explicados em relação às Figs. 1 a 11. As formas de realização descritas em relação a estas figuras combinam vários aspetos do presente pedido de patente que, contudo, também seria vantajoso se implementadas individualmente dentro de um esquema de codificação e, por conseguinte, com relação às Figs, subsequentes, as formas de realização que são brevemente discutidas para explorar aspetos apenas mencionados individualmente com cada uma destas formas de realização representando uma abstração das formas de realização descritas em relação às Figs. 1 e 11 num sentido diferente. A Fig. 1 mostra um codificador de acordo com uma forma de realização da presente invenção. 0 codificador 10 da Fig. 1 compreende um preditor 12, um precodificador residual 14, um reconstrutor residual 16, um dispositivo de inserção de fluxo de dados 18 e um divisor de bloco 20. O codificador 10 é para a codificação de um sinal de informação temporal espacialmente amostrado num fluxo de dados 22. O sinal de informação temporal espacialmente amostrado pode ser, por exemplo, um vídeo, isto é, uma sequência de imagens. Cada imagem representa um arranjo de amostras de imagem. Outros exemplos de sinais de informação espaciais temporais compreendem, por exemplo, as imagens capturadas pela profundidade, por exemplo, por câmaras de tempo de luz. Além disso, deve ser notado que um sinal de informação espacialmente amostrado pode compreender mais do que um arranjo por carimbo ou quadro de tempo, tais como no caso de um vídeo de cor, que compreende, por exemplo, um arranjo de amostras de luminância, juntamente com dois arranjos de amostras de crominância por quadro. Pode também ser possível que a taxa de amostragem temporal para os diferentes componentes do sinal de informação, isto é, luminância e crominância seja diferente. O mesmo se aplica à resolução espacial. Um vídeo também pode ser acompanhado de informações espacialmente amostradas adicionais, como profundidade ou informações de transparência. A descrição a seguir, no entanto, irá concentrar-se no processamento de um desses arranjos para efeitos de uma melhor compreensão dos aspetos principais do presente pedido primeiramente, em seguida, abordando o tratamento de mais de um plano. 0 codificador 10 da Fig. 1 é configurado para criar o fluxo de dados 22 de modo que os elementos de sintaxe do fluxo de dados 22 descrevem as imagens numa granularidade situada entre imagens inteiras e as amostras de imagem individuais. Para este fim, o divisor 20 está configurado para subdividir cada imagem 24 em regiões simplesmente ligadas de tamanhos diferentes 26. A seguir estas regiões serão simplesmente chamadas de blocos ou sub-regiões 26.

Como será descrito em maior detalhe abaixo, o divisor 20 utiliza um sistema de subdivisão multi-tree, a fim de subdividir a imagem 24 nos blocos 26 de diferentes tamanhos. Para ser ainda mais preciso, as formas de realização especificas descritas abaixo em relação às Figs. 1 a 11 usam principalmente uma subdivisão quadtree. Como também será explicado em maior detalhe abaixo, o divisor 20 pode, internamente, compreender uma concatenação de um subdivisor 28 para subdividir as imagens 24 nos blocos 26 já mencionados seguido por uma fusão 30 que permite a combinação de grupos destes blocos 26, a fim de obter uma subdivisão efetiva ou granularidade, que se situa entre a não subdivisão de imagens 24 e a subdivisão definida pelo subdivisor 28.

Tal como ilustrado pelas linhas tracejadas na Fig. 1, o preditor 12, o pré-codificador residual 14, o reconstrutor residual 16 e o dispositivo de inserção de fluxo de dados 18 operam nas subdivisões de imagem definidas pelo divisor 20. Por exemplo, como será descrito em mais detalhe abaixo, o preditor 12 usa uma subdivisão de predição definida pelo divisor 20, a fim de determinar para as sub-regiões individuais da subdivisão de predição quanto ao facto de a respetiva sub-região ser submetida a predição de intra imagem ou predição de inter imagem com a definição dos parâmetros de predição correspondentes para a respetiva sub-região, de acordo com o modo de predição selecionado. 0 pré-codificador residual 14, por sua vez, pode utilizar uma subdivisão residual das imagens 24, a fim de codificar o resíduo da predição das imagens 24 fornecidas pelo preditor 12. Como o reconstrutor residual 16 reconstrói o resíduo da produção por elementos de sintaxe pelo pré-codificador residual 14, o reconstrutor residual 16 também opera na subdivisão residual recém-mencionada. 0 dispositivo de inserção de fluxo de dados 18 pode explorar as divisões agora mencionadas, ou seja, as subdivisões de predição e residual, a fim de determinar a ordem de inserção e vizinhança entre os elementos de sintaxe para a inserção da saída por elementos de sintaxe pelo pré-codificador residual 14 e o preditor 12 para dentro do fluxo de dados 22 por meio de, por exemplo, codificação por entropia.

Como mostrado na Fig. 1, o codificador 10 inclui uma entrada 32 onde o sinal de informação original entra o codificador 10. Um subtrator 34, o pré-codificador residual 14 e o dispositivo de inserção de fluxo de dados 18 são ligados em série pela ordem mencionada entre a entrada 32 e a saída do dispositivo de inserção de fluxo de dados 18 no qual o fluxo de dados codificado 22 é emitido. O subtrator 34 e o pré-codificador residual 14 fazem parte de um circuito de predição que é fechado pelo construtor residual 16, um adicionador 36 e um preditor 12 que estão ligados em série pela ordem mencionada entre a saída do pré-codificador residual 14 e a entrada inversora do subtrator 34. A saída do preditor 12 é também ligada a uma outra entrada do adicionador 36. Além disso, o preditor 12 compreende uma entrada diretamente ligada à entrada 32 e pode compreender outra entrada, também ligada à saída do adicionador 36 através de um filtro de circuito opcional 38. Além disso, o preditor 12 gera informação suplementar durante a operação e, por conseguinte, uma saída do preditor 12 é também acoplada ao dispositivo de inserção de fluxo de dados 18. Da mesma forma, o divisor 20 compreende uma saída que está ligada a outra entrada de dispositivo de inserção de fluxo de dados 18.

Tendo descrito a estrutura do codificador 10, o modo de funcionamento é descrito mais detalhadamente a seguir.

Como descrito acima, o divisor 20 decide para cada imagem 24 como subdividir a mesma em sub-regiões 26. De acordo com uma subdivisão da imagem 24 a ser utilizada para a predição, o preditor 12 decide para cada sub-região correspondente a esta subdivisão, como prever a respetiva sub-região. O preditor 12 produz a predição da sub-região para a entrada inversora do subtrator 34 e para a outra entrada do adicionador 36 e produz a informação de predição que reflete a maneira como o preditor 12 obteve esta predição a partir de porções previamente codificadas de vídeo, para o dispositivo de inserção do fluxo de dados 18.

Na saída do subtrator 34, a predição residual é assim obtida, em que o pré-codificador residual 14 processa esta predição residual, de acordo com uma subdivisão residual também prescrita pelo divisor 20. Conforme descrito em maior detalhe abaixo com relação às Figs. 3 a 10, a subdivisão de imagem residual 24 utilizada pelo pré-codificador residual 14 pode ser relacionada com a subdivisão de predição utilizada pelo preditor 12, de modo que cada sub-região de predição é adotada como sub-região residual ou é ainda subdividida em sub-regiões residuais menores. No entanto, a predição totalmente independente e subdivisões residuais também seriam possíveis. O pré-codificador residual 14 submete cada sub-região residual a uma transformação de domínio espacial a espetral por uma transformação bidimensional seguido de, ou inerentemente envolvendo, uma quantização dos coeficientes de transformação resultantes de blocos de transformação resultantes onde a distorção resulta do ruído de quantização. O dispositivo de inserção de fluxo de dados 18 pode, por exemplo, codificar sem perdas os elementos de sintaxe que descrevem coeficientes de transformação acima mencionados no fluxo de dados 22 através da utilização de, por exemplo, codificação por entropia. 0 reconstrutor residual 16, por sua vez, reconverte, por utilização de uma re-quantização sequida por uma re-transformação, os coeficientes de transformação num sinal residual, em que o sinal residual é combinado no adicionador 36 com a predição utilizada pelo subtrator 34 para obter a predição residual, obtendo-se assim uma porção reconstruída ou sub-reqião de uma imagem atual na saída do adicionador 36. 0 preditor 12 pode usar a imagem da sub-região reconstruída para a intra-predição diretamente, que é para prever determinada sub-região de predição por extrapolação a partir da predição prévia de sub-regiões vizinhas reconstruídas. No entanto, uma intra-predição realizada com o domínio espetral prevendo o espetro da sub-região atual a partir de um vizinho, diretamente, seria teoricamente também possível.

Para a inter-predição, o preditor 12 pode usar imagens previamente codificadas e reconstruídas numa versão segundo a qual elas foram filtradas por um filtro de anel opcional 38. 0 filtro de anel 38 pode, por exemplo, compreender um filtro de desbloqueio ou um filtro adaptativo que tem uma função de transferência adaptada para formar, vantajosamente, o ruido de quantização mencionado anteriormente. 0 preditor 12 escolhe os parâmetros de predição que revelam a maneira de prever uma determinada sub-região de predição através da utilização de uma comparação com as amostras originais dentro da imagem 24. Os parâmetros de predição podem, tal como descrito em maiores detalhes abaixo, compreender, para cada sub-região da predição uma indicação do modo de predição, tal como a predição de intra-predição e inter-predição de imagem. No caso da intra-predição de imagem, os parâmetros de predição podem também incluir uma indicação de um ângulo ao longo do qual as bordas da sub-região de predição a ser intra-prevista principalmente se estende, e no caso de predição de inter-imagem, vetores de movimento, índices de imagem em movimento e, eventualmente, parâmetros de ordem mais elevada de transformação de movimento e, no caso da predição de intra- e/ou inter-imagem, informações de filtro opcional para a filtragem das amostras de imagem reconstruídas com base nas quais a sub-região de predição atual é prevista.

Como será descrito em maior detalhe abaixo, as referidas subdivisões definidas por um divisor 20 influenciam substancialmente a razão de taxa/distorção máxima alcançável pelo pré-codificador residual 14, o preditor 12 e dispositivo de inserção de fluxo de dados 18. No caso de uma subdivisão muito fina, a saída dos parâmetros de predição 40 pelo preditor 12 para ser inseridos no fluxo de dados 22 necessitam de uma taxa de codificação muito grande embora a predição obtida pelo preditor 12 possa ser melhor e o sinal residual a ser codificado pelo pré-codificador residual 14 possa ser menor, de modo que o mesmo pode ser codificado por menos bits. No caso de uma subdivisão muito grossa, o oposto é aplicável. Além disso, o pensamento mencionado também se aplica para a subdivisão residual de um modo similar: a transformação de uma imagem usando uma granularidade mais fina dos blocos individuais de transformação conduz a uma menor complexidade para calcular as transformações e uma maior resolução espacial da transformação resultante. Isto é, menores sub-regiões residuais permitem que a distribuição espetral do conteúdo dentro de cada sub-região residual seja mais consistente. No entanto, a resolução espetral é reduzida e a razão entre coeficientes significantes e insignificantes, isto é, quantizados a zero, piora. Ou seja, a granularidade de transformação deverá ser adaptada ao conteúdo da imagem localmente. Além disso, independentemente do efeito positivo de um localizador de granularidade, uma granularidade mais fina aumenta regularmente a quantidade de informação suplementar necessária, a fim de indicar a subdivisão escolhida para o descodificador. Como será descrito em mais detalhe abaixo, as formas de realização descritas abaixo fornecem ao codificador 10 a capacidade de adaptar as subdivisões de forma muito eficaz ao conteúdo do sinal de informação a ser codificado e para sinalizar as subdivisões a serem utilizadas para a descodificação lateral a instruir o dispositivo de inserção de fluxo de dados 18 para inserir a informação de subdivisão no fluxo de dados codificados 22. Os detalhes são apresentados abaixo.

No entanto, antes de definir a subdivisão do divisor 20 mais detalhadamente, um descodificador de acordo com uma forma de realização do presente pedido de patente é descrita em mais detalhes com referência à Fig. 2. O descodificador da FIG. 2 é indicado pelo sinal de referência 100 e compreende um extrator 102, um divisor 104, um reconstrutor residual 106, um adicionador 108, um preditor 110, filtro em anel opcional 112 e um pós-filtro opcional 114. O extrator 102 recebe o fluxo de dados codificados numa entrada 116 do descodificador 100 e extrai da informação da subdivisão do fluxo de dados codificados 118, os parâmetros de predição 120 e dados residuais 122 que o extrator 102 emite para o divisor de imagem 104, preditor 110 e reconstrutor residual 106, respetivamente. O reconstrutor residual 106 tem uma saida ligada a uma primeira entrada do adicionador 108. A outra entrada do adicionador 108 e as suas saldas estão ligadas a um circuito de predição no qual o filtro em anel opcional 112 e o preditor 110 são ligados em série pela ordem mencionada com uma rota de passagem que conduz da saida do adicionador 108 para o preditor 110 de forma diretamente semelhante à das ligações acima mencionadas entre o adicionador 36 e o preditor 12 na Fig. 1, ou seja, um para a predição de intra-imagem e o outro para a predição de inter-imagem. Tanto a saida do acionador 108 como a saida do filtro em anel 112 podem ser ligadas a uma saida 124 do descodificador 100, em que o sinal de informação reconstruído é enviado para um dispositivo de reprodução, por exemplo. Um pós-filtro opcional 114 pode ser ligado dentro do caminho que conduz à saida 124 a fim de melhorar a qualidade visual da impressão visual do sinal reconstruído na saída 124.

De um modo geral, o reconstrutor residual 106, o adicionador 108 e o preditor 110 atuam como elementos 16, 36 e 12 na Fig. 1. Por outras palavras, mesmo emula o funcionamento dos elementos já referidos da Fig. 1. Para este fim, o reconstrutor residual 106 e o preditor 110 são controlados pelos parâmetros de predição 120 e a subdivisão prescrita pelo divisor de imagem 104 de acordo com a informação da subdivisão 118 a partir do extrator 102, respetivamente, a fim de prever as sub-regiões de predição da mesma maneira que o preditor 12 fez ou decidiu fazer, e a fim de retransformar os coeficientes de transformação recebidos na mesma granularidade que o pré-codificador residual 14 fez. O divisor de imagem 104, por sua vez, reconstitui as subdivisões escolhidas pelo divisor 20 da Fig. 1 de uma forma sincronizada, baseando-se na informação da subdivisão 118. O extrator pode usar, por sua vez, a informação da subdivisão, a fim de controlar a extração de dados, tais como, em termos de seleção de contexto, determinação da vizinhança, estimativa de probabilidade, análise da sintaxe do fluxo de dados etc. Vários desvios podem ser realizados sobre as formas de realização acima referidas. Alguns são mencionados na descrição detalhada a seguir em relação à subdivisão feita pelo subdivisor 28 e da fusão realizada por fusão 30 e outros são descritos em relação às Figs. 12 a 16 subsequentes. Na ausência de quaisquer obstáculos, todos estes desvios podem ser aplicados, individualmente ou em subconjuntos à descrição acima mencionada da Fig. 1 e Fig. 2, respetivamente. Por exemplo, os divisores 20 e 104 podem não determinar uma subdivisão de predição e uma subdivisão residual por imagem somente. Em vez disso, eles também podem determinar uma subdivisão de filtro para o filtro em anel opcional 38 e 112, respetivamente, tanto independente ou dependente das outras subdivisões para a predição ou codificação residual, respetivamente. Além disso, a determinação da subdivisão de ou subdivisões por estes elementos não podem ser realizadas numa base de quadro a quadro. Em vez disso, uma subdivisão ou subdivisões determinadas para um determinado quadro podem ser reutilizadas ou adotadas para determinado número de quadros sequintes transferindo apenas uma nova subdivisão.

Ao fornecer mais detalhes sobre a divisão das imaqens em sub-regiões, a seguinte descrição concentra-se em primeiro lugar na parte da subdivisão onde o subdivisor 28 e 104a assume a responsabilidade. Em seguida, o processo de fusão onde o fusor 30 e o fusor 104b assumem a responsabilidade, é descrita. Por último, a adaptação/predição do inter-plano é descrita. A forma como o subdivisor 28 e 104 dividem as imagens é tal que uma imagem é dividida num determinado número de blocos de tamanhos diferentes, possivelmente com a finalidade de codificação preditiva e residual dos dados de imagem ou de video. Como mencionado anteriormente, uma imagem 24 pode estar disponível como um ou mais arranjos de valores de amostra de imagem. No caso do espaço de cor YUV/YCbCr, por exemplo, o primeiro arranjo pode representar o canal de luminância, enquanto os outros dois arranjos representam canais de crominância. Estes arranjos podem ter diferentes dimensões.

Todos os arranjos podem ser agrupados num ou mais grupos de plano, com cada grupo de plano que consiste num ou mais planos consecutivos de tal modo que cada plano está contido num e somente um grupo de plano. Para cada grupo de plano é aplicável o seguinte. O primeiro arranjo de um grupo de plano particular pode ser denominado arranjo primário deste grupo de plano. Os possíveis arranjos seguintes são arranjos subordinados. A divisão de blocos do arranjo primário pode ser feita com base numa abordagem quadtree como descrito abaixo. A divisão em blocos dos arranjos subordinados pode ser derivada com base na divisão do conjunto primário.

De acordo com as formas de realização descritas a seguir, os subdivisores 28 e 104a são configurados para dividir o arranjo primário num número de blocos quadrados de tamanho igual, os assim chamados blocos de árvore a seguir. O comprimento da aresta dos blocos de árvores é tipicamente uma potência de dois, tais como 16, 32 ou 64, quando são usados quadtrees. Para efeitos de completude, no entanto, deve ser notado que a utilização de outros tipos de árvores seria possível, assim como as árvores binárias, ou árvores com qualquer número de folhas. Além disso, o número de árvores descendentes pode ser variado dependendo do nível da árvore e, dependendo do que o sinal da árvore representar.

Além disso, como mencionado acima, o arranjo de amostras pode também representar outras informações de sequências de vídeo, tais como mapas de profundidade ou campos luminosos, respetivamente. Para simplificar, a seguinte descrição concentra-se em quadtrees como um exemplo representativo para multi-trees. Quadtrees são árvores que têm exatamente quatro descendentes em cada nó interno. Cada um dos blocos de árvores constitui um quadtree primário juntamente com quadtrees subordinados em cada uma das folhas do quadtree primário. O quadtree primário determina a subdivisão de um dado bloco de árvore para a predição enquanto um quadtree subordinado determina a subdivisão de um dado bloco de predição com o propósito de codificação residual. O nó da raiz do quadtree primário corresponde ao bloco de árvore completo. Por exemplo, a Fig. 3a mostra um bloco de árvore 150. Deve ser relembrado que cada imagem é dividida numa grelha regular de linhas e colunas de tais blocos de árvores 150 de modo que os mesmos, por exemplo, cobrem a gama de amostras sem intervalos. No entanto, deve ser notado que para todas as subdivisões de blocos mostradas a seguir, a subdivisão constante sem sobreposição não é crítica. Em vez disso, os blocos vizinhos podem sobrepor-se entre si, desde que nenhum bloco de folhas seja uma subporção adequada de um bloco de folhas vizinho.

Ao longo da estrutura quadtree para o bloco de árvore 150, cada nó pode ser ainda dividido em quatro nós descendentes, que, no caso do quadtree primário significa que cada bloco de árvore 150 pode ser dividido em quatro sub-blocos com metade da largura e metade da altura do bloco de árvore 150. Na Fig. 3a, estes sub-blocos são indicados com números de referência 152a a 152d. Da mesma maneira, cada um destes sub-blocos pode ainda ser dividido em quatro sub-blocos menores, com metade da largura e metade da altura dos primeiros sub-blocos. Na Fig. 3d isso é mostrado de forma exemplificativa para o sub-bloco 152c, que é subdividido em quatro pequenos sub-blocos 154a a 154d. Na medida em que as Figs. 3a a 3c mostram como um bloco de árvore exemplar 150 é primeiro dividido nos seus quatro sub-blocos 152a a 152d, então o sub-bloco 152c inferior esquerdo é ainda dividido em quatro pequenos sub-blocos 154a a 154d e, finalmente, como mostrado na Fig. 3c, o bloco 154b superior direito desses pequenos sub-blocos é mais uma vez dividido em quatro blocos com um oitavo da largura e altura do bloco de árvore original 150, sendo estes blocos menores designados com 156a a 156d. A Fig. 4 mostra a estrutura da árvore subjacente para a divisão quadtree exemplificativa, como mostrado nas Figs. 3a-3d. Os números ao lado dos nós da árvore são os valores de um chamado sinalizador de subdivisão, que serão explicados em detalhe posteriormente quando se discute a sinalização da estrutura quadtree. O nó da raiz do quadtree é representado no topo da figura (rotulado "Nível 0") . As quatro ramificações no nível 1 deste nó da raiz correspondem aos quatro sub-blocos, como mostrado na Fig. 3a. À medida que o terceiro dentre esses sub-blocos é posteriormente subdividido nos seus quatro sub-blocos, na Fig. 3b, o terceiro nó no nível 1 na Fig.4 também tem quatro ramificações. Mais uma vez, correspondendo à subdivisão do segundo (canto superior direito) nó descendente na Fig. 3c, existem quatro sub-ramificações relacionadas com o segundo nó no nivel 2 da hierarquia quadtree. Os nós no nivel 3 não são mais subdivididos.

Cada folha do quadtree primário corresponde a um bloco de tamanho variável para o qual os parâmetros de predição individuais podem ser especificados (isto é, o modo de intra- ou inter-predição, parâmetros de movimento, etc.) A seguir, estes blocos são chamados blocos de predição. Em particular, estes blocos de folhas são os blocos mostrados na Fig. 3c. Com breve referência novamente à descrição das Figs. 1 e 2, o divisor 20 ou subdivisor 28 determina a subdivisão quadtree como já explicada. O subdivisor 152a-d efetua a decisão sobre qual dos blocos de árvore 150, sub-blocos 152a-d, pequenos sub-blocos 154a-d e assim por diante, a subdividir ou particionar adicionalmente, com o objetivo de encontrar uma compensação ótima entre uma subdivisão de predição muito fina e uma subdivisão de predição muito grossa, como já indicado acima. O preditor 12, por sua vez, utiliza a subdivisão de predição prescrita, a fim de determinar os parâmetros de predição mencionados acima a uma granularidade dependendo da subdivisão de predição ou para cada uma das sub-regiões de predição representadas pelos blocos mostrados na Fig. 3c, por exemplo.

Os blocos de predição representados na Fig. 3c podem ser ainda divididos em blocos menores para o propósito de codificação residual. Para cada bloco de predição, ou seja, para cada nó de folha do quadtree primário, a subdivisão correspondente é determinada por um ou mais quadtrees subordinados para a codificação residual. Por exemplo, ao permitir que o tamanho do bloco máximo de resíduos de 16x16, um dado bloco de predição de 32 χ 32 pode ser dividido em quatro blocos de 16 χ 16, cada um dos quais sendo determinado por um quadtree subordinado para codificação residual. Cada bloco de 16 x 16, neste exemplo, corresponde ao nó de raiz de um quadtree subordinado .

Tal como descrito para o caso da subdivisão de um dado bloco de árvore em blocos de predição, cada bloco de predição pode ser dividido num certo número de blocos residuais pelo uso de decomposição(ões) quadtree subordinada(s). Cada folha de um quadtree subordinado corresponde a um bloco residual para o qual parâmetros de codificação individuais residuais podem ser especificados (isto é, modo de transformação, coeficientes de transformação, etc.) pelo pré-codificador residual 14 em que codifica os parâmetros de codificação controlam, por sua vez, os reconstrutores residuais 16 e 106, respetivamente.

Por outras palavras, o subdivisor 28 pode ser configurado para determinar, para cada imagem, ou para cada grupo de imagens uma subdivisão de predição e uma subdivisão residual subordinada em primeiro lugar, dividindo a imagem num arranjo regular de blocos de árvore 150, uma partição recursiva de um subconjunto destes blocos de árvore por subdivisão quadtree, a fim de obter a subdivisão de predição em blocos de predição - que podem ser blocos de árvore se nenhuma partição tiver ocorrido no bloco de árvore respetivo, ou os blocos de folhas da subdivisão quadtree com, em seguida, ainda outra subdivisão de um subconjunto destes blocos de predição, numa maneira similar, por, se um bloco de predição for maior do que o tamanho máximo da subdivisão residual subordinada, em primeiro lugar, divisão do bloco de predição correspondente num arranjo regular de sub-blocos de árvore com então subdivisão de um subconjunto destes sub-blocos de árvore em conformidade com o procedimento de subdivisão quadtree, a fim de obter os blocos residuais - que podem ser blocos de predição, se não tiver ocorrido qualquer divisão em sub-blocos de árvore no bloco de predição respetivo, sub-blocos de árvore, se nenhuma divisão em regiões ainda menores teve lugar nos respetivos sub-blocos, ou blocos de folhas da subdivisão quadtree residual.

Como brevemente descrito acima, as subdivisões escolhidas para um arranjo primário podem ser mapeadas sobre arranjos subordinados. Isso é fácil quando se consideram arranjos subordinados da mesma dimensão do arranjo primário. No entanto, medidas especiais devem ser tomadas quando as dimensões dos arranjos subordinados diferem da dimensão do arranjo primário. De um modo qeral, o mapeamento da subdivisão do arranjo primário em arranjos subordinados em caso de dimensões diferentes pode ser feita por mapeamento espacial, ou seja, por mapeamento espacial das fronteiras de blocos da subdivisão de arranjo primário em arranjos subordinados. Em particular, para cada arranjo subordinado, pode haver um fator de escala no sentido horizontal e vertical, que determina a relação entre a dimensão do arranjo primário para com o arranjo subordinado. A divisão do arranjo subordinado em sub-blocos de codificação preditiva e residual pode ser determinada pelo quadtree primário e o quadtree (s) subordinado (s) de cada um dos blocos de árvore co-instalados do arranjo primário, respetivamente, com os blocos de árvore resultantes do arranjo subordinado sendo escalados pelo fator de escala relativa. No caso dos fatores de escala em direções horizontais e verticais diferentes (por exemplo, como em subamostraqem de crominância 4:2:2), a predição resultante e blocos residuais do arranjo subordinado não seriam mais quadrados. Neste caso, é possível predeterminar, ou selecionar adaptativamente (quer seja para toda a sequência, uma imaqem fora de sequência ou para cada predição única ou residual) se o bloco não-quadrado residual deve ser dividido em blocos quadrados. No primeiro caso, por exemplo, o codificador e descodificador podem concordar numa subdivisão em blocos quadrados por cada vez que um bloco mapeado não for elevado ao quadrado. No sequndo caso, o subdivisor 28 pode sinalizar a seleção por meio do dispositivo de inserção de fluxo de dados 18 e fluxo de dados 22 para o subdivisor 104a. Por exemplo, no caso de subamostraqem de crominância 4:2:2, em que os arranjos subordinados têm metade da larqura, mas a mesma altura que o arranjo primário, os blocos residuais teriam o dobro de larqura.

Através da divisão vertical, este bloco poderia obter dois blocos quadrados de novo.

Como mencionado acima, o subdivisor 28 ou divisor 20, respetivamente, sinaliza a divisão quadtree através do fluxo de dados 22 para o subdivisor 104a. Para este fim, o subdivisor 28 informa o dispositivo de inserção de fluxo de dados 18 sobre as subdivisões escolhidas para imagens 24. O dispositivo de inserção de fluxo de dados, por sua vez, transmite a estrutura do quadtree primário e secundário e, por conseguinte, a divisão do arranjo de imagem em blocos de tamanho variável para predição ou codificação residual dentro do fluxo de dados ou fluxo de bits 22, respetivamente, para o lado da descodificação.

Os tamanhos mínimos e máximos de bloco admissíveis são transmitidos como informação suplementar e podem mudar de imagem para imagem. Ou os tamanhos mínimos e máximos de bloco admissíveis podem ser fixados no codificador e no descodificador. Estes tamanhos do bloco mínimo e máximo podem ser diferentes para os blocos de predição e residual. Para a sinalização da estrutura quadtree, o quadtree tem que ser percorrido e para cada nó que tem de ser especificado se este nó particular é um nó de folha quadtree (ou seja, o bloco correspondente não é subdividido posteriormente), ou, se é ramificado nos seus quatro nós descendentes (isto é, o bloco correspondente é dividido em quatro sub-blocos com metade do tamanho) . A sinalização dentro de uma imagem é feita bloco de árvore por bloco de árvore numa ordem de digitalização raster como da esquerda para a direita e de cima para baixo, como ilustrado na Fig. 5a com 140. Esta ordem de digitalização também pode ser diferente, como do lado inferior direito para cima, à esquerda ou no sentido de xadrez. Numa forma de realização preferida, cada bloco de árvore e, portanto, cada quadtree é percorrido em profundidade de primeira ordem para a sinalização das informações da subdivisão.

Numa forma de realização preferida, não só as informações de subdivisão, ou seja, a estrutura da árvore, mas também os dados de predição, etc., isto é, a carga útil associada aos nós das folhas da árvore, é transmitida/processada por ordem de prioridade de profundidade. Isso é feito porque a transversal de prioridade de profundidade tem grandes vantagens sobre a ordem de prioridade de largura. Na Fig. 5b, uma estrutura quadtree é apresentada com os nós da folha marcados como a, b, . . ., j . A Fig. 5a mostra a divisão de blocos resultante. Se os blocos/nós da folha são percorridos em primeira ordem de largura, obtemos a seguinte ordem: abjchidefg. Em ordem de prioridade de profundidade, no entanto, a ordem é abc ... ij . Como pode ser visto a partir da Fig. 5a, na ordem de prioridade de profundidade, o bloco vizinho esquerdo e bloco vizinho superior são sempre transmitidos/processados antes do bloco atual. Assim, a predição do vetor de movimento e modelagem de contexto podem usar sempre os parâmetros especificados para o bloco vizinho esquerdo e superior, a fim de obter um melhor desempenho de codificação. Para a ordem de prioridade de largura, isto não será o caso, uma vez que o bloco j é transmitido antes dos blocos e, g, e i, por exemplo.

Por conseguinte, a sinalização para cada bloco de árvore é feita recursivamente ao longo da estrutura quadtree do quadtree primário de tal forma que para cada nó é transmitido um sinalizador, indicando se o bloco correspondente é dividido em quatro sub-blocos. Se esse sinalizador tem o valor "1" (para "verdadeiro"), então este processo de sinalização é repetido recursivamente para todos os quatro nós descendentes, ou seja, os sub-blocos em ordem de digitalização raster (canto superior esquerdo, superior direito, inferior esquerdo, canto inferior direito) até que o nó de folha do quadtree primário seja alcançado. Note-se que um nó de folha é caracterizado por ter um sinalizador da subdivisão com um valor de "0". Para o caso em que um nó reside no nível mais baixo de hierarquia do quadtree primário e, portanto, corresponde ao tamanho menor do bloco de predição admissível, nenhum sinalizador da subdivisão tem que ser transmitido. Para o exemplo na Fig. 3a-c, em primeiro lugar uma transmissão de "1", tal como mostrado em 190 na Fig. 6a, especificando que o bloco de árvore 150 é dividido nos seus quatro sub-blocos 152a-d. Em seguida, pode-se codificar recursivamente a informação da subdivisão de todos os quatro sub-blocos 152a-d em ordem de verificação raster 200. Para os dois primeiros sub-blocos 152a, b transmitir-se-ia "0", indicando que não se encontram subdivididos (ver 202 na Figura 6a). Para o terceiro sub-bloco 152c (esquerda inferior), transmitir-se-ia "1", indicando que este bloco é subdividido (ver 204 na Fig. 6a) . Agora, de acordo com a abordagem recursiva, os quatro sub-blocos 154a-d deste bloco seriam processados. Aqui, pode-se transmitir "0" para o primeiro (206) e "1" para o segundo (superior direito) sub-bloco (208) . Agora, os quatro blocos de tamanho de bloco menor 156a-d na Fig. 3c seriam processados. No caso de se ter atingido o menor tamanho de bloco permitido neste exemplo, não teriam de ser transmitidos mais dados, uma vez que uma subdivisão adicional não é possível. Caso contrário, "0000", indicando que nenhum destes blocos é dividido, seria transmitido como indicado nas Figs. 6a a 210. Depois disso, seria transmitido "00" para os dois blocos mais baixos, na Fig. 3b (ver 212 na Fig. 6a), e, finalmente, "0" para o bloco do canto inferior direito na Fig. 3a (ver 214). Assim, a cadeia binária completa representando a estrutura quadtree seria ilustrada na Fig. 6a.

Os diferentes sombreados de fundo nesta sequência binária na representação da Fig. 6a correspondem a diferentes níveis na hierarquia da subdivisão à base de quadtree. O sombreado 216 representa o nível 0 (correspondendo a um tamanho de bloco igual ao tamanho de bloco de árvore original), o sombreado 218 representa o nível 1 (correspondendo a um tamanho de bloco igual a metade do tamanho do bloco de árvore original), o sombreado 220 representa o nível 2 (correspondendo a um tamanho de bloco igual a um quarto do tamanho do bloco de árvore original) , e o sombreado 222 representa o nível 3 (correspondente a um tamanho de bloco igual a um oitavo do tamanho de bloco de árvore original) . Todos os sinalizadores da subdivisão do mesmo nível de hierarquia (o que corresponde ao mesmo tamanho de bloco e da mesma cor que na representação de sequência binária exemplar) podem ser codificados por entropia e usando um e o mesmo modelo de probabilidade de inserção 18, por exemplo.

Note-se que, para o caso de um percurso de prioridade de largura, a informação da subdivisão seria transmitida numa ordem diferente, mostrada na Fig. 6b.

Semelhante à subdivisão de cada bloco de árvore para efeitos de predição, a divisão de cada bloco de predição resultante em blocos residuais tem que ser transmitida no fluxo de bits. Além disso, pode haver um tamanho de bloco máximo e mínimo para a codificação residual que é transmitida como informação suplementar e que pode mudar de imagem para imagem. Ou o valor máximo e mínimo para o tamanho do bloco de codificação residual pode ser fixado no codificador e descodif icador. Em cada nó da folha do quadtree primário, tal como os mostrados na Fig. 3c, o bloco de predição correspondente pode ser dividido em blocos residuais do tamanho máximo admissível. Estes blocos são os nós de raiz constituintes da estrutura quadtree subordinada para codificação residual. Por exemplo, se o tamanho do bloco máximo residual para a imagem é de 64 x 64 e o bloco de predição é de tamanho 32x32, então o bloco inteiro de predição corresponderia a um nó raiz subordinado do quadtree (residual) de tamanho 32x32. Por outro lado, se o tamanho do bloco máximo residual para a imagem é de 16 x 16, então o bloco de predição 32x32 consistiria de quatro nós de raiz quadtree residuais, cada um de tamanho 16 x 16. Dentro de cada bloco de predição, a sinalização da estrutura quadtree subordinada é feita nó de raiz por nó de raiz na ordem de digitalização raster (esquerda para a direita, de cima para baixo) . Tal como no caso da estrutura primária quadtree (predição), para cada nó um sinalizador é codificado, que especifica se esse nó particular é dividido nos seus quatro nós descendentes. Então, se esse sinalizador tem um valor de "1", este procedimento é repetido recursivamente para todos os quatro nós descendentes correspondentes e seus correspondentes sub-blocos na ordem de digitalização raster (canto superior esquerdo, superior direito, inferior esquerdo, canto inferior direito) até que um nó de folha do quadtree subordinado seja atingido. Tal como no caso do quadtree primário, não é necessária a sinalização para os nós de nivel mais baixo da hierarquia do quadtree subordinada, uma vez que os nós correspondem aos blocos do bloco residual do tamanho menor possível, que não podem ser mais divididos.

Para codificação por entropia, sinalizadores da subdivisão residual do bloco pertencente a blocos residuais do mesmo tamanho de bloco podem ser codificados utilizando um único modelo de mesma probabilidade.

Assim, de acordo com o exemplo apresentado acima em relação às Figs. 3a a 6a, o subdivisor 28 definiu uma subdivisão primário para fins de predição e uma subdivisão subordinada dos blocos de tamanhos diferentes da subdivisão primária para fins de codificação residuais. 0 dispositivo de inserção do fluxo de dados 18 codificou a subdivisão primária através da sinalização para cada bloco de árvore numa ordem de digitalização em ziguezague, uma sequência de bits construídos de acordo com a Fig. 6a, juntamente com o tamanho do bloco de codificação máximo primário e o nível de hierarquia máxima da subdivisão primária. Para cada bloco de predição assim definido, os parâmetros de predição associados foram incluídos no fluxo de dados. Além disso, uma codificação de informações semelhantes, ou seja, o tamanho máximo, o nível de hierarquia e sequências de bits máxima de acordo com a Fig. 6a, foi realizada para cada bloco de predição, o tamanho do qual era igual ou menor do que o tamanho máximo para a subdivisão residual e para cada bloco residual da raiz da árvore no qual os blocos de predição previamente dividiram o tamanho que excede o tamanho máximo definido para os blocos residuais. Para cada bloco residual assim definido, os dados residuais são inseridos no fluxo de dados. 0 extrator 102 extrai as sequências de bits respetivas a partir do fluxo de dados na entrada 116 e informa o divisor 104 sobre as informações da subdivisão assim obtidas. Além disso, o dispositivo de inserção de fluxo de dados 18 e o extrator 102 podem usar a ordem acima mencionada entre os blocos de predição e os blocos residuais para transmitir elementos de sintaxe adicionais, tais como saida de dados residuais pelo pré-codificador residual 14 e saida dos parâmetros de predição pelo preditor 12. Usando esta ordem tem vantagens em que os contextos adequados para codificar os elementos de sintaxe individuais para um determinado bloco podem ser escolhidos através da exploração de elementos de sintaxe já codificados/descodifiçados de blocos vizinhos. Além disso, de forma semelhante, o pré-codificador residual 14 e o preditor 12, bem como o reconstrutor residual 106 e o pré-codificador 110 podem processar a predição individual e blocos residuais na ordem acima descrita. A Fig. 7 mostra um diagrama de fluxo das etapas, que podem ser realizadas pelo extrator 102, a fim de extrair a informação da subdivisão do fluxo de dados 22, quando codificado no modo como descrito acima. Num primeiro passo, o extrator 102 divide a imagem 24 em blocos de árvores de raiz 150. Este passo está indicado como passo 300 na Fig. 7. O passo 300 pode envolver o extrator 102 extraindo o tamanho máximo do bloco de predição a partir do fluxo de dados 22. Adicionalmente ou em alternativa, o passo 300 pode envolver o extrator 102 que extrai o máximo nivel de hierarquia do fluxo de dados 22.

Em seguida, num passo 302, um extrator 102 descodifica o sinalizador ou bit do fluxo de dados. Quando o passo 302 é executado pela primeira vez, o extrator 102 sabe que o sinalizador correspondente é o primeiro sinalizador da sequência de bits pertencentes ao primeiro bloco de raiz da árvore 150 na ordem de diqitalização do bloco da raiz da árvore 140. Como este sinalizador é um sinalizador de nível de hierarquia 0, o extrator 102 pode usar uma modelação de contexto associada a esse nível 0 de hierarquia no passo 302, a fim de determinar um contexto. Cada contexto pode ter uma estimativa de probabilidade correspondente para a descodificação por entropia do sinalizador associado com a mesma. A estimativa da probabilidade dos contextos pode, em contexto individual, ser adaptada à respetiva estatística de símbolo do contexto. Por exemplo, a fim de determinar um contexto apropriado para descodificar o sinalizador de nivel 0 de hierarquia no passo 302, o extrator 102 pode selecionar um contexto de um conjunto de contextos, que está associado com esse nível 0 de hierarquia, dependendo do nível 0 de hierarquia do sinalizador de blocos de árvore vizinhos, ou mesmo, dependendo da informação contida dentro das cadeias de bits que definem a subdivisão quadtree de blocos de árvore vizinhos do bloco de árvore atualmente processado, tais como o bloco de árvore vizinho superior e esquerdo.

No passo seguinte, ou seja, passo 304, o extrator 102 verifica se o sinalizador recentemente descodificado sugere uma partição. Se este for o caso, o extrator 102 executa a partição do bloco atual - presente como um bloco de árvore - ou indica essa partição ao subdivisor 104a no passo 306 e verifica, no passo 308, se o nível de hierarquia atual era igual ao nível de hierarquia máxima menos um. Por exemplo, o extrator 102 pode, por exemplo, também ter o nível de hierarquia máximo extraído do fluxo de dados no passo 300. Se o nível de hierarquia atual for desigual ao nível de hierarquia máxima menos um, o extrator 102 aumenta o nível de hierarquia atual por 1 no passo 310 e recua para o passo 302 para descodificar o próximo sinalizador do fluxo de dados. Desta vez, os sinalizadores a ser descodificados no passo 302 pertencem a outro nível de hierarquia e, portanto, de acordo com uma forma de realização, o extrator 102 pode selecionar um dos diferentes conjuntos de contextos, o conjunto que pertence ao nível de hierarquia atual. A seleção também pode basear-se em sequências de bits de subdivisão de acordo com a Fig. 6a de blocos de árvore vizinhos já descodificados.

Se um sinalizador for descodificado, e a verificação no passo 304 revelar que este sinalizador não sugere uma partição do bloco atual, o extrator 102 continua para o passo 312 para verificar se o nível de hierarquia atual é 0. Se este for o caso, o extrator 102 prossegue o processamento em relação ao bloco seguinte da raiz da árvore na ordem da digitalização 140 no passo 314, ou interrompe o processamento da extração da informação da subdivisão, se não houver mais nenhum bloco da raiz da árvore a ser processado.

Deve ser notado que a descrição da Fig. 7 concentra-se na descodificação dos sinalizadores de indicação de subdivisão da subdivisão da predição apenas, de modo que, de facto, o passo 314 poderia implicar a descodificação de caixas adicionais ou elementos de sintaxe referentes, por exemplo, ao bloco de árvore atual. Em qualquer caso, se existir outro ou um próximo bloco de raiz da árvore, o extrator 102 prossegue a partir do passo 314 para o passo 302 para descodificar o sinalizador próximo a partir da informação da subdivisão, isto é, o primeiro sinalizador da sequência de indicadores em relação ao novo bloco de raiz da árvore.

Se, no passo 312, o nível de hierarquia acabar por ser diferente de 0, a operação prossegue para o passo 316 com uma verificação para saber se existem outros nós descendentes pertencentes ao nó atual. Isto é, quando o extrator 102 executa a verificação no passo 316, já foi verificado no passo 312 que o nível de hierarquia atual é um nível de hierarquia diferente do nível 0 de hierarquia. Isto, por sua vez, significa que existe um nó progenitor, que pertence a um bloco de raiz da árvore 150 ou um dos blocos menores 152a-d, ou blocos ainda menores 152a-d, e assim por diante. 0 nó da estrutura da árvore, ao qual o sinalizador recém-descodifiçado pertence, tem um nó progenitor, que é comum a três nós adicionais da estrutura da árvore atual. A ordem de digitalização entre tais nós descendentes com um nó progenitor comum foi ilustrada de modo exemplificativo na Fig. 3 para o nível 0 de hierarquia com o sinal de referência 200. Assim, no passo 316, o extrator 102 verifica quanto ao facto de cada um destes quatro nós descendentes já terem sido visitados no âmbito do processo da Fig. 7. Se este não for o caso, isto é, se não houver nós descendentes adicionais com o nó progenitor atual, o processo da Fig. 7 prossegue com o passo 318, onde o nó descendente seguinte de acordo com uma ordem de digitalização em ziguezague 200 dentro do nível de hierarquia atual é visitado, de modo que o seu sub-bloco correspondente agora representa o bloco atual do processo 7 e, a partir daí, um sinalizador é descodificado no passo 302 a partir do fluxo de dados em relação ao bloco atual ou nó atual. Se, no entanto, não existirem nós descendentes adicionais para o nó progenitor atual no passo 316, o processo da Fig. 7 prossegue para o passo 320, onde o nível de hierarquia atual é diminuído por 1, em que a seguir o processo avança com o passo 312.

Ao realizar as etapas mostradas na Fig. 7, o extrator 102 e o subdivisor 104a cooperam para recuperar a subdivisão escolhida do lado do codificador a partir do fluxo de dados. O processo da Fig. 7 é concentrado no caso acima descrito de subdivisão da predição. A Fig. 8 mostra, em combinação com o diagrama de fluxo da Fig. 7, como o extrator 102 e o subdivisor 104a cooperam para recuperar a subdivisão residual do fluxo de dados.

Em particular, a Fig. 8 mostra os passos executados pelo extrator 102 e subdivisor 104a, respetivamente, para cada bloco de predição resultante da subdivisão de predição. Estes blocos de predição são percorridos, como mencionado acima, de acordo com uma ordem de digitalização em ziguezague 140 entre os blocos de árvore 150 da subdivisão de predição e utilização de uma ordem transversal de prioridade de profundidade no interior de cada bloco de árvore 150 atualmente visitado para atravessar os blocos de folha como mostrado, por exemplo, na Fig. 3c. De acordo com a ordem de transversal de prioridade de profundidade, os blocos de folhas de blocos de árvore primários particionados são visitados na ordem transversal de prioridade de profundidade com a visita de sub-blocos de um determinado nivel de hierarquia tendo um nó comum atual na ordem de digitalização em ziguezague 200 e principalmente a digitalização da subdivisão de cada um destes sub-blocos antes de prosseguir para o próximo sub-bloco, por esta ordem de digitalização em ziguezague 200.

Para o exemplo na Fig. 3c, a ordem de digitalização resultante entre os nós de folha do bloco de árvore 150 é mostrada com o sinal de referência 350.

Para um bloco de predição atualmente visitado, o processo da Fig. 8 começa no passo 400. No passo 400, um parâmetro interno indicando o tamanho atual do bloco atual é ajustado igual ao tamanho do nivel de hierarquia 0 da subdivisão residual, ou seja, o tamanho máximo do bloco da subdivisão residual. Deve ser lembrado que o tamanho máximo do bloco residual pode ser menor do que o menor tamanho de bloco de subdivisão de predição ou pode ser igual ou maior do que o último. Por outras palavras, de acordo com uma forma de realização, o codificador é livre para escolher qualquer uma das possibilidades apenas mencionadas.

No passo seguinte, ou seja, o passo 402, é realizada uma verificação se o tamanho do bloco do bloco de predição atualmente visitado é maior do que o parâmetro interno que indica o tamanho atual. Se este for o caso, o bloco de predição atualmente visitado, o qual pode ser um bloco de folhas de subdivisão de predição ou um bloco de árvore da subdivisão de predição, que não tenha sido adicionalmente particionado, é maior do que o tamanho máximo de bloco residual e, neste caso, o processo da Fig. 8 prossegue com passo 300 da Fig. 7. Isto é, ο bloco de predição atualmente visitado é dividido em blocos de raizes da árvore residuais e o primeiro sinalizador da sequência de sinalizadores do primeiro bloco de árvore residual dentro deste bloco de predição atualmente visitado é descodificado no passo 302, e assim por diante.

Se, no entanto, o bloco de predição atualmente visitado tem um tamanho igual ou menor do que o parâmetro interno indicando o tamanho atual, o processo da Fig. 8 prossegue para o passo 404, onde o tamanho do bloco de predição é verificado para determinar se o mesmo é igual ao parâmetro interno indicando o tamanho atual. Se este for o caso, a etapa de divisão 300 pode ser omitida e o processo prossegue diretamente com passo 302 da Fig. 7 .

Se, no entanto, o tamanho do bloco de predição do bloco de predição atualmente visitado é menor do que o parâmetro interno indicando o tamanho atual, o processo da Fig. 8 prossegue com o passo 406, onde o nivel de hierarquia é aumentado em 1 e o tamanho atual é ajustado para o tamanho do novo nivel de hierarquia, assim como dividido por 2 (em ambos os sentidos do eixo no caso de subdivisão quadtree) . Depois disso, a verificação do passo 404 é realizada novamente. O efeito do circuito formado pelos passos 404 e 406 é a de que o nivel de hierarquia sempre corresponde ao tamanho dos blocos correspondentes a serem particionados e independentemente da predição respetiva do bloco ter sido menor ou igual a/maior do que o tamanho máximo do bloco residual. Assim, durante a descodificação dos sinalizadores no passo 302, a modelação de contexto realizada depende do nivel de hierarquia e do tamanho do bloco ao qual o sinalizador se refere, ao mesmo tempo. O uso de diferentes contextos de sinalizadores de diferentes níveis de hierarquia ou tamanhos de bloco, respetivamente, é vantajoso na medida em que a estimativa de probabilidade pode adaptar-se bem à distribuição de probabilidades reais entre as ocorrências do valor do sinalizador com, por outro lado, ter um número relativamente moderado de contextos a serem administrados, reduzindo desse modo a sobrecarga de gestão do contexto, bem como aumentando a adaptação do contexto às estatísticas dos símbolos atuais.

Como já foi notado acima, pode haver mais de um arranjo de amostras e estes arranjos de amostras podem ser agrupados num ou mais grupos de plano. 0 sinal de entrada a ser codificado, entrando na entrada 32, por exemplo, pode ser uma imagem de uma sequência de vídeo ou uma imagem fixa. A imagem pode assim, ser administrada na forma de um ou mais arranjos de amostra. No contexto da codificação de uma imagem de uma sequência de vídeo ou imagem fixa, os arranjos de amostra podem referir-se aos três planos de cores, tais como vermelho, verde e azul ou a planos de luminância ou crominância e, como em representações de cor de YUV ou YCbCr. Além disso, os arranjos de amostras representando alfa, isto é, transparência, e/ou a informação da profundidade em material de vídeo 3-D pode estar presente também. Um determinado número destes arranjos de amostra pode ser agrupado em conjunto como um assim chamado grupo de plano. Por exemplo, a luminância (Y) pode ser um grupo de plano com apenas um arranjo de amostras e de crominância, como CbCr, pode ser outro grupo de plano com dois arranjos de amostra ou, num outro exemplo, YUV pode ser um grupo de plano com três matrizes uma informação de profundidade para o material de vídeo 3-D pode ser um grupo de plano diferente com um único arranjo de amostras. Para cada grupo de plano, uma estrutura quadtree primária pode ser codificada dentro do fluxo de dados 22 para representar a divisão em blocos de predição e para cada bloco de predição, uma estrutura secundária quadtree representa a divisão em blocos residuais. Assim, de acordo com um primeiro exemplo que acabamos de mencionar, onde o componente de luminância é um grupo de plano, enquanto que o componente de crominância forma o outro grupo plano, haveria uma estrutura quadtree para os blocos de predição do plano de luminância, uma estrutura quadtree para os blocos residuais do plano de luminância, uma estrutura quadtree para o bloco de predição do plano de crominância e uma estrutura quadtree para os blocos residuais do plano de crominância. No sequndo exemplo mencionado anteriormente, no entanto, haveria uma estrutura quadtree para os blocos de predição de luminância e crominância juntos (YUV), uma estrutura quadtree para os blocos residuais de luminância e crominância juntos (YUV), uma estrutura quadtree para os blocos de predição de informações de profundidade para o material de vídeo 3-D e uma estrutura quadtree para os blocos residuais da informação de profundidade para o material de vídeo 3-D.

Além disso, na descrição anterior, o sinal de entrada foi dividido em blocos de predição utilizando uma estrutura primária quadtree e foi descrito como esses blocos de predição foram ainda subdivididos em blocos residuais, utilizando uma estrutura de quadtree subordinado. De acordo com uma forma de realização alternativa, a subdivisão pode não terminar no estáqio quadtree subordinado. Isto é, os blocos obtidos a partir de uma divisão usando a estrutura quadtree subordinada podem ainda ser subdivididos com uma estrutura quadtree terciária. Esta divisão, por sua vez, pode ser utilizada para a finalidade da utilização de codificação de novas ferramentas que podem facilitar a codificação do sinal residual. A descrição anterior concentrou-se na subdivisão feita pelo subdivisor 28 e subdivisores 104a, respetivamente. Como mencionado acima, a subdivisão definida pelo subdivisor 28 e 104a, respetivamente, pode controlar a granularidade de processamento dos módulos acima mencionados do codificador 10 e do descodificador 100. No entanto, de acordo com as formas de realização descritas a seguir, os subdivisores 228 e 104a, respetivamente, são seguidos por uma fusão 30 e fusão 104b, respetivamente. Deve notar-se, contudo, que as fusões 30 e 104b são opcionais e podem ser deixadas fora.

Com efeito, no entanto, e como será descrito em mais detalhe abaixo, a fusão proporciona ao codificador a oportunidade de combinar alguns dos blocos de predição ou blocos residuais em grupos ou agregados, de modo que o outro, ou pelo menos alguns dos outros módulos podem tratar estes grupos de blocos juntos. Por exemplo, o preditor 12 pode sacrificar os pequenos desvios entre os parâmetros de predição de alguns blocos de predição tal como determinado pela otimização utilizando a subdivisão do subdivisor 28 e usar parâmetros de predição comuns a todos estes blocos de predição, se a sinalização do grupo dos blocos de predição juntamente com uma transmissão de parâmetros comum para todos os blocos pertencentes a este grupo forem mais promissores em termos da taxa/ taxa de distorção do que sinalizar individualmente os parâmetros de predição para todos os esses blocos de predição. 0 processamento para recuperar a predição de preditores 12 e 110, em si, com base nestes parâmetros de predição comuns pode, no entanto, ainda ocorrer a predição de bloco. No entanto, é também possível que os indicadores 12 e 110 ainda realizem o processo de predição uma vez para todo o grupo de blocos de predição.

Como será descrito em maior detalhe abaixo, é também possível que o grupo de blocos de predição seja não só para a utilização dos mesmos parâmetros de predição ou parâmetros comuns para um grupo de blocos de predição, mas, em alternativa, ou, além disso, permite que o codificador 10 envie um parâmetro de predição para este grupo, juntamente com os resíduos de predição para blocos de predição que pertencem a este grupo, de modo que a sobrecarga de sinalização para a sinalização dos parâmetros de predição para este grupo pode ser reduzida. Neste último caso, o processo de fusão pode apenas influenciar o dispositivo de inserção do fluxo de dados 18, em vez das decisões tomadas pelo pré-codificador residual 14 e o preditor 12. No entanto, mais detalhes são apresentados abaixo. Para efeitos de completude, no entanto, deve notar-se que apenas o aspeto mencionado também se aplica a outras subdivisões, tais como a subdivisão residual ou a subdivisão de filtro mencionada acima.

Em primeiro lugar, a fusão de conjuntos de amostras, tais como a predição e blocos residuais acima mencionados, é motivada, num sentido mais amplo, isto é, não se limita a subdivisão multi-tree acima mencionada. Subsequentemente, no entanto, a descrição foca na fusão de blocos resultantes da subdivisão multi-tree para os quais formas de realização acabam de ser descritas acima.

De modo geral, a fusão dos elementos de sintaxe associados com conjuntos específicos de amostras para o propósito de transmitir parâmetros de codificação associados permite reduzir a taxa de informações de aplicações de codificação de imagem e vídeo. Por exemplo, os arranjos de amostra do sinal a ser codificado são usualmente particionados em conjuntos particulares de amostras ou conjuntos de amostras, que podem representar blocos retangulares ou quadrados, ou qualquer outra coleção de amostras, incluindo as regiões arbitrariamente formadas, em forma de triângulos, ou outras formas. Nas formas de realização acima descritas, as regiões simplesmente ligadas eram os blocos de predição e os blocos residuais resultantes da subdivisão multi-tree. A subdivisão de arranjos de amostra pode ser fixada pela sintaxe ou, como descrito acima, a subdivisão pode ser, pelo menos parcialmente, sinalizada no interior do fluxo de bits. Para manter a taxa de informação suplementar para a sinalização de informações de subdivisão pequena, a sintaxe geralmente permite apenas um número limitado de escolhas, resultando em partição simples, tais como a subdivisão de blocos em blocos menores. Os conjuntos de amostras estão associados a determinados parâmetros de codificação, os quais podem especificar a informação de predição ou modos de codificação residuais, etc. Detalhes sobre este assunto foram descritos acima. Para cada conjunto de amostra, os parâmetros individuais de codificação, tais como para a especificação de predição e/ou codificação residuais podem ser transmitidos. A fim de obter uma melhor eficiência de codificação, o aspeto da fusão descrita a seguir, ou seja, a fusão de dois ou mais conjuntos de amostras nos assim denominados grupos de conjuntos de amostras, permite algumas vantagens, que são descritas mais abaixo. Por exemplo, os conjuntos de amostras podem ser combinados de tal modo que todos os conjuntos de amostras de um tal grupo partilham os mesmos parâmetros de codificação, os quais podem ser transmitidos em conjunto com um dos conjuntos de amostras no grupo. Ao fazer isso, os parâmetros de codificação não têm que ser transmitidos para cada conjunto de amostras do grupo de conjuntos de amostras de forma individual, mas, em vez disso, os parâmetros de codificação são transmitidos apenas uma vez para todo o grupo de conjuntos de amostras. Como resultado, a taxa de informação suplementar para a transmissão dos parâmetros de codificação pode ser reduzida e a eficiência geral de codificação pode ser melhorada. Como uma abordagem alternativa, um refinamento adicional de um ou mais parâmetros de codificação pode ser transmitido a um ou mais conjuntos de amostras de um grupo de conjuntos de amostras. 0 refinamento pode ser aplicado a todos os conjuntos de amostras de um grupo ou apenas ao conjunto de amostras para o qual é transmitido. 0 aspeto da fusão descrito abaixo também fornece ao codificador uma maior liberdade na criação do fluxo de bits 22, uma vez que a abordagem de fusão aumenta significativamente o número de possibilidades para a seleção de uma partição para os arranjos de amostras de uma imagem. Uma vez que o codificador pode escolher entre mais opções, tais como, minimizar uma taxa/ medida de distorção particular, a eficiência de codificação pode ser melhorada. Existem várias possibilidades de operar um codificador. Numa abordagem simples, o codificador poderia em primeiro lugar determinar a melhor subdivisão dos arranjos de amostra. Numa breve referência à Fig. 1, o subdivisor 28 poderia determinar a subdivisão ótima numa primeira fase. Posteriormente, pode ser verificado, para cada conjunto de amostras, se uma fusão com um outro conjunto de amostras ou um outro grupo de conjuntos de amostras, reduz uma taxa/medida de custo de distorção em particular. Com isso, os parâmetros de predição associados a um grupo resultante da fusão de conjuntos de amostras podem ser re-estimados, tais como através da realização de uma nova pesquisa de movimento ou os parâmetros de predição que tenham sido determinados para o conjunto de amostra comum e o conjunto candidato de amostras ou grupo de conjuntos de amostras para a fusão pode ser avaliado para o grupo considerado de conjuntos de amostras. Numa abordagem mais abrangente, uma taxa/medida de custo em particular pode ser avaliada para grupos candidatos adicionais de conjuntos de amostras.

Deve ser notado que a abordagem de fusão descrita a seguir não altera a ordem de processamento dos conjuntos de amostras. Isto é, o conceito de fusão pode ser implementado de certo modo que o atraso não é aumentado, isto é, cada conjunto de amostras continua descodificável no mesmo tempo sem utilizar a abordagem de fusão.

Se, por exemplo, a taxa de bits que é economizada por reduzir o número de parâmetros de predição codificados for maior do que a taxa de bits que está para ser adicionalmente gasta para a codificação de informação de fusão para a indicação da fusão para o lado da descodificação, a abordagem de fusão adicional a ser descrita abaixo resulta num aumento da eficiência de codificação. Além disso, deve ser mencionado que a extensão de sintaxe descrita para a fusão proporciona ao codificador a liberdade adicional na seleção de partição de uma imagem ou um grupo de plano em blocos. Por outras palavras, o codificador não se restringe a realizar a subdivisão em primeiro lugar e, em seguida, verificar se algum dos blocos resultantes tem o mesmo conjunto ou um conjunto semelhante de parâmetros de predição. Como uma alternativa simples, o codificador poderia determinar primeiro a subdivisão de acordo com uma medida de custos de distorção - taxa, em seguida, o codificador poderia verificar, para cada bloco, se uma fusão com um dos seus blocos vizinhos ou o grupo associado de blocos já determinado reduz uma medida de custo da taxa de distorção. Com isso, os parâmetros de predição associados com o novo grupo de blocos pode ser re-estimado, tais como através da realização de uma nova pesquisa de movimento ou os parâmetros de predição que tenham sido determinados para o bloco atual e o bloco vizinho ou grupos de blocos pode ser avaliado para o novo grupo de blocos. A informação da fusão pode ser sinalizada com base em blocos. Efetivamente, a fusão pode também ser interpretada como inferência dos parâmetros de predição para um bloco atual, em que os parâmetros de predição inferidos são igualados com os parâmetros de predição de um dos blocos vizinhos. Em alternativa, os resíduos podem ser transmitidos para blocos dentro de um grupo de blocos.

Assim, a ideia fundamental subjacente ao conceito da fusão descrita abaixo é a de reduzir a taxa de bits que é necessária para a transmissão dos parâmetros de predição ou outros parâmetros de codificação, fundindo blocos vizinhos num grupo de blocos, onde cada grupo de blocos está associado a um único conjunto de parâmetros de codificação, tais como parâmetros de parâmetros de predição ou de codificação residuais. A informação de fusão é sinalizada dentro do fluxo de bits em complemento à informação da subdivisão, se presente. A vantagem do conceito de fusão é um aumento de eficiência de codificação resultante de uma diminuição da taxa de informação suplementar para os parâmetros de codificação. Deve-se notar que os processos de fusão descritos aqui podem também estender-se a outras dimensões que as dimensões espaciais. Por exemplo, um grupo de conjuntos de amostras ou blocos, respetivamente, encontrando-se dentro de várias imagens de vídeo diferentes, pode ser fundido num grupo de blocos. A fusão pode também ser aplicada a compressão de 4-D e de luz de campo de codificação.

Assim, resumidamente retornando para a descrição anterior das Fig. 1 a 8, deve ser notado que o processo de fusão subsequente à subdivisão é vantajoso independentemente do modo especifico que subdivisores 28 e 104a, respetivamente, subdividem as imagens. Para ser mais preciso, este último pode também subdividir as imagens de um modo semelhante a, por exemplo, H.264, ou seja, através da divisão de cada subimagem num arranjo regular de macroblocos retangulares ou quadrados de um tamanho predeterminado, tal como amostras de luminância 16 x 16 ou um tamanho sinalizado dentro do fluxo de dados, cada macrobloco com certos parâmetros de codificação que lhe estão associados que compreende, inter alia, os parâmetros de partição que definem, para cada macrobloco, uma partição numa sub-rede regular de 1, 2, 4 ou algum outro número de divisores que servem como uma granularidade de predição e os parâmetros de predição correspondentes no fluxo de dados, bem como para definir a partição do resíduo e a granularidade de transformação residual correspondente.

Em qualquer caso, a fusão proporciona as vantagens acima mencionadas brevemente discutidas, tais como a redução da taxa de bits de informação suplementar em aplicações de codificação de imagem e vídeo. Um conjunto particular de amostras, que podem representar os blocos retangulares ou quadrados ou regiões moldadas arbitrariamente, ou qualquer outra coleção de amostras, tais como qualquer região simplesmente ligada ou as amostras são normalmente ligadas a um determinado conjunto de parâmetros de codificação e para cada um dos conjuntos de amostras, os parâmetros de codificação são incluídos no fluxo de bits, os parâmetros de codificação que representam, por exemplo, parâmetros de predição, que especificam como o conjunto de amostras correspondente é previsto utilizando amostras já codificadas. A partição dos arranjos de amostras de uma imagem em conjuntos de amostras pode ser fixada pela sintaxe ou pode ser sinalizada pela informação de subdivisão correspondente dentro do fluxo de bits. Os parâmetros de codificação para o conjunto de amostra podem ser transmitidos numa ordem predefinida, a qual é dada pela sintaxe. De acordo com a funcionalidade de fusão, a fusão 30 é capaz de sinalizar, por um conjunto comum de amostras ou de um bloco atual, tais como um bloco de predição ou residual que está fundido com um ou mais conjuntos de amostras num grupo de conjuntos de amostras. Os parâmetros de codificação para um grupo de conjuntos de amostras, por conseguinte, necessitam de ser transmitidos apenas uma vez. Numa forma de realização particular, os parâmetros de codificação de um conjunto de amostras de fluxo não são transmitidos, se o conjunto de amostras de fluxo é fundido com um conjunto de amostras ou um grupo já existente de conjuntos de amostras para o qual os parâmetros de codificação já tenham sido transmitidos. Em vez disso, os parâmetros de codificação para o atual conjunto de amostras são igualados com os parâmetros de codificação do conjunto de amostras ou um grupo de conjuntos de amostras com a qual o atual conjunto de amostras é fundido. Como abordagem alternativa, um refinamento adicional de um ou mais parâmetros de codificação pode ser transmitido para um conjunto de amostras atual. O refinamento pode ser aplicado a todos os conjuntos de amostras de um grupo ou apenas para o conjunto de amostras para o qual é transmitido.

De acordo com uma forma de realização, para cada conjunto de amostras, tais como um bloco de predição como mencionado acima, um bloco residual tal como acima referido, ou um bloco de folhas de uma subdivisão multi-tree como mencionado acima, o conjunto de todos os conjuntos de amostras previamente codificados/descodificados é chamado de "conjunto de conjuntos de amostras causais". Ver, por exemplo, a Fig. 3c. Todos os blocos mostrados nesta Fig. são o resultado de uma determinada subdivisão, tal como uma subdivisão de predição ou uma subdivisão residual ou de qualquer subdivisão multi-tree, ou similar, e a ordem de codificação/descodificação definida entre estes blocos são definidos pela seta 350. Considerando-se um determinado bloco entre esses blocos como sendo o conjunto de amostras atual ou região atual simplesmente ligada, o seu conjunto de conjuntos de amostras causais é feito de todos os blocos anteriores do bloco atual ao longo da ordem 350. No entanto, deve novamente ser relembrado que outra subdivisão não utilizando subdivisão multi-tree seria possível, assim como a seguinte discussão dos princípios que se fundem são relatados.

Os conjuntos de amostras que podem ser utilizados para a fusão com um conjunto atual de amostras são chamados de "conjunto de conjuntos de amostras candidatos" a seguir e é sempre um subconjunto de "conjunto de conjuntos de amostras causais". A maneira como o subconjunto é formado pode ser conhecida para o descodif icador, ou pode ser especificada no interior do fluxo de dados ou fluxo de bits a partir do codificador para o descodificador. Se um determinado conjunto de amostras de fluxo é codificado/descodifiçado e o seu conjunto de conjuntos de amostras candidatos não estiver vazio, ele é sinalizado dentro do fluxo de dados no codificador ou derivado a partir do fluxo de dados no descodificador se o conjunto de amostras é fundido com um conjunto de amostras para fora do conjunto de conjuntos de amostras candidatos e, se assim for, com um deles. Caso contrário, a união não pode ser usada para este bloco, uma vez que o conjunto de conjuntos de amostras candidatos está vazio de qualquer maneira.

Existem diferentes maneiras para determinar como o subconjunto do conjunto de conjuntos de amostras causais constitui o conjunto de conjuntos de amostras candidatos. Por exemplo, a determinação dos conjuntos de amostras candidatos pode basear-se numa amostra no interior do atual conjunto de amostras, o qual é exclusivamente geometricamente definido, tais como a amostra de imagem superior esquerda de um bloco retangular ou quadrado. A partir desta amostra única geometricamente definida, um número diferente de zero, em particular de amostras, é determinado, que representa diretamente vizinhos espaciais desta amostra exclusiva geometricamente definida. Por exemplo, em particular, o número diferente de zero de amostras compreende o vizinho superior e o vizinho esquerdo da amostra exclusiva geometricamente definida do atual conjunto de amostras, de modo que o número não-zero de amostras vizinhos pode ser, no máximo, dois, um, se um dos vizinhos de cima e à esquerda não estiver disponível ou estiver fora da imagem, ou zero, no caso de ambos os vizinhos ausentes. 0 conjunto de conjuntos de amostras candidatas pode então ser determinado a abranger esses conjuntos de amostras que contêm pelo menos um número diferente de zero das amostras vizinhas apenas mencionadas. Ver, por exemplo, a Fig. 9a. 0 conjunto de amostras atual agora sob consideração como sendo a objeto de fusão, deve ser o bloco X e sua amostra geometricamente exclusivamente definida, deve ser exemplarmente a amostra superior esquerda indicada em 400. As amostras vizinhas superiores e esquerdas da amostra 400 são indicadas em 402 e 404. O conjunto de conjuntos de amostras causais ou conjunto de blocos causais é destacado de forma sombreada. Entre estes blocos, os blocos A e B formam uma das amostras vizinhas 402 e 404 e, portanto, estes blocos formam o conjunto de blocos de candidatos ou o conjunto de conjuntos de amostras candidatos.

De acordo com outra forma de realização, o conjunto de conjuntos de amostras candidatas determinado por uma questão de fusão pode adicionalmente ou exclusivamente incluir conjuntos de amostras que contenham um número diferente de zero em particular de amostras, que podem ser um ou dois, que têm a mesma localização espacial, mas estão contidos numa imagem diferente, a saber, por exemplo, uma imagem previamente codif icada/descodif içada. Por exemplo, além dos blocos A e B na Fig. 9a, um bloco de uma imagem previamente codificada pode ser usado, que compreende a amostra na mesma posição como a amostra 400. A propósito, deve ser notado que apenas a parte superior da amostra 404 vizinha ou meramente de exemplo a esquerda vizinha 402 poderia ser usada para definir o número diferente de zero de amostras vizinhos acima mencionados. Em geral, o conjunto de conjuntos de amostras candidatas pode ser derivado a partir dos dados anteriormente processados dentro da imagem atual ou em outras imagens. A derivação pode incluir informação direcional espacial, como transformar coeficientes associados com uma determinada direção e gradientes de imagem da imagem atual ou pode incluir informação direcional temporal, tais como representações de movimento vizinho. A partir de tais dados disponíveis para os dados do recetor/descodificador e outro lado e informações no interior do fluxo de dados, se estiver presente, o conjunto de conjuntos de amostras candidatas podem ser derivadas.

Deve notar-se que a derivação dos conjuntos de amostras candidatas é realizada em paralelo tanto na fusão 30 no lado do codificador como a fusão 104b no lado do descodificador. Como já mencionado, tanto pode determinar o conjunto dos conjuntos de amostras candidatas independente um do outro com base numa maneira predefinida conhecida para ambos ou o codificador pode sinalizar dicas dentro do fluxo de bits, que trazem a fusão 104b em condições de desempenhar a derivação destes conjuntos de amostras candidatas de um modo igual à forma de fusão 30 no lado do codificador determinando o conjunto de conjuntos de amostras candidatas.

Como será descrito em maior detalhe abaixo, a fusão de fluxo de dados 30 e inserção do fluxo de dados 18 cooperam a fim de transmitir um ou mais elementos de sintaxe para cada conjunto de amostras, as quais especificam se o conjunto de amostras é fundido com outro conjunto de amostras, o que, por sua vez, pode ser parte de um grupo já mesclado de conjuntos de amostras, e que do conjunto de conjuntos de amostras é utilizado para candidatos de fusão. O extrator 102, por sua vez, extrai esses elementos de sintaxe e informa o fusor 104b adequadamente. Em particular, de acordo com a forma de realização específica descrita mais adiante, um ou dois elementos de sintaxe são transmitidos para especificar a informação de fusão para um determinado conjunto de amostras. 0 primeiro elemento de sintaxe especifica se o conjunto atual de amostras é mesclado com outro conjunto de amostras. 0 segundo elemento de sintaxe, só é transmitido se o primeiro elemento de sintaxe especificar que o atual conjunto de amostras é mesclado com outro conjunto de amostras, especificando qual conjunto dos conjuntos de amostras candidatos é empregado para a fusão. A transmissão do primeiro elemento de sintaxe pode ser suprimida se um conjunto de derivados de conjuntos de amostras candidatas está vazio. Por outras palavras, o primeiro elemento de sintaxe apenas pode ser transmitido se um conjunto de derivados de conjuntos de amostras candidatos não estiver vazio. 0 segundo elemento de sintaxe só pode ser transmitido se um conjunto de conjuntos de amostras derivadas candidatas contém mais do que um conjunto de amostras, uma vez que, se apenas um conjunto de amostra está contido no conjunto de conjuntos de amostras candidatas, outra seleção não é possível de qualquer maneira. Além disso, a transmissão do segundo elemento de sintaxe pode ser suprimida se o conjunto de conjuntos de amostras candidatas compreenderem mais do que um conjunto de amostras, mas se todos os conjuntos de amostras no conjunto de conjuntos de amostras candidatas são associados com o mesmo parâmetro de codificação. Por outras palavras, o segundo elemento de sintaxe só pode ser transmitido se pelo menos dois conjuntos de amostras de um conjunto de conjuntos de amostras derivadas candidatas são associados com diferentes parâmetros de codificação.

Dentro do fluxo de bits, a informação de fusão para um conjunto de amostras pode ser codificada antes dos parâmetros de predição ou outros parâmetros de codificação específicos que estão associados a esse conjunto de amostras. A parâmetros de predição ou de codificação só podem ser transmitidos se a informação do objeto de fusão sinalizar que o atual conjunto de amostras não deve ser mesclado com qualquer outro conjunto de amostras. A informação de fusão para um determinado conjunto de amostras, isto é, um bloco, por exemplo, pode ser codificada depois de um subconjunto apropriado dos parâmetros de predição, ou, num sentido mais amplo, a codificação de parâmetros que estão associados com o conjunto da amostra respetiva, tiver sido transmitido. 0 subconjunto de parâmetros de predição/codificação pode consistir de um ou mais indices de referência de imagem ou de um ou mais componentes de um vetor de parâmetros de movimento ou de um índice de referência e um ou mais componentes de um vetor de parâmetros de movimento, etc. 0 subconjunto de parâmetros de predição ou de codificação já transmitidos pode ser utilizado para obter um conjunto de amostra candidata estabelecendo um conjunto maior provisório de conjuntos de amostras candidatas, que podem ter sido derivadas como descrito acima. Como um exemplo, uma medida de diferença ou distância de acordo com uma medida de distância predeterminada, entre a predição já codificada e os parâmetros de codificação do atual conjunto de amostras e de predição correspondente ou os parâmetros de codificação do conjunto preliminar de conjuntos de amostras candidatos pode ser calculada. Então, apenas os conjuntos de amostras para os quais a medida de diferença calculada, ou a distância, é menor ou igual a um limiar predefinido ou derivado, e estão incluídos no final, ou seja, um conjunto limitado de conjuntos de amostras candidatas. Ver, por exemplo, a Fig. 9a. 0 atual conjunto de amostras é de bloco de X. Um subconjunto dos parâmetros de codificação que pertencem a este bloco já terá sido inserido no fluxo de dados 22. Imagine-se, por exemplo, o bloco X era um bloco de predição, caso em que o subconjunto apropriado dos parâmetros de codificação pode ser um subconjunto dos parâmetros de predição para este bloco X, tais como um subconjunto de um conjunto que compreende um índice de referência de imagem e informação do mapeamento e movimento, tal como um vetor de movimento. Se o bloco X era um bloco residual, o subconjunto de parâmetros de codificação é um subconjunto da informação residual, tais como coeficientes de transformação, ou um mapa que indica as posições dos coeficientes de transformação significativos no bloco X. Com base nesta informação, tanto o dispositivo de inserção de fluxo de dados 18 e o extrator 102 é capaz de utilizar esta informação para determinar um subconjunto de blocos A e B, a qual forma, nesta forma de realização especifica, o conjunto previamente mencionado preliminar de conjuntos de amostras candidatas. Em particular, uma vez que os blocos A e B pertencem ao conjunto de conjuntos de amostras causais, os parâmetros de codificação destes estão disponíveis para o codificador e descodificador, no momento em que os parâmetros de codificação de blocos X estão atualmente codificados/descodifiçados. Por conseguinte, a comparação acima referida utilizando a medida de diferença pode ser usada para excluir qualquer número de blocos do conjunto inicial dos conjuntos de amostras candidatos A e B. O conjunto resultante reduzido de conjuntos de amostras candidatas pode então ser utilizado como descrito acima, a saber, de modo a determinar quanto ao facto de um indicador de fusão indicando a fusão deve ser transmitido ou deve ser extraído do fluxo de dados, dependendo do número de conjuntos de amostras no conjunto de conjuntos de amostras reduzidas e candidatas quanto ao facto de um segundo elemento de sintaxe ter que ser transmitido, ou ter que ser extraída do fluxo de dados com um elemento de sintaxe indicando que o segundo exemplo definido dentro do conjunto reduzido de conjuntos de amostras candidatas deve ser o bloco parceiro para a fusão. O limiar acima mencionado em relação ao qual as distâncias acima mencionadas são comparadas pode ser fixado e conhecido pelo codificador e descodificador, ou pode ser derivado com base nas distâncias calculadas, tais como a média dos valores de diferença, ou alguma outra tendência central ou semelhante. Neste caso, o conjunto reduzido de conjuntos de amostras candidatas seria inevitável proceder a um subconjunto apropriado do conjunto preliminar de conjuntos de amostras candidatas. Em alternativa, apenas os conjuntos de amostras são selecionados entre o conjunto preliminar de conjuntos candidatos de amostra para o qual a distância de acordo com a distância medida é minimizada. Alternativamente, exatamente um conjunto de amostras é selecionado do conjunto inicial de amostras utilizando o candidato de conjuntos de medida de distância acima mencionado. Neste último caso, a informação de fusão só precisa especificar se o conjunto atual de amostras deverá ser fundido com um candidato único do conjunto de amostras ou não.

Assim, o conjunto de blocos de candidatos pode ser formado ou derivado, tal como descrito a seguir, com referência à Fig. 9a. Partindo da posição da amostra superior esquerda 400 do bloco atual X na Fig. 9a, sua posição da amostra esquerda vizinha 402 e sua posição amostra superior vizinha 404 é derivada - do lado do codificador e descodificador. O conjunto de blocos candidatos pode, portanto, ter apenas até dois elementos, a saber, os blocos do conjunto de blocos sombreados causais na Fig. 9a que contêm uma das duas posições de amostra, o que no caso da Fig. 9a, são blocos B e A. Deste modo, o conjunto de blocos candidatos pode ter apenas dois blocos diretamente vizinhos da posição da amostra superior esquerda do bloco atual, como seus elementos. De acordo com outra forma de realização, o conjunto de blocos de candidatos pode ser dado por todos os blocos que foram codificados antes do bloco atual e contêm uma ou mais amostras que representam os vizinhos diretos espaciais de qualquer amostra do bloco atual. A vizinhança direta espacial pode ser restringida para direcionar vizinhos diretamente da esquerda e/ou vizinhos diretamente superiores e/ou vizinhos diretamente da direita e/ou vizinhos diretamente inferiores de uma amostra do bloco atual. Ver, por exemplo, a Fig. 9b mostrando outra subdivisão do bloco. Neste caso, os blocos candidatos compreendem quatro blocos, denominados os blocos A, B, C e D.

Alternativamente, o conjunto de blocos candidatos, adicionalmente, ou exclusivamente, podem incluir blocos que contêm uma ou mais amostras que estão localizadas na mesma posição, como qualquer uma das amostras do bloco atual, mas estão contidas numa forma diferente, ou seja, imagem já codificada/descodificada.

Ainda alternativamente, o conjunto candidato de blocos representa um subconjunto dos conjuntos acima descritos de blocos, que foram determinados pela vizinhança em direção espacial ou temporal. 0 subconjunto de blocos candidatos pode ser fixado, sinalizado ou derivado. A derivação do subconjunto de blocos candidatos pode considerar as decisões tomadas por outros blocos na imagem ou em outras imagens. A titulo de exemplo, os blocos que estão associados com os mesmos parâmetros de codificação ou muito semelhantes que outros blocos candidatos não podem ser incluídos no conjunto de blocos candidatos. A descrição a seguir de uma forma de realização aplica-se para o caso em que apenas dois blocos que contêm o exemplo vizinho esquerdo e superior da amostra superior esquerda do bloco atual são considerados como candidatos potenciais ao máximo.

Se o conjunto de blocos candidatos não estiver vazio, um sinalizador denominado merge_flag é sinalizado, especificando se o bloco atual é mesclado com qualquer um dos blocos candidatos. Se o merge_flag for igual a 0 (para "falso"), este bloco não é mesclado com um de seus blocos candidatos e todos os parâmetros de codificação são transmitidos normalmente. Se o merge_flag for igual a 1 (para "verdadeiro"), o seguinte aplica-se. Se o conjunto de blocos candidatos contém um único bloco, o bloco candidato é utilizado para a fusão. Caso contrário, o conjunto de blocos candidatos contém exatamente dois blocos. Se os parâmetros de predição destes dois blocos forem idênticos, estes parâmetros de predição são utilizados para o bloco atual. Caso contrário (os dois blocos têm parâmetros diferentes de predição), um sinalizador denominado merge_left_flag é sinalizado. Se o merge_lef t_f lag for igual a 1 (para "verdadeiro"), o bloco com a posição da amostra vizinha esquerda da posição da amostra superior esquerda do bloco atual é selecionado do conjunto de blocos candidatos. Se o merqe_left_flaq for iqual a 0 (para "falso"), o outro (isto é, vizinhança superior) bloqueio do conjunto de blocos candidatos é selecionado. Os parâmetros de predição do bloco selecionado são utilizados para o bloco atual.

Em resumo, para alqumas das formas de realização acima descritas em relação à fusão, é feita referência à Fig. 10 mostrando os passos realizados pelo extrator 102 para extrair a informação de fusão a partir do fluxo de dados 22 da introdução da entrada 116. O processo começa em 450 com a identificação de blocos candidatos ou de conjuntos de amostras para um conjunto de amostras ou blocos atuais. Deve ser lembrado que os parâmetros de codificação para os blocos são transmitidos dentro do fluxo de dados 22, numa ordem de uma dimensão determinada e, por conseguinte, a Fig. 10 refere-se ao processo de recuperação da informação de intercalação para um conjunto de amostras ou de blocos atualmente visitados.

Como mencionado anteriormente, a identificação e o passo 450 pode incluir a identificação entre blocos previamente descodificados, isto é, o conjunto casual de blocos, com base em aspetos da vizinhança. Por exemplo, os blocos vizinhos podem ser nomeados candidatos, que incluem certas amostras de vizinhança que são vizinhas a uma ou mais amostras geometricamente predeterminadas do bloco atual X no espaço ou no tempo. Além disso, o passo de identificação pode compreender duas fases, nomeadas, uma primeira fase envolvendo uma identificação como apenas mencionado, ou seja, com base na vizinhança, que conduz a um conjunto de blocos candidatos preliminar, e uma segunda fase de acordo com a qual apenas os blocos candidatos são nomeados os parâmetros já transmitidos de codificação que satisfazem uma determinada relação com o subconjunto adequado de um dos parâmetros de codificação do bloco X atuais, o que já foi descodificado a partir do fluxo de dados antes do passo 450.

Em seguida, os passos do processo para o passo 452, onde é determinado se o número de blocos candidatos é maior do que zero. Se este for o caso, um merge_flag é extraído do fluxo de dados no passo 454. O passo de extração 454 pode envolver a entropia de descodificação. O contexto para descodificar a entropia merge_flag no passo 454 pode ser determinado com base em elementos de sintaxe pertencentes, por exemplo, ao conjunto de blocos candidatos ou ao conjunto de blocos candidatos preliminares, em que a dependência em relação aos elementos de sintaxe pode ser restringida com a informação se os blocos pertencentes ao conjunto de interesse foram objeto de fusão ou não. A estimativa de probabilidade do contexto selecionado pode ser adaptada.

Se, no entanto, o número de blocos de candidatos é determinado, por sua vez para ser igual a zero 452, o processo da Fig. 10 prossegue com o passo 456 em que os parâmetros de codificação do bloco atual são extraídos do fluxo de bits, ou, no caso da alternativa de identificação acima mencionada de dois estágios, os parâmetros restantes de codificação do mesmo, em que, em seguida os extratores 102 prosseguem com o processamento do próximo bloco da ordem de varredura do bloco, tais como a ordem 350 mostrada na Fig. 3c.

Voltando para a etapa 454, o processo continua, depois da extração no passo 454, com o passo 458 com uma verificação sobre se o merge_flag extraído sugere a ocorrência ou ausência de uma fusão do bloco atual. Se não houver a fusão terá lugar o processo que prossegue com o passo 456 acima mencionado. Caso contrário, o processo prossegue com o passo 460, incluindo a verificação se o número de blocos candidatos é igual a um. Se este for o caso, a transmissão de uma indicação de um bloco candidato determinada entre os blocos de candidatos não era necessária e, portanto, o processo da Fig. 10 prossegue com o passo 462, segundo o qual o parceiro de fusão do bloco de fluxo é ajustado para ser o único bloco candidato, que em seguida no passo 464 os parâmetros de codificação do bloco parceiro de fusão são utilizados para a adaptação ou a predição dos parâmetros de codificação ou dos parâmetros de codificação restantes do bloco atual. Em caso de adaptação, os parâmetros de codificação ausentes do bloco atual são meramente copiados a partir do bloco parceiro de fusão. No outro caso, ou seja, no caso de predição, o passo 464 pode incluir uma extração adicional de dados residuais do fluxo de dados dos dados residuais relativos a predição residual dos parâmetros de codificação ausentes do bloco atual e uma combinação destes dados residuais com a predição destes parâmetros de codificação ausentes obtidos a partir do bloco parceiro de fusão.

Se, no entanto, o número de blocos de candidatos é determinado para ser maior do que um no passo 460, o processo da Fig. 10 segue para o passo 466, onde é realizada uma verificação para saber se os parâmetros de codificação ou a parte interessante dos parâmetros de codificação - nomeadamente a subparte relacionada à parte ainda não ter sido transferida dentro do fluxo de dados para o bloco atual - são idênticos entre si. Se for esse o caso, estes parâmetros de codificação comuns são definidos como intercalação de referência ou os blocos candidatos são definidos como parceiros de fusão no passo 468 e os respetivos parâmetros de codificação são interessantes utilizados para adaptação ou predição no passo 464.

Deve notar-se que o parceiro de fusão por si só pode ter sido um obstáculo para o qual a fusão foi sinalizada. Neste caso, os parâmetros adotados ou preditivamente obtidos codificando parceiros de fusão são usados no passo 464.

Caso contrário, no entanto, isto é, no caso em que os parâmetros de codificação não são idênticos, o processo da Fig. 10 prossegue para o passo 470, onde um elemento de sintaxe adicional é extraído do fluxo de dados, ou seja, este merge_left_flag. Um conjunto separado de contextos pode ser utilizado para descodificar por entropia este sinalizador. O conjunto de contextos utilizado para descodificar por entropia o merge_left_flag também pode compreender apenas um contexto. Após a etapa 470, o bloco candidato indicado por merge_left_flag está definido para ser o parceiro de fusão no passo 472 e usado para adaptação ou predição no passo 464. Após a etapa 464, o extrator 102 prossegue com a manipulação do bloco na próxima ordem do bloco. É claro que existem muitas alternativas. Por exemplo, um elemento de sintaxe combinado pode ser transmitido dentro do fluxo de dados, em vez de separar os elementos de sintaxe merge_flag e merge_left_flag descrito antes, os elementos de sintaxe combinados sinalizam o processo de fusão. Além disso, o merge_left_flag acima mencionado pode ser transmitido dentro do fluxo de dados, independentemente do facto de os dois blocos candidatos ter os mesmos parâmetros de predição ou não, reduzindo assim a carga computacional para a realização do processo da Fig. 10.

Como já foi indicado em relação a, por exemplo, a Fig. 9b, mais do que dois blocos podem ser incluídos no conjunto de blocos candidatos. Além disso, as informações de fusão, isto é, a informação de sinalização se um bloco é fundido e, em caso afirmativo, que o bloco é candidato a ser incorporado pode ser sinalizado por um ou mais elementos de sintaxe. Um elemento de sintaxe pode especificar se o bloco é fundido com qualquer um dos blocos candidatos, tais como o merge_flag descrito acima. O sinalizador só pode ser transmitido se o conjunto de blocos candidatos não estiver vazio. Um segundo elemento de sintaxe pode sinalizar que um dos blocos candidatos é empregado para fusão tal como o merge_left_flag acima mencionado, mas, em geral, indica uma seleção entre dois ou mais do que dois blocos candidatos. 0 segundo elemento de sintaxe pode ser transmitido apenas se o primeiro elemento de sintaxe sinaliza que o bloco atual está para ser fundido com um dos blocos candidatos. 0 segundo elemento de sintaxe pode ainda ser transmitido apenas se o conjunto de blocos candidatos contiver mais do que um bloco candidato e/ou, se qualquer um dos blocos candidatos tiver parâmetros de predição diferentes do que qualquer outro dentre os blocos de candidatos. A sintaxe pode ser, dependendo de quantos blocos candidatos são apresentados e/ou como os parâmetros de predição diferentes estão associados com os blocos candidatos. A sintaxe para sinalizar qual dos blocos dentre os blocos candidatos a ser utilizado, pode ser definida simultaneamente e/ou paralelamente, na lateral do codificador e descodificador. Por exemplo, se houver três opções para blocos candidatos identificadas no passo 450, a sintaxe é escolhida de tal modo que apenas estas três opções estão disponíveis e são consideradas para a codificação por entropia, por exemplo, no passo 470. Por outras palavras, o elemento de sintaxe é escolhido de tal modo que o seu alfabeto simbólico tem simplesmente tantos elementos como escolhas de blocos candidatos existem. As probabilidades para todas as outras escolhas podem ser consideradas como sendo zero e a codificação/descodificação por entropia pode ser ajustada simultaneamente no codificador e descodificador.

Além disso, como já foram referidos em relação ao passo 464, os parâmetros de predição que são inferidos como uma consequência do processo de fusão pode representar o conjunto completo de parâmetros de predição que são associados com o bloco em curso ou podem representar um subconjunto destes parâmetros de predição, tais como os parâmetros de predição para uma hipótese de um bloco para o qual várias hipóteses de predição são usadas.

Como notado acima, os elementos de sintaxe referentes à informação da fusão pode ser codificada por entropia utilizando modelos de contexto. Os elementos de sintaxe podem consistir no merge_flag e no merge_left_flag descrito acima (ou elementos de sintaxe semelhantes). Num exemplo concreto, um em três modelos de contexto ou contextos pode ser utilizado para codificação/descodificação do merge_flag no passo 454, por exemplo. 0 índice usado no modelo do contexto de merge_flag_ctx pode ser derivado da seguinte forma: se o conjunto de blocos candidatos contiver dois elementos, o valor do merge_flag_ctx é igual à soma dos valores do merge_flag dos dois blocos candidatos. Se o conjunto de blocos candidatos contiver um elemento, no entanto, o valor de merge_flag_ctx pode ser igual a duas vezes o valor do merge_flag deste bloco de um candidato. À medida que cada um dos blocos de merge_flag candidatos vizinhos pode ser tanto um ou zero, os três contextos estão disponíveis para merge_flag. 0 merge_left_flag pode ser codificado utilizando apenas um único modelo probabilístico.

No entanto, de acordo com uma forma de realização alternativa, os modelos de contexto diferentes podem ser usados. Por exemplo, os elementos de sintaxe não binários podem ser mapeados para uma sequência de símbolos binários, os chamados compartimentos. Os modelos de contexto para alguns elementos de sintaxe ou compartimentos de elementos de sintaxe que definem a informação da fusão podem ser obtidos com base em elementos de sintaxe já transmitidos de blocos vizinhos ou o número de blocos de candidatos ou de outras medidas, enquanto outros elementos de sintaxe ou compartimentos dos elementos de sintaxe podem ser codificados com um modelo de contexto fixo.

Em relação à descrição acima da fusão de blocos, é verificado que o conjunto de blocos candidatos pode também ser derivado da mesma maneira que para qualquer uma das formas de realização descritas acima, com a seguinte modificação: os blocos candidatos são restritos a blocos com predição com compensação de movimento ou inter-predição, respetivamente. Apenas estes podem ser elementos de um conjunto de blocos candidatos. A sinalização e modelagem do contexto da informação da fusão podem ser realizadas como descrito acima.

Voltando para a combinação das formas de realização descritas acima da subdivisão multi-tree e o aspeto de fusão descrito agora, se a imagem está dividida em blocos quadrados de tamanho variável com o uso de uma estrutura de subdivisão à base de quadtree, por exemplo, os merge_flag e merge_left_flag ou outros elementos de sintaxe especificando a fusão podem ser intercalados com os parâmetros de predição que são transmitidos para cada nó de folha da estrutura quadtree. Considere-se novamente, por exemplo, a Fig. 9a. A Fig. 9a mostra um exemplo de uma subdivisão à base de quadtree numa imagem em blocos de predição de tamanho variável. Os primeiros dois blocos de maior tamanho são os chamados blocos de árvore, isto é, eles são os blocos de predição do tamanho máximo possível. Os outros blocos nesta figura são obtidos como uma subdivisão do seu bloco de árvore correspondente. 0 bloco atual é marcado com um "X". Todos os blocos sombreados são co/descodifiçados antes do bloco atual, e formam o conjunto de blocos causais. Como explicado na descrição da derivação do conjunto de blocos candidatos para uma das formas de realização, apenas os blocos que contêm as amostras diretamente vizinhas (isto é, superior ou esquerda) da posição da amostra superior esquerda do bloco atual podem ser membros do conjunto de blocos candidatos. Assim, o bloco atual pode ser fundido com qualquer bloco "A" ou bloco "B". Se o merge_flag for igual a 0 (para "falso"), o bloco atual "X" não é fundido com qualquer um dos dois blocos. Se os blocos "A" e "B" tiverem os parâmetros de predição idênticos, nenhuma distinção precisa ser feita, uma vez que a fusão com qualquer um dos dois blocos vai provocar o mesmo resultado. Assim, neste caso, o merge_left_flag não é transmitido. Caso contrário, se os blocos "A" e "B" têm parâmetros diferentes de predição, o merge_left_flag igual a 1 (para "verdadeiro") irá fundir os blocos "X" e "B", enquanto o merge_lef t_f lag igual a 0 (para "falso") irá fundir os blocos "X" e "A". Numa outra forma de realização preferida, blocos vizinhos adicionais (já transmitidos) representam candidatos para a fusão.

Na Fig. 9b, outro exemplo é mostrado. Aqui, o bloco atual "X", e o bloco vizinho esquerdo "B" são blocos de árvore, ou seja, eles têm o tamanho de bloco máximo permitido. 0 tamanho do bloco vizinho superior "A" tem um quarto do tamanho do bloco de árvore. Os blocos que são o elemento do conjunto de blocos causais estão sombreados. Note-se que de acordo com uma forma de realização preferida, o bloco atual "X" pode somente ser fundido com os dois blocos "A" ou "B", e não com qualquer um dos outros blocos vizinhos superiores. Na outra realização preferida, outros blocos vizinhos (já transmitidos) representam candidatos para a fusão.

Antes de proceder com a descrição em relação ao aspeto de como lidar com os arranjos de amostras diferentes de uma imagem, de acordo com formas de realização do presente pedido de patente, deve ser notado que a discussão acima sobre a subdivisão multi-tree e a sinalização por um lado e o aspeto de fusão por outro lado é claro que estes aspetos proporcionam vantagens que podem ser exploradas independentes entre si. Isto é, como já foi explicado acima, a combinação de uma subdivisão multi-tree com fusão tem vantagens especificas, mas também estas vantagens resultam a partir de alternativas que, por exemplo, o recurso de fusão é incorporado com, no entanto, a subdivisão feita por subdivisores 30 e 104 não se baseando numa subdivisão quadtree ou multi-tree, mas correspondendo a uma subdivisão do macrobloco com o partição regular destes macroblocos em partes menores. Por outro lado, por sua vez, a combinação da subdivisão multi-tree juntamente com a transmissão do tamanho do bloco de árvore máximo dentro do fluxo de bits, e o uso da subdivisão multi-tree juntamente com a utilização da ordem transversal de prioridade de profundidade, que transportam os parâmetros de codificação dos blocos correspondentes, é vantajosa independentemente da característica de fusão a ser utilizada concomitantemente ou não. Em geral, as vantagens de fusão podem ser entendidas, quando se considera que, intuitivamente, a eficiência de codificação pode ser aumentada quando a sintaxe de códigos de arranjo de amostras é estendida de modo a não só permitir a subdivisão de um bloco, mas também para fundir dois ou mais blocos que são obtidos após a subdivisão. Como resultado, obtém-se um grupo de blocos que são codificados com os mesmos parâmetros de predição. Os parâmetros de predição para um grupo de blocos têm de ser codificados uma vez. Além disso, em relação à fusão de conjuntos de amostras, deve novamente ser notado que os conjuntos considerados de amostras podem ser blocos retangulares ou quadrados, caso em que os conjuntos de amostras fundidos representam uma coleção de blocos retangulares e/ou quadrados. Em alternativa, no entanto, os conjuntos de amostras considerados são regiões de imagem arbitrariamente formadas e os conjuntos fundidos de amostras representam uma coleção de regiões de imagem formadas de forma arbitrária. A descrição a seguir concentra-se na manipulação de arranjos de amostras diferentes de uma imagem no caso de haver mais de uma amostra por arranjos de imagem e, em alguns aspetos descritos na seguinte subdescrição são vantajosos independentemente do tipo de subdivisão usada, isto é, independentemente da subdivisão se basear em subdivisão multitree ou não, e independentemente da fusão que está a ser usada ou não. Antes de começar com a descrição de formas de realização especificas relativas ao processamento de arranjos de amostras diferentes de uma imagem, o principal problema destas formas de realização é motivado por meio de uma breve introdução no campo do processamento de arranjos de amostra diferentes por imagem. A discussão a seguir concentra-se em parâmetros de codificação entre os blocos de arranjos de amostras diferentes de uma imagem na aplicação de codificação de video ou imagem, e, em particular, uma forma de prever adaptativamente os parâmetros de codificação entre os arranjos de amostras diferentes de uma imagem, por exemplo, mas não exclusivamente no codificador e descodificador das Figs. 1 e 2, respetivamente, ou outro ambiente de codificação de imagem ou video. Os arranjos de amostra podem, tal como observado acima, representar arranjos de amostra que estão relacionados com os componentes de cor diferentes ou arranjos de amostra que estão associados a uma imagem com informação adicional, tal como dados de transparência ou mapas de profundidade. Arranjos de amostra que estão relacionados com os componentes de cor de uma imagem são também referidos como planos de cor. A técnica descrita a seguir também é referida como a adoção/predição inter-plano e pode ser usada numa imagem baseada em blocos e os codificadores e descodificadores de video, em que a ordem de processamento dos blocos de arranjos de amostra para uma imagem pode ser arbitrária.

Codificadores de imagem e video são normalmente concebidos para a codificação de imagens a cores (tanto de imagens estáticas como imagens de uma sequência de video). Uma imagem de cores consiste de planos de cores múltiplos, que representam arranjos de amostra para componentes de cores diferentes. Muitas vezes, as imagens de cor são codificadas como um conjunto de arranjos de amostra consistindo de um plano de luminância e dois planos de crominância, em que estes últimos especificam componentes de diferença de cor. Em alguns domínios de aplicação, é também comum que o conjunto de arranjos de amostras codificados consista em três planos de cores que representam os arranjos de amostra para as três cores primárias: vermelho, verde e azul. Além disso, para uma representação de cor melhorada, uma imagem a cores pode ser constituída por mais do que três planos de cor. Além disso, uma imagem pode ser associada a arranjos de amostra auxiliares que especificam informações adicionais para a imagem. Por exemplo, esses arranjos de amostra auxiliares podem ser arranjos de amostra que especificam a transparência (adequado para fins de exibição especifica) para os arranjos de amostra de cor associada ou arranjos de amostra que especificam um mapa de profundidade (adequado para render visões múltiplas, por exemplo, para 3-D ).

Nas normas convencionais de codificação de imagem e video (como H.264), os planos de cor são geralmente codificados juntos, em que determinados parâmetros de codificação, tais como os modos de predição de macrobloco e sub-macrobloco, indices de referência, e os vetores de movimento são usados para todos os componentes de cor de um bloco. 0 plano de luminância pode ser considerado como o plano de cor primária para o qual os parâmetros específicos de codificação estão especificados no fluxo de bits, e os planos de crominância podem ser considerados como planos secundários, para os quais os parâmetros de codificação correspondentes são inferidos a partir do plano de luminância primário. Cada bloco de luminância está associado a dois blocos de crominância que representam a mesma área de uma imagem. Dependendo do formato de amostragem utilizado de crominância, os arranjos de amostras de crominância podem ser menores do que a arranjo de amostras de luminância para um bloco. Para cada macrobloco, que consiste de uma luminância e dois componentes de crominância, a mesma partição em blocos menores é usada (se o macrobloco é subdividido). Para cada bloco composto por um bloco de amostras de luminância e dois blocos de amostras de crominância (que pode ser o próprio macrobloco ou um sub-bloco do macrobloco) , o mesmo conjunto de parâmetros de predição, tais como os índices de referência, os parâmetros de movimento, e os modos de intra-predição, por vezes, são empregados. Nos perfis específicos das normas de codificação de vídeo convencionais (tais como os perfis de 4:4:4 na H.264), também é possível codificar os planos de cores diferentes de uma imagem independente. Nessa configuração, a partição do macrobloco, os modos de predição, índices de referência, e os parâmetros de movimento podem ser separadamente escolhidos para um componente de cor de um macrobloco ou sub-bloco. Normas de codificação convencionais de todos os planos de cor são codificadas em conjunto, utilizando o mesmo conjunto de parâmetros de codificação específicos (tais como informações da subdivisão e os parâmetros de predição) ou todos os planos de cor são codificados de forma completamente independente entre si.

Se os planos de cor são codificados em conjunto, um conjunto de parâmetros de subdivisão de predição deve ser utilizado para todos os componentes de cor de um bloco. Isto assegura que a informação suplementar seja mantida pequena, mas pode resultar numa redução da eficiência de codificação em comparação com uma codificação independente, uma vez que o uso de decomposições de bloco diferentes e parâmetros de predição de componentes de cores diferentes podem resultar num menor custo de taxa de distorção. Como um exemplo, a utilização de um vetor de movimento diferente ou o quadro de referência para os componentes de crominância pode reduzir significativamente a energia do sinal residual para os componentes de crominância e aumentar a sua eficiência global de codificação. Se os planos de cor são codificados de forma independente, os parâmetros de codificação, como a partição de blocos, os índices de referência, e os parâmetros do movimento podem ser selecionados para cada componente de cor separadamente a fim de otimizar a eficiência de codificação para cada componente de cor. Mas não é possível empregar a redundância entre os componentes de cor. As transmissões múltiplas de determinados parâmetros de codificação têm como resultado um aumento da taxa de informação suplementar (em comparação com a codificação combinada) e esta taxa de aumento de informações suplementares pode ter um impacto negativo sobre a eficiência geral de codificação. Além disso, o suporte para arranjos de amostra auxiliares nos padrões do estado da técnica de codificação de vídeo (tal como H.264) se restringe ao caso conjunto de parâmetros de codificação.

Assim, em todas as formas de realização descritas até agora, os planos de imagem podem ser manipulados como descrito acima, mas também como discutido acima, a eficiência geral de codificação para a codificação de arranjos de amostras múltiplas (que podem ser relacionados com os planos de cores diferentes e/ou de amostras de arranjos auxiliares) pode ser aumentada, quando seria possível decidir com base em blocos, por exemplo, se todos os arranjos de amostra para um bloco são codificados com os mesmos parâmetros de codificação ou se diferentes parâmetros de codificação são usados. A ideia básica da predição inter-plano seguinte é a de permitir uma decisão adaptativa com base em blocos, por exemplo. 0 codificador pode escolher, por exemplo, com base no critério de taxa de distorção, se todos ou alguns dos conjuntos de amostras de um determinado bloco são codificados utilizando os mesmos parâmetros de codificação ou se diferentes parâmetros de codificação são usados para arranjos de amostras diferentes. Esta seleção pode também ser alcançada através de sinalização para um determinado bloco de um arranjo de amostras se os parâmetros específicos de codificação são inferidos a partir de um bloco codificado já co-localizado de um arranjo de amostras diferente. É também possível organizar os arranjos de amostra diferentes para obter uma imagem em grupos, que são também referidos como grupos de amostras de arranjo ou grupos de plano. Cada grupo de plano pode conter um ou mais arranjos de amostras de uma imagem. Em seguida, os blocos dos arranjos de amostra dentro de um grupo de plano partilham os mesmos parâmetros de codificação selecionados, como a informação de subdivisão, modos de predição, e modos de codificação residuais, enquanto que outros parâmetros de codificação, tais como os níveis de coeficientes de transformação são transmitidos separadamente para cada um dos conjuntos de amostras no interior do grupo de plano. Um grupo de plano é codificado como grupo plano primário, isto é, nenhum dos parâmetros de codificação é inferido ou previsto a partir de outros grupos de plano. Para cada bloco de um grupo de plano secundário, pode ser escolhido de forma adaptativa se um novo conjunto de parâmetros de codificação selecionados é transmitido, ou se os parâmetros de codificação selecionados são inferidos ou previstos a partir do grupo de plano primário ou outro grupo de plano secundário. As decisões sobre se alguns parâmetros de codificação para um determinado bloco são inferidos ou previsíveis são incluídos no fluxo de bits. A predição inter- plano permite uma maior liberdade na escolha da troca entre a taxa de informações suplementares e qualidade de predição em relação à codificação do estado da técnica das imagens que consistem em arranjos de amostra múltiplas. A vantagem é uma maior eficiência de codificação em relação à codificação de imagens convencionais que consistem em arranjos de amostras múltiplas. A adoção/predição intra-plano pode estender um codificador de imagem ou de vídeo, tais como os das formas de realização anteriores, de maneira que ela pode ser escolhida de forma adaptável para um bloco de um arranjo de amostras de cor, ou um arranjo de amostras auxiliar ou de um conjunto de arranjos de amostras de cores e/ou arranjos de amostra auxiliares se um conjunto de parâmetros de codificação selecionado seja inferido ou previsto a partir dos blocos co-localizados já codificados de outros arranjos de amostras na mesma imagem, ou se o conjunto selecionado de parâmetros de codificação para o bloco é independentemente codificado sem referência aos blocos co-localizados de arranjos de outras amostras da mesma imagem. As decisões se o conjunto de parâmetros de codificação selecionado é inferido ou previsto para um bloco de um arranjo de amostras ou um bloco de conjuntos de amostras múltiplas podem ser incluídas no fluxo de bits. Os arranjos de amostra diferentes que estão associados com uma imagem não precisam de ter o mesmo tamanho.

Como descrito acima, os arranjos de amostra que estão associados a uma imagem (os conjuntos de amostras podem representar os componentes de cor e/ou arranjos de amostra auxiliares) podem ser dispostos em dois ou mais dos assim chamados grupos de plano, em que cada grupo de plano consiste num ou mais arranjos de amostras. Os arranjos de amostra que estão contidos num grupo de plano particular, não precisam de ter o mesmo tamanho. Note-se que esta organização num grupo de plano inclui o caso em que cada arranjo de amostras é codificado separadamente.

Para ser mais preciso, de acordo com uma forma de realização, é escolhido de forma adaptativa, para cada bloco de um grupo de plano, se os parâmetros de codificação que especificam como um bloco é previsto são inferidos ou previstos a partir de um bloco co-localizado já codificado de um grupo de plano diferente para a mesma imagem ou se estes parâmetros de codificação são codificados separadamente para o bloco. Os parâmetros de codificação que especificam como um bloco está previsto incluem um ou mais dos seguintes parâmetros de codificação: modos de predição de bloco especificando qual a predição utilizada para o bloco (intra-predição, inter-predição utilizando o vetor de movimento único e a imagem de referência, a inter-predição utilizando dois vetores de movimento e imagens de referência, a inter-predição usando uma ordem mais elevada, ou seja, o modelo de movimento de não translação e uma imagem de referência única, a inter-predição usando modelos de movimento múltiplos e imagens de referência), modos de intra-predição, que especificam como um sinal de intra-predição é gerado, um identificador que especifica como vários sinais de predição são combinados para gerar o sinal de predição final para o bloco, os indices de referência especificando quais as imagens de referência empregadas para predição com compensação de movimento, parâmetros de movimento (tais como vetores de deslocamento ou parâmetros de movimento afins) especificando como o(s) sinal(ais) de predição (s) é/são gerados utilizando a(s) imagem(ens) de referência, um identificador que especifica como a(s) imagem(ens) de referência é/são filtradas para a geração de sinais de predição de movimento compensado. Note-se que, em geral, um bloco pode ser associado com apenas um subconjunto dos parâmetros de codificação mencionados. Por exemplo, se o modo de predição do bloco especifica que um bloco é intra-previsto, os parâmetros de codificação para um bloco podem incluir adicionalmente os modos de intra-predição, mas os parâmetros de codificação, tais como os indices de referência e parâmetros de movimento que especificam como um sinal de inter-predição é gerado não são especificados; ou, se o modo de predição de bloco especifica a inter-predição, os parâmetros associados de codificação podem incluir, adicionalmente, os indices de referência e parâmetros de movimento, mas os modos de intra-predição não são especificados.

Um dos dois ou mais grupos de plano podem ser codificados ou indicados dentro do fluxo de bits como o grupo de plano primário. Para todos os blocos desse grupo de plano primário, os parâmetros de codificação que especificam como o sinal de predição é gerado são transmitidos, sem se referir a outros grupos de plano da mesma imagem. Os grupos de plano restantes são codificados como grupos de plano secundários. Para cada bloco de um dos grupos de plano secundários, um ou mais elementos de sintaxe são transmitidos que sinalizam se os parâmetros de codificação para especificar como o bloco é predito são inferidos ou previstos a partir de um bloco co-localizado de grupos de outros planos ou se um novo conjunto destes parâmetros de codificação é transmitido para o bloco. Um dentre um ou mais elementos de sintaxe pode ser referido como sinalizador de predição inter-plano ou parâmetro de predição inter-plano. Se os elementos de sintaxe sinalizam que os parâmetros de codificação correspondentes não são inferidos ou previstos, um novo conjunto de parâmetros de codificação para os blocos correspondentes são transmitidos no fluxo de bits. Se os elementos de sintaxe sinalizam que os parâmetros de codificação correspondentes são inferidos ou previstos, o bloco co-localizado num assim chamado grupo de plano de referência é determinado. A atribuição do grupo plano de referência para o bloco pode ser configurada de diversas maneiras. Numa forma de realização, um grupo de plano particular de referência é atribuído a cada grupo de plano secundário; esta atribuição pode ser fixada ou pode ser sinalizada em estruturas de alto nível de sintaxe, tais como os conjuntos de parâmetros, cabeçalho da unidade de acesso, o cabeçalho da imagem, ou cabeçalho de secção.

Numa segunda forma de realização, a atribuição do grupo de plano de referência é codificada dentro do fluxo de bits e assinalada por um ou mais elementos de sintaxe que são codificados para um bloco, a fim de especificar se os parâmetros de codificação selecionados são inferidos ou previstos ou separadamente codificados. A fim de facilitar as possibilidades recentemente mencionadas, em ligação com a predição inter-plano e as seguintes formas de realização detalhadas, é feita referência à Fig. 11, que mostra uma imagem ilustrativa 500 composta por três arranjos de amostras 502, 504 e 506. Para efeitos de uma melhor compreensão, somente subporções dos arranjos de amostra 502-506 são mostradas na Fig. 11. Os arranjos de amostra são mostrados como se fossem registados uns contra os outros no espaço, de modo que os conjuntos de amostras 502-506 sobrepõem entre si ao longo de uma direção 508 e de modo a que a projeção das amostras dos arranjos de amostra 502-506 juntamente os resultados de direção 508 nas amostras de todos esses arranjos de amostra 502-506 sejam corretamente espacialmente localizados uns em relação aos outros. Ainda por outras palavras, os planos 502 e 506 foram espalhados ao longo da direção horizontal e vertical, a fim de adaptar a sua resolução espacial entre si e registá-los uns aos outros.

De acordo com uma forma de realização, todos os arranjos de amostras de uma imagem pertencem à mesma porção de uma cena espacial em que a resolução ao longo da direção vertical e horizontal pode diferir entre os arranjos de amostras individuais 502-506. Além disso, para fins de ilustração, os arranjos de amostra 502 e 504 são considerados como pertencendo a um grupo de plano 510, enquanto que o arranjo de amostras 506 é considerado como pertencendo a outro grupo de plano 512. Além disso, a Fig. 11 ilustra o caso exemplar onde a resolução espacial ao longo do eixo horizontal do arranjo de amostras 504 é o dobro da resolução na direção horizontal do arranjo de amostras 502. Além disso, o arranjo de amostras 504 é considerado, para formar o arranjo primário em relação ao arranjo de amostras 502, o qual forma um arranjo subordinado em relação ao arranjo primário 504. Como explicado anteriormente, neste caso, a subdivisão de arranjo de amostras 504 em blocos como decidido pelo subdivisor 30 da Fig. 1 é adotada pelo arranjo subordinado 502, em que de acordo com o exemplo da Fig. 11, em função da resolução vertical do arranjo de amostras 502 ser metade da resolução na direção vertical do arranjo primário 504, cada bloco foi reduzido para metade em dois blocos horizontalmente justapostos, que, devido à redução para metade são blocos quadrados, quando medidos em unidades das posições da amostra no interior do arranjo de amostras 502.

Como é exemplarmente representado na Fig. 11, a subdivisão escolhida para o arranjo de amostras 506 é diferente da subdivisão do outro grupo de plano 510. Como descrito antes, o subdivisor 30 pode selecionar a subdivisão do arranjo de pixel 506 separadamente ou independentemente da subdivisão para o grupo de plano 510. Naturalmente, a resolução de arranjo de amostras 506 pode também diferir das resoluções dos planos 502 e 504 do grupo de plano 510.

Agora, quando se codifica os arranjos de amostras individuais 502-506, o codificador 10 pode começar com a codificação do arranjo primário 504 do grupo de plano 510, por exemplo, da maneira descrita acima. Os blocos representados na Fig. 11 podem, por exemplo, ser os blocos de predição acima mencionados. Alternativamente, os blocos são blocos residuais ou outros blocos que definem a granularidade para definir certos parâmetros de codificação. A predição do inter-plano não se restringe a subdivisão quadtree ou multi-tree, embora isto esteja ilustrado na Fig. 11.

Após a transmissão do elemento de sintaxe para o arranjo primário 504, o codificador 10 pode decidir declarar o arranjo primário 504 como o plano de referência para o plano subordinado 502. O codificador 10 e um extrator 30, respetivamente, podem sinalizar esta decisão através do fluxo de bits 22, enquanto a associação pode ser evidente a partir do facto de o arranjo de amostras 504 fazer o arranjo primário do grupo de plano 510 em que a informação, por sua vez, também pode ser parte da sequência de bits 22. Em qualquer caso, para cada bloco de amostra 502 o dispositivo de inserção 18 ou qualquer outro módulo de codificação 10, juntamente com o dispositivo de inserção 18 pode decidir suprimir a transferência dos parâmetros de codificação deste bloco dentro do fluxo de bits e sinalizar dentro do fluxo de bits para esse bloco ao invés dos parâmetros de codificação de um bloco co-localizado no interior do arranjo primário 504 que deve ser utilizado em vez disso, ou os parâmetros de codificação do bloco co-localizado no interior do arranjo primário 504 que devem ser utilizados como uma predição para os parâmetros de codificação do atual bloco de arranjo de amostras 502 simplesmente transferindo os dados residuais do mesmo para o bloco atual do arranjo de amostras 502 no interior do fluxo de bits. No caso de uma decisão negativa, os parâmetros de codificação são transferidos no interior do fluxo de dados, como de costume. A decisão é sinalizada dentro do fluxo de dados 22 para cada bloco. No lado do descodif icador, o extrator 102 utiliza esta informação de predição inter-plano para cada bloco, a fim de obter os parâmetros de codificação do bloco respetivo do arranjo de amostras 502 em conformidade, a saber, por inferência dos parâmetros de codificação do bloco co-localizado do arranjo primário 504 ou, alternativamente, por extração de dados residuais para aquele bloco a partir do fluxo de dados e combinando esses dados residuais com uma predição obtida a partir dos parâmetros de codificação do bloco co-localizado do arranjo primário 504, se a informação de adoção/predição de inter- plano sugerir a adoção/predição do inter- plano, ou por extração dos parâmetros de codificação do bloco atual do arranjo de amostras 502, como de costume independentemente do arranjo primário 504.

Como também foi anteriormente descrito, os planos de referência não são restritos a residir dentro do mesmo grupo de plano que o bloco para os quais a predição inter-plano é atualmente de interesse. Assim, como descrito acima, o grupo de plano 510 pode representar o grupo de plano primário ou grupo de plano de referência para o grupo de plano secundário 512. Neste caso, o fluxo de bits pode conter um elemento de sintaxe indicando, para cada bloco de arranjo de amostras 506, como a adoção/predição de parâmetros de codificação acima mencionada de macroblocos co-localizados de qualquer um dos planos 502 e 504 do grupo de plano primário ou do grupo do plano de referência 510 deve ser realizada ou não, em que no último caso, os parâmetros de codificação do atual bloco do arranjo de amostras 506 são transmitidos normalmente.

Deve notar-se que os parâmetros da subdivisão e/ou de predição para os planos dentro de um grupo de plano podem ser os mesmos, isto é, porque são apenas codificados uma vez para um grupo de plano (todos os planos secundários de um grupo de plano inferem a informação da subdivisão e/ou parâmetros de predição a partir do plano primário dentro do mesmo grupo de plano), e a predição adaptativa ou inferência da informação da subdivisão e/ou parâmetros de predição é feita entre os grupos de plano.

Deve notar-se que o grupo de plano de referência pode ser um grupo de plano primário ou um grupo de plano secundário. A co-localização entre os blocos de diferentes planos dentro de um grupo de plano é facilmente compreensível em que a subdivisão do arranjo de amostras primário 504 é espacialmente adaptada pelo arranjo de amostras subordinado 502, exceto a recém-descrita subpartição dos blocos, a fim de tornar os blocos de folhas adotados em blocos quadrados. Em caso de adoção/predição inter-plano entre diferentes grupos de plano, a co-localização pode ser definida de uma maneira, de modo a permitir uma maior liberdade entre as subdivisões destes grupos de plano. Dado o grupo plano de referência, o bloco co- localizado no interior do grupo de plano de referência é determinado. A derivação do bloco co-localizado e o grupo de plano de referência pode ser feito por um processo semelhante ao seguinte. Uma amostra particular 514 no bloco atual 516 de um dos arranjos de amostras 506 do grupo de plano secundário 512 é selecionada. A mesma pode ser a amostra superior esquerda do bloco atual 516, como mostrado em 514 na Fig. 11 para fins ilustrativos, ou, uma amostra no bloco atual 516 próxima do meio do bloco atual 516 ou qualquer outra amostra no interior do bloco atual, que seja exclusivamente definida geometricamente. A localização desta amostra selecionada 515 dentro de um arranjo de amostras 502 e 504 do plano de referência de plano 510 é calculada. As posições da amostra 514 no interior dos arranjos de amostra 502 e 504 estão indicadas na Fig. 11 em 518 e 520, respetivamente. Qual dos planos 502 e 504 dentro do grupo do plano de referência 510 é realmente utilizado pode ser determinado, ou pode ser assinalado dentro do fluxo de bits. A amostra no interior do arranjo de amostras correspondente 502 ou 504 do grupo do plano de referência 510, sendo a mais próxima das posições 518 e 520, respetivamente, é determinada e o bloco que contém essa amostra é escolhido como o bloco co-localizado dentro do arranjo de amostras respetivo 502 e 504, respetivamente. No caso da Fig. 11, estes são os blocos 522 e 524, respetivamente. Uma abordagem alternativa para a determinação do bloco co-localizado em outros planos é descrita posteriormente.

Numa forma de realização, os parâmetros de codificação especificando a predição para o bloco atual 516 são completamente inferidos utilizando os parâmetros de predição correspondentes do bloco co-localizado 522/524 num grupo de plano diferente 510 da mesma imagem 500, sem transmitir a informação suplementar adicional. A inferência pode consistir de uma simples cópia dos respetivos parâmetros de codificação ou uma adaptação dos parâmetros de codificação levando em conta as diferenças entre o atual 512 e o grupo de plano de referência 510. Como um exemplo, esta adaptação pode consistir em adição de uma correção de parâmetro de movimento (por exemplo, uma correção de vetor de deslocamento) para ter em conta a diferença de fase entre os arranjos de amostra de luminância e crominância; ou a adaptação pode consistir em modificar a precisão dos parâmetros de movimento (por exemplo, modificando a precisão dos vetores de deslocamento) para ter em conta a resolução diferente de arranjos de amostra de luminância e crominância. Numa outra forma de realização, um ou mais dos parâmetros de codificação inferidos para especificar a geração do sinal de predição não são diretamente utilizados para o bloco atual 516, mas são usados como uma predição para os respetivos parâmetros de codificação para o bloco atual 516 e um refinamento destes parâmetros de codificação para o bloco atual 516 é transmitido no fluxo de bits 22. Como um exemplo, os parâmetros do movimento inferidos não são diretamente utilizados, mas as diferenças de parâmetros de movimento (tal como uma diferença de vetores de deslocamento) que especificam o desvio entre os parâmetros de movimento que são utilizados para o bloco atual 516 e os parâmetros de movimento inferidos são codificados no fluxo de bits; no lado do descodif icador, os parâmetros de movimento atuais utilizados são obtidos por combinação dos parâmetros do movimento inferidos e as diferenças dos parâmetros de movimento transmitidos.

Noutra forma de realização, a subdivisão de um bloco, tais como os blocos de árvore da subdivisão da predição acima mencionada em blocos de predição (isto é, blocos de amostras para os quais o mesmo conjunto de parâmetros de predição é usado) é adaptativamente inferida ou prevista a partir de um bloco co- localizado já codificado de um grupo de plano diferente para a mesma imagem, ou seja, a sequência de bits de acordo com a Fig. 6a ou 6b. Numa forma de realização, um dos dois ou mais grupos de plano é codificado como grupo de plano primário. Para todos os blocos desse grupo de plano primário, a informação de subdivisão é transmitida, sem se referir a outros grupos de plano da mesma imagem. Os grupos de plano restantes são codificados como grupos de plano secundários. Para os blocos dos grupos de planos secundários, um ou mais elementos de sintaxe são transmitidos de forma que o sinal da informação de subdivisão é inferido ou previsto a partir de um bloco co-localizado de outros grupos de plano ou se a informação de subdivisão é transmitida no fluxo de bits. Um dos um ou mais elementos de sintaxe pode ser referido como sinalizador de predição inter- plano ou parâmetro de predição inter-plano. Se os elementos de sintaxe sinalizarem que a informação da subdivisão não é inferida ou prevista, a informação para a subdivisão do bloco é transmitida no fluxo de bits sem se referir a outros grupos de plano da mesma imagem. Se os elementos de sintaxe sinalizam que a informação de subdivisão é inferida ou prevista, o bloco co-localizado num assim chamado grupo de plano de referência é determinado. A atribuição do grupo de plano de referência para o bloco pode ser configurada de diversas maneiras. Numa forma de realização, um grupo de plano de referência particular é atribuído a cada grupo de plano secundário; esta atribuição pode ser fixada ou pode ser sinalizada em estruturas de alto nível de sintaxe, como os conjuntos de parâmetros, cabeçalho da unidade de acesso, o cabeçalho de imagem, ou cabeçalho de secção. Numa segunda forma de realização, a atribuição do grupo de plano de referência é codificada dentro do fluxo de bits e assinalada por um ou mais elementos de sintaxe que são codificados para um bloco, a fim de especificar se a informação de subdivisão é inferida ou prevista ou separadamente codificada. 0 grupo de plano de referência pode ser o grupo de plano primário ou outro grupo de plano secundário. Dado o grupo de plano de referência, o bloco co-localizado no interior do grupo de plano de referência é determinado. 0 bloco co-localizado é o bloco no grupo de plano de referência que corresponde à mesma área de imagem que o bloco atual, ou o bloco que representa o bloco dentro do grupo de plano de referência, que partilha a maior parte da área de imagem com o bloco atual. 0 bloco co- localizado pode ser particionado em blocos de predição menores.

Numa outra forma de realização, a informação de subdivisão para o bloco atual, tal como a subdivisão à base de quadtree de acordo com as Figs. 6a ou 6b, está completamente inferida com base nas informações de subdivisão do bloco co-localizado num plano de grupo diferente da mesma imagem, sem transmitir a informação suplementar adicional. Como um exemplo particular, se o bloco co-localizado, está particionado em dois ou quatro blocos de predição, o bloco atual está também particionado em dois ou quatro sub-blocos, para efeitos de predição. Como outro exemplo particular, se o bloco co-localizado, estiver particionado em quatro sub-blocos e um destes sub-blocos for adicionalmente particionado em quatro sub-blocos menores, o bloco atual é também particionado em quatro sub-blocos e um desses sub-blocos (o que corresponde ao sub-bloco do bloco co-localizado, que está ainda em decomposição) é também particionado em quatro sub-blocos menores. Numa forma de realização ainda mais preferida, a informação da subdivisão inferida não é diretamente usada para o bloco atual, mas é usada como uma predição para a informação de subdivisão atual para o bloco atual, e a informação de refinamento correspondente é transmitida no fluxo de bits. Como um exemplo, a informação de subdivisão que é inferida a partir do bloco co-localizado pode ser aperfeiçoada. Para cada sub-bloco que corresponde a um sub-bloco do bloco co-localizado, que não é particionado em blocos menores, um elemento de sintaxe pode ser codificado no fluxo de bits, que especifica se o sub-bloco é adicionalmente decomposto no qrupo de plano atual. A transmissão de tal elemento de sintaxe pode ser condicionada ao tamanho do sub-bloco. Ou pode ser sinalizado no fluxo de bits que um sub-bloco que é ainda particionado no qrupo de plano de referência não é particionado em blocos menores do qrupo de plano atual.

Numa outra forma de realização, tanto a subdivisão de um bloco em blocos de predição como os parâmetros de codificação que especificam como os sub-blocos são preditos são adaptativamente inferidos ou previstos a partir de um bloco codificado já co-localizado de um qrupo de plano diferente para a mesma imagem. Numa forma de realização preferida da invenção, um dos dois ou mais grupos de plano é codificado como grupo de plano primário. Para todos os blocos desse grupo de plano primário, as informações subdivisão e os parâmetros de predição são transmitidos, sem se referir a outros grupos de plano da mesma imagem. Os grupos de plano restantes são codificados como grupos de plano secundários. Para os blocos dos grupos de plano secundários, um ou mais elementos de sintaxe são transmitidos que sinalizam se a informação da subdivisão e os parâmetros de predição são inferidos ou previstos a partir de um bloco co-localizado de outros grupos de plano ou se a informação da subdivisão e os parâmetros de predição são transmitidos no fluxo de bits. Um dos um ou mais elementos de sintaxe pode ser referido como o sinalizador de predição inter- plano ou parâmetro de predição inter-plano. Se os elementos de sintaxe sinalizam que a informação de subdivisão e os parâmetros de predição não são inferidos ou previstos, a informação de subdivisão para o bloco, e os parâmetros de predição para os sub-blocos resultantes são transmitidos no fluxo de bits sem se referir a outros grupos de plano da mesma imagem. Se os elementos de sintaxe sinalizam que a informação de subdivisão e os parâmetros de predição para o sub-bloco são inferidos ou previstos, o bloco co-localizado num assim chamado grupo de plano de referência é determinado. A atribuição do grupo de plano de referência para o bloco pode ser configurada de diversas maneiras. Numa forma de realização, um grupo de plano de referência particular é atribuído a cada grupo de plano secundário; esta atribuição pode ser fixada ou pode sinalizada em estruturas de alto nível de sintaxe, tais como os conjuntos de parâmetros, cabeçalho da unidade de acesso, o cabeçalho de imagem, ou cabeçalho de secção. Numa segunda forma de realização, a atribuição do grupo de plano de referência é codificada dentro do fluxo de bits e assinalada por um ou mais elementos de sintaxe que são codificados para um bloco, a fim de especificar se a informação da subdivisão e os parâmetros de predição são inferidos ou previstos ou separadamente codificados. 0 grupo de plano de referência pode ser o grupo de plano primário ou outro grupo de plano secundário. Dado o grupo plano de referência, o bloco co-localizado no interior do grupo de plano de referência é determinado. 0 bloco co-localizado pode ser o bloco no grupo de plano de referência que corresponde à mesma área de imagem que o bloco atual, ou o bloco que representa o bloco dentro do grupo de plano de referência, que partilha a maior parte da área de imagem com o bloco atual. 0 bloco co- localizado pode ser particionado em blocos menores de predição. Numa forma de realização preferida, a informação de subdivisão para o bloco atual, bem como os parâmetros de predição para os sub-blocos resultantes são completamente inferidos com base nas informações de subdivisão do bloco co- localizado num grupo de plano diferente de mesma imagem e os parâmetros de predição dos sub-blocos correspondentes, sem transmissão de informações secundárias adicionais. Como um exemplo particular, se o bloco co-localizado, estiver particionado em dois ou quatro blocos de predição, o bloco atual está também particionado em dois ou quatro sub-blocos com a finalidade de predição e os parâmetros de predição para os sub- blocos do bloco atual são derivados, como descrito acima. Como outro exemplo particular, se o bloco co-localizado, estiver particionado em quatro sub-blocos e um destes sub-blocos for adicionalmente particionado em quatro sub-blocos menores, o bloco atual é também particionado em quatro sub-blocos e um desses sub-blocos (o que corresponde ao sub-bloco do bloco co-localizado, que está ainda em decomposição) é também particionado em quatro sub-blocos mais pequenos e os parâmetros de predição para todos os sub-blocos não mais particionados são inferidos como descrito acima. Numa forma de realização ainda mais preferida, a informação de subdivisão é completamente inferida com base na informação de subdivisão do bloco co-localizado no grupo de plano de referência, mas os parâmetros de predição inferidos para os sub-blocos são usados apenas como predição para os parâmetros de predição atuais dos sub-blocos. Os desvios entre os parâmetros de predição atuais e os parâmetros de predição inferidos são codificados no fluxo de bits. Numa outra forma de realização, as informações de subdivisão inferida são usadas como uma predição para a informação de subdivisão atual do bloco atual e a diferença é transmitida no fluxo de bits (tal como descrito acima) , mas os parâmetros de predição são completamente inferidos. Numa outra forma de realização, tanto a informação de subdivisão inferida como os parâmetros de predição inferidos são usados como a predição e as diferenças entre a informação de subdivisão atual e os parâmetros de predição e seus valores inferidos são transmitidos no fluxo de bits.

Noutra forma de realização, é escolhido de forma adaptativa, para um bloco de um grupo de plano, se os modos de codificação residuais (tais como o tipo de transformação) são inferidos ou previstos a partir de um bloco já codificado co-localizado de um grupo de plano diferente para a mesma imagem ou se os modos de codificação residuais são codificados separadamente para o bloco. Esta forma de realização é semelhante à forma de realização para a inferência /predição adaptativa dos parâmetros de predição descritos acima.

Noutra forma de realização, a subdivisão de um bloco (por exemplo, um bloco de predição) em blocos de transformação (isto é, blocos de amostras para o qual a transformação bidimensional é aplicada) é adaptativamente inferida ou prevista a partir de um bloco codificado já co-localizado de um grupo de plano diferente para a mesma imagem. Esta forma de realização é semelhante à forma de realização para a inferência/predição adaptativa da subdivisão em blocos de predição descritos acima.

Noutra forma de realização, a subdivisão de um bloco em blocos de transformação e os modos de codificação residuais (por exemplo, tipos de transformação) para os blocos de transformação resultantes são adaptativamente inferidos ou previstos a partir de um bloco codificado já co-localizado de um grupo de plano diferente para a mesma imagem. Esta forma de realização é semelhante à forma de realização para a inferência/ predição adaptativa da subdivisão em blocos de predição e parâmetros de predição para os blocos de predição resultantes descritos acima.

Noutra forma de realização, a subdivisão de um bloco em blocos de predição, os parâmetros de predição associados, a informação de subdivisão dos blocos de predição, e os modos de codificação residual de blocos de transformação são adaptativamente inferidos ou previstos a partir de um bloco codificado já co-localizado de um grupo de plano diferente para a mesma imagem. Esta forma de realização representa uma combinação das formas de realização descritas acima. Também é possível que apenas alguns dos parâmetros de codificação mencionados sejam inferidos ou previstos.

Assim, a adoção/predição do inter-plano pode aumentar a eficiência de codificação descrita anteriormente. No entanto, o ganho de eficiência de codificação por meio de adoção/predição inter-plano também está disponível em caso de outras subdivisões de bloco a ser utilizado que não as subdivisões de base multitree e de modo independente da fusão de bloco ser implementada ou não.

As formas de realização acima delineadas em relação à adaptação/ predição inter-plano são aplicáveis a codificadores e descodificadores de imagem de vídeo que dividem os planos de cor de uma imagem e, se presente, os arranjos de amostra auxiliares associados a uma imagem em blocos e associam estes blocos com parâmetros de codificação. Para cada bloco, um conjunto de parâmetros de codificação pode ser incluído no fluxo de bits. Por exemplo, estes parâmetros de codificação podem ser parâmetros que descrevem a forma como um bloco é previsto ou descodificado no lado do descodificador. Como exemplos particulares, os parâmetros de codificação podem representar modos de predição de macroblocos ou blocos, informação de subdivisão, modos de intra-predição, índices de referência utilizados para predição de movimento compensado, parâmetros de movimento, como vetores de deslocamento, modos de codificação residuais, coeficientes de transformação, etc. Os diferentes arranjos de amostra que estão associados a uma imagem podem ter tamanhos diferentes. A seguir, um esquema de sinalização aumentada de parâmetros de codificação dentro de um esquema de partição baseada em árvore, como, por exemplo, os descritos acima com referência à Fig. 1-8 é descrito. Tal como com os outros esquemas, ou seja, a fusão e adoção/predição inter-plano, os efeitos e as vantagens dos esquemas de sinalização avançada, a seguir frequentemente chamados de herança, são descritos independentemente das formas de realização acima, embora os esquemas a seguir descritos sejam combináveis com qualquer uma das formas de realização anteriores, tanto isoladamente como em combinação.

Geralmente, o esquema de codificação melhorado para codificação de informação suplementar dentro de um esquema de partição baseado em árvore, chamado de herança, descrito a seguir permite as seguintes vantagens em relação aos esquemas convencionais de tratamento de parâmetros de codificação.

Na codificação de imagem e video convencional, as imagens ou conjuntos particulares de arranjos de amostra para as imagens são geralmente decompostos em blocos, que são associados com determinados parâmetros de codificação. As imagens geralmente consistem em arranjos de amostras múltiplas. Além disso, uma imagem pode também ser associada a outros arranjos de amostras auxiliares, o que pode, por exemplo, especificar informação de transparência ou mapas de profundidade. Os arranjos de amostra de uma imagem (incluindo arranjos de amostra auxiliares) podem ser agrupados num ou mais dos assim chamados grupos de plano, em que cada grupo de plano consiste num ou mais arranjos de amostra. Os grupos de plano de uma imagem podem ser codificados de forma independente, ou, se a imagem estiver associada a mais de um grupo de plano, com a predição de outros grupos de plano da mesma imagem. Cada grupo de plano normalmente é decomposto em blocos. Os blocos (ou os blocos de arranjos de amostra correspondentes) , são previstos por uma predição de inter-imagem ou predição de intra-imagem. Os blocos podem ter diferentes tamanhos, podendo ser quadrados ou retangulares. A partição de uma imagem em blocos pode ser fixada pela sintaxe, ou pode ser (pelo menos parcialmente) sinalizada dentro do fluxo de bits. Muitas vezes, os elementos de sintaxe são transmitidos sinalizando a subdivisão para blocos de tamanhos predefinidos. Tais elementos de sintaxe podem especificar se e como um bloco é subdividido em blocos menores e estão associados a parâmetros de codificação, como por exemplo, para efeitos de predição. Para todas as amostras de um bloco (ou os correspondentes blocos de arranjos de amostra) a descodificação dos parâmetros associados de codificação é especificada de uma maneira determinada. No exemplo, todas as amostras num bloco são previstas usando o mesmo conjunto de parâmetros de predição, tais como os indices de referência (a identificação de uma imagem de referência no conjunto de imagens já codificado), os parâmetros de movimento (especificando uma medida para o movimento de um bloco entre uma imagem de referência e a imagem atual), parâmetros para especificar o filtro de interpolação, modos de intra-predição, etc. Os parâmetros de movimento podem ser representados por vetores de deslocamento com um componente horizontal e vertical, ou por meio de parâmetros de ordem mais elevada de movimento, tais como os parâmetros de movimento afins que consistem de seis componentes. Também é possível que mais do que um conjunto de parâmetros de predição particulares (tais como os índices de referência e parâmetros de movimento) estejam associados a um único bloco. Neste caso, para cada conjunto destes parâmetros de predição determinados, um sinal de predição intermediária única para o bloco (ou os correspondentes blocos de arranjos de amostra) é gerado, e o sinal de predição final é construído por uma combinação incluindo a sobreposição dos sinais de predição intermediários. Os parâmetros de ponderação correspondentes e eventualmente também uma constante de deslocamento (que é adicionada à soma ponderada) podem ser fixados para uma imagem, ou uma imagem de referência, ou um conjunto de imagens de referência, ou podem ser incluídos no conjunto de parâmetros de predição para o bloco correspondente. A diferença entre os blocos originais (ou os blocos de arranjos de amostra correspondentes) e os seus sinais de predição, também referido como o sinal residual, é geralmente transformado e quantizado. Muitas vezes, uma transformação bidimensional é aplicada ao sinal residual (ou os arranjos de amostras correspondentes do bloco residual). Para transformar a codificação, os blocos (ou os blocos de arranjos de amostra correspondentes), para os quais um determinado conjunto de parâmetros de predição tem sido utilizado, pode ser ainda dividido, antes de aplicar a transformação. Os blocos de transformação podem ser iguais a ou menores do que os blocos que são usados para a predição. Também é possível que um bloco de transformação inclua mais do que um dos blocos que são usados para a predição. Diferentes blocos de transformação podem ter tamanhos diferentes e os blocos de transformação podem representar blocos quadrados ou retangulares. Após a transformação, os coeficientes de transformação resultantes são quantificados e os assim chamados níveis de coeficientes de transformação são obtidos. Os níveis de coeficientes de transformação, bem como os parâmetros de predição, e, se estiver presente, a informação de subdivisão é codificada por entropia.

Em algumas normas de codificação de imagem e video, as possibilidades de subdividir uma imagem (ou um grupo de plano) em blocos que são fornecidos pela sintaxe são muito limitadas. Normalmente, só se pode especificar se, e (potencialmente como) um bloco de um tamanho predefinido pode ser subdividido em blocos menores. Como exemplo, o tamanho maior de bloco na H.264 é de 16x16. Os blocos de 16x16 são também referidos como macroblocos e cada imagem está particionada em macroblocos num primeiro passo. Para cada macrobloco de 16x16, pode ser sinalizado se é codificado como bloco de 16x16, ou como dois blocos de 16x8, ou como dois blocos de 8x16, ou como quatro blocos de 8x8. Se um bloco de 16x16 é subdividido em quatro blocos 8x8, cada um destes blocos de 8x8 pode ser codificado como um bloco de 8x8, ou como dois blocos8x4, ou como dois blocos 4x8, ou como quatro blocos 4x4. 0 conjunto reduzido de possibilidades para especificar a partição em blocos em normas do estado da técnica de codificação de imagem e video tem a vantagem de que a taxa de informação suplementar para a sinalização das informações da subdivisão pode ser mantida pequena, mas tem a desvantagem de que a taxa de bits necessária para transmitir os parâmetros de predição para os blocos pode tornar-se significativa, conforme explicado a seguir. A taxa de informação suplementar para a sinalização das informações de predição não representa geralmente uma quantidade significativa da taxa de bits total de um bloco. E a eficiência de codificação pode ser aumentada quando a referida informação suplementar é reduzida, o que, por exemplo, pode ser conseguido através de tamanhos de bloco maiores. Imagens reais ou imagens de uma sequência de vídeo consistem em objetos de forma arbitrária com propriedades específicas. Como um exemplo, os objetos ou partes de objetos são caracterizados por uma textura única ou um movimento único. E, geralmente, o mesmo conjunto de parâmetros de predição pode ser aplicado para tal objeto, ou parte de um objeto. Mas os limites do objeto geralmente não coincidem com os limites de blocos possíveis para blocos de predição de grandes dimensões (por exemplo, macroblocos 16x16 em H.264). Um codificador geralmente determina a subdivisão (entre o conjunto limitado de possibilidades) que resulta no mínimo de uma medida de custo em particular de taxa de distorção. Para objetos em forma arbitrária, isso pode resultar num grande número de pequenos blocos. E uma vez que cada um destes blocos pequenos está associado a um conjunto de parâmetros de predição, que precisa ser transmitido, a taxa de informação suplementar pode se tornar uma parte significativa da taxa de bits total. Mas, uma vez que muitos dos pequenos blocos ainda representam áreas do mesmo objeto ou parte de um objeto, os parâmetros de predição para um número de blocos obtidos são iguais ou muito semelhantes. Intuitivamente, a eficiência de codificação pode ser aumentada quando a sintaxe é estendida de modo que não só permite a subdivisão de um bloco, mas também a partilha dos parâmetros de codificação entre os blocos que são obtidos após a subdivisão. Numa subdivisão baseada em árvore, a partilha de parâmetros de codificação para um determinado conjunto de blocos pode ser alcançada através da atribuição dos parâmetros de codificação ou de partes de um ou mais nós progenitores na hierarquia baseada em árvore. Como resultado, os parâmetros partilhados, ou partes destes podem ser utilizados para reduzir a informação suplementar que é necessária para assinalar a escolha atual dos parâmetros de codificação para os blocos obtidos após a subdivisão. A redução pode ser obtida ao omitir a sinalização de parâmetros para os blocos subsequentes ou usando o(s) parâmetro(s) partilhado(s) para a predição e/ou modelagem do contexto dos parâmetros para os blocos subsequentes. A ideia básica do esquema de herança descrito abaixo é a de reduzir a taxa de bits que é necessária para a transmissão dos parâmetros de codificação e partilhando a informação ao longo da hierarquia baseada em árvore de blocos. A informação partilhada é sinalizada dentro do fluxo de bits (além da informação da subdivisão). A vantagem do esquema de herança é um aumento de eficiência de codificação resultante de uma diminuição da taxa de informação suplementar para os parâmetros de codificação. A fim de reduzir a taxa de informação suplementar, de acordo com as formas de realização descritas a seguir, os respetivos parâmetros de codificação para conjuntos particulares de amostras, isto é, regiões simplesmente ligadas, que podem representar blocos retangulares ou quadrados ou regiões formadas arbitrariamente ou qualquer outra coleção de amostras, de uma subdivisão multi-tree são sinalizadas no fluxo de dados de forma eficiente. 0 esquema de herança descrito abaixo permite que os parâmetros de codificação não necessitem de ser explicitamente incluídos no fluxo de bits para cada um desses conjuntos de amostras na íntegra. Os parâmetros de codificação podem representar parâmetros de predição, que especificam como o conjunto de amostras correspondente é previsto usando amostras já codificadas. Muitas possibilidades e exemplos foram acima descritos e também se aplicam aqui. Como também foi indicado acima, e será descrito mais adiante, na medida em que o esquema de herança seguinte está relacionado, a partição baseada em árvore dos conjuntos de amostras de uma imagem em conjuntos de amostras pode ser fixada pela sintaxe ou pode ser assinalada por informações de subdivisão correspondente dentro do fluxo de bits. Os parâmetros de codificação para os conjuntos de amostras podem, como acima descrito, ser transmitidos numa ordem predefinida, que é dada pela sintaxe.

De acordo com o esquema de herança, o descodificador ou extrator 102 do descodificador está configurado para derivar a informação sobre os parâmetros de codificação da região individual simplesmente ligada ou conjuntos de amostras de uma maneira especifica. Em particular, os parâmetros de codificação, ou partes destes, tais como os parâmetros que servem para a finalidade de predição, são partilhados entre os blocos ao longo do esquema de partição dado baseado em árvore com o grupo de partilha ao longo da estrutura de árvore a ser decidido pelo codificador ou dispositivo de inserção 18, respetivamente. Numa forma de realização particular, a partilha d os parâmetros de codificação para todos os nós descendentes de um dado nó interno da árvore de partição é indicado por meio de um sinalizador de partilha especifico com valor binário. Como uma abordagem alternativa, refinamentos dos parâmetros de codificação podem ser transmitidos para cada nó de tal forma que os refinamentos acumulados de parâmetros ao longo da hierarquia baseada em árvore de blocos podem ser aplicados a todos os conjuntos de amostras do bloco a um nó de folha fornecido. Noutra forma de realização, as partes dos parâmetros de codificação que são transmitidos para nós internos ao longo da hierarquia com base em árvore de blocos podem ser utilizadas para a codificação por entropia do contexto adaptativo e descodificação do parâmetro de codificação ou de partes do bloco a um nó de folha fornecida.

Fig. 12a e 12b ilustram a ideia básica da herança para o caso especifico de utilizar uma partição baseada em quadtree. No entanto, como indicado acima, muitas vezes, outros sistemas de subdivisão multi-tree podem ser utilizados, assim a estrutura da árvore é mostrada na Fig. 12a enquanto que a partição correspondente espacial que corresponde à estrutura da árvore da Fig. 12a é mostrada na Fig. 12b. A partição mostrada ai é semelhante à mostrada em relação às Figs. 3a a 3c. De um modo geral, o regime de herança irá permitir que a informação suplementar seja atribuída aos nós localizados em diferentes camadas não-folha no interior da estrutura da árvore. Dependendo da atribuição de informações suplementares para os nós em diferentes camadas da árvore, tal como os nós internos da árvore da Fig. 12a ou o nó da raiz dos mesmos, diferentes graus de informação suplementar partilhada podem ser alcançados dentro da hierarquia de blocos de árvore mostrada na Fig. 12b. Por exemplo, se for decidido que todos os nós das folhas da camada 4, os quais, no caso da Fig. 12a têm todos os mesmos nós progenitores, devem partilhar a informação suplementar, virtualmente isto significa que os blocos menores, na Fig. 12b indicados com 156a 156d partilham esta informação suplementar e não é mais necessário transmitir a informação suplementar por todos esses pequenos blocos 156a a 156d, na integra, ou seja, quatro vezes, embora isso seja mantido como uma opção para o codificador. No entanto, seria também possível decidir que uma região inteira do nível de hierarquia 1 (camada 2) da Fig. 12a, nomeadamente a quarta parte no canto superior direito do bloco de árvore 150, incluindo os sub-blocos 154a, 154b e 154d bem como os sub-blocos ainda menores 156a a 156d recentemente mencionados, serve como uma região em que parâmetros de codificação são partilhados. Assim, a área de informação suplementar partilhada é aumentada. O próximo nível de crescimento seria a soma de todos os sub-blocos da camada 1, ou seja, sub-blocos 152a, 152c e 152d e os blocos menores acima mencionados. Por outras palavras, nesse caso o bloco de árvore inteiro teria a informação suplementar atribuída ao mesmo, com todos os sub-blocos deste bloco de árvore 150 partilhando a informação suplementar.

Na descrição de herança seguinte, a seguinte notação é usada para descrever as formas de realização: a. Amostras reconstruídas do nó da folha atual: r b. Amostras reconstruídas de folhas vizinhas: r' c. Preditor do nó da folha atual: p d. Resíduo do nó de folha atual: Res e. Resíduo reconstruído do nó de folha atual: RecRes

f. Escala e transformação inversa: SIT g. Sinalizador de partilhamento: /

Como um primeiro exemplo de herança, a sinalização intra-predição nos nós internos pode ser descrita. Para ser mais exato, é descrito como sinalizar os modos de intra-predição dos nós internos da árvore de um bloco baseado na partição com a finalidade de predição. Ao percorrer a árvore a partir do nó da raiz para os nós da folha, os nós internos (incluindo o nó da raiz) podem transmitir partes de informação suplementar que serão exploradas pelos seus nós descendentes correspondentes. Para ser mais especifico, um sinalizador de partilha / é transmitido para os nós internos com o seguinte significado: • Se /tem um valor de 1 ("verdadeiro"), todos os nós descendentes de um determinado nó interno partilham o mesmo modo de intra-predição. Além do sinalizador de partilha /com um valor de 1, o nó interno também sinaliza o parâmetro do modo de intra-predição a ser usado para todos os nós descendentes. Consequentemente, todos nós descendentes posteriores não possuem qualquer informação do modo de predição, bem como todos os sinalizadores de partilha. Para a reconstrução de todos os nós de folha relacionados, o descodificador aplica o modo de intra-predição do nó interno correspondente. • Se /tem um valor 0 ("falso"), os nós descendentes do nó correspondente interno não partilham o mesmo modo de intra-predição e cada nó descendente que é um nó interno carrega um sinalizador de partilha separado. A Fig. 12c ilustra a sinalização da intra-predição nos nós internos como descrito acima. 0 nó interno da camada 1 transmite o sinalizador de partilha e a informação suplementar que é dada pela informação do modo de intra-predição e os nós descendentes não transportam qualquer informação suplementar.

Como um segundo exemplo de herança, o refinamento entre predição pode ser descrito. Para ser mais preciso, é descrito como sinalizar a informação suplementar de modos de inter- predição a modos internos de uma partição do bloco baseada em árvore com a finalidade de refinamento de parâmetros de movimento, como por exemplo, dados por vetores de movimento. Ao percorrer a árvore a partir do nó da raiz para os nós da folha, os nós internos (incluindo o nó da raiz) podem transmitir partes de informação suplementar que vai ser refinada pelos seus nós descendentes correspondentes. Para ser mais especifico, um sinalizador de partilha / é transmitido para os nós internos com o seguinte significado: • Se f tem um valor de 1 ("verdadeiro"), todos os nós descendentes do determinado nó interno partilham a mesma referência do vetor de movimento. Além do sinalizador de partilha / com um valor de 1, o nó interno também sinaliza o vetor de movimento e o índice de referência. Consequentemente, todos os nós descendentes subsequentes não carregam mais os sinalizadores de partilha, mas podem realizar um refinamento desta referência do vetor de movimento herdado. Para a reconstrução de todos os nós de folha relacionados, o descodificador adiciona o refinamento do vetor de movimento no determinado nó de folha à referência do vetor de movimento herdado pertencente ao nó progenitor interno correspondente que tem um sinalizador de partilha / com um valor de 1. Isto significa que o refinamento do vetor de movimento num dado nó de folha é a diferença entre o vetor de movimento atual a ser aplicado na predição com compensação de movimento para este nó de folha e o vetor de movimento de referência do nó progenitor correspondente interno. • Se f tem um valor de 0 ("falso"), os nós descendentes do nó correspondente interno não partilham necessariamente o mesmo modo de inter-predição e nenhum refinamento dos parâmetros de movimento é executado nos nós descendentes, usando os parâmetros do movimento a partir do nó correspondente interno e cada nó descendente que é um nó interno carrega um sinalizador de partilha separado. A Fig. 12d ilustra o refinamento do parâmetro de movimento como descrito acima. 0 nó interno na camada 1 transmite o sinalizador de partilha e a informação suplementar. Os nós descendentes que são nós de folha transportam apenas os refinamentos de parâmetros de movimento e, por exemplo, o nó descendente interno na camada 2 não transporta nenhuma informação suplementar.

Faz-se referência agora à Fig. 13. A Fig. 13 mostra um diagrama de fluxo que ilustra o modo de operação de um descodificador, tais como o descodificador da FIG. 2 reconstruindo um conjunto de amostras de informação que representam um sinal de informação espacial exemplar, que é subdividido em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, a partir de um fluxo de dados. Como foi descrito acima, cada uma das regiões da folha tem com ela associado um nivel de hierarquia de uma sequência de níveis de hierarquia da subdivisão multi-tree. Por exemplo, todos os blocos mostrados na Fig. 12b são regiões de folha. A região da folha 156c, por exemplo, está associada com a camada de hierarquia 4 (ou nível 3) . Cada região de folha tem com ela associados parâmetros de codificação. Exemplos destes parâmetros de codificação foram descritos acima. Os parâmetros de codificação são, para cada região da folha, representados por um conjunto de elementos de sintaxe respetivo. Cada elemento de sintaxe é de um tipo de elemento de sintaxe respetivo de um conjunto de tipos de elementos de sintaxe. Tal tipo de elemento de sintaxe é, por exemplo, um modo de predição, um componente de vetor de movimento, uma indicação de um modo de intra-predição ou afins. De acordo com a Fig. 13, o descodif icador executa os seguintes passos.

No passo 550, uma informação de herança é extraída do fluxo de dados. No caso da Fig. 2, o extrator 102 é responsável pelo passo 550. A informação de herança indica se a herança é usada ou não para o arranjo de amostras de informação atual. A descrição a seguir vai revelar que existem várias possibilidades para a informação de herança, tais como, entre outros aspetos, o sinalizador de partilha / e a sinalização de uma estrutura multi-tree dividida numa parte primária e secundária. 0 arranjo de amostras da informação pode já ser uma sub-parte de uma imagem, tal como um bloco de árvore, denominado o bloco de árvore 150 da Fig. 12b, por exemplo. Assim, a informação de herança indica quanto ao facto de a herança ser usada ou não para o bloco de árvore especifico 150. Tal informação de herança pode ser inserida no fluxo de dados para todos os blocos de árvores da subdivisão de predição, por exemplo.

Além disso, a informação de herança indica se a herança é indicada para ser utilizada, pelo menos, uma região de herança do arranjo de amostras de informação, que é composto por um conjunto de regiões de folha e corresponde a um nivel de hierarquia da sequência de níveis de hierarquia da subdivisão multi-tree, sendo menor do que cada um dos níveis hierárquicos com o qual o conjunto de regiões de folhas está associado. Por outras palavras, a informação de herança indica quanto ao facto de a herança será usada ou não para o arranjo de amostras atual, tais como o bloco de árvore 150. Se sim, denota pelo menos, uma região de herança ou sub-região deste bloco de árvore 150, dentro do qual as regiões de folha partilham parâmetros de codificação. Assim, a região de herança pode não ser uma região de folha. No exemplo da Fig. 12b, esta região de herança pode, por exemplo, ser a região formada pelos sub-blocos 156a a 156b. Em alternativa, a região de herança pode ser maior e pode englobar também adicionalmente os sub-blocosl54a, bed, e, mesmo, alternativamente, a região de herança pode ser o bloco de árvore 150 propriamente dito com todos os blocos de folhas do mesmo a partilhar parâmetros de codificação associados a essa região de herança.

Deve-se notar, no entanto, que mais do que uma reqião de herança pode ser definida dentro um arranjo de amostras ou bloco de árvore 150, respetivamente. Imaqine-se, por exemplo, o sub-bloco no canto inferior esquerdo 152c também foi particionado em blocos menores. Neste caso, o sub-bloco 152c pode também formar uma reqião de herança.

No passo 552, a informação de herança é verificada quanto ao facto de a herança ser usada ou não. Se sim, o processo da Fig. 13 continua com o passo 554, onde um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elemento sintaxe é extraído do fluxo de dados por região inter-herança. No passo seguinte 556, este subconjunto de herança é então copiado para, ou utilizado como uma predição para, um subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto das regiões da folha de que a pelo menos uma região de herança respetiva é composta. Por outras palavras, para cada região de herança indicada na informação de herança, o fluxo de dados compreende um subconjunto de elementos de sintaxe de herança. Em ainda outras palavras, a herança pertence a pelo menos um determinado tipo de elemento de sintaxe ou categoria de elemento de sintaxe que está disponível para a herança. Por exemplo, o modo de predição ou modo de inter-predição ou modo de intra-predição do elemento de sintaxe podem ser submetidos a herança. Por exemplo, o subconjunto de herança contido dentro do fluxo de dados para a região de herança pode compreender um elemento de sintaxe de modo de inter-predição. O subconjunto de herança também pode compreender outros elementos de sintaxe dos tipos de elemento de sintaxe, que dependem do valor do tipo acima mencionado do elemento sintaxe fixo associado com o esquema de herança. Por exemplo, no caso do modo de inter-predição ser um componente fixo do subconjunto de herança, os elementos de sintaxe que definem a compensação de movimento, tais como os componentes de vetor de movimento, podem ou não ser incluídos no subconjunto de herança pela sintaxe. Imagine-se, por exemplo, que o quarto superior direito do bloco de árvore 150, ou seja, sub-bloco 152b, era a região de herança, em seguida, o modo de inter-predição só poderia ser indicado para esta região de herança ou o modo de inter-predição juntamente com os vetores de movimento e índices do vetor de movimento.

Todos os elementos de sintaxe contidos no subconjunto de herança são copiados ou usados como uma predição para os respetivos parâmetros de codificação de blocos de folhas dentro daquela região de herança da folha, ou seja, blocos de folha 154a, b, d e 156a a 156d. No caso de a predição ser utilizada, os resíduos são transmitidos para os blocos de folhas individuais.

Uma possibilidade para transmitir a informação de herança para o bloco de árvore 150 é a transmissão acima mencionada de um sinalizador de partilha f. A extração da informação de herança no passo 550 pode, neste caso, ter a seguinte composição. Em especial, o descodificador poderia ser configurado para extrair e verificar, para regiões de não folha correspondentes a qualquer um de um conjunto de pelo menos um nível de hierarquia da subdivisão multi-tree, utilizando uma ordem do nível de hierarquia a partir do nível mais baixo de hierarquia ao nível mais alto de hierarquia, o sinalizador de partilha / do fluxo de dados, para saber se o sinalizador respetivo de herança ou sinalizador de partilha prescreve a herança ou não. Por exemplo, o conjunto de herança de níveis de hierarquia pode ser formado por camadas de hierarquia 1 a 3 na

Fig. 12a. Assim, para qualquer um dos nós da estrutura de subárvore não sendo um nó de folha e localizado dentro de qualquer uma das camadas 1 a 3 pode ter um sinalizador de partilha a ele associado no fluxo de dados. O descodificador extrai esses sinalizadores de partilha na ordem da camada 1 para a camada 3, como numa ordem transversal de prioridade de profundidade ou prioridade de largura. Logo que um dos sinalizadores de partilha é igual a 1, o descodificador sabe que os blocos de folhas contidos numa região correspondente de herança partilham o subconjunto de herança subsequentemente extraído no passo 554. Para nós descendentes do nó atual, uma verificação de sinalizadores de herança não é mais necessária. Por outras palavras, os sinalizadores de herança para estes nós descendentes não foram transmitidos no fluxo de dados, uma vez que é evidente que a área desses nós, já pertence à região da herança dentro da qual o subconjunto de elementos de sintaxe de herança é partilhado.

Os sinalizadores de partilha / podem ser intercalados com os bits de sinalização acima mencionados da subdivisão quadtree. Por exemplo, uma sequência de bits intercalada incluindo ambos os sinalizadores de subdivisão, bem como os sinalizadores de partilha poderia ser: 10001101 (0000) 000, que é a mesma informação da subdivisão, tal como ilustrado na Fig. 6a com os dois sinalizadores de partilha intercalados, os quais são destacados por sublinhados a fim de indicar que, na Fig. 3c todos os sub-blocos no canto inferior esquerdo do bloco de árvore 150 partilham os parâmetros de codificação.

Outra forma de definir a informação de herança indicando a região de herança seria a utilização de duas subdivisões definidas de uma forma dependente uma da outra, tal como explicado acima em relação à predição e subdivisão residual, respetivamente. De um modo geral, os blocos de folhas da subdivisão primária poderiam formar a região de herança que define as regiões em que os subconjuntos de herança de elementos de sintaxe são partilhados, enquanto a subdivisão subordinada define os blocos dentro destas regiões de herança para as quais o subconjunto de herança de elementos de sintaxe é copiado ou utilizado como predição.

Considere-se, por exemplo, a árvore residual, como uma extensão da árvore de predição. Além disso, considere-se o caso em que os blocos de predição podem ser ainda divididos em blocos menores para o propósito de codificação residual. Para cada bloco de predição que corresponde a um nó de folha da predição quadtree relacionada, a subdivisão correspondente para a codificação residual é determinada por um ou mais quadtree (s) subordinado(s).

Neste caso, em vez de usar qualquer sinalização de predição em nós internos, consideramos a árvore residual como sendo interpretada de forma a também especificar um refinamento da árvore de predição, no sentido da utilização de um modo de predição constante (sinalizado pelo nó de folha da árvore correspondente relacionado à predição), mas com as amostras de referência refinadas. 0 exemplo a sequir ilustra este caso.

Por exemplo, as Fig. 14a e 14b mostram uma partição quadtree para intra-predição com amostras de referência vizinhas sendo destacadas para um nó de folha especifica da subdivisão primária, enquanto a Fig. 14b mostra a subdivisão quadtree residual para o mesmo nó de folha de predição com amostras de referência refinadas. Todos os sub-blocos mostrados na Fig. 14b apresentam os mesmos parâmetros de inter-predição contidos dentro do fluxo de dados para o respetivo bloco de folhas em destaque na Fig. 14a. Assim, a Fig. 14a mostra um exemplo para a partição quadtree convencional para a intra-predição, onde as amostras de referência para um nó de folha especifico são descritas. Na nossa forma de realização preferida, no entanto, um sinal de intra-predição separado é calculado para cada nó de folha na árvore residual usando amostras vizinhas já reconstruídas de nós de folha na árvore residual, por exemplo, conforme indicado pelas riscas cinzentas sombreadas na Fig. 4 (b) . Em seguida, o sinal reconstruído de um determinado nó de folha residual é obtido da maneira habitual, adicionando o sinal quantizado residual a este sinal de predição. Este sinal reconstruído é então usado como um sinal de referência para o processo de predição seguinte. Note-se que a ordem de descodificação para a predição é a mesma que a ordem de descodificação residual.

No processo de descodificação, como mostrado na Figura 15, para cada nó de folha residual, o sinal de predição p é calculado de acordo com o modo de intra-predição atual (como indicado pelo nó de folha quadtree relacionada a predição) utilizando as amostras de referência r' .

Após o processo SIT,

Re c Re s = SIT (Re s) o sinal reconstruído r é calculado e armazenado para o próximo processo de predição de cálculo: r = Re c Re s + p A ordem de descodificação para a predição é a mesma que a ordem de descodificação residual, que é ilustrada na Figura 16.

Cada nó de folha residual é descodificado como descrito no parágrafo anterior. 0 sinal reconstruído r é armazenado numa memória intermediária, como mostrado na Figura 16. Fora desta memória, as amostras de referência r' serão levadas para a próxima predição e processo de descodificação.

Depois de ter descrito formas de realização específicas em relação às Figs. 1 a 16 com subconjuntos combinados distintos dos aspetos acima delineados, formas de realização adicionais do presente pedido de patente são descritas que se concentram em determinados aspetos já descritos acima, mas que representam formas de realização generalizadas de algumas das formas de realização descritas acima. Em particular, as formas de realização acima descritas no que diz respeito à estrutura das Figs. 1 e 2, principalmente combinam muitos dos aspetos do presente pedido de patente, o que seria também vantajoso quando utilizado em outras aplicações ou outros campos de codificação. Como frequentemente mencionado durante a discussão acima, a subdivisão multi-tree, por exemplo, pode ser utilizada sem a fusão e/ou sem adoção/predição inter-plano e/ou sem a herança. Por exemplo, a transmissão do tamanho máximo do bloco, a utilização da ordem transversal de prioridade de profundidade, a adaptação do contexto, dependendo do nivel de hierarquia do respetivo sinalizador de subdivisão e a transmissão do nivel de hierarquia máximo dentro do fluxo de bits, a fim de economizar a taxa de bits de informação secundária, todos estes aspetos são vantajosos independentemente uns dos outros. Isso também é verdadeiro quando se considera o esquema de herança. A herança dos parâmetros de codificação é vantajosamente independente da subdivisão multi-tree exata usada de forma a subdividir uma imagem em regiões simplesmente ligadas e é vantajosamente independente da existência de mais de um arranjo de amostras ou o uso da adoção/predição inter-plano. 0 mesmo se aplica para as vantagens envolvidas com a adoção/predição inter-plano e herança.

Por conseguinte, generalizando as formas de realização, o esquema de codificação utilizando o esquema de herança acima referido não é restrito a ambientes híbridos de codificação. Isto é, a reconstrução poderia ser realizada sem predição. Os parâmetros de codificação herdados podem pertencer a outros parâmetros de codificação, tais como indicações de detalhes do filtro ou semelhantes. Como descrito acima, as regiões simplesmente ligadas em que o conjunto de amostras de informação é subdividido podem decorrer de uma subdivisão quadtree e podem ser de forma quadrada ou retangular. Além disso, as formas de realização descritas especificamente para subdividir um arranjo de amostras são meramente formas de realização específicas e outras subdivisões podem ser também usadas. Algumas possibilidades são mostradas na Fig. 17a e b. A Fig. 17a, por exemplo, mostra a subdivisão de um arranjo de amostras 606 num arranjo bidimensional regular de blocos de árvores de não sobreposição 608 que contactam entre si, com algumas das quais sendo subdivididas em conformidade com sub-blocos da estrutura em multi-tree 610 de tamanhos diferentes. Como mencionado acima, embora uma subdivisão quadtree seja ilustrada na Fig. 17a, uma partição de cada nó progenitor em qualquer outro número de nós descendentes também é possível. A Fig. 17b mostra uma forma de realização de acordo com a qual um arranjo de amostras 606 é subdividido em sub-blocos de diferentes tamanhos através da aplicação de uma subdivisão multi-tree diretamente sobre o arranjo de pixel inteiro 606. Isto é, o arranjo de pixel inteiro 606 é tratado como o bloco de árvore. Ambas as subdivisões das Figs. 17a e 17b levam a uma subdivisão do arranjo de amostras 606 em regiões que são simplesmente ligadas, de forma exemplar, de acordo com as formas de realização das Figs. 17a e 17b, sem sobreposição. No entanto, várias alternativas são possíveis. Por exemplo, os blocos podem sobrepor-se uns aos outros. A sobreposição pode, no entanto, ser limitada de tal forma que cada bloco tem uma porção não sobreposta por qualquer bloco vizinho, ou de tal modo que cada uma das amostras dos blocos é sobreposta por, no máximo, um bloco entre os blocos adjacentes dispostos em justaposição para o bloco atual ao longo de uma direção predeterminada. Este último significa que os blocos vizinhos da esquerda e da direita podem sobrepor o atual bloco de forma a cobrir totalmente o bloco atual, mas não podem se sobrepor um ao outro, e o mesmo se aplica para os vizinhos em direção vertical e diagonal.

Como descrito acima em relação às Figs. 1 a 16, o arranjo de amostras de informações não representa necessariamente uma imagem de um vídeo ou uma imagem estática. O arranjo de amostras também pode representar um mapa de profundidade ou um mapa de transparência de alguma cena. A determinação dos parâmetros de codificação e a informação de herança podem ser um processo iterativo. Por exemplo, se parâmetros de codificação anteriormente determinados idealmente, preliminarmente, no sentido da taxa/distorção das regiões vizinhas simplesmente ligadas pertencentes a uma região progenitora semelhante anteriormente preliminarmente determinada de forma ideal, no sentido da taxa/distorção, um processo iterativo pode determinar o abandono das pequenas diferenças entre estes parâmetros de codificação pode ser preferido sobre a sinalização dessas diferenças para o descodificador quando se considera que a herança permite suprimir a transmissão explícita dos parâmetros de codificação de todas estas regiões simplesmente ligadas completamente e substituir a apresentação destes parâmetros de codificação na totalidade pela submissão de um residual apenas ou meramente pela transmissão dos parâmetros de codificação partilhados.

Embora alguns aspetos tenham sido descritos no contexto de um aparelho, é evidente que estes aspetos representam também uma descrição do método correspondente, onde um bloco ou um dispositivo corresponde a uma etapa do método, ou uma característica de uma etapa do método. De forma análoga, os aspetos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou característica de um aparelho correspondente. Alguns ou todos os passos do método podem ser executados por (ou com) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrónico. Em algumas formas de realização, alguns ou mais dos passos mais importantes do método podem ser executados por esse aparelho.

Os sinais codificados/comprimidos inventivos podem ser armazenados num meio de armazenamento digital ou podem ser transmitidos num meio de transmissão, tal como um meio de transmissão sem fios ou um meio de transmissão por fios, tal como a Internet.

Dependendo de certos requisitos de implementação, as formas de realização da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, uma disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, apresentando sinais de controlo de leitura eletrónica armazenados nela, que cooperam (ou são capazes de cooperar) com um sistema de computador programável de modo que o respetivo método seja realizado. Portanto, o meio de armazenamento digital pode ser de leitura por computador.

Algumas formas de realização de acordo com a invenção compreendem um suporte de dados com os sinais de controlo legíveis eletronicamente, os quais são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos seja realizado.

Geralmente, as formas de realização da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para a realização de um dos métodos quando o produto de programa de computador é executado num computador. 0 código de programa, por exemplo, pode ser armazenado num suporte de leitura ótica.

Outras formas de realização compreendem o programa de computador para a execução de um dos métodos descritos no presente documento, armazenado num suporte de leitura ótica.

Por outras palavras, uma forma de realização do método da invenção é, portanto, um programa de computador com um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador é executado num computador.

Outra forma de realização dos métodos da invenção é, portanto, um suporte de dados (ou um meio de armazenamento digital, ou um meio legível por computador) , que compreende nele gravado, o programa de computador para a realização de um dos métodos aqui descritos.

Outra forma de realização do método da invenção é, portanto, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para a realização de um dos métodos aqui descritos. 0 fluxo de dados ou a sequência de sinais podem, por exemplo, ser configurados para ser transferidos através de uma ligação de comunicação de dados, por exemplo, através da Internet.

Uma forma de realização compreende, além disso, um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado ou adaptado para executar um dos métodos aqui descritos.

Outra forma de realização compreende um computador tendo nele instalado um programa de computador para a execução de um dos métodos aqui descritos.

Em algumas formas de realização, um dispositivo lógico programável (por exemplo, um arranjo de porta de campo programável - field programmable gate array) pode ser usado para executar uma parte ou todas as funcionalidades dos métodos aqui descritos. Em algumas formas de realização, um arranjo de porta de campo programável pode cooperar com um microprocessador para executar um dos métodos aqui descritos. Geralmente, os métodos são de preferência realizados por qualquer aparelho de hardware.

As formas de realização acima descritas são meramente ilustrativas dos princípios da presente invenção. Entende-se que modificações e variações dos arranjos e detalhes aqui descritos serão evidentes para outros peritos na arte. É intenção, portanto, ser limitado apenas pelo âmbito das reivindicações da patente anexas e não pelos pormenores específicos apresentados a título de descrição e explicação das formas de realização da presente invenção.

Lisboa, 18 de Novembro de 2015.

Claims

REIVINDICAÇÕES 1. Descodificador, para reconstruir um arranjo de amostras de informação que representam um sinal de informação representando um sinal de informação amostrado espacialmente, que é subdividido de acordo com a informação de subdivisão em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, a partir de um fluxo de dados, em que cada região da folha tem associado um nivel de hierarquia a partir de uma sequência de níveis de hierarquia da subdivisão multi-tree, cada região da folha tem com ela associados parâmetros de codificação, os parâmetros de codificação são, para cada região da folha, representados por um conjunto de elementos de sintaxe respetivo, cada elemento de sintaxe é de um tipo respetivo de elemento de sintaxe de um conjunto de tipos de elementos de sintaxe, e o descodificador compreendendo um extrator para extrair (550) a informação de subdivisão e informação de herança, sinalizada no interior do fluxo de dados para além da informação de subdivisão, a partir do fluxo de dados, a informação da herança indicando se a herança é ou não utilizada, e se a herança for indicada para ser utilizada, pelo menos uma região da herança das amostras do arranjo de informação que é composta por um conjunto das regiões de folha e corresponde a um nível de hierarquia de sequência de níveis de hierarquia da subdivisão multi-tree, sendo menor do que cada um dos níveis hierárquicos com os quais o conjunto de regiões de folhas está associado; em que o descodificador está configurado para, se a herança for indicada para ser utilizada, extrair (554) um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elemento de sintaxe do fluxo de dados por região de herança, e utilizar (556) o subconjunto de herança como uma predição para um subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto das regiões de folha onde pelo menos uma região de herança respetiva é composta.
2. Descodif icador de acordo com a reivindicação 1, em que o extrator está configurado extrair para cada região, exceto as regiões de folha, definida pela subdivisão multi-tree e usando uma ordem de nível de hierarquia de nível de hierarquia baixo e nível de hierarquia alto, um sinalizador de herança a partir do fluxo de dados associado à referida região; em que o descodificador está configurado para verificar, para cada região, exceto as regiões de folha, definidas pela subdivisão multi-tree se o sinalizador de herança prescreve herança, ou não, para a respetiva região, em que o extrator e o descodificador estão ainda configurados para não executar a extração e verificar para as regiões, que são nós descendentes de cada uma das referidas regiões, para as quais o referido sinalizador de herança prescreveu herança; em que o extrator e o descodificador estão ainda configurados para, para cada uma das regiões para as quais o sinalizador de herança associado prescreve a herança, extrair um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado do elemento de sintaxe do fluxo de dados, e usar o subconjunto de herança como uma predição para, um subconjunto de herança correspondente de elementos de sintaxe no conjunto de elementos de sintaxe que representa os parâmetros de codificação associados às regiões de folha de que é composta a região para a qual o sinalizador de herança associado prescreve a herança.
3. Descodificador de acordo com a reivindicação 1 ou 2, em que o descodificador é um descodificador híbrido.
4. Descodificador de acordo com qualquer uma das reivindicações 1 a 3, em que o descodificador está configurado para descodificar um resíduo para cada bloco de folhas.
5. Descodificador de acordo com qualquer uma das reivindicações 1 a 4, em que o descodificador está configurado para extrair pelo menos um elemento de sintaxe do tipo de elemento de sintaxe predeterminado dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados com as regiões de folha que não pertencem a qualquer conjunto de regiões de folha em que qualquer região de herança indicada pela informação de herança indica, é composta de, a partir do fluxo de dados.
6. Descodificador de acordo com qualquer uma das reivindicações 1 a 5, em que o descodif icador está configurado para, se a herança estiver indicada para não ser utilizada, extrair pelo menos um elemento de sintaxe do tipo de elemento de sintaxe predeterminado dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados a todas as regiões de folha do arranjo de amostras de informação.
7. Descodificador de acordo com qualquer uma das reivindicações 1 a 6, em que o descodificador está configurado para reconstruir as amostras do arranjo de informação por meio de predição usando um modo de predição em função do pelo menos um elemento de sintaxe do tipo de elemento de sintaxe predeterminado associado às regiões de folha.
8. Descodificador de acordo com qualquer uma das reivindicações 1 a 7, em que o pelo menos um elemento de sintaxe do tipo de elemento de sintaxe predeterminado é um elemento de sintaxe do modo intra-predição, e o descodificador está configurado para, por cada região de herança, descodificar, numa ordem de descodificação residual, um sinal residual para cada uma das regiões de folha de que a respetiva região de herança é composta, e calcular, na ordem de descodificação residual, um sinal de intra-predição separado para cada uma das regiões de folha, de que a região de herança respetiva é composta, de acordo com um modo de intra-predição indicado pelo elemento de sintaxe do modo de intra-predição, usando amostras vizinhas de um sinal reconstruído de regiões de folha já reconstruídas como um sinal de referência, com a reconstrução da respetiva região da folha, adicionando o sinal de intra-predição e o sinal residual.
9. Descodif icador de acordo com a reivindicação 8, em que o descodif icador é configurado de tal modo que a ordem de descodificação residual é uma ordem transversal de prioridade de profundidade.
10. Método para reconstruir um arranjo de amostras de informação que representam um sinal de informação amostrado espacialmente, que está subdividido, de acordo com informação de subdivisão, em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, a partir de um fluxo de dados, em que cada região da folha tem associado um nível de hierarquia a partir de uma sequência de níveis de hierarquia da subdivisão multi-tree, cada região da folha tem associados parâmetros de codificação, os parâmetros de codificação são, para cada região da folha, representados por um respetivo conjunto de elementos de sintaxe, cada elemento de sintaxe é de um tipo respetivo de elemento de sintaxe de um conjunto de tipos de elementos de sintaxe, e o método compreendendo extrair uma informação de subdivisão a partir do fluxo de dados; extrair (550) uma informação de herança sinalizada no interior do fluxo de dados, para além da informação de subdivisão, a partir do fluxo de dados, a informação de herança indicando se a herança é ou não utilizada, e se a herança está indicada para ser utilizada, pelo menos uma região da herança do arranjo de amostras de informação que é composta por um conjunto de regiões de folha e corresponde a um nivel de hierarquia de sequência de níveis de hierarquia da subdivisão multi-tree, sendo menor do que cada um dos níveis hierárquicos com os quais o conjunto de regiões de folhas está associado; se a herança está indicada para ser utilizada, extrair (554) um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elemento de sintaxe do fluxo de dados por região de herança, e utilizar (556) o subconjunto de herança como uma predição para um subconjunto de herança de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto das regiões de folha das quais a pelo menos uma região de herança respetiva é composta.
11. Codificador, para codificar um conjunto de amostras de informação representando um sinal de informação amostrado espacialmente, que é subdividido, de acordo com informação de subdivisão, em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, num fluxo de dados, em que cada região da folha tem associado um nível de hierarquia de uma sequência de níveis de hierarquia da subdivisão multi-tree, cada região da folha tem associados parâmetros de codificação, os parâmetros de codificação são, para cada região da folha, representados por um conjunto de elementos de sintaxe respetivo, cada elemento de sintaxe é de um tipo de elemento de sintaxe respetivo de um conjunto de tipos de elementos de sintaxe, e o codificador compreendendo um dispositivo de inserção de fluxo de dados para inserir a informação de subdivisão e a informação de herança no fluxo de dados, de modo que a informação de herança seja sinalizada no fluxo de dados, para além da informação de subdivisão, a informação de herança indicando se a herança é ou não utilizada, e se a herança é indicada para ser utilizada, pelo menos uma região de herança do arranjo de amostras de informação, que é composto por um conjunto de regiões de folha e corresponde a um nivel de hierarquia da sequência de níveis de hierarquia da subdivisão multi-tree, sendo inferior a cada um dos níveis hierárquicos aos quais o conjunto de regiões de folha está associado; em que o codificador está configurado para, se a herança for indicada para ser utilizada, introduzir um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elemento sintaxe do fluxo de dados por região de herança no fluxo de dados, e suprimir a codificação de um subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe representando os parâmetros de codificação associados ao conjunto das regiões de folha de que a pelo menos uma região de herança respetiva é composta, ou utilizando o subconjunto de herança inserido como uma predição em codificação residual em que o subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto de regiões de folha de que a pelo menos uma região de herança respetiva é composta, no fluxo de dados.
12. Método de codificação de um arranjo de amostras de informação que representam um sinal de informação amostrado espacialmente, que é subdividido, de acordo com informação de subdivisão, em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, num fluxo de dados, em que cada região da folha tem associado um nível de hierarquia a partir de uma sequência de níveis de hierarquia da subdivisão multi-tree, cada região da folha tem associados parâmetros de codificação, os parâmetros de codificação são, para cada região da folha, representados por um conjunto de elementos de sintaxe respetivo, cada elemento de sintaxe é de um tipo respetivo de elemento de sintaxe de um conjunto de tipos de elementos de sintaxe, e o método compreende inserir a informação de subdivisão no fluxo de dados; inserir no fluxo de dados uma informação de herança de modo que a informação de herança seja sinalizada no fluxo de dados, para além da informação de subdivisão, a informação de herança indicando se a herança é ou não utilizada, e se a herança está indicada para ser utilizada, pelo menos uma região de herança do arranjo de amostras de informação que é composta por um conjunto de regiões de folha e corresponde a um nivel de hierarquia de sequência de níveis de hierarquia da subdivisão multi-tree, sendo mais baixa do que cada um dos níveis hierárquicos aos quais o conjunto de regiões de folha está associado; se a herança for indicada para ser usada, inserir um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elemento de sintaxe do fluxo de dados por região de herança no fluxo de dados, e suprimir a codificação de um subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados com o conjunto de regiões de folha de que a pelo menos uma região de herança respetiva é composta, ou utilizando o subconjunto de herança inserido como uma predição em codificação residual, o subconjunto de herança correspondente de elementos de sintaxe no interior do conjunto de elementos de sintaxe representando os parâmetros de codificação associados ao conjunto das regiões de folha em que a pelo menos uma região de herança respetiva é composta, no fluxo de dados.
13. Meio de armazenamento digital legível por computador, tendo armazenado no mesmo um programa de computador com um código de programa para executar, quando executado num computador, um método de acordo com qualquer uma das reivindicações 10 e 12 .
14. Fluxo de dados, tendo codificado nele um arranjo de amostras de informação que representam um sinal de informação amostrada espacialmente, que é subdividido, de acordo com informação de subdivisão, em regiões de folhas de diferentes tamanhos por subdivisão multi-tree, num fluxo de dados, em que cada região da folha tem associado um nível de hierarquia, de uma sequência de níveis de hierarquia da subdivisão multi-tree, cada região da folha tem associados parâmetros de codificação, os parâmetros de codificação são, para cada região da folha, representados por um conjunto de elementos de sintaxe respetivo, cada elemento de sintaxe é de um tipo respetivo de elemento de sintaxe respetivo de um conjunto de tipos de elementos de sintaxe, em que o fluxo de dados compreende a informação de subdivisão; uma informação de herança sinalizada no fluxo de dados, para além da informação de subdivisão, a informação de herança indicando se a herança é utilizada ou não, e se a herança está indicada para ser utilizada, pelo menos, uma região de herança do arranjo de amostras de informação que é composta por um conjunto de regiões de folha e corresponde a um nível de hierarquia de sequência de níveis de hierarquia da subdivisão multi-tree, sendo menor do que cada um dos níveis hierárquicos aos quais o conjunto de regiões de folha está associado; se a herança está indicada para ser utilizada, um subconjunto de herança incluindo pelo menos um elemento de sintaxe de um tipo predeterminado de elementos de sintaxe do fluxo de dados por região de herança para o fluxo de dados, de tal modo que o subconjunto de herança seja copiado num subconjunto de herança correspondente de elementos de sintaxe no interior do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto de regiões de folha onde pelo menos uma região de herança respetiva é composta, ou é para ser usado como uma predição para um subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto das regiões de folha de que pelo menos uma região de herança respetiva é composta, em que o fluxo de dados compreende ainda resíduos do subconjunto de herança correspondente de elementos de sintaxe dentro do conjunto de elementos de sintaxe que representam os parâmetros de codificação associados ao conjunto de regiões de folha de que pelo menos uma região de herança respetiva é composta, em relação ao subconjunto de herança inserido como uma predição. Lisboa, 18 de Novembro de 2015.