BRPI0406507B1

BRPI0406507B1 - método de codificação de imagem e método de decodificação de imagem

Info

Publication number: BRPI0406507B1
Application number: BRPI0406507A
Authority: BR
Inventors: Lu Jiuhuai; Kozuka Masayuki; Kadono Shinya; Kashiwagi Yoshiichiro
Original assignee: Matsushita Electric Ind Co Ltd; Panasonic Corp; Panasonic Ip Corp America
Priority date: 2003-02-21
Filing date: 2004-02-18
Publication date: 2018-10-16
Also published as: EP1597909A4; US9071817B2; CN1751511A; US20060159165A1; US8081678B2; BRPI0406507A8; US8630342B2; MXPA05006718A; JP2004254327A; KR20100083853A; CN101247524A; CN100387059C; JP4348209B2; KR101004208B1; EP1597909A2; AU2004214795B2; CA2513537A1; CA2513537C; KR20050099964A; US20140126632A1

Abstract

"método de codificação de imagem e método de decodificação de imagem". o método de codificação de imagem da presente invenção é um método de codificação de imagem para a codificação de uma imagem em uma base bloco por bloco, que compreende: uma etapa de seleção de seleção de um de pelo menos dois tamanhos como um tamanho de um bloco no qual uma transformação ortogonal deve ser realizada; uma etapa de transformação de realização de uma transformação ortogonal em um bloco que tem o tamanho selecionado; uma etapa de codificação de codificação de dados do referido bloco obtido na etapa de transformação; e uma etapa de geração de geração de um fluxo codificado que inclui os dados codificados do bloco e a informação de tamanho concernente ao tamanho selecionado na etapa de seleção, onde a informação de tamanho indica se o tamanho é ou não um tamanho de bloco fixo em uma seção predeterminada no fluxo codificado, e a seção predeterminada é uma dentre uma seqüência, um grupo de imagens, uma imagem, uma fatia e um macrobloco.

Description

(54) Título: MÉTODO DE CODIFICAÇÃO DE IMAGEM E MÉTODO DE DECODIFICAÇÃO DE IMAGEM (51) lnt.CI.: H04N 7/12 (30) Prioridade Unionista: 21/02/2003 US 60/449,135 (73) Titular(es): PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA (72) Inventor(es): JIUHUAI LU; YOSHIICHIRO KASHIWAGI; MASAYUKI KOZUKA; SHINYA KADONO (85) Data do Início da Fase Nacional: 21/06/2005

1/42

Relatório Descritivo da Patente de Invenção para MÉTODO DE CODIFICAÇÃO DE IMAGEM E MÉTODO DE DECODIFICAÇÃO DE IMAGEM”.

Campo Técnico [001] A presente invenção refere-se a um método de codificação de imagem para a compressão eficiente de um filme e um método de decodificação de imagem para decodificação desse filme comprimido, bem como um aparelho de codificação de imagem e um aparelho de decodificação de imagem do mesmo, e, mais particularmente, a uma técnica melhorada para a obtenção de uma relação de compressão alta.

Técnica Antecedente [002] Na idade da multimídia, que lida integralmente com áudio, vídeo e valores de pixel de outros, mídias de informação existentes, isto é, jornais, revistas, televisão, rádio, telefone e outros meios através dos quais uma informação é levada para as pessoas, recentemente vieram a ser incluídas no escopo de multimídia. Em geral, multimídia se refere a representação não apenas de caracteres, mas, também, de elementos gráficos, vozes e, especialmente, imagens e similares em conjunto em associação uns com os outros. Entretanto, de modo a incluir a mídia de informação existente mencionada acima no escopo de multimídia, torna-se absolutamente necessário representar essa informação em forma digital.

[003] Entretanto, quando do cálculo da quantidade de informação contida em cada uma das mídias de informação mencionadas anteriormente como a quantidade de informação digital, enquanto a quantidade de informação por caractere é de 1 a 2 bytes no caso de caracteres, a quantidade de informação a ser requerida é de 64 kbits ou mais por segundo, no caso de vozes (qualidade de telefone) e 100 Mbits ou mais por segundo no caso de um filme (qualidade de recepção de tePetição 870180053328, de 21/06/2018, pág. 4/54

2/42 levisão atual). Assim, não é realístico que a mídia de informação mencionada anteriormente lide com tal quantidade enorme de informação como está em forma digital. Por exemplo, embora videofones já estejam em uso real pelo uso da Rede Digital de Serviços Integrados (ISDN), que oferece uma velocidade de transmissão de 64 kbits/s a

1,5 Mbits/s, não é possível transmitir um vídeo de televisões e câmeras diretamente através de ISDN.

[004] Contra este cenário, técnicas de compressão de informação tornaram-se requeridas, e técnicas de compressão de filme em conformidade com os padrões H.261 e H.263 recomendadas pela ITU-T (International Telecommunication Union - Telecommunication Standardization Sector) são empregados para videofones, por exemplo. Mais ainda, de acordo com uma técnica de compressão de informação em conformidade com o padrão MPEG-1, é possível armazenar uma informação de imagem em um CD (disco compacto) de música comum em conjunto com uma informação de áudio.

[005] Aqui, MPEG (Moving Picture Experts Group) é um padrão internacional de compressão de sinais de filme padronizado pela ISO/IEC (International Organization for Standardization/lnternational Electrotechnical Commission), e MPEG-1 é um padrão para compressão de informação de sinal de televisão de comerciante aproximadamente em um centésimo, de modo que um sinal de filme possa ser transmitido a uma taxa de 1,5 Mbits/s. Mais ainda, uma vez que a velocidade de transmissão obtida pelo padrão MPEG-1 é uma velocidade de qualidade média de cerca de 1,5 Mbits/s, MPEG-2, o qual foi padronizado com vistas à satisfação de exigências para uma qualidade de imagem mais melhorada, permite uma transmissão de dados equivalente à qualidade de difusão de televisão através da qual um sinal de filme é transmitido a uma taxa de 2 a 15 Mbits/s. Mais ainda, MPEG-4 foi padronizado pelo grupo de trabalho (ISO/IEC

Petição 870180053328, de 21/06/2018, pág. 5/54

3/42

JTC1/SC29/WG11), o qual promoveu a padronização de MPEG-1 e MPEG-2. MPEG-4, o qual provê uma relação de compressão mais alta do que MPEG-1 e MPEG-2 e o qual permite uma codificação/decodificação/operação baseada em objetos, é capaz de prover uma nova funcionalidade requerida nesta era da multimídia. No estágio inicial de padronização, MPEG-4 objetivou prover um método de codificação de taxa de bit baixa, mas ele foi estendido como um padrão suportando uma codificação mais geral, que lida com imagens entrelaçadas bem como alta codificação de taxa de bit. Atualmente, um esforço foi feito conjuntamente pela ISO/IEC e pela ITU-T para padronização de MPEG-4 AVC e ITU-T H.264 como métodos de codificação de imagem da próxima geração, que oferecem uma relação de compressão mais alta.

[006] Em geral, na codificação de um filme, a quantidade de informação é comprimida pela redução de redundâncias em direções temporal e espacial. Portanto, uma codificação de predição interimagem objetivando a redução de redundâncias temporais, estimativa de movimento e a geração de uma imagem preditiva são realizadas em uma base bloco por bloco com referência a imagem(ns) para frente ou para trás, e a codificação então é realizada no valor diferencial entre a imagem preditiva obtida e uma imagem na imagem atual a ser codificada. Aqui, imagem é um termo denotando uma imagem. No caso de uma imagem progressiva, Imagem significa um quadro, ao passo que significa um quadro ou campos no caso de uma imagem entrelaçada. Aqui, imagem entrelaçada é uma imagem de um quadro composta por dois campos, os quais são separados no momento da captura. Na codificação e na decodificação de uma imagem entrelaçada, é possível lidar com um quadro como (1) um quadro como ele está, (2) dois campos, ou (3) uma estrutura de quadro ou uma estrutura de campo em uma base por bloco no quadro.

Petição 870180053328, de 21/06/2018, pág. 6/54

4/42 [007] Uma imagem a ser codificada usando-se predição intraimagem sem referência a quaisquer imagens deve ser referida como uma imagem I. Uma imagem a ser codificada usando-se uma predição interimagem com referência a apenas uma imagem deve ser referida como uma imagem P. E uma imagem a ser codificada usando predição interimagem com referência a duas imagens ao mesmo tempo deve ser referida como uma imagem B. É possível que uma imagem B se refira a duas imagens, as quais podem ser arbitrariamente combinadas a partir de imagens para frente/para trás na ordem de exibição. Imagens de referência (imagens de referência) podem ser determinadas para cada bloco servindo como uma unidade de codificação/decodificação básica. A distinção deve ser feita entre essas imagens de referência ao chamar uma imagem de referência a ser descrita anteriormente em um fluxo de bit codificado como uma primeira imagem de referência, e ao se chamar uma imagem de referência a ser descrita mais tarde em um fluxo de bit codificado como uma segunda imagem de referência. Note que como uma condição para a codificação e a decodificação destes tipos de imagens, é requerido que imagens usadas para referência já estejam codificadas e decodificadas.

[008] As imagens P e as imagens B são codificadas usando-se uma predição interimagem de compensação de movimento. A codificação pelo uso de uma predição interimagem de compensação de movimento é um método de codificação que emprega compensação de movimento em uma codificação de predição interimagem. Diferentemente de um método para realização de predição simplesmente baseado em valores de pixel em uma imagem de referência, a estimativa de movimento é uma técnica capaz de melhorar a acurácia de predição, bem como resultando na quantidade de dados pela estimativa da quantidade de movimento (a partir deste ponto referido como um vePetição 870180053328, de 21/06/2018, pág. 7/54

5/42 tor de movimento) de cada parte em uma imagem e, ainda, pela realização de predição considerando-se essa quantidade de movimento. Por exemplo, é possível reduzir a quantidade de dados através de compensação de movimento pela estimativa de vetores de movimento da imagem atual a ser codificada e, então, codificando-se resíduos de predição entre valores de predição obtidos pelo deslocamento apenas da quantidade dos respectivos vetores de movimento e da imagem atual a ser codificada. Nesta técnica, os vetores de movimento também são gravados ou transmitidos em forma codificada, uma vez que a informação de vetor de movimento é requerida no momento da decodifi cação.

[009] Os vetores de movimento são estimados em uma base por macrobloco. Mais especificamente, um macrobloco deve ser previamente fixado na imagem atual a ser codificada, de modo a se estimarem vetores de movimento ao se encontrar a posição do bloco de referência mais similar desse macrobloco na área de busca em uma imagem de referência.

[0010] A FIGURA 1 é um diagrama que ilustra uma estrutura de dados de exemplo de um fluxo de bit. Como mostra a FIGURA 1, o fluxo de bit tem uma estrutura hierárquica, tal como abaixo. O fluxo de bit (Fluxo) é formado por mais de um grupo de imagens (GOP). Pelo uso de GOPs como unidades de codificação básicas, torna-se possível editar um filme bem como fazer um acesso randômico. Cada GOP é constituído por imagens plurais, cada uma das quais sendo uma dentre uma imagem I, uma imagem P e uma imagem B. Cada imagem é ainda constituída por fatias plurais. Cada fatia, a qual é uma área em formato de tira em cada imagem, é constituída por macroblocos plurais. Mais ainda, cada fluxo, GOP, imagem e fatia inclui um sinal de sincronização (sync) para indicação do ponto de térmico de cada unidade e um cabeçalho (cabeçalho) o qual é um dado comum a cada

Petição 870180053328, de 21/06/2018, pág. 8/54

6/42 referida unidade.

[0011] Note que quando os dados são transportados não em um fluxo de bit que é uma seqüência de fluxos, mas em um pacote e similar que é uma unidade fragmentada, o cabeçalho e a porção de dados, a qual é a outra parte além do cabeçalho, podem ser portados separadamente. Nesse caso, o cabeçalho e a porção de dados não devem ser incorporados no mesmo fluxo de bit, como mostrado na FIGURA 1. No caso de um pacote, contudo, mesmo quando o cabeçalho e a porção de dados não são transmitidos de forma contígua, é simplesmente que o cabeçalho correspondente à porção de dados é portado em um outro pacote. Portanto, mesmo quando o cabeçalho e a porção de dados não são incorporados no mesmo fluxo de bit, o conceito de um fluxo de bit codificado descrito com referência à FIGURA 1 também é aplicável a pacotes.

[0012] A FIGURA 2 é um diagrama de blocos que mostra a construção de um aparelho de codificação de imagem existente. Neste desenho, um aparelho de codificação de imagem 1 é um aparelho que realiza uma codificação de compressão em um sinal de imagem de entrada Vin, de modo a se extrair um sinal de imagem codificado Str, o qual foi codificado em um fluxo de bit pela realização de uma codificação de comprimento variável e similar. Esse aparelho de codificação de imagem 1 é compreendido por uma unidade de estimativa de movimento ME, uma unidade de compensação de movimento MC, uma unidade de subtração Sub, uma unidade de transformação ortogonal T, uma unidade de quantificação Q, uma unidade de quantificação inversa IQ, uma unidade de transformação ortogonal inversa IT, uma unidade de adição Add, uma memória de imagem PicMem, um comutador SW, e uma unidade de codificação de comprimento variável VLC.

[0013] O sinal de imagem Vin é introduzido na unidade de subtraPetição 870180053328, de 21/06/2018, pág. 9/54

7/42 ção Sub e na unidade de estimativa de movimento ΜΕ. A unidade de subtração Sub calcula, como um erro de predição, uma diferença entre cada imagem no sinal de imagem de entrada Vin e cada imagem preditiva em uma base bloco por bloco, e extrai o erro de predição calculado para a unidade de transformação ortogonal T. A unidade de transformação ortogonal T realiza uma transformação ortogonal no erro de predição, para transformá-lo em coeficientes de freqüência, e extrai esses coeficientes de freqüência para a unidade de quantificação Q. A unidade de quantificação Q quantifica esses coeficientes de freqüência introduzidos, e extrai os valores quantificados Qcoef para a unidade de codificação de comprimento variável VLC.

[0014] A unidade de quantificação inversa IQ realiza uma quantificação inversa nos valores quantificados Qcoef, de modo a torná-los os coeficientes de freqüência, e extrai esses coeficientes de freqüência para a unidade de transformação ortogonal inversa IT. A unidade de transformação ortogonal inversa IT realiza uma transformação de freqüência inversa nos coeficientes de freqüência de modo a transformálos em um erro de predição, e extrai esse erro de predição para a unidade de adição Add. A unidade de adição Add adiciona cada erro de predição e cada imagem preditiva extraída da unidade de estimativa de movimento MC, de modo a formar uma imagem decodificada. O comutador SW se ATIVA quando é indicado que essa imagem decodificada deve ser armazenada, e essa imagem decodificada é para ser armazenada na memória de imagem PicMem.

[0015] A propósito, a unidade de estimativa de movimento ME, a qual recebe o sinal de imagem Vin em uma base de macrobloco, detecta uma área de imagem mais próxima do sinal de imagem de entrada Vin dentre as imagens decodificadas armazenadas na memória de imagem PicMem, e determina vetor(es) de movimento MV indicando a posição dessa área. Os vetores de movimento são estimados para caPetição 870180053328, de 21/06/2018, pág. 10/54

8/42 da bloco, o que é obtido pela divisão de um macrobloco. Quando isto é feito, é possível usar mais de uma imagem como as imagens de referência. Uma imagem de referência usada para a estimativa de um vetor de movimento deve ser identificada por um número de identificação (índice de referência Index). Os números de imagem das respectivas imagens armazenadas na memória de imagem PicMem são associados a índices de referência Index.

[0016] A unidade de compensação de movimento MC lê uma imagem ótima como uma imagem preditiva a partir de dentre as imagens decodificada armazenadas na memória de imagem PicMem, com base nos vetores de movimento detectados no processamento acima e nos índices de referência Index.

[0017] A unidade de codificação de comprimento variável VLC realiza uma codificação de comprimento variável em cada um dos valores quantificados Qcoef, nos índices de referência Index e nos vetores de movimento MV, de modo a extraí-los como um fluxo codificado Str. [0018] A FIGURA 3 é um diagrama de blocos que mostra a construção de um aparelho de decodificação de imagem existente. Neste desenho, a unidades que operam da mesma maneira que aquela das unidades no aparelho de codificação de imagem mostrado na FIGURA 2 são atribuídos os mesmos números, e as descrições dos mesmos são omitidas.

[0019] A unidade de decodificação de comprimento variável VLD decodifica o fluxo codificado Str nos valores quantificados Qcoef, nos índices de referência Index e nos vetores de movimento MV. Aqueles valores quantificados Qcoef, índices de referência Index e vetores de movimento MV são introduzidos na memória de imagem PicMem, na unidade de compensação de movimento MC e na unidade de quantificação inversa IQ, quando um processamento de decodificação é realizado. O processamento a ser realizado nesse processamento de dePetição 870180053328, de 21/06/2018, pág. 11/54

9/42 codificação é equivalente àquele realizado no aparelho de codificação de imagem existente mostrado na FIGURA 2.

[0020] (Documento não de patente) ITU-T Rec. H.264 | ISO/IEC

14496-10 AVC Joint Final Committee Draft of Joint Video Specification (2002-8-10).

[0021] Entretanto, de acordo com o aparelho de codificação de imagem existente, é difícil usar uma relação de compressão alta para todas as imagens contendo muitos pixels e para todas as imagens de uma variedade de conteúdos. Assim, é requerido que esse aparelho de codificação de imagem existente seja capaz de melhorar a qualidade da imagem, bem como de oferecer uma relação de compressão alta.

[0022] Para se ser mais específico, o aparelho de codificação de imagem existente usa um bloco de tamanho fixo como uma unidade de realização de transformação ortogonal (tamanho de transformação ortogonal). Isso torna difícil obter uma alta relação de compressão para um sinal de filme incluindo imagens com uma variedade de conteúdos, tais como imagens de alta e baixa resolução, bem como imagens com muitas e poucas variações de brilho e cores. A razão para isso é que um tamanho de transformação ortogonal é de 8 x 8 pixels no caso de MPEG-1, MPEG-2 e MPEG-4, por exemplo, ao passo que um tamanho de transformação ortogonal é de 4 x 4 pixels no caso de MPEG-4 AVC, isto é, ITU-T H.264. Naquele ponto, uma vez que os pixels são mais fortemente correlacionados um ao outro e a densidade dentre pixels de um dispositivo de exibição (por exemplo, CRT) é mais alta se comparada com uma imagem de baixa resolução, é julgado desejável em muitos casos que um tamanho maior de transformação ortogonal seja usado para conteúdos com um número menor de componentes de alta freqüência, ao passo que um tamanho de transformação ortogonal menor seja usado para conteúdos com um número

Petição 870180053328, de 21/06/2018, pág. 12/54

10/42 maior de componentes de alta freqüência.

Exposição da Invenção [0023] A presente invenção foi concebida tendo em vista os problemas acima, e é um objetivo da presente invenção prover um método de codificação de imagem, um método de decodificação de imagem, um aparelho de codificação de imagem, um aparelho de decodificação de imagem e um programa do mesmo para a realização de codificação a uma alta relação de compressão, independentemente de a resolução das imagens bem como a taxa de bit ser alta ou baixa e independentemente de haver muitas variações no brilho e nas cores. [0024] De modo a se atingir o objetivo acima, o método de codificação de imagem de acordo com a presente invenção é um método de codificação de imagem para a codificação de uma imagem em uma base bloco por bloco, compreendendo: uma etapa de seleção de seleção de um de pelo menos dois tamanhos como um tamanho de um bloco no qual uma transformação ortogonal deve ser realizada; uma etapa de transformação de realização de uma transformação ortogonal em um bloco que tem o tamanho selecionado; uma etapa de codificação de codificação de dados do referido bloco obtido na etapa de transformação; e uma etapa de geração de geração de um fluxo codificado que inclui os dados codificados do bloco e a informação de tamanho concernente ao tamanho selecionado na etapa de seleção. [0025] Com esta construção, uma vez que um tamanho de transformação ortogonal é selecionado, é possível realizar uma transformação ortogonal de uma maneira apropriada de acordo com se a resolução é alta ou baixa, se a taxa de bit é alta ou baixa e se há muitas variações no brilho e na cor. Assim sendo, torna-se possível comprimir todos os tipos de imagens a uma relação de compressão mais alta. [0026] Aqui, a informação de tamanho pode indicar se o tamanho é um tamanho de bloco fixo em uma seção predeterminada no fluxo

Petição 870180053328, de 21/06/2018, pág. 13/54

11/42 codificado, e a seção predeterminada pode ser uma dentre uma seqüência, um grupo de imagens, uma imagem, uma fatia e um macrobloco.

[0027] Com a construção acima, torna-se possível indicar se um tamanho de bloco para transformação ortogonal é ou não fixo no fluxo codificado para cada seção predeterminada descrita acima.

[0028] Aqui, a informação de tamanho pode indicar se o tamanho selecionado na etapa de seleção é um dentre um primeiro tamanho e um segundo tamanho o qual é outro além do referido primeiro tamanho, e o primeiro tamanho pode ser um tamanho de um bloco constituído por 4x4 pixels, e o segundo tamanho pode ser um tamanho de um bloco constituído por 8x8 pixels.

[0029] Com a construção acima, torna-se possível melhorar uma relação de compressão pela comutação entre o primeiro tamanho para um bloco de 4 x 4 pixels e o segundo tamanho para um bloco de 8 x 8 pixels.

[0030] Aqui, na etapa de transformação, os dados do bloco transformado ortogonalmente podem ser quantificados pelo uso de uma matriz de ponderação correspondente ao tamanho do referido bloco. [0031] Com a construção acima, uma matriz de ponderação é usada para mudança do tamanho de uma etapa de quantificação em uma base de componente de freqüência no tempo de quantificação de componentes de freqüência transformadas ortogonalmente por meio da ponderação. Pelo uso de uma matriz de ponderação que corresponde a cada um dos primeiro tamanho e segundo tamanho, torna-se possível melhorar mais a eficiência de codificação.

[0032] Aqui, na etapa de codificação, a matriz de ponderação correspondente ao segundo tamanho pode ser codificada, e na etapa de geração, a referida matriz de ponderação codificada pode ser incorporada no fluxo codificado.

Petição 870180053328, de 21/06/2018, pág. 14/54

12/42 [0033] Com a construção acima, torna-se possível regulara matriz de ponderação correspondente ao primeiro tamanho como a matriz de ponderação padrão em ambos os métodos de codificação e decodificação de imagem, de modo a habilitar a matriz de ponderação correspondente ao segundo tamanho para ser seletivamente usada no método de codificação de imagem.

[0034] Aqui, na etapa de seleção, um dentre o primeiro tamanho e o segundo tamanho pode ser selecionado de acordo com pelo menos uma das seguintes: uma taxa de bit do fluxo codificado; uma resolução da imagem; e uma indicação do exterior.

[0035] Com a construção acima, torna-se possível fazer uma seleção flexível do primeiro tamanho ou do segundo tamanho de acordo com qualquer uma dentre a taxa de bit do fluxo codificado, a resolução da imagem e uma indicação do exterior.

[0036] Como descrito acima, de acordo com o método de codificação de imagem e com o método de decodificação de imagem da presente invenção, torna-se possível comprimir eficientemente quaisquer tipos de imagens, independentemente de a resolução de imagem ser alta ou baixa, independentemente de a taxa de bit ser alta ou baixa, e independentemente de haver muitas variações de brilho e cores.

[0037] Mais ainda, é possível obter os efeitos descritos acima através do aparelho de codificação de imagem, do aparelho de decodificação de imagem e do programa dos mesmos, de acordo com a presente invenção.

[0038] Como uma informação adicional sobre os antecedentes técnicos para este pedido, o Pedido de Patente Provisória U.S. N° de Série 60/449135 depositado em 21 de fevereiro de 2003 é incorporado aqui como referência.

Breve Descrição dos Desenhos [0039] Estes e outros objetivos, vantagens e recursos da invenção

Petição 870180053328, de 21/06/2018, pág. 15/54

13/42 tornar-se-ão evidentes a partir da descrição a seguir da mesma, tomada em conjunto com os desenhos em anexo que ilustram uma modalidade específica da invenção. Nos Desenhos:

[0040] a FIGURA 1 é um diagrama que ilustra uma estrutura de dados de exemplo de um fluxo de bit;

[0041] a FIGURA 2 é um diagrama de blocos que mostra uma construção de um aparelho de codificação de imagem existente;

[0042] a FIGURA3 é um diagrama de blocos que mostra uma construção de um aparelho de decodificação de imagem existente; [0043] a FIGURA 4 é um diagrama de blocos que mostra uma construção de um aparelho de codificação de imagem de acordo com uma modalidade da presente invenção;

[0044] as FIGURA 5A a 5G são diagramas que mostram tamanhos de bloco para compensação de movimento no momento da codificação interimagem;

[0045] a FIGURA 6A é um diagrama de blocos que mostra um macrobloco de luma de 16 x 16 pixels e um bloco de transformação ortogonal do mesmo;

[0046] a FIGURA 6B é um diagrama de blocos que mostra um macrobloco de croma de 8 x 8 pixels e um bloco de transformação ortogonal do mesmo;

[0047] a FIGURA 7A é um diagrama que mostra uma matriz de ponderação para um bloco de 8 x 8 pixels;

[0048] a FIGURA 7B é um diagrama que mostra uma matriz de ponderação para um bloco de 4 x 4 pixels;

[0049] a FIGURA 8 é um fluxograma que mostra um processamento de codificação realizado no aparelho de codificação de imagem de acordo com a presente modalidade;

[0050] as FIGURA 9A a 9C são diagramas que mostram onde uma informação de tamanho é inserida em cada fluxo codificado;

Petição 870180053328, de 21/06/2018, pág. 16/54

14/42 [0051] as FIGURA 10A a 10C são diagramas que mostram onde a informação de tamanho e uma matriz de ponderação são inseridas em cada fluxo codificado em uma base por GOP;

[0052] as FIGURA 11A a 11C são diagramas que mostram onde a informação de tamanho e uma matriz de ponderação são inseridas em cada fluxo codificado em uma base por fatia;

[0053] a FIGURA 12 é um fluxograma que mostra uma variação de exemplo do processamento de codificação de imagem;

[0054] a FIGURA 13 é um fluxograma que mostra um processamento de codificação de imagem a ser realizado no caso em que uma matriz de ponderação 4 x 4 é derivada de uma matriz de ponderação 8 x 8;

[0055] a FIGURA 14 é um diagrama de blocos que mostra uma construção de um aparelho de decodificação de imagem de acordo com a modalidade da presente invenção;

[0056] a FIGURA 15 é um fluxograma que mostra um processamento de decodificação de comprimento variável realizado pelo aparelho de decodificação de imagem da presente modalidade;

[0057] a FIGURA 16 é um fluxograma que mostra um processamento de decodificação de imagem a ser realizado no caso em que uma matriz de ponderação W4mat é derivada de uma matriz de ponderação W8mat;

[0058] as FIGURA 17A a 17C são diagramas que ilustram um meio de gravação que armazena um programa para a realização do método de codificação de imagem e do método de decodificação de imagem de acordo com a modalidade acima por um sistema de computador;

[0059] a FIGURA 18 é um diagrama de blocos que mostra uma configuração geral de um sistema de suprimento de conteúdo;

[0060] a FIGURA 19 é um diagrama que mostra uma visão externa

Petição 870180053328, de 21/06/2018, pág. 17/54

15/42 de um telefone celular que emprega o método de codificação de imagem e o método de decodificação de imagem;

[0061] a FIGURA 20 é um diagrama de blocos que mostra uma construção do telefone celular; e [0062] a FIGURA 21 é um diagrama que mostra uma configuração geral de um sistema de difusão digital.

Melhor Modo de Realização da Invenção [0063] O que vem a seguir descreve uma modalidade da presente invenção com referência às FIGURA 4 a 21.

[0064] A FIGURA 4 é um diagrama de blocos que mostra a construção de um aparelho de codificação de imagem de acordo com a modalidade da presente invenção. Neste desenho, um aparelho de codificação de imagem 1 é compreendido por uma unidade de determinação DE, uma unidade de estimativa de movimento ME, uma unidade de compensação de movimento MC, uma unidade de subtração Sub, uma unidade de transformação ortogonal T1, uma unidade de quantificação Q1, uma unidade de quantificação inversa IQ1, uma unidade de transformação ortogonal inversa IT1, uma unidade de adição Add, uma memória de imagem PicMem, um comutador SW, e uma unidade de codificação de comprimento variável VLC1.

[0065] A unidade de determinação DE determina (1) um tamanho de bloco Tsize de um bloco no qual uma transformação ortogonal deve ser realizada pela unidade de transformação ortogonal inversa IT1 (a partir deste ponto, referido como tamanho de transformação ortogonal) e (2) uma matriz de ponderação Wmatrix para mudança de uma matriz de quantificação a ser usada na unidade de quantificação Q1. Há dois tamanhos de transformação ortogonal Tsize, um primeiro tamanho e um segundo tamanho, os quais são seletivamente determinados em uma base por macrobloco. Aqui, o primeiro tamanho deve

Petição 870180053328, de 21/06/2018, pág. 18/54

16/42 indicar 4x4 pixels e o segundo tamanho deve indicar 8x8 pixels. Quanto às matrizes de ponderação Wmatrix, há uma matriz de ponderação W4 para o primeiro tamanho e um matriz de ponderação Oitavas passagens de água W8 para o segundo tamanho.

[0066] Um tamanho de transformação ortogonal é determinado com base na resolução da imagem atual a ser codificada, se há muitas variações no brilho e nas cores (componentes de alta freqüência) e na taxa de bit de um fluxo codificado Str, e similares. Por exemplo, a unidade de determinação DE seleciona um tamanho de transformação ortogonal da maneira a seguir:

[0067] Exemplo 1: a unidade de determinação DE seleciona o segundo tamanho quando o nível de resolução da imagem atual a ser codificada é igual a ou maior do que um primeiro limite, ao passo que seleciona o primeiro tamanho quando o nível de resolução da imagem atual é menor do que o primeiro limite. O nível de resolução de uma HDTV e similar pode ser usado como o primeiro limite;

[0068] Exemplo 2: a unidade de determinação DE seleciona o segundo tamanho quando a taxa de bit após a codificação é igual a ou maior do que um segundo limite, ao passo que seleciona o primeiro tamanho quando a taxa de bit é menor do que o segundo limite. O segundo limite pode ser de 10 Mbps, por exemplo; e [0069] Exemplo 3: a unidade de determinação DE julga, a partir de um resultado prévio de transformação ortogonal, o número de componentes de freqüência alta, e seleciona o segundo tamanho quando o número de componentes de freqüência alta é maior do que um terceiro limite ao passo que a unidade de determinação DE seleciona o primeiro tamanho quando esse número é menor do que o terceiro limite. Em outras palavras, um julgamento deve ser feito aqui quanto a haver ou não muitas componentes de alta freqüência, pela contagem do número ou dos valores de coeficientes de freqüência os quais são mais altos

Petição 870180053328, de 21/06/2018, pág. 19/54

17/42 do que a n-ésima ordem. Aqui, um valor o qual é predeterminado de acordo com a qualidade de imagem e similar pode ser o terceiro limite. [0070] Nos exemplos 1 a 3 acima, a unidade de determinação DE pode ainda determinar um tamanho de transformação ortogonal de acordo com um tamanho de bloco para compensação de movimento. [0071] As FIGURA 5A a 5G são diagramas que mostram tamanhos de bloco para compensação de movimento (a partir deste ponto referido(s) como tamanho(s) de compensação de movimento) no momento da codificação interimagem. Delas, a FIGURA 5A mostra o tamanho de compensação de movimento de 16 x 16 pixels, a FIGURA 5B mostra 16x8 pixels, a FIGURA 5C mostra 8x16 pixels, e a FIGURA 5D mostra 8x8 pixels. Mais ainda, o tamanho de compensação de movimento de 8 x 8 pixels mostrado na FIGURA 5D ainda pode ser dividido em um dentre os tamanhos a seguir de modo a serem usados como um tamanho de compensação de movimento: 8x4 pixels mostrado na FIGURA 5E, 4x8 pixels mostrado na FIGURA 5F, e 4 x 4 pixels mostrado na FIGURA 5G. Preferencialmente há uma consistência entre os tamanhos de bloco usados como um tamanho de compensação de movimento e um tamanho de transformação ortogonal, de modo que um processamento possa ser simplificado e artefatos em uma fronteira de bloco não sejam dispersos. Considerando-se isso, a unidade de determinação DE determina um tamanho de transformação ortogonal de uma maneira pela qual um tamanho de transformação ortogonal se torna menor do que um tamanho de compensação de movimento.

[0072] Mais especificamente, no caso de uma codificação interimagem, quando os tamanhos de compensação de movimento são como mostrado nas FIGURA 5A a 5D (16 x 16 pixels, 16x8 pixels, 8 x pixels e 8 x 8 pixels), exatamente um ou mais blocos de 8 x 8 pixels mostrado na FIGURA 5D é/estão contido(s). Nestes casos, uma vez

Petição 870180053328, de 21/06/2018, pág. 20/54

18/42 que uma eficiência mais alta é obtida pela realização de uma transformação ortogonal em uma base de bloco de 8 x 8 pixels, a unidade de determinação DE deve selecionar o segundo tamanho (8x8 pixels) como um tamanho de transformação ortogonal. A propósito, quando um tamanho de compensação de movimento é menor do que 8x8 pixels, como mostrado nas FIGURA 5E a 5G, a unidade de determinação DE deve selecionar o primeiro tamanho (4x4 pixels).

[0073] Quanto mais freqüentemente a unidade de determinação DE comuta os tamanhos de transformação ortogonal entre o primeiro tamanho e o segundo tamanho, mais complicada a construção do aparelho de codificação de imagem e do aparelho de decodificação de imagem se torna. Uma melhor eficiência de codificação, contudo, pode ser obtida por isto.

[0074] Note que a unidade de determinação DE pode determinar um tamanho de transformação ortogonal em uma base de fatia/imagem/GOP /seqüência, ao invés de em uma base de macrobloco. Mais ainda, no caso em que um tamanho de transformação ortogonal é indicado a partir do exterior do aparelho de codificação de imagem, a unidade de determinação DE pode usar esse tamanho indicado como um tamanho de transformação ortogonal Tsize.

[0075] A unidade de compensação de movimento MC lê um bloco de referência de acordo com o(s) vetor(es) de movimento estimado(s) pela unidade de estimativa de movimento ME, de modo a gerar uma imagem preditiva a partir desse bloco de referência, e extrai a imagem preditiva gerada para a unidade de subtração Sub. Uma imagem preditiva é extraída para cada bloco tendo um tamanho de compensação de movimento selecionado a partir de dentre os tamanhos de compensação de movimento mostrados nas FIGURA 5A a 5G.

[0076] A unidade de subtração Sub calcula, como um erro de predição, a diferença entre uma imagem no sinal de imagem Vin e uma

Petição 870180053328, de 21/06/2018, pág. 21/54

19/42 imagem preditiva para cada bloco tendo um tamanho de compensação de movimento selecionado a partir de dentre os tamanhos de compensação de movimento mostrados nas FIGURA 5A a 5G, e extrai esse erro de predição calculado para a unidade de transformação ortogonal T1.

[0077] A unidade de transformação ortogonal T1 realiza uma transformação ortogonal em um erro de predição de modo a transformá-lo em coeficientes de freqüência para cada bloco tendo um tamanho de transformação ortogonal Tsize extraído pela unidade de determinação DE, e extrai a resultante para a unidade de quantificação Q. Aqui, com referência às FIGURA6A e 6B, uma descrição é dada da transformação ortogonal a ser realizada no caso em que um tamanho de transformação ortogonal Tsize é o segundo tamanho (8x8 pixels). É ilustrado no lado esquerdo da FIGURA 6A um macrobloco de luma de 16 x 16 pixels. Uma vez que o segundo tamanho é indicado como um tamanho de transformação ortogonal Tsize no caso de uma codificação intra-imagem, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal em uma base de bloco de 8 x 8 pixels. Mais ainda, como mostrado no lado direito da FIGURA 6A, a unidade de transformação ortogonal T1 integra quatro componentes DC de quatro blocos transformados ortogonalmente de 8 x 8 pixels, de modo a gerar um bloco DC de luma de 2 x 2 pixels e, então, realiza uma transformação ortogonal de bloco de 2 x 2 pixels nesse bloco DC de luma. Note que a geração de um bloco DC de luma e a execução de uma transformação ortogonal de bloco de 2 x 2 pixels podem ser omitidas. A propósito, uma vez que o segundo tamanho é indicado como um tamanho de transformação ortogonal Tsize no caso de uma codificação interimagem, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal em uma base de bloco de 8 x 8 pixels. Neste caso, a geração de um bloco DC de luma e a execução da

Petição 870180053328, de 21/06/2018, pág. 22/54

20/42 transformação ortogonal não devem ser realizadas.

[0078] É ilustrado no lado esquerdo da FIGURA6B um macrobloco de croma de 8 x 8 pixels. Com referência a um sinal de imagem, em geral, um sinal de crominância tem metade do número de pixels em ambas as direções horizontal e vertical, se comparado com um sinal de luminância. Assim, o número de pixels em um macrobloco de croma é de 8 x 8 pixels. No caso de uma codificação intra-imagem, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal em uma base de bloco de 4 x 4 pixels, o qual é metade do tamanho do segundo tamanho indicado como um tamanho de transformação ortogonal Tsize. Então, a unidade de transformação ortogonal T1 integra quatro componentes DC de quatro blocos de croma de 4 x 4 transformados ortogonalmente, de modo a gerar um bloco DC de croma de 2 x 2 pixels e, então, realiza uma transformação ortogonal de bloco de 2 x 2 pixels nesse bloco DC de croma. Note que a geração de um bloco DC de croma e a execução de uma transformação ortogonal de bloco de 2 x 2 pixels podem ser omitidas. A propósito, no caso de uma codificação interimagem, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal em uma base de bloco de 4 x 4 pixels, o qual é metade do tamanho do segundo tamanho indicado como um tamanho de transformação ortogonal Tsize. Neste caso, a geração de um bloco DC de croma e a execução da transformação ortogonal não devem ser realizadas.

[0079] Como descrito acima, quando um tamanho de transformação ortogonal Tsize indica o segundo tamanho, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal em duas etapas em um bloco de luma e um bloco de croma no caso de codificação intra-imagem, ao passo que realiza uma transformação ortogonal de etapa única no caso de codificação interimagem. A propósito, quando um tamanho de transformação ortogonal Tsize indica o primeiPetição 870180053328, de 21/06/2018, pág. 23/54

21/42 ro tamanho, a unidade de transformação ortogonal T1 realiza uma transformação ortogonal como no caso do segundo tamanho, uma vez que a diferença entre os primeiro e segundo tamanhos é a diferença em um tamanho de bloco, mas uma codificação de etapa única deve ser realizada no caso de codificação intra-imagem e de codificação interimagem.

[0080] A unidade de quantificação Q1 quantifica um bloco de coeficiente de freqüência de 4 x 4 ou 8 x 8 pixels introduzido a partir da unidade de transformação ortogonal T1, e extrai valores quantificados Qcoef para a unidade de codificação de comprimento variável VLC. Ao fazê-lo, a unidade de quantificação Q1 pondera uma matriz de quantificação de acordo com uma matriz de ponderação Wmatrix determinada pela unidade de determinação DE, e quantifica o bloco de coeficiente de freqüência usando essa matriz de quantificação ponderada. As FIGURA 7A e 7B são diagramas que ilustram matrizes de ponderação. Quando um tamanho de transformação ortogonal é o primeiro tamanho, uma matriz de ponderação Wmatrix a ser introduzida a partir da unidade de determinação DE deve ser uma matriz de ponderação W4mat de 4 x 4 pixels mostrada na FIGURA 7B, ao passo que quando um tamanho de transformação ortogonal é o segundo tamanho, uma matriz de ponderação Wmatrix deve ser uma matriz de ponderação W8mat de 8 x 8 pixels mostrada na FIGURA 7A. Pelo uso de uma matriz de ponderação, os tamanhos de etapas de quantificação são mudados em uma base por coeficiente de freqüência no momento da quantificação de coeficientes de freqüência transformados ortogonalmente. É conhecido no MPEG-2 que ouso de uma matriz de ponderação melhora a eficiência de codificação. Uma vez que vários tamanhos de tamanho de transformação ortogonal são comutados entre eles na presente modalidade, torna-se possível melhorar a eficiência de codificação pelo emprego de uma matriz de ponderação diferente para cada

Petição 870180053328, de 21/06/2018, pág. 24/54

22/42 um dos tamanhos de transformação ortogonal. Na Figura 7A, W8i,j (i e j são qualquer um de 0 a 7, respectivamente) indica que uma ponderação a ser aplicada ao componente na i-ésima linha nas oito linhas e a j-ésima coluna nas oito colunas. Na FIGURA 7B, W4i,j (i e j são qualquer um de 0 a 3, respectivamente) indica que uma ponderação a ser aplicada ao componente na i-ésima linha nas quatro linhas e a j-ésima coluna nas quatro colunas.

[0081] A unidade de quantificação inversa IQ1 realiza uma quantificação inversa nos valores quantificados Qcoef de modo a torná-los coeficientes de freqüência, e extrai esses coeficientes de freqüência para a unidade de transformação ortogonal T1. Dito de uma outra forma, a unidade de quantificação inversa IQ1 realiza um processamento que é o inverso do processamento realizado pela unidade de quantificação Q1, de acordo com a matriz de ponderação Wmatrix introduzida a partir da unidade de determinação DE.

[0082] A unidade de transformação ortogonal inversa T1 realiza uma transformação de freqüência inversa no bloco de coeficiente de freqüência recebido a partir da unidade de quantificação inversa IQ1 de modo a transformá-lo em um erro de predição, e extrai esse erro de predição para a unidade de adição Add. Dito de uma outra forma, a unidade de transformação ortogonal inversa IT1 realiza um processamento que é o inverso do processamento realizado pela unidade de transformação ortogonal T1 para cada bloco tendo um tamanho de transformação ortogonal Tsize introduzido a partir da unidade de determinação DE.

[0083] A unidade de adição Add adiciona o erro de predição e uma imagem preditiva extraída a partir da unidade de compensação de movimento MC para cada bloco tendo o mesmo tamanho de compensação de movimento que aquele no qual a unidade de subtração Sub realizou um processamento, e gera uma imagem decodificada.

Petição 870180053328, de 21/06/2018, pág. 25/54

23/42 [0084] O comutador SW se ATIVA quando é indicado que essa imagem decodificada deve ser armazenada, e a imagem decodificada é para ser armazenada na memória de imagem PicMem.

[0085] A propósito, a unidade de estimativa de movimento ME, a qual recebe o sinal de imagem Vin em uma base de macrobloco, estima uma área de imagem mais próxima desse sinal de imagem de entrada Vin de dentre as imagens decodificadas armazenadas na memória de imagem PicMem, e determina vetor(es) de movimento MV indicando a posição dessa área. Os vetores de movimento são estimados para cada bloco, o que é obtido pela divisão adicional de um macrobloco. Quando isto é feito, é possível usar mais de uma imagem como imagens de referência. Uma imagem de referência usada para estimativa de um vetor de movimento deve ser indicada por um número de identificação (índice de referência Index). Os números de imagem das respectivas imagens armazenadas na memória de imagem PicMem são associados a índices de referência.

[0086] A unidade de compensação de movimento MC lê uma imagem ótima como uma imagem preditiva de dentre as imagens decodificadas armazenadas na memória de imagem PicMem, com base nos vetores de movimento detectados no processamento acima e nos índices de referência Index.

[0087] A unidade de codificação de comprimento variável VLC1 realiza uma codificação de comprimento variável em cada um dos valores quantificados Qcoef, nos índices de referência Index e nos vetores de movimento MV, de modo a extraí-los como um fluxo codificado Str. Ao fazê-lo, a unidade de codificação de comprimento variável VLC1 gera uma informação de tamanho TsizeFlag, de acordo com cada tamanho de transformação ortogonal Tsize, e codifica essa informação de tamanho TsizeFlag e uma matriz de ponderação Wmatrix. Há dois tipos de matrizes de ponderação Wmatrix: uma matriz de ponPetição 870180053328, de 21/06/2018, pág. 26/54

24/42 deração W8mat para transformação ortogonal 8 x 8 e uma matriz de ponderação W4mat para uma transformação ortogonal 4x4.

[0088] A FIGURA 8 é um fluxograma que mostra um processamento de codificação realizado no aparelho de codificação de imagem de acordo com a presente modalidade. A unidade de determinação DE determina um tamanho de transformação ortogonal Tsize e uma matriz de ponderação Wmatrix em uma base por macrobloco (S10). A transformação ortogonal e a quantificação devem ser realizadas com base nesses tamanho de transformação ortogonal Tsize e matriz de ponderação Wmatrix determinados. Mais ainda, a unidade de codificação de comprimento variável VLC1 realiza uma codificação de uma maneira que permite que uma informação de tamanho TsizeFlag indicando Tsize seja incorporada no fluxo codificado Str para cada seção predeterminada, isto é, uma das seguintes seções: seqüência, GOP, imagem, fatia e macrobloco. Aqui, a informação de tamanho TsizeFlag significa qualquer um dos seguintes: (A) todos os tamanhos de transformação ortogonal em uma seção predeterminada são de 8 x 8 pixels; (B) todos os tamanhos de transformação ortogonal em uma seção predeterminada são de 4 x 4 pixels; e (C) é desconhecido se todos os tamanhos de transformação ortogonal em uma seção predeterminada são 8x8 pixels ou 4 x 4 pixels (isto é, se há uma mistura de blocos de 4 x 4 pixels e blocos de 8 x 8 pixels). Note que não é necessário distinguir todas as informações de tamanho TsizeFlag (A) a (C) umas das outras e, portanto, que uma distinção pode ser feita, por exemplo, apenas entre (A) e (C) e (B) e (C). Mais ainda, quando deve haver uma mistura de tamanhos de transformação ortogonal 8 x 8 e 4 x 4, uma distinção pode ser feita apenas entre (A) e (B).

[0089] Como mostrado na FIGURA 9A, quando da codificação da informação de tamanho de TsizeFlag em uma base por GOP, como uma seção predeterminada, a unidade de codificação de comprimento

Petição 870180053328, de 21/06/2018, pág. 27/54

25/42 variável VLC1 julga se todos os tamanhos de transformação ortogonal Tsize nessa seção são do segundo tamanho (8x8 pixels) ou do primeiro tamanho (4x4 pixels) (S11 e S12).

[0090] Quando o resultado do julgamento indica que há apenas blocos de 8 x 8 pixels, a unidade de codificação de comprimento variável VLC1 codifica a informação de tamanho TsizeFlag indicando que todos os blocos de transformação ortogonal no GOP são dimensionados para 8x8 pixels (S13), e codifica uma matriz de ponderação W8mat para um bloco de 8 x 8 pixels (S14). A FIGURA 10B mostra um fluxo codificado Str a ser gerado neste caso.

[0091] Quando o resultado do julgamento indica que há apenas blocos de 4 x 4 pixels, a unidade de codificação de comprimento variável VLC1 codifica a informação de tamanho TsizeFlag indicando que todos os blocos de transformação ortogonal no GOP são dimensionados para 4x4 pixels (S15) e codifica uma matriz de ponderação W4mat para um bloco de 4 x 4 pixels (S16). A FIGURA 10C mostra um fluxo codificado Str a ser gerado neste caso.

[0092] Quando o resultado do julgamento indica que todos os blocos de transformação ortogonal não podem ser classificados como um bloco de 8 x 8 pixels ou como um bloco de 4 x 4 pixels (isto é, há uma mistura deles), a unidade de codificação de comprimento variável VLC1 codifica a informação de tamanho TsizeFlag indicando que todos os blocos de transformação ortogonal no GOP não são dimensionados apenas como 4x4 pixels ou 8 x 8 pixels (S17), e codifica uma matriz de ponderação W4mat para um bloco de 4 x 4 pixels e uma matriz de ponderação W8mat para um bloco de 8 x 8 pixels (S18). A FIG 10A mostra um fluxo codificado Str a ser gerado neste caso. Note que de modo a informar ao aparelho de decodificação se um tamanho de transformação ortogonal Tsize de cada macrobloco é o primeiro tamanho ou o segundo tamanho, é desejável que a unidade de codificação

Petição 870180053328, de 21/06/2018, pág. 28/54

26/42 de comprimento variável VLC1 realize uma codificação de uma maneira na qual um tamanho de transformação ortogonal Tsize será incorporado em uma base de macrobloco.

[0093] Na descrição acima é dado um exemplo para o caso em que a unidade de codificação de comprimento variável VLC1 codifica uma informação de tamanho TsizeFlag em uma base por GOP, mas a unidade de codificação de comprimento variável VLC1 pode codificar a informação de tamanho TsizeFlag em uma base por fatia, como mostrado na FIGURA9B. Nesse caso, as matrizes de ponderação devem ser codificadas como mostrado nas FIGURA 11A a 11C.

[0094] A FIGURA 11A mostra a estrutura de um fluxo codificado no caso em que há uma mistura do primeiro tamanho e do segundo tamanho em uma seção predeterminada. No cabeçalho de um fluxo codificado como esse (antes da imagem atual a ser codificada), a informação de tamanho TsizeFlag indicando uma mistura dos dois tamanhos de transformação ortogonal acima é codificada, e uma matriz de ponderação W8mat de transformação ortogonal 8 x 8 e uma matriz de ponderação W4mat de transformação ortogonal 4x4 são codificadas subseqüentemente para a informação de tamanho TsizeFlag. Note que a matriz de ponderação W8mat de transformação ortogonal 8x8 e a matriz de ponderação W4mat de transformação ortogonal 4x4 não necessariamente têm de ser nesta ordem e, portanto, que estes dois tipos de matrizes podem ser determinados como sendo dispostos na ordem inversa. A FIGURA 11B mostra a estrutura de um fluxo codificado no caso em que apenas o segundo tamanho é usado para uma transformação ortogonal em uma seção predeterminada. No cabeçalho desse fluxo codificado (antes da imagem atual a ser codificada), a informação de tamanho TsizeFlag indicando o tamanho de transformação ortogonal 8 x 8 é codificada, e uma matriz de ponderação W8mat de transformação ortogonal 8 x 8 é codificada subseqüentePetição 870180053328, de 21/06/2018, pág. 29/54

27/42 mente à informação de tamanho TsizeFlag. A FIGURA 11C mostra a estrutura de um fluxo codificado no caso em que apenas o primeiro tamanho é usado para uma transformação ortogonal em uma seção predeterminada. No cabeçalho desse fluxo codificado (antes da imagem atual a ser codificada), uma informação de tamanho TsizeFlag indicando o tamanho de transformação ortogonal 4 x 4 é codificada, e uma matriz de ponderação W4mat de transformação ortogonal 4 x 4 é codificada subseqüentemente à informação de tamanho TsizeFlag. [0095] Mais ainda, como mostrado na FIGURA9C, a unidade de codificação de comprimento variável VLC1 pode codificar uma informação de tamanho TsizeFlag em uma base de macrobloco. No caso da FIGURA9C, contudo, um tamanho de transformação ortogonal Tsize em si pode ser codificado, ao invés da informação de tamanho TsizeFlag. As FIGURA 9A a 9C descritas acima respectivamente indicam onde a informação de tamanho TsizeFlag é para ser inserida. No caso em que um tamanho de transformação ortogonal é comutado para um outro para cada fluxo ou seqüência constituído de várias imagens, é desejável inserir a informação de tamanho TsizeFlag no topo de cada fluxo ou seqüência, como mostrado na FIGURA9A. Isto é eficaz no caso em que há poucas mudanças no tamanho e na qualidade das imagens por todo um fluxo ou uma seqüência. A propósito, no caso em que os conteúdos de imagem mudam em uma base imagem por imagem e, portanto, um tamanho de transformação ortogonal precisa ser comutado para um outro para cada imagem, é desejável colocar a informação de tamanho TsizeFlag no topo de cada imagem, como mostrado na FIGURA 9B. Mais ainda, no caso em que um tamanho de transformação ortogonal precisa ser comutado para um outro em uma base de macrobloco, é desejável colocar a informação de tamanho TsizeFlag no topo de cada macrobloco, como mostrado na FIGURA9C.

Petição 870180053328, de 21/06/2018, pág. 30/54

28/42 <Variação>

[0096] A FIGURA 12 é um fluxograma que mostra uma variação de exemplo do processamento de codificação de imagem mostrado na FIGURA8. Este desenho mostra um processamento de codificação a ser realizado no caso em que uma distinção é feita entre a informação de tamanho TsizeFlag descrita acima (B) e (C). Às mesmas etapas que aquelas mostradas na FIGURA 8 são atribuídos os mesmos números. Com esta construção, a informação de tamanho TsizeFlag indica se todos os tamanhos de transformação ortogonal em uma seção predeterminada descrita acima são ou não de 4 x 4 pixels, e essa indicação deve ser representada por um bit 1.

[0097] É desejável que um valor ótimo seja regulado para cada matriz de ponderação W8mat e matriz de ponderação W4mat. Entretanto, quando a unidade de determinação DE determina uma matriz de ponderação Wmatrix em uma base por fluxo ou por imagem, pode ser possível que uma matriz de ponderação W8mat seja derivada a partir de uma matriz de ponderação W4mat e vice-versa.

[0098] A FIGURA 13 é um fluxograma que mostra um processamento de codificação de imagem a ser realizado no caso em que uma matriz de ponderação W4mat é derivada de uma matriz de ponderação W8mat. Ao fluxograma é recém-acrescentada a Etapa 19, se comparado com o fluxograma mostrado na FIGURA 8. Às mesmas etapas que aquelas na FIGURA 8 são atribuídos os mesmos números, e as descrições das mesmas são omitidas. Aqui, apenas pontos diferentes entre as FIGURA8 e 9 são descritos. Na Etapa S19, a unidade de codificação de comprimento variável VLC1 deriva uma matriz de ponderação W4mat 4 x 4 a partir de uma matriz de ponderação W8mat 8 x 8 da maneira a seguir, e codifica a matriz de ponderação W4mat derivada:

[0099] W4i,j = K*W8 2i, 2j (i e j são qualquer um de 0 a 3, resPetição 870180053328, de 21/06/2018, pág. 31/54

29/42 pectivamente, e K é um número constante) [00100] Note que a unidade de transformação ortogonal T1 deriva de uma matriz de ponderação W4mat da maneira similar, de modo a usá-la para uma transformação ortogonal.

[00101] Também note que a unidade de codificação de comprimento variável VLC1 pode não codificar a matriz de ponderação W4mat 4 x 4 derivada.

[00102] Mais ainda, a unidade de quantificação Q1 e a unidade de quantificação inversa IQ1 podem usar diferentes matrizes de ponderação para codificação intra-imagem e codificação interimagem, mesmo quando o processamento tiver sido realizado no mesmo tamanho de transformação ortogonal nestes tipos de codificação. Mais ainda, a unidade de quantificação Q1 e a unidade de quantificação inversa IQ1 podem usar diferentes matrizes de ponderação para um sinal de luminância e um sinal de crominância.

[00103] Também, a unidade de quantificação Q1 e a unidade de quantificação inversa IQ1 podem selecionar uma matriz de ponderação usada para a quantificação dentre várias matrizes de ponderação. [00104] Mais ainda, a unidade de quantificação Q1 e a unidade de quantificação inversa IQ1 podem ponderar uma matriz de quantificação usando uma matriz de ponderação apenas para um tamanho de transformação ortogonal maior (por exemplo, o segundo tamanho) para o qual o uso de uma matriz de ponderação é especialmente eficaz, e pode não ponderar uma matriz de quantificação para o outro tamanho (o primeiro tamanho) usando uma matriz de ponderação. <Aparelho de Decodificação de lmagem>

[00105] A FIGURA 14 é um diagrama de blocos que mostra a construção de um aparelho de decodificação de imagem de acordo com a modalidade da presente invenção.

[00106] Neste desenho, os mesmos números são atribuídos aos

Petição 870180053328, de 21/06/2018, pág. 32/54

30/42 mesmos componentes que aqueles mostrados no aparelho de codificação de imagem mostrado na FIGURA 4 e, portanto, descrições do mesmo são omitidas.

[00107] O fluxo codificado Str é decodificado pela unidade de decodificação de comprimento variável VLD1. O resultado dessa decodificação inclui matrizes de ponderação Wmatrix e tamanhos de transformação ortogonal Tsize. A unidade de quantificação inversa IQ1 pondera uma matriz de quantificação usando uma matriz de ponderação Wmatrix, e realiza uma quantificação inversa usando a matriz de quantificação ponderada. A unidade de transformação ortogonal inversa IT1 realiza uma transformação ortogonal inversa de acordo com um tamanho de transformação ortogonal Tsize determinado. As outras operações são as mesmas que aquelas descritas no diagrama de blocos da FIGURA3 que mostra o aparelho de decodificação de imagem realizando um método de decodificação de imagem existente.

[00108] A FIGURA 15 é um fluxograma que mostra um processamento de decodificação de comprimido variável realizado pelo aparelho de decodificação de imagem da presente modalidade. Como mostrado neste desenho, a unidade de decodificação de comprimento variável VLD1 decodifica uma informação de tamanho TsizeFlag incorporada no fluxo codificado Str (S30) e julga se essa informação de tamanho TsizeFlag indica que há apenas blocos tendo o segundo tamanho (8x8 pixels) (S31). Quando julgando que há apenas blocos tendo o segundo tamanho, a unidade de decodificação de comprimento variável VLD1 decodifica uma matriz de ponderação W8mat (S33). A propósito, quando a informação de tamanho TsizeFlag não indica que apenas uma transformação ortogonal 8 x 8 foi aplicada e quando essa informação de tamanho TsizeFlag indica que há apenas blocos tendo o primeiro tamanho (4x4 pixels) (S32), a unidade de decodificação de comprimento variável VLD1 decodifica uma matriz de ponderação

Petição 870180053328, de 21/06/2018, pág. 33/54

31/42

W4mat 4x4 (S34). Mais ainda, quando a informação de tamanho TsizeFlag não indica que apenas uma transformação ortogonal 4 x 4 foi aplicada, a unidade de decodificação de comprimento variável VLD1 decodifica um matriz de ponderação W8mat 8 x 8 e uma matriz de ponderação W4mat 4x4 (S35). Uma quantificação inversa e uma transformação ortogonal inversa então são realizadas de acordo com o resultado desta decodificação.

[00109] Note que quando não há uma matriz de ponderação W4mat codificada no fluxo codificado Str, o aparelho de decodificação de imagem pode derivar uma matriz de ponderação W4mat a partir de uma matriz de ponderação W8mat. A FIGURA 16 é um fluxograma que mostra um processamento de decodificação de imagem a ser realizado no caso em que uma matriz de ponderação W4mat é derivada de uma matriz de ponderação W8mat. A este fluxograma é recémadicionada a Etapa S36, se comparado com a FIGURA 15. Na Etapa S36, uma matriz de ponderação W4mat é derivada a partir de uma matriz de ponderação W8mat, da maneira equivalente àquela da Etapa S19 mostrada na FIGURA 13.

[00110] Como descrito acima, o aparelho de decodificação de imagem de acordo com a presente modalidade é capaz de decodificar corretamente o fluxo codificado Str o qual foi codificado pelo aparelho de codificação de imagem mostrado na FIGURA 4. Note que um tamanho de transformação ortogonal Tsize é descrito acima como sendo obtido a partir da unidade de decodificação de comprimento variável VLD1. Entretanto, no caso em que um tamanho de transformação ortogonal Tsize é comutado para um outro dependendo do tamanho de um bloco de compensação de movimento como descrito acima, um tamanho de transformação ortogonal Tsize pode ser derivado, com base no tamanho de um bloco de compensação de movimento.

[00111] Mais ainda, se um programa para a realização do método

Petição 870180053328, de 21/06/2018, pág. 34/54

32/42 de codificação de imagem e do método de decodificação de imagem como mostrado na modalidade mencionada anteriormente for gravado em um meio de gravação, tal como um disco flexível, torna-se possível facilmente realizar o processamento apresentado na modalidade acima em um sistema de computador independente.

[00112] As FIGURA 17A, 17B e 17C são diagramas que ilustram um meio de gravação que armazena um programa para a realização do método de codificação de imagem e do método de decodificação de imagem de acordo com a modalidade mencionada anteriormente. [00113] A FIGURA 17B mostra uma vista externa do disco flexível visto a partir da dianteira, sua configuração em seção transversal esquemática e o disco flexível em si, enquanto a FIGURA 17A ilustra um exemplo de um formato físico de um disco flexível como um meio de gravação em si. O disco flexível FD está contido em um invólucro F e uma pluralidade de trilhas Tr é formada concentricamente na superfície do disco flexível FD na direção radial da periferia, cada trilha sendo dividida em 16 setores Se na direção angular. Portanto, no disco flexível armazenando o programa mencionado acima, o método de codificação de imagem e o método de decodificação de imagem, como esse programa é gravado em uma área alocada para isso no disco flexível FD.

[00114] A propósito, a FIGURA 17C mostra a estrutura para a gravação e a leitura do programa no e do disco flexível FD. Quando o programa realizando o método de codificação de imagem e o método de decodificação de imagem acima é para ser gravado no disco flexível FD, esse programa deve ser escrito pelo uso de um sistema de computador Cs através de uma unidade de disco flexível FDD. A propósito quando o método de codificação de imagem e o método de decodificação de imagem devem ser construídos no sistema de computador Cs através do programa no disco flexível FD, o programa deve

Petição 870180053328, de 21/06/2018, pág. 35/54

33/42 ser lido a partir do disco flexível FD através da unidade de disco flexível FDD e, então, transferido para o sistema de computador Cs.

[00115] A descrição acima é dada com a hipótese de que um meio de gravação seja um disco flexível, mas um disco ótico também pode ser usado. Além disso, o meio de gravação não está limitado a isso, e qualquer outro meio, tais como uma placa de IC e um cassete de ROM, capaz de gravação de um programa também pode ser usado. [00116] O que vem a seguir descreve exemplos de aplicação do método de codificação de imagem e do método de decodificação de imagem, como mostrado na modalidade acima, bem como de um sistema usando-os.

[00117] A FIGURA 18 é um diagrama de blocos que mostra uma configuração geral de um sistema de provisão de conteúdo ex100 que realiza de um serviço de distribuição de conteúdo. A área para a provisão de serviço de comunicação é dividida em células de tamanho desejado, e as estações de base ex107 a ex110, as quais são estações sem fio fixas, são colocadas em cada célula.

[00118] Neste sistema de provisão de conteúdo ex100, dispositivos tais como um computador ex111, um PDA (Assistente Digital Pessoal) ex112, uma câmera ex113, um telefone celular ex114 e um telefone celular equipado com câmera ex115 são respectivamente conectados à Internet ex101 através de um provedor de serviços de Internet ex102, de uma rede de telefonia ex104 e das estações de base ex107 a ex110.

[00119] Entretanto, o sistema de provisão de conteúdo ex100 não está limitado à combinação como mostrado na FIGURA 18, e pode ser conectado a uma combinação de qualquer um deles. Também, cada dispositivo pode ser conectado diretamente à rede de telefonia ex104, não através das estações de base ex107 a ex110, as quais são estações sem fio fixas.

Petição 870180053328, de 21/06/2018, pág. 36/54

34/42 [00120] A câmera ex113 é um dispositivo tal como uma câmera de vídeo digital capaz de fazer filmes. O telefone celular pode ser um telefone celular de um sistema de PDC (Comunicações Digitais Pessoais), sistema CDMA (Acesso Múltiplo de Divisão de Código), sistema WCDMA (Acesso Múltiplo de Divisão de Código de Banda Larga) ou um sistema GSM (Sistema Global para Comunicações Móveis), um PHS (Sistema de Telefone Portátil Pessoal) ou similar, e pode ser qualquer um destes.

[00121] Mais ainda, um servidor de streaming ex103 é conectado à câmera ex113 através da estação de base ex109 e da rede de telefonia ex104, a qual permite uma distribuição ao vivo ou similar, com base nos dados codificados transmitidos pelo usuário usando a câmera ex113. A câmera ex113 ou o servidor e similar capaz de um processamento de transmissão de dados pode codificar os dados filmados. Também, os dados de filme feitos por uma câmera ex116 podem ser transmitidos para o servidor de streaming ex103 através do computador ex111. A câmera ex116 é um dispositivo tal como uma câmera digital capaz de fazer imagens paradas e em movimento. Neste caso, a câmera ex116 ou o computador ex111 pode codificar os dados de filme. Neste caso, uma LSI ex117 incluída no computador ex111 ou na câmera ex116 realiza o processamento de codificação. Note que um software para a codificação e a decodificação pode ser integrado em qualquer tipo de meio de armazenamento (tal como um CD-ROM, um disco flexível e um disco rígido), que é um meio de gravação que pode ser lido pelo computador ex111 ou similar. Mais ainda, um telefone celular equipado com uma câmera ex115 pode transmitir os dados de filme. Estes dados de filme são os dados codificados por uma LSI incluídos no telefone celular ex115.

[00122] Neste sistema de suprimento de conteúdo ex100, um conteúdo (tal como um vídeo de música ao vivo) o qual foi filmado pelo

Petição 870180053328, de 21/06/2018, pág. 37/54

35/42 usuário usando a câmera ex113, a câmera ex116 ou similar, é codificado da mesma maneira que na modalidade descrita acima e transmitido para o servidor de streaming ex103, e o servidor de streaming ex103 faz uma distribuição de fluxo dos dados de conteúdo para os clientes à sua vontade. Os clientes aqui incluem o computador ex111, o PDA ex112, a câmera ex113, o telefone celular ex114 e assim por diante, capazes de decodificar os dados codificados acima. O sistema de suprimento de conteúdo ex100 com a configuração acima é um sistema que permite que os clientes recebam e reproduzam os dados codificados e realiza uma difusão pessoal ao permitir que eles recebam, decodifiquem e reproduzam os dados em tempo real.

[00123] O aparelho de codificação de imagem e o aparelho de decodificação de imagem apresentados na modalidade acima podem ser usados para a codificação e a decodificação a serem realizadas em cada um dos dispositivos que constituem o sistema acima.

[00124] É dada uma explanação de um telefone celular como um exemplo.

[00125] A FIGURA 19 é um diagrama que mostra o telefone celular ex115 que emprega o método de codificação de imagem e o método de decodificação de imagem explicados na modalidade acima. O telefone celular ex115 tem uma antena ex201 para transmissão/recepção de ondas de rádio para e da estação de base ex110, uma unidade de câmera ex203 tal como uma câmera de CCD capaz de tomar imagens em movimento e paradas, uma unidade de exibição ex202, tal como um visor de cristal líquido para a exibição dos dados obtidos pela decodificação de imagens e similares feitas pela unidade de câmera ex203 e vídeo e similares recebidos pela antena ex201, um corpo principal equipado com um grupo de teclas de operação ex204, uma unidade de saída de voz ex208, tal como um alto-falante, para a extração de vozes, uma unidade de entrada de voz ex205, tal como um miPetição 870180053328, de 21/06/2018, pág. 38/54

36/42 crofone, para a introdução de vozes, um meio de gravação ex207 para armazenamento de dados codificados ou dados decodificados, tais como dados de filmes de imagens paradas feitos pela câmara, dados recebidos de e-mail e dados de filmes ou imagens paradas, e uma unidade de conector ex206 para permitir que o meio de gravação ex207 seja afixado ao telefone celular ex115. O meio de gravação ex207 é concretizado como um elemento de memória flash, um tipo de EEPROM (Memória Apenas de Leitura Eletricamente Apagável e Programável), que é uma memória não-volátil eletricamente apagável e regravável armazenada em um invólucro de plástico, tal como uma placa de SD.

[00126] Em seguida, com referência à FIGURA 20, é dada uma descrição do telefone celular ex115. No telefone celular ex115, uma unidade de controle principal ex311 para controle central da unidade de exibição ex202 e de cada unidade do corpo principal tendo as teclas de operação ex204 é configurada de uma maneira pela qual uma unidade de circuito de suprimento de energia ex310, uma unidade de controle de entrada em operação ex304, uma unidade de codificação de imagem ex312, uma unidade de interface de câmera ex303, uma unidade de controle de LCD (Visor de Cristal Líquido) ex302, uma unidade de decodificação de imagem ex309, uma unidade de multiplexação/demultiplexação ex308, uma unidade de gravação/reprodução ex307, uma unidade de circuito de modem ex306 e uma unidade de processamento de voz ex305 são interconectadas através de um barramento síncrono ex313.

[00127] Quando uma tecla de término de chamada ou uma tecla de energia é ligada por uma operação do usuário, a unidade de circuito de suprimento de energia ex310 supre cada unidade com energia a partir de uma batería, e ativa o telefone celular digital equipado com câmera ex115, para colocá-lo em um estado de pronto para operar.

Petição 870180053328, de 21/06/2018, pág. 39/54

37/42 [00128] No telefone celular ex115, a unidade de processamento de voz ex305 converte um sinal de voz recebido pela unidade de entrada de voz ex205 em um modo de conversação em dados de voz digitais, sob o controle da unidade de controle principal ex311, incluindo uma CPU, uma ROM e uma RAM, e outros, a unidade de circuito de modem ex306 executa um processamento de espectro amplo neles, e uma unidade de circuito de transmissão/recepção ex301 executa um processamento de conversão de digital para analógico e um processamento de transformação de freqüência nos dados, de modo a transmitir o resultado através da antena ex201. Também, no telefone celular ex115, os dados recebidos pela antena ex201 em modo de conversação são amplificados e realizado um processamento de transformação de freqüência e um processamento de conversão de analógico para digital, a unidade de circuito de modem ex306 realiza um processamento de espectro amplo inverso no resultado, e a unidade de processamento de voz ex305 os converte em dados de voz analógicos, de modo a extrai-los através da unidade de saída de voz ex208. [00129] Mais ainda, quando do envio de um e-mail no modo de comunicação de dados, os dados de texto do e-mail introduzidos pela operação das teclas de operação ex204 no corpo principal são enviados para a unidade de controle principal ex311 através da unidade de controle de entrada em operação ex304. Na unidade de controle principal ex311, após a unidade de circuito de modem ex306 realizar um processamento de espectro amplo dos dados de texto e a unidade de circuito de transmissão/recepção ex301 realizar um processamento da conversão de digital para analógico e um processamento da transformação de freqüência neles, os são transmitidos para a estação de base ex110 através da antena ex201.

[00130] Quando dados de imagem são transmitidos em um modo de comunicação de dados, os dados de imagem feitos pela unidade de

Petição 870180053328, de 21/06/2018, pág. 40/54

38/42 câmera ex203 são supridos para a unidade de codificação de imagem ex312 através da unidade de interface de câmera ex303. Quando os dados de imagens não são transmitidos, também é possível exibir os dados de imagem feitos pela unidade de câmera ex203 diretamente na unidade de exibição ex202 através da unidade de interface de câmera ex303 e da unidade de controle de LCD ex302.

[00131] A unidade de codificação de imagem ex312, a qual inclui o aparelho de codificação de imagem, de acordo com a presente invenção, realiza uma codificação com compressão nos dados de imagem supridos a partir da unidade de câmera ex203 usando o método de codificação empregado pelo aparelho de codificação de imagem apresentado na modalidade acima, de modo a convertê-los em dados de imagem codificados, e os envia para a unidade de multiplexação/demultiplexação ex308. Neste momento, o telefone celular ex115 envia as vozes recebidas pela unidade de entrada de voz ex205, durante a filmagem com a unidade de câmera ex203 para a unidade de multiplexação/demultiplexação ex308, como dados de voz digitais, através da unidade de processamento de voz ex305.

[00132] A unidade de multiplexação/demultiplexação ex308 multiplexa os dados de imagem codificados supridos a partir da unidade de codificação de imagem ex312 e os dados de voz supridos a partir da unidade de processamento de voz ex305, usando um método predeterminado, a unidade de circuito de modem ex306 realiza um processamento de espectro amplo dos dados multiplexados resultantes, e a unidade de circuito de transmissão/recepção ex301 realiza um processamento de conversão de digital para analógico e um processamento de transformação de freqüência no resultado, de modo a transmitir os dados processados através da antena ex201.

[00133] Quando da recepção, em um modo de comunicação de dados, dos dados de um arquivo de filme, o qual está ligado a uma págiPetição 870180053328, de 21/06/2018, pág. 41/54

39/42 na da web ou similar, a unidade de circuito de modem ex306 realiza um processamento de espectro amplo inverso dos sinais recebidos a partir da estação de base ex110, através da antena ex201, e envia os dados multiplexados resultantes para a unidade de multiplexação/demultiplexação ex308.

[00134] De modo a se decodificarem os dados multiplexados recebidos através da antena ex201, a unidade de multiplexação/demultiplexação ex308 separa os dados multiplexados em um fluxo de bits codificado de dados de imagem e um fluxo de bits codificado de dados de voz, e supre os dados de imagem codificados para a unidade de decodificação de imagem ex309 e esses dados de voz para a unidade de processamento de voz ex305 através do barramento síncrono ex313.

[00135] Em seguida, a unidade de decodificação de imagem ex309, a qual inclui o aparelho de decodificação de imagem de acordo com a presente invenção, decodifica o fluxo de bits codificado dos dados de imagem usando o método de decodificação correspondente ao método de codificação mostrado na modalidade mencionada acima, de modo a gerar dados de filme para reprodução, e supre estes dados para a unidade de exibição ex202, através da unidade de controle de LCD ex302. Assim sendo, os dados de imagem incluídos em um arquivo de filme ligado a uma página da web, por exemplo, são exibidos. Ao mesmo tempo, a unidade de processamento de voz ex305 converte os dados de voz em sinais de voz analógicos, e supre estes para a unidade de saída de voz ex208. Assim sendo, os dados de voz incluídos no arquivo de filme ligado a uma página da web, por exemplo, são reproduzidos.

[00136] Note que o sistema mencionado anteriormente não é um exemplo exclusivo e, portanto, que pelo menos o aparelho de codificação de imagem ou o aparelho de decodificação de imagem da modaliPetição 870180053328, de 21/06/2018, pág. 42/54

40/42 dade acima pode ser incorporado em um sistema de difusão digital, como mostrado na FIGURA 21, contra o pano de fundo de uma difusão digital por satélite/terrestre foi um tópico recente de conversação. Para ser mais específico, em uma estação de difusão ex409, um fluxo de bits codificado de informação de vídeo é transmitido, por ondas de rádio, para um satélite ex410 para comunicação ou difusão. Mediante o recebimento dele, o satélite de difusão ex410 transmite ondas de rádio para difusão, uma antena ex406 de uma casa equipada com instalações de recepção de difusão por satélite recebe essas ondas de rádio, e um aparelho tal como uma televisão (receptor) ex401 ou uma caixa de decodificador (STB) ex407 decodifica o fluxo de bits codificado e reproduz os dados decodificados. O aparelho de decodificação de imagem, como mostrado na modalidade mencionada acima, pode ser implementado no aparelho de reprodução ex403, para leitura e decodificação do fluxo de bits gravado em um meio de armazenamento ex402, que é um meio de gravação tal como um CD ou um DVD. Neste caso, um sinal de vídeo reproduzido é exibido em um monitor ex404. Também é concebível que o aparelho de decodificação de imagem seja implementado na caixa de decodificador ex407 conectada a um cabo ex405 para uma televisão a cabo ou à antena ex406 para uma difusão por satélite/em terra, de modo a se reproduzi-los em um monitor de televisão ex408. Neste caso, o aparelho de decodificação de imagem pode ser incorporado na televisão, não na caixa de decodificador. Ou um carro ex412 com uma antena ex411 pode receber sinais do satélite ex410, da estação de base ex107, ou similar, de modo a reproduzir um filme em um dispositivo de exibição, tal como um sistema de navegação de carro ex413 montado no carro ex412. [00137] Mais ainda, também é possível codificar um sinal de imagem pelo aparelho de codificação de imagem apresentado na modalidade acima e gravar o resultado em um meio de gravação. Os exemPetição 870180053328, de 21/06/2018, pág. 43/54

41/42 pios incluem um gravador de DVD, para a gravação de um sinal de imagem em um disco de DVD ex421e um gravador ex420 tal como um gravador de disco para a gravação de um sinal de imagem em um disco rígido. Mais ainda, um sinal de imagem também pode ser gravado em uma placa de SD ex422. Se o gravador ex420 for equipado com o aparelho de decodificação de imagem apresentado na modalidade acima, é possível reproduzir um sinal de imagem gravado no disco de DVD ex421 ou na placa de SD ex422 e exibi-lo no monitor ex408. [00138] Quanto à configuração do sistema de navegação de carro ex413, a configuração sem a unidade de câmera ex203 e a unidade de interface de câmera ex303 além da configuração mostrada na FIGURA 20, é concebível. O mesmo é aplicável ao computador ex111, à televisão (receptor) ex401 e similares.

[00139] Concernente aos terminais, tal como o telefone celular ex114, um terminal de transmissão/recepção tendo um codificador e um decodificador, bem como um terminal de transmissão apenas com um codificador, e um terminal de recepção apenas com um decodificador são possíveis como formas de implementação.

[00140] Como estabelecido acima, é possível usar o método de codificação de imagem ou o método de decodificação de imagem apresentados na modalidade acima em qualquer um dos dispositivos e sistemas descritos acima. Assim sendo, torna-se possível obter um efeito descrito na modalidade mencionada anteriormente.

[00141] A partir da invenção assim descrita, será óbvio que a modalidade da invenção pode ser variada de muitas formas. Essas variações não devem ser consideradas como um desvio do espírito e do escopo da invenção, e pretende-se que todas essas modificações como seriam óbvias para uma pessoa versada na técnica estejam incluídas no escopo das reivindicações a seguir.

Aplicabilidade Industrial

Petição 870180053328, de 21/06/2018, pág. 44/54

42/42 [00142] A presente invenção é adequada para uso como um aparelho de codificação de imagem para a codificação de uma imagem em uma base bloco por bloco e um aparelho de decodificação de imagem, bem como um servidor da web para a distribuição de um filme, um terminal de rede para o recebimento desse filme, uma câmera digital capaz de gravar e reproduzir um filme, um telefone celular equipado com câmera, um gravador/tocador de DVD, um PDA, um computador pessoal e similar.

Petição 870180053328, de 21/06/2018, pág. 45/54

1/4

Claims

REIVINDICAÇÕES

1. Método de codificação para codificar dados de imagem em uma base bloco por bloco caracterizado pelo fato de que compreende as etapas de:

receber uma unidade de dados de imagem de um tamanho predeterminado;

gerar um erro de predição entre uma imagem de referência e a unidade de dados de imagem recebida, referindo-se a um vetor de compensação de movimento da unidade de dados de imagem recebida;

selecionar, como tamanhos de transformações ortogonais de todos os blocos incluídos em uma unidade de dados de imagem predeterminada em que deve ser realizada a transformação ortogonal, um primeiro tamanho ou uma mistura do primeiro tamanho e um segundo tamanho, o primeiro tamanho sendo menor do que o segundo tamanho, em que, no caso onde um tamanho de bloco de compensação de movimento, que é usado para realizar compensação de movimento no bloco no qual a transformação ortogonal deve ser executada, é menor que o segundo tamanho, somente o primeiro tamanho é selecionado como tamanho de transformação ortogonal na seleção;

transformar ortogonalmente o erro de predição de um bloco, a partir de todos os blocos incluídos na unidade de dados de imagem predeterminada, tendo o tamanho de transformação ortogonal selecionado para obter coeficientes de transformação;

quantificar os coeficientes de transformação utilizando uma matriz de quantificação correspondente ao tamanho de transformação ortogonal selecionado;

codificar por comprimento variável os coeficientes de transformação quantificados para obter um fluxo codificado;

inserir, no fluxo codificado, informações de tamanho indiPetição 870180053328, de 21/06/2018, pág. 46/54
2/4 cando se os tamanhos da transformação ortogonal de todos os blocos incluídos na unidade de dados de imagem predeterminada são o primeiro tamanho ou a mistura do primeiro tamanho e do segundo tamanho;

quantizar inversamente os coeficientes de transformação; realizar a transformação ortogonal inversa nos coeficientes de transformação inversamente quantizados;

adicionar a imagem de referência ao sinal decodificado a partir da transformação ortogonal inversa; e armazenar a imagem decodificada na memória para referência futura.

2. Método de codificação, de acordo com a reivindicação 1, caracterizado pelo fato de que a informação de tamanho é colocada em cada imagem no fluxo codificado.
3. Método de codificação, de acordo com a reivindicação 1, caracterizado pelo fato de que o primeiro tamanho indica um tamanho de um bloco que tem 4 pixels de altura e 4 pixels de largura, e o segundo tamanho indica um tamanho de um bloco que tem 8 pixels de altura e 8 pixels de largura.
4. Método de codificação, de acordo com a reivindicação 1, caracterizado pelo fato de que um nível de resolução de limiar, um nível de taxa de bits limite e um número limite de componentes de alta frequência da unidade de dados de imagem predeterminada são utilizados na seleção do tamanho de transformação ortogonal.
5. Método de decodificação para decodificar um fluxo codificado em uma base bloco por bloco caracterizado pelo fato de que compreende as etapas de:

obter, a partir do fluxo codificado, informação indicando se um tamanho de transformação ortogonal inversa de um bloco no qual a transformação ortogonal inversa deve ser realizada é um primeiro

Petição 870180053328, de 21/06/2018, pág. 47/54

3/4 tamanho ou uma mistura do primeiro tamanho e um segundo tamanho, em que o primeiro tamanho é menor que o segundo tamanho;

derivar o tamanho da transformação ortogonal inversa do bloco no qual deve ser realizada a transformação ortogonal inversa, com base na informação incluída no fluxo codificado;

decodificar dados codificados de comprimento variável incluodos no fluxo codificado para obter coeficientes de transformação de cada bloco;

quantizar inversamente os coeficientes de transformação utilizando uma matriz de quantização correspondente ao tamanho da transformação ortogonal inversa derivada; e fazer a transformação ortogonal inversa dos coeficientes de transformação quantificada inversa de cada bloco, com base no tamanho da transformação ortogonal inversa derivada;

em que, no caso onde a informação de tamanho indica que o tamanho de transformação ortogonal inversa do bloco, no qual a transformação ortogonal inversa deve ser realizada, é uma mistura do primeiro tamanho e do segundo tamanho e a derivação inclui ainda derivar o tamanho de transformação ortogonal inverso baseado em um tamanho de bloco de compensação de movimento, que é usado para realizar a compensação de movimento no bloco, no qual a transformação ortogonal inversa deve ser realizada, é menor do que o segundo tamanho, uma transformação ortogonal inversa subsequente é realizada usando apenas o primeiro tamanho como o tamanho da transformação ortogonal inversa.
6. Método de decodificação, de acordo com a reivindicação 5, caracterizado pelo fato de que a informação de tamanho é colocada em cada imagem no fluxo codificado.

7. Método de decodificação, de acordo com a reivindicação 5, caracterizado pelo fato de que o primeiro tamanho indica um taPetição 870180053328, de 21/06/2018, pág. 48/54

4/4 manho de um bloco que tem 4 pixels de altura e 4 pixels de largura, e o segundo tamanho indica um tamanho de um bloco que tem 8 pixels de altura e 8 pixels de largura.

Petição 870180053328, de 21/06/2018, pág. 49/54

7/21 <

r>

ώ

FIG. 7B tn o xC £ tn ** t*1 Xf* £ tn fM* xJ* tn tn xf £ CM O xf fM t—i V £ CM fM xh tn tn xl- τ-4 o Xt i™í t-? Xf W fM XT •r-l tn xf £ o X? O rH Xf £ O fM Xf $ <o in xt* Ps o 00 P> T“4 do ps *· fM 00 <: —- rs, ps 00 : : i o 00 £ fM tH 00 N fs? 00 <: tM Ps 00 tH O 00 Γ-» T-? 00 r-t N 00 --- t-1 Ps 00 o_ o 00 £ o ,-T 00 O cT 00 --- o ps 00

♦ « ··<

·♦* $

8/21

Fim ·· ··· • β ·
9/21 • · • · ·· • * • * • · • · • · · • · · · ··· · · • · · « · • · ·· ·· • · · • · · · • ·

TsizeFlag
10/21 • · • · ·

TsizeFlag W4mat

12/21