BR112013019937B1 - Dispositivo e método de processamento de imagem - Google Patents

Dispositivo e método de processamento de imagem Download PDF

Info

Publication number
BR112013019937B1
BR112013019937B1 BR112013019937-7A BR112013019937A BR112013019937B1 BR 112013019937 B1 BR112013019937 B1 BR 112013019937B1 BR 112013019937 A BR112013019937 A BR 112013019937A BR 112013019937 B1 BR112013019937 B1 BR 112013019937B1
Authority
BR
Brazil
Prior art keywords
quantization matrix
section
parameters
aps
quantization
Prior art date
Application number
BR112013019937-7A
Other languages
English (en)
Other versions
BR112013019937A2 (pt
Inventor
Junichi Tanaka
Original Assignee
Velos Media International Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Velos Media International Limited filed Critical Velos Media International Limited
Publication of BR112013019937A2 publication Critical patent/BR112013019937A2/pt
Publication of BR112013019937B1 publication Critical patent/BR112013019937B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Image Processing (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Analysis (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

DISPOSITIVO E MÉTODO DE PROCESSAMENTO DE IMAGEM [Problema] Moderar a diminuição de eficiência de codificação acompanhando a atualização de uma matriz de quantização. [Solução] Provido de aquisição para adquirir um parâmetro de matriz de quantização de um fluxo codificado no qual o parâmetro de matriz de quantização definindo uma matriz de quantização é fixado em um conjunto de parâmetro diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada; uma unidade de fixação para fixar uma matriz de quantização a ser usada na hora da quantização inversa de dados dedodificados do fluxo codificado, na base do parâmetro de matriz de quantização adquirido pela unidade de aquisição; e uma unidade de quantização inversa para quantização inversa dos dados dedodificados do fluxo codificado usando a matriz de quantização fixada pela unidade de fixação

Description

Campo Técnico
A exposição presente se refere a um dispositivo de processamento de imagem e um método de processamento de imagem.
Fundamentos da Técnica
Em H.264/AVC, uma das especificações padrão para esquemas de codificação de imagem, é possível usar etapas de quantização diferentes para cada componente dos coeficientes de transformada ortogonal ao quantizar dados de imagem no Perfil Alto ou perfil mais alto. Uma etapa de quantização (ou escala de quantização) para cada componente dos coeficientes de transformada ortogonal pode ser fixada na base de uma matriz de quantização (também chamada uma lista de escalonamento) definida ao mesmo tamanho como as unidades de transformada ortogonal, e um valor de etapa padrão.
A Figura 38 ilustra quatro classes de matrizes de quantização prefixadas que estão predefinidas em H.264/AVC. A matriz SL1 é a matriz de quantização 4x4 prefixada para modo de intrapredição. A matriz SL2 é a matriz de quantização 4x4 prefixada para modo de interpredição. A matriz SL3 é a matriz de quantização 8x8 prefixada para modo de intrapredição. A matriz SL4 é a 8x8 matriz de quantização prefixada para modo de interpredição. O usuário também pode definir a própria matriz de quantização que difere das matrizes prefixadas ilustradas na Figura 38 no conjunto de parâmetro de sequência ou no conjunto de parâmetro de imagem parada. Note que no caso onde nenhuma matriz de quantização é especificada, uma matriz de quantização plana tendo uma etapa de quantização igual para todos os componentes pode ser usada.
Em Codificação de Vídeo de Alta Eficiência (HEVC), cuja padronização está estando avançada como um esquema de codificação de imagem de próxima geração para suceder H.264/AVC, é introduzido o conceito de uma unidade de codificação (CU), que corresponde a um macrobloco do passado (veja Literatura Não Patente 1 abaixo). A gama de tamanhos de unidade de codificação é especificada no conjunto de parâmetro de sequência como um par de valores de potência de 2 chamado a unidade de codificação maior (LCU) e a unidade de codificação menor (SCU). Adicionalmente, SPLIT_FLAGs são usados para designar um tamanho de unidade de codificação específico dentro da gama especificada pela LCU e SCU.
Em HEVC, uma unidade de codificação pode ser dividida em uma ou mais unidades de transformada ortogonal, ou em outras palavras, uma ou mais unidades de transformada (TUs). Qualquer de 4*4, 8*8, 16x16 e 32x32 é utilizável como o tamanho de unidade de transformada. Consequentemente, uma matriz de quantização também pode ser especificada para cada um destes tamanhos de unidade de transformada de candidato. Literatura Não Patente 2 abaixo propõe especificar múltiplos candidatos de matriz de quantização para um tamanho de unidade de transformada em uma imagem parada, e selecionar adaptavelmente uma matriz de quantização para cada bloco da perspectiva de otimização de taxa-distorção (RD).
Lista de Citação
Literatura Não Patente
Literatura Não Patente 1:JCTVC-B205, “Test Model under Consideration”, Equipe Colaboradora Conjunta sobre Codificação de Vídeo (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11 2a Reunião: Genebra, CH, 21-28 julho, 2010
Literatura Não Patente 2:VCEG-AD06, “Adaptive Quantization Matrix Selection on KTA Software”, ITU - Setor de Padronização de Telecomunicações GRUPO DE ESTUDO 16 Pergunta 6 Grupo de Peritos em Codificação de Vídeo (VCEG) 30a Reunião: Hangzhou, China, 23-24 outubro, 2006.
Sumário da Invenção
Problema Técnico Porém, a matriz de quantização adaptada à quantização e quantização inversa difere de acordo com as características de cada imagem incluída em um vídeo. Por esta razão, a frequência de atualizações de matriz de quantização subirá se alguém tentar codificar vídeo cujas características de imagem mudam de momento para momento com matrizes ótimas de quantização. Em H.264/AVC, a matriz de quantização está definida no conjunto de parâmetro de sequência (SPS) ou no conjunto de parâmetro de imagem parada (PPS). Consequentemente, se a frequência de atualizações de matriz de quantização elevar, a proporção do fluxo codificado ocupado pelo SPS ou PPS aumentará. Isto significa que a eficiência de codificação diminuirá por causa de custo aumento. Para HEVC, em que o tamanho de matriz de quantização é aumentado ademais e em que várias matrizes de quantização diferentes podem ser definidas para cada imagem parada, há um risco que tais diminuições na eficiência de codificação acompanhando a atualização da matriz de quantização pode se tornar até mesmo mais significante.
Consequentemente, é desejável prover um mecanismo habilitando moderação da diminuição em eficiência de codificação acompanhando a atualização da matriz de quantização.
Solução para o Problema
De acordo com uma concretização da exposição presente, é provido um dispositivo de processamento de imagem incluindo uma seção de aquisição configurada para adquirir parâmetros de matriz de quantização de um fluxo codificado no qual os parâmetros de matriz de quantização definindo uma matriz de quantização são fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada, uma seção de fixação configurada para fixar, com base nos parâmetros de matriz de quantização adquiridos pela seção de aquisição, uma matriz de quantização que é usada ao quantizar inversamente dados decodificados do fluxo codificado, e uma seção de quantização inversa configurada para quantizar inversamente os dados decodificados do fluxo codificado usando a matriz de quantização fixada pela seção de fixação.
O dispositivo de processamento de imagem pode ser realizado tipicamente como um dispositivo de decodificação de imagem que decodifica uma imagem.
De acordo com uma concretização da exposição presente, é provido um método de processamento de imagem incluindo adquirir parâmetros de matriz de quantização de um fluxo codificado no qual os parâmetros de matriz de quantização definindo uma matriz de quantização são fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada, fixando, com base nos parâmetros de matriz de quantização adquiridos, uma matriz de quantização que é usada ao quantizar inversamente dados decodificados do fluxo codificado, e quantizar inversamente os dados decodificados do fluxo codificado usando a matriz de quantização fixada.
De acordo com uma concretização da exposição presente, é provido um dispositivo de processamento de imagem incluindo uma seção de quantização configurada para quantizar dados usando uma matriz de quantização, uma seção de fixação configurada para fixar parâmetros de matriz de quantização que definem uma matriz de quantização a ser usada quando a seção de quantização quantiza os dados, e uma seção de codificação configurada para codificar os parâmetros de matriz de quantização fixados pela seção de fixação dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada.
O dispositivo de processamento de imagem pode ser realizado tipicamente como um dispositivo de codificação de imagem que codifica uma imagem.
De acordo com uma concretização da exposição presente, é provido um método de processamento de imagem incluindo quantizar dados usando uma matriz de quantização, fixar parâmetros de matriz de quantização que definem a matriz de quantização a ser usada ao quantizar os dados, e codificar os parâmetros de matriz de quantização fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada.
Efeitos Vantajosos da Invenção
De acordo com um dispositivo de processamento de imagem e um método de processamento de imagem conforme a exposição presente, é possível moderar a diminuição em eficiência de codificação acompanhando a atualização da matriz de quantização.
Breve Descrição dos Desenhos
A Figura 1 é um diagrama de bloco ilustrando uma configuração exemplar de um dispositivo de codificação de imagem de acordo com uma concretização. A Figura 2 é um diagrama de bloco ilustrando um exemplo de uma configuração detalhada da seção de processamento de sintaxe ilustrada na Figura 1.
A Figura 3 é um diagrama explicativo ilustrando parâmetros exemplares incluídos em um conjunto de parâmetro de matriz de quantização em uma concretização. A Figura 4 é um diagrama explicativo ilustrando parâmetros exemplares incluídos em um cabeçalho de pedaço em uma concretização.
A Figura 5 é um fluxograma ilustrando um fluxo exemplar de um processo de inserção de conjunto de parâmetro de acordo com uma concretização. A Figura 6 é um diagrama explicativo para explicar diferenças na estrutura de fluxo entre uma técnica de acordo com uma concretização e uma técnica existente.
A Figura 7 é um diagrama de bloco ilustrando uma configuração exemplar de um dispositivo de decodificação de imagem de acordo com uma concretização. A Figura 8 é um diagrama de bloco ilustrando um exemplo de uma configuração detalhada da seção de processamento de sintaxe ilustrada na Figura 7.
A Figura 9 é um fluxograma ilustrando um fluxo exemplar de um processo de geração de matriz de quantização de acordo com uma concretização. A Figura 10 é um fluxograma ilustrando um exemplo de um fluxo detalhado de um processo em modo de cópia de acordo com uma concretização.
A Figura 11 é um fluxograma ilustrando um exemplo de um fluxo detalhado de um processo em modo de designação de eixo de acordo com uma concretização. A Figura 12 é um fluxograma ilustrando um fluxo exemplar de um processo para fixar uma matriz de quantização a um pedaço de acordo com uma concretização.
A Figura 13 é um primeiro diagrama explicativo ilustrando um primeiro exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização. A Figura 14 é um segundo diagrama explicativo ilustrando um primeiro exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização.
A Figura 15 é um terceiro diagrama explicativo ilustrando um primeiro exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização. A Figura 16 é um primeiro diagrama explicativo ilustrando um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização.
A Figura 17 é um segundo diagrama explicativo ilustrando um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização. A Figura 18 é um terceiro diagrama explicativo ilustrando um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização.
A Figura 19 é um quarto diagrama explicativo ilustrando um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização. A Figura 20 é um quinto diagrama explicativo ilustrando um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um conjunto de parâmetro de matriz de quantização.
A Figura 21 é um diagrama explicativo ilustrando um exemplo de áreas de fixação de escala de quantização definidas a fim de quantizar uma matriz de quantização. A Figura 22 é um diagrama explicativo ilustrando um exemplo de escalas de quantização fixadas nas áreas de fixação de escala de quantização respectivas ilustradas por exemplo na Figura 21.
A Figura 23 é um diagrama explicativo para explicar 11 classes de tabelas de VLC preparadas em LCEC. A Figura 24 é um diagrama explicativo ilustrando um exemplo de um fluxo codificado estruturado conforme uma primeira técnica que usa um APS.
A Figura 25 é um diagrama explicativo ilustrando um exemplo de sintaxe de APS definida conforme uma primeira técnica que usa um APS. A Figura 26 é um diagrama explicativo ilustrando um exemplo de sintaxe de cabeçalho de pedaço definida conforme uma primeira técnica que usa um APS.
A Figura 27 é um diagrama explicativo ilustrando um exemplo de sintaxe de APS definida conforme uma modificação exemplar de uma primeira técnica que usa um APS. A Figura 28 é um diagrama explicativo ilustrando um exemplo de um fluxo codificado estruturado conforme uma segunda técnica que usa um APS.
A Figura 29 é um diagrama explicativo ilustrando um exemplo de um fluxo codificado estruturado conforme uma terceira técnica que usa um APS. A Figura 30 é um diagrama explicativo ilustrando um exemplo de sintaxe de APS definida conforme uma terceira técnica que usa um APS.
A Figura 31 é um diagrama explicativo ilustrando um exemplo de sintaxe de cabeçalho de pedaço definida conforme uma terceira técnica que usa um APS. A Figura 32 é uma tabela listando as características de parâmetro para cada uma de várias ferramentas de codificação típicas.
A Figura 33 é um diagrama explicativo para explicar um exemplo de um fluxo codificado estruturado conforme uma modificação exemplar de uma terceira técnica que usa um APS. A Figura 34 é um diagrama de bloco ilustrando um exemplo de uma configuração esquemática de uma televisão.
A Figura 35 é um diagrama de bloco ilustrando um exemplo de uma configuração esquemática de um telefone móvel. A Figura 36 é um diagrama de bloco ilustrando um exemplo de uma configuração esquemática de um dispositivo de gravação e reprodução.
A Figura 37 é um diagrama de bloco ilustrando um exemplo de uma configuração esquemática de um dispositivo de geração de imagem. A Figura 38 é um diagrama explicativo ilustrando matrizes de quantização prefixadas que estão predefinidas em H.264/AVC.
Descrição das Concretizações
Em seguida, concretizações preferidas da presente invenção serão descritas em detalhes com referência aos desenhos anexos. Note que, nesta especificação e nos desenhos, elementos que têm substancialmente a mesma função e estrutura são denotados com os mesmos sinais de referência, e explicação repetida é omitida.
Também, a descrição procederá na ordem seguinte. 1. Configuração exemplar de dispositivo de codificação de imagem de acordo com concretização 1-1. Configuração global exemplar 1-2. Configuração exemplar de seção de processamento de sintaxe 1-3. Estrutura de parâmetro exemplar 2. Fluxo de processo durante codificação de acordo com concretização 3. Configuração exemplar de dispositivo de decodificação de imagem de acordo com concretização 3-1. Configuração global exemplar 3-2. Configuração exemplar de seção de processamento de sintaxe 4. Fluxo de processo durante decodificação de acordo com concretização 4-1. Gerando matrizes de quantização 4-2. Fixando matriz de quantização a pedaço 5. Exemplos de sintaxe 5-1. Primeiro exemplo 5-2. Segundo exemplo 6. Várias configurações exemplares de conjuntos de parâmetro 6-1. Primeira técnica 6-2. Modificação exemplar da primeira técnica 6-3. Segunda técnica 6-4. Terceira técnica 6-5. Modificação exemplar da terceira técnica 7. Aplicações 8. Conclusão
1. Configuração exemplar de dispositivo de codificação de imagem de acordo com concretização
Esta seção descreve uma configuração exemplar de um dispositivo de codificação de imagem de acordo com uma concretização. 1-1. Configuração global exemplar
A Figura 1 é um diagrama de bloco ilustrando uma configuração exemplar de um dispositivo de codificação de imagem 10 de acordo com uma concretização. Se referindo à Figura 1, o dispositivo de codificação de imagem 10 está equipado com uma seção de conversão analógica para digital (A/D) 11, um buffer de reordenação 12, uma seção de processamento de sintaxe 13, uma seção de subtração 14, uma seção de transformada ortogonal 15, um seção de quantização 16, uma seção de codificação sem perda 17, um buffer de acumulação 18, uma seção de controle de taxa 19, uma seção de quantização inversa 21, uma seção de transformada ortogonal inversa 22, uma seção de adição 23, um filtro de desbloqueio 24, memória de quadro 25, um seletor 26, uma seção de intrapredição 30, uma seção de estimação de movimento 40, e uma seção de seleção de modo 50.
A seção de conversão A/D 11 converte um sinal de imagem introduzido em um formato analógico em dados de imagem em um formato digital, e produz uma sequência de dados de imagem digitais para o buffer de reordenação 12.
O buffer de reordenação 12 reordena as imagens incluídas na sequência de dados de imagem introduzidos da seção de conversão A/D 11. Depois de reordenar as imagens de acordo com uma estrutura de grupo de imagens paradas (GOP) conforme o processo de codificação, o buffer de reordenação 12 produz os dados de imagem reordenados para a seção de processamento de sintaxe 13.
Os dados de imagem produzidos do buffer de reordenação 12 à seção de processamento de sintaxe 13 são mapeados a fluxo de bit em unidades chamadas unidades de Camada de Abstração de Rede (NAL). O fluxo de dados de imagem inclui uma ou mais sequências. A imagem parada dianteira em uma sequência é chamada de imagem parada de renovação de decodificação instantânea (IDR). Cada sequência inclui um ou mais imagens paradas, e cada imagem parada ademais inclui um ou mais pedaços. Em H.264/AVC e HEVC, estes pedaços são as unidades básicas de codificação e decodificação de vídeo. Os dados para cada pedaço são reconhecidos como uma unidade de NAL de Camada de Codificação de Vídeo (VCL).
A seção de processamento de sintaxe 13 reconhece sequencialmente as unidades de NAL no fluxo de dados de imagem introduzidos do buffer de reordenação 12, e insere unidades de NAL não CL armazenando informação de cabeçalho no fluxo. As unidades de NAL não VCL que a seção de processamento de sintaxe 13 insere no fluxo incluem conjuntos de parâmetro de sequência (SPSs) e conjuntos de parâmetro de imagem parada (PPSs). Além disso, na concretização presente, a seção de processamento de sintaxe 13 insere no fluxo um conjunto de parâmetro de matriz de quantização (QMPS), uma unidade de NAL não VCL diferente do SPS e do PPS. A seção de processamento de sintaxe 13 também adiciona um cabeçalho de pedaço (SH) ao começo dos pedaços. A seção de processamento de sintaxe 13 então produz o fluxo de dados de imagem incluindo unidades de NAL VCL e unidades de NAL não VCL para a seção de subtração 14, a seção de intrapredição 30, e a seção de estimação de movimento 40. Uma configuração detalhada da seção de processamento de sintaxe 13 será descrita ademais mais tarde.
A seção de subtração 14 é provida com os dados de imagem introduzidos da seção de processamento de sintaxe 13, e dados de imagem preditos selecionados pela seção de seleção de modo 50 descrita mais tarde. A seção de subtração 14 calcula dados de erro de predição, que são a diferença entre os dados de imagem introduzidos da seção de processamento de sintaxe 13 e os dados de imagem preditos introduzidos da seção de seleção de modo 50, e produz os dados de erro de predição calculados para a seção de transformada ortogonal 15.
A seção de transformada ortogonal 15 executa uma transformada ortogonal nos dados de erro de predição introduzidos da seção de subtração 13. A transformada ortogonal executada pela seção de transformada ortogonal 15 pode ser transformada de cosseno discreta (DCT) ou a transformada de Karhunen-Loeve, por exemplo. A seção de transformada ortogonal 15 produz dados de coeficiente de transformada adquiridos pelo processo de transformada ortogonal para a seção de quantização 16.
A seção de quantização 16 usa uma matriz de quantização para quantizar os dados de coeficiente de transformada introduzidos da seção de transformada ortogonal 15, e produz os dados de coeficiente de transformada quantizados (em seguida chamados dados quantizados) para a seção de codificação sem perda 17 e a seção de quantização inversa 21. A taxa de bit dos dados quantizados é controlada na base de um sinal de controle de taxa da seção de controle de taxa 19. A matriz de quantização usada pela seção de quantização 16 está definida no conjunto de parâmetro de matriz de quantização, e pode ser especificada no cabeçalho de pedaço para cada pedaço. No caso onde uma matriz de quantização não está especificada, uma matriz de quantização plana tendo uma etapa de quantização igual para todos os componentes é usada.
A seção de codificação sem perda 17 gera um fluxo codificado executando um processo de codificação sem perda nos dados quantizados introduzidos da seção de quantização 16. A codificação sem perda pela seção de codificação sem perda 17 pode ser codificação de comprimento variável ou codificação aritmética, por exemplo. Além disso, a seção de codificação sem perda 17 multiplexa informação sobre intrapredição ou informação sobre interpredição introduzida da seção de seleção de modo 50 no cabeçalho do fluxo codificado. A seção de codificação sem perda 17 então produz o fluxo codificado assim gerado ao buffer de acumulação 18.
O buffer de acumulação 18 usa um meio de armazenamento tal como memória de semicondutor para armazenar temporariamente em buffer o fluxo codificado introduzido da seção de codificação sem perda 17. O buffer de acumulação 18 então produz o fluxo codificado assim armazenado para uma seção de transmissão não ilustrada (tal como uma interface de comunicação ou uma interface de conexão com equipamento periférico, por exemplo), a uma taxa de acordo com a largura da banda do canal de transmissão.
A seção de controle de taxa 19 monitora o espaço livre no buffer de acumulação 18. Então, a seção de controle de taxa 19 gera um sinal de controle de taxa de acordo com o espaço livre no buffer de acumulação 18, e produz o sinal de controle de taxa gerado para a seção de quantização 16. Por exemplo, quando não há muito espaço livre no buffer de acumulação 18, a seção de controle de taxa 19 gera um sinal de controle de taxa para abaixar a taxa de bit dos dados quantizados. Também, quando há espaço livre suficiente no buffer de acumulação 18, por exemplo, a seção de controle de taxa 19 gera um sinal de controle de taxa para elevar a taxa de bit dos dados quantizados.
A seção de quantização inversa 21 usa uma matriz de quantização para executar um processo de quantização inversa nos dados quantizados introduzidos da seção de quantização 16. A seção de quantização inversa 21 então produz dados de coeficiente de transformada adquiridos pelo processo de quantização inversa à seção de transformada ortogonal inversa 22.
A seção de transformada ortogonal inversa 22 executa um processo de transformada ortogonal inversa nos dados de coeficiente de transformada introduzidos da seção de desquantização 21, por esse meio para restaurar os dados de erro de predição. Então, a seção de transformada ortogonal inversa 22 produz os dados de erro de predição restaurados para a seção de adição 23.
A seção de adição 23 soma os dados de erro de predição restaurados introduzidos da seção de transformada ortogonal inversa 22 e os dados de imagem preditos introduzidos da seção de seleção de modo 50, por esse meio para gerar dados de imagem decodificados. Então, a seção de adição 23 produz os dados de imagem decodificados assim gerados ao filtro de desbloqueio 24 e à memória de quadro 25.
O filtro de desbloqueio 24 aplica filtragem para reduzir artefatos de bloqueio produzidos na hora de codificação de imagem. O filtro de desbloqueio 24 remove artefatos de bloqueio filtrando os dados de imagem decodificados introduzidos da seção de adição 23, e produz os dados de imagem decodificados filtrados assim à memória de quadro 25.
A memória de quadro 25 usa um meio de armazenamento para armazenar os dados de imagem decodificados introduzidos da seção de adição 23 e os dados de imagem decodificados depois de filtragem introduzidos do filtro de desbloqueio 24.
O seletor 26 lê, da memória de quadro 25, dados de imagem decodificados não filtrados a serem usados para intrapredição, e provê os dados de imagem decodificados assim lidos à seção de intrapredição 30 como dados de imagem de referência. Também, o seletor 26 lê, da memória de quadro 25, os dados de imagem decodificados filtrados a serem usados para interpredição, e provê os dados de imagem decodificados assim lidos à seção de estimação de movimento 40 como dados de imagem de referência.
A seção de intrapredição 30 executa um processo de intrapredição em cada modo de intrapredição, na base dos dados de imagem a serem codificados que são introduzidos da seção de processamento de sintaxe 13, e os dados de imagem decodificados providos pelo seletor 26. Por exemplo, a seção de intrapredição 30 avalia o resultado de predição de cada modo de intrapredição usando uma função de custo predeterminada. Então, a seção de intrapredição 30 seleciona o modo de intrapredição produzindo o menor valor de função de custo, quer dizer, o modo de intrapredição produzindo a relação de compressão mais alta, como o modo ótimo de intrapredição. Além disso, a seção de intrapredição 30 produz informação sobre intrapredição, tal como informação de modo de predição indicando o modo ótimo de intrapredição, os dados de imagem preditos e o valor de função de custo, para a seção de seleção de modo 50.
A seção de estimação de movimento 40 executa um processo de interpredição (processo de predição entre quadros) na base de dados de imagem a serem codificados que são introduzidos da seção de processamento de sintaxe 13, e dados de imagem decodificados providos pelo seletor 26. Por exemplo, a seção de estimação de movimento 40 avalia o resultado de predição de cada modo de predição usando uma função de custo predeterminada. Então, a seção de estimação de movimento 40 seleciona o modo de predição produzindo o menor valor de função de custo, quer dizer, o modo de predição produzindo a
relação de compressão mais alta, como o modo ótimo de predição. A seção de estimação de movimento 40 gera dados de imagem preditos de acordo com o modo ótimo de predição. A seção de estimação de movimento 40 produz informação sobre interpredição, tal como informação de modo de predição indicando o modo ótimo de intrapredição assim selecionado, os dados de imagem preditos e o valor de função de custo, para a seção de seleção de modo 50.
A seção de seleção de modo 50 compara o valor de função de custo relacionado à intrapredição introduzido da seção de intrapredição 30 ao valor de função de custo relacionado à interpredição introduzido da seção de estimação de movimento 40. Então, a seção de seleção de modo 50 seleciona o método de predição com o menor valor de função de custo entre intrapredição e interpredição. No caso de selecionar intrapredição, a seção de seleção de modo 50 produz a informação sobre intrapredição para a seção de codificação sem perda 17, e também produz os dados de imagem preditos para a seção de subtração 14 e a seção de adição 23. Também, no caso de selecionar interpredição, a seção de seleção de modo 50 produz a informação sobre interpredição descrita acima para a seção de codificação sem perda 17, e também produz os dados de imagem preditos para a seção de subtração 14 e a seção de adição 23. 1-2. Configuração exemplar de seção de processamento de sintaxe
A Figura 2 é um diagrama de bloco ilustrando um exemplo de uma configuração detalhada da seção de processamento de sintaxe 13 do dispositivo de codificação de imagem 10 ilustrado na Figura 1. Se referindo à Figura 2, a seção de processamento de sintaxe 13 inclui uma seção de fixação 110, uma seção geradora de parâmetro 120 e uma seção de inserção 130.
(1) Seção de fixação
A seção de fixação 110 retém várias fixações usadas para o processo de codificação pelo dispositivo de codificação de imagem 10. Por exemplo, a seção de fixação 110 retém um perfil para cada sequência nos dados de imagem, o modo de codificação para cada imagem parada, dados relativos à estrutura de GOP, e similar. Também, na concretização presente, a seção de fixação 110 retém fixações relativas a matrizes de quantização usadas pela seção de quantização 16 (e a seção de quantização inversa 21). A pergunta de qual matriz de quantização deveria ser usada pela seção de quantização 16 pode ser predeterminada para cada pedaço, tipicamente na base de análise de imagem offline.
Por exemplo, em aplicações exemplares tais como câmeras de vídeo digitais, artefatos de compressão não existem nas imagens de entrada, e assim uma matriz de quantização com uma etapa de quantização reduzida pode ser usada, até mesmo no alto alcance. A matriz de quantização varia em unidades de imagem ou unidades de quadro. No caso de imagens de entrada com baixa complexidade, usar uma matriz de quantização plana com uma etapa de quantização menor habilita melhoria na qualidade de imagem percebida subjetivamente pelo usuário. Por outro lado, no caso de imagens de entrada com complexidade alta, é desejável usar uma etapa de quantização maior a fim de inibir aumentos na taxa. Neste caso, usar uma matriz de quantização plana tem o risco de artefatos no sinal de baixo alcance serem notável reconhecidos como ruído de bloco. Por esta razão, é benéfico reduzir ruído usando uma matriz de quantização na qual a etapa de quantização aumenta procedendo do baixo alcance para o alto alcance.
Em aplicações exemplares tais como gravadores que recomprimem conteúdo radiodifundido codificado em MPEG-2, artefatos de compressão de MPEG-2 tal como ruído de mosquito existem nas próprias imagens de entrada. Ruído de mosquito é ruído produzido como resultado de quantizar um sinal de alto alcance com uma etapa de quantização maior, e os componentes de frequência do ruído se tornam frequências extremamente altas eles mesmos. Ao recomprimir tais imagens de entrada, é desejável usar uma matriz de quantização tendo uma etapa de quantização grande no alto alcance. Também, em sinais 17/78 entrelaçados, a correlação de sinal na direção horizontal é mais alta do que a correlação do sinal na direção vertical comparada a sinais progressivos, devido aos efeitos das varreduras entrelaçadas. Por esta razão, também é benéfico usar matrizes de quantização diferentes de acordo com se o sinal de imagem é um sinal progressivo ou um sinal entrelaçado. Em qualquer caso, a matriz de quantização ótima pode variar em unidades de imagem ou unidades de quadro, dependendo do conteúdo de imagem.
(2) Seção geradora de parâmetro
A seção geradora de parâmetro 120 gera parâmetros definindo fixações para o processo de codificação, que são retidos pela seção de fixação 110, e produz os parâmetros gerados para a seção de inserção 130.
Por exemplo, na concretização presente, a seção geradora de parâmetro 120 gera parâmetros de matriz de quantização definindo matrizes de quantização a serem usadas pela seção de quantização 16. O grupo de parâmetros de matriz de quantização gerado pela seção geradora de parâmetro 120 está incluído no conjunto de parâmetro de matriz de quantização (QMPS). A cada QMPS é nomeado um QMPS ID, que é um identificador para discriminar os QMPSs individuais entre si. Tipicamente, múltiplas classes de matrizes de quantização estão definidas dentro de um QMPS. As classes de matrizes de quantização são distinguidas entre si pelo tamanho de matriz junto com o método de predição correspondente, e os componentes de sinal. Por exemplo, um máximo de seis classes de matrizes de quantização (os componentes de Y/Cb/Cr em intrapredição/interpredição) podem ser definidos para cada um dos tamanhos 4x4, 8x8, 16x16 e 32x32 dentro de um QMPS.
Mais especificamente, a seção geradora de parâmetro 120 pode converter cada matriz de quantização em um arranjo linear usando uma varredura em ziguezague, e codificar o valor de cada elemento no arranjo linear em formato de modulação de código de pulso diferencial (DPCM), semelhantemente ao processo de codificação de matriz de quantização em H.264/AVC. Neste caso, os arranjos lineares de dados diferenciais de DPCM se tornam os parâmetros de matriz de quantização. Nesta especificação, um tal modo para gerar parâmetros de matriz de quantização é designado o modo de varredura completa.
Além disso, a seção geradora de parâmetro 120 também pode gerar parâmetros de matriz de quantização em um modo que difere do modo de varredura completa, a fim de reduzir a quantidade de códigos dos parâmetros de matriz de quantização. Por exemplo, em vez do modo de varredura completa, a seção geradora de parâmetro 120 também pode gerar parâmetros de matriz de quantização em um modo de cópia ou um modo de designação de eixo, descrito a seguir.
Modo de cópia é um modo que pode ser selecionado no caso onde a matriz de quantização usada para um dado pedaço se assemelha ou iguala uma matriz de quantização já definida. No caso de modo de cópia, a seção geradora de parâmetro 120 inclui o QMPS ID do QMPS no qual a matriz de quantização de fonte de cópia está definida, como também o tamanho e tipo da matriz de quantização de fonte de cópia, no QMPS como parâmetros de matriz de quantização. Note que nesta especificação, a combinação do método de predição e componentes de sinal correspondendo a uma dada matriz de quantização é designada o tipo dessa matriz de quantização. No caso onde diferenças existem entre a matriz de quantização a ser definida e a matriz de quantização de fonte de cópia, a seção geradora de parâmetro 120 pode adicionalmente incluir dados residuais para gerar uma matriz residual expressando o erro residual de cada componente no QMPS.
Processamento para modo de designação de eixo é dividido ademais de acordo com dois métodos de especificação: um método diferencial e um método de interpolação. Com o método diferencial, a seção geradora de parâmetro 120 especifica só os valores dos elementos na matriz de quantização correspondendo ao eixo vertical, que é a coluna mais à esquerda, o eixo horizontal que é a fila superior, e eixo diagonal ao longo da diagonal da unidade de transformada. Com o método de interpolação, a seção geradora de parâmetro 120 especifica só os valores dos elementos na matriz de quantização correspondendo aos quatro cantos à esquerda superior (o componente de CC), à direita superior, à esquerda inferior, e à direita inferior da unidade de transformada. Os valores dos elementos restantes podem ser interpolados com uma técnica arbitrária tal como interpolação linear, interpolação cúbica, ou interpolação de Lagrange. Igualmente em modo de designação de eixo, no caso onde diferenças existem entre a matriz de quantização a ser definida e a matriz de quantização interpolada, a seção geradora de parâmetro 120 pode adicionalmente incluir dados residuais para gerar uma matriz residual expressando o erro residual de cada componente no QMPS.
(3) Seção de inserção
A seção de inserção 130 insere informação de cabeçalho, tais como SPSs, PPSs, QMPSs, e cabeçalhos de pedaço que incluem respectivamente os grupos de parâmetro gerados pela seção geradora de parâmetro 120, no fluxo de dados de imagem introduzido do buffer de reordenação 12. Como discutido mais cedo, o QMPS é uma unidade de NAL não VCL que difere do SPS e do PPS. O QMPS inclui parâmetros de matriz de quantização gerados pela seção geradora de parâmetro 120. A seção de inserção 130 então produz o fluxo de dados de imagem com informação de cabeçalho inserida para a seção de subtração 14, a seção de intrapredição 30 e a seção de estimação de movimento 40. 1-3. Estrutura de parâmetro exemplar (1) Conjunto de parâmetro de matriz de quantização
A Figura 3 é um diagrama explicativo ilustrando parâmetros exemplares incluídos em cada QMPS na concretização presente. Se referindo à Figura 3, cada QMPS inclui um “QMPS ID”, um “sinalizador de modo de geração presente”, um “modo de geração”, e parâmetros de matriz de quantização diferentes para cada modo.
O “QMPS ID” é um identificador para discriminar os QMPSs individuais entre si. O QMPS ID pode ser um inteiro na gama de 0 a 31, ou similar. A especificação de um QMPS ID não usado significa que um novo QMPS é para ser definido. A re-especificação de um QMPS ID já sendo usado em uma sequência significa que um QMPS já definido é para ser atualizado.
O “sinalizador de modo de geração presente” é um sinalizador indicando se ou não um “modo de geração”, que é uma classificação representando um modo do processo de geração de matriz de quantização, está presente dentro desse QMPS. No caso onde o sinalizador de modo de geração presente indica “0: não presente”, matrizes de quantização estão definidas em modo de varredura completa dentro desse QMPS. Enquanto isso, no caso onde o sinalizador de modo de geração presente indica “1: presente”, um “modo de geração” está presente dentro desse QMPS.
O “modo de geração” é uma classificação que pode tomar quaisquer dos valores “0: cópia”, “1: designação de eixo”, ou “2: varredura completa”, por exemplo. No pseudocódigo de sintaxe descrito mais tarde, o modo de geração é representado por uma variável chamada “pred_mode”.
No caso de modo de cópia (quer dizer, pred_mode=0), o QMPS pode incluir um “ID de fonte”, um “tamanho de fonte de cópia”, um “tipo de fonte de cópia”, um “sinalizador residual”, e “dados residuais” como parâmetros de matriz de quantização. O “ID de fonte” é um QMPS ID especificando um QMPS no qual uma matriz de quantização de fonte de cópia está definida. O “tamanho de fonte de cópia” é o tamanho da matriz de quantização de fonte de cópia. O “tipo de fonte de cópia” é o tipo da matriz de quantização de fonte de cópia (intraY, intraCb, ..., intraCr). A “sinalizador residual” é um sinalizador indicando se ou não erro residual está presente. Os “dados residuais” são dados para gerar uma matriz residual expressando o erro residual no caso onde erro residual está presente. Os dados residuais podem ser omitidos no caso onde o sinalizador residual indica “0: não presente”.
Note o caso onde o ID de fonte de um dado QMPS é igual a QMPS ID daquele próprio QMPS pode ser interpretado como especificando uma matriz de quantização prefixada como aquela ilustrada através de exemplo na Figura 38. Fazendo assim pode reduzir a quantidade de códigos do QMPS, desde que um sinalizador independente para especificar a matriz de quantização prefixada não precisa mais ser incluída no QMPS.
No caso de modo de designação de eixo (quer dizer, pred_mode=1), o QMPS pode incluir um “sinalizador de método de designação”, além de tanto “dados de eixo de referência” ou “dados de canto”, um “sinalizador residual”, e “dados residuais” como parâmetros de matriz de quantização. O sinalizador de método de designação é um sinalizador que indica como designar os valores de elementos ao longo de eixos de referência que servem como uma referência para a geração de uma matriz de quantização, e pode tomar um valor tanto de “0: diferencial” ou “1: interpolação”, por exemplo. No caso onde o método de designação é “0: diferencial”, os valores de elementos correspondendo aos eixos de referência da matriz de quantização, estes sendo o eixo vertical, o eixo horizontal, e o eixo diagonal, são designados pelos dados de eixo de referência. No caso onde o método de designação é “1: interpolação”, os valores de elementos correspondendo aos quatro cantos à esquerda superior, à direita superior, à esquerda inferior, e à direita inferior da matriz de quantização são designados pelos dados de canto. Os valores de elementos nos três eixos de referência podem ser gerados através de interpolação dos valores destes quatro cantos. O sinalizador residual e os dados residuais são semelhantes ao caso de modo de cópia.
No caso de modo de varredura completa (quer dizer, pred_mode=2), o QMPS pode incluir arranjos lineares de dados diferenciais de DPCM como parâmetros de matriz de quantização.
Note que cada QMPS pode incluir modos de geração que diferem para cada classe de matriz de quantização e parâmetros de matriz de quantização correspondendo a cada modo. Em outras palavras, como um exemplo, uma dada classe de matriz de quantização pode ser definida por modo de varredura completa, outra classe de matriz de quantização pode ser definida em modo de designação de eixo, e as matrizes de quantização restantes podem ser definidas em modo de cópia dentro de um único QMPS.
(2) Cabeçalho de pedaço A Figura 4 é um diagrama explicativo ilustrando parcialmente parâmetros exemplares incluídos em cada cabeçalho de pedaço na concretização presente. Se referindo à Figura 4, cada cabeçalho de pedaço pode incluir um “tipo de pedaço”, um “PPS ID”, um “sinalizador de QMPS ID presente”, e um “QMPS ID”. O “tipo de pedaço” é uma classificação indicando o tipo de codificação para esse pedaço, e toma um valor correspondendo a um pedaço P, pedaço B, ou pedaço I, ou similar. O “PPS ID” é um ID para o conjunto de parâmetro de imagem (PPS) referenciado para esse pedaço. O “sinalizador de QMPS ID presente” é um sinalizador indicando se ou não um QMPS ID está presente nesse cabeçalho de pedaço. O “QMPS ID” é um QMPS ID para o conjunto de parâmetro de matriz de quantização (QMPS) referenciado para esse pedaço.
2. Fluxo de processo durante codificação de acordo com concretização
(1) Processo de inserção de conjunto de parâmetro A Figura 5 é um fluxograma ilustrando um fluxo exemplar de um processo de inserção de conjunto de parâmetro pela seção de inserção 130 da seção de processamento de sintaxe 13 de acordo com a concretização presente.
Se referindo à Figura 5, a seção de inserção 130 primeiro adquire sucessivamente unidades de NAL dentro do fluxo de dados de imagem introduzido do buffer de reordenação 12, e reconhece uma única imagem parada (etapa S100). A seguir, a seção de inserção 130 determina se ou não a imagem parada reconhecida é a imagem parada dianteira de uma sequência (etapa S102). Neste momento, a seção de inserção 130 insere um SPS no fluxo no caso onde a imagem parada reconhecida é a imagem parada dianteira de uma sequência (etapa S104). A seguir, a seção de inserção 130 determina adicionalmente se ou não há uma mudança no PPS para a imagem parada reconhecida (etapa S106). Neste momento, a seção de inserção 130 insere um PPS no fluxo no caso onde há uma mudança no PPS, ou no caso onde a imagem parada reconhecida é a imagem parada dianteira de uma sequência (etapa S108). A seguir, a seção de inserção 130 determina adicionalmente se ou não há uma mudança no QMPS (etapa S110). Neste momento, a seção de inserção 130 insere um QMPS no fluxo no caso onde há uma mudança no QMPS, ou no caso onde a imagem parada reconhecida é a imagem parada dianteira de uma sequência (etapa S112). Depois disso, a seção de inserção 130 termina o processo no caso de detectar o fim do fluxo. Por outro lado, a seção de inserção 130 repete o processo anterior para a próxima imagem parada no caso onde o fluxo não terminou (etapa S114).
Note que embora o fluxograma só ilustre a inserção do SPS, do PPS, e QMPS por causa de simplicidade, a seção de inserção 130 também pode inserir outra informação de cabeçalho, tal como informação de aprimoramento suplementar (SEI) e cabeçalhos de pedaço, no fluxo. (2) Descrição de estrutura de fluxo
A Figura 6 é um diagrama explicativo para explicar diferenças na estrutura de fluxo entre uma técnica de acordo com a concretização presente e uma técnica existente.
O lado esquerdo da Figura 6 ilustra um fluxo ST1 como um exemplo gerado conforme uma técnica existente. Desde que o começo do fluxo ST1 é o começo de uma sequência, um primeiro SPS(1) e um primeiro PPS(1) são inseridos ao começo do fluxo ST1. Uma ou mais matrizes de quantização podem ser definidas no SPS(1) e no PPS(1). A seguir, assuma que fica necessário atualizar as matrizes de quantização depois de vários cabeçalhos de pedaço subsequentes e dados de pedaço. Assim, um segundo PPS(2) é inserido no fluxo ST1. O PPS(2) também inclui parâmetros diferentes de parâmetros de matriz de quantização. A seguir, assuma que fica necessário atualizar o PPS depois de vários cabeçalhos de pedaço subsequentes e dados de pedaço. Assim, um terceiro PPS(3) é inserido no fluxo ST1. O PPS(3) também inclui parâmetros de matriz de quantização. O processo de quantização (e processo de quantização inversa) para pedaços subsequentes é conduzido usando as matrizes de quantização definidas no PPS especificado pelo PPS ID no cabeçalho de pedaço.
O lado direito da Figura 6 ilustra um fluxo ST2 como um exemplo gerado conforme a técnica anterior de acordo com a concretização presente. Desde que o começo do fluxo ST2 é o começo de uma sequência, um primeiro SPS(1), um primeiro PPS(1) e um primeiro QMPS(1) são inseridos ao começo do fluxo ST1. No fluxo ST2, uma ou mais matrizes de quantização podem ser definidas no QMPS(1). A soma dos comprimentos do PPS(1) e do QMPS(1) no fluxo ST2 é aproximadamente igual ao comprimento do PPS(1) no fluxo ST1. A seguir, se ficar necessário atualizar as matrizes de quantização depois de vários cabeçalhos de pedaço subsequentes e dados de pedaço, um segundo QMPS(2) é inserido no fluxo ST2. Desde que o QMPS(2) não contém parâmetros diferentes de parâmetros de matriz de quantização, o comprimento do QMPS(2) é mais curto do que o comprimento do PPS(2) no fluxo ST2. A seguir, se ficar necessário atualizar o PPS depois de vários cabeçalhos de pedaço subsequentes e dados de pedaço, um segundo PPS(2) é inserido no fluxo ST2. Desde que o PPS(2) no fluxo ST2 não contém parâmetros de matriz de quantização, o comprimento do PPS(2) no fluxo ST2 é mais curto do que o comprimento do PPS(3) no fluxo ST1. O processo de quantização (e processo de quantização inversa) para pedaços subsequentes é conduzido usando as matrizes de quantização definidas no QMPS especificado pelo QMPS ID no cabeçalho de pedaço.
Uma comparação dos fluxos ST1 e ST2 na Figura 6 revela que a quantidade de códigos do fluxo global pode ser reduzida com a técnica descrita na concretização presente. Particularmente, a redução da quantidade de códigos com a técnica anterior fica até mesmo mais efetiva no caso de matrizes de quantização com tamanhos maiores, ou no caso onde um número maior de matrizes de quantização está definido para cada imagem parada.
3. Configuração exemplar de dispositivo de decodificação de imagem de acordo com concretização
3-1. Configuração global exemplar Esta seção descreve uma configuração exemplar de um dispositivo de decodificação de imagem de acordo com uma concretização.
3-1. Configuração global exemplar A Figura 7 é um diagrama de bloco ilustrando uma configuração exemplar de um dispositivo de decodificação de imagem 60 de acordo com uma concretização. Se referindo à Figura 7, o dispositivo de decodificação de imagem 60 está equipado com uma seção de processamento de sintaxe 61, uma seção de decodificação sem perda 62, uma seção de quantização inversa 63, uma seção de transformada ortogonal inversa 64, uma seção de adição 65, um filtro de desbloqueio 66, um buffer de reordenação 67, uma seção de conversão digital para analógico (D/A) 68, memória de quadro 69, seletores 70 e 71, uma seção de intrapredição 80, e uma seção de compensação de movimento 90.
A seção de processamento de sintaxe 61 adquire informação de cabeçalho tais como SPSs, PPSs, QMPSs, e cabeçalhos de pedaço de um fluxo codificado introduzido por um canal de transmissão, e reconhece várias fixações para um processo de decodificação pelo dispositivo de decodificação de imagem 60 na base da informação de cabeçalho adquirida. Por exemplo, na concretização presente, a seção de processamento de sintaxe 61 fixa uma matriz de quantização a ser usada durante um processo de quantização inversa pela seção de quantização inversa 63 na base de parâmetros de matriz de quantização incluídos em um QMPS. Uma configuração detalhada da seção de processamento de sintaxe 61 será descrita ademais mais tarde.
A seção de decodificação sem perda 62 decodifica o fluxo codificado introduzido da seção de processamento de sintaxe 61 de acordo com o método de codificação usado na hora de codificação. A seção de decodificação sem perda 62 então produz os dados de quantização decodificados para a seção de quantização inversa 62. Além disso, a seção de decodificação sem perda 62 produz informação sobre intrapredição incluída na informação de cabeçalho à seção de intrapredição 80, e produz informação sobre interpredição à seção de compensação de movimento 90.
A seção de quantização inversa 63 usa um conjunto de matriz de quantização pela seção de processamento de sintaxe 61 para quantizar inversamente os dados de quantização decodificados pela seção de decodificação sem perda 62 (quer dizer, dados de coeficiente de transformada quantizados). A pergunta de qual matriz de quantização deveria ser usada para cada bloco em um dado pedaço pode ser determinada de acordo com o QMPS ID especificado no cabeçalho de pedaço, o tamanho de cada bloco (Unidade de Transformada), o método de predição para cada bloco, e os componentes de sinal.
A seção de transformada ortogonal inversa 64 gera dados de erro de predição executando uma transformada ortogonal inversa em dados de coeficiente de transformada introduzidos da seção de desquantização 63 de acordo com o método de transformada ortogonal usado na hora de codificação. Então, a seção de transformada ortogonal inversa 64 produz os dados de erro de predição gerados para a seção de adição 65.
A seção de adição 65 soma os dados de erro de predição introduzidos da seção de transformada ortogonal inversa 64 a dados de imagem preditos introduzidos do seletor 71, por esse meio para gerar dados de imagem decodificados. Então, a seção de adição 65 produz os dados de imagem decodificados assim gerados ao filtro de desbloqueio 66 e à memória de quadro 69.
O filtro de desbloqueio 66 remove artefatos de bloqueio filtrando os dados de imagem decodificados introduzidos da seção de adição 65, e produz os dados de imagem decodificados assim filtrados ao buffer de reordenação 67 e à memória de quadro 69.
O buffer de reordenação 67 gera uma sequência cronológica de dados de imagem reordenando imagens introduzidas do filtro de desbloqueio 66. Então, o buffer de reordenação 67 produz os dados de imagem gerados para a seção de conversão D/A 68.
A seção de conversão D/A 68 converte os dados de imagem em um formato digital introduzido do buffer de reordenação 67 em um sinal de imagem em um formato analógico. Então, a seção de conversão D/A 68 faz uma imagem ser exibida produzindo o sinal de imagem analógico a uma exibição (não ilustrada) conectada ao dispositivo de decodificação de imagem 60, por exemplo.
A memória de quadro 69 usa um meio de armazenamento para armazenar os dados de imagem não filtrados decodificados introduzidos da seção de adição 65 e os dados de imagem decodificados filtrados introduzidos do filtro de desbloqueio 66.
O seletor 70 comuta o destino de saída dos dados de imagem da memória de quadro 69 entre a seção de intrapredição 80 e a seção de compensação de movimento 90 para cada bloco na imagem de acordo com informação de modo adquirida pela seção de decodificação sem perda 62. Por exemplo, no caso onde um modo de intrapredição é especificado, o seletor 70 produz os dados de imagem não filtrados decodificados que são providos da memória de quadro 69 para a seção de intrapredição 80 como dados de imagem de referência. Também, no caso onde um modo de interpredição é especificado, o seletor 70 produz os dados de imagem decodificados filtrados que são providos da memória de quadro 69 para a seção de compensação de movimento 90 como dados de imagem de referência.
O seletor 71 comuta a fonte de saída de dados de imagem preditos a serem providos à seção de adição 65 entre a seção de intrapredição 80 e a seção de compensação de movimento 90 para cada bloco na imagem de acordo com a informação de modo adquirida pela seção de decodificação sem perda 62. Por exemplo, no caso onde um modo de intrapredição é especificado, o seletor 71 provê a seção de adição 65 com os dados de imagem preditos produzidos da seção de intrapredição 80. No caso onde um modo de interpredição é especificado, o seletor 71 provê a seção de adição 65 com os dados de imagem preditos produzidos da seção de compensação de movimento 90.
A seção de intrapredição 80 executa predição em quadro de valores de pixel na base da informação sobre intrapredição introduzida da seção de decodificação sem perda 62 e os dados de imagem de referência da memória de quadro 69, e gera dados de imagem preditos. Então, a seção de intrapredição 80 produz os dados de imagem preditos assim gerados ao seletor 71.
A seção de compensação de movimento 90 executa um processo de compensação de movimento na base da informação sobre interpredição introduzida da seção de decodificação sem perda 62 e os dados de imagem de referência da memória de quadro 69, e gera dados de imagem preditos. Então, a seção de compensação de movimento 90 produz os dados de imagem preditos assim gerados ao seletor 71. 3-2. Configuração exemplar de seção de processamento de sintaxe
A Figura 8 é um diagrama de bloco ilustrando um exemplo de uma configuração detalhada da seção de processamento de sintaxe 61 do dispositivo de decodificação de imagem 60 ilustrado na Figura 7. Se referindo à Figura 8, a seção de processamento de sintaxe 61 inclui uma seção de aquisição de parâmetro 160 e uma seção de fixação 170. (1) Seção de aquisição de parâmetro
A seção de aquisição de parâmetro 160 reconhece informação de cabeçalho tais como SPSs, PPSs, QMPSs, e cabeçalhos de pedaço do fluxo de dados de imagem, e adquire parâmetros incluídos na informação de cabeçalho. Por exemplo, na concretização presente, a seção de aquisição de parâmetro 160 adquire parâmetros de matriz de quantização definindo uma matriz de quantização de um QMPS. Como discutido mais cedo, o QMPS é uma unidade de
NAL não VCL que difere do SPS e do PPS. A seção de aquisição de parâmetro 160 então produz os parâmetros adquiridos à seção de fixação 170. A seção de aquisição de parâmetro 160 também produz o fluxo de dados de imagem para a seção de decodificação sem perda 62. (2) Seção de fixação
A seção de fixação 170 aplica fixações ao processamento em cada seção ilustrada na Figura 7 na base dos parâmetros adquiridos pela seção de aquisição de parâmetro 160. Por exemplo, a seção de fixação 170 reconhece a gama de tamanhos de Unidade de Codificação do par de valores de LCU e SCU, enquanto também fixando o tamanho de Unidade de Codificação de acordo com o valor de split_flag. A decodificação de dados de imagem é conduzida tomando as Unidades de Codificação fixadas neste momento como as unidades de processamento. Além disso, a seção de fixação 170 adicionalmente fixa o tamanho de Unidade de Transformada. A quantização inversa pela seção de quantização inversa 63 e a transformada ortogonal inversa pela seção de transformada inversa ortogonal 64 discutida acima são conduzidas tomando as Unidades de Transformada fixadas neste momento como as unidades de processamento.
Também, na concretização presente, a seção de fixação 170 fixa matrizes de quantização na base de parâmetros de matriz de quantização adquiridos de um QMPS pela seção de aquisição de parâmetro 160. Mais especificamente, na base de parâmetros de quantização incluídos em um QMPS, a seção de fixação 170 gera múltiplas matrizes de quantização que diferem entre si em tamanho e tipo por modo de varredura completa, modo de cópia, e modo de designação de eixo, respectivamente. A geração de matrizes de quantização pode ser conduzida cada vez que um QMPS é detectado no fluxo de dados de imagem.
Por exemplo, por modo de varredura completa, a seção de fixação 170 decodifica um arranjo linear de dados diferenciais incluídos nos parâmetros de matriz de quantização em formato de DPCM. A seção de fixação 170 então converte o arranjo linear decodificado a uma matriz de quantização bidimensional de acordo com o padrão de varredura de uma varredura em ziguezague.
Também, em modo de cópia, a seção de fixação 170 copia uma matriz de quantização (gerada previamente) especificada por um ID de fonte, um tamanho de fonte de cópia, e um tipo de fonte de cópia incluídos nos parâmetros de matriz de quantização. Neste momento, no caso onde o tamanho da nova matriz de quantização é menor do que o tamanho da matriz de quantização de fonte de cópia, a seção de fixação 170 gera a nova matriz de quantização dizimando elementos na matriz de quantização copiada. Além disso, no caso onde o tamanho da nova matriz de quantização é maior do que o tamanho da matriz de quantização de fonte de cópia, a seção de fixação 170 gera a nova matriz de quantização interpolando elementos na matriz de quantização copiada. Então, no caso onde componentes residuais estão presentes, a seção de fixação 170 adiciona os componentes residuais à nova matriz de quantização.
Também, no caso onde o ID de fonte incluído nos parâmetros de matriz de quantização dentro de um dado QMPS é igual ao QMPS ID daquele QMPS, a seção de fixação 170 trata a nova matriz de quantização como a matriz de quantização prefixada.
Também, em modo de designação de eixo, a seção de fixação 170 reconhece o sinalizador de método de designação incluída nos parâmetros de matriz de quantização. Então, no caso do método diferencial, a seção de fixação 170 gera os valores dos elementos da matriz de quantização que correspondem ao eixo vertical, ao eixo horizontal, e ao eixo diagonal na base de dados de eixo de referência incluídos nos parâmetros de matriz de quantização, e gera os valores dos elementos restantes através de interpolação. Além disso, no caso do método de interpolação, a seção de fixação 170 gera os valores dos elementos da matriz de quantização que correspondem aos quatro cantos na base de dados de canto incluídos nos parâmetros de matriz de quantização, e depois de gerar os valores de elementos ao longo dos eixos de referência através de interpolação, adicionalmente gera os valores dos elementos restantes através de interpolação. Então, no caso onde componentes residuais estão presentes, a seção de fixação 170 adiciona os componentes residuais à nova matriz de quantização.
Depois disso, quando um QMPS ID é especificado em um cabeçalho de pedaço, a seção de fixação 170 fixa a matriz de quantização gerada para o QMPS identificado pelo QMPS ID especificado como a matriz de quantização a ser usada pela seção de quantização inversa 63.
4. Fluxo de processo durante decodificação de acordo com concretização
4-1. Gerando matrizes de quantização (1) Processo de geração de matriz de quantização A Figura 9 é um fluxograma ilustrando um fluxo exemplar de um processo de geração de matriz de quantização pela seção de processamento de sintaxe 61 de acordo com a concretização presente. O processo de geração de matriz de quantização na Figura 9 é um processo que pode ser conduzido cada vez que um QMPS é detectado no fluxo de dados de imagem.
Se referindo à Figura 9, a seção de aquisição de parâmetro 160 primeiro adquire um QMPS ID de um QMPS (etapa S200). Se o QMPS ID adquirido neste momento for um ID não usado no fluxo, a seção de fixação 170 gera uma nova matriz de quantização a ser associada com esse QMPS ID de acordo com o processo descrito abaixo. Por outro lado, se o QMPS ID for um ID que já está em uso, a seção de fixação 170 atualiza a matriz de quantização armazenada em associação com esse QMPS ID para uma matriz gerada de acordo com o processo descrito abaixo. A seguir, a seção de aquisição de parâmetro 160 adquire um sinalizador de modo de geração presente do QMPS (etapa S202).
O processamento subsequente da etapa S206 à etapa S240 é repetido para toda classe de matriz de quantização (etapa S204). Note que a classe de uma matriz de quantização corresponde à combinação do tamanho e do tipo (quer dizer, o método de predição e componentes de sinal) da matriz de quantização.
Na etapa S206, a seção de fixação 170 determina, de acordo com o sinalizador de modo de geração presente, se ou não (uma classificação de) um modo de geração está presente no QMPS (etapa S206). No caso onde um modo de geração não está presente neste momento, a seção de fixação 170 gera uma matriz de quantização com o método de varredura completa, semelhantemente ao processo de decodificação de matriz de quantização em H.264/AVC (etapa S208). Por outro lado, no caso onde um modo de geração está presente, a seção de aquisição de parâmetro 160 adquire o modo de geração do QMPS (etapa S210). A seção de fixação 170 então conduz processamento diferente dependendo do modo de geração (etapas S212, S214).
Por exemplo, no caso onde modo de cópia está indicado, a seção de fixação 170 conduz processamento no modo de cópia ilustrado por exemplo na Figura 10 (etapa S220). Também, no caso onde modo de designação de eixo está indicado, a seção de fixação 170 conduz processamento no modo de designação de eixo ilustrado por exemplo na Figura 11 (etapa S240). Também, no caso onde modo de varredura completa está indicado, a seção de fixação 170 gera uma matriz de quantização com o método de varredura completa, semelhantemente ao processo de decodificação de matriz de quantização em H.264/AVC (etapa S208).
Depois disso, quando matrizes de quantização para todas as classes de matrizes de quantização são geradas, o processo de geração de matriz de quantização ilustrado na Figura 9 termina. (2) Processo em modo de cópia
A Figura 10 é um fluxograma ilustrando um exemplo de um fluxo detalhado de um processo em modo de cópia na etapa S220 da Figura 9.
Se referindo à Figura 10, primeiro, a seção de aquisição de parâmetro 160 adquire um ID de fonte de um QMPS (etapa S221). A seguir, a seção de fixação 170 determina se ou não o QMPS ID adquirido na etapa S200 da Figura 9 (o QMPS ID do QMPS atual) e o ID de fonte são iguais (etapa S222). Neste momento, no caso onde o QMPS ID do QMPS atual e o ID de fonte são iguais, a seção de fixação 170 gera uma nova matriz de quantização como a matriz de quantização prefixada (etapa S223). Por outro lado, no caso onde o QMPS ID do QMPS atual e o ID de fonte não são iguais, o processo procede à etapa S224.
Na etapa S224, a seção de aquisição de parâmetro 160 adquire o tamanho de fonte de cópia e o tipo de fonte de cópia do QMPS (etapa S224). A seguir, a seção de fixação 170 copia a matriz de quantização especificada pelo ID de fonte, o tamanho de fonte de cópia e o tipo de fonte de cópia (etapa S225). A seguir, a seção de fixação 170 compara o tamanho de fonte de cópia ao tamanho da matriz de quantização a ser gerada (etapa S226). Neste momento, no caso onde o tamanho de fonte de cópia e o tamanho da matriz de quantização a ser gerada não são iguais, a seção de fixação 170 gera uma nova matriz de quantização interpolando ou dizimando elementos na matriz de quantização copiada, dependendo da diferença de tamanho (etapa S227).
Adicionalmente, a seção de aquisição de parâmetro 160 adquire o sinalizador residual do QMPS (etapa S228). A seguir, a seção de fixação 170 determina se ou não dados residuais estão presentes, de acordo com o valor do sinalizador residual (etapa S229). Neste momento, no caso onde dados residuais estão presentes, a seção de fixação 170 adiciona o erro residual à nova matriz de quantização gerada na etapa S223 ou etapas S225 a S227 (etapa S230). (3) Processo em modo de designação de eixo
A Figura 11 é um fluxograma ilustrando um exemplo de um fluxo detalhado de um processo em modo de designação de eixo na etapa S240 da Figura 9.
Se referindo à Figura 11, primeiro, a seção de aquisição de parâmetro 160 adquire o sinalizador de método de designação de um QMPS (etapa S241). A seguir, a seção de fixação 170 determina o método de designação de acordo com o valor do sinalizador de método de designação (etapa S242). Neste momento, o processo procede à etapa S243 no caso onde o método diferencial está designado. Por outro lado, o processo procede à etapa S246 no caso onde o método de interpolação está designado.
No caso do método diferencial, a seção de fixação 170 gera os valores dos elementos da matriz de quantização que correspondem ao eixo vertical, ao eixo horizontal e ao eixo diagonal, na base de dados de eixo de referência incluídos nos parâmetros de matriz de quantização (etapas S243, S244 e S245). Enquanto isso, no caso do método de interpolação, a seção de fixação 170 gera os valores dos elementos da matriz de quantização que correspondem aos quatro cantos, na base de dados de canto incluídos nos parâmetros de matriz de quantização (etapa S246). A seguir, a seção de fixação 170 gera através de interpolação os valores dos elementos ao longo dos eixos de referência (eixo vertical, eixo horizontal e eixo diagonal) que unem os quatro cantos (etapa S247). Depois disso, a seção de fixação 170 interpola os valores dos elementos restantes na base dos valores dos elementos ao longo dos eixos de referência (etapa S248).
Adicionalmente, a seção de aquisição de parâmetro 160 adquire o sinalizador residual do QMPS (etapa S249). A seguir, a seção de fixação 170 determina se ou não dados residuais estão presentes, de acordo com o valor do sinalizador residual (etapa S250). Neste momento, no caso onde dados residuais estão presentes, a seção de fixação 170 adiciona o erro residual à nova matriz de quantização gerada na etapa S248 (etapa S251). 4-2. Fixando matriz de quantização a pedaço
A Figura 12 é um fluxograma ilustrando um fluxo exemplar de um processo para fixar uma matriz de quantização a um pedaço pela seção de processamento de sintaxe 61 de acordo com a concretização presente. O processo na Figura 12 pode ser conduzido cada vez que um cabeçalho de pedaço é detectado no fluxo de dados de imagem.
Primeiro, a seção de aquisição de parâmetro 160 adquire o sinalizador de QMPS ID presente de um cabeçalho de pedaço (etapa S261). A seguir, a seção de aquisição de parâmetro 160 determina se ou não um QMPS ID está presente dentro do cabeçalho de pedaço, de acordo com o valor do sinalizador de QMPS ID presente (etapa S262). Neste momento, a seção de aquisição de parâmetro 160 adicionalmente adquire um QMPS ID de um QMPS no caso onde um QMPS ID está presente (etapa S263). A seção de fixação 170 então fixa a matriz de quantização gerada para o QMPS identificado pelo QMPS ID adquirido para pedaços seguindo esse cabeçalho de pedaço (etapa S264). Por outro lado, no caso onde um QMPS ID não está presente dentro do cabeçalho de pedaço, a seção de fixação 170 fixa uma matriz de quantização plana para pedaços seguindo esse cabeçalho de pedaço (etapa S265).
5. Exemplos de sintaxe 5-1. Primeiro exemplo
As Figuras 13 a 15 ilustram um primeiro exemplo de pseudocódigo ilustrativo expressando a sintaxe de um QMPS de acordo com a concretização presente. Números de linha são dados na borda esquerda do pseudocódigo. Também, uma variável sublinhada no pseudocódigo significa que o parâmetro correspondendo àquela variável está especificado dentro do QMPS.
A função QuantizationMatrixParameterSet () na linha 1 na Figura 13 é uma função que expressa a sintaxe de um único QMPS. Na linha 2 e linha 3, o QMPS ID (quantization_matrix_paramter_id) e o sinalizador de modo de geração presente (pred_present_flag) são especificados. A sintaxe subsequente da linha 6 à linha 56 volta para todo tamanho e tipo de matriz de quantização. A sintaxe da linha 7 à linha 53 na malha é inserida no QMPS no caso onde um modo de geração está presente (pred_present_flag=1).
A sintaxe da linha 9 à linha 16 no caso onde um modo de geração está presente é a sintaxe para modo de cópia. Da linha 9 à linha 11, o ID de fonte, tamanho de fonte de cópia e tipo de fonte de cópia são especificados. A função pred_matrix () na linha 12 significa que a matriz de quantização especificada pelo ID de fonte, tamanho de fonte de cópia, e tipo de fonte de cópia é para ser copiada. Na linha 13, o sinalizador residual é especificado. A função residual_matrix () na linha 15 significa que dados residuais estão especificados no QMPS no caso onde componentes residuais estão presentes.
A sintaxe da linha 18 à linha 50 é a sintaxe para modo de designação de eixo, e é descrita na Figura 14. Na linha 18, o sinalizador de método de designação é especificada. No caso onde o método de designação é o método diferencial (DPCM), os valores de elementos ao longo do eixo vertical são especificados da linha 21 à linha 25, enquanto os valores de elementos ao longo do eixo horizontal são especificados da linha 26 à linha 34, e os valores de elementos ao longo do eixo diagonal são especificados da linha 35 à linha 40. Os dados de eixo de referência neste caso são arranjos lineares de dados diferenciais de DPCM. Note que a sintaxe para elementos ao longo do eixo horizontal pode ser omitida no caso onde os valores de elementos ao longo do eixo horizontal podem ser copiados (linha 27, linha 28). No caso onde o método de designação é o método de interpolação, os valores dos elementos à esquerda superior (componente de CC), direita superior, esquerda inferior e direita inferior são especificados respectivamente como dados de canto da linha 42 à linha 45.
O processo na linha 52 é a sintaxe para o modo de varredura completa. O processo na linha 55 é a sintaxe para o caso onde um modo de geração não está presente. Em qualquer caso, uma matriz de quantização é especificada com o método de varredura completa por uma função qmatrix () que representa a sintaxe de matriz de quantização em H.264/AVC.
A função residual_matrix () na linha 1 na Figura 15 é uma função para especificar dados residuais usados na linha 15 na Figura 13 e linha 49 na Figura 14. No exemplo na Figura 15, dados residuais estão especificados por um método de DPCM ou um método de comprimento corrido. No caso do método de DPCM, o valor da diferença do último elemento (delta_coef) é especificado da linha 4 à linha 8 para todo elemento no arranjo linear. No caso do método de comprimento corrido, o comprimento de grupos de elemento em porções nas quais o valor é consecutivamente zero (corrida) e o valor de elementos não zero (dados) são especificados repetidamente da linha 11 à linha 18.
5-2. Segundo exemplo
As Figuras 16 a 20 ilustram um segundo exemplo de pseudocódigo ilustrativo expressando a sintaxe de um QMPS de acordo com a concretização presente.
A função QuantizationMatrixParameterSet () na linha 1 na Figura 16 é uma função que expressa a sintaxe de um único QMPS. Na linha 2, o QMPS ID (quantization_matrix_paramter_id) é especificado. Além disso, o sinalizador de modo de geração presente (pred_present_flag) é especificado na linha 6, exceto no caso onde só a matriz de quantização prefixada é designada.
Além disso, no segundo exemplo, quatro classes de escalas de quantização (Qscale0 a Qscale3) são especificadas da linha 7 à linha 10 na função QuantizationMatrixParameterSet (). Estas escalas de quantização são parâmetros que podem ser adotados a fim de quantizar o valor de cada elemento em uma matriz de quantização e ademais diminuir a taxa. Mais especificamente, quatro áreas de fixação de escala de quantização A1 a A4 como aquelas ilustradas na Figura 21 estão definidas em uma matriz de quantização 8x8, por exemplo. A área de fixação de escala de quantização A1 é uma área para o grupo de elemento correspondendo ao sinal de baixo alcance, incluindo o componente de CC. As áreas de fixação de escala de quantização A2 e A3 são áreas para os grupos de elemento que correspondem a sinais respectivos no alcance mediano. A área de fixação de escala de quantização A4 é uma área para o grupo de elemento correspondendo ao sinal de alto alcance. Uma escala de quantização para quantizar os valores de elementos na matriz de quantização pode ser fixada para cada uma destas áreas. Por exemplo, se referindo à Figura 22, a primeira escala de quantização (Qscale0) é “1” para a área de fixação de escala de quantização A1. Isto significa que valores na matriz de quantização não estão quantizados em grupos de elemento correspondendo ao sinal de baixo alcance. Enquanto isso, a segunda escala de quantização (Qscale1) é “2” para a área de fixação de escala de quantização A2. A terceira escala de quantização (Qscale2) é “3” para a área de fixação de escala de quantização A3. A quarta escala de quantização (Qscale3) é “4” para a área de fixação de escala de quantização A4. Quando a escala de quantização fica maior, o erro produzido por quantização aumenta. Tipicamente, porém, algum grau de erro é tolerável para o sinal de alto alcance. Consequentemente, em casos onde é desejável alcançar uma eficiência de codificação alta, a quantidade de códigos exigida para definir uma matriz de quantização pode ser reduzida efetivamente fixando tais escalas de quantização para quantizar a matriz de quantização, sem degradar grandemente a qualidade de imagem. Em casos onde uma matriz de quantização é quantizada, o valor de cada elemento nos dados residuais ou nos dados diferenciais ilustrados por exemplo na Figura 3 pode ser quantizado ou quantizado inversamente pelas etapas de quantização fixadas nas áreas de fixação de escala de quantização para qual cada elemento pertence substancialmente.
Nota que a disposição de áreas de fixação de escala de quantização ilustradas na Figura 21 é somente um exemplo. Por exemplo, números diferentes de áreas de fixação de escala de quantização também podem ser definidos para cada tamanho de matriz de quantização (por exemplo, mais áreas de fixação de escala de quantização podem ser definidas para tamanhos maiores). Também, as posições dos limites das áreas de fixação de escala de quantização não estão limitadas ao exemplo na Figura 21. Ordinariamente, o padrão de varredura ao linearizar uma matriz de quantização é uma varredura em ziguezague. Por esta razão, é preferível usar limites de área diagonais da direita superior à esquerda inferior, como ilustrado na Figura 21. Porém, limites de área seguindo ao longo da direção vertical ou da direção horizontal também podem ser usados, dependendo de fatores tais como correlação interelemento na matriz de quantização e o padrão de varredura em uso. Além disso, a disposição de áreas de fixação de escala de quantização (o número de áreas, as posições de limites, e similar) também pode ser selecionada adaptavelmente da perspectiva de eficiência de codificação. Por exemplo, um número menor de áreas de fixação de escala de quantização também pode ser selecionado no caso onde uma matriz de quantização quase plana está definida.
Na Figura 16, a sintaxe subsequente da linha 13 à linha 76 volta para todo tamanho e tipo de matriz de quantização. A sintaxe da linha 14 à linha 66 (veja Figura 18) na malha é inserida no QMPS no caso onde um modo de geração está presente (pred_present_flag=1).
A sintaxe da linha 16 à linha 22 no caso onde um modo de geração está presente é a sintaxe para modo de cópia. Da linha 16 à linha 18, o ID de fonte, tamanho de fonte de cópia, e tipo de fonte de cópia são especificados. Na linha 19, o sinalizador residual é especificado. A função residual_matrix () na linha 21 significa que dados residuais estão especificados no QMPS no caso onde componentes residuais estão presentes. Os dados residuais neste momento podem ser quantizados de acordo com os valores das quatro classes de escalas de quantização (Qscale0 a Qscale3) discutidas acima. A sintaxe da linha 23 à linha 56 é a sintaxe para modo de designação de eixo, e é descrita na Figura 17. Os dados residuais em modo de designação de eixo podem igualmente ser quantizados de acordo com os valores das quatro classes de escalas de quantização (Qscale0 a Qscale3) discutidas acima (linha 55).
A sintaxe da linha 57 à linha 66 na Figura 18 é a sintaxe para modo de varredura completa. Também, a sintaxe da linha 68 à linha 75 é a sintaxe para o caso no qual um modo de geração não está presente. Em qualquer caso, uma matriz de quantização é especificada com o método de varredura completa pela função qmatrix (). Porém, no segundo exemplo, tabelas de VLC para dados diferenciais de codificação de entropia (delta_coef) no método de DPCM ou valores de corrida (corrida) e valores de elemento não zero (dados) no método de comprimento corrido estão trocados adaptavelmente para ademais elevar a eficiência de codificação. O vlc_table_data na linha 61 e linha 71 especificam o número de tabela de uma tabela de VLC selecionada para os dados diferenciais (delta_coef) no método de DPCM ou os valores de elemento não zero (dados) no método de comprimento corrido. O vlc_table_run na linha 63 e linha 73 especificam o número de tabela de uma tabela de VLC selecionada para os valores de corrida (corrida) no método de comprimento corrido.
A função qmatrix () na linha 1 da Figura 19 é a sintaxe para especificar uma matriz de quantização com o método de varredura completa. Linha 3 à linha 8 na Figura 19 indicam a sintaxe para o método de DPCM, e os dados diferenciais (delta_coef) na linha 5 são codificados usando a tabela de VLC especificada por vlc_table_data discutido acima. Também, linha 10 à linha 21 indicam a sintaxe para o método de comprimento corrido, e os valores corridos (corrida) na linha 12 são codificados usando a tabela de VLC especificada por vlc_table_run discutido acima. Os valores de elemento não zero (dados) na linha 13 são codificados usando a tabela de VLC especificada por vlc_table_data discutido acima.
A Figura 23 ilustra listas de palavra-código em 11 classes de tabelas de codificação de comprimento variável (VLC) selecionáveis em um método de codificação de entropia de complexidade baixa (LCEC). O “x” em cada palavra- código na Figura 23 é um dado sufixo. Por exemplo, se um valor de “15” for codificado com codificação de Exp-Golomb, uma palavra-código 9 bits de “000010000” é obtida, mas se esse valor for codificado com VLC4, uma palavra- código de 5 bits de “11111” é obtida. Deste modo, a eficiência de codificação pode ser elevada selecionando uma tabela de VLC tendo sufixos em resumo com números maiores de dígitos em palavras-código curtas no caso de codificar muitos valores maiores. Entre as 11 classes de tabelas de VLC na Figura 23, VLC4 por exemplo tem sufixos de 4 dígitos em palavras-código de 5 bits. Também, VLC9 tem sufixos de 4 dígitos em palavras-código de 6 bits. Consequentemente, estas tabelas de VLC são adequadas no caso de codificar muitos valores maiores.
Retornando à sintaxe de matriz de quantização, desde que os dados diferenciais de um arranjo linear de uma matriz de quantização têm muitos zeros consecutivos, os valores corridos no método de comprimento corrido produzem muitos valores maiores, em lugar de valores pequenos tais como 0, 1 ou 2. Por outro lado, os valores de elemento não zero e os valores de dados diferenciais no método de comprimento corrido produzem valores grandes só raramente. Consequentemente, trocando a tabela de VLC para cada método de designação de dados diferenciais (DPCM/comprimento corrido) e a classe de valor (corrido/elemento não zero no caso do método de comprimento corrido) como com a sintaxe discutida acima, a quantidade de códigos exigida para definir uma matriz de quantização é reduzida significativamente.
A função residual_matrix () na linha 1 da Figura 20 também implementa troca adaptável de tabelas de VLC. Em outras palavras, o vlc_table_data na linha 7 especifica o número de tabela de uma tabela de VLC selecionada para os dados diferenciais (delta_coef) no método de DPCM. Os dados diferenciais (delta_coef) na linha 10 são codificados usando a tabela de VLC especificada na linha 7. O vlc_table_data na linha 15 especifica o número de tabela de uma tabela de VLC selecionada para os valores de elemento não zero (dados) no método de comprimento corrido. O vlc_table_run na linha 16 especifica o número de tabela de uma tabela de VLC selecionada para os valores corridos (corrido) no método de comprimento corrido. Os valores corridos (corrido) na linha 19 são codificados usando a tabela de VLC especificada por vlc_table_run discutida acima. Os valores de elemento não zero (dados) na linha 20 são codificados usando a tabela de VLC especificada por vlc_table_data discutida acima.
De acordo com as várias características de uma tal sintaxe de QMPS, a quantidade de códigos exigida para definir uma matriz de quantização é reduzida efetivamente, e a eficiência de codificação pode ser melhorada. Porém, a sintaxe descrita nesta seção é somente um exemplo. Em outras palavras, parte da sintaxe ilustrada por exemplo aqui pode ser reduzida ou omitida, a sequência de parâmetros pode ser mudada, ou outros parâmetros podem ser adicionados à sintaxe. Também, várias das características da sintaxe descritas nesta seção também pode ser implementadas ao definir uma matriz de quantização no SPS ou PPS em lugar de o QMPS. Em tais casos, é possível reduzir a quantidade de códigos exigida para definir uma matriz de quantização no SPS ou PPS.
6. Várias configurações exemplares de conjuntos de parâmetro
O antecedente descreve vários exemplos específicos da sintaxe para um conjunto de parâmetro de matriz de quantização (QMPS) que armazena parâmetros de matriz de quantização. O QMPS substancialmente pode ser um conjunto de parâmetro dedicado contendo parâmetros de matriz de quantização somente, mas também pode ser um conjunto de parâmetro comum que também contém outros parâmetros relativos a ferramentas de codificação diferentes de matrizes de quantização. Por exemplo, “Adaptation Parameter Set (APS)” (JCTVC-F747r3, Equipe Colaboradora Conjunta sobre Codificação de Vídeo (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11 6a Reunião: Torino, IT, 14-22 julho, 2011) introduz um novo conjunto de parâmetro chamado o conjunto de parâmetro de adaptação (APS), e propõe armazenar parâmetros relativos ao filtro de malha adaptável (ALF) e a compensação adaptável de amostra (SAO) no APS. Adicionalmente incluindo parâmetros de matriz de quantização em um tal APS, também é possível configurar substancialmente o QMPS discutido acima. Assim, nesta seção, várias técnicas para configurar o QMPS usando o APS proposto por “Adaptation Parameter Set (APS)” (JCTVC- F747r3) serão descritas.
6-1. Primeira técnica A primeira técnica é uma técnica que lista todos os parâmetros visados dentro de um APS, e referencia cada parâmetro usando um APS ID, um identificador que identifica exclusivamente esse APS. Figura 24 ilustra um exemplo de um fluxo codificado configurado de acordo com a primeira técnica.
Se referindo à Figura 24, um SPS 801, um PPS 802 e um APS 803 são inseridos ao começo de uma imagem parada P0 posicionada ao começo de uma sequência. O PPS 802 é identificado pelo PPS ID “P0”. O APS 803 é identificado pelo APS ID “A0”. O APS 803 inclui parâmetros relacionados a ALF, parâmetros relacionados a SAO, e parâmetros de matriz de quantização (em seguida parâmetros relacionados a QM designados). Um cabeçalho de pedaço 804 anexado a dados de pedaço dentro da imagem parada P0 inclui um PPS ID de referência “P0”, e isto significa que parâmetros dentro do PPS 802 são referenciados a fim de decodificar esses dados de pedaço. Semelhantemente, o cabeçalho de pedaço 804 inclui uma APS ID de referência “A0”, e isto significa que parâmetros dentro do APS 803 são referenciados a fim de decodificar esses dados de pedaço.
Um APS 805 é inserido em uma imagem parada P1 seguindo a imagem parada P0. O APS 805 é identificado pelo APS ID “A1”. O APS 805 inclui parâmetros relacionados a ALF, parâmetros relacionados a SAO, e parâmetros relacionados a QM. Os parâmetros relacionados a ALF e os parâmetros relacionados a SÃO incluídos no APS 805 foram atualizados do APS 803, mas os parâmetros relacionados a QM não foram atualizados. Um cabeçalho de pedaço 806 anexado a dados de pedaço dentro da imagem parada P1 inclui um APS ID de referência “A1”, e isto significa que parâmetros dentro do APS 805 são referenciados a fim de decodificar esses dados de pedaço.
Um APS 807 é inserido em uma imagem parada P2 seguindo a imagem parada P1. O APS 807 é identificado pelo APS ID “A2”. O APS 807 inclui parâmetros relacionados a ALF, parâmetros relacionados a SAO, e parâmetros relacionados a QM. Os parâmetros relacionados a ALF e os parâmetros relacionados a QM incluídos no APS 807 foram atualizados do APS 805, mas os parâmetros relacionados a SÃO não foram atualizados. Um cabeçalho de pedaço 808 anexado a dados de pedaço dentro da imagem parada P2 inclui um APS ID de referência “A2”, e isto significa que parâmetros dentro do APS 807 são referenciados a fim de decodificar esses dados de pedaço.
A Figura 25 ilustra um exemplo de sintaxe de APS definida de acordo com a primeira técnica. Na linha 2 na Figura 25, um APS ID para identificar exclusivamente esse APS é especificado. O APS ID é um identificador de conjunto de parâmetro usado em vez do QMPS ID descrito usando a Figura 3. Os parâmetros relacionados a ALF são especificados na linha 13 à linha 17. Os parâmetros relacionados a SAO são especificados na linha 18 a linha 23. Os parâmetros relacionados a QM são especificados na linha 24 à linha 28. O “aps_qmatrix_flag” na linha 24 é um sinalizador de matriz de quantização presente indicando se parâmetros relacionados a QM estão fixados dentro desse APS. O “qmatrix_param ()” na linha 27 é uma função especificando parâmetros de matriz de quantização como ilustrado por exemplo nas Figuras 13 a 20. No caso onde o sinalizador de matriz de quantização presente na linha 24 indica que parâmetros relacionados a QM estão fixados dentro desse APS (aps_qmatrix_flag=1), a função qmatrix_param () pode ser usada para fixar parâmetros de matriz de quantização dentro desse APS.
No caso de implementar a primeira técnica, a seção de aquisição de parâmetro 160 ilustrada na Figura 8 determina se parâmetros de matriz de quantização estão fixados dentro de um APS referenciando o sinalizador de matriz de quantização presente incluída nesse APS. A seção de aquisição de parâmetro 160 então adquire os parâmetros de matriz de quantização do APS no caso onde parâmetros de matriz de quantização estão fixados dentro desse APS.
A Figura 26 é um diagrama explicativo ilustrando um exemplo de sintaxe de cabeçalho de pedaço definida conforme a primeira técnica. Na linha 5 na Figura 26, é especificado um PPS ID de referência para referenciar parâmetros incluídos no PPS dentre os parâmetros a serem fixados para esse pedaço. Na linha 8, é especificado um APS ID de referência para parâmetros de referência incluídos no APS dentre os parâmetros a serem fixados para esse pedaço. O APS ID de referência é um parâmetro de referência usado em vez do (referência) QMPS ID descrito usando a Figura 4.
De acordo com a primeira técnica, estendendo o APS proposto por “Adaptation Parameter Set (APS)” (JCTVC-F747r3), é possível realizar o conjunto de parâmetro de matriz de quantização discutido mais cedo a pouco custo. Além disso, fica possível usar um sinalizador de matriz de quantização presente para atualizar parcialmente só os parâmetros de matriz de quantização dentre os parâmetros relativos a várias ferramentas de codificação potencialmente incluídas no APS, ou alternativamente, parcialmente não atualizar só os parâmetros de matriz de quantização. Em outras palavras, desde que é possível só incluir parâmetros de matriz de quantização no APS só quando atualizar a matriz de quantização fica necessário, parâmetros de matriz de quantização podem ser transmitidos eficientemente dentro do APS.
6-2. Modificação exemplar da primeira técnica Uma técnica conforme a modificação exemplar descrita abaixo também pode ser implementada a fim de ademais reduzir a quantidade de códigos de parâmetros de matriz de quantização dentro do APS.
A Figura 27 ilustra um exemplo de sintaxe de APS definida de acordo com uma modificação exemplar da primeira técnica. Na sintaxe ilustrada na Figura 27, os parâmetros relacionados a QM são especificados na linha 24 à linha 33. O “aps_qmatrix_flag” na linha 24 é um sinalizador de matriz de quantização presente indicando se parâmetros relacionados a QM estão fixados dentro desse APS. O “ref_aps_id_present_flag” na linha 25 é um sinalizador de ID de referência passado presente indicando se um ID de referência passado é para ser usado como o parâmetro relacionado a QM nesse APS. No caso onde o sinalizador de ID de referência passado presente indica que um ID de referência passado é para ser usado (ref_aps_id_present_flag=1), um ID de referência passado “ref_aps_id” é fixado na linha 27. O ID de referência passado é um identificador para referenciar o APS ID de um APS codificado ou decodificado antes do APS atual. No caso onde um ID de referência passado é usado, parâmetros de matriz de quantização não são fixados dentro do APS de fonte de referência (posterior). Neste caso, a seção de fixação 170 ilustrada na Figura 8 reutiliza as matrizes de quantização fixadas na base dos parâmetros de matriz de quantização no APS visado de referência indicado pelo ID de referência passado como matrizes de quantização correspondendo ao APS de fonte de referência. Note que um ID de referência passado referenciando o APS ID de um APS de fonte de referência (o que é chamado autorreferência) pode ser proibido. Ao invés, a seção de fixação 170 pode fixar a matriz de quantização prefixada como a matriz de quantização correspondendo ao APS de autorreferência. No caso onde um ID de referência passado não é usado (ref_aps_id_present_flag=0), a função “qmatrix_param ()” na linha 31 pode ser usada para fixar parâmetros de matriz de quantização dentro desse APS.
Deste modo, usando um ID de referência passado para reutilizar matrizes de quantização já codificadas ou decodificadas, fixar repetidamente os mesmos parâmetros de matriz de quantização dentro de APSs é evitado. Assim, a quantidade de códigos de parâmetros de matriz de quantização dentro do APS pode ser reduzida. Note que embora a Figura 27 ilustre um exemplo no qual o APS ID é usado a fim de referenciar um APS passado, o meio de referenciar um APS passado não está limitado a um tal exemplo. Por exemplo, outro parâmetro tal como o número de APSs entre o APS de fonte de referência e o APS visado de referência também pode ser usado a fim de referenciar um APS passado. Também, em vez de usar o sinalizador de ID de referência passado presente, a referência de um APS passado e a fixação de novos parâmetros de matriz de quantização podem ser trocados dependendo de se ou não o ID de referência passado indica um dado valor (menos um, por exemplo). 6-3. Segunda técnica
A segunda técnica é uma técnica que armazena parâmetros em APSs diferentes (unidades de NAL diferentes) para cada classe de parâmetro, e referencia cada parâmetro usando um APS ID que identifica exclusivamente cada APS. Figura 28 ilustra um exemplo de um fluxo codificado configurado de acordo com a segunda técnica.
Se referindo à Figura 28, um SPS 811, um PPS 812, um APS 813a, um APS 813b e um APS 813c são inseridos ao começo de uma imagem parada P0 posicionada ao começo de uma sequência. O PPS 812 é identificado pelo PPS ID “P0”. O APS 813a é um APS para parâmetros relacionados a ALF, e é identificado pelo APS ID “A00”. O APS 813b é um APS para parâmetros relacionados a SÃO, e é identificado pelo APS ID “A10”. O APS 813c é um APS para parâmetros relacionados a QM, e é identificado pelo APS ID “A20”. Um cabeçalho de pedaço 814 anexado a dados de pedaço dentro da imagem parada P0 inclui um PPS ID de referência “P0”, e isto significa que parâmetros dentro do PPS 812 são referenciados a fim de decodificar esses dados de pedaço. Semelhantemente, o cabeçalho de pedaço 814 inclui um APS_ALF ID de referência “A00”, um APS_SAO ID de referência “A10”, e um APS_QM ID de referência “A20”, e estes significam que parâmetros dentro dos APSs 813a, 813b, e 813c são referenciados a fim de decodificar esses dados de pedaço.
Um APS 815a e um APS 815b são inseridos em uma imagem parada P1 seguindo a imagem parada P0. O APS 815a é um APS para parâmetros relacionados a ALF, e é identificado pelo APS ID “A01”. O APS 815b é um APS para parâmetros relacionados a SAO, e é identificado pelo APS ID “A11”. Desde que os parâmetros relacionados a QM não estão atualizados da imagem parada P0, um APS para parâmetros relacionados a QM não é inserido. Um cabeçalho de pedaço 816 anexado a dados de pedaço dentro da imagem parada P1 inclui um APS_ALF ID de referência “A01”, um APS_SAO ID de referência “A11”, e um APS_QM ID de referência “A20”. Estes significam que parâmetros dentro dos APSs 815a, 815b e 813c são referenciados a fim de decodificar esses dados de pedaço.
Um APS 817a e um APS 817c são inseridos em uma imagem parada P2 seguindo a imagem parada P1. O APS 817a é um APS para parâmetros relacionados a ALF, e é identificado pelo APS ID “A02”. O APS 817c é um APS para parâmetros relacionados a QM, e é identificado pelo APS ID “A21”. Desde que os parâmetros relacionados a SAO não estão atualizados da imagem parada
P1, um APS para parâmetros relacionados a SAO não é inserido. Um cabeçalho de pedaço 818 anexado a dados de pedaço dentro da imagem parada P2 inclui um APS_ALF ID de referência “A02”, um APS_SAO ID de referência “A11”, e um APS_QM ID de referência “A21”. Estes significam que parâmetros dentro dos APSs 817a, 815b e 817c são referenciados a fim de decodificar esses dados de pedaço.
O APS para parâmetros relacionados a QM na segunda técnica (os APSs 813c e 817c, por exemplo) é substancialmente igual ao QMPS discutido mais cedo. O APS ID do APS para parâmetros relacionados a QM é usado em vez do QMPS ID descrito usando a Figura 3. De acordo com a segunda técnica, desde que APSs diferentes são usados para cada classe de parâmetros, a transmissão de parâmetros redundantes não é conduzida para parâmetros que não requerem atualização. Por esta razão, a eficiência de codificação pode ser otimizada. Porém, com a segunda técnica, quando as classes de parâmetros a serem incorporadas no APS aumentam, há um aumento nas classes de tipos de unidade de NAL (nal_unit_type), um identificador para identificar classes de APSs. Na especificação padrão de HEVC, há um número limitado de tipos de unidade de NAL (nal_unit_type) reservado para extensões. Consequentemente, é benéfico considerar uma estrutura que evita gastar muitos tipos de unidade de NAL para APSs.
6-4. Terceira técnica A terceira técnica é uma técnica que incorpora parâmetros de matriz de quantização e outros parâmetros no APS, e agrupa estes parâmetros por identificadores individuais definidos separadamente do APS ID. Nesta especificação, este identificador nomeado a cada grupo e definido separadamente do APS ID é chamado o subidentificador (SUB ID). Cada parâmetro é referenciado usando o subidentificador no cabeçalho de pedaço. Figura 29 ilustra um exemplo de um fluxo codificado configurado de acordo com a terceira técnica.
Se referindo à Figura 29, um SPS 821, um PPS 822 e um APS 823 são inseridos ao começo de uma imagem parada P0 posicionada ao começo de uma sequência. O PPS 822 é identificado pelo PPS ID “P0”. O APS 823 inclui parâmetros relacionados a ALF, parâmetros relacionados a SAO, e parâmetros relacionados a QM. Os parâmetros relacionados a ALF pertencem a um grupo, e são identificados por um SUB_ALF ID “AA0”, um subidentificador para ALF. Os parâmetros relacionados a SAO pertencem a um grupo, e são identificados por um SUB_SAO ID “AS0”, um subidentificador para SAO. Os parâmetros relacionados a QM pertencem a um grupo, e são identificados por um SUB_QM ID “AQ0”, um subidentificador para QM. Um cabeçalho de pedaço 824 anexado a dados de pedaço dentro da imagem parada P0 inclui um SUB_ALF ID de referência “AA0”, um SUB_SAO ID de referência “AS0”, e um SUB_QM ID de referência “AQ0”. Estes significam parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA0”, os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS0”, e os parâmetros relacionados a QM pertencendo ao SUB_QM ID” AQ0” são referenciados a fim de decodificar esses dados de pedaço.
Um APS 825 é inserido em uma imagem parada P1 seguindo a imagem parada P0. O APS 825 inclui parâmetros relacionados a ALF e parâmetros relacionados a SAO. Os parâmetros relacionados a ALF são identificados por um SUB_ALF ID “AA1”. Os parâmetros relacionados a SAO são identificados por um SUB_SAO ID “AS1”. Desde que os parâmetros relacionados a QM não estão atualizados da imagem parada P0, parâmetros relacionados a QM não são incluídos no APS 825. Um cabeçalho de pedaço 826 anexado a dados de pedaço dentro da imagem parada P1 inclui um SUB_ALF ID de referência “AA1”, um SUB_SAO ID de referência “AS1”, e um SUB_QM ID de referência “AQ0”. Estes significam parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA1” e os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS1” dentro do APS 825, como também os parâmetros relacionados a QM pertencendo ao SUB_QM ID “AQ0” dentro do APS 823, são referenciados a fim de decodificar esses dados de pedaço.
Um APS 827 é inserido em uma imagem parada P2 seguindo a imagem parada P1. O APS 827 inclui parâmetros relacionados a ALF e parâmetros relacionados a QM. Os parâmetros relacionados a ALF são identificados por um SUB_ALF ID “AA2”. Os parâmetros relacionados a QM são identificados por um SUB_QM ID “AQ1”. Desde que os parâmetros relacionados a SAO não estão atualizados da imagem parada P1, parâmetros relacionados a SAO no APS 827 não são incluídos. Um cabeçalho de pedaço 828 anexado a dados de pedaço dentro da imagem parada P2 inclui um SUB_ALF ID de referência “AA2”, um SUB_SAO ID de referência “AS1”, e um SUB_QM ID de referência “AQ1”. Estes parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA2” e os parâmetros relacionados a QM pertencendo ao SUB_QM ID “AQ1” dentro do APS 827, como também os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS1” dentro do APS 825, são referenciados a fim de decodificar esses dados de pedaço.
A Figura 30 ilustra um exemplo de sintaxe de APS definida de acordo com a terceira técnica. Na linha 2 à linha 4 da Figura 30, três sinalizadores de grupo presente “aps_adaptive_loop_filter_flag”, “aps_sample_adaptive_offset_flag” e “aps_qmatrix_flag” são especificadas. Os sinalizadores de grupo presente indicam se ou não parâmetros pertencendo aos grupos respectivos estão incluídos nesse APS. Embora o APS ID seja omitido da sintaxe no exemplo na Figura 30, um APS ID para identificar esse APS também pode ser adicionado dentro da sintaxe. Os parâmetros relacionados a ALF são especificados na linha 12 à linha 17. O “sub_alf_id” na linha 13 é um subidentificador para ALF. Os parâmetros relacionados a SAO são especificados na linha 18 à linha 24. O “sub_sao_id” na linha 19 é um subidentificador para SAO. Os parâmetros relacionados a QM são especificados na linha 25 à linha 30. O “sub_qmatrix_id” na linha 26 é um subidentificador para QM. O “qmatrix_param ()” na linha 29 é uma função especificando parâmetros de matriz de quantização como ilustrado por exemplo nas Figuras 13 a 20.
A Figura 31 é um diagrama explicativo ilustrando um exemplo de sintaxe de cabeçalho de pedaço definida conforme a terceira técnica. Na linha 5 na Figura 31, é especificado um PPS ID de referência para referenciar parâmetros incluídos no PPS dentre os parâmetros a serem fixados para esse pedaço. Na linha 8, é especificado um SUB_ALF ID de referência para referenciar parâmetros relacionados a ALF dentre os parâmetros a serem fixados para esse pedaço. Na linha 9, é especificado um SUB_SAO ID de referência para referenciar parâmetros relacionados a SAO dentre os parâmetros a serem fixados para esse pedaço. Na linha 10, é especificado um SUB_QM ID de referência para referenciar parâmetros relacionados a QM dentre os parâmetros a serem fixados para esse pedaço.
No caso de implementar a terceira técnica, a seção geradora de parâmetro 130 da seção de processamento de sintaxe 13 do dispositivo de codificação de imagem 10 anexa um novo SUB_QM ID como um subidentificador para um grupo atualizado de parâmetros de matriz de quantização toda vez que os parâmetros de matriz de quantização são atualizados. A seção de inserção 130 então insere os parâmetros de matriz de quantização com o SUB_QM ID anexado no APS, junto com outros parâmetros. A seção de aquisição de parâmetro 160 da seção de processamento de sintaxe 61 do dispositivo de decodificação de imagem 60 usa o SUB_QM ID de referência designado no cabeçalho de pedaço para adquirir, de um APS, parâmetros de matriz de quantização a serem fixados para cada pedaço.
De acordo com a terceira técnica, parâmetros são agrupados dentro do APS usando subidentificadores, e a transmissão de parâmetros redundantes não é conduzida para parâmetros em grupos que não requerem atualização. Por esta razão, a eficiência de codificação pode ser otimizada. Também, desde que as classes de APSs não aumentam até mesmo se as classes de parâmetros aumentarem, números grandes de tipos de unidade de NAL não são gastos como com a segunda técnica discutida mais cedo. Consequentemente, a terceira técnica não compromete a flexibilidade de extensões futuras.
No exemplo nas Figuras 29 a 31, parâmetros incluídos no APS são agrupados de acordo com ferramentas de codificação relativas a ALF, SAO e QM. Porém, este é somente um exemplo de agrupar parâmetros. O APS também pode incluir parâmetros relativos a outras ferramentas de codificação. Por exemplo, parâmetros relacionados a AIF tais como coeficientes de filtro para um filtro de interpolação adaptável (AIF) são um exemplo de parâmetros que podem ser incorporados no APS. Em seguida, vários critérios para agrupar parâmetros a serem incorporados no APS serão discutidos com referência à Figura 32.
A tabela ilustrada na Figura 32 lista “Conteúdos de parâmetro”, “Frequência de atualização”, e “Tamanho de dados “como características de parâmetros respectivos em ferramentas de codificação típicas.
O filtro de malha adaptável (ALF) é um filtro (tipicamente um filtro de Wiener) que filtra bidimensionalmente uma imagem decodificada com coeficientes de filtro que são determinados adaptavelmente de modo a minimizar o erro entre a imagem decodificada e a imagem original. Parâmetros relacionados a ALF incluem coeficientes de filtro a serem aplicados a cada bloco, e um sinalizador de ativo/inativo para cada unidade de codificação (CU). O tamanho de dados de coeficientes de filtro de ALF é extremamente grande comparado a outras classes de parâmetros. Por esta razão, parâmetros relacionados a ALF são transmitidos ordinariamente para imagens paradas I de alta taxa, enquanto a transmissão de parâmetros relacionados a ALF pode ser omitida para imagens paradas B de baixa taxa. Isto é porque transmitir parâmetros relacionados a ALF com um tamanho de dados grande para imagens paradas de baixa taxa é ineficiente de uma perspectiva de ganho. Na maioria dos casos, coeficientes de filtra de ALF variam para cada imagem parada. Desde que os coeficientes de filtro dependem do conteúdo de imagem, a probabilidade de poder reutilizar coeficientes de filtro fixados previamente é baixa.
A compensação adaptável de amostra (SAO) é uma ferramenta que melhora a qualidade de imagem de uma imagem decodificada adicionando um valor de compensação determinado adaptavelmente a cada valor de pixel em uma imagem decodificada. Parâmetros relacionados a SAO incluem padrões de compensação e valores de compensação. O tamanho de dados de parâmetros relacionados a SAO não é tão grande quanto parâmetros relacionados a ALF. Parâmetros relacionados a SAO variam igualmente para cada imagem parada como regra geral. Porém, desde que parâmetros relacionados a SAO têm a propriedade de não mudar muito até mesmo se o conteúdo de imagem mudar ligeiramente, há uma possibilidade de poder reutilizar valores de parâmetro fixados previamente.
A matriz de quantização (QM) é uma matriz cujos elementos são escalas de quantização usadas ao quantizar coeficientes de transformada transformados de dados de imagem através de transformada ortogonal. Parâmetros relacionados a QM, ou em outras palavras parâmetros de matriz de quantização, são como descritos em detalhes nesta especificação. O tamanho de dados de parâmetros relacionados a QM é maior do que parâmetros relacionados a SAO. A matriz de quantização é requerida para todos as imagens paradas como regra geral, mas não exige necessariamente atualização para todas imagem parada se o conteúdo de imagem não mudar grandemente. Por esta razão, a matriz de quantização pode ser reutilizada para os mesmos tipos de imagem parada (tais como imagens paradas I/P/B), ou para cada GOP.
O filtro de interpolação adaptável (AIF) é uma ferramenta que varia adaptavelmente os coeficientes de filtro de um filtro de interpolação usado durante compensação de movimento para cada posição de subpixel. Parâmetros relacionados a AIF incluem coeficientes de filtro para posições de subpixel respectivas. O tamanho de dados de parâmetros relacionados a AIF é pequeno comparado às três classes de parâmetros anteriores. Parâmetros relacionados a AIF variam para cada imagem parada como regra geral. Porém, desde que os mesmos tipos de imagem parada tendem a ter propriedades de interpolação semelhantes, parâmetros relacionados a AIF podem ser reutilizados para os mesmos tipos de imagem parada (tais como imagens paradas I/P/B).
Na base das qualidades de parâmetro anteriores, os três critérios seguintes, por exemplo, podem ser adotados para o propósito de agrupar parâmetros incluídos no APS: Critério A) Agrupar de acordo com ferramenta de codificação Critério B) Agrupar de acordo com frequência de atualização Critério C) Agrupar de acordo com probabilidade de reuso de parâmetro Critério A é um critério que agrupa parâmetros de acordo com suas ferramentas de codificação relacionadas. A estrutura de conjunto de parâmetro ilustrada por exemplo nas Figuras 29 a 31 está com base em critério A. Desde que as qualidades de parâmetros são geralmente determinadas de acordo com suas ferramentas de codificação relacionadas, agrupar parâmetros por ferramenta de codificação torna possível fazer atualizações de parâmetro oportunas e eficientes de acordo com as várias qualidades dos parâmetros.
Critério B é um critério que agrupa parâmetros de acordo com sua frequência de atualização. Como ilustrado na Figura 32, parâmetros relacionados a ALF, parâmetros relacionados a SAO e parâmetros relacionados a AIF todos podem ser atualizados a toda imagem parada como regra geral. Assim, estes parâmetros podem ser agrupados em um único grupo enquanto parâmetros relacionados a QM são agrupados em outro grupo, por exemplo. Neste caso, há menos grupos comparados a critério A. Como resultado, também há menos subidentificadores para especificar no cabeçalho de pedaço, e a quantidade de códigos do cabeçalho de pedaço pode ser reduzida. Enquanto isso, desde que as frequências de atualização de parâmetros pertencendo ao mesmo grupo se assemelham entre si, a probabilidade de transmitir redundantemente parâmetros não atualizados a fim de atualizar outros parâmetros é mantida baixa. Critério A é um critério que agrupa parâmetros de acordo com a probabilidade de reuso de parâmetro. Embora parâmetros relacionados a ALF serão improvavelmente reutilizados parâmetros relacionados a SAO e parâmetros relacionados a AIF são pouco prováveis serem reutilizados. Com parâmetros relacionados a QM, os parâmetros são altamente prováveis serem reutilizados através de múltiplas imagens paradas. Consequentemente, agrupando parâmetros de acordo com sua probabilidade de reuso deste modo, a transmissão redundante de parâmetros reutilizados dentro do APS pode ser evitada.
6-5. Modificação exemplar da terceira técnica Com a terceira técnica discutida acima, o número de grupos nos quais parâmetros são agrupados dentro dos resultados de APS em um número igual de SUB IDs de referência especificados nos cabeçalhos de pedaço, como ilustrado por exemplo na Figura 31. A quantidade de códigos requerida pelos SUB IDs de referência é aproximadamente proporcional ao produto do número de cabeçalhos de pedaço e o número de grupos. Uma técnica conforme a modificação exemplar descrita abaixo também pode ser implementada a fim de ademais reduzir uma tal taxa.
Na modificação exemplar da terceira técnica, um ID de combinação associado com uma combinação de subidentificadores está definida dentro do APS ou outro conjunto de parâmetro. Parâmetros incluídos dentro do APS podem então ser referenciados de um cabeçalho de pedaço pelo ID de combinação. Figura 33 ilustra um exemplo de um fluxo codificado configurado de acordo com uma tal modificação exemplar da terceira técnica.
Se referindo à Figura 33, um SPS 831, um PPS 832 e um APS 833 são inseridos ao começo de uma imagem parada P0 posicionado ao começo de uma sequência. O PPS 832 é identificado pelo PPS ID “P0”. O APS 833 inclui parâmetros relacionados a ALF, parâmetros relacionados a SAO, e parâmetros relacionados a QM. Os parâmetros relacionados a ALF são identificados por um SUB_ALF ID “AA0”. Os parâmetros relacionados a SAO são identificados por um SUB_SAO ID “AS0”. Os parâmetros relacionados a QM são identificados por um SUB_QM ID “AQ0”. Adicionalmente, o APS 833 inclui um ID de combinação “C00”={AA0, AS0, AQ0} como uma definição de uma combinação. Um cabeçalho de pedaço 834 anexado a dados de pedaço na imagem parada P0 inclui o ID de combinação “C00”. Isto significa que os parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA0”, os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS0”, e os parâmetros relacionados a QM pertencendo ao SUB_QM ID “AQ0” que estão associados respectivamente com o ID de combinação “C00” são referenciados a fim de decodificar esses dados de pedaço.
Um APS 835 é inserido em uma imagem parada P1 seguindo a imagem parada P0. O APS 835 inclui parâmetros relacionados a ALF e parâmetros relacionados a SAO. Os parâmetros relacionados a ALF são identificados por um SUB_ALF ID “AA1”. Os parâmetros relacionados a SAO são identificados por um SUB_SAO ID “AS1”. Desde que os parâmetros relacionados a QM não estão atualizados da imagem parada P0, parâmetros relacionados a QM não são incluídos no APS 835. Adicionalmente, o APS 835 inclui um ID de combinação “C01”={AA1, AS0, AQ0}, um ID de combinação “C02”={AA0, AS1, AQ0} e um ID de combinação “C03”={AA1, AS1, AQ0} como definições de combinações. Um cabeçalho de pedaço 836 anexado a dados de pedaço na imagem parada P1 inclui o ID de combinação “C03”. Isto significa que os parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA1”, os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS1”, e os parâmetros relacionados a QM pertencendo ao SUB_QM ID “AQ0” que estão associados respectivamente com o ID combinação de “C03” são referenciados a fim de decodificar esses dados de pedaço.
Um APS 837 é inserido em uma imagem parada P2 seguindo a imagem parada P1. O APS 837 inclui parâmetros relacionados a ALF. Os parâmetros relacionados a ALF são identificados por um SUB_ALF ID “AA2”. Desde que os parâmetros relacionados a SAO e os parâmetros relacionados a QM não estão atualizados da imagem parada P1, parâmetros relacionados a SAO e parâmetros relacionados a QM não são incluídos no APS 837. Adicionalmente, o APS 837 inclui um ID de combinação “C04”={AA2, AS0, AQ0} e um ID de combinação “C05”={AA2, AS1, AQ0} como definições de combinações. Um cabeçalho de pedaço 838 anexado a dados de pedaço na imagem parada P2 inclui o ID de combinação “C05”. Isto significa que os parâmetros relacionados a ALF pertencendo ao SUB_ALF ID “AA2”, os parâmetros relacionados a SAO pertencendo ao SUB_SAO ID “AS1”, e os parâmetros relacionados a QM pertencendo ao SUB_QM ID “AQ0” que estão associados respectivamente com o ID de combinação “C05” são referenciados a fim de decodificar esses dados de pedaço.
Note que nesta modificação exemplar, IDs de combinação podem não ser definidos para todas as combinações de subidentificadores, tal que IDs de combinação sejam definidos só para as combinações de subidentificadores realmente referenciados em um cabeçalho de pedaço. Também, combinações de subidentificadores podem ser definidas dentro de um APS diferente do APS onde os parâmetros correspondentes estão armazenados.
No caso de implementar esta modificação exemplar, a seção geradora de parâmetro 130 da seção de processamento de sintaxe 13 do dispositivo de codificação de imagem 10 gera IDs de combinação como parâmetros suplementares, que são para serem associados com combinações de subidentificadores que agrupam vários parâmetros, incluindo parâmetros de matriz de quantização. A seção de inserção 130 então insere os IDs de combinação gerados pela seção geradora de parâmetro 130 em um APS ou outro conjunto de parâmetro. A seção de aquisição de parâmetro 160 da seção de processamento de sintaxe 61 do dispositivo de decodificação de imagem 60 adquire o ID de combinação designado no cabeçalho de pedaço de cada pedaço, e usa os subidentificadores associados com esse ID de combinação para adicionalmente adquirir parâmetros de matriz de quantização dentro do APS.
Deste modo, usando um ID de combinação associado com combinações de subidentificadores para referenciar parâmetros de dentro do APS, a quantidade de códigos requerida para referenciar cada parâmetro dos cabeçalhos de pedaço pode ser reduzida.
7. Aplicação de exemplo
O dispositivo de codificação de imagem 10 e o dispositivo de decodificação de imagem 60 de acordo com a concretização descrita acima podem ser aplicados a vários aparelhos eletrônicos tais como um transmissor e um receptor por radiodifusão de satélite, radiodifusão de cabo tal como TV a cabo, distribuição na Internet, distribuição para dispositivos de cliente por comunicação celular, e similar, um dispositivo de gravação que grava imagens sobre um meio tal como um disco óptico, um disco magnético, ou memória flash, e um dispositivo de reprodução que reproduz imagens de tais meios de armazenamento. Quatro aplicações de exemplo serão descritas abaixo.
7-1. Primeira Aplicação de
Exemplo A Figura 34 é um diagrama de bloco ilustrando uma configuração esquemática exemplar de uma televisão adotando a concretização descrita acima. Uma televisão 900 inclui uma antena 901, um sintonizador 902, um demultiplexador 903, um decodificador 904, uma seção de processamento de sinal de vídeo 905, uma seção de exibição 906, uma seção de processamento de sinal de áudio 907, um alto-falante 908, uma interface externa 909, uma seção de controle 910, uma interface de usuário 911 e um barramento 912.
O sintonizador 902 extrai um sinal de um canal desejado de sinais radiodifundidos recebidos pela antena 901, e demodula o sinal extraído. Então, o sintonizador 902 produz um fluxo de bits codificado obtido por demodulação ao demultiplexador 903. Quer dizer, o sintonizador 902 serve como meio de transmissão da televisão 900 para receber um fluxo codificado no qual uma imagem está codificada.
O demultiplexador 903 separa um fluxo vídeo e um fluxo de áudio de um programa a ser visto do fluxo de bits codificado, e produz os fluxos separados para o decodificador 904. Também, o demultiplexador 903 extrai dados auxiliares tal como um guia de programa eletrônico (EPG) do fluxo de bits codificado, e provê os dados para a seção de controle 910. Adicionalmente, o demultiplexador 903 pode executar desembaralhamento (descrambling) no caso onde o fluxo de bits codificado está embaralhado (scrambled).
O decodificador 904 decodifica o fluxo vídeo e o fluxo de áudio introduzidos do demultiplexador 903. Então, o decodificador 904 produz dados de vídeo gerados pelo processo de decodificação à seção de processamento de sinal de vídeo 905. Também, o decodificador 904 produz os dados de áudio gerados pelo processo de decodificação à seção de processamento de sinal de áudio 907.
A seção de processamento de sinal de vídeo 905 reproduz os dados de vídeo introduzidos do decodificador 904, e faz a seção de exibição 906 exibir o vídeo. A seção de processamento de sinal de vídeo 905 também pode fazer a seção de exibição 906 exibir uma tela de aplicação provida por uma rede. Ademais, a seção de processamento de sinal de vídeo 905 pode executar processos adicionais tal como remoção de ruído, por exemplo, nos dados de vídeo de acordo com fixações. Além disso, a seção de processamento de sinal de vídeo 905 pode gerar a imagens de interface gráfica de usuário (GUI) tais como menus, botões, ou um cursor, por exemplo, e sobrepor as imagens geradas sobre uma imagem de saída.
A seção de exibição 906 é excitada por um sinal de excitação provido pela seção de processamento de sinal de vídeo 905, e exibe um vídeo ou uma imagem em uma tela de vídeo de um dispositivo de exibição (tal como um mostrador de cristal líquido, uma exibição de plasma, ou uma exibição de OLED, por exemplo).
A seção de processamento de sinal de áudio 907 executa processos de reprodução tais como conversão D/A e amplificação nos dados de áudio introduzidos do decodificador 904, e produz áudio do alto-falante 908. Também, a seção de processamento de sinal de áudio 907 pode executar processos adicionais tais como remoção de ruído nos dados de áudio.
A interface externa 909 é uma interface para conectar a televisão 900 a uma aplicação externa ou uma rede. Por exemplo, um fluxo de vídeo ou um fluxo de áudio recebido pela interface externa 909 pode ser decodificado pelo decodificador 904. Quer dizer, a interface externa 909 também serve como meio de transmissão da televisão 900 para receber um fluxo codificado no qual uma imagem está codificada.
A seção de controle 910 inclui um processador tal como uma unidade de processamento central (CPU), e memória tal como memória de acesso aleatório (RAM), e memória somente para leitura (ROM). A memória armazena um programa a ser executado pela CPU, dados de programa, dados de EPG, dados adquiridos por uma rede, e similar. O programa armazenado na memória é lido e executado pela CPU ao ativar a televisão 900, por exemplo. Executando o programa, a CPU controla a operação da televisão 900 de acordo com um sinal de operação introduzido da interface de usuário 911, por exemplo.
A interface de usuário 911 está conectada à seção de controle 910. A interface de usuário 911 inclui botões e chaves usados por um usuário para operar a televisão 900, e um receptor de sinal de controle remoto, por exemplo. A interface de usuário 911 detecta uma operação pelo usuário por estes elementos estruturais, gera um sinal de operação, e produz o sinal de operação gerado para a seção de controle 910.
O barramento 912 interconecta o sintonizador 902, o demultiplexador 903, o decodificador 904, a seção de processamento de sinal de vídeo 905, a seção de processamento de sinal de áudio 907, a interface externa 909 e a seção de controle 910.
Em uma televisão 900 configurada deste modo, o decodificador 904 inclui as funções de um dispositivo de decodificação de imagem 60 de acordo com as concretizações precedentes. Consequentemente, é possível moderar a diminuição em eficiência de codificação para vídeo decodificado pela televisão 900, ou melhorar a eficiência de codificação.
7-2. Segunda Aplicação de
Exemplo A Figura 35 é um diagrama de bloco ilustrando uma configuração esquemática exemplar de um telefone móvel adotando a concretização descrita acima. Um telefone móvel 920 inclui uma antena 921, uma seção de comunicação 922, um codec de áudio 923, um alto-falante 924, um microfone 925, uma seção de câmera 926, uma seção de processamento de imagem 927, uma seção de multiplexação/demultiplexação (mux/demux) 928, uma seção de gravação e reprodução 929, uma seção de exibição 930, um seção de controle 931, uma seção operável 932 e um barramento 933.
A antena 921 está conectada à seção de comunicação 922. O alto-falante 924 e o microfone 925 estão conectados ao codec de áudio 923. A seção operável 932 está conectada à seção de controle 931. O barramento 933 interconecta a seção de comunicação 922, o codec de áudio 923, a seção de câmera 926, a seção de processamento de imagem 927, a seção de mux/demux 928, a seção de gravação e reprodução 929, a exibição 930 e a seção de controle 931.
O telefone móvel 920 executa operações tais como transmitir e receber sinais de áudio, transmitir e receber e-mails ou dados de imagem, tomar imagens, e gravar dados em vários modos operacionais incluindo um modo de comunicação de áudio, um modo de comunicação de dados, um modo de geração de imagem e um modo de videofone.
No modo de comunicação de áudio, um sinal de áudio analógico gerado pelo microfone 925 é provido ao codec de áudio 923. O codec de áudio 923 converte o sinal de áudio analógico em dados de áudio, e converte em A/D e comprime os dados de áudio convertidos. Então, o codec de áudio 923 produz os dados de áudio comprimidos para a seção de comunicação 922. A seção de comunicação 922 codifica e modula os dados de áudio, e gera um sinal de transmissão. Então, a seção de comunicação 922 transmite o sinal de transmissão gerado para uma estação base (não ilustrada) pela antena 921. Também, a seção de comunicação 922 amplifica um sinal sem fios recebido pela antena 921 e converte a frequência do sinal sem fios, e adquire um sinal recebido. Então, a seção de comunicação 922 demodula e decodifica o sinal recebido e gera dados de áudio, e produz os dados de áudio gerados para o codec de áudio 923. O codec de áudio 923 expande e converte em D/A os dados de áudio, e gera um sinal de áudio analógico. Então, o codec de áudio 923 provê o sinal de áudio gerado para o alto-falante 924 e faz áudio ser produzido.
Também, no modo de comunicação de dados, a seção de controle 931 gera dados de texto que compõem um e-mail, de acordo com operações por um usuário pela seção operável 932, por exemplo. Além disso, a seção de controle 931 faz o texto ser exibido na seção de exibição 930. Além disso, a seção de controle 931 gera dados de e-mail de acordo com instruções de transmissão do usuário pela seção operável 932, e produz os dados de e-mail gerados para a seção de comunicação 922. A seção de comunicação 922 codifica e modula os dados de e-mail, e gera um sinal de transmissão. Então, a seção de comunicação 922 transmite o sinal de transmissão gerado para uma estação base (não ilustrada) pela antena 921. Também, a seção de comunicação 922 amplifica um sinal sem fios recebido pela antena 921 e converte a frequência do sinal sem fios, e adquire um sinal recebido. Então, a seção de comunicação 922 demodula e decodifica o sinal recebido, reconstrói os dados de e-mail, e produz os dados de e-mail reconstruídos para a seção de controle 931. A seção de controle 931 faz a seção de exibição 930 exibir os conteúdos do e-mail, e também faz os dados de e-mail serem armazenados no meio de armazenamento da seção de gravação e reprodução 929.
A seção de gravação e reprodução 929 inclui um meio de armazenamento legível e gravável arbitrário. Por exemplo, o meio de armazenamento pode ser um meio de armazenamento embutido tal como RAM, ou memória flash, ou um meio de armazenamento montado externamente tal como um disco rígido, um disco magnético, um disco magneto-óptico, um disco óptico, memória de USB, ou um cartão de memória.
Além disso, no modo de geração de imagem, a seção de câmera 926 toma uma imagem de um tema, gera dados de imagem, e produz os dados de imagem gerados para a seção de processamento de imagem 927, por exemplo. A seção de processamento de imagem 927 codifica os dados de imagem introduzidos da seção de câmera 926, e faz o fluxo codificado ser armazenado no meio de armazenamento da seção de gravação e reprodução 929.
Além disso, no modo de videofone, a seção de mux/demux 928 multiplexa um fluxo vídeo codificado pela seção de processamento de imagem 927 e um fluxo de áudio introduzido do codec de áudio 923, e produz o fluxo multiplexado para a seção de comunicação 922, por exemplo. A seção de comunicação 922 codifica e modula o fluxo, e gera um sinal de transmissão. Então, a seção de comunicação 922 transmite o sinal de transmissão gerado para uma estação base (não ilustrada) pela antena 921. Também, a seção de comunicação 922 amplifica um sinal sem fios recebido pela antena 921 e converte a frequência do sinal sem fios, e adquire um sinal recebido. O sinal de transmissão e sinal recebido podem incluir um fluxo de bits codificado. Então, a seção de comunicação 922 demodula e decodifica o sinal recebido, reconstrói o fluxo, e produz o fluxo reconstruído para a seção de mux/demux 928. A seção de mux/demux 928 separa um fluxo vídeo e um fluxo de áudio do fluxo de entrada, e produz o fluxo vídeo para a seção de processamento de imagem 927 e o fluxo de áudio para o codec de áudio 923. A seção de processamento de imagem 927 decodifica o fluxo de vídeo, e gera dados de vídeo. Os dados de vídeo são providos à seção de exibição 930, e uma série de imagens é exibida pela seção de exibição 930. O codec de áudio 923 expande e converte em D/A o fluxo de áudio, e gera um sinal de áudio analógico. Então, o codec de áudio 923 provê o sinal de áudio gerado para o alto-falante 924 e faz áudio ser produzido.
Em um telefone móvel 920 configurado deste modo, a seção de processamento de imagem 927 inclui as funções do dispositivo de codificação de imagem 10 e do dispositivo de decodificação de imagem 60 de acordo com as concretizações precedentes. Consequentemente, é possível moderar a diminuição em eficiência de codificação para vídeo codificado e decodificado pelo telefone móvel 920, ou melhorar a eficiência de codificação.
7-3. Terceira Aplicação de
Exemplo A Figura 36 é um diagrama de bloco ilustrando uma configuração esquemática exemplar de um dispositivo de gravação e reprodução adotando a concretização descrita acima. Um dispositivo de gravação e reprodução 940 codifica, e grava sobre um meio de gravação, os dados de áudio e dados de vídeo de um programa radiodifundido recebido, por exemplo. O dispositivo de gravação e reprodução 940 também pode codificar, e gravar sobre o meio de gravação, dados de áudio e dados de vídeo adquiridos de outro dispositivo, por exemplo. Além disso, o dispositivo de gravação e reprodução 940 reproduz dados gravados sobre o meio de gravação por um monitor e alto-falante de acordo com instruções de um usuário, por exemplo. Nestas ocasiões, o dispositivo de gravação e reprodução 940 decodifica os dados de áudio e os dados de vídeo.
O dispositivo de gravação e reprodução 940 inclui um sintonizador 941, uma interface externa 942, um codificador 943, uma unidade de disco rígido (HDD) 944, uma unidade de disco 945, um seletor 946, um decodificador 947, uma exibição em tela (OSD) 948, um seção de controle 949 e uma interface de usuário 950.
O sintonizador 941 extrai um sinal de um canal desejado de sinais radiodifundidos recebidos por uma antena (não ilustrada), e demodula o sinal extraído. Então, o sintonizador 941 produz um fluxo de bit codificado obtido por demodulação ao seletor 946. Quer dizer, o sintonizador 941 serve como meio de transmissão do dispositivo de gravação e reprodução 940.
A interface externa 942 é uma interface para conectar o dispositivo de gravação e reprodução 940 para uma aplicação externa ou uma rede. Por exemplo, a interface externa 942 pode ser uma interface IEEE 1394, uma interface de rede, uma interface de USB, uma interface de memória flash, ou similar. Por exemplo, dados de vídeo e dados de áudio recebidos pela interface externa 942 são introduzidos no codificador 943. Quer dizer, a interface externa 942 serve como meio de transmissão do dispositivo de gravação e reprodução 940.
No caso onde não os dados vídeos e os dados de áudio introduzidos da interface externa 942 são codificados, o codificador 943 codifica os dados de vídeo e os dados de áudio. Então, o codificador 943 produz o fluxo de bit codificado para o seletor 946.
O HDD 944 grava sobre um disco rígido interno um fluxo de bit codificado, que são dados de conteúdo comprimido tais como vídeo ou áudio, vários programas e outros dados. Também, o HDD 944 lê tais dados do disco rígido ao reproduzir vídeo e áudio.
A unidade de disco 945 grava ou lê dados com respeito a um meio de gravação inserido. O meio de gravação inserido na unidade de disco 945 pode ser um disco de DVD (tal como um DVD-vídeo, DVD-RAM, DVD-R, DVD-RW, DVD+, ou disco de DVD+RW), um disco Blu-ray (marca registrada), ou similar, por exemplo.
Ao gravar vídeo e áudio, o seletor 946 seleciona uma entrada de fluxo de bit codificado do sintonizador 941 ou do codificador 943, e produz o fluxo de bit codificado selecionado para o HDD 944 ou a unidade de disco 945. Também, ao reproduzir vídeo e áudio, o seletor 946 produz um fluxo de bit codificado introduzido do HDD 944 ou da unidade de disco 945 ao decodificador 947.
O decodificador 947 decodifica o fluxo de bits codificado, e gera dados de vídeo e dados de áudio. Então, o decodificador 947 produz os dados de vídeo gerados para o OSD 948. Também, o decodificador 904 produz os dados de áudio gerados para um alto-falante externo.
O OSD 948 reproduz os dados de vídeo introduzidos do decodificador 947, e exibe vídeo. Também, o OSD 948 pode sobrepor imagens de GUI, tais como menus, botões, ou um cursor, por exemplo, sobre vídeo exibido.
A seção de controle 949 inclui um processador tal como uma CPU, e memória tal como RAM ou ROM. A memória armazena um programa a ser executado pela CPU, dados de programa, e similar. Um programa armazenado na memória é lido e executado pela CPU ao ativar o dispositivo de gravação e reprodução 940, por exemplo. Executando o programa, a CPU controla a operação do dispositivo de gravação e reprodução 940 de acordo com um sinal de operação introduzido da interface de usuário 950, por exemplo.
A interface de usuário 950 está conectada à seção de controle 949. A interface de usuário 950 inclui botões e chaves usados por um usuário para operar o dispositivo de gravação e reprodução 940, e um receptor de sinal de controle remoto, por exemplo. A interface de usuário 950 detecta uma operação pelo usuário por estes elementos estruturais, gera um sinal de operação, e produz o sinal de operação gerado para a seção de controle 949.
Em um dispositivo de gravação e reprodução 940 configurado deste modo, o codificador 943 inclui as funções do dispositivo de codificação de imagem 10 de acordo com as concretizações precedentes. Além disso, o decodificador 947 inclui as funções do dispositivo de decodificação de imagem 60 de acordo com as concretizações precedentes. Consequentemente, é possível moderar a diminuição em eficiência de codificação para vídeo codificado e decodificado pelo dispositivo de gravação e reprodução 940, ou melhorar a eficiência de codificação.
7-4. Quarta Aplicação de Exemplo
A Figura 37 é um diagrama de bloco mostrando um exemplo de uma configuração esquemática de um dispositivo de geração de imagem adotando a concretização descrita acima. Um dispositivo de geração de imagem 960 toma uma imagem de um tema, gera uma imagem, codifica os dados de imagem, e grava os dados de imagem sobre um meio de gravação.
O dispositivo de geração de imagem 960 inclui um bloco óptico 961, uma seção de geração de imagem 962, uma seção de processamento de sinal 963, uma seção de processamento de imagem 964, uma seção de exibição 965, uma interface externa 966, memória 967, uma unidade de mídia 968, um OSD 969, um seção de controle 970, uma interface de usuário 971 e um barramento 972.
O bloco óptico 961 está conectado à seção de geração de imagem 962. A seção de geração de imagem 962 está conectada à seção de sinal de processo 963. A seção de exibição 965 está conectada à seção de processamento de imagem 964. A interface de usuário 971 está conectada à seção de controle 970. O barramento 972 interconecta a seção de processamento de imagem 964, a interface externa 966, a memória 967, a unidade de mídia 968, o OSD 969 e a seção de controle 970.
O bloco óptico 961 inclui uma lente de foco, um mecanismo de parada de abertura, e similar. O bloco óptico 961 forma uma imagem óptica de um tema na superfície de geração de imagem da seção de geração de imagem 962. A seção de geração de imagem 962 inclui um sensor de imagem tal como um sensor de CCD ou CMOS, e converte fotoeletricamente a imagem óptica formada na superfície de geração de imagem em um sinal de imagem que é um sinal elétrico. Então, a seção de geração de imagem 962 produz o sinal de imagem para a seção de processamento de sinal 963.
A seção de processamento de sinal 963 executa vários processos de sinal de câmera tais como correção de joelho, correção gama, e correção de cor no sinal de imagem introduzido da seção de geração de imagem 962. A seção de processamento de sinal 963 produz os dados de imagem processados para a seção de processamento de imagem 964.
A seção de processamento de imagem 964 codifica os dados de imagem introduzidos da seção de processamento de sinal 963, e gera dados codificados.
Então, a seção de processamento de imagem 964 produz os dados codificados assim gerados para a interface externa 966 ou a unidade de mídia 968. Também, a seção de processamento de imagem 964 decodifica dados codificados introduzidos da interface externa 966 ou da unidade de mídia 968, e gera dados de imagem. Então, a seção de processamento de imagem 964 produz os dados de imagem gerados para a seção de exibição 965. Também, a seção de processamento de imagem 964 pode produzir os dados de imagem introduzidos da seção de processamento de sinal 963 para a seção de exibição 965, e faz a imagem ser exibida. Além disso, a seção de processamento de imagem 964 pode sobrepor dados de exibição adquiridos do OSD 969 sobre uma imagem a ser produzida à seção de exibição 965.
O OSD 969 gera imagens de GUI tais como menus, botões, ou um cursor, por exemplo, e produz as imagens geradas para a seção de processamento de imagem 964.
A interface externa 966 é configurada como um terminal de entrada/saída de USB, por exemplo. A interface externa 966 conecta o dispositivo de geração de imagem 960 a uma impressora ao imprimir uma imagem, por exemplo. Também, uma unidade de disco está conectada à interface externa 966 como necessário. Um meio removível tal como um disco magnético ou um disco óptico, por exemplo, é inserido na unidade de disco, e um programa lido do meio removível pode ser instalado no dispositivo de geração de imagem 960. Além disso, a interface externa 966 pode ser configurada como uma interface de rede a ser conectada a uma rede tal como uma LAN ou a Internet. Quer dizer, a interface externa 966 serve como meio de transmissão do dispositivo de captura de imagem 960.
Um meio de gravação a ser inserido na unidade de mídia 968 pode ser um meio removível legível e gravável arbitrário, tal como um disco magnético, um disco magneto-óptico, um disco óptico, ou memória de semicondutor, por exemplo. Também, um meio de gravação pode ser instalado permanentemente na unidade de mídia 968 para constituir uma seção de armazenamento não portátil tal como uma unidade de disco rígido interna ou uma unidade de estado sólido (SSD), por exemplo.
A seção de controle 970 inclui um processador tal como uma CPU, e memória tal como RAM ou ROM. A memória armazena um programa a ser executado pela CPU, dados de programa, e similar. Um programa armazenado na memória é lido e executado pela CPU ao ativar o dispositivo de geração de imagem 960, por exemplo. Executando o programa, a CPU controla a operação do dispositivo de geração de imagem 960 de acordo com um sinal de operação introduzido da interface de usuário 971, por exemplo.
A interface de usuário 971 está conectada à seção de controle 970. A interface de usuário 971 inclui botões, chaves e similar usados por um usuário para operar o dispositivo de geração de imagem 960, por exemplo. A interface de usuário 971 detecta uma operação pelo usuário por estes elementos estruturais, gera um sinal de operação, e produz o sinal de operação gerado para a seção de controle 970.
Em um dispositivo de geração de imagem 960 configurado deste modo, a seção de processamento de imagem 964 inclui as funções do dispositivo de codificação de imagem 10 e do dispositivo de decodificação de imagem 60 de acordo com as concretizações precedentes. Consequentemente, é possível moderar a diminuição em eficiência de codificação para vídeo codificado e decodificado pelo dispositivo de geração de imagem 960, ou melhorar a eficiência de codificação.
8. Conclusão
O precedente usa as Figuras 1 a 37 para descrever um dispositivo de codificação de imagem 10 e um dispositivo de decodificação de imagem 60 de acordo com uma concretização. De acordo com a concretização, parâmetros de matriz de quantização definindo matrizes de quantização usadas ao quantizar e quantizar inversamente uma imagem são inseridos em um conjunto de parâmetro de matriz de quantização (QMPS) que difere do conjunto de parâmetro de sequência e do conjunto de parâmetro de imagem parada. Fazendo assim, fica desnecessário ambos codificar parâmetros diferentes de parâmetros de matriz de quantização ao atualizar uma matriz de quantização, e codificar parâmetros de matriz de quantização ao atualizar parâmetros diferentes de parâmetros de matriz de quantização. Consequentemente, a diminuição em eficiência de codificação acompanhando a atualização da matriz de quantização é mediada, ou a eficiência de codificação é melhorada. Particularmente, a redução da quantidade de códigos com as técnicas expostas nesta especificação fica mais efetiva até mesmo no caso de matrizes de quantização com tamanhos maiores, ou no caso onde um número maior de matrizes de quantização está definido para cada imagem parada.
Também, de acordo com a concretização presente, parâmetros que especificam copiar uma matriz de quantização gerada previamente podem ser incluídos no QMPS em vez de definir diretamente uma matriz de quantização. Neste caso, os parâmetros que especificam uma própria matriz de quantização (um arranjo de dados diferenciais em formato de DPCM, por exemplo) são omitidos do QMPS, e assim a quantidade de códigos exigida para definir uma matriz de quantização pode ser reduzida ademais.
Também, de acordo com a concretização presente, um QMPS ID é nomeado a cada QMPS. Então, em modo de cópia, o QMPS ID do QMPS definindo a matriz de quantização de fonte de cópia pode ser designado como um ID de fonte. Também, o tamanho e tipo da matriz de quantização de fonte de cópia podem ser designados como o tamanho de fonte de cópia e o tipo de fonte de cópia. Consequentemente, uma matriz de quantização em um QMPS arbitrário dentre matrizes de quantização em múltiplos QMPSs gerados previamente pode ser designada flexivelmente como uma matriz de quantização de fonte de cópia. Também é possível copiar e reutilizar uma matriz de quantização de um tamanho ou tipo diferentes.
Também, de acordo com a concretização presente, parâmetros que especificam componentes residuais de uma matriz de quantização a ser copiada podem ser incluídos em um QMPS. Consequentemente, uma matriz de quantização que não é completamente igual a uma matriz de quantização gerada previamente ainda pode ser gerada novamente a uma taxa baixa.
Também, em modo de designação de eixo, em vez de varrer todos os elementos de uma matriz de quantização, só os valores dos elementos na matriz de quantização correspondendo a três eixos de referência ou os quatro cantos da matriz de quantização podem ser incluídos no QMPS. Consequentemente, é igualmente possível definir uma matriz de quantização com uma quantidade pequena de códigos neste caso.
Também, de acordo com a concretização presente, as matrizes de quantização a usar para cada pedaço são fixadas na base de parâmetros de matriz de quantização dentro do QMPS identificado pelo QMPS ID designado no cabeçalho de pedaço. Consequentemente, desde que matrizes de quantização podem ser trocadas flexivelmente para cada pedaço, a matriz ótima de quantização a cada momento pode ser usada para codificar ou decodificar vídeo, até mesmo no caso onde as características de imagem variam de momento para momento.
Note que esta especificação descreve um exemplo no qual o conjunto de parâmetro de matriz de quantização multiplexado no cabeçalho do fluxo codificado e transmitido do lado de codificação ao lado de decodificação. Porém, a técnica de transmitir o conjunto de parâmetro de matriz de quantização não está limitada a um tal exemplo. Por exemplo, informação dentro de cada conjunto de parâmetro também pode ser transmitida ou gravada como dados separados associados com um fluxo de bit codificado sem ser multiplexado no fluxo de bit codificado. Aqui, o termo “associado” significa que imagens incluídas no fluxo de bit (também cercando imagens parciais tais como pedaços ou blocos) e informação correspondendo a essas imagens podem ser ligadas na hora de decodificação. Em outras palavras, informação também pode ser transmitida sobre um canal de transmissão separado de uma imagem (ou fluxo de bit). Também, a informação pode ser gravada a um meio de gravação separado (ou uma área de gravação separada no mesmo meio de gravação) da imagem (ou fluxo de bit). Além disso, informação e imagens (ou fluxos de bit) podem ser associadas entre si em unidades arbitrárias tais como quadros múltiplos, quadros únicos, ou porções dentro de quadros, por exemplo.
O antecedente assim descreve concretizações preferidas da exposição presente em detalhes e com referência aos desenhos anexos. Porém, a extensão técnica da exposição presente não está limitada a tais exemplos. Está claro a pessoas normalmente qualificadas no campo técnico ao qual a exposição presente pertence que várias modificações ou alterações podem ocorrer até onde elas estão dentro da extensão das ideias técnicas declaradas nas reivindicações, e é para ser entendido que tais modificações ou alterações pertencem obviamente à extensão técnica da exposição presente.
Adicionalmente, a tecnologia presente também pode ser configurada como abaixo. (1) Um dispositivo de processamento de imagem incluindo: uma seção de aquisição configurada para adquirir parâmetros de matriz de quantização de um fluxo codificado no qual os parâmetros de matriz de quantização definindo uma matriz de quantização são fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada; uma seção de fixação configurada para fixar, com base nos parâmetros de matriz de quantização adquiridos pela seção de aquisição, uma matriz de quantização que é usada ao quantizar inversamente dados decodificados do fluxo codificado; e uma seção de quantização inversa configurada para quantizar inversamente os dados decodificados do fluxo codificado usando a matriz de quantização fixada pela seção de fixação. (2) O dispositivo de processamento de imagem de acordo com (1), em que: o conjunto de parâmetro contendo os parâmetros de matriz de quantização é um conjunto de parâmetro comum dentro dos outros parâmetros de codificação relativos a ferramentas de codificação diferentes de uma matriz de quantização também podem ser fixados, e a seção de aquisição adquire os parâmetros de matriz de quantização quando os parâmetros de matriz de quantização são fixados dentro do conjunto de parâmetro comum. (3) O dispositivo de processamento de imagem de acordo com (2), em que: a seção de aquisição determina se os parâmetros de matriz de quantização estão fixados dentro do conjunto de parâmetro comum referenciando um sinalizador incluído no conjunto de parâmetro comum. (4) O dispositivo de processamento de imagem de acordo com (2) ou (3), em que: o conjunto de parâmetro comum é um conjunto de parâmetro de adaptação. (5) O dispositivo de processamento de imagem de acordo com (4), em que: em um caso onde uma referência para um primeiro conjunto de parâmetro de adaptação está incluída em um segundo conjunto de parâmetro de adaptação decodificado depois do primeiro conjunto de parâmetro de adaptação, a seção de fixação reutiliza uma matriz de quantização fixada com base nos parâmetros de matriz de quantização adquiridos do primeiro conjunto de parâmetro de adaptação como uma matriz de quantização correspondendo ao segundo conjunto de parâmetro de adaptação. (6) O dispositivo de processamento de imagem de acordo com (5), em que: em um caso onde uma referência para um terceiro conjunto de parâmetro de adaptação está incluída dentro do terceiro conjunto de parâmetro de adaptação, a seção de fixação fixa uma matriz de quantização prefixada como uma matriz de quantização correspondendo ao terceiro conjunto de parâmetro de adaptação. (7) O dispositivo de processamento de imagem de acordo com (1), em que: em um caso onde um parâmetro de cópia instruindo para copiar uma primeira matriz de quantização para um primeiro conjunto de parâmetro está incluído em um segundo conjunto de parâmetro, a seção de fixação fixa uma segunda matriz de quantização copiando a primeira matriz de quantização. (8) O dispositivo de processamento de imagem de acordo com (7), em que: cada conjunto de parâmetro que inclui os parâmetros de matriz de quantização tem um identificador que identifica cada conjunto de parâmetro, e o parâmetro de cópia inclui um identificador de um conjunto de parâmetro de uma fonte de cópia. (9) O dispositivo de processamento de imagem de acordo com (8), em que: cada conjunto de parâmetro inclui parâmetros de matriz de quantização que definem respectivamente uma pluralidade de classes de matrizes de quantização, e o parâmetro de cópia inclui um parâmetro de classe designando uma classe da primeira matriz de quantização. (10) O dispositivo de processamento de imagem de acordo com (8), em que: em um caso onde o identificador do conjunto de parâmetro da fonte de cópia incluído no terceiro conjunto de parâmetro é igual a um identificador do terceiro conjunto de parâmetro, a seção de fixação fixa uma matriz de quantização prefixada como uma terceira matriz de quantização para o terceiro conjunto de parâmetro. (11) O dispositivo de processamento de imagem de acordo com (7), em que: em um caso onde um tamanho da segunda matriz de quantização é maior do que um tamanho da primeira matriz de quantização, a seção de fixação fixa a segunda matriz de quantização interpolando elementos da primeira matriz de quantização copiada. (12) O dispositivo de processamento de imagem de acordo com (7), em que; em um caso onde um tamanho da segunda matriz de quantização é menor do que um tamanho da primeira matriz de quantização, a seção de fixação fixa a segunda matriz de quantização dizimando elementos da primeira matriz de quantização copiada. (13) O dispositivo de processamento de imagem de acordo com (7), em que: em um caso onde um parâmetro de designação residual designando componentes residuais de uma matriz de quantização que é copiada está incluído no segundo conjunto de parâmetro, a seção de fixação fixa a segunda matriz de quantização adicionando os componentes residuais à primeira matriz de quantização copiada. (14) O dispositivo de processamento de imagem de acordo com (1), em que: cada conjunto de parâmetro que inclui os parâmetros de matriz de quantização tem um identificador de conjunto de parâmetro que identifica cada conjunto de parâmetro, e a seção de quantização inversa usa, para cada pedaço, uma matriz de quantização fixada pela seção de fixação com base em parâmetros de matriz de quantização incluídos em um conjunto de parâmetro identificado pelo identificador de conjunto de parâmetro designado em um cabeçalho de pedaço. (15) O dispositivo de processamento de imagem de acordo com qualquer um de (7) a (14), em que: o conjunto de parâmetro contendo os parâmetros de matriz de quantização ademais inclui outros parâmetros de codificação relativos a ferramentas de codificação diferentes de uma matriz de quantização. (16) O dispositivo de processamento de imagem de acordo com (15), em que: os parâmetros de matriz de quantização e os outros parâmetros de codificação são agrupados por um subidentificador definido separadamente de um identificador de parâmetro que identifica cada conjunto de parâmetro, e a seção de aquisição adquire os parâmetros de matriz de quantização usando o subidentificador. (17) O dispositivo de processamento de imagem de acordo com (16), em que: um identificador de combinação associado com uma combinação de uma pluralidade dos subidentificadores está definido no conjunto de parâmetro ou outro conjunto de parâmetro, e a seção de aquisição adquire o identificador de combinação designado em um cabeçalho de pedaço de cada pedaço, e adquire os parâmetros de matriz de quantização usando os subidentificadores associados com o identificador de combinação adquirido. (18) Um método de processamento de imagem incluindo: adquirir parâmetros de matriz de quantização de um fluxo codificado no qual os parâmetros de matriz de quantização definindo uma matriz de quantização são fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada; fixar, com base nos parâmetros de matriz de quantização adquiridos, uma matriz de quantização que é usada ao quantizar inversamente dados decodificados do fluxo codificado; e quantizar inversamente os dados decodificados do fluxo codificado usando a matriz de quantização fixada. (19) Um dispositivo de processamento de imagem incluindo: uma seção de quantização configurada para quantizar dados usando uma matriz de quantização; uma seção de fixação configurada para fixar parâmetros de matriz de quantização que definem uma matriz de quantização a ser usada quando a seção de quantização quantiza os dados; e uma seção de codificação configurada para codificar os parâmetros de matriz de quantização fixados pela seção de fixação dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada. (20) Um método de processamento de imagem incluindo: quantizar dados usando uma matriz de quantização; fixar parâmetros de matriz de quantização que definem a matriz de quantização a ser usada ao quantizar os dados; e codificar os parâmetros de matriz de quantização fixados dentro de um conjunto de parâmetro que é diferente de um conjunto de parâmetro de sequência e um conjunto de parâmetro de imagem parada.
Lista de Sinais de Referência 10 - Dispositivo de processamento de imagem (dispositivo de codificação de imagem) 16 - Seção de quantização 120 - Seção geradora de parâmetro 130 - Seção de inserção 60 - Dispositivo de processamento de imagem (dispositivo de decodificação de imagem) 63 - Seção de quantização inversa 160 - Seção de aquisição de parâmetro 170 - Seção de fixação

Claims (10)

1. Dispositivo de processamento de imagem, CARACTERIZADO pelo fato de compreender: circuito configurado para: receber um fluxo de bits codificado (encoded); decodificar, a partir do fluxo de bits codificado, uma primeira informação indicando se uma matriz de quantização atual deve ou não ser gerada copiando uma matriz de quantização de fonte, em que a matriz de quantização atual possui um segundo valor de identificação; no caso quando a primeira informação indica que a matriz de quantização atual deve ser gerada copiando a matriz de quantização de fonte: decodificar uma segunda informação indicativa de um primeiro valor de identificação; em um caso quando o primeiro valor de identificação não for igual ao segundo valor de identificação: identificar a matriz de quantização de fonte com base pelo menos em parte no primeiro valor de identificação, e com base em um ou mais ou em nenhum dentre: um tamanho de matriz e um tipo de matriz; em um caso quando o primeiro valor de identificação for igual ao segundo valor de identificação: usar uma matriz prefixada como a matriz de quantização de fonte; gerar a matriz de quantização atual copiando a matriz de quantização de fonte; e usar a matriz de quantização atual para processar a imagem.
2. Dispositivo de processamento de imagem, de acordo com reivindicação 1, CARACTERIZADO pelo fato de que o tipo da matriz inclui pelo menos uma combinação de um modo de predição e de um componente de cor.
3. Dispositivo de processamento de imagem, de acordo com reivindicação 2, CARACTERIZADO pelo fato de que a pelo menos uma combinação do modo de predição e do componente de cor inclui intrapredição para um componente de luma, intrapredição para um componente de crominância (chroma), interpredição para um componente de luma e interpredição para um componente de crominância (chroma).
4. Dispositivo de processamento de imagem, de acordo com reivindicação 2, CARACTERIZADO pelo fato de que a pelo menos uma combinação do modo de predição e do componente de cor inclui intrapredição para um componente Y, intrapredição para um componente Cb, intrapredição para um componente Cr, interpredição para um componente Y, interpredição para um componente Cb e interpredição para um componente Cr.
5. Dispositivo de processamento de imagem, de acordo com reivindicação 1, CARACTERIZADO pelo fato de que no caso onde a primeira informação indica que a matriz de quantização atual possuindo o segundo valor de identificação que não deve ser gerado copiando a matriz de quantização de fonte, é configurado ainda para: decodificar a matriz de quantização atual; e usar a matriz de quantização atual decodificada para processar a imagem.
6. Método de processamento de imagem, CARACTERIZADO pelo fato de compreender as etapas de: receber um fluxo de bits codificado (encoded); decodificar, a partir do fluxo de bits codificado, uma primeira informação indicando se uma matriz de quantização atual deve ou não ser gerada copiando uma matriz de quantização de fonte, em que a matriz de quantização atual possui um segundo valor de identificação; no caso quando a primeira informação indica que a matriz de quantização atual deve ser gerada copiando a matriz de quantização de fonte: decodificar uma segunda informação indicativa de um primeiro valor de identificação; em um caso onde o primeiro valor de identificação não for igual ao segundo valor de identificação: identificar a matriz de quantização de fonte com base pelo menos em parte no primeiro valor de identificação, e um ou mais ou nenhum dentre: um tamanho de matriz e um tipo de matriz; em um caso quando o primeiro valor de identificação for igual ao segundo valor de identificação: usar uma matriz prefixada como a matriz de quantização de fonte; gerar a matriz de quantização atual copiando a matriz de quantização de fonte; e usar a matriz de quantização atual para processar a imagem.
7. Método de processamento de imagem, de acordo com reivindicação 6, CARACTERIZADO pelo fato de que na etapa de definir a matriz de quantização de fonte, a matriz de quantização de fonte é definida correspondendo ao tipo de matriz que inclui pelo menos uma combinação de um modo de predição e um componente de cor.
8. Método de processamento de imagem, de acordo com reivindicação 7, CARACTERIZADO pelo fato de que a pelo menos uma combinação do modo de predição e do componente de cor inclui intrapredição para um componente de luma, intrapredição para um componente de crominância (chroma), interpredição para um componente de luma e interpredição para um componente de crominância (chroma).
9. Método de processamento de imagem, de acordo com reivindicação 7, CARACTERIZADO pelo fato de que a pelo menos uma combinação do modo de predição e do componente de cor inclui intrapredição para um componente Y, intrapredição para um componente Cb, intrapredição para um componente Cr, interpredição para um componente Y, interpredição para um componente Cb e interpredição para um componente Cr.
10. Método de processamento de imagem, de acordo com reivindicação 6, CARACTERIZADO pelo fato de que no caso quando a primeira informação indica que a matriz de quantização atual possuindo o segundo valor de identificação que não deve ser gerado copiando a matriz de quantização de fonte: decodificar a matriz de quantização atual; e usar a matriz de quantização atual decodificada para processar a imagem.
BR112013019937-7A 2011-02-10 2012-01-18 Dispositivo e método de processamento de imagem BR112013019937B1 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2011027896 2011-02-10
JP2011-027896 2011-02-10
JP2011047655 2011-03-04
JP2011-047655 2011-03-04
JP2011-187179 2011-08-30
JP2011187179 2011-08-30
PCT/JP2012/050931 WO2012108237A1 (ja) 2011-02-10 2012-01-18 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
BR112013019937A2 BR112013019937A2 (pt) 2016-12-13
BR112013019937B1 true BR112013019937B1 (pt) 2022-05-03

Family

ID=46638456

Family Applications (2)

Application Number Title Priority Date Filing Date
BR112013019937-7A BR112013019937B1 (pt) 2011-02-10 2012-01-18 Dispositivo e método de processamento de imagem
BR122014031521-0A BR122014031521B1 (pt) 2011-02-10 2012-01-18 Dispositivo e método de processamento de imagem

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122014031521-0A BR122014031521B1 (pt) 2011-02-10 2012-01-18 Dispositivo e método de processamento de imagem

Country Status (19)

Country Link
US (13) US9706205B2 (pt)
EP (3) EP4254953A3 (pt)
JP (6) JP5966932B2 (pt)
KR (4) KR101989613B1 (pt)
CN (5) CN107566845B (pt)
AU (1) AU2012215968B2 (pt)
BR (2) BR112013019937B1 (pt)
CA (3) CA3063234C (pt)
CO (1) CO6751263A2 (pt)
ES (1) ES2708940T3 (pt)
HK (1) HK1250109A1 (pt)
MX (3) MX2018013536A (pt)
MY (2) MY169660A (pt)
PH (2) PH12015501742B1 (pt)
RU (2) RU2609094C2 (pt)
SG (3) SG10201400975QA (pt)
TW (4) TWI629894B (pt)
WO (1) WO2012108237A1 (pt)
ZA (1) ZA201304780B (pt)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
JP5359657B2 (ja) * 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5914962B2 (ja) 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
TWI600318B (zh) 2010-05-18 2017-09-21 Sony Corp Image processing apparatus and image processing method
CN108366264B (zh) 2010-06-04 2022-08-26 索尼公司 图像处理设备和方法
CN106791878B (zh) 2010-12-07 2019-05-14 索尼公司 图像处理设备和图像处理方法
RU2691962C2 (ru) 2010-12-07 2019-06-19 Сони Корпорейшн Устройство обработки изображений и способ обработки изображений
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
KR101989613B1 (ko) 2011-02-10 2019-06-14 벨로스 미디어 인터내셔널 리미티드 화상 처리 장치 및 화상 처리 방법
BR122020013607B1 (pt) 2011-03-11 2023-10-24 Sony Corporation Aparelho e método de processamento de imagem
CN106937126B (zh) 2011-05-20 2019-11-15 索尼公司 图像处理装置和图像处理方法
TWI530161B (zh) 2011-06-07 2016-04-11 Sony Corp Image processing apparatus and method
CN107295335B (zh) 2011-06-28 2020-03-17 索尼公司 图像处理装置和图像处理方法
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP5815853B2 (ja) * 2011-08-23 2015-11-17 メディア テック シンガポール ピーティーイー.リミテッド ビデオコーディングにおける量子化マトリクスに従うトランスフォームブロック処理の方法及びシステム
CN103096056B (zh) 2011-11-08 2015-11-25 华为技术有限公司 矩阵编码方法与装置及解码方法与装置
CN108924570B (zh) 2012-01-20 2021-08-24 韩国电子通信研究院 使用量化矩阵的视频编解码方法
KR102074601B1 (ko) 2012-02-29 2020-02-06 소니 주식회사 화상 처리 장치 및 방법, 및 기록 매체
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
EP2858355A4 (en) * 2012-05-25 2016-11-16 Sun Patent Trust PICTURE CODING METHOD, PICTURE DECODING METHOD, PICTURE CODING DEVICE, PICTURE DECODING DEVICE, AND PICTURE CODING / DECODING DEVICE
JP6041554B2 (ja) * 2012-06-27 2016-12-07 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
JP6210368B2 (ja) * 2012-09-18 2017-10-11 サン パテント トラスト 画像復号方法および画像復号装置
CA2894637A1 (en) * 2012-12-18 2014-06-26 Sony Corporation Image processing device and image processing method
GB2519745B (en) * 2013-10-22 2018-04-18 Canon Kk Method of processing disordered frame portion data units
KR102231279B1 (ko) 2013-10-30 2021-03-25 삼성디스플레이 주식회사 영상 데이터 인코딩 장치 및 방법
KR102253039B1 (ko) * 2013-11-04 2021-05-20 삼성디스플레이 주식회사 영상 데이터 인코딩 장치 및 방법
KR20200014945A (ko) * 2014-03-14 2020-02-11 브이아이디 스케일, 인크. Rgb 비디오 코딩 향상을 위한 시스템 및 방법
US9877035B2 (en) * 2014-03-17 2018-01-23 Qualcomm Incorporated Quantization processes for residue differential pulse code modulation
CN105227953A (zh) * 2014-06-11 2016-01-06 晨星半导体股份有限公司 影像编码装置、影像解码装置以及其相关编码与解码方法
JP6392572B2 (ja) * 2014-07-22 2018-09-19 ルネサスエレクトロニクス株式会社 画像受信装置、画像伝送システムおよび画像受信方法
KR102365685B1 (ko) * 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
WO2016119746A1 (zh) * 2015-01-29 2016-08-04 同济大学 图像编码方法及装置、图像解码方法及装置
US9380303B1 (en) * 2015-03-18 2016-06-28 Sony Corporation Adding run-mode to block-based DPCM codec
CN105208298B (zh) * 2015-10-28 2018-06-19 大连科迪视频技术有限公司 一种用于多格式视频信号切换的矩阵切换系统及矩阵切换方法
FR3044196B1 (fr) * 2015-11-20 2019-05-10 Thales Methode de compression d'images permettant d'obtenir une qualite de compression fixe
CN105472371B (zh) * 2016-01-13 2019-11-05 腾讯科技(深圳)有限公司 视频码流处理方法和装置
US10218976B2 (en) * 2016-03-02 2019-02-26 MatrixView, Inc. Quantization matrices for compression of video
CN117354516A (zh) * 2016-10-04 2024-01-05 有限公司B1影像技术研究所 图像编码/解码方法、记录介质和传输比特流的方法
CN115022625A (zh) * 2016-10-04 2022-09-06 有限公司B1影像技术研究所 图像数据编码/解码方法和计算机可读记录介质
JP6272441B2 (ja) * 2016-11-08 2018-01-31 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
US20230308626A1 (en) * 2017-07-17 2023-09-28 B1 Institute Of Image Technology, Inc. Image data encoding/decoding method and apparatus
MX2021005654A (es) 2018-11-22 2021-07-07 Beijing Bytedance Network Tech Co Ltd Tecnica de modulacion por codificacion de pulsos en procesamiento de video.
JP2020098983A (ja) * 2018-12-17 2020-06-25 キヤノン株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法
KR20200080187A (ko) * 2018-12-26 2020-07-06 한국전자통신연구원 양자화 행렬 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3939278A4 (en) * 2019-03-11 2023-03-22 Tencent America LLC TILE AND SUB-DIVISION
CN113785581A (zh) * 2019-04-15 2021-12-10 Lg 电子株式会社 基于缩放列表的视频或图像编译
WO2020213866A1 (ko) * 2019-04-15 2020-10-22 엘지전자 주식회사 스케일링 리스트 파라미터 기반 비디오 또는 영상 코딩
WO2020260668A1 (en) * 2019-06-28 2020-12-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video decoder, video encoder, methods for encoding and decoding video signals and computer program adjusting one or more denoising operations
WO2021001215A1 (en) * 2019-07-02 2021-01-07 Interdigital Vc Holdings France, Sas Chroma format dependent quantization matrices for video encoding and decoding
EP3987775A4 (en) * 2019-07-06 2023-04-19 HFI Innovation Inc. SIGNALING OF QUANTITY MATRICES
US11284073B2 (en) 2019-07-08 2022-03-22 Hyundai Motor Company Method and apparatus for intra prediction coding of video data involving matrix based intra-prediction
KR20210006305A (ko) * 2019-07-08 2021-01-18 현대자동차주식회사 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
KR20220030918A (ko) 2019-07-10 2022-03-11 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 색 성분 예측 방법, 인코더, 디코더 및 저장 매체
JP2021048532A (ja) * 2019-09-19 2021-03-25 キヤノン株式会社 画像符号化装置、画像復号装置及びそれらの制御方法及びプログラム
KR20220074952A (ko) * 2019-11-05 2022-06-03 엘지전자 주식회사 영상/비디오 코딩 방법 및 장치
WO2021091254A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 영상/비디오 코딩 시스템에서 픽처 헤더에서 슬라이스 타입에 관한 정보를 시그널링하는 방법 및 장치
KR20220073834A (ko) 2019-11-05 2022-06-03 엘지전자 주식회사 영상/비디오 코딩을 위한 상위 레벨 신택스 시그널링 방법 및 장치
CN114007082B (zh) * 2020-03-25 2022-12-23 杭州海康威视数字技术股份有限公司 一种解码、编码、编解码方法、装置及其设备
WO2021251744A1 (ko) * 2020-06-10 2021-12-16 엘지전자 주식회사 Aps에 대한 식별자를 시그널링하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체
CN112429475B (zh) * 2020-09-29 2023-06-30 贵州大学 一种胶囊排序送料装置
WO2022115113A1 (en) * 2020-11-30 2022-06-02 Intel Corporation Determining adaptive quantization matrices using machine learning for video coding

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06284412A (ja) 1993-03-26 1994-10-07 Sony Corp 画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
JPH07152693A (ja) 1993-11-29 1995-06-16 Canon Inc 情報処理装置
DE19618117C1 (de) 1996-05-06 1997-10-02 Siemens Ag Verfahren zur Quantisierung und Verfahren zur inversen Quantisierung von Transformationscodierungskoeffizienten eines Videodatenstorms
RU2201654C2 (ru) * 1997-12-23 2003-03-27 Томсон Лайсенсинг С.А. Способ низкошумового кодирования и декодирования
EP0944261A3 (en) * 1998-03-17 1999-10-06 Matsushita Electric Industrial Co., Ltd. Video signal processing apparatus
JP4099682B2 (ja) 1998-09-18 2008-06-11 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP2000152213A (ja) * 1998-11-17 2000-05-30 Nec Software Nagano Ltd 圧縮画像のセキュリティ装置および方法
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
KR100584552B1 (ko) 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
CA2513537C (en) * 2003-02-21 2013-03-26 Matsushita Electric Industrial Co. Ltd. Picture coding method and picture decoding method
JP4414328B2 (ja) * 2003-12-26 2010-02-10 パナソニック株式会社 画像処理装置及び画像処理装置
KR101082233B1 (ko) * 2004-01-20 2011-11-09 파나소닉 주식회사 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치,화상 복호화 장치 및 그 프로그램
CN101699866B (zh) * 2004-01-30 2016-08-03 松下电器(美国)知识产权公司 运动图片编码方法和运动图片解码方法
EP2373033A3 (en) * 2004-01-30 2011-11-30 Panasonic Corporation Picture coding and decoding method, apparatus, and program thereof
US20050190836A1 (en) 2004-01-30 2005-09-01 Jiuhuai Lu Process for maximizing the effectiveness of quantization matrices in video codec systems
JP4393319B2 (ja) * 2004-09-08 2010-01-06 キヤノン株式会社 画像符号化装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
EP1675402A1 (en) * 2004-12-22 2006-06-28 Thomson Licensing Optimisation of a quantisation matrix for image and video coding
US7653129B2 (en) * 2004-12-28 2010-01-26 General Instrument Corporation Method and apparatus for providing intra coding frame bit budget
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
SI2380592T1 (en) 2005-11-14 2018-06-29 Teva Pharmaceuticals International Gmbh The antibody to the calcitonin-related peptide antagonist
AU2006320064B2 (en) * 2005-11-30 2010-09-09 Kabushiki Kaisha Toshiba Image encoding/image decoding method and image encoding/image decoding apparatus
AU2006338425B2 (en) * 2006-02-13 2010-12-09 Kabushiki Kaisha Toshiba Moving image encoding/decoding method and device and program
JP2007318516A (ja) 2006-05-26 2007-12-06 Sony Corp プログラム、情報処理装置、情報処理方法、並びに、記録媒体
KR100773761B1 (ko) * 2006-09-14 2007-11-09 한국전자통신연구원 동영상 부호화 장치 및 방법
US8718139B2 (en) 2007-01-12 2014-05-06 Mitsubishi Electric Corporation Image decoding device and image decoding method
JP2008193627A (ja) * 2007-01-12 2008-08-21 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法
US20080253449A1 (en) 2007-04-13 2008-10-16 Yoji Shimizu Information apparatus and method
EP2077670A4 (en) * 2007-07-11 2011-09-28 Panasonic Corp TRANSCODER, TRANSCODING METHOD, DECODER, AND DECODING METHOD
JPWO2009050897A1 (ja) * 2007-10-19 2011-02-24 パナソニック株式会社 符号化レート変換装置、符号化レート変換方法および集積回路
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8660193B2 (en) * 2009-01-12 2014-02-25 Maxim Integrated Products, Inc. Parallel, pipelined, integrated-circuit implementation of a computational engine
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
JP5359657B2 (ja) 2009-07-31 2013-12-04 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5344238B2 (ja) 2009-07-31 2013-11-20 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5914962B2 (ja) 2010-04-09 2016-05-11 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
TWI600318B (zh) 2010-05-18 2017-09-21 Sony Corp Image processing apparatus and image processing method
CN108366264B (zh) 2010-06-04 2022-08-26 索尼公司 图像处理设备和方法
US9167252B2 (en) 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
US9258573B2 (en) * 2010-12-07 2016-02-09 Panasonic Intellectual Property Corporation Of America Pixel adaptive intra smoothing
CN106791878B (zh) 2010-12-07 2019-05-14 索尼公司 图像处理设备和图像处理方法
RU2691962C2 (ru) 2010-12-07 2019-06-19 Сони Корпорейшн Устройство обработки изображений и способ обработки изображений
JP5741076B2 (ja) 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
KR101989613B1 (ko) 2011-02-10 2019-06-14 벨로스 미디어 인터내셔널 리미티드 화상 처리 장치 및 화상 처리 방법
BR122020013607B1 (pt) 2011-03-11 2023-10-24 Sony Corporation Aparelho e método de processamento de imagem
JP2012238927A (ja) 2011-05-09 2012-12-06 Sony Corp 画像処理装置及び画像処理方法
CN106937126B (zh) 2011-05-20 2019-11-15 索尼公司 图像处理装置和图像处理方法
TWI530161B (zh) 2011-06-07 2016-04-11 Sony Corp Image processing apparatus and method
JP5907367B2 (ja) 2011-06-28 2016-04-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
CN107295335B (zh) 2011-06-28 2020-03-17 索尼公司 图像处理装置和图像处理方法
US20140133547A1 (en) 2011-08-30 2014-05-15 Sony Corporation Image processing device and image processing method
KR102074601B1 (ko) 2012-02-29 2020-02-06 소니 주식회사 화상 처리 장치 및 방법, 및 기록 매체
CN104380752B (zh) 2012-06-29 2018-10-23 威勒斯媒体国际有限公司 编码设备和编码方法

Also Published As

Publication number Publication date
TWI629894B (zh) 2018-07-11
US20190166368A1 (en) 2019-05-30
US20150063447A1 (en) 2015-03-05
KR20180080334A (ko) 2018-07-11
EP3462738A1 (en) 2019-04-03
SG10201606972VA (en) 2016-10-28
US9967564B2 (en) 2018-05-08
CN103780912A (zh) 2014-05-07
RU2014150547A (ru) 2016-07-10
CN107682706B (zh) 2020-04-03
US11196996B2 (en) 2021-12-07
US20220078426A1 (en) 2022-03-10
US20180234680A1 (en) 2018-08-16
EP2675161B1 (en) 2018-11-14
US20130322525A1 (en) 2013-12-05
RU2609094C2 (ru) 2017-01-30
CN107682706A (zh) 2018-02-09
CA2819401C (en) 2020-02-11
CN103370935B (zh) 2017-11-21
JP2015084556A (ja) 2015-04-30
BR122014031521B1 (pt) 2022-08-23
EP4254953A2 (en) 2023-10-04
US20200099931A1 (en) 2020-03-26
US11166024B2 (en) 2021-11-02
JP2019165468A (ja) 2019-09-26
JP2016195429A (ja) 2016-11-17
KR20200105544A (ko) 2020-09-07
JP2018011340A (ja) 2018-01-18
ES2708940T3 (es) 2019-04-12
JP2016195430A (ja) 2016-11-17
US20220014746A1 (en) 2022-01-13
JP5967179B2 (ja) 2016-08-10
TW201540048A (zh) 2015-10-16
US11831873B2 (en) 2023-11-28
US10674153B2 (en) 2020-06-02
CN107566845B (zh) 2020-03-03
MY191819A (en) 2022-07-18
JP6211653B2 (ja) 2017-10-11
TWI590646B (zh) 2017-07-01
TW201249114A (en) 2012-12-01
HK1250109A1 (zh) 2018-11-23
RU2595624C2 (ru) 2016-08-27
KR102205752B1 (ko) 2021-01-22
MY169660A (en) 2019-04-26
AU2012215968A1 (en) 2013-07-18
US10531089B2 (en) 2020-01-07
TW201830960A (zh) 2018-08-16
KR20190069613A (ko) 2019-06-19
US10225554B2 (en) 2019-03-05
US20240040123A1 (en) 2024-02-01
US20130251032A1 (en) 2013-09-26
CO6751263A2 (es) 2013-09-16
CA3063234A1 (en) 2012-08-16
WO2012108237A1 (ja) 2012-08-16
CN107509077A (zh) 2017-12-22
JP5966932B2 (ja) 2016-08-10
PH12018501219A1 (en) 2019-03-11
US20200252612A1 (en) 2020-08-06
EP2675161A4 (en) 2016-03-16
KR101874143B1 (ko) 2018-07-03
MX2018013536A (es) 2021-06-23
TW201722153A (zh) 2017-06-16
KR20140010029A (ko) 2014-01-23
CN107566845A (zh) 2018-01-09
MX2013008980A (es) 2013-11-01
TWI528734B (zh) 2016-04-01
US20150043816A1 (en) 2015-02-12
CA3211497A1 (en) 2012-08-16
US20190182485A1 (en) 2019-06-13
CA2819401A1 (en) 2012-08-16
CN107509077B (zh) 2020-08-07
AU2012215968A2 (en) 2013-08-01
KR101989613B1 (ko) 2019-06-14
AU2012215968B2 (en) 2015-12-24
MX348562B (es) 2017-06-20
TWI695617B (zh) 2020-06-01
SG10201400975QA (en) 2014-07-30
CN103780912B (zh) 2017-11-24
CA3063234C (en) 2023-09-19
US9706205B2 (en) 2017-07-11
US9986241B2 (en) 2018-05-29
CN103370935A (zh) 2013-10-23
PH12018501219B1 (en) 2019-03-11
PH12015501742A1 (en) 2017-06-14
BR122014031521A2 (pt) 2019-08-20
US11825089B2 (en) 2023-11-21
SG10201912144SA (en) 2020-02-27
ZA201304780B (en) 2016-07-27
US8897361B2 (en) 2014-11-25
US20170310966A1 (en) 2017-10-26
RU2013136367A (ru) 2015-02-10
EP4254953A3 (en) 2024-01-03
EP2675161A1 (en) 2013-12-18
JP6726334B2 (ja) 2020-07-22
PH12015501742B1 (en) 2017-06-14
BR112013019937A2 (pt) 2016-12-13
JPWO2012108237A1 (ja) 2014-07-03
US10257515B2 (en) 2019-04-09
JP6208822B2 (ja) 2017-10-04

Similar Documents

Publication Publication Date Title
US11825089B2 (en) Image processing device and image processing method
AU2018206825B2 (en) Image processing device and image processing method
AU2015202011B2 (en) Image Processing Device and Image Processing Method

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: VELOS MEDIA INTERNATIONAL LIMITED (IE)

B15K Others concerning applications: alteration of classification

Ipc: H04N 19/124 (2014.01), H04N 19/103 (2014.01), H04N

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 18/01/2012, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.

B25A Requested transfer of rights approved

Owner name: SONY GROUP CORPORATION (JP)