BR102013010166A2 - Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo - Google Patents

Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo Download PDF

Info

Publication number
BR102013010166A2
BR102013010166A2 BRBR102013010166-4A BR102013010166A BR102013010166A2 BR 102013010166 A2 BR102013010166 A2 BR 102013010166A2 BR 102013010166 A BR102013010166 A BR 102013010166A BR 102013010166 A2 BR102013010166 A2 BR 102013010166A2
Authority
BR
Brazil
Prior art keywords
decoding
group
time
video image
groups
Prior art date
Application number
BRBR102013010166-4A
Other languages
English (en)
Inventor
Junpei Koyama
Kimihiko Kazui
Satoshi Shimada
Akira Nakagawa
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of BR102013010166A2 publication Critical patent/BR102013010166A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo. Um método inclui determinar um grupo ao qual cada bloco pertence, os blocos sendo obtidos dividindo cada fotografia incluída nos dados de imagem de vídeo; adicionar, a um fluxo de saída, informação de grupos incluindo blocos; calcular um tempo de decodificação para grupos e adicionar o tempo de decodificação ao fluxo de saída; calcular um tempo de exibição para os grupos e adicionar o tempo de exibição ao fluxo de saída; controlar uma quantidade de codificação de modo que os dados usados para decodificar todos os blocos incluídos em um grupo chheguem a uma memória temporária de recebimento de um dispositivo de decodificação pelo tempo de exibição; codificação baseada na quantidade de codificação controlada; e implementar controle de modo que os primeiros dados em uma próxima fotoggrafia não cheguem à memória temporária de recebimento pelo tempo de exibição.

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVO DE CODIFICAÇÃO DE IMAGEM DE VÍDEO, MÉTODO DE CODIFICAÇÃO DE IMAGEM DE VÍDEO, DISPOSITIVO DE DECODIFICAÇÃO DE IMAGEM DE VÍDEO, E MÉTODO DE DECODIFICAÇÃO DE IMAGEM DE VÍDEO". CAMPO
As modalidades discutidas no presente documento referem-se a um dispositivo de codificação de imagem de vídeo, a um método de codificação de imagem de vídeo, a um dispositivo de decodificação de imagem de vídeo, e a um método de decodificação de imagem de vídeo, para dividir uma fotografia incluída em dados de imagem de vídeo em blocos plurais e codificar cada bloco.
ANTECEDENTES
Em geral, os dados de imagem de vídeo incluem uma grande quantidade de dados. Assim, um dispositivo para manipular dados de imagem de vídeo comprime os dados de imagem de vídeo codificando os dados de imagem de vídeo, ao enviar os dados de imagem de vídeo para outro dispositivo ou ao armazenar os dados de imagem de vídeo em um dispositivo de armazenamento.
Como uma tecnologia padrão representativa para codificar imagens de vídeo, MPEG (Moving Picture Experts Group phase)-2, MPEG-4, ou MPEG-4 AVC/H.264 (H.264 MPEG-4 Advanced Video Coding) desenvolvidos em ISO/IEC (International Standardization Organization/ International Electrotechnical Commission) é amplamente usado.
Como as tecnologias de codificação padrão descritas acima, e-xiste um método de intercodificação para codificar uma fotografia usando informação da fotografia que é o alvo de codificação e informação de fotografias antes e depois do alvo de codificação, e um método de intracodifica-ção para codificar uma fotografia usando somente informação da fotografia que é o alvo de codificação.
Em geral, a quantidade de codificação de fotografias ou blocos que foram codificados pelo método de intercodificação é menor do que a quantidade de codificação de fotografias ou blocos que foram codificados pelo método de intracodificação. Portanto, de acordo com o modo de codificação selecionado, a quantidade de codificação de fotografias torna-se desproporcional dentro da mesma sequência. Similarmente, de acordo com o modo de codificação selecionado, a quantidade de codificação de blocos torna-se desproporcional dentro da mesma fotografia.
Portanto, a fim de transmitir um fluxo de dados incluindo imagens de vídeo codificadas por uma taxa de transmissão constante mesmo se a quantidade de codificação varia ao longo do tempo, o dispositivo de fonte de transmissão é provido com uma memória temporária de transmissão para um fluxo de dados, e o dispositivo de destinação de transmissão é provido com uma memória temporária de recepção para um fluxo de dados.
Um retardo causado por estas memórias temporárias (daqui em diante, "retardo de memória temporária") é o fator principal que causa um retardo de quando cada fotografia é introduzida no dispositivo de codificação até cada fotografia ser exibida em um dispositivo de decodificação (daqui em diante "retardo de codec (codificador/decodificador"). Como o retardo de co-dec, existe retardo de decodificação que é um retardo relevante para decodificação, e exibe o retardo que é um retardo relevante para exibição (saída).
Ao reduzir o tamanho da memória temporária, o retardo de memória temporária e o retardo de codec são reduzidos. No entanto, na medida em que o tamanho da memória temporária diminui o grau de liberdade na alocação da quantidade de codificação para cada fotografia diminui. Consequentemente, a qualidade de imagem de uma imagem de vídeo reproduzida é deteriorada. O grau de liberdade na alocação da quantidade de alocação significa a extensão de variação na quantidade de codificação. MPEG-2 e MPEG-4 AVC/H.264, respectivamente, especificam VBV (Verificador de Memória Temporária Codificada) e CPB (Memória Temporária de Fotografia Codificada), que são operações de uma memória temporária de recepção em um dispositivo de decodificação ideal.
Um dispositivo de codificação de imagem de vídeo controla a quantidade de codificação de modo que a memória temporária de recepção de um dispositivo de decodificação ideal não excede ou excede em capaci- dade negativa. Um dispositivo de decodificação ideal é especificado para realizar decodificação instantânea, onde o tempo tomado para um processo de decodificação é zero. Por exemplo, existe uma tecnologia para controlar um dispositivo de codificação de imagem de vídeo relevante para VBV (ver, por exemplo, Documento de Patente 1). O dispositivo de codificação de imagem de vídeo controla a quantidade de codificação para assegurar que os dados de uma fotografia a ser decodificada sejam armazenados na memória temporária de recepção no momento em que o dispositivo de decodificação ideal decodifica a fotografia, de modo que a memória temporária de recepção do dispositivo de decodificação ideal não excede ou excede em capacidade negativa. A memória temporária de recepção excede em capacidade negativa quando o dispositivo de codificação de imagem de vídeo transmite um fluxo por uma taxa de transmissão constante, mas a transmissão de dados usados para decodificar a fotografia não é concluída até o momento em que o dispositivo de decodificação de imagem de vídeo decodifica e exibe as fotografias, porque há uma grande quantidade de decodificação para cada fotografia. Isto é, o excesso em capacidade negativa da memória temporária de recepção significa que os dados usados para decodificar uma fotografia não estão presentes na memória temporária de recepção do dispositivo de decodificação. Neste caso, não é possível para o dispositivo de decodifica-ção de imagem de vídeo realizar um processo de decodificação e, portanto, o quadro é ignorado. A fim de realizar um processo de decodificação sem levar a memória temporária de recepção a exceder em capacidade negativa, o dispositivo de decodificação de imagem de vídeo exibe uma fotografia após retardar um fluxo por uma extensão predeterminada de tempo a partir do momento da recepção.
Como descrito acima, um dispositivo de decodificação ideal é especificado de modo que o processo de decodificação é instantaneamente concluído por um tempo de processamento de zero. Portanto, presumindo que o tempo de introdução de uma "i" ésima fotografia (daqui em diante também expressada como "P(i)") no dispositivo de codificação de imagem de vídeo é t(i) e o tempo de decodificação P(i) no dispositivo de decodifica-ção ideal é dt(i), é possível exibir esta fotografia ao mesmo tempo que o tempo de decodificação, isto é, em dt(i).
Para todas as fotografias, o período de tempo de exibição da fo-tografia{(t(i+1)-t(i)} e {dt(i+1)-dt(i)} é igual e, portanto, o tempo de decodificação dt(i) torna-se {dt(i)=t(i)+dly}, que é exibido por um tempo fixo dly a partir do tempo de entrada t(i). Consequentemente, o dispositivo de codificação de imagem de vídeo tem que completar os dados de transmissão usados para decodificação para a memória temporária de recepção do dispositivo de decodificação de imagem de vídeo até o tempo dt(i). A figura 1 ilustra um exemplo de transição da quantidade de o-cupação da memória temporária da memória temporária de recepção de a-cordo com a tecnologia convencional. No exemplo da figura 1, o eixo horizontal indica o tempo e o eixo vertical indica a quantidade de ocupação da memória temporária da memória temporária de recepção. Uma linha 10 indicada por uma linha sólida indica a quantidade de ocupação da memória temporária em cada ponto de tempo.
Na memória temporária de recepção, a quantidade de ocupação da memória temporária é recuperada a uma taxa de transmissão predeterminada, e os dados usados para decodificar uma fotografia no momento da decodificação de cada fotografia são extraídos a partir da memória temporária. No exemplo da figura 1, os dados de P(i) começam a ser introduzidos na memória temporária de recepção em um tempo em(i), e o último dado de P(i) é introduzido em um tempo ft(i). O dispositivo de decodificação ideal completa a decodificação P(i) em um tempo dt(i), e é possível exibir P(i) no tempo dt(i). O dispositivo de decodificação ideal realiza decodificação instantânea, enquanto um dispositivo de decodificação de imagem de vídeo atual toma uma extensão de tempo predeterminada para efetuar um processo de decodificação. Em geral, o tempo de processo de decodificação para uma fotografia é mais curto do que o período de exibição de uma fotografia; no entanto, o dispositivo de decodificação de imagem de vídeo atual toma uma quantidade de tempo próximo ao período de exibição de uma fotografia para efetuar o processo de decodificação.
Os dados de P(i) são introduzidos na memória temporária de recepção a partir do tempo em(i) para o tempo ft(i). No entanto, o tempo em que os dados usados para decodificar cada bloco chegam entre(i) e ft(i) não é assegurado. Portanto, o dispositivo de decodificação de imagem de vídeo inicia o processo de decodificação P(i) a partir do tempo ft(i). Consequentemente, presumindo que o tempo de processamento máximo a ser tomado para decodificar uma fotografia é ct, somente é possível assegurar que o dispositivo de decodificação de imagem de vídeo atual conclui o processo de decodificação dentro do tempo ft(i) + ct. O dispositivo de codificação de imagem de vídeo assegura que os dados usados para decodificar P(i) chegam à memória temporária de recepção até o temo dt(i), isto é, é assegurado que ft(i) < dt(i) é satisfeito. Assim, quando ft(i) está no tempo mais recente, ft(i) torna-se igual a dt(i).
Neste caso, o tempo em que o término do processo de decodificação de todo P(i) é assegurado é dt(i) + ct. Para exibir todas as fotografias a intervalos iguais, o dispositivo de decodificação de imagem de vídeo deve retardar os tempos de exibição das respectivas fotografias em pelo um tempo ct com respeito ao dispositivo de decodificação ideal.
Em VBV de MPEG-2 e CPB de MPEG-4 AVC/H.264, a diferença entre o tempo de chegada de cada fotografia codificada no dispositivo de decodificação de imagem de vídeo e o tempo de exibição de cada fotografia codificada que foi codificada é expressa como (ft(i) - at(i) + ct). Isto é, é difícil obter um retardo de codec menor do que o tempo ct, onde o retardo de codec estende-se a partir de quando cada fotografia é introduzida no dispositivo de codificação para quando a fotografia é emitida no dispositivo de decodificação. Isto é, o tempo ct é geralmente o tempo de processamento para uma fotografia, e, portanto, é difícil obter um retardo de codec menor do que o tempo de processamento para uma fotografia.
Documento de Patente 1: Publicação de Patente JP Aberta ao Público η2 2003-179938 Documento não Patente 1: JCTVC-H1003, "High Efficiency Video Coding (HEVC) text specification draft 6", Joint Collaborative Team on Video Coding of ITU-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11, fevereiro de 2012.
Documento não Patente 2: MPEG-2 Test Model 5. Abril de 1993. ISO-IEC/JTC1/SC29/WG11/N0400 (http://www.mpea.ora/MPEG/MSSG/tm5A
Na tecnologia convencional, é difícil fazer um retardo de codec tornar-se o tempo de processamento para uma fotografia. No entanto, existe o seguinte método para fazer o retardo de codec tornar-se menos do que o tempo de processamento para uma fotografia. Por exemplo, este método é para atribuir cada bloco em uma fotografia a um de um números de grupos N, e atribuir um tempo de início de decodificação para cada grupo. Um grupo é, por exemplo, uma linha de blocos. Uma linha de blocos expressa uma linha de blocos na direção horizontal da fotografia.
Se a quantidade de informação gerada em cada grupo é feita u-niforme, a diferença no tempo de início de decodificação de grupo contínuos iguala o tempo de processamento para cada grupo, e o tempo ct torna-se o tempo de processamento ct/N de cada grupo. Assim, como um resultado, é possível diminuir o retardo de codec para o tempo de processamento de cada grupo. A figura 2 ilustra um exemplo onde o retardo de codec é feito para ser menor do que um tempo de fotografia por divisão de grupos. Uma linha de gráfico 17 na figura 2 expressa a transição de tempo da quantidade de ocupação da memória temporária do método convencional. Entretanto, uma linha de gráfico 15 na figura 2 expressa a transição de tempo da quantidade de ocupação da memória temporária de acordo com a divisão de grupos.
De acordo com o método de divisão de grupos, o tempo de início de decodificação dgt (i, n) do "n" ésimo grupo de P(i) (daqui em diante, também expresso como G (i, n)) é definido, e a quantidade de ocupação da memória temporária é diminuída. Cada grupo é decodificado tomando o tempo de decodificação de grupo ct/N indicado pelo número de referência 16 partindo do tempo de início de decodificação correspondente. Portanto, o retardo no tempo possível de retardo (o tempo durante o qual a exibição é possível) de cada grupo é reduzido.
No método de divisão de grupos, a quantidade de informação gerada em cada grupo é substancialmente igual, e, portanto o retardo de codec é reduzido para o tempo por grupo. O retardo de codec é o valor máximo em Um caso onde a quantidade de geração de informação em cada bloco no grupo é significativamente desproporcional. No entanto, sob as circunstâncias atuais, a desproporção na quantidade de informação gerada em cada bloco no grupo é reduzida pelo controle de taxa apropriado. Neste caso, é teoricamente possível reduzir mais ó retardo de codificação, mas isto é difícil de obter pelo método de divisão de blocos. A razão para isto é descrito com referência às figuras 3 a 6. A figura 3 ilustra as operações de uma memória temporária de recepção do dispositivo de decodificação de imagem de vídeo. No exemplo da figura 3, o valor cumulativo da quantidade de dados codificados que chegam à memória temporária de recepção e o valor cumulativo de dados codificador consumidos por um processo de decodificação são usados para expressar as operações de uma memória temporária de recepção.
Uma linha de gráfico 20 na figura 3 expressa o valor cumulativo da quantidade de dados codificados que chegam à memória temporária de recepção. Os dados codificados são transmitidos a partir do dispositivo de codificação de imagem de vídeo para o dispositivo de decodificação de imagem de vídeo por uma taxa fixa R. No exemplo da figura 3, o primeiro bit chega à memória temporária de recepção do dispositivo de decodificação de imagem de vídeo em um tempo "at (0)", que é zero.
Uma linha de gráfico 21 na figura 3 expressa o valor cumulativo dos dados codificados consumidos por um processo de decodificação instantânea nas unidades das fotografias. Após o retardo inicial dly, a i ésima fotografia P(i) (i=0, ...) é sequencialmente submetida a decodificação instan- tânea em dt(i). A diferença de dt(i+1)-dt(i) no tempo de decodificação instantânea entre duas fotografias é fixado. A quantidade de informação de codificação de P(i) é expressa por b(i). at(i) e ft(i) expressam o tempo em que o primeiro bit nos dados codificados de P(i) e o último bit nos dados codificados de P(i) chegam ao dispositivo de decodificação de imagem de vídeo, respectivamente. A fim de prevenir a memória temporária de recepção do dispositivo de decodificação de imagem de vídeo de exceder em capacidade negativa, todos os dados codificados de P(i) devem chegar a dt(i). Isto é, dt(i)>at(i) devem ser satisfeitos. A capacidade da memória temporária de recepção em cada tempo corresponde à diferença entre a linha de gráfico 20 e a linha de gráfico 21 em cada tempo. Por exemplo, a capacidade da memória temporária de recepção após decodificação instantânea de P(0) no tempo dt(0) é a quantidade de bits indicada por um número de referência 25. A figura 4 ilustra a operação da memória temporária de recepção focalizando sobre um P(i). A figura 4 é ilustrada aumentando parte da figura 3. Particularmente, o exemplo da figura 4 ilustra um caso onde a decodificação instantânea é realizada nas unidades das fotografias, a memória temporária de recepção do dispositivo de decodificação de imagem de vídeo não excede em capacidade negativa e at(i) e ft(i) são os tempos mais recentes, isto é, dt(i)=ft(i) e dt(i-1)=at(i). No exemplo da figura 4, o número de grupos N é 4, e o número de blocos e a quantidade de informação gerada de cada um dos grupos dgt (i, n+1)-dgt (i, n) são uniformes.
Uma linha de gráfico 30 na figura 4 expressa o valor cumulativo da quantidade de dados codificados que chegam à memória temporária de recepção do dispositivo de decodificação de imagem de vídeo. Uma linha de gráfico 31 expressa o valor cumulativo de dados consumidos por decodificação instantânea nas unidades das fotografias.
Uma linha de gráfico 32 expressa o valor cumulativo de dados codificados consumidos por decodificação instantânea no "n" ésimo grupo G (i, n) de P(i) em dgt (i, n).
No método de divisão de grupos, presume-se que as quantidades de informação gerada nos respectivos grupos são a média calculada na fotografia. Isto é, a soma total das quantidades de informação gerada nos blocos nos grupos de P(i) é b(i)/N. b(i) é a quantidade de informação gerada em P(i). O valor mínimo da quantidade de informação gerada nos blocos nos grupos de P(i) é zero, e o valor máximo é b(i)/N. Em um caso onde os blocos em P(i) são instantaneamente decodificados a intervalos iguais a partir de dt (i-1) para dt(i), uma linha de gráfico f(t) expressando o valor cumulativo dos dados codificados consumidos está presente dentro das áreas quadradas indicadas pelos números de referência 35 a 38.
Quando as quantidades de informação gerada nos blocos são iguais, f(t) é uma linha reta (igualando a linha de gráfico 30) unindo o vértice esquerdo de fundo e o vértice direito de topo de cada uma das áreas quadradas indicadas pelos números de referência 35 a 38. Quando uma quantidade de bits de todo o grupo é gerada no bloco líder, f(t) é uma linha conectando a borda esquerda e a borda de topo de cada uma das áreas quadradas. O último caso corresponde ao retardo máximo em termos de retardo da memória temporária.
No exemplo da figura 4, entre os tempos de dt(i-1) a dt(i), os bits dos blocos em P(i) chegam à memória temporária de recepção. O tempo (g(x) de chegada do "x" ésimo bit (x=[1 ,b(i)]) é expresso pela seguinte fórmula. Fórmula 1 ( x \ g(x) = dt(i -1) + (dt(i) - dt(i -1))* —— Em vista das operações de um dispositivo de decodificação de imagem de vídeo atual, um caso onde os blocos em P(i) são decodificados instantaneamente a intervalos iguais a partir de dt(1-1) para dt(i) é considerado. Presumindo que o número total de blocos na fotografia é Μ, o tempo de decodificação instantânea ideal p(i,m) do "m" ésimo bloco em P(i) é expresso pela seguinte fórmula. Fórmula 2 p(i, m) = dt(i — 1) + (dt(i) — dt(i — 1))* í — \M ) Dependendo da forma de f(t), f(t) pode estar acima da linha de gráfico 30. Isto é, f(p(i,m))<g(f(p(i,m))) é satisfeito, e todos os bits usados para decodificar o bloco não alcançam a memória temporária de recepção do dispositivo de decodificação de imagem de vídeo, e ocorre excesso em capacidade negativa. Quando os blocos têm um número igual de bits, f(p(i,m)=g(f(p(i,m))) é satisfeito e excesso em capacidade negativa não ocorre, mas este é o pior caso em termos de retardo de memória temporária.
Quando a quantidade de bits de todo o grupo é gerada no bloco líder, o tempo de chegada de todos os bits usados para decodificar o bloco líder é retardado por dgt(1, n+1)-dtgi, n).
No método de divisão de grupos, a forma de f(t) não é conhecida para o dispositivo de decodificação de imagem de vídeo. Portanto, é assegurado que o excesso em capacidade negativa é impedido mesmo se o retardo da chegada de bits do bloco líder de G(i, n) for o valor máximo dgt (i, n)-dgt (i, n-1). Assim, o tempo de decodificação instantânea de todos os blocos em G(i, n) deve ser retardado para dgt (i, n). Isto é, o tempo de início de decodificação do bloco líder em P(i) é dgt (i,1). Assim, o primeiro problema com a tecnologia convencional é que não é possível reduzir mais o retardo de co-dec.
Além disso, na tecnologia convencional, presume-se que é possível exibir instantaneamente a fotografia após decodificação por um tempo de decodificação ct/N. No entanto, no Documento não Patente 1, um método de codificação referido como azulejos é usado, pelo qual a fotografia não somente é dividida horizontalmente, mas também pode ser dividida verticalmente. Assim, mesmo após decodificação por um tempo de decodificação ct/N, pode haver casos onde não é possível exibir instantaneamente a fotografia. Um exemplo onde não é possível exibir instantaneamente a fotografia é descrito com referência à figura 5. A figura 5 ilustra um exemplo onde a exibição instantânea de uma imagem não é possível. No Documento não Patente 1, as áreas de uma fotografia, que são obtidas dividindo a fotografia não somente horizontalmente, mas também verticalmente, são referidas como azulejos. No exemplo da figura 5, a fotografia é dividida em quatro azulejos.
Na ordem da esquerda de topo, direita de topo, esquerda de fundo e direita de fundo, os azulejos são referidos como azulejo 0(t40), 1(t41), azulejo 2(t42) e azulejo 3(t43), e os azulejos são processados nesta ordem.
Além disso, dentro de cada azulejo, existem vários grupos incluindo blocos plurais. No exemplo da figura 5, os grupos 0 a 3 são indicados por s41 a s44. Neste caso, a decodificação é realizada na ordem dos grupos, que é uma ordem de varredura ou uma ordem de decodificação como indicado pelos números de referência sc41 a sc42.
Diferente da ordem de codificação, a ordem de exibição pode ser uma varredura de rastreio dependendo da exibição. Neste caso, a ordem é como indicado pelo número de referência sc43. Neste caso, mesmo se o processo de decodificação para os grupos estiver concluído, não é possível exibir instantaneamente a fotografia.
Por exemplo, imediatamente após decodificar um grupo 0 (s41), o CTB na metade esquerda da etapa superior da fotografia incluída no azulejo 0 (t40), por exemplo, um bloco b41 e um bloco b42, pertencendo ao grupo 0 (s41) e são assim exibíveis. No entanto, o CTB na metade direita da etapa superior da fotografia incluída no azulejo 1(t41), por exemplo, um bloco b45 e um bloco b46, pertencendo ao grupo 2 (s43), não são decodificados e assim não são exibíveis.
Quando a exibição é realizada por varredura de rastreio, a estrutura é configurada para exibir fotografias na ordem da borda esquerda da tela para a borda direita da tela. Portanto, quando a etapa de topo da fotografia deve ser exibido, o bloco pertencendo ao grupo 2 (s43) deve ser exibido. Portanto, deve ser aguardado que o grupo 2 (s43) seja decodificado de modo que o grupo 2 (s43) torne-se exibível. O tempo tomado para a decodificação do grupo 2 (s43) ser con- cluída é o tempo tomado para decodificar todos os blocos através dos quais sc41 e sc42 passam na ordem de varredura.
No método de divisão de grupos, a decodificação pode ser efetuada rapidamente, mas não há nenhuma consideração sobre o tempo exi-bível. Assim, o segundo problema com a tecnologia convencional é que a fim de assegurar que uma fotografia é exibida, o tempo para uma fotografia deve ser aguardado.
Além disso, o Documento não Patente 1 define uma operação quando a quantidade de bits a serem usados para decodificar uma fotografia é maior do que a quantidade de bits que podem ser acumulados em uma memória temporária, em um caso onde a fotografia é mais complexa. A figura 6 ilustra uma operação quando a quantidade de bits a serem usados para decodificar uma fotografia é maior do que a quantidade de bits que podem ser acumulados em uma memória temporária. O dispositivo de codificação de imagem de vídeo ajusta a quantidade de codificação de modo que o acúmulo da taxa R indicado por uma taxa predeterminada 51 em um gráfico 50 na figura 6 não excede o acúmulo 52 da quantidade de bits extraídos da fotografia.
No entanto, quando a fotografia é complexa, a quantidade de bits acumulados na memória temporária não é suficiente para codificação, e há casos onde ocorre excesso em capacidade negativa. Um exemplo é o caso de um gráfico 53 na figura 6.
Quando ocorre excesso em capacidade negativa, como indicado por um gráfico 54 na figura 6, o dispositivo de decodificação não inicia a decodificação no tempo de decodificação original dt (0) da fotografia, mas executa a decodificação no tempo dt’ quando os bits usados para decodificação são recebidos na memória temporária.
Geralmente, o tempo de exibição de uma fotografia retardada é o tempo dt (1), que é quando se supõe que a próxima fotografia é exibida. Para a fotografia suposta ser exibida no tempo dt(1), a decodificação é realizada, mas a exibição é ignorada. O terceiro problema com a tecnologia convencional é que o Do- cumento não Patente 1 não define claramente a operação quando ocorre excesso em capacidade negativa nas unidades dos grupos.
SUMÁRIO
De acordo com um aspecto das modalidades, um dispositivo de codificação de imagem de vídeo inclui uma unidade de determinação de configuração de grupo configurada para determinar um grupo ao qual cada uma de uma pluralidade de blocos pertence, a pluralidade de blocos que é obtida dividindo cada fotografia incluída em dados de imagem de vídeo; uma unidade de adição de informação de grupo configurada para adicionar, a um fluxo de saída, informação de grupo expressando o grupo ao qual cada uma da pluralidade de blocos pertence; uma unidade de determinação de tempo de decodificação configurada para calcular um tempo de decodificação para cada um dos grupos e adicionar o tempo de decodificação ao fluxo de saída; uma unidade de determinação de tempo de saída configurada para calcular um tempo de exibição para cada um dos grupos e adicionar o tempo de exibição ao fluxo de saída; uma unidade de controle da quantidade de codificação configurada para controlar uma quantidade de codificação de modo que os dados usados para decodificar todos os blocos incluídos em um dos grupos chegam a uma memória temporária de recepção de um dispositivo de decodificação por um tempo expresso pelo tempo de exibição calculado pela unidade de determinação de tempo de saída, quando os dados são transmitidos ao dispositivo de decodificação a uma taxa de transmissão predeterminada; uma unidade de processo de codificação configurada para realizar a codificação baseada na informação de controle da unidade de controle da quantidade de codificação; e uma unidade de controle da quantidade de informação configurada para implementar o controle de modo que os primeiros dados em uma próxima fotografia não chegam à memória temporária de recepção do dispositivo de decodificação pelo tempo de exibição, quando os dados usados para decodificar todos os blocos incluídos em um dos grupos não chegam à memória temporária de recepção do dispositivo de decodificação pelo tempo de exibição.
BREVE DESCRIÇÃO DOS DESENHOS A figura 1 ilustra um exemplo da transição da quantidade de o-cupação da memória temporária de uma memória temporária de recepção de acordo com a tecnologia convencional; a figura 2 ilustra um exemplo onde o retardo de codec é feito para ser menor do que um tempo de fotografia por divisão de grupos; a figura 3 ilustra operações de uma memória temporária de recepção de um dispositivo de decodificação de imagem de vídeo; a figura 4 ilustra a operação da memória temporária de recepção focalizando sobre um P(i); a figura 5 ilustra um exemplo onde o retardo instantâneo de uma imagem não é possível; a figura 6 ilustra uma operação onde a quantidade de bits a serem usados para decodificar uma fotografia é maior do que a quantidade de bits que podem ser acumulados em uma memória temporária; a figura 7 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de codificação de imagem de vídeo de acordo com uma primeira modalidade; a figura 8 ilustra um valor cumulativo dos dados codificados no caso de focalização sobre P(i); a figura 9 ilustra o retardo de exibição; a figura 10 ilustra a relação entre um valor cumulativo de quantidades de bits dos dados codificados que chegam à memória temporária de recepção e o valor cumulativo da quantidade de informação gerada em cada bloco em P(i); a figura 11 é para descrever o cálculo da informação do tempo de saída de grupo; a figura 12 é um fluxograma ilustrando um exemplo de um processo de codificação de imagem de vídeo de acordo com a primeira modalidade; a figura 13 é um fluxograma ilustrando um exemplo de um processo de saída de acordo com a primeira modalidade; a figura 14 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de decodificação de imagem de vídeo de a-cordo com uma segunda modalidade; a figura 15 é um fluxograma ilustrando um exemplo de um processo de decodificação de imagem de vídeo de acordo com a segunda modalidade; a figura 16 é um fluxograma ilustrando um exemplo de um processo de saída de acordo com a segunda modalidade; a figura 17 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de codificação de imagem de vídeo de acordo com uma terceira modalidade; a figura 18 é para descrever a ocorrência de excesso em capacidade negativa; a figura 19 é para descrever um processo realizado quando o-corre excesso em capacidade negativa; a figura 20 é um fluxograma ilustrando um exemplo de um processo do dispositivo de dispositivo de codificação de imagem de vídeo de acordo com a terceira modalidade; a figura 21 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de decodificação de imagem de vídeo de a-cordo com uma quarta modalidade; a figura 22 é um fluxograma ilustrando um exemplo de um processo do dispositivo de decodificação de imagem de vídeo de acordo com a quarta modalidade; e a figura 23 é um diagrama de bloco de um exemplo de um dispositivo de processamento de imagem de vídeo de acordo com uma primeira modalidade.
DESCRIÇÃO DAS MODALIDADES
As modalidades preferidas da presente invenção serão explicadas com referência aos desenhos anexos. Um dispositivo de codificação de imagem de vídeo descrito nas modalidades codifica fotografias incluídas em dados de imagem de vídeo nas unidades dos grupos, e emite um fluxo de bits como dados codificados. A fotografia pode ser um quadro ou um campo. Um quadro é uma imagem parada nos dados de imagem de vídeo, enquanto um campo é uma imagem parada contida por dados de extração das fileiras de número ímpar ou dados de fileiras de número par de um quadro.
Além disso, a imagem de vídeo que é um alvo de codificação pode ser uma imagem de vídeo colorida ou uma imagem de vídeo monocromática.
Primeira Modalidade Configuração A figura 7 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de codificação de imagem de vídeo 100 de acordo com uma primeira modalidade. O dispositivo de codificação de imagem de vídeo 100 inclui uma unidade de processo de codificação 110, uma unidade de controle da quantidade de codificação 120, uma unidade de determinar grupos 130, uma unidade de determinação de tempo de decodifica-ção 140, e uma unidade de determinação de tempo de saída 150. A unidade de processo de codificação 110 inclui uma unidade de transformação ortogonal 111, uma unidade de quantização 112, e uma unidade de codificação de entropia 113. A unidade de controle da quantidade de codificação 120 inclui uma unidade de cálculo do valor de quantização 121, uma unidade de cálculo da quantidade de ocupação da memória temporária 122 e um contador de bits 123. A unidade de controle da quantidade de codificação 120 controla a quantidade de codificação em um caso quando os dados usados para produzir todos os blocos incluídos em um grupo são transmitidos a um dispositivo de decodificação por uma taxa de transmissão predeterminada, de modo que os dados chegam a uma memória temporária de recepção de decodificação de um dispositivo de saída por um tempo expresso por um tempo de saída calculado e um retardo de saída determinado. A unidade de determinação de grupo 130 inclui uma unidade de determinação de configuração de grupo 131 e uma unidade de adição de informação de grupo 132. A unidade de determinação de tempo de decodificação 140 inclui uma unidade de cálculo de tempo de decodificação de grupo 141, uma unidade de determinação de retardo de decodificação de grupo 142, e uma unidade de adição de informação de retardo de decodificação de grupo 143. A unidade de determinação de tempo de saída 150 inclui uma unidade de cálculo de tempo de saída de grupo 151, uma unidade de determinação de retardo de saída de grupo 152 e uma unidade de adição de informação de retardo de saída de grupo 153.
As unidades incluídas no dispositivo de codificação de imagem de vídeo 100 são montadas no dispositivo de codificação de imagem de vídeo 100 como circuitos separados. Alternativamente, as unidades incluídas no dispositivo de codificação de imagem de vídeo 100 podem ser montadas no dispositivo de codificação de imagem de vídeo 100 como um circuito integrado único em que os circuitos que implementam as funções das unidades são integrados. Alternativamente, as unidades incluídas no dispositivo de codificação de imagem de vídeo 100 podem ser módulos funcionais concebidos por programas de computador executados em um processador incluído no dispositivo de codificação de imagem de vídeo 100. A fotografia alvo de codificação incluída no vídeo é dividida nas unidades de blocos por uma unidade de controle (não ilustrada), e os respectivos blocos são introduzidos na unidade de transformação ortogonal 111. Os blocos incluem, por exemplo, 16 x 16 pixéis. A unidade de transformação ortogonal 111 calcula um valor in-traprevisto ou um valor interprevisto de uma fotografia que foi decodificada localmente e armazenada em uma memória de quadro (não ilustrada). Então, a unidade de transformação ortogonal 111 realiza uma operação da diferença sobre o bloco de entrada e o valor calculado, e calcula um erro de bloco previsto. Além disso, a unidade de transformação ortogonal 111 realiza a transformação ortogonal sobre o erro de bloco previsto. A unidade de quantização 112 realiza quantização sobre o erro de bloco previsto que sofreu a transformação ortogonal. O parâmetro de quantização (informação de controle) em uma operação de quantização é dado pela unidade de cálculo do valor de quantização 121. O coeficiente de transformação ortogonal quantizado obtido como um resultado da quantização e o parâmetro (direção intraprevista, informação de vetor de movimento) de intraprevisão ou interprevisão são emitidos para a unidade de codificação de entropia 113 como os dados comprimidos do bloco. Uma uriidade de de-codificação local (não ilustrada) realiza a quantização inversa e a transformação ortogonal inversa sobre o coeficiente de transformação ortogonal quantizado, e então adiciona o valor intraprevisto ou o valor interprevisto para gerar um bloco decodificado localmente, e armazena o bloco em uma memória de quadro. A unidade de codificação de entropia 113 efetua a saída da codificação de entropia nos dados comprimidos do bloco a partir da unidade de quantização 112. A unidade de cálculo do valor de quantização 121 calcula o valor de quantização de cada bloco a partir do estado da memória temporária de recepção em um dispositivo de decodificação ideal e o limite superior da quantidade de informação gerada de um bloco a ser codificado em seguida, que são emitidos a partir da unidade de cálculo da quantidade de ocupação da memória temporária. A unidade de cálculo da quantidade de ocupação da memória temporária 122 calcula o estado da memória temporária de recepção em um dispositivo de decodificação ideal e o limite superior da quantidade de informação gerada de um bloco a ser codificado em seguida, baseada em um valor cumulativo da quantidade de bits dos dados codificados emitida a partir do contador de bits 123, informação de grupo emitida a partir da unidade de determinação de configuração 131, e o tempo de decodificação do grupo e o retardo de decodificação do grupo emitido a partir da unidade de determinação de retardo de decodificação de grupo 142. O contador de bits 123 conta o número de bits de saída da unidade de codificação de entropia 113, e emite um valor cumulativo dos dados codificados. A unidade de determinação de configuração de grupo 131 determina, para uma pluralidade de blocos, o grupo ao qual cada bloco pertence. A unidade de determinação de configuração de grupo 131 determina o grupo ao qual um bloco que passa por um processo de codificação pertence por um método predeterminado, usando a informação de contagem de blocos recebida de uma unidade de controle (não ilustrada) e a informação da especificação do método de codificação recebida de uma unidade de controle (não ilustrada). A informação de contagem de blocos expressa o número de cada bloco incluído em uma fotografia. Por exemplo, um número de um bloco na borda esquerda de topo de uma fotografia é fixado como um, e os números são atribuídos sequencialmente aos blocos na ordem da varredura de rastreío. Então, o número mais alto é atribuído ao bloco sobre a borda direita de fundo da fotografia. A informação de contagem de blocos pode incluir números atribuídos a blocos de acordo com outra ordem. A unidade de determinação de configuração de grupo 131 determina preferivelmente grupos plurais em um modo em que os respectivos grupos incluam o mesmo número de blocos tanto quanto possível, a fim de equalizar o tempo de processo de decodificação dos grupos.
Por exemplo, se a unidade de determinação de configuração de grupo 131 divide os blocos dentro dos grupos nas unidades de linhas de bloco, é possível equalizar o número de blocos incluídos em cada grupo em um tamanho de fotografia arbitrário.
Por exemplo,, quando o tamanho da fotografia é 1920 pixéis x 1088 pixéis correspondendo a uma Televisão de Alta Definição (HDTV), o tamanho do bloco é 16 pixéis x 16 pixéis e o número de linhas de bloco é 68. Portanto, neste caso, cada bloco incluído na fotografia alvo de codificação é classificado em um dos 68 grupos. O número de blocos incluídos em cada grupo pode ser um valor a partir de um até o número total de blocos em toda a tela. A unidade de determinação de configuração de grupo 131 relata a informação de identificação do grupo ao qual o bloco aivo de codificação pertence à unidade de cálculo da quantidade de ocupação da memória temporária 122. A unidade de determinação de configuração de grupo 131 relata a informação do bloco incluído em cada grupo à unidade de cálculo de tempo de decodificação de grupo 141 e à unidade de cálculo de tempo de saída de grupo 151. A unidade de determinação de configuração de grupo 131 pode relatar o índice do bloco posicionado no início de cada grupo à unidade de cálculo de tempo de decodificação de grupo 141 e à unidade de cálculo de tempo de saída de grupo 151. A unidade de adição de informação de grupo 132 adiciona, aos dados codificados, a informação de grupo indicando o número de grupos na fotografia e a informação de bloco em cada grupo. A unidade de cálculo de tempo de decodificação de grupo 141 calcula o tempo de decodificação de cada grupo a partir da informação de grupo emitida a partir da unidade de determinação de configuração de grupo 131, e relata o tempo de decodificação à unidade de determinação de retardo de decodificação de grupo 142. A unidade de determinação de retardo de grupo 142 determina o retardo de decodificação de cada grupo, e relata o retardo de decodificação junto com o tempo de decodificação de cada grupo à unidade de cálculo da quantidade de ocupação da memória temporária 122 e à unidade de adição de informação de retardo de decodificação de grupo 143. O retardo de decodificação determinado é relatado como informação de retardo. A unidade de adição de informação de retardo de decodificação de grupo 143 recebe o tempo de decodificação e o retardo de decodificação do grupo e adiciona esta informação aos dados codificados como informação de retardo de decodificação de grupo. A unidade de cálculo de tempo de saída de grupo 151 calcula um tempo de saída (também referido como "tempo de exibição") de cada grupo baseada na informação da especificação do método de codificação recebida de uma unidade de controle (não ilustrada) e informação de grupo emitida a partir da unidade de determinação de configuração de grupo 131, e relata a informação de tempo de saída à unidade de determinação de retardo de saída de grupo 152. A unidade de determinação de retardo de saída de grupo 152 determina o retardo de saída de cada grupo a partir do tempo de saída de cada grupo, e relata a informação de retardo de saída à unidade de adição de informação de retardo de saída de grupo 153. A unidade de adição de informação de retardo de saída de grupo 153 recebe o tempo de saída e o retardo de saída de cada grupo, e adiciona esta informação aos dados codificados como a informação de retardo de saída de grupo.
Retardo de Decodificacão Um caso onde os blocos em uma "i" ésima fotografia P(i) são decodificados instantaneamente a intervalos iguais entre dt(i-1) e dt(i) é considerado. Neste caso, a linha de gráfico cumulativo f(t) dos dados codificados consumidos, é possível reduzir o retardo de transmissão de bloco pelo controle de taxa apropriado tal como ajustando o limite inferior e o limite superior da quantidade de informação em cada bloco. Além disso, ao relatar esta informação ao dispositivo de decodificação de imagem de vídeo, o tempo de início de decodificação mais antigo do bloco pode ser mais acelerado. Uma descrição é dada com referência à figura 8. A figura 8 ilustra o valor cumulativo dos dados codificados no caso de focalização sobre P(i). Uma linha de gráfico 60 expressa o valor cumulativo da quantidade que chega de dados codificados na taxa de R. Uma linha de gráfico 61 é o valor cumulativo dos dados codificados consumidos em um caso onde a decodificação instantânea é realizada nas unidades das fotografias.
Os números de referência 62 a 66 são valores cumulativos dos dados codificados consumidos para decodificação nos respectivos grupos (GO a G4) expressos pelos números de referência 67 a 71.
Olhando para a relação entre a faixa em que os grupos estão presentes e a linha de gráfico 60, em G(1) a G(4), a taxa é constantemente maior do que o valor cumulativo dos dados codificados. Portanto, mesmo quando decodificação instantânea nos blocos em G(1) a G(4) é realizada a intervalos iguais entre dt(i-1) e dgt (i, 1), não ocorre excesso em capacidade negativa.
Em G(0), o valor cumulativo dos dados codificados em G(0) excede a taxa, e, portanto, ocorre excesso em capacidade negativa. Para evitar o excesso em capacidade negativa, o valor cumulativo dós dados codificados não deve exceder a taxa, e o valor mínimo é um intervalo At.
At é menos do que dgt (i, n)-dgt (i, n-1) em qualquer um dos grupos. O dispositivo de decodificação de imagem de vídeo usa o valor máximo de At em cada grupo em P(i) para fixar o tempo de início de decodificação no bloco líder em P(i) a dt(1-1)+At(i), de modo que decodificação instantânea é realizada a intervalos iguais em todos os blocos sem causar excesso em capacidade negativa.
Em toda a sequência, a partir do valor máximo At de At(i) de todas as fotografias, o dinit de tempo de início de decodificação do bloco líder na primeira fotografia é expresso pela seguinte fórmula. Consequentemente, todos os blocos em todas as fotografias são decodificados instantaneamente a intervalos iguais sem causar excesso em capacidade negativa. Fórmula 3 O tempo mais antigo r(i, n) em que o início de decodificação torna-se possível no "n" ésimo grupo em P(i) é expresso pela seguinte fórmula. Fórmula 4 No dispositivo de codificação de imagem de vídeo, a quantidade de informação gerada em cada fotografia e cada grupo é controlada de modo que At é menor do que dgt (i, n)-dgt (i, n-1), e o valor de At é explicitamente transmitido ao dispositivo de decodificação de imagem de vídeo. No dispositivo de decodificação de imagem de vídeo, o tempo de decodificação instantânea do grupo G (i, n) é r (i, n) e, portanto, o tempo de início de decodificação de cada bloco é seguramente garantido. O grupo no dispositivo de decodificação de imagem de vídeo não tem que igualar o grupo relatado a partir do dispositivo de codificação de imagem de vídeo. Em um caso onde o grupo no dispositivo de decodificação de imagem de vídeo iguala o grupo relatado a partir do dispositivo de codificação de imagem de vídeo, (i, n)=dgt (i, n) é satisfeito.
Retardo de Exibição Ao relatar explicitamènte o retardo de exibição de um grupo alvo como a informação estendida adicional, o tempo de exibição mais antigo é relatado ao dispositivo de decodificação, e o retardo de exibição é minimizado. Por exemplo, um método de especificar o retardo de exibição em um caso de divisão de azulejo e de divisão de grupos como ilustrado na figura 5, é descrito com referência às figuras 5 e 9.
Na figura 5, o retardo de exibição é máximo quando exibindo a etapa mais superior no grupo 0 (s41). Para iniciar a exibição da etapa mais superior do grupo 0 (s41), pelo menos a decodificação do valor de pixel na etapa mais superior da fotografia no grupo 2 (s43) deve ser terminada. Portanto, o retardo de exibição é explicitamente relatado como informação estendida adicional. A figura 9 ilustra o retardo de exibição. O tempo quando a exibição da etapa mais superior do grupo 0 (s41) torna-se possível é ogt (0) indicado na figura 9. Em ogt (0), o tempo tomado para decodificar é fixado para ser mais lento do que o tempo prolongado dgt (2) do grupo 2. O tempo de exibição neste caso é expresso pela seguinte fórmula, presumindo que a decodificação de uma fotografia é realizada a uma velocidade fixa. Fórmula 5 L é o número total de linhas na direção perpendicular no grupo 2 indicado por s43, e 1 expressa a "1" ésima linha correspondendo à borda direita de topo da fotografia no grupo 2 indicado por s43. 1/L (dgt (3)-dgt (1)) expressa o tempo quando da decodificação da borda direita de topo da fotografia no grupo 2 indicado por s43 está concluída, presumindo que decodificar um grupo toma um tempo do grupo.
Isto é, o tempo possível de exibição é obtido adicionando ao tempo de decodificação dgt (0) do grupo 0 indicado por s41 o tempo tomado a partir do tempo de decodificação instantânea do grupo 0 indicado por s41 para o tempo de decodificação instantânea do grupo 2 indicado por s43. A-lém disso, o tempo possível de exibição é obtido adicionando o tempo tomado atualmente para concluir a decodificação na borda direita de topo da fotografia no grupo 2.
No dispositivo de codificação de imagem de vídeo, ao enviar explicitamente o tempo expresso pela fórmula 5 acima como informação estendida adicional é possível relatar, ao dispositivo de decodificação, um tempo apropriado em consideração ao tempo de decodificação atual e, portanto, a exibição com uma pequena quantidade de retardo é assegurada.
No exemplo acima, quando a parte do tempo de exibição correspondendo a quando a decodificação está concluída na borda direita de topo da fotografia no grupo 2, é expressa pelo tempo dgt (3)-dgt (2) tomado para completar atualmente a decodificação em todo o grupo 2 indicado por s43, um tempo mais antigo é relatado comparado ao caso onde o tempo possível de exibição é o tempo quando a decodificação em uma fotografia é concluída. Portanto, exibição com uma pequena quantidade de retardo é assegurada. Cálculo do tempo de decodificação Em seguida, é dada uma descrição de um método de informação de tempo de decodificação de grupo de cálculo de acordo com a primeira modalidade. Na seguinte descrição, o número total de blocos incluídos na fotografia alvo de codificação é M. A unidade de cálculo de tempo de decodificação de grupo 141 calcula primeiro um tempo de decodificação dgt (i, n) expressando o tempo no qual o "n" ésimo grupo G (i, n) na fotografia (P(i) é decodificado, baseado no tempo de decodificação dt(1) {=t(i)+dly} da "i" ésima fotografia P(i) exibida por um tempo de retardo predeterminado dly a partir do tempo de entrada t(i) da "i" ésima fotografia P(i) na ordem de codificação. Alternativamente, em vez de dgt (i, n), a unidade de cálculo de tempo de decodificação de grupo 141 pode calcular {dgt (i, n)-dgt (i, n-1)} que é igual a dgt (i, n) como o tempo de decodificação. Além disso, a unidade de cálculo de tempo de decodifica-ção de grupo 141 pode converter o tempo de decodificação em uma unidade apropriada, tal como um múltiplo de 1/90.000 segundos. A fim de equalizar o tempo tomado para realizar um processo de decodificação em cada bloco incluído em cada grupo, a unidade de cálculo de tempo de decodificação de grupo 141 determina o tempo de decodificação de cada grupo dividindo igualmente o tempo tomado para realizar um processo de decodificação por fotografia pelo número de grupos N. Neste caso, o tempo de decodificação dgt (i, n) de G(i, n) (n=1,2,.,., n) é calculado pela seguinte fórmula 6. Fórmula 6 dgt (i) é o tempo de decodificação de P(i). d(i+1)-d(i) é fixado independente de i, e é daqui em diante expresso como "s".
Além disso, a unidade de cálculo de tempo de decodificação de grupo 141 pode determinar o tempo de decodificação dgt (i, n) (n>2) do segundo grupo em diante que é codificado/decodificado pela seguinte fórmula. Fórmula 7 a unidade de cálculo 141 pode determinar o tempo de decodificação dgt (1, n) (n>2) do segundo grupo em diante que é codificado/decodificado pela seguinte fórmula. Fórmula 8 A unidade de determinação de retardo de decodificação de grupo 142 determina o valor máximo At de retardo de bloco em toda a fotografia antes de iniciar a codificação. At é determinado para ser um valor em uma faixa expressa pela seguinte fórmula.
Condição 1 A unidade de cálculo da quantidade de ocupação da memória temporária 122 calcula a quantidade de ocupação da memória temporária da memória temporária de recepção de um dispositivo de decodificação e o limite superior na quantidade de informação gerada em um bloco que é codificado em seguida, como a seguir. A figura 10 ilustra a relação entre um valor cumulativo das quantidades de bits dos dados codificados que chegam à memória temporária de recepção de um dispositivo de decodificação ideal e o valor cumulativo da quantidade de informação gerada em cada bloco em P(i), no processo de codificação de P(i).
Uma linha de gráfico 72 expressa o valor cumulativo da quantidade de bits dos dados codificados que chegam à memória temporária de recepção do dispositivo de decodificação ideal. Uma linha de gráfico 75 é obtida deslocando a linha de gráfico 72 para a esquerda por At, e expressa R’ (t). A relação de R’ (t)=R(t+At) é satisfeita. B(i) indicado na figura 10 expressa o valor cumulativo dos dados codificados gerados a partir de P(0) para P(i). b(i) expressa a quantidade de informação gerada em todo P(i), e é igual a B(i)-B(i-1).
Em uma linha de gráfico 73, o valor no tempo dt(i-1) é B(M), o valor no tempo dt(i) é B(i), e a linha de gráfico 73 é uma linha reta V(t) tendo uma inclinação de b(i)/s. s expressa um tempo de fotografia, que é igual a dt(i)-dt(i-1). A linha de gráfico 73 corresponde a uma curva f(t) expressando o consumo dos dados codificados nas unidades dos blocos, quando os blocos são decodificados a intervalos iguais a partir de um tempo dt(i-1) para um tempo dt(i) e quando a quantidade de informação gerada é igual a b(i)/M.
Uma linha de gráfico 74 é uma curva f(t) expressando o consumo dos dados codificados em unidades dos blocos atuais, e um ponto 77 expressa o valor cumulativo da quantidade de consumo dos dados codificados nas unidades dos blocos quando a decodificação é realizada até o "m" ésimo bloco. A fim de prevenir o excesso em capacidade negativa de memória temporária de recepção no dispositivo de decodificação ideal quando o grupo n é decodificado em um tempo de início anterior de decodificação de grupo r(i, n) calculado a partir da informação de tempo de decodificação de grupo, a seguinte condição deve ser satisfeita. A unidade de cálculo do valor de quantização 121 calcula o valor de quantização de modo que a seguinte condição é constantemente satisfeita.
Condição 2 Uma área 76 indica a faixa na qual f(t) pode ser obtida entre um tempo dgt (i, u-1) para um tempo dgt (i, u). Cálculo do valor de quantização É dada uma descrição de um método de calcular o valor de quantização de um bloco m realizado pela unidade de cálculo do valor de quantização 121. Na primeira modalidade, um número igual de blocos é incluído em cada grupo, que é M/N.
Para iniciar um processo em um bloco líder no "n" ésimo grupo G (i, n) ao qual o bloco m pertence, a quantidade de informação alvo T (i, n) de G (i, n) é calculada pela seguinte fórmula. No presente documento, n=Cei I m*N/M) é satisfeito. Fórmulr “ T(i) é a quantidade de informação alvo de todo P(i) e T (i, n) é a quantidade de informação atual gerada em G(i, n). T(i) é a soma total da quantidade de informação atual gerada a partir de P(0) para P(i-1), usando um método conhecido.
Por exemplo, a unidade de cálculo do valor de quantização 121 calcula o valor de quantização de acordo com o método de cálculo do valor de quantização descrito no Modelo de Teste 5 de software de referência de organização de padronização em MPEG-2 (ver Documento não Patente 2), de modo que a quantidade de informação atual gerada em G(i,n) aproxima- sedeT(i,n).
Em seguida, a unidade de cálculo do valor de quantização 121 compara um DTH limiar predeterminado com uma diferença dl que é a diferença entre o valor esperado b’ (i.n) do valor cumulativo da quantidade de informação gerada em P(i) quando o processo de codificação é concluído para todo G(i,n), e o valor cumulativo B(i, n-1) da quantidade de informação gerada em P(i) antes de realizar a codificação de entropia no "n" ésimo grupo. b’ (i,n) é calculado pela seguinte fórmula. Fórmula 10 O DTH1 limiar é expresso pela seguinte fórmula: Fórmula 11 bO é a quantidade de codincaçao maxima gerada em cada bloco, quando o valor de quantização é o valor máximo na faixa possível. ((M/N)-m) corresponde ao número de blocos para os quais o processo de codificação não foi concluída em G(i,m. desvio é o termo de margem.
Quando d1<DTH1 é satisfeito, a unidade de cálculo do valor de quantização 121 fixa o valor de quantização como o valor máximo. bO pode ser a quantidade de codificação de bloco quando todos os coeficientes de frequência são zero. Quando d1<DTH1 é satisfeito, a unidade de cálculo do valor de quantização 121 determina o valor de quantização de modo que todos os coeficientes de frequência dos blocos alvo de codificação são quantizados para zero. Por esta operação de controle, quando o valor médio das quantidades de codificação dos blocos restantes para os quais o processo de codificação não é concluído no grupo não excede bO, (i,n)>T’ (i,n), isto é, f (dtg(i,n)<V (dtg (i,n)) é assegurado. Assim, é assegurado que a memória temporária de recepção do dispositivo de deco-dificação ideal não excede em capacidade negativa.
Como descrito acima, a unidade de cálculo do valor de quantiza- ção 121 transmite atualmente o fluxo de saída a partir do dispositivo de codificação de imagem de vídeo 100 para um dispositivo de decodificação de imagem de vídeo de acordo com uma taxa R predeterminada e, portanto, a quantidade de codificação dos dados de imagem de vídeo é controlada de modo que a memória temporária de recepção do dispositivo de decodificação de imagem de vídeo não excede em capacidade negativa. A unidade de cálculo do valor de quantização 121 relata o valor de quantização obtido à unidade de quantização 112. Cálculo do tempo de saída Em seguida, é dada uma descrição de um método de calcular a informação de tempo de saída de grupo de acordo com a primeira modalidade. A figura 11 é para descrever o cálculo da informação de tempo de saída de grupo.
Na seguinte descrição, o número total de blocos incluídos na fotografia alvo de codificação é M. Além disso, a largura e a altura da fotografia, a largura e a altura do azulejo, e a largura e a altura do CTB são (largu-rap, alturap), (largurat, alturat), e (largurac, alturac), respectivamente. Os tamanhos de todos os azulejos (t80 a t83) são os mesmos, e os azulejos são processados na ordem da varredura de rastreio sc83. Isto é, no exemplo da figura 11, os azulejos são processados na ordem do azulejo 0 (t80), azulejo 1 (t81), azulejo 2 (t82) e azulejo 3 (s83).
Além disso, no exemplo da figura 11, o grupo inclui 17 CTBs, e todos os grupos têm o mesmo número de CTBs. Neste caso, o grupo 0 (s81) está localizado a partir do índice 0 para a terceira coluna, quarta fileira nos CTBs na fotografia.
De acordo com este modo de pensar, a coluna de CTB na etapa mais superior do azulejo 1 (t81) à direita do topo é incluída no grupo 2 (s83). Portanto, quando a tela de exibição é exibida na ordem de varredura de rastreio, pelo menos o grupo 0 (s81) pode ser somente exibido após o grupo 2 (s83) ter sido decodificado.
Quando o grupo 0 (s81) é exibido depois do grupo 2 (s83) ser decodificado, presumindo que a decodificação instantânea é realizada e que o grupo de extração k é d(k), o tempo de saída ogt(O) (do grupo 0 (s81) é expresso pela seguinte fórmula: Fórmula 12 ogt(O) - d(k) Além disso, presumindo que se toma um tempo de fotografia s para decodificação e o número de grupos na fotografia é N, o tempo tomado para decodificar um grupo é expresso como s/N. Isto é, usando o tempo de decodificação dgt de decodificação instantânea, o tempo dgt’ (2) quando da decodificação do grupo 2 está concluído e o tempo igt (0) quando o grupo 0 (s81) é exibido é expresso pela seguinte fórmula. Fórmula 13 ogt(0) = dgt' (2) = dgt(2) + s/N
No presente documento, o dispositivo de codificação de imagem de vídeo 100 relata ao dispositivo de decodificação o tempo de retardo de saída obtido subtraindo o tempo de entrada do grupo a partir do tempo de decodificação da fotografia de decodificação anterior. Consequentemente, o tempo de retardo é assegurado no dispositivo de decodificação.
Além disso, em um filtro de suporte como um filtro de desbloqueio em HEVC divulgado no Documento não Patente 1, para exibir o grupo, existem casos onde ele deve ser aguardado para um grupo subseqüente a ser decodificado a fim de exibir um grupo. Nesse caso, ajustando apropriadamente o retardo de exibição em consideração ao tempo de decodificação do grupo subsequentemente decodificado, é possível obter um retardo de exibição de menos do que um tempo de fotografia.
Fluxo de saída Para que o dispositivo de codificação de imagem de vídeo 100 compartilhe com o dispositivo de decodificação de imagem de vídeo, o grupo ao qual os blocos pertencem, o retardo de decodificação de grupo, e o retardo de saída de grupo, pelo menos a informação de grupo expressando o bloco pertencente a cada grupo, a informação de retardo de decodificação de grupo e a informação de retardo de saída de grupo são adicionadas ao fluxo de dados de saída e relatadas ao dispositivo de decodificação de ima- gem de vídeo. O fluxo de dados de saída também é simplesmente referido como um "fluxo de saída".
Assim, por exemplo, a unidade de adição de informação de retardo de decodificação de grupo 143 adiciona o retardo de decodificação de grupo à informação de cabeçalho do fluxo de dados de saída para cada fotografia ou para fotografias a cada intervalo predeterminado.
Além disso, a unidade de adição de informação de retardo de saída de grupo 153 adiciona o retardo de saída de grupo à informação de cabeçalho do fluxo de dados de saída para cada fotografia ou para fotografias a cada intervalo predeterminado.
Além disso, a unidade de adição de informação de grupo 132 a-diciona a informação de grupo à informação de cabeçalho do fluxo de dados de saída para cada fotografia ou para fotografias a cada intervalo predeterminado. A informação de cabeçalho pode ser, por exemplo, um Cabeçalho de Sequência especificado em MPEG-2, ou um Conjunto de Parâmetro de Sequência ou Informação de Melhora Suplementar especificado em H.264. O tempo de decodificação para cada grupo pode ser adicionado à informação de cabeçalho que é anexado a cada fotografia, tal como um Cabeçalho de Fotografia definido em MPEG-2 ou um Cabeçalho de Fatia definido em H.264.
Se os grupos são determinados de um modo que cada grupo inclua o mesmo número de blocos, o dispositivo de codificação de imagem de vídeo 100 declara ao dispositivo de decodificação de imagem de vídeo que todos os blocos são divididos igualmente em um número N de grupos. Consequentemente, a unidade de determinação de configuração de grupo 131 relata à unidade de adição de informação de grupo 132 o número de grupos N como o grupo de informação. A unidade de adição de informação de grupo 132 codifica a informação de grupo. Em MPEG-2 e H.264, a codificação é realizada nas unidades de blocos de 16 pixéis x 16 pixéis referidas como macroblocos, e este número de blocos não excede geralmente uma faixa que pode ser expressa por 20 bits. O valor máximo de número de grupos N é igual ao valor máximo do número de blocos e, portanto, a codificação de N pode ser feita com um comprimento de bits fixado.
Além disso, cada grupo nem sempre inclui o mesmo número de blocos. Neste caso, a unidade de determinação de configuração de grupo 131 relata à unidade de adição de informação de grupo 132 a informação do índice do bloco líder em cada grupo como informação de grupo junto ao número de grupos N. A unidade de adição de informação de grupo 132 primeiramente codifica o número de grupos N, e então codifica sequencialmente a informação de índice do bloco líder em cada grupo. Por exemplo, a codificação da informação de índice no primeiro bloco é realizada por um método de codificação de um comprimento de bit fixado. Além disso, a unidade de adição de informação de grupo 132 pode usar outro método de codificação, incluindo um método de codificação de comprimento variável tal como a codificação de Huffman, para codificar o número de grupos N e a informação de índice no primeiro bloco em cada grupo.
Operação Em seguida, é dada uma descrição de operações do dispositivo de codificação de imagem de vídeo 100 de acordo com a primeira modalidade. A figura 12 é um fluxograma ilustrando um exemplo de um processo de codificação de imagem de vídeo de acordo com a primeira modalidade.
Na etapa S100, para iniciar a operação de codificação da sequência, um retardo de decodificação de grupo At é determinado. At é determinado de modo a ser menor do que o tempo do grupo em que o número de blocos incluídos na sequência é mínimo.
Na etapa S101, a unidade de adição de informação de retardo de decodificação de grupo 143 adiciona a informação de grupo e a informação de retardo de tempo de decodificação de grupo ao fluxo de dados.
Na etapa S102, para iniciar a codificação de cada fotografia, a unidade de determinação de configuração de grupo 131 primeiramente determina os grupos na fotografia. O número de grupos e o número de blocos incluídos em cada grupo em cada fotografia na sequência podem ser determinados para cada fotografia. Alternativamente, todas as fotografias na sequência podem ter o mesmo número de grupos, e os grupos podem incluir o mesmo número de blocos.
Na etapa S103, a unidade de determinação de retardo de codificação de grupo 142 calcula o retardo da decodificação de grupo para cada grupo (etapa S103).
Na etapa S104, para iniciar a decodificação de grupos, a unidade de cálculo da quantidade de ocupação de memória temporária 122 estima o estado de memória temporária da memória temporária de recepção em um dispositivo de decodificação ideal, e o limite superior da quantidade de informação gerada do grupo a ser codificado em seguida.
Na etapa S105, a unidade de cálculo do valor de quantização 121 calcula o valor de quantização do bloco de modo que todos os dados no grupo cheguem à memória temporária de recepção até o tempo de início de decodificação mais antigo do grupo, baseada no estado da memória temporária de recepção e no limite superior da quantidade de informação gerada do grupo a ser codificado em seguida.
Na etapa S106, a unidade de processo de codificação 110 codifica o bloco usando o valor de quantização calculado.
Em seguida, é dada uma descrição de um processo de saída do dispositivo de codificação de imagem de vídeo 100 de acordo com a primeira modalidade. A figura 13 é um fluxograma ilustrando um exemplo de um processo de saída de acordo com a primeira modalidade.
Na etapa S200, a unidade de determinação de tempo de saída 150 extrai a informação de grupo a partir do fluxo de dados.
Na etapa S201, a unidade de determinação de retardo de saída de grupo 152 determina a informação de retardo de saída de grupo. A informação de retardo de saída de grupo pode ser determinada como descrito acima.
Na etapa S202, a unidade de adição de informação de retardo de saída 153 adiciona a informação de retardo de saída de grupo ao fluxo de dados.
De acordo com a primeira modalidade, quando se realiza o retardo de codec de menos do que um tempo de fotografia, a decodificação ou a saída do grupo é acelerada, de modo que é realizado um retardo inferior. Segunda modalidade Em seguida, é dada uma descrição de um dispositivo de decodificação de imagem de vídeo de acordo com uma segunda modalidade. Na segunda modalidade, o fluxo que é codificado no dispositivo de codificação de imagem de vídeo 100 de acordo com a primeira modalidade é apropriadamente decodificado.
Configuração A figura 14 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de decodificação de imagem de vídeo 200 de acordo com a segunda modalidade. O dispositivo de decodificação de imagem de vídeo 200 inclui uma memória temporária de recepção 205, uma unidade de decodificação de bloco 210, uma memória de quadro 211, uma unidade de saída de grupo 212, uma unidade de cálculo de tempo de decodificação 220, uma unidade de cálculo de tempo de saída 230 e uma unidade de extração de informação de grupo 240. A unidade de extração de informação de grupo 240 extrai, a partir do fluxo de entrada, a informação de grupo indicando os grupos obtidos dividindo os blocos a intervalos predeterminados. A unidade de cálculo de tempo de decodificação 220 inclui uma unidade de extração de informação de retardo de decodificação de grupo 221 e uma unidade de cálculo de tempo de decodificação de grupo 222. A unidade de cálculo de tempo de saída 230 inclui uma unidade de extração de informação de retardo de saída de grupo 231 e uma unidade de cálculo de tempo de saída de grupo 232.
As unidades incluídas no dispositivo de decodificação de imagem de vídeo 200 são montadas no dispositivo de decodificação de imagem de vídeo 200 como circuitos separados. Alternativamente, as unidades incluídas no dispositivo de decodificação de imagem de vídeo 200 podem ser montadas no dispositivo de decodificação de imagem de vídeo 200 como um circuito integrado único em que circuitos implementando as funções das unidades são integrados. Alternativamente, as unidades incluídas no dispositivo de decodificação de imagem de vídeo 200 podem ser módulos funcionais concebidos por programas de computador executados em um processador incluído no dispositivo de decodificação de imagem de vídeo 200. A memória temporária de recepção 205 recebe um fluxo enviado pelo dispositivo de codificação de imagem de vídeo 100 e efetua o armazenamento temporário. A unidade de decodificação de bloco 210 adquire dados a partir da memória temporária de recepção 205 em um tempo de início de decodificação de um grupo emitido a partir da unidade de cálculo de tempo de decodificação de grupo 222, realiza um processo de decodificação partindo do bloco líder, e sequencialmente emite os blocos decodificados. O tempo de início de decodificação também é simplesmente referido como um "tempo de decodificação". A memória de quadro 211 salva os blocos decodificados emitidos a partir da unidade de decodificação de bloco 210. A memória de quadro 211 funciona como uma memória temporária de decodificação em que os grupos alvos de saída são armazenados temporariamente antes de serem emitidos. A memória temporária de decodificação pode ter uma configuração diferente daquela da memória de quadro 211. A unidade de saída de grupo 212 emite um grupo em um tempo de saída de grupo emitido a partir da unidade de cálculo de tempo de saída de grupo 232. A unidade de extração de informação de retardo de decodificação de grupo 221 extrai informação de retardo de decodificação de grupo a partir de um fluxo de entrada que são dados codificados. A unidade de cálculo de tempo de decodificação de grupo 222 calcula o tempo de início de decodificação de cada grupo baseada na saída da informação de grupo a partir da unidade de extração de informação de grupo 240 e a saída da informação de retardo de decodificação de grupo a partir da unidade de extração de informação de retardo de decodificação de grupo 221. A unidade de cálculo de tempo de decodificação de grupo 222 calcula o tempo de início de decodificação dtb (i) do bloco líder na "i" ésima ftc P(i) pela seguinte fórmula. Fórmula 14 A unidade de extração de informação de retardo de saída de grupo 231 extrai a informação de retardo de saída de grupo a partir do fluxo de entrada que são dados codificados. A unidade de cálculo de tempo de saída de grupo 232 calcula o tempo de saída de cada grupo baseada na saída de informação de grupo a partir da unidade de extração de informação de grupo 240 e da informação de retardo de saída de grupo emitida a partir da unidade de extração de informação de retardo de decodificação de grupo 221. O dispositivo de decodificação de imagem de vídeo 200 calcula o tempo de início de decodificação de cada grupo de decodificação baseado no número de grupos N e a informação de retardo de decodificação dos grupos que foram relatados. Além do mais, o dispositivo de decodificação de imagem de vídeo 200 calcula o tempo de saída de cada grupo de decodificação baseado no número de grupos N e na informação de retardo de saída dos grupos que foram relatados.
Operação Em seguida, é dada uma descrição de operações do dispositivo de decodificação de imagem de vídeo 200 de acordo com a segunda modalidade. figura 15 é um fluxograma ilustrando um exemplo de um processo de decodificação de imagem de vídeo de acordo com a segunda modalidade. Na etapa S300 da figura 15, para iniciar a decodificação de cada fotografia primeiramente a unidade de extração de informação de grupo 240 extrai informação de grupo a partir de fluxo de dados.
Na etapa S301, a unidade de extração de informação de retardo de decodificação de grupo 221 extrai informação de retardo de decodificação de grupo a partir do fluxo de dados.
Na etapa S302, a unidade de cálculo do tempo de decodificação de grupo 222 calcula o tempo de início de decodificação do grupo líder. O número de grupos de decodificação e o número de blocos incluídos em cada grupo de decodificação em cada fotografia na sequência podem ser determinados para cada fotografia. Alternativamente, todas as fotografias na sequência podem ter o mesmo número de grupos de decodificação, e os grupos de decodificação podem incluir o mesmo número de blocos. Além disso, os grupos de decodificação podem ser iguais aos grupos descritos na informação de tempo de decodificação de bloco.
Na etapa S303, a unidade de decodificação de bloco 210 aguarda até o tempo de decodificação de grupo, no loop de decodificação de grupo.
Na etapa S304, a unidade de decodificação de bloco 210 adquire dados a partir da memória temporária de recepção 205 e decodifica cada bloco.
Na etapa S305, a unidade de cálculo de tempo de decodificação de grupo 222 calcula o tempo de início de decodificação do grupo seguinte.
Na etapa S306, uma unidade de decodificação de bloco 210 e-mite o bloco de decodificação decodificado à memória de quadro 211.
Em seguida, é dada uma descrição de um processo de saída do dispositivo de decodificação de imagem de vídeo 200 de acordo com a segunda modalidade. A figura 16 é um fluxograma ilustrando um exemplo de um processo de saída de acordo com a segunda modalidade.
Na etapa S400, primeiramente, para iniciar a decodificação de fotografias, a unidade de extração de informação de retardo de decodificação de grupo 221 extrai informação de retardo de saída de grupo a partir do fluxo de dados.
Na etapa S401, em seguida, a unidade de cálculo de tempo de decodificação de grupo 222 calcula o tempo de início de saída do grupo líder em P(i) baseada na informação de retardo de saída de grupo.
Na etapa S402, a unidade de cálculo de tempo de saída de gru- ρο 232 calcula ο tempo de início de saída do grupo.
Na etapa S403, a unidade de decodificação de bloco 210 calcula os blocos de decodificação pertencentes ao grupo de acordo com o tempo de início de saída do grupo.
De acordo com a segunda modalidade, um fluxo codificado pelo dispositivo de codificação de imagem de vídeo 100 de acordo com a primeira modalidade é apropriadamente decodificado.
Terceira modalidade Em seguida, é dada uma descrição de um dispositivo de codificação de imagem de vídeo de acordo com uma terceira modalidade. Na terceira modalidade, os processos a serem realizados quando ocorre excesso em capacidade negativa nas unidades dos grupos são definidos. Configuração A figura 17 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de codificação de imagem de vídeo 300 de acordo com a terceira modalidade. O dispositivo de codificação de imagem de vídeo 300 inclui uma unidade de processo de codificação 310, uma unidade de controle da quantidade de codificação 320, uma unidade de determinação de grupo 330, uma unidade de determinação do tempo de decodificação 340, e uma unidade de determinação do tempo de saída 350. A unidade de processo de codificação 310 inclui uma unidade de transformação ortogonal 311, uma unidade de quantização 312 e uma unidade de codificação de entropia 313. A unidade de determinação de grupo 330 inclui uma unidade de determinação de configuração de grupo 331 e uma unidade de adição de informação de grupo 332. A unidade de determinação de tempo de decodificação 340 inclui uma unidade de cálculo de tempo de decodificação de grupo 341, uma unidade de determinação de retardo de decodificação de grupo 342 e uma unidade de adição de informação de retardo de decodificação de grupo 343. A unidade de determinação de tempo de saída 350 inclui uma unidade de cálculo de tempo de saída de grupo 351, uma unidade de determinação de retardo de saída de grupo 352 e uma unidade de adição de informação de retardo de saída de grupo 353. A unidade de processo de codificação 310, a unidade de determinação de grupo 330, a unidade de determinação de tempo de decodifica-ção 340 e a unidade de determinação de tempo de saída 350 realizam os mesmos processos como a unidade de processo de codificação 110, a unidade de determinação de grupo 130, a unidade de determinação de tempo de decodificação 140 e a unidade de determinação de tempo de saída 150 ilustradas na figura 7, respectivamente. A unidade de controle da quantidade de codificação 320 inclui uma unidade de cálculo do valor de quantização 321, uma unidade de cálculo da quantidade de ocupação da memória temporária 322, um contador de bits 323, e uma unidade de adição de preenchedor 324. A unidade de controle da quantidade de codificação 320 contra a quantidade de codificação em um caso quando os dados usados para decodificar todos os blocos incluídos em um grupo são transmitidos ao dispositivo de decodificação por uma taxa de transmissão predeterminada, de modo que os dados chegam a uma memória temporária de recepção do dispositivo de decodificação por um tempo expresso por um tempo de exibição determinado. A unidade de cálculo do valor de quantização 321 e o contador de bits 323 realizam os mesmos processos como a unidade de cálculo do valor de quantização 121 e o contador de bits 123 ilustrados na figura 7, respectivamente.
Além das operações pela unidade de cálculo da quantidade de ocupação da memória temporária 122 ilustrada na figura 7, a unidade de cálculo da quantidade de ocupação da memória temporária 322 verifica se ocorre um estado de excesso em capacidade negativa da memória temporária, onde a quantidade de informação gerada do grupo excede o valor alvo e todos os dados no grupo não chegam à memória temporária de recepção do dispositivo de decodificação ideal até o tempo de início de decodificação.
Quando um estado de excesso em capacidade negativa de memória temporária é detectado, a unidade de cálculo da quantidade de ocupação da memória temporária 322 instrui a unidade de adição de preenche- dor 324 a inserir dados simulados na extremidade da fotografia processada, e relata o estado de excesso em capacidade negativa da memória temporária a uma unidade de controle total (não ilustrada). Quando a unidade de controle total (não ilustrada) recebe o relatório de um estado de excesso em capacidade negativa da memória temporária, a unidade de controle total implementa o controle para ignorar o processo de codificação na fotografia seguinte a ser codificada. A unidade de adição de preenchedor 324 insere dados simulados na extremidade da fotografia processada, A quantidade de dados simulados a serem inseridos é instruída a partir da unidade de cálculo da quantidade de ocupação da memória temporária 322. A unidade de adição de preenchedor 324 adiciona dados do preenchedor ao fluxo de saída quando os dados usados para decodificar todos os blocos incluídos no grupo não chegam à memória temporária de Ha HÍcihAcitK/n Ho ΗαλλΗificar^ÃA í*Amnn ovihirÕA Δlom Hic. I UU U UC üí3v/v/Uli IvJ ttíi I !|Jw vjvlí tÍAlL/lyClU. I \IC?111 Ulo so, ao adicionar os dados do preenchedor, a unidade de adição de preenchedor 324 implementa o controle de modo que os dados usados para decodificar o último bloco na fotografia incluindo o grupo não chegam à memória temporária de recepção do dispositivo de decodificação pelo tempo de exibição.
Na presente modalidade, quando ocorre excesso em capacidade negativa no grupo na fotografia, os dados do preenchedor são inseridos. No entanto, ao controlar a unidade de cálculo do valor de quantização 321 ilustrado na figura 17, a quantidade de informação em toda a fotografia pode ser aumentada para causar propositalmente o excesso em capacidade negativa na fotografia.
Especificamente, como ilustrado na figura 18, presume-se que a fotografia é constituída por quatro grupos. Quando ocorre excesso em capacidade negativa no primeiro grupo em dgt (0), a unidade de cálculo do valor de quantização 321 controla a quantidade de informação gerada na fotografia, e controla o quantizador de grupos 1 a 3 de modo que o excesso em capacidade negativa ocorre na fotografia no tempo de chegada da próxima fotografia dt (0) = dgt (3). Similarmente, quando ocorre excesso em capacidade negativa no "n" ésimo grupo, a unidade de cálculo do valor de quanti-zação 321 controla o quantizador do "n+1" ésimo grupo e para diante, de modo que o excesso em capacidade negativa ocorre na fotografia.
Como descrito acima, quando ocorre excesso em capacidade negativa em pelo menos um grupo dentre os grupos em uma fotografia, a quantidade de informação gerada na fotografia é controlada de modo que o excesso em capacidade negativa ocorre em toda a fotografia.
Como descrito acima, a unidade de adição de preenchedor 324 tem uma função como uma unidade de controle da quantidade de informação. Quando os dados usados para decodificar todos os blocos incluídos em um grupo não chegam à memória temporária de recepção do dispositivo de decodificação pelo tempo de exibição, a unidade de adição de preenchedor 324 implementa o controle de modo que os primeiros dados na fotografia seguinte não chegam à memória temporária de recepção do dispositivo de decodificação no tempo de retardo.
Processo guando ocorre excesso em capacidade negativa Com referência à figura 18, um caso onde ocorre excesso em capacidade negativa em um grupo em uma fotografia é considerado. A figura 18 é para descrever a ocorrência de excesso em capacidade negativa. Como indicado por um gráfico 90 na figura 18, basicamente, quando um tempo de decodificação é definido nas unidades dos grupos, o dispositivo de codificação ajusta a quantidade de codificação de modo que a decodificação é realizada a um tempo de decodificação que é programado de acordo com a informação enviada ao dispositivo de decodificação por informação adicional tal como uma mensagem de SEI.
No entanto, como indicado por um gráfico 91 na figura 18, quando o excesso em capacidade negativa ocorre no primeiro grupo em dgt (0), a decodificação não é realizada até os bits usados para decodificação serem recebidos na memória temporária, similar ao acima.
Deve ser notado que a exibição de uma fotografia deve ser assegurada, e quando o excesso em capacidade negativa ocorre em um gru- po, a exibição deve ser retardada por uma fotografia. A razão é para aguardar até os bits usados para decodificar um grupo serem recebidos na memória temporária, quando ocorre excesso em capacidade negativa em um grupo. O próximo tempo de decodificação é dgt’ indicado no gráfico de linha 91 da figura 18.
Neste caso, o tempo de decodificação subseqüente é retardado de forma correspondente. Portanto, mesmo se o tempo dt (0) quando a fotografia à qual o grupo pertence é decodificada e exibida se aproxima, a decodificação de todos os grupos não é concluída. Portanto, a exibição de uma fotografia é retardada.
Um caso onde ocorre excesso em capacidade negativa em um grupo, mas o excesso em capacidade negativa não ocorre para a fotografia é considerado. O excesso em capacidade negativa ocorre nas unidades dos grupos. Portanto, a decodificação de grupo deve ser retardada, a exibição para uma fotografia deve ser retardada, e a próxima fotografia deve ser ignorada.
No entanto, o excesso em capacidade negativa não ocorre nas unidades das fotografia, assim é feita uma tentativa de exibir a fotografia a um tempo regular, que é um estado contraditório. Neste caso, a decodificação do grupo é retardada, e, portanto, a decodificação da fotografia não é concluída no tempo regular para exibir a fotografia. Assim, não é possível emitir uma fotografia apropriada.
Além disso, no tempo para exibir a próxima fotografia,a decodificação para a próxima fotografia não é concluída. Assim, não é possível emitir uma fotografia apropriada. Consequentemente, a decodificação não é realizada para emitir fotografias apropriadas nos tempos para exibir as fotografias.
Assim, como ilustrado na figura 19, quando ocorre excesso em capacidade negativa em um grupo, a quantidade de informação gerada na fotografia correspondente é controlada de modo que o excesso em capacidade negativa ocorre para a fotografia também. A exibição de uma fotografia é retardada e a fotografia a ser exibida em seguida é ignorada. Consequen- temente, a mesma fotografia é ignorada no caso onde a decodificação é realizada nas unidades dos grupos e em um caso onde a decodificação é realizada nas unidades das fotografias. Assim, os mesmos intervalos de exibição entre as fotografias são obtidos em ambos os casos de decodificação nas unidades dos grupos e o caso de decodificação nas unidades das fotografias. A figura 19 é para descrever um processo realizado quando o-corre excesso em capacidade negativa. No exemplo da figura 19, presume-se que quando o excesso em capacidade negativa ocorre em dgt(1), o excesso em capacidade negativa ocorre em dt(1) ainda que a quantidade de fotografias indicadas por um número de referência 95 a serem decodificadas em dt(1) seja menor do que o de uma taxa de chegada de fluxo de codificação 96. Consequentemente, a exibição de uma fotografia é retardada, e a fotografia que é suposta exibida em dt(1) é exibida em dt(2), e a fotografia que é suposta exibida em dt(2) é ignorada.
Além disso, no dispositivo de decodificação, quando ocorre excesso em capacidade negativa em um grupo, o controle de quantização e a adição de dados de preenchedor são realizados sobre os dados de codificação da fotografia para um grupo subseqüente na fotografia correspondente, de modo que o excesso em capacidade negativa é causado propositalmente na fotografia correspondente. Consequentemente, a mesma fotografia é ignorada em ambos o caso quando a decodificação é realizada nas unidades dos grupos e o caso quando a decodificação é realizada nas unidades das fotografias. Assim, os intervalos de exibição entre as fotografias incluindo omissões são os mesmos para ambos os casos, de modo que a consistência é alcançada.
Detecção de excesso em capacidade negativa, controle da quantidade de informação de fotografia É dada uma descrição de um método de detectar excesso em capacidade negativa e um método de controlar a quantidade de informação gerada em uma fotografia realizada por um dispositivo de codificação de i-magem de vídeo de acordo com a terceira modalidade.
Primeiramente, a unidade de controle da quantidade de codificação 120 realiza a mesma operação como a da primeira modalidade. O excesso em capacidade negativa é detectado pela unidade de cálculo da quantidade de ocupação da memória temporária 322. Nesta caso, quando a condição (2) não é satisfeita em pelo menos um dos grupos, a unidade de cálculo da quantidade de ocupação da memória temporária 322 detecta que o excesso em capacidade negativa ocorre em um grupo incluído na fotografia.
Neste tempo, a unidade de cálculo da quantidade de ocupação da memória temporária 322 relata a informação de ocorrência de excesso em capacidade negativa à unidade de adição de preenchedor 324. Quando a unidade de adição de preenchedor 324 recebe a informação de ocorrência de excesso em capacidade negativa e confirma que ocorreu excesso em capacidade negativa, a unidade de adição de preenchedor 324 realiza um processo de ignorar a exibição de uma fotografia.
Por exemplo, anexando os dados de preenchedor ao fluxo de saída, o excesso em capacidade negativa é propositalmente causado nas unidades das fotografias, e a exibição de uma fotografia é ignorada. O método de anexar os dados de preenchedor é facilmente feito por analogia e assim não mais descrito.
Alternativamente, quando a unidade de cálculo da quantidade de ocupação da memória temporária 322 detecta excesso em capacidade negativa em um grupo em uma fotografia, a unidade de cálculo do valor de quantização 321 controla o valor de quantização para controlar a quantidade de informação gerada em toda a fotografia de modo que o excesso em capacidade negativa ocorre na fotografia em um grupo subsequente ao grupo correspondendo à fotografia, e causa propositalmente o excesso em capacidade negativa na fotografia.
Ao realizar o processo acima, a exibição de uma fotografia é ignorada, de modo que a ordem nas fotografias em exibição não é alterada. Operação Em seguida, é dada uma descrição das operações do dispositivo de codificação de imagem de vídeo 300 de acordo com a terceira modalida- de. A figura 20 é um fluxograma ilustrando um exemplo de um processo do dispositivo de codificação de imagem de vídeo 300 de acordo com a terceira modalidade.
Na etapa S500, a unidade de cálculo da quantidade de ocupação da memória temporária 322 confirma se o excesso em capacidade negativa ocorrerá nas unidades dos grupos baseadas na quantidade de ocupação da memória temporária da memória temporária de recepção do dispositivo de decodificação.
Na etapa S501, quando a unidade de cálculo da quantidade de ocupação da memória temporária 322 determina que o excesso em capacidade negativa ocorrerá nas unidades dos grupos, a unidade de cálculo da quantidade de ocupação da memória temporária 322 controla a quantidade de informação gerada na fotografia de modo que excesso em capacidade negativa também ocorrerá nas unidades das fotografias. Um exemplo de método de controle é aplicar uma carga pelo preenchedor ao fluxo de saída pela unidade de adição de preenchedor 324 ou controlar o valor de quanti-zação. A fotografia na qual o excesso em capacidade negativa ocorreu também é referida como uma fotografia grande.
De acordo com a terceira modalidade, quando o excesso em capacidade negativa ocorre nas unidades dos grupos, um processo apropriado é realizado.
Quarta modalidade Em seguida, é dada uma descrição de um dispositivo de decodificação de imagem de vídeo de acordo com uma quarta modalidade. Na quarta modalidade, os dados codificados que são codificados pelo dispositivo de codificação de imagem de vídeo de acordo com a terceira modalidade são decodificados apropriadamente.
Configuração A figura 21 é um diagrama de bloco ilustrando uma configuração esquemática de um dispositivo de decodificação de imagem de vídeo 400 de acordo com a quarta modalidade. O dispositivo de decodificação de imagem de vídeo 400 inclui uma memória temporária de recepção 405, uma unidade de cálculo de tempo de decodificação 420, uma unidade de cálculo de tempo de saída 430, uma unidade de extração de informação de retardo de decodificação 421, uma unidade de extração de informação de retardo de saída 431, uma unidade de cálculo de tempo de decodificação de grupo 422, uma unidade de cálculo de tempo de saída de grupo 432, uma unidade de extração de informação de grupo 440, uma unidade de decodificação. de bloco 410, uma memória de quadro 411, uma unidade de saída de grupo 412 e uma unidade de controle de exibição 413.
As unidades incluídas no dispositivo de decodificação de imagem de vídeo 400 são montadas no dispositivo de decodificação de imagem de vídeo 400 como circuitos separados. Alternativamente, as unidades incluídas no dispositivo de decodificação de imagem de vídeo 400 podem ser montadas no dispositivo de decodificação de imagem de vídeo 400 como um circuito integrado único em que circuitos que implementam as funções das unidades são integrados. Alternativamente, as unidades incluídas no dispositivo de decodificação de imagem de vídeo 400 podem ser módulos funcionais concebidos por programas de computador executados em um processador incluído no dispositivo de decodificação de imagem de vídeo 400. Detecção de excesso em capacidade negativa, edição de fluxo É dada uma descrição de um método de detecção de excesso em capacidade negativa e um método de editar um fluxo de bits realizado pelo dispositivo de decodificação de imagem de vídeo 400 de acordo com a quarta modalidade.
Primeiramente, a unidade de decodificação de bloco 410 realiza a mesma operação como a da primeira modalidade. O excesso em capacidade negativa é detectado pela unidade de decodificação de bloco 410. A unidade de decodificação de bloco 410 recebe a informação da quantidade de bits a partir de uma unidade de decodificação de entropia (não ilustrada).
Neste caso, quando a condição (2) não é satisfeita em pelo menos um dos grupos, a unidade de decodificação de bloco 410 detecta que ocorreu excesso em capacidade negativa em um grupo incluído na fotografi-a. Por exemplo, o gráfico 91 na figura 18 indica que o excesso em capacida- de negativa ocorreu em dgt (1).
Neste tempo, a unidade de decodificação de bloco 410 relata a informação de ocorrência de excesso em capacidade negativa à unidade de controle de exibição 413. Quando a unidade de controle de exibição 413 recebe a informação de ocorrência de excesso em capacidade negativa e confirma que ocorreu excesso em capacidade negativa, a unidade de controle de exibição 413 realiza um processo de ignorar a exibição de uma fotografia.
Isto é, quando ocorre excesso em capacidade negativa em um dgt (1) do grupo na fotografia que tem um tempo de decodificação de dt(k), mesmo se uma quantidade de bits que podem ser decodificados como uma fotografia é acumulada na memória temporária em dt(k), a fotografia de dt(k) é exibida em dt(k-1). A fotografia que é suposta ser exibida em dt (k+1) é ignorada.
No exemplo da figura 19, a fotografia suposta ser exibida em dt(1) é exibida em dt(2), e a fotografia suposta ser exibida em dt(2) é ignorada. Neste exemplo, presume-se que a decodificação é realizada instantaneamente, e que a saída (exibição) é realizada ao mesmo tempo que a decodi-ficação.
Ao realizar o processo acima, a exibição de uma fotografia é ignorada, de modo que a ordem nas fotografias em exibição não é alterada. Operação Em seguida, é dada uma descrição de operações do dispositivo de decodificação de imagem de vídeo 400 de acordo com a quarta modalidade. A figura 22 é um fluxograma ilustrando um exemplo de um processo do dispositivo de decodificação de imagem de vídeo 400 de acordo com a quarta modalidade.
Na etapa S600, a unidade de decodificação de bloco 410 confirma se excesso em capacidade negativa ocorrerá nas unidades de grupos baseada na quantidade de ocupação da memória temporária da memória temporária de recepção 405.
Na etapa S601, quando a unidade de decodificação de bloco 410 determina que o excesso em capacidade negativa ocorrerá nas unida- des de grupos, a unidade de decodificação de bloco 410 relata a informação de geração de excesso em capacidade negativa à unidade de controle de exibição 413. Quando a informação de geração de excesso em capacidade negativa é relatada, a unidade de controle de exibição 413 corrige o tempo de exibição da fotografia.
De acordo com a quarta modalidade, os dados codificados, codificados pelo dispositivo de codificação de imagem de vídeo 300 de acordo com a quarta modalidade, são apropriadamente decodificados.
Quinta modalidade A figura 23 é um diagrama de bloco de um exemplo de um dispositivo de processamento de imagem de vídeo 500 de acordo com uma quinta modalidade. Um dispositivo de processamento de imagem de vídeo 500 é um exemplo de dispositivos de codificação de imagem de vídeo ou de dispositivos de decodificação de imagem de vídeo descritos nas respectivas modalidades. Como ilustrado na figura 23, o dispositivo de processamento de imagem de vídeo 500 inclui uma unidade de controle 501, uma unidade de memória principal 502, uma unidade de memória secundária 503, um dispositivo de acionamento 504, uma unidade l/F de rede 506, uma unidade de entrada 507 e uma unidade de exibição 508. Estas unidades são conectadas via um barramento de modo que é possível trocar os dados entre si. A unidade de controle 501 controla os respectivos dispositivos e realiza o cálculo e o processamento de dados no computador. Além disso, a unidade de controle 501 é um processador para executar programas armazenados na unidade de memória principal 502 e na unidade de memória secundária 503, receber dados a partir da unidade de entrada 507 e do dispositivo de armazenamento, realizar cálculos e processamento de dados, e emitir os dados para a unidade de exibição 508 e o dispositivo de armazenamento. A unidade de memória principal 502 é, por exemplo, uma ROM (Memória somente de Leitura) ou uma RAM (Memória de Acesso Aleatório) e é um dispositivo de armazenamento para armazenar ou salvar temporariamente o OS que é o software básico e programas tais como software de aplicação executado pela unidade de controle 501, e dados. A unidade de memória secundária 503 é, por exemplo, um HDD (Unidade de Disco Rígido), que é um dispositivo de armazenamento para armazenar dados relevantes para o software de aplicação. O dispositivo de acionamento 504 é para ler um programa a partir de um meio de gravação 505 tal como um disco flexível, e instalar o programa no dispositivo de armazenamento. O meio de gravação 505 armazena o programa predeterminado. O programa armazenado no meio de gravação 505 é instalado no dispositivo de processamento de imagem de vídeo 500 através do dispositivo de acionamento 504. O programa predeterminado instalado pode ser executado pelo dispositivo de processamento de imagem de vídeo 500. A unidade de rede l/F 506 é uma interface entre o dispositivo de processamento de imagem de vídeo 500 e os dispositivos periféricos que têm funções de comunicação conectadas através de uma rede tal como uma LAN (Rede de Área Local) e uma WAN (Rede de Área de Longa Distância) por uma via de transmissão de dados com fio e/ou sem fio. A unidade de entrada 507 inclui uma tecla de cursor, um teclado incluindo teclas para introduzir números e várias funções, e um mouse e uma almofada de fatiamento para selecionar uma tecla na tela de exibição da unidade de exibição 508. Além disso, a unidade de entrada 507 é uma interface de usuário usada pelo usuário para dar instruções de operação à unidade de controle 501 e introduzir dados. A unidade de exibição 508 inclui um MCD (Monitor de Cristal Líquido), e exibe informação de acordo com a entrada de dados de exibição introduzidos a partir da unidade de controle 501. A unidade de exibição 508 pode ser fornecida no exterior, caso em que o dispositivo de processamento de imagem de vídeo 500 tem uma unidade de controle de exibição.
Consequentemente, o processo de codificação de imagem de vídeo ou o processo de decodificação de imagem de vídeo descrito nas modalidades acima, pode ser implementado como um programa a ser executado por um computador. Ao instalar este programa a partir de um servidor e fazer com que um computador execute este programa, é possível implementar o processo de codificação de imagem de vídeo ou o processo de decodi-ficação de imagem de vídeo descrito acima.
Além disso, o programa de codificação de imagem de vídeo ou o programa de decodificação de imagem de vídeo pode ser gravado no meio de gravação 505, e fazer com que um computador ou um terminal móvel leia o meio de gravação 505 gravando este programa para implementar o processo de codificação de imagem de vídeo ou o processo de decodificação de imagem de vídeo descrito acima. O meio de gravação 505 pode ser vários tipos de meios de gravação de modo que um meio de gravação para gravar informação oticamen-te, eletricamente ou magneticamente, por exemplo, um CD-ROM, um disco flexível e um disco magneto-ótico, ou uma memória semicondutora para gravar informação eletricamente, por exemplo, uma ROM e uma memória flash. O meio de gravação 505 não inclui ondas de transporte.
Um programa executado pelo dispositivo de processamento de imagem de vídeo 500 tem uma configuração de módulo incluindo as respectivas unidades descritas nas modalidades acima. Como o hardware atual, a unidade de controle 501 lê um programa a partir da unidade de memória secundária 503 e executa o programa para carregar uma ou mais das unidades descritas acima na unidade de memória principal 502, de modo que uma ou mais das unidades é gerada na unidade de memória principal 502.
Além do mais, o processo de codificação de imagem de vídeo descrito nas modalidades acima pode ser montado em um ou mais dos circuitos integrados. O dispositivo de codificação de imagem de vídeo para as modalidades acima pode ser usado para vários fins. Por exemplo, o dispositivo de codificação de imagem de vídeo ou o dispositivo de decodificação de imagem de vídeo pode ser construído em uma câmara de vídeo, em um dispositivo de transmissão de imagem, em um dispositivo de recepção de imagem, em um sistema de videotelefonia, em um computador, ou em um telefone móvel.
De acordo com um aspecto das modalidades, quando ocorre excesso em capacidade negativa nas unidades de grupos, um processo apropriado é realizado. A presente invenção não está limitada às modalidades específicas descritas no presente documento, e variações e modificações podem ser feitas sem sair do escopo da presente invenção. Todos ou uma pluralidade de elementos de configuração nas modalidades acima podem ser combinados.

Claims (4)

1. Dispositivo de codificação de imagem de vídeo compreendendo: uma unidade de determinação de configuração de grupo configurada para determinar um grupo ao qual cada um de uma pluralidade de blocos pertence, a pluralidade de blocos sendo obtida dividindo cada fotografia incluída nos dados de imagem de vídeo; uma unidade de adição de informação de grupo configurada para adicionar, a um fluxo de saída, informação de grupo expressando o grupo ao qual cada um da pluralidade de blocos pertence; uma unidade de determinação de tempo de decodificação configurada para calcular um tempo de decodificação para cada um dos grupos e adicionar o tempo de decodificação ao fluxo de saída; uma unidade de determinação de tempo de saída configurada para calcular um tempo de exibição para cada um dos grupos e adicionar o tempo de exibição ao fluxo de saída; uma unidade de controle da quantidade de codificação configurada para controlar uma quantidade de codificação de modo que os dados usados para decodificar todos os blocos incluídos em um dos grupos chegam a uma memória temporária de recebimento de um dispositivo de deco-dificação por um tempo expresso pelo tempo de exibição calculado pela unidade de determinação de tempo de saída, quando os dados são transmitidos ao dispositivo de decodificação a uma taxa de transmissão predeterminada; uma unidade de processo de codificação configurada para efetuar codificação baseada na informação de controle da unidade de controle da quantidade de codificação; e uma unidade de controle da quantidade de informação configurada para implementar o controle de modo que os primeiros dados em uma próxima fotografia não chegam à memória temporária de recebimento do dispositivo de decodificação pelo tempo de exibição, quando os dados usados para decodificar todos os blocos incluídos em um dos grupos não che- gam à memória temporária de recebimento do dispositivo de decodificação pelo tempo de exibição.
2. Método executado por um computador, o método compreendendo: determinar um grupo ao qual cada uma de uma pluralidade de blocos pertence, a pluralidade de blocos sendo obtida dividindo cada fotografia incluída nos dados de imagem de vídeo; adicionar, a um fluxo de saída, informação de grupo expressando o grupo ao qual cada uma da pluralidade de blocos pertence; calcular um tempo de decodificação para cada um dos grupos e adicionar o tempo de decodificação ao fluxo de saída; calcular um tempo de exibição para cada um dos grupos e adicionar o tempo de exibição ao fluxo de saída; controlar uma quantidade de codificação de modo que os dados i ícaHnc nara HprnHifir^ar tnHnç nc hlnrnc inrli iÍHnc <arn 11m Wfse nri inoc rhô-UoaUUo pala UCuUUIIIl/al lUUUo Uo UIUUU5 li luIUlUUo Cíi 11 UI II UUo yiUpUo UliB gam a uma memória temporária de recebimento de um dispositivo de decodificação por um tempo expresso pelo tempo de exibição, quando os dados são transmitidos ao dispositivo de decodificação a uma taxa de transmissão predeterminada; efetuar a codificação baseada na quantidade de codificação que é controlada; e controlar uma quantidade de informação de modo que os primeiros dados em uma próxima fotografia não cheguem à memória temporária de recebimento do dispositivo de decodificação pelo tempo de exibição, quando os dados usados para decodificar todos os blocos incluídos em um dos grupos não cheguem à memória temporária de recebimento do dispositivo de decodificação pelo tempo de exibição.
3. Dispositivo de decodificação de imagem de vídeo compreendendo: uma unidade de extração de informação de grupo configurada para extrair informação de grupo expressando um grupo de um fluxo de saída, o fluxo de entrada indicando dados codificados de uma pluralidade de blocos obtidos dividindo cada fotografia incluída nos dados de imagem de vídeo; uma unidade de cálculo do tempo de codificação configurada para calcular a informação de tempo de decodificação para cada um dos grupos; uma unidade de cálculo do tempo de saída configurada para calcular um tempo de saída para cada um dos grupos; uma unidade de decodificação de bloco configurada para receber o fluxo de entrada, efetuar a decodificação do fluxo de entrada e produzir os blocos decodificados; uma memória de quadro configurada para salvar os blocos decodificados; uma unidade de saída de grupo configurada para emitir os blocos decodificados incluídos em cada um dos grupos salvos na memória de quadro; e uma unidade de controle de exibição configurada para controlar a exibição de cada um dos grupos, em que a unidade de decodificação confirma se todos os blocos usados para decodificação de bloco chegam ao tempo de decodificação de um dos grupos; e a unidade de controle de exibição controla a unidade de saída de grupo para exibir outro bloco decodificado salvo na memória de quadro em vez dos blocos decodificados incluídos em um dos grupos, quando todos os dados usados para decodificação não chegaram ao tempo de decodificação de um ou mais dos grupos.
4. Método executado por um computador, o método compreendendo: extrair informação de grupo expressando um grupo de um fluxo de entrada, o fluxo de entrada indicando os dados codificados de uma pluralidade de blocos obtidos dividindo cada fotografia incluída nos dados de i-magem de vídeo; calcular a informação de tempo de decodificação para cada um os grupos; calcular um tempo de saída para cada um dos grupos; receber o fluxo de entrada, efetuando a decodificação sobre o fluxo de entrada, e produzindo os blocos decodificados; salvar os blocos decodificados em uma memória de quadro; produzir os blocos decodificados incluídos em cada um dos grupos salvos na memória de quadro; e controlar a exibição de cada um dos grupos, em que a realização da decodificação inclui confirmar se todos os dados usados para a decodificação chegam ao tempo de decodificação de um dos grupos, e o controle da exibição inclui o controle para exibir outro bloco decodificado salvo na memória de quadro em vez dos blocos decodificados incluídos em um dos grupos, quando todos os dados usados para decodifi-cação não chegam ao tempo de decodificação de um dos grupos.
BRBR102013010166-4A 2012-04-27 2013-04-25 Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo BR102013010166A2 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012104003A JP5994367B2 (ja) 2012-04-27 2012-04-27 動画像符号化装置、動画像符号化方法

Publications (1)

Publication Number Publication Date
BR102013010166A2 true BR102013010166A2 (pt) 2015-06-30

Family

ID=48190102

Family Applications (1)

Application Number Title Priority Date Filing Date
BRBR102013010166-4A BR102013010166A2 (pt) 2012-04-27 2013-04-25 Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo

Country Status (9)

Country Link
US (5) US20130287118A1 (pt)
EP (2) EP2658257B1 (pt)
JP (1) JP5994367B2 (pt)
KR (5) KR20130121733A (pt)
CN (5) CN103379337B (pt)
BR (1) BR102013010166A2 (pt)
CA (2) CA2812653C (pt)
MX (3) MX341030B (pt)
TW (1) TWI477124B (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102059084B1 (ko) * 2012-10-18 2019-12-24 브이아이디 스케일, 인크. 모바일 멀티미디어 스트리밍에 대한 디코딩 복잡도
EP2988466B1 (en) * 2014-08-18 2017-05-24 Alcatel Lucent Methods and devices for transmission of media content
CN108694995B (zh) * 2015-12-17 2020-10-20 广州宝荣科技应用有限公司 一种医疗诊断系统及方法
JP6288129B2 (ja) * 2016-03-07 2018-03-07 富士通株式会社 動画像復号装置及び動画像復号方法
JP6951446B2 (ja) 2016-12-20 2021-10-20 エーファウ・グループ・エー・タルナー・ゲーエムベーハー 感光性の層を露光するための装置および方法
EP3734349A1 (de) 2016-12-20 2020-11-04 EV Group E. Thallner GmbH Vorrichtung und verfahren zur belichtung einer lichtempfindlichen schicht
US10666955B2 (en) * 2017-02-23 2020-05-26 Panasonic Intellectual Property Management, Co., Ltd. Still image generating apparatus and information recording medium used in still image generating apparatus
CN112839229A (zh) * 2019-11-25 2021-05-25 合肥杰发科技有限公司 计算解码耗时的方法、计算编码耗时的方法及其相关装置
US20230217034A1 (en) * 2020-09-04 2023-07-06 Attila Mihály Split Rendering To Improve Tolerance To Delay Variation In Extended Reality Applications With Remote Rendering

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3969776B2 (ja) * 1997-01-21 2007-09-05 沖電気工業株式会社 伝送画像復号装置
EP1354483B1 (en) * 2001-01-22 2006-10-04 STMicroelectronics Asia Pacific Pte Ltd. Method and apparatus for video buffer verifier underflow and overflow control
JP4276420B2 (ja) 2002-11-05 2009-06-10 三菱電機株式会社 動き補償方法
US7020201B2 (en) * 2002-11-20 2006-03-28 National Chiao Tung University Method and apparatus for motion estimation with all binary representation
US7047991B2 (en) * 2002-12-10 2006-05-23 J.T. Posey Company Bed enclosure
US7266147B2 (en) * 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
JP4379779B2 (ja) * 2003-04-28 2009-12-09 Kddi株式会社 映像配信方式
FR2872974A1 (fr) * 2004-07-06 2006-01-13 Thomson Licensing Sa Procede ou dispositif de codage adaptatif
US7234825B2 (en) * 2004-07-29 2007-06-26 Wei Meng Curved rearview system for vehicles
US20060104351A1 (en) * 2004-11-15 2006-05-18 Shu-Wen Teng Video/image processing devices and methods
JP4740955B2 (ja) * 2005-11-21 2011-08-03 パイオニア株式会社 デジタル放送受信用の信号処理装置、信号処理方法および信号処理プログラム並びにデジタル放送受信装置
TW200619985A (en) * 2006-03-03 2006-06-16 Univ Chang Gung A new cellular search algorithm of video image coding
JP4762052B2 (ja) * 2006-05-31 2011-08-31 パナソニック株式会社 ストリームデータ処理装置及びストリームデータ処理方法
US8320686B2 (en) * 2006-09-11 2012-11-27 Panasonic Corporation Detailed description of the invention
JP5162939B2 (ja) * 2007-03-30 2013-03-13 ソニー株式会社 情報処理装置および方法、並びにプログラム
KR100923961B1 (ko) * 2007-07-09 2009-10-29 세종대학교산학협력단 저지연 영상 통신 시스템 및 방법
US7650455B2 (en) * 2007-07-27 2010-01-19 International Business Machines Corporation Spider web interconnect topology utilizing multiple port connection
JP2009105477A (ja) * 2007-10-19 2009-05-14 Canon Inc 再生装置及び再生方法
JP2009111932A (ja) * 2007-10-31 2009-05-21 Panasonic Corp 動画像復号化装置
US8467444B2 (en) * 2008-06-16 2013-06-18 Canon Kabushiki Kaisha Information processing system, information processing apparatus, information processing method, and program
JP2010166140A (ja) * 2009-01-13 2010-07-29 Hitachi Kokusai Electric Inc 画像復号装置および画像データ出力方法
JP5072893B2 (ja) * 2009-03-25 2012-11-14 株式会社東芝 画像符号化方法および画像復号化方法
JP5343703B2 (ja) * 2009-05-22 2013-11-13 ソニー株式会社 復号処理装置、復号処理方法、およびプログラム
JP2011217082A (ja) * 2010-03-31 2011-10-27 Jvc Kenwood Corp 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP5521940B2 (ja) * 2010-09-22 2014-06-18 富士通株式会社 符号化方法、復号化方法、符号化装置及び復号化装置
JP5720691B2 (ja) * 2010-09-30 2015-05-20 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Also Published As

Publication number Publication date
EP2658257A3 (en) 2014-09-03
US20130287118A1 (en) 2013-10-31
KR101461856B1 (ko) 2014-11-14
TWI477124B (zh) 2015-03-11
CN105744276A (zh) 2016-07-06
CA2812653C (en) 2018-02-20
US20170054981A1 (en) 2017-02-23
CA2899536C (en) 2017-11-07
EP3217666B1 (en) 2019-09-04
MX2013004678A (es) 2013-10-28
MX364616B (es) 2019-05-02
CN105812808A (zh) 2016-07-27
MX344920B (es) 2017-01-10
CA2812653A1 (en) 2013-10-27
CN105812809A (zh) 2016-07-27
KR101697456B1 (ko) 2017-02-01
KR20160031469A (ko) 2016-03-22
CN105812810A (zh) 2016-07-27
US20170054978A1 (en) 2017-02-23
EP2658257A2 (en) 2013-10-30
EP3217666A1 (en) 2017-09-13
KR20130121733A (ko) 2013-11-06
MX341030B (es) 2016-08-03
US20170054979A1 (en) 2017-02-23
KR20140106482A (ko) 2014-09-03
KR20140106484A (ko) 2014-09-03
CN105812809B (zh) 2018-12-07
KR20140106483A (ko) 2014-09-03
CN103379337B (zh) 2016-08-03
EP2658257B1 (en) 2019-08-28
US20170054980A1 (en) 2017-02-23
JP5994367B2 (ja) 2016-09-21
CN105744276B (zh) 2019-03-01
JP2013232801A (ja) 2013-11-14
TW201345270A (zh) 2013-11-01
CN103379337A (zh) 2013-10-30
CA2899536A1 (en) 2013-10-27

Similar Documents

Publication Publication Date Title
BR102013010166A2 (pt) Dispositivo de codificação de imagem de vídeo, método de codificação de imagem de vídeo, dispositivo de decodificação de imagem de vídeo, e método de decodificação de imagem de vídeo
JP5470405B2 (ja) 画像符号化装置および方法
BR122013020553B1 (pt) Método de codificação de uma imagem, método de decodificar uma imagem, equipamento para codificar uma imagem, equipamento para a decodificação de uma imagem, e meio de gravação legível por computador
US9648337B2 (en) Video image encoding device and video image encoding method
JP6234659B2 (ja) 動画像復号装置
JP6194973B2 (ja) 動画像復号装置及び動画像復号方法
JP6394766B2 (ja) 動画像符号化装置及び動画像符号化方法
JP6194974B2 (ja) 動画像復号装置及び動画像復号方法
JP6288129B2 (ja) 動画像復号装置及び動画像復号方法
JP6146502B2 (ja) 動画像符号化復号システム及び動画像符号化復号方法
JP6249040B2 (ja) 動画像復号方法
JP6164324B2 (ja) 動画像復号方法

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: H04N 19/42 , H04N 19/50

Ipc: H04N 19/115 (2014.01), H04N 19/124 (2014.01), H04N

B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements