BR112016021113B1 - Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) - Google Patents

Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) Download PDF

Info

Publication number
BR112016021113B1
BR112016021113B1 BR112016021113-8A BR112016021113A BR112016021113B1 BR 112016021113 B1 BR112016021113 B1 BR 112016021113B1 BR 112016021113 A BR112016021113 A BR 112016021113A BR 112016021113 B1 BR112016021113 B1 BR 112016021113B1
Authority
BR
Brazil
Prior art keywords
dlt
depth
pps
images
bit
Prior art date
Application number
BR112016021113-8A
Other languages
English (en)
Other versions
BR112016021113A2 (pt
Inventor
Kai Zhang
Jicheng An
Xianguo Zhang
Han Huang
Original Assignee
Hfi Innovation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hfi Innovation Inc filed Critical Hfi Innovation Inc
Publication of BR112016021113A2 publication Critical patent/BR112016021113A2/pt
Publication of BR112016021113B1 publication Critical patent/BR112016021113B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

método para sinalização de tabela de pesquisa de profundidade. um método e aparelho para sinalização de tabela de pesquisa de profundidade (dlt) em um sistema de codificação tridimensional e de múltiplas visualizações são revelados. de acordo com a presente invenção, se as imagens contiverem somente dados de textura, nenhuma informação dlt não é incorporada ao conjunto de parâmetros de imagem (pps) correspondendo às imagens. por outro lado, se as imagens contiverem dados de profundidade, a dlt associada com as imagens é determinada. se uma dlt anterior exigida para predizer a dlt existir, a dlt será predita com base na dlt anterior. sintaxe relacionada com a dlt é incluída no pps. além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da dlt também é incluída no pps e a primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em dados de nível de sequência para segundas amostras de profundidade de uma sequência contendo as imagens.

Description

REFERÊNCIA CRUZADA PARA PEDIDOS RELACIONADOS
[001] A presente invenção reivindica prioridade para o pedido de patente PCT/CN2014/073611, depositado em 18 de março de 2014. O pedido de patente PCT está incorporado a este documento na sua totalidade pela referência.
CAMPO TÉCNICO
[002] A presente invenção diz respeito à codificação de vídeo tridimensional e de múltiplas visualizações. Em particular, a presente invenção diz respeito a método para sinalização de Tabela de Pesquisa de Profundidade.
ANTECEDENTES
[003] Televisão tridimensional (3D) tem sido uma tendência de tecnologia desde os últimos anos que é direcionada para trazer para os espectadores experiência de visualização sensacional. Vídeo de múltiplas visualizações é uma técnica para capturar e renderizar vídeo 3D. O vídeo de múltiplas visualizações tipicamente é criado ao capturar uma cena usando múltiplas câmeras simultaneamente, onde as múltiplas câmeras são localizadas de modo apropriado de tal maneira que cada câmera captura a cena a partir de um ponto de visualização. O vídeo de múltiplas visualizações com um grande número de sequências de vídeo associadas com as visualizações representa uma quantidade maciça de dados. Portanto, o vídeo de múltiplas visualizações exigirá um grande espaço de armazenamento para armazenar e/ou uma largura de banda alta para transmitir. Portanto, técnicas de codificação de vídeo de múltiplas visualizações têm sido desenvolvidas no campo para reduzir o espaço de armazenamento e a largura de banda de transmissão exigida. Uma abordagem direta pode simplesmente aplicar técnicas de codificação de vídeo convencionais para cada sequência de vídeo de visualização única independentemente e desconsiderar qualquer correlação entre visualizações diferentes. Tais técnicas diretas resultam em desempenho de codificação inferior. A fim de melhorar eficiência de codificação de vídeo de múltiplas visualizações, codificação de vídeo de múltiplas visualizações sempre explora redundância entre visualizações. A disparidade entre duas visualizações é causada pelas localizações e ângulos das duas respectivas câmeras.
[004] Tabela de Pesquisa de Profundidade (DLT) tem sido adotada em HEVC 3D. Muito frequentemente, existem somente valores limitados aparecendo na componente de profundidade. Portanto, DLT é uma representação compacta dos valores válidos em um bloco. Quando uma CU é codificada em modo Intra de codificação de profundidade simplificada (SDC) ou modo de modelagem de mapa de profundidade (DMM), DLT é usada para mapear os valores de profundidades válidos para índices DLT. A figura 1 demonstra um exemplo de representação DLT de valores de profundidades em uma imagem. Embora a faixa de valores de profundidades seja de 0 a 255, somente 5 valores de profundidades (isto é, 50, 108, 110, 112 e 200) aparecem na imagem. Portanto, a DLT consiste de 5 valores com índices de 0 a 4. A DLT é sinalizada no conjunto de parâmetros de imagem (PPS) e é até o codificador para gerar a DLT.
[005] No padrão de esboço de HEVC 3D (Codificação Tridimensional Baseada em Codificação de Vídeo de Alta Eficiência) corrente, DLT é sinalizada como uma extensão para conjunto de parâmetros de imagem (PPS). Os elementos de sintaxe relacionados com sinalização DLT são descritos nas tabelas seguintes.
[006] Tal como mostrado na Tabela 1, a informação de parâmetro DLT, pps_dlt_parameters( ), é incorporada ao PPS se a sinalização de extensão PPS, pps_extension_type_flag[ 0 ], for asseverada. Tabela 1
[007] A estrutura de sintaxe para a informação de parâmetro DLT, pps_dlt_parameters( ), está mostrada na Tabela 2. Quando a sinalização dlt_present_flag tem um valor de 1, informação relacionada com DLT é incorporada em pps_dlt_parameters( ) tal como mostrado na Tabela 2. A sinalização de predição DLT entre visualizações, inter_view_dlt_pred_enable_flag[ i ], igual a 1 indica que a tabela de pesquisa de profundidade de ordem i é predita da tabela de pesquisa de profundidade de ordem 0. Por outro lado, a sinalização inter_view_dlt_pred_enable_flag[ i ] igual a 0 indica que a tabela de pesquisa de profundidade de ordem i não é predita de qualquer outra tabela de pesquisa de profundidade. Tabela 2
[008] A sinalização DLT de acordo com o padrão HEVC 3D existente tem alguns problemas. Primeiro, predição entre visualizações pode ser aplicada para DLT tal como indicado por meio de uma sinalização correspondente inter_view_dlt_pred_enable_flag[ i ]. Se esta sinalização for estabelecida para 1, a DLT de ordem i é predita da DLT de ordem 0. Por outro lado, dlt_flag[ i ] indica se a DLT de ordem i existe. Portanto, se dlt_flag[ 0 ] for 0 e inter_view_dlt_pred_enable_flag[ i ] com i > 0 for 1, a DLT de ordem i é predita de uma DLT que não existiu.
[009] No padrão HEVC 3D existente, pps_bit_depth_for_depth_views_minus8 é sinalizado para indicar o bit-profundidade para amostras da componente de profundidade na imagem. Entretanto, a profundidade de bits para amostras na componente de profundidade também é sinalizada no nível de sequência tal como indicado por bit_depth_luma_minus8 que é sinalizado em conjunto de parâmetros de sequência (SPS). Portanto, existe potencial contradição entre estes dois elementos de sintaxe se estes dois elementos de sintaxe forem diferentes.
[010] No padrão HEVC 3D existente, a DLT é sinalizada em todos os PPSs do fluxo de bits incluindo o vídeo de textura em todas as visualizações uma vez que a sinalização dlt_present_flag pode ser estabelecida para 1 para os dados de textura. Entretanto, a DLT somente é exigida pela componente de profundidade de cada visualização. De acordo com o padrão HEVC 3D existente, a DLT é sinalizada em quatro PPSs no total quando existem 3 visualizações. Tal como mostrado na figura 2, três PPSs são enviados para a componente de textura para três visualizações, (isto é, T0, T1 e T2) individualmente. Por outro lado, somente um PPS é usado e compartilhado pela componente de profundidade para todas as três visualizações (isto é, D0, D1 e D2). Portanto, 4 cópias do mesmo conteúdo de DLT serão sinalizadas nos 4 PPSs repetidamente com uma redundância óbvio.
[011] É desejável desenvolver métodos para superar estas questões sem causar impacto considerável no desempenho.
SUMÁRIO
[012] Um método e aparelho para sinalização de tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações são revelados. De acordo com a presente invenção, se as imagens contiverem somente dados de textura, nenhuma informação DLT não é incorporada ao conjunto de parâmetros de imagem (PPS) correspondendo às imagens. Por outro lado, se as imagens contiverem dados de profundidade, a DLT associada com as imagens é determinada. Se existir uma DLT anterior exigida para predizer a DLT, a DLT será predita com base na DLT anterior. Sintaxe relacionada com a DLT é incluída no PPS. Além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT também é incluída no PPS e a primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em dados de nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens.
[013] Um aspecto da presente invenção aborda validade em sinalização DLT para predizer a DLT. Se a DLT anterior exigida para predizer a DLT não existir, codificação preditiva não será aplicada para a DLT independente de se predição DLT entre visualizações está ou não capacitada para a DLT. Também, uma sinalização indicando se predição DLT entre visualizações está ou não capacitada para a DLT pode não ser sinalizada e um valor da sinalização pode ser inferido para ser zero. Além disso, se a DLT anterior exigida para predizer a DLT não existir e uma sinalização indicando se predição DLT entre visualizações está capacitada é asseverada para a DLT, uma outra DLT é usada para predizer a DLT. Uma outra DLT pode corresponder a uma DLT anterior existente ou a uma DLT predefinida.
[014] Um outro aspecto da presente invenção aborda consistência de sinalização DLT no nível de sequência e no nível de imagem. O primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits pode ser igual ao segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits. Se o primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits for diferente do segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits, a DLT pode ser escalada de acordo com o primeiro valor de profundidade de bits e o segundo valor de profundidade de bits. Além disso, se o primeiro valor de profundidade D1 for maior que o segundo valor de profundidade de bits D2 então um valor de profundidade D da DLT é escalado para um novo valor de profundidade D’ de acordo com D’ = (D + deslocamento) >> (D1 - D2) ; e se D1 for menor que D2, então o valor de profundidade D é escalado para o novo valor de profundidade D’ de acordo com D’ = (D + deslocamento) << (D2 -D1) , e em que deslocamento é um valor de deslocamento, “>>” é uma operação de deslocamento aritmético para a direita e “<<” é uma operação de deslocamento aritmético para a esquerda.
[015] Também um outro aspecto da presente invenção aborda redundância em sinalização DLT para dados de textura. As imagens podem corresponder a imagens de múltiplas profundidades associadas com múltiplas visualizações e a DLT no PPS pode ser compartilhada por todas as imagens de profundidades das múltiplas visualizações. As imagens podem corresponder a uma imagem de profundidade associada com cada visualização e a DLT no PPS é usada pela imagem de profundidade associada com cada visualização. As imagens correspondem a uma imagem de profundidade associada com uma visualização e o PPS inclui a DLT para somente uma visualização. Uma fatia em uma imagem de profundidade pode usar a DLT sinalizada no PPS contendo uma identificação PPS, pps_pic_parameter_set_id, tendo um mesmo valor como uma identificação de fatia, slice_pic_parameter_set_id, sinalizada em um cabeçalho de fatia para a fatia. Uma segunda DLT sinalizada em um segundo PPS pode ser predita por meio de uma primeira DLT sinalizada em um primeiro PPS. Neste caso, a identificação PPS, pps_pic_parameter_set_id, associada com o primeiro PPS pode ser sinalizada no segundo PPS a fim de localizar a primeira DLT para predizer a segunda DLT.
BREVE DESCRIÇÃO DOS DESENHOS
[016] A figura 1 ilustra um exemplo de tabela de pesquisa de profundidade (DLT), onde a tabela consiste de cinco entradas correspondendo a 50, 108, 110, 112 e 200 indicadas pelos índices 0 a 4.
[017] A figura 2 ilustra um exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com método convencional.
[018] A figura 3 ilustra um exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com uma modalidade da presente invenção.
[019] A figura 4 ilustra um outro exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com uma modalidade da presente invenção.
[020] A figura 5 ilustra um fluxograma exemplar de sinalização de tabela de pesquisa de profundidade (DLT) para um sistema de codificação 3D ou de múltiplas visualizações de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DETALHADA
[021] Tal como mencionado anteriormente, existem várias questões com a sinalização de tabela de pesquisa de profundidade (DLT) na codificação de vídeo 3D baseada em Codificação de Vídeo de Alta Eficiência (HEVC) existente. Portanto, modalidades da presente invenção são reveladas para superar estas questões. A descrição a seguir é do modo considerado como o melhor para executar a invenção. Esta descrição é feita para o propósito de ilustrar os princípios gerais da invenção e não deve ser considerada com um sentido de limitação. O escopo da invenção é mais bem determinado pela referência às reivindicações anexas.
[022] Um aspecto da presente invenção aborda validade de predição DLT. Tal como mostrado na sintaxe de parâmetro DLT PPS da HEVC 3D existente, codificação DLT preditiva é permitida para todas as camadas de profundidades independentemente de se a DLT dependente existe ou não. Em uma modalidade, se uma DLT correspondente existe para predizer uma DLT corrente é verificado primeiro. Se a DLT correspondente existir, codificação DLT preditiva é permitida para a DLT corrente usar a DLT correspondente como um preditor. Se a DLT correspondente não existir, codificação DLT preditiva não é aplicada para a DLT corrente independente de se a predição DLT entre visualizações está capacitada ou não tal como indicado por uma sinalização de capacitar predição DLT entre visualizações, inter_view_dlt_pred_enable_flag[ i ]. Alternativamente, se a DLT correspondente exigida para predizer a DLT de ordem i não existir, a sinalização inter_view_dlt_pred_enable_flag[ i ] é forçada para ser 0. Em uma outra modalidade, a sinalização inter_view_dlt_pred_enable_flag[ i ] é inferida como 0 se a DLT para predizer a DLT de ordem i não existir.
[023] Uma tabela de sintaxe exemplar para incorporar uma modalidade da presente invenção está mostrada na Tabela 3. Para a DLT de ordem i, a sinalização inter_view_dlt_pred_enable_flag[ i ] é incorporada somente quando a DLT de ordem 0 existe, isto é, dlt_flag[ 0 ] sendo 1. Tabela 3
[024] Quando a sinalização inter_view_dlt_pred_enable_flag[ i ] é 1 e a DLT que é usada originalmente para predizer a DLT de ordem i não existe, o preditor para a DLT de ordem i pode ser mudado para uma outra DLT que existe. Em vez de mudar para uma DLT existente, uma DLT predefinida pode ser usada neste caso igualmente. Por exemplo, a DLT predefinida pode incluir todos os valores possíveis, tais como 0, 1, ..., 255, na componente de profundidade. Em um outro exemplo, a DLT predefinida não contém valores.
[025] Um outro aspecto da presente invenção aborda a consistência de informação de profundidade de bits em diferentes camadas da sintaxe. Por exemplo, a consistência da indicação de profundidade de bits pode ser verificada com relação ao nível de sequência. Para ser específico, todas as indicações de profundidades de bits para dados de profundidade sinalizados em uma sequência de vídeo devem ser iguais à indicação de profundidade sinalizada no conjunto de parâmetros de sequência (SPS). Também, a indicação de profundidade de bits de nível PPS (isto é, pps_bit_depth_for_depth_views_minus8) é estabelecida para ser igual à indicação de profundidade de bits de nível SPS (isto é, bit_depth_luma_minus8).
[026] Em uma outra modalidade, a consistência de profundidade de bits é alcançada por meio de escalamento quando as indicações de profundidades de bits são diferentes em níveis diferentes. Por exemplo, valores de profundidades da DLT sinalizada no PPS podem ser escalados se a indicação de profundidade de bits de nível PPS, pps_bit_depth_for_depth_views_minus8, e a indicação de profundidade de bits de nível SPS, bit_depth_luma_minus8, forem diferentes. Por exemplo, um valor de profundidade D da DLT pode ser escalado de acordo com D’ = (D + deslocamento) >> (pps_bit_depth_for_depth_views_minus8 - bits_depth_luma_minus8) se pps_bit_depth_for_depth_views_minus8 for maior que bit_depth_luma_minus8. Em um outro exemplo, o escalamento pode ser feito de acordo com D’ = D << (bit_depth_luma_minus8 - pps_bit_depth_for_depth_views_minus8) se pps_bit_depth_for_depth_views_minus8 for menor que bit_depth_luma_minus8. O deslocamento pode ser qualquer número inteiro tal como 0 ou (1<< (pps_bit_depth_for_depth_views_minus8 - bit_depth_luma_minus8-1)).
[027] Um outro aspecto da presente invenção aborda redundância na sinalização DLT. Uma vez que a DLT não é necessitada pelos dados de textura, DLT não é sinalizada no PPS para a componente de textura. Em outras palavras, DLT não é sinalizada no PPS somente para a camada de textura. Por outro lado, a DLT para os dados de profundidade de todas as visualizações pode ser sinalizada em um único PPS que é compartilhado por componentes de profundidade de todas as visualizações tal como mostrado na figura 3. Alternativamente, a DLT para os dados de profundidade de cada visualização pode ser sinalizada em um PPS individual que é usado pela componente de profundidade particular da visualização correspondente tal como mostrado na figura 4.
[028] Em uma modalidade, um PPS pode sinalizar somente a DLT para a componente de profundidade associada com somente uma visualização. Em outras palavras, um PPS somente sinaliza a DLT para uma camada. Em uma outra modalidade, uma fatia pode usar a DLT sinalizada no PPS que contém identificação PPS, pps_pic_parameter_set_id, com o mesmo valor da identificação de fatia, slice_pic_parameter_set_id, no cabeçalho de fatia para esta fatia.
[029] Em uma modalidade, a DLT sinalizada em um PPS, identificado como P1, pode ser predita por meio de uma DLT sinalizada em um PPS diferente, identificado como P0. Além disso, a pps_pic_parameter_set_id de P0 pode ser sinalizada em P1 para localizar o PPS (isto é, P0) contendo uma DLT para ser usada como um preditor para a DLT no PPS P1.
[030] A figura 5 ilustra um fluxograma exemplar de sinalização de tabela de pesquisa de profundidade (DLT) para um sistema de codificação 3D ou de múltiplas visualizações de acordo com uma modalidade da presente invenção. O sistema identifica uma ou mais imagens para serem processadas tal como mostrado na etapa 510. Se a dita uma ou mais imagens contêm somente dados de textura é verificado na etapa 520. Se o resultado for “Sim”, o processo vai para a etapa 570. Se o resultado for “Não”, o processo vai para a etapa 530. Na etapa 530, a DLT associada com a dita uma ou mais imagens é determinada. Se uma DLT anterior exigida para predizer a DLT existir, codificação preditiva é aplicada para a DLT com base na DLT anterior tal como mostrado na etapa 540 e sintaxe relacionada com a DLT é incluída no PPS tal como mostrado na etapa 550. Além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT é incluída no PPS tal como mostrado na etapa 560. A primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens. O PPS é então sinalizado em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens, tal como mostrado na etapa 570.
[031] O fluxograma mostrado anteriormente é pretendido para ilustrar um exemplo de codificação 3D/múltiplas visualizações usando sinalização DLT em codificação tridimensional e de múltiplas visualizações de acordo com uma modalidade da presente invenção. Os versados na técnica podem modificar cada etapa, rearranjar as etapas, dividir uma etapa ou combinar etapas para praticar a presente invenção sem divergir do espírito da presente invenção.
[032] A descrição anterior é apresentada para capacitar uma pessoa de conhecimento comum na técnica para praticar a presente invenção tal como fornecida no contexto de uma aplicação particular e sua exigência. Várias modificações para as modalidades descritas estarão aparentes para os versados na técnica, e os princípios gerais definidos neste documento podem ser aplicados para outras modalidades. Portanto, a presente invenção não é pretendida para ficar limitada às modalidades particulares mostradas e descritas, e é para abranger o escopo mais amplo consistente com os princípios e recursos inéditos revelados neste documento. Na descrição detalhada anterior, vários detalhes específicos estão ilustrados a fim de fornecer um entendimento completo da presente invenção. Apesar disso, será entendido pelos versados na técnica que a presente invenção pode ser praticada.
[033] Modalidade da presente invenção tal como descrita anteriormente pode ser implementada em vários códigos de hardware, de software, ou em uma combinação de ambos. Por exemplo, uma modalidade da presente invenção pode corresponder a um ou mais circuitos eletrônicos integrados a um chip de compressão de vídeo ou código de programa integrado a software de compressão de vídeo para executar o processamento descrito neste documento. Uma modalidade da presente invenção também pode ser código de programa para ser executado em um Processador de Sinal Digital (DSP) para executar o processamento descrito neste documento. A invenção também pode envolver diversas funções a ser executadas por um processador de computador, um processador de sinal digital, um microprocessador ou matriz de portas programáveis em campo (FPGA). Estes processadores podem ser configurados para executar tarefas particulares de acordo com a invenção, ao executar código de software ou código de firmware legível por máquina que define os métodos particulares incorporados pela invenção. O código de software ou código de firmware pode ser desenvolvido em diferentes linguagens de programação e diferentes formatos ou estilos. O código de software também pode ser compilado para diferentes plataformas alvos. Entretanto, diferentes formatos de códigos, estilos e linguagens de códigos de software e outros recursos de configurar código para executar as tarefas de acordo com a invenção não divergirão do espírito e escopo da invenção.
[034] A invenção pode ser incorporada em outras formas específicas sem divergir de seu espírito ou características essenciais. Os exemplos descritos são para ser considerados sob todos os aspectos somente como ilustrativos e não restritivos. O escopo da invenção, portanto, é indicado pelas reivindicações anexas em vez de pela descrição anterior. Todas as mudanças que ocorram dentro do significado e faixa de equivalência das reivindicações são para ser abrangidas pelo seu escopo.

Claims (6)

1. Método de codificação de profundidade usando uma tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações, caracterizado pelo fato de que compreende: identificar (510) uma ou mais imagens para serem processadas; se a dita uma ou mais imagens contiverem somente dados de textura, excluir qualquer informação DLT em um conjunto de parâmetros de imagem (PPS) correspondendo à dita uma ou mais imagens; se (520) dita uma ou mais imagens contiverem dados de profundidade: determinar (530) a DLT associada com a dita uma ou mais imagens; aplicar (540) codificação preditiva para a DLT com base na DLT anterior; se uma DLT anterior exigida para predizer a DLT existir, aplicar codificação preditiva para a DLT com base na DLT anterior; incluir (550) sintaxe relacionada com a DLT no PPS ; e incluir (560) primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT no PPS, em que a primeira informação de profundidade de bits incluída no PPS é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens; e sinalizar (570) o PPS em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência corresponde a amostras luma.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência é bit_depth_luma_minus8.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência é para amostras de luma de segunda profundidade.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits é igual ao segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits.
6. Aparelho para codificação de profundidade usando uma tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações, caracterizado pelo fato de que compreende um ou mais circuitos eletrônicos configurados para: identificar (510) uma ou mais imagens; se a dita uma ou mais imagens contiverem somente dados de textura, excluir qualquer informação DLT em um conjunto de parâmetros de imagem (PPS) correspondendo à dita uma ou mais imagens; se (520) a dita uma ou mais imagens contiverem dados de profundidade: determinar (530) a DLT associada com a dita uma ou mais imagens; se uma DLT anterior exigida para predizer a DLT existir, aplicar codificação preditiva para a DLT com base na DLT anterior; aplicar (540) codificação preditiva para a DLT com base na DLT anterior; incluir (550) sintaxe relacionada com a DLT no PPS; e incluir (560) primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT no PPS, em que a primeira informação de profundidade de bits incluída no PPS é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens; e sinalizar (570) o PPS em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens.
BR112016021113-8A 2014-03-18 2015-03-17 Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) BR112016021113B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2014/073611 2014-03-18
PCT/CN2014/073611 WO2015139203A1 (en) 2014-03-18 2014-03-18 Dlt signaling in 3d video coding
PCT/CN2015/074391 WO2015139615A1 (en) 2014-03-18 2015-03-17 Method for depth lookup table signaling in 3d video coding based on high efficiency video coding standard

Publications (2)

Publication Number Publication Date
BR112016021113A2 BR112016021113A2 (pt) 2018-05-15
BR112016021113B1 true BR112016021113B1 (pt) 2023-12-19

Family

ID=54143635

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016021113-8A BR112016021113B1 (pt) 2014-03-18 2015-03-17 Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt)

Country Status (6)

Country Link
US (2) US9800896B2 (pt)
EP (1) EP3108656A4 (pt)
KR (1) KR101779313B1 (pt)
CN (2) CN110278440B (pt)
BR (1) BR112016021113B1 (pt)
WO (2) WO2015139203A1 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020003274A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in lut
MX2020013828A (es) 2018-06-29 2021-03-25 Beijing Bytedance Network Tech Co Ltd Interaccion entre lut y amvp.
CN115134599A (zh) 2018-06-29 2022-09-30 抖音视界有限公司 更新查找表(lut)的条件
TWI723444B (zh) 2018-06-29 2021-04-01 大陸商北京字節跳動網絡技術有限公司 使用一個或多個查找表來按順序存儲先前編碼的運動信息並使用它們來編碼後面的塊的概念
BR112020024202A2 (pt) 2018-06-29 2021-02-17 Beijing Bytedance Network Technology Co., Ltd. método de processamento de dados de vídeo, aparelho de processamento de vídeo e meios de armazenamento e gravação legíveis por computador não transitório
CN110662057B (zh) 2018-06-29 2022-06-21 北京字节跳动网络技术有限公司 视频处理方法、装置、设备以及存储比特流的方法
EP3791589A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Which lut to be updated or no updating
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
JP7181395B2 (ja) 2018-07-02 2022-11-30 北京字節跳動網絡技術有限公司 イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測
TWI820211B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 取決於總數減去k的開始檢查hmvp候選的條件
KR20240010576A (ko) 2019-01-10 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut 업데이트의 호출
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
CN113615193A (zh) 2019-03-22 2021-11-05 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
US11729427B2 (en) 2020-09-17 2023-08-15 Lemon Inc. Chroma format and bit depth indication in coded video
LU500994B1 (de) 2021-12-12 2023-06-12 Eclever Entw Ohg Fahrzeug- und fahrzeugführerspezifisches routing

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7123774B2 (en) * 2002-11-27 2006-10-17 General Electric Company System and method for coding data
WO2008077273A1 (en) * 2006-12-25 2008-07-03 Thomson Licensing Device for encoding video data, device for decoding video data, stream of digital data
CN101222639B (zh) * 2007-01-09 2010-04-21 华为技术有限公司 多视点视频技术中的视间预测方法、编码器和解码器
EP2051527A1 (en) * 2007-10-15 2009-04-22 Thomson Licensing Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs
KR101367282B1 (ko) * 2007-12-21 2014-03-12 삼성전자주식회사 깊이 정보에 대한 적응적 정보 표현 방법 및 그 장치
US9338475B2 (en) * 2008-04-16 2016-05-10 Intel Corporation Tone mapping for bit-depth scalable video codec
JP5203503B2 (ja) * 2008-04-16 2013-06-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ビット深度スケーラビリティ
CN101668219B (zh) * 2008-09-02 2012-05-23 华为终端有限公司 3d视频通信方法、发送设备和系统
CN102292993B (zh) * 2009-01-20 2015-05-13 Lg电子株式会社 三维字幕显示方法以及用于实现该方法的三维显示装置
BR112013007782A2 (pt) * 2010-10-01 2016-06-07 Samsung Electronics Co Ltd método de intrapredição de uma imagem
CN103210418B (zh) * 2010-11-23 2016-08-17 杜比实验室特许公司 高动态范围图像的内容元数据增强
KR101824241B1 (ko) * 2011-01-11 2018-03-14 에스케이 텔레콤주식회사 인트라 부가정보 부호화/복호화 장치 및 방법
US9565449B2 (en) * 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
US9918068B2 (en) * 2011-06-15 2018-03-13 Media Tek Inc. Method and apparatus of texture image compress in 3D video coding
US9363535B2 (en) * 2011-07-22 2016-06-07 Qualcomm Incorporated Coding motion depth maps with depth range variation
US9094761B2 (en) * 2011-12-15 2015-07-28 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Digital technique for FM modulation of infrared headphone interface signals
CN102609680B (zh) * 2011-12-22 2013-12-04 中国科学院自动化研究所 一种基于三维深度图像信息的并行统计学习人体部位检测方法
KR20130098122A (ko) * 2012-02-27 2013-09-04 세종대학교산학협력단 영상 부호화/복호화 장치 및 영상을 부호화/복호화하는 방법
WO2013155662A1 (en) * 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Methods and apparatuses of simplification for intra chroma lm mode
US9998726B2 (en) * 2012-06-20 2018-06-12 Nokia Technologies Oy Apparatus, a method and a computer program for video coding and decoding
CN104429074B (zh) * 2012-06-28 2018-11-30 寰发股份有限公司 3d视频编码中视差矢量导出的方法和装置
WO2014107029A1 (ko) * 2013-01-02 2014-07-10 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR102216585B1 (ko) * 2013-01-04 2021-02-17 삼성전자주식회사 깊이 영상의 부호화 장치 및 복호화 장치, 부호화 방법 및 복호화 방법
KR101740630B1 (ko) * 2013-01-11 2017-05-26 미디어텍 싱가폴 피티이. 엘티디. 깊이 룩업 테이블의 효율적인 코딩을 위한 방법 및 장치
US10271034B2 (en) * 2013-03-05 2019-04-23 Qualcomm Incorporated Simplified depth coding
WO2014139566A1 (en) * 2013-03-13 2014-09-18 Huawei Technologies Co., Ltd. Method for coding a depth lookup table
CN105009575B (zh) * 2013-03-13 2018-12-07 华为技术有限公司 一种基于子范围编码深度查询表的方法
CN104079941B (zh) 2013-03-27 2017-08-25 中兴通讯股份有限公司 一种深度信息编解码方法、装置及视频处理播放设备
WO2014166100A1 (en) * 2013-04-12 2014-10-16 Mediatek Singapore Pte. Ltd. A flexible dlt signaling method
CN103491369B (zh) * 2013-09-18 2016-09-28 华为技术有限公司 一种帧间预测编码方法和编码器
BR112016015109A2 (pt) * 2013-12-30 2017-08-08 Qualcomm Inc Simplificação de codificação residual dc delta em codificação de vídeo 3d
JP6396493B2 (ja) * 2013-12-30 2018-09-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated 3dビデオコーディングにおける大型予測ブロックのセグメントごとのdcコーディングの簡易化
US10687079B2 (en) * 2014-03-13 2020-06-16 Qualcomm Incorporated Constrained depth intra mode coding for 3D video coding
WO2015139187A1 (en) * 2014-03-17 2015-09-24 Mediatek Inc. Low latency encoder decision making for illumination compensation and depth look-up table transmission in video coding
WO2015184605A1 (en) * 2014-06-04 2015-12-10 Mediatek Singapore Pte. Ltd. Depth coding compatible with arbitrary bit-depth

Also Published As

Publication number Publication date
CN110278440B (zh) 2021-11-02
US9800896B2 (en) 2017-10-24
WO2015139203A1 (en) 2015-09-24
US20170019682A1 (en) 2017-01-19
US20180014029A1 (en) 2018-01-11
KR20160132935A (ko) 2016-11-21
EP3108656A4 (en) 2017-08-02
EP3108656A1 (en) 2016-12-28
US10085041B2 (en) 2018-09-25
CN106464906A (zh) 2017-02-22
WO2015139615A1 (en) 2015-09-24
CN106464906B (zh) 2019-08-09
CN110278440A (zh) 2019-09-24
BR112016021113A2 (pt) 2018-05-15
KR101779313B1 (ko) 2017-09-18

Similar Documents

Publication Publication Date Title
BR112016021113B1 (pt) Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt)
JP7216351B2 (ja) 点群符号化構造
ES2652132T3 (es) Método y aparato para codificar y descodificar un bloque de textura mediante el uso de partición de bloque basada en la profundidad
US10827170B2 (en) Method and device for coding POC, method and device for decoding POC, and electronic equipment
SA515360724B1 (ar) إرسال إشارات حساب ترتيب صورة لعلاقات معلومات موقوتة لميقات فيديو في تشفير الفيديو
KR102000868B1 (ko) 인코딩 장치, 방법 및 컴퓨터 판독가능 매체
RU2015115896A (ru) Устойчивая к ошибкам ассоциация единицы декодирования
BR112017004490B1 (pt) Método para a construção de uma tabela de hash para correspondência de bloco baseada em hash, dispositivo de computação e meio de armazenamento legível por computador
JP2016539544A5 (pt)
BRPI0918019B1 (pt) Marca d&#39;água compatível com cabac/avc de elementos de sintaxe em vídeo comprimido
BR112016014327B1 (pt) Método de decodificação de um bloco de dados de vídeo
BR112012012020B1 (pt) Métodos de codificação programada e de decodificação programada em um controlador em um dispositivo, dispositivo codificador, e, dispositivo decodificador, e, sistema programado em um controlador em um dispositivo
BRPI0917635B1 (pt) Método para selecionar alterações para a formação de marcas dágua em um vídeo compactado
JP2013229674A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム
JP2018182770A (ja) 信頼性レベル及び混合コンテンツ情報を含む付加拡張情報
JP6532962B2 (ja) 画像符号化方法、画像復号方法、符号化デバイス、および復号デバイス
US10033982B2 (en) Method and device for decoding and encoding supplemental auxiliary information of three-dimensional video sequence
BR112021006580B1 (pt) Método de decodificação de imagem realizado por um aparelho de decodificação, método de codificação de imagem realizado por um aparelho de codificação e mídia de armazenamento legível por computador não transitória
KR20150118988A (ko) 호환 가능 깊이 독립 코딩 방법 및 장치
WO2016161678A1 (zh) 一种视频编码和解码的方法、装置和处理系统
US20140003507A1 (en) Multiview video decoding device, method and multiview video coding device
US11240512B2 (en) Intra-prediction for video coding using perspective information
US20170013265A1 (en) Encoding/Decoding Processing Method and Apparatus for Image Segmentation Manner
JP2016103808A (ja) 画像処理装置、画像処理方法及びプログラム
EP3979651A1 (en) Encoding and decoding immersive video

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 17/03/2015, OBSERVADAS AS CONDICOES LEGAIS