BR112016021113B1 - Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) - Google Patents
Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) Download PDFInfo
- Publication number
- BR112016021113B1 BR112016021113B1 BR112016021113-8A BR112016021113A BR112016021113B1 BR 112016021113 B1 BR112016021113 B1 BR 112016021113B1 BR 112016021113 A BR112016021113 A BR 112016021113A BR 112016021113 B1 BR112016021113 B1 BR 112016021113B1
- Authority
- BR
- Brazil
- Prior art keywords
- dlt
- depth
- pps
- images
- bit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000011664 signaling Effects 0.000 claims abstract description 19
- 241000023320 Luma <angiosperm> Species 0.000 claims 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims 2
- 229920000069 polyphenylene sulfide Polymers 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/34—Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
método para sinalização de tabela de pesquisa de profundidade. um método e aparelho para sinalização de tabela de pesquisa de profundidade (dlt) em um sistema de codificação tridimensional e de múltiplas visualizações são revelados. de acordo com a presente invenção, se as imagens contiverem somente dados de textura, nenhuma informação dlt não é incorporada ao conjunto de parâmetros de imagem (pps) correspondendo às imagens. por outro lado, se as imagens contiverem dados de profundidade, a dlt associada com as imagens é determinada. se uma dlt anterior exigida para predizer a dlt existir, a dlt será predita com base na dlt anterior. sintaxe relacionada com a dlt é incluída no pps. além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da dlt também é incluída no pps e a primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em dados de nível de sequência para segundas amostras de profundidade de uma sequência contendo as imagens.
Description
[001] A presente invenção reivindica prioridade para o pedido de patente PCT/CN2014/073611, depositado em 18 de março de 2014. O pedido de patente PCT está incorporado a este documento na sua totalidade pela referência.
[002] A presente invenção diz respeito à codificação de vídeo tridimensional e de múltiplas visualizações. Em particular, a presente invenção diz respeito a método para sinalização de Tabela de Pesquisa de Profundidade.
[003] Televisão tridimensional (3D) tem sido uma tendência de tecnologia desde os últimos anos que é direcionada para trazer para os espectadores experiência de visualização sensacional. Vídeo de múltiplas visualizações é uma técnica para capturar e renderizar vídeo 3D. O vídeo de múltiplas visualizações tipicamente é criado ao capturar uma cena usando múltiplas câmeras simultaneamente, onde as múltiplas câmeras são localizadas de modo apropriado de tal maneira que cada câmera captura a cena a partir de um ponto de visualização. O vídeo de múltiplas visualizações com um grande número de sequências de vídeo associadas com as visualizações representa uma quantidade maciça de dados. Portanto, o vídeo de múltiplas visualizações exigirá um grande espaço de armazenamento para armazenar e/ou uma largura de banda alta para transmitir. Portanto, técnicas de codificação de vídeo de múltiplas visualizações têm sido desenvolvidas no campo para reduzir o espaço de armazenamento e a largura de banda de transmissão exigida. Uma abordagem direta pode simplesmente aplicar técnicas de codificação de vídeo convencionais para cada sequência de vídeo de visualização única independentemente e desconsiderar qualquer correlação entre visualizações diferentes. Tais técnicas diretas resultam em desempenho de codificação inferior. A fim de melhorar eficiência de codificação de vídeo de múltiplas visualizações, codificação de vídeo de múltiplas visualizações sempre explora redundância entre visualizações. A disparidade entre duas visualizações é causada pelas localizações e ângulos das duas respectivas câmeras.
[004] Tabela de Pesquisa de Profundidade (DLT) tem sido adotada em HEVC 3D. Muito frequentemente, existem somente valores limitados aparecendo na componente de profundidade. Portanto, DLT é uma representação compacta dos valores válidos em um bloco. Quando uma CU é codificada em modo Intra de codificação de profundidade simplificada (SDC) ou modo de modelagem de mapa de profundidade (DMM), DLT é usada para mapear os valores de profundidades válidos para índices DLT. A figura 1 demonstra um exemplo de representação DLT de valores de profundidades em uma imagem. Embora a faixa de valores de profundidades seja de 0 a 255, somente 5 valores de profundidades (isto é, 50, 108, 110, 112 e 200) aparecem na imagem. Portanto, a DLT consiste de 5 valores com índices de 0 a 4. A DLT é sinalizada no conjunto de parâmetros de imagem (PPS) e é até o codificador para gerar a DLT.
[005] No padrão de esboço de HEVC 3D (Codificação Tridimensional Baseada em Codificação de Vídeo de Alta Eficiência) corrente, DLT é sinalizada como uma extensão para conjunto de parâmetros de imagem (PPS). Os elementos de sintaxe relacionados com sinalização DLT são descritos nas tabelas seguintes.
[006] Tal como mostrado na Tabela 1, a informação de parâmetro DLT, pps_dlt_parameters( ), é incorporada ao PPS se a sinalização de extensão PPS, pps_extension_type_flag[ 0 ], for asseverada. Tabela 1
[007] A estrutura de sintaxe para a informação de parâmetro DLT, pps_dlt_parameters( ), está mostrada na Tabela 2. Quando a sinalização dlt_present_flag tem um valor de 1, informação relacionada com DLT é incorporada em pps_dlt_parameters( ) tal como mostrado na Tabela 2. A sinalização de predição DLT entre visualizações, inter_view_dlt_pred_enable_flag[ i ], igual a 1 indica que a tabela de pesquisa de profundidade de ordem i é predita da tabela de pesquisa de profundidade de ordem 0. Por outro lado, a sinalização inter_view_dlt_pred_enable_flag[ i ] igual a 0 indica que a tabela de pesquisa de profundidade de ordem i não é predita de qualquer outra tabela de pesquisa de profundidade. Tabela 2
[008] A sinalização DLT de acordo com o padrão HEVC 3D existente tem alguns problemas. Primeiro, predição entre visualizações pode ser aplicada para DLT tal como indicado por meio de uma sinalização correspondente inter_view_dlt_pred_enable_flag[ i ]. Se esta sinalização for estabelecida para 1, a DLT de ordem i é predita da DLT de ordem 0. Por outro lado, dlt_flag[ i ] indica se a DLT de ordem i existe. Portanto, se dlt_flag[ 0 ] for 0 e inter_view_dlt_pred_enable_flag[ i ] com i > 0 for 1, a DLT de ordem i é predita de uma DLT que não existiu.
[009] No padrão HEVC 3D existente, pps_bit_depth_for_depth_views_minus8 é sinalizado para indicar o bit-profundidade para amostras da componente de profundidade na imagem. Entretanto, a profundidade de bits para amostras na componente de profundidade também é sinalizada no nível de sequência tal como indicado por bit_depth_luma_minus8 que é sinalizado em conjunto de parâmetros de sequência (SPS). Portanto, existe potencial contradição entre estes dois elementos de sintaxe se estes dois elementos de sintaxe forem diferentes.
[010] No padrão HEVC 3D existente, a DLT é sinalizada em todos os PPSs do fluxo de bits incluindo o vídeo de textura em todas as visualizações uma vez que a sinalização dlt_present_flag pode ser estabelecida para 1 para os dados de textura. Entretanto, a DLT somente é exigida pela componente de profundidade de cada visualização. De acordo com o padrão HEVC 3D existente, a DLT é sinalizada em quatro PPSs no total quando existem 3 visualizações. Tal como mostrado na figura 2, três PPSs são enviados para a componente de textura para três visualizações, (isto é, T0, T1 e T2) individualmente. Por outro lado, somente um PPS é usado e compartilhado pela componente de profundidade para todas as três visualizações (isto é, D0, D1 e D2). Portanto, 4 cópias do mesmo conteúdo de DLT serão sinalizadas nos 4 PPSs repetidamente com uma redundância óbvio.
[011] É desejável desenvolver métodos para superar estas questões sem causar impacto considerável no desempenho.
[012] Um método e aparelho para sinalização de tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações são revelados. De acordo com a presente invenção, se as imagens contiverem somente dados de textura, nenhuma informação DLT não é incorporada ao conjunto de parâmetros de imagem (PPS) correspondendo às imagens. Por outro lado, se as imagens contiverem dados de profundidade, a DLT associada com as imagens é determinada. Se existir uma DLT anterior exigida para predizer a DLT, a DLT será predita com base na DLT anterior. Sintaxe relacionada com a DLT é incluída no PPS. Além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT também é incluída no PPS e a primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em dados de nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens.
[013] Um aspecto da presente invenção aborda validade em sinalização DLT para predizer a DLT. Se a DLT anterior exigida para predizer a DLT não existir, codificação preditiva não será aplicada para a DLT independente de se predição DLT entre visualizações está ou não capacitada para a DLT. Também, uma sinalização indicando se predição DLT entre visualizações está ou não capacitada para a DLT pode não ser sinalizada e um valor da sinalização pode ser inferido para ser zero. Além disso, se a DLT anterior exigida para predizer a DLT não existir e uma sinalização indicando se predição DLT entre visualizações está capacitada é asseverada para a DLT, uma outra DLT é usada para predizer a DLT. Uma outra DLT pode corresponder a uma DLT anterior existente ou a uma DLT predefinida.
[014] Um outro aspecto da presente invenção aborda consistência de sinalização DLT no nível de sequência e no nível de imagem. O primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits pode ser igual ao segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits. Se o primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits for diferente do segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits, a DLT pode ser escalada de acordo com o primeiro valor de profundidade de bits e o segundo valor de profundidade de bits. Além disso, se o primeiro valor de profundidade D1 for maior que o segundo valor de profundidade de bits D2 então um valor de profundidade D da DLT é escalado para um novo valor de profundidade D’ de acordo com D’ = (D + deslocamento) >> (D1 - D2) ; e se D1 for menor que D2, então o valor de profundidade D é escalado para o novo valor de profundidade D’ de acordo com D’ = (D + deslocamento) << (D2 -D1) , e em que deslocamento é um valor de deslocamento, “>>” é uma operação de deslocamento aritmético para a direita e “<<” é uma operação de deslocamento aritmético para a esquerda.
[015] Também um outro aspecto da presente invenção aborda redundância em sinalização DLT para dados de textura. As imagens podem corresponder a imagens de múltiplas profundidades associadas com múltiplas visualizações e a DLT no PPS pode ser compartilhada por todas as imagens de profundidades das múltiplas visualizações. As imagens podem corresponder a uma imagem de profundidade associada com cada visualização e a DLT no PPS é usada pela imagem de profundidade associada com cada visualização. As imagens correspondem a uma imagem de profundidade associada com uma visualização e o PPS inclui a DLT para somente uma visualização. Uma fatia em uma imagem de profundidade pode usar a DLT sinalizada no PPS contendo uma identificação PPS, pps_pic_parameter_set_id, tendo um mesmo valor como uma identificação de fatia, slice_pic_parameter_set_id, sinalizada em um cabeçalho de fatia para a fatia. Uma segunda DLT sinalizada em um segundo PPS pode ser predita por meio de uma primeira DLT sinalizada em um primeiro PPS. Neste caso, a identificação PPS, pps_pic_parameter_set_id, associada com o primeiro PPS pode ser sinalizada no segundo PPS a fim de localizar a primeira DLT para predizer a segunda DLT.
[016] A figura 1 ilustra um exemplo de tabela de pesquisa de profundidade (DLT), onde a tabela consiste de cinco entradas correspondendo a 50, 108, 110, 112 e 200 indicadas pelos índices 0 a 4.
[017] A figura 2 ilustra um exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com método convencional.
[018] A figura 3 ilustra um exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com uma modalidade da presente invenção.
[019] A figura 4 ilustra um outro exemplo de sinalização de tabela de pesquisa de profundidade (DLT) no conjunto de parâmetros de imagem (PPS) para a componente de textura e a componente de profundidade de acordo com uma modalidade da presente invenção.
[020] A figura 5 ilustra um fluxograma exemplar de sinalização de tabela de pesquisa de profundidade (DLT) para um sistema de codificação 3D ou de múltiplas visualizações de acordo com uma modalidade da presente invenção.
[021] Tal como mencionado anteriormente, existem várias questões com a sinalização de tabela de pesquisa de profundidade (DLT) na codificação de vídeo 3D baseada em Codificação de Vídeo de Alta Eficiência (HEVC) existente. Portanto, modalidades da presente invenção são reveladas para superar estas questões. A descrição a seguir é do modo considerado como o melhor para executar a invenção. Esta descrição é feita para o propósito de ilustrar os princípios gerais da invenção e não deve ser considerada com um sentido de limitação. O escopo da invenção é mais bem determinado pela referência às reivindicações anexas.
[022] Um aspecto da presente invenção aborda validade de predição DLT. Tal como mostrado na sintaxe de parâmetro DLT PPS da HEVC 3D existente, codificação DLT preditiva é permitida para todas as camadas de profundidades independentemente de se a DLT dependente existe ou não. Em uma modalidade, se uma DLT correspondente existe para predizer uma DLT corrente é verificado primeiro. Se a DLT correspondente existir, codificação DLT preditiva é permitida para a DLT corrente usar a DLT correspondente como um preditor. Se a DLT correspondente não existir, codificação DLT preditiva não é aplicada para a DLT corrente independente de se a predição DLT entre visualizações está capacitada ou não tal como indicado por uma sinalização de capacitar predição DLT entre visualizações, inter_view_dlt_pred_enable_flag[ i ]. Alternativamente, se a DLT correspondente exigida para predizer a DLT de ordem i não existir, a sinalização inter_view_dlt_pred_enable_flag[ i ] é forçada para ser 0. Em uma outra modalidade, a sinalização inter_view_dlt_pred_enable_flag[ i ] é inferida como 0 se a DLT para predizer a DLT de ordem i não existir.
[023] Uma tabela de sintaxe exemplar para incorporar uma modalidade da presente invenção está mostrada na Tabela 3. Para a DLT de ordem i, a sinalização inter_view_dlt_pred_enable_flag[ i ] é incorporada somente quando a DLT de ordem 0 existe, isto é, dlt_flag[ 0 ] sendo 1. Tabela 3
[024] Quando a sinalização inter_view_dlt_pred_enable_flag[ i ] é 1 e a DLT que é usada originalmente para predizer a DLT de ordem i não existe, o preditor para a DLT de ordem i pode ser mudado para uma outra DLT que existe. Em vez de mudar para uma DLT existente, uma DLT predefinida pode ser usada neste caso igualmente. Por exemplo, a DLT predefinida pode incluir todos os valores possíveis, tais como 0, 1, ..., 255, na componente de profundidade. Em um outro exemplo, a DLT predefinida não contém valores.
[025] Um outro aspecto da presente invenção aborda a consistência de informação de profundidade de bits em diferentes camadas da sintaxe. Por exemplo, a consistência da indicação de profundidade de bits pode ser verificada com relação ao nível de sequência. Para ser específico, todas as indicações de profundidades de bits para dados de profundidade sinalizados em uma sequência de vídeo devem ser iguais à indicação de profundidade sinalizada no conjunto de parâmetros de sequência (SPS). Também, a indicação de profundidade de bits de nível PPS (isto é, pps_bit_depth_for_depth_views_minus8) é estabelecida para ser igual à indicação de profundidade de bits de nível SPS (isto é, bit_depth_luma_minus8).
[026] Em uma outra modalidade, a consistência de profundidade de bits é alcançada por meio de escalamento quando as indicações de profundidades de bits são diferentes em níveis diferentes. Por exemplo, valores de profundidades da DLT sinalizada no PPS podem ser escalados se a indicação de profundidade de bits de nível PPS, pps_bit_depth_for_depth_views_minus8, e a indicação de profundidade de bits de nível SPS, bit_depth_luma_minus8, forem diferentes. Por exemplo, um valor de profundidade D da DLT pode ser escalado de acordo com D’ = (D + deslocamento) >> (pps_bit_depth_for_depth_views_minus8 - bits_depth_luma_minus8) se pps_bit_depth_for_depth_views_minus8 for maior que bit_depth_luma_minus8. Em um outro exemplo, o escalamento pode ser feito de acordo com D’ = D << (bit_depth_luma_minus8 - pps_bit_depth_for_depth_views_minus8) se pps_bit_depth_for_depth_views_minus8 for menor que bit_depth_luma_minus8. O deslocamento pode ser qualquer número inteiro tal como 0 ou (1<< (pps_bit_depth_for_depth_views_minus8 - bit_depth_luma_minus8-1)).
[027] Um outro aspecto da presente invenção aborda redundância na sinalização DLT. Uma vez que a DLT não é necessitada pelos dados de textura, DLT não é sinalizada no PPS para a componente de textura. Em outras palavras, DLT não é sinalizada no PPS somente para a camada de textura. Por outro lado, a DLT para os dados de profundidade de todas as visualizações pode ser sinalizada em um único PPS que é compartilhado por componentes de profundidade de todas as visualizações tal como mostrado na figura 3. Alternativamente, a DLT para os dados de profundidade de cada visualização pode ser sinalizada em um PPS individual que é usado pela componente de profundidade particular da visualização correspondente tal como mostrado na figura 4.
[028] Em uma modalidade, um PPS pode sinalizar somente a DLT para a componente de profundidade associada com somente uma visualização. Em outras palavras, um PPS somente sinaliza a DLT para uma camada. Em uma outra modalidade, uma fatia pode usar a DLT sinalizada no PPS que contém identificação PPS, pps_pic_parameter_set_id, com o mesmo valor da identificação de fatia, slice_pic_parameter_set_id, no cabeçalho de fatia para esta fatia.
[029] Em uma modalidade, a DLT sinalizada em um PPS, identificado como P1, pode ser predita por meio de uma DLT sinalizada em um PPS diferente, identificado como P0. Além disso, a pps_pic_parameter_set_id de P0 pode ser sinalizada em P1 para localizar o PPS (isto é, P0) contendo uma DLT para ser usada como um preditor para a DLT no PPS P1.
[030] A figura 5 ilustra um fluxograma exemplar de sinalização de tabela de pesquisa de profundidade (DLT) para um sistema de codificação 3D ou de múltiplas visualizações de acordo com uma modalidade da presente invenção. O sistema identifica uma ou mais imagens para serem processadas tal como mostrado na etapa 510. Se a dita uma ou mais imagens contêm somente dados de textura é verificado na etapa 520. Se o resultado for “Sim”, o processo vai para a etapa 570. Se o resultado for “Não”, o processo vai para a etapa 530. Na etapa 530, a DLT associada com a dita uma ou mais imagens é determinada. Se uma DLT anterior exigida para predizer a DLT existir, codificação preditiva é aplicada para a DLT com base na DLT anterior tal como mostrado na etapa 540 e sintaxe relacionada com a DLT é incluída no PPS tal como mostrado na etapa 550. Além disso, primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT é incluída no PPS tal como mostrado na etapa 560. A primeira informação de profundidade de bits é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens. O PPS é então sinalizado em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens, tal como mostrado na etapa 570.
[031] O fluxograma mostrado anteriormente é pretendido para ilustrar um exemplo de codificação 3D/múltiplas visualizações usando sinalização DLT em codificação tridimensional e de múltiplas visualizações de acordo com uma modalidade da presente invenção. Os versados na técnica podem modificar cada etapa, rearranjar as etapas, dividir uma etapa ou combinar etapas para praticar a presente invenção sem divergir do espírito da presente invenção.
[032] A descrição anterior é apresentada para capacitar uma pessoa de conhecimento comum na técnica para praticar a presente invenção tal como fornecida no contexto de uma aplicação particular e sua exigência. Várias modificações para as modalidades descritas estarão aparentes para os versados na técnica, e os princípios gerais definidos neste documento podem ser aplicados para outras modalidades. Portanto, a presente invenção não é pretendida para ficar limitada às modalidades particulares mostradas e descritas, e é para abranger o escopo mais amplo consistente com os princípios e recursos inéditos revelados neste documento. Na descrição detalhada anterior, vários detalhes específicos estão ilustrados a fim de fornecer um entendimento completo da presente invenção. Apesar disso, será entendido pelos versados na técnica que a presente invenção pode ser praticada.
[033] Modalidade da presente invenção tal como descrita anteriormente pode ser implementada em vários códigos de hardware, de software, ou em uma combinação de ambos. Por exemplo, uma modalidade da presente invenção pode corresponder a um ou mais circuitos eletrônicos integrados a um chip de compressão de vídeo ou código de programa integrado a software de compressão de vídeo para executar o processamento descrito neste documento. Uma modalidade da presente invenção também pode ser código de programa para ser executado em um Processador de Sinal Digital (DSP) para executar o processamento descrito neste documento. A invenção também pode envolver diversas funções a ser executadas por um processador de computador, um processador de sinal digital, um microprocessador ou matriz de portas programáveis em campo (FPGA). Estes processadores podem ser configurados para executar tarefas particulares de acordo com a invenção, ao executar código de software ou código de firmware legível por máquina que define os métodos particulares incorporados pela invenção. O código de software ou código de firmware pode ser desenvolvido em diferentes linguagens de programação e diferentes formatos ou estilos. O código de software também pode ser compilado para diferentes plataformas alvos. Entretanto, diferentes formatos de códigos, estilos e linguagens de códigos de software e outros recursos de configurar código para executar as tarefas de acordo com a invenção não divergirão do espírito e escopo da invenção.
[034] A invenção pode ser incorporada em outras formas específicas sem divergir de seu espírito ou características essenciais. Os exemplos descritos são para ser considerados sob todos os aspectos somente como ilustrativos e não restritivos. O escopo da invenção, portanto, é indicado pelas reivindicações anexas em vez de pela descrição anterior. Todas as mudanças que ocorram dentro do significado e faixa de equivalência das reivindicações são para ser abrangidas pelo seu escopo.
Claims (6)
1. Método de codificação de profundidade usando uma tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações, caracterizado pelo fato de que compreende: identificar (510) uma ou mais imagens para serem processadas; se a dita uma ou mais imagens contiverem somente dados de textura, excluir qualquer informação DLT em um conjunto de parâmetros de imagem (PPS) correspondendo à dita uma ou mais imagens; se (520) dita uma ou mais imagens contiverem dados de profundidade: determinar (530) a DLT associada com a dita uma ou mais imagens; aplicar (540) codificação preditiva para a DLT com base na DLT anterior; se uma DLT anterior exigida para predizer a DLT existir, aplicar codificação preditiva para a DLT com base na DLT anterior; incluir (550) sintaxe relacionada com a DLT no PPS ; e incluir (560) primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT no PPS, em que a primeira informação de profundidade de bits incluída no PPS é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens; e sinalizar (570) o PPS em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência corresponde a amostras luma.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência é bit_depth_luma_minus8.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a segunda informação de profundidade de bits sinalizada no nível de sequência é para amostras de luma de segunda profundidade.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que primeiro valor de profundidade de bits indicado pela primeira informação de profundidade de bits é igual ao segundo valor de profundidade de bits indicado pela segunda informação de profundidade de bits.
6. Aparelho para codificação de profundidade usando uma tabela de pesquisa de profundidade (DLT) em um sistema de codificação tridimensional e de múltiplas visualizações, caracterizado pelo fato de que compreende um ou mais circuitos eletrônicos configurados para: identificar (510) uma ou mais imagens; se a dita uma ou mais imagens contiverem somente dados de textura, excluir qualquer informação DLT em um conjunto de parâmetros de imagem (PPS) correspondendo à dita uma ou mais imagens; se (520) a dita uma ou mais imagens contiverem dados de profundidade: determinar (530) a DLT associada com a dita uma ou mais imagens; se uma DLT anterior exigida para predizer a DLT existir, aplicar codificação preditiva para a DLT com base na DLT anterior; aplicar (540) codificação preditiva para a DLT com base na DLT anterior; incluir (550) sintaxe relacionada com a DLT no PPS; e incluir (560) primeira informação de profundidade de bits relacionada com primeiras amostras de profundidade da DLT no PPS, em que a primeira informação de profundidade de bits incluída no PPS é consistente com segunda informação de profundidade de bits sinalizada em um nível de sequência para segundas amostras de profundidade de uma sequência contendo a dita uma ou mais imagens; e sinalizar (570) o PPS em um fluxo de bits de vídeo para uma sequência incluindo a dita uma ou mais imagens.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2014/073611 | 2014-03-18 | ||
PCT/CN2014/073611 WO2015139203A1 (en) | 2014-03-18 | 2014-03-18 | Dlt signaling in 3d video coding |
PCT/CN2015/074391 WO2015139615A1 (en) | 2014-03-18 | 2015-03-17 | Method for depth lookup table signaling in 3d video coding based on high efficiency video coding standard |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112016021113A2 BR112016021113A2 (pt) | 2018-05-15 |
BR112016021113B1 true BR112016021113B1 (pt) | 2023-12-19 |
Family
ID=54143635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112016021113-8A BR112016021113B1 (pt) | 2014-03-18 | 2015-03-17 | Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) |
Country Status (6)
Country | Link |
---|---|
US (2) | US9800896B2 (pt) |
EP (1) | EP3108656A4 (pt) |
KR (1) | KR101779313B1 (pt) |
CN (2) | CN110278440B (pt) |
BR (1) | BR112016021113B1 (pt) |
WO (2) | WO2015139203A1 (pt) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020003274A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Checking order of motion candidates in lut |
MX2020013828A (es) | 2018-06-29 | 2021-03-25 | Beijing Bytedance Network Tech Co Ltd | Interaccion entre lut y amvp. |
CN115134599A (zh) | 2018-06-29 | 2022-09-30 | 抖音视界有限公司 | 更新查找表(lut)的条件 |
TWI723444B (zh) | 2018-06-29 | 2021-04-01 | 大陸商北京字節跳動網絡技術有限公司 | 使用一個或多個查找表來按順序存儲先前編碼的運動信息並使用它們來編碼後面的塊的概念 |
BR112020024202A2 (pt) | 2018-06-29 | 2021-02-17 | Beijing Bytedance Network Technology Co., Ltd. | método de processamento de dados de vídeo, aparelho de processamento de vídeo e meios de armazenamento e gravação legíveis por computador não transitório |
CN110662057B (zh) | 2018-06-29 | 2022-06-21 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、设备以及存储比特流的方法 |
EP3791589A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Which lut to be updated or no updating |
TWI752331B (zh) | 2018-06-29 | 2022-01-11 | 大陸商北京字節跳動網絡技術有限公司 | 當向Merge/AMVP添加HMVP候選時的部分/完全修剪 |
JP7181395B2 (ja) | 2018-07-02 | 2022-11-30 | 北京字節跳動網絡技術有限公司 | イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測 |
TWI820211B (zh) | 2018-09-12 | 2023-11-01 | 大陸商北京字節跳動網絡技術有限公司 | 取決於總數減去k的開始檢查hmvp候選的條件 |
KR20240010576A (ko) | 2019-01-10 | 2024-01-23 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Lut 업데이트의 호출 |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
WO2020147772A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidates derivation |
CN113615193A (zh) | 2019-03-22 | 2021-11-05 | 北京字节跳动网络技术有限公司 | Merge列表构建和其他工具之间的交互 |
US11729427B2 (en) | 2020-09-17 | 2023-08-15 | Lemon Inc. | Chroma format and bit depth indication in coded video |
LU500994B1 (de) | 2021-12-12 | 2023-06-12 | Eclever Entw Ohg | Fahrzeug- und fahrzeugführerspezifisches routing |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7123774B2 (en) * | 2002-11-27 | 2006-10-17 | General Electric Company | System and method for coding data |
WO2008077273A1 (en) * | 2006-12-25 | 2008-07-03 | Thomson Licensing | Device for encoding video data, device for decoding video data, stream of digital data |
CN101222639B (zh) * | 2007-01-09 | 2010-04-21 | 华为技术有限公司 | 多视点视频技术中的视间预测方法、编码器和解码器 |
EP2051527A1 (en) * | 2007-10-15 | 2009-04-22 | Thomson Licensing | Enhancement layer residual prediction for bit depth scalability using hierarchical LUTs |
KR101367282B1 (ko) * | 2007-12-21 | 2014-03-12 | 삼성전자주식회사 | 깊이 정보에 대한 적응적 정보 표현 방법 및 그 장치 |
US9338475B2 (en) * | 2008-04-16 | 2016-05-10 | Intel Corporation | Tone mapping for bit-depth scalable video codec |
JP5203503B2 (ja) * | 2008-04-16 | 2013-06-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ビット深度スケーラビリティ |
CN101668219B (zh) * | 2008-09-02 | 2012-05-23 | 华为终端有限公司 | 3d视频通信方法、发送设备和系统 |
CN102292993B (zh) * | 2009-01-20 | 2015-05-13 | Lg电子株式会社 | 三维字幕显示方法以及用于实现该方法的三维显示装置 |
BR112013007782A2 (pt) * | 2010-10-01 | 2016-06-07 | Samsung Electronics Co Ltd | método de intrapredição de uma imagem |
CN103210418B (zh) * | 2010-11-23 | 2016-08-17 | 杜比实验室特许公司 | 高动态范围图像的内容元数据增强 |
KR101824241B1 (ko) * | 2011-01-11 | 2018-03-14 | 에스케이 텔레콤주식회사 | 인트라 부가정보 부호화/복호화 장치 및 방법 |
US9565449B2 (en) * | 2011-03-10 | 2017-02-07 | Qualcomm Incorporated | Coding multiview video plus depth content |
US9918068B2 (en) * | 2011-06-15 | 2018-03-13 | Media Tek Inc. | Method and apparatus of texture image compress in 3D video coding |
US9363535B2 (en) * | 2011-07-22 | 2016-06-07 | Qualcomm Incorporated | Coding motion depth maps with depth range variation |
US9094761B2 (en) * | 2011-12-15 | 2015-07-28 | Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America | Digital technique for FM modulation of infrared headphone interface signals |
CN102609680B (zh) * | 2011-12-22 | 2013-12-04 | 中国科学院自动化研究所 | 一种基于三维深度图像信息的并行统计学习人体部位检测方法 |
KR20130098122A (ko) * | 2012-02-27 | 2013-09-04 | 세종대학교산학협력단 | 영상 부호화/복호화 장치 및 영상을 부호화/복호화하는 방법 |
WO2013155662A1 (en) * | 2012-04-16 | 2013-10-24 | Mediatek Singapore Pte. Ltd. | Methods and apparatuses of simplification for intra chroma lm mode |
US9998726B2 (en) * | 2012-06-20 | 2018-06-12 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
CN104429074B (zh) * | 2012-06-28 | 2018-11-30 | 寰发股份有限公司 | 3d视频编码中视差矢量导出的方法和装置 |
WO2014107029A1 (ko) * | 2013-01-02 | 2014-07-10 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
KR102216585B1 (ko) * | 2013-01-04 | 2021-02-17 | 삼성전자주식회사 | 깊이 영상의 부호화 장치 및 복호화 장치, 부호화 방법 및 복호화 방법 |
KR101740630B1 (ko) * | 2013-01-11 | 2017-05-26 | 미디어텍 싱가폴 피티이. 엘티디. | 깊이 룩업 테이블의 효율적인 코딩을 위한 방법 및 장치 |
US10271034B2 (en) * | 2013-03-05 | 2019-04-23 | Qualcomm Incorporated | Simplified depth coding |
WO2014139566A1 (en) * | 2013-03-13 | 2014-09-18 | Huawei Technologies Co., Ltd. | Method for coding a depth lookup table |
CN105009575B (zh) * | 2013-03-13 | 2018-12-07 | 华为技术有限公司 | 一种基于子范围编码深度查询表的方法 |
CN104079941B (zh) | 2013-03-27 | 2017-08-25 | 中兴通讯股份有限公司 | 一种深度信息编解码方法、装置及视频处理播放设备 |
WO2014166100A1 (en) * | 2013-04-12 | 2014-10-16 | Mediatek Singapore Pte. Ltd. | A flexible dlt signaling method |
CN103491369B (zh) * | 2013-09-18 | 2016-09-28 | 华为技术有限公司 | 一种帧间预测编码方法和编码器 |
BR112016015109A2 (pt) * | 2013-12-30 | 2017-08-08 | Qualcomm Inc | Simplificação de codificação residual dc delta em codificação de vídeo 3d |
JP6396493B2 (ja) * | 2013-12-30 | 2018-09-26 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 3dビデオコーディングにおける大型予測ブロックのセグメントごとのdcコーディングの簡易化 |
US10687079B2 (en) * | 2014-03-13 | 2020-06-16 | Qualcomm Incorporated | Constrained depth intra mode coding for 3D video coding |
WO2015139187A1 (en) * | 2014-03-17 | 2015-09-24 | Mediatek Inc. | Low latency encoder decision making for illumination compensation and depth look-up table transmission in video coding |
WO2015184605A1 (en) * | 2014-06-04 | 2015-12-10 | Mediatek Singapore Pte. Ltd. | Depth coding compatible with arbitrary bit-depth |
-
2014
- 2014-03-18 WO PCT/CN2014/073611 patent/WO2015139203A1/en active Application Filing
-
2015
- 2015-03-17 EP EP15765534.1A patent/EP3108656A4/en not_active Withdrawn
- 2015-03-17 KR KR1020167028104A patent/KR101779313B1/ko active IP Right Grant
- 2015-03-17 BR BR112016021113-8A patent/BR112016021113B1/pt active IP Right Grant
- 2015-03-17 US US15/123,882 patent/US9800896B2/en active Active
- 2015-03-17 CN CN201910606198.0A patent/CN110278440B/zh active Active
- 2015-03-17 WO PCT/CN2015/074391 patent/WO2015139615A1/en active Application Filing
- 2015-03-17 CN CN201580012848.9A patent/CN106464906B/zh active Active
-
2017
- 2017-09-06 US US15/696,260 patent/US10085041B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN110278440B (zh) | 2021-11-02 |
US9800896B2 (en) | 2017-10-24 |
WO2015139203A1 (en) | 2015-09-24 |
US20170019682A1 (en) | 2017-01-19 |
US20180014029A1 (en) | 2018-01-11 |
KR20160132935A (ko) | 2016-11-21 |
EP3108656A4 (en) | 2017-08-02 |
EP3108656A1 (en) | 2016-12-28 |
US10085041B2 (en) | 2018-09-25 |
CN106464906A (zh) | 2017-02-22 |
WO2015139615A1 (en) | 2015-09-24 |
CN106464906B (zh) | 2019-08-09 |
CN110278440A (zh) | 2019-09-24 |
BR112016021113A2 (pt) | 2018-05-15 |
KR101779313B1 (ko) | 2017-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112016021113B1 (pt) | Método e aparelho de codificação de profundidade usando uma tabela de pesquisa de profundidade (dlt) | |
JP7216351B2 (ja) | 点群符号化構造 | |
ES2652132T3 (es) | Método y aparato para codificar y descodificar un bloque de textura mediante el uso de partición de bloque basada en la profundidad | |
US10827170B2 (en) | Method and device for coding POC, method and device for decoding POC, and electronic equipment | |
SA515360724B1 (ar) | إرسال إشارات حساب ترتيب صورة لعلاقات معلومات موقوتة لميقات فيديو في تشفير الفيديو | |
KR102000868B1 (ko) | 인코딩 장치, 방법 및 컴퓨터 판독가능 매체 | |
RU2015115896A (ru) | Устойчивая к ошибкам ассоциация единицы декодирования | |
BR112017004490B1 (pt) | Método para a construção de uma tabela de hash para correspondência de bloco baseada em hash, dispositivo de computação e meio de armazenamento legível por computador | |
JP2016539544A5 (pt) | ||
BRPI0918019B1 (pt) | Marca d'água compatível com cabac/avc de elementos de sintaxe em vídeo comprimido | |
BR112016014327B1 (pt) | Método de decodificação de um bloco de dados de vídeo | |
BR112012012020B1 (pt) | Métodos de codificação programada e de decodificação programada em um controlador em um dispositivo, dispositivo codificador, e, dispositivo decodificador, e, sistema programado em um controlador em um dispositivo | |
BRPI0917635B1 (pt) | Método para selecionar alterações para a formação de marcas dágua em um vídeo compactado | |
JP2013229674A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム | |
JP2018182770A (ja) | 信頼性レベル及び混合コンテンツ情報を含む付加拡張情報 | |
JP6532962B2 (ja) | 画像符号化方法、画像復号方法、符号化デバイス、および復号デバイス | |
US10033982B2 (en) | Method and device for decoding and encoding supplemental auxiliary information of three-dimensional video sequence | |
BR112021006580B1 (pt) | Método de decodificação de imagem realizado por um aparelho de decodificação, método de codificação de imagem realizado por um aparelho de codificação e mídia de armazenamento legível por computador não transitória | |
KR20150118988A (ko) | 호환 가능 깊이 독립 코딩 방법 및 장치 | |
WO2016161678A1 (zh) | 一种视频编码和解码的方法、装置和处理系统 | |
US20140003507A1 (en) | Multiview video decoding device, method and multiview video coding device | |
US11240512B2 (en) | Intra-prediction for video coding using perspective information | |
US20170013265A1 (en) | Encoding/Decoding Processing Method and Apparatus for Image Segmentation Manner | |
JP2016103808A (ja) | 画像処理装置、画像処理方法及びプログラム | |
EP3979651A1 (en) | Encoding and decoding immersive video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 17/03/2015, OBSERVADAS AS CONDICOES LEGAIS |