BR112020024663A2 - predição para codificação e decodificação de campo de luz - Google Patents

predição para codificação e decodificação de campo de luz Download PDF

Info

Publication number
BR112020024663A2
BR112020024663A2 BR112020024663-8A BR112020024663A BR112020024663A2 BR 112020024663 A2 BR112020024663 A2 BR 112020024663A2 BR 112020024663 A BR112020024663 A BR 112020024663A BR 112020024663 A2 BR112020024663 A2 BR 112020024663A2
Authority
BR
Brazil
Prior art keywords
camera
sensor
sub
array
prediction
Prior art date
Application number
BR112020024663-8A
Other languages
English (en)
Inventor
Didier Doyen
Olivier Bureller
Guillaume Boisson
Original Assignee
Interdigital Vc Holdings, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interdigital Vc Holdings, Inc. filed Critical Interdigital Vc Holdings, Inc.
Publication of BR112020024663A2 publication Critical patent/BR112020024663A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L27/00Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
    • H01L27/14Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation
    • H01L27/144Devices controlled by radiation
    • H01L27/146Imager structures
    • H01L27/14601Structural or functional details thereof
    • H01L27/14625Optical elements or arrangements associated with the device
    • H01L27/14627Microlenses

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

PREDIÇÃO PARA CODIFICAÇÃO E DECODIFICAÇÃO DE CAMPO DE LUZ. A predição de um componente de um pixel atual que pertence a uma imagem de subabertura atual em uma matriz de imagens de subabertura capturadas por um sensor de uma câmera plenóptica tipo I pode envolver, primeiro, determinar uma localização no sensor com base em: uma distância de uma pupila de saída de uma lente principal da câmera a um arranjo de microlentes da câmera; um comprimento focal da lente principal; um comprimento focal das microlentes do arranjo de microlentes; e um conjunto de parâmetros de um modelo da câmera que permite uma derivação de uma parametrização de dois planos que descreve o campo de raios que corresponde aos pixels do sensor; e, segundo, prever o componente com base em um pixel de referência que pertence a uma imagem de subabertura de referência na matriz e situado no sensor em uma vizinhança da localização.

Description

“PREDIÇÃO PARA CODIFICAÇÃO E DECODIFICAÇÃO DE CAMPO DE LUZ”
1. CAMPO DA REVELAÇÃO
[001]A presente revelação se refere, de modo geral, ao campo de codificação de vídeo de Campo de Luz (LF).
[002]Mais especificamente, a revelação se refere a um método para prever um componente de um pixel que pertencem a uma imagem de subabertura capturada por uma câmera plenóptica tipo |.
[003]A revelação pode ser de interesse, por exemplo no campo de compacta- ção e/ou descompactação LF.
2. ANTECEDENTES TECNOLÓGICOS
[004]Por um lado, a Predição de Síntese de Vista (VSP) foi padronizada como parte da extensão 3D-HEVC para codificação de vídeo de múltiplas vistas. Mais par- ticularmente, a VSP consiste em usar informações de profundidade para distorcer da- dos de textura a partir de uma vista de referência para uma vista atual, de modo que um preditor para a vista atual possa ser gerado (consulte, por exemplo: S. Yea e A. Vetro, “View Synthesis Prediction for Multiview video coding”, em Signal Processing: Image Communication, vol. 24, no 1-2, páginas 89-100, janeiro de 2009).
[005]Por outro lado, os dados LF consistem em: - vídeo de múltiplas vistas, isto é em um vídeo em que as imagens que per- tencem a uma matriz de imagens foram capturadas simultaneamente a partir de múl- tiplos ângulos da câmera; ou - vídeo plenóptico, também conhecido como vídeo baseado em lenslet, isto é em um vídeo em que as imagens que pertencem a uma matriz de imagens são ima- gens de subabertura que foram capturadas simultaneamente a partir de uma única câmera com o uso de uma matriz de lentes além do sistema de lentes principal.
[006]A VSP assume, entre outros, um modelo pinhole para a câmera que foi usada para capturar o vídeo LF. Isso impede a obtenção de altos desempenhos na codificação de vídeo LF, em particular para o LF capturado pela câmera plenóptica para a qual a extensão da abertura não pode ser negligenciada.
[007]Existe, portanto, uma necessidade de um método aprimorado para pre- ver um componente (por exemplo, uma crominância ou luminância) de um pixel de uma imagem de subabertura em um LF capturado por uma câmera plenóptica.
3. SUMÁRIO
[008]A presente revelação se refere a um método para prever um componente de um pixel atual que pertencem a uma imagem de subabertura atual em uma matriz de imagens de subabertura capturadas por um sensor de uma câmera plenóptica tipo |. Tal método compreende: - determinar uma localização do sensor com base pelo menos em: - uma distância D de uma pupila de saída de uma lente principal da câmera a um arranjo de microlentes da câmera; - um comprimento focal F da lente principal; - um comprimento focal f das microlentes do arranjo de microlentes; e - um conjunto de parâmetros de um modelo da câmera que permite uma de- rivação de uma parametrização de dois planos que descreve o campo de raios que corresponde aos pixels do sensor; - prever o componente do pixel atual com base em pelo menos um pixel de referência que pertence a uma imagem de subabertura de referência na matriz e situ- ado no sensor em uma vizinhança da localização.
[009] Outro aspecto da revelação se refere a um dispositivo para prever um componente de um pixel atual que pertence a uma imagem de subabertura atual em uma matriz de imagens de subabertura capturadas por um sensor de uma câmera plenóptica tipo |. Tal dispositivo compreende um processador configurado para: - determinar uma localização do sensor com base pelo menos em:
- uma distância D de uma pupila de saída de uma lente principal (1001) da câmera a um arranjo de microlentes (100mla) da câmera; - um comprimento focal F da lente principal; - um comprimento focal f das microlentes do arranjo de microlentes; e - um conjunto de parâmetros de um modelo da câmera que permite uma de- rivação de uma parametrização de dois planos que descreve o campo de raios que corresponde aos pixels do sensor; - prever o componente do pixel atual com base em pelo menos um pixel de referência que pertence a uma imagem de subabertura de referência na matriz e situ- ado no sensor em uma vizinhança da localização.
[010]Outro aspecto da revelação se refere a um fluxo de bits que porta um campo de luz capturado por um sensor de uma câmera plenóptica tipo |. Tal fluxo de bits compreende metadados que compreendem: - uma distância D de uma pupila de saída de uma lente principal da câmera a um arranjo de microlentes da câmera; - um comprimento focal F da lente principal; - um comprimento focal f das microlentes do arranjo de microlentes; e - um conjunto de parâmetros de um modelo da câmera que permite uma de- rivação de uma parametrização de dois planos que descreve o campo de raios que corresponde aos pixels do sensor.
[011]Além disso, a presente revelação se refere a um meio legível por com- putador não transitório que compreende um produto de programa de computador gra- vado no mesmo e capaz de ser executado por um processador, incluindo instruções de código do programa que compreendem instruções de código do programa para implementar um método para prever um componente de um pixel atual que pertence a uma imagem de subabertura atual em uma matriz de imagens de subabertura cap- turadas por um sensor de uma câmera plenóptica tipo | anteriormente descrita.
4. LISTA DE FIGURAS - A Figura 1 ilustra um codificador e um decodificador que codificam e decodi- ficam respectivamente um pixel atual de uma imagem de subabertura capturada por uma câmera plenóptica tipo |, de acordo com pelo menos uma modalidade; -As Figuras 2a e 2b ilustram a relação entre as microimagens capturadas pelo sensor da câmera da Figura 1 e as imagens de subabertura correspondentes; - As Figuras 3a e 3b ilustram uma propriedade óptica da câmera plenóptica tipo | da Figura 1; - A Figura 4 ilustra um fluxograma de um método para prever um componente de um pixel atual à medida que implementado no codificador e decodificador da Figura 1, de acordo com pelo menos uma modalidade; - A Figura 5a ilustra o primeiro e o segundo raios envolvidos no método da Figura 4; - A Figura 5b ilustra uma localização determinada no sensor da câmera ple- nóptica tipo | da Figura 1 aplicando-se o método da Figura 4; - A Figura 6 ilustra um sistema exemplificativo que pode ser usado para imple- mentar o método da Figura 4.
5. DESCRIÇÃO DETALHADA
[012]Em todas as Figuras, os mesmos sinais de referência numérica desig- nam elementos e etapas similares.
[013]É revelado um método para prever um componente (por exemplo, uma crominância ou luminância) de um pixel atual que pertence a uma imagem de suba- bertura atual em uma matriz de imagens de subabertura capturadas por um sensor de uma câmera plenóptica tipo |. Tal método compreende uma etapa de determinar uma localização no sensor com base nos parâmetros da câmera. Com base em tal locali- zação determinada, o componente do pixel atual é previsto com base pelo menos em um pixel de referência que pertence a uma imagem de subabertura de referência na
BR112020024663-8A 2018-06-05 2019-05-29 predição para codificação e decodificação de campo de luz BR112020024663A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18305684.5 2018-06-05
EP18305684.5A EP3579561A1 (en) 2018-06-05 2018-06-05 Prediction for light-field coding and decoding
PCT/US2019/034308 WO2019236347A1 (en) 2018-06-05 2019-05-29 Prediction for light-field coding and decoding

Publications (1)

Publication Number Publication Date
BR112020024663A2 true BR112020024663A2 (pt) 2021-03-02

Family

ID=62567579

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020024663-8A BR112020024663A2 (pt) 2018-06-05 2019-05-29 predição para codificação e decodificação de campo de luz

Country Status (6)

Country Link
US (2) US11570471B2 (pt)
EP (2) EP3579561A1 (pt)
KR (1) KR20210018348A (pt)
CN (1) CN112385235B (pt)
BR (1) BR112020024663A2 (pt)
WO (1) WO2019236347A1 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111416983B (zh) * 2020-04-07 2022-03-15 清华大学深圳国际研究生院 基于成像相关的多焦距光场视频帧内预测方法和装置
BR102021009291A2 (pt) * 2021-05-13 2022-11-22 Samsung Eletrônica da Amazônia Ltda. Método de intrapredição quadridimensional para codificação e decodificação de dados de light field

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013159330A1 (en) * 2012-04-27 2013-10-31 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
US10158876B2 (en) 2013-04-10 2018-12-18 Qualcomm Incorporated Backward view synthesis prediction
WO2015006967A1 (en) 2013-07-19 2015-01-22 Mediatek Singapore Pte. Ltd. Simplified view synthesis prediction for 3d video coding
EP2879372A1 (en) * 2013-11-29 2015-06-03 Thomson Licensing Method and device for processing a raw image acquired with a plenoptic camera
GB2525851B (en) * 2014-04-30 2017-03-29 Canon Kk Method and device for encoding a sub-aperture image of a set of sub-aperture images obtained from a plenoptic image
US9675430B2 (en) 2014-08-15 2017-06-13 Align Technology, Inc. Confocal imaging apparatus with curved focal surface
JP6472877B2 (ja) 2014-10-09 2019-02-20 寰發股▲ふん▼有限公司HFI Innovation Inc. 視点合成予測を含む3dまたは多視点映像符号化の方法
EP3026628A1 (en) * 2014-11-26 2016-06-01 Thomson Licensing Method and apparatus for estimating depth of unfocused plenoptic data
EP3026884A1 (en) 2014-11-27 2016-06-01 Thomson Licensing Plenoptic camera comprising a light emitting device
EP3065395A1 (en) * 2015-03-05 2016-09-07 Thomson Licensing Processing of light field data
EP3142366A1 (en) * 2015-09-14 2017-03-15 Thomson Licensing Method and apparatus for encoding and decoding a light field based image, and corresponding computer program product
CA2998690A1 (en) * 2015-09-17 2017-03-23 Thomson Licensing Method for encoding a light field content
CN108292431B (zh) * 2015-09-17 2022-08-02 交互数字Vc控股公司 光场数据表示
EP3160142A1 (en) * 2015-10-21 2017-04-26 Thomson Licensing Method for encoding and method for decoding a light field based image and corresponding devices
EP3188123A1 (en) * 2015-12-30 2017-07-05 Thomson Licensing A method and an apparatus for generating data representative of a pixel beam
US20170221223A1 (en) * 2016-01-28 2017-08-03 Thomson Licensing Method for obtaining a position of a main lens optical center of a plenoptic camera
EP3264759A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing An apparatus and a method for generating data representative of a pixel beam

Also Published As

Publication number Publication date
EP3804333A1 (en) 2021-04-14
EP3579561A1 (en) 2019-12-11
US12088841B2 (en) 2024-09-10
US20230179799A1 (en) 2023-06-08
WO2019236347A1 (en) 2019-12-12
CN112385235A (zh) 2021-02-19
KR20210018348A (ko) 2021-02-17
US11570471B2 (en) 2023-01-31
CN112385235B (zh) 2024-09-17
US20210227258A1 (en) 2021-07-22

Similar Documents

Publication Publication Date Title
US20220217363A1 (en) Interaction between pairwise average merging candidates and ibc
US10726876B2 (en) Systems and methods for video replaying
TWI767972B (zh) 基於凝視感測來解碼/編碼視訊資料之方法、顯示裝置、及攝影機
ES2974237T3 (es) Método y aparato de predicción de imágenes de vídeo
ES2625902T3 (es) Procedimientos y aparatos para la compensación de iluminación y color en la codificación de vídeo de múltiples vistas
JP6901468B2 (ja) 光照射野ベース画像を符号化及び復号する方法と装置、および対応するコンピュータプログラム製品
ES2981403T3 (es) Método y aparato de predicción de bloques de croma
ES2926196T3 (es) Codificación de imágenes basada en la predicción de movimiento afín usando la lista de candidatos de MVP afines
BR112021011427A2 (pt) Método e aparelho de predição de bloco de croma
JP2017085611A5 (pt)
TW201916685A (zh) 用於處理360°vr幀序列的方法及裝置
BR122023023994A2 (pt) Codificador de vídeo, decodificador de vídeo e métodos correspondentes
BR112020024663A2 (pt) predição para codificação e decodificação de campo de luz
WO2019137313A1 (zh) 一种媒体信息的处理方法及装置
KR20190020083A (ko) 인코딩 방법 및 장치 및 디코딩 방법 및 장치
BR112021004124A2 (pt) método de decodificação de vídeo e decodificador de vídeo
BR112021008016A2 (pt) codificador, decodificador e métodos correspondentes para modo de fusão
BR112021001991A2 (pt) método de predição de bloco de croma e dispositivo
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
BR112021014502A2 (pt) Codificador, decodificador e métodos correspondentes de adaptação de filtro de desblocagem
US20150071362A1 (en) Image encoding device, image decoding device, image encoding method, image decoding method and program
BR112021013644A2 (pt) Codificador, decodificador e métodos correspondentes de adaptação de filtro de deblocagem
BR122022009674A2 (pt) Método implementado por um codificador, dispositivo e aparelho de codificação, sistema e meio para codificação
BR112021009911A2 (pt) codificador, decodificador e métodos correspondentes usando armazenamento de mv compacto
JP2022532035A (ja) ビデオビットストリームを復号する方法、装置、及びプログラム

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]