CN110754090A - 减少360度视频中的接缝伪影 - Google Patents

减少360度视频中的接缝伪影 Download PDF

Info

Publication number
CN110754090A
CN110754090A CN201880040403.5A CN201880040403A CN110754090A CN 110754090 A CN110754090 A CN 110754090A CN 201880040403 A CN201880040403 A CN 201880040403A CN 110754090 A CN110754090 A CN 110754090A
Authority
CN
China
Prior art keywords
temporal
picture
region
degree
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880040403.5A
Other languages
English (en)
Other versions
CN110754090B (zh
Inventor
G·范德奥维拉
M·科班
M·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN110754090A publication Critical patent/CN110754090A/zh
Application granted granted Critical
Publication of CN110754090B publication Critical patent/CN110754090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • G06T3/067Reshaping or unfolding 3D tree structures onto 2D planes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • H04L1/0011Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding applied to payload information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/10Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供用于通过以下操作来处理360度视频数据的系统及方法:获得至少一个360度矩形格式化投影图片;在所述至少一个360度矩形格式化投影图片中检测投影边界;基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及产生经编码视频位流。

Description

减少360度视频中的接缝伪影
根据35 U.S.C.§119的优先权主张
本申请案主张2017年6月29日申请的美国临时申请案第62/526,700号及2018年6月27日申请的美国非临时申请案第16/020,596号的权益,所述申请案的全部内容是特此以引用的方式并入。
技术领域
本申请案涉及360度视频内容。举例来说,描述用于编码及/或解码具有投影至正方形区上的球体的圆形极的360度格式化图片且用于360视频的高效及伪影减少压缩及/或解压缩的系统及方法。
背景技术
视频译码标准包含MPEG及VCEG的联合视频探索小组(JVET)、ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IECMPEG-4 Visual、ITU-T H.264(也被称为ISO/IEC MPEG-4 AVC),包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展,以及具有其扩展的ITU-T H.265(也被称为ISO/IECMPEG-4 HEVC)。
发明内容
在各种实施方案中,本文中描述用于处理360度视频数据以获得较好译码效率的方法、装置、设备及计算机可读媒体。
一种方法可包含:获得至少一个360度矩形格式化投影图片;在所述至少一个360度矩形格式化投影图片中检测投影边界;基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及产生经编码视频位流。
在一些实施例中,所述方法可包含:确定所述360度矩形格式化投影图片含有第一图片半部及第二图片半部,其中所述第一图片半部及所述第二图片半部是由投影边界分离;及响应于确定所述360度矩形格式化投影图片含有所述第一图片半部及所述第二图片半部而停用环路内滤波。
在另外实施例中,停用环路内滤波进一步包括:通过在用于所述至少一个360度矩形格式化投影图片的参数集中停用环路内滤波而针对所述整个至少一个360度矩形格式化投影图片停用环路内滤波。
在额外实施例中,停用环路内滤波进一步包括:在所述至少一个360度矩形格式化投影图片的切片内停用环路内滤波。
在一些实施方案中,停用环路内滤波进一步包括:识别围绕所述投影边界彼此邻近的至少两个译码树单元(CTU);及针对围绕所述投影边界彼此邻近的所述经识别至少两个CTU停用环路内滤波。
在另外实施方案中,停用环路内滤波进一步包括:识别围绕所述投影边界彼此邻近的至少两个译码树单元(CTU);及通过横越所述至少两个CTU停用样本自适应偏移(SAO)带偏移或SAO边缘偏移而针对所述经识别至少两个CTU停用环路内滤波。
在额外实施方案中,所述360度矩形格式化投影图片为3×2包装投影图片。
在一些实施例中,所述360度矩形格式化投影图片为6×1包装投影图片。
在另外实施例中,所述方法可包含:确定所述360度矩形格式化投影图片包括至少第一区及第二区,其中所述第一区及所述第二区是由所述投影边界分离;横越所述360度矩形格式化投影图片确定多个译码树单元(CTU);从所述多个CTU内确定多个译码单元(CU);横越所述多个CU中的至少两者执行帧内预测;识别位于所述第一区内的第一CU及位于所述第二区内的第二CU;及基于识别位于所述第一区内的所述第一CU及位于所述第二区内的所述第二CU而横越所述第一CU及所述第二CU停用帧内预测。
在额外实施例中,所述第一CU及所述第二CU共享共同边界,且所述共同边界为所述投影边界。
在一些实施方案中,所述方法可包含确定所述360度矩形格式化投影图片的360度矩形格式化投影图片QP值;且其中横越所述第一CU及所述第二CU停用帧内预测是仅在所述360度矩形格式化投影图片QP值高于阈值QP水平时才执行。
在另外实施方案中,所述阈值QP水平为20。
在额外实施方案中,获得所述至少一个360度矩形格式化投影图片包括获得第一时间360度矩形格式化投影图片及第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片在时间上先于所述第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片包括至少第一区,且其中所述第二时间360度矩形格式化投影图片包括至少第二区,其中所述第一区及所述第二区位于所述投影边界的相对侧上,所述方法可进一步包含:横越所述第一时间360度矩形格式化投影图片确定多个第一时间译码树单元(CTU);横越所述第二时间360度矩形格式化投影图片确定多个第二时间译码树单元(CTU);从所述多个第一时间CTU内确定多个第一时间译码单元(CU);从所述多个第二时间CTU内确定多个第二时间译码单元(CU);横越来自所述多个第一时间CU的所述CU及来自所述多个第二时间CU的至少一个CU中的至少一者执行帧间预测;识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU;及基于所述识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU而横越所述第一时间CU及所述第二时间CU停用帧间预测。
在一些实施例中,横越所述第一时间CU及所述第二时间CU停用帧间预测进一步包括横越所述第一时间CU及所述第二时间CU不执行基于运动的预测。
在另外实施例中,所述投影边界包括一边界,在所述边界中,在投影域中沿着所述边界彼此邻近而安置的第一区及第二区并不在空间域中彼此邻近而安置。
一种装置可包含:存储器;及处理器,其经配置以执行方法,所述方法包含:获得至少一个360度矩形格式化投影图片;在所述至少一个360度矩形格式化投影图片中检测投影边界;基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及产生经编码视频位流。
一种计算机可读媒体可为非暂时性计算机可读媒体,其存储含有指令的程序,所述指令在由装置的处理器执行时致使所述装置执行方法,所述方法包含:获得至少一个360度矩形格式化投影图片;在所述至少一个360度矩形格式化投影图片中检测投影边界;基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及产生经编码视频位流。
一种设备可包含:用于获得至少一个360度矩形格式化投影图片的装置;用于在所述至少一个360度矩形格式化投影图片中检测投影边界的装置;用于基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者的装置;及用于产生经编码视频位流的装置。
附图说明
下文参考以下附图详细地描述本申请案的说明性实施例:
图1A为绘示根据一些实例的等矩形投影帧的实例的图像。
图1B为绘示根据一些实例的立方体映图投影帧的实例的图像。
图1C为绘示根据一些实例的经调整立方体映图投影帧的实例的图像。
图1D为绘示根据一些实例的赤道圆柱形投影帧的实例的图像。
图2A为绘示根据一些实例的等矩形投影的实例的图解。
图2B为绘示根据一些实例的立方体映图或经调整立方体映图投影的实例的图解。
图2C为绘示根据一些实例的立方体映图或经调整立方体映图投影的实例的图解。
图2D为绘示根据一些实例的赤道圆柱形投影的实例的图解。
图2E为绘示根据一些实例的赤道圆柱形投影的实例的图解。
图3A为绘示根据一些实例的归因于运动的经显现视口接缝/边界的实例的图像。
图3B为绘示根据一些实例的归因于滤波的视口接缝/边界的实例的图像。
图4A为绘示根据一些实例的用于3×2包装立方体映图或经调整立方体映图投影的防护带方案的实例的图解。
图4B为绘示根据一些实例的用于3×2包装立方体映图或经调整立方体映图投影的防护带方案的实例的图解。
图4C为绘示根据一些实例的用于3×2包装立方体映图或经调整立方体映图投影的防护带方案的实例的图解。
图5A为绘示根据一些实例的用于3×2包装等矩形投影的防护带方案的实例的图解。
图5B为绘示根据一些实例的用于3×2包装等矩形投影的防护带方案的实例的图解。
图5C为绘示根据一些实例的用于3×2包装等矩形投影的防护带方案的实例的图解。
图5D为绘示根据一些实例的用于6×1包装等矩形投影的防护带方案的实例的图解。
图5E为绘示根据一些实例的用于6×1包装等矩形投影的防护带方案的实例的图解。
图6为绘示根据一些实例的沿着上部图片半部及下部图片半部降至8×8CU的CTU拆分的实例的图解。
图7为绘示根据一些实例的实例视频编码装置的框图。
图8为绘示根据一些实例的实例视频解码装置的框图。
图9为绘示用于根据本文中所论述的技术处理视频数据的过程的实例的流程图。
具体实施方式
下文提供本发明的某些方面及实施例。可独立地应用这些方面及实施例中的一些且可组合地应用其中的一些,这对于所属领域的技术人员来说将显而易见。在以下描述中,出于阐释的目的,阐述众多特定细节以便提供对本申请案的实施例的透彻理解。然而,将显而易见,可在无这些特定细节的情况下实践各种实施例。图及描述并不意图为限定性的。
随后的描述仅提供示范性实施例,且并不意图限制本发明的范围、适用性或配置。更确切地,示范性实施例的随后的描述将向所属领域的技术人员提供用于实施示范性实施例的令人能够实现的描述。应理解,可在不脱离如所附权利要求书中所阐述的本申请案的精神及范围的情况下对元件的功能及布置进行各种改变。
在以下描述中给出特定细节以提供对实施例的透彻理解。然而,所属领域的一般技术人员应理解,可在无这些特定细节的情况下实践实施例。举例来说,可以框图形式将电路、系统、网络、过程及其它组件展示为组件,以免以不必要的细节混淆实施例。在其它情况下,可在无不必要的细节的情况下展示熟知的电路、过程、算法、结构及技术,以便避免混淆实施例。
此外,应注意,个别实施例可被描述为过程,过程被描绘为流程图、流图、数据流图、结构图或框图。尽管流程图可将操作描述为顺序过程,但可并行地或同时地执行许多操作。另外,可重新布置操作的次序。过程在其操作完成时终止,但可具有未包含于图中的额外步骤。过程可对应于方法、函数、规程、子例程、子程序等等。当过程对应于函数时,其终止可对应于函数返回至调用函数或主函数。
术语“计算机可读媒体”包含但不限于便携式或非便携式存储装置、光学存储装置,及能够存储、含有或携载指令及/或数据的各种其它媒体。计算机可读媒体可包含:非暂时性媒体,其中可存储数据且不包含载波;及/或暂时性电子信号,其以无线方式或经由有线连接而传播。非暂时性媒体的实例可包含但不限于磁盘或磁带、例如紧密光盘(CD)或数字多功能光盘(DVD)的光学存储媒体、闪速存储器、存储器或存储器装置。计算机可读媒体可具有存储于其上的代码及/或机器可执行指令,所述代码及/或所述机器可执行指令可表示规程、函数、子程序、程序、例程、子例程、模块、软件包、类,或指令、数据结构或程序语句的任何组合。一代码片段可通过传递及/或接收信息、数据、自变量、参数或存储器内容而耦合至另一代码片段或硬件电路。信息、自变量、参数、数据等等可经由包含存储器共享、消息传递、令牌传递、网络传输等等的任何合适方式而传递、转发或传输。
此外,实施例可由硬件、软件、固件、中间件、微码、硬件描述语言或其任何组合实施。当以软件、固件、中间件或微码实施时,用以执行必要任务的程序代码或代码片段(例如计算机程序产品)可存储于计算机可读或机器可读媒体中。处理器可执行必要任务。
虚拟实境(VR)提供虚拟地存在于通过显现自然及/或合成图像及与沉浸用户的移动相关的声音而创建的非物理世界中的能力,从而允许用户与所述世界交互。随着显现装置(例如头戴式显示器(HMD))及360度视频(在一些情况下也被称作VR或扩增实境(AR)视频)创建的最新进展,可提供显着的体验质量。VR及/或AR应用包含游戏、培训、教育、运动视频、在线购物等等。
在一些实例中,360度视频系统可包含各种组件且可执行各种步骤。举例来说,360度视频系统可包含相机组。相机组可包含指向不同方向(具有不同视图)且共同地覆盖围绕相机组的各种视点(或虚拟实境场景)的多个个别相机(虚拟或真实相机)。
360度视频系统可获得由相机组的相机捕获的视频图片,且可执行图像拼接。举例来说,图像拼接装置可从相机组接收视频图片。在一些实例中,图像拼接包含获得由多个个别相机拍摄的视频图片,及在时域中使视频图片同步且在空间(space/spatial)域中将视频图片拼接为球体视频,但映射至矩形格式,例如等矩形(例如世界地图)、立方体映图或其它形状。
可接着使用视频编码解码器(例如MPEG编码解码器、H.265/HEVC编码解码器、H.264/AVC编码解码器或其它合适编码解码器)编码(或压缩)呈映射矩形格式的视频。下文描述关于使用视频编码解码器编码视频数据的细节。
可以媒体格式存储及/或封装一或多个经压缩视频位流且经由网络传输至接收器。举例来说,360度视频系统的传输侧可从经编码视频数据产生经封装文件(例如使用ISO基本媒体文件格式及/或导出文件格式)。举例来说,视频编码解码器可编码视频数据,且封装引擎可通过将视频数据封装于一或多个ISO格式媒体文件中而产生媒体文件。在一些实施方案中,不以媒体格式存储及/或封装经压缩位流。
接收器可接着接收可能以一格式而封装的经编码(或经压缩)视频位流。接收器中的编码解码器可解码(或解压缩)经编码视频位流。在一些情况下,接收器可解析具有经封装视频数据的媒体文件以产生经编码视频数据。举例来说,当使用媒体格式时,接收器可解析具有经封装视频数据的媒体文件以产生经编码视频数据,且接收器中的编码解码器可解码经编码视频数据。
接收器可接着将经解码视频信号发送至显现装置。显现装置可为例如HMD或其它显现装置。HMD可跟踪头部移动及眼球移动,且可显现视频的对应部分,使得向用户呈现沉浸式体验。
投影及几何映射用以使用三维(3D)至二维(2D)过程在2D映图上表示3D表面。举例来说,在360度视频应用中,投影及映射用以将球体上表示的360度视频映射至二维视频帧上。3D至2D投影及映射的实例包含但不限于:等矩形(ERP)、立方体映图(CMP)、经调整立方体映图(ACP),及赤道圆柱形(ECP)。在一些几何映射(例如CMP及ACP)中,将彼此空间上相关的六边立方体图像变换成矩形2D投影及映射。在其它几何映射(例如ECP)中,可使用圆柱体几何形状。
在拼接多个输入相机图片之后,通常以ERP格式表示360度视频图片。等矩形投影映图通过将球体上的点的纬度及经度映射至图片上的x-y坐标而将球体上的点映射至2D映图。立方体映图投影将球体的表面上的点投影至与球体表面相切的平面(立方体的面)上的点。立方体映图投影将球体的表面投影至与球体表面相切的平面(立方体的六个面)上。经调整立方体映图投影为CMP的增强,其将立方体面上的取样调整为几乎均一。除了立方体几何形状以外,圆柱形几何形状还已用以实现球体表面至投影图片上的等面积映射。赤道圆柱形投影将赤道球体片段映射至圆柱体上。在一个实例中,ECP操作以将在纬度±sin-1(2/3)≈±41.81°之间的球体的赤道区投影至圆柱体几何形状上,而将圆形球体极区变形成投影图片中的正方形区。
图1(图1A至1D)展示运用ERP、CMP、ACP及ECP投影而获得的‘撑杆跳(PoleVault)’序列的视频图片。图1A中展示ERP帧投影100,图1B中展示CMP 3×2帧投影102,图1C中展示ACP 3×2帧投影104,且图1D中展示ECP 3×2帧投影106。
图1B的CMP 3×2帧投影102包含上部图片半部130及底部图片半部132,且所述半部是通过水平投影边界160(在其它投影类型中其可竖直)而分离。如本文中所使用,“投影边界”可表示在投影域(例如帧投影102中所展示)内沿着边界彼此邻近而安置的多个区(例如上部图片半部130及底部图片半部132)之间的边界。在一些实施例中,投影边界还可表示并不在空间域内沿着边界彼此邻近而安置的多个区(例如上部图片半部130及底部图片半部132)之间的边界。
上部图片半部130被划分成以下一组邻近相机图片区:左侧区110、前部区111及右侧区112,且上部半部130中的这些区中的每一者是通过竖直空间域邻近区边界150及151而彼此分离。底部图片半部132被划分成以下一组邻近相机图片区:底部区120、背部区121及顶部区122,且底部半部132中的这些区中的每一者是通过竖直空间域邻近区边界150及151而彼此分离。
图1C的ACP 3×2帧投影104包含上部图片半部134及底部图片半部136,且所述半部是通过水平投影边界162而分离。上部图片半部134被划分成以下一组空间上及投影邻近相机图片区:左侧区113、前部区114及右侧区115,且上部图片半部134中的这些区中的每一者是通过竖直空间域邻近区边界152及153而彼此分离。底部图片半部136被划分成以下一组空间上及投影邻近相机图片区:底部区123、背部区124及顶部区125,且底部图片半部136中的这些区中的每一者是通过竖直空间域邻近区边界152及153而彼此分离。
图1D的ECP 3×2帧投影106包含上部图片半部138及底部图片半部139,且所述半部是通过水平投影边界163而分离。上部图片半部138被划分成以下一组特殊及投影邻近相机图片区:左侧区116、前部区117及右侧区118,且上部图片半部138中的这些区中的每一者是通过竖直空间域邻近区边界154及155而彼此分离。底部图片半部139被划分成以下一组空间上及投影邻近相机图片区:底部区126、背部区127及顶部区128,且底部图片半部139中的这些区中的每一者是通过竖直空间域邻近区边界154及155而彼此分离。
在经由使用三维(3D)至二维(2D)过程在2D映图上变换3D表面的已知投影及映射技术显现360度视频时存在各种问题。举例来说,由使用这些技术引起的现有程度的接缝/边界伪影。接缝/边界伪影趋向于在投影图片由邻近不连续区组成时出现。
在投影过程之后,通常运用视频编码器(AVC、HEVC等等)压缩视频图片,存储或传输视频图片,且在接收器侧处解码视频图片,其中显现器产生匹配于查看者的头部定向的视口。取决于此定向及视场,视口可与图片内的外部图片边界或内部边界交叉。对于图片内的边界,所述边界可在连续邻近区或不连续非邻近区之间,如图2所展示。
图2(图2A至2D)在图2A中展示ERP图片200。图2B展示3×2 CMP/ACP图片201。图2C展示3×2 CMP/ACP图片202。图2D展示ECP图片203。图2E展示ECP图片204。
图2A展示含有外部图片边缘边界290至296的ERP图片200。ERP图片200包含视口205,其中视口205沿着与边缘片段220相交的视口边界而与外部图片边缘边界294相交,且沿着与边缘片段221相交的视口边界而与外部图片边缘边界292相交。此处,在一个实例中,ERP图片200的完整区域等于一个单一区。作为ERP图片,ERP图片200为围绕360度投影图片的完整包覆,尽管两个竖直外部图片边界292、294被展示为单独外部图片边界,但其可被认为表示ERP图片200的背部边缘处的单一竖直空间域邻近边界,其中在右侧外部图片边界292旁边的像素表示与在左侧外部图片边界294旁边的其它对应像素空间上相关联的像素。
图2B展示含有四个外部图片边缘边界242至245的CMP/ACP图片201。CMP/ACP图片201含有六个区270至272、278至280,其中CMP/ACP图片201的顶部半部是由三个空间上连续邻近区270至272构成,且其中空间上连续邻近区270至272沿着竖直空间域邻近边界258、259彼此分离。CMP/ACP图片201的底部半部含有三个空间上连续邻近区278至280,其中空间上连续邻近区沿着竖直空间域邻近边界258、259彼此分离。CMP/ACP图片201的顶部半部(270至272一起)及底部半部(278至280一起)是通过水平投影边界266而彼此分离。CMP/ACP图片201包含视口206,其中视口206由于其位于左侧区270内的部分而沿着与边缘片段222相交的视口边界而与左侧外部图片边缘边界244相交,且还沿着与边缘片段223相交的视口边界而与顶部外部图片边缘边界242相交。视口206由于其位于背部区279内的部分而沿着与边缘片段224相交的视口边界而与底部外部图片边界245相交,且沿着与边缘片段225相交的视口边界而与竖直空间域邻近区边界259相交。视口206由于其位于顶部区280内的部分而沿着与边缘片段226相交的视口边界而与底部外部图片边界245相交,且沿着与边缘片段225相交的视口边界而与竖直空间域邻近邻近图片边界259相交。
图2C展示含有四个外部图片边缘边界246至249的CMP/ACP图片202。CMP/ACP图片202含有六个区273至275、281至283,其中CMP/ACP图片202的顶部半部含有三个空间上连续邻近区273至275,且其中空间上连续邻近区沿着竖直空间域邻近边界260、261而与其邻近对应物分离。CMP/ACP图片202的底部半部含有三个空间上连续邻近区281至283,其中空间上连续邻近区沿着竖直空间域邻近区边界260、261而与其邻近对应物区分离。CMP/ACP图片202的顶部半部(273至275一起)及底部半部(281至283一起)是通过水平投影边界267而彼此分离。CMP/ACP图片202包含视口207,其中视口207由于其位于前部区274内的部分而沿着与边缘片段229相交的视口边界而与水平投影边界267相交,且还沿着与边缘片段230相交的视口边界而与竖直空间域邻近区边界261相交。视口207由于其位于右侧区275内的部分而沿着与边缘片段231相交的视口边界而与水平投影边界267相交,且沿着与边缘片段230相交的视口边界而与竖直空间域邻近图片/区边界261相交。视口207由于其位于底部区281内的部分而沿着与边缘片段227相交的视口边界而与左侧外部图片边界248相交,且沿着与边缘片段228相交的视口边界而与水平投影边界267相交。
图2D展示含有四个外部图片边缘边界250至253的ECP图片203。ECP图片203含有四个区276、284至286,其中ECP图片203的顶部半部包括前部区276,其中前部区276表示圆柱体的四分之三且跨越ECP图片203的顶部半部。ECP图片203的底部半部含有三个空间上连续邻近区284至286,其中空间上连续邻近区沿着竖直空间域邻近区边界262、263而与其邻近对应物区分离。ECP图片203的顶部半部276及底部半部(284至286一起)是通过水平投影边界268而彼此分离。ECP图片203包含视口208,其中视口208由于其位于前部区276内的部分而沿着与边缘片段232相交的视口边界而与左侧外部图片边界252相交,且还沿着与边缘片段233相交的视口边界而与顶部外部图片边界250相交。视口208由于其位于背部区285内的部分而沿着与边缘片段234相交的视口边界而与底部外部图片边界253相交,且沿着与边缘片段235相交的视口边界而与竖直空间域邻近区/图片边界263相交。视口208由于其位于顶部区286内的部分而沿着与边缘片段236相交的视口边界而与底部外部图片边界253相交,且沿着与边缘片段235相交的视口边界而与竖直空间域邻近区/图片边界263相交。
图2E展示含有四个外部图片边缘边界254至257的ECP图片204。ECP图片204含有四个区277、287至289,其中ECP图片204的顶部半部包括前部区277,其中前部区276表示圆柱体的四分之三且跨越ECP图片204的顶部半部。ECP图片204的底部半部含有三个空间上连续邻近区287至289,其中空间上连续邻近区沿着竖直空间域邻近区边界264、265而与其邻近对应物区分离。ECP图片204的顶部半部277及底部半部(287至289一起)是通过水平投影边界269而彼此分离。ECP图片204包含视口209,其中视口209由于其位于前部区277内的部分而沿着两个视口边缘片段239及240而与水平投影边界269相交。视口209由于其位于底部区287内的部分而沿着与边缘片段237相交的视口边界而与左侧外部图片边界256相交,且沿着与边缘片段238相交的视口边界而与水平投影边界269相交。
取决于定向及视场,且如图2(图2A至2E)所展示,视口205至209可与以下各者交叉:(1)外部边缘图片边界242至257、290至296;或(2)在邻近区群组(例如(270/271/272)、(273/274/275)、(278/279/280)、(281/282/283)、(284/285/286)、(287/288/289))之间的图片内的竖直空间域邻近区边界258至265;或(3)在非空间上邻近区(例如270/278、271/279、272/280、273/281、274/282、275/283、276/284、276/285、276/286、277/287、277/288、277/289)之间的水平投影边界266至269。如所展示,视口边缘片段220至240为视口区202至210与这些边界(外部图片,邻近及非邻近)交叉之处。
在至少一个实例中,例如展示投影图片200的图2A中的ERP情况,左侧外部图片边界294及右侧外部图片边界292围绕球体的背部而包覆,因此,朝向球体的背部而定向的视口205可与左侧外部图片边界294及右侧外部图片边界292交叉。ERP图片中的可用的且在一些实例中为显现视口所需要的区是出于说明性目的而由加阴影矩形205表示(通常,形状可能不为矩形)。在图2A中由两个线段220、221表示为显现所需要的区内的边界。
在至少一个实例中,如图1B及1C所绘示的CMP或ACP立方体面的3×2帧包装的情况,如图2B及2C所展示的视口(206及207)可与如被展示为粗体边界边缘片段222至226及227至231(分别为图2B及2C)的各种边界交叉。尽管如所展示将左侧立方体面/区270、273、前部立方体面/区271、274及右侧立方体面/区272、275邻近地放置于顶部图片半部中,但在左侧面/区270、273与前部面/区271、274之间及在前部面/区271、274与右侧面/区272、275之间存在竖直空间域邻近区边界258、260,其中,例如线如在图1B及1C中可见为断裂的,且对于底部图片半部相似,其中在顶部区/面280、283与背部区/面279、282之间存在竖直空间域邻近区边界259、261,且在底部面/区278、281与背部面/区279、282之间存在竖直空间域邻近区边界258、260。邻近立方体面之间的这些竖直空间域邻近区边界258至265(图2B至2E)相比于以下各者较不为不连续的:(1)实际图片边界242至257;及(2)在图片的顶部半部270/271/272、273/274/275、276、277(图2B至2E)与底部半部278/279/280、281/282/283、284/285/286、287/288/289之间的水平投影边界266至269。图2B及2C绘示具有与各种边界交叉的用于显现的区的两个视口206、207。在这些实例中,选择立方体面的3×2包装,然而,存在具有表示其它替代实例的不同边界(例如1×6、6×1等等)的替代包装方案。3×2包装具有包装方案的最少边界中的一者。
在至少一个实例中,例如图2D及2E所绘示的ECP边界的情况具有相似于CMP及ACP的3×2包装的包装。在此实例中,主要差异为,含有“前部”区276、277的顶部图片半部为与用以投影球体的赤道区的解开圆柱体的完整四分之三对应的连续区。在此包装中,如背部区284至286、287至289中所含有,解开圆柱体的四分之一放置于背部位置中。相较于CMP及ACP(图2B及2C),例如线不在前部区276、277(图2D及2E)内的任何边界处断裂,然而,线归因于圆柱形投影而弯曲。在此ECP实例(图2D及2E)中,其它边界与CMP及ACP(图2B及2C)边界等效,其中归因于ECP方案中的微小未对准而在顶部区(280、283(图2B及2C))(286、289(图2D及2E))与背部区(279、282(图2B及2C))、(285、288(图2D及2E))之间及底部区(278、281(图2B及2C))、(284、287(图2D及2E))与背部区(279、282(图2B及2C))、(285、288(图2D及2E))之间具有某一额外不连续性。其它替代示范性包装方案(未展示),例如6×1或1×6,使解开圆柱体区保持连接,然而,在这些实例中,在圆柱形区与极区之间存在额外边界。
三种类型的图片边界:(1)外部图片边界;(2)位于图片之间的竖直空间域邻近区边界,所述图片在预拼接相机图片中彼此邻近且其中这些边界表示两个空间上邻近区之间的拼接边界;及(3)位于图片之间的水平投影边界,其中这些图片在预拼接相机图片中彼此不空间上邻近,且全部三种类型的图片边界是在投影图片内,且可与经显现视口内的可见接缝/边界伪影相关联。以下为潜在原因的两个实例:实例1潜在原因与运动相关。在至少一个实例中,例如横越被导向至区中的外部图片边界的运动情况,运动估计过程可选择部分地包含由编码器添加以扩展参考图片的经填补样本的块。在较高量化参数(QP)值下,那些经填补样本出现于视口中的边界的一个侧,而边界的另一侧不同,如图3A所绘示。(图3A表示归因于运动的经显现视口接缝/边界301(沿着图像的中心竖直地向下)的实例)。此类型的接缝/边界伪影在较高QP值下强。在一些实例中,当运动估计选择部分地横越中间图片边界而定位的块时,在CMP或ACP图片(3×2包装)(图2B及2C)内部发生相似问题。在一些实例中,发生与环路内滤波(解块、样本自适应偏移)相关的相似问题。在至少一个实例中,其中在图片边界上停用滤波,清晰的未经滤波接缝/边界尤其在较高QP值下可在经显现视口中可见。在CMP或ACP图片(3×2包装)中,可横越中间图片边界发生滤波,从而导致可见的接缝/边界伪影,如图3B所绘示。(图3B展示归因于滤波的视口接缝/边界310、312)。
本文中揭示解决例如上文所提及的问题的问题的系统及方法。举例来说,为了解决与相对众多的接缝/边界伪影相关联的问题,提议多个系统及方法,例如(1)投影图片适配(编码器/解码器)、(2)仅视频编码器修改,及(3)混合模型。在投影图片适配示范性途径中,投影图片经适配使得在显现阶段期间防止接缝/边界。此途径的实例为防护带的使用。在仅视频编码器修改示范性途径中,编码器可为投影感知的,且可进行符合标准(AVC、HEVC等等)的内部修改以防止显现阶段中的投影接缝/边界。在混合示范性途径中,可组合视频编码器及投影图片修改两者以实现改善的接缝/边界伪影减少结果。
以下为投影图片适配示范性途径的另外详细实例,包含名为围绕投影图片的区对称地分布的防护带的第1实例,及名为投影图片中不对称地分布的防护带的第2实例。
防护带为添加至由额外样本(接缝伪影减少样本)(例如像素)组成的投影图片中的区/区域,所述额外样本并非为将图片投影回至球体上所必需的,但其可有助于减少例如球体上或经显现视口中的接缝/边界的伪影,其中所述伪影为例如运动补偿预测、环路内滤波、量化等等的视频编码器动作的结果。并非为将图片投影回至球体上所必需且用以减少与接缝/边界相关联的伪影的样本在本文中被描述为接缝伪影减少样本。防护带中的样本可包含额外接缝伪影减少投影样本,即,运用相同投影过程(例如CMP、ACP或ECP过程)围绕(空间上靠近)投影区所获得的样本。举例来说,在第一点位于立方体几何形状中的前部区/面立方体的边缘附近的情况下,且在相邻顶部区/面上的空间上靠近位置中存在第二点/样本的情况下,这些空间上靠近点可在包含这些区/面的关联CMP、ACP或ECP投影中彼此远离而重新定位。在关联CMP、ACP或ECP算法/计算中产生的所有像素的空间接近度及位置可用于关联投影过程中,且可用以识别任何两个位置之间的空间接近度,而不管其位于投影图片上的何处。
存在用于例如以下各者的防护带接缝伪影减少样本的其它选项:从投影图片中的一个区至第二区转变的梯度样本(例如经由梯度操作),或投影样本与梯度或混合物的组合,或重复样本,其中投影区的边界样本(例如围绕区的边缘)重复至防护带区。一般来说,可获得防护带接缝伪影减少样本,使得保持压缩效率,同时减少接缝/边界伪影。防护带区通常由宽度及围绕图片中的投影区的周界的位置界定,且可被进一步描述为在特定区边界旁边的位置及从此特定区边界的边缘延伸至此区中的宽度。举例来说,防护带可沿着立方体面的所有侧/边缘/边界(周界)而存在,这为对称情况;或防护带可仅沿着最多地促成视口中的伪影减少的一些侧/边缘/边界而放置,这为不对称情况。由于防护带区(包含额外防护带接缝伪影减少样本)在视频编码之前被添加至投影图片,故防护带区可用于视频编码过程以用于例如运动补偿预测等等的预测,这可改善预测。然而,在视频编码过程中使用用于预测的样本可被例如呈文件格式等等的经用信号发送的信息禁止,如以下各者中进一步所描述:2017年4月,澳大利亚荷巴特,MPEG Doc.M40408,Miska M.Hannuksela,IgorD.D.Curcio,“OMAF:Guard band signalling”;及2017年4月,澳大利亚荷巴特,MPEGDoc.N16824,Byeongdoo Choi,Ye-Kui Wang,Miska M.Hannuksela,Youngkwon Lim,“Textof ISO/IEC DIS 23090-2 Omnidirectional Media Format”。
图4(图4A至4C)绘示用于3×2包装CMP及ACP图片400至406的各种防护带示范性方案,其可基于具有六个面/区410至412、419至421的立方体几何形状,如图4A所展示。图4A展示投影图片400,在每一立方体面/区(410至412、419至421)边界旁边存在一防护带430至453((虚线外部的区域)(430至435)),使得立方体面/区(非防护带区域)区域保持正方形。这为对称防护带情况的实例。一般来说,防护带宽度可取决于立方体面侧而变化,这为不对称防护带情况。图4B及4C中描绘实例。展示投影图片402的图4B为防护带454至469添加于投影图片402的顶部(413至415一起)及底部(422至424一起)3×1半部旁边的情况的实例。原因为,顶部(413至415一起)及底部(422至424一起)半部中的每一者内的立方体面/区沿着竖直空间域邻近区边界在相应半部中彼此邻近,以在这些相应半部内避免不连续边缘。支持此类型的防护带区的假定为,与在空间域中彼此邻近的相机图片对应的接缝/边界伪影在经显现视口中常常较不可见,且因此在至少一个实例中无需防护带。应注意,对于顶部半部(413至415一起)中的每一面/区,例如非防护带区域(从原始面/区切断的区域:面/区减防护带)表示在应用关联防护区域之前不同于其原始正方形几何形状的矩形非正方形区域。本文中的许多实例中的其它原始正方形面/区在应用关联防护区之后还改变为非正方形区域(非防护带区域)。在展示投影图片406的图4C中,防护带区470至475可仅围绕顶部(416至418一起)与底部(425至427一起)图片半部之间的水平投影边界及在所述水平投影边界旁边应用,以避免可在编码过程中横越此非空间域邻近中间边界而发生的环路内滤波。此类型的接缝/边界伪影已知为在经显现视口中通常非常有问题,且因此,在例如环路内滤波不能在编码器中通过其它方式停用的情况下可推荐此防护带类型。可在下文关于仅视频编码器修改的论述中找到进一步论述。
展示投影图片500至508的图5(图5A至5E)描绘用于ECP图片及CMP/ACP图片的防护带区530至591、330至346(例如图5A至5C中的3×2包装ECP;图5D中的6×1包装ECP;及图5E中的6×1包装CMP/ACP)。可示范与用于立方体几何形状(例如图5E)的防护带的差异,这在于,在ECP包装中,存在未拆分(例如图5A至5D)的圆柱体区(在这些实例中被标记为“前部”)的四分之三。
展示投影图片500的图5A描绘对称防护带区情况,其中防护带区域(530至536一起)围绕顶部图片半部510,且防护带(537至548一起)在底部图片半部(516至518一起)内,且更特定地说,防护带544至546、549围绕顶部区518,防护带538至540、547围绕底部区516,且防护带541至543、548围绕背部区517。此处,顶部图片半部510在同一位置及区域中包括圆柱体前部区的四分之三。展示投影图片502、504的图5B及5C描绘不对称情况实例,其中图5B展示防护带550至565围绕顶部511及底部(519至521一起)3×1图片半部,且其中图5C展示防护带566至571在顶部512与底部(522至524一起)图片半部之间的水平投影边界旁边(上方及下方)。
在其它实例中,ECP可被包装1×6或6×1,如展示投影图片506的图5D所描绘,其中圆柱体区(316至320一起)未拆分(具有防护区的6×1包装ECP)。图5D展示投影图片506,其具有三个面/区:360圆柱体区面(316至320一起)、顶部面321及底部面322,且每一面具有相应防护带区域572至591。在图5D中,展示两个竖直投影边界595、596,第一边界595在360圆柱体区面(316至320一起)与顶部面/区321之间,且第二边界596在顶部面/区321与底部面/区322之间。尽管圆柱体区未拆分且以前部面(316至320一起)形式表示,但此前部面(316至320一起)对应于原始立方体几何形状(即,360圆柱体区)的四者:前部、左侧、右侧及背部。
在另一实例中,CMP/ACP可被背衬1×6或6×1,如展示投影图片508的图5E所描绘。图5E展示投影图片508,其具有六个面/区1010至1015,且每一面具有防护带330至346。在图5E中,仅竖直不连续投影邻近区边界360展示于底部区1013与右侧区1012之间。
取决于包装类型,防护带的数目可能不同。举例来说,5B中所表示的情况被展示为具有16个防护带(550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565)(每面侧计数一个防护带(应注意,顶部图片(前部)半部内存在3个面侧)),而5D中所表示的情况被展示为具有18个防护带((572、573、574、575、577、578、579、580、581、582、583、584、586、587、588、589、590、591)(应注意,面区(316至320一起)内存在4个面侧)。因此,对于相似防护带保护,在一些实例中,3×2包装类型可更有利。
可例如以文件格式等等用信号发送每区的防护带的存在及防护带宽度。防护带的存在还可为QP相依的。举例来说,在低QP值下,可避免防护带或可减少其宽度。
以下表示利用投影样本(即,运用相同投影过程围绕投影区所获得的样本)的防护带实施方案的实例。这些实例适用于ACP及CMP途径两者。尽管许多以下实例及实例计算对应于特定3×2立方体几何形状,但其它实例可包含其它实例计算,且其中那些实例计算可对应于其它立方体几何形状,例如6×1、1×6、2×3立方体几何形状。
将任何正方形面的尺寸表示为以样本单位计的A×A。对于2D至3D坐标转换,在给出在给定面f上的位置(m,n)的情况下,首先将(u,v)计算为:
u=(m+0.5)*2/A–1,0≤m<A,-1<u<1
v=(n+0.5)*2/A-1,0≤n<A,-1<v<1。
对于对称防护带,即,应用于立方体面的四个侧的防护带,定义以下padfactor:
Figure BDA0002321861450000151
其中padmargin指定以样本单位计的防护带的宽度(小于A/2),例如4个样本。随后,如下运用padfactor将(u,v)坐标缩放成(u',v'):
u'=u×padfactor,v'=v×padfactor
这扩展立方体面以取样来自球体的额外边界样本。在ACP情况下,在缩放之后进行调整公式。随后,使用位置(u',v')及面索引f(参见下表1)导出3D坐标(X,Y,Z)。
表1.在给出(u,v)及面索引f的情况下的(X,Y,Z)导出
Figure BDA0002321861450000152
在3D至2D坐标转换的情况下,在给出(X,Y,Z)的情况下,根据下表2计算(u,v)及面索引f。随后,将(u,v)坐标除以padfactor。在ACP情况下,在调整公式之后执行缩放。
表2.在给出(X,Y,Z)的情况下的(u,v)及面索引f的导出
条件 f u v
|X|≥|Y|且|X|≥|Z|且X>0 0 -Z/|X| -Y/|X|
|X|≥|Y|且|X|≥|Z|且X<0 1 Z/|X| -Y/|X|
|Y|≥|X|且|Y|≥|Z|且Y>0 2 X/|Y| Z/|Y|
|Y|≥|X|且|Y|≥|Z|且Y<0 3 X/|Y| -Z/|Y|
|Z|≥|X|且|Z|≥|X|且Z>0 4 X/|Z| -Y/|Z|
|Z|≥|X|且|Z|≥|Y|且Z<0 5 -X/|Z| -Y/|Z|
对于图4B所描绘的不对称防护带情况,其中防护带(454至469)是围绕顶部(413至315一起)及底部(422至424一起)图片半部而添加,表3中的缩放是根据立方体面f而应用,其中如下定义不对称apadfactor:
Figure BDA0002321861450000162
表3.CMP及ACP的2D至3D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000163
在3D至2D坐标转换的情况下,应用表4中的缩放以获得最终(u',v')坐标。
表4.CMP及ACP的3D至2D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000164
Figure BDA0002321861450000171
对于图4C所描绘的不对称防护带情况,其中防护带(470至475)被添加至仅中间图片边界,运用下表5替换表3且运用下表6替换表4。
表5.CMP及ACP的2D至3D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000172
表6.CMP及ACP的3D至2D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000173
缩放应用于ECP,其中针对CMP及ACP定义padfactor及apadfactor。
在图5B的不对称防护带情况下,其中防护带(550至565)应用于上部(511)及下部图片(519至521一起)半部,应用表7及表8中的以下缩放。
表7.ECP的2D至3D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000181
表8.ECP的3D至2D转换中的(u,v)坐标的缩放。
Figure BDA0002321861450000182
以下为仅视频编码器修改示范性途径的另外详细实例,包含名为量化参数调整的第1实例、名为环路内滤波器停用的第2实例,及名为防止从非邻近区进行预测的第3实例。这些实例为符合至少HEVC的视频译码标准,且可符合功能性适用于或类似于此处所解决的功能性的其它标准。
图6展示图片600、上部图片半部604及下部图片半部608。图片600还被展示为具有示范性64×64译码树单元(CTU)及示范性8×8译码单元(CU)。展示示范性CTU的一个CTU侧610,以及示范性CU的一个8×8CU侧620。图片600具有在其周界处的四个外部边缘图片边界630至633,围绕上部图片半部604的周界的四个上部图片区边界630、631、632、634,及围绕下部图片半部608的周界的四个下部图片区边界631、632、633、634。
沿着投影图片区的量化参数(QP)调整的示范性途径可含有以下功能性。可沿着CMP、ACP或ECP的投影图片区边界调整QP值。另外,可针对一组CU调整QP值,其中第一CU邻近于投影图片区边界,且至少一个其它CU邻近于所述组中的第一CU或另一CU,但不邻近于投影图片区边界。QP被调整的区QP区域边界可类似于如上文所论述的防护带区,即,对称或不对称,其中差异为,如果存在残差(例如HEVC),那么QP区域边界的宽度取决于经由增量QP译码而允许QP改变的译码单元大小。用于QP调整的译码单元大小可与CTU一样大或与8×8CU一样小,或为其间的任何CU大小组合。应注意,QP调整通常不会将投影样本添加至投影图片,然而,QP调整可与防护带途径组合。图6绘示图片600沿着上部图片半部及下部图片半部降至8×8CU的CTU拆分。想法是沿着边界减少8×8CU的QP值。此途径将增加指派给边界的位的数目,因此增加边界的质量且减少经显现视口中的接缝/边界伪影。
QP调整可应用于所有图片类型,例如在例如视频编码器的随机存取(RA)配置中产生的经帧内译码P(预测性经译码图片)或B(双向预测性经译码图片)图片。替代地,QP调整可限于仅经帧内译码图片,或限于RA配置中的图片预测层次的特定层级,例如仅经帧内译码图片及第一层级B图片。QP调整还可取决于例如图片的QP值。在低(低于阈值(例如小于20))QP值的情况下,可避免或减少QP调整。
运用图块、切片或QP改变的环路内滤波器(解块、样本自适应偏移等等)停用的示范性途径可含有以下功能性。在至少一个实例中,在CMP、ACP或ECP投影图片的3×2包装中,环路内滤波可影响上部图片半部与下部图片半部之间的边界,从而在经显现视口中产生严重的接缝/边界伪影。可在以下五种情境下在某些边缘上停用环路内滤波:在第1情境中,通过在参数集(序列参数集(SPS)、图片参数集(PPS)等等)中停用环路内滤波而在整个图片中停用环路内滤波(解块、SAO)。在第2情境中,在切片内停用环路内滤波。在一实例中,一个切片可由含有边界的CTU组成。可在切片标头中停用环路内滤波。在第3情境中,横越图块边界停用环路内滤波。在一个实例中,可界定两个图块,其分别在上部图片半部及下部图片半部中含有CTU(或横越中间边界而分离的两个CU,其中中间边界可能未CTU对准,但图块高度为CTU的整数倍)。在第4情境中,通过沿着边界减少CU的QP值停用环路内滤波。如果QP减少至低于阈值(例如15),那么解块滤波器不会影响边缘样本。在第5情境中,编码器可通过选择不将样本自适应偏移(SAO)带或边缘偏移应用于沿着边界的CTU而停用环路内滤波。
防止从非邻近区进行帧预测(帧内预测、运动补偿预测(帧间预测)等等)的示范性途径可含有以下功能性。由于帧内预测利用潜在地位于投影图片中的非邻近区中的相邻样本,故目标将是防止编码器利用这些样本。尤其在较高QP值层级下,伪影可能是可见的。一种用以防止编码器利用相邻样本的途径是运用投影图片中的非邻近区之间的边界界定图块。防止从非邻近区进行运动补偿(帧间预测)可通过限定编码器中的运动估计过程的搜索区域而实现。
由相机(例如鱼眼相机或其它合适相机或多个相机)捕获的视频数据可经译码以减少为传输及存储所需要的数据的量。译码技术可实施于实例视频编码及解码系统中。在一些实例中,系统包含源装置,其提供稍后将由目的地装置解码的经编码视频数据。具体地说,源装置经由计算机可读媒体将视频数据提供至目的地装置。源装置及目的地装置可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手机、所谓的“智能”平板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式处理装置等等。在一些情况下,源装置及目的地装置可经配备以用于无线通信。
目的地装置可经由计算机可读媒体接收待解码的经编码视频数据。计算机可读媒体可包括能够将经编码视频数据从源装置移动至目的地装置的任何类型的媒体或装置。在一个实例中,计算机可读媒体可包括用以使源装置能够实时地将经编码视频数据直接传输至目的地装置的通信媒体。可根据例如无线通信协议的通信标准调制经编码视频数据,且将经编码视频数据传输至目的地装置。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成例如局域网、广域网或例如互联网的全局网络的基于数据包的网络的部分。通信媒体可包含路由器、交换机、基站,或可用于促进从源装置至目的地装置的通信的任何其它设备。
在一些实例中,可将经编码数据从输出接口输出至存储装置。相似地,可由输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取数据存储媒体中的任一者,例如硬盘驱动器、蓝光(Blu-ray)光盘、DVD、CD-ROM、闪速存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体。在另外实例中,存储装置可对应于可存储由源装置产生的经编码视频的文件服务器或另一中间存储装置。目的地装置可经由流式处理或下载从存储装置存取经存储视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据传输至目的地装置的任何类型的服务器。实例文件服务器包含网页服务器(例如用于网站)、FTP服务器、网络连接存储(NAS)装置,或本地磁盘驱动器。目的地装置可经由包含互联网连接的任何标准数据连接来存取经编码视频数据。此连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如Wi-Fi连接)、有线连接(例如DSL、电缆调制解调器等等)或两者的组合。从存储装置的经编码视频数据的传输可为流式处理传输、下载传输或其组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者,例如空中电视广播、有线电视传输、卫星电视传输、互联网流式处理视频传输(例如HTTP动态自适应流式处理(DASH))、编码至数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统可经配置以支持单向或双向视频传输来支持例如视频流式处理、视频回放、视频广播及/或视频电话的应用。
在一个实例中,源装置包含视频源、视频编码器及输出接口。目的地装置可包含输入接口、视频解码器及显示装置。源装置的视频编码器可经配置以应用本文中所揭示的技术。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置可从例如外部相机的外部视频源接收视频数据。同样地,目的地装置可与外部显示装置介接,而非包含集成显示装置。
以上实例系统仅仅为一个实例。用于并行地处理视频数据的技术可由任何数字视频编码及/或解码装置执行。尽管本发明的技术通常由视频编码装置执行,但所述技术还可由视频编码器/解码器(通常被称作“编码解码器(CODEC)”)执行。此外,本发明的技术还可由视频预处理器执行。源装置及目的地装置仅仅为源装置产生经译码视频数据以供传输至目的地装置的这些译码装置的实例。在一些实例中,源装置及目的地装置可以大致上对称方式而操作,使得所述装置中的每一者包含视频编码及解码组件。因此,实例系统可支持视频装置之间的单向或双向视频传输,例如用于视频流式处理、视频回放、视频广播或视频电话。
视频源可包含例如视频相机的视频捕获装置、含有经先前捕获视频的视频存档,及/或用以从视频内容提供者接收视频的视频馈送接口。作为另外替代方案,视频源可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频及计算机产生视频的组合。在一些情况下,如果视频源为视频相机,那么源装置及目的地装置可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术一般可适用于视频译码,且可适用于无线及/或有线应用。在每一情况下,可由视频编码器编码经捕获、经预捕获或计算机产生视频。可接着由输出接口将经编码视频信息输出至计算机可读媒体上。
如所提及,计算机可读媒体可包含:暂态媒体,例如无线广播或有线网络传输;或存储媒体(即,非暂时性存储媒体),例如硬盘、闪存驱动器、紧密光盘、数字视频光盘、蓝光光盘,或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置接收经编码视频数据且例如经由网络传输将经编码视频数据提供至目的地装置。相似地,例如光盘冲压设施的媒体生产设施的计算装置可从源装置接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体可被理解为包含各种形式的一或多个计算机可读媒体。
目的地装置的输入接口从计算机可读媒体接收信息。计算机可读媒体的信息可包含由视频编码器定义的语法信息,其也由视频解码器使用,所述语法信息包含描述块及其它经译码单元(例如图片群组(GOP))的特性及/或处理的语法元素。显示装置将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。已描述了本申请案的各种实施例。
图7及图8中分别展示实例编码装置104及解码装置112的特定细节。图7为绘示可实施本发明中所描述的技术中的一或多者的实例编码装置104的框图。编码装置104可例如产生本文中所描述的语法结构(例如视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)或其它语法元素的语法结构)。编码装置104可执行视频切片内的视频块的帧内预测及帧间预测译码。如先前所描述,帧内译码至少部分地依赖于空间预测以减少或移除给定视频帧或图片内的空间冗余。帧间译码至少部分地依赖于时间预测以减少或移除视频序列的邻近或周围帧内的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。帧间模式,例如单向预测(P模式)或双向预测(B模式),可指若干基于时间的压缩模式中的任一者。
编码装置104包含分割单元35、预测处理单元41、滤波器单元63、图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。预测处理单元41包含运动估计单元42、运动补偿单元44及帧内预测处理单元46。对于视频块重构,编码装置104还包含反量化单元58、反变换处理单元60及求和器62。滤波器单元63意图表示一或多个环路滤波器,例如解块滤波器、自适应环路滤波器(ALF)及样本自适应偏移(SAO)滤波器。尽管滤波器单元63在图7中被展示为环路内滤波器,但在其它配置中,滤波器单元63可被实施为环路后滤波器。后处理装置57可对由编码装置104产生的经编码视频数据执行额外处理。本发明的技术可在一些情况下由编码装置104实施。然而,在其它情况下,本发明的技术中的一或多者可由后处理装置57实施。
如图7所展示,编码装置104接收视频数据,且分割单元35将数据分割成视频块。分割还可包含分割成切片、切片片段、图块或其它较大单元的分割,以及视频块分割,例如根据LCU及CU的四叉树结构。编码装置104大体上绘示编码待编码视频切片内的视频块的组件。切片可被划分成多个视频块(且可能被划分成被称作图块的多组视频块)。预测处理单元41可基于误差结果(例如译码速率及失真程度等等)针对当前视频块选择多个可能译码模式中的一者,例如多个帧内预测译码模式中的一者或多个帧间预测译码模式中的一者。预测处理单元41可将所得的经帧内或帧间译码块提供至求和器50以产生残差块数据且提供至求和器62以重构经编码块以用作参考图片。
预测处理单元41内的帧内预测处理单元46可执行当前视频块相对于与待译码的当前块在同一帧或切片中的一或多个相邻块的帧内预测译码以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码以提供时间压缩。
运动估计单元42可经配置以根据用于视频序列的预定图案来确定用于视频切片的帧间预测模式。预定图案可将序列中的视频切片指定为P切片、B切片或GPB切片。运动估计单元42及运动补偿单元44可高度地集成,但出于概念目的而被单独地绘示。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的预测单元(PU)相对于参考图片内的预测性块的位移。
预测性块为被发现在像素差方面接近地匹配于待译码的视频块的PU的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些实例中,编码装置104可计算存储于图片存储器64中的参考图片的次整数像素位置的值。举例来说,编码装置104可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜索且输出具有分数像素精确度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一者识别存储于图片存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送至熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计(可能执行内插至子像素精确度)确定的运动向量而提取或产生预测性块。在接收到当前视频块的PU的运动向量后,运动补偿单元44就可在参考图片列表中定位运动向量所指向的预测性块。编码装置104通过从正被译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残差视频块。像素差值形成用于块的残差数据,且可包含亮度及色度差分量两者。求和器50表示执行此减去运算的一或多个组件。运动补偿单元44还可产生与视频块及视频切片相关联的语法元素,以供解码装置112用于解码视频切片的视频块。
作为如上文所描述的由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测处理单元46可帧内预测当前块。具体地说,帧内预测处理单元46可确定帧内预测模式以用以编码当前块。在一些实例中,帧内预测处理单元46可例如在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测处理单元46可从经测试模式中选择适当帧内预测模式来使用。举例来说,帧内预测处理单元46可使用对各种经测试帧内预测模式的速率-失真分析来计算速率-失真值,且可在经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析大体上确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位速率(即,位的数目)。帧内预测处理单元46可根据各种经编码块的失真及速率计算比率以确定哪一帧内预测模式展现所述块的最佳速率-失真值。
在任何情况下,在选择用于块的帧内预测模式之后,帧内预测处理单元46可将指示用于块的选定帧内预测模式的信息提供至熵编码单元56。熵编码单元56可编码指示选定帧内预测模式的信息。编码装置104可在经传输位流配置数据中包含各种块的编码上下文的定义,以及待用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表及经修改帧内预测模式索引表的指示。位流配置数据可包含多个帧内预测模式索引表及多个经修改帧内预测模式索引表(也被称作码字映射表)。
在预测处理单元41经由帧间预测或帧内预测而产生用于当前视频块的预测性块之后,编码装置104通过从当前视频块减去预测性块而形成残差视频块。残差块中的残差视频数据可包含于一或多个TU中且应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上相似变换的变换将残差视频数据变换成残差变换系数。变换处理单元52可将残差视频数据从像素域转换至变换域,例如频域。
变换处理单元52可将所得的变换系数发送至量化单元54。量化单元54量化变换系数以进一步减少位速率。量化过程可减少与所述系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行包含经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56熵编码经量化变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码技术。在由熵编码单元56进行熵编码之后,经编码位流可传输至解码装置112,或经存档以供稍后由解码装置112传输或由解码装置112检索。熵编码单元56还可熵编码用于正被译码的当前视频切片的运动向量及其它语法元素。
反量化单元58及反变换处理单元60分别应用反量化及反变换,以在像素域中重构残差块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残差块与参考图片列表内的参考图片中的一者的预测性块相加来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构残差块以计算次整数像素值以用于运动估计。求和器62将经重构残差块与由运动补偿单元44产生的运动补偿预测块相加以产生用于存储于图片存储器64中的参考块。参考块可由运动估计单元42及运动补偿单元44用作参考块以帧间预测后续视频帧或图片中的块。
以此方式,图7的编码装置104表示经配置以产生用于经编码视频位流的语法的视频编码器的实例。编码装置104可例如产生如上文所描述的VPS、SPS及PPS参数集。编码装置104可执行本文中所描述的技术中的任一者,包含上文所描述的过程。本发明的技术已大体上关于编码装置104予以描述,但如上文所提及,本发明的一些技术还可由后处理装置57实施。
图8为绘示实例解码装置112的框图。解码装置112包含熵解码单元80、预测处理单元81、反量化单元86、反变换处理单元88、求和器90、滤波器单元91及图片存储器92。预测处理单元81包含运动补偿单元82及帧内预测处理单元84。在一些实例中,解码装置112可执行与关于来自图7的编码装置104所描述的编码遍次大体上互逆的解码遍次。
在解码过程期间,解码装置112接收由编码装置104发送的表示经编码视频切片的视频块及关联语法元素的经编码视频位流。在一些实施例中,解码装置112可从编码装置104接收经编码视频位流。在一些实施例中,解码装置112可从例如以下各者的网络实体79接收经编码视频位流:服务器、媒体感知网络元件(MANE)、视频编辑器/剪接器,或经配置以实施上文所描述的技术中的一或多者的其它此类装置。网络实体79可能或可能不包含编码装置104。在网络实体79将经编码视频位流传输至解码装置112之前,本发明中所描述的一些技术可由网络实体79实施。在一些视频解码系统中,网络实体79及解码装置112可为单独装置的部分,而在其它情况下,关于网络实体79所描述的功能性可由包括解码装置112的同一装置执行。
解码装置112的熵解码单元80熵解码位流以产生经量化系数、运动向量及其它语法元素。熵解码单元80将运动向量及其它语法元素转发至预测处理单元81。解码装置112可接收视频切片层级及/或视频块层级处的语法元素。熵解码单元80可处理及解析例如VPS、SPS及PPS的一或多个参数集中的固定长度语法元素及可变长度语法元素两者。
当视频切片被译码为经帧内译码(I)切片时,预测处理单元81的帧内预测处理单元84可基于经用信号发送的帧内预测模式及来自当前帧或图片的先前经解码块的数据而产生用于当前视频切片的视频块的预测数据。当视频帧被译码为经帧间译码(例如B、P或GPB)切片时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量及其它语法元素产生用于当前视频切片的视频块的预测性块。可从参考图片列表内的参考图片中的一者产生预测性块。解码装置112可基于存储于图片存储器92中的参考图片使用默认构造技术来构造参考帧列表:列表0及列表1。
运动补偿单元82通过解析运动向量及其它语法元素来确定用于当前视频切片的视频块的预测信息,且使用所述预测信息以产生用于正被解码的当前视频块的预测性块。举例来说,运动补偿单元82可使用参数集中的一或多个语法元素以确定用以译码视频切片的视频块的预测模式(例如帧内预测或帧间预测)、帧间预测切片类型(例如B切片、P切片或GPB切片)、用于切片的一或多个参考图片列表的构造信息、用于切片的每一帧间编码视频块的运动向量、用于切片的每一帧间译码视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元82还可执行基于内插滤波器的内插。运动补偿单元82可使用如在编码视频块期间由编码装置104使用的内插滤波器来计算参考块的次整数像素的内插值。在此情况下,运动补偿单元82可从经接收语法元素确定由编码装置104使用的内插滤波器,且可使用内插滤波器来产生预测性块。
反量化单元86反量化或解量化位流中所提供且由熵解码单元80解码的经量化变换系数。反量化过程可包含使用由编码装置104针对视频切片中的每一视频块所计算的量化参数来确定量化程度且同样地确定应被应用的反量化程度。反变换处理单元88将反变换(例如反DCT或其它合适反变换)、反整数变换或概念上相似反变换过程应用于变换系数,以便在像素域中产生残差块。
在运动补偿单元82基于运动向量及其它语法元素而产生用于当前视频块的预测性块之后,解码装置112通过将来自反变换处理单元88的残差块与由运动补偿单元82产生的对应预测性块求和而形成经解码视频块。求和器90表示执行此求和运算的一或多个组件。视需要,还可使用环路滤波器(在译码环路中或在译码环路之后)以使像素转变平滑,或以其它方式改善视频质量。滤波器单元91意图表示一或多个环路滤波器,例如解块滤波器、自适应环路滤波器(ALF)及样本自适应偏移(SAO)滤波器。尽管滤波器单元91在图8中被展示为环路内滤波器,但在其它配置中,滤波器单元91可被实施为环路后滤波器。给定帧或图片中的经解码视频块接着存储于图片存储器92中,图片存储器92存储用于后续运动补偿的参考图片。图片存储器92还存储经解码视频以供稍后呈现于显示装置(例如视频目的地装置122)上。
图9绘示用于根据上文所论述的技术处理视频数据的过程900的实例。在902处,过程900包含获得至少一个360度矩形格式化投影图片。
在904处,过程900包含在至少一个360度矩形格式化投影图片中检测投影边界。
在906处,过程900包含基于检测到至少一个360度矩形格式化投影图片包括投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者。
在908处,过程900包括产生经编码视频位流。
在前述描述中,参考本申请案的特定实施例描述了本申请案的方面,但所属领域的技术人员将认识到,本申请案并不限于此情形。因此,尽管本文中已详细地描述本申请案的说明性实施例,但应理解,本发明概念可以其它方式本不同地体现及使用,且所附权利要求书意图被认作包含这些变化,但先前技术所限制者除外。上述申请案的各种特征及方面可被个别地或联合地使用。另外,实施例可用于除了本文中所描述的环境及应用以外的任何数目个环境及应用,而不脱离本说明书的较广精神及范围。因此,本说明书及附图应被视为说明性而非限定性的。出于说明的目的,以特定次序描述了方法。应了解,在替代实施例中,可以与所描述的次序不同的次序来执行所述方法。
在组件被描述为“经配置以”执行某些操作的情况下,可例如通过以下方式来实现此配置:设计电子电路或其它硬件以执行操作;编程可编程电子电路(例如微处理器或其它合适电子电路)以执行操作;或其任何组合。
结合本文中所揭示的实施例而描述的各种说明性逻辑块、模块、电路及算法步骤可被实施为电子硬件、计算机软件、固件或其组合。为了清楚地说明硬件与软件的此可互换性,各种说明性组件、块、模块、电路及步骤已在上文大体上在其功能性方面予以描述。此功能性被实施为硬件还是软件取决于特定应用及强加于整个系统的设计约束。所属领域的技术人员可针对每一特定应用而以变化的方式实施所描述的功能性,而但不应将这些实施决策解释为造成脱离本申请案的范围。
本文中所描述的技术还可实施于电子硬件、计算机软件、固件或其任何组合中。这些技术可实施于多种装置中的任一者中,例如通用计算机、无线通信装置手机,或具有多种用途的集成电路装置,所述用途包含应用于无线通信装置手机及其它装置中。可将被描述为模块或组件的任何特征一起实施于集成逻辑装置中或单独地实施为离散但可互操作的逻辑装置。如果以软件实施,那么所述技术可至少部分地由包括程序代码的计算机可读数据存储媒体实现,所述程序代码包含在执行时执行上文所描述的方法中的一或多者的指令。计算机可读数据存储媒体可形成计算机程序产品的部分,所述计算机程序产品可包含包装材料。计算机可读媒体可包括存储器或数据存储媒体,例如随机存取存储器(RAM),例如同步动态随机存取存储器(SDRAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、闪速存储器、磁性或光学数据存储媒体等等。另外或替代地,所述技术可至少部分地由计算机可读通信媒体实现,所述计算机可读通信媒体携载或传达呈指令或数据结构的形式且可由计算机存取、读取及/或执行的程序代码,例如传播信号或波。
程序代码可由处理器执行,所述处理器可包含一或多个处理器,例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。此处理器可经配置以执行本发明中所描述的技术中的任一者。通用处理器可为微处理器;但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可被实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一或多个微处理器,或任何其它此类配置。因此,如本文中所使用的术语“处理器”可指以下各者中的任一者:前述结构、前述结构的任何组合,或适合于实施本文中所描述的技术的任何其它结构或设备。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用软件模块或硬件模块内,或并入于组合式视频编码器-解码器(编码解码器)中。

Claims (34)

1.一种在视频编码器处处理视频数据的方法,其包括:
获得至少一个360度矩形格式化投影图片;
在所述至少一个360度矩形格式化投影图片中检测投影边界;
基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及
产生经编码视频位流。
2.根据权利要求1所述的方法,其进一步包括:
确定所述360度矩形格式化投影图片含有第一图片半部及第二图片半部,其中所述第一图片半部及所述第二图片半部是由投影边界分离;及
响应于确定所述360度矩形格式化投影图片含有所述第一图片半部及所述第二图片半部而停用环路内滤波。
3.根据权利要求2所述的方法,其中停用环路内滤波进一步包括:通过在用于所述至少一个360度矩形格式化投影图片的参数集中停用环路内滤波而针对所述整个至少一个360度矩形格式化投影图片停用环路内滤波。
4.根据权利要求2所述的方法,其中停用环路内滤波进一步包括:在所述至少一个360度矩形格式化投影图片的切片内停用环路内滤波。
5.根据权利要求2所述的方法,其中停用环路内滤波进一步包括:
识别围绕所述投影边界彼此邻近的至少两个译码树单元CTU;及
针对围绕所述投影边界彼此邻近的所述经识别至少两个CTU停用环路内滤波。
6.根据权利要求2所述的方法,其中停用环路内滤波进一步包括:
识别围绕所述投影边界彼此邻近的至少两个译码树单元CTU;及
通过横越所述至少两个CTU停用样本自适应偏移SAO带偏移或SAO边缘偏移而针对所述经识别至少两个CTU停用环路内滤波。
7.根据权利要求1所述的方法,其中所述360度矩形格式化投影图片为3×2包装投影图片。
8.根据权利要求1所述的方法,其中所述360度矩形格式化投影图片为6×1包装投影图片。
9.根据权利要求1所述的方法,其进一步包括:
确定所述360度矩形格式化投影图片包括至少第一区及第二区,其中所述第一区及所述第二区是由所述投影边界分离;
横越所述360度矩形格式化投影图片确定多个译码树单元CTU;
从所述多个CTU内确定多个译码单元CU;
横越所述多个CU中的至少两者执行帧内预测;
识别位于所述第一区内的第一CU及位于所述第二区内的第二CU;及
基于识别位于所述第一区内的所述第一CU及位于所述第二区内的所述第二CU而横越所述第一CU及所述第二CU停用帧内预测。
10.根据权利要求9所述的方法,其中所述第一CU及所述第二CU共享共同边界,且其中所述共同边界为所述投影边界。
11.根据权利要求9所述的方法,其进一步包括:
确定所述360度矩形格式化投影图片的360度矩形格式化投影图片QP值;且
其中横越所述第一CU及所述第二CU停用帧内预测是仅在所述360度矩形格式化投影图片QP值高于阈值QP水平时才执行。
12.根据权利要求11所述的方法,其中所述阈值QP水平为20。
13.根据权利要求1所述的方法,其中获得所述至少一个360度矩形格式化投影图片包括获得第一时间360度矩形格式化投影图片及第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片在时间上先于所述第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片包括至少第一区,且其中所述第二时间360度矩形格式化投影图片包括至少第二区,其中所述第一区及所述第二区位于所述投影边界的相对侧上,所述方法进一步包括:
横越所述第一时间360度矩形格式化投影图片确定多个第一时间译码树单元CTU;
横越所述第二时间360度矩形格式化投影图片确定多个第二时间译码树单元CTU;
从所述多个第一时间CTU内确定多个第一时间译码单元CU;
从所述多个第二时间CTU内确定多个第二时间译码单元CU;
横越来自所述多个第一时间CU的所述CU及来自所述多个第二时间CU的至少一个CU中的至少一者执行帧间预测;
识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU;及
基于所述识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU而横越所述第一时间CU及所述第二时间CU停用帧间预测。
14.根据权利要求13所述的方法,其中横越所述第一时间CU及所述第二时间CU停用帧间预测进一步包括横越所述第一时间CU及所述第二时间CU不执行基于运动的预测。
15.根据权利要求1所述的方法,其中所述投影边界包括一边界,在所述边界中,在投影域中沿着所述边界彼此邻近而安置的第一区及第二区并不在空间域中彼此邻近而安置。
16.一种包括用于处理视频数据的视频译码器的装置,其包括:
存储器;及
处理器,其经配置以执行方法,所述方法包括:
获得至少一个360度矩形格式化投影图片;
在所述至少一个360度矩形格式化投影图片中检测投影边界;
基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及
产生经编码视频位流。
17.根据权利要求16所述的装置,所述方法进一步包括:
确定所述360度矩形格式化投影图片含有第一图片半部及第二图片半部,其中所述第一图片半部及所述第二图片半部是由投影边界分离;及
响应于确定所述360度矩形格式化投影图片含有所述第一图片半部及所述第二图片半部而停用环路内滤波。
18.根据权利要求17所述的装置,其中停用环路内滤波进一步包括:通过在用于所述至少一个360度矩形格式化投影图片的参数集中停用环路内滤波而针对所述整个至少一个360度矩形格式化投影图片停用环路内滤波。
19.根据权利要求17所述的装置,其中停用环路内滤波进一步包括:在所述至少一个360度矩形格式化投影图片的切片内停用环路内滤波。
20.根据权利要求17所述的装置,其中停用环路内滤波进一步包括:
识别围绕所述投影边界彼此邻近的至少两个译码树单元CTU;及
针对围绕所述投影边界彼此邻近的所述经识别至少两个CTU停用环路内滤波。
21.根据权利要求17所述的装置,其中停用环路内滤波进一步包括:
识别围绕所述投影边界彼此邻近的至少两个译码树单元CTU;及
通过横越所述至少两个CTU停用样本自适应偏移SAO带偏移或SAO边缘偏移而针对所述经识别至少两个CTU停用环路内滤波。
22.根据权利要求16所述的装置,其中所述360度矩形格式化投影图片为3×2包装投影图片。
23.根据权利要求16所述的装置,其中所述360度矩形格式化投影图片为6×1包装投影图片。
24.根据权利要求16所述的装置,所述方法进一步包括:
确定所述360度矩形格式化投影图片包括至少第一区及第二区,其中所述第一区及所述第二区是由所述投影边界分离;
横越所述360度矩形格式化投影图片确定多个译码树单元CTU;
从所述多个CTU内确定多个译码单元CU;
横越所述多个CU中的至少两者执行帧内预测;
识别位于所述第一区内的第一CU及位于所述第二区内的第二CU;及
基于识别位于所述第一区内的所述第一CU及位于所述第二区内的所述第二CU而横越所述第一CU及所述第二CU停用帧内预测。
25.根据权利要求24所述的装置,其中所述第一CU及所述第二CU共享共同边界,且其中所述共同边界为所述投影边界。
26.根据权利要求24所述的装置,所述方法进一步包括:
确定所述360度矩形格式化投影图片的360度矩形格式化投影图片QP值;且
其中横越所述第一CU及所述第二CU停用帧内预测是仅在所述360度矩形格式化投影图片QP值高于阈值QP水平时才执行。
27.根据权利要求26所述的装置,其中所述阈值QP水平为20。
28.根据权利要求16所述的装置,其中获得所述至少一个360度矩形格式化投影图片包括获得第一时间360度矩形格式化投影图片及第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片在时间上先于所述第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片包括至少第一区,且其中所述第二时间360度矩形格式化投影图片包括至少第二区,其中所述第一区及所述第二区位于所述投影边界的相对侧上,所述方法进一步包括:
横越所述第一时间360度矩形格式化投影图片确定多个第一时间译码树单元CTU;
横越所述第二时间360度矩形格式化投影图片确定多个第二时间译码树单元CTU;
从所述多个第一时间CTU内确定多个第一时间译码单元CU;
从所述多个第二时间CTU内确定多个第二时间译码单元CU;
横越来自所述多个第一时间CU的所述CU及来自所述多个第二时间CU的至少一个CU中的至少一者执行帧间预测;
识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU;及
基于所述识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU而横越所述第一时间CU及所述第二时间CU停用帧间预测。
29.根据权利要求28所述的装置,其中横越所述第一时间CU及所述第二时间CU停用帧间预测进一步包括横越所述第一时间CU及所述第二时间CU不执行基于运动的预测。
30.根据权利要求16所述的装置,其中所述投影边界包括一边界,在所述边界中,在投影域中沿着所述边界彼此邻近而安置的第一区及第二区并不在空间域中彼此邻近而安置。
31.一种用于在视频译码器处处理视频数据的非暂时性计算机可读媒体,所述非暂时性计算机可读媒体存储含有指令的程序,所述指令在由装置的处理器执行时致使所述装置执行方法,所述方法包括:
获得至少一个360度矩形格式化投影图片;
在所述至少一个360度矩形格式化投影图片中检测投影边界;
基于检测到所述至少一个360度矩形格式化投影图片包括所述投影边界而停用环路内滤波、帧内预测或帧间预测中的至少一者;及
产生经编码视频位流。
32.根据权利要求31所述的非暂时性计算机可读媒体,所述方法进一步包括:
确定所述360度矩形格式化投影图片包括至少第一区及第二区,其中所述第一区及所述第二区是由所述投影边界分离;
横越所述360度矩形格式化投影图片确定多个译码树单元CTU;
从所述多个CTU内确定多个译码单元CU;
横越所述多个CU中的至少两者执行帧内预测;
识别位于所述第一区内的第一CU及位于所述第二区内的第二CU;及
基于识别位于所述第一区内的所述第一CU及位于所述第二区内的所述第二CU而横越所述第一CU及所述第二CU停用帧内预测。
33.根据权利要求31所述的非暂时性计算机可读媒体,其中获得所述至少一个360度矩形格式化投影图片包括获得第一时间360度矩形格式化投影图片及第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片在时间上先于所述第二时间360度矩形格式化投影图片,其中所述第一时间360度矩形格式化投影图片包括至少第一区,且其中所述第二时间360度矩形格式化投影图片包括至少第二区,其中所述第一区及所述第二区位于所述投影边界的相对侧上,所述方法进一步包括:
横越所述第一时间360度矩形格式化投影图片确定多个第一时间译码树单元CTU;
横越所述第二时间360度矩形格式化投影图片确定多个第二时间译码树单元CTU;
从所述多个第一时间CTU内确定多个第一时间译码单元CU;
从所述多个第二时间CTU内确定多个第二时间译码单元CU;
横越来自所述多个第一时间CU的所述CU及来自所述多个第二时间CU的至少一个CU中的至少一者执行帧间预测;
识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU;及
基于所述识别位于所述第一区内的第一时间CU及位于所述第二区内的第二时间CU而横越所述第一时间CU及所述第二时间CU停用帧间预测。
34.根据权利要求31所述的非暂时性计算机可读媒体,其中所述投影边界包括一边界,在所述边界中,在投影域中沿着所述边界彼此邻近而安置的第一区及第二区并不在空间域中彼此邻近而安置。
CN201880040403.5A 2017-06-29 2018-06-28 减少360度视频中的接缝伪影 Active CN110754090B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762526700P 2017-06-29 2017-06-29
US62/526,700 2017-06-29
US16/020,596 2018-06-27
US16/020,596 US11032545B2 (en) 2017-06-29 2018-06-27 Reducing seam artifacts in 360-degree video
PCT/US2018/040146 WO2019006209A1 (en) 2017-06-29 2018-06-28 REDUCTION OF WELDING ARTIFACTS IN A 360 DEGREE VIDEO

Publications (2)

Publication Number Publication Date
CN110754090A true CN110754090A (zh) 2020-02-04
CN110754090B CN110754090B (zh) 2023-11-24

Family

ID=64734448

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201880040403.5A Active CN110754090B (zh) 2017-06-29 2018-06-28 减少360度视频中的接缝伪影
CN201880040051.3A Active CN110754089B (zh) 2017-06-29 2018-06-28 减少360度视频中的接缝伪影
CN201880040025.0A Pending CN110754088A (zh) 2017-06-29 2018-06-28 减少360度视频中的接缝伪影

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201880040051.3A Active CN110754089B (zh) 2017-06-29 2018-06-28 减少360度视频中的接缝伪影
CN201880040025.0A Pending CN110754088A (zh) 2017-06-29 2018-06-28 减少360度视频中的接缝伪影

Country Status (4)

Country Link
US (3) US11032545B2 (zh)
CN (3) CN110754090B (zh)
TW (3) TW201906410A (zh)
WO (3) WO2019006207A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10593074B1 (en) * 2016-03-16 2020-03-17 Liberty Mutual Insurance Company Interactive user interface for displaying geographic boundaries
US20180054613A1 (en) * 2016-08-22 2018-02-22 Mediatek Inc. Video encoding method and apparatus with in-loop filtering process not applied to reconstructed blocks located at image content discontinuity edge and associated video decoding method and apparatus
EP3322149B1 (en) * 2016-11-10 2023-09-13 Tata Consultancy Services Limited Customized map generation with real time messages and locations from concurrent users
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US11032545B2 (en) 2017-06-29 2021-06-08 Qualcomm Incorporated Reducing seam artifacts in 360-degree video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
KR102342874B1 (ko) * 2017-07-04 2021-12-23 엘지전자 주식회사 360도 비디오에 대한 영상 코딩 시스템에서 프로젝션 타입 기반 양자화 파라미터를 사용한 영상 디코딩 방법 및 장치
JP6854716B2 (ja) * 2017-07-05 2021-04-07 キヤノン株式会社 画像処理装置、画像処理方法
US10798417B2 (en) * 2017-07-05 2020-10-06 Qualcomm Incorporated Deblock filtering for 360-degree video coding
US10614609B2 (en) * 2017-07-19 2020-04-07 Mediatek Inc. Method and apparatus for reduction of artifacts at discontinuous boundaries in coded virtual-reality images
US11212438B2 (en) 2018-02-14 2021-12-28 Qualcomm Incorporated Loop filter padding for 360-degree video coding
CN112352425B (zh) * 2018-06-21 2024-02-13 索尼公司 图像处理装置和图像处理方法
WO2020005031A1 (ko) * 2018-06-28 2020-01-02 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US11765349B2 (en) * 2018-08-31 2023-09-19 Mediatek Inc. Method and apparatus of in-loop filtering for virtual boundaries
US11094088B2 (en) * 2018-08-31 2021-08-17 Mediatek Inc. Method and apparatus of in-loop filtering for virtual boundaries in video coding
WO2020147545A1 (en) * 2019-01-14 2020-07-23 Mediatek Inc. Method and apparatus of in-loop filtering for virtual boundaries
US11089335B2 (en) 2019-01-14 2021-08-10 Mediatek Inc. Method and apparatus of in-loop filtering for virtual boundaries
US11127166B2 (en) * 2019-03-01 2021-09-21 Tencent America LLC Method and apparatus for enhanced patch boundary identification for point cloud compression
US11070848B2 (en) * 2019-06-24 2021-07-20 Tencent America LLC Method for efficient signaling of virtual boundary for loop filtering control
US11190801B2 (en) 2019-07-02 2021-11-30 Mediatek Inc. Video encoding method with syntax element signaling of mapping function employed by cube-based projection and associated video decoding method
US11190768B2 (en) 2019-07-02 2021-11-30 Mediatek Inc. Video encoding method with syntax element signaling of packing of projection faces derived from cube-based projection and associated video decoding method and apparatus
US11659206B2 (en) 2019-07-02 2023-05-23 Mediatek Inc. Video encoding method with syntax element signaling of guard band configuration of projection-based frame and associated video decoding method and apparatus
US11616962B2 (en) * 2019-07-15 2023-03-28 Tencent America LLC Method and apparatus for video coding
US20220400291A1 (en) * 2019-11-18 2022-12-15 Lg Electronics Inc. Image coding device and method, for controlling loop filtering
KR102381163B1 (ko) * 2020-01-07 2022-04-01 엘지전자 주식회사 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법
CN111586414B (zh) * 2020-04-07 2022-04-15 南京师范大学 一种基于svc和dash的360°视频流调度方法
WO2023025178A1 (en) * 2021-08-24 2023-03-02 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100322304A1 (en) * 2009-06-17 2010-12-23 Novatek Microelectronics Corp. Multi-source filter and filtering method based on h.264 de-blocking
US20130101031A1 (en) * 2011-10-25 2013-04-25 Qualcomm Incorporated Determining quantization parameters for deblocking filtering for video coding
US20140362922A1 (en) * 2013-01-30 2014-12-11 Atul Puri Content adaptive prediction and entropy coding of motion vectors for next generation video
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
US20170085917A1 (en) * 2015-09-23 2017-03-23 Nokia Technologies Oy Method, an apparatus and a computer program product for coding a 360-degree panoramic video

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6693649B1 (en) * 1999-05-27 2004-02-17 International Business Machines Corporation System and method for unifying hotspots subject to non-linear transformation and interpolation in heterogeneous media representations
US20110274162A1 (en) * 2010-05-04 2011-11-10 Minhua Zhou Coding Unit Quantization Parameters in Video Coding
JP5505154B2 (ja) * 2010-07-16 2014-05-28 ソニー株式会社 画像処理装置と画像処理方法
TWI468849B (zh) 2011-04-28 2015-01-11 Inst Information Industry 建築物紋理擷取裝置及其方法
US9621894B2 (en) * 2012-01-13 2017-04-11 Qualcomm Incorporated Determining contexts for coding transform coefficient data in video coding
CN104170383A (zh) 2012-03-15 2014-11-26 索尼公司 图像处理装置和方法
WO2014199634A1 (ja) * 2013-06-12 2014-12-18 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置及び画像復号方法
US20150063461A1 (en) * 2013-08-27 2015-03-05 Magnum Semiconductor, Inc. Methods and apparatuses for adjusting macroblock quantization parameters to improve visual quality for lossy video encoding
JPWO2015064403A1 (ja) * 2013-11-01 2017-03-09 ソニー株式会社 画像処理装置および方法
US10477232B2 (en) * 2014-03-21 2019-11-12 Qualcomm Incorporated Search region determination for intra block copy in video coding
CN111988606B (zh) 2014-09-15 2022-09-20 寰发股份有限公司 去区块滤波方法、相应地编码装置和存储介质
US10136133B2 (en) * 2014-11-11 2018-11-20 Dolby Laboratories Licensing Corporation Rate control adaptation for high-dynamic range images
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
US10917564B2 (en) 2016-10-12 2021-02-09 Qualcomm Incorporated Systems and methods of generating and processing files for partial decoding and most interested regions
US20180242016A1 (en) 2017-02-21 2018-08-23 Intel Corporation Deblock filtering for 360 video
US10924747B2 (en) * 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US11172208B2 (en) 2017-02-28 2021-11-09 Nokia Technologies Oy Method and apparatus for improving the visual quality of viewport-based omnidirectional video streaming
US11212497B2 (en) * 2017-03-30 2021-12-28 Samsung Electronics Co., Ltd. Method and apparatus for producing 360 degree image content on rectangular projection by selectively applying in-loop filter
US11032545B2 (en) 2017-06-29 2021-06-08 Qualcomm Incorporated Reducing seam artifacts in 360-degree video

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100322304A1 (en) * 2009-06-17 2010-12-23 Novatek Microelectronics Corp. Multi-source filter and filtering method based on h.264 de-blocking
US20130101031A1 (en) * 2011-10-25 2013-04-25 Qualcomm Incorporated Determining quantization parameters for deblocking filtering for video coding
US20140362922A1 (en) * 2013-01-30 2014-12-11 Atul Puri Content adaptive prediction and entropy coding of motion vectors for next generation video
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
US20170085917A1 (en) * 2015-09-23 2017-03-23 Nokia Technologies Oy Method, an apparatus and a computer program product for coding a 360-degree panoramic video

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHIH-MING FU ET AL.: "Sample Adaptive Offset in the HEVC Standard" *
H-C LIN ET AL.: "AHG8: An alternative arrangement for cube format (Double-cross layout)" *
MEDIATEK INC.: "AHG8: Compact cube layout with tile partition" *

Also Published As

Publication number Publication date
US20190007684A1 (en) 2019-01-03
TW201907721A (zh) 2019-02-16
US20190005683A1 (en) 2019-01-03
CN110754089A (zh) 2020-02-04
TW201906410A (zh) 2019-02-01
WO2019006198A1 (en) 2019-01-03
WO2019006209A1 (en) 2019-01-03
CN110754089B (zh) 2023-11-07
TW201911864A (zh) 2019-03-16
US10764582B2 (en) 2020-09-01
CN110754090B (zh) 2023-11-24
CN110754088A (zh) 2020-02-04
WO2019006207A1 (en) 2019-01-03
US20190007683A1 (en) 2019-01-03
US10848761B2 (en) 2020-11-24
US11032545B2 (en) 2021-06-08

Similar Documents

Publication Publication Date Title
CN110754090B (zh) 减少360度视频中的接缝伪影
CN110383843B (zh) 用于360度视频的有效压缩的球体赤道投影
KR102646967B1 (ko) 360-도 비디오의 효율적 압축을 위한 구체 극 투영들
US10484682B2 (en) Reference picture derivation and motion compensation for 360-degree video coding
CN110419221B (zh) 自适应扰动立方体的地图投影
CN111713113B (zh) 用于360度视频编码的环路滤波填充
JP6640373B2 (ja) 仮想現実ビデオコンテンツを表現するための四角錐台の幾何学的形状およびフレームパッキング構造
CN112369027A (zh) 具有用于帧内预测的多条参考线的位置相关帧内预测组合
WO2018132317A1 (en) Adjusting field of view of truncated square pyramid projection for 360-degree video
US10798417B2 (en) Deblock filtering for 360-degree video coding
US10721465B2 (en) Motion compensation for cubemap packed frames
WO2019160795A1 (en) Intra prediction for 360-degree video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant