CN102176748A - 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法 - Google Patents

用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法 Download PDF

Info

Publication number
CN102176748A
CN102176748A CN201110120389XA CN201110120389A CN102176748A CN 102176748 A CN102176748 A CN 102176748A CN 201110120389X A CN201110120389X A CN 201110120389XA CN 201110120389 A CN201110120389 A CN 201110120389A CN 102176748 A CN102176748 A CN 102176748A
Authority
CN
China
Prior art keywords
image
image data
base layer
resolution
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110120389XA
Other languages
English (en)
Other versions
CN102176748B (zh
Inventor
G·J·苏利万
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102176748A publication Critical patent/CN102176748A/zh
Application granted granted Critical
Publication of CN102176748B publication Critical patent/CN102176748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234354Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering signal-to-noise ratio parameters, e.g. requantization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64784Data processing by the network
    • H04N21/64792Controlling the complexity of the content stream, e.g. by dropping packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0102Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving the resampling of the incoming video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Television Systems (AREA)

Abstract

描述了在诸如空间可伸缩视频编码和解码的应用中为调整图像大小计算高精度位置的技术和工具。在一个方面,根据重新采样比例因子执行视频图像的重新采样。重新采样包括计算重新采样的阵列中位置i,j处的样本值。计算包括以涉及通过用上采样比例因子的逆(近似的或精确的)乘以2n值来对值的一部分进行近似的方式来计算导出的水平或垂直子样本位置x或y。近似可以是舍入或者某些其他类型的近似,诸如近似到邻近整数的取上限整数或取下限整数函数。使用滤波器对样本值进行内插。

Description

用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法
本申请是申请人于2007年1月8日提交的、申请号为“200780001989.6”(国际申请号为“PCT/US2007/000195”)的、发明名称为“用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法”的发明专利申请的分案申请。
技术领域
描述了用于编码/解码数字视频的技术和工具。
背景
随着DVD的日益流行,经因特网、数码相机、数字媒体传递音乐也变得愈发平常。工程师使用各种技术在维持质量的同时有效处理数字音频、视频和图像。为了理解这些技术,理解音频、视频和图像信息是如何在计算机内表示和处理是有帮助的。
I.计算机中媒体信息的表示
计算机将媒体信息作为表示该信息的一系列数字来处理。例如,单个数字可以表示图像的每个元素小区域的亮度强度和诸如红色、绿色或蓝色的色彩分量的强度,使得图像的数字表示由这些数字的一个或多个阵列组成。每个这样的数字可以被称为一个样本。对于彩色图像,习惯上用一个以上的样本来表示每个元素区域的颜色,通常使用三个样本。针对该元素区域的这些样本的集合可被称之为像素,其中单词“像素”指的是“图像元素”这一概念的缩写。例如,一个像素可以由显示元素区域所必须的表示红光、绿光和蓝光强度的三个样本组成。这一像素类型被称为RGB像素。若干因素影响媒体信息的质量,包括样本深度、分辨率和帧率(用于视频)。
样本深度是指示能够用来表示一样本的数量范围的通常以比特为单位测得的性质。当用于该样本的可能值越多,质量就越高,因为该数量能够捕捉更精细的强度变化和/或更大的值范围。分辨率通常指的是某一持续时间(对于音频)或空间(对于图像或单独的视频图像)内的样本数。空间分辨率更高的图像往往比其他图像看上去更明快,并且包含更多可辨别的有用细节。帧率是视频时间分辨率的常用术语。较高帧率的视频往往比其他视频更能模拟自然物体的平滑运动,并且也可以类似地认为其在时间维度上包含更多细节。鉴于所有这些因素,如下表1所示按照表示样本深度、分辨率和帧率所需的比特率,高质量对存储和传输信息的成本的折衷。
Figure BSA00000493421200021
表1:原始视频不同质量级的比特率
不考虑存储和发送高质量视频(诸如HDTV)所需的高比特率,公司和消费者愈发依赖计算机来创建、分布和回放高质量内容。为此,工程师使用压缩(也称为源译码或源编码)来降低数字媒体的比特率。压缩通过将信息转换成更低比特率的形式而降低了信息存储和传送的成本。压缩可以是无损的,其中视频质量不受损害,但是比特率的降低受到视频复杂度的限制。或者,压缩可以是有损的,其中视频质量受到损害,但是比特率的降低更显著。解压(也被称为解码)从压缩形式中重构原始信息版本。“编解码器”是编码器/解码器系统。
一般而言,视频压缩技术包括“帧内”压缩和“帧间”或预测压缩。对于视频图像,帧内压缩技术压缩各个图像。帧间压缩技术参考在前和/或在后图像压缩图像。
II.多分辨率视频和空间可伸缩性
标准的视频编码器在目标比特率低于某一阈值时会经历大幅的性能劣化。量化和其他有损处理阶段引入失真。在低比特率的情况下,高频信息可能会严重失真或者完全丢失。结果是出现明显的伪像并使得重构视频的质量显著降低。虽然可用比特率随着传输和处理技术的改进而提升,但是以受限的比特率维持高视觉质量仍然是视频编解码设计的主要目标。现有的编解码器使用若干种方法来改善受限比特率下的视觉质量。
多分辨率编码允许以不同的空间分辨率来编码视频。分辨率降低的视频能够以信息损失为代价按足够低的比特率编码。例如,在前视频编码器可以下采样(使用下采样滤波器)全分辨率视频并在垂直和/或水平方向上以降低的分辨率对其进行编码。每个方向上分辨率降低一半使得经编码图像的大小维度缩小一半。编码器发信号通知解码器这一分辨率降低的编码。解码器接收指示分辨率降低编码的信息并从接收到的信息确定该分辨率降低的视频应被如何上采样(使用上采样滤波器)来在显示前增加其图像大小。然而,在编码器下采样和编码时就已损失的信息在经上采样的图像中仍然丢失。
空间可伸缩的视频使用多层方法,允许编码器在基层降低空间分辨率(并由此降低比特率),同时在一个或多个增强层中维持来自源视频的更高分辨率的信息。例如,基层帧内图像可以用降低的分辨率编码,而伴随的增强层帧内图像则可以用更高分辨率编码。类似地,基层预测的图像可由增强层预测的图像伴随。解码器可以选择(鉴于比特率约束和/或其他准则)仅解码较低分辨率的基层以图像获得较低分辨率的重构图像,或者解码基层和增强层的图像以获得更高分辨率的重构图像。当以低于显示图像的分辨率对基层进行编码(也被称为下采样)时,经编码的图像大小实际上小于显示的图像。解码器执行计算以调整重构图像的大小并使用上采样滤波器在重构图像内的合适位置处生成内插样本值。然而,使用空间可伸缩视频的早先的编解码器已经由于非柔性的上采样滤波器以及不精确或昂贵(在计算时间或比特率方面)的调整图像大小技术而蒙受损失。
给定视频压缩和解压对于数字视频的关键重要性,视频压缩和解压是充分开发的领域并不令人惊奇。然而,不论早先的视频压缩和解压技术的好处如何,它们都没有以下技术和工具的优点。
发明内容
提供本概述以便以简化形式介绍将在以下的详细描述中进一步描述的一些概念。本概述并不旨在标识要求保护的主题的关键特征或本质特征,也不旨在用于帮助限制要求保护的主题的范围。
在本概述中,详细描述涉及用于多分辨率和分层空间可伸缩视频编码和解码的各种技术和工具。
例如,详细描述涉及在诸如空间可伸缩视频编码和解码的应用中用于调整图像大小的高精度位置计算的各种技术和工具。描述了在诸如空间可伸缩视频编码和解码的应用中为调整图像大小高精度位置计算的技术和工具。在一个方面,根据重新采样比例因子执行视频图像的重新采样。重新采样包括计算重新采样阵列中位置i,j处的样本值。计算包括以涉及通过用上采样比例因子的逆(近似的或精确的)乘以2n值来对值的一部分进行近似(或者用2n值除以上采样比例因子或者对上采样比例因子的近似)的方式来计算导出的水平或垂直子样本位置x或y。指数n可以是包括表示分数分量位数的整数F在内的两个整数之和。近似可以是舍入或者某些其他类型的近似,诸如近似到邻近整数的取上限整数或取下限整数函数。使用滤波器对样本值进行内插。
所描述的技术的一些替换提供了变化的样本位置计算,在一个实现中提供计算中近似一个额外位的精度而不会明显改变该样本位置计算过程或其复杂性。所描述的技术的一些进一步替换涉及如何对4:2:2和4:4:4采样结构进行样本位置计算。用于这些采样结构的这些替换技术只要在色度和亮度采样网格的分辨率在一特定维度上相同就把亮度和色度样本位置计算锁定在一起。
当参考附图阅读以下各个实施例的详细描述时,可以清楚其它特征和优点。
附图说明
图1是可结合其实现所描述的若干实施例的合适的计算环境的框图。
图2是可结合其实现所描述的若干实施例的通用视频编码器系统的框图。
图3是可结合其实现所描述的若干实施例的通用视频解码器系统的框图。
图4是在所描述的若干实施例中使用的宏块格式的图示。
图5A是隔行扫描视频帧的一部分的图示,示出了上半帧和下半帧的交错行。图5B是为编码/解码组织为帧的隔行扫描视频帧的图示,且图5C是为编码/解码组织为半帧的隔行扫描视频帧的图示。
图5D示出了相对于视频帧每个半帧的亮度样本位置的4:2:0色度样本位置的六个示例性空间排列。
图6是示出了用于多分辨率视频编码的概括性技术的流程图。
图7是示出了用于多分辨率视频解码的概括性技术的流程图。
图8是示出了多分辨率帧内图像和帧间预测图像的多分辨率编码技术的流程图。
图9是示出了多分辨率帧内图像和帧间预测图像的多分辨率解码技术的流程图。
图10是示出了用于编码空间可伸缩比特流层以允许按不同分辨率解码视频的技术的流程图。
图11是示出了用于解码空间可伸缩比特流层以允许按不同分辨率解码视频的技术的流程图。
图12和13是示出了用于示例性多阶段位置计算技术的伪码的代码图。
图14是示出了用于示例性增量位置计算技术的伪码的代码图。
具体实施方式
描述的实施例涉及用于多分辨率的和分层的空间可伸缩视频编码和解码的技术和工具。
本文描述的各种技术和工具可以独立使用。某些技术和工具也可以结合使用(例如,在组合的编码和/或解码过程的各不同相位)。
如下将参考处理动作的流程图描述各种技术。在流程图中示出的各种处理动作可以合并为更少的动作或者分割成更多的动作。为了简明,在特定流程图中示出的各动作与在其它地方描述的各动作之间的关系通常不示出。在许多情况下,可以重排流程图中的动作。
大部分详细描述旨在表示、编码和解码视频信息。本文中描述的用于表示、编码和解码视频信息的技术和工具可以应用于音频信息、静止图像信息或其他媒体信息。
I.计算环境
图1示出了适合在其中实现所描述的若干实施例的合适计算环境100的一个通用示例。计算环境100并非旨在对使用范围或功能提出任何限制,因为这些技术和工具可以在完全不同的通用或专用计算环境中实现。
参考图1,计算环境100包括至少一个处理单元110和存储器120。在图1中,这一最基本配置130包括在虚线内。处理单元110执行计算机可执行指令,且可以是真实或虚拟处理器。在多处理系统中,多个处理单元执行计算机可执行指令以提高处理能力。存储器120可以是易失性存储器(例如,寄存器、高速缓存、RAM)、非易失性存储器(例如,ROM、EEPROM、闪存等)或两者的某一组合。存储器120储存用此处所描述的一个或多个技术或工具实现视频编码器或解码器的软件180。
计算环境可具有额外的特征。例如,计算环境100包括存储140、一个或多个输入设备150、一个或多个输出设备160以及一个或多个通信连接170。诸如总线、控制器或网络等互连机制(未示出)将计算环境100的组件互连。通常,操作系统软件(未示出)为在计算环境100中执行的其它软件提供了操作环境,并协调计算环境100的组件的活动。
存储140可以是可移动或不可移动的,且包括磁盘、磁带或磁带盒、CD-ROM、DVD、闪存或可用于储存信息并可在计算环境100内访问的任何其它介质。存储140储存用于软件180实现视频编码器或解码器的指令。
输入设备150可以是诸如键盘、鼠标、笔、触摸屏或跟踪球等触摸输入设备、语音输入设备、扫描设备或可向计算环境100提供输入的另一设备。对于音频或视频编码,输入设备150可以是声卡、显卡、TV调谐卡、或接受模拟或数字格式的音频或视频输入的类似的设备、或将音频或视频样值读入计算环境100的CD-ROM、CD-RW或DVD。输出设备160可以是显示器、打印机、扬声器、CD或DVD刻录机、或从计算环境100提供输出的另一设备。
通信连接170允许通过通信介质到另一计算实体的通信。通信介质传达诸如计算机可执行指令、音频或视频输入或输出、或已调制数据信号形式的其它数据等信息。已调制数据信号是其一个或多个特征以在信号中编码信息的方式设置或改变的信号。作为示例而非局限,通信介质包括以电、光、RF、红外、声学或其它载波实现的有线或无线技术。
各种技术和工具可以在计算机可读介质的一般上下文中描述。计算机可读介质可以是可在计算环境内访问的任何可用介质。作为示例而非局限,对于计算环境100,计算机可读介质包括存储器120、存储140、通信介质以及上述任一个的组合。
各种技术和工具可以在诸如程序模块中所包括的在计算环境中的一个或多个目标真实或虚拟处理器上执行的计算机可执行指令的一般上下文中描述。一般而言,程序模块包括例程、程序、库、对象、类、组件、数据结构等,它们执行特定任务或实现特定抽象数据类型。程序模块的功能可以如各实施例中所需的组合或在程序模块之间分离。用于程序模块的计算机可执行指令可以在本地或分布式计算环境中执行。
为了呈现,详细描述使用了如“编码”、“解码”和“选择”等术语来描述计算环境中的计算机操作。这些术语是由计算机执行的操作的高级抽象,且不应与人类所执行的动作混淆。对应于这些术语的实际的计算机操作取决于实现而不同。
II.示例性视频编码器和解码器
图2是可结合其实现所描述的某些实施例的示例性视频编码器200的框图。图3是可结合其实现所描述的某些实施例的概括性视频解码器300的框图。
编码器200和解码器300内的模块之间所示的关系指示了编码器和解码器中的一般信息流;为简明起见,未示出其它关系。具体地,图2和3一般不示出指示用于视频序列、图像、片、宏块、块等的编码器设置、模式、表等辅助信息。这一辅助信息通常在该辅助信息的熵编码之后在输出比特流中发送。输出比特流的格式可以取决于实现变化。
编码器200和解码器300处理视频图像,视频图像可以是视频帧、视频半帧或帧和半帧的组合。图像和宏块级的比特流句法和语法可取决于使用了帧还是半帧。也可以对宏块组织和总体时序有改变。编码器200和解码器300是基于块的并且对帧使用4:2:0的宏块格式,其中每一宏块包括四个8×8的亮度块(有时候作为一个16×16的宏块来对待)以及两个8×8的色度块。对于半帧,可使用相同或不同的宏块组织和格式。8×8的块还可在不同阶段细分,例如在频率变换和熵编码阶段。示例性视频帧组织在以下更详细描述。或者,编码器200和解码器300是基于对象的,使用不同的宏块或块格式,或对与8×8的块和16×16的宏块不同大小或配置的样本集执行操作。
取决于所需的实现和压缩类型,编码器或解码器的模块可被添加、省略、分成多个模块、与其它模块组合、和/或用相似的模块来替代。在替换实施例中,具有不同模块和/或其它模块配置的编码器或解码器执行一个或多个所描述的技术。
A.视频帧组织
在某些实现中,编码器200和解码器300处理如下组织的视频帧。帧包含视频信号的空间信息行。对于逐行扫描视频,这些行包含表示从一同时刻立即采样一场景内容快照并从该帧上到下覆盖整幅场景的样值。逐行扫描视频帧被划分成诸如图4所示的宏块400等宏块。宏块400包括四个8×8的亮度块(Y1到Y4)以及两个8×8的色度块,这些色度块与四个亮度块共同定位,但是水平和垂直分辨率都是一半,遵循常规的4:2:0的宏块格式。8×8的块还可在不同阶段细分,例如在频率变换(例如,8x4、4x8或4x4DCT)和熵编码阶段。逐行扫描I帧是帧内编码的逐行扫描视频帧,其中术语“帧内”指的是不涉及从其他在前解码的图像内容进行预测的编码方法。逐行扫描P帧是使用从与当前图像时间上不同的时刻处的一个或多个图像的预测(在某些上下文中有时也称为前向预测)来编码的逐行扫描视频帧,而逐行扫描B帧是使用涉及在某些区域内(可能加权的)多个预测的平均的帧间预测(有时称为双预测或双向预测)来编码的逐行扫描视频帧。逐行扫描P帧和B帧可包括帧内编码宏块以及各种类型的帧间预测宏块。
隔行扫描视频帧由一场景的两种扫描类型的交替序列构成——一种包括帧的偶数行(行号为0、2、4等),称之为上半帧,而另一种包括帧的奇数行(行号1、3、5等),称之为下半帧。这两个半帧可表示两个不同的快照时间瞬间。图5A示出了隔行扫描视频帧500的一部分,包括位于隔行扫描视频帧500的左上部分的上半帧和下半帧的交替行。
图5B示出了为编码/解码组织为帧530的图5A的隔行扫描视频帧500。隔行扫描视频帧500已被划分成诸如宏块531和532等的宏块或其他这类区域,它们使用如图4所示的4:2:0的格式。在亮度平面中,每一宏块531、532包括来自上半帧的8行,这8行与来自下半帧的8行交替,总共有16行,且每一行是16个样本长。(将该图像实际组织到宏块或其他这类区域以及宏块531、532内亮度块和色度块的实际组织和布置未示出,且实际上对不同的编码决策以及对不同的视频编码设计可以有所变化。)在给定宏块内,上半帧信息和下半帧信息可以联合编码或在各相位处的任一个单独编码。
隔行扫描I帧是包括两个半帧的帧内编码的隔行扫描视频帧,其中每个宏块包括关于一个或两个半帧的信息。隔行扫描P帧是包括两个半帧的使用帧间预测编码的隔行扫描视频帧,其中每个宏块包括关于一个或两个半帧的信息,同隔行扫描B帧一样。隔行扫描P帧和B帧可包括帧内编码的宏块以及各种类型的帧间预测宏块。
图5C示出了为编码/解码而被组织成半帧560的图5A的隔行扫描视频帧500。隔行扫描视频帧500的两个半帧中的每一个被划分成宏块。上半帧被划分成诸如宏块561等的宏块,下半帧被划分成诸如宏块562等的宏块。(同样地,这些宏块也使用如图4所示的4:2:0格式,并且将图像组织到宏块或其他这类区域以及各宏块内亮度块和色度块的布置未示出且可以变化。)在亮度平面中,宏块561包括来自上半帧的16行,而宏块562包括来自下半帧的16行,且每一行是16个样本长。
隔行扫描I半帧是隔行扫描视频帧的单个单独表示的半帧。隔行扫描P半帧是使用帧间图像预测编码的隔行扫描视频帧的单个单独表示的半帧,同隔行扫描B半帧一样。隔行扫描P半帧和B半帧可包括帧内编码的宏块以及不同类型的帧间预测宏块。
为编码/解码组织为半帧的隔行扫描视频帧可包括不同半帧类型的各种组合。例如,这样的帧可在上半帧和下半帧两者中具有相同的半帧类型(I-半帧、P-半帧或B-半帧),或者在每一半帧中具有不同的半帧类型。
术语图像一般指的是源、已编码或已重构图像数据的帧或半帧。对于逐行扫描视频,图像通常是逐行扫描视频帧。对于隔行扫描视频,图像取决于上下文可以指隔行扫描视频帧、帧的上半帧、或帧的下半帧。
图5D示出了相对于视频帧每个半帧的亮度样本位置的4:2:0色度样本位置的六个示例性空间排列。
或者,编码器200和解码器300是基于对象的,使用不同的宏块或格式(例如,4:2:2或4:4:4)或块格式,或对与8×8的块和16×16的宏块不同大小或配置的样本集执行操作。
B.视频编码器
图2是示例性视频编码器系统200的框图。编码器系统200接收包括当前图像205(例如,逐行扫描视频帧、隔行扫描视频帧或隔行扫描视频帧的半帧)的视频图像序列,并产生压缩的视频信息295作为输出。视频编码器的具体实施例通常使用示例编码器200的变化或补充版本。
编码器系统200为帧内编码(帧内)图像(I-图像)和帧间图像预测(帧间)图像(P或B图像)使用编码过程。为演示起见,图2示出了I图像的通过编码器系统200的路径以及用于帧间图像预测图像的路径。编码器系统200的许多组件用于同时压缩I图像和帧间预测图像两者。由这些组件执行的确切操作可以取决于所压缩的信息类型而变化。
帧间图像预测图像按照来自一个或多个其它图像(通常被称为参考图像)的预测(或差)来表示。预测残差是所预测的和原始图像之差。相反,I图像不参考其它图像来压缩。I图像可以使用空间预测或频域预测(即,帧间图像预测)从来自I图像本身其他部分的数据来预测I图像的某些部分。但为了简明,这些I图像在本文中将不被称为“预测”图像,因而短语“预测”图像可被理解为帧间图像预测图像(例如,P图像或B图像)。
如果当前图像205是预测图像,则运动估计器210估计当前图像205的宏块或其它样本集相对于一个或多个参考图像(例如,缓冲在图像存储220中的重构的前一图像225)的运动。运动估计器210可以相对于一个或多个时间上在前的参考图像和一个或多个时间上在将来的参考图像(例如,在双向预测图像的情况下)估计运动。因此,编码器系统200可使用单独的存储220和222用于多个参考图像。
运动估计器210可按照全样本、1/2样本、1/4样本或其它增量来估计运动,并可在逐图像的基础或其它基础上切换运动估计的分辨率。运动估计器210(和补偿器230)也可在每一帧或其它基础上在参考图像样本内插的类型之间切换(例如,在三次卷积内插和双线性内插之间)。运动估计的分辨率可以在水平和垂直上相同或不同。运动估计器210输出运动信息215,诸如差分运动矢量信息作为辅助信息。编码器200通过例如为运动矢量计算一个或多个预测值,计算运动矢量和预测值之间的差,以及对差进行熵编码,来对运动信息215进行编码。为重构运动矢量,运动补偿器230将预测值与运动矢量差信息组合。
运动补偿器230将重构的运动矢量应用于重构的图像225,以形成经运动补偿的预测235。然而,预测很少是完美的,且经运动补偿的预测235和原始的当前图像205之间的差是预测残差245。在稍后的图像重构期间,将预测残差245的近似添加到经运动补偿的预测235,以获得比经运动补偿预测235更接近于原始的当前图像205的重构图像。然而,在有损压缩中,某些信息仍从原始当前图像205中丢失。或者,运动估计器和运动补偿器应用另一类型的运动估计/补偿。
频率变换器260将空间域视频信息转换成频域(即,频谱)数据。对于基于块的视频编码,频率变换器260通常向样本数据或预测残差数据的块应用离散余弦变换(DCT)、DCT的变体或某些其它块变换,从而产生频域变换系数块。或者,频率变换器260应用诸如傅立叶变换等另一常规频率变换类型或使用小波或子带分析。频率变换器260可应用8×8、8×4、4×8、4×4或其它大小的频率变换。
量化器270随后量化频域变换系数块。量化器根据在逐图像的基础、宏块基础或某些其它基础上变化的量化步长向变换系数应用标量量化,其中量化步长是管理在解码器反量化器过程中在可离散表示重构点之间均匀隔开的间隔的控制参数,而这也可以在编码器反量化器过程276中重复。或者,量化器向频域变换系数应用另一类型的量化,例如带有非均匀重构点的标量量化器、矢量量化器或非自适应量化,或直接在不使用频率变换的编码器系统中量化空间域数据。除自适应量化之外,编码器200可为速率控制使用帧丢弃、自适应滤波或其它技术。
当需要重构的当前图像用于后续的运动估计/补偿时,反量化器276在量化的频域变换系数上执行反量化。反频率变换器266然后执行频率变换器260的逆运算,从而产生重构的预测残差的近似(对于预测图像)或重构的I图片的近似。如果当前图像205是I图像,则重构的I图像的近似用作重构的当前图像的近似(未示出)。如果当前图像205是预测图像,则重构的预测残差的近似被添加到经运动补偿的预测235,以形成重构的当前图像的近似。一个或多个图像存储220、222缓冲重构的当前图像的近似,以在后续图像的经运动补偿预测中用作参考图像。编码器可以在将图像近似存储到一个或多个图像存储220、222之前,向重构帧应用解块滤波器或其他图像细化过程以便自适应地平滑来自图像的不连续性并移除其它伪像。
熵编码器280压缩量化器270的输出以及某些辅助信息(例如,运动信息215、量化步长)。典型的熵编码技术包括算术编码、差分编码、哈夫曼编码、行程长度编码、Lempel-Ziv编码、字典式编码以及上述的组合。熵编码器280通常对不同种类的信息(例如,低频系数、高频系数、零频系数、不同种类的辅助信息)使用不同的编码技术,并可从特定编码技术内的多个代码表中进行选择。
熵编码器280向多路复用器[“MUX”]290提供压缩的视频信息295。MUX290可包括缓冲器,并且缓冲器完整性级别指示符可被反馈给比特率自适应模块用于速率控制。在MUX 290之前或之后,压缩的视频信息295可被信道编码用于通过网络发送。信道编码可向压缩的视频信息295应用检错和纠错数据。
C.视频解码器
图3是示例性视频解码器系统300的框图。解码器系统300接收关于压缩的视频图像序列的信息395,并产生包括重构的图像305(例如,逐行扫描视频帧、隔行扫描视频帧或隔行扫描视频帧的半帧)的输出。视频解码器的具体实施例通常使用概括性解码器300的变体或补充版本。
解码器系统300解压预测图像和I图像。为演示起见,图3示出了通过解码器系统300用于I图片的路径以及用于预测图像的路径。解码器系统300的许多组件用于解压I图像和预测图像两者。由这些组件执行的确切操作可以取决于所解压的信息类型而变化。
DEMUX 390接收关于压缩的视频序列的信息395,并使得所接收的信息对熵解码器380可用。DEMUX 390可包括抖动缓冲器以及其它缓冲器。在DEMUX 390之前或之中,压缩的视频信息可以被信道解码,并被处理用于检错和纠错。
熵解码器380对熵编码的量化数据以及熵编码的辅助信息(例如,运动信息315、量化步长)进行熵解码,通常应用编码器中执行的熵编码的逆运算。熵解码技术包括算术解码、差分解码、哈夫曼解码、行程长度解码、Lempel-Ziv解码、字典式解码以及上述的组合。熵解码器380通常对不同种类的信息(例如,低频系数、高频系数、零频系数、不同种类的辅助信息)使用不同的解码技术,并可从特定解码技术内的多个代码表中进行选择。
解码器300通过例如为运动矢量计算一个或多个预测值、对运动矢量差进行熵解码(在熵解码器380处)、以及将解码的运动矢量差与预测值组合以重构运动矢量,来对运动信息315进行解码。
运动补偿器330向一个或多个参考图像315应用运动信息325,以形成所重构的图像305的预测335。例如,运动补偿器330使用一个或多个宏块运动矢量以找出样本块或者在参考图像325中的样本之间内插分数位置。一个或多个图像存储(例如,图像存储320、322)存储先前重构的图像以用作参考图像。通常,B图像具有一个以上参考图像(例如,至少一个时间上先前的参考图像以及至少一个时间上未来的参考图像)。因此,解码器系统300可对多个参考图像使用单独的图像存储320和322。运动补偿器330可以按全样本、1/2样本、1/4样本或其它增量来补偿运动,并可在逐图像的基础或其它基础上切换运动补偿的分辨率。运动补偿器330也可在每一帧或其它基础上在参考图像样本内插的类型之间(例如,在三次卷积内插和双线性内插之间)切换。运动补偿的分辨率可以在水平和垂直上相同或不同。或者,运动补偿器应用另一类型的运动补偿。运动补偿器的预测很少是完美的,因此解码器300也重构预测残差。
反量化器370对熵解码的数据进行反量化。一般而言,反量化器向熵解码的数据应用均匀的标量反量化,其中重构步长在逐图像的基础上、宏块基础上或某些其它基础上变化。或者,反量化器向数据应用另一类型的反量化,例如用于在非均匀矢量或非自适应反量化,或直接在不使用反频率变换的解码器系统中对空间域数据进行反量化。
反频率变换器360将反量化频域变换系数转换成空间域视频信息。对于基于块的视频图像,反频率变换器360向频率变换系数块应用反DCT[“IDCT”]、IDCT的变体或其它反块变换,从而分别对I图像或预测图像产生样本数据或帧间图像预测残差数据。或者,反频率变换器360应用另一类型的反频率变换,诸如傅立叶反变换或使用小波或子带合成。反频率变换器360可应用8×8、8×4、4×8、4×4或其它大小的反频率变换。
对于预测图像,解码器300将重构的预测残差345与经运动补偿的预测335组合,以形成重构的图像305。当解码器需要重构的图像305用于后续的运动补偿时,一个或多个图像存储(例如,图像存储320)缓冲重构的图像305以供预测下一图像时使用。在某些实施例中,解码器300可以在将重构图像305存储到一个或多个图像存储(例如,图像存储320)之前或者在解码视频放出期间显示解码图像之前,向重构图像应用解块滤波器或其他图像细化过程以便自适应地平滑来自图像的不连续性并移除其它伪像。
III.多分辨率编码和解码的概览
视频可以按不同的分辨率编码(和解码)。出于本描述的目的,多分辨率编码和解码可以被描述为基于帧的编码和解码(例如,参考图像重新采样)或者分层的(有时也称为可空间缩放的)编码和解码。多分辨率编码和解码还可以涉及隔行扫描视频、基于半帧的编码和解码、以及在指定分辨率基础上或某些其他基础上在基于帧和基于半帧的编码和解码之间的切换。然而,在此概览中出于简化概念描述的目的讨论了进行逐行扫描视频的帧编码。
A.基于帧的多分辨率编码和解码
在基于帧的多分辨率编码中,编码器以不同的分辨率编码输入图像。编码器在逐图像的基础上或在某些其他基础上为各图像选择空间分辨率。例如,在参考图像重新采样时,如果该图像以不同于当前编码的分辨率编码则可以对该参考图像进行重新采样。术语重新采样用于描述用于表示图像区域或者采样信号的某些其他部分的样本数增加(上采样)或降低(下采样)。每单位面积或者每信号部分的样本数被称为采样的分辨率。
空间分辨率可以基于例如可用比特率的减小/增大、量化步长的的减小/增大、输入视频内容运动量的减小/增大、视频内容的其他属性(例如,在较低分辨率下可能会明显失真的强边缘、文本或其他内容的呈现)或在某些其他基础上来选择。空间分辨率可以在垂直、水平或者垂直和水平维度两者上变化。水平分辨率可以与垂直分辨率相同或不同。解码器使用互补技术对编码帧进行解码。
一旦编码器已经为当前图像或者当前图像内的区域选择了空间分辨率,编码器将在对原始图像编码前将其重新采样至期望的分辨率。编码器随后可以发信号通知解码器这一空间分辨率的选择。
图6示出了基于帧的多分辨率图像编码的技术(600)。诸如图2所示编码器的编码器为一图像设置分辨率(610)。例如,编码器考虑以上列出准则或其他准则。编码器随后按此分频率编码图像(620)。如果完成了要编码的所有图像的编码(630),则编码器退出。如果没有,则编码器就为下一幅图像设置分辨率(610)并继续编码。作为替换,编码器可以在图像级以外的某些级别上设置分辨率,诸如为图像的不同部分不同地设置分辨率或者为一组或一系列图像作出分辨率选择。
编码器可以编码预测图像以及帧内图像。图8示出了基于帧的多分辨率帧内图像和图像间预测图像编码的技术(800)。首先,编码器在810检查要编码的当前图像是帧内图像还是预测图像。如果当前图像是帧内图像,编码器就在820设置针对当前图像的分辨率。如果图像是预测图像,编码器就在830针对当前图像设置分辨率之前设置针对参考图像的分辨率。在为当前图像设置分辨率之后,编码器就按该分辨率编码当前图像(840)。为一图像设置分辨率(无论是当前源图像或者是存储的参考图像)可涉及对该图像的重新采样以便与所选分辨率相匹配并且可以涉及对信号进行编码以将该所选分辨率指示给解码器。如果完成了要编码的所有图像的编码(850),则编码器退出。如果没有,编码器继续编码另外的图像。作为替换,编码器以不同的方式处理预测图像。
解码器对经编码图像进行解码,并且如有必要,在显示前重新采样该图像。与经编码的图像的分辨率相类似,解码图像的分辨率可以用许多不同方式调整。例如,解码图像的分辨率可被调整为适应输出显示设备或者输出显示设备一区域(例如,用于“画中画”或PC桌面窗口显示)的分辨率。
图7示出了基于帧的多分辨率图像解码的技术(700)。诸如图3所示解码器的解码器为图像设置分辨率(在710)。例如,解码器从编码器获取分辨率信息。解码器随后按此分频率解码图像(720)。如果完成了要解码的所有图像的编码(730),则解码器退出。如果没有,则解码器就为下一幅图像设置分辨率(710)并继续解码。作为替换,解码器在图像级以外的某些级别上设置分辨率。
解码器可以解码预测图像以及帧内图像。图9示出了基于帧的多分辨率帧内图像和预测图像解码的技术(900)。
首先,解码器检查要解码的当前图像是帧内图像还是预测图像(910)。如果当前图像是帧内图像,解码器设置针对当前图像的分辨率(920)。如果图像是预测图像,编码器就在针对当前图像设置分辨率(920)之前设置针对参考图像的分辨率(930)。设置参考图像的分辨率可以涉及对存储的参考图像进行重新采样以匹配所选分辨率。在为当前图像设置分辨率(920)之后,解码器就按该分辨率解码当前图像(940)。如果完成了要解码的所有图像的解码(950),则解码器退出。如果没有,解码器继续解码。
解码器通常按编码器使用的同一分辨率来解码图像。作为替换,解码器可以按不同的分辨率解码图像,诸如在解码器可用的分辨率无法与编码器中使用的分辨率完全相同的情况下。
B.分层的多分辨率编码和解码
在分层的多分辨率编码中,编码器在各层中编码视频,其中各层具有按不同分辨率解码视频的信息。以此方式,编码器以一个以上的分辨率来对视频内的至少某些独立图像进行编码。解码器随后可以通过处理各层的不同组合来按一个或多个分辨率解码该视频。例如,第一层(有时被称为基层)含有用于按较低分辨率解码视频的信息,而一个或多个其他层(有时被称为增强层)含有用于按较高分辨率解码视频的信息。
可以将基层本身设计为可独立解码的比特流。于是,在这一设计中,仅解码基层的解码器将按基层的较低分辨率生成有效解码的比特流。使用增强层恰当解码较高分辨率图像可能还需要解码部分或全部的经编码基层数据以及可能的一个或多个增强层。解码基层和一个或多个其他更高分辨率层的解码器将能够比仅解码基层的解码器生成更高分辨率的内容。两、三或更多层可用来允许两、三或更多不同的分辨率。作为替换,更高分辨率层本身也可以是能独立解码的比特流。(这一设计通常被称为同时联播多分辨率编码方法。)
图10示出了用于编码比特流层以便允许按不同分辨率解码的技术(1000)。诸如图2所示编码器200的编码器获取全分辨率视频信息作为输入(1010)。编码器下采样全分辨率视频信息(1020)并使用下采样信息编码基层(1030)。编码器使用基层和更高分辨率视频信息编码一个或多个更高分辨率层(1040)。更高分辨率层可以是允许按全分辨率解码的层或者是按某一中间分辨率解码的层。编码器随后输出包括两个以上编码层的分层比特流。作为替换,更高分辨率层的编码(1040)可能不使用基层信息,于是就能够为同时联播多分辨率编码方法来独立解码更高分辨率层的数据。
编码器能够按照图10所示的基本概要用各种方式来实现多分辨率层的编码。更多信息,请参见例如美国专利No.6,510,177,或者MPEG-2标准或其他视频标准。
图11示出了用于解码比特流层以便允许按不同分辨率解码视频的技术(1100)。诸如图3所示解码器300的解码器获取分层比特流作为输入(1110)。各层包括较低分辨率层(基层)和一个或多个包含更高分辨率信息的层。更高分辨率层无需包含可独立编码的图像;一般而言,更高分辨率层包括描述各图像较高和较低分辨率版本之间差异的残差信息。解码器解码基层(1120),并且如果期望更高分辨率的解码,则解码器将解码的基层图像下采样至期望的分辨率(1130)。解码器解码一个或多个较高分辨率层(1140)并将解码的较高分辨率信息与下采样的解码基层图片相结合以形成较高分辨率的图像(1150)。取决于期望的分辨率级,更高分辨率图像可以是全分辨率图像或者中间分辨率图像。更多信息,请参见例如美国专利No.6,510,177,或者MPEG-2标准或其他视频标准。
解码器通常按编码器使用分辨率之一来解码图像。作为替换,解码器可用的分辨率可以不与编码器中使用的分辨率完全相同。
IV.可伸缩视频编码和解码的重新采样滤波器
这一部分描述用于可伸缩视频编码和解码的技术和工具。虽然所述的一些技术和工具是在分层(或空间可伸缩)的上下文中描述的,但是所述的一些技术和工具也可以在基于帧(或者参考图像采样)的上下文中或者在涉及重新采样滤波器的某些其他上下文中使用。此外,虽然所述的一些技术和工具可以在重新采样图像的上下文中描述,但是所述的一些技术和工具也可以用于对来自更高分辨率信号预测的残差或差分信号进行重新采样。
可伸缩视频编码(SVC)是允许对一较大比特流的子集进行解码以生成其帧质量在某些应用中可接受的解码图像(虽然这些图像质量要低于解码整个较高比特率比特流而生成的质量)的一种数字视频编码类型。一种周知类型的SVC被称为空间可伸缩性,或者分辨率可伸缩性。在空间SVC设计中,编码过程(或者在编码过程前执行的预处理功能,这取决于编码过程范围的精确定义)通常包括将该视频下采样至一较低分辨率并对该较低分辨率视频进行编码以启用较低分辨率解码过程,同时上采样该较低分辨率的解码图像来用作更高分辨率视频图像中各样本值的预测。针对更高分辨率视频的解码过程随后包括解码较低分辨率视频(或其部分),并使用上采样的视频作为更高分辨率视频图像中各样本值的预测。这些设计要求使用重新采样滤波器。更具体地,编解码器的设计包括在解码器和编码器两者中使用上采样滤波器并在编码器或编码预处理器中使用下采样滤波器。对这类设计中使用的上采样滤波器予以特别关注。一般而言,上采样过程被设计为在编码器和解码器中相同以防止漂移现象,所谓漂移是由于在编码和解码期间使用同一信号的不同预测而导致的误差累积。
某些空间SVC设计的一大缺点是在解码过程中使用低质量滤波器(例如,双抽头双线性滤波器)。使用更高质量的滤波器会有益于视频质量。
空间SVC可以包括能在滤波器的重新采样比率内实现更高程度灵活性的重新采样滤波器。然而,这可能需要在编码器和解码器实现中针对要开发的这一滤波器的每个不同“相位”以及要存储的这些滤波器的“抽头”值的大量特定的滤波器设计。
此外,这对视频质量有益以允许编码器控制用于空间SVC的重新采样滤波器的模糊的量。于是,对设计用于上采样或下采样的重新采样的每个“相位”,取决于要在该过程中引入的模糊的期望程度来从若干不同的滤波器进行的选择会是有利的。要在上采样期间执行的模糊程度的选择可以作为传达以供解码过程使用的信息而从编码器发送至解码器。这一额外的灵活性使设计进一步复杂,因为它大幅增加来需要在编码器或解码器中存储的必要抽头值的数量。
可以使用统一的设计来指定具有各种相位和各种模糊程度的各种重新采样的滤波器。一种可能的解决方案是使用Mitchell-Netravali滤波器设计方法。Mitchell-Netravali滤波器设计方法对这些问题的直接应用可能会以针对要在编码器或解码器中计算的量的过大可能值动态范围的形式来要求过多的计算资源。例如,一种这样的设计可能要求使用45位算术处理,而不是在通用CPU和DSP中常用的16位或32位处理元件。为解决这一问题,提供了一些设计改进。
典型的SVC设计要求针对空间可伸缩性的标准化上采样滤波器。为了支持任意重新采样比率(已知为扩展的空间可伸缩性特征),描述了一种结合了关于重新采样比率的大量灵活性的上采样滤波器设计。另一个关键方面是亮度和色度的相对对准。当在单层方法中发现各种对准结构(参见例如针对4:2:0色度的H.261/MPEG-1相对于MPEG-2对准以及H.264/MPEG-4AVC)时,所描述的技术和工具以一种编码器能够轻易向解码器指示如何恰当应用滤波的方式支持各类灵活对准。
所述的技术和工具包括能够进行高质量上采样和良好抗图形失真的上采样滤波器。更具体地,所描述的技术和工具具有的质量要优于由在前针对空间可伸缩性的双线性滤波器设计提供的质量。所描述的技术和工具具有视觉上合意并能提供良好信号处理频率行为的高质量上采样滤波器。所描述的技术和工具包括指定简单且不要求大型存储器存储表来保持抽头值的滤波器设计,并且滤波操作本身在计算上也操作简单。例如,所描述的技术和工具具有不过于冗长且不要求过度数学精度或极度复杂数学函数的滤波器。
这一部分描述具有一个或多个下列特征的设计:
-亮度/色度相位对准的灵活性;
-重新采样比率的灵活性;
-频率特性的灵活性;
-高视觉质量;
-不太少也不太多的滤波器抽头(例如,在4到6之间);
-指定简单;
-操作简单(例如,使用实用字长的算术)。
A.Mitchell-Netravali上采样滤波器
所描述的技术和工具采用可分的滤波方法——因此随后的讨论将主要集中在一维信号的处理,因为二维情况是一维情况的简单可分应用。首先基于由下式给出的概念连续脉冲响应h(x)提出一组两参数滤波器集合:
h ( x ) = 1 6 * ( 12 - 9 b - 6 c ) | x | 3 - ( 18 - 12 b - 6 c ) | x | 2 + ( 6 - 2 b ) | x | < 1 - ( b + 6 c ) | x | 3 + ( 6 b + 30 c ) | x | 2 - ( 12 b + 48 c ) | x | + ( 8 b + 24 c ) 1 &le; | x | < 2 0 otherwise - - - ( 1 ) ,
其中b和c是那两个参数(otherwise即其他)。对于相对相位偏移量位置0≤x<1,该核生成由以下矩阵等式给出的抽头值的4抽头有限脉冲响应(FIR)滤波器:
1 6 * 1 x x 2 x 3 * b 6 - 2 b b 0 - ( 3 b + 6 c ) 0 3 b + 6 c 0 3 b + 12 c - 15 + 12 b + 6 c 18 - 15 b - 12 c - 6 c - ( b + 6 c ) 12 - 9 b - 6 c - ( 12 - 9 b - 6 c ) b + 6 c - - - ( 2 )
实际上,只有考虑x的范围从0到1/2就够了,因为用于x的FIR滤波器核完全就是逆序的用于1-x的FIR滤波器核。
这一设计具有多个感兴趣且有用的属性。如下列出其中的一部分:
-计算该滤波器抽头值不需要三角函数、超越函数或者无理数处理。实际上,这一滤波器的抽头值可以用很少的简单操作直接计算。没有必要为要使用的各种可能参数值和相位存储这些抽头值,因为在需要是可以简单计算这些值。(因此,为了标准化这些滤波器的使用,只需要少量公式——而不需要对类似余弦或贝塞尔函数的近似函数的多次或标准化尝试的大型表。
-所得的滤波器具有4个抽头。这是非常实用的数目。
-滤波器在其主波瓣的每一侧只有单个旁瓣。于是就不会生成过度的边缘振荡效应。
-滤波器具有平滑的脉冲响应。其值及其一阶导数都是连续的。
-它具有单位增益DC响应,意味着被上采样的信息种不存在整体的亮度放大或衰减。
-这些滤波器系列的成员包括对周知良好滤波器的相对良好的近似,诸如“Lanczos-2”设计和“Catmull-Rom”设计。
此外,所描述的技术和工具包括在用于选择视觉合意滤波器的两参数之间的特定关系。这一关系可如下表达为:
c = 1 2 ( 1 - b ) - - - ( 3 )
这将自由度降低至单个带宽控制参数b。这一参数控制由滤波器引入的额外模糊程度。注意与值b=0相关联的这一系列的成员是优秀且周知的Catmull-Rom上采样滤波器(也被称为密钥“三次卷积”内插滤波器)。
除了Mitchell-Netravali滤波器系列的所有成员都能找到的基本优点之外,Catmull-Rom上采样滤波器本身还具有诸多良好的属性:
-它是“内插”滤波器——即,对于相位值x=0和x=1而言,滤波器具有等于1的单个非零抽头。换句话说,上采样信号将会正好在每个上采样曲线段的边缘处通过输入样本的值。
-如果输入样本的设置形成抛物线(或直线或静态值),输出点将正好落在抛物线曲线(或直线或静态值)上。
实际上,用某些方式,Catmull-Rom上采样器出于这些原因可被认为是这一长度的最佳上采样滤波器——虽然引入某些额外模糊(增加b)有时可能更为视觉合意。同样地,引入某些额外模糊可以有助于抹掉低比特率压缩伪像,于是就能够更相似地充当真实上采样图像的Wiener滤波器(用于噪声滤波的周知滤波器)估计器。
简单地将等式(3)代入等式(2)可得如下抽头值:
1 6 * 1 x x 2 x 3 * b 6 - 2 b b 0 - 3 0 3 0 6 - 3 b - 15 + 9 b 12 - 9 b - 3 + 3 b - ( 3 - 2 b ) 9 - 6 b - ( 9 - 6 b ) 3 - 2 b - - - ( 4 ) .
据报告,基于9位专家观察者和超过500个样本的主观性测试,可得:
-可用范围被报告为0≤b≤5/3;
-0≤b≤1/2被归类为视觉上“令人满意”,当b=1/3时报告为视觉合意;
-b>1/2被归类为“模糊”,当b=3/2时报告为非常模糊
B.带宽控制参数的整数化
在等式(4)中被6除可能是不合宜的。相反,希望整数化带宽控制参数和滤波器抽头值,因为作为解码器设计一部分的无限精度是不可行的。考虑使用如下定义的新整数值变量a代入:
a=(b/6)*2S                       (5),
其中S是整数移位因子而a是用作整数化带宽控制参数的无符号整数。参数a可以由编码器在比特流中的视频序列级处编码为语法元素。例如,参数a可以用可变长度或固定长度代码来显式编码,共同地用其他信息编码,或者显式地作为信号通知。可选地,参数a可以在比特流中的某些其他级处作为信号通知。
整数化导致整数化的抽头值:
1 x x 2 x 3 * a 2 S - 2 a a 0 - 2 S - 1 0 2 S - 1 0 2 S - 3 a - 5 * 2 S - 1 + 9 a 2 S + 1 - 9 a - 2 S - 1 + 3 a - ( 2 S - 1 - 2 a ) 3 * 2 S - 1 - 6 a - ( 3 * 2 S - 1 - 6 a ) 2 S - 1 - 2 a - - - ( 6 )
该结果随后需要在二进制算术处理中按比例减小S个位置。
如果a的范围从0到M,b的范围则从0到6*M/2S。对M的某些可能有用的选择包括以下各项:
-M=2(S-2)-1,得到b的范围从0到3/2-6/2S
-M=Ceil(2S/6),返回大于或等于2S/6的最小整数,得到b的范围从0到略大于1。
-M=2(S-3)-1,导致b的近似范围从0到3/4-6/2S
这些对M的选择大到足以覆盖大多数有用情况,其中第一个选择(M=2(S-2)-1)是三个选择中较大的。S的有用范围在6到8之间。例如,考虑S=7和M=2(S-2)-1,即M=31。作为替换,也可以使用M和S的其他值。
C.分数样本定位的整数化
接下来,考虑x值的粒度。为了实用性,也应该近似x。例如,可以如下定义整数i:
x=i÷2F                    (7)
其中F表示所支持的分数样本位置精度。对于一个足够精确的重新采样操作示例而言,考虑F≥4(1/16或更高的样本定位精度)。这就得到以下的整数化滤波器抽头值:
1 i i 2 i 3 * a * 2 3 F ( 2 S - 2 a ) * 2 3 F a * 2 3 F 0 - 2 2 F + S - 1 0 2 2 F + S - 1 0 ( 2 S - 3 a ) * 2 F ( - 5 * 2 S - 1 + 9 a ) * 2 F ( 2 S + 1 - 9 a ) * 2 F ( - 2 S - 1 + 3 a ) * 2 F - ( 2 S - 1 - 2 a ) 3 * 2 S - 1 - 6 a - ( 3 * 2 S - 1 - 6 a ) 2 S - 1 - 2 a - - - ( 8 )
例如,考虑F=4。该结果随后需要按比例减小3F+S个位置。
注意到上述矩阵中的每个元都含有因子2(假设S大于1)。于是能够如下代替地将抽头值公式化为:
1 i i 2 i 3 * a * 2 3 F - 1 ( 2 S - 1 - a ) * 2 3 F a * 2 3 F - 1 0 - 2 2 F + S - 2 0 2 2 F + S - 2 0 ( 2 S - 3 a ) * 2 F - 1 ( - 5 * 2 S - 1 + 9 a ) * 2 F - 1 ( 2 S + 1 - 9 a ) * 2 F - 1 ( - 2 S - 1 + 3 a ) * 2 F - 1 - ( 2 S - 2 - a ) 3 * ( 2 S - 2 - a ) - 3 * ( 2 S - 2 - a ) 2 S - 2 - a - - - ( 9 ) ,
其中每个抽头值都已被除以2。该结果随后仅需要按比例减小3F+S-1个位置。
对于按比例减小,定义函数RoundingRightShift(p,R)作为为输入值p计算的右移R位的输出(带舍入),其计算如下:
RoundingRightShift ( p , R ) ( p + 2 R - 1 ) > > R for R = 2,3,4 , . . . ( p ) > > R for R = 0 or 1 - - - ( 10 )
其中符号“>>”指的是使用2的补码二进制算术的二进制算术右移算符。作为替换,不同地执行舍入右移。
如下提供舍入右移的一些示例性应用。
D.动态范围考虑
如果用N位样本位长度滤波图像并在执行任何舍入之前两维地这般执行,那么在将结果按比例减小2*(3F+S-1)个位置并将输出限制为N位范围之前,将会在累加器内需要2*(3F+S-1)+N+1位的动态范围。例如,如果F=4,S=7且N=8,则需要使用45位的累加器来计算滤波的结果。
会在以下各分段中讨论一些缓解这一问题的方法。这些方法可以彼此分开或彼此结合使用。应该理解基于本文对所述动态范围缓解方法进行变化是可能的。
1.第一示例性动态范围缓解方法
考虑首先执行水平滤波随后进行垂直滤波的示例。考虑对二维处理流水线中任何点的W位最大字长。在第一动态范围缓解方法中,为了实现滤波,在该过程的第一(水平)阶段输出处使用RH位舍入右移,而在该过程的第二(垂直)阶段输出处使用RV位舍入右移。
于是可以如下计算:
2*(3F+S-1)+N+1-RH=W              (11),
因此
RH=2*(3F+S-1)+N+1-W              (12).
随后从下式计算第二(垂直)阶段的右移:
RH+RV=2*(3F+S-1)                 (13),
因此
RV=2*(3F+S-1)-RH.                (14).
例如,对于F=4且S=7且N=8且W=32,得到RH=13且RV=23。于是,代替45位的动态范围,用舍入右移将动态范围缩减到32位。可以为不同的W值使用不同的右移位数。
2.第二示例性动态范围缓解方法
第二动态范围缓解方法涉及降低抽头值的精度而非该相位定位的精度(即,缩减F),降低滤波器带宽调整参数的粒度(即,缩减S)或降低第一阶段输出的精度(即,增加RH)。
将等式(9)生成的四个整数抽头值表示为[t-1,t0,t1,t2]。注意到四个滤波器抽头值之和将会等于23F+S-1,即:t-1+t0+t1+t2=23F+S-1
(15).
这是该示例性动态范围缓解方法的一个重要性质,因为只要当四个输入样本具有相同的值,输出就会具有相同的值。
使用在等式(10)中找出的舍入右移的示例性定义并给出用于抽头值的右移量Rt,则如下定义:
u-1=RoundingRightShift(t-1,Rt);
u1=RoundingRightShift(t1,Rt);
u2=RoundingRightShift(t2,Rt);
u0=23F+S-1-u-1-u1-u2.
随后用抽头值[u-1,u0,u1,u2]而非[t-1,t0,t1,t2]来执行滤波。Rt的值每增加1就表示算术累加器中所需的动态范围减少1位,同时在后续处理阶段中要执行的右移也减少1位。
3.第三示例性动态范围缓解方法
前一设计使用类似于第一示例性动态范围缓解方法概念的手段,不同之处在于它在该过程的第一阶段之后让右移量作为相位定位变量i值的函数。
可以认识到当i的值是2K的整数倍时,等式(9)所示的滤波器抽头值将含有K个零值LSB。于是,如果滤波过程的第二阶段使用2K整数倍的相位定位变量i,那么就可以将第二阶段的抽头值右移K位并将第一阶段的右移量减小K位。
这在操作一般的重新采样因子时将变得相当难以跟踪。然而,当执行2∶1的简单重新采样因子或其他简单因子时,很容易确认在滤波过程第二阶段中使用的所有相位都含有相同的乘数2K,从而允许将该方法应用于这些特定的情况。
V.位置计算的技术和工具
描述了为空间SVC计算定位信息的技术和工具。
一些技术和工具涉及如何聚焦于字长B并在该字长约束内优化计算精度。并非只是选择精度并要求一些必要的字长,应用这一新方法会在真实实现中得到更高的精度并将拓宽该技术的有效应用范围,因为它使用所有可用字长来最大化该约束内的准确性。
一些技术和工具涉及a)偏移坐标系的原点以及b)使用无符号整数而非带符号整数以实现精度和字长/动态范围之间更好的折衷。需要增加少量的计算用以将原点偏移项加入每个计算的位置。
一些技术和工具涉及将要生成样本串的各不同部分的计算打入处理的不同阶段,其中坐标系的原点在每阶段开始时改变。同样地,它用另一个少量计算要求的增加(因为在每阶段开始时执行某些额外计算)来提供精度和字长/动态范围之间更好的折衷。如果到达该技术的逻辑极值,就能够排除对乘法操作的需要,从而进一步改进精度和字长/动态范围之间的折衷。然而,将会需要为每个样本执行某些额外的操作(因为“每一阶段”所需的额外计算在每阶段仅含一个样本的情况下就变成为每个样本所需)。
作为一概括主题,描述的设计用于该处理位置计算部分以实现计算结果的精度、处理元素的字长/动态范围、以及处理中涉及数学操作的次数和类型(例如,移位、加法和乘法操作)之间理想的折衷。
例如,所描述的技术和工具允许使用B位(例如,32位)算术的灵活精度计算。这允许空间SVC编码器/解码器灵活适应不同的图像大小而无需为了计算转换成不同的算术(例如,16位或64位算术)。使用灵活精度B位(例如,32位)算术,编码器/解码器能够将灵活位数用于分数分量。这允许随着表示整数分量所需的位数降低(例如,对于较小的帧大小)而增加计算精度。随着表示整数分量的所需位数的增加(例如,对于较大的帧大小),编码器/解码器能够为整数分量使用更多位而为分数分量使用更少位,从而降低精度但维持B位算术。由此就能大大简化不同精度和不同帧大小之间的变化。
这一部分包括用于一示例性实现的具体细节。然而,应该注意到本文描述的具体细节可以依据在此描述的原则而在其他实现中有所变化。
A.介绍和位置计算原则
描述了用于计算位置和相位信息以实现低得多的计算要求而无需任何显著准确性损失的技术。例如,所描述的技术能够显著降低计算要求,例如通过动态降低额定动态范围要求(例如,降低几十位)。考虑可在基层和增强层中使用的各种可能的色度位置,期望找出一种提供重新采样色度样本相对于亮度样本的合适定位的解决方案。因此,所描述的技术允许用亮度和色度位置之间的不同关系来作出调整以计算视频格式的位置。
为扩展空间可伸缩性设计的在前的上采样方法使用一种相当麻烦的方法来计算上采样低分辨率层时的位置和相位信息;它按比例缩放分母的上移近似逆,从而在分子增加时(即,在上采样过程从左向右或从上往下移时)导致了反演近似中舍入误差的放大通过比较,本文描述的技术具有卓越的准确性和简化的计算。更具体地,所述技术使得动态范围和位置计算中的右移量减小了几十位。
例如,描述的一种技术用于计算位置信息来获取整数位置和相位定位变量i,其中i=0..2F-1,以便在SVC空间上采样中使用。
所描述的技术将重新采样过程应用于空间可伸缩视频编码应用,而非前向参考图像重新采样。在这一空间可伸缩编码的应用中,可以应用某些简化。并非是普通的变形过程,只需要调整图像大小操作。这可以是针对每一维度分开的设计。
B.位置计算设计
考虑问题陈述,在每一维度(x或y)中,因为样本串的生成概念地处于新的(上采样的)阵列中实值从L至R>L的范围。这一实值范围对应于参考低分辨率阵列中从从L′至R′>L′的范围。
对于在新阵列中的位置T其中L≤T≤R,于是需要计算对应于该新阵列中位置的参考阵列中的位置。这会是位置T′=L′+(T-L)*(R′-L′)÷(R-L)。
现在代替考虑调整从L至R的范围大小,定义整数M>0并且考虑通过相同的大小调整比率(R′-L′)÷(R-L)来调整从L至L+2M的范围大小。参考样本坐标中对应的范围则是从L′至R″,其中R″=L′+2M*(R′-L′)÷(R-L)。如果M足够大,即if M≥Ceil(Log2(R-L)),则R″≥R′。(目前假设维持这一约束以解释以下概念,虽然这一约束对于等式的适当功能并不真是必需的。)
现在能够为定位计算使用位置L′和R″之间的线性内插。位置L被映射至位置L′,并且位置T≥L被映射至位置((2M-(T-L))*L′+(T-L)*R″)÷2M。这将操作的分母转换为2的幂,从而通过允许用二进制右移代替除法操作而降低了除法操作的计算复杂性。
可以作出适当修改来整数化这一计算。将L′和R″的值舍入为1÷2G的整数倍,其中G是整数,使得L′由k÷2G近似,而R″由r÷2G近似,其中k和r是整数。使用这一调整,就能将位置T映射至位置((2M-(T-L))*k+(T-L)*r)÷2(M+G)
现在假设T和L的相关值是1÷2J的整数倍,其中J是整数,使得T-L=j÷2J。使用这一调整,就能将位置T映射至位置((2(M+J)-j)*k+j*r)÷2(M+G+J)
回想以上部分IV,重新采样滤波器的分数相位可以是单位为1÷2F的整数。所以在这些单位中,算出的位置是Round(((2(M+J)-j)*k+j*r)÷2(M+G+J-F)),或者
t′=((2(M+J)-j)*k+j*r+2(M+G+J-F-1))>>(M+G+J-F)      (16),
或者,更简单地,
t′=(j*C+D)>>S                                      (17),
其中
S=M+G+J-F                                             (18),
C=r-k                                                 (19),
D=(k<<(M+J))+(1<<(S-1))                           (20)。
此处描述的方法在将算出的位置舍入至1÷2F最近倍数之前(在两个设计内都存在的误差)产生的仅有误差(假设在L和R以及L′和R′的表示中没有误差)是从位置R″舍入到最近倍数1÷2G的舍入误差。该量在G+M相对较大的情况下会很小。实际上,这一误差源被紧紧绑定在约(T-L)÷2(G+M+1)的大小,结果计算的字长要求适中,并且模算术允许将结果的整数部分分出以使得字长最小化,或者允许用其他类似方法分解该计算。
F例如可以是4或更大。(对于某些应用,F=3或F=2就足够了。)J值的示例包括用于亮度位置计算的J=1以及用于色度样本位置的J=2。如下可以找出这些J值示例的基本原理。
1.使用带符号的B位算术的第一示例性简化位置计算技术
如果R′>0且L′>-R′,那么在要上采样图像中计算的所有位置t′,作为以1÷2F为单位的整数,则位于-2Z和2Z-1之间,其中Z=Ceil(Log2(R′))+F。如果(j*C+D)计算的字长是B位,并且假设使用带符号的2的补码算术,则可以要求B-1≥Z+S。如果这一约束严格,即如果B-1=Z+M+G+J-F,则实现高精度。
对于相当小的图像大小(例如,在当前H.264/MPEG-4 AVC标准中达4.2级),可以使用B=32作为字长。也可以使用其他的B值。对于很大的图像,可以使用更大的B。该计算也可以被轻易分解成更小的字长子计算以便在16位或其他处理器上使用。
剩下的两个自由度是M和G。它们的关系是灵活的,只要G大到足以避免在将L′表示为k÷2G时舍入误差的任何需要。于是,基于下一部分对SVC讨论的问题,可以选择G=2,得到:
M=B+F-(G+J+Z+1)
即,
M=32+4-(2+1+Z+1)
即,
M=32-Z。
例如,如果希望用B=32和L′=0上采样具有1000个亮度样本宽度的图像亮度阵列,那么可以使用这第一示例性位置计算技术来使用F=4、G=2、J=1、M=18、S=17和Z=14。
当T很接近(或等于)R且R′很接近(或等于)2的整数幂,特别是当(T-L)*(R′-L′)÷2F较大(例如,大于1/2)时,那么可以在假设上存在由1违背上限的可能。在此不进一步考虑这些情况,虽然处理这些情况的调整是直接的。
2.使用无符号的B位算术的第二示例性位置计算技术
如果在低分辨率图像中计算的所有位置都大于或等于0,这种情况有时通过将合适的偏移量加入坐标系原点时存在,那么使用无符号的整数算术而非带符号的2的补码算术来计算t′=(j*C+D)会是更好的选择。这允许多一位的动态范围而不会在计算中溢出(即,能够使用B位的动态范围大小而非B-1位),从而将M(或G)和S分别加1并进一步增加计算结果的精度。于是,在包括偏移量E以调整坐标系原点之后,计算的形式可以是t′=((j*C+D′)>>S′)+E而非只是t′=(j*C+D)>>S。
通过标识何时将不需要原点偏移量E,提供有关该涉及无符号算术的更精确方法的进一步细节如下。
-如上所述选择用于B、F、G、J和Z的值。
-设置M=B+F-(G+J+Z)。
-分别计算在上式(18)、(19)和(20)指定的S、C和D,其中D按带符号数计算。
-如果D大于或等于0,则不需要原点偏移量(即,不使用E)并且可以使用无符号算术简单执行计算为t′=(j*C+D)>>S,而所得结果的精度会高于以上在部分V.B.1中描述的第一示例性位置计算技术。
除了通过启用使用无符号整数的计算来增加精度之外,偏移原点有时也可用于通过启用Z值的下降来提供改善的精度。没有原点偏移量,Z是R′的函数。但用原点偏移量,就可以让Z是R′-L′的函数,则在其得到较小Z值的情况下将使计算更为精确。
通过示出一种对原点的偏移的方式,导出D′和E,提供有关该涉及无符号算术的更精确方法的进一步细节如下。
-如上所述选择用于B、F、G和J的值。
-设置Z=Ceil(Log2(R′-L′))+F。
-设置M=B+F-(G+J+Z)。
-分别计算在上式(18)、(19)和(20)指定的S、C和D,其中D按带符号数计算。
-设置E=D>>S。
-Set D′=D-(E<<S)。
-该位置计算于是可执行为t′=((j*C+D′)>>S)+E。
如果以此方式计算D′和E(以及M、S和Z),则等式t′=((j*C+D′)>>S)+E的算术结果实际将总是与等式t′=(j*C+D)>>S的结果理论上相同,除了(j*C+D)的值有时会落入从0到2B-1的范围之外,而(j*C+D′)的值则不会。
例如,如果希望用B=32和L′=0上采样具有1000个亮度样本宽度的图像亮度阵列,那么可以使用这第二示例性位置计算技术来使用F=4、G=2、J=1、M=19、S=18和Z=14。也等效地起作用,并非偏移原点以使得j*C+D所有值都非负,并由此允许使用B位计算使用无符号算术来使用范围从0到2B-1的B位计算的另一种可能性是通过另一个2(B-1)以允许使用带符号算术来使用范围从-2(B-1)到2(B-1)-1的B位计算来进一步将原点向右偏移。
而在前一部分的第一示例性位置计算技术中,存在当T很接近(或等于)R且R′-L′很接近(或等于)2的整数幂时所需的“角情况”调整。
3.用于位置计算的示例性多阶技术
已经讨论了在其中使设计能够为覆盖要生成样本范围的所有j值(即,为在L和R之间的所有T值)而用相同的变量值C、D′、S和E用相同的等式(例如,t′=((j*C+D′)>>S)+E)执行计算的方法。现在讨论如何放松这一假设,从而允许更高的精度和/或降低的计算动态范围要求。
一般而言,重新采样过程从左向右(或从上向下)进行以在相等间隔的位置上生成连续的样本串。在以上部分V.B.2中描述的第二示例性位置技术,示出了改变使用偏移量参数E的原点如何能用于利用寄存器的B位动态范围来计算位置计算的(j*C+D′)部分。
回想前一部分,D中仅有的S个最低有效位在D′中保留,其他则移至E中。于是,计算(j*C+D′)的主要剩余的问题是j*C的大小。
回想T和L是1÷2J的整数倍。一般在较高分辨率图像中执行上采样过程以生成整数值增量处的样本串,例如相继生成样本之间的2J间隔。于是期望为p和N的一些值计算对于i=0至N-1对应于位置Ti=(p+i*2J)÷2J的位置t′i
这一过程可以如图12的伪码1200所示为p和N的一些值而用伪码总结。随着i向N递增,q值增加,并且q的最大值应被维持在B位可用动态范围内。为q计算的最大值为(p+(N-1)*2J)*C+D′。
现在,代替以此方式在一个循环中生成所有样本,考虑将该过程分成多个阶段,例如两个阶段。例如,在两阶段过程中,第一阶段生成第一N0<N个样本,而第二阶段生成剩下的N-N0个样本。同样地,因为p是关于循环的约束,所以可以在第一阶段前将其影响移入D′和E。这导致了在图13的伪码1300中示出的两阶段过程。
在伪码1300中每阶段的开始处,原点已被重设使得针对此阶段的q的第一值中除了S个最低有效位之外的所有位都已移入E(即,针对第一阶段的E0和针对第二阶段的E1)。于是,在两阶段中每阶段的操作期间,q要求更小的动态范围。在以此方式将该过程分成各阶段之后,q的最大值将会是N0*C′+D0或((N-N0-1)*C′+D1中的较大值。但是因为D0和D1各自具有不多于S位的无符号动态范围,所以这通常将会是小于前述单阶段设计的最大值。在此阶段中生成的样本数(即,第一阶段N0个而第二阶段N-N0个)可以影响关联计算的动态范围。例如,在每一阶段使用较少样本数将导致相关计算的较小动态范围。
每个阶段可以进一步分成更多的阶段,于是总共N个样本的生成可以被进一步分解成任何数量的这些更小的阶段。例如,该过程可以被分成大小相等的各阶段,从而在每一阶段生成例如8或16个相继样本的块。这一技术或者可用于降低计算q时所需的动态范围B的位数,或者可用于增加计算的精度(增加S和G+M)同时保持动态范围相同,或者是这两大优点的混合。
将位置计算过程分解成各阶段的这一技术也能够用于沿着极长的输入样本串(概念上,该串可以是无限长)执行连续的重新采样过程,诸如随着样本从音频信号的模数转换器的到来执行采样率转换。无疑的是,如果不把该过程分成有限大小的阶段并从每一阶段到下一阶段递增地重新设置原点,则在先前各部分中描述的技术将无法处理无限长度的样本串,因为这需要处理字长中无限的动态范围。然而,将各技术应用于有效无限串长的困难并非这些技术的实质限制,因为应用于有效无限长度仅在以用代表1÷2G倍数为整数单位的假设基准位置L′和R″的表示没有引入舍入误差时有用。
在其中能够应用多阶段位置计算技术的场景下,提供一种沿着无限长度样本串执行计算的方式,该方式不带有舍入误差的“漂移”累积,无论在整个速率转换过程的位置计算操作中发生了什么。
4.位置计算的示例性增量操作
针对上述多阶段分解概念的有趣的指定情况是当每个阶段要生成的样本数已经降低至每阶段一个样本。图14中的伪码1400表示针对i=0至N-1生成N个位置t′i的过程。
因为将该过程描述为上采样过程(虽然相同的原理也可应用于下采样过程),所以知道对于每次i的增量都在较高分辨率图像中存在有1的间隔,因此在较低分辨率图像中存在有小于或等于1的增量。在较低分辨率图像中空间位置内1的增量对应于C′的2(S+F)的值。同样知道D′<2S。因此,q=C′+D′具有从0到小于2(S+F)+2S的范围,因此可以使用无符号整数算术用不多于B=S+F+1位的动态范围要求来计算q。在一个实现中,这一动态范围要求对图像大小是不变的(即,不依赖于R′或R′-L′的值)。
对于可伸缩视频编码和许多其他这类应用,并不真的需要支持上采样比率非常接近1。在这类应用中,可以假设C′实际上要求不多于S+F位。
例如,如果希望用B=32和L′=0上采样具有1000个亮度样本宽度的图像亮度阵列,那么可以使用这一方法来使用F=4、G=2、J=1、M=29、S=28和Z=14。结果将会是如此的格外精确使得较小的B值看上去是更为合理的选择。
作为替换,如果希望用B=16和L′=0上采样具有1000个亮度样本宽度的图像亮度阵列,那么可以使用这一方法来使用F=4、G=2、J=1、M=13、S=12和Z=14。
关于进一步了解执行上采样操作场景可提供进一步的优化机会。例如,如果上采样比率明显大于2,则动态范围要求将再减小一位,并且对于大于4、16等的上采样比率而言继续减小。
参考这一部分中的示例性增量位置计算技术描述的改变(相对于上述的示例性多阶位置计算机技术)都不会影响在给定C、D和S的值时所实际算出的位置t′i的值。只有改变支持该计算所需的动态范围。
用于这一分解形式的伪码1400中的内部循环不要求任何乘法操作。这一事实有利于在某些计算处理器上提供缩短的计算时间。
5.额外的注释
对于诸如2∶1、3∶2之类的常见重新采样比率——在其中无需为了将位置L′和R″近似为以为1÷2G单位的整数而作出舍入的任何情况——在使用这些方法时根本不存在任何舍入误差(除了当将最终结果舍入以1÷2F为单位的整数时引入的任何舍入误差,该误差是无论位置计算方法都将存在的误差)。
C.亮度和色度位置和关系
假设全新(上采样)图像和参考图像阵列相对于亮度采样网格索引坐标精确对准,则当前图像坐标内的位置L和R是
Figure BSA00000493421200341
Figure BSA00000493421200342
其中W是取决于相关重新采样维度图像在垂直或水平方向上的样本数。等效地,可以设置图像空间坐标系的原点向网格索引0位置左移(或上移)半个样本在并在从图像空间坐标转换成网格索引值时加1/2,由此免于在空间坐标系中执行计算时处理负数的需要。
参考(低分辨率)图像中的位置L′和R′以相同方式参考采样网格坐标,其中在此情况下W是参考图像而非新图像中的样本数。
对于色度采样网格(无论是在新图像还是在参考图像中),情况多少没那么简单。为了构建色度样本相对于亮度的指定对准,考虑由色度样本表示的图像矩形与由亮度样本表示的矩形相同。这会产生如下情况:水平
地,对于4:2:0色度采样类型0、2和4(参见图5D),当前图像坐标由
Figure BSA00000493421200343
Figure BSA00000493421200344
定义。
-水平地,对于4:2:0色度采样类型3、1和5(参见图5D),当前图像坐标由
Figure BSA00000493421200345
定义。
-垂直地,对于4:2:0色度采样类型2和3(参见图5D),当前图像坐标由
Figure BSA00000493421200347
Figure BSA00000493421200348
定义。
-垂直地,对于4:2:0色度采样类型0和1(参见图5D),当前图像坐标由
Figure BSA00000493421200349
Figure BSA000004934212003410
定义。
-垂直地,对于4:2:0色度采样类型4和5(参见图5D),当前图像坐标由
Figure BSA000004934212003411
Figure BSA000004934212003412
定义。
-水平地,对于4:2:2色度采样,通常用于工业实践的4:2:2采样的当前图像坐标由
Figure BSA000004934212003413
Figure BSA000004934212003414
定义。
-垂直地,对于4:2:2色度采样,通常用于工业实践的4:2:2采样的当前图像坐标由
Figure BSA00000493421200351
Figure BSA00000493421200352
定义。
-对于水平和垂直两者而言,对于4:4:4色度采样,当前图像坐标由
Figure BSA00000493421200353
Figure BSA00000493421200354
Figure BSA00000493421200355
定义。
同样地,使用一偏移量充分的将坐标系的原点移动到位置L的左侧以免于处理负数。
整数坐标和分数相位偏移量余数通过调整要在上采样阵列中生成的各样本的整数坐标位置以补偿分数偏移量L,并在随后应用部分V.B结尾处所示的转换来计算。概念地,将结果右移F位导致指向参考图像的整数系数指针,并且减去左移的整数坐标(移位F位)提供相位偏移量余数。
D.上采样位置计算的额外精度
这一部分描述如何将以上部分V.C.4的位置计算方法映射至特定的上采样过程,诸如用于H.264 SVC扩展的上采样过程。位置计算以一种非常灵活的方式应用以最大化各种色度格式以及逐行和隔行扫描帧格式下亮度和色度通道两者的精度。在这一部分中描述的技术能够取决于实现和不同的上采样过程而变化。
在上述位置计算中(在以上部分V.A-C中),比例改变参数(是变量C,其后在以下标记为deltaX(或者deltaY))由等于2J的比例因子按比例增加(其中对于亮度J=1,而对于色度则为2)来形成增量,加入该增量以从左向右或从上到下生成每个样本位置。选择缩放比例以使得按比例放大的增量将符合16位。
1.比例缩放位置计算的最大精度
应用位置计算方法的一种直接方式是将比例改变参数按比例放大等于2J的比例因子,其中对于亮度J=1而对于色度则为2,从而形成增量,加入该增量以从左向右或从上到下生成每个样本位置。随后选择比例缩放参数以确保按比例放大的增量将符合指定的字长,诸如16位。在如下部分将描述更灵活的设计来最大化位置精度。
a.亮度通道
“直接”亮度位置计算方法可以在F=4和S=12时由以下示例性等式(沿着水平方向)概括:
deltaX=Floor(((BasePicWidth<<15)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)
xf=((2*(xP-ScaledBaseLeftOffset)+1)*deltaX-30720)>>12
在此,BasePicWidth是基层或低分辨率图像的水平分辨率;ScaledBaseWidth是高分辨率图像区域或窗口的水平分辨率;deltaX是中间比例改变参数,在此情况下是32768乘以上采样比率的逆的舍入近似;xP表示在高分辨率图像中的样本位置;ScaledBaseLeftOffset表示高分辨率图像中图像窗口的相对位置,以及Floor( )指示小于或等于其自变量的最大整数。常数值30720是由在右移之前添加2S-1作为舍入偏移量并针对亮度采样网格参考位置的半个样本偏移量来减去2S*2F/2而产生,如在上述部分V.C开始处所讨论的。
值得注意的是xP的每次增量都导致等式内部2*deltaX的增量。同样地,量2*deltaX的LSB总是为零,使得计算精度的一位实质上被浪费。通过如下改变这些等式,可以在复杂度没有任何显著增加的情况下近似地获取额外一位的精度:
deltaX=Floor(((BasePicWidth<<16)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)
xf=((xP-ScaledBaseLeftOffset)*deltaX+(deltaX>>1)-30720)>>12
或者(略微)更加精确的形式如下:
deltaXa=Floor(((BasePicWidth<<16)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)
deltaXb=Floor(((BasePicWidth<<15)+(ScaledBaseWidth>>1))÷ScaledBaseWidth)
xf=((xP-ScaledBaseLeftOffset)*deltaXa+deltaXb-30720)>>12
推荐后两种形式,因为其更高的准确性和可以忽略的复杂度影响(虽然精度的差异看上去也很小)。
注意到对于处理其上难以执行除法计算的体系结构,具有这些等式之一的结果能够简化其他的计算。deltaXa的值将总是在2*deltaXa加1或减1的范围内。因此可以导出如下的简化规则以避免对deltaXa的计算执行除法操作的需要:
deltaXa=(deltaXb<<1)
remainderDiff=(BasePicWidth<<16)+(ScaledBaseWidth>>1)-deltaXa
if(remainderDiff<0)
deltaXa--
else if(remainderDiff≥ScaledBaseWidth)
deltaXa++
b.色度通道
在这一部分的设计中可以为色度通道使用四因子乘法器来代替二因子乘法器,从而能够表示4:2:0采样的色度位置(为色度使用J=2而非如所述地为亮度使用的J=1)。因此,“直接”等式为:
deltaXC=Floor(((BasePicWidthC<<14)+(ScaledBaseWidthC>>1))÷
ScaledBaseWidthC)
xfC=((((4*(xC-ScaledBaseLeftOffsetC)+
(2+scaledBaseChromaPhaseX))*deltaXC)
+2048)>>12)-4*(2+baseChromaPhaseX)
在此,baseChromaPhaseX和scaledBaseChromaPhaseX分别表示用于低分辨率和高分辨率的色度采样网格位置偏移量。这些参数的值可以随着信息从编码器发送至解码器而被显式传达,或者可以具有由应用确定的特定值。所有其他的变量与为亮度通道定义的那些相似,而其带有的“C”后缀表示对色度通道的应用。
xC的每次递增都导致等式内部4 * deltaXC的增量。因此,通过如下改变这些等式,可以在复杂度没有任何实质增加的情况下近似地获取额外两位的精度:
deltaXC=Floor(((BasePicWidthC<<16)+(ScaledBaseWidthC>>1))÷
ScaledBaseWidthC
xfC=(((xC-ScaledBaseLeftOffsetC)*deltaXC
+(2+scaledBaseChromaPhaseX)*((deltaXC+K)>>2)
+2048)>>12)-4*(2+baseChromaPhaseX)
其中K=0、1或2。使用K=0可以避免一次额外操作。使用K=1或K=2可以具有稍高的准确性。
相对应地稍微更精确的形式可以如下:
deltaXCa=Floor(((BasePicWidthC<<16)+(ScaledBaseWidthC>>1))÷
ScaledBaseWidthC)
deltaXCb=Floor(((BasePicWidthC<<14)+(ScaledBaseWidthC>>1))÷
ScaledBaseWidthC)
xfC=(((xC-ScaledBaseLeftOffsetC)*deltaXCa+
(2+scaledBaseChromaPhaseX)*deltaXCb
+2048)>>12)-4*(2+baseChromaPhaseX)
如同亮度情况一样,推荐后一种变体,因为复杂度的差异看上去可以忽略不计(虽然精度差异看上去也很小)。
c.隔行扫描场坐标
对图像坐标系的参考通常基于亮度帧坐标中半个样本位置,于是导致如上所述针对亮度坐标参考位置的为2的比例因子。亮度帧坐标中半个样本的位移对应于4:2:0色度帧坐标中四分之一个样本的位移,这也是当前在用于上述色度坐标的比例缩放中使用为4的因子而非为2的因子的原因。
水平地,对表示帧的编码图像和表示隔行扫描视频单个半帧的那些图像进行的操作不存在本质上的差别。然而,当编码的图像表示单个半帧时,在亮度帧垂直坐标中半个样本的位移对应于在亮度场垂直坐标中四分之一个样本的位移。于是,应该在垂直亮度坐标位置的计算中应用为4而非为2的比例因子。
类似地,当编码的图像表示单个半帧时,在亮度帧垂直坐标中半个样本的位移对应于在色度场垂直坐标中八分之一个样本的位移。于是,应该在垂直色度坐标位置的计算中应用为8而非为4的比例因子。
用于在编码场图像中计算垂直坐标位置的这些比例缩放因子可以与以上关于编码帧图像中增量计算所述相同的方式并入deltaY垂直增量计算。在此情况下,由于应用了增加的比例缩放因子,使得精度的改善对亮度位置近似为2位的精度增加而对色度(垂直地)近似为3位的精度增加。
2.4:2:2和4:4:4色度限制和细化
部分V.D.1.b的位置计算方法要求为色度使用亮度不同的乘法因子。这对4:2:0视频有意义并且对4:2:2视频在水平上也合理,但是它对4:2:2视频在垂直上或者对4:4:4视频在水平或垂直上都不必要,因为在这些情况下亮度和色度分辨率相同并且亮度和色度样本因此推测起来在同一地点。
结果,部分V.D.1.b的方法可能要求分开计算来确定亮度和色度位置,即使在某些维度中亮度和色度分辨率相同且无意相移的情况下也是如此,这只是因为在这两种情况下将要执行的舍入略有不同。这是不期望的,所以在这一部分中建议为4:2:2和4:4:4采样结构使用不同的色度处理。
a.4:2:2垂直的和4:4:4水平的和垂直的位置
对于4:2:2视频的垂直维度以及4:4:4视频的垂直和水平维度两者,不存在对色度相位的自定义控制的明显需要。因此,只要在某一维度中色度分辨率与亮度分辨率相同,就应该对用于计算色度位置的等式进行修改以便无论何时色度采样格式在某一具体维度上对亮度和色度具有相同的分辨率,为亮度和色度样本两者计算准确相同的位置。一个选项是仅设置色度位置变量等于亮度位置变量,另一选项是设置色度位置等式以使它们具有相同的结果。
b.4:2:2水平位置
虽然水平地允许为4:2:2视频的色度相位调整不存在功能问题,但如果4:2:2只使用了一种类型的水平子采样结构,诸如对应于部分V.D.1.b各等式中用于scaledBaseChromaPhaseX或BaseChromaPhaseX的值-1的那个,那么可能期望考虑只要颜色采样格式是4:2:2就强迫使用这些值。
VI.扩展和变化
本文中的技术和工具也可应用于使用参考图像重新采样的多分辨率视频编码,诸如在ITU-T国际标准推荐H.263的附件P中找出的情况。
本文中的技术和工具不仅还可应用于图像样本阵列的上采样,还可用于残差数据信号或其他信号的上采样。例如,本文中的技术和工具也可应用于降低分辨率更新编码的残差数据信号上采样,例如可在ITU-T国际标准推荐H.263的附件Q中找出。作为另一个示例,本文中描述的技术和工具也可应用于在空间可伸缩视频编码设计中从较低分辨率残差信号中预测高分辨率残差信号的残差数据信号的上采样。作为又一个示例,本文中描述的技术和工具也可应用于在空间可伸缩视频编码设计中运动矢量场的上采样作为再一个示例,本文中描述的技术和工具也可应用于图形图像、静止照片图像、音频样本信号等的上采样。
参考各所述实施例描述和示出了本发明的原理之后,可以认识到,可以在排列和细节上修改所述各实施例,而不脱离这些原理。应当理解,此处所描述的程序、过程或方法不相关于或不限于任何特定类型的计算环境,除非另外指明。可依照此处所描述的教导来使用各种类型的通用或专用计算环境或执行操作。描述的实施例中以软件示出的元素可以用硬件来实现,反之亦然。
鉴于可应用本发明的原理的许多可能的实施例,要求保护落入所附权利要求书及其等效技术方案的范围和精神之内的所有这样的实施例作为本发明。

Claims (20)

1.一种用于在视频编码或解码期间执行基层图像数据的上采样的方法,其特征在于,所述方法包括:对于上采样的阵列中的一个位置:
计算所述基层图像数据中的一个位置,其中y指示所述基层图像数据中的该位置的垂直值,而y的导出包括数学上等价于(j*C+D)>>S的结果的计算,并且其中:
j指示上采样的阵列中的该位置的垂直值;
C是通过对垂直比例因子的倒数乘以2S+F的值进行近似;
D是偏移量;
S是移位值;以及
F是基于在y的分数分量中的位数。
2.如权利要求1所述的方法,其特征在于,其中j、C和D部分基于所述基层图像数据是用于帧还是半帧,并且其中,j和D部分基于所述基层图像数据是用于亮度还是色度。
3.如权利要求1所述的方法,其特征在于,其中
S设置动态范围和精度;以及
D基于所述基层图像数据的垂直分辨率、所述垂直比例因子和S。
4.如权利要求1所述的方法,其特征在于,其中F是4,而S为12。
5.如权利要求1所述的方法,其特征在于,x指示所述基层图像数据中的该位置的水平值,而x的导出包括数学上等价于(i*C’+D’)>>S’的结果的计算,并且其中:
i指示上采样的阵列中的该位置的水平值;
C’是通过对水平比例因子的倒数乘以2S+F’的值进行近似;
D’是可以与D相同或不同的偏移量;
S’是可以与S相同或不同的移位值;以及
F’是基于在x的分数分量中的位数。
6.如权利要求5所述的方法,其特征在于,i是基于T-L,T指示水平偏移量,而L指示左偏移量。
7.如权利要求5所述的方法,其特征在于,其中F’是4,而S’为12。
8.如权利要求7所述的方法,其特征在于,根据下式来导出C’:
((BasePic Width<<16)+(ScaledBase Width>>1))÷ScaledBase Width,
其中BasePicWidth指示所述基层图像数据的水平分辨率,而ScaledBaseWidth指示在上采样之后的水平分辨率。
9.如权利要求5所述的方法,其特征在于,x还基于偏移量E,x的导出包括数学上等价于((i*C’+D’)>>S’)+E的结果的计算。
10.如权利要求5所述的方法,其特征在于,还包括:
基于y的F个最低有效位来选择垂直滤波器,并基于y的剩余位来选择要过滤的垂直整数位置,其中,所述基层图像数据的垂直内插在所述垂直整数位置处使用所述垂直滤波器;以及
基于x的F’个最低有效位来选择水平滤波器,并基于x的剩余位来选择要过滤的水平整数位置,其中,垂直内插的结果的水平内插在所述水平整数位置处使用所述水平滤波器。
11.如权利要求1所述的方法,其特征在于,还包括:
在所述基层图像数据中的该位置处内插一个值;以及
将所述内插的值分配给所述上采样阵列中的该位置。
12.如权利要求1所述的方法,其特征在于,所述基层图像数据是采样值。
13.如权利要求1所述的方法,其特征在于,所述基层图像数据是剩余的数据值。
14.一种系统,包括处理器、存储器和存储有计算机可执行指令的计算机可读存储,所述计算机可执行指令用于一种在视频编码或解码期间对基层图像数据进行上采样的方法,其特征在于,所述方法包括:对于上采样的阵列中的一个位置:
计算所述基层图像数据中的一个位置,其中y指示所述基层图像数据中的该位置的垂直值,而y的导出包括数学上等价于(j*C+D)>>S的结果的计算,并且其中:
j指示上采样的阵列中的该位置的垂直值;
C是通过对垂直比例因子的倒数乘以2S+F的值进行近似;
D是偏移量;
S是移位值;以及
F是基于在y的分数分量中的位数。
15.如权利要求14所述的系统,其特征在于,其中
j、C和D部分基于所述基层图像数据是用于帧还是半帧,
j和D部分基于所述基层图像数据是用于亮度还是色度;
D基于所述基层图像数据的垂直分辨率、所述垂直比例因子和S;
F是4,以及
S为12。
16.如权利要求14所述的系统,其特征在于,其中x指示所述基层图像数据中的该位置的水平值,而x的导出包括数学上等价于(i*C’+D’)>>S’的结果的计算,并且其中:
i指示上采样的阵列中的该位置的水平值;
C’是通过对水平比例因子的倒数乘以2S+F’的值进行近似;
D’是可以与D相同或不同的偏移量;
S’是可以与S相同或不同的移位值;以及
F’是基于在x的分数分量中的位数。
17.如权利要求16所述的系统,其特征在于,i是基于T-L,T指示水平偏移量,而L指示左偏移量;
F’是4,
S’为12;以及。
根据下式来导出C’:
((BasePic Width<<16)+(ScaledBase Width>>1))÷ScaledBase Width,
其中BasePicWidth指示所述基层图像数据的水平分辨率,而ScaledBaseWidth指示在上采样之后的水平分辨率。
18.如权利要求16所述的系统,其特征在于,所述方法还包括:
基于y的F个最低有效位来选择垂直滤波器,并基于y的剩余位来选择要过滤的垂直整数位置,其中,所述基层图像数据的垂直内插在所述垂直整数位置处使用所述垂直滤波器;以及
基于x的F’个最低有效位来选择水平滤波器,并基于x的剩余位来选择要过滤的水平整数位置,其中,垂直内插的结果的水平内插在所述水平整数位置处使用所述水平滤波器。
19.如权利要求18所述的系统,其特征在于,所述计算机可读存储进一步存储用于为所述基层图像数据在上采样阵列中的位置处使用内插的采样值来编码增强层的计算机可执行指令。
20.如权利要求18所述的系统,其特征在于,所述计算机可读存储进一步存储用于为所述基层图像数据在上采样阵列中的位置处使用内插的采样值来解码增强层的计算机可执行指令。
CN201110120389XA 2006-01-06 2007-01-08 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法 Active CN102176748B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US75684606P 2006-01-06 2006-01-06
US60/756,846 2006-01-06
US78657306P 2006-03-27 2006-03-27
US60/786,573 2006-03-27
US82951506P 2006-10-13 2006-10-13
US60/829,515 2006-10-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2007800019896A Division CN101366281B (zh) 2006-01-06 2007-01-08 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法

Publications (2)

Publication Number Publication Date
CN102176748A true CN102176748A (zh) 2011-09-07
CN102176748B CN102176748B (zh) 2013-03-27

Family

ID=38256899

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2007800019896A Active CN101366281B (zh) 2006-01-06 2007-01-08 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法
CN201110120389XA Active CN102176748B (zh) 2006-01-06 2007-01-08 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2007800019896A Active CN101366281B (zh) 2006-01-06 2007-01-08 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法

Country Status (11)

Country Link
US (4) US7956930B2 (zh)
EP (1) EP1985120B1 (zh)
JP (2) JP5302010B2 (zh)
KR (2) KR101354741B1 (zh)
CN (2) CN101366281B (zh)
AU (2) AU2007205175B2 (zh)
CA (1) CA2635898C (zh)
HK (1) HK1161016A1 (zh)
IL (2) IL192420A (zh)
RU (2) RU2420915C2 (zh)
WO (1) WO2007081752A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620574A (zh) * 2012-09-14 2015-05-13 高通股份有限公司 用于数字图像的高效重新取样和调整大小的方法和装置
CN104871545A (zh) * 2012-12-21 2015-08-26 杜比实验室特许公司 高位深度视频的可扩展编码中的高精度上采样
CN111713104A (zh) * 2018-02-14 2020-09-25 索尼公司 图像处理装置和方法
CN112840650A (zh) * 2018-10-19 2021-05-25 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法
CN114025161A (zh) * 2020-10-20 2022-02-08 平头哥(上海)半导体技术有限公司 图像处理中的频率特定压缩与补偿技术

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US8243820B2 (en) * 2004-10-06 2012-08-14 Microsoft Corporation Decoding variable coded resolution video with native range/resolution post-processing operation
US9071847B2 (en) * 2004-10-06 2015-06-30 Microsoft Technology Licensing, Llc Variable coding resolution in video codec
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
WO2008049446A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
US8199812B2 (en) * 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
US8503524B2 (en) * 2007-01-23 2013-08-06 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction
US8665942B2 (en) 2007-01-23 2014-03-04 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction signaling
US8233536B2 (en) * 2007-01-23 2012-07-31 Sharp Laboratories Of America, Inc. Methods and systems for multiplication-free inter-layer image prediction
KR100834443B1 (ko) * 2007-02-27 2008-06-04 삼성전자주식회사 비디오 코덱을 위한 메모리 구조 및 메모리 액세스 방법
US8107571B2 (en) * 2007-03-20 2012-01-31 Microsoft Corporation Parameterized filters and signaling techniques
US8619874B2 (en) * 2007-04-13 2013-12-31 Apple Inc. Method and system for video encoding and decoding
KR20080114388A (ko) * 2007-06-27 2008-12-31 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
KR101365596B1 (ko) 2007-09-14 2014-03-12 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
US8989553B2 (en) * 2008-01-12 2015-03-24 Innotive Inc. Korea Video processing system and video processing method
US20100278236A1 (en) * 2008-01-17 2010-11-04 Hua Yang Reduced video flicker
US8953673B2 (en) * 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
KR20090097015A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
FR2931610B1 (fr) * 2008-05-20 2010-12-17 Canon Kk Procede et un dispositif de transmission de donnees d'images
JP2009290552A (ja) * 2008-05-29 2009-12-10 Fujifilm Corp 動画圧縮装置および動画圧縮プログラム
JP5369893B2 (ja) * 2008-05-30 2013-12-18 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、動画像復号プログラム、動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラム
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8194977B2 (en) * 2008-12-09 2012-06-05 Microsoft Corporation Remote desktop protocol compression acceleration using single instruction, multiple dispatch instructions
US20100177162A1 (en) * 2009-01-15 2010-07-15 Charles Macfarlane Method and system for enabling 3d video and image processing using one full resolution video stream and one lower resolution video stream
CN104702960B (zh) * 2009-01-26 2018-01-02 汤姆森特许公司 用于视频解码的装置
WO2010093430A1 (en) * 2009-02-11 2010-08-19 Packetvideo Corp. System and method for frame interpolation for a compressed video bitstream
US20100226437A1 (en) * 2009-03-06 2010-09-09 Sony Corporation, A Japanese Corporation Reduced-resolution decoding of avc bit streams for transcoding or display at lower resolution
WO2010120338A2 (en) * 2009-04-14 2010-10-21 Thomson Licensing Methods and apparatus for filter parameter determination and selection responsive to variable transforms in sparsity-based de-artifact filtering
WO2011005624A1 (en) * 2009-07-04 2011-01-13 Dolby Laboratories Licensing Corporation Encoding and decoding architectures for format compatible 3d video delivery
US8699565B2 (en) * 2009-08-27 2014-04-15 Hewlett-Packard Development Company, L.P. Method and system for mixed-resolution low-complexity information coding and a corresponding method and system for decoding coded information
US8487929B2 (en) * 2009-09-09 2013-07-16 Advanced Micro Devices, Inc. Resolution enhancement of video stream based on spatial and temporal correlation
US8665968B2 (en) * 2009-09-30 2014-03-04 Broadcom Corporation Method and system for 3D video coding using SVC spatial scalability
JP2011109469A (ja) * 2009-11-18 2011-06-02 Canon Inc コンテンツ受信装置及びコンテンツ受信装置の制御方法
US9014276B2 (en) * 2009-12-04 2015-04-21 Broadcom Corporation Method and system for 3D video coding using SVC temporal and spatial scalabilities
US8611414B2 (en) * 2010-02-17 2013-12-17 University-Industry Cooperation Group Of Kyung Hee University Video signal processing and encoding
JP5544996B2 (ja) * 2010-04-09 2014-07-09 ソニー株式会社 画像処理装置および方法
US9047531B2 (en) * 2010-05-21 2015-06-02 Hand Held Products, Inc. Interactive user interface for capturing a document in an image signal
CN101895748B (zh) * 2010-06-21 2014-03-26 华为终端有限公司 一种编解码方法以及编解码装置
US9467689B2 (en) * 2010-07-08 2016-10-11 Dolby Laboratories Licensing Corporation Systems and methods for multi-layered image and video delivery using reference processing signals
US9323438B2 (en) 2010-07-15 2016-04-26 Apple Inc. Media-editing application with live dragging and live editing capabilities
CN103026706B (zh) * 2010-07-21 2016-04-20 杜比实验室特许公司 用于多层帧兼容视频传输的系统及方法
MX2013002429A (es) * 2010-09-03 2013-04-08 Dolby Lab Licensing Corp Metodo y sistema para compensacion de iluminacion y transicion para codificacion y procesamiento de video.
US9462220B2 (en) 2010-12-17 2016-10-04 Microsoft Technology Licensing, Llc Auto-regressive edge-directed interpolation with backward projection constraint
US8639053B2 (en) * 2011-01-18 2014-01-28 Dimension, Inc. Methods and systems for up-scaling a standard definition (SD) video to high definition (HD) quality
US9099161B2 (en) 2011-01-28 2015-08-04 Apple Inc. Media-editing application with multiple resolution modes
US11747972B2 (en) 2011-02-16 2023-09-05 Apple Inc. Media-editing application with novel editing tools
US8839110B2 (en) * 2011-02-16 2014-09-16 Apple Inc. Rate conform operation for a media-editing application
US9412414B2 (en) 2011-02-16 2016-08-09 Apple Inc. Spatial conform operation for a media-editing application
CN103354997A (zh) * 2011-02-18 2013-10-16 索尼公司 图像处理设备和图像处理方法
KR20120118781A (ko) * 2011-04-19 2012-10-29 삼성전자주식회사 다시점 비디오를 위한 단일화된 스케일러블 비디오 부호화 방법 및 그 장치, 다시점 비디오를 위한 단일화된 스케일러블 비디오 복호화 방법 및 그 장치
EP4075799B1 (en) 2011-06-14 2024-04-10 LG Electronics Inc. Apparatus for encoding and decoding image information
US9686543B2 (en) 2011-06-15 2017-06-20 Electronics And Telecommunications Research Institute Method for coding and decoding scalable video and apparatus using same
LT3343781T (lt) 2011-06-16 2022-03-10 Ge Video Compression, Llc Konteksto inicijavimas entropinio kodavimo metu
US8837582B2 (en) * 2011-06-22 2014-09-16 Blackberry Limited Compressing image data
KR20130001541A (ko) 2011-06-27 2013-01-04 삼성전자주식회사 다시점 영상의 해상도 복원 방법 및 장치
CN103597829B (zh) * 2011-06-28 2017-03-22 日本电气株式会社 对视频量化参数编码的方法和对视频量化参数解码的方法
UA114674C2 (uk) 2011-07-15 2017-07-10 ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі Ініціалізація контексту в ентропійному кодуванні
EP2557789B1 (en) 2011-08-09 2017-09-27 Dolby Laboratories Licensing Corporation Guided image up-sampling in video coding
KR20140063774A (ko) 2011-09-09 2014-05-27 파나몰프, 인코포레이티드 이미지 처리 시스템 및 방법
US10034018B2 (en) 2011-09-23 2018-07-24 Velos Media, Llc Decoded picture buffer management
JP5232319B2 (ja) 2011-10-20 2013-07-10 株式会社東芝 通信装置及び通信方法
GB201119206D0 (en) 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
CN103123718B (zh) * 2011-11-21 2016-06-22 腾讯科技(深圳)有限公司 一种图像处理方法和系统
CN103975594B (zh) * 2011-12-01 2017-08-15 英特尔公司 用于残差预测的运动估计方法
US9111376B2 (en) 2012-01-26 2015-08-18 Samsung Electronics Co., Ltd. Image processing method and apparatus for 3D video
FR2989856B1 (fr) * 2012-04-23 2014-11-28 Assistance Tech Et Etude De Materiels Electroniques Compression/decompression progressive d'un flux numerique video comprenant au moins une image entrelacee
EA201492098A1 (ru) * 2012-05-14 2015-04-30 Лука Россато Кодирование и декодирование на основании смешивания последовательностей выборок с течением времени
JP5390667B2 (ja) * 2012-06-11 2014-01-15 株式会社東芝 映像送信機器及び映像受信機器
US9146666B2 (en) * 2012-06-21 2015-09-29 Sharp Laboratories Of America, Inc. Touch sensor navigation
CN104412611A (zh) * 2012-07-02 2015-03-11 思科技术公司 告知针对具有相同纵横比不同图像分辨率的连续编码视频序列的信息
CN104704831B (zh) 2012-08-06 2019-01-04 Vid拓展公司 多层视频编码中用于空间层的采样栅格信息
CN104685878B (zh) * 2012-09-24 2018-11-30 华为技术有限公司 具有颜色空间缩放性的视频压缩
RU2666305C1 (ru) * 2012-09-28 2018-09-06 Сони Корпорейшн Устройство и способ кодирования, устройство и способ декодирования
US20140119446A1 (en) * 2012-11-01 2014-05-01 Microsoft Corporation Preserving rounding errors in video coding
KR102163477B1 (ko) * 2012-12-04 2020-10-07 인텔렉추얼디스커버리 주식회사 비디오 부호화 및 복호화 방법, 그를 이용한 장치
US8891905B2 (en) * 2012-12-19 2014-11-18 Hong Kong Applied Science And Technology Research Institute Co., Ltd. Boundary-based high resolution depth mapping
WO2014107066A1 (ko) * 2013-01-04 2014-07-10 삼성전자 주식회사 위상차를 고려한 영상 업샘플링을 이용하는 스케일러블 비디오 부호화 방법 및 장치, 스케일러블 비디오 복호화 방법 및 장치
US10284908B2 (en) 2013-02-26 2019-05-07 Comcast Cable Communications, Llc Providing multiple data transmissions
US9947335B2 (en) 2013-04-05 2018-04-17 Dolby Laboratories Licensing Corporation Companding apparatus and method to reduce quantization noise using advanced spectral extension
EP2984831A4 (en) * 2013-04-08 2016-12-07 Nokia Technologies Oy METHOD AND TECHNICAL APPARATUS FOR VIDEO CODING AND DECODING
US9813723B2 (en) * 2013-05-03 2017-11-07 Qualcomm Incorporated Conditionally invoking a resampling process in SHVC
WO2014189300A1 (ko) * 2013-05-24 2014-11-27 주식회사 케이티 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치
KR20140138538A (ko) * 2013-05-24 2014-12-04 주식회사 케이티 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치
US9635371B2 (en) * 2013-05-31 2017-04-25 Qualcomm Incorporated Determining rounding offset using scaling factor in picture resampling
US9762920B2 (en) * 2013-06-07 2017-09-12 Qualcomm Incorporated Dynamic range control of intermediate data in resampling process
KR102062764B1 (ko) 2013-07-19 2020-02-21 삼성전자주식회사 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
US9497473B2 (en) * 2013-10-03 2016-11-15 Qualcomm Incorporated High precision explicit weighted prediction for video coding
WO2015054812A1 (en) 2013-10-14 2015-04-23 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
RU2654129C2 (ru) 2013-10-14 2018-05-16 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Функциональные возможности режима внутреннего предсказания с блочным копированием для кодирования и декодирования видео и изображений
CN105659602B (zh) 2013-10-14 2019-10-08 微软技术许可有限责任公司 用于视频和图像编码的帧内块复制预测模式的编码器侧选项
US9648348B2 (en) * 2013-10-23 2017-05-09 Qualcomm Incorporated Multi-layer video file format designs
US9310908B2 (en) * 2013-10-30 2016-04-12 Htc Corporation Color sampling method and touch control device thereof
EP2890131A1 (en) * 2013-12-31 2015-07-01 Patents Factory Ltd. Sp. z o.o. Video coding with different spatial resolutions for intra-coded frames and inter-coded frames
MY178217A (en) * 2014-01-02 2020-10-07 Vid Scale Inc Methods and systems for scalable video coding with mixed interlace and progressive content
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US11350015B2 (en) 2014-01-06 2022-05-31 Panamorph, Inc. Image processing system and method
US9774881B2 (en) * 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US20150264368A1 (en) * 2014-03-14 2015-09-17 Sony Corporation Method to bypass re-sampling process in shvc with bit-depth and 1x scalability
CN103838543A (zh) * 2014-03-27 2014-06-04 成都睿明医疗信息技术有限公司 屏幕画面共享方法及其系统
WO2015170928A1 (en) 2014-05-08 2015-11-12 Samsung Electronics Co., Ltd. Apparatus and method for changing mode of device
US9843812B2 (en) * 2014-05-23 2017-12-12 Sony Corporation Video transmission system with color gamut partitioning and method of operation thereof
US9251431B2 (en) 2014-05-30 2016-02-02 Apple Inc. Object-of-interest detection and recognition with split, full-resolution image processing pipeline
US9449239B2 (en) 2014-05-30 2016-09-20 Apple Inc. Credit card auto-fill
US9565370B2 (en) 2014-05-30 2017-02-07 Apple Inc. System and method for assisting in computer interpretation of surfaces carrying symbols or characters
CN105187824A (zh) * 2014-06-10 2015-12-23 杭州海康威视数字技术股份有限公司 图像编码方法和装置以及图像解码方法和装置
CN105493505B (zh) 2014-06-19 2019-08-06 微软技术许可有限责任公司 统一的帧内块复制和帧间预测模式
CN104184981B (zh) * 2014-08-27 2017-12-15 深圳市华星光电技术有限公司 一种基于缩减像素采样处理的低解析度显示方法及设备
AU2014408228B2 (en) 2014-09-30 2019-09-19 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US9690752B2 (en) * 2014-10-03 2017-06-27 Harris Corporation Method and system for performing robust regular gridded data resampling
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles
KR102440941B1 (ko) 2015-03-03 2022-09-05 삼성전자주식회사 이미지 처리 정보에 따라 크기와 방향을 갖는 초기 위상을 계산할 수 있는 이미지 처리 장치들
US10659783B2 (en) 2015-06-09 2020-05-19 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
CN105407352A (zh) * 2015-11-23 2016-03-16 小米科技有限责任公司 图像压缩方法、装置及服务器
CN106802964A (zh) * 2015-11-26 2017-06-06 北京华大九天软件有限公司 一种图形自动转化阵列的方法
EP3185556A1 (en) * 2015-12-21 2017-06-28 Thomson Licensing Method and apparatus for combined adaptive resolution and internal bit-depth increase coding
US10630992B2 (en) 2016-01-08 2020-04-21 Samsung Electronics Co., Ltd. Method, application processor, and mobile terminal for processing reference image
WO2017205648A1 (en) * 2016-05-26 2017-11-30 Vid Scale, Inc. Geometric conversion for 360-degree video coding
US20180146019A1 (en) * 2016-11-21 2018-05-24 International Business Machines Corporation Light-weight resolution switching for online video streaming
CN108495130B (zh) * 2017-03-21 2021-04-20 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、终端、服务器和存储介质
CN107896330B (zh) * 2017-11-29 2019-08-13 北京大学深圳研究生院 一种用于帧内和帧间预测的滤波方法
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US11736648B2 (en) 2018-05-09 2023-08-22 Panamorph, Inc. Progressive image compression and restoration providing a high spatial quality intermediate image
KR102022648B1 (ko) 2018-08-10 2019-09-19 삼성전자주식회사 전자 장치, 이의 제어 방법 및 서버의 제어 방법
CN109040755A (zh) * 2018-09-17 2018-12-18 珠海亿智电子科技有限公司 一种适用于视频编码的图像前处理装置
CN109544502B (zh) * 2018-09-25 2023-06-30 中山大学 一种jpeg图像下采样因子估计方法
US11290734B2 (en) * 2019-01-02 2022-03-29 Tencent America LLC Adaptive picture resolution rescaling for inter-prediction and display
US11012710B2 (en) 2019-03-06 2021-05-18 Tencent America LLC Techniques for intra prediction for 360 image and video coding
JP2020160737A (ja) * 2019-03-26 2020-10-01 株式会社コーエーテクモゲームス 情報処理装置、情報処理方法及びプログラム
WO2020263499A1 (en) 2019-06-24 2020-12-30 Alibaba Group Holding Limited Adaptive resolution change in video processing
KR102665968B1 (ko) 2019-06-27 2024-05-16 삼성전자주식회사 블러 추정 방법 및 장치
CN114467300A (zh) * 2019-08-06 2022-05-10 Op方案有限责任公司 自适应分辨率管理信令
KR20220088679A (ko) * 2019-08-06 2022-06-28 오피 솔루션즈, 엘엘씨 적응적 해상도 관리 예측 재스케일링
WO2021026334A1 (en) * 2019-08-06 2021-02-11 Op Solutions Adaptive resolution management signaling
KR20220090493A (ko) 2019-08-06 2022-06-29 오피 솔루션즈, 엘엘씨 블록-기반 적응적 해상도 관리
JP2022544164A (ja) 2019-08-06 2022-10-17 オーピー ソリューションズ, エルエルシー フレームタイプに基づく適応分解能管理の暗示的信号伝達
WO2021026324A1 (en) * 2019-08-06 2021-02-11 Op Solutions Adaptive resolution management prediction rescaling
US11140402B2 (en) * 2019-09-20 2021-10-05 Tencent America LLC Signaling of reference picture resampling with constant window size indication in video bitstream
US11336894B2 (en) * 2019-09-20 2022-05-17 Tencent America LLC Signaling of reference picture resampling with resampling picture size indication in video bitstream
EP4035384A4 (en) * 2019-09-23 2023-08-16 Alibaba Group Holding Limited MOTION COMPENSATION INTERPOLATION FILTER WITH REFERENCE DOWNSAMPLE
US11317093B2 (en) 2019-09-24 2022-04-26 Tencent America LLC Method for reference picture resampling with offset in video bitstream
CN110572672B (zh) * 2019-09-27 2024-03-15 腾讯科技(深圳)有限公司 视频编解码方法和装置、存储介质及电子装置
CN110662071B (zh) * 2019-09-27 2023-10-24 腾讯科技(深圳)有限公司 视频解码方法和装置、存储介质及电子装置
CN110572673B (zh) * 2019-09-27 2024-04-09 腾讯科技(深圳)有限公司 视频编解码方法和装置、存储介质及电子装置
CN110572674B (zh) * 2019-09-27 2024-03-15 腾讯科技(深圳)有限公司 视频编解码方法和装置、存储介质及电子装置
CN110677690B (zh) * 2019-09-27 2022-07-01 腾讯科技(深圳)有限公司 视频处理方法和装置、存储介质
CA3157445A1 (en) 2019-11-08 2021-05-14 Hari Kalva Methods and systems for adaptive cropping
US11372644B2 (en) 2019-12-09 2022-06-28 Meta Platforms, Inc. Matrix processing instruction with optional up/down sampling of matrix
US11438611B2 (en) 2019-12-11 2022-09-06 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US20210192019A1 (en) * 2019-12-18 2021-06-24 Booz Allen Hamilton Inc. System and method for digital steganography purification
US11563947B2 (en) * 2019-12-31 2023-01-24 Tencent America LLC Signaling output picture size for reference picture resampling
US11445176B2 (en) 2020-01-14 2022-09-13 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US20210304357A1 (en) * 2020-03-27 2021-09-30 Alibaba Group Holding Limited Method and system for video processing based on spatial or temporal importance
CN111757142B (zh) * 2020-07-22 2022-03-11 四川新视创伟超高清科技有限公司 一种基于云端流媒体切画的视频播放系统
CN112235606A (zh) * 2020-12-11 2021-01-15 全时云商务服务股份有限公司 一种多层视频处理方法、系统和可读存储介质

Family Cites Families (200)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU1506554A1 (ru) 1987-10-06 1989-09-07 Предприятие П/Я А-1772 Кодер видеосигнала
USRE35910E (en) 1989-05-11 1998-09-29 Matsushita Electric Industrial Co., Ltd. Moving image signal encoding apparatus and decoding apparatus
JP3303869B2 (ja) 1990-11-30 2002-07-22 株式会社日立製作所 画像符号化方法、画像符号化装置、画像復号化方法
JP3191935B2 (ja) 1990-11-30 2001-07-23 株式会社日立製作所 画像符号化方法、画像符号化装置、画像復号化方法
US5136377A (en) 1990-12-11 1992-08-04 At&T Bell Laboratories Adaptive non-linear quantizer
US5611038A (en) 1991-04-17 1997-03-11 Shaw; Venson M. Audio/video transceiver provided with a device for reconfiguration of incompatibly received or transmitted video and audio information
US5414469A (en) 1991-10-31 1995-05-09 International Business Machines Corporation Motion video compression system with multiresolution features
US5300949A (en) 1992-10-22 1994-04-05 International Business Machines Corporation Scalable digital video decompressor
KR970000683B1 (ko) 1993-05-31 1997-01-16 삼성전자 주식회사 해상도 가변 적응적 화상압축/복원방법 및 장치
US5555021A (en) * 1993-12-14 1996-09-10 Watec America Corporation Compact television camera with switching noise prevention
US5592226A (en) 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
US5828421A (en) 1994-10-11 1998-10-27 Hitachi America, Ltd. Implementation efficient digital picture-in-picture decoding methods and apparatus
US5821986A (en) 1994-11-03 1998-10-13 Picturetel Corporation Method and apparatus for visual communications in a scalable network environment
US5864637A (en) 1995-04-18 1999-01-26 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selective reduction of spatial resolution
US6002801A (en) 1995-04-18 1999-12-14 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selection of IDCT method based on image characteristics
US5796855A (en) 1995-10-05 1998-08-18 Microsoft Corporation Polygon block matching method
US6324301B1 (en) 1996-01-24 2001-11-27 Lucent Technologies Inc. Adaptive postfilter for low bitrate visual telephony noise removal
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
WO1997037322A1 (en) 1996-03-29 1997-10-09 Sarnoff Corporation Apparatus and method for optimizing encoding and performing automated steerable image compression using a perceptual metric
JP3466032B2 (ja) 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置
US6175592B1 (en) * 1997-03-12 2001-01-16 Matsushita Electric Industrial Co., Ltd. Frequency domain filtering for down conversion of a DCT encoded picture
EP1628479A3 (en) 1997-03-12 2007-09-05 Matsushita Electric Industrial Co., Ltd. HDTV downconversion system
US6014694A (en) 1997-06-26 2000-01-11 Citrix Systems, Inc. System for adaptive video/audio transport over a network
KR100435257B1 (ko) * 1997-08-07 2004-07-16 삼성전자주식회사 영상신호 처리 시스템에서의 이미지 포맷 변환장치 및 방법
AR016812A1 (es) 1997-08-14 2001-08-01 Samsung Electronics Co Ltd Metodo para transmitir informacion de video comprimida, disposiciones de compresion y de grabacion de video y aparato de reproduccion de video
US6339434B1 (en) * 1997-11-24 2002-01-15 Pixelworks Image scaling circuit for fixed pixed resolution display
WO1999029112A1 (en) 1997-12-01 1999-06-10 Matsushita Electric Industrial Co., Ltd. Image processor, image data processor and variable length encoder/decoder
US6239847B1 (en) * 1997-12-15 2001-05-29 Netergy Networks, Inc. Two pass multi-dimensional data scaling arrangement and method thereof
US6731811B1 (en) 1997-12-19 2004-05-04 Voicecraft, Inc. Scalable predictive coding method and apparatus
US6873368B1 (en) 1997-12-23 2005-03-29 Thomson Licensing Sa. Low noise encoding and decoding method
US5995150A (en) 1998-02-20 1999-11-30 Winbond Electronics Corporation America Dual compressed video bitstream camera for universal serial bus connection
MY123018A (en) * 1998-07-24 2006-05-31 Panasonic Corp Video signal character converting device and method of the same
US6157396A (en) 1999-02-16 2000-12-05 Pixonics Llc System and method for using bitstream information to process images for use in digital display systems
US6229570B1 (en) 1998-09-25 2001-05-08 Lucent Technologies Inc. Motion compensation image interpolation—frame rate conversion for HDTV
US6501484B1 (en) * 1998-09-29 2002-12-31 Globalstreams, Inc. System and method for high definition video rescaling
JP2000134618A (ja) 1998-10-23 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化方法と装置、及び画像信号復号方法と装置、及びこれらの方法を記録した記録媒体
JP2000165661A (ja) * 1998-11-27 2000-06-16 Murata Mach Ltd 画像処理装置及び記録媒体
US6418166B1 (en) 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern
US6983018B1 (en) 1998-11-30 2006-01-03 Microsoft Corporation Efficient motion vector coding for video compression
AUPP779898A0 (en) * 1998-12-18 1999-01-21 Canon Kabushiki Kaisha A method of kernel selection for image interpolation
JP3672185B2 (ja) 1999-02-09 2005-07-13 ソニー株式会社 コーディングシステム及びこれを用いた装置並びに記録媒体
US6259741B1 (en) 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
FR2792798B1 (fr) * 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
FI113124B (fi) 1999-04-29 2004-02-27 Nokia Corp Tiedonsiirto
WO2000074385A2 (en) 1999-05-27 2000-12-07 University Of Maryland, College Park 3d wavelet based video codec with human perceptual model
US6678424B1 (en) 1999-11-11 2004-01-13 Tektronix, Inc. Real time human vision system behavioral modeling
US6931060B1 (en) 1999-12-07 2005-08-16 Intel Corporation Video processing of a quantized base layer and one or more enhancement layers
US6700933B1 (en) 2000-02-15 2004-03-02 Microsoft Corporation System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
US7079157B2 (en) * 2000-03-17 2006-07-18 Sun Microsystems, Inc. Matching the edges of multiple overlapping screen images
US6510177B1 (en) 2000-03-24 2003-01-21 Microsoft Corporation System and method for layered video coding enhancement
US6456663B1 (en) 2000-03-29 2002-09-24 Matsushita Electric Industrial Co., Ltd. DCT domain down conversion system that compensates for IDCT mismatch
JP4686048B2 (ja) 2000-04-21 2011-05-18 パナソニック株式会社 画素演算装置
JP4560897B2 (ja) 2000-06-02 2010-10-13 ソニー株式会社 通信装置、通信方法及び媒体
US6647061B1 (en) 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
US7023922B1 (en) 2000-06-21 2006-04-04 Microsoft Corporation Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information
WO2002001881A2 (en) 2000-06-30 2002-01-03 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
KR100370076B1 (ko) 2000-07-27 2003-01-30 엘지전자 주식회사 다운 컨버젼 기능을 갖는 비디오 디코더 및 비디오 신호를디코딩 하는 방법
CN1180630C (zh) 2000-08-08 2004-12-15 皇家菲利浦电子有限公司 基于子波分解的视频编码方法
US6937291B1 (en) 2000-08-31 2005-08-30 Intel Corporation Adaptive video scaler
US7039115B1 (en) 2000-09-20 2006-05-02 General Instrument Corporation Processor allocation for channels in a video multi-processor system
US6940905B2 (en) 2000-09-22 2005-09-06 Koninklijke Philips Electronics N.V. Double-loop motion-compensation fine granular scalability
DE10048735A1 (de) 2000-09-29 2002-04-11 Bosch Gmbh Robert Verfahren zur Codierung und Decodierung von Bildsequenzen sowie Einrichtungen hierzu
JP4231620B2 (ja) * 2000-10-11 2009-03-04 メディア・テック・ユーエスエイ・インコーポレーテッド 画像処理方法および装置
US20020159484A1 (en) 2000-12-05 2002-10-31 Murat Azizoglu Coding scheme using a control code map for signal transmission in optical communications networks
US6907070B2 (en) 2000-12-15 2005-06-14 Microsoft Corporation Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding
AUPR222500A0 (en) 2000-12-21 2001-01-25 Unisearch Limited Method for efficient scalable compression of video
WO2002054777A1 (en) 2000-12-28 2002-07-11 Koninklijke Philips Electronics N.V. Mpeg-2 down-sampled video generation
US20020118743A1 (en) 2001-02-28 2002-08-29 Hong Jiang Method, apparatus and system for multiple-layer scalable video coding
US6831947B2 (en) 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
KR20030014705A (ko) 2001-04-10 2003-02-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 프레임들의 시퀀스를 인코딩하는 방법
KR100783396B1 (ko) 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
DE10120395A1 (de) 2001-04-25 2002-10-31 Bosch Gmbh Robert Einrichtung zur Interpolation von Abtastwerten sowie Bildencoder und Bilddecoder
US7206453B2 (en) 2001-05-03 2007-04-17 Microsoft Corporation Dynamic filtering for lossy compression
US6907143B2 (en) 2001-05-16 2005-06-14 Tektronix, Inc. Adaptive spatio-temporal filter for human vision system models
US6792044B2 (en) 2001-05-16 2004-09-14 Koninklijke Philips Electronics N.V. Method of and system for activity-based frequency weighting for FGS enhancement layers
WO2002096120A1 (en) 2001-05-25 2002-11-28 Centre For Signal Processing, Nanyang Technological University Bit rate control for video compression
US7747094B2 (en) * 2001-06-29 2010-06-29 Ntt Docomo, Inc. Image encoder, image decoder, image encoding method, and image decoding method
US9894379B2 (en) 2001-07-10 2018-02-13 The Directv Group, Inc. System and methodology for video compression
RU2313190C2 (ru) * 2001-07-10 2007-12-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации масштабируемого кодированного видеосигнала из немасштабируемого кодированного видеосигнала
US7876820B2 (en) 2001-09-04 2011-01-25 Imec Method and system for subband encoding and decoding of an overcomplete representation of the data structure
US6992725B2 (en) 2001-10-22 2006-01-31 Nec Electronics America, Inc. Video data de-interlacing using perceptually-tuned interpolation scheme
US7639739B2 (en) 2001-11-02 2009-12-29 The Regents Of The University Of California Technique to enable efficient adaptive streaming and transcoding of video and other signals
JP4610195B2 (ja) 2001-12-17 2011-01-12 マイクロソフト コーポレーション スキップマクロブロックコード化
JP2005515729A (ja) 2001-12-28 2005-05-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法
WO2003063497A1 (en) 2002-01-22 2003-07-31 Koninklijke Philips Electronics N.V. Drift-free video encoding and decoding method, and corresponding devices
US7596179B2 (en) 2002-02-27 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing the resolution of media data
US7317759B1 (en) 2002-02-28 2008-01-08 Carnegie Mellon University System and methods for video compression mode decisions
US6993078B2 (en) 2002-03-28 2006-01-31 International Business Machines Corporation Macroblock coding technique with biasing towards skip macroblock coding
US8284844B2 (en) 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
JP4102973B2 (ja) 2002-04-24 2008-06-18 日本電気株式会社 動画像の符号化方法および復号化方法、これを用いた装置とプログラム
US7386049B2 (en) 2002-05-29 2008-06-10 Innovation Management Sciences, Llc Predictive interpolation of a video signal
AUPS291002A0 (en) 2002-06-12 2002-07-04 Unisearch Limited Method and apparatus for scalable compression of video
AU2003246987A1 (en) 2002-07-09 2004-01-23 Nokia Corporation Method and system for selecting interpolation filter type in video coding
JP4724351B2 (ja) * 2002-07-15 2011-07-13 三菱電機株式会社 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
WO2004008771A1 (en) 2002-07-17 2004-01-22 Koninklijke Philips Electronics N.V. 3d wavelet video coding and decoding method and corresponding device
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7010037B2 (en) 2002-08-06 2006-03-07 Koninklijke Philips Electronics N.V. System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
US7072394B2 (en) 2002-08-27 2006-07-04 National Chiao Tung University Architecture and method for fine granularity scalable video coding
US7379496B2 (en) 2002-09-04 2008-05-27 Microsoft Corporation Multi-resolution video coding and decoding
AU2003264804A1 (en) 2002-10-16 2004-05-04 Koninklijke Philips Electronics N.V. Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering
US7227901B2 (en) 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
EP1422928A3 (en) * 2002-11-22 2009-03-11 Panasonic Corporation Motion compensated interpolation of digital video signals
GB0228556D0 (en) 2002-12-06 2003-01-15 British Telecomm Video quality measurement
EP1576730A1 (en) 2002-12-19 2005-09-21 Koninklijke Philips Electronics N.V. Digital filter with spatial scalability
JP2006521039A (ja) 2003-02-25 2006-09-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーバコンプリートウェーブレット展開での動き補償時間フィルタリングを使用した3次元ウェーブレットビデオ符号化
FR2852773A1 (fr) 2003-03-20 2004-09-24 France Telecom Procedes et dispositifs de codage et de decodage d'une sequence d'images par decomposition mouvement/texture et codage par ondelettes
US8761252B2 (en) 2003-03-27 2014-06-24 Lg Electronics Inc. Method and apparatus for scalably encoding and decoding video signal
US20070038861A1 (en) 2003-04-25 2007-02-15 Thomson Licensing Inc. Marking techniques for tracking pirated media content
US7653133B2 (en) * 2003-06-10 2010-01-26 Rensselaer Polytechnic Institute (Rpi) Overlapped block motion compression for variable size blocks in the context of MCTF scalable video coders
US8107535B2 (en) 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
WO2004114668A1 (en) 2003-06-16 2004-12-29 Thomson Licensing S.A. Decoding method and apparatus enabling fast channel change of compressed video
JP4207684B2 (ja) 2003-06-27 2009-01-14 富士電機デバイステクノロジー株式会社 磁気記録媒体の製造方法、および、製造装置
US20060159173A1 (en) 2003-06-30 2006-07-20 Koninklijke Philips Electronics N.V. Video coding in an overcomplete wavelet domain
WO2005001772A1 (en) 2003-06-30 2005-01-06 Koninklijke Philips Electronics, N.V. System and method for video processing using overcomplete wavelet coding and circular prediction mapping
JP4699685B2 (ja) 2003-08-21 2011-06-15 パナソニック株式会社 信号処理装置及びそれを用いた電子機器
TWI232681B (en) 2003-08-27 2005-05-11 Mediatek Inc Method of transforming one video output format into another video output format without degrading display quality
US7822123B2 (en) 2004-10-06 2010-10-26 Microsoft Corporation Efficient repeat padding for hybrid video sequence with arbitrary video resolution
US7391933B2 (en) 2003-10-30 2008-06-24 Samsung Electronics Co., Ltd. Method and apparatus for image interpolation based on adaptive polyphase filters
NO319660B1 (no) 2003-11-17 2005-09-05 Tandberg Telecom As Fremgangsmåte for interpolering av pixelverdier
KR100519776B1 (ko) * 2003-11-24 2005-10-07 삼성전자주식회사 영상 신호의 해상도 변환 방법 및 장치
KR100597402B1 (ko) * 2003-12-01 2006-07-06 삼성전자주식회사 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
US7369610B2 (en) 2003-12-01 2008-05-06 Microsoft Corporation Enhancement layer switching for scalable video coding
US7379608B2 (en) 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
CN1332563C (zh) * 2003-12-31 2007-08-15 中国科学院计算技术研究所 一种视频图像跳过宏块的编码方法
US20050157791A1 (en) 2004-01-20 2005-07-21 Eastman Kodak Company System and method for video tone scale reduction
JP2005217940A (ja) 2004-01-30 2005-08-11 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
US7227894B2 (en) 2004-02-24 2007-06-05 Industrial Technology Research Institute Method and apparatus for MPEG-4 FGS performance enhancement
US7324616B2 (en) 2004-03-01 2008-01-29 Motorola, Inc. Low cost and high performance narrowband interference cancellation system
US7505636B2 (en) 2004-03-04 2009-03-17 Broadcom Corporation System and method for two-pass interpolation for quarter-pel motion compensation
KR100596705B1 (ko) 2004-03-04 2006-07-04 삼성전자주식회사 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템
US20050195896A1 (en) 2004-03-08 2005-09-08 National Chiao Tung University Architecture for stack robust fine granularity scalability
EP1578137A2 (en) 2004-03-17 2005-09-21 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus with multistep interpolation process
JP4965429B2 (ja) 2004-04-02 2012-07-04 トムソン ライセンシング 複雑度スケーラブルなビデオエンコーダの方法及び装置
EP1599046A1 (en) 2004-05-19 2005-11-23 THOMSON Licensing Method for coding video data of a sequence of pictures
US20050259729A1 (en) 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
CN100588257C (zh) 2004-06-23 2010-02-03 新加坡科技研究局 采用栅格运动估计和补偿的可扩展视频编码
KR100654436B1 (ko) 2004-07-07 2006-12-06 삼성전자주식회사 비디오 코딩 방법과 디코딩 방법, 및 비디오 인코더와디코더
US8340177B2 (en) 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
EP1617672A1 (en) 2004-07-13 2006-01-18 Matsushita Electric Industrial Co., Ltd. Motion estimator/compensator including a 16-bit 1/8 pel interpolation filter
US20060013305A1 (en) 2004-07-14 2006-01-19 Sharp Laboratories Of America, Inc. Temporal scalable coding using AVC coding tools
KR100621581B1 (ko) * 2004-07-15 2006-09-13 삼성전자주식회사 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
KR100679011B1 (ko) 2004-07-15 2007-02-05 삼성전자주식회사 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
KR100657268B1 (ko) 2004-07-15 2006-12-14 학교법인 대양학원 컬러 영상의 신축적 부호화, 복호화 방법 및 장치
US9071847B2 (en) 2004-10-06 2015-06-30 Microsoft Technology Licensing, Llc Variable coding resolution in video codec
US7839933B2 (en) 2004-10-06 2010-11-23 Microsoft Corporation Adaptive vertical macroblock alignment for mixed frame video sequences
US8243820B2 (en) 2004-10-06 2012-08-14 Microsoft Corporation Decoding variable coded resolution video with native range/resolution post-processing operation
JP2008516556A (ja) 2004-10-13 2008-05-15 トムソン ライセンシング コンプレクシティスケーラブル映像符号化復号化方法及び装置
DE102004059993B4 (de) 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium
KR20060043115A (ko) 2004-10-26 2006-05-15 엘지전자 주식회사 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치
KR100679025B1 (ko) 2004-11-12 2007-02-05 삼성전자주식회사 다 계층 기반의 인트라 예측 방법, 및 그 방법을 이용한비디오 코딩 방법 및 장치
US7783106B2 (en) 2004-11-12 2010-08-24 Fuji Xerox Co., Ltd. Video segmentation combining similarity analysis and classification
KR100703734B1 (ko) 2004-12-03 2007-04-05 삼성전자주식회사 Dct 업샘플링을 이용한 다 계층 비디오 인코딩/디코딩방법 및 장치
KR100679031B1 (ko) 2004-12-03 2007-02-05 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
KR100888963B1 (ko) 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR100888962B1 (ko) 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
US7616824B2 (en) 2004-12-08 2009-11-10 Ecole Polytechnique Fédérale de Lausanne (EPFL) CM - Ecublens Method for spatially scalable video coding
KR20070090245A (ko) 2004-12-13 2007-09-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 스케일러블 화상 인코딩
US7801220B2 (en) 2005-01-07 2010-09-21 Microsoft Corporation In-band wavelet video coding with spatial scalability
KR100714689B1 (ko) 2005-01-21 2007-05-04 삼성전자주식회사 다 계층 구조 기반의 스케일러블 비디오 코딩 및 디코딩방법, 이를 위한 장치
US20080152251A1 (en) 2005-01-31 2008-06-26 Koninklijke Philips Electronics, N.V. Pyramidal Decomposition for Multi-Resolution Image Filtering
US7995656B2 (en) 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
US8638862B2 (en) * 2005-03-18 2014-01-28 Sharp Laboratories Of America, Inc. Methods and systems for upsampling filter design
US8175168B2 (en) 2005-03-18 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for picture up-sampling
EP1862010A4 (en) * 2005-03-25 2011-08-17 Korea Electronics Telecomm HIERARCHICAL VIDEO ENCODING / DECODING METHOD FOR COMPLETE SCALE VARIABILITY AND APPARATUS THEREOF
US7876833B2 (en) 2005-04-11 2011-01-25 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive up-scaling for spatially scalable coding
US20070009050A1 (en) 2005-04-11 2007-01-11 Nokia Corporation Method and apparatus for update step in video coding based on motion compensated temporal filtering
KR100703778B1 (ko) 2005-04-29 2007-04-06 삼성전자주식회사 고속 fgs를 지원하는 비디오 코딩 방법 및 장치
US8619860B2 (en) 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
EP1727372A1 (en) 2005-05-27 2006-11-29 Thomson Licensing Method and apparatus for encoding and decoding video data,
US20070014349A1 (en) 2005-06-03 2007-01-18 Nokia Corporation Residual prediction mode in scalable video coding
US7830961B2 (en) 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
JP5008664B2 (ja) 2005-07-11 2012-08-22 トムソン ライセンシング マクロブロック適応型レイヤ間テクスチャ内予測の方法及び装置
US7216279B2 (en) * 2005-07-19 2007-05-08 Lsi Logic Corporation Testing with high speed pulse generator
US20080123947A1 (en) * 2005-07-22 2008-05-29 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, image decoding program, computer readable recording medium having image encoding program recorded therein
EP1746839A1 (en) 2005-07-22 2007-01-24 Thomson Licensing Method and apparatus for encoding video data
KR100746011B1 (ko) 2005-08-24 2007-08-06 삼성전자주식회사 잔차 예측의 성능 개선 방법, 상기 방법을 이용한 비디오인코더 및 비디오 디코더
WO2007044556A2 (en) 2005-10-07 2007-04-19 Innovation Management Sciences, L.L.C. Method and apparatus for scalable video decoder using an enhancement stream
EP1775958A1 (en) 2005-10-14 2007-04-18 Thomson Licensing Method and apparatus for reconstructing the texture of a spatial enhancement-layer video picture
KR100772868B1 (ko) 2005-11-29 2007-11-02 삼성전자주식회사 복수 계층을 기반으로 하는 스케일러블 비디오 코딩 방법및 장치
US8023569B2 (en) 2005-12-15 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for block-based residual upsampling
US8094721B2 (en) * 2005-12-29 2012-01-10 Cisco Technology, Inc. Methods and apparatuses for selecting a mode within a compression scheme
GB0600141D0 (en) 2006-01-05 2006-02-15 British Broadcasting Corp Scalable coding of video signals
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
TW200737993A (en) 2006-01-09 2007-10-01 Nokia Corp System and apparatus for low-complexity fine granularity scalable video coding with motion compensation
CN1794821A (zh) 2006-01-11 2006-06-28 浙江大学 可分级视频压缩中插值的方法与装置
KR100772873B1 (ko) 2006-01-12 2007-11-02 삼성전자주식회사 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
US8848789B2 (en) 2006-03-27 2014-09-30 Qualcomm Incorporated Method and system for coding and decoding information associated with video compression
KR100781524B1 (ko) 2006-04-04 2007-12-03 삼성전자주식회사 확장 매크로블록 스킵 모드를 이용한 인코딩/디코딩 방법및 장치
US20070274396A1 (en) 2006-05-26 2007-11-29 Ximin Zhang Complexity adaptive skip mode estimation for video encoding
WO2008004816A1 (en) 2006-07-04 2008-01-10 Electronics And Telecommunications Research Institute Scalable video encoding/decoding method and apparatus thereof
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
JP4647558B2 (ja) 2006-07-27 2011-03-09 日本電信電話株式会社 映像符号化並列処理方法,映像符号化装置,映像符号化プログラムおよびその記録媒体
WO2008049446A1 (en) 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
US7756350B2 (en) 2006-11-13 2010-07-13 Global Ip Solutions, Inc. Lossless encoding and decoding of digital data
US8311120B2 (en) 2006-12-22 2012-11-13 Qualcomm Incorporated Coding mode selection using information of other coding modes
US8199812B2 (en) 2007-01-09 2012-06-12 Qualcomm Incorporated Adaptive upsampling for scalable video coding
US8848787B2 (en) 2007-10-15 2014-09-30 Qualcomm Incorporated Enhancement layer coding for scalable video coding
US20090268818A1 (en) 2008-04-29 2009-10-29 International Business Machines Corporation Method and system for integrating noise filtering in predictive video coding
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620574B (zh) * 2012-09-14 2016-11-23 高通股份有限公司 用于数字图像的高效重新取样和调整大小的方法和装置
CN104620574A (zh) * 2012-09-14 2015-05-13 高通股份有限公司 用于数字图像的高效重新取样和调整大小的方法和装置
US11570455B2 (en) 2012-12-21 2023-01-31 Dolby Laboratories Licensing Corporation High precision up-sampling in scalable coding of high bit-depth video
US10516889B2 (en) 2012-12-21 2019-12-24 Dolby Laboratories Licensing Corporation High precision up-sampling in scalable coding of high bit-depth video
US10958922B2 (en) 2012-12-21 2021-03-23 Dolby Laboratories Licensing Corporation High precision up-sampling in scalable coding of high bit-depth video
US11284095B2 (en) 2012-12-21 2022-03-22 Dolby Laboratories Licensing Corporation High precision up-sampling in scalable coding of high bit-depth video
CN104871545A (zh) * 2012-12-21 2015-08-26 杜比实验室特许公司 高位深度视频的可扩展编码中的高精度上采样
US11792416B2 (en) 2012-12-21 2023-10-17 Dolby Laboratories Licensing Corporation High precision up-sampling in scalable coding of high bit-depth video
CN111713104A (zh) * 2018-02-14 2020-09-25 索尼公司 图像处理装置和方法
CN112840650A (zh) * 2018-10-19 2021-05-25 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法
CN112840650B (zh) * 2018-10-19 2024-04-30 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法
CN114025161A (zh) * 2020-10-20 2022-02-08 平头哥(上海)半导体技术有限公司 图像处理中的频率特定压缩与补偿技术
CN114025161B (zh) * 2020-10-20 2023-10-10 平头哥(上海)半导体技术有限公司 图像处理中的频率特定压缩与补偿技术

Also Published As

Publication number Publication date
HK1161016A1 (en) 2012-08-17
JP2009522935A (ja) 2009-06-11
JP5302010B2 (ja) 2013-10-02
US9319729B2 (en) 2016-04-19
IL192420A0 (en) 2009-08-03
IL192420A (en) 2012-03-29
US7956930B2 (en) 2011-06-07
CN101366281A (zh) 2009-02-11
US20130271651A1 (en) 2013-10-17
CN102176748B (zh) 2013-03-27
JP2012191655A (ja) 2012-10-04
JP5590574B2 (ja) 2014-09-17
US20140269912A1 (en) 2014-09-18
CA2635898A1 (en) 2007-07-19
AU2010219337A1 (en) 2010-09-30
KR20130041378A (ko) 2013-04-24
EP1985120A2 (en) 2008-10-29
CN101366281B (zh) 2011-06-22
IL218145A0 (en) 2012-03-29
RU2420915C2 (ru) 2011-06-10
AU2007205175A1 (en) 2007-07-19
CA2635898C (en) 2015-10-06
KR101354741B1 (ko) 2014-01-23
US20110211122A1 (en) 2011-09-01
WO2007081752A2 (en) 2007-07-19
US8493513B2 (en) 2013-07-23
EP1985120B1 (en) 2019-09-04
KR101344193B1 (ko) 2013-12-20
RU2456761C1 (ru) 2012-07-20
AU2007205175B2 (en) 2010-07-01
WO2007081752A3 (en) 2007-09-20
KR20080085156A (ko) 2008-09-23
EP1985120A4 (en) 2014-12-03
IL218145A (en) 2014-08-31
US20070160153A1 (en) 2007-07-12
AU2010219337B2 (en) 2011-06-30
RU2008127319A (ru) 2010-01-10
US8780272B2 (en) 2014-07-15

Similar Documents

Publication Publication Date Title
CN101366281B (zh) 用于多分辨率视频编码和解码的重新采样和调整图像大小操作的方法
CN1735208B (zh) 在运动补偿的时间滤波中的自适应更新
CN102084655B (zh) 通过过滤器选择进行的视频编码
JP4425561B2 (ja) イメージおよびビデオ符号化のための2−d変換
US7620109B2 (en) Sub-pixel interpolation in motion estimation and compensation
KR100703788B1 (ko) 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
US20030194010A1 (en) Chrominance motion vector rounding
US20030194011A1 (en) Rounding control for multi-stage interpolation
CN102804171B (zh) 用于媒体数据译码的16点变换
CN101263717A (zh) 任意分辨率改变尺寸缩小解码器
CN1751519A (zh) 视频编码
CN105474642A (zh) 使用频域差对图像集合进行重新编码
TW420955B (en) Image compression
MX2008008762A (en) Resampling and picture resizing operations for multi-resolution video coding and decoding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1161016

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1161016

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150428

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150428

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.