CN109413430B - 视频编解码方法及其装置 - Google Patents

视频编解码方法及其装置 Download PDF

Info

Publication number
CN109413430B
CN109413430B CN201810891041.2A CN201810891041A CN109413430B CN 109413430 B CN109413430 B CN 109413430B CN 201810891041 A CN201810891041 A CN 201810891041A CN 109413430 B CN109413430 B CN 109413430B
Authority
CN
China
Prior art keywords
channel
pixels
color channel
video
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810891041.2A
Other languages
English (en)
Other versions
CN109413430A (zh
Inventor
吴东兴
林亭安
周汉良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN109413430A publication Critical patent/CN109413430A/zh
Application granted granted Critical
Publication of CN109413430B publication Critical patent/CN109413430B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/88Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving rearrangement of data among different coding units, e.g. shuffling, interleaving, scrambling or permutation of pixel data or permutation of transform coefficient data among different blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Abstract

本发明提供了一种视频编解码方法及其装置,其配置多通道编解码设备用作单通道编解码设备。被重新配置为单通道编解码设备的多通道编解码设备执行第一颜色通道的像素的编码或解码,而用预设(例如,固定)值替代第二颜色通道的像素。重配置的编解码设备可以输出第一颜色通道的已重构像素但不输出第二颜色通道的已重构像素。本发明所提出的视频编解码方法及其装置,可配置多通道编解码设备用作单通道编解码设备,无需使用新的硬件或设备。

Description

视频编解码方法及其装置
技术领域
本发明涉及视频处理。具体而言,本发明涉及编解码一个或多个颜色通道的方法和裝置。
背景技术
除非此处另有说明外,本部分所描述的方法相对于下面列出的权利要求而言不是现有技术,并且通过本部分的引入不被承认是现有技术。
图像或视频的现代数字表示通常具有多个颜色通道,例如,YUV(其具有一个亮度颜色通道和量色度颜色通道)或者RGB(其具有三个颜色通道)。为了编码或解码具有多个颜色通道的图像或视频,所使用的编码或解码设备必须具备能处理多个颜色通道中的每个的编码或解码的相应的电路或程序。编码或解码设备也必须具有足够输出带宽以用于传输不同颜色通道的已重构像素。
发明内容
有鉴于此,本发明提出一种视频编解码方法及其装置。
依据本发明一实施方式,提供一种视频编码方法。该视频编码方法包括:接收用于配置视频编码器的单通道模式标志,其中所述视频编码器编码至少具有第一颜色通道和第二颜色通道的多通道图像;当所述单通道模式标志指示第一模式时,配置所述视频编码器接收第一像素集和第二像素集,以基于接收到的所述第一颜色通道的所述第一像素集和接收到的所述第二颜色通道的所述第二像素集编码所述多通道图像;以及当所述单通道模式标志指示第二模式时,配置所述视频编码器接收所述第一像素集,以基于接收到的所述第一颜色通道的所述第一像素集和所述第二颜色通道的预设值的集合编码所述多通道图像。
依据本发明另一实施方式,提供一种视频编码装置。该视频编码装置包括:视频编码器,用于编码至少具有第一颜色通道和第二颜色通道的多通道图像;选择电路,用于接收单通道模式标志;当所述单通道模式标志指示第一模式时,配置所述视频编码器接收第一像素集和第二像素集,以基于接收到的所述第一颜色通道的所述第一像素集和接收到的所述第二颜色通道的所述第二像素集编码所述多通道图像;以及当所述单通道模式标志指示第二模式时,配置所述视频编码器接收所述第一像素集,以基于接收到的所述第一颜色通道的所述第一像素集和所述第二颜色通道的预设值的集合编码所述多通道图像。
在一些实施例中,当视频编码器被配置成执行单颜色通道编码时,视频编码装置接收具有第一颜色通道的像素的图像。视频编码装置分配预设值的集合作为第二颜色通道的像素。视频编码装置编码包括第一颜色通道的像素和第二颜色通道的像素的多通道图像编码成比特流。在一些实施例中,单通道编码系统通过将第一颜色通道的像素编码成第一编码数据集并通过使用预设值的集合作为第二编码数据集,将多通道图像编码成比特流。
依据本发明另一实施方式,提供一种视频解码方法。该视频解码方法包括:接收包括至少具有第一颜色通道和第二颜色通道的已编码的多通道图像的比特流;基于所述比特流的内容,识别用于配置视频解码器的单通道模式标志,其中所述视频解码器用于解码所述多通道图像;当所述单通道模式标志指示第一模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素和所述第二颜色通道的多个像素,并输出所述第一颜色通道的多个已解码像素和所述第二颜色通道的多个已解码像素;以及当所述单通道模式标志指示第二模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素并输出所述第一颜色通道的多个已解码像素。
依据本发明另一实施方式,提供一种视频解码装置。该视频解码装置包括:视频解码器,用于解码包括至少具有第一颜色通道和第二颜色通道的已编码的多通道图像的比特流;选择电路,用于基于所述比特流的内容,识别用于配置视频解码器的单通道模式标志以用于解码所述多通道图像;当所述单通道模式标志指示第一模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素和所述第二颜色通道的多个像素,并输出所述第一颜色通道的多个已解码像素和所述第二颜色通道的多个已解码像素;当所述单通道模式标志指示第二模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素并输出所述第一颜色通道的多个已解码像素。本发明的一些实施例中,本发明提供的视频解码装置和方法不解码第二颜色通道的像素,且不输出第二颜色像素的已解码像素。
在一些实施例中,视频解码装置接收包括一个或多个已编码多通道图像的比特流。比特流具有第一颜色通道的第一编码数据集和第二颜色通道的第二编码数据集。视频解码装置丢弃第二编码数据集。视频解码装置处理第一编码数据集,以获得第一颜色通道的像素,并输出第一颜色通道的像素作为单通道图像。在一些实施例中,通过将预设值的集合分配为第二颜色通道的像素(而不是解码第二编码数据集),视频解码装置也生成第二颜色通道的像素。
本发明所提出的视频编解码方法及其装置,可配置多通道编解码设备用作单通道编解码设备,无需使用新的硬件或设备。
附图说明
下列附图用以提供本发明的进一步理解,并被纳入且构成本发明的一部分。这些附图说明了本发明的实施方式,并与说明书一起用以解释本发明的原理。为了清楚地说明本发明的概念,由于与实际实施方式中的尺寸相比,一些组件可以不按照比例被示出,这些附图无需按照比例绘制。
图1a-图1b示出了用于将单个颜色通道的像素编码成比特流的单通道编码系统。
图2示出了使用单通道模式标志以确定执行单通道编码还是多通道编码的单通道编码系统。
图3a-图3b示出了用于确定是否执行单通道编码的单通道模式标志。
图4a-图4d示出了在执行单通道编码时在视频编码器的不同阶段处用于编码u通道/v通道的信息的预设值。
图5概念性示出了将来自于图像的单通道或单通道图像的像素编码成具有已编码多通道图像的比特流的流程。
图6概念性示出了使用单通道模式标志来配置视频编码器执行第一通道的单通道编码或至少第一通道和第二通道的多通道编码的流程。
图7示出了视频编码器或视频编码装置。
图8示出了用于通过解码具有已编码多通道图像的比特流产生单颜色通道图像(或视频)的单通道解码系统。
图9概念性示出了执行单通道解码的流程。
图10概念性示出了用于基于嵌入到比特流中的标志执行单通道解码的单通道解码系统。
图11示出了用于基于特定数据模型执行单通道解码的单通道解码系统。
图12概念性示出了使用单通道模式标志来配置图像解码电路执行单通道解码或多通道解码的流程。
图13示出了实现单通道解码系统的视频解码器或视频解码装置。
图14概念性示出了实现本发明一些实施例的电子系统。
具体实施方式
在下面详细的说明书中,为了透彻理解相关教示内容,通过举例的方式进行说明大量具体的细节。基于本文所描述的教示内容的任何改变、推导和/或拓展均在本发明的保护范围内。在一些例子中,为了避免不必要地混淆本发明的教示内容的方面,在相对较高的级别而无细节上描述已知的方法、程序、元件和/或关于此处所公开的一个或者多个示例性实施方式的电路。
本发明的一些实施例提供一种配置多通道编解码设备用作单通道编解码设备的方法。被重新配置为单通道编解码设备的多通道编解码设备执行第一颜色通道的像素的编码或解码,而用预设(例如固定)值替代第二颜色通道的像素。重新配置的编解码设备可以输出第一颜色通道的已重构像素,但不输出第二颜色通道的已重构像素。
单通道编码器
本发明的一些实施例提供一种图像或视频编码系统,其可以被配置成执行单颜色通道编码。单通道编码系统是图像或视频编解码电子装置,其包括能编码至少具有第一颜色通道和第二颜色通道的多通道图像的图像或视频编码器。单通道编码系统也包括能接收单通道模式标志的选择电路。当单通道模式标志指示第一模式时,选择电路配置视频编码器以接收第一像素集和第二像素集,并基于所接收到的第一颜色通道的第一像素集和接收到的第二颜色通道的第二像素集编码多通道图像。当单通道模式标志指示第二模式时,选择电路配置视频编码器以接收第一像素集,并基于所接收到的第一颜色通道的第一像素集和第二颜色通道的预设值的集合编码多通道图像。
在一些实施例中,当视频编码器被配置成执行单颜色通道编码时,单通道编码系统接收具有第一颜色通道的像素的图像。单通道编码系统分配预设值的集合作为第二颜色通道的像素。单通道编码系统将包括第一颜色通道的第一像素集和第二颜色通道的第二像素集的多通道图像编码成比特流。在一些实施例中,通过将第一颜色通道的像素编码成第一编码数据集,并通过使用预设值的集合作为第二编码数据集,单通道编码系统将多通道图像编码成比特流。
图1a-图1b示出了用于将单个颜色通道的像素编码成比特流的单通道编码系统。单通道编码系统100自视频源705接收单颜色通道(y通道)的像素。单通道编码系统100也接收预设值120作为一个或多个其他颜色通道(u通道和v通道)的像素。随后,单通道编码系统100执行视频编码技术(包括压缩)以产生比特流795(即,已编码YUV图像180),其包括具有多个颜色通道的已编码图像。y颜色通道、u颜色通道和v颜色通道的像素可以根据诸如4:4:4、4:2:2或4:2:0的格式被存储在比特流中。编码操作也可以重构来自于已压缩图像的像素。单通道编码系统100可以优选地将已重构y通道像素输出到外部目的地(例如,外部存储器170或显示设备)。
视频源705将一个单颜色通道的一阵列或一系列的像素提供给单通道编码系统100。视频源705可以是提供图像序列作为视频序列的图像或帧的视频源。视频源705也可以是提供单个静态图像的图像源。由视频源705提供的一个或多个图像可以是在一个颜色通道中具有像素且在其他通道中没有像素的单颜色通道图像。例如,视频源705可以提供具有y通道像素但不具有u通道像素或v通道像素的图像。由视频源705提供的一个或多个图像也可以包括多颜色通道图像,例如在y通道、u通道和v通道中具有像素的图像。然而,单通道编码系统100仅自视频源705接收并编码一个颜色通道,并不接收并编码其他颜色通道。预设值120提供视频源705中的图像信息的单独定义的值或数据。预设值120可以提供不变化的单个固定值。预设值120也可以提供固定的值序列,例如,来自于预设且预定义的图像(例如,白噪声)的像素值。预设值也可以是随机生成的值。
预设值120可以由位于单通道编码系统100外部的电路或存储提供。图1a概念性示出了由位于单通道编码系统100的外部来源(source)提供预设值的示例单通道编码系统100。
预设值120也可以由单通道编码系统100自身内部提供。换句话说,预设值可以不是自位于单通道编码系统100的外部来源(外部存储器、外部存储等)接收的。例如,预设值120可以由单通道编码系统100的硬连线逻辑或编程定义。图1b概念性示出了预设值由单通道编码系统100自身内部提供的示例单通道编码系统100。单通道编码系统100包括图像或视频编码器700。视频编码器700是图像编码或视频编码电路,其执行将像素值转换成比特流中的已编码已压缩图像的图像和/或视频编码操作。由视频编码器700所产生的比特流可以符合任何图像编解码或视频编解码标准,例如JPEG、MPEG、HEVC、VP9等。
视频编码器700提供被配置成执行图像/视频编码操作的不同阶段的几个模块,诸如变换模块710、量化模块711、熵编码模块790以及不同预测模块(例如,帧内预测720和运动补偿730)的模块。在一些实施例中,每个颜色通道具有其自身的变换模块和量化器模块的集合(例如,单独的硬件电路或单独的软件模块)。在一些实施例中,不同颜色通道重复使用相同的变换模块和量化器模块。下面图7提供视频编码器700内不同模块的详细描述。
在一些实施例中,单通道编码系统100使用单通道模式标志以确定执行单通道编码还是多通道编码。当单通道模式标志指示单通道模式时,单通道编码系统100仅编码y通道的像素,但不编码u通道和v通道的像素。当单通道模式标志指示多通道模式时,单通道编码系统100像传统编码器一样,并编码所有颜色通道(y、u和v)。
图2示出了使用单通道模式标志以确定执行单通道编码还是多通道编码的单通道编码系统100。单通道编码系统100可以自另一程序接收单通道模式标志,或自另一电路或设备接收离散控制信号。视频编码器700产生具有已压缩/已编码图像的比特流795。视频编码器700也可选地产生具有不同颜色通道的已重构像素。单通道编码系统100具有像素传输150,以用于输出不同通道的已重构像素(例如,到显示或外部存储170)。在一些实施例中,像素传输150在正输出的像素值中识别冗余(例如,重复),并执行压缩以移除一些冗余。在一些实施例中,像素传输150不传输u通道和v通道的任何像素值。在一些实施例中,外部存储170用u通道像素和v通道像素进行初始化,并且像素传输150不传输u通道和v通道的任何像素值。
如图所示,单通道编码系统100接收单通道模式标志210(“仅y”)。单通道模式标志确定视频编码器700的编码阶段自视频源705的所有通道(y通道、u通道和v通道)接收并编码像素,或者仅自一个通道(仅y通道)接收并编码像素。
当单通道模式标志没被断言时,单通道编码系统100像传统编码器一起,并且视频编码器700编码来自于视频源705的所有颜色通道(y、u和v)。当单通道模式标志被断言时,视频编码器700仅编码来自于视频源705的y通道像素,并使用预设值120生成u通道和v通道的信息。预设值可以被用作像素值,或作为中间编码数据,以用于视频编码器700内的阶段。
单通道模式标志也用于确定单通道编码系统100将如何输出已重构像素。作为编码操作的一部分,视频编码器700产生图像的已重构像素。当单通道模式标志(“仅y”)没被断言时(多通道模式),单通道编码系统100输出所有颜色通道的已重构像素。当单通道模式标志被断言时(单通道模式),单通道编码系统100仅输出y通道的已重构像素,但不输出u通道和v通道的已重构像素。在一些实施例中,单通道编码系统100不通过像素传输150输出u通道和v通道的任何像素。在一些实施例中,单通道编码系统100通过像素传输150输出u通道和v通道的预设值220。(选择电路包括多路复用器315,其在视频编码器700的输出和预设值之间进行选择)。通过像素传输150发送的预设值是易压缩的,使得u通道像素和v通道像素将在像素传输150处使用最小带宽。
当用于执行单通道编码时,单通道编码系统100可以直接使用作为其他颜色通道的像素值。在一些实施例中,单通道编码系统100使用预设值替代视频编码器700中的编码阶段之一(例如,变换模块710、量化器711或熵编码器790)的输出,或者作为注入到编码阶段之一的输入。换言之,预设值可以用作残差像素数据(例如,变换模块710、变换系数(例如,量化器711的输入)、已量化数据(例如,熵编码器790的输入)、比特流数据(例如,熵编码器790的输出)或由编码阶段之一产生的其他类型的编码数据)。
图3a-图3b示出了用于确定是否执行单通道编码的单通道模式标志。图3a示出了用于在单通道模式标志被断言时使用预设值作为u通道/v通道的像素数据的单通道编码系统100。包括多路复用器310的选择电路使用单通道模式标志以在来自于视频源705的像素与作为u通道/v通道的像素数据的预设值120之间进行选择,作为视频编码器700的输入。
图3b示出了用于在单通道模式标志被断言时使用预设值作为u通道/v通道的编码信息(或者中间编码数据)的单通道编码系统100。包括多路复用器310的选择电路使用单通道模式标志以在视频编码器700的编码阶段的输出与作为编码信息的预设值120之间进行选择,以用于产生比特流795。
不同实施例的单通道编码系统100在执行单通道编码时,使用预设值作为视频编码器的不同阶段处的u通道/v通道的编码信息。
图4a示出了用于使用预设值作为视频编码器700中的变换模块710的输入的单通道编码系统100。如图所示,由用于y通道、u通道和v通道的提取器708计算的残差像素值(例如,来自于视频源110的像素值与运动补偿预测像素值之间的差)被提供为变换模块710的输入。然而,在多路复用器310接收仅y标志时,u通道和v通道的残差像素值由预设值120替代。
图4b示出了用于使用预设值作为视频编码器700中的量化器模块711的输入的单通道编码系统100。如图所示,由用于y通道、u通道和v通道的变换模块710计算的变换系数(例如,残差像素数据的离散余弦变换(discrete cosine transform,DCT))被提供为量化器模块711的输入。然而,在多路复用器310接收仅y标志时,u通道和v通道的变换系数由预设值120替代。
图4c示出了用于使用预设值作为视频编码器700中的熵编码器790的输入的单通道编码系统100。如图所示,由用于y通道、u通道和v通道的量化器模块711计算的已量化数据(例如,已量化版本的变换系数)被提供为熵编码器790的输入。然而,在多路复用器310接收仅y标志时,u通道和v通道的已量化数据由预设值120替代。
图4d示出了用于使用预设值作为视频编码器700中的熵编码器790的熵编码数据的单通道编码系统100。如图所示,由用于y通道、u通道和v通道的熵编码器模块790计算的熵编码数据(例如,根据上下文自适应二进制算术编解码所计算且编解码的可变长度)将被存储为比特流795的一部分。然而,在多路复用器310接收仅y标志时,u通道和v通道的熵编码数据由预设值120替代。
图5概念性示出了将单颜色通道的像素编码成具有已编码多通道图像的比特流的流程501和流程502。在一些实施例中,单通道编码系统100在其用于执行单通道编码时执行流程501或流程502。在一些实施例中,实现单通道编码系统100的计算设备的一个或多个处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令执行流程600。
流程501是单通道编码流程,其使用预设值作为其他通道的像素值。本流程始于单通道编码系统100接收第一颜色通道(例如,y通道)的像素(在步骤510中)。这些像素可以是来自于单通道图像(例如,仅具有亮度值的图像)。这些像素也可以是来自于包括第一颜色通道中的像素的多通道图像。这些像素也可以来自于诸如视频源705的视频源。
单通道编码系统100将预设值的集合分配给第二颜色通道(例如,u通道和/或v通道)的像素。预设值是独立于步骤510的视频源,并可以由单通道编码系统自身内部提供。第二颜色通道的像素因此可以被分配相同的预设值。第二颜色通道的像素也可以根据预设序列或预定义图像被分配。
在步骤530中,单通道编码系统100将包括第一颜色通道的像素和第二颜色通道的像素的多通道图像编码成比特流(第二颜色通道的像素被分配预设值)。编码流程可以符合已知的图像或视频编解码标准,并可以包括可操作阶段,例如,变换、量化、预测和熵编码。随后,流程501结束。
流程502是单通道编码流程,其使用预设值作为编码流程中的中间编码数据(或编码信息)。本流程始于单通道编码系统接收第一颜色通道(例如,y通道)的像素(在步骤510中)。这些像素可以是来自于单通道图像(例如,仅具有亮度值的图像)。这些像素也可以是来自于包括第一颜色通道中的像素的多通道图像。这些像素也可以来自于诸如视频源705的视频源。
在步骤540中,单通道编码系统将接收到的第一通道的像素编码成第一编码数据集,以用于表示第一颜色通道的像素。此第一编码数据集可以包括y通道的变换系数、y通道的已量化数据或y通道的熵编码数据,或者在编码流程期间自y通道编码的其他数据。
在步骤550中,单通道编码系统生成或接收预设值的集合作为第二编码数据集,以用于表示第二颜色通道的像素。预设值的集合独立于在步骤510中接收到的像素的源,并可以由没有外部源的单通道编码系统的电路内部生成。预设值的集合可以用作u通道/v通道的变换系数(如图4b所示)、u通道/v通道的已量化数据(如图4c所示)或者由编码流程使用的u通道/v通道的其他中间形式的编码数据。
在步骤560中,单通道编码系统基于第一编码数据集和第二编码数据集,将多通道图像编码成比特流。随后,流程502结束。
图6概念性示出了使用单通道模式标志来配置单通道编码系统100的视频编码器700执行第一通道的单通道编码或至少第一通道和第二通道的多通道编码的流程600。在一些实施例中,单通道编码系统100配置视频编码器700,通过控制选择电路的集合(包括多路复用器310和多路复用器315)。
在一些实施例中,实现单通道编码系统100的计算设备的一个或处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令,执行流程600。在一些实施例中,实现单通道编码系统100的电子装置执行流程600。
流程600始于单通道编码系统100接收单通道模式标志(在步骤610中)。随后,单通道编码系统100确定执行单通道编码(仅y通道)还是多通道编码(y通道、u通道、v通道)(在步骤620中)。单通道编码系统100可以通过检测单通道模式标志(例如,仅y标志)而做出决定。如果单通道模式标志被断言以指示单通道编码,则本流程继续到步骤650。如果单通道模式标志没有被断言,则本流程继续到步骤630。
在步骤630中,单通道编码系统100配置视频编码器700以接收第一像素集和第二像素集。在步骤635中,单通道编码系统100也配置视频编码器以基于接收到的第一颜色通道的第一像素集和第二颜色通道的第二像素集来编码多通道图像。
在步骤640中,单通道编码系统配置视频编码器700以输出第一颜色通道和第二颜色通道的已重构像素。已重构像素是基于由单通道编码系统100的视频编码器700所产生的编码信息产生的。随后,流程600结束。
在步骤650中,单通道编码系统100配置视频编码器700以接收第一颜色通道的第一像素集。在一些实施例中,在单通道编码模式被选择时,视频编码器不接收第二通道的第二像素集。
在步骤655中,单通道编码系统配置视频编码器700以基于接收到的第一颜色通道的第一像素集和第二颜色通道的预设值的集合编码多通道图像。
在步骤660中,单通道编码系统也配置视频编码器700以输出第一颜色通道的已重构像素。单通道编码系统不输出由视频编码器700重构的第二通道的像素。在一些实施例中,单通道编码系统100输出第二通道的预设值。在一些实施例中,单通道编码系统不输出第二颜色通道的任何像素。随后,流程600结束。在一些实施例中,在单通道编码系统100根据步骤655和步骤660配置视频编码器时,该视频编码器执行图5的流程500。
图7示出了实现单通道编码系统100的视频编码器700或视频编码装置。
如图所示,该视频编码器700自视频源705接收输入视频信号,并将该信号编码成比特流795。该视频编码器700具有几个元件或者模块,以用于编码该视频信号,包括变换模块710、量化模块711、逆量化模块714、逆变换模块715、帧内图像估计模块720、帧内图像预测模块725、运动补偿模块730、运动估计模块735、环路滤波器745、已重构图像缓存器750、运动矢量(motion vector,MV)缓存器765和运动矢量预测模块775,以及熵编码器790。
在一些实施例中,模块710到模块790是由该计算设备或电子装置的一个或者多个处理单元(例如处理器)正在执行的软件指令的模块。在一些实施例中,模块710到模块790是由电子装置的一个或者多个集成电路(integrated circuit,IC)实现的硬件电路的模块。尽管模块710到模块790被示为单独的模块,但是这些模块中的一些可以结合成一个独立的模块。
视频源705提供原始视频信号,其表示没有压缩的每视频帧的像素数据。提取器708计算视频源705的原始视频像素数据与来自于运动补偿730或帧内图像预测的预测像素数据713之间的差。变换710将该差值(或残差像素数据)转换成变换系数(例如,通过执行离散余弦变换)。量化器711将变换系数量化成已量化数据(或已量化变换系数)712,其由熵编码器790编码成比特流程795。
逆量化模块714去量化已量化数据(或已量化变换系数)712,以获得变换系数,并且该逆变换模块715对该变换系数712执行逆变换,以产生已重构像素数据(在添加预测像素数据713之后)。在一些实施例中,已重构像素数据被临时存储在线缓存器(line buffer)中(未示出),以用于帧内图像预测和空间运动矢量预测。已重构像素由环路滤波器745进行滤波,并被存储在已重构图像缓存器750中。在一些实施例中,已重构图像缓存器750是位于视频编码器700外部的存储(例如,通过像素传输接收已重构y通道像素的外部存储170)。在一些实施例中,已重构图像缓存器750是位于视频编码器700内部的存储。
帧内图像估计模块720基于已重构像素数据执行帧内预测,以产生帧内预测数据。该帧内预测数据被提供给该熵编码器790,以将其编码成比特流795。该帧内预测数据也由该帧内图像预测模块725来使用,以产生预测像素数据713。
运动估计模块735通过产生存储在该已重构图像缓存器750中的先前解码帧的参考像素数据的运动矢量,以执行帧间预测。这些运动矢量被提供给运动补偿模块730,以产生预测像素数据。这些运动矢量对在单通道解码系统处重构视频帧而言也是必要的。不是编码比特流中整个实际运动矢量,视频编码器700使用时间运动矢量预测来产生已预测运动矢量,以及用于运动补偿的该运动矢量与已预测运动矢量之间的差被编码为残差运动数据,并被存储在比特流795中,以用于单通道解码系统。
基于被生成用于编码先前视频帧的参考运动矢量,即用于执行运动补偿的运动补偿运动矢量,视频编码器700生成已预测运动矢量。视频编码器700从运动矢量缓存器765中检索来自于先前视频帧的参考运动矢量。视频编码器700将被生成用于当前视频帧的这些运动矢量存储到运动矢量缓存器765中,以作为用于生成已预测运动矢量的参考运动矢量。
运动矢量预测模块775使用参考运动矢量来创建已预测运动矢量。已预测运动矢量可以由空间运动矢量预测或者时间运动矢量预测来计算。已预测运动矢量和当前帧的该运动补偿运动矢量(motion compensation MV,MC MV)之间的差(残差运动数据)由熵编码器790编码成比特流795。
通过使用熵编码技术,例如,内容适应二进制算术编码(context-adaptivebinary arithmetic coding,CABAC)或者赫夫曼编码(Huffman encoding),熵编码器790将各种参数和数据编码成比特流795。熵编码器790将参数编码成比特流,例如,已量化变换数据和残差运动数据。
环路滤波器745对已重构像素执行滤波或者平滑操作,以减少编解码的伪影,特别是位于像素块的边界的伪影。在一些实施例中,所执行的滤波操作包括样本适应偏移(sample adaptive offset,SAO)。在一些实施例中,滤波操作包括适应环路滤波器(adaptive loop filter,ALF)。
单通道解码器
本发明的一些实施例提供一种图像或视频解码系统,其可以被配置成执行单颜色通道解码。单通道解码系统是图像或视频编解码电子装置,其包括能解码具有已编码多通道图像的比特流的视频解码器,其中已编码多通道图像至少具有第一颜色通道和第二颜色通道。单通道解码系统也包括能基于比特流的内容识别单通道模式标志的选择电路。
当单通道模式标志指示第一模式时,选择电路配置解码编码器以解码多通道图像以生成第一颜色通道和第二颜色通道的像素,并输出第一颜色通道和第二颜色通道的已解码像素。当单通道模式标志指示第二模式时,选择电路配置视频解码器以解码多通道图像,以生成第一通道的像素,并输出第一颜色通道的已解码像素。在第二模式中,单通道解码系统不解码第二颜色通道的像素,并不输出第二颜色通道的已解码像素。
在一些实施例中,单通道解码系统接收包括一个或多个已编码多通道图像的比特流。比特流具有第一颜色通道的第一编码数据集和第二颜色通道的第二编码数据集。单通道解码系统丢弃第二编码数据集。单通道解码系统处理第一编码数据集,以获得第一颜色通道的像素并输出第一颜色通道的像素作为单通道图像。在一些实施例中,通过分配预设值的集合作为第二颜色通道的像素,单通道解码系统也生成第二颜色通道的像素(而不是解码第二编码数据集)。
图8示出了用于通过解码具有已编码多通道图像的比特流产生单颜色通道图像(或视频)的单通道解码系统。如图所示,单通道解码系统800接收比特流1395,使用视频解码器1300执行图像/视频解码技术(包括去压缩),以产生第一颜色通道(例如,y通道)中的像素。单通道解码系统也产生第二颜色通道(例如,u通道和/或v通道)的像素。第二颜色通道的像素不是自比特流1395推导出的,而是由预设值820的集合提供的。
比特流1395包括已压缩或已编码图像或图像的已压缩/已编码序列,其作为符合图像编解码或视频编解码标准的格式的视频,例如JPEG、MPEG、HEVC、VP9等。被编码在比特流中的图像可以包括多个颜色通道中的像素的编码数据,例如,y通道、u通道和v通道。不同颜色通道的像素可以是以诸如4:4:4、4:2:2或4:2:0的颜色格式的。
预设值820可以由位于单通道解码系统800外部的电路或存储提供。预设值820也可以由单通道解码系统800自身内部提供。预设值820也可以由视频解码器1300的内部逻辑提供。换言之,预设值不是自位于单通道解码系统800外部的源(外部存储器、外部存储等)接收的。例如,预设值820可以由单通道解码系统800的电路定义,作为其硬连线逻辑的一部分,或其编程的一部分。
基于比特流1395的内容,其可以符合任何图像编解码或视频编解码标准,例如JPEG、MPEG、HEVC、VP9等,视频解码器1300是执行图像和/或视频解码操作的图像解码或视频解码电路。视频解码器1300包括被配置成执行图像/视频解码操作的不同阶段的几个模块,诸如逆变换模块1315、逆量化模块1305、比特流解析器1390(或熵解码器)的模块以及不同预测模块(例如,帧内预测1325和运动补偿1335)的模块。图13提供视频解码器1300内不同模块的详细描述。
图8显示了用于单通道解码器的单通道解码系统800。视频解码器1300自比特流识别y通道、u通道和v通道的语法元素,并随后仅处理y通道的语法元素。u通道和v通道的语法元素被丢弃,并不由视频解码器1300进一步处理。因此,视频解码器1300解码比特流1395,以产生y通道像素但不产生u通道像素和v通道像素。已解码y通道像素通过像素传输850输出到外部目的地(例如,外部存储器870或显示设备)。单通道解码系统也可以使用预设值820产生u通道和/或v通道的像素,以也通过像素传输850输出。在一些实施例中,像素传输850在正输出的像素值中识别冗余(例如,重复),并执行压缩以移除一些冗余。在一些实施例中,外部目的地用u通道像素和v通道像素进行初始化,并且像素传输850不传输u通道和v通道的任何像素值。
图9概念性示出了执行单通道解码的流程900。在一些实施例中,实现单通道解码系统800的计算设备的一个或处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令,执行流程900。在一些实施例中,实现单通道解码系统800的电子装置执行流程900。
在步骤910中,流程900始于单通道解码系统800接收比特流。比特流具有一个或多个已编码多通道图像,其是用第一颜色通道的第一编码数据集和第二颜色通道的第二编码数据集编码的。
在步骤920中,单通道解码系统识别并丢弃第二编码数据集,使得其将不由单通道解码系统进行处理(第二编码数据集的处理被跳过)。在步骤930中,单通道解码系统处理第一编码数据集,以获得第一颜色通道的像素。在步骤940中,单通道解码系统也输出第一颜色通道的像素(例如,到外部存储器)。由于第二编码数据集被丢弃且不由单通道解码系统处理,单通道解码系统不输出自比特流推导的像素。在一些实施例中,在步骤950中,单通道解码系统800输出第二通道的预设值。在一些实施例中,单通道解码系统不输出第二通道的任何像素,但填充外部存储器870,其存储具有第二通道的固定值的已解码像素。随后,流程900结束。
单通道解码系统800可以基于单通道模式标志被配置成用作单通道解码器或多通道解码器。在一些实施例中,比特流1395包括单通道模式标志。这种标志可以是比特流的头(切片头、图像头、序列头等)中的语法元素。在一些实施例中,不是依赖于比特流中的标志,单通道解码系统800而是通过检测编码成比特流的像素块中的特定数据模型,例如,具有相同特定像素值的像素块,确定是否执行单通道解码。
图10概念性示出了用于基于嵌入到比特流中的标志执行单通道解码的单通道解码系统800。如图所示,比特流1395包括单通道模式标志(“仅y”),作为语法元素(例如,作为切片、图像或图像头中的码元)。当解析比特流时,视频解码器1300检测“仅y”标志。当“仅y”标志不存在时,单通道解码系统800用作多通道解码器,并产生所有颜色通道(y、u和v)的已解码像素。当“仅y”标志存在时,单通道解码系统800用作单通道解码器。具体地,“仅y”标志的存在使得视频解码器1300(例如,在比特流解析器1390(或熵解码器)处)识别并丢弃u通道和v通道的语法元素。
“仅y”标志的存在也使得单通道解码系统800通过像素传输850仅输出已解码y通道像素,并丢弃u通道和v通道的像素。在一些实施例中,“仅y”标志的存在使得单通道解码系统通过像素传输输出预设值820。如图所示,包括多路复用器1010、多路复用器1020的选择电路基于“仅y”标志在预设值820与视频解码器1300的解码阶段的输出之间进行选择。(视频解码器1300的解码阶段可以包括比特流解析器1390(或熵解码器)、逆量化器1305、逆变换1315、帧内图像预测1325和/或运动补偿1335。解码阶段的输出可以是来自于运动补偿1335和逆变换1315的输出之和。)视频解码器1300可以提供多路复用器1010、多路复用器1020作为其内部逻辑电路的一部分。单通道解码系统800也可以提供多路复用器1010、多路复用器1020作为位于视频解码器1300外部的逻辑电路。
预设值容易被像素传输850压缩,使得u通道像素和v通道像素在像素传输150处仅使用最小带宽。在一些实施例中,外部存储870是用u通道像素和v通道像素的固定值进行初始化的,并且像素传输850不传输u通道和v通道的任何像素值。
图11示出了用于通过检测特定数据模型执行单通道解码的单通道解码系统800。如图所示,比特流1395包括一个或多个已编码图像,其像素可以呈现特定可检测模型1105。该模型可以在由视频解码器1300中的解码阶段之一处理之后是可检测的。单通道解码系统800被配置有检测器1110,以检测特定模型。该模型可以是具有相同固定特定值或者对检测器1110已知的一些其他类型的预定义模型。该模型是视频解码器1300的不同解码阶段处的已解码数据的可检测中间形式。例如,该模型可以是可检测的,作为比特流解析器1390(或熵解码器)之后的已量化数据的特定集合;或者作为逆变换1315之后的像素值的特定集合。视频解码器1300可以提供检测器1110(也称为模型检测器),作为其内部逻辑电路。单通道解码系统800也可以提供检测器1110,作为位于视频解码器1300外部的逻辑电路。如果特定模型被检测到,则“仅y”标志可以被生成。
“仅y”标志的存在也使得单通道解码系统800通过像素传输850仅输出已解码y通道像素,并丢弃u通道和v通道的像素。在一些实施例中,“仅y”标志的存在使得单通道解码系统通过像素传输输出预设值820。如图所示,包括多路复用器1010、多路复用器1020的选择电路基于“仅y”标志在预设值820与视频解码器1300的解码阶段的输出之间进行选择。
图12概念性示出了使用单通道模式标志来配置视频解码器1300执行第一通道(y通道)的单通道解码或至少第一通道和第二通道(u通道/v通道)的多通道解码的流程1200。在一些实施例中,实现单通道解码系统800的计算设备的一个或处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令,执行流程1200。在一些实施例中,实现单通道解码系统800的电子装置执行流程1200。
在步骤1210中,单通道解码系统800接收包括具有第一颜色通道和第二颜色通道的多通道图像的比特流。单通道解码系统800确定执行单通道解码还是多通道解码。在一些实施例中,通过解析比特流得到对应于单通道模式标志的语法元素(结合上面图10所描述),单通道解码系统做出该决策。在一些实施例中,通过在比特流中检测特定数据模型或中间形式的已解码数据(结合上面图11所描述),单通道解码系统做出该决策。如果单通道模式被选择,则本流程继续到步骤1250。否则,本流程继续到步骤1230。
在步骤1230,单通道解码系统800配置视频解码器1300解码多通道图像以生成第一颜色通道和第二颜色通道的像素。在步骤1240中,单通道解码系统800也配置视频解码器输出第一颜色通道和第二颜色通道的已解码像素。
在步骤1250中,单通道解码系统800配置视频解码器1300解码多通道图像以生成第一颜色通道的像素。第二颜色通道的像素不被解码。在一些实施例中,视频解码器识别对应于第二颜色通道的比特流语法元素(例如,u通道/v通道的已量化变换样本),并丢弃所识别的第二颜色通道语法元素。
在步骤1260中,单通道解码系统800也配置视频解码器1300输出第一颜色通道的已解码像素。单通道解码系统不输出由视频解码器所解码的第二通道的像素。在一些实施例中,单通道解码系统800输出预设值作为第二颜色通道的像素。在一些实施例中,单通道解码系统不输出第二颜色通道的任何像素。随后,流程1200结束。在一些实施例中,单通道解码系统800在其根据步骤1250和步骤1260配置视频解码器1300时执行图9的流程900。
图13示出了实现单通道解码系统800的视频解码器1300或视频解码装置。如图所示,视频解码器1300是图像解码或视频解码电路,其接收比特流1395,并将比特流解码成视频帧的像素数据,以用于显示。视频解码器1300具有几个元件或者模块,以用于解码比特流1395,包括逆量化模块1305、逆变换模块1315、帧内图像预测模块1325、运动补偿模块1335、环路滤波器1345、已解码图像缓存器1350、运动矢量缓存器1365、运动矢量预测模块1375和比特流解析器1390(或熵解码器)。
在一些实施例中,上述模块是由计算设备的一个或者多个处理单元(例如处理器)正在执行的软件指令的模块。在一些实施例中,上述模块是由电子装置的一个或者多个集成电路实现的硬件电路的模块。尽管上述模块被示为单独的模块,但是这些模块中的一些可以结合成一个独立的模块。
比特流解析器1390(或熵解码器)接收比特流1395,并根据由视频编解码或图像编解码标准所定义的语法执行原始解析。解析的语法元素包括不同头元素,标志以及已量化数据(或已量化变换系数)1312。通过使用诸如上下文自适应二进制算术编解码或霍夫曼编码的熵编解码技术,比特流解析器1390(或熵解码器)解析出不同语法元素。
逆量化模块1305去量化已量化数据(或已量化变换系数)1312,以获得变换系数,并且逆变换模块1315对变换系数1316执行逆变换,以产生已解码像素数据(在添加来自于帧内预测模块1325或者运动补偿模块1335的预测像素数据1313之后)。已解码像素数据由环路滤波器1345进行滤波,并被存储在已解码图像缓存器1350中。在一些实施例中,已解码图像缓存器1350是位于视频解码器130外部的存储(例如,通过像素传输850接收已解码y通道像素的外部存储870)。在一些实施例中,已解码图像缓存器1350是位于视频解码器1300内部的存储。
帧内图像预测模块1325接收来自于比特流1395的帧内预测数据,并根据此自存储在已解码图像缓存器1350中的已解码像素数据产生预测像素数据1313。在一些实施例中,已解码像素数据也被存储在线缓存器中(未示出),以用于帧内图像预测和空间运动矢量预测。
在一些实施例中,已解码图像缓存器1350的内容用于显示。显示设备1355检索已解码图像缓存器1350的内容,以直接用于显示,或者检索已解码图像缓存器的内容到显示缓存器。在一些实施例中,显示设备通过像素传输自已解码图像缓存器接收像素值。
运动补偿模块1335根据运动补偿运动矢量自存储在已解码图像缓存器1350中的已解码像素数据产生预测像素数据1313。通过添加自比特流1395接收的残差运动数据以及自运动矢量预测模块1375接收的已预测运动矢量,这些运动补偿运动矢量被解码。
基于被生成用于解码先前视频帧的参考运动矢量,例如,用于执行运动补偿的运动补偿运动矢量,视频解码器1300生成已预测运动矢量。视频解码器1300自运动矢量缓存器1365检索先前视频帧的参考运动矢量。视频解码器1300也将被生成用于解码当前视频帧的运动补偿运动矢量存储到运动矢量缓存器1365中,作为参考运动矢量,以用于产生已预测运动矢量。
环路滤波器1345对已解码像素数据执行滤波或者平滑操作,以减少编解码的伪影,特别是位于像素块的边界的伪影。在一些实施例中,所执行的滤波操作包括样本适应偏移。在一些实施例中,滤波操作包括适应环路滤波器。
电子系统示例
很多上述的特征和应用可以被实现为软件处理,其被指定为记录在计算机可读存储介质(computer readable storage medium)(也被称为计算机可读介质)上的指令集。当这些指令由一个或者多个计算单元或者处理单元(例如,一个或者多个处理器、处理器核或者其他处理单元)来执行时,则这些指令使得该处理单元执行这些指令所表示的动作。计算机可读介质的示例包括但不限于CD-ROM、闪存驱动器(flash drive)、随机存取存储器(random access memory,RAM)芯片、硬盘、可擦写可编程只读存储器(erasableprogrammable read only memory,EPROM),电可擦除可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)等。该计算机可读介质不包括通过无线或有线连接的载波和电信号。
在本说明书中,术语“软件”意味着包括只读存储器中的固件或者存储在磁存储设备中的应用程序,该应用程序可以被读入到存储器中以用于处理器进行处理。同时,在一些实施例中,多个软件发明可以作为更大程序的子部分来实现,而保留不同的软件发明。在一些实施例中,多个软件发明可以作为独立的程序来实现。最后,一起实现此处所描述的软件发明的独立的程序的任何结合是在本发明的范围内。在一些实施例中,当被安装以在一个或者多个电子系统上进行操作时,软件程序定义了一个或者多个特定的机器实现方式,该机器实现方式执行和实施该软件程序的操作。
图14概念性示出了实现本发明一些实施例的电子系统1400。电子系统1400可以是计算机(例如,台式电脑、个人电脑、平板电脑等)、电话、PDA或者其他种类的电子设备。这个电子系统包括各种类型的计算机可读媒质和用于各种其他类型的计算机可读媒质的接口。电子系统1400包括总线1405、处理单元1410、图像处理单元(graphics-processing unit,GPU)1415、系统存储器1420、网络1425、只读存储器(read-only memory,ROM)1430、永久存储设备1435、输入设备1440和输出设备1445。
总线1405集体表示与大量的电子系统1400通信连接的内部设备的所有系统总线、外设总线和芯片组总线。例如,总线1405通过图像处理单元1415、只读存储器1430、系统存储器1420和永久存储设备1435,与处理单元1410通信连接。
对于这些各种存储器单元,处理单元1410检索执行的指令和处理的数据,以为了执行本发明的处理。在不同实施例中,该处理单元可以是单个处理器或者多核处理器。某些指令被传输图像处理单元1415和并被其执行。该图像处理单元1415可以卸载各种计算或补充由处理单元1410提供的图像处理。
只读存储器1430存储处理单元1410或者该电子系统的其他模块所需要的静态数据和指令。另一方面,永久存储设备1435是一种读写存储器设备(read-and-writememory)。这个设备是一种非易失性(non-volatile)存储器单元,其即使在电子系统1400关闭时也存储指令和数据。本发明的一些实施例使用大容量存储设备(例如磁盘或光盘及其相应的磁盘驱动器)作为永久存储设备1435。
其他实施例使用可移动存储设备(如软盘、闪存设备等,以及其相应的磁盘驱动器)作为该永久存储设备。与永久存储设备1435一样,系统存储器1420是一种读写存储器设备。但是,与存储设备1435不一样的是,系统存储器1420是一种易失性(volatile)读写存储器,例如随机读取存储器。系统存储器1420存储一些处理器在运行时需要的指令和数据。在一些实施例中,根据本发明的处理被存储在该系统存储器1420、永久存储设备1435和/或只读存储器1430中。例如,各种存储器单元包括用于根据一些实施例的处理多媒体剪辑的指令。对于这些各种存储器单元,处理单元1410检索执行的指令和处理的数据,以为了执行某些实施例的处理。
总线1405也连接到输入设备1440和输出设备1445。该输入设备1440使得用户沟通信息并选择指令到该电子系统上。该输入设备1440包括字母数字键盘和指点设备(也被称为“光标控制设备”),摄像机(如网络摄像机(webcam)),用于接收语音命令的麦克风或类似的设备等。输出设备1445显示由该电子系统生成的图像或以其他方式输出的数据。输出设备1445包括打印机和显示设备,例如阴极射线管(cathode ray tube,CRT)或液晶显示器(liquid crystal display,LCD),以及扬声器或类似的音频输出设备。一些实施例包括诸如同时用作输入设备和输出设备的触摸屏等设备。
最后,如图14所示,总线1405也通过网络适配器(未示出)将电子系统1400耦接到网络1425。在这个方式中,计算机可以是计算机网络(例如,局域网(local area network,LAN)、广域网(wide area network,WAN)或者内联网)或者网络的网络(例如互联网)的一部分。电子系统1400的任一或者所有元件可以与本发明结合使用。
一些实施例包括电子元件,例如,微处理器、存储设备和存储器,其将计算机程序指令存储到机器可读介质或者计算机可读介质(可选地被称为计算机可读存储介质、机器可读介质或者机器可读存储介质)。计算机可读介质的一些实例包括RAM、ROM、只读光盘(read-only compact disc,CD-ROM),可刻录光盘(recordable compact disc,CD-R)、可擦写光盘(rewritable compact disc,CD-RW)、只读数字通用光盘(read-only digitalversatile disc)(例如,DVD-ROM,双层DVD-ROM)、各种可记录/可擦写DVD(例如DVD RAM、DVD-RW、DVD+RW等)、闪存(如SD卡、迷你SD卡,微SD卡等)、磁性和/或固态硬盘、只读和可刻录
Figure BDA0001756961260000251
盘、超高密度光盘和其他任何光学介质或磁介质,以及软盘。计算机可读介质可以存储由至少一个处理单元执行的计算机程序,并且包括用于执行各种操作的指令集。计算机程序或计算机代码的示例包括机器代码,例如编译器产生的机器代码,以及包含由计算机、电子元件或微处理器使用注释器(interpreter)而执行的高级代码的文件。
当以上讨论主要是指执行软件的微处理器或多核处理器时,很多上述的功能和应用程序由一个或多个集成电路执行,如特定应用的集成电路(application specificintegrated circuit,ASIC)或现场可编程门阵列(field programmable gate array,FPGA)。在一些实施例中,这种集成电路执行存储在该电路本身上的指令。此外,一些实施例执行存储在可编程逻辑器件(programmable logic device,PLD),ROM或RAM设备中的软件。
如本发明的说明书和任一权利要求中所使用,术语“计算机”、“服务器”、“处理器”和“存储器”均指电子设备或其他技术设备。这些术语不包括人或群体。为了本说明书的目的,术语显示或显示装置指在电子设备上进行显示。如本发明的说明书和任一权利要求中所使用,术语“计算机可读介质”、“计算机可读媒质”和“机器可读介质”完全局限于有形的、物理的物体,其以计算机可读的形式存储信息。这些术语不包括任何无线信号、有线下载信号和其他任何短暂信号。
在结合许多具体细节的情况下描述了本发明时,本领域普通技术人员将认识到,本发明可以以其他具体形式而被实施,而不脱离本发明的精神。此外,多个图(包括图5、图6、图9和图12)概念性示出了处理。这些处理的具体操作可以不以所示以及所描述的确切顺序来被执行。这些具体操作可用不在一个连续的操作系列中被执行,并且不同的具体操作可以在不同的实施例中被执行。另外,该处理通过使用几个子处理而被实现,或者作为更大宏处理的部分。因此,本领域的技术人员将能理解的是,本发明不受前述说明性细节的限制,而是由附加权利要求加以界定。
附加说明
本文所描述的主题有时表示不同的组件,其包含在或者连接到其他不同的组件。可以理解的是,所描述的结构仅是示例,实际上可以由许多其他结构来实施,以实现相同的功能。从概念上讲,任何实现相同功能的组件的排列实际上是“相关联的”,以便实现所需的功能。因此,不论结构或中间部件,为实现特定的功能而组合的任何两个组件被视为“相互关联”,以实现所需的功能。同样,任何两个相关联的组件被看作是相互“可操作连接”或“可操作耦接”,以实现特定功能。能相互关联的任何两个组件也被视为相互“可操作地耦合”以实现特定功能。可操作连接的具体例子包括但不限于物理可配对和/或物理上相互作用的组件,和/或无线可交互和/或无线上相互作用的组件,和/或逻辑上相互作用和/或逻辑上可交互的组件。
此外,关于基本上任何复数和/或单数术语的使用,本领域的技术人员可以根据上下文和/或应用从复数转换为单数和/或从单数到复数。为清楚起见,本文明确规定了不同的单数/复数排列。
此外,本领域的技术人员可以理解,通常,本发明所使用的术语特别是权利要求中的,如权利要求的主题,通常用作“开放”术语,例如,“包括”应解释为“包括但不限于,“有”应理解为“至少有”“包括”应解释为“包括但不限于”等。本领域的技术人员可以进一步理解,若计划介绍特定数量的权利要求内容,将在权利要求内明确表示,并且,在没有这类内容时将不显示。例如,为帮助理解,下面权利要求可能包含短语“至少一个”和“一个或多个”,以介绍权利要求内容。然而,这些短语的使用不应理解为暗示使用“一个”来介绍权利要求内容,而限制了任何特定的权利要求。甚至当相同的权利要求包括短语“一个或多个”或“至少有一个”,“一个”,则应被解释为表示至少一个或者更多,对于介绍权利要求的明确描述的使用而言,同样成立。此外,即使明确引用特定数量的介绍性内容,本领域的技术人员可以认识到,这样的内容应被解释为表示所引用的数量,例如,没有其他修改的“两个引用”,意味着至少两个引用,或两个或两个以上的引用。此外,在使用类似于“A、B和C中的至少一个”的表述的情况下,通常如此表述是为了本领域的技术人员可以理解该表述,例如,“系统包括A、B和C中的至少一个”将包括但不限于单独具有A的系统,单独具有B的系统,单独具有C的系统,具有A和B的系统,具有A和C的系统,具有B和C的系统,和/或具有A、B和C的系统,等。本领域的技术人员进一步可理解,无论在说明书中、权利要求中或者附图中,由两个或两个以上的替代术语所表现的任何分隔的单词和/或短语应理解为,包括这些术语中的一个,其中一个,或者这两个术语的可能性。例如,“A或B”应理解为,“A”,或者“B”,或者“A和B”的可能性。
从前述可知,为了说明目的,此处已描述了各种实施方案,并且在不偏离本发明的范围和精神的情况下,可以进行各种变形。因此,此处所公开的各种实施方式不用于限制本发明,本发明的保护范围以权利要求表示的范围和精神为准。

Claims (18)

1.一种视频编码方法,其特征在于,包括:
接收用于配置视频编码器的单通道模式标志,其中所述视频编码器编码至少具有第一颜色通道和第二颜色通道的多通道图像;
当所述单通道模式标志指示第一模式时,配置所述视频编码器接收第一像素集和第二像素集,以基于接收到的所述第一颜色通道的所述第一像素集和接收到的所述第二颜色通道的所述第二像素集编码所述多通道图像;以及
当所述单通道模式标志指示第二模式时,配置所述视频编码器接收所述第一像素集,以基于接收到的所述第一颜色通道的所述第一像素集和所述第二颜色通道的预设值的集合编码所述多通道图像。
2.如权利要求1中所述的视频编码方法,其特征在于,所述第一颜色通道是亮度通道,且第二颜色通道是色度通道。
3.如权利要求1中所述的视频编码方法,其特征在于,基于所述第二颜色通道的预设值的集合,编码所述多通道图像,包括:
给所述第二颜色通道的多个像素分配相同的固定值。
4.如权利要求1中所述的视频编码方法,其特征在于,接收到的所述第一像素集和所述第二像素集均是源图像的像素,所述第一像素集属于所述源图像的第一颜色通道,所述第二像素集属于所述源图像的第二颜色通道,其中所述预设值的集合是由独立于所述源图像的所述视频编码器来提供。
5.如权利要求1中所述的视频编码方法,其特征在于,还包括:
当所述单通道模式标志指示所述第一模式时,配置所述视频编码器输出所述第一颜色通道的多个已重构像素和所述第二颜色通道的多个已重构像素;以及
当所述单通道模式标志指示所述第二模式时,配置所述视频编码器不输出所述第二颜色通道的数据,或者配置所述视频编码器输出所述第二颜色通道的固定值。
6.如权利要求1中所述的视频编码方法,其特征在于,基于所述第二颜色通道的所述预设值的集合,编码所述多通道图像,包括:
使用所述预设值的集合作为所述第二颜色通道的多个变换系数。
7.如权利要求1中所述的视频编码方法,其特征在于,基于所述第二颜色通道的所述预设值的集合,编码所述多通道图像,包括:
使用所述预设值的集合作为所述第二颜色通道的已量化数据。
8.如权利要求1中所述的视频编码方法,其特征在于,基于所述第二颜色通道的所述预设值的集合,编码所述多通道图像,包括:
将所述预设值的集合注入到比特流中,作为熵编码数据。
9.一种视频编码装置,其特征在于,包括:
视频编码器,用于编码至少具有第一颜色通道和第二颜色通道的多通道图像;
选择电路,用于接收单通道模式标志;
当所述单通道模式标志指示第一模式时,配置所述视频编码器接收第一像素集和第二像素集,以基于接收到的所述第一颜色通道的所述第一像素集和接收到的所述第二颜色通道的所述第二像素集编码所述多通道图像;以及
当所述单通道模式标志指示第二模式时,配置所述视频编码器接收所述第一像素集,以基于接收到的所述第一颜色通道的所述第一像素集和所述第二颜色通道的预设值的集合编码所述多通道图像。
10.如权利要求9中所述的视频编码装置,其特征在于,所述第一像素集和所述第二像素集均是源图像的像素,所述第一像素集属于所述源图像的第一颜色通道,所述第二像素集属于所述源图像的第二颜色通道,其中所述预设值的集合是由独立于所述源图像的所述视频编码器中的逻辑元件来提供。
11.如权利要求9中所述的视频编码装置,其特征在于,当单通道模式标志指示所述第二模式时,所述视频编码器被配置成不输出所述第二颜色通道的数据。
12.如权利要求9中所述的视频编码装置,其特征在于,当单通道模式标志指示所述第二模式时,所述视频编码器被配置成输出所述第二颜色通道的固定值。
13.一种视频解码方法,其特征在于,包括:
接收包括至少具有第一颜色通道和第二颜色通道的已编码的多通道图像的比特流;
基于所述比特流的内容,识别用于配置视频解码器的单通道模式标志,其中所述视频解码器用于解码所述多通道图像;
当所述单通道模式标志指示第一模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素和所述第二颜色通道的多个像素,并输出所述第一颜色通道的多个已解码像素和所述第二颜色通道的多个已解码像素;以及
当所述单通道模式标志指示第二模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素并输出所述第一颜色通道的多个已解码像素。
14.如权利要求13中所述的视频解码方法,其特征在于,所述单通道模式标志是所述比特流中的语法元素。
15.如权利要求13中所述的视频解码方法,其特征在于,识别所述单通道模式标志包括:
在具有特定值集的所述多通道图像中检测像素块。
16.如权利要求13中所述的视频解码方法,其特征在于,还包括:
识别所述第二颜色通道的已编码数据,并丢弃所识别的所述第二颜色通道的所述已编码数据。
17.如权利要求13中所述的视频解码方法,其特征在于,所述第二颜色通道的多个像素不是基于所述比特流的内容而解码的多个像素。
18.一种视频解码装置,其特征在于,包括:
视频解码器,用于解码包括至少具有第一颜色通道和第二颜色通道的已编码的多通道图像的比特流;
选择电路,用于基于所述比特流的内容,识别用于配置视频解码器的单通道模式标志以用于解码所述多通道图像;
当所述单通道模式标志指示第一模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素和所述第二颜色通道的多个像素,并输出所述第一颜色通道的多个已解码像素和所述第二颜色通道的多个已解码像素;
当所述单通道模式标志指示第二模式时,配置所述视频解码器解码所述多通道图像,以生成所述第一颜色通道的多个像素并输出所述第一颜色通道的多个已解码像素。
CN201810891041.2A 2016-08-15 2018-08-07 视频编解码方法及其装置 Active CN109413430B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662374971P 2016-08-15 2016-08-15
US15/676,668 2017-08-14
US15/676,668 US20170366819A1 (en) 2016-08-15 2017-08-14 Method And Apparatus Of Single Channel Compression

Publications (2)

Publication Number Publication Date
CN109413430A CN109413430A (zh) 2019-03-01
CN109413430B true CN109413430B (zh) 2021-05-11

Family

ID=60660007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810891041.2A Active CN109413430B (zh) 2016-08-15 2018-08-07 视频编解码方法及其装置

Country Status (3)

Country Link
US (1) US20170366819A1 (zh)
CN (1) CN109413430B (zh)
TW (1) TWI783024B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110012294B (zh) * 2019-04-02 2021-03-23 上海工程技术大学 一种用于多分量视频的编码方法及解码方法
EP3937487B1 (en) * 2020-07-07 2024-09-04 Google LLC Alpha channel prediction
CN114095732A (zh) * 2021-11-09 2022-02-25 深圳市创凯智能股份有限公司 图像处理方法、装置、设备及存储介质
US12067749B2 (en) * 2021-12-27 2024-08-20 Advanced Micro Devices, Inc. Color channel correlation detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101014122A (zh) * 2006-01-30 2007-08-08 索尼株式会社 编解码装置及方法、编解码方法的程序、记录程序的介质
CN101218831A (zh) * 2005-09-20 2008-07-09 三菱电机株式会社 图像编码方法和图像解码方法、图像编码装置以及图像解码装置、以及图像编码比特流及记录介质
CN101411199A (zh) * 2006-03-28 2009-04-15 三星电子株式会社 对图像编码和/或解码的方法、介质和系统
CN106464887A (zh) * 2014-03-06 2017-02-22 三星电子株式会社 图像解码方法及其装置以及图像编码方法及其装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5225904A (en) * 1987-10-05 1993-07-06 Intel Corporation Adaptive digital video compression system
US5790177A (en) * 1988-10-17 1998-08-04 Kassatly; Samuel Anthony Digital signal recording/reproduction apparatus and method
US5737026A (en) * 1995-02-28 1998-04-07 Nielsen Media Research, Inc. Video and data co-channel communication system
US6195674B1 (en) * 1997-04-30 2001-02-27 Canon Kabushiki Kaisha Fast DCT apparatus
US6714683B1 (en) * 2000-08-24 2004-03-30 Digimarc Corporation Wavelet based feature modulation watermarks and related applications
US20030112863A1 (en) * 2001-07-12 2003-06-19 Demos Gary A. Method and system for improving compressed image chroma information
US20060157574A1 (en) * 2004-12-21 2006-07-20 Canon Kabushiki Kaisha Printed data storage and retrieval
US20080130740A1 (en) * 2005-09-20 2008-06-05 Mitsubishi Electric Corporation Image encoding method and image decoding method, image encoder and image decoder, and image encoded bit stream and recording medium
JP5266202B2 (ja) * 2006-03-28 2013-08-21 サムスン エレクトロニクス カンパニー リミテッド 画像符号化/復号化方法及び装置
TWI334106B (en) * 2006-12-27 2010-12-01 Icp Electronics Inc Apparatus for converting gray scale and method for the same
US8345968B2 (en) * 2007-06-28 2013-01-01 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US9398314B2 (en) * 2008-02-05 2016-07-19 Microsoft Technology Licensing, Llc Entropy coding efficiency enhancement utilizing energy distribution remapping
US8755431B2 (en) * 2010-01-14 2014-06-17 Silicon Image, Inc. Transmission and detection of multi-channel signals in reduced channel format
US8750383B2 (en) * 2011-01-17 2014-06-10 Exaimage Corporation Systems and methods for wavelet and channel-based high definition video encoding
KR101753551B1 (ko) * 2011-06-20 2017-07-03 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램을 저장한 기록매체
US9712847B2 (en) * 2011-09-20 2017-07-18 Microsoft Technology Licensing, Llc Low-complexity remote presentation session encoder using subsampling in color conversion space
EP2670139A1 (en) * 2012-06-01 2013-12-04 Alcatel Lucent Method and apparatus for encoding a video stream having a transparency information channel
US9098887B2 (en) * 2012-10-12 2015-08-04 Mediatek Inc. Image compression method and apparatus for encoding pixel data of frame into interleaved bit-stream, and related image decompression method and apparatus
US9743091B2 (en) * 2012-12-17 2017-08-22 Lg Electronics Inc. Method for encoding/decoding image, and device using same
EP3056007A4 (en) * 2013-10-11 2017-05-24 Sharp Kabushiki Kaisha Color information and chromaticity signaling
WO2015139007A1 (en) * 2014-03-14 2015-09-17 Sharp Laboratories Of America, Inc. Video compression with color space scalability
WO2016043637A1 (en) * 2014-09-19 2016-03-24 Telefonaktiebolaget L M Ericsson (Publ) Methods, encoders and decoders for coding of video sequences
US9854201B2 (en) * 2015-01-16 2017-12-26 Microsoft Technology Licensing, Llc Dynamically updating quality to higher chroma sampling rate
US10397443B2 (en) * 2016-03-01 2019-08-27 Qualcomm Incorporated Methods and systems for generating color remapping information supplemental enhancement information messages for video
CN107071514B (zh) * 2017-04-08 2018-11-06 腾讯科技(深圳)有限公司 一种图片文件处理方法及智能终端
US20190141028A1 (en) * 2017-06-20 2019-05-09 Andrew Grant Lind System and Methods for Authentication and/or Identification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101218831A (zh) * 2005-09-20 2008-07-09 三菱电机株式会社 图像编码方法和图像解码方法、图像编码装置以及图像解码装置、以及图像编码比特流及记录介质
CN101014122A (zh) * 2006-01-30 2007-08-08 索尼株式会社 编解码装置及方法、编解码方法的程序、记录程序的介质
CN101411199A (zh) * 2006-03-28 2009-04-15 三星电子株式会社 对图像编码和/或解码的方法、介质和系统
CN106464887A (zh) * 2014-03-06 2017-02-22 三星电子株式会社 图像解码方法及其装置以及图像编码方法及其装置

Also Published As

Publication number Publication date
CN109413430A (zh) 2019-03-01
TW201911870A (zh) 2019-03-16
TWI783024B (zh) 2022-11-11
US20170366819A1 (en) 2017-12-21

Similar Documents

Publication Publication Date Title
JP7256859B2 (ja) 動画符号化における彩度量子化
CN109413430B (zh) 视频编解码方法及其装置
US10523966B2 (en) Coding transform blocks
US10313668B2 (en) Method and device for encoding or decoding an image comprising encoding of decoding information representing prediction modes
US8208543B2 (en) Quantization and differential coding of alpha image data
EP3114843B1 (en) Adaptive switching of color spaces
JP6272321B2 (ja) デブロッキングにおけるクロマ量子化パラメータ・オフセットの使用
TWI792149B (zh) 量化相關參數之傳訊技術
TWI750624B (zh) 編解碼變換係數的方法及裝置
US12113988B2 (en) Device and method of video decoding with first and second decoding code
US11582465B2 (en) Video display preference filtering
CN114731414A (zh) 发信图像以及视频的块分割
CN114009015A (zh) 转换省略块的传讯编码技术
US20240064314A1 (en) Device and method of video encoding with first and second encoding code
US20210152826A1 (en) Specifying Video Picture Information
WO2015137201A1 (en) Method for coding and decoding videos and pictures using independent uniform prediction mode
US9275434B2 (en) Phase control multi-tap downscale filter
CN114731433B (zh) 一种视频编解码方法及装置
US11785204B1 (en) Frequency domain mode decision for joint chroma coding
TWI832602B (zh) 轉換係數符號的熵編碼
CN118872270A (zh) 转换系数符号的熵编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant