CN108337519A - 视频编码设备及方法 - Google Patents
视频编码设备及方法 Download PDFInfo
- Publication number
- CN108337519A CN108337519A CN201810287571.6A CN201810287571A CN108337519A CN 108337519 A CN108337519 A CN 108337519A CN 201810287571 A CN201810287571 A CN 201810287571A CN 108337519 A CN108337519 A CN 108337519A
- Authority
- CN
- China
- Prior art keywords
- component
- sampling location
- sampling
- chromatic
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000005070 sampling Methods 0.000 claims abstract description 362
- 230000009466 transformation Effects 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims description 14
- 239000000306 component Substances 0.000 description 436
- 239000010410 layer Substances 0.000 description 59
- 238000004891 communication Methods 0.000 description 38
- 238000006243 chemical reaction Methods 0.000 description 29
- 239000011229 interlayer Substances 0.000 description 21
- 230000015654 memory Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 17
- 238000007726 management method Methods 0.000 description 16
- 239000011159 matrix material Substances 0.000 description 13
- 241000023320 Luma <angiosperm> Species 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 11
- 230000004438 eyesight Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000033001 locomotion Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000001737 promoting effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 230000000712 assembly Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001062009 Indigofera Species 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 229910005580 NiCd Inorganic materials 0.000 description 1
- 101150069124 RAN1 gene Proteins 0.000 description 1
- 101100355633 Salmo salar ran gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004100 electronic packaging Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/64—Circuits for processing colour signals
- H04N9/67—Circuits for processing colour signals for matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/64—Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/24—High-definition television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/139—Format conversion, e.g. of frame-rate or size
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/15—Processing image signals for colour aspects of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/64—Circuits for processing colour signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
提供一种视频编码设备及方法,所述设备包括:处理器,被配置成:接收与第一颜色空间关联的图片,所述第一颜色空间与第一色域关联,其中所述图片包括第一采样位置的第一分量、第二采样位置的第二分量、以及第三采样位置的所述第二分量;将第一插值滤波器应用于所述第二采样位置的所述第二分量以及所述第三采样位置的所述第二分量,以确定所述第一采样位置的所述第二分量,其中所述第一采样位置的所述第二分量与所述第一颜色空间关联;以及将颜色转换模型应用于所述第一采样位置的所述第一分量以及所述第一采样位置的所述第二分量,以将所述第一采样位置的所述第一分量转换到第二颜色空间,该第二颜色空间与第二色域关联。
Description
本申请是申请日为2014年12月12日、申请号为201480068000.3、名称为“使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法”的中国发明专利申请的分案申请。
相关申请的交叉引用
本申请要求于2013年12月13日提交的美国临时申请No.61/915,892的权益,其全部内容结合于此作为参考。
背景技术
输入视频流的亮度和色度样本位置的相位(phase)可能无法对准。这种亮度和色度样本位置的不对准会影响到3D LUT插值的精确度,从而影响到被估计的3D LUT。
发明内容
用于估计颜色转换分量的系统和/或方法。视频编码设备可接收与第一颜色空间关联的图片。所述图片可包括第一采样位置的第一分量、第二采样位置的第二分量、以及第三采样位置的第二分量。所述视频编码设备可将第一插值滤波器应用于第二采样位置的第二分量和第三采样位置的第二分量,以确定第一采样位置的第二分量。第一采样位置的第二分量可与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一分量和第一采样位置的第二分量,以将第一采样位置的第一分量转换(translate)到第二颜色空间。所述第一分量可以是亮度分量,而所述第二分量可以是第一色度分量(例如红色色度差分量和/或蓝色色度差分量)或第二色度分量(例如红色色度差分量和/或蓝色色度差分量)。所述第一分量可以是第一色度分量(例如红色色度差分量和/或蓝色色度差分量)或第二色度分量,而所述第二分量可以是亮度分量。
所述视频编码设备可应用第一插值滤波器。所述第一插值滤波器可包括:将第二采样位置的第二分量乘3;将乘后的第二采样位置的第二分量、第三采样位置的第二分量以及2相加以确定其和;以及将该和除以4。所述第一插值滤波器可包括:将第二采样位置的第二分量、第三采样位置的第二分量以及1相加以确定其和;以及将该和除以2。
所述图片可包括第四采样位置的第二分量以及第五采样位置的第二分量。所述视频编码设备可将第一插值滤波器应用于第二采样位置的第二分量、第三采样位置的第二分量、第四采样位置的第二分量以及第五采样位置的第二分量,以确定第一采样位置的第二分量。所述第一插值滤波器可包括:将第二采样位置的第二分量与第三采样位置的第二分量相加以确定第一和;将第四采样位置的第二分量与第五采样位置的第二分量相加以确定第二和;将所述第二和乘3以确定第三和;将所述第一和、所述第三和以及4相加以确定第四和;以及将所述第四和除以8。
所述图片可包括第二采样位置的第三分量和第三采样位置的第三分量。所述第一分量可以是亮度分量,所述第二分量可以是红色色度差分量,而所述第三分量可以是蓝色色度差分量。所述视频编码设备可将第一插值滤波器应用于第二采样位置的第三分量和第三采样位置的第三分量,以确定第一采样位置的第三分量。所述第一采样位置的第三分量可与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一分量、第一采样位置的第二分量以及第一采样位置的第三分量,以将第一采样位置的第一分量转换到第二颜色空间。
所述图片可包括第一采样位置的第三分量。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一分量、第一采样位置的第三分量以及第一采样位置的第二分量,以将第一采样位置的第一分量转换到第二颜色空间。所述第一分量可以是第一色度分量,所述第二分量可以是亮度分量,而所述第三分量可以是第二色度分量。所述第一分量可以是第二色度分量,所述第二分量可以是亮度分量,而所述第三分量可以是第一色度分量。
所述图片的特征可在于4:2:0色度格式。所述颜色转换模型可以基于3维查找表(LUT)。
根据权利要求1所述的视频编码设备,其中所述处理器还被配置成接收可伸缩比特流,所述可伸缩比特流包括基层和增强层,其中所述基层包括所述图片,所述基层与第一颜色空间关联,而所述增强层与第二颜色空间关联。
视频编码设备可接收与第一颜色空间关联的图片。所述图片可包括第一采样位置的第一色度分量、第一采样位置的第二色度分量、第二采样位置的亮度分量、第三采样位置的亮度分量、第四采样位置的亮度分量、以及第五采样位置的亮度分量。所述视频编码设备可将第一插值滤波器应用于下列中的两者或更多者以确定第一采样位置的亮度分量:第二采样位置的亮度分量、第三采样位置的亮度分量、第四采样位置的亮度分量、以及第五采样位置的亮度分量,其中所述第一采样位置的亮度分量与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一色度分量、第一采样位置的第二色度分量、以及第一采样位置的亮度分量,以将第一采样位置的第一色度分量转换到第二颜色空间。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一色度分量、第一采样位置的第二色度分量、以及第一采样位置的亮度分量,以将第一采样位置的第二色度分量转换到第二颜色空间。所述第一色度分量和/或第二色度分量可以是红色色度差分量和/或蓝色色度差分量。
视频编码设备可接收与第一颜色空间关联的图片。所述图片可包括第一采样位置的亮度分量、第二采样位置的第一色度分量、第二采样位置的第二色度分量、第三采样位置的第一色度分量、第三采样位置的第二色度分量、第四采样位置的第一色度分量、第四采样位置的第二色度分量、第五采样位置的第一色度分量、以及第五采样位置的第二色度分量。所述视频编码设备可将第一插值滤波器应用于下列中的两者或更多者以确定第一采样位置的第一色度分量:第二采样位置的第一色度分量、第三采样位置的第一色度分量、第四采样位置的第一色度分量、以及第五采样位置的第一色度分量,其中所述第一采样位置的第一色度分量与第一颜色空间关联。所述视频编码设备可将第一插值滤波器应用于下列中的两者或更多者以确定第一采样位置的第二色度分量:第二采样位置的第二色度分量、第三采样位置的第二色度分量、第四采样位置的第二色度分量、以及第五采样位置的第二色度分量,其中所述第一采样位置的第二色度分量与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的亮度分量、第一采样位置的第一色度分量、以及第一采样位置的第二色度分量,以将所述第一采样位置的亮度分量转换到第二颜色空间。所述第一色度分量和/或所述第二色度分量可以是红色色度差分量和/或蓝色色度差分量。
附图说明
图1是具有一个或多个层(例如N个层)的示例可伸缩视频编码系统的框图。
图2是使用MVC的立体(例如2视图)视频编码的时间和/或层间预测的示例。
图3是CIE颜色定义或空间中的BT.709(HDTV)与BT.2020(UHDTV)之间的示例颜色初步比较。
图4A是图片在BT.709中分级(graded)与在BT.709中渲染之间对于终端用户的视差示例。
图4B是图片在BT.2020中分级与在BT.709中渲染之间对于终端用户的视差示例。
图5是采用图片级层间预测(ILP)的色域可伸缩性(CGS)编码示例。
图6是8比特YUV信号的3D查找表的示例。
图7是(例如在3D LUT估计中使用的)三线性或四面体插值中的权重计算的示例。
图8是(例如在3D LUT估计中使用的)四面体插值的示例。
图9A-9F是(例如在3D LUT估计中使用的)包围(encompass)插值点的四面体的示例。
图10是针对色度格式(例如针对420色度格式)的亮度与色度分量之间的相移的示例,在所述色度格式中,方形可表示亮度像素网格,而圆形可表示色度网格。
图11A是示例通信系统的图示,在该示例通信系统中可实施一个或多个所公开的实施方式。
图11B是可在图11A示出的通信系统内使用的示例无线发射/接收单元(WTRU)的系统图。
图11C是可在图11A示出的通信系统内使用的示例无线电接入网络和示例核心网络的系统图。
图11D是可在图11A示出的通信系统内使用的另一示例无线电接入网络和核心网络的系统图。
图11E是可在图11A示出的通信系统内使用的另一示例无线电接入网络和核心网络的系统图。
具体实施方式
数字视频压缩技术可实现高效数字视频通信、分配和消耗,例如H.261、MPEG-1、MPEG-2、H.263、MPEG-4第2部分以及H.264/MPEG-4第10部分AVC。
与传统数字视频服务(例如通过卫星、电缆和地面传输信道发送TV信号)相比,越来越多的视频应用(例如IPTV、视频聊天、移动视频及流视频)可在异构环境中得以部署。举例来说,视频应用可为网络中的视频流提供不同大小的小区,诸如此类。异构性可存在于客户端以及网络中。举例来说,在客户端侧,可提供和/或使用在具有可变屏幕大小和显示性能的设备(包括智能电话、平板电脑、PC和TV等等)上消费视频内容的N屏方案。在网络侧,视频可在因特网、WiFi网络、移动(3G和4G)网络和/或上述任意组合上传输。
可伸缩视频编码可在最高分辨率下对信号进行编码。可伸缩视频编码可依据某些应用所要求的和/或由客户端设备所支持的特定速率和分辨率从流子集实现解码。所述分辨率可由多个视频参数进行定义,所述视频参数包括但不限于空间分辨率(例如图片大小)、时间分辨率(例如帧速率)、视频质量(例如主观质量(如MOS)和/或客观质量(如PSNR或SSIM或VQM)等等)。其他常用的视频参数可包括色度格式(例如YUV420或YUV422或YUV444)、比特深度(例如8比特或10比特视频)、复杂性、视图、色域和/或宽高比(例如16:9或4:3)。国际视频标准(例如MPEG-2视频、H.263、MPEG4视觉和H.264)可具有支持可伸缩性模式的工具和/或文档(profile)。
可伸缩视频编码可实现部分比特流的传输和解码。部分比特流的传输和解码可使得可伸缩视频编码(SVC)系统为视频服务提供更低的时间和/或空间分辨率或降低的精度(fidelity),同时保持相对高的重建质量(例如部分比特流的给定各个速率)。SVC可采用单回路解码来实施,由此SVC解码器可在正被解码的层上建立一个运动补偿回路,但不在一个或多个其他较低层上建立运动补偿回路。举例来说,比特流可包括两个层,所述层包括可以是基层的第一层(例如层1)和可以是增强层的第二层(例如层2)。当这样的SVC解码器重建了层2视频时,建立解码后的图片缓冲器和运动补偿后的预测可被限制在层2。在SVC的这种实施过程中,来自较低层的各个参考图片可能无法被完全重建,这可能会降低解码器处的内存消耗和/或计算复杂性。
单回路解码可通过受限的层间纹理预测来实现,其中对于给定层中的当前块,来自较低层的空间纹理预测在对应的较低层块在帧内模式下编码时可被允许。这可称作受限帧内预测。当较低层块在帧内模式下编码时,其可被重建而无需运动补偿操作和/或解码的图片缓冲器。
SVC可从一个或多个较低层实施一个或多个额外的层间预测技术(例如运动向量预测、残差预测、模式预测等等)。该行为可提高增强层的率失真效率。采用单回路解码的SVC实施可展示解码器处降低的内存消耗和/或降低的计算复杂性,并且可展示增加的实现复杂性,例如由于对块级层间预测的依赖度。为了补偿由于施行单回路解码限制而引起的性能损失可增加编码器设计和计算复杂性以实现所需性能。SVC可能不支持交错式(interlaced)内容的编码。
图1是描述了示例的基于块的混合可伸缩视频编码(SVC)系统的简化框图。将由层1(例如基层)表示的空间和/或时间信号分辨率可通过对输入视频信号进行下采样而产生。在随后的编码阶段,编码器的设置(例如Q1)可决定基本信息的质量等级。一个或多个随后的较高层可使用基层重建Y1来编码和/或解码,这可表示较高层分辨率等级的近似值。上采样单元可执行基层重建信号的上采样到层2分辨率。可通过多个层(例如对于N个层,层1、2…N)来执行下采样和/或上采样。下采样和/或上采样率可以不同,例如取决于两个层之间可伸缩性的维度。
根据图1的示例可伸缩视频编码系统,对于给定较高层n(例如2≤n≤N,N为层的总数量),可通过从当前层n信号中减去上采样较低层信号(例如层n-1信号)来产生差分信号。该差分信号可被编码。如果分别由两个层(n1和n2)表示的视频信号具有相同的空间分辨率,则可忽略对应的下采样和/或上采样操作。给定层n(例如1≤n≤N)或多个层可在不使用来自较高层的解码信息的情况下进行解码。
依赖于除基层之外的层的残差信号(例如两层之间的差分信号)的编码,例如使用图1中的示例SVC系统,会导致视觉假象。这样的视觉假象可能由于例如用于限制其动态范围的残差信号的量化和/或规范化和/或在对残差信号编码期间执行的量化而导致的。一个或多个更高层编码器可采用运动估计和/或运动补偿预测作为各自的编码模式。残差信号中的运动估计和/或补偿可能与传统运动估计不同,并且可能倾向于视觉假象。为了减少(例如最小化)视觉假象的发生,可实施更为复杂的残差量化(例如连同联合量化过程一起,该联合量化过程可包括用于限制其动态范围的残差信号的量化和/或规范化以及在对残差信号编码期间执行的量化两者。这样的量化过程可增加SVC系统的复杂性。
多视图视频编码(MVC)可提供视图可伸缩性。根据视图可伸缩性的一个实例,可对基层比特流进行解码以重建传统二维(2D)视频,并且可对一个或多个额外的增强层进行解码以重建同一视频信号的其他视图表示(view representation)。当这样的视图组合在一起且由三维(3D)显示来进行显示,可生成具有适当的深度知觉的3D视频。
图2示出了使用MVC编码具有左视图(例如层1)和右视图(例如层2)的立体视频的示例预测结构。左视图视频可被编码具有I-B-B-P预测结构,而右视图视频可被编码具有P-B-B-B预测结构。如图2所示,在右视图中,与左视图中的第一个I图片并列的第一个图片可被编码为P图片,并且右视图中随后的图片可被编码为B图片,所述B图片具有来自右视图中的时间基准的第一预测以及来自左视图中的层间基准的第二预测。MVC可能无法支持单回路解码特征。举例来说,如图2所示,右视图(例如层2)视频的解码的条件在于左视图(例如层1)中完整图片的有效性,其中一个或多个(例如每一)层(例如视图)具有各自的补偿回路。实施MVC可包括高级句法改变,并且可能不包括块级改变。这种情况可延缓(ease)MVC的实施。举例来说,MVC可通过在片和/或图片级配置基准图片得以实施。MVC可支持两个以上视图的编码,例如通过扩展图2中示出的实例以在多个视图上实现层间预测。
MPEG帧兼容(MFC)视频编码可为3D视频编码提供可伸缩扩展。举例来说,MFC可为帧兼容基层视频(例如两个视图封装到同一帧内)提供可伸缩扩展,并且可提供一个或多个增强层以恢复全分辨率视图。立体3D视频可具有两个视图,包括左视图和右视图。立体3D内容可通过将所述两个视图封装和/或复用到一个帧内且通过对封装后的视频进行压缩和传送来得以传递。在接收机侧,在解码之后,所述帧可被解封装并显示为两个视图。这种对视图的复用可在时间域或空间域中执行。当在空间域中执行时,为了保持相同图片大小,所述两个视图可根据一个或多个排列被空间下采样(例如通过因子2)和封装。举例来说,并排排列可将下采样左视图放置在图片的左半部而将下采样右视图放置在图片的右半部。其他排列可包括上下、逐行、棋盘式等等。用于实现帧兼容3D视频的排列例如可通过一个或多个帧封装排列SEI消息来传达。虽然这种排列实现的3D传递具有最小的带宽消耗增长,但空间下采样会引起图片的混淆和/或会降低视觉质量及3D视频的用户体验。
视频应用(例如IPTV、视频聊天、移动视频和/或流视频)可在异构环境中得以部署。异构性可存在于客户端侧。异构性可存在于网络中。N屏可包括在具有可变屏幕大小和/或显示性能的设备上消耗视频内容,所述设备包括包括智能电话、平板电脑、PC和/或TV等等。N屏可有助于例如客户端侧的异构性。视频可在因特网、WiFi网络、移动网络(例如3G和/或4G)和/或这些网络的任意组合上(例如在网络侧)传送。可伸缩视频编码可提高用户体验和/或视频服务质量。可伸缩视频编码可包括在最高分辨率下对信号进行编码。可伸缩视频编码可包括根据某些应用所使用的和/或由客户端设备所支持的有效网络带宽和/或视频分辨率从流子集实现解码。分辨率的特征在于多个视频参数。视频参数可包括下列中的一者或多者:空间分辨率、时间分辨率、视频质量、色度格式、比特深度、复杂性、视图、色域和/或宽高比等等。空间分辨率可包括图片大小。时间分辨率可包括帧速率。视频质量可包括主观质量(例如MOS)和/或客观质量(例如PSNR、SSIM或VQM)。色度格式可包括YUV420、YUV422或YUV444等等。比特深度可包括8比特视频、10比特视频等等。宽高比可包括16:9或4:3等等。HEVC可伸缩扩展至少可支持空间可伸缩性(例如可伸缩比特流可包括一个以上空间分辨率上的信号)、质量可伸缩性(例如可伸缩比特流可包括一个以上质量等级上的信号)和/或标准可伸缩性(例如可伸缩比特流可包括使用H.264/AVC编码的基层和一个或多个使用HEVC编码的增强层)。根据空间可伸缩性,可伸缩比特流可包括一个或多个空间分辨率上的信号。根据质量可伸缩性,可伸缩比特流可包括一个或多个质量等级上的信号。根据标准可伸缩性,可伸缩比特流可包括使用例如H.264/AVC编码的基层以及一个或多个使用例如HEVC编码的增强层。质量可伸缩性可被称为SNR可伸缩性。视图可伸缩性可支持3D视频应用。根据视图可伸缩性,可伸缩视频流可包括2D和3D视频信号两者。
视频编码系统(例如根据高效视频编码(SHVC)的可伸缩扩展的视频编码系统)可包括一个或多个被配置成执行视频编码的设备。被配置成执行视频编码(例如编码和/或解码视频信号)的设备可被称为视频编码设备。这种视频编码设备可包括视频可用设备,例如电视机、数字媒体播放器、DVD播放器、蓝光TM播放器、网络媒体播放器设备、台式电脑、便携式个人电脑、平板设备、移动电话、视频会议系统、基于硬件和/或软件的视频编码系统,诸如此类。这样的视频编码设备可包括无线通信网络元素,例如无线发射/接收单元(WTRU)、基站、网关、或其他网络元素。
HEVC的可伸缩增强将在此处进行讨论。举例来说,针对空间可伸缩性可能已建立了一个或多个目标(target)。举例来说,与使用不可伸缩编码相比,针对较高分辨率视频测量,可实现具有针对2x空间可伸缩性的25%比特率缩减和针对1.5x空间可伸缩性的50%比特率缩减的目标。举例来说,可伸缩性可被用于扩大可伸缩HEVC用例的范围。当基层采用H.264/AVC或MPEG2编码时,可伸缩性可指可伸缩性的类型,同时所述一个或多个增强层可使用例如HEVC来编码。可伸缩性可为使用H.264/AVC或MPEG2编码的传统内容(legacycontent)提供向后兼容,并提高具有一个或多个采用HEVC编码的增强层的传统内容的质量,从而可提供更好的编码效率。
3D可伸缩视频编码技术可被称为3D视频编码或3DV。3DV将在此进行讨论。3DV可开发目标用于自动立体应用的视图可伸缩性的不同体验。自动立体显示和应用可允许或使人们在无需佩戴笨重镜片的情况下就能体验3D。为了在不佩戴镜片的情况下实现适当的或良好的3D体验,可以提供和/或使用两个以上的视图。对多个视图(例如9个视图或10个视图)进行编码可能很昂贵。3DV可提供和/或使用一种混合方法,来对一些具有相对较大的差距以及可提供视图的深度信息的深度图的视图(例如2个或3个视图)进行编码。在显示侧,编码视图和深度图可被解码,并且剩余的视图可使用解码后的视图及其采用视图合成技术的深度图生成。3DV可考虑多种方法来对所述视图及其深度图进行编码,例如使用不同技术(例如H.264/AVC、MVC及HEVC)的组合来对所述视图及其深度图进行编码,包括采用一种技术(H.264/AVC)对基层进行编码以及采用另一种技术(例如HEVC)对一个或多个增强层进行编码。3DV可提供不同选项的菜单,可从所述该菜单中选择应用。
表1概括了此处讨论的不同类型可伸缩性的示例。在表1最下方,比特深度可伸缩性及色度格式可伸缩性可被限制为(be tied to)成由专业视频应用使用的视频格式(例如高于8比特视频和/或高于YUV4:2:0的色度采样格式)。比特深度可伸缩性及色度格式可伸缩性可被使用。宽高比可伸缩性及色域可伸缩性可被提供和/或用作期望的可伸缩性(当前可能无法针对可伸缩HEVC开发的第一阶段提供、使用和/或规划)。
图3示出了BT.709(HDTV)与BT.2020(UHDTV)之间在CIE颜色清晰度上的比较。采用高级显示技术,与HDTV规范(例如BT.709)相比,超高清晰度TV(UHDTV)可支持更高的分辨率、更大的比特深度、更高的帧速率、以及更宽的色域。由于BT.2020可提供的高保真质量,用户体验可得到极大提升。UHDTV可支持最高4K(3840x2160)和8K(7680x4320)分辨率、最高120Hz的帧速率和10比特或12比特的图片样本比特深度。UHDTV 310的颜色空间可由BT.2020定义。UHDTV 320的颜色空间可由BT.790定义。采用BT.2020 310渲染(render)的颜色体积(volume of colors)可比采用HDTV 320(例如BT.709)的颜色空间体积更大,这意味着使用UHDTV规范可渲染更多可见颜色信息。
表1.不同可伸缩性类型的示例
色域可伸缩性。色域可伸缩(CGS)编码可以是多层编码,其中两个或更多个层可具有不同的色域和比特深度。举例来说,如表1所示,在2层可伸缩系统中,基层可以是BT.709中定义的HDTV色域,而增强层可以是BT.2020中定义的UHDTV色域。P3色域为可使用的色域。该P3色域可在数字电影应用中使用。CGS编码中的层间过程可使用色域转换技术将基层色域转换成增强层色域。在应用色域转换之后,所生成的层间基准图片可用于预测具有更好或提高的精确度的增强层图片。
图4A和图4B描述了终端用户分别在BT.709色域与BT.2020色域之间的视差的示例。在图4A和图4B中,同一内容可使用不同色域两次按颜色梯度分级(color graded)。举例来说,图4A中的内容可在BT.709中按颜色梯度分级并在BT.709显示上渲染/显示。图4B的内容可在BT.2020中按颜色梯度分级并在BT.709显示上渲染/显示。如所示的,两个图片之间的色差可以不同。
图5示出了采用图片级层间预测的色域可伸缩性(CGS)编码示例。根据示例实施方式,图4A可在基层编码而图4B可在增强层编码。额外的层间处理可被提供和/或用于提高增强层编码效率,例如使用图5中的CGS编码系统。色域转换可在针对CGS的层间处理中使用。通过使用色域转换,BT.709空间中的颜色可被转换到BT.2020空间。BT.709空间中的颜色可用于更有效地预测BT.2020空间中的增强层信号。
如图5所示,基层(BL)视频输入530可以是HD视频信号,而增强层(EL)视频输入502可以是UHD视频信号。HD视频信号530和UHD视频信号502可通过下列中的一者或多者相互对应:一个或多个下采样参数(例如空间可伸缩性);一个或多个颜色梯度分级参数(例如色域可伸缩性);以及一个或多个声调映射参数(例如比特深度可伸缩性)528。
BL编码器518可包括例如高效视频编码(HEVC)视频编码器或H.264/AVC视频编码器。BL编码器518可被配置成使用用于预测的一个或多个BL重建图片(例如存储在BL DPB320中的)生成BL比特流532。EL编码器504可包括例如HEVC编码器。EL编码器504例如可包括一个或多个高级句法修正,以通过将层间基准图片添加到EL DPB来支持层间预测。EL编码器504可被配置成使用用于预测的一个或多个EL重建图片(例如存储在EL DPB 506中的)生成EL比特流508。
BL DPB 520中的一个或多个重建BL图片可在层间处理(ILP)单元522中使用一个或多个图片级层间处理技术进行处理,所述图片级层间处理技术包括下列中的一者或多者:上采样(例如用于空间可伸缩性)、色域转换(例如用于色域可伸缩性)、和逆向声调映射(例如用于比特深度可伸缩性)。一个或多个处理后的重建BL图片可用作用于EL编码的基准图片。层间处理可基于接收自EL编码器504的增强视频信息514和/或接收自BL编码器518的基本视频信息516执行。这样可提高EL编码效率。
在526,EL比特流508、BL比特流532、以及在层间处理中使用的参数(例如ILP信息524)可被一起复用成可伸缩比特流512。举例来说,可伸缩比特流512可包括SHVC比特流。
即使在BL色域和EL色域固定的情况下(例如BL在709中而EL在2020中),用于色域转换的模型参数针对不同内容可以是不同的。这些参数可取决于内容生成的后期制作期间的颜色梯度分级处理,在内容生成期间,调色师可将不同的梯度分级参数应用于不同的空间和/或不同的内容以反映其艺术意图。用于颜色梯度分级的输入视频可包括高保真图片。在可伸缩编码系统中,对BL图片的编码会引入量化噪声。采用编码结构(例如分层预测结构),量化等级可针对每图片和/或每组图片得以调整。根据颜色梯度分级生成的模型参数用于编码的目的可能不够精确。根据一种实施方式,编码器通过在任意点估计模型参数来补偿编码噪声可能更有效。所述编码器可针对每图片或每组图片来估计模型参数。这些模型参数(例如在颜色梯度分级处理期间生成的和/或由编码器生成的)可以序列和/或图片级采用信号进行传递,由此解码器可在层间预测期间执行相同的色域转换处理。
色域转换示例可包括但不限于线性或分段(piece-wise)线性颜色转换。在电影工业中,3D查找表(3D LUT)可用于从一种色域方法或技术到另一种色域方法或技术的色域转换。此外,可提供和/或使用针对CGS编码的3D LUT。图5示出了采用图片级层间预测(ILP)的示例CGS编码机制。所述ILP包括从基层(BL)色域到增强层(EL)色域的色域转换、从BL空间分辨率到EL空间分辨率的上采样、和/或从BL样本比特深度到EL样本比特深度的逆向声调映射。
图6示出了8比特YUV信号的示例3D查找表。图7示出了三线性或四面体插值中的示例权重计算。如此处所述,颜色转换模型(例如3D LUT)可用于色域转换。举例来说,(y,u,v)可指代基层的色域中的样本三元组(triplet),而(Y,U,V)可指代EL色域中的三元组。在3DLUT中,BL颜色空间的范围可被划分(segment)成相等的八分区(octant),如图6所示。
3D LUT的输入可以是BL色域中的(y,u,v),而3D LUT的输出可以是EL色域中的映射的三元组(Y,U,V)。举例来说,参见图7,所述输入可以是位于八分区700内的索引(y,u,v)。在转换处理期间,如果输入(y,u,v)与八分区的其中一个顶点(vertex)交叠,则输出(Y,U,V)可通过直接引用3D LUT坐标(entry)中的一个来导出,例如分量(y,u,v)与其各自的顶点交叠。如果输入(y,u,v)(或者输入分量的任意一个)处于八分区内(但不在八分区的其中一个顶点上),例如图7中的索引(y,u,v),则可应用插值处理。举例来说,可应用执行同一处理的三线性(trilinear)和/或四面体插值和方法。三线性插值可应用于最近的8个顶点,如图7所示。该三线性插值可使用下列等式中的一者或多者来执行:
Y=K×∑i=0,1∑j=0,1∑k=0,1si(y)×sj(u)×sk(v)×LUT[yi][uj][vk].Y (1)
U=K×∑i=0,1∑j=0,1∑k=0,1si(y)×sj(u)×sk(v)×LUT[yi][uj][vk].U (2)
V=K×∑i=0,1∑j=0,1∑k=0,1si(y)×sj(u)×sk(v)×LUT[yi][uj][vk].V (3)
参见等式(1)-(3)及图7,举例来说,(yi,uj,vk)可表示BL色域的顶点(即到3D LUT的输入)。LUT[yi][uj][vk]可表示EL色域的顶点(即在坐标(yi,uj,vk)的3D LUT的输出)。LUT[yi][uj][vk].Y、LUT[yi][uj][vk].U、LUT[yi][uj][vk].V可分别表示LUT[yi][uj][vk]的Y、U、及V分量。i,j,k={0,1},并且s0(y)=y1-y、s1(y)=y-y0、s0(u)=u1-u、s1(u)=u-u0、s0(v)=v1-v、s1(v)=v-v0为所应用的权重,如图7所示。
图8示出了示例四面体插值。图9A、图9B、图9C、图9D、图9E和图9F示出了围绕插值点的四面体类型。四面体插值可使用四面体的四个顶点(包括点P(y,u,v)),以便内插用于计算。图8中的输入点P(即P(y,u,v))可被封闭(enclose)在四面体内,该四面体的顶点可以是P0、P1、P5、P7。四面体插值可针对每一分量在等式(4)(5)(6)中计算。对于四面体可以有6个可能的选择,所述选择可包括将被内插的点P。图9A-9F可示出或列出这6种可能的情况。根据一个示例,顶点P0和P7可包括在所述四面体中。
Y=Ty×((y1-y0)×LUT[P0].Y+dy×(LUT[P1].Y-LUT[P0].Y))+Tu×du×(LUT[P5].Y-LUT[P1].Y)+Tv×dv×(LUT[P7].Y-LUT[P5].Y) (4)
U=Ty×((y1-y0)×LUT[P0].U+dy×(LUT[P1].U-LUT[P0].U))+Tu×du×(LUT[P5].U-LUT[P1].U)+Tv×dv×(LUT[P7].U-LUT[P5].U) (5)
V=Ty×((y1-y0)×LUT[P0].V+dy×(LUT[P1].V-LUT[P0].V))+Tu×du×(LUT[P5].V-LUT[P1].V)+Tv×dv×(LUT[P7].V-LUT[P5].V) (6)
3D LUT可由编码器使用一个颜色空间中的原始信号及另一颜色空间中的对应信号来估计。举例来说,如果3D LUT插值技术或处理是线性的,则最小二乘(LS)估计法可用于估计3D LUT。基于梯度下降的迭代技术可用于估计。如此处所述,3D LUT估计可采用LS估计法来执行。
采用LS的3D LUT估计可能带来挑战。举例来说,可被估计的3D LUT参数的尺寸可以很大。在图6中,样本比特深度可以是8比特。如果单位八分区大小为16x16x16,则3D LUT表中有17x17x17坐标。3D LUT的一个或多个(例如每一)坐标可包括三个分量。每一分量可具有4913(17x17x17)未知参数。这样的大尺寸线性系统估计可使用大量内存,并且可调用大量计算。
3D LUT并非完全用于给定视频输入的色域转换。举例来说,在色域可伸缩性的核心试验中使用的一个或多个测试序列的统计分析中,3D LUT中使用的坐标的百分比可以小于20%。在这样的实施方式中,LS估计法可能不能够被直接应用,这是由于可能存在一个或多个无法测量的坐标。
BL像素的分布在3D颜色空间中可能并不均匀。举例来说,这样的BL像素可紧紧环绕某些颜色(例如主要颜色),并且可稀疏地分布在其他颜色周围。如此处所述,这种不平衡的特征可与LS估计的稳定性相关。
图10示出了YUV 4:2:0视频的亮度和色度样本位置的示例。输入视频的亮度和色度的相位可能无法对准。为了针对一个或多个(例如每一)分量估计和应用3D LUT,可使用由3个分量形成的三元组。三元组可指代位于同一采样位置的一个亮度分量和两个色度分量(例如位于同一采样位置的亮度分量、红色色度差分量、以及蓝色色度差分量)。这种亮度和色度样本位置的不对准会影响到3D LUT插值的精确度。
为了应对一个或多个这种挑战,可提供用于改善3D LUT估计的系统和/或方法。举例来说,此处将描述BT.709到BT.2020色域转换。举例来说,3D LUT估计中的输入信号可以是BT.709压缩/解压视频,而输出信号可以是BT.2020视频(其可以是训练基准或目标)。等式(7)可用于描述采用3D LUT的色域转换处理。
zi(c)=fP(c)(xi),i∈[0,N-1] (7)
其中x可指代BT.709中三元组(y,u,v)形式的输入信号。Z(c)可以是分量c的输出信号,其中c可以是BT.2020中的Y、U或V。P(c)可以是将被估计的分量c的参数。P(c)可以是分量c的3D LUT输出。fP(c)可以是插值函数。fP(c)可以是线性函数,如在此表述的三线性或四面体。i可以是输入像素的索引。N可以是输入像素的总数。以矩阵形式可改写如下:
其等式(8)中的*可以是矩阵乘法。可以是第i个输入像素的权重向量。Wi,j可以是第i个输入像素的3D LUT的第j个输出坐标的权重。根据一个示例,Wi,j可根据用于三线性插值的等式(1)-(3)以及用于四面体插值的等式(4)-(6)计算。在一个示例中,权重向量可表示如下:
P(c)可以是将被估计的参数向量,该参数向量可以是3D LUT的输出坐标且可表示如下:
P(c)=[p0 … pM-1]
M可以是3D LUT输出坐标的数量。举例来说,M对于17x17x17大小的3DLUT可以为4913。根据一个示例,由于一个或多个(例如每一)分量的3DLUT可被单独估计,分量c在下列等式中可被省略。针对一个或多个(例如所有)像素集合等式(8),可定义或提供下列各项:
Z=W*P (9)
Z=[z0 … zN-1]T
采用最小二乘估计,其解如下:
P=H-1*(WT*Z) (11)
H=(WT*W) (12)
其中H可以是自相关矩阵。
3D LUT估计将在此进行描述。举例来说,对于输入视频信号(例如BT.709),3D LUT坐标(例如3D LUT坐标的20%)可在采用3D LUT的颜色转换中使用。这意味着等式(10)中的矩阵W为稀疏的,且其元素中的一个或多个可能为零。自相关矩阵H可在等式(12)中定义。该自相关矩阵H可以为稀疏的。该自相关矩阵H可能并非可逆的。等式(11)的解对于自相关矩阵H来说可能并非可用。根据一个示例,矩阵W可通过考虑所参照的3D LUT的坐标而得到精简。为了精简(compact)所述矩阵,可对输入视频的输入像素(y,u,v)进行扫描。如果3D LUT顶点在3D LUT插值处理中得到使用,则3D LUT顶点可被遮掩(mask)。通过移除未使用的顶点,精简参数集P’可被确定、计算或生成。用于在P’之后重建P的从P’到P的映射可被估计和/或构建如下:
P’=compact(P)(P’=精简(P))
W’和H’可使用精简的P’来计算,其中未使用的顶点可能已被移除。其解可定义如下:
P’=H’-1*(W’T*Z) (13)
H’=(W’T*W’) (14)
3D LUT估计可减少矩阵W的稀疏度。在精简之后,由于H’的大小可能小于H,用于存储3D LUT估计的自相关矩阵H的内存会被减少。
如此处所述,输入视频的颜色分布可能并不均匀。举例来说,像素可能具有类似的颜色。具有高出现率的颜色可以是主要颜色。这可导致W’的不平衡问题。举例来说,W’中的元素可对应于主要颜色,其可具有大的值。W’中的其他元素可对应于不经常(例如较常或极少)出现的颜色,其具有较低或较小的值。其结果是,自相关矩阵H’中的元素的动态范围可以很大,这会导致H’的逆向处理变得不稳定。对P’的估计会变得不稳定。为了减少这种问题,可提供和/或采用一种限制来建立精确估计结果与估计处理的稳定性之间的权衡。举例来说:
H′=(W′T*W′)+λI,λ≥0 (15)
其中I可以是一元矩阵,而λ可以是用以平衡估计精度与处理的稳定性的因数。更大的λ意味着方法或处理的稳定性上会产生更多偏差。λ的值可基于W’中不平衡程度来确定。
原始参数向量P可通过将估计的顶点从P’映射到P来获取,例如在估计精简参数向量P’之后。举例来说:
P’=decompact(P)(P’=松散(P)) (16)
P中未使用的顶点可使用P’中对应的顶点来填充,例如使用3D LUT编码中的差值处理(例如三线性或四面体)。
如此处所述,图10示出了4:2:0色度格式的亮度分量与色度分量之间的相移。3DLUT估计中的亮度和色度相位对准将在此处进行描述。举例来说,根据等式(1)-(3)中的三线性插值或等式(4)-(6)中的四面体插值,一个或多个(例如每一)输出分量的3D LUT插值可使用输入信号的三个输入分量。
如图10所示及此处所述,根据一个示例,亮度分量采样位置与色度分量采样位置可能无法对准。图10描述了4:2:0色度格式。虽然分量转换参照图10和/或4:2:0色度格式进行描述,此处所述的示例可用于4:1:0色度格式、4:2:2:0色度格式、4:4:4色度格式等等。虽然图10参照YCbCr格式进行描述,也可使用其他颜色度格式。
在图10中,样本位置L0-L15可指示亮度分量的采样位置。在图10中,L可指示亮度分量,而数字(例如0-15)可指示采样位置。采样位置C0-C3可指示一个或多个(例如两个)交叠色度分量(例如红色色度差分量和蓝色色度差分量)的采样位置。在图10中,C可指示一个或多个(例如两个)交叠色度分量(例如红色色度差分量和蓝色色度差分量),而数字(例如0-3)可指示采样位置。
图10可以是具有x-轴和y-轴的网格,其中x-轴可以是水平轴而y-轴可以是垂直轴。采样位置L0-L15的亮度分量可具有x坐标和y坐标。采样位置C0-C3的一个或多个(例如两个)交叠色度分量(例如红色色度差分量和蓝色色度差分量)可具有x坐标和y坐标。
采样位置不对准会降低3D LUT估计的精确度。举例来说,如图10所示,亮度分量采样位置L0-L15未与色度分量采样位置C0-C3交叠。采样位置不对准会出现在色度格式(例如4:2:0或4:2:2)中,其中色度分量在两个方向(例如对于4:2:0,针对每四个亮度分量有一个红色色度差分量样本和一个蓝色色度差分量样本)被子采样或在水平方向(例如4:2:2)被子采样。作为色度子采样处理的结果,亮度和色度位置的样本位置会变为不对准。
对于亮度分量插值,一个或多个色度分量(例如红色色度差分量和/或蓝色色度差分量)的多个采样位置可用于将色度分量向亮度分量样本位置对准。对于色度分量插值,亮度分量的一个或多个采样位置可用于将亮度分量向色度分量采样位置对准。一旦对准,颜色分量转换模型(例如3D LUT)可用于将分量(例如亮度或色度)从一个颜色空间转换到另一个颜色空间。将分量从一个颜色空间转换到另一个颜色空间可以是在第二颜色空间中确定该分量(例如使用第一颜色空间中的分量(例如在特定采样位置))。
视频编码设备可接收可伸缩比特流。可伸缩比特流可包括基层和增强层。所述基层可包括图片且所述基层可与第一颜色空间关联。所述增强层可与第二颜色空间关联。
3D LUT转换的输入可在一个颜色空间(例如BT.709)中以信号传递分量(例如(y,u,v)),而3D LUT转换的输出可以是另一颜色空间(例如BT.2020)中的分量(例如(Y,U,V))。对于色度分量转换,亮度分量y可被调整为y’以向色度分量采样位置对准。插值滤波器可以为等式(17)-(18)。色度分量的3D LUT转换的输入可以是(y’,u,v),而其输出可以是U或V。插值滤波器可以是2抽头滤波器[1,1]、4抽头滤波器和/或诸如此类。
视频编码设备可接收与第一颜色空间关联的图片。所述图片可包括第一采样位置的第一色度分量、第一采样位置的第二色度分量、第二采样位置的亮度分量、第三采样位置的亮度分量、第四采样位置的亮度分量、以及第五采样位置的亮度分量。所示视频编码设备可将第一插值滤波器应用于下列中的两者或更多者以确定第一采样位置的亮度分量:第二采样位置的亮度分量、第三采样位置的亮度分量、第四采样位置的亮度分量、以及第五采样位置的亮度分量,其中所述第一采样位置的亮度分量与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一色度分量、第一采样位置的第二色度分量、以及第一采样位置的亮度分量,以将第一采样位置的第一色度分量转换到第二颜色空间。所述视频编码设备可将颜色转换模型应用于第一采样位置的第一色度分量、第一采样位置的第二色度分量、以及第一采样位置的亮度分量,以将第一采样位置的第二色度分量转换到第二颜色空间。举例来说,在使用YCbCr格式的情况下,所述第一色度分量和/或所述第二色度分量可以是红色色度差分量和/或蓝色色度差分量。举例来说,在使用YCgCo格式的情况下,所述第一色度分量和/或第二色度分量可以是绿色色度差分量和/或橙色色度差分量。应当注意的是,此处的描述适用于其他格式的颜色空间。
如图10所示,举例来说,一个或多个插值滤波器(例如等式(17)-(18)中示出的)可用于将亮度分量对准到未对准的色度分量的采样位置。一旦对准,转换模型(例如3D LUT)可用于将色度分量从第一颜色空间转换到第二颜色空间。举例来说,如果色度分量的具有相同的采样位置,则色度分量的3D LUT转换的输入可以是(y’,u,v),并且其中y’为可调整的亮度分量(例如与色度分量u,v的采样位置交叠的采样位置的亮度分量)。分量(y’,u,v)可与第一颜色空间关联。3D LUT的输出可以是U或V,其指的是第二颜色空间中的色度分量U或V相关。
插值滤波器(例如等式(17)-(18)中示出的)可用于将亮度分量对准到色度分量的采样位置,由此可使用转换模型。举例来说,依照等式(17)-(18)所描述的,色度分量的采样位置(例如采样位置C0)的亮度分量可通过使用两个或更多个亮度采样位置(例如采样位置L0、L1、L4和/或L5)的亮度分量应用插值滤波器得以确定。色度分量的采样位置可包括两个或更多个色度分量,例如红色色度差分量Cr0和对应的蓝色色度差分量Cb0。采样位置C0的亮度分量和采样位置C0的色度分量可用于将位置C0的色度分量从第一颜色空间转换到第二颜色空间。
举例来说,如此处所述,在将色度分量从一个颜色空间转换到另一颜色空间时,色度分量采样位置的亮度分量值可得以确定。为了确定色度分量的采样位置(例如采样位置C0)的亮度分量值,视频编码设备可使用4插头插值滤波器或2插头插值滤波器。所述视频编码设备可根据图10中的x-y轴上的色度分量的采样位置来确定使用哪个插值滤波器。举例来说,所述视频编码设备可确定采样位置的色度分量的x和y分量。所述视频编码设备接着可将色度分量采样位置的x坐标除以2,且所述视频编码设备可将色度分量采样位置的y坐标除以2。如果将x坐标除以2的余数为1,且将y坐标除以2的余数为1,则所述视频编码设备可使用等式(17)或等式(18)中的插值滤波器来确定色度分量的采样位置的亮度分量。如果将x坐标除以2的余数为0,而将y坐标除以2的余数为1,则所述视频编码设备可使用等式(17)或等式(18)中的插值滤波器来确定色度分量的采样位置的亮度分量。如果将x坐标除以2的余数为1,而将y坐标除以2的余数为0,则所述视频编码设备可使用等式(17)或等式(18)中的插值滤波器来确定色度分量的采样位置的亮度分量。如果将x坐标除以2的余数为0,且将y坐标除以2的余数为0,则所述视频编码设备可使用等式(17)或等式(18)中的插值滤波器来确定色度分量的采样位置的亮度分量。视频编码设备可交替使用等式(17)-等式(18)来确定(例如对准)色度分量的采样位置的亮度分量的值。
举例来说,采样位置C0的亮度分量可使用4插头滤波器来确定,如等式(17)所示:
L(C0)=((L0+L4)*3+(L1+L5)+4)>>3 (17)
其中>>3意为((L0+L4)*3+(L1+L5)+4)之和除以23,和/或>>3使用右移3位来计算。如果((L0+L4)*3+(L1+L5)+4)之和不为整数,则可忽略小数之后再以该和除以23。在等式17中,为了在采样位置C0确定亮度分量,视频编码设备可应用插值滤波器,其中将采样位置L0的亮度分量与不同的采样位置L4的亮度分量相加以确定其和。所述视频编码设备接着可将该和乘以3,并且将乘后的和与采样位置L1的亮度分量、采样位置L5的亮度分量以及4相加以确定最终之和。所述最终之和的整数和可被确定。所述视频编码设备接着可将该整数和除以8以确定采样位置C0的亮度分量。采样位置C1、C2和C3的亮度分量可采用适当的亮度分量使用等式17来确定。
采样位置C0的亮度分量可使用2插头滤波器来确定。等式(18)中提供了可使用的2插头滤波器的示例:
L(C0)=(L0+L4+1)>>1 (18)
其中>>1意为(L0+L4+1)之和除以21,和/或>>1使用右移1位来计算。如果(L0+L4+1)之和不为整数,则可忽略小数之后再以该和除以21。在等式18中,为了确定采样位置C0的亮度分量,视频编码设备可应用2插头插值滤波器,其中将采样位置L0的亮度分量与另一采样位置L4的亮度分量及1相加以确定其和。最终之和的整数和可被确定。所述视频编码设备接着可将所述和的整数值除以2以确定采样位置C0的亮度分量。采样位置C1、C2和C3的亮度分量可采用适当的亮度分量使用等式18来确定。
所述视频编码设备可使用第一颜色空间中的采样位置C0的亮度分量转换(例如确定)第二颜色空间中的采样位置C0的色度分量,以及使用转换模型(例如此处所述的3DLUT)转换(例如确定)第一颜色空间中的采样位置C0的两个色度分量。如上所述,采样位置C0的亮度分量可使用插值滤波器来确定(如等式(17)或(18)中所示)。
视频编码设备可接收与第一颜色空间关联的图片。所述图片可包括第一采样位置的亮度分量、第二采样位置的第一色度分量、第二采样位置的第二色度分量、第三采样位置的第一色度分量、第三采样位置的第二色度分量、第四采样位置的第一色度分量、第四采样位置的第二色度分量、第五采样位置的第一色度分量、以及第五采样位置的第二色度分量。所述视频编码设备可将插值滤波器应用于下列中的两者或更多者以确定第一采样位置的第一色度分量:第二采样位置的第一色度分量、第三采样位置的第一色度分量、第四采样位置的第一色度分量、以及第五采样位置的第一色度分量,其中所述第一采样位置的第一色度分量与第一颜色空间关联。所述视频编码设备可将插值滤波器应用于下列中的两者或更多者以确定第一采样位置的第二色度分量:第二采样位置的第二色度分量、第三采样位置的第二色度分量、第四采样位置的第二色度分量、以及第五采样位置的第二色度分量,其中所述第一采样位置的第二色度分量与第一颜色空间关联。所述视频编码设备可将颜色转换模型应用于第一采样位置的亮度分量、第一采样位置的第一色度分量、以及第一采样位置的第二色度分量,以将第一采样位置的亮度分量转换到第二颜色空间。所述第一色度分量和/或第二色度分量可以是红色色度差分量和/或蓝色色度差分量。
如图10所示,举例来说,一个或多个插值滤波器(例如等式(19)-(22)中示出的)可用于将一个或多个色度分量对准到未对准的亮度分量的采样位置。一旦对准,转换模型(例如3D LUT)可用于将亮度分量从第一颜色空间转换到第二颜色空间。亮度分量的3D LUT转换的输入可以是(y,u’,v’),其中u’和v’为调整后的色度分量(例如与亮度分量y的采样位置交叠的采样位置的色度分量)。分量(y,u’,v’)可与第一颜色空间关联。3D LUT的输出为Y,其可与第二颜色空间中的亮度分量相关。
插值滤波器(例如等式(19)-(22)中示出的)可用于将色度分量对准到亮度分量的采样位置,由此可使用转换模型。举例来说,亮度分量的采样位置(例如采样位置L4、L5、L8和/或L9)的色度分量可通过使用两个或更多个采样位置(例如采样位置C0、C1、C2和/或C3)的色度分量应用重采样滤波器来确定。由此,分量的重采样后的值(例如另一采样位置的分量的值)可使用多个其他采样位置的该分量来确定。举例来说,图10中采样位置L4、L5、L8和/或L9的亮度分量可使用3D LUT来插值。为了对采样位置L4、L5、L8和/或L9的亮度分量插值,可确定采样位置L4、L5、L8和/或L9的色度分量(例如u,v)。如此处所述,采样位置L4、L5、L8和L9的色度分量可使用一个或多个重采样滤波器(例如等式(19)-(22))来导出。采样位置L4、L5、L8和/或L9的亮度分量及采样位置L4、L5、L8和/或L9的色度分量可用于将位置L4、L5、L8和/或L9的亮度分量从第一颜色空间转换到第二颜色空间。
举例来说,如此处所讨论的,在将亮度分量从一个颜色空间转换到另一颜色空间时,亮度分量采样位置的色度分量(例如红色色度差分量和/或蓝色色度差分量)的值可被确定。为了确定亮度分量的采样位置(例如采样位置L0、L1、L4、L5)的色度分量的值,视频编码设备可使用4插头插值滤波器或2插头插值滤波器。所述视频编码设备可根据图10中的x-y轴上的亮度分量的采样位置来确定使用哪个插值滤波器。举例来说,所述视频编码设备可确定采样位置的亮度分量的x和y分量。所述视频编码设备接着可将亮度分量采样位置的x坐标除以2,且所述视频编码设备可将亮度分量采样位置的y坐标除以2。如果将x坐标除以2的余数为0,而将y坐标除以2的余数为1,则所述视频编码设备可使用等式(19)中的插值滤波器来确定亮度分量的采样位置的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如图10所示,等式(19)可用于确定亮度分量采样位置L4、L6、L12和L14的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如果将x坐标除以2的余数为1,且将y坐标除以2的余数为1,则所述视频编码设备可使用等式(20)中的插值滤波器来确定亮度分量的采样位置的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如图10所示,等式(20)可用于确定亮度分量采样位置L5、L7、L13和L15的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如果将x坐标除以2的余数为0,且将y坐标除以2的余数为0,则所述视频编码设备可使用等式(21)中的插值滤波器来确定亮度分量的采样位置的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如图10所示,等式(21)可用于确定亮度分量采样位置L0、L2、L8和L10的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如果将x坐标除以2的余数为1,而将y坐标除以2的余数为0,则所述视频编码设备可使用等式(22)中的插值滤波器来确定亮度分量的采样位置的色度分量(例如红色色度差分量和/或蓝色色度差分量)。如图10所示,等式(22)可用于确定亮度分量采样位置L1、L3、L9和L11的色度分量(例如红色色度差分量和/或蓝色色度差分量)。
采样位置L4的色度分量可使用等式(19)导出:
C(L4)=(C0*3+C2+2)>>2 (19)
其中>>2意为(C0*3+C2+2)之和除以22,和/或>>2使用右移2位来计算。如果(C0*3+C2+2)之和不为整数,则可忽略小数之后再以该和除以22。在等式(19)中,为了确定采样位置L4的色度分量,视频编码设备可应用插值滤波器,其中采样位置C0的色度分量(例如Cr0或Cb0)乘以3,之后该和与另一色度采样位置C2的色度分量(例如Cr2或Cb2)相加,且其和与2相加以确定最终之和。所述最终之和的整数值可被确定。所述插值滤波器可将该整数和除以4以确定采样位置L4的色度分量。采样位置L4的多个色度分量(例如cr和cb、u和v等等)的值可使用插值滤波器(例如等式(19))来确定。其他采样位置(例如采样位置L6、L14、L112)的色度分量可使用适当的采样位置的色度分量使用等式(19)来确定。
采样位置L8的色度分量可使用等式(20)来导出。采样位置L8的色度分量可与导出的采样位置L4的色度分量相似。等式(20)提供如下:
C(L8)=(C0+C2*3+2)>>2 (20)
其中>>2意为(C0+C2*3+2)之和除以22,和/或>>2使用右移2位来计算。如果(C0*3+C2+2)之和不为整数,则可忽略小数之后再以该和除以22。在等式(20)中,为了确定采样位置L8的色度分量,视频编码设备可应用插值滤波器,其中采样位置C2的色度分量(例如Cr2或Cb2)乘以3,之后该和与另一色度采样位置C0的色度分量(例如Cr0或Cb0)相加,且其和与2相加以确定最终之和。所述最终之和的整数值可被确定。所述插值滤波器可将该整数和除以4以确定采样位置L8的色度分量。采样位置L8、L2、L10的色度分量可采用适当的色度分量的采样位置使用等式(20)来确定。采样位置L8的多个色度分量(例如Cr和Cb、u和v等等)的值可使用插值滤波器(例如等式(20))来确定。
采样位置L5的色度分量可使用等式(21)来确定,如下:
C(L5)=((C0+C1)*3+(C2+C3)+4)>>3 (21)
其中>>3意为((C0+C1)*3+(C2+C3)+4)之和除以23,和/或>>3使用右移3位来计算。如果((C0+C1)*3+(C2+C3)+4)之和不为整数,则可忽略小数之后再以该和除以23。在等式(21)中,为了确定采样位置L5的色度分量,视频编码设备可应用插值滤波器,其中采样位置C0的色度分量(例如Cr0或Cb0)与另一采样位置C1的色度分量(例如Cr1或Cb1)相加。所述视频编码设备可将采样位置C1与采样位置C0之和乘以3,接着将乘后的和与采样位置C2的色度分量(例如Cr2或Cb2)、采样位置C3的色度分量(例如Cr3或Cb3)及4相加以确定最终之和。该最终之和的整数值可被确定。所述视频编码设备可将该整数值除以8以确定采样位置L5的色度分量。采样位置L7、L13、L15的色度分量可采用适当的色度分量的采样位置使用等式(21)来确定。采样位置L5的多个色度分量(例如Cr和Cb、u和v等等)的值可使用插值滤波器(例如等式(21))来确定。
针对采样位置L9的亮度分量的导出的色度分量可与针对采样位置L5的亮度分量的导出的色度分量相似。采样位置L9的色度分量可使用等式(22)来确定,如下:
C(L9)=((C0+C1)+(C2+C5)*3+4>>3 (22)
其中>>3意为((C0+C1)+(C2+C5)*3+4)之和除以23,和/或>>3使用右移3位来计算。如果((C0+C1)+(C2+C5)*3+4)之和不为整数,则可忽略小数之后再以该和除以23。在等式(22)中,为了确定采样位置L9的色度分量,视频编码设备可应用插值滤波器,其中采样位置C0的色度分量C0(例如Cr0或Cb0)与采样位置C1的色度分量C1(例如Cr1或Cb1)相加。所述视频编码设备可将采样位置C2的色度分量(Cr2或Cb2)与另一采样位置C5的色度分量(例如Cr5或Cb5)相加。所述视频编码设备可将采样位置C2的色度分量与采样位置C5的色度分量之和乘以3,并且将乘后的和与采样位置C0的色度分量与采样位置C1的色度分量之和及4相加以确定最终之和。该最终之和的整数值可被确定。所述视频编码设备接着可将该整数值除以8以确定采样位置L9的色度分量。采样位置L11、L1、L3的色度分量可采用适当的色度分量采样位置使用等式(22)来确定。
用于采样位置L4和L8的亮度分量的插值滤波器可以是2插头滤波器,例如分别为2插头滤波器[1,3]和[3,1]。举例来说,用于采样位置L4和L8的亮度分量的插值滤波器可以分别为参照等式(19)和等式(20)描述的插值滤波器。用于采样位置L5和L9的亮度分量的插值滤波器可以是4插头滤波器,例如分别为4插头滤波器[3,3,1,1]和[1,1,3,3]。举例来说,用于采样位置L5和L9的亮度分量的插值滤波器可以分别为参照等式(21)和等式(22)描述的插值滤波器。
所述视频编码设备可被配置成将第一插值滤波器应用于第一采样位置的色度分量以及将第二插值滤波器应用于第二采样位置的色度分量,诸如此类。举例来说,所述视频编码设备可被配置成将等式(17)-(18)中的一者或多者应用于一个或多个采样位置的一个或多个两交叠色度分量(例如红色色度差分量和/或蓝色色度差分量)。举例来说,所述视频编码设备可将等式(17)应用于第一采样位置的色度分量,然后将等式(18)应用于第二采样位置的色度分量,并且接着将等式(17)应用于第三采样位置的色度分量,诸如此类。类似地,所述视频编码设备可被配置成将第一插值滤波器应用于第一采样位置的亮度分量以及将第二插值滤波器应用于第二采样位置的亮度分量,诸如此类。举例来说,所述视频编码设备可被配置成将等式(19)-(22)中的一者或多者应用于一个或多个采样位置的亮度分量。举例来说,所述视频编码设备可将等式(19)应用于第一采样位置的亮度分量,将等式(20)应用于第二采样位置的亮度分量,将等式(21)应用于第三采样位置的亮度分量,将等式(22)应用于第四采样位置的亮度分量,诸如此类。
图11A是示例通信系统1100的图示,在该示例通信系统1100中可实施和/或使用一个或多个所公开的实施方式。该通信系统1100可以是将诸如语音、数据、视频、消息发送、广播等之类的内容提供给多个无线用户的多接入系统。该通信系统1100可以通过系统资源(包括无线带宽)的共享使得多个无线用户能够访问这些内容。例如,该通信系统100可以使用一种或多种信道接入方法,例如码分多址(CDMA)、时分多址(TDMA)、频分多址(FDMA)、正交FDMA(OFDMA)、单载波FDMA(SC-FDMA)等等。
如图11A所示,通信系统1100可以包括无线发射/接收单元(WTRU)1102a、1102b、1102c和/或1102d(统称或合称为WTRU 1102)、无线电接入网(RAN)1103/1104/1105、核心网1106/1107/1109、公共交换电话网(PSTN)1108、因特网1110和其他网络1112,但可以理解可实施任意数量的WTRU、基站、网络和/或网络元件。WTRU 1102a、1102b、1102c和/或102d中的每一个可以是被配置成在无线环境中运行和/或通信的任何类型的装置。作为示例,WTRU1102a、1102b、1102c和/或102d可以被配置成发送和/或接收无线信号,并且可以包括用户设备(UE)、移动站、固定或移动订户单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能电话、便携式电脑、上网本、个人计算机、无线传感器、消费电子产品等等。
通信系统1100还可以包括基站1114a和基站1114b。基站1114a、1114b中的每一个可以是被配置成与WTRU 1102a、1102b、1102c和/或102d中的至少一者无线对接,以便于接入一个或多个通信网络(例如,核心网络1106/1107/1109、因特网1110和/或网络1112)的任何类型的装置。例如,基站1114a和/或114b可以是基站收发信站(BTS)、节点B、e节点B、家用节点B、家用e节点B、站点控制器、接入点(AP)、无线路由器等。尽管基站1114a、1114b每个均被描述为单个元件,但是可以理解基站1114a、1114b可以包括任何数量的互连基站和/或网络元件。
基站1114a可以是RAN 1103/1104/1105的一部分,该RAN还可以包括其他基站和/或网络元件(未示出),诸如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。基站1114a和/或基站1114b可以被配置成发送和/或接收特定地理区域内的无线信号,该特定地理区域可以被称作小区(未示出)。小区还可以被划分成小区扇区。例如与基站1114a相关联的小区可以被划分成三个扇区。由此,在一种实施方式中,基站1114a可以包括三个收发信机,即针对所述小区的每个扇区都有一个收发信机。在另一实施方式中,基站1114a可以使用多输入多输出(MIMO)技术,并且因此可以使用针对小区的每个扇区的多个收发信机。
基站1114a和/或114b可以通过空中接口1115/1116/1117与WTRU 1102a、1102b、1102c和/或102d中的一者或多者通信,该空中接口115/116/117可以是任何合适的无线通信链路(例如,射频(RF)、微波、红外(IR)、紫外(UV)、可见光等)。空中接口1115/1116/1117可以使用任何合适的无线电接入技术(RAT)来建立。
更特别地,如上所述,通信系统1100可以是多接入系统,并且可以使用一种或多种信道接入方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等。例如,在RAN1 103/1104/1105中的基站1114a和WTRU 1102a、1102b、1102c可以实施诸如通用移动电信系统(UMTS)陆地无线电接入(UTRA)之类的无线电技术,其可以使用宽带CDMA(WCDMA)来建立空中接口1115/1116/1117。WCDMA可以包括诸如高速分组接入(HSPA)和/或演进型HSPA(HSPA+)的通信协议。HSPA可以包括高速下行链路分组接入(HSDPA)和/或高速上行链路分组接入(HSUPA)。
在另一实施方式中,基站1114a和WTRU 1102a、1102b和/或1102c可以实施诸如演进型UMTS陆地无线电接入(E-UTRA)之类的无线电技术,其可以使用长期演进(LTE)和/或高级LTE(LTE-A)来建立空中接口1115/1116/1117。
在其他实施方式中,基站1114a和WTRU 1102a、1102b和/或1102c可以实施诸如IEEE 802.16(即,全球微波互联接入(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000EV-DO、临时标准2000(IS-2000)、临时标准95(IS-95)、临时标准856(IS-856)、全球移动通信系统(GSM)、增强型数据速率GSM演进(EDGE)、GSM EDGE(GERAN)之类的无线电技术。
图11A中的基站1114b可以是例如无线路由器、家用节点B、家用e节点B或者接入点,并且可以使用任何合适的RAT,以用于促进在诸如商业区、家庭、车辆、校园之类的局部区域的无线连接。基站1114b和WTRU 1102c、1102d可以实施诸如IEEE 802.11之类的无线电技术以建立无线局域网(WLAN)。在另一个实施方式中,基站114b和WTRU 1102c、1102d可以实施诸如IEEE 802.15之类的无线电技术以建立无线个域网(WPAN)。在另一个实施方式中,基站1114b和WTRU 1102c、1102d可以使用基于蜂窝的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A等)以建立微微小区(picocell)和毫微微小区(femtocell)。如图11A所示,基站1114b可以具有至因特网1110的直接连接。由此,基站1114b可不经由核心网络1106/1107/1109来接入因特网1110。
RAN 1103/1104/1105可以与核心网1106/1107/1109通信,该核心网1106/1107/1109可以是被配置成将语音、数据、应用和/或通过网际协议的语音(VoIP)服务提供到WTRU1102a、1102b、1102c和/或102d中的一者或多者的任何类型的网络。例如,核心网1106/1107/1109可以提供呼叫控制、账单服务、基于移动定位的服务、预付费呼叫、因特网连接、视频分配等,和/或执行高级安全性功能,例如用户认证。尽管图11A中未示出,可以理解RAN1103/1104/1105和/或核心网1106/1107/1109可以直接或间接地与其他RAN进行通信,这些其他RAN使用与RAN 1103/1104/1105相同的RAT或者不同的RAT。例如,除了连接到可以采用E-UTRA无线电技术的RAN 1103/1104/1105,核心网1106/1107/1109也可以与使用GSM无线电技术的其他RAN(未显示)通信。
核心网1106/1107/1109也可以用作WTRU 1102a、1102b、1102c和/或1102d接入PSTN 108、因特网1110和/或其他网络1112的网关。PSTN 1108可以包括提供普通老式电话服务(POTS)的电路交换电话网络。因特网1110可以包括使用公共通信协议的互联计算机网络及装置的全球系统,所述公共通信协议例如是传输控制协议(TCP)/网际协议(IP)因特网协议套件中的传输控制协议(TCP)、用户数据报协议(UDP)和网际协议(IP)。所述网络1112可以包括由其他服务提供方拥有和/或运营的无线或有线通信网络。例如,网络1112可以包括连接到一个或多个RAN的另一核心网,这些RAN可以使用与RAN 1103/1104/1105相同的RAT或者不同的RAT。
通信系统1100中的WTRU 1102a、1102b、1102c和/或1102d中的一些或者全部可以包括多模式能力,即WTRU 1102a、1102b、1102c和/或1102d可以包括用于通过不同的通信链路与不同的无线网络进行通信的多个收发信机。例如,图11A中显示的WTRU 1102c可以被配置成与可使用基于蜂窝的无线电技术的基站1114a进行通信,并且与可使用IEEE 802无线电技术的基站1114b进行通信。
图11B是示例WTRU 1102的系统图。如图11B所示,WTRU 1102可以包括处理器1118、收发信机1120、发射/接收元件1122、扬声器/麦克风1124、键盘1126、显示屏/触摸板1128、不可移动存储器1130、可移动存储器1132、电源1134、全球定位系统(GPS)芯片组1136和其他外围设备1138。应该理解的是,在保持与实施方式一致的情况下,WTRU 102可以包括上述元件的任何子组合。同样,实施方式设想基站1114a和1114b和/或基站1114a和1114b可以表示的节点(例如但不限于收发信机站(BTS)、节点B、站点控制器、接入点(AP)、家庭节点B、演进型家庭节点B(e节点B)、家庭演进型节点B(HeNB)、家庭演进型节点B网关、以及代理节点等等)可以包括图11B中描述的以及这里描述的元件的一些或全部。
处理器1118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其它类型的集成电路(IC)、状态机等。处理器1118可以执行信号编码、数据处理、功率控制、输入/输出处理和/或使得WTRU 1102能够运行在无线环境中的其他任何功能。处理器1118可以耦合到收发信机1120,该收发信机1120可以耦合到发射/接收元件1122。尽管图11B中将处理器118和收发信机1120描述为独立的组件,但是处理器1118和收发信机1120可以被一起集成到电子封装或者芯片中。
发射/接收元件1122可以被配置成通过空中接口1115/1116/1117将信号发送到基站(例如,基站1114a),或者从基站(例如,基站1114a)接收信号。例如,在一个实施方式中,发射/接收元件1122可以是被配置成发送和/或接收RF信号的天线。在另一个实施方式中,发射/接收元件1122可以是被配置成发送和/或接收例如IR、UV或者可见光信号的发射器/检测器。在另一个实施方式中,发射/接收元件1122可以被配置成发送和接收RF信号和光信号两者。可以理解发射/接收元件1122可以被配置成发送和/或接收无线信号的任意组合。
此外,尽管发射/接收元件1122在图11B中被描述为单个元件,但是WTRU 1102可以包括任何数量的发射/接收元件1122。更具体地,WTRU 1102可以使用MIMO技术。由此,在一个实施方式中,WTRU 1102可以包括两个或更多个发射/接收元件1122(例如,多个天线)以用于通过空中接口1115/1116/1117发射和/或接收无线信号。
收发信机1120可以被配置成对将由发射/接收元件1122发送的信号进行调制,并且被配置成对由发射/接收元件1122接收的信号进行解调。如上所述,WTRU 1102可以具有多模式能力。由此,收发信机1120可以包括多个收发信机以用于使得WTRU 1102能够经由多个RAT进行通信,例如UTRA和IEEE 802.11。
WTRU 1102的处理器1118可以被耦合到扬声器/麦克风1124、键盘1126和/或显示屏/触摸板1128(例如,液晶显示(LCD)显示单元或者有机发光二极管(OLED)显示单元),并且可以从上述装置接收用户输入数据。处理器1118还可以向扬声器/麦克风1124、键盘1126和/或显示屏/触摸板1128输出用户数据。此外,处理器1118可以访问来自任何类型的合适的存储器中的信息,以及向任何类型的合适的存储器中存储数据,所述存储器例如可以是不可移动存储器1130和/或可移动存储器1132。不可移动存储器1130可以包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或者任何其他类型的存储器存储装置。可移动存储器1132可以包括订户标识模块(SIM)卡、记忆棒、安全数字(SD)存储卡等。在其他实施方式中,处理器1118可以访问来自物理上未位于WTRU 102上(例如位于服务器或者家用计算机(未示出)上)的存储器的数据,以及在该存储器中存储数据。
处理器1118可以从电源1134接收电能,并且可以被配置成将该电能分配给WTRU1102中的其他组件和/或对至WTRU 1102中的其他组件的电能进行控制。电源1134可以是任何适用于给WTRU 1102供电的装置。例如,电源1134可以包括一个或多个干电池(镍镉(NiCd)、镍锌(NiZn)、镍氢(NiMH)、锂离子(Li-ion)等)、太阳能电池、燃料电池等。
处理器1118还可以耦合到GPS芯片组1136,该GPS芯片组1136可以被配置成提供关于WTRU 1102的当前位置的位置信息(例如,经度和纬度)。作为来自GPS芯片组1136的信息的补充或者替代,WTRU 1102可以通过空中接口1115/1116/1117从基站(例如,基站1114a、1114b)接收位置信息,和/或基于从两个或更多个相邻基站接收到的信号的定时(timing)来确定其位置。可以理解,在保持与实施方式一致性的同时,WTRU可以通过任何合适的位置确定方法来获取位置信息。
处理器1118还可以耦合到其他外围设备1138,该外围设备1138可以包括提供附加特征、功能和/或无线或有线连接的一个或多个软件和/或硬件模块。例如,外围设备1138可以包括加速度计、电子指南针(e-compass)、卫星收发信机、数字相机(用于照片或者视频)、通用串行总线(USB)端口、振动装置、电视收发信机、免持耳机、蓝牙模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏机模块、因特网浏览器等等。
图11C为根据一种实施方式的RAN 1103及核心网1106的系统图。如上所述,RAN1103可使用UTRA无线电技术通过空中接口1115与WTRU 1102a、1102b和/或1102c通信。RAN1103还可以与核心网1106进行通信。如图11C所示,RAN 1103可包括节点B 1140a、1140b和/或1140c,节点B 1140a、1140b和/或1140c每一者均可包括一个或多个用于通过空中接口1115与WTRU 1102a、1102b和/或1102c通信的收发信机。节点B 1140a、1140b和/或1140c中的每一者均可与RAN 1103中的特定小区(未示出)相关联。RAN 1103还可以包括RNC 1142a、1142b。可以理解在保持与实施方式一致性的同时,RAN 1103可以包括任意数量的节点B和RNC。
如图11C所示,节点B 1140a、1140b可以与RNC 1142a通信。此外,节点B 1140c可以与RNC 1142b通信。节点B 1140a、1140b和/或1140c可以经由Iub接口与各自的RNC 1142a、1142b通信。RNC 1142a、1142b可以经由Iur接口彼此通信。RNC 1142a、1142b的每一个可以被配置成控制其连接的各自的节点B 1140a、1140b和/或1140c。此外,RNC 1142a、1142b的每一个可以被配制成执行或支持其他功能,例如外环功率控制、负载控制、准许控制、分组调度、切换控制、宏分集、安全功能、数据加密等。
图11C中示出的核心网1106可以包括媒体网关(MGW)1144、移动交换中心(MSC)1146、服务GPRS支持节点(SGSN)1148和/或网关GPRS支持节点(GGSN)1150。尽管前述每一个元件被描述为核心网1106的一部分,但这些元件的任何一个可以由除核心网络运营方之外的实体所拥有和/或操作。
RAN 1103中的RNC 1142a可以经由IuCS接口连接到核心网1106中的MSC 1146。MSC1146可以连接到MGW 1144。MSC 1146和MGW 1144可以给WTRU 1102a、1102b和/或1102c提供对例如PSTN 108的电路交换网络的接入,以促进WTRU 1102a、1102b和/或1102c与传统路线通信装置之间的通信。
RAN 1103中的RNC 1102a还可以经由IuPS接口连接到核心网1106中的SGSN 1148。SGSN 1148可以连接到GGSN 1150。SGSN 1148和GGSN 1150可以给WTRU 1102a、1102b和/或1102c提供对例如因特网1110的分组交换网络的接入,以促进WTRU 1102a、1102b和/或102c与IP使能装置之间的通信。
如上所述,核心网1106还可以连接到网络1112,网络1112可以包括其他服务提供方拥有和/或运营的其他有线或无线网络。
图11D为根据一种实施方式的RAN 1104及核心网1107的系统图。如上所述,RAN1104可使用E-UTRA无线电技术通过空中接口1116与WTRU 1102a、1102b和/或1102c通信。RAN 1104还可以与核心网1107进行通信。
RAN 1104可包括e节点B 1160a、1160b和/或1160c,但可以理解RAN 1104可以包括任意数量的e节点B而保持与实施方式一致。e节点B 1160a、1160b和/或1160c每一者均可包括用于通过空中接口1116与WTRU 1102a、1102b和/或1102c通信的一个或多个收发信机。在一个实施方式中,e节点B 1160a、1160b和/或1160c可以实施MIMO技术。从而,例如e节点B1160a可以使用多个天线来向WTRU 1102a发射无线信号并从WTRU 1102a接收无线信号。
e节点B 1160a、1160b和/或1160c中的每一个可以与特定小区(未示出)相关联,并可被配置为处理无线电资源管理决定、切换决定、在上行链路和/或下行链路中对用户进行调度等。如图11D所示,e节点B 1160a、1160b和/或1160c可以通过X2接口互相通信。
图11D中示出的核心网1107可以包括移动性管理网关(MME)1162、服务网关1164和分组数据网(PDN)网关1166。虽然上述元件中的每一个都被描述为核心网1107的一部分,这些元件中的任何一个可被不同于核心网运营商的实体所拥有和/或操作。
MME 1162可经由S1接口连接到RAN 1104中的e节点B 1160a、1160b和/或1160c中的每一个,并可充当控制节点。例如,MME 1162可负责认证WTRU 1102a、1102b和/或1102c的用户、承载激活/去激活、在WTRU 1102a、1102b和/或1102c的初始附着期间选择特定服务网关,等等。MME 1162还可提供控制平面功能,以用于在RAN 1104和使用其它无线电技术(比如GSM或WCDMA)的其它RAN(未示出)之间进行切换。
服务网关1164可经由S1接口连接到RAN 1104中的e节点B 1160a、1160b和/或1160c中的每一个。服务网关1164可以一般地向/从WTRU 1102a、1102b和/或1102c路由并转发用户数据分组。服务网关1164还可执行其它功能,比如在e节点B间切换期间锚定用户平面、当下行链路数据对WTRU 1102a、1102b和/或1102c是可用的时触发寻呼、管理并存储WTRU 1102a、1102b和/或1102c的上下文,等等。
服务网关1164还可连接到PDN 1166,其可向WTRU 1102a、1102b和/或1102c提供到分组交换网络(比如因特网1110)的接入,以促进WTRU 1102a、1102b和/或1102c和IP使能装置之间的通信。
核心网1107可以促进与其它网络的通信。例如,核心网1107可以向WTRU 1102a、1102b和/或1102c提供到电路交换网络(比如PSTN 1108)的接入,以促进WTRU 1102a、1102b和/或1102c和传统陆线通信装置之间的通信。例如,核心网107可以包括充当核心网107与PSTN 108之间的接口的IP网关(例如IP多媒体子系统(IMS)服务器)或者可以与该IP网关通信。此外,核心网1107可以向WTRU 1102a、1102b和/或1102c提供到网络1112的接入,网络1112可包括由其他服务提供商拥有和/或操作的其它有线或无线网络。
图11E是根据一种实施方式的RAN 1105和核心网1109的系统图。RAN 1105可以是利用IEEE 802.16无线电技术通过空中接口1117与WTRU 1102a、1102b和/或1102c进行通信的接入服务网(ASN)。如将在下面详细描述的,WTRU 1102a、1102b和/或1102c、RAN 1105和核心网1109中的不同功能实体之间的通信链路可被定义为参考点。
如图11E中所示,RAN 1105可包括基站1180a、1180b和/或1180c和ASN网关1182,但可以理解在保持与实施方式一致性的同时RAN 1105可以包括任意数量的基站和ASN网关。基站1180a、1180b和/或1180c每一个可以与RAN 1105中的特定小区(未示出)相关联并且均可包括用于通过空中接口1117与WTRU 1102a、1102b和/或1102c通信的一个或多个收发信机。在一种实施方式中,基站1180a、1180b和/或1180c可以实施MIMO技术。从而,举例来讲,基站1180a可以使用多个天线来向WTRU 1102a发射无线信号并从WTRU 1102a接收无线信号。基站1180a、1180b和/或1180c还可提供移动性管理功能,比如切换触发、隧道建立、无线电资源管理、流量分类、服务质量(QoS)策略执行等。ASN网关1182可以充当流量聚集点并可负责寻呼、缓存订户简档、路由到核心网1109等。
WTRU 1102a、1102b和/或1102c与RAN 1105之间的空中接口1117可被定义为实施IEEE 802.16规范的R1参考点。此外,WTRU 1102a、1102b和/或1102c中的每一个可与核心网1109建立逻辑接口(未示出)。WTRU 1102a、1102b和/或1102c和核心网1109之间的逻辑接口可被定义为R2参考点,其可用于认证、授权、IP主机配置管理和/或移动性管理。
基站1180a、1180b和/或1180c中的每一个之间的通信链路可被定义为包括用于促进WTRU切换和基站之间的数据转移的协议的R8参考点。基站1180a、1180b和/或1180c和ASN网关1182之间的通信链路可被定义为R6参考点。R6参考点可包括用于促进基于与WTRU1102a、1102b和/或1102c中的每一个相关联的移动性事件的移动性管理的协议。
如图11E所示,RAN 1105可连接到核心网1109。RAN 1105和核心网1109之间的通信链路可被定义为例如包括用于促进数据转移和移动性管理能力的协议的R3参考点。核心网1109可包括移动性IP本地代理(MIP-HA)1184、认证授权记账(AAA)服务器1186、和网关1188。虽然上述元件中的每一个都被描述为核心网1109的一部分,但可以理解这些元件中的任何一个可被不同于核心网运营商的实体所拥有和/或操作。
所述MIP-HA负责IP地址管理,并且可使得WTRU 1102a、1102b和/或1102c在不同的ASN和/或不同的核心网络之间漫游。所述MIP-HA 1184可向WTRU 1102a、1102b和/或1102c提供到分组交换网络(例如英特网1110)的接入,以便于WTRU 1102a、1102b和/或1102c与IP使能设备之间的通信。AAA服务网其可以负责用户认证和支持用户服务。网关1188可促进与其他网络的交互。例如,网关1188可向WTRU 1102a、1102b和/或1102c提供到电路交换网络(例如PSTN 1108)的接入,以便于WTRU 1102a、1102b和/或1102c与传统陆线通信设备之间的通信。此外,网关1188向WTRU 1102a、1102b和/或1102c提供到网络1112的接入,该网络1112可包括由其他服务提供商所拥有和/或操作的其他有线或无线网络。
虽然未在图11E中示出,应当理解的是,RAN 1105可与其他ASN连接,并且核心网络1109可与其他核心网络连接。RAN 1105与其他ASN之间的通信链路可被定义为R4参考点,其可包括用于协调WTRU 1102a、1102b和/或1102c在RAN 1105与其他ASN之间的移动性的协议。核心网络1109与其他核心网络之间的通信链路可被定义为R5参考点,其可包括用于促进家用核心网络与受访核心网络之间的交互的协议。
虽然上面以特定组合的方式描述了特征和元素,但是每个特征或元素都可在没有其他特征和元素的情况下单独使用,或与其他特征和元素进行各种组合。此外,此处所述的方法可在结合至计算机可读存储介质中的计算机程序、软件或固件中实现,以由计算机或处理器执行。计算机可读介质的示例包括电子信号(通过有线或无线连接传送)和计算机可读存储媒介。计算机可读存储媒介的例子包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓存存储器、半导体存储设备、例如内置磁盘和可移动磁盘的磁媒介、磁光媒介和光媒介(例如CD-ROM盘和数字多用途盘(DVD))。与软件相关联的处理器可被用于实施在WTRU、UE、终端、基站、RNC或任何主机中使用的射频收发信机。
Claims (15)
1.一种视频编码设备,该视频编码设备包括:
处理器,被配置成:
接收与第一颜色空间关联的图片,所述第一颜色空间与第一色域关联,其中所述图片包括第一采样位置的第一分量、第二采样位置的第二分量、以及第三采样位置的所述第二分量;
将第一插值滤波器应用于所述第二采样位置的所述第二分量以及所述第三采样位置的所述第二分量,以确定所述第一采样位置的所述第二分量,其中所述第一采样位置的所述第二分量与所述第一颜色空间关联;以及
将颜色转换模型应用于所述第一采样位置的所述第一分量以及所述第一采样位置的所述第二分量,以将所述第一采样位置的所述第一分量转换到第二颜色空间,该第二颜色空间与第二色域关联。
2.根据权利要求1所述的视频编码设备,其中所述第一分量为亮度分量,而所述第二分量为第一色度分量或第二色度分量;或者其中所述第一分量为所述第一色度分量或所述第二色度分量,而所述第二分量为所述亮度分量。
3.根据权利要求1所述的视频编码设备,其中所述处理器还被配置:
将所述第二采样位置的所述第二分量、所述第三采样位置的所述第二分量以及1相加以确定和;以及
将所述和除以2。
4.根据权利要求1所述的视频编码设备,其中所述处理器还被配置成:
将所述第二采样位置的所述第二分量乘以3;
将乘后的第二采样位置的所述第二分量、所述第三采样位置的所述第二分量以及2相加以确定和;以及
将所述和除以4。
5.根据权利要求1所述的视频编码设备,其中所述图片包括第四采样位置的所述第二分量以及第五采样位置的所述第二分量;以及
其中所述处理器被配置成将所述第一插值滤波器应用于所述第二采样位置的所述第二分量、所述第三采样位置的所述第二分量、所述第四采样位置的所述第二分量、以及所述第五采样位置的所述第二分量,以确定所述第一采样位置的所述第二分量,以及所述处理器还被配置成:
将所述第二采样位置的所述第二分量以及所述第三采样位置的所述第二分量相加以确定第一和;
将所述第四采样位置的所述第二分量以及所述第五采样位置的所述第二分量相加以确定第二和;
将所述第二和乘以3以确定第三和;
将所述第一和、所述第三和以及4相加以确定第四和;以及
将所述第四和除以8。
6.根据权利要求1所述的视频编码设备,其中所述图片包括所述第二采样位置的第三分量以及所述第三采样位置的所述第三分量,其中所述第一分量为亮度分量,所述第二分量为第一色度分量,而所述第三分量为第二色度分量,并且其中所述处理器还被配置成:
将所述第一插值滤波器应用于所述第二采样位置的所述第三分量以及所述第三采样位置的所述第三分量,以确定所述第一采样位置的所述第三分量,其中所述第一采样位置的所述第三分量与所述第一颜色空间关联;以及
将所述颜色转换模型应用于所述第一采样位置的所述第一分量、所述第一采样位置的所述第二分量以及所述第一采样位置的所述第三分量,以将所述第一采样位置的所述第一分量转换到所述第二颜色空间。
7.根据权利要求1所述的视频编码设备,其中所述图片包括所述第一采样位置的第三分量,并且其中所述处理器还被配置成:
将所述颜色转换模型应用于所述第一采样位置的所述第一分量、所述第一采样位置的所述第三分量以及所述第一采样位置的所述第二分量,以将所述第一采样位置的所述第一分量转换到所述第二颜色空间。
8.根据权利要求7所述的视频编码设备,其中所述第一分量为第一色度分量,所述第二分量为亮度分量,而所述第三分量为第二色度分量;或者其中所述第一分量为所述第二色度分量,所述第二分量为所述亮度分量,而所述第三分量为所述第一色度分量。
9.根据权利要求1所述的视频编码设备,其中所述图片的特征在于4:2:0色度格式或4:2:2色度格式。
10.一种视频编码方法,该视频编码方法包括:
接收与第一颜色空间关联的图片,所述第一颜色空间与第一色域关联,其中所述图片包括第一采样位置的第一分量、第二采样位置的第二分量以及第三采样位置的所述第二分量;
将第一插值滤波器应用于所述第二采样位置的所述第二分量以及所述第三采样位置的所述第二分量,以确定所述第一采样位置的所述第二分量,其中所述第一采样位置的所述第二分量与所述第一颜色空间关联;以及
将颜色转换模型应用于所述第一采样位置的所述第一分量以及所述第一采样位置的所述第二分量,以将所述第一采样位置的所述第一分量转换到第二颜色空间,该第二颜色空间与第二色域关联。
11.根据权利要求10所述的视频编码方法,其中所述第一分量为亮度分量,而所述第二分量为第一色度分量或第二色度分量;或者其中所述第一分量为所述第一色度分量或所述第二色度分量,而所述第二分量为所述亮度分量。
12.根据权利要求10所述的视频编码方法,其中所述图片包括第四采样位置的所述第二分量以及第五采样位置的所述第二分量,并且其中所述方法还包括:
将所述第一插值滤波器应用于所述第二采样位置的所述第二分量、所述第三采样位置的所述第二分量、所述第四采样位置的所述第二分量、以及所述第五采样位置的所述第二分量,以确定所述第一采样位置的所述第二分量。
13.根据权利要求10所述的视频编码方法,其中所述图片包括所述第二采样位置的第三分量以及所述第三采样位置的所述第三分量,其中所述第一分量为亮度分量,所述第二分量为第一色度分量,而所述第三分量为第二色度分量,并且其中所述方法还包括:
将所述第一插值滤波器应用于所述第二采样位置的所述第三分量以及所述第三采样位置的所述第三分量,以确定所述第一采样位置的所述第三分量,其中所述第一采样位置的所述第三分量与所述第一颜色空间关联;以及将所述颜色转换模型应用于所述第一采样位置的所述第一分量、所述第一采样位置的所述第二分量以及所述第一采样位置的所述第三分量,以将所述第一采样位置的所述第一分量转换到所述第二颜色空间。
14.根据权利要求10所述的视频编码方法,其中所述图片包括所述第一采样位置的第三分量,并且其中所述方法还包括:
将所述颜色转换模型应用于所述第一采样位置的所述第一分量、所述第一采样位置的所述第三分量以及所述第一采样位置的所述第二分量,以将所述第一采样位置的所述第一分量转换到所述第二颜色空间。
15.根据权利要求10所述的视频编码方法,其中所述图片的特征在于4:2:0色度格式或4:2:2色度格式。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361915892P | 2013-12-13 | 2013-12-13 | |
US61/915,892 | 2013-12-13 | ||
CN201480068000.3A CN105830440B (zh) | 2013-12-13 | 2014-12-12 | 使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480068000.3A Division CN105830440B (zh) | 2013-12-13 | 2014-12-12 | 使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108337519A true CN108337519A (zh) | 2018-07-27 |
CN108337519B CN108337519B (zh) | 2021-12-03 |
Family
ID=52345528
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810287571.6A Active CN108337519B (zh) | 2013-12-13 | 2014-12-12 | 视频编码设备及方法 |
CN201480068000.3A Active CN105830440B (zh) | 2013-12-13 | 2014-12-12 | 使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480068000.3A Active CN105830440B (zh) | 2013-12-13 | 2014-12-12 | 使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法 |
Country Status (9)
Country | Link |
---|---|
US (3) | US9912925B2 (zh) |
EP (1) | EP3080985B1 (zh) |
JP (3) | JP6240331B2 (zh) |
KR (2) | KR101786414B1 (zh) |
CN (2) | CN108337519B (zh) |
AU (1) | AU2014362246B2 (zh) |
MX (1) | MX358758B (zh) |
TW (1) | TWI628959B (zh) |
WO (1) | WO2015089352A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10455230B2 (en) | 2015-01-09 | 2019-10-22 | Avago Technologies International Sales Pte. Limited | Methods for improving low-cost video/image compression |
US11700395B2 (en) | 2019-06-28 | 2023-07-11 | Hfi Innovation Inc. | Method and apparatus of matrix based intra prediction in image and video processing |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9948916B2 (en) | 2013-10-14 | 2018-04-17 | Qualcomm Incorporated | Three-dimensional lookup table based color gamut scalability in multi-layer video coding |
US10531105B2 (en) | 2013-12-17 | 2020-01-07 | Qualcomm Incorporated | Signaling partition information for 3D lookup table for color gamut scalability in multi-layer video coding |
US9756337B2 (en) | 2013-12-17 | 2017-09-05 | Qualcomm Incorporated | Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding |
US10448029B2 (en) * | 2014-04-17 | 2019-10-15 | Qualcomm Incorporated | Signaling bit depth values for 3D color prediction for color gamut scalability |
US10127887B2 (en) * | 2015-01-14 | 2018-11-13 | Intel Corporation | Acceleration of color conversion |
US11102495B2 (en) * | 2016-05-17 | 2021-08-24 | Qualcomm Incorporated | Methods and systems for generating and processing content color volume messages for video |
US11778231B2 (en) | 2016-05-26 | 2023-10-03 | Vid Scale, Inc. | Geometric conversion for 360-degree video coding |
US10225536B2 (en) | 2016-07-01 | 2019-03-05 | Intel Corporation | Dynamic fidelity updates for encoded displays |
US10219002B2 (en) * | 2016-07-01 | 2019-02-26 | Intel Corporation | Dynamic fidelity updates for encoded displays |
US11449256B2 (en) | 2018-05-15 | 2022-09-20 | Samsung Electronics Co., Ltd. | Method for accelerating image storing and retrieving differential latency storage devices based on access rates |
US10949087B2 (en) | 2018-05-15 | 2021-03-16 | Samsung Electronics Co., Ltd. | Method for rapid reference object storage format for chroma subsampled images |
WO2019229683A1 (en) | 2018-05-31 | 2019-12-05 | Beijing Bytedance Network Technology Co., Ltd. | Concept of interweaved prediction |
WO2020140951A1 (en) | 2019-01-02 | 2020-07-09 | Beijing Bytedance Network Technology Co., Ltd. | Motion vector derivation between color components |
KR20230157529A (ko) | 2019-04-01 | 2023-11-16 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 히스토리 기반 움직임 벡터 예측을 위한 보간 필터 사용 |
EP3935854A4 (en) | 2019-04-12 | 2022-06-01 | Beijing Bytedance Network Technology Co., Ltd. | CHROMINANCE CODING MODE DETERMINATION BASED ON MATRIX-BASED INTRA PREDICTION |
KR20210145757A (ko) | 2019-04-16 | 2021-12-02 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 인트라 코딩 모드에서의 행렬 도출 |
CN117097912A (zh) | 2019-05-01 | 2023-11-21 | 北京字节跳动网络技术有限公司 | 基于矩阵的帧内预测的上下文编码 |
CN113812150B (zh) | 2019-05-01 | 2023-11-28 | 北京字节跳动网络技术有限公司 | 使用滤波的基于矩阵的帧内预测 |
CN117412039A (zh) | 2019-05-22 | 2024-01-16 | 北京字节跳动网络技术有限公司 | 使用上采样的基于矩阵的帧内预测 |
WO2020239017A1 (en) | 2019-05-31 | 2020-12-03 | Beijing Bytedance Network Technology Co., Ltd. | One-step downsampling process in matrix-based intra prediction |
WO2020244610A1 (en) | 2019-06-05 | 2020-12-10 | Beijing Bytedance Network Technology Co., Ltd. | Context determination for matrix-based intra prediction |
WO2020253864A1 (en) | 2019-06-21 | 2020-12-24 | Beijing Bytedance Network Technology Co., Ltd. | Selective enablement of adaptive in-loop color-space transform in video coding |
EP3997881A4 (en) | 2019-08-20 | 2022-09-14 | Beijing Bytedance Network Technology Co., Ltd. | SELECTIVE USE OF ALTERNATIVE INTERPOLATION FILTERS IN VIDEO PROCESSING |
EP4042689A4 (en) | 2019-10-28 | 2023-06-07 | Beijing Bytedance Network Technology Co., Ltd. | SIGNALING AND SYNTAX ANALYSIS BASED ON A COLOR COMPONENT |
CN115152219A (zh) | 2019-11-07 | 2022-10-04 | 抖音视界有限公司 | 视频编解码的自适应环内颜色空间变换的量化特性 |
CN112017105B (zh) * | 2020-08-13 | 2024-03-26 | 深圳市洲明科技股份有限公司 | 颜色校正fpga实现装置和方法、颜色校正设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5737032A (en) * | 1995-09-05 | 1998-04-07 | Videotek, Inc. | Serial digital video processing with concurrent adjustment in RGB and luminance/color difference |
US20080175497A1 (en) * | 2007-01-23 | 2008-07-24 | Segall Christopher A | Methods and Systems for Multiplication-Free Inter-Layer Image Prediction |
CN101379511A (zh) * | 2005-03-18 | 2009-03-04 | 夏普株式会社 | 具有画面级调整的扩展空间可缩放性的方法和系统 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583656A (en) | 1992-12-31 | 1996-12-10 | Eastman Kodak Company | Methods and apparatus for attaching compressed look-up table (LUT) representations of N to M-dimensional transforms to image data and for processing image data utilizing the attached compressed LUTs |
JP2933487B2 (ja) * | 1994-07-15 | 1999-08-16 | 松下電器産業株式会社 | クロマフォーマット変換の方法 |
US5712687A (en) * | 1996-04-25 | 1998-01-27 | Tektronix, Inc. | Chrominance resampling for color images |
US6400843B1 (en) * | 1999-04-22 | 2002-06-04 | Seiko Epson Corporation | Color image reproduction with accurate inside-gamut colors and enhanced outside-gamut colors |
US6301393B1 (en) | 2000-01-21 | 2001-10-09 | Eastman Kodak Company | Using a residual image formed from a clipped limited color gamut digital image to represent an extended color gamut digital image |
RU2190306C2 (ru) | 2000-05-10 | 2002-09-27 | Государственное унитарное предприятие "Калужский научно-исследовательский институт телемеханических устройств" | Способ обработки цветного полутонового изображения с использованием векторной диффузии ошибки цвета и устройство для его осуществления |
US7929610B2 (en) * | 2001-03-26 | 2011-04-19 | Sharp Kabushiki Kaisha | Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding |
US6741263B1 (en) * | 2001-09-21 | 2004-05-25 | Lsi Logic Corporation | Video sampling structure conversion in BMME |
US7643675B2 (en) | 2003-08-01 | 2010-01-05 | Microsoft Corporation | Strategies for processing image information using a color information data structure |
KR100552695B1 (ko) | 2003-11-20 | 2006-02-20 | 삼성전자주식회사 | 칼라영상의 색조절방법 및 장치 |
US7659911B2 (en) | 2004-04-21 | 2010-02-09 | Andreas Wittenstein | Method and apparatus for lossless and minimal-loss color conversion |
CN101005620B (zh) | 2004-09-03 | 2011-08-10 | 微软公司 | 为隔行扫描和逐行扫描视频编码和解码宏块和运动信息中的革新 |
CN1859576A (zh) | 2005-10-11 | 2006-11-08 | 华为技术有限公司 | 对空间分层编码视频图象的上采样方法及其系统 |
JP5039142B2 (ja) * | 2006-10-25 | 2012-10-03 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 品質スケーラブルな符号化方法 |
JP2008211310A (ja) | 2007-02-23 | 2008-09-11 | Seiko Epson Corp | 画像処理装置および画像表示装置 |
US8625676B2 (en) | 2007-06-29 | 2014-01-07 | Pai Kung Limited Liability Company | Video bitstream decoding using least square estimates |
US7684084B2 (en) * | 2007-09-25 | 2010-03-23 | Xerox Corporation | Multiple dimensional color conversion to minimize interpolation error |
US8446961B2 (en) * | 2008-07-10 | 2013-05-21 | Intel Corporation | Color gamut scalability techniques |
US9538176B2 (en) | 2008-08-08 | 2017-01-03 | Dolby Laboratories Licensing Corporation | Pre-processing for bitdepth and color format scalable video coding |
WO2010103433A1 (en) | 2009-03-09 | 2010-09-16 | Koninklijke Philips Electronics N.V. | Multi primary conversion |
US9185422B2 (en) | 2010-07-15 | 2015-11-10 | Qualcomm Incorporated | Variable localized bit-depth increase for fixed-point transforms in video coding |
EP2622857A1 (en) | 2010-10-01 | 2013-08-07 | Dolby Laboratories Licensing Corporation | Optimized filter selection for reference picture processing |
CN101977316B (zh) * | 2010-10-27 | 2012-07-25 | 无锡中星微电子有限公司 | 一种可伸缩编码方法 |
GB2495468B (en) | 2011-09-02 | 2017-12-13 | Skype | Video coding |
US11184623B2 (en) | 2011-09-26 | 2021-11-23 | Texas Instruments Incorporated | Method and system for lossless coding mode in video coding |
KR20130068823A (ko) | 2011-12-16 | 2013-06-26 | 삼성전자주식회사 | 영상 신호 처리를 위한 방법 및 장치 |
WO2013106190A1 (en) | 2012-01-09 | 2013-07-18 | Dolby Laboratories Licensing Corporation | Hybrid reference picture reconstruction method for single and multiple layered video coding systems |
FR2989856B1 (fr) * | 2012-04-23 | 2014-11-28 | Assistance Tech Et Etude De Materiels Electroniques | Compression/decompression progressive d'un flux numerique video comprenant au moins une image entrelacee |
JP5926465B2 (ja) * | 2013-01-02 | 2016-05-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 向上ダイナミックレンジをもつ超高精細度ビデオ信号のための後方互換な符号化 |
US9673936B2 (en) | 2013-03-15 | 2017-06-06 | Google Inc. | Method and system for providing error correction to low-latency streaming video |
KR102257783B1 (ko) | 2013-04-08 | 2021-05-28 | 돌비 인터네셔널 에이비 | Lut를 인코딩하는 방법, lut를 디코딩하는 방법 및 대응하는 장치들 |
KR20190112854A (ko) | 2013-09-20 | 2019-10-07 | 브이아이디 스케일, 인크. | 색역 확장성을 위한 3d 룩업 테이블 코딩을 제공하기 위한 시스템 및 방법 |
US9756337B2 (en) | 2013-12-17 | 2017-09-05 | Qualcomm Incorporated | Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding |
-
2014
- 2014-12-12 JP JP2016539123A patent/JP6240331B2/ja active Active
- 2014-12-12 EP EP14825514.4A patent/EP3080985B1/en active Active
- 2014-12-12 AU AU2014362246A patent/AU2014362246B2/en active Active
- 2014-12-12 MX MX2016007619A patent/MX358758B/es active IP Right Grant
- 2014-12-12 CN CN201810287571.6A patent/CN108337519B/zh active Active
- 2014-12-12 US US14/568,807 patent/US9912925B2/en active Active
- 2014-12-12 KR KR1020167018888A patent/KR101786414B1/ko active IP Right Grant
- 2014-12-12 TW TW103143487A patent/TWI628959B/zh active
- 2014-12-12 WO PCT/US2014/069898 patent/WO2015089352A1/en active Application Filing
- 2014-12-12 KR KR1020177027095A patent/KR20170113713A/ko not_active IP Right Cessation
- 2014-12-12 CN CN201480068000.3A patent/CN105830440B/zh active Active
-
2017
- 2017-11-02 JP JP2017213065A patent/JP6463820B2/ja active Active
-
2018
- 2018-01-19 US US15/875,638 patent/US10440340B2/en active Active
-
2019
- 2019-01-04 JP JP2019000306A patent/JP2019050640A/ja not_active Ceased
- 2019-08-21 US US16/546,578 patent/US20190379870A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5737032A (en) * | 1995-09-05 | 1998-04-07 | Videotek, Inc. | Serial digital video processing with concurrent adjustment in RGB and luminance/color difference |
CN101379511A (zh) * | 2005-03-18 | 2009-03-04 | 夏普株式会社 | 具有画面级调整的扩展空间可缩放性的方法和系统 |
US20080175497A1 (en) * | 2007-01-23 | 2008-07-24 | Segall Christopher A | Methods and Systems for Multiplication-Free Inter-Layer Image Prediction |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10455230B2 (en) | 2015-01-09 | 2019-10-22 | Avago Technologies International Sales Pte. Limited | Methods for improving low-cost video/image compression |
US11700395B2 (en) | 2019-06-28 | 2023-07-11 | Hfi Innovation Inc. | Method and apparatus of matrix based intra prediction in image and video processing |
Also Published As
Publication number | Publication date |
---|---|
WO2015089352A1 (en) | 2015-06-18 |
CN108337519B (zh) | 2021-12-03 |
AU2014362246A1 (en) | 2016-07-07 |
MX358758B (es) | 2018-09-04 |
JP2017505028A (ja) | 2017-02-09 |
EP3080985A1 (en) | 2016-10-19 |
AU2014362246B2 (en) | 2018-01-25 |
JP2019050640A (ja) | 2019-03-28 |
MX2016007619A (es) | 2016-12-08 |
KR20160096712A (ko) | 2016-08-16 |
TWI628959B (zh) | 2018-07-01 |
TW201537992A (zh) | 2015-10-01 |
US9912925B2 (en) | 2018-03-06 |
CN105830440B (zh) | 2018-06-12 |
US20150172616A1 (en) | 2015-06-18 |
CN105830440A (zh) | 2016-08-03 |
JP6240331B2 (ja) | 2017-11-29 |
KR101786414B1 (ko) | 2017-10-17 |
US20180146181A1 (en) | 2018-05-24 |
JP6463820B2 (ja) | 2019-02-06 |
US20190379870A1 (en) | 2019-12-12 |
KR20170113713A (ko) | 2017-10-12 |
US10440340B2 (en) | 2019-10-08 |
EP3080985B1 (en) | 2023-08-02 |
JP2018038076A (ja) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105830440B (zh) | 使用插值进行亮度和色度的相位对准的色域可伸缩视频编码设备及方法 | |
US10986370B2 (en) | Combined scalability processing for multi-layer video coding | |
CN105556943B (zh) | 提供3d查找表编码以用于色域可伸缩性的系统和方法 | |
EP3090540B1 (en) | Color space conversion | |
CN104429071A (zh) | 用于多层视频编码的编解码器架构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240809 Address after: Delaware, USA Patentee after: Interactive Digital VC Holdings Country or region after: U.S.A. Address before: Delaware, USA Patentee before: VID SCALE, Inc. Country or region before: U.S.A. |
|
TR01 | Transfer of patent right |