TWI646822B - 可調整視訊編碼移動向量預測的方法及裝置 - Google Patents

可調整視訊編碼移動向量預測的方法及裝置 Download PDF

Info

Publication number
TWI646822B
TWI646822B TW106126144A TW106126144A TWI646822B TW I646822 B TWI646822 B TW I646822B TW 106126144 A TW106126144 A TW 106126144A TW 106126144 A TW106126144 A TW 106126144A TW I646822 B TWI646822 B TW I646822B
Authority
TW
Taiwan
Prior art keywords
layer
image
inter
reference image
base layer
Prior art date
Application number
TW106126144A
Other languages
English (en)
Other versions
TW201804792A (zh
Inventor
修小玉
葉言
何永
何玉文
Original Assignee
Vid衡器股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid衡器股份有限公司 filed Critical Vid衡器股份有限公司
Publication of TW201804792A publication Critical patent/TW201804792A/zh
Application granted granted Critical
Publication of TWI646822B publication Critical patent/TWI646822B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

層間移動映射資訊可被用來賦能位元流的增強層的時間移動向量預測(TMVP)。例如,可確定層間視訊塊的移動向量(MV)和參考圖像。可根據並置基礎層視訊塊來確定參考圖像。例如,參考圖像可以是並置基礎層視訊塊的參考圖像的並置層間參考圖像。可根據並置基礎層視訊塊的MV來確定MV。例如,可藉由根據基礎層和增強層間的空間比率來縮放並置基礎層視訊塊的MV和確定並置基礎層視訊塊的MV,從而確定MV。可使用層間視訊塊的MV以在增強層圖像上執行TMVP。

Description

可調整視訊編碼移動向量預測的方法及裝置
相關申請案的交叉引用
本申請案要求2012年8月29日提出的美國臨時專利申請案No.61/694,555、2012年12月7日提出的美國臨時專利申請案No.61/734,650和2013年8月16日提出的美國臨時專利申請案No.61/866,822的權益,其內容以引用的方式結合於此。
過去的二十年中,數位視訊壓縮技術有了很大發展並且被標準化,使高效的數位視訊通訊、分發和消費成為可能。大部分在商業上被廣泛應用的標準由ISO/IEC和ITU-T開發,例如MPEC-2和H.263(MPEG-4第10部分)。由於視訊壓縮技術的出現和成熟,開發出了高效視訊編碼(HEVC)。
相較於傳統的經由衛星、電纜和陸地傳輸通道的數位視訊服務,異質環境中在用戶端和網路側可使用越來越多的視訊應用,例如但不限於視訊聊天、行動視訊和串流視訊。智慧型電話、平板電腦和TV主宰著用戶端側,其中視訊可通過網際網路、行動網路及/或這兩者的結合來傳輸。為改善使用者體驗和視訊服務品質,可進行可調視訊編碼(SVC)。在SVC中,信號一旦在最高的解析度下被編碼,能從資料流的子集合中根據應用 所需並且用戶端裝置所支援的特定速率和解析度被解碼。國際視訊標準MPEC-2視訊、H.263、MPEG4可視和H.264具有支援可調性模式的工具及/或設定檔。
層間移動映射資訊用於賦能位元流的增強層的時間移動向量預測(TMVP)。舉例來說,可基於並置基礎層視訊塊來確定增強層視訊塊的參考圖像。增強層視訊塊與位元流的增強層相關聯,而並置基礎層視訊塊與位元流的基礎層相關聯。舉例來說,增強層視訊塊與增強層圖像相關聯,而並置基礎層視訊塊與基礎層圖像相關聯。可藉由選擇與增強層視訊塊的重疊面積最大為特徵的並置基礎層圖像的視訊塊來確定並置基礎層視訊塊。視訊塊可以是在位元流的任意等級的操作單元。視訊塊可以是任意大小(舉例來說,塊大小(例如,16x16)、PU、SPU等)。
可藉由確定並置基礎層視訊塊的參考圖像來確定增強層視訊塊的參考圖像。增強層視訊塊的參考圖像可以是並置基礎層視訊塊的參考圖像的並置增強層圖像。可藉由確定並置基礎層視訊塊的參考圖像、利用並置基礎層視訊塊的參考圖像來確定層間視訊塊的參考圖像並利用層間視訊塊的參考圖像來確定增強層視訊塊的參考圖像,來確定增強層視訊塊的參考圖像。層間視訊塊可以是與增強層視訊塊及/或基礎層視訊塊並置(collocate)。
可基於並置基礎層視訊塊的移動向量(MV)來確定增強層視訊塊的MV。可藉由確定並置基礎層視訊塊的MV並且根據基礎層和增強層間的空間比率來縮放並置基礎層視訊塊的MV以確定增強層視訊塊的MV,來確定增強層視訊塊的MV。
可藉由確定並置基礎層視訊塊的MV、根據基礎層和增強層 間的空間比率來縮放並置基礎層視訊塊的MV來確定層間視訊塊的MV並基於層間視訊塊的MV來預測增強層視訊塊的MV,來確定增強層視訊塊的MV。例如,可基於層間視訊塊的MV,藉由在層間視訊塊的MV上執行時間縮放來預測增強層視訊塊的MV。層間視訊塊可與增強層視訊塊及/或基礎層視訊塊並置。
可在增強層視訊塊上使用層間視訊塊的MV及/或參考圖像來執行TMVP。可根據增強層視訊塊的參考圖像及/或MV、及/或層間視訊塊的參考圖像及/或MV來解碼增強層視訊塊。
方法包括接收包含基礎層和增強層的位元流、以及利用時間移動向量預測(TMVP)來解碼被編碼的位元流中的增強層。層間參考圖像可被用作用於增強層TMVP的並置參考圖像。
利用TMVP來解碼被編碼的位元流中的增強層可包括利用TMVP來解碼增強層圖像。利用TMVP來解碼增強層圖像可包括確定層間參考圖像的移動向量(MV)域和基於層間參考圖像的MV域來解碼增強層圖像。可基於並置基礎層圖像的MV域來確定層間參考圖像的MV域。MV域包括層間參考圖像的視訊塊的參考圖像索引和MV。舉例來說,MV域可包括層間參考圖像的一個或多個視訊塊的一個或多個索引(舉例來說,根據其是P片段(slice)還是B片段(slice))和MV。確定層間參考圖像的MV域可包括確定並置基礎層圖像的壓縮MV域和根據該並置基礎層圖像的壓縮MV域來確定層間參考圖像的MV域。
確定層間參考圖像的MV域可包括確定層間參考圖像的視訊塊的MV和參考圖像。確定層間參考圖像的視訊塊的MV和參考圖像可包括基於並置基礎層視訊塊的參考圖像來確定層間視訊塊的參考圖像和基於並置基礎層視訊塊的MV來確定層間視訊塊的MV。可藉由選擇與層間參考圖像的重疊面積最大為特徵的並置基礎層圖像中的視訊塊來確定並置基礎 層視訊塊。
確定層間視訊塊的參考圖像可包括確定並置基礎層視訊塊的參考圖像和確定層間視訊塊的參考圖像。層間視訊塊的參考圖像可以是並置基礎層視訊塊的參考圖像的並置層間參考圖像。確定層間視訊塊的MV可包括確定並置基礎層視訊塊的MV和根據基礎層和增強層間的空間比率來縮放並置基礎層視訊塊的MV,以確定層間視訊塊的MV。
可基於層間視訊塊的MV域來確定增強層視訊塊的MV域。增強層視訊塊可與中間層視訊塊及/或基礎層視訊塊並置。舉例來說,可基於層間視訊塊的參考圖像(例如,可能是並置增強層圖像)來確定增強層視訊塊的參考圖像。可基於層間視訊塊的MV來確定增強層視訊塊的MV。舉例來說,可縮放(例如,時間縮放)層間視訊塊的MV來確定增強層視訊塊的MV。可基於增強層視訊塊的MV域來解碼增強層視訊塊。
方法包括接收包含基礎層和增強層的位元流和層間移動映射資訊、以及執行增強層的層間移動預測。可確定基於層間映射資訊來賦能對於增強層的層間移動預測。
可在位元流的序列級用信號發送層間映射資訊。舉例來說,層間映射資訊可以是變數(例如旗標),可在位元流的序列級用信號發送該變數。可在位元流的序列級上推斷出層間映射資訊。可經由位元流的視訊參數集合(VPS)中的變數(例如旗標)來用信號發送層間映射資訊(例如,層間映射資訊可以是位元流的VPS中的旗標)。舉例來說,可經由位元流的序列參數集合(SPS)中的變數(旗標)來用信號發送層間映射資訊(例如,層間映射資訊可以是位元流形式的SPS中的旗標)。舉例來說,可經由位元流的圖像參數集合(PPS)中的變數(旗標)來用信號發送層間映射資訊(例如,層間映射資訊可以是位元流的PPS中的旗標)。
100、200、300、400、500、600、701、702、703、800、810、900、910、1000、1010、1020、1030、1100、111011120、1200、1210、1220、1300、1310‧‧‧圖形
310‧‧‧NeighbRefPic
314、412‧‧‧PU
320、420‧‧‧CurrRefPic
322、422‧‧‧CurrRefPU
330、440‧‧‧CurrPic
332、442‧‧‧CurrPU
334‧‧‧NeighbPU
340、350、450、460、1302、1304、1312、1314‧‧‧MV
410‧‧‧ColRefPic
430‧‧‧ColPic
432‧‧‧ColPU
802、804、812、814、1002、1012、1022、1034、1102、1114、1124‧‧‧短期MV
902、904、912、914、1004、1014、1024、1032、1202、1214、1224‧‧‧長期MV
1104、111211122、1204、1212、1222‧‧‧層間MV
1400、1700‧‧‧通訊系統
1402、1402a、1402b、1402c、1402d‧‧‧WTRU
1403、1404、1405‧‧‧RAN
1406、1407、1409‧‧‧核心網路
1408‧‧‧PSTN
1410‧‧‧網際網路
1412‧‧‧其他網路
1414a、1414b、1480a、1480b、1480c‧‧‧基地台
1415、1416、1417‧‧‧空中介面
1418‧‧‧處理器
1420‧‧‧收發器
1422‧‧‧傳輸/接收元件
1424‧‧‧揚聲器/麥克風
1426‧‧‧鍵盤
1428‧‧‧顯示器/觸控板
1430‧‧‧不可移式記憶體
1432‧‧‧可移式記憶體
1434‧‧‧電源
1436‧‧‧GPS晶片組
1438‧‧‧週邊裝置
1440a、1440b、1440c‧‧‧節點B
1442a、1442b‧‧‧RNC
1444‧‧‧MGW
1446‧‧‧MSC
1448‧‧‧SGSN
1450‧‧‧GGSN
1460a、1460b、1460c‧‧‧e節點B
1462‧‧‧MME
1464‧‧‧服務閘道
1466‧‧‧PDN閘道
1482‧‧‧ASN閘道
1484‧‧‧MIP-HA
1486‧‧‧AAA伺服器
1488‧‧‧閘道
1502‧‧‧視訊訊號
1504‧‧‧轉換
1506‧‧‧量化
1508‧‧‧熵編碼
1510、1610‧‧‧反向量化
1512、1612‧‧‧逆轉換
1520、1602‧‧‧視訊位元流
1560、1660‧‧‧空間預測
1562、1662‧‧‧時間預測
1564、1664‧‧‧參考圖像記憶體
1566、1666‧‧‧內迴路濾波
1580‧‧‧模式決策塊
1608‧‧‧熵解碼
1702‧‧‧編碼器
1704‧‧‧通訊網路
1706‧‧‧解碼器
1708、1710‧‧‧連接
AAA‧‧‧認證、授權、計費
ASN‧‧‧存取服務網路
BL、pBL‧‧‧基礎層圖像
ColPic‧‧‧並置圖像
ColPU‧‧‧並置PU
ColRefPic‧‧‧並置參考圖像
CurrPic‧‧‧目前圖像
CurrPU‧‧‧目前PU
CurrRefPic‧‧‧目前參考圖像
CurrRefPU‧‧‧最佳匹配塊
GGSN‧‧‧閘道GPRS支援節點
GPS‧‧‧全球定位系統
IP‧‧‧網際網路協定
Iub、IuCS、IuPS、iur、S1、X2‧‧‧介面
MGW‧‧‧媒體閘道
MIP-HA‧‧‧行動IP本地代理
MME‧‧‧移動性管理實體
MSC‧‧‧行動交換中心
MV‧‧‧移動向量
NeighbPU‧‧‧鄰近PU
NeighbRefPic‧‧‧鄰近參考圖像
PDN‧‧‧封包資料網路
PSTN‧‧‧公共交換電話網路
PU‧‧‧預測單元
R1、R3、R6、R8‧‧‧參考點
RAN‧‧‧無線電存取網路
SGSN‧‧‧服務GPRS支援節點
SPU‧‧‧最小PU
TB、TD‧‧‧時間距離
WTRU‧‧‧無線傳輸/接收單元
第1圖是示出用於SVC空間可調編碼的具有額外層間預測的可調結構的示例圖。
第2圖是示出被考慮用於HEVC可調編碼的示例層間預測結構圖。
第3圖是示出空間移動向量(MV)預測(SMVP)的示例圖。
第4圖是示出時間MV預測(TMVP)的示例圖。
第5圖是示出從基礎層到經上取樣的基礎層的預測結構複製的示例圖。
第6圖是示出經上取樣的基礎層的SPU和原始基礎層的SPU間的示例關係圖。
第7A圖至第7C圖是示出基礎層圖像的片段和處理後的基礎層圖像的片段間的示例關係圖。
第8A圖是示出時間短期MV間的MV預測圖。
第8B圖是示出根據被映射的短期MV對時間短期MV的MV預測圖。
第9A圖是示出時間長期MV間的MV預測的示例圖。
第9B圖是示出根據被映射的長期MV對時間長期MV的MV預測的示例圖。
第10A圖是示出根據時間長期MV對時間短期MV的MV預測的示例圖。
第10B圖是示出根據被映射的長期MV對時間短期MV的MV預測的示例圖。
第10C圖是示出根據時間短期MV對時間長期MV的MV預測的示例圖。
第10D圖是示出根據被映射的短期MV對時間長期MV的MV預測的示例圖。
第11A圖是示出根據層間MV對時間短期MV的禁用的MV預測的示例圖。
第11B圖是示出根據時間短期MV對層間MV的禁用的MV預測的示例圖。
第11C圖是示出根據被映射的短期MV對層間MV的禁用的MV預測的示例圖。
第12A圖是示出根據層間MV對時間長期MV的禁用的MV預測的示例圖。
第12B圖是示出根據時間長期MV對層間MV的禁用的MV預測的示例圖。
第12C圖是示出根據映射的長期MV對層間MV的禁用的MV預測的示例圖。
第13A圖是示出當Te=Tp時兩個層間MV間的MV預測的示例圖。
第13B圖是示出當Te≠Tp時兩個層間MV間的禁用的MV預測的示例圖。
第14A圖是可以實施一個或多個揭露的實施方式的示例通訊系統的系統圖。
第14B圖是可以在第14A圖所示的通訊系統中使用的示例無線傳輸/接收單元(WTRU)的系統圖。
第14C圖是可以在第14A圖所示的通訊系統中使用的示例無線電存取網路和示例核心網路的系統圖。
第14D圖是可以在第14A圖所示的通訊系統中使用的另一示例無線電存取網路和另一示例核心網路的系統圖。
第14E圖是可以在第14A圖示出的通訊系統中使用的另一示例無線電存取網路和另一示例核心網路的系統圖。
第15圖是示出基於塊的視訊編解碼器的示例方塊圖。
第16圖是示出基於塊的視訊解碼器的示例方塊圖。
第17圖是示出示例通訊系統圖。
舉例來說,藉由H.264的可調性擴展,可提供位元流(例如,部分位元流)的編碼及/或解碼(例如,以及傳輸及/或接收)以在保留與部分位元流的速率緊密相關的重建品質的同時提供具有較低時間解析度、較低空間解析度及/或被降低的保真度的視訊服務。第1圖是示出具有用於SVC空間可調性編碼的額外層間預測的可調結構的示例圖。圖100可示出可提高可調編碼效率的雙層SVC層間預測機制的示例。類似的機制可被用在多層SVC編碼結構上。在圖形100中,基礎層和增強層可表示具有不同解析度的兩個相鄰空間可調層。在層中(例如,基礎層及/或增強層),例如H.264編碼器可採用移動補償預測及/或內部預測。層間預測可使用基礎層資訊(例如,空間紋理、移動向量、參考圖像索引值和殘留信號等)來提高增強層的編碼效率。當解碼增強層時,SVC可不使用來自更低層(例如,目前層的相依層)的參考圖像而被完全重建。
在可調編碼系統(例如,HEVC可調編碼擴展)中採用層間預測,舉例來說,來確定多個層間的關係及/或提高可調的編碼效率。第2圖是示出被考慮用於HEVC可調編碼的示例層間預測結構的圖。舉例來說,圖形200可示出具有用於HEVC空間可調編碼的額外層間預測的可調結構的示例。可由來自重建的基礎層信號(例如,如果兩層間的空間解析度不同則在上取樣後)的移動補償預測、目前增強層中的時間預測及/或基礎層重建信號和時間預測信號的平均值來產生增強層的預測。可執行更低層圖像的完全重建。類似的實施可被用於多於兩層的可調編碼系統(例如,多於兩層的HEVC可調編碼系統)。
例如藉由使用來自經編碼的視訊圖像的像素來預測目前視訊圖像中的像素,HEVC可利用先進的移動補償預測技術來確定視訊訊號中內在的層間圖像冗餘。將被編碼的目前預測單元(PU)和其在參考圖像(例如,鄰近的PU)中的一個或多個匹配塊間的位移可用在移動補償預測中的移動向量來表示。MV可包括兩成分,MVx和MVy。MVx和MVy可分別表示水平方向和垂直方向的位移。可對MVx和MVy直接編碼或不對其直接編碼。
先進的移動向量預測(AMVP)可被用來從鄰近PU的一個或多個MV來預測MV。可對真實MV和MV預測子(predictor)之間的差異進行編碼。藉由對MV的差異進行編碼(例如,僅編碼),可降低用於對MV編碼的位元數。可從空間及/或時間鄰域中獲得用於預測的MV。空間鄰域可指目前的經編碼的PU周圍的那些空間PU。時間鄰域可指鄰近圖像中的並置PU。在HEVC中,為獲得準確的MV預測子,可將來自空間及/或時間鄰域的預測候選值放在一起以形成候選列表並選出最好的預測子來預測目前PU的MV。舉例來說,可基於拉格朗日率失真(R-D)消耗等來選擇最好的MV預測子。可將MV差異編碼成位元流。
第3圖是示出空間MV預測(SMVP)的示例的圖。圖形300可示出鄰近參考圖像310、目前參考圖像320和目前圖像330的示例。在將被編碼的目前圖像(CurrPic 330)中,散列的正方形可能是目前PU(CurrPU 332)。CurrPU 332可具有位於參考圖像(CurrRefPic 320)中的最佳匹配塊(CurrRefPU 322)。可預測CurrPU的MV(MV2 340)。舉例來說,在HEVC中,目前PU的空間鄰域可以是目前PU 332的上方、左側、左上側、左下側或右上側的PU。舉例來說,示出的鄰近PU 334是CurrPU 332的上方鄰居。例如,鄰近PU(NeighbPU)的參考圖像(NeighbRefPic 310)、PU 314和MV(MV1 350)是已知的,因為NeighbPU 334在CurrPU 332前被編碼。
第4圖是示出時間MV預測(TMVP)的示例的圖。圖形400可包括4個圖像,例如並置參考圖像(ColRefPic)410、CurrRefPic 420、並置圖像(ColPic)430和CurrPic 440。在將被編碼的目前圖像(CurrPic 440)中,散列的正方形(CurrPU 442)可能是目前PU。散列的正方形(CurrPU 442)可具有位於參考圖像(CurrRefPic 420)中的最佳匹配塊(CurrRefPU 422)。可預測CurrPU的MV(MV2 460)。舉例來說,在HEVC中,目前PU的時間鄰域可以是並置PU(ColPU)432,例如,ColPU 432是鄰近圖像(ColPic)430的一部分。例如,ColPU的參考圖像(ColRefPic 410)、PU 412和MV(MV1 450)是已知的,因為ColPic 430在CurrPic 440前被編碼。
PU間的移動是勻速的平移。兩個PU間的MV與兩個相關聯的圖像被捕獲的時刻間的時間距離成比例。在預測目前PU的MV前,可縮放移動向量預測子(例如,在AMVP中)。舉例來說,CurrrPic和CurrRefPic間的時間距離可被稱為TB。舉例來說,CurrPic和NeighbRefPic之間(例如,第3圖中)或者ColPic和ColRefPic(例如,第4圖中)的時間距離可被稱為TD。給定TB和TD,MV2的(例如MV的)被縮放的預測子可等於:
可支援短期參考圖像和長期參考圖像。舉例來說,儲存在被解碼的圖像緩衝(DPB)中的參考圖像可被標記為短期參考圖像或長期參考圖像。例如等式(1),如果參考圖像中的一者或多者是長期參考圖像,可能禁用移動向量的縮放。
本文描述了用於多層視訊編碼的MV預測的使用。本文描述的示例可使用HEVC標準作為基本(underlying)單層編碼標準和具有兩個空間層(例如,增強層和基礎層)的可調系統。本文描述的示例可適用於 使用其他類型的基本單層編解碼器、層數多於兩層及/或支援其他類型的可調性的其他可調編碼系統。
開始解碼視訊片段(例如,P片段或B片段)時,DPB中的一個或多個參考圖像可被添加到用於移動補償預測的P片段的參考圖像清單(例如清單0)及/或B片段的兩個參考圖像清單(例如,清單0和列表1)。可調編碼系統可利用增強層的時間參考圖像及/或來自基礎層的處理後的參考圖像(例如,如果兩層的空間解析度不同,則是經上取樣的基礎層圖像)來進行移動補償預測。當預測增強層中的目前圖像的MV時,指向來自基礎層的處理後的參考圖像的層間MV可被用來預測指向增強層的時間參考圖像的時間MV。時間MV也可被用來預測層間MV。因為這兩種類型的MV幾乎不相關,會導致用於增強層的MV預測的效率損失。單層編解碼器不支援來自基礎層圖像間的時間MV來預測增強層圖像間的時間MV,而這兩者高度相關並且可被用來改善MV預測性能。
MV預測過程可以被簡化及/或對於多層視訊編碼的壓縮效率可以被提高。增強層中的MV預測可以與單層編碼器的MV預測過程向後相容。例如,可能會有不需要在增強層中對塊級操作做任何變動的MV預測實施,使得單層編碼器和解碼器邏輯可被重新用於增強層。這可降低可調系統的實施複雜度。增強層的MV預測可區分指向增強層中的時間參考圖像的時間MV和指向來自基礎層的經處理(例如,上取樣)的參考圖像的層間MV。這可提高編碼效率。增強層中的MV預測可支援增強層圖像間的時間MV和基礎層圖像間的時間MV之間的MV預測,這可提高編碼效率。當兩層間的空間解析度不同時,可根據兩層間的空間解析度的比率來縮放基礎層圖像間的時間MV。
本文所述的實施與用於基礎層MV的層間移動資訊映射演算法有關,例如,使得在AMVP的處理中被映射的基礎層MV可被用來預測 增強層MV(例如,第4圖中的TMVP模式)。塊級操作可能沒有變化。單層編碼器和解碼器可無變動地用於增強層的MV預測。本文將描述用於增強層編碼和解碼過程的包含塊級變動的MV預測工具。
層間可包括處理後的基礎層及/或經上取樣的基礎層。例如,可互換地使用層間、處理後的基礎層及/或經上取樣的基礎層。可互換地使用層間參考圖像、處理後的基礎層參考圖像及/或經上取樣的基礎層參考圖像。可互換地使用層間視訊塊、處理後的基礎層視訊塊及/或經上取樣的基礎層視訊塊。在增強層、層間和基礎層間可能存在時序關係。例如,增強層的視訊塊及/或圖像可能與層間及/或基礎層的對應視訊塊及/或圖像時間相關聯。
視訊塊可以是在任意層及/或位元流的任意等級的操作單元。例如,視訊塊可能是在圖像級、塊級和片段級等等的操作單元。視訊塊可以是任意大小。例如,視訊塊可以指任意大小的視訊塊,例如4x4的視訊塊、8x8的視訊塊和16x16的視訊塊等等。例如,視訊塊可以指預測單元(PU)和最小PU(SPU)等。PU可以是用於攜帶與移動預測有關的資訊的視訊塊單元,例如,包括參考圖像索引和MV。一個PU可包括一個或多個最小PU(SPU)。雖然在同一個PU中的SPU指具有相同MV的同一參考圖像,在一些實施中以SPU為單位儲存移動資訊可使移動資訊獲取變得容易。移動資訊(例如,MV域)可以用視訊塊(例如PU和SPU等)為單位被儲存。雖然此處描述的示例是以圖像為參考來描述的,但也可使用視訊塊、PU及/或SPU和任意大小的任意操作單元(例如,圖像,視訊塊,PU,SPU等)。
重建的基礎層信號的紋理可能會被處理以用於增強層的層間預測。例如,當兩層之間的空間可調性被賦能時,層間參考圖像處理可包括一個或多個基礎層圖像的上取樣。可能不能從基礎層正確地產生對於處理後的參考圖像的移動有關的資訊(例如,MV、參考圖像清單、參考圖 像索引等)。當時間MV預測子來自處理後的基礎層參考圖像時(例如,如第4圖所示),丟失的移動資訊可能影響對增強層的MV的預測(例如,經由TMVP)。例如,當選出的處理後的基礎層參考圖像作為包括時間並置PU(ColPU)的時間鄰近圖像(ColPic)時,如果沒有正確地產生對於處理後的基礎層參考圖像的MV預測子(MV1)和參考圖像(ColRefPic),則TMPV不能正常工作。為賦能對於增強層MV預測的TMVP,可利用層間移動資訊映射實施,例如,如此處所述。例如,可產生對於處理後的基礎層參考圖像的MV域(包括MV和參考圖像)。
可用一個或多個變數來說明目前視訊片段的參考圖像,例如,參考圖像清單ListX(例如,X是0或1),在ListX中的參考圖像索引refIdx等。利用第4圖的示例,為了獲得並置PU(ColPU)的參考圖像(ColRefPic),可產生處理後的參考圖像(ColPic)中的PU(例如,每一個PU)(ColPU)的參考圖像。這可被分解成產生ColPic的參考圖像清單及/或對於ColPic中的ColPU(例如,每一個ColPU)的參考圖像索引。給定參考圖像清單,此處描述了對於處理後的基礎層參考圖像中的PU的參考圖像索引的產生。此處描述了與處理後的基礎層參考圖像的參考圖像清單的構成有關的實施。
因為基礎層和處理後的基礎層是相關的,所以可假定基礎層和處理後的基礎層具有相同或實質上相同的預測依賴關係。可以複製基礎層圖像的預測依賴關係來形成處理後的基礎層圖像的參考圖像清單。例如,如果基礎層圖像BL1是具有參考圖像清單ListX(例如,X是0或1)中的參考圖像索引refIdx的另一個基礎層圖像BL2的時間參考圖像,則BL1的處理後的基礎層圖像pBL1可被加到具有BL2的處理後的基礎層圖像pBL2的相同索引refIdx的相同的參考圖像清單ListX(例如,X是0或1)。第5圖是示出基礎層到上取樣基礎層的預測結構複製的示例的圖。圖形500示出了空間可調性的示例,其中和取樣基礎層的移動資訊(圖中用虛線表示)一樣, 對於基礎層的移動預測所採用相同的B級結構被複製(圖中用實線表示)。
可基於並置基礎層預測單元(PU)來確定處理後的基礎層PU的參考圖像。舉例來說,可確定處理後的基礎層PU的並置基礎層PU。可藉由選擇與處理後的基礎層PU的重疊面積最大為特徵的並置基礎層圖像中的PU來確定並置基礎層PU,例如,如此處所述。可確定並置基礎層PU的參考圖像。處理後的基礎層PU的參考圖像可被確定為並置基礎層PU的參考圖像的並置處理後的基礎層參考圖像。處理後的基礎層PU的參考圖像可用於增強層的TMVP、及/或用來解碼增強層(例如,並置增強層PU)。
處理後的基礎層PU與處理後的基礎層圖像相關聯。處理後的基礎層圖像的MV域可包括處理後的基礎層PU的參考圖像,例如,對於增強層圖像的TMVP(例如,並置增強層PU)。參考圖像清單與處理後的基礎層圖像相關聯。處理後的基礎層圖像的參考圖像清單可包括處理後的基礎層PU的參考圖像中的一個或多個。處理後的基礎層中的圖像(例如,每一個圖像)可從基礎層中對應的圖像中繼承相同的圖像順序計數(POC)及/或短期/長期圖像標記。
具有1.5倍上取樣速率的空間可調性被用作示例。第6圖是示出經上取樣的基礎層的SPU和原始基礎層的SPU間的示例關係的圖。圖形600可示出經上取樣的基礎層的SPU(例如,被標記為ui的塊)和原始基礎層的SPU(例如,被標記為bj的塊)間的示例關係。例如,圖像中的各種給定上取樣速率和座標,經上取樣的基礎層圖像中的SPU可對應於來自原始基礎層圖像的各種數目及/或比例的SPU。例如,SPU u4可覆蓋基礎層中的4個SPU區域(例如,b0、b1、b2、b3)。SPU u1可覆蓋兩個基礎層SPU(例如,b0和b1,)。SPU u0可覆蓋一個單一基礎層SPU(例如,b0)。MV域映射實施可用來估計對於處理後的基礎層圖像中的SPU的參考圖像索引和MV,例如,利用來自原始基礎層圖像的對應SPU的移動資訊。
可根據並置基礎層PU的MV來確定處理後的基礎層PU的MV。舉例來說,可確定處理後的基礎層PU的並置基礎層PU。可確定並置基礎層PU的MV。可以縮放基礎層PU的MV以確定處理後的基礎層PU的MV。舉例來說,可根據基礎層和增強層間的空間比率來縮放基礎層PU的MV以確定處理後的基礎層PU的MV。處理後的基礎層PU的MV可用於增強層(例如,並置增強層PU)的TMVP及/或用來解碼增強層(例如,並置增強層PU)。
處理後的基礎層PU可以與增強層圖像(例如,增強層圖像的PU)相關聯(例如,時間相關聯)。並置增強層圖像的MV域以處理後的基礎層PU的MV為基礎,例如,對於增強層圖像(例如,並置增強層PU)的TMVP。可基於處理後的基礎層PU的MV來確定增強層PU(例如,並置增強層PU)的MV。例如,可利用處理後的基礎層PU的MV來預測(例如,空間預測)增強層PU(例如,並置增強層PU)的MV。
可基於基礎層中相應的SPU的參考圖像索引來選擇處理後的基礎層圖像中的SPU(例如,每一個SPU)的參考圖像。例如,對於處理後的基礎層圖像中的SPU,用於確定參考圖像索引所應用的主要規則是其來自基礎層圖像的對應SPU使用最頻繁的參考圖像索引。例如,假定處理後的基礎層圖像中的一個SPU uh對應於來自基礎層的K個SPU bi(i=0,1,…,K-1),在處理後的基礎層圖像的參考圖像清單中有索引值為{0,1,…,M-1}的M個參考圖像。假定從索引為{r0,r1,..,rk-1}的參考圖像的集合來預測基礎層中K個對應的SPU,其中對於i=0,1,…,K-1,有r i {0,1,...,M-1},則uh的參考圖像索引可藉由等式(2)來確定: 其中C(ri),i=0,1,…,K-1是用於表示參考圖像r被使用了多少次的計數器。例如,如果基礎層圖像有被標為{0,1}的2個參考圖像(M=2),而處理後的基礎層圖像中的給定uh對應於從{0,1,1,1}(例如,{r0,r1,…,r3}等於{0,1,1,1})預測的4個(K=4)基礎層SPU,則根據等式(2),r(uh)被設定為1。例如,因為具有更小時間距離的兩個圖像有更高相關性,選擇具有到目前處理後的圖像的最小POC的參考圖像ri(例如,來打破應用等式(2)時C(ri)的約束)。
在處理後的基礎層圖像中的不同SPU可對應於來自原始基礎層中的各種數目及/或比例的SPU(例如,如第6圖所示)。可選出具有最大覆蓋面積的基礎層SPU的參考圖像索引來確定在處理後的基礎層中的對應的SPU的參考圖像。對於處理後的基礎層中給定的SPU uh,其參考圖像索引可由等式(3)來確定: 其中,Si是基礎層中的第i個對應的SPU bi的覆蓋面積。例如,當兩個或更多對應的SPU的覆蓋面積相同時,選擇具有到目前處理後的圖像的最小POC距離的參考圖像ri,來打破等式(3)Si的約束。
可藉由內部模式來對對應的基礎層SPU bj進行編碼。參考圖像索引(例如,對應的基礎層SPU bj的參考圖像索引)可被設定為-1並且在應用等式(2)及/或等式(3)時被忽略。如果對應的基礎層SPU bj是被內部編碼的,SPU uh的參考圖像索引可被設定為-1或對於TMVP被標記為無效。
對於處理後的基礎層中給定的SPU uh,其對應的SPU bi的面積可能是不相同的。例如,可利用此處所述的基於面積的實施來估計在處 理後的基礎層圖像中的SPU(例如,每一個SPU)的MV。
為估計在處理後的基礎層圖像中的一個SPU uh的MV,可在基礎層SPU候選者bi中選出與SPU uh的覆蓋面積最大(例如,重疊面積最大)的基礎層SPU b1的MV。例如,可使用等式(4): 其中MV’表示所得的SPU uh的MV,MVi表示基礎層中的第i個對應的SPU bi的MV,而N是上取樣因數(例如,N可以等於2或1.5),取決於兩層(例如,基礎層和增強層)間的空間比率(例如,空間解析度)。例如,上取樣因數(例如,N)可用於縮放從基礎層的PU所確定的所得MV來計算處理後的基礎層圖像中的PU的MV。
可用加權平均來確定處理後的基礎層中的SPU的MV。例如,可使用加權平均,藉由利用與基礎層中的對應SPU相關聯的MV,來確定處理後的基礎層中的SPU的MV。例如,使用加權平均可提高處理後的基礎層的MV的準確度。對於處理後的基礎層中的SPU uh,可藉由確定對於一個或多個(例如,每一個)與uh重疊的基本基礎層的SPU bi的加權平均來獲得該SPU uh的MV。例如,其由等式(5)示出: 其中B是基礎層中的參考圖像索引等於r(uh)的SPU bi的子集合,例如,由等式(2)及/或等式(3)來確定。
一個或多個濾波器(例如,中值濾波器,低通高斯濾波器等)可被應用在等式(5)中B所表示的MV組,例如,來獲得MV’所表示的經映射的MV。可採用可靠(confidence)的均值來改進所評估的MV的準確度, 如等式(6)所示: 其中參數wi是估計SPU uh的MV時基礎層SPU bi(例如,每一個基礎層SPU bi)的MV的可靠的測量。不同的度量可用來導出wi的值。例如,可根據移動補償預測期間的預測殘留的量來確定wi,也可根據MVi與其鄰近MV的相干程度來確定wi
可從基礎層的原始移動域來映射處理後的基礎層圖像的移動資訊,例如,其可用來執行基礎層中的時間移動補償預測。移動域補償演算法(例如,如HEVC中所支援的)可被應用到基礎層的移動域,例如,以產生基礎層的壓縮移動域。可以從基礎層的壓縮移動域來映射處理後的基礎層圖像中的一個或多個的移動資訊。
可產生對於處理後的基礎層圖像的丟失的移動資訊,例如,如此處所述。無需對塊級操作進行額外變動,可針對增強層採用單層編解碼器(例如,HEVC編解碼器)所支援的TMVP。
當對應的基礎層參考圖像包括一個或更多片段時,可使用參考圖像清單產生過程及/或MV映射過程,例如,如此處所示的。如果在基礎層參考圖像中存在多個片段,則片段切割可從基礎層影像對應到處理後的基礎層圖像上。對於處理後的基礎層中的片段,可執行參考圖像清單產生步驟來導出合適的片段類型及/或參考圖像清單。
第7A圖至第7C圖是示出基礎層圖像的片段和處理後的基礎層圖像的片段間的示例關係的圖,例如,用於1.5倍的空間可調性。第7A圖是示出基礎層中的片段切割的示例的圖形701。第7B圖是示出處理後的基礎層中的被映射的片段切割的示例的圖形702。第7C圖是示出處理後的基礎層 中調整後的片段切割的示例的圖形703。
基礎層圖像可包括多個片段,例如,如圖形701所示的2個片段。在處理後的基礎層圖像中映射的片段切割可穿過增強層中的相鄰編碼樹塊(CTB)的邊界,例如,當基礎層被上取樣時(例如,如圖形702所示)。這是因為基礎層圖像和增強層圖像之間的空間比率不同。片段切割(例如,在HEVC中)可與CTB邊界對齊。可調整處理後的基礎層中的片段切割以使片段的邊界與CTB的邊界對齊,例如,如圖形703所示。
增強層TMVP導出過程可能包括約束。例如,如果在對應的基礎層圖像中有一個片段,則處理後的基礎層圖像可被用作並置圖像。當在對應的基礎層圖像中有多於一個片段時,可不對處理後的基礎層參考圖像執行層間移動資訊映射(例如,如此處所述的參考圖像清單產生及/或MV映射)。如果在對應的基礎層圖像中有多於一個片段時,則時間參考圖像可被用作用於增強層的TMVP導出過程的並置圖像。基礎層圖像中的片段數目可用於確定是否使用層間參考圖像及/或時間參考圖像作為用於增強層的TMVP的並置圖像。
如果在對應的基礎層圖像中有一個片段及/或如果片段資訊(例如,在對應的基礎層圖像中片段的參考圖像清單、片段類型等等)是完全相同的,則處理後的基礎層圖像可被用作並置圖像。當對應的基礎層圖像中的兩個或更多片段具有不同片段資訊時,不對處理後的基礎層參考圖像執行層間移動資訊映射(例如,如此處所述的參考圖像清單產生及/或MV映射)。如果對應的基礎層圖像中的兩個或更多片段具有不同的片段資訊,則時間參考圖像可被用作用於增強層的TMVP導出過程的並置圖像。
移動資訊映射可以使各種單層MV預測技術可被用於可調編碼系統。可應用塊級MV預測操作來改善增強層編碼性能。此處描述了增強層的MV預測。基本層的MV預測過程無變化。
時間MV指的是指向來自相同增強層的參考圖像的MV。層間MV指的是指向另一層(例如,處理後的基礎層參考圖像)的MV。映射的MV指的是為處理後的基礎層圖像產生的MV。映射的MV可包括映射的時間MV及/或映射的層間MV。映射的時間MV指的是源於最後一個編碼層的時間預測的映射的MV。映射的層間MV指的是從最後一個編碼層的層間預測所產生的映射的MV。對於具有多於兩層的可調編碼系統可存在映射的層間MV。時間MV及/或映射的時間MV可以是短期MV或長期MV,例如,依賴於該MV指向短期參考圖像或長期參考圖像。時間短期MV和映射的短期MV指的是在各自的編碼層中使用短期時間參考的時間MV和映射的時間MV。時間長期MV和映射的長期MV指的是在其各自的編碼層中使用長期時間參考的時間MV和映射的時間MV。時間MV、映射的時間MV、映射的層間MV和層間MV可被看做是不同類型的MV。
增強層MV預測可包括下列的一者或多者。從層間MV及/或映射的層間MV對時間MV的MV預測可能被賦能或禁用。從時間MV及/或映射的時間MV對層間MV的MV預測可能被賦能或禁用。從映射的時間MV對時間MV的MV預測可以被賦能。從層間MV及/或映射的層間MV對層間MV的MV預測可能被賦能或禁用。對於MV預測中包含的長期MV(例如,包括時間長期MV和映射的長期MV)可採用不使用MV縮放的MV預測。
使用MV縮放的短期MV間的預測(例如,類似於單層MV預測)可被賦能。第8A圖是示出時間短期MV間的MV預測的圖。第8B圖是示出根據映射的短期MV對時間短期MV的MV預測的圖,在圖形800中,可根據時間短期MV 804來預測時間短期MV 802。在圖形810中,可根據映射的短期MV 814來預測時間短期MV 812。
例如,由於很大的POC間距,可提供長期MV間的不使用MV縮放的預測。這類似於單層編碼和解碼的MV預測。第9A圖是示出時間長期 MV間的MV預測的示例的圖。第9B圖是示出從映射的長期MV對時間長期MV的MV預測的示例的圖。在圖形900中,可從時間長期MV 904來預測時間長期MV 902。在圖910中,可從映射的長期MV 914來預測時間長期MV 912。
例如,因為兩個參考圖像的間距很長,可提供短期MV和長期MV間不使用MV縮放的預測。這類似於單層編碼和解碼的MV預測。第10A圖是示出從時間長期MV對時間短期MV的MV預測的示例的圖。第10B圖是示出從映射的長期MV對時間短期MV的MV預測的示例的圖。第10C圖是示出從時間短期MV對時間長期MV的MV預測的示例的圖。第10D圖是示出從映射的短期MV對時間長期MV的MV預測的示例的圖。
圖1000中,可從時間長期MV 1004來預測時間短期MV 1002。在圖1010中,可從映射的長期MV 1014來預測時間短期MV 1012。在圖1020中,可從時間短期MV 1022來預測時間長期MV 1024。在圖1030中,可從映射的短期MV 1034來預測時間長期MV 1032。
從層間MV及/或映射的層間MV的對時間短期MV的預測可能被禁用。從時間短期MV及/或映射的短期MV對層間MV的預測可能被禁用。第11A圖是示出從層間MV對時間短期MV的禁用的MV預測的示例的圖。第11B圖是示出從時間短期MV對層間MV的禁用的MV預測的示例的圖。第11C圖是示出從映射的短期MV對層間MV的禁用的MV預測的示例的圖。
圖形1100示出了從層間MV 1104對時間短期MV 1102的禁用的MV預測的示例。例如,可能不能從層間MV 1104來預測時間短期MV 1102。圖形1110示出了從時間短期MV 1114對層間MV 1112的禁用的MV預測的示例。例如,可能不能從時間短期MV 1114來預測層間MV 1112。圖1120示出了從映射的短期MV 1124對層間MV 1122的禁用的MV預測的示例。例 如,可能不能從映射的短期MV 1124來預測層間MV 1122。
從層間MV及/或映射的層間MV對時間長期MV的預測可能被禁用。從時間長期MV及/或映射的長期MV對層間MV的預測可能被禁用。第12A圖是示出從層間MV對時間長期MV的禁用的MV預測的示例的圖。第12B圖是示出從時間長期MV對層間MV的禁用的MV預測的示例的圖。第12C圖是示出從映射的長期MV對層間MV的禁用的MV預測的示例的圖。
圖形1200示出了從層間MV 1204對時間長期MV 1202的禁用的MV預測的示例。例如,可能不能從層間MV 1204來預測時間長期MV 1202。圖形1210示出了從時間長期MV 1214對層間MV 1212的禁用的MV預測的示例。例如,可能不能從時間長期MV 1214來預測層間MV 1212。圖形1220示出了從映射的長期MV 1224對層間MV 1222的禁用的MV映射。例如,可能不能從映射的長期MV 1224來預測層間MV 1222。
例如,如果兩個層間MV在增強層和處理後的基礎層中具有相同的時間間隔,從另一個層間MV來預測層間MV可被賦能。如果兩個層間MV在增強層和處理後的基礎層的時間間隔不同,兩個層間MV間的預測可能被禁用。這是因為由於缺乏明確的MV相關性,使預測不能產生良好的編碼性能。
第13A圖是示出當Te=Tp時兩個層間MV間的MV預測的示例的圖。第13B圖是示出當Te≠Tp時禁用的兩個層間MV間的MV預測的示例的圖。可用TMVP作為示例(例如,如第13A圖至第13B圖中)。在圖1300中,可從另一個層間MV(例如,MV1)1304來預測目前層間MV(例如,MV2)1302。目前圖像CurrPic和其時間相鄰的圖像ColPic(例如,包括並置PU ColPU)間的時間間隔被表示為Te。它們各自的參考圖像(例如,CurrRefPic和ColRefPic)間的時間間隔被表示為Tp。CurrPic和ColPic可以是 在增強層中,CurrRefPic和ColRefPic可以是在處理後的基礎層中。如果Te=Tp,則MV1可被用來預測MV2。
例如,因為基於POC的MV縮放可能失敗,對於兩個層間MV間的預測MV的MV縮放可能被禁用。在圖1310中,例如,因為目前圖像CurrPic和其相鄰的圖像ColPic間的時間間隔(例如,Te)和它們各自的參考圖像間的時間間隔不相等(例如,Tp),可能不能從另一個層間MV(例如,MV1)1314來預測目前層間MV(例如,MV2)1312。
例如,如果層間MV和映射的層間MV具有相同的時間距離,根據映射的層間MV對層間MV的不使用縮放的預測可被賦能。如果它們的時間距離不同,則根據映射的層間MV對層間MV的預測可能被禁用。表格1總結了用於SVC的增強層編碼的MV預測的不同條件的示例。
對於不同編碼層間的移動資訊映射實施,層間MV的MV映射可能被禁用,例如,如此處所述。映射的層間MV對於增強層中的MV預測是不可用的。
包含層間MV的MV預測可能被禁用。對於增強層,根據其他時間MV能預測時間MV(例如,僅時間MV)。這相當於用於單層編解碼器的MV預測。
裝置(例如,處理器、編碼器、解碼器、WTRU等等)可接 收位元流(例如,可縮放的位元流)。例如,該位元流可包括基礎層和一個或更多增強層。可利用TMVP來解碼位元流中的基礎層(例如,基礎層視訊塊)及/或增強層(例如,增強層視訊塊)。可對位元流中的基礎層和增強層執行TMVP。例如,可不做任何變動而對位元流中的基礎層(例如,基礎層視訊塊)執行TMVP,例如,參考第4圖的描述。可利用層間參考圖像對位元流中的增強層(例如,增強層視訊塊)執行TMVP,例如,如此處所述。例如,層間參考圖像可被用作用於增強層(例如,增強層視訊塊)的TMVP的並置參考圖像。例如,可確定並置基礎層圖像的壓縮MV域。可根據並置基礎層圖像的壓縮MV域來確定層間參考圖像的MV域。層間參考圖像的MV域可被用來在增強層(例如,增強層視訊塊)上執行TMVP。例如,層間參考圖像的MV域可被用來預測對於增強層視訊塊(例如,並且增強層視訊塊)的MV域。
可確定層間參考層圖像的MV域。例如,可基於並置基礎層圖像的MV域來確定層間參考層圖像的MV域。MV域可包括一個或多個MV及/或參考圖像索引。例如,MV域可包括層間參考層圖像中的PU(例如,對於層間參考層圖像中的每一個PU)的參考圖像索引和MV。可基於MV域解碼增強層圖像(例如,並置增強層圖像)。可基於MV域以在增強層圖像上執行TMVP。
可提供用於層間移動預測的語法傳訊(例如,高級語法傳訊)。在序列級可以賦能或禁用層間移動資訊映射和MV預測。在圖像/片段級可以賦能或禁用層間移動資訊映射和MV預測。例如,可基於提高編碼效率及/或降低系統複雜度的考慮來做出是否賦能及/或禁用某些層間移動預測技術的決策。例如,因為增加的語法可以用應用到序列的圖像(例如,所有圖像),序列級的傳訊比圖像/片段級的傳訊的開銷更少。例如,因為序列的圖像(例如,每一個圖像)可以接收到其自己的移動預測實施及/或 MV預測實施,圖像/片段級的傳訊可提供更好的靈活性。
可提供序列級傳訊。可在序列級用信號發送層間移動資訊映射及/或MV預測。如果使用了序列級傳訊,則序列中的圖像(例如,所有圖像)可使用相同的移動資訊映射及/或MV預測。例如,表格2中示出的語法可表明是否允許在序列級的層間移動資訊映射及/或MV預測。表格2中的語法可被用在參數集合上,舉例來說,例如視訊參數集合(VPS)(例如,在HEVC中)、序列參數集合(SPS)(例如,在H.264和HEVC中)和圖像參數集合(PPS)(例如,在H.264和HEVC中)等等,但不限於此。
層間移動向量存在旗標(inter_layer_mvp_present_flag)可表明在序列級或是在圖像/片段級使用層間移動預測。例如,如果該旗標被設為0,則該傳訊在圖像/片段級。如果該旗標被設為1,則移動映射及/或MV預測傳訊在序列級。層間移動映射序列賦能旗標(inter_layer_motion_mapping_seq_enabled_flag)可表明在序列級是否使用層間移動映射(例如,層間移動預測)。層間增加移動向量預測序列賦能旗標(inter_layer_add_mvp_seq_enabled_flag)可表明在序列級是否採用塊MV預測(例如,額外的塊MV預測)。
可提供圖像/片段級傳訊。可在圖像/片段級用信號發送層間 移動資訊映射。如果使用了圖像/片段級傳訊,則序列的圖像(例如,每一個圖像)可接收其自己的傳訊。例如,相同的序列的圖像可使用不同的移動資訊映射及/或MV預測(例如,基於其接收到的傳訊)。例如,表格3中的語法可用在片段標頭來表明層間移動資訊映射及/或MV預測是否被用於增強層中的目前圖像/片段。
層間移動映射片段賦能旗標(inter_layer_motion_mapping_slice_enabled_flag)可用來表明是否對目前片段應用層間移動映射。層間增加移動向量預測片段賦能旗標(inter_layer_add_mvp_slice_enabled_flag)可用來表明是否對目前片段應用 額外的塊MV預測。
提議將MV預測編碼用於多層視訊編碼系統。此處描述的層間移動資訊映射演算法用來產生用於處理後的基礎層的移動相關資訊,例如,使得在增強層中的TMVP過程中能利用基礎層和增強層的時間MV間的相關性。因為可以不變動塊級操作,單層編碼器和解碼器可無變動地用於增強層的MV預測。MV預測可基於可調系統中的不同類型的MV的特性分析(例如,以提高MV預測效率為目的)。
雖然此處描述的是具有空間可調性的兩層SVC系統,但本揭露內容可擴展到具有多於兩層的以及其他可調性模式的SVC系統。
可對位元流中的增強層執行層間移動預測。可用信號發送層間移動預測,例如,如此處所述。可在位元流的序列級用信號發送層間移動預測(例如,使用inter_layer_motion_mapping_seq_enabled_flag等等)。例如,可經由在位元流中的視訊參數集合(VPS)、序列參數集合(SPS)、圖像參數集合(PPS)等等中的變數用信號發送層間移動預測。
裝置(例如,處理器,編碼器,解碼器,WTRU等)可執行此處描述的任何功能。例如,編碼器可包括被配置為接收位元流(例如,可調位元流)的處理器。位元流可包括基礎層和增強層。解碼器可使用將層間參考圖像作為用於增強層的TMVP的並置參考圖像的時間移動向量預測(TMVP)來解碼位元流中的增強層。增強層視訊塊、層間視訊塊及/或基礎層視訊塊可以是並置的(例如,時間上並置)。
解碼器可使用TMVP來解碼增強層圖像。例如,解碼器可基於並置基礎層圖像的MV域來確定層間參考圖像的MV域。層間參考圖像和增強層參考圖像是並置的。層間參考圖像的MV域可包括層間參考圖像的視訊塊的參考圖像索引和MV。解碼器可基於層間參考圖像的MV域來解碼增強層圖像。例如,解碼器可基於層間參考圖像的MV域來確定增強層圖像的MV域並基於增強層圖像的MV域來解碼增強層圖像。
可基於壓縮MV域來確定層間參考圖像的MV域。例如,解碼器可確定並置基礎層圖像的壓縮MV域和基於並置基礎層圖像的壓縮MV域來確定層間參考圖像的MV域。
解碼器可確定層間參考圖像的視訊塊的MV和參考圖像。例如,解碼器可基於並置基礎層視訊塊的參考圖像來確定層間視訊塊的參考圖像。解碼器可基於並置基礎層視訊塊的MV來確定層間視訊塊的MV。解碼器可以藉由選擇與層間視訊塊的重疊面積最大為特徵的並置基礎層圖像的視訊塊來確定並置基礎層視訊塊。解碼器可基於層間參考圖像的視訊塊的MV及/或參考圖像來確定增強層的視訊塊(例如,增強層圖像的並置視訊塊)的MV及/或參考圖像。
解碼器可確定並置基礎層視訊塊的參考圖像、並基於並置基礎層視訊塊的參考圖像來確定層間視訊塊的參考圖像。例如,層間視訊塊的參考圖像可以是並置基礎層視訊塊的參考圖像的並置層間參考圖像。解碼器可基於層間視訊塊的參考圖像來確定增強層圖像的視訊塊的參考圖像。例如,增強層的參考圖像可以是層間視訊塊的參考圖像的並置增強層參考圖像。增強層視訊塊、層間視訊塊及/或基礎層視訊塊可能是並置的(例如,時間上並置)。
解碼器可確定層間視訊塊的MV。例如,解碼器可確定並置基礎層視訊塊的MV,並根據基礎層和增強層間的空間比率來縮放並置基礎層視訊塊的MV,來確定層間視訊塊的MV。解碼器可基於層間視訊塊的MV來確定增強層視訊塊的MV。例如,解碼器可利用層間視訊塊的MV來預測增強層視訊塊的MV,例如,藉由時間縮放層間視訊塊的MV。
解碼器可被配置為基於並置基礎層視訊塊來確定增強層視訊塊的參考圖像、基於並置基礎層視訊塊的MV來確定增強層視訊塊的MV、及/或基於增強層視訊塊的參考圖像和增強層視訊塊的MV來解碼增強層視訊塊。例如,解碼器可藉由選擇與增強層視訊塊的重疊面積最大為特 徵的並置基礎層圖像的視訊塊來確定並置基礎層視訊塊。
解碼器可確定並置基礎層視訊塊的參考圖像。解碼器可利用並置基礎層視訊塊的參考圖像來確定層間視訊塊的參考圖像。解碼器可確定增強層視訊塊的參考圖像。例如,增強層視訊塊的參考圖像可以是並置基礎層視訊塊的參考圖像和並置層間視訊塊的參考圖像的並置增強層圖像。增強層視訊塊、層間視訊塊及/或基礎層視訊塊可以是並置的(例如,時間上並置)。
解碼器可確定並置基礎層視訊塊的MV。解碼器可根據基礎層和增強層之間的空間比率來縮放並置基礎層視訊塊的MV,以確定層間視訊塊的MV。解碼器可基於層間視訊塊的MV來預測增強層視訊塊的MV,例如,藉由對層間視訊塊的MV的時間縮放。
解碼器可包括可以接收位元流的處理器。位元流可包括基礎層和增強層。位元流可包括層間移動映射資訊。解碼器可確定基於層間映射資訊可賦能對於增強層的層間移動預測。解碼器可基於層間映射資訊來執行增強層的層間移動預測。可在位元流的序列級用信號發送層間映射資訊。例如,可藉由位元流中的VPS、SPS及/或PPS中的變數(例如旗標)來用信號發送層間映射資訊。
雖然是從解碼器的視角來描述的,但此處所描述的功能(例如,此處描述的功能的逆向功能)可由其他裝置來執行,如編碼器等。
第14A圖是在其中可以實施一個或更多個實施方式的示例通訊系統1400的系統圖。通訊系統1400可以是向多個使用者提供內容,例如語音、資料、視訊、訊息發送、廣播等的多重存取系統。通訊系統1400可以使多個無線使用者經由系統資源分享(包括無線頻寬)來存取這些內容。例如,通訊系統1400可以使用一種或多種通道存取方法,例如分碼多重存取(CDMA)、分時多重存取(TDMA)、分頻多重存取(FDMA)、正交FDMA(OFDMA)、單載波FMDA(SC-FDMA)等。
如第14A圖所示,通訊系統1400可以包括無線傳輸/接收單元(WTRU)1402a、1402b、1402c及/或1402d(常被統稱為WTRU 1402)、無線電存取網路(RAN)1403/1404/1405、核心網路1406/1407/1409、公共交換電話網路(PSTN)1408、網際網路1410和其他網路1412。不過將被理解,揭露的實施方式考慮到了任何數量的WTRU、基地台、網路及/或網路元件。WTRU 1402a、1402b、1402c、1402d的每一個可以是配置為在無線環境中進行操作及/或通訊的任何類型的裝置。作為示例,可以將WTRU 1402a、1402b、1402c、1402d配置為發送及/或接收無線信號、並可以包括使用者設備(UE)、基地台、固定或者行動使用者單元、呼叫器、行動電話、個人數位助理(PDA)、智慧型電話、筆記型電腦、隨身型易網機、個人電腦、無線感測器、消費電子產品等等。
通訊系統1400亦可以包括基地台1414a和基地台1414b。基地台1414a、1414b的每一個都可以是配置為與WTRU 1402a、1402b、1402c、1402d中的至少一個進行無線介接以便於存取一個或者更多個通訊網路,例如核心網路1406/1407、1409、網際網路1410及/或網路1412的任何裝置類型。作為示例,基地台1414a、1414b可以是基地台收發站(BTS)、節點B)、演進的節點B(e節點B)、本地節點B、本地eNB、網站控制器、存取點(AP)、無線路由器等等。雖然基地台1414a、1414b的每一個被描述為單一元件,但是將被理解的是,基地台1414a、1414b可以包括任何數量互連的基地台及/或網路元件。
基地台1414a可以是RAN 1403/1404/1405的一部分,RAN 1403/1404/1405也可以包括其他基地台及/或網路元件(未顯示),例如基地台控制器(BSC)、無線電網路控制器(RNC)、中繼節點等。可以將基地台1414a及/或基地台1414b配置為在特定地理區域之內發送及/或接收無線信號,該區域可以被稱為胞元(未顯示)。胞元也可以被切割為胞元扇區。例如,與基地台1414a關聯的胞元可以切割為三個扇區。因此,在一種 實施方式中,基地台1414a可以包括三個收發器,即每一個用於胞元的一個扇區。在另一種實施方式中,基地台1414a可以使用多輸入多輸出(MIMO)技術,因此可以將多個收發器用於胞元的每一個扇區。
基地台1414a、1414b可以經由空中介面1415/1416/1417與WTRU 1402a、1402b、1402c、1402d中的一個或者更多個進行通訊,該空中介面1415/1416/1417可以是任何合適的無線通訊鏈路(例如,射頻(RF)、微波、紅外(IR)、紫外線(UV)、可見光等)。可以使用任何合適的無線電存取技術(RAT)來建立空中介面1415/1416/1417。
更具體地,如上所述,通訊系統1400可以是多重存取系統、並可以使用一種或者多種通道存取方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 1403/1404/1405中的基地台1414a和WTRU 1402a、1402b、1402c可以使用例如通用行動電信系統(UMTS)陸地無線電存取(UTRA)的無線電技術,其可以使用寬頻CDMA(WCDMA)來建立空中介面1415/1416/1417。WCDMA可以包括例如高速封包存取(HSPA)及/或演進的HSPA(HSPA+)的通訊協定。HSPA可以包括高速下鏈封包存取(HSDPA)及/或高速上鏈封包存取(HSUPA)。
在另一種實施方式中,基地台1414a和WTRU 1402a、1402b、1402c可以使用例如演進的UMTS陸地無線電存取(E-UTRA)的無線電技術,其可以使用長期演進(LTE)及/或高級LTE(LTE-A)來建立空中介面1415/1416/1417。
在其他實施方式中,基地台1414a和WTRU 1402a、1402b、1402c可以使用例如IEEE 802.16(即,全球微波存取互通性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫行標準2000(IS-2000)、暫行標準95(IS-95)、暫行標準856(IS-856)、全球行動通訊系統(GSM)、GSM演進的增強型資料速率(EDGE)、GSM EDGE(GERAN)等等的無線電技術。
第14A圖中的基地台1414b可以是無線路由器、本地節點B、本地e節點B或者存取點,例如,並且可以使用任何適當的RAT以方便例如商業場所、住宅、車輛、校園等等的局部區域中的無線連接。在一種實施方式中,基地台1414b和WTRU 1402c、1402d可以實施例如IEEE 802.11的無線電技術來建立無線區域網路(WLAN)。在另一種實施方式中,基地台1414b和WTRU 1402c、1402d可以使用例如IEEE 802.15的無線電技術來建立無線個人區域網路(WPAN)。在另一種實施方式中,基地台1414b和WTRU 1402c、1402d可以使用基於蜂巢的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A等)來建立微微胞元或毫微微胞元。如第14A圖所示,基地台1414b可以具有到網際網路1410的直接連接。因此,基地台1414b可以不需要經由核心網路1406/1407/1409而存取到網際網路1410。
RAN 1403/1404/1405可以與核心網路1406/1407/1409通訊,該核心網路1406/1407/1409可以是被配置為向WTRU 1402a、1402b、1402c、1402d中的一個或更多個提供語音、資料、應用及/或基於網際網路協定的語音(VoIP)服務等的任何類型的網路。例如,核心網路1406/1407/1409可以提供呼叫控制、計費服務、基於移動位置的服務、預付費呼叫、網際網路連接、視訊分配等及/或執行高階安全功能,例如用戶認證。雖然第14A圖中未示出,將被理解的是,RAN 1403/1404/1405及/或核心網路1406/1407/1409可以與使用和RAN 1403/1404/1405相同的RAT或不同RAT的其他RAN進行直接或間接的通訊。例如,除了連接到正在使用E-UTRA無線電技術的RAN 1403/1404/1405之外,核心網路1406/1407/1409也可以與使用GSM無線電技術的另一個RAN(未示出)通訊。
核心網路1406/1407/1409也可以充當WTRU 1402a、1402b、1402c、1402d存取PSTN 1408、網際網路1410及/或其他網路1412的閘道。PSTN 1408可以包括提供普通老式電話服務(POTS)的電路交換電話網路。網際網路1410可以包括使用公共通訊協定的互連電腦網路和裝置的全球系 統,該協定例如有TCP/IP網際網路協定組中的傳輸控制協定(TCP)、使用者資料包通訊協定(UDP)和網際網路協定(IP)。網路1412可以包括被其他服務提供者擁有及/或操作的有線或無線的通訊網路。例如,網路1412可以包括連接到一個或更多個RAN的另一個核心網路,該RAN可以使用和RAN 1403/1404/1405相同的RAT或不同的RAT。
通訊系統1400中的WTRU 1402a、1402b、1402c、1402d的某些或全部可以包括多模式能力,即WTRU 1402a、1402b、1402c、1402d可以包括用於在不同無線鏈路上與不同無線網路進行通訊的多個收發器。例如,第14A圖中示出的WTRU 1402c可被配置為與基地台1414a通訊以及與基地台1414b通訊,該基地台1414a可以使用基於蜂巢的無線電技術,該基地台1414b可以使用IEEE 802無線電技術。
第14B圖是WTRU 1402示例的系統圖。如第14B圖所示,WTRU 1402可以包括處理器1418、收發器1420、傳輸/接收元件1422、揚聲器/麥克風1424、鍵盤1426、顯示器/觸控板1428、不可移式記憶體1430、可移式記憶體1432、電源1434、全球定位系統(GPS)晶片組1436和其他週邊裝置1438。將被理解的是,在保持與實施方式一致時,WTRU 1402可以包括前述元件的任何子組合。同樣,實施方式所關注的基地台1414a和基地台1414b及/或基地台1414a和基地台1414b所代表的節點,例如但不限於基地台收發站(BTS)、節點B、網站控制器、存取點(AP)、本地節點B、演進的本地節點B(eNodeB)、本地演進的節點B(HeNB)、本地演進的節點B的閘道和代理節點,可包括第14B圖和此處所描述的部分或全部元件。
處理器1418可以是通用處理器、專用處理器、常規處理器、數位訊號處理器(DSP)、多個微處理器、與DSP核相關聯的一或更多個微處理器、控制器、微控制器、專用積體電路(ASIC)、場可編程閘陣列(FPGA)電路、任何其他類型的積體電路(IC)、狀態機等等。處理器1418可執行信號編碼、資料處理、功率控制、輸入/輸出處理及/或使WTRU 1402於無線 環境中操作的任何其他功能。處理器1418可以耦合到收發器1420,該收發器1420可耦合到傳輸/接收元件1422。雖然第14B圖描述了處理器1418和收發器1420是單獨的元件,但是將被理解的是,處理器1418和收發器1420可以一起集成在電子封裝或晶片中。
傳輸/接收元件1422可以被配置為經由空中介面1415/1416/1417將信號發送到基地台(例如,基地台1414a)、或從基地台(例如,基地台1414a)接收信號。例如,在一種實施方式中,傳輸/接收元件1422可以是被配置為發送及/或接收RF信號的天線。在另一種實施方式中,傳輸/接收元件1422可以是被配置為發送及/或接收例如IR、UV或可見光信號的發射器/偵測器。在另一種實施方式中,傳輸/接收元件1422可以被配置為發送和接收RF和光信號兩者。應當理解,傳輸/接收元件1422可以被配置為發送及/或接收無線信號的任何組合。
另外,雖然傳輸/接收元件1422在第14B圖中描述為單獨的元件,但是WTRU 1402可以包括任意數量的傳輸/接收元件1422。更具體的,WTRU 1402可以使用例如MIMO技術。因此,在一種實施方式中,WTRU 1402可以包括用於經由空中介面1415/1416/1417來發送和接收無線信號的兩個或更多個傳輸/接收元件1422(例如,多個天線)。
收發器1420可以被配置為調變要由傳輸/接收元件1422發送的信號及/或解調由傳輸/接收元件1422接收的信號。如上文所述,WTRU 1402可以具有多模式能力。因此收發器1420可以包括使WTRU 1402經由多個例如UTRA和IEEE 802.11的RAT通訊的多個收發器。
WTRU 1402的處理器1418可以耦合到下述裝置、並且可以從下述裝置中接收使用者輸入資料:揚聲器/麥克風1424、鍵盤1426及/或顯示器/觸控板1428(例如,液晶顯示器(LCD)顯示單元或有機發光二極體(OLED)顯示單元)。處理器1418還可以輸出使用者資料到揚聲器/麥克風1424、鍵盤1426及/或顯示/觸控板1428。另外,處理器1418可以從任何類 型的適當的記憶體存取資訊、並且可以儲存資料到任何類型的適當的記憶體中,例如非可移式記憶體1430及/或可移式記憶體1432。非可移式記憶體1430可以包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、硬碟或任何其他類型的記憶體裝置。可移式記憶體1432可以包括使用者身份模組(SIM)卡、記憶條、安全數位(SD)記憶卡等等。在其他實施方式中,處理器1418可以從在實體位置上沒有位於WTRU 1402上,例如位於伺服器或家用電腦(未示出)上的記憶體存取資訊、並且可以將資料儲存在該記憶體中。
處理器1418可以從電源1434接收電能、並且可以被配置為分配及/或控制到WTRU 1402中的其他元件的電能。電源1434可以是給WTRU 1402供電的任何適當的裝置。例如,電源1434可以包括一個或更多個乾電池(例如,鎳鎘(NiCd)、鎳鋅(NiZn)、鎳氫(NiMH)、鋰離子(Li-ion)等等),太陽能電池,燃料電池等等。
處理器1418也可以耦合到GPS晶片組1436,該GPS晶片組1436可以被配置為提供關於WTRU 1402目前位置的位置資訊(例如,經度和緯度)。另外,除了來自GPS晶片組1436的資訊或作為其替代,WTRU 1402可以經由空中介面1415/1416/1417以從基地台(例如,基地台1414a、1414b)接收位置資訊及/或基於從兩個或更多個鄰近基地台接收的信號的時序來確定其位置。將被理解,在保持實施方式的一致性時,WTRU 1402可以用任何適當的位置確定方法來獲得位置資訊。
處理器1418可以耦合到其他週邊裝置1438,該週邊裝置1438可以包括一個或更多個提供附加特性、功能及/或有線或無線連接的軟體及/或硬體模組。例如,週邊裝置1438可以包括加速計、電子羅盤、衛星收發器、數位相機(用於照片或視訊)、通用序列導流排(USB)埠、振動裝置、電視收發器、免持耳機、藍芽(BluetoothR)模組、調頻(FM)無線電單元、數位音樂播放機、媒體播放機、視訊遊戲機模組、網際網路瀏覽 器等等。
第14C圖是根據實施方式的RAN 1403和核心網路1406的結構圖。如上文所述,例如RAN 1403可使用UTRA無線電技術以經由空中介面1415來與WTRU 1402a、1402b和1402c通訊。RAN 1403也可以與核心網路1406通訊。如第14C圖所示,RAN 1403可以包括節點B 1440a、1440b、1440c,節點B 1440a、1440b、1440c的每一個包括一個或更多個用於經由空中介面1415以與WTRU 1402a、1402b、1402c通訊的收發器。節點B 1440a、1440b、1440c的每一個可以與RAN 1403內的特定胞元(未顯示)關聯。RAN 1403也可以包括RNC 1442a、1442b。將被理解的是,RAN 1403在保持實施方式的一致性時,可以包括任意數量的節點B和RNC。
如第14C圖所示,節點B 1440a、1440b可以與RNC 1442a通訊。此外,節點B 1440c可以與RNC 1442b通訊。節點B 1440a、1440b、1440c可以經由Iub介面分別與RNC 1442a、1442b通訊。RNC 1442a、1442b可以經由Iur介面相互通訊。RNC 1442a、1442b的每一個可以被配置以控制其連接的各自的節點B 1440a、1440b、1440c。另外,RNC 1442a、1442b的每一個可以被配置以執行或支援其他功能,例如外環功率控制、負載控制、允許控制、封包排程、切換控制、巨集分集、安全功能、資料加密等等。
第14C圖中所示的核心網路1406可以包括媒體閘道(MGW)1444、行動交換中心(MSC)1446、服務GPRS支援節點(SGSN)1448、及/或閘道GPRS支援節點(GGSN)1450。儘管前述元件的每一個被描述為核心網路1406的部分,將被理解的是,這些元件中的任何一個可以被不是核心網路操作者的實體擁有或操作。
RAN 1403中的RNC 1442a可以經由IuCS介面以與核心網路1406中的MSC 1446連接。MSC 1446可以連接至MGW 1444。MSC 1446和MGW 1444可以向WTRU 1402a、1402b、1402c提供到例如PSTN 1408的電路切換式網路的存取,以便於WTRU 1402a、1402b、1402c和傳統陸地線路 通訊裝置之間的通訊。
RAN 1403中RNC 1442a也可以經由IuPS介面以連接至核心網路1406中的SGSN 1448。SGSN 1448可以連接至GGSN 1450。SGSN 1448和GGSN 1450可以向WTRU 1402a、1402b、1402c提供到例如網際網路1410的封包交換網路的存取,以便於WTRU 1402a、1402b、1402c和IP賦能裝置之間的通訊。
如上所述,核心網路1406也可以連接至網路1412,網路1412可以包括由其他服務提供者擁有或操作的其他有線或無線網路。
第14D圖是根據實施方式的RAN 1404和核心網路1407結構圖。如上文所述,例如RAN 1404可使用E-UTRA無線電技術以經由空中介面1416來與WTRU 1402a、1402b和1402c通訊。RAN 1404也可以與核心網路1407通訊。
RAN 1404可包括e節點B 1460a、1460b和1460c,但將被理解的是,RAN 1404可以包括任意數量的e節點B而保持與各種實施方式的一致性。e節點B 1460a、1460b和1460c的每一個可包括用於經由空中介面1416以與WTRU 1402a、1402b、1402c通訊的一個或更多個收發器。在一種實施方式中,e節點B 1460a、1460b和1460c可以實施MIMO技術。因此,例如,e節點B 1460a,可以使用多個天線來向WTRU 1402a發送無線信號及/或從其接收無線信號。
e節點B 1460a、1460b和1460c的每一個可以與特定胞元關聯(未顯示)、並可以被配置為處理無線資源管理決策、切換決策、在上鏈及/或下鏈中的用戶排程等等。如第14D圖所示,e節點B 1460a、1460b、1460c可以經由X2介面相互通訊。
第14D圖中所示的核心網路1407可以包括移動性管理實體(MME)1462、服務閘道1464及/或封包資料網路(PDN)閘道1466。雖然前述單元的每一個被描述為核心網路1407的一部分,將被理解的是,這些 單元中的任一個可以由除了核心網路操作者之外的實體擁有及/或操作。
MME 1462可以經由S1介面以連接到RAN 1404中的e節點B 1460a、1460b和1460c的每一個、並可以作為控制節點。例如,MME 1462可以負責WTRU 1402a、1402b、1402c的用戶認證、承載啟動/停用、在WTRU 1402a、1402b、1402c的初始連結期間選擇特定服務閘道等等。MME 1462還可以提供控制平面功能,用於在RAN 1404和使用例如GSM或者WCDMA的其他無線電技術的其他RAN(未顯示)之間切換。
服務閘道1464可以經由S1介面以連接到RAN 104b中的e節點B 1460a、1460b和1460c的每一個。服務閘道1464通常可以向/從WTRU 1402a、1402b、1402c路由和轉發使用者資料封包。服務閘道1464也可以執行其他功能,例如在eNB間切換期間錨定用戶平面、當下鏈資料對於WTRU 1402a、1402b、1402c可用時觸發傳呼、管理和儲存WTRU 1402a、1402b、1402c的上下文(context)等等。
服務閘道1464也可以連接到PDN閘道1466,PDN閘道1466可以向WTRU 1402a、1402b、1402c提供到封包交換網路(例如網際網路1410)的存取,以便於WTRU 1402a、1402b、1402c與IP賦能裝置之間的通訊。
核心網路1407可以便於與其他網路的通訊。例如,核心網路1406可以向WTRU 1402a、1402b、1402c提供到電路切換式網路(例如PSTN 1408)的存取,以便於WTRU 1402a、1402b、1402c與傳統陸地線路通訊裝置之間的通訊。例如,核心網路1407可以包括IP閘道(例如,IP多媒體子系統(IMS)伺服器),或者與之通訊,該IP閘道作為核心網路1407與PSTN 1408之間的介面。另外,核心網路1407可以向WTRU 1402a、1402b、1402c提供到網路1412的存取,該網路1412可以包括被其他服務提供者擁有及/或操作的其他有線或無線網路。
第14E圖是根據實施方式的RAN 1405和核心網路1409的結構圖。RAN 1405可以是使用IEEE 802.16無線電技術以經由空中介面1417來與 WTRU 1402a、1402b和1402c進行通訊的存取服務網路(ASN)。如下面進一步討論的,WTRU 1402a、1402b、1402c,RAN 1405和核心網路1409的不同功能實體之間的鏈路可以被定義為參考點。
如第14E圖所示,RAN 1405可以包括基地台1480a、1480b、1480c和ASN閘道1482,但將被理解的是,RAN 1405可以包括任意數量的基地台和ASN閘道而與實施方式保持一致。基地台1480a、1480b和1480c的每一個可以與RAN 1405中特定胞元(未示出)關聯並可以包括經由空中介面11417以與WTRU 1402a、1402b、1402c通訊的一個或更多個收發器。在一個示例中,基地台1480a、1480b、1480c可以實施MIMO技術。因此,例如,基地台1480a可使用多個天線來向WTRU 1402a發送無線信號、或從其接收無線信號。基地台1480a、1480b和1480c可以提供移動性管理功能,例如呼叫切換(handoff)觸發、隧道建立、無線電資源管理、訊務分類、服務品質策略執行等等。ASN閘道1482可以充當訊務聚合點、並且負責傳呼、快取使用者資料(profile)、路由到核心網路1409等等。
WTRU 1402a、1402b、1402c和RAN 1405之間的空中介面1417可以被定義為實施IEEE 802.16規範的R1參考點。另外,WTRU 1402a、1402b和1402c的每一個可以與核心網路1409建立邏輯介面(未顯示)。WTRU 1402a、1402b、1402c和核心網路1409之間的邏輯介面可以定義為R2參考點,其可以用於認證、授權、IP主機(host)配置管理及/或移動性管理。
基地台1480a、1480b、1480c的每一個之間的通訊鏈路可以定義為包括便於WTRU切換和基地台間轉移資料的協定的R8參考點。基地台1480a、1480b、1480c和ASN閘道1482之間的通訊鏈路可以定義為R6參考點。R6參考點可以包括用於促進基於與WTRU 1402a、1402b、1402c的每一個關聯的移動性事件的移動性管理的協定。
如第14E圖所示,RAN 1405可以連接至核心網路1409。RAN 1405和核心網路1409之間的通訊鏈路可以定義為包括例如便於資料轉移和 移動性管理能力的協定的R3參考點。核心網路1409可以包括行動IP本地代理(MIP-HA)1484、認證、授權、計費(AAA)伺服器1486和閘道1488。儘管前述的每個元件被描述為核心網路1409的部分,將被理解的是,這些元件中的任一個可以由不是核心網路操作者的實體擁有或操作。
MIP-HA可以負責IP位址管理、並可以使WTRU 1402a、1402b和1402c在不同ASN及/或不同核心網路之間漫遊。MIP-HA 1484可以向WTRU 1402a、1402b、1402c提供封包交換網路(例如網際網路1410)的存取,以促進WTRU 1402a、1402b、1402c和IP賦能裝置之間的通訊。AAA伺服器1486可以負責使用者認證和支援使用者服務。閘道1488可促進與其他網路互通。例如,閘道1488可以向WTRU 1402a、1402b、1402c提供電路切換式網路(例如PSTN 1408)的存取,以促進WTRU 1402a、1402b、1402c和傳統陸地線路通訊裝置之間的通訊。此外,閘道1488可以向WTRU 1402a、1402b、1402c提供網路1412,其可以包括由其他服務提供者擁有或操作的其他有線或無線網路。
儘管未在第14E圖中顯示,將被理解的是,RAN 1405可以連接至其他ASN,並且核心網路1409可以連接至其他核心網路。RAN 1405和其他ASN之間的通訊鏈路可以定義為R4參考點,其可以包括協調RAN 1405和其他ASN之間的WTRU 1402a、1402b、1402c的移動性的協定。核心網路1409和其他核心網路之間的通訊鏈路可以定義為R5參考,其可以包括促進本地核心網路和被訪問核心網路之間的互通的協定。
第15圖是示出基於塊的視訊編解碼器(例如,混合視訊編解碼器)的方塊圖。可一塊塊地處理輸入的視訊訊號1502。視訊塊單元包括16x16個像素。這樣的一個塊單元可以被稱為巨集塊(MB)。在高效視訊編碼(HEVC)中,可使用擴展的塊大小(例如,被稱為“編碼單元”或CU)來有效地壓縮高解析度(例如,大於以及等於1080p)的視訊訊號。在HEVC中,CU可高達64x64個像素。CU可被切割為預測單元(PU),對於預測單 元可以採用單獨預測的方法。
對輸入視訊塊(例如,MB或CU),可執行空間預測1560及/或時間預測1562。空間預測(例如,“內部預測”)可使用相同視訊圖像/片段中的已被編碼的相鄰塊中的像素來預測目前視訊塊。空間預測可減少視訊訊號中內在的空間冗餘。時間預測(例如,“間預測”或“移動補償預測”)可使用已被編碼的視訊圖像(例如,可以被稱為“參考圖像”)的像素來預測目前視訊塊。時間預測可減少信號中內在的時間冗餘。可經由一或多個移動向量用信號發送對於視訊塊的時間預測,移動向量可用來表明參考圖像中的其預測塊和目前塊之間的移動的量及/或方向。如果支援多個參考圖像(例如,在H.264/AVC及/或HEVC的情況下),則對於每一個視訊塊,將額外發送其參考圖像索引。參考圖像索引可被用來識別時間預測信號來自參考圖像記憶體1564(例如,其可以被稱為“被解碼的圖像緩衝”或DPB)中的哪個參考圖像。
在空間及/或時間預測之後,編碼器中的模式決策塊1580可選擇預測模式。從目前視訊塊1516中減去預測塊。預測殘留(residual)可被轉換1504及/或被1506量化。量化殘留係數可被1510反向量化及/或被逆轉換1512來形成被重建的殘留,然後將被重建的殘留加回給預測塊1526來形成重建的視訊塊。
在重建的視訊塊在被放入參考圖像儲存1564中及/或用於對後來的視訊塊編碼前,可在重建的視訊塊上應用例如但不限於解塊濾波器、取樣自適應偏移及/或自適應迴路濾波器之類的內迴路濾波(in-loop filtering)1566。為形成輸出視訊位元流1520,編碼模式(例如,間預測(inter prediction)模式或內部預測模式)、預測模式資訊、移動資訊及/或量化的殘留係數將被送到熵編碼單元1508進行壓縮及/或緊縮以形成位元流。
第16圖是示出基於塊的視訊解碼器的示例的圖。視訊位元流1602在熵解碼單元1608被拆開及/或被熵解碼。編碼模式及/或預測資訊可被 發送給空間預測單元1660(例如,如果是內部編碼)及/或時間預測單元1662(例如,如果是間編碼),以形成預測塊。如果是間編碼(inter coded),預測資訊可包括預測塊大小、一或更多移動向量(例如,其可以用於表明移動的方向和量)、及/或一或更多參考索引(例如,其可以用於表明預測信號從哪個參考圖像得到)。
時間預測單元1662可應用移動補償預測來形成時間預測塊。殘留轉換係數可被發送至反向量化單元1610和逆轉換單元1612來重建殘留塊。在1626中將預測塊和殘留塊相加。重建的塊在被儲存在參考圖像儲存1664前,先經過內迴路濾波。參考圖像儲存1664中的重建的視訊可被用來驅動顯示裝置及/或被用來預測以後的視訊塊。
單層視訊編解碼器可採用單一視訊序列輸入並產生傳送給單層解碼器的單一壓縮位元流。可設計用於數位視訊服務(舉例來說,例如但不限於經由衛星、電纜和陸地傳輸通道發送TV信號)的視訊編解碼器。隨著在異質環境中所開發的視訊中心應用,可開發出作為視訊標準的擴展的多層視訊編碼技術來賦能各種應用。例如,可調視訊編碼技術被設計用來處理多於一個視訊層的情況,其中每一層都可被解碼來重建具有特定空間解析度、時間解析度、保真度及/或視野(view)的視訊訊號。雖然參考第15圖和第16圖描述了單層編碼器和解碼器,此處所述的概念也利用多層編碼器和解碼器,例如,用於多層或可調編碼技術。第15圖的編碼器及/或第16圖的解碼器可執行此處所述的任何功能。例如,第15圖的編碼器及/或第16圖的解碼器可使用增強層PU的MV在增強層(例如增強層圖像)上執行TMVP。
第17圖是示出通訊系統的示例的圖。通訊系統1700可包括編碼器1702、通訊網路1704和解碼器1706。編碼器1702可經由連接1708以與通訊網路1704通訊。連接1708可以是有線連接或無線連接。編碼器1702類似於第15圖中的基於塊的視訊編解碼器。編碼器1702可包括單層編解碼器 (例如,如第15圖所示)或多層編解碼器器。
解碼器1706可經由連接1710以與通訊網路1704通訊。連接1710可以是有線連接或無線連接。解碼器1706類似於第16圖中的基於塊的視訊解碼器。解碼器1706可包括單層編解碼器(例如,如第16圖所示)或多層編解碼器。編碼器1702及/或解碼器1706可被結合到多種多樣的有線通訊裝置及/或無線傳輸/接收單元(WTRU)中的任一種,例如,但不限於數位電視、無線廣播系統、網路元件/終端、伺服器(例如,內容或網站伺服器(例如,如超文本傳輸協定(HTTP)伺服器)、個人數位助理(PDA)、筆記型電腦或桌上型電腦、平板電腦、數位相機、數位記錄裝置、視訊遊戲裝置、視訊遊戲控制台、蜂巢或衛星無線電話和數位媒體播放機等等。
通訊網路1704適用於通訊系統。例如,通訊網路1704可以是向多個無線使用者提供內容(例如,語音、資料、視訊、訊息發送、廣播等)的多重存取系統。通訊網路1704可以使多個無線使用者能夠經由系統資源分享(包括無線頻寬)存取這些內容。例如,通訊網路1704可以使用一種或多種通道存取方法,例如分碼多重存取(CDMA)、分時多重存取(TDMA)、分頻多重存取(FDMA)、正交FDMA(OFDMA)、單載波FMDA(SC-FDMA)等。
這裡描述的方法可以用電腦程式、軟體或韌體實現,其可包含到由電腦或處理器執行的電腦可讀媒體中。電腦可讀媒體的示例包括電子信號(經由有線或無線連接傳送)和電腦可讀儲存媒體。電腦可讀儲存媒體的示例包括但不限於唯讀記憶體(ROM)、隨機存取記憶體(RAM)、暫存器、快取記憶體、半導體記憶體裝置、磁性媒體(例如,內部硬碟和抽取式磁碟)、磁光媒體和光學媒體,例如光碟(CD)或數位多功能光碟(DVD)。與軟體關聯的處理器用於實現射頻收發器,用於WTRU、UE、終端、基地台、RNC或任何主機電腦。

Claims (24)

  1. 一種用於使用時間移動向量預測(TMVP)解碼一增強層圖像的方法,該方法包括:經由一視訊解碼器接收一位元流,該位元流包括一基礎層以及一增強層;基於該位元流中的一指示,確定是使用一層間參考圖像還是一時間增強層圖像作為一並置圖像(ColPic)以用於一增強層圖像的TMVP;在確定使用該層間參考圖像作為該ColPic以用於該增強層圖像的TMVP時,經由該視訊解碼器將該層間參考圖像加入用於該增強層圖像的一參考圖像列表,其中該層間參考圖像包括從一基礎層圖像的一紋理確定的一紋理、從該基礎層圖像的一移動向量確定的一移動向量、以及從該基礎層圖像的一參考圖像索引確定的一參考圖像索引;以及使用該層間參考圖像作為該ColPic以用於該增強層圖像的TMVP以經由該視訊解碼器解碼該增強層圖像。
  2. 如申請專利範圍第1項所述的方法,更包括:經由該視訊解碼器上取樣該基礎層圖像的該紋理以確定該層間參考圖像的該紋理;以及經由該視訊解碼器縮放該基礎層圖像的該移動向量以確定該層間參考圖像的該移動向量。
  3. 如申請專利範圍第1項所述的方法,其中該層間參考圖像是在一不同時間實例作為該增強層圖像。
  4. 如申請專利範圍第1項所述的方法,其中該層間參考圖像是在一相同時間實例作為該增強層圖像。
  5. 如申請專利範圍第1項所述的方法,更包括:標記該層間參考圖像的一區域以表明該區域在TMVP中不可用。
  6. 如申請專利範圍第5項所述的方法,其中標記該層間參考圖像的該區域包括將與該區域對應的一參考圖像索引設定為-1的一值。
  7. 如申請專利範圍第5項所述的方法,其中標記該層間參考圖像的該區域是回應於確定該基礎層圖像中的一對應區域是被內部編碼的而被執行。
  8. 如申請專利範圍第1項所述的方法,更包括:經由該視訊解碼器確定該基礎層圖像的一壓縮移動向量;以及基於該基礎層圖像的該壓縮移動向量以經由該視訊解碼器確定該層間參考圖像的該移動向量。
  9. 如申請專利範圍第8項所述的方法,其中確定該層間參考圖像的該移動向量包括根據該基礎層與該增強層之間的一空間比率來縮放該基礎層圖像的該壓縮移動向量、以及基於該縮放的移動向量確定該層間參考圖像的該移動向量。
  10. 如申請專利範圍第1項所述的方法,更包括:藉由複製該基礎層圖像的一參考圖像列表以經由該視訊解碼器來確定用於該層間參考圖像的一參考圖像列表。
  11. 如申請專利範圍第10項所述的方法,更包括:藉由複製該基礎層圖像的該參考圖像列表中的一對應參考圖像的一圖像順序計數(POC)以經由該視訊解碼器來確定該層間參考圖像的該參考圖像列表中的每一參考圖像的一POC。
  12. 如申請專利範圍第1項所述的方法,其中解碼包括使用該層間參考圖像的一移動向量來預測該增強層圖像的一移動向量。
  13. 一種解碼器,包括:一處理器,被配置為:接收一位元流,該位元流包括一基礎層以及一增強層;基於該位元流中的一指示,確定是使用一層間參考圖像還是一時間增強層圖像作為一並置圖像(ColPic)以用於一增強層圖像的時間移動向量預測(TMVP);在確定使用該層間參考圖像作為該ColPic以用於該增強層圖像的TMVP時,將該層間參考圖像加入用於該增強層圖像的一參考圖像列表,其中該層間參考圖像包括從一基礎層圖像的一紋理確定的一紋理、從該基礎層圖像的一移動向量確定的一移動向量、以及從該基礎層圖像的一參考圖像索引確定的一參考圖像索引;以及使用該層間參考圖像作為該ColPic以用於該增強層圖像的TMVP而使用TMVP解碼該增強層圖像。
  14. 如申請專利範圍第13項所述的解碼器,其中該紋理是藉由上取樣該基礎層圖像的該紋理而被確定,以及該移動向量是藉由縮放該基礎層圖像的該移動向量而被確定。
  15. 如申請專利範圍第13項所述的解碼器,其中該層間參考圖像是在一不同時間實例作為該增強層圖像。
  16. 如申請專利範圍第13項所述的解碼器,其中該層間參考圖像是在一相同時間實例作為該增強層圖像。
  17. 如申請專利範圍第13項所述的解碼器,其中該層間參考圖像的一區域被標記以表明該區域在TMVP中不可用。
  18. 如申請專利範圍第17項所述的解碼器,其中與該區域對應的一參考圖像索引被設定為-1的一值以表明該區域在TMVP中不可用。
  19. 如申請專利範圍第17項所述的解碼器,其中該層間參考圖像的該區域被標記以回應於確定該基礎層圖像中的一對應區域是被內部編碼的。
  20. 如申請專利範圍第13項所述的解碼器,其中該處理器更被配置為:確定該基礎層圖像的一壓縮移動向量;以及基於該基礎層圖像的該壓縮移動向量以確定該層間參考圖像的該移動向量。
  21. 如申請專利範圍第20項所述的解碼器,其中該處理器被配置為確定該層間參考圖像的該移動向量包括該處理器被配置為根據該基礎層與該增強層之間的一空間比率來縮放該基礎層圖像的該壓縮移動向量、以及基於該縮放的移動向量來確定該層間參考圖像的該移動向量。
  22. 如申請專利範圍第13項所述的解碼器,其中該處理器更被配置為:藉由複製該基礎層圖像的一參考圖像列表以確定用於該層間參考圖像的一參考圖像列表。
  23. 如申請專利範圍第22項所述的解碼器,其中該處理器更被配置為藉由複製該基礎層圖像的該參考圖像列表中的一對應參考圖像的一圖像順序計數(POC)以確定該層間參考圖像的該參考圖像列表中的每一參考圖像的一POC。
  24. 如申請專利範圍第13項所述的解碼器,其中該處理器被配置為藉由使用該層間參考圖像的一移動向量預測該增強層圖像的一移動向量以使用TMVP來解碼該增強層圖像。
TW106126144A 2012-08-29 2013-08-29 可調整視訊編碼移動向量預測的方法及裝置 TWI646822B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201261694555P 2012-08-29 2012-08-29
US61/694,555 2012-08-29
US201261734650P 2012-12-07 2012-12-07
US61/734,650 2012-12-07
US201361866822P 2013-08-16 2013-08-16
US61/866,822 2013-08-16

Publications (2)

Publication Number Publication Date
TW201804792A TW201804792A (zh) 2018-02-01
TWI646822B true TWI646822B (zh) 2019-01-01

Family

ID=49162260

Family Applications (2)

Application Number Title Priority Date Filing Date
TW106126144A TWI646822B (zh) 2012-08-29 2013-08-29 可調整視訊編碼移動向量預測的方法及裝置
TW102131068A TWI637625B (zh) 2012-08-29 2013-08-29 可調整視訊編碼移動向量預測的方法及裝置

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW102131068A TWI637625B (zh) 2012-08-29 2013-08-29 可調整視訊編碼移動向量預測的方法及裝置

Country Status (9)

Country Link
US (3) US9900593B2 (zh)
EP (2) EP3588958B1 (zh)
JP (3) JP5961761B2 (zh)
KR (3) KR102062506B1 (zh)
CN (3) CN108156463B (zh)
AU (2) AU2013308719B2 (zh)
MX (1) MX341900B (zh)
TW (2) TWI646822B (zh)
WO (1) WO2014036259A1 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035286B (zh) * 2012-07-09 2021-11-12 Vid拓展公司 用于多层视频编码的编解码器架构
CN105141964B (zh) * 2012-09-03 2018-07-03 索尼公司 图像处理设备和方法
SG11201408580PA (en) * 2012-09-28 2015-01-29 Sony Corp Image Processing Device
US10375405B2 (en) * 2012-10-05 2019-08-06 Qualcomm Incorporated Motion field upsampling for scalable coding based on high efficiency video coding
US10194146B2 (en) * 2013-03-26 2019-01-29 Qualcomm Incorporated Device and method for scalable coding of video information
KR20140121315A (ko) * 2013-04-04 2014-10-15 한국전자통신연구원 참조 픽처 리스트를 이용한 다 계층 기반의 영상 부호화/복호화 방법 및 그 장치
US11438609B2 (en) * 2013-04-08 2022-09-06 Qualcomm Incorporated Inter-layer picture signaling and related processes
WO2014186542A1 (en) * 2013-05-15 2014-11-20 Vid Scale, Inc. Single loop decoding based inter layer prediction
CN105531999B (zh) 2013-07-09 2019-08-09 诺基亚技术有限公司 涉及用于信号传输运动信息的语法的视频编码方法及装置
US9560358B2 (en) * 2013-07-22 2017-01-31 Qualcomm Incorporated Device and method for scalable coding of video information
KR102248848B1 (ko) * 2013-10-26 2021-05-06 삼성전자주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
EP3090549A1 (en) 2014-01-02 2016-11-09 VID SCALE, Inc. Methods and systems for scalable video coding with mixed interlace and progressive content
WO2015139205A1 (en) * 2014-03-18 2015-09-24 Mediatek Singapore Pte. Ltd. An improved method for collocated picture in video coding
WO2015143603A1 (en) * 2014-03-24 2015-10-01 Mediatek Singapore Pte. Ltd. An improved method for temporal motion vector prediction in video coding
WO2016165069A1 (en) * 2015-04-14 2016-10-20 Mediatek Singapore Pte. Ltd. Advanced temporal motion vector prediction in video coding
KR20170059718A (ko) * 2015-11-23 2017-05-31 삼성전자주식회사 디코딩 장치 및 그 방법
CN109660800B (zh) * 2017-10-12 2021-03-12 北京金山云网络技术有限公司 运动估计方法、装置、电子设备及计算机可读存储介质
KR20200095463A (ko) * 2017-11-01 2020-08-10 브이아이디 스케일, 인크. 병합 모드를 위한 서브-블록 모션 도출 및 디코더측 모션 벡터 정교화
GB2588004B (en) 2018-06-05 2023-03-01 Beijing Bytedance Network Tech Co Ltd Interaction between IBC and affine
WO2019234613A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
WO2019244117A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
CN113115046A (zh) 2018-06-21 2021-07-13 北京字节跳动网络技术有限公司 分量相关的子块分割
CN110944196B (zh) 2018-09-24 2023-05-30 北京字节跳动网络技术有限公司 简化的基于历史的运动矢量预测
CN111083491B (zh) 2018-10-22 2024-09-20 北京字节跳动网络技术有限公司 细化运动矢量的利用
WO2020084476A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Sub-block based prediction
WO2020084552A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Motion candidate derivation based on spatial neighboring block in sub-block motion vector prediction
WO2020094150A1 (en) 2018-11-10 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Rounding in current picture referencing
WO2020098644A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Bandwidth control methods for inter prediction
CN113170171B (zh) 2018-11-20 2024-04-12 北京字节跳动网络技术有限公司 组合帧间帧内预测模式的预测细化
CN117319644A (zh) 2018-11-20 2023-12-29 北京字节跳动网络技术有限公司 基于部分位置的差计算
CN113196771B (zh) 2018-12-21 2023-12-22 北京字节跳动网络技术有限公司 基于运动矢量精度的运动矢量范围
KR102023742B1 (ko) 2019-01-31 2019-11-04 (주)래딕스 테스트 핀 조립체
WO2020177755A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Usage of converted uni-prediction candidate
KR102610709B1 (ko) 2019-04-02 2023-12-05 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 디코더 측 움직임 벡터 유도
CA3145240C (en) * 2019-06-24 2024-06-11 Lg Electronics Inc. Inter prediction-based image coding method and apparatus
EP4000265A4 (en) 2019-08-20 2022-10-26 Beijing Bytedance Network Technology Co., Ltd. USING DEFAULT AND CUSTOM SCALING MATRICES
CN115606183A (zh) 2020-04-07 2023-01-13 抖音视界有限公司(Cn) 参考图片环绕的剪裁操作
CN115668917A (zh) 2020-04-09 2023-01-31 抖音视界有限公司 视频编解码中的去块信令通知
WO2021204251A1 (en) 2020-04-10 2021-10-14 Beijing Bytedance Network Technology Co., Ltd. Use of header syntax elements and adaptation parameter set
WO2021209061A1 (en) 2020-04-17 2021-10-21 Beijing Bytedance Network Technology Co., Ltd. Presence of adaptation parameter set units
WO2021213357A1 (en) * 2020-04-20 2021-10-28 Beijing Bytedance Network Technology Co., Ltd. Adaptive color transform in video coding
KR20230002447A (ko) 2020-04-26 2023-01-05 바이트댄스 아이엔씨 비디오 코딩 신택스 요소의 조건적 시그널링

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100621581B1 (ko) * 2004-07-15 2006-09-13 삼성전자주식회사 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
ITMI20041971A1 (it) * 2004-10-15 2005-01-15 Uni Degli Studi Brescia Metodo di codifica video scalabile
KR100679022B1 (ko) * 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
KR100664929B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
KR100714689B1 (ko) * 2005-01-21 2007-05-04 삼성전자주식회사 다 계층 구조 기반의 스케일러블 비디오 코딩 및 디코딩방법, 이를 위한 장치
KR20060088461A (ko) * 2005-02-01 2006-08-04 엘지전자 주식회사 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
KR100896279B1 (ko) * 2005-04-15 2009-05-07 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
US8619860B2 (en) 2005-05-03 2013-12-31 Qualcomm Incorporated System and method for scalable encoding and decoding of multimedia data using multiple layers
WO2007018688A1 (en) * 2005-07-22 2007-02-15 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
EP1999960A4 (en) * 2006-03-24 2011-05-18 Korea Electronics Telecomm CODING METHOD FOR REDUCING REDUNDANCY BETWEEN LAYERS USING MITION DATA OF THE FGS LAYER AND ESTABLISHMENT THEREFOR
CN101102503A (zh) * 2006-07-07 2008-01-09 华为技术有限公司 视频分层编码层间运动矢量的预测方法
US8396134B2 (en) * 2006-07-21 2013-03-12 Vidyo, Inc. System and method for scalable video coding using telescopic mode flags
JP5134001B2 (ja) * 2006-10-18 2013-01-30 アップル インコーポレイテッド 下層のフィルタリングを備えたスケーラブルビデオ符号化
AP2545A (en) * 2006-10-20 2012-12-20 Nokia Corp Virtual decoded reference picture marking and reference picture list
WO2008051995A2 (en) * 2006-10-23 2008-05-02 Vidyo, Inc. System and method for scalable video coding using telescopic mode flags
CN101690220B (zh) * 2007-04-25 2013-09-25 Lg电子株式会社 用于解码/编码视频信号的方法和装置
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8265144B2 (en) * 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
WO2012122423A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Pre-processing for bitdepth and color format scalable video coding
US9973739B2 (en) * 2008-10-17 2018-05-15 Nokia Technologies Oy Sharing of motion vector in 3D video coding
FR2939593B1 (fr) * 2008-12-09 2010-12-31 Canon Kk Procede et dispositif de codage video
US20120050475A1 (en) * 2009-05-01 2012-03-01 Dong Tian Reference picture lists for 3dv
US9124898B2 (en) * 2010-07-12 2015-09-01 Mediatek Inc. Method and apparatus of temporal motion vector prediction
US8908755B2 (en) * 2010-07-16 2014-12-09 Sony Corporation Multi-parameter motion for efficient prediction in video compression
TW201223249A (en) 2010-09-24 2012-06-01 Qualcomm Inc Coding stereo video data
US20120075436A1 (en) * 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
EP2630799A4 (en) * 2010-10-20 2014-07-02 Nokia Corp METHOD AND DEVICE FOR VIDEO CODING AND DECODING
US9635382B2 (en) * 2011-01-07 2017-04-25 Texas Instruments Incorporated Method, system and computer program product for determining a motion vector
KR102450324B1 (ko) * 2011-02-09 2022-10-04 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
US9148666B2 (en) * 2011-02-09 2015-09-29 Lg Electronics Inc. Method for storing motion information and method for inducing temporal motion vector predictor using same
US9247266B2 (en) * 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
US20120287999A1 (en) * 2011-05-11 2012-11-15 Microsoft Corporation Syntax element prediction in error correction
US20130016776A1 (en) * 2011-07-12 2013-01-17 Vidyo Inc. Scalable Video Coding Using Multiple Coding Technologies
US9736489B2 (en) * 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
KR20130037161A (ko) * 2011-10-05 2013-04-15 한국전자통신연구원 스케일러블 비디오 코딩을 위한 향상된 계층간 움직임 정보 예측 방법 및 그 장치
EP2781091B1 (en) * 2011-11-18 2020-04-08 GE Video Compression, LLC Multi-view coding with efficient residual handling
US9900615B2 (en) * 2011-12-28 2018-02-20 Microsoft Technology Licensing, Llc Representative motion information for temporal motion prediction in video encoding and decoding
US20130188719A1 (en) * 2012-01-20 2013-07-25 Qualcomm Incorporated Motion prediction in svc using motion vector for intra-coded block
PL2822276T3 (pl) * 2012-02-29 2019-04-30 Lg Electronics Inc Sposób predykcji międzywarstwowej i stosujące go urządzenie
CN108377393A (zh) * 2012-03-22 2018-08-07 联发科技股份有限公司 编码视频数据的方法以及装置
WO2013162450A1 (en) * 2012-04-24 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Encoding and deriving parameters for coded multi-layer video sequences
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
US9253487B2 (en) * 2012-05-31 2016-02-02 Qualcomm Incorporated Reference index for enhancement layer in scalable video coding
US9762903B2 (en) * 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
US9420286B2 (en) * 2012-06-15 2016-08-16 Qualcomm Incorporated Temporal motion vector prediction in HEVC and its extensions
WO2013189257A1 (en) * 2012-06-20 2013-12-27 Mediatek Inc. Method and apparatus of bi-directional prediction for scalable video coding
US20130343459A1 (en) * 2012-06-22 2013-12-26 Nokia Corporation Method and apparatus for video coding
WO2014030920A1 (ko) * 2012-08-21 2014-02-27 삼성전자 주식회사 트리 구조의 부호화 단위에 기초한 예측 정보의 인터-레이어 비디오 부호화 방법 및 그 장치, 트리 구조의 부호화 단위에 기초한 예측 정보의 인터-레이어 비디오 복호화 방법 및 그 장치
EP2898671A4 (en) * 2012-09-21 2016-03-09 Intel Corp PREDICTION OF MOTION VECTORS BETWEEN LAYERS
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
US9124899B2 (en) * 2012-09-28 2015-09-01 Sharp Laboratories Of America, Inc. Motion derivation and coding for scaling video
US20150245063A1 (en) * 2012-10-09 2015-08-27 Nokia Technologies Oy Method and apparatus for video coding
US9294776B2 (en) * 2013-03-05 2016-03-22 Qualcomm Incorporated Parallel processing for video coding
US8958477B2 (en) * 2013-04-05 2015-02-17 Vidyo, Inc. Multiple reference layer prediction signaling techniques
US20140348222A1 (en) * 2013-05-23 2014-11-27 Mediatek Inc. Method of Sample Adaptive Offset Processing for Video Coding and Inter-Layer Scalable Coding
WO2016180486A1 (en) * 2015-05-12 2016-11-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Composite scalable video streaming

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H. Schwarz, D. Marpe and T. Wiegand, "Overview of the Scalable Video Coding Extension of the H.264/AVC Standard," in IEEE Transactions on Circuits and Systems for Video Technology, vol. 17, no. 9, pp. 1103-1120, Sept. 2007 *
Z. Shi, X. Sun and J. Xu, "CGS quality scalability for HEVC," 2011 IEEE 13th International Workshop on Multimedia Signal Processing, Hangzhou, 2011, pp. 1-6 *

Also Published As

Publication number Publication date
JP6220013B2 (ja) 2017-10-25
TWI637625B (zh) 2018-10-01
JP5961761B2 (ja) 2016-08-02
KR101754999B1 (ko) 2017-07-06
EP2891311A1 (en) 2015-07-08
CN115243046A (zh) 2022-10-25
KR20150046228A (ko) 2015-04-29
JP6431966B2 (ja) 2018-11-28
CN104604230B (zh) 2018-03-02
JP2016213857A (ja) 2016-12-15
EP3588958B1 (en) 2024-07-03
US20180131952A1 (en) 2018-05-10
JP2018029361A (ja) 2018-02-22
JP2015529420A (ja) 2015-10-05
TW201804792A (zh) 2018-02-01
AU2016201903A1 (en) 2016-04-21
KR20190025758A (ko) 2019-03-11
AU2013308719B2 (en) 2015-12-24
US9900593B2 (en) 2018-02-20
US20140064374A1 (en) 2014-03-06
MX2015002536A (es) 2015-10-12
CN108156463A (zh) 2018-06-12
KR102062506B1 (ko) 2020-01-03
AU2013308719A1 (en) 2015-04-02
US10939130B2 (en) 2021-03-02
TW201424390A (zh) 2014-06-16
WO2014036259A1 (en) 2014-03-06
KR101955700B1 (ko) 2019-03-07
US20210120257A1 (en) 2021-04-22
CN108156463B (zh) 2022-07-01
KR20170081741A (ko) 2017-07-12
EP3588958A1 (en) 2020-01-01
CN104604230A (zh) 2015-05-06
US11343519B2 (en) 2022-05-24
AU2016201903B2 (en) 2017-12-21
MX341900B (es) 2016-09-07

Similar Documents

Publication Publication Date Title
TWI646822B (zh) 可調整視訊編碼移動向量預測的方法及裝置
JP6307650B2 (ja) スケーラブルビデオ符号化のための動き情報シグナリング
JP6954763B2 (ja) マルチレイヤビデオコーディングの適応型アップサンプリング
TWI652936B (zh) 針對可縮放視訊編碼的增強型時間運動向量預測
TWI625052B (zh) 多層視訊編碼以片段為基礎之跨越模式傳訊