TW201531090A - Hevc延伸高階語法 - Google Patents

Hevc延伸高階語法 Download PDF

Info

Publication number
TW201531090A
TW201531090A TW103135355A TW103135355A TW201531090A TW 201531090 A TW201531090 A TW 201531090A TW 103135355 A TW103135355 A TW 103135355A TW 103135355 A TW103135355 A TW 103135355A TW 201531090 A TW201531090 A TW 201531090A
Authority
TW
Taiwan
Prior art keywords
layer
video
direct
video encoding
sps
Prior art date
Application number
TW103135355A
Other languages
English (en)
Other versions
TWI646825B (zh
Inventor
Yong He
Yan Ye
Xiao-Yu Xiu
yu-wen He
Original Assignee
Vid Scale Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid Scale Inc filed Critical Vid Scale Inc
Publication of TW201531090A publication Critical patent/TW201531090A/zh
Application granted granted Critical
Publication of TWI646825B publication Critical patent/TWI646825B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

視訊編碼裝置可對網路提取層(NAL)單元進行識別。該視訊編碼裝置可確定該NAL單元是否包括當前層的活動參數集。當該NAL單元包括當前層的活動參數集時,該視訊編碼裝置可將與該NAL單元關聯的NAL單元標頭層識別符設為下列中的至少一者:零、指示當前層的值、以及指示當前層的基準層的值。該NAL單元可以是圖片參數集(PPS)NAL單元。該NAL單元可以是序列參數集(SPS)NAL單元。

Description

HEVC延伸高階語法
相關申請的交叉引用
本申請要求於2013年10月11日提交的美國臨時申請No. 61/889,787以及於2013年10月11日提交的美國臨時申請No. 61/889,919的權益,其全部內容結合於此作為參考。
為了實現高效數位視訊通訊、分佈和消費,開發了多種數位視訊壓縮技術並為之設立了標準。由ISO/IEC和/或ITU-T開發的示例標準包括H.261、MPEG-1、MPEG-2、H.263、MPEG-4 (第二部分)以及 H.264/AVC (MPEG-4第十部分高階視訊編碼)。被稱作高效視訊編碼(HEVC)的視訊編碼標準由ITU-T視訊編碼專家組(VCEG)和ISO/IEC MPEG共同開發。與H.264/AVC 標準相比,HEVC(ITU-T H.265 和 ISO/IEC 23008-2)實體上能夠實現更高的編碼效率。
[01]
視訊編碼裝置可識別網路提取層(NAL)單元。該視訊編碼裝置可確定該NAL單元是否包括當前層的活動參數集。基於確定該NAL單元包括當前層的活動參數集,該視訊編碼裝置可將與該NAL單元關聯的NAL單元標頭層識別符設為下列中的至少一者:零、指示當前層的值、以及指示當前層的基準層的值。該NAL單元可以是圖片參數集(PPS)NAL單元。該NAL單元可以是序列參數集(SPS)NAL單元。該指示當前層的值可包括與當前層關聯的層識別符。該指示當前層的基準層的值可包括與當前層的基準層關聯的層識別符。該視訊編碼裝置可發送包括該NAL單元的視訊位元串流至視訊解碼裝置。[02]
視訊編碼裝置可接收包括SPS和視訊參數集(VPS)的視訊位元串流。該VPS可包括視訊表示格式清單。該視訊編碼裝置例如可基於該SPS中的更新視訊表示格式標記來確定與該SPS關聯的層的視訊表示格式。如果該更新視訊表示格式標記指示該SPS中存在表現格式索引,則該視訊編碼裝置可基於該表現格式索引根據該VPS中的視訊表現格式清單來確定該視訊表現格式。如果該SPS中不存在更新表現格式索引,則該視訊編碼裝置可根據預設視訊表現格式來確定該視訊表現格式。該視訊編碼裝置例如可基於該SPS中的更新視訊表現格式標記來確定該SPS中是否存在該表現格式索引。舉例來說,如果該更新視訊表現格式標記等於1,則該視訊編碼裝置可確定該SPS中存在該視訊表現格式索引。如果該更新視訊表現格式標記等於0,則該視訊編碼裝置可確定該SPS中不存在該視訊表現格式索引。該預設視訊表現格式可包括在該VPS中針對層指定的預設視訊表現格式。該視訊更新表現格式索引可在0與表現格式的VPS號的值減1(包括0和表現格式的VPS號碼的值減1)之間的範圍內。[03]
視訊編碼裝置可為與SPS關聯的層分派表現格式。該視訊編碼裝置例如可基於用於與SPS關聯的層之被分派的表現格式來確定是否在SPS中包含表現格式索引。舉例來說,如果被分派的表現格式為預設表現格式,則該表現格式索引可能不被包含在該SPS中。舉例來說,如果被分派的表現格式在該VPS中被指定,則該表現格式索引可被包含在該SPS中。該視訊編碼裝置可將更新視訊表現格式標記設為指示該表現格式索引是否被包含在該SPS中。該視訊編碼裝置可將該更新視訊表現格式標記設為等於1,以指示該表現格式索引存在於該SPS中。該視訊編碼裝置可將該更新視訊表現格式索引設為等於0,以指示該表現格式索引不存在於該SPS中。[04]
視訊編碼裝置可接收包括VPS和一個或多個層的視訊位元串流。該視訊編碼裝置例如可基於該VPS中的預設直接附屬標記(direct dependency flag)來確定與該一個或多個層關聯的直接附屬關係。如果該預設直接附屬標記指示該VPS中存在直接附屬類型資訊,則該視訊編碼裝置可根據該VPS中的直接附屬類型資訊來確定該直接附屬關係。如果該預設直接附屬標記指示該VPS中不存在該直接附屬類型資訊,則該視訊編碼裝置可基於預設確定該直接附屬關係。該預設附屬可應用於該多個層中的所有層。[05]
視訊編碼裝置可確定是否在該VPS中包括直接附屬類型資訊。如果該視訊編碼裝置決定使用預設附屬,則該視訊編碼裝置可以跳過在該VPS中以信號通告直接附屬類型資訊。如果該視訊編碼裝置決定不使用預設附屬,則該視訊編碼裝置可在該VPS包括直接附屬類型資訊。該視訊編碼裝置可在該VPS中將預設直接附屬標記設為指示是否在該VPS中以信號通告直接附屬類型資訊。[06]
多路SHVC編碼器可包括處理器,該處理器具有用於限制針對設定檔(profile)的基準層數量的可執行指令。該多路SHVC編碼器可設置基準層限制(limit)。該多路SHVC編碼器可將視訊訊號編碼到針對類的層中,由此編碼視訊訊號中針對給定層的直接和間接基準層的總數量小於該基準層限制。[07]
多路SHVC編碼器可具有處理器,該處理器具有用於限制針對類的基準層數量的可執行指令。該多路SHVC編碼器可設置基準層限制。該多路SHVC編碼器可將視訊訊號編碼到針對類的層中,該層包括直接和間接層。針對每一層,該多路SHVC編碼器可確定直接和間接基準層的總數量。該多路SHVC編碼器可確定針對該層的直接和間接基準層的總數量是否小於該基準層限制。舉例來說,如果針對每一層的直接和間接基準層的總數量小於該基準層限制,該多路SHVC編碼器可發送編碼視訊訊號至解碼器。[08]
視訊編碼裝置可例如通過應用一個或多個約束(constraint)限制層的數量來限定(restrict)和/或降低針對多路SHVC轉碼器的編碼複雜度。該層可以是直接附屬層、間接附屬層、和/或基層。一個或多個約束例如可限制該直接附屬層的最大數量或限制直接和間接附屬層的最大數量。該視訊編碼裝置可通過下列中的至少一者限制設定檔中的直接附屬層的最大數量:VPS延伸中的語法元素、SPS中的語法元素、類指示、和/或類、層(tier)和/或級(level)(例如可伸縮主設定檔)。該視訊編碼裝置可通過下列中的至少一者限制設定檔中的直接和間接附屬層的最大數量:VPS延伸中的語法元素、SPS中的語法元素、設定檔指示、和/或設定檔、層和/或級(例如可伸縮主設定檔)。約束可以是基層上的約束。該基層上的約束可使用一致SHVC位元串流。該一致SHVC位元串流可以是一個或多個存取單元,例如包括其nuh_layer_id(nuh_層_id)等於0而TemporalId(時間Id)等於1的圖片。包括nuh_layer_id等於0而時間ID等於1的圖片的層可以是層識別符列表TargetDecLayerIdList中的每一nuh_layer_id值的層的直接或間接附屬層。該視訊編碼裝置可通過導出變數用信號通告一個或多個約束。該視訊編碼裝置可通過語法元素用信號通告一個或多個約束。
[21]
現在參照各個附圖對說明性實施方式進行詳細描述。雖然該描述提供了可能實施的具體示例,應當注意的是該細節是示例性的且不對本申請的範圍進行限制。[22]
與傳統數位視訊服務(例如通過衛星、電纜和地面傳輸通道發送TV信號)相比,越來越多的視訊服務、例如IPTV、視訊聊天、移動視訊和串流式視訊可被應用在不同的環境之中。舉例來說,視訊應用可為網路中的視訊串流提供不同大小的胞元和/或其他等等。異構性(heterogeneity)可存在於用戶端以及網路中。例如,在客戶側,在具有變化的螢幕大小和顯示能力的裝置(包括智慧型電話、平板電腦、PC和TV、和/或其他等等)上消費視訊內容的N屏方案可被提供和/或使用。在網路側,視訊可在網際網路、WiFi網路、移動網路(3G和4G)和/或上述任意組合上進行傳送。[23]
可伸縮視訊編碼可在最高解析度下對信號進行編碼。可伸縮視訊編碼可根據某些應用所需的和/或客戶裝置支援的特定速率和解析度從該串流的子集啟動解碼。該解析度可由多個視訊參數(包括但不限於空間解析度(例如圖片大小)、時間解析度(例如訊框速率)、視訊品質(例如諸如MOS的主觀品質和/或諸如PSNR或SSIM或VQM的客觀品質))和/或其他等等來定義。其他通常使用的視訊參數可包括色度格式(例如YUV420或YUV422或YUV444)、位元深度(例如8位元或10位元視訊)、複雜度、視圖、色域和/或寬高比(例如16:9或4:3)。國際視訊標準(例如MPEG-2視訊、H.263、 MPEG4 可視和H.264)可具有支援伸縮性模式的工具和/或設定檔。[24]
可伸縮視訊編碼可啟動對部分位元串流的傳輸和解碼。對部分位元串流的傳輸和解碼會使得可伸縮視訊編碼(SVC)系統為視訊服務提供更低的時間和/或空間解析度或降低的保真度,同時保持相對高的重建品質(例如給定部分位元串流的相對速率)。SVC可採用單路解碼來實現,由此SVC解碼器可在正被解碼的層處設置一個動態補償路徑而不在一個或多個其他較低層處設置動態補償路徑。舉例來說,一個位元串流可包括兩個層,這兩個層包括作為基層的第一層(層1)和作為增強層的第二層(層2)。當上述的SVC解碼器重建層2視訊,解碼圖片緩衝器和動態補償預測的設置會被限制在層2。在SVC的這種實施過程中,來自較低層的各個基準圖片可能無法被完全重建,由此會降低該解碼器處的計算複雜性和/或記憶體消耗。[25]
單路解碼可被約束的層間紋理預測來實現,其中對於給定層中的當前塊,來自較低層的空間紋理預測可在相應的較低層塊在內模式下被編碼的情況下得以獲准。這可被稱為受限內預測。當較低層塊在內模式下被編碼時,該較低層塊可被重建而無需運動補償操作和/或解碼圖片緩衝器。[26]
SVC可從一個或多個較低層實施一個或多個額外的層間預測技術,例如動態向量預測、殘差預測、模式預測等等。這可提高增強層的失真效率。採用單路解碼的SVC實施過程會在解碼器處展現出降低的計算複雜性和/或降低的記憶體消耗,並且會展現出增加的實現複雜性(例如由於依靠塊級層間預測)。為了對通過施行單路解碼約束而引起的性能損失進行補償,可對編碼器設計和計算複雜性進行改進以實現所期望的性能。SVC可能無法支援交錯式內容的編碼。[27]
第1圖是描述了示例基於塊的混合可伸縮視訊編碼(SVC)系統的簡化框圖。將由層1(基層)表示的空間和/或時間信號解析度可通過對輸入視訊訊號進行下採樣而生成。在後續的編碼階段中,對量化器(例如Q1)的設置可通向基本資訊的品質級。一個或多個後續的較高層可使用基層重建Y1進行編碼和/或解碼,基層重建Y1可表示較高層解析度級的近似值。上採樣單元可對發送到層2解析度的基層重建信號執行上採樣。下採樣和/或上採樣可遍及多個層(例如對於N個層而言,層1、2…N)執行。下採樣和/或上採樣比率可以不同,例如取決於兩個層之間的可伸縮性的尺度。[28]
在第1圖的示例可伸縮視訊編碼系統中,對於給定較高層n(例如2≤n≤N,N為層的總數量),通過從當前層n信號中減去上採樣較低層信號(例如層n-1信號)可生成一個差分信號。該差分信號可被編碼。如果由兩個層n1和n2表示的各自的視訊訊號具有相同的空間解析度,則可跳過相應下採樣和/或上採樣操作。給定層n(例如1≤n≤N)或多個層可被解碼而無需使用來自較高層的解碼資訊。[29]
依靠(rely on)對非基層的層的殘差信號(例如兩個層之間的差分信號)的編碼(例如使用第1圖中的示例SVC系統)可能導致視覺假影。這種視覺假影例如可歸因於對殘差信號進行量化和/或標準化以限定其動態範圍和/或在殘差編碼期間執行的量化。一個或多個較高層編碼器可採用動態估計和/或動態補償預測作為各自的編碼模式。殘差信號中的動態估計和/或補償可能與常規動態補償不同,並且可能傾向於視覺假影。為了降低(例如最小化)視覺假影的出現,可實施更為複雜的殘差量化,例如與聯合量化進程一起實施,該聯合量化進程可包括殘差信號的量化和/或標準化以限定其動態範圍和在殘差編碼期間執行的量化。上述的量化進程會增加該SVC系統的複雜性。[30]
多視點視訊編碼(MVC)可提供視圖可伸縮性。在視圖可伸縮性的一個實例中,可對基層位元串流解碼以重建規範二維(2D)視訊,並且可對一個或多個額外的增強層解碼以重建同一視訊訊號的其他視圖表示。當這樣的視圖被組合到一起並且由三維(3D)顯示來顯示時,具有適當深度感知的3D視訊可得以產生。[31]
第2圖描述了使用MVC來編碼具有左視圖(層1)和右視圖(層2)的立體視訊的示例預測結構。左視圖視訊可採用I-B-B-P預測結構進行編碼,而右視圖視訊可採用P-B-B-B預測結構進行編碼。如第2圖所示,在右視圖中,與左視圖中的第一個I圖片並置的第一個圖片可被編碼為P圖片,而右視圖中後續的圖片可採用來自右視圖中的時間基準(temporal reference)的第一預測以及來自左視圖中的層間基準的第二預測被編碼為B圖片。MVC可能無法支援單路解碼特徵。舉例來說,如第2圖所示,對右視圖(層2)視訊進行解碼可以左視圖(層1)中全部圖片的有效性為條件,其中每一層(視圖)具有各自的補償路徑。MVC的實施可包括高階語法改變並且可能不包括塊級改變。上述過程可緩解(ease)MVC的實施。例如,MVC可通過在片(slice)和/或圖片級配置基準圖片得以實施。MVC可支援兩個以上視圖的編碼,例如通過對第2圖中的示例進行延伸以在多個視圖上執行層間預測。[32]
MPEG訊框相容(MFC)視訊編碼可為3D視訊編碼提供可伸縮延伸。例如,MFC可為訊框相容基層視訊(例如被包裝到同一訊框內的兩個視圖)提供可伸縮延伸,並且可提供一個或多個增強層以恢復全解析度視圖。立體3D視訊可具有兩個視圖,包括左視圖和右視圖。立體3D內容可通過將該兩個視圖包裝和/或多工到一個訊框內以及通過對包裝的視訊進行壓縮和傳輸來得以傳遞。在接收機側,在解碼之後,該訊框可被解開並顯示為兩個視圖。上述對視圖的多工可在時間域或空間域中執行。當在空間域執行時,為了保持相同的圖片大小,該兩個視圖會根據一個或多個排列方式在空間上被下採樣(例如通過係數2)並且被包裝。舉例來說,並排排列方式可將下採樣左視圖放在圖片的左一半並且將下採樣右視圖放在圖片的右一半。其他排列方式可包括上下、逐行、棋盤等等。用於實現訊框相容3D視訊的排列方式例如可通過一個或多個訊框包裝排列方式SEI消息來傳達。雖然上述的排列方式可使得3D傳遞的頻寬消耗的增加最小化,但空間下採樣會造成視圖混淆和/或會降低3D視訊的視覺品質和用戶體驗。[33]
視訊應用(例如IPTV、視訊聊天、移動視訊和/或串流式視訊可被使用在不同的環境中。異構性可存在於客戶側。異構性可存在於網路中。N屏可包括在具有變化的螢幕大小和顯示能力的裝置(包括智慧型電話、平板電腦、PC和/或TV等等)上消費視訊內容。N屏例如可在客戶側構建異構性。視訊例如可在網路側在網際網路、WiFi網路、移動網路(3G和/或4G)和/或上述網路的任意組合上進行傳送。可伸縮視訊編碼可改善用戶體驗和/或視訊服務品質。可伸縮視訊編碼可包括在最高解析度下對信號進行編碼。可伸縮視訊編碼可包括例如根據某些應用所使用的和/或客戶裝置支援的可用網路頻寬和/或視訊解析度從該串流的子集啟動解碼。解析度可以多個視訊參數為表徵。視訊參數可包括下列中的一者或多者:空間解析度、時間解析度、視訊品質、色度格式、位元深度、複雜度、視圖、色域和/或寬高比等等。空間解析度可包括圖片大小。時間解析度可包括訊框速率。視訊品質可包括主觀品質(例如MOS)和/或客觀品質(例如PSNR或SSIM或VQM)。色度格式可包括YUV420、YUV422或YUV444等等。位元深度可包括8位元視訊、10位元視訊等等。寬高比可包括16:9或4:3等等。HEVC可伸縮延伸至少可支援空間可伸縮性(例如可伸縮位元串流可包括多於一個空間解析度的信號)、品質可伸縮性(例如可伸縮位元串流可包括多於一個品質級的信號)、和/或標準可伸縮性(例如可伸縮位元串流可包括使用H.264/AVC編碼的基層以及一個或多個使用HEVC編碼的增強層)。在空間可伸縮性方面,可伸縮位元串流可包括一個或多個空間解析度的信號。在品質可伸縮性方面,可伸縮位元串流可包括一個或多個品質級的信號。在標準可伸縮性方面,可伸縮位元串流可包括使用例如H.264/AVC編碼的基層以及一個或多個例如使用HEVC編碼的增強層。品質可伸縮性可被稱為SNR可伸縮性。視圖可伸縮性可支援3D視訊應用。在視圖可伸縮性方面,可伸縮位元串流可包括2D和3D視訊訊號兩者。[34]
視訊編碼系統(例如根據高效視訊編碼(SHVC)的可伸縮延伸的視訊編碼系統)可包括一個或多個被配置成執行視訊編碼的裝置。被配置成執行視訊編碼(例如對視訊訊號進行編碼和/或解碼)的裝置可被稱為視訊編碼裝置。這樣的視訊編碼裝置可包括有視訊能力的裝置,例如電視機、數位媒體播放機、DVD播放機、藍光™播放機、網路媒體播放機裝置、臺式電腦、筆記本個人電腦、平板裝置、行動電話、視訊會議系統、基於硬體和/或軟體的視訊編碼系統等等。這樣的視訊編碼裝置可包括無線通訊網路元素(例如無線發射/接收單元(WTRU)、基地台、閘道或其他網路元素)。[35]
第3圖是示出了示例編碼器(例如SHVC編碼器)的簡化框圖。所示出的示例編碼器可用於生成兩層HD到UHD可伸縮性位元串流。如第3圖所示,基層(BL)視訊輸入330可以是HD視訊訊號,而增強層(EL)視訊輸入302可以是UHD視訊訊號。該HD視訊訊號330和該UHD視訊訊號302可相互對應,例如通過下列中的一者或多者:一個或多個下採樣參數(例如空間可伸縮性);一個或多個色彩分級參數(例如色域可伸縮性);一個或多個色調映射參數(例如位元深度可伸縮性)328。[36]
BL編碼器318例如可包括高效視訊編碼(HEVC)視訊轉碼器或H.264/AVC視訊轉碼器。該BL編碼器318可被配置成使用一個或多個(例如儲存在BL DPB320中的)BL重建圖片來生成BL位元串流332以用於預測。EL編碼器304例如可包括HEVC編碼器。該EL編碼器304可包括一個或多個高階語法修正,例如通過添加層間基準圖片到DL DPB來支援層間預測。該EL編碼器304可被配置成使用一個或多個(例如儲存在EL DPB 306中的)EL重建圖片來生成EL位元串流308以用於預測。[37]
BL DPB 320中的一個或多個重建BL圖片可在層間處理(ILP)單元322處使用一個或多個圖片級層間處理技術進行處理,該圖片級層間處理技術包括上採樣(例如針對空間可伸縮性)、色域轉換(例如針對色域可伸縮性)、以及反轉色調映射(例如針對位元深度可伸縮性)中的一者或多者。該一個或多個重建BL圖片可被用作針對EL編碼的基準圖片。層間處理可基於接收自EL編碼器304的增強視訊資訊314和/或接收自BL編碼器318的基本視訊資訊316來執行。上述過程可提高EL編碼效率。[38]
在326,EL位元串流308、BL位元串流332以及在層間處理中使用的參數(例如ILP資訊324)可被一起多工為可伸縮位元串流312。舉例來說,可伸縮位元串流312可包括SHVC位元串流。[39]
第4圖是示出了與第3圖中示出的示例編碼器對應的示例解碼器(例如SHVC解碼器)的簡化框圖。所示出的示例解碼器例如可用於解碼兩層HD到UHD位元串流。[40]
如第4圖所示,解多工模組412可接收可伸縮位元串流402,並且可對可伸縮位元串流402進行解多工以生成ILP資訊414、EL位元串流404和BL位元串流418。該可伸縮位元串流402可包括SHVC位元串流。該EL位元串流404可由EL解碼器406解碼。該EL解碼器406例如可包括HEVC視訊解碼器。該EL解碼器406可被配置成使用(例如儲存在EL DPB 408中的)一個或多個EL重建圖片生成UHD視訊訊號410以用於預測。該BL位元串流418可由BL解碼器420解碼。該BL解碼器420例如可包括HEVC視訊解碼器或H.264/AVC視訊。該BL解碼器420可被配置成使用(例如儲存在BL DPB 422中的)一個或多個BL重建圖片生成HD視訊訊號424以用於預測。該重建視訊訊號(例如UHD視訊訊號410和HD視訊訊號424)可用於驅動顯示裝置。[41]
BL DPB 422中的一個或多個重建BL圖片可在ILP單元916處使用一個或多個圖片級層間處理技術進行處理。該的圖片級層間處理技術可包括下列中的一者或多者:上採樣(例如針對空間可伸縮性)、色域轉換(例如針對色域可伸縮性)、或反轉色調映射(例如針對位元深度可伸縮性)。一個或多個處理後的重建BL圖片可用作針對EL解碼的基準圖片。層間處理可基於在層間處理中使用的參數(例如ILP資訊414)執行。預測資訊可包括預測塊大小、一個或多個(例如可指示運動的方向和運動量的)動態向量、和/或一個或多個(例如可指示從哪個基準圖片獲取預測信號的)基準索引。上述過程可提高EL解碼效率。[42]
基於基準索引的架構可使用與單層轉碼器中的塊級操作類似的塊級操作。單層轉碼器邏輯可在可伸縮編碼系統中重複使用。基於基準索引的架構可簡化可伸縮轉碼器設計。基於基準索引的架構可提供支援不同類型可伸縮性的靈活性,例如通過適當的高階語法信令和/或通過使用層間處理模組來實現編碼效率。一個或多個高階語法改變可支援SHVC的多層信令和/或層間處理。[43]
SHVC的高階語法設計例如可包括參數集識別約束、高階語法元素和語義改進、和/或針對對應語法/語義改變的解碼進程。[44]
參數集可以是視訊參數集(VPS)、序列參數集(SPS)、和/或圖片參數集(PPS)。參數集可以是包括語法元素的高階語法結構。語法元素可應用於多位元串流層。語法元素可應用於一個層內的多個編碼圖片。該參數集可利用視訊位元串流的編碼圖片來發送。舉例來說,視訊編碼裝置可被配置成利用視訊位元串流的編碼圖片來發送參數集。該參數集可通過其他手段進行發送,例如使用可靠通道的帶外傳輸、硬編碼等等。視訊編碼裝置可以被配置成通過其他手段來發送參數集,例如使用可靠通道的帶外傳輸、硬編碼等等。片標頭可包括相對較小或與某些片或圖片類型相關的圖片相關資訊。該片標頭可被認為是高階語法的一部分。[45]
表1示出了示例NAL單元標頭語法結構。識別符nuh_layer_id(nuh_層_id)可指定層的識別符。nuh_layer_id的值可等於0。舉例來說,對於VPS,nuh_layer_id的值可等於0。表2示出了部分SPS語法結構的實例。表3示出了部分PPS語法結構的實例。表4示出了部分片標頭語法結構的實例。 [46]
第5圖示出了利用SPS、PPS、以及片分段標頭的NAL單元的SPS和PPS啟動的實例。該NAL單元可包括NAL單元標頭和/或NAL單元標頭層識別符。該NAL單元可包括酬載資料。示例NAL單元標頭在表1中示出。舉例來說,取決於NAL單元類型(nal_單元_類型),NAL單元酬載資料可包括諸如SPS、PPS、和/或片分段資料的資料。[47]
根據第5圖中所示的實例,一個或多個SPS NAL單元502、504、506可具有唯一的SPS識別符sps_seq_parameter_set_id(sps_序列_參數_集_id)。一個或多個PPS NAL單元508、510、512可包括唯一的PPS識別符pps_pic_parameter_set_id(pps_圖片_參數_集_id)。編碼圖片片標頭可包括語法元素slice_pic_parameter_set_id(片_圖片_參數_集_id)。語法元素slice_pic_parameter_set_id可指示片所指的PPS NAL單元。舉例來說,視訊編碼裝置可將語法元素slice_pic_parameter_set_id設為指示片所指的PPS NAL單元。視訊解碼裝置可使用語法元素slice_pic_parameter_set_id來確定片所指的PPS NAL單元。視訊編碼裝置(例如第1圖中所示的視訊編碼裝置、第3圖中所示的視訊轉碼器和/或第4圖中所示的視訊解碼器)可啟動視訊訊號和/或視訊訊號層。舉例來說,在第5圖中,片指於slice_pic_parameter_set_id等於2的PPS NAL單元510。該視訊編碼裝置可被配置成啟動slice_pic_parameter_set_id等於2的PPS NAL單元510。slice_pic_parameter_set_id等於2的PPS NAL單元510可指具有其語法元素pps_seq_parameter_set_id的SPS NAL單元。根據第5圖中示出的實例,活動PPS NAL單元的pps_seq_parameter_set_id等於2。該視訊編碼裝置可被配置成啟動sps_seq_parameter_set_id等於2的SPS NAL單元504。[48]
視訊編碼裝置在SPS和/或PPS單元由另一NAL單元所指時可啟動該SPS和/或PPS。舉例來說,PPS可被包括編碼片的NAL單元啟動。該編碼片的片標頭可包括slice_pic_parameter_set_id(片_圖片_參數_集_id)語法元素。該PPS可包括pps_seq_parameter_set_id語法元素。另一NAL單元中被該slice_pic_parameter_set_id和/或pps_seq_parameter_set_id語法元素識別的該SPS和/或PPS可被啟動。[49]
例如在活動SPS或PPS的nuh_layer_id值小於或等於其啟動的層時,該視訊編碼裝置可啟動SPS或PPS。啟動SPS或PPS的 nuh_layer_id的值可不等於啟動的層的nuh_layer_id。啟動SPS或PPS的nuh_layer_id的值可不等於啟動的層的其中一個附屬層的nuh_layer_id的值。視訊編碼裝置(例如解碼器)可在子位元串流提取進程期間移除SPS或PPS NAL單元。該SPS或PPS NAL單元例如可在子位元串流提取進程期間被移除,這是由於識別SPS或PPS為特定層提供資訊(例如基本資訊)非常困難。如果在位元串流提取中出現了錯誤,且視訊編碼裝置移除位元串流提取中的SPS或PPS(例如基本SPS或PPS),接著產生的位元串流中的至少一個層可能由於遺失SPS和/或PPS而無法被正確解碼。在位元串流提取進程中,視訊編碼裝置(例如解碼器)可對該視訊編碼裝置希望保存的層中的每一個NAL單元進行解析(parse)。該視訊編碼裝置例如可通過對該視訊裝置希望保存的層中的每一個NAL單元進行解析來保證SPS或PPS(例如必要的SPS或PPS)不被丟棄。[50]
視訊編碼裝置可對NAL單元進行識別並且可確定該NAL單元是否包括針對當前層的活動參數集。基於確定該NAL單元包括有針對當前層的活動參數集,該視訊編碼裝置可將與該NAL單元關聯的NAL單元標頭層識別符設為下列中的至少一者:零、指示當前層的值、或指示當前層的基準層的值。基準層可包括附屬層,並且基準層和附屬層在此處可互換使用。該NAL單元可以是PPS NAL單元、SPS NAL單元和/或其他等等。指示當前層的值可以是指示在NAL單元標頭中以信號通告的與當前層關聯的層識別符的值。指示當前層的基準層的值可以是指示在NAL單元標頭中以信號通告的當前層的基準層的層識別符的值。該視訊編碼裝置可發送包括NAL單元的視訊位元串流到視訊解碼裝置。[51]
舉例來說,視訊編碼裝置(例如編碼器)可被配置成將活動SPS或PPS NAL單元的nuh_layer_id的值設為等於0。該視訊編碼裝置可將活動SPS或PPS NAL單元的nuh_layer_id的值約束為0。[52]
該視訊編碼裝置可將活動SPS或PPS NAL單元的nuh_layer_id的值設為等於當前層的值。該視訊編碼裝置可將活動SPS或PPS NAL單元的nuh_layer_id的值設為等於當前層的附屬層的值。該視訊編碼裝置可將活動SPS或PPS NAL單元的nuh_layer_id的值約束為等於當前層的值。該視訊編碼裝置可將活動SPS或PPS NAL單元的nuh_layer_id的值約束為等於當前層的附屬層的值。[53]
視訊編碼裝置例如可應用約束來使得對應的SPS或PPS NAL單元的識別能夠涉及在給定層的解碼過程。視訊編碼裝置例如可通過對對應的SPS或PPS NAL單元的nuh_layer_id的值進行識別來使得對應的SPS或PPS NAL單元的識別能夠涉及在給定層的解碼過程內。視訊編碼裝置可對對應的SPS或PPS NAL單元的nuh_layer_id的值進行識別。視訊編碼裝置例如可在子位元串流提取過程中忽略(omit)深度封包檢測。子位元串流提取可保證SPS或PPS NAL單元不被丟棄。[54]
視訊編碼裝置可被配置成使用子位元串流提取。在子位元串流提取過程中,視訊編碼裝置可將位元串流、目標最高時間Id值tId目標、和/或目標層識別符清單層Id清單對象作為輸入。在子位元串流提取過程中,所示視訊編碼裝置可輸出子位元串流。對於輸入位元串流的位元串流一致性,一致的位元串流可以是具有目標最高時間Id值tId目標和目標層識別符清單層Id清單對象的輸出子位元串流。該目標最高時間Id值tId對象例如可等於0至6範圍內(包括0和6)的任意值。該目標層識別符清單層Id清單目標例如可等於與在活動視訊參數集中指定的層集關聯的層識別符列表。一致的位元串流可包括一個或多個nuh_layer_id等於0且時間Id等於0的編碼片分段NAL單元。[55]
視訊編碼裝置可被配置成導出輸出子位元串流。該視訊編碼裝置例如可通過移除附加增強資訊(SEI)NAL單元來導出輸出子位元串流,該SEI NAL單元的nuh_layer_id等於0並且可包括非嵌套(non-nested)緩衝週期SEI消息、非嵌套圖片定時SEI消息、和/或非嵌套解碼單元資訊SEI消息。該視訊解碼裝置例如可通過移除附加增強資訊(SEI)NAL單元來導出輸出子位元串流,該SEI NAL單元可包括非嵌套緩衝週期SEI消息、非嵌套圖片定時SEI消息、和/或非嵌套解碼單元資訊SEI消息。視訊編碼裝置可移除VCL NAL單元,例如在層Id清單目標不包括位元串流中的每個NAL單元中的nuh_layer_id的每一值的情況下。視訊編碼裝置可移除VCL NAL單元,例如在tId目標小於位元串流中的每一NAL單元中的最大時間Id的情況下。位元串流提取器可包括提取的子位元串流中的適當的非嵌套緩衝圖片SEI消息、非嵌套圖片定時SEI消息、和/或非嵌套解碼單元資訊SEI消息,例如在可應用於子位元串流的SEI消息在原始位元串流中作為嵌套SEI消息出現的情況下。位元串流提取器可以是中間盒。位元串流提取器能夠通過由終端用戶請求的層。視訊編碼裝置(例如解碼器)可被配置成移除時間Id大於tId對象或nuh_layer_id不在層Id清單目標包含的值之中的視訊編碼層(VCL)NAL單元。視訊編碼裝置(例如解碼器)可被配置成保留非-VCL NAL單元,例如SPS和PPS。視訊編碼裝置(例如解碼器)可保留非-VCL NAL單元,即使非_VCL NAL單元的nuh_layer_id被排除在層Id清單目標之外。保留非-VCL NAL單元可確保SPS和/或PPS在非-VCL NAL啟動的層的子位元串流提取之後可用。視訊編碼裝置可在子位元串流提取期間移除時間Id大於tId對象或nuh_layer_id不在層Id清單目標包含的值之中的VCL NAL單元。[56]
表5示出了附屬信令的實例。層附屬(例如直接_附屬_標記)和層附屬類型(直接_附屬_類型)可分別地作為VPS延伸的一部分以信號通告。 [57]
視訊編碼裝置(例如編碼器)可被配置成對語法元素的值進行設置。舉例來說,該視訊編碼裝置可對語法元素的值進行設置,以向解碼器指示資訊。[58]
如果語法元素direct_dependency_flag[i][j](直接_附屬_標記[i][j])等於0,則具有索引j的層可能無法作為具有索引i的層的直接基準層。如果direct_dependency_flag[i][j]等於1,則具有索引j的層可以作為具有索引i的層的直接基準層。當對於在0到vps_max_layers_minus1(vps_最大_層_減1)範圍之間的i和j而言不存在direct_dependency_flag[i][j]時,direct_dependency_flag[i][j]可被推定為等於0。[59]
語法元素direct_dep_type_len_minus2 plus 2(直接_深度_類型_len減2 加 2)可指定direct_dependency_type[i][j](直接_附屬_類型[i][j])語法元素的位元數量。在位元串流中,direct_dep_type_len_minus2的值可以等於0。解碼器可允許在0到30的範圍(包括0和30)內的direct_dep_type_len_minus2的其他值出現在該語法中。[60]
視訊編碼裝置可被配置成使用語法元素來指示資訊。舉例來說,語法元素direct_dependency_type[i][j]可指示nuh_layer_id等於layer_id_in_nuh[i](層_id_in_nuh[i])的層與nuh_layer_id等於layer_id_in_nuh[j](層_id_in_nuh[j])的層之間的附屬類型。direct_dependency_type[i][j]等於0可指示nuh_layer_id等於layer_id_in_nuh[j]的層可用於層間樣本預測。direct_dependency_type[i][j]等於0可指示nuh_layer_id等於layer_id_in_nuh[j]的層可被排除在nuh_layer_id等於layer_id_in_nuh[i]的層的層間動態預測之外。direct_dependency_type[i][j]等於1可指示nuh_layer_id等於layer_id_in_nuh[j]的層可用於層間動態預測。direct_dependency_type[i][j]等於1可指示nuh_layer_id等於layer_id_in_nuh[j]的層可被排除在nuh_layer_id等於layer_id_in_nuh[i]的層的層間樣本預測之外。direct_dependency_type[i][j]等於2可指示nuh_layer_id等於layer_id_in_nuh[j]的層可用於nuh_layer_id等於layer_id_in_nuh[i]的層的層間樣本預測和層間動態預測兩者。雖然direct_dependency_type[i][j]的值可以在0到2(包括0和2)的範圍之內,解碼器仍然可允許在3到332 -2(包括3和332 -2)之內的direct_dependency_type[i][j]的值出現在該語法中。[61]
視訊編碼裝置(例如第1圖中示出的視訊編碼裝置、第3圖中示出的視訊轉碼器和/或第3圖中示出的視訊解碼器)可使用語法元素來指示哪一層是每一增強層的直接附屬層以及每一直接附屬層可支援的層間預測類型。舉例來說,語法元素direct_dependency_flag[i][j]、direct_dep_type_len_minus2以及direct_dependency_type[i][j]由視訊編碼裝置使用以指示哪一層是每一增強層的直接附屬層以及每一直接附屬層可支援的層間預測類型。[62]
舉例來說,視訊編碼裝置(例如編碼器)可被配置成將語法元素direct_dependency_flag[i][j]、direct_dep_type_len_minus2以及direct_dependency_type[i][j]設為指示哪一層是每一增強層的直接附屬層以及每一直接附屬層可支援的層間預測類型。舉例來說,視訊編碼裝置(例如解碼器)可被配置成使用語法元素direct_dependency_flag[i][j]、direct_dep_type_len_minus2以及direct_dependency_type[i][j]來確定哪一層是每一增強層的直接附屬層以及每一直接附屬層可支援的層間預測類型。[63]
SHVC可支援層間預測類型。舉例來說,SHVC可支援紋理樣本預測和動態預測。視訊編碼裝置可忽略語法元素direct_dep_type_len_minus2。視訊編碼裝置可將direct_dependency_type[i][j]的描述符從u(v)改變為u(2)。[64]
視訊編碼裝置(例如第1圖中示出的視訊編碼裝置、第3圖中示出的視訊轉碼器和/或第3圖中示出的視訊解碼器)可指示層間附屬性。該視訊編碼裝置可使用層附屬標記direct_dependency_flag(直接_附屬_標記)和標記類型direct_dependency_type(直接_附屬_類型)來指示兩層之間的附屬性。舉例來說,編碼器可被配置成使用層附屬標記direct_dependency_flag和附屬類型direct_dependency_type來指示兩層之間的附屬性。舉例來說,解碼器可被配置成使用層附屬標記direct_dependency_flag和附屬類型direct_dependency_type來確定兩層之間的附屬性。使用層附屬標記direct_dependency_flag和附屬類型direct_dependency_type來指示兩層之間的附屬性可導致冗餘信令。語法元素direct_dependency_flag和direct_dependency_type可被合併成一個具有描述符ue(v)的語法元素direct_dependency_type,如表6中所示。在表6中,刪除線文本指示了可被忽略的語法元素。 [65]
語法元素direct_dependency_type可替換語法元素direct_dependency_flag。視訊編碼裝置(例如第1圖中示出的視訊編碼裝置、第3圖中示出的視訊轉碼器和/或第3圖中示出的視訊解碼器)可使用語法元素來指示兩層之間的附屬性。語法元素direct_dependency_type[i][j]可指示nuh_layer_id等於layer_id_in_nuh[i]的層與nuh_layer_id等於layer_id_in_nuh[j]的層之間的附屬類型。舉例來說,編碼器可被配置成將語法元素direct_dependency_type[i][j]設為指示nuh_layer_id等於layer_id_in_nuh[i]的層與nuh_layer_id等於layer_id_in_nuh[j]的層之間的附屬類型。舉例來說,解碼器可被配置成使用語法元素direct_dependency_type[i][j]來確定nuh_layer_id等於layer_id_in_nuh[i]的層與nuh_layer_id等於layer_id_in_nuh[j]的層之間的附屬類型。[66]
舉例來說,如果direct_dependency_type[i][j]等於0,則nuh_layer_id等於layer_id_in_nuh[j]的層可能無法作為nuh_layer_id等於layer_id_in_nuh[i]的層的直接基準層。如果direct_dependency_type[i][j]等於1,則nuh_layer_id等於layer_id_in_nuh[j]的層可以作為nuh_layer_id等於layer_id_in_nuh[i]的層的直接基準層。視訊編碼裝置可被配置成將nuh_layer_id等於layer_id_in_nuh[j]的層用於層間樣本預測。如果direct_dependency_type[i][j]等於2,則nuh_layer_id等於layer_id_in_nuh[j]的層可以作為nuh_layer_id等於layer_id_in_nuh[i]的層的直接基準層。視訊編碼裝置可被配置成將nuh_layer_id等於layer_id_in_nuh[j]的層用於層間樣本預測和層間動態預測兩者。如果direct_dependency_type[i][j]等於3,則nuh_layer_id等於layer_id_in_nuh[j]的層可以作為nuh_layer_id等於layer_id_in_nuh[i]的層的直接基準層。視訊編碼裝置可被配置成將nuh_layer_id等於layer_id_in_nuh[j]的層用於層間動態預測。視訊編碼裝置可被配置成在層間樣本預測中忽略nuh_layer_id等於layer_id_in_nuh[j]的層。[67]
變數NumDirectRefLayers[i](數量直接基準層 [i])、RefLayerId[i][j](基準層Id[i][j])、SamplePredEnabledFlag[i][j](樣本預測賦能標記[i][j])、MotionPredEnabledFlag[i][j](動態預測賦能標記[i][j])、以及DirectRefLayerIdx[i][j](直接基準層Idx[i][j])可導出如下: for( i = 0; i  <=  vps_max_layers_minus1; i++ ) {       iNuhLId = layer_id_in_nuh[i]       NumDirectRefLayers[ iNuhLId ] = 0       for( j = 0; j < i; j++ )              if( direct_dependency_type[i][j] ) {                    RefLayerId[ iNuhLId ][ NumDirectRefLayers[ iNuhLId ]++ ] = layer_id_in_nuh[j]                    SamplePredEnabledFlag[ iNuhLId ][ j ] = ( ( direct_dependency_type[i][j] == 1) || ( direct_dependency_type[i][j] == 2) )                    MotionPredEnabledFlag[ iNuhLId ][j] = ( ( direct_dependency_type[i][j] == 2) || ( direct_dependency_type[i][j] == 3) )                    DirectRefLayerIdx[ iNuhLid ][ layer_id_in_nuh[j] ] = NumDirectRefLayers[ iNuhLId ] – 1                    } }[68]
視訊編碼裝置(例如第1圖中示出的視訊編碼裝置、第3圖中示出的視訊轉碼器和/或第3圖中示出的視訊解碼器)可使用附屬層提供層間動態預測。視訊編碼裝置在提供層間樣本預測時可忽略附屬層。與層間動態預測相比,層間樣本預測為編碼性能增益帶來的貢獻要顯著得多(例如與層間動態預測的大約1%相比,層間樣本預測為大約25-30%)。層間樣本預測可用作層間預測的基本形式並且允許層間動態預測作為可能的附加。舉例來說,在允許層間樣本預測時,層間動態預測可被允許。支援層間樣本預測的直接附屬層的約束可應用於SHVC主設定檔。[69]
VPS延伸中的層附屬信令可進行如表7中所示的修改。在表7中,刪除線文本指示了被忽略的語法元素。語法結構可被整理如表8所示。 [70]
如表7和表8中所示,語法元素direct_dependency_type可由語法元素il_motion_prediction_flag(il_動態_預測_標記)替換。direct_dependency_flag和il_motion_prediction_flag的語義如此處所揭露。[71]
如果direct_dependency_flag[i][j]等於0,則具有索引j的層可能無法作為具有索引i的層的直接基準層。如果direct_dependency_flag[i][j]等於1,則具有索引j的層可以作為具有索引i的層的直接基準層。視訊編碼裝置可將使用nuh_layer_id等於layer_id_in_nuh[j]層間樣本預測的層。當對於在0到vps_max_layers_minus1範圍之間的i和j而言不存在direct_dependency_flag[i][j]時,direct_dependency_flag[i][j]可被推定為等於0。[72]
變數NumDirectRefLayers[i]、RefLayerId[i][j]、SamplePredEnabledFlag[i][j]、MotionPredEnabledFlag[i][j]、以及 DirectRefLayerIdx[i][j]可被導出如下: for( i = 0; i  <=  vps_max_layers_minus1; i++ ) {       iNuhLId = layer_id_in_nuh[i]       NumDirectRefLayers[ iNuhLId ] = 0       for( j = 0; j < i; j++ )              if( direct_dependency_flag[i][j] ) {                    RefLayerId[ iNuhLId ][ NumDirectRefLayers[ iNuhLId ]++ ] = layer_id_in_nuh[j]                    SamplePredEnabledFlag[ iNuhLId ][j] = 1                    MotionPredEnabledFlag[ iNuhLId ][j] = il_motion_prediction_flag[i][j]                    DirectRefLayerIdx[ iNuhLid ][ layer_id_in_nuh[j] ] = NumDirectRefLayers[ iNuhLId ] – 1                    } }[73]
如果il_motion_prediction_flag[i][j]等於0,視訊編碼裝置可將nuh_layer_id等於layer_id_in_nuh[j]的層排除在nuh_layer_id等於layer_id_in_nuh[i]的層的層間動態預測之外。如果il_motion_prediction_flag[i][j]等於1,視訊編碼裝置可將nuh_layer_id等於layer_id_in_nuh[j]的層用於nuh_layer_id等於layer_id_in_nuh[i]的層的層間動態預測。當對於在0到vps_max_layers_minus1範圍之間的i和j而言不存在direct_dependency_flag[i][j]時,視訊編碼裝置可將il_motion_prediction_flag[i][j]推定為等於0。[74]
在示例SHVC位元串流中,視訊編碼裝置可使得層間樣本預測和/或層間動態預測能夠用於一個或多個直接附屬層或所有的直接附屬層。該視訊編碼裝置可跳過以信號通告一個或多個(例如每個)個別附屬層的direct_dependency_type。舉例來說,編碼器可使用閘控(gating)標記(如表9中所示的default_all_ilp_enable_flag(預設_所有_ilp_賦能_標記))來指示以信號通告每一獨立附屬層的direct_dependency_type可被跳過。舉例來說,解碼器可使用閘控標記(default_all_ilp_enable_flag)來確定以信號通告每一獨立附屬層的direct_dependency_type是否被跳過。 [75]
如果default_all_ilp_enable_flag等於1,視訊編碼裝置可將nuh_layer_id等於iNuhLId的層的直接附屬層(例如所有的直接附屬層)用於nuh_layer_id等於iNuhLId的層的層間樣本預測和層間動態預測。如果default_all_ilp_enable_flag等於0,視訊編碼裝置可將nuh_layer_id等於iNuhLId的層的直接附屬層(例如所有的直接附屬層)用於nuh_layer_id等於iNuhLId的層的層間樣本預測和層間動態預測或將nuh_layer_id等於iNuhLId的層的直接附屬層(例如所有的直接附屬層)排除在nuh_layer_id等於iNuhLId的層的層間樣本預測和層間動態預測之外。[76]
視訊編碼裝置可確定是否在VPS中包括直接附屬類型資訊。如果視訊編碼裝置決定使用預設附屬,則該視訊編碼裝置可跳過在VPS中以信號通告直接附屬類型資訊。如果該視訊編碼裝置決定不使用預設附屬,則該視訊編碼裝置可在VPS中包括直接附屬類型資訊。該視訊編碼裝置可在VPS中設置預設直接附屬標記。[77]
視訊編碼裝置可被配置成以信號通告附屬類型存在標記,例如direct_dependency_type_presence_flag(直接_附屬_類型_存在_標記)。視訊編碼裝置可被配置成設置該direct_dependency_type_presence_flag。視訊編碼裝置可被配置成在VPS延伸中以信號通告direct_dependency_type[i][j]。視訊編碼裝置可被配置成對direct_dependency_type_presence_flag進行設置以用信號通告direct_dependency_type[i][j]。當direct_dependency_type_presence_flag被設為等於1時,視訊編碼裝置可顯式地在VPS延伸中以信號通告direct_dependency_type[i][j]。語法元素direct_dependency_type[i][j]可能不存在於VPS延伸中。[78]
視訊編碼裝置可接收包括視訊參數集(VPS)和一個或多個層的視訊位元串流。視訊編碼裝置可確定與一個或多個層關聯的直接附屬關係,例如基於VPS中的預設直接附屬標記。如果該預設直接附屬標記指示在VPS中存在直接附屬類型資訊,則該視訊編碼裝置可根據VPS中的直接附屬類型資訊確定直接附屬關係。如果該預設直接附屬標記指示在VPS中不存在直接附屬類型資訊,則該視訊編碼裝置可基於預設確定直接附屬關係。預設附屬可應用於多個層中的所有層。[79]
視訊編碼裝置可對樣本預測賦能標記和動態預測賦能標記進行推定。視訊編碼裝置可被配置成對樣本預測賦能標記和動態預測賦能標記的值進行推定。舉例來說,第i增強層的每一第j附屬層的樣本預測賦能標記[i][j]和動態預測賦能標記[i][j]可被預設推定為1。[80]
語法元素direct_dependency_type[i][j]可指示nuh_layer_id等於layer_id_in_nuh[i]的層與nuh_layer_id等於layer_id_in_nuh[j]的層之間的附屬類型。視訊編碼裝置(例如編碼器)可被配置成將語法元素direct_dependency_type[i][j]設為指示nuh_layer_id等於layer_id_in_nuh[i]的層與nuh_layer_id等於layer_id_in_nuh[j]的層之間的附屬類型。如果direct_dependency_type[i][j]等於0,則視訊編碼裝置可將nuh_layer_id等於layer_id_in_nuh[j]的層用於層間樣本預測。如果direct_dependency_type[i][j]等於0,則視訊編碼裝置可將nuh_layer_id等於layer_id_in_nuh[j]的層用於nuh_layer_id等於layer_id_in_nuh[i]的層的層間動態預測。如果direct_dependency_type[i][j]等於1,則視訊編碼裝置可被配置成將nuh_layer_id等於layer_id_in_nuh[j]的層用於層間動態預測。如果direct_dependency_type[i][j]等於1,則視訊編碼裝置可將nuh_layer_id等於layer_id_in_nuh[j]的層用於nuh_layer_id等於layer_id_in_nuh[i]的層的層間樣本預測。如果direct_dependency_type[i][j]等於2,則視訊編碼裝置可被配置成將nuh_layer_id等於layer_id_in_nuh[j]的層用於nuh_layer_id等於layer_id_in_nuh[i]的層的層間樣本預測和層間動態預測兩者。[81]
該視訊編碼裝置可為與SPS關聯的層分配表現格式。VPS可包括視訊表現格式清單。舉例來說,視訊編碼裝置(例如編碼器)可被配置成將視訊表現格式(例如表10中示出的rep_format()(表現_格式()))用信號輸入成VPS延伸中的查找列表。對應的索引(例如表11中示出的進入到rep_format()列表中的vps_rep_format_idx[i](vps_表現_格式_索引[i])可針對VPS中的層(例如每一層)進行指定。[82]
舉例來說,如果特定層的rep_format()不與VPS延伸中指定的預定義rep_format()匹配,視訊編碼裝置(例如編碼器)可被配置成對SPS中的更新標記(如表12中示出的update_rep_format_flag(更新_表現_格式_標記)進行設定。如果特定層的rep_format()不與VPS延伸中指定的預定義rep_format()匹配,視訊編碼裝置(例如編碼器)可被配置成以信號通告(例如顯式信號)SPS中的rep_format()的語法元素(例如每一語法元素)。 [83]
該視訊編碼裝置可確定是否在SPS中包括表現格式索引,例如基於與SPS關聯的層的所分配的表現格式。舉例來說,在所分配的表現格式是預設表現格式的情況下,該表現格式索引可能不被包括在SPS中。舉例來說,在所分配的表現格式在VPS中被指定的情況下,該表現格式索引可被包括在SPS中。[84]
視訊編碼裝置(例如第1圖中示出的視訊編碼裝置、第3圖中示出的視訊轉碼器和/或第3圖中示出的視訊解碼器)可為VPS中的語法結構指定資訊。舉例來說,語法元素(例如update_rep_format_idx_present_flag(更新_表現_格式_索引_存在_標記)和update_rep_format_idx(更新_表現_格式_索引))可將該索引指定到VPS中的rep_format()語法結構清單中。如果表現格式與VPS中以信號通告的rep_format()清單匹配,則rep_format()清單的索引可以信號進行通告。語法元素可將索引指定到VPS中的rep_format()語法結構清單中。表13示出了SPS中的示例語法元素。 [85]
該視訊編碼裝置可將更新視訊表現格式標記設為指示該表現格式索引是否包含在SPS中。舉例來說,如果update_rep_format_idx_present_flag等於1,則語法元素update_rep_format_idx可以存在。如果update_rep_format_idx_present_flag等於0,則語法元素update_rep_format_idx可能不存在。[86]
語法元素update_rep_format_idx可將索引指定到rep_format()語法結構的VPS中的rep_format()語法結構清單中。當不存在update_rep_format_idx時,update_rep_format_idx的值可被推定為等於0。update_rep_format_idx的值可以在0到vps_num_rep_formats_minus1(vps_數量_表現_格式_減1)的值範圍(包括0和vps_num_rep_formats_minus1的值)內。[87]
該視訊編碼裝置可確定與SPS關聯的層的視訊表現格式,例如基於SPS中的更新視訊表現格式標記。如果該更新視訊表現格式標記指示了表現格式索引的存在,則該視訊表現格式可基於該表現格式索引從視訊表現格式清單進行確定。如果不存在更新表現格式索引,則該視訊表現格式可從預設視訊表現格式進行確定。該視訊編碼裝置可確定在SPS中是否存在表現格式索引,例如基於SPS中的更新視訊表現格式標記。如果該更新視訊表現格式標記等於1,則該視訊編碼裝置可確定SPS中存在該表現格式索引。如果該更新視訊表現格式標記等於0,則該視訊編碼裝置可確定SPS中不存在表現格式索引。該預設視訊表現格式可以是VPS中針對層指定的預設視訊表現格式。該視訊更新表現格式索引可以在0到VPS數量表現格式減1的值的範圍(包括0和VPS數量表現格式減1)內。[88]
VPS延伸中的語法元素和片標頭可從其他語法元素的值推定。以信號通告語法元素為條件可節省酬載。[89]
視訊編碼裝置(例如編碼器)可被配置成以信號通告視訊參數集(VPS)延伸中的語法元素max_one_active_ref_layer_flag(最大_一個_活動_基準_層_標記)以說明針對當前增強層中的每一圖片,來自一個附屬層的單個圖片是否可用於層間預測。舉例來說,針對當前增強層中的不同圖片,來自不同附屬層的圖片可用於層間預測。同一VPS延伸中的語法元素all_ref_layers_active_flag(所有_基準_層_活動_標記)可說明針對當前增強層中的每一圖片,在當前存取單元中有效的該當前增強層的直接附屬層的基準圖片可在all_ref_layers_active_flag的值等於1時用於層間預測。[90]
視訊編碼裝置(例如編碼器)可被配置成對all_ref_layers_active_flag的值進行設置。當all_ref_layers_active_flag被設為等於1時,視訊編碼裝置(例如解碼器)可被配置成從數量直接基準層[i]的最大值中推定max_one_active_ref_layer_flag的值,例如當i在1到層的最大數量的範圍內時。[91]
表14示出了VPS延伸中的示例語法條件。 [92]
變數最大數量直接附屬基準層可表示增強層的直接附屬基準層的最大數量。變數最大數量直接附屬基準層可導出如下: MaxNumDirectDependentRefLayers = 0 for (i=0; I <= vps_max_layers_minus1; i++) {     if (MaxNumDirectDependentRefLayers < NumDirectRefLayers[i])       MaxNumDirectDependentRefLayers = NumDirectRefLayers[i] }[93]
視訊編碼裝置(例如編碼器)可被配置成對max_one_active_ref_layer_flag的值進行設置。如果max_one_active_ref_layer_flag等於1,則視訊編碼裝置(例如解碼器)可被配置成針對CVS中的每一圖片將最多一個圖片用於層間預測。如果max_one_active_ref_layer_flag等於0,則視訊編碼裝置(例如解碼器)可被配置成針對CVS中的每一圖片將多於一個圖片用於層間預測。如果max_one_active_ref_layer_flag不存在,則max_one_active_ref_layer_flag可被導出如下: max_one_active_ref_layer_flag = (MaxNumDirectDependentRefLayers > 1) ? 0:1[94]
視訊編碼裝置(例如視訊轉碼器)可以信號通告非IDR片的片標頭中的語法元素slice_pic_order_cnt_lsb(片_圖片_順序_cnt_lsb)以指定當前圖片的圖片順序計數的LSB。該語法元素可針對增強層用信號告知而無需考慮圖片類型。舉例來說,視訊編碼裝置(例如視訊轉碼器)可被配置成針對增強層以信號告知該語法元素而無需考慮圖片類型。該視訊編碼裝置(例如編碼器)在內隨機存取點(IRAP)圖片在層上未對齊時可使用該語法元素來對齊相同或類似存取單元內的圖片的POC值。當層上的IRAP圖片被對齊時,由於IDR圖片的POC值為零,以信號通告IDR圖片的slice_pic_order_cnt_lsb是多餘的。該視訊編碼裝置(例如視訊轉碼器)可被配置成以信號通告VPS中的語法元素cross_layer_irap_aligned_flag(上_層_irap_對齊_標記)以指示IRAP圖片是否在不同的層上對齊。[95]
如果cross_layer_irap_aligned_flag等於1,CVS中的IRAP圖片可以是層上對齊的,例如當存取單元中的層A的圖片A是IRAP圖片時。屬於層A的直接附屬層或屬於層A為直接附屬層所針對的層的相同或類似存取單元中的圖片B可以是IRAP圖片。圖片B的VCL NAL單元可以與圖片A具有相同或類似的nal_unit_type值。如果cross_layer_irap_aligned_flag等於0,上述關係適用或不適用。[96]
語法元素cross_layer_irap_aligned_flag可用於條件化(condition)slice_pic_order_cnt_lsb的信令,如表15中所示。 . 片標頭語法中的slice_pic_order_cnt_lsb示例條件 [97]
HEVC可被延伸為支援可伸縮編碼。舉例來說,HEVC可支援空間可伸縮性、品質可伸縮性以及標準可伸縮性。空間可伸縮性可以是當可伸縮位元串流包含多於一個空間解析度的信號時。品質可伸縮性可以是當可伸縮位元串流包含在多於一個品質級上的信號時。品質可伸縮性還可被稱為SNR可伸縮性。標準可伸縮性可以是當可伸縮位元串流包含使用H.264/AVC編碼的基層和使用HEVC編碼的一個或多個增強層時。HEVC可以支援視圖可伸縮性。視圖可伸縮性可以是當可伸縮位元串流包含2D和3D視訊訊號兩者時。[98]
HEVC的可伸縮延伸(SHVC)可使用基準索引基礎框架。SHVC可使用語法、一個或多個語義和/或一個或多個解碼進程。[99]
視訊編碼裝置可使用設定檔來定義演算法特徵(例如壓縮工具)、視訊輸入格式(例如位元深度和色度格式)和/或類似等等。視訊編碼裝置可使用級和/或層來定義量化能力集合(例如最大位元速率、最大訊框大小、每秒的樣本最大數量、和/或類似等等)。H.265中的視訊編碼裝置和/或HEVC可使用三個設定檔(例如主設定檔、主10設定檔、以及主靜止圖片設定檔)和/或13個級,例如其具有兩個層。視訊編碼裝置可使用設定檔、級和/或層來指定符合該設定檔、級和/或層的視訊編碼裝置的最大複雜度。[100]
該類、層和級可具有多個約束(例如三個約束)。該約束可包括下列中的一者或多者。視訊編碼裝置(例如視訊解碼裝置)對於特定圖片解碼可能無法多於一次地調用(invoke)對圖片樣本值的圖片重新採樣。視訊編碼裝置對於特定圖片解碼可能無法多於一次地調用對圖片動態欄位的重新採樣。當視訊編碼裝置針對特定圖片解碼調用圖片樣本值和圖片動態欄位重新採樣兩者時,視訊編碼裝置可將圖片樣本值和/或圖片動態欄位重新採樣應用於同一基準層圖片。當附屬Id[i]等於1時,視訊編碼裝置可將ScalabilityId[ LayerIdxInVps [i]][smIdx](可伸縮性Id[層IdxInVps [i]][smIdx])設為0,其中smIdx值為從0到15(包括0和15),對於nuh_layer_id等於i的編碼圖片,其不等於2。當avc_base_layer_flag(avc_基_層_標記)等於1時,例如為了位元串流一致性,視訊編碼裝置可將MotionPredEnabledFlag[ iNuhLId ][ 0 ](動態預測賦能標記 [ iNuhLId ][ 0 ])設為等於0(針對iNuhLId等於位元串流中存在的nuh_layer_id的值)。[101]
視訊編碼裝置可使用可伸縮主設定檔來指定在對圖片進行解碼時圖片紋理重新採樣和動態重新採樣可能無法多於一次被調用。舉例來說,針對空間可伸縮性的層間樣本預測和層間動態預測中的每一者都可來自一個基準層。例如當層間樣本預測和動態預測被啟用時,視訊編碼裝置可使用同一基準層。[102]
視訊編碼裝置可在圖片級指定約束(例如當前約束)。NAL單元標頭中的layer_id(層_id)的位元長度可以是6位元。NAL單元標頭中的6位元長度layer_id可允許和/或啟用最大64層。最多63個直接附屬層可存在於位元串流或編碼視訊序列(CVS)層,例如在視訊編碼裝置針對位元串流中的一個或多個編碼圖片使用了其中一個基準層進行樣本和/或動態預測的情況下。直接附屬層可以是包括至少一個可用作特定增強層圖片的層間樣本和/或動態預測的基準圖片的圖片的層。[103]
舉例來說,通過以信號通告一個或多個約束來限制SHVC設定檔的多個層以及應用該一個或多個約束,視訊編碼裝置可限定和/或降低多路SHVC轉碼器的複雜度。該層可以是直接附屬層、間接附屬層、和/或基層。一個或多個約束例如可限制直接附屬層的最大數量或限制直接和間接附屬層的最大數量。該視訊編碼裝置可經由VPS延伸中的語法元素、SPS中的語法元素、設定檔指示中的至少一者和/或根據設定檔、層和/或級(例如可伸縮主類)來限制直接附屬層的最大數量。該視訊編碼裝置可經由VPS延伸中的語法元素、SPS中的語法元素、設定檔指示中的至少一者和/或根據設定檔、層和/或級(例如可伸縮主類)來限制直接和間接附屬層的最大數量。約束可以是基層上的約束。基層上的約束可使用一致的SHVC位元串流。該一致的SHVC位元串流可以是一個或多個存取單元,例如包括nuh_layer_id等於0和時間ID等於0的圖片。包括nuh_layer_id等於0和時間ID等於0的圖片的層可以是層識別符列表TargetDecLayerIdList中的每一nuh_layer_id值的層的直接或間接附屬層。該視訊編碼裝置可經由導出的變數以信號通告一個或多個約束。該視訊編碼裝置可經由語法元素以信號通告一個或多個約束。[104]
第6圖示出了示例多層預測結構。在第6圖中,頂層(層-63 610)可在視訊序列內具有最多63個直接附屬層。視訊編碼裝置可被配置成針對層-63 610的每一圖片從63個附屬層中的一個中選擇基準圖片以用於層間樣本和動態預測,例如以滿足SHVC主設定檔約束。舉例來說,視訊編碼裝置可將來自層-632的POC-0圖片用於層-63 630的POC-0圖片的層間預測(例如箭頭640所示)。視訊編碼裝置可將來自層-61 652的POC-1圖片用於層-63 650的圖片POC-1 614的層間預測,等等。舉例來說,限定實現複雜度可能無法與當前約束一起執行,這是因為直接基準層的基準圖片可能需要被解碼,除非確定這樣的層可能無法用於其自有層內的層間預測和時間預測兩者。用於限定實現複雜度的層間動態預測和樣本預測操作的數量可得以限制。直接或間接附屬層的基準圖片可被解碼。視訊編碼裝置可對直接或間接附屬層的基準圖片進行解碼,例如通過層間預測和/或樣本預測。視訊編碼裝置可能無法對直接或間接附屬層的一個或多個圖片進行解碼,例如在該一個或多個圖片並非時間和/或層間預測的基準圖片的情況下。舉例來說,視訊編碼裝置可能需要解碼層-0的具有POC 0 612、1 614、… 62 616的圖片以解碼層-0 672中的具有POC 63的圖片,例如在層-63 670中具有POC 63的圖片直接取決於層-0 672中的具有POC 63的圖片以用於層間預測的情況下。[105]
多路SHVC編碼器可具有處理器,該處理器具有用於限制設定檔的基準層的數量的可執行指令。多路SHVC編碼器可設定基準層限制。多路SHVC編碼器可將視訊訊號編碼到該設定檔的層中,由此該層包括直接和間接基準層,並且針對編碼視訊訊號中的層的直接和間接基準層的總數量小於基準層限制。[106]
第7圖示出了示例間接附屬層。間接附屬層的數量可影響SHVC轉碼器實現的複雜度。間接附屬層可以是包含有至少一個可用作特定增強層的直接附屬層的圖片的層間樣本和/或動態預測的基準圖片的圖片的層。如第7圖中所示,層-63 702可在視訊序列內具有一個直接附屬層(層-62 704)。視訊編碼裝置可從層-62 712的共同基準圖片來預測層-63 702中的一個或多個編碼圖片。層-63 702可具有至多62個間接附屬層,如第7圖所示。在第7圖中,一一個或多個層或每一層可依據作為基準層的其較低層,例如層-63 702直接依據層-62 704,而層-62 704直接依據層-61 706,諸如此類。為了正確解碼層-63的圖片,視訊編碼裝置需要正確解碼從層-0 710到層62 704的並置圖片708、714、716、712。間接附屬層的數量會對SHVC編碼系統所需的總記憶體量造成影響。間接附屬層的數量會對該系統的差錯還原能力造成影響。對直接和/或間接附屬層數量的約束對於指明SHVC轉碼器的最大實現複雜度是至關重要的。[107]
多路SHVC編碼器可具有處理器,該處理器具有用於限制類的基準層的數量的可執行指令。該多路SHVC編碼器可設定基準層限制。該多路SHVC編碼器可將視訊訊號編碼到該設定檔的層中,該層包括直接和間接基準層。針對每一層,該多路SHVC編碼器可確定直接和間接基準層的總數量。該多路SHVC編碼器可確定該層的直接和間接基準層的總數量是否小於該基準層限制。該多路SHVC編碼器可發送編碼視訊訊號到解碼器,例如在每一層的直接和間接基準層的總數量小於該基準層限制的情況下。[108]
該SHVC主設定檔約束可對樣本的數量和/或動態重新採樣進程進行限制,以限定在圖片級可用的層間基準圖片的數量。在SNR可伸縮性,視訊編碼裝置可能不會使用樣本或動態重新採樣進程。在SNR可伸縮性,視訊編碼裝置可遵照多路解碼架構。在SNR可伸縮性,視訊編碼裝置可使用將被解碼的附屬層(例如直接或間接)以解碼給定增強層。對附屬層數量的約束可應用於SNR可伸縮性。[109]
SHVC視訊編碼裝置(例如視訊解碼裝置)能夠對位元串流的64個層進行完全解碼。對位元串流的64個層進行解碼可等同於在SHVC解碼器中具有64個單獨的層解碼器。視訊編碼裝置可增加設定檔約束以限制SHVC解碼器複雜度。[110]
根據一個實例,可對附屬層的數量提供主類約束。舉例來說,為了限定多路SHVC轉碼器的編碼複雜度,可提供進一步的約束以限制SHVC主類及其如下該的級的直接和間接附屬層的數量。[111]
nuh_layer_id等於iNuhLId的層的直接附屬層的數量NumDirectRefLayers[iNuhLId]數量直接基準層 [iNuhLId] )可被預先確定。視訊編碼裝置可將nuh_layer_id等於iNuhLId的層的間接附屬層的數量NumIndirectRefLayers[iNuhLId]數量間接基準層 [iNuhLId] )導出如下:for ( i = 0; i  <= vps_max_layers_minus1 ; i++ ) { iNuhLId = layer_id_in_nuh[i] NumDirectRefLayers[ iNuhLId ] = 0 NumIndirectRefLayers[iNuhLId] = 0 iRefLayerMarkedFlag[iNuhLId] = 0; for( j = 0; j < i; j++ ) { if( direct_dependency_flag[ i ][ j ] ) { RefLayerId[ iNuhLId ][ NumDirectRefLayers[ iNuhLId ]++ ] = layer_id_in_nuh[ j ] SamplePredEnabledFlag[ iNuhLId ][ j ] = ( ( direct_dependency_type[ i ][ j ] + 1 ) & 1 ) MotionPredEnabledFlag[ iNuhLId ][ j ] = ( ( ( direct_dependency_type[ i ][ j ] + 1 ) & 2 ) >> 1 ) DirectRefLayerIdx[ iNuhLid ][ layer_id_in_nuh[ j ] ] = NumDirectRefLayers[ iNuhLId ] 1 iRefLayerMarkedFlag[iNuhLId] = iRefLayerMarkedFlag[iNuhLId] | (1 << j) getIndirectDependentLayers(j, iRefLayerMarkedFlag[iNuhLId], NumIndirectRefLayers[iNuhLId]) } } } 其中函數getIndirectDependentLayers()(獲取間接附屬層())可以是:getIndirectDependentLayers( layer_index, iRefLayerMarkedFlag, NumIndirectRefLayers) { for( i = 0; i < layer_index; i++) { if (direct_dependency_flag[layer_index][i] && !(iRefLayerMarkedFlag & (1 << i))) { iRefLayerMarkedFlag = iRefLayerMarkedFlag | (1 << i) NumIndirectRefLayers ++ getIndirectDependentLayers(i, iRefLayerMarkedFlag, NumIndirectRefLayers) } } } [112]
視訊編碼裝置可通過對NumDirectRefLayers[iNuhLId]NumIndirectRefLayers[iNuhLId] 求和來確定nuh_layer_id等於iNuhLId的層的直接和間接附屬層的總數量NumRefLayers[iNuhLId] (數量基準層[iNuhLId] )。舉例來說,NumRefLayers[iNuhLId] =NumDirectRefLayers[iNuhLId] +NumIndirectRefLayers[iNuhLId][113]
視訊編碼裝置可使用對直接附屬層數量的約束。例如,視訊編碼裝置可使用約束選項來限制主設定檔中的直接附屬層的最大數量。視訊編碼裝置可在VPS延伸或SPS中以信號通告語法元素max_num_direct_dependent_ref_layers_minus1(最大_數量_直接_附屬_基準_層_減1)以限定可用於SHVC主類中的一個或多個增強層或每一增強層的直接附屬層的總數量的最大值。視訊編碼裝置可將可用NumDirectRefLayers[i](數量直接基準層[i])(其中i可在1到層最大數量(例如63)之間)設為等於或小於max_num_direct_dependent_ref_layers_minus1的值。舉例來說,視訊編碼裝置為了解碼特定層而解碼的層的總數量至多為63個,這是因為每一附屬層可依賴於一個或多個其自身的將被解碼的附屬層。[114]
視訊編碼裝置可使用對可伸縮主類的約束。舉例來說,nuh_layer_id等於iNuhLId的特定增強層的直接附屬層的數量NumDirectRefLayers[iNuhLId](數量直接基準層[iNuhLId])不會超過N,其中N可以是可伸縮主設定檔所允許的直接附屬層的最大數量。視訊編碼裝置可針對SHVC主設定檔將直接附屬層的最大數量N設為等於1。[115]
舉例來說,視訊編碼裝置可在VPS延伸或SPS中以信號通告語法元素例如max_num_dependent_ref_layers_minus1以約束可用於SHVC主類中的一個或多個增強層或每一增強層的直接和間接附屬基準層的總數量的最大值。視訊編碼裝置可將可用NumRefLayers[i](數量基準層[i])(其中i可在1到層最大數量(例如63)之間的範圍)設為小於或等於max_num_dependent_ref_layers_minus1 plus 1(最大_數量_附屬_基準_層_減1加1)的值。[116]
視訊編碼裝置可使用對附屬層(可包括直接和間接附屬層兩者)數量的約束以減低或限制SHVC轉碼器的複雜度。舉例來說,多路SHVC編碼器可包括處理器,該處理器具有用於限制類的基準層數量的可執行指令。該多路SHVC編碼器可對基準層限制進行設定。例如,該基準層限制可被用作用於限制直接和間接附屬層的最大數量的約束。該多路SHVC編碼器可將視訊訊號編碼到該設定檔的層中,由此編碼視訊訊號中的給定層的直接和間接基準層的總數量小於基準層限制。[117]
舉例來說,針對每一層,多路SHVC編碼器可確定直接和間接基準層的總數量。該多路SHVC編碼器可確定該層的直接和間接基準層的總數量是否小於基準層限制。該編碼視訊訊號可被發送至解碼器,例如在每一層的直接和間接基準層的總數量小於該基準層限制的情況下。[118]
舉例來說,視訊編碼裝置可使用對可伸縮主設定檔的約束。特定增強層的直接和間接附屬層的總數量NumRefLayers[iNuhLId]可能不會超過N,其中N可以是可由可伸縮主類、層和/或級使用和/或允許的附屬層的最大數量。[119]
舉例來說,SHVC主類可指定可由某個或特定層和/或級允許或使用的CTB(編碼樹區塊)的最大數量。根據一個實例,視訊編碼裝置可基於一個或多個附屬層或每一附屬層的視訊解決方案從CTB的最大數量導出N。[120]
視訊編碼裝置可以一種或多種方式以信號來提供約束。例如,視訊編碼裝置可以信號通告兩種方式以在SHVC中提供此處所述的一個或多個約束。[121]
舉例來說,視訊編碼裝置可以不用信號通告額外的語法元素,並且該約束可被提供於導出的變數,例如NumDirectRefLayers[iNuhLId]NumRefLayers[iNuhLId] 。視訊編碼裝置可對語法元素(例如direct_dependency_flag)的值進行設定以實現對直接和/或間接附屬層的總數量的約束。視訊編碼裝置可使用語法元素(例如direct_dependency_flag)來導出變數NumDirectRefLayers[iNuhLId]NumRefLayers[iNuhLId][122]
視訊編碼裝置可以信號通告參數集中的語法元素(例如max_num_direct_dependent_layer_minus1(最大_數量_直接_附屬_層_減1) 和/或max_num_dependent_layers_minus1(最大_數量_附屬_層_減1)以指示附屬層的總數量。參數集可以是SPS或VPS。視訊編碼裝置例如可基於轉碼器支援的設定檔、層和/或級來設定該語法元素的值。視訊編碼裝置可使用語法元素max_num_dependent_layer_minus1。[123]
視訊編碼裝置可使用語法元素來指示層中的附屬層的最大數量(如表16所示)和/或每一獨立增強層的附屬層的最大數量(如表17所示),這是因為例如當語法元素可在VPS延伸中以信號通告時,每一層可支援不同的設定檔和/或級。 [124]
視訊編碼裝置可使用max_num_dependent_layers_minus1來指定每一層的直接和間接附屬層的最大數量。max_num_dependent_layers_minus1的值可以在0到62的範圍內。當其不存在,則max_num_dependent_layers_minus1的值可以等於0。 [125]
視訊編碼裝置可使用max_num_dependent_layers_minus1[i](最大_數量_附屬_層_減1[i])來指定第i層的直接和間接附屬層的最大數量。max_num_dependent_layers_minus1的值可以在0到62的範圍內。當其不存在,則max_num_dependent_layers_minus1的值可以等於0。[126]
視訊編碼裝置可使用max_num_dependent_layers_minus1來條件化在VPS中以信號通告的一些語法元素。舉例來說,當存在可用於每一層的附屬層(max_num_dependent_layers_minus1=0),語法元素(例如“all_ref_layers_active_flag(所有_基準_層_活動_標記)”和“max_one_active_ref_layer_flag(最大_一個_活動_基準_層_標記)”可能不存在,如表18所示。 [127]
視訊編碼裝置可使用在SPS中以信號通告的語法元素(如表19所示)來指示可與SPS關聯的活動層的附屬層的最大數量。視訊編碼裝置可使用語法元素來條件化在SPS延伸中以信號通告的伸縮的(scaled)偏移語法元素。表20示出了可被提供和/或使用的示例SPS延伸語法改變。 [128]
視訊編碼裝置在基層使用主設定檔約束。舉例來說,視訊編碼裝置可使用子位元串流提取。視訊編碼裝置可使用子位元串流提取的輸入。子位元串流提取的輸入可以是位元串流、目標最高時間Id值tId目標、和/或目標層識別符清單層Id清單對象。子位元串流提取的輸出可以是子位元串流。輸入位元串流的位元串流一致性可向該進程的子位元串流輸出提供等於0到6範圍內(包括0和6)的一個值的tId目標。等於與活動視訊參數集中指定的層集合關聯的層識別符清單的層Id清單目標可以是一致的位元串流。一致的位元串流可包括一個或多個nuh_layer_id等於0並且時間ID等於0的編碼片分段NAL單元。[129]
視訊編碼裝置可將輸出子位元串流導出如下。當一個或多個以下的條件為真時,視訊編碼裝置可移除可能具有nuh_layer_id等於0並且可包括非嵌套緩衝週期SEI消息、非嵌套圖片定時SEI消息、或非嵌套解碼單元資訊SEI消息的SEI NAL單元。該視訊編碼裝置可在層Id清單對象不包括位元串流中(例如條件中)的NAL單元中的nuh_layer_id的值時移除SEL NAL單元。該視訊編碼裝置可在tId目標小於位元串流中(例如條件中)的NAL單元中的最大時間Id時移除SEI NAL單元。如果可應用於子位元串流的SEI消息作為嵌套SEI消息存在於原始位元串流中,該視訊編碼裝置可在“智慧”位元串流提取器在提取的子位元串流中包括適當的非嵌套緩衝圖片SEI消息、非嵌套圖片定時SEI消息、以及非嵌套解碼單元資訊SEI消息時移除SEL NAL單元。該視訊編碼裝置可移除時間Id大於tId對象或nuh_layer_id不在包含在層Id清單目標的值之中的NAL單元。[130]
第8圖示出了單層分層視訊編碼結構的示例時間層。時間Id等於0的第一時間層可包括圖片POC 810和POC 890;時間Id等於1的第二時間層可包括圖片PC 850;時間Id等於2的第三時間層可包括圖片POC 830和POC 870;並且時間Id等於3的最後一個時間層可包括圖片POC 820、POC 840、POC 860、以及POC 880。在tId對象針對子位元串流提取被設為等於2的實例中,來自子位元串流提取進程的輸出位元串流可包括圖片POC 810、POC 830、POC 850、POC 870和POC 890。[131]
一致的位元串流可包括一個或多個nuh_layer_id等於0且時間Id等於0的編碼片分段NAL單元。提取進程的輸出子位元串流可以是一致的位元串流。視訊編碼裝置可使用針對SHVC主設定檔的約束來幫助保證nuh_layer_id等於0且時間Id等於0的基層NAL單元被包含在提取的子位元串流中,例如在相同的一致性要求應用於HEVC的多視圖和可伸縮延伸的情況下。[132]
一個示例約束示出如下。視訊編碼裝置可包括一個或多個存取單元,該一個或多個存取單元在一致的SHVC位元串流中包括nuh_layer_id等於0且時間Id等於0的圖片。舉例來說,包括nuh_layer_id等於0且時間Id等於0的圖片的層可以是在層識別符列表TargetDecLayerIdList中的每一nuh_layer_id的值的層的直接或間接附屬層。視訊編碼裝置可使用該約束來指明同時聯播(simulcast)層在SHVC位元串流中可用。[133]
第9A圖是示例通訊系統900的系統圖,在該示例通訊系統900中可實現一個或多個揭露的實施方式。該通訊系統900可以是將諸如語音、資料、視訊、消息發送、廣播等之類的內容提供給多個無線用戶的多存取系統。該通訊系統900可以通過系統資源(包括無線頻寬)的共用使得多個無線用戶能夠存取這些內容。例如,該通訊系統900可以使用一種或多種通道存取方法,例如分碼多重存取(CDMA)、分時多重存取(TDMA)、分頻多重存取(FDMA)、正交FDMA(OFDMA)、單載波FDMA(SC-FDMA)等等。[134]
如第9A圖所示,通訊系統900可以包括無線發射/接收單元(WTRU)902a、902b、902c、和/或902d(通常或總體上可被稱作WTRU 902)、無線電存取網路 (RAN) 903/904/905、核心網路906/907/909、公共交換電話網路(PSTN)908、網際網路910和其他網路912,但可以理解可實施任意數量的WTRU、基地台、網路和/或網路元件。WTRU 902a、902b、902c、902d中的每一個可以是被配置成在無線環境中運行和/或通訊的任何類型的裝置。作為示例,WTRU 902a、902b、902c、902d可以被配置成發送和/或接收無線信號,並且可以包括用戶設備(UE)、移動站、固定或移動訂戶單元、傳呼機、行動電話、個人數位助理(PDA)、智慧型電話、可攜式電腦、上網本、個人電腦、無線感測器、消費電子產品等等。[135]
通訊系統900還可以包括基地台914a和基地台914b。基地台914a、914b中的每一個可以是被配置成與WTRU 902a、902b、902c、902d中的至少一者有無線介面,以便於存取一個或多個通訊網路(例如,核心網路906/907/909、網際網路910和/或網路912)的任何類型的裝置。例如,基地台914a、914b可以是基地台收發站(BTS)、節點B、e節點B、家用節點B、家用e節點B、網站控制器、存取點(AP)、無線路由器等。儘管基地台914a、914b每個均被描述為單個元件,但是可以理解基地台914a、914b可以包括任何數量的互連基地台和/或網路元件。[136]
基地台914a可以是RAN 903/904/905的一部分,該RAN還可以包括其他基地台和/或網路元件(未示出),諸如基地台控制器(BSC)、無線電網路控制器(RNC)、中繼節點等。基地台914a和/或基地台914b可以被配置成發送和/或接收特定地理區域內的無線信號,該特定地理區域可以被稱作胞元(未示出)。胞元還可以被劃分成胞元扇區。例如與基地台914a相關聯的胞元可以被劃分成三個扇區。由此,在一種實施方式中,基地台914a可以包括三個收發器,例如針對該胞元的每個扇區都有一個收發器。在另一實施方式中,基地台914a可以使用多輸入多輸出(MIMO)技術,並且因此可以使用針對胞元的每個扇區的多個收發器。[137]
基地台914a、914b可以通過空中介面915/916/917與WTRU 902a、902b、902c、902d中的一者或多者通訊,該空中介面915/916/917可以是任何合適的無線通訊鏈路(例如,射頻(RF)、微波、紅外(IR)、紫外(UV)、可見光等)。空中介面915/916/917可以使用任何合適的無線電存取技術(RAT)來建立。[138]
更具體而言,如上所述,通訊系統900可以是多重存取系統,並且可以使用一種或多種通道存取方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等。例如,在RAN 903/904/905中的基地台914a和WTRU 902a、902b、902c可以實施諸如通用移動電信系統(UMTS)陸地無線電存取(UTRA)之類的無線電技術,其可以使用寬頻CDMA(WCDMA)來建立空中介面915/916/917。WCDMA可以包括諸如高速封包存取(HSPA)和/或演進型HSPA(HSPA+)的通訊協定。HSPA可以包括高速下行鏈路封包存取(HSDPA)和/或高速上行鏈路封包存取(HSUPA)。[139]
在另一實施方式中,基地台914a和WTRU 902a、902b、902c可以實施諸如演進型UMTS陸地無線電存取(E-UTRA)之類的無線電技術,其可以使用長期演進(LTE)和/或高階LTE(LTE-A)來建立空中介面915/916/917。[140]
在其他實施方式中,基地台914a和WTRU 902a、902b、902c可以實施諸如IEEE 802.16(例如,全球互通微波存取(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、臨時標準2000(IS-2000)、臨時標準95(IS-95)、臨時標準856(IS-856)、全球移動通訊系統(GSM)、增強型資料速率GSM演進(EDGE)、GSM EDGE(GERAN)之類的無線電技術。[141]
第9A圖中的基地台914b可以是例如無線路由器、家用節點B、家用e節點B或者存取點,並且可以使用任何合適的RAT,以用於促進在諸如商業區、家庭、車輛、校園之類的局部區域的無線連接。在一個實施例中基地台914b和WTRU 902c、902d可以實施諸如IEEE 802.11之類的無線電技術以建立無線區域網路(WLAN)。在另一個實施方式中,基地台914b和WTRU 902c、902d可以實施諸如IEEE 802.15之類的無線電技術以建立無線個人區域網路(WPAN)。在另一個實施方式中,基地台914b和WTRU 902c、902d可以使用基於胞元的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A等)以建立微微胞元(picocell)和毫微微胞元(femtocell)。如第9A圖所示,基地台914b可以具有至網際網路910的直接連接。由此,基地台914b可不經由核心網路906/907/909來存取網際網路910。[142]
RAN 903/904/905可以與核心網路906/907/909通訊,該核心網路906/907/909可以是被配置成將語音、資料、應用和/或網際網路協定語音(VoIP)服務提供到WTRU 902a、902b、902c、902d中的一者或多者的任何類型的網路。例如,核心網路906/907/909可以提供呼叫控制、帳單服務、基於移動位置的服務、預付費呼叫、網際網路連接、視訊分配等,和/或執行高階安全性功能,例如用戶認證。儘管第9A圖中未示出,可以理解RAN 903/904/905和/或核心網路906/907/909可以直接或間接地與其他RAN進行通訊,這些其他RAN使用與RAN 903/904/905相同的RAT或者不同的RAT。例如,除了連接到可以採用E-UTRA無線電技術的RAN 903/904/905,核心網路906/907/909也可以與使用GSM無線電技術的其他RAN(未顯示)通訊。[143]
核心網路906/907/909也可以用作WTRU 902a、902b、902c、902d存取PSTN 908、網際網路910和/或其他網路912的閘道。PSTN 908可以包括提供普通老式電話服務(POTS)的電路交換電話網絡。網際網路910可以包括使用公共通訊協定的互聯電腦網路及裝置的全球系統,該公共通訊協定例如是傳輸控制協定(TCP)/網際網路協定(IP)網際網路協定套件中的傳輸控制協定(TCP)、用戶資料包通訊協定(UDP)和網際網路協定(IP)。該網路912可以包括由其他服務提供方擁有和/或營運的無線或有線通訊網路。例如,網路912可以包括連接到一個或多個RAN的另一核心網路,這些RAN可以使用與RAN 903/904/905相同的RAT或者不同的RAT。[144]
通訊系統100中的WTRU 902a、902b、902c、902d中的一些或者全部可以包括多模式能力,例如WTRU 902a、902b、902c、902d可以包括用於通過不同的通訊鏈路與不同的無線網路進行通訊的多個收發器。例如,第9A圖中顯示的WTRU 902c可以被配置成與可使用基於胞元的無線電技術的基地台914a進行通訊,並且與可使用IEEE 802無線電技術的基地台914b進行通訊。[145]
第9B圖是示例WTRU 902的系統圖。如第9B圖所示,WTRU 902可以包括處理器918、收發器920、發射/接收元件922、揚聲器/麥克風924、數字鍵盤926、顯示器/觸控板928、不可移動記憶體930、可移動記憶體932、電源934、全球定位系統(GPS)晶片組936和其他週邊設備938。應該理解的是,在保持與實施方式一致的情況下,WTRU 902可以包括上述元件的任何子組合。同樣,實施方式設想基地台914a和914b和/或基地台914a和914b可以表示的節點(例如但不限於收發器站(BTS)、節點B、網站控制器、存取點(AP)、家庭節點B、演進型家庭節點B(e節點B)、家庭演進型節點B(HeNB)、家庭演進型節點B閘道、以及代理節點等等)可以包括第9B圖中描述的以及這裡描述的元件的一些或全部。[146]
處理器918可以是通用處理器、專用處理器、常規處理器、數位訊號處理器(DSP)、多個微處理器、與DSP核心相關聯的一個或多個微處理器、控制器、微控制器、專用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)電路、任何其它類型的積體電路(IC)、狀態機等。處理器918可以執行信號編碼、資料處理、功率控制、輸入/輸出處理和/或使得WTRU 902能夠運行在無線環境中的其他任何功能。處理器918可以耦合到收發器920,該收發器920可以耦合到發射/接收元件922。儘管第9B圖中將處理器918和收發器920描述為分別的組件,但是處理器918和收發器920可以被一起整合到電子封裝或者晶片中。[147]
發射/接收元件922可以被配置成通過空中介面915/916/917將信號發送到基地台(例如,基地台914a),或者從基地台(例如,基地台914a)接收信號。例如,在一個實施方式中,發射/接收元件922可以是被配置成發送和/或接收RF信號的天線。在另一個實施方式中,發射/接收元件922可以是被配置成發送和/或接收例如IR、UV或者可見光信號的發射器/檢測器。在另一個實施方式中,發射/接收元件922可以被配置成發送和接收RF信號和光信號兩者。可以理解發射/接收元件922可以被配置成發送和/或接收無線信號的任意組合。[148]
此外,儘管發射/接收元件922在第9B圖中被描述為單個元件,但是WTRU 902可以包括任何數量的發射/接收元件922。更具體地,WTRU 902可以使用MIMO技術。由此,在一個實施方式中,WTRU 902可以包括兩個或更多個發射/接收元件922(例如,多個天線)以用於通過空中介面915/916/917發射和/或接收無線信號。[149]
收發器920可以被配置成對將由發射/接收元件922發送的信號進行調變,並且被配置成對由發射/接收元件922接收的信號進行解調。如上所述,WTRU 902可以具有多模式能力。由此,收發器920可以包括多個收發器以用於使得WTRU 902能夠經由多個RAT進行通訊,例如UTRA和IEEE 802.11。[150]
WTRU 902的處理器918可以被耦合到揚聲器/麥克風924、數字鍵盤926和/或顯示器/觸控板928(例如,液晶顯示(LCD)顯示單元或者有機發光二極體(OLED)顯示單元),並且可以從上述裝置接收用戶輸入資料。處理器118還可以向揚聲器/麥克風924、數字鍵盤926和/或顯示器/觸控板928輸出用戶資料。此外,處理器918可以存取來自任何類型的合適的記憶體中的資訊,以及向任何類型的合適的記憶體中儲存資料,該記憶體例如可以是不可移動記憶體930和/或可移動記憶體932。不可移動記憶體930可以包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、硬碟或者任何其他類型的記憶體儲存裝置。可移動記憶體932可以包括訂戶身份模組(SIM)卡、記憶棒、安全數位(SD)記憶卡等。在其他實施方式中,處理器918可以存取來自實體上未位於WTRU 902上(例如位於伺服器或者家用電腦(未示出)上)的記憶體的資料,以及在該記憶體中儲存資料。[151]
處理器918可以從電源934接收電能,並且可以被配置成將該電能分配給WTRU 902中的其他組件和/或對至WTRU 902中的其他元件的電能進行控制。電源934可以是任何適用於給WTRU 902供電的裝置。例如,電源934可以包括一個或多個乾電池(鎳鎘(NiCd)、鎳鋅(NiZn)、鎳氫(NiMH)、鋰離子(Li-ion)等)、太陽能電池、燃料電池等。[152]
處理器918還可以耦合到GPS晶片組936,該GPS晶片組936可以被配置成提供關於WTRU 902的當前位置的位置資訊(例如,經度和緯度)。WTRU 902可以通過空中介面915/916/917從基地台(例如,基地台914a、914b)接收加上或取代GPS晶片組936資訊之位置資訊,和/或基於從兩個或更多個相鄰基地台接收到的信號的定時(timing)來確定其位置。可以理解,在保持與實施方式一致性的同時,WTRU可以通過任何合適的位置確定方法來獲取位置資訊。[153]
處理器918還可以耦合到其他週邊設備938,該週邊設備938可以包括提供附加特徵、功能和/或無線或有線連接的一個或多個軟體和/或硬體模組。例如,週邊設備938可以包括加速度計、電子指南針(e-compass)、衛星收發器、數位相機(用於照片或者視訊)、通用序列匯流排(USB)埠、振動裝置、電視收發器、免持耳機、藍芽®模組、調頻(FM)無線電單元、數位音樂播放機、媒體播放機、視訊遊戲機模組、網際網路瀏覽器等等。[154]
第9C圖為根據一種實施方式的RAN 903及核心網路906的系統圖。如上所述,RAN 903可使用UTRA無線電技術通過空中介面915與WTRU 902a、902b、902c通訊。RAN 903還可以與核心網路906進行通訊。如第9C圖所示,RAN 903可包括節點B 940a、940b、940c,節點B 940a、940b、940c每一者均可包括一個或多個用於通過空中介面915與WTRU 902a、902b、902c通訊的收發器。節點B 940a、940b、940c中的每一者均可與RAN 903中的特定胞元(未示出)相關聯。RAN 903還可以包括RNC 942a、942b。可以理解在保持與實施方式一致性的同時,RAN 903可以包括任意數量的節點B和RNC。[155]
如第9C圖所示,節點B 940a、940b可以與RNC 942a通訊。此外,節點B 940c可以與RNC 942b通訊。節點B 940a、940b、940c可以經由Iub介面與各自的RNC 942a、942b通訊。RNC 942a、942b可以經由Iur介面彼此通訊。RNC 942a、942b的每一個可以被配置成控制其連接的各自的節點B 940a、940b、940c。此外,RNC 942a、942b的每一個可以被配製成執行或支持其他功能,例如外環功率控制、負載控制、准許控制、封包排程、切換控制、巨集分集、安全功能、資料加密等。[156]
第9C圖中示出的核心網路906可以包括媒體閘道(MGW)944、移動交換中心(MSC)946、服務GPRS支援節點(SGSN)948和/或閘道GPRS支持節點(GGSN)950。儘管前述每一個元件被描述為核心網路906的一部分,但這些元件的任何一個可以由除核心網路營運方之外的實體所擁有和/或操作。[157]
RAN 903中的RNC 942a可以經由IuCS介面連接到核心網路906中的MSC 946。MSC 946可以連接到MGW 944。MSC 946和MGW 944可以給WTRU 902a、902b、902c提供對例如PSTN 908的電路切換式網路的存取,以促進WTRU 902a、902b和/或902c與傳統路線通訊裝置之間的通訊。[158]
RAN 903中的RNC 902a還可以經由IuPS介面連接到核心網路906/907/909中的SGSN 948。SGSN 948可以連接到GGSN 950。SGSN 948和GGSN 950可以給WTRU 902a、902b、902c提供對例如網際網路910的封包交換網路的存取,以促進WTRU 902a、902b、902c與IP賦能裝置之間的通訊。[159]
如上所述,核心網路906還可以連接到網路912,網路912可以包括其他服務提供方擁有和/或營運的其他有線或無線網路。[160]
第9D圖為根據一種實施方式的RAN 904及核心網路907的系統圖。如上所述,RAN 904可使用E-UTRA無線電技術通過空中介面916與WTRU 902a、902b、902c通訊。RAN 904還可以與核心網路907進行通訊。[161]
RAN 904可包括e節點B 960a、960b、960c,但可以理解RAN 904可以包括任意數量的e節點B而保持與實施方式一致。e節點B 960a、960b、960c每一者均可包括用於通過空中介面916與WTRU 902a、902b、902c通訊的一個或多個收發器。在一個實施方式中,e節點B 960a、960b、960c可以實施MIMO技術。從而,例如e節點B 960a可以使用多個天線來向WTRU 902a發射無線信號並從WTRU 902a接收無線信號。[162]
e節點B 960a、960b、960c中的每一個可以與特定胞元(未示出)相關聯,並可被配置成處理無線電資源管理決定、切換決定、在上行鏈路和/或下行鏈路中對用戶進行排程等。如第9D圖所示,e節點B 960a、960b、960c可以通過X2介面互相通訊。[163]
第9D圖中示出的核心網路907可以包括移動性管理閘道(MME)962、服務閘道964和封包資料網路(PDN)閘道966。雖然上述元件中的每一個都被描述為核心網路907的一部分,這些元件中的任何一個可被不同於核心網路營運商的實體所擁有和/或操作。[164]
MME 962可經由S1介面連接到RAN 904中的e節點B 160a、160b、160c中的每一個,並可充當控制節點。例如,MME 962可負責認證WTRU 902a、902b、902c的用戶、承載啟動/去啟動、在WTRU 902a、902b、902c的初始附著期間選擇特定服務閘道,等等。MME 942還可提供控制平面功能,以用於在RAN 904和使用其它無線電技術(比如GSM或WCDMA)的其它RAN(未示出)之間進行切換。[165]
服務閘道964可經由S1介面連接到RAN 904中的e節點B 960a、960b、960c中的每一個。服務閘道964可以一般地向/從WTRU 902a、902b、902c路由並轉發用戶資料封包。服務閘道964還可執行其它功能,比如在e節點B間切換期間錨定用戶平面、當下行鏈路資料對WTRU 902a、902b、902c是可用的時觸發傳呼、管理並儲存WTRU 902a、902b、902c的上下文,等等。[166]
服務閘道964還可連接到PDN 966,其可向WTRU 902a、902b、902c提供到封包交換網路(比如網際網路910)的存取,以促進WTRU 902a、902b、902c和IP賦能裝置之間的通訊。[167]
核心網路907可以促進與其它網路的通訊。例如,核心網路907可以向WTRU 902a、902b、902c提供到電路切換式網路(比如PSTN 908)的存取,以促進WTRU 902a、902b、902c和傳統陸線通訊裝置之間的通訊。例如,核心網路907可以包括充當核心網路907與PSTN 908之間的介面的IP閘道(例如IP多媒體子系統(IMS)伺服器)或者可以與該IP閘道通訊。此外,核心網路907可以向WTRU 902a、902b、902c提供到網路912的存取,網路912可包括由其他服務提供者擁有和/或操作的其它有線或無線網路。[168]
第9E圖是根據一種實施方式的RAN 905和核心網路909的系統圖。RAN 905可以是利用IEEE 802.16無線電技術通過空中介面917與WTRU 902a、902b、902c進行通訊的存取服務網(ASN)。如將在下面詳細描述的,WTRU 902a、902b、902c、RAN 905和核心網路109中的不同功能實體之間的通訊鏈路可被定義為參考點。[169]
如第9E圖中所示,RAN 905可包括基地台 980a、980b、980c和ASN閘道982,但可以理解在保持與實施方式一致性的同時RAN 905可以包括任意數量的基地台和ASN閘道。基地台980a、980b、980c 每一個可以與RAN 905中的特定胞元(未示出)相關聯並且均可包括用於通過空中介面917與WTRU 902a、902b、902c通訊的一個或多個收發器。在一種實施方式中,基地台980a、980b、980c 可以實施MIMO技術。從而,舉例來講,基地台980a可以使用多個天線來向WTRU 902a發射無線信號並從WTRU 902a接收無線信號。基地台980a、980b、980c還可提供移動性管理功能,比如切換觸發、隧道建立、無線電資源管理、訊務分類、服務品質(QoS)策略執行等。ASN閘道942可以充當流量聚集點並可負責傳呼、快取訂戶簡檔、路由到核心網路909等。[170]
WTRU 902a、902b、902c與RAN 905之間的空中介面917可被定義為實施IEEE 802.16規範的R1參考點。此外,WTRU 902a、902b、902c中的每一個可與核心網路909建立邏輯介面(未示出)。WTRU 902a、902b、902c和核心網路909之間的邏輯介面可被定義為R2參考點,其可用於認證、授權、IP主機配置管理和/或移動性管理。[171]
基地台980a、980b、980c中的每一個之間的通訊鏈路可被定義為包括用於促進WTRU切換和基地台之間的資料轉移的協定的R8參考點。基地台980a、980b、980c和ASN閘道982之間的通訊鏈路可被定義為R6參考點。R6參考點可包括用於促進基於與WTRU 902a、902b、902c中的每一個相關聯的移動性事件的移動性管理的協定。[172]
如第9E圖所示,RAN 905可連接到核心網路909。RAN 905和核心網路909之間的通訊鏈路可被定義為例如包括用於促進資料轉移和移動性管理能力的協定的R3參考點。核心網路9099可包括移動性IP本地代理(MIP-HA)984、認證授權記帳(AAA)伺服器986、和閘道988。雖然上述元件中的每一個都被描述為核心網路909的一部分,但可以理解這些元件中的任何一個可被不同於核心網路營運商的實體所擁有和/或操作。[173]
該MIP-HA對於IP位址關聯是可靠的,並且可使得WTRU 902a、902b、902c在不同的ASN和/或不同的核心網路之間路由。該MIP-HA 984可向WTRU 902a、902b、902c提供到封包交換網路(例如英特網910)的存取,以便於WTRU 902a、902b、902c與IP賦能裝置之間的通訊。該AAA伺服器986可用於用戶認證以及支援用戶服務。閘道988可促進與其他網路的交互工作。例如,閘道988可向WTRU 902a、902b、902c提供到電路切換式網路(例如PSTN 908)的存取,以便於WTRU 902a、902b、902c與傳統陸線通訊裝置之間的通訊。此外,閘道988向WTRU 902a、902b、902c提供到網路912的存取,該網路912可包括由其他服務提供者所擁有和/或操作的其他有線或無線網路。[174]
雖然未在第9E圖中示出,應當理解的是,RAN 905可與其他ASN連接,並且核心網路909可與其他核心網路連接。RAN 905與其他ASN之間的通訊鏈路可被定義為R4參考點,其可包括用於協調WTRU 902a、902b、902c在RAN 905與其他ASN之間的移動性的協定。核心網路909與其他核心網路之間的通訊鏈路可被定義為R5參考點,其可包括用於促進家用核心網路與受訪核心網路之間的交互的協定。[175]
此處描述的方法和手段可適用於任意組合,並且可適用於其他無線技術及其他服務。[176]
WTRU可意指物理裝置的身份或用戶身份(例如訂閱相關身份,例如MSISDN、SIP URI等)。WTRU可意指基於應用的身份,例如針對每一應用使用的用戶名。
此處所述的方法可在結合至電腦可讀儲存媒體中的電腦程式、軟體和/或韌體中實現,以由電腦或處理器執行。電腦可讀媒體的示例包括電子信號(通過有線或無線連接傳送)和電腦可讀儲存媒體。電腦可讀儲存媒體的例子包括但不限於唯讀記憶體(ROM)、隨機存取記憶體(RAM)、暫存器、快取記憶體、半導體記憶裝置、例如內置磁片和抽取式磁碟的磁媒體、磁光媒體和光媒體(例如CD-ROM盤和數位多用途盤(DVD))。與軟體相關聯的處理器可被用於實施在WTRU、UE、終端、基地台、RNC或任何主機中使用的射頻收發器。
502、504、506‧‧‧序列參數集網路提取層(SPS NAL)單元
508、510、512‧‧‧圖片參數集網路提取層(PPSNAL)單元
810、820、830、840、850、860、870、880、890、B、I、P、POC‧‧‧圖片
900‧‧‧通訊系統
902、902a、902b、902c、902d‧‧‧無線發射/接收單元(WTRU)
903、904、904b‧‧‧無線電存取網路(RAN)
906、907、909‧‧‧核心網路
908‧‧‧公共交換電話網路(PSTN)
910‧‧‧網際網路
912‧‧‧其他網路
914a、914b、980a、980b、980c‧‧‧基地台
915、916、917‧‧‧空中介面
918‧‧‧處理器
920‧‧‧收發器
922‧‧‧發射/接收元件
924‧‧‧揚聲器/麥克風
926‧‧‧數字鍵盤
928‧‧‧顯示器/觸控板
930‧‧‧不可移動記憶體
932‧‧‧可移動記憶體
934‧‧‧電源
936‧‧‧全球定位系統(GPS)晶片組
938‧‧‧其他週邊設備
940a、940b、940c‧‧‧節點B
942a、942b‧‧‧無線電網路控制器(RNC)
944‧‧‧媒體閘道(MGW)
946‧‧‧移動交換中心(MSC)
948‧‧‧服務GPRS支援節點(SGSN)
950‧‧‧閘道GPRS支持節點(GGSN)
960a、960b、960c‧‧‧e節點B
962‧‧‧移動性管理閘道(MME)
964‧‧‧服務閘道
966‧‧‧封包資料網路(PDN)閘道
982‧‧‧存取服務網(ASN)閘道
984‧‧‧移動性IP本地代理(MIP-HA)
986‧‧‧認證授權記帳(AAA)伺服器
988‧‧‧閘道
AVC‧‧‧高階視訊編碼
BL‧‧‧基層
DEMUX‧‧‧解多工模組
DPB‧‧‧解碼圖片緩衝器
EL‧‧‧增強層
Enh‧‧‧增強視訊資訊
HD‧‧‧高解析度
HEVC‧‧‧高效視訊編碼
ILP‧‧‧層間處理
IP‧‧‧網際網路協定
Iub、IuCS、IuPS、Iur、S1、X2‧‧‧介面
MUX‧‧‧多工
Q‧‧‧量化器
R1、R3、R6、R8‧‧‧參考點
SHVC‧‧‧可伸縮延伸
UHD‧‧‧最高解析度
Y‧‧‧基層重建
[09]
第1圖示出了示例多層可伸縮視訊編碼系統。[10] 第2圖示出了立體視訊編碼的時間預測和層間預測的實例。[11] 第3圖是示出了可被配置成執行HD到UHD可伸縮性的示例兩層可伸縮視訊轉碼器的簡化框圖。[12] 第4圖是示出了可被配置成執行HD到UHD可伸縮性的示例兩層可伸縮視訊解碼器的簡化框圖。[13] 第5圖是示出了序列參數集(SPS)和圖片參數集(PPS)啟動的實例的圖。[14] 第6圖示出了示例多層預測結構。[15] 第7圖示出了示例直接附屬層。[16] 第8圖示出了分層視訊編碼結構的示例時間層。[17] 第9A圖是示例通訊系統的系統圖,在該示例通訊系統中可實現一個或多個揭露的實施方式。[18] 第9B圖是可在第9A圖的通訊系統中使用的示例無線發射/接收單元(WTRU)的系統圖。[19] 第9C圖是可在第9A圖的通訊系統中使用的示例無線電存取網路和示例核心網路的系統圖。[20] 第9D圖是可在第9A圖的通訊系統中使用的另一示例無線電存取網路和另一示例核心網路的系統圖。 第9E圖是可在第9A圖的通訊系統中使用的另一示例無線電存取網路和另一示例核心網路的系統圖。
Q‧‧‧量化器
Y‧‧‧基層重建

Claims (42)

  1. 一種視訊編碼裝置,該視訊編碼裝置包括: 一處理器,被配置成: 識別一網路提取層(NAL)單元; 確定該NAL單元是否包括一當前層的一活動參數集; 基於確定該NAL單元包括該當前層的該活動參數集,將與該NAL單元關聯的一NAL單元標頭層識別符設為下列中的至少一者:零、指示該當前層的一值、或指示該當前層的一基準層的一值。
  2. 如申請專利範圍第1項所述的視訊編碼裝置,其中該NAL單元是一圖片參數集(PPS)NAL單元。
  3. 如申請專利範圍第1項所述的視訊編碼裝置,其中該NAL單元是一序列參數集(SPS)NAL單元。
  4. 如申請專利範圍第1項所述的視訊編碼裝置,其中指示該當前層的該值包括指示與該當前層關聯的一層識別符的一值。
  5. 如申請專利範圍第1項所述的視訊編碼裝置,其中指示該當前層的該基準層的該值包括指示與該當前層的該基準層關聯的一層識別符的一值。
  6. 如申請專利範圍第1項所述的視訊編碼裝置,其中該處理器被配置成發送包括該NAL單元的一視訊位元串流至一視訊解碼裝置。
  7. 一種視訊編碼方法,該視訊編碼方法包括: 識別一網路提取層(NAL)單元; 確定該NAL單元是否包括一當前層的一活動參數集; 基於確定該NAL單元包括該當前層的該活動參數集,將與該NAL單元關聯的一NAL單元標頭層識別符設為下列中的至少一者:零、指示該當前層的一值、或指示該當前層的一基準層的一值。
  8. 如申請專利範圍第7項所述的視訊編碼方法,其中該NAL單元是圖片參數集(PPS)NAL單元。
  9. 如申請專利範圍第7項所述的視訊編碼方法,其中該NAL單元是一序列參數集(SPS)NAL單元。
  10. 如申請專利範圍第7項所述的視訊編碼方法,其中指示該當前層的該值包括指示與該當前層關聯的一層識別符的值。
  11. 如申請專利範圍第7項所述的視訊編碼方法,其中指示該當前層的該基準層的該值包括指示與該當前層的該基準層關聯的一層識別符的一值。
  12. 如申請專利範圍第7項所述的視訊編碼方法,其中該處理器被配置成發送包括該NAL單元的一視訊位元串流至一視訊解碼裝置。
  13. 一種視訊編碼裝置,該視訊編碼裝置包括: 一處理器,被配置成: 接收包括一序列參數集(SPS)和具有一視訊表現格式清單的一視訊參數集(VPS)的視訊位元串流; 基於該SPS中的一更新視訊表示格式標記確定與該SPS關聯的一層的一視訊表示格式,其中: 在該更新視訊表現格式標記指示存在一表現格式索引的一條件下,該視訊表現格式基於該表現格式索引從該VPS中的該視訊表現格式清單來確定;以及 在該更新表現格式索引不存在的一條件下,該視訊表現格式從一預設視訊表現格式來確定。
  14. 如申請專利範圍第13項所述的視訊編碼裝置,其中該處理器被配置成: 基於該SPS中的該更新視訊表現格式標記確定該SPS中是否存在該表現格式索引,其中在該更新視訊表現格式標記等於1的一條件下,確定該SPS中存在該表現格式索引,並且在該更新視訊表現格式標記等於0的條件下,確定該SPS中不存在該表現格式索引。
  15. 如申請專利範圍第13項所述的視訊編碼裝置,其中該預設視訊表現格式是在該VPS中針對該層指定的一預設視訊表現格式。
  16. 如申請專利範圍第13項所述的視訊編碼裝置,其中該表現格式索引在包含端點的0與表現格式的該VPS號的該值減1之間的一範圍內。
  17. 一種視訊編碼方法,該視訊編碼方法包括: 接收包括一序列參數集(SPS)和具有一視訊表現格式清單的一視訊參數集(VPS)的一視訊位元串流; 基於該SPS中的一更新視訊表現格式標記確定與該SPS關聯的一層的一視訊表現格式,其中: 在該更新視訊表現格式標記指示存在一表現格式索引的一條件下,基於該表現格式索引從該VPS中的一視訊表現格式清單確定該視訊表現格式;以及 在一更新表現格式索引不存在的一條件下,從一預設視訊表現格式確定該視訊表現格式。
  18. 如申請專利範圍第17項所述的視訊編碼方法,該視訊編碼方法包括: 基於該SPS中的該更新視訊表現格式標記確定該SPS中是否存在該表現格式索引,其中在該更新視訊表現格式標記等於1的條件下,確定該SPS中存在該表現格式索引,並且在該更新視訊表現格式標記等於0的條件下,確定該SPS中不存在該表現格式索引。
  19. 如申請專利範圍第17項所述的視訊編碼方法,其中該預設視訊表現格式是在該VPS中針對層指定的一預設視訊表現格式。
  20. 如申請專利範圍第17項所述的視訊編碼方法,其中該表現格式索引在包含端點的0與表現格式的該VPS號的該值減1之間的一範圍內。
  21. 一種視訊編碼裝置,該視訊編碼裝置包括: 一處理器,被配置成: 為與一序列參數集(SPS)關聯的一層分派一表現格式; 基於用於與該SPS關聯的該層的該被分派的表現格式確定是否在該SPS中包含一表現格式索引,其中: 在該被分派的表現格式為一預設表現格式的條件下,該表現格式索引不被包含在該SPS中,以及 在該被分派的表現格式在一視訊參數集(VPS)中被指定的條件下,該表現格式索引被包含在該SPS中;以及 基於該確定,設置一更新視訊表現格式標記,以指示該表現格式索引是否被包含在該SPS中。
  22. 如申請專利範圍第21項所述的視訊編碼裝置,其中該處理器被配置成將該更新視訊表現格式標記設為等於1,以指示該SPS中存在該表現格式索引。
  23. 如申請專利範圍第21項所述的視訊編碼裝置,其中該處理器被配置成將該更新視訊表現格式標記設為等於0,以指示該SPS中不存在該表現格式索引。
  24. 如申請專利範圍第21項所述的視訊編碼裝置,其中該處理器被配置成在一視訊位元串流中以信號通告該所設定的更新視訊表現格式標記。
  25. 一種視訊編碼方法,該視訊編碼方法包括: 為與一序列參數集(SPS)關聯的一層分派一表現格式; 基於用於與該SPS關聯的該層的該被分派的表現格式確定是否在該SPS中包含一表現格式索引,其中: 在該被分派的表現格式為一預設表現格式的條件下,該表現格式索引不被包含在該SPS中;和 在該被分派的表現格式在一視訊參數集(VPS)中被指定的條件下,該表現格式索引被包含在該SPS中;以及 基於該確定,設置一更新視訊表現格式標記,以指示該表現格式索引是否被包含在該SPS中。
  26. 如申請專利範圍第25項所述的視訊編碼方法,其中該處理器被配置成將該更新視訊表現格式標記設為等於1,以指示該SPS中存在該表現格式索引。
  27. 如申請專利範圍第25項所述的視訊編碼方法,其中該處理器被配置成將該更新視訊表現格式標記設為等於0,以指示該SPS中不存在該表現格式索引。
  28. 如申請專利範圍第25項所述的視訊編碼方法,其中該處理器被配置成在一視訊位元串流中以信號通告該所設定的更新視訊表現格式標記。
  29. 一種視訊編碼裝置,該視訊編碼裝置包括: 一處理器,被配置成: 接收包括一視訊參數集(VPS)和多個層的一視訊位元串流; 基於該VPS中的一預設直接附屬標記確定與該多個層關聯的直接附屬關係,其中: 在該預設直接附屬標記指示該VPS中存在直接附屬類型資訊的條件下,該直接附屬關係從該VPS中的該直接附屬類型資訊來確定;以及 在該預設直接附屬標記指示該VPS中不存在該直接附屬類型資訊的條件下,該直接附屬關係基於一預設來確定。
  30. 一種視訊編碼方法,該視訊編碼方法包括: 接收包括一視訊參數集(VPS)和多個層的一視訊位元串流; 基於該VPS中的一預設直接附屬標記確定與該多個層關聯的直接附屬關係,其中: 在該預設直接附屬標記指示該VPS中存在該直接附屬類型資訊的條件下,從該VPS中的該直接附屬類型資訊確定該直接附屬關係;以及 在該預設直接附屬標記指示該VPS中不存在直接附屬類型資訊的條件下,基於一預設確定該直接附屬關係。
  31. 如申請專利範圍第30項所述的視訊編碼方法,其中該預設附屬應用於該多個層中的每一層。
  32. 一種視訊編碼裝置,該視訊編碼裝置包括: 一處理器,被配置成: 確定是否在該視訊VPS中包括直接附屬類型資訊,其中: 在使用了預設附屬的條件下,跳過在該VPS中以信號通告該直接附屬類型資訊; 在未使用預設附屬的條件下,在該VPS中包括該直接附屬類型資訊;以及 基於該確定,在該VPS中設定一預設直接附屬標記。
  33. 一種視訊編碼方法,該視訊編碼方法包括: 確定是否在該視訊VPS中包括直接附屬類型資訊,其中: 在使用了預設附屬的條件下,跳過在該VPS中以信號通告直接附屬類型資訊; 在未使用預設附屬的條件下,在該VPS中包括該直接附屬類型資訊;以及 基於該確定,在該VPS中設定一預設直接附屬標記。
  34. 一種多路SHVC編碼器,該多路SHVC編碼器包括: 一處理器,該處理器具有用於限制針對一設定檔的該基準層數量的可執行指令,該可執行指令包括: 設定一基準層限制; 將一視訊訊號編碼到針對該設定檔的層中,由此該層包括直接和間接基準層,並且在該所編碼的視訊信號中針對一層的直接和間接基準層的該總數量小於該基準層限制。
  35. 一種多路SHVC編碼器,該多路SHVC編碼器包括: 一處理器,該處理器具有用於限制針對一設定檔的該基準層數量的可執行指令,該可執行指令包括: 設定一基準層限制; 將一視訊訊號編碼到針對該設定檔的層中,該層包括直接和間接層; 針對每一層,確定直接和間接基準層的該總數量,以及確定針對該層的該直接和間接基準層的該總數量是否小於該基準層限制;以及 在針對每一層的直接和間接基準層的該總數量小於該基準層限制的情況下,發送一編碼視訊訊號至一解碼器。
  36. 一種用於限定和/或降低針對一多路SHVC轉碼器的一編碼複雜度的方法,該方法包括: 以信號通告一個或多個約束以限制層的一數量;以及 應用該一個或多個約束。
  37. 如申請專利範圍第36項所述的方法,其中該層包括下列中的至少一者:直接附屬層、間接附屬層、以及一基層。
  38. 如申請專利範圍第37項所述的方法,其中該一個或多個約束包括下列中的至少一者:限制該直接附屬層的一最大數量、或限制直接和間接附屬層的一最大數量。
  39. 如申請專利範圍第38項所述的方法,其中直接附屬層的該最大數量經由下列中的至少一者進行限制:一VPS延伸中的一語法元素、一SPS中的一語法元素、或一設定檔指示。
  40. 如申請專利範圍第38項所述的方法,其中直接和間接附屬層的該最大數量經由下列中的至少一者進行限制:一VPS延伸中的一語法元素、一SPS中的一語法元素、或一設定檔指示。
  41. 如申請專利範圍第36項所述的方法,其中該一個或多個約束經由一導出的變數以信號通告。
  42. 如申請專利範圍第36項所述的方法,其中該一個或多個約束經由一語法元素以信號通告。
TW103135355A 2013-10-11 2014-10-13 視訊編碼裝置及方法 TWI646825B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361889787P 2013-10-11 2013-10-11
US201361889919P 2013-10-11 2013-10-11
US61/889,787 2013-10-11
US61/889,919 2013-10-11

Publications (2)

Publication Number Publication Date
TW201531090A true TW201531090A (zh) 2015-08-01
TWI646825B TWI646825B (zh) 2019-01-01

Family

ID=51868303

Family Applications (2)

Application Number Title Priority Date Filing Date
TW103135355A TWI646825B (zh) 2013-10-11 2014-10-13 視訊編碼裝置及方法
TW107141244A TWI704801B (zh) 2013-10-11 2014-10-13 視訊編碼/解碼裝置及方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW107141244A TWI704801B (zh) 2013-10-11 2014-10-13 視訊編碼/解碼裝置及方法

Country Status (9)

Country Link
US (3) US9648333B2 (zh)
EP (2) EP3056004A2 (zh)
JP (3) JP6212212B2 (zh)
KR (2) KR102143707B1 (zh)
CN (2) CN109905703B (zh)
IL (1) IL245013B (zh)
MY (1) MY178305A (zh)
TW (2) TWI646825B (zh)
WO (1) WO2015054634A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI647946B (zh) * 2016-06-30 2019-01-11 北京奇藝世紀科技有限公司 一種圖像編解碼方法及裝置

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210129266A (ko) * 2012-07-09 2021-10-27 브이아이디 스케일, 인크. 멀티 레이어 비디오 코딩용 코덱 아키텍처
US10284858B2 (en) * 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
WO2015099400A1 (ko) 2013-12-24 2015-07-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
CN104754358B (zh) * 2013-12-27 2019-02-19 中兴通讯股份有限公司 码流的生成和处理方法、装置及系统
US9654794B2 (en) * 2014-01-03 2017-05-16 Qualcomm Incorporated Methods for coding an inter-layer reference picture set (RPS) and coding end of bitstream (EOB) network access layer (NAL) units in multi-layer coding
US9832481B2 (en) * 2014-01-03 2017-11-28 Qualcomm Incorporated Support of base layer of a different codec in multi-layer video coding
US20150195549A1 (en) * 2014-01-08 2015-07-09 Qualcomm Incorporated Support of non-hevc base layer in hevc multi-layer extensions
US10091553B1 (en) * 2014-01-10 2018-10-02 Sprint Communications Company L.P. Video content distribution system and method
KR20150110295A (ko) * 2014-03-24 2015-10-02 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
JP6150134B2 (ja) * 2014-03-24 2017-06-21 ソニー株式会社 画像符号化装置および方法、画像復号装置および方法、プログラム、並びに記録媒体
US9894370B2 (en) 2014-03-24 2018-02-13 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
US10432951B2 (en) * 2014-06-24 2019-10-01 Qualcomm Incorporated Conformance and inoperability improvements in multi-layer video coding
WO2016098056A1 (en) 2014-12-18 2016-06-23 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
JP6909223B2 (ja) 2016-01-25 2021-07-28 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ 空間スケーラブル・ビデオ・コーディング
US10623755B2 (en) * 2016-05-23 2020-04-14 Qualcomm Incorporated End of sequence and end of bitstream NAL units in separate file tracks
CN106658225B (zh) * 2016-10-31 2019-11-26 日立楼宇技术(广州)有限公司 视频扩展码设置及视频播放方法和系统
US10904521B2 (en) 2017-03-03 2021-01-26 Qualcomm Incorporated Extracting MCTS sub-bitstreams for video coding
CN107124571B (zh) * 2017-04-14 2020-01-14 浙江宇视科技有限公司 录像存储方法及装置
CN111937401B (zh) 2018-04-13 2022-08-16 皇家Kpn公司 基于块级超分辨率的视频编码的方法和装置
KR102030630B1 (ko) * 2018-04-30 2019-11-08 서울과학기술대학교 산학협력단 하이브리드 망 기반의 스테레오스코픽 3차원 360도 가상 현실 서비스 제공 시스템
CN112771885B (zh) * 2018-09-18 2023-04-25 诺基亚技术有限公司 用于针对视频编码的非二进制简档约束信令的方法和装置
US11553210B2 (en) 2018-12-07 2023-01-10 Interdigital Vc Holdings, Inc. Managing coding tools combinations and restrictions
BR112021016689A2 (pt) 2019-03-08 2021-10-13 Beijing Bytedance Network Technology Co., Ltd. Método de processamento de vídeo, aparelho em um sistema de vídeo, e, produto de programa de computador armazenado em uma mídia legível por computador não transitória
JP2022525399A (ja) * 2019-03-11 2022-05-13 ヴィド スケール インコーポレイテッド サブピクチャ適応解像度変更のための方法および装置
US20200322656A1 (en) * 2019-04-02 2020-10-08 Nbcuniversal Media, Llc Systems and methods for fast channel changing
BR112021019679A2 (pt) 2019-04-18 2021-12-07 Beijing Bytedance Network Tech Co Ltd Método para processamento de mídia visual, aparelho codificador de vídeo, aparelho decodificador de vídeo, e, mídia legível por computador
KR102630411B1 (ko) * 2019-04-20 2024-01-29 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 잔차 조인트 코딩을 위한 구문 요소의 시그널링
CN113711610B (zh) 2019-04-23 2024-04-16 北京字节跳动网络技术有限公司 降低跨分量依赖性的方法
CN117221558A (zh) 2019-05-08 2023-12-12 北京字节跳动网络技术有限公司 跨分量编解码的适用性条件
CN113785574B (zh) 2019-05-30 2022-10-11 北京字节跳动网络技术有限公司 色度分量的自适应环路滤波
US11166033B2 (en) * 2019-06-06 2021-11-02 Qualcomm Incorporated Adaptation parameter set in access unit in video coding
KR20220024006A (ko) 2019-06-22 2022-03-03 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 잔차 스케일링을 위한 신택스 요소
CA3145175A1 (en) * 2019-06-24 2020-12-30 Interdigital Vc Holdings, Inc. Method and apparatus for signaling decoding data using high level syntax elements
CN117395396A (zh) 2019-07-07 2024-01-12 北京字节跳动网络技术有限公司 色度残差缩放的信令通知
CA3150261A1 (en) * 2019-09-06 2021-03-11 Huawei Technologies Co., Ltd. HIGH LEVEL SIGNALING METHOD AND APPARATUS FOR WEIGHTED PREDICTION
US11418813B2 (en) 2019-09-20 2022-08-16 Tencent America LLC Signaling of inter layer prediction in video bitstream
US11109069B2 (en) * 2019-09-20 2021-08-31 Tencent America LLC Signaling of scalability parameters in video bitstream
EP4022772A4 (en) * 2019-09-24 2022-11-23 Huawei Technologies Co., Ltd. LAYER-BASED PARAMETER SET NAL UNIT CONSTRAINTS
AU2020319903A1 (en) * 2019-10-07 2022-05-19 Huawei Technologies Co., Ltd. Avoidance of redundant signaling in multi-layer video bitstreams
EP4062319A4 (en) 2019-12-26 2023-01-11 ByteDance Inc. REPORTING DECODED FRAME BUFFER PARAMETERS IN LAYERED VIDEO
MX2022007502A (es) 2019-12-26 2022-07-04 Bytedance Inc Tecnicas para implementar un orden de decodificacion dentro de una imagen codificada.
WO2021134015A1 (en) 2019-12-26 2021-07-01 Bytedance Inc. Profile, tier and layer indication in video coding
EP4066499A4 (en) 2019-12-27 2023-01-11 ByteDance Inc. SYNTAX FOR SIGNALING VIDEO IMAGES
US11825107B2 (en) * 2019-12-27 2023-11-21 Tencent America LLC Method for parameter set reference in coded video stream
BR112022013032A2 (pt) * 2019-12-31 2023-03-14 Huawei Tech Co Ltd Codificador, decodificador e métodos e aparelho correspondentes
CN115004669A (zh) 2020-01-09 2022-09-02 字节跳动有限公司 不同sei消息的解码顺序
WO2021170091A1 (en) 2020-02-29 2021-09-02 Beijing Bytedance Network Technology Co., Ltd. Constrains for high level syntax elements
US20230319302A1 (en) * 2020-03-31 2023-10-05 Lg Electronics Inc. Image encoding/decoding method and apparatus for determining sublayer on basis of whether or not to make reference between layers, and method for transmitting bitstream
WO2021233449A1 (en) * 2020-05-22 2021-11-25 Beijing Bytedance Network Technology Co., Ltd. Reserved bits in general constraint information of a video
WO2021237184A1 (en) 2020-05-22 2021-11-25 Bytedance Inc. Signaling of display information in video bitstreams
US11418814B2 (en) * 2020-05-22 2022-08-16 Tencent America LLC Constraint on syntax elements for still picture profiles
CA3179644A1 (en) 2020-05-22 2021-11-25 Ye-Kui Wang Scalable nested sei message handling in video sub-bitstream extraction process
KR20230013264A (ko) 2020-05-22 2023-01-26 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 서브픽처 서브-비트스트림 추출 개선들
WO2021252533A1 (en) 2020-06-09 2021-12-16 Bytedance Inc. Sub-bitstream extraction of multi-layer video bitstreams
KR20230019848A (ko) * 2020-06-09 2023-02-09 바이트댄스 아이엔씨 서브픽처 서브비트스트림 추출 프로세스 향상들
KR20230024341A (ko) * 2020-06-10 2023-02-20 엘지전자 주식회사 최대 시간 식별자에 기반하여 서브 비트스트림 추출과정을 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 컴퓨터 판독가능한 기록매체
CN112749548B (zh) * 2020-11-02 2024-04-26 万齐智 一种基于规则的中文结构化金融事件缺省补全抽取方法
US20230102088A1 (en) * 2021-09-29 2023-03-30 Tencent America LLC Techniques for constraint flag signaling for range extension
WO2024063559A1 (ko) * 2022-09-23 2024-03-28 엘지전자 주식회사 프로파일을 정의하는 하이 레벨 신택스에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2386275B (en) * 2002-03-05 2004-03-17 Motorola Inc Scalable video transmissions
JP5055355B2 (ja) * 2006-03-30 2012-10-24 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
US8699583B2 (en) * 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
US20080089411A1 (en) * 2006-10-16 2008-04-17 Nokia Corporation Multiple-hypothesis cross-layer prediction
US20080095228A1 (en) * 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
WO2008056959A1 (en) * 2006-11-09 2008-05-15 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
KR100896291B1 (ko) * 2006-11-17 2009-05-07 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
US20100189182A1 (en) * 2009-01-28 2010-07-29 Nokia Corporation Method and apparatus for video coding and decoding
US8745677B2 (en) * 2009-06-12 2014-06-03 Cygnus Broadband, Inc. Systems and methods for prioritization of data for intelligent discard in a communication network
US9053562B1 (en) * 2010-06-24 2015-06-09 Gregory S. Rabin Two dimensional to three dimensional moving image converter
EP2596633B1 (en) * 2010-07-20 2016-11-23 Nokia Technologies Oy A media streaming apparatus
CN103299619A (zh) * 2010-09-14 2013-09-11 汤姆逊许可公司 遮挡数据的压缩方法和装置
US20120075436A1 (en) * 2010-09-24 2012-03-29 Qualcomm Incorporated Coding stereo video data
CN103430458B (zh) * 2011-03-10 2016-03-02 维德约股份有限公司 可伸缩视频编码的依存参数集
US20130170561A1 (en) * 2011-07-05 2013-07-04 Nokia Corporation Method and apparatus for video coding and decoding
US9451252B2 (en) * 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
KR101669524B1 (ko) * 2012-02-01 2016-11-09 노키아 테크놀로지스 오와이 비디오 코딩을 위한 방법 및 장치
PT2822276T (pt) * 2012-02-29 2018-12-18 Lg Electronics Inc Processo de predição inter-camadas e dispositivo que o utiliza
US9503720B2 (en) * 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
CN104205813B (zh) * 2012-04-06 2018-05-08 维德约股份有限公司 分层视频编码的等级信令
JP6057395B2 (ja) * 2012-04-16 2017-01-11 ノキア テクノロジーズ オーユー ビデオ符号化方法および装置
KR101682999B1 (ko) * 2012-04-16 2016-12-20 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
KR20130116782A (ko) * 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US20130287093A1 (en) * 2012-04-25 2013-10-31 Nokia Corporation Method and apparatus for video coding
US9674532B2 (en) * 2012-06-24 2017-06-06 Lg Electronics Inc. Image decoding method using information on a random access picture and apparatus using same
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
WO2014006266A1 (en) * 2012-07-02 2014-01-09 Nokia Corporation Method and apparatus for video coding
WO2014009603A1 (en) * 2012-07-02 2014-01-16 Nokia Corporation Method and apparatus for video coding
CN110087091B (zh) * 2012-08-06 2021-11-12 Vid拓展公司 多层视频编码中用于空间层的采样栅格信息
WO2014038906A1 (ko) * 2012-09-09 2014-03-13 엘지전자 주식회사 영상 복호화 방법 및 이를 이용하는 장치
KR102160242B1 (ko) * 2012-09-09 2020-09-25 엘지전자 주식회사 영상 복호화 방법 및 이를 이용하는 장치
SG11201502194QA (en) * 2012-09-21 2015-04-29 Nokia Technologies Oy Method and apparatus for video coding
US20140085415A1 (en) * 2012-09-27 2014-03-27 Nokia Corporation Method and apparatus for video coding
KR101775250B1 (ko) * 2012-09-28 2017-09-05 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
KR20150063135A (ko) * 2012-09-28 2015-06-08 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
CN104685885B (zh) * 2012-09-30 2018-09-07 华为技术有限公司 一种在参数集中用信号发送可缩放性信息的方法
WO2014072571A1 (en) * 2012-10-01 2014-05-15 Nokia Corporation Method and apparatus for scalable video coding
WO2014058177A1 (ko) * 2012-10-08 2014-04-17 삼성전자 주식회사 멀티 레이어 비디오 부호화 방법 및 장치, 멀티 레이어 비디오 복호화 방법 및 장치
US20150245063A1 (en) * 2012-10-09 2015-08-27 Nokia Technologies Oy Method and apparatus for video coding
US20140098883A1 (en) * 2012-10-09 2014-04-10 Nokia Corporation Method and apparatus for video coding
US10805605B2 (en) * 2012-12-21 2020-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Multi-layer video stream encoding and decoding
US9774927B2 (en) * 2012-12-21 2017-09-26 Telefonaktiebolaget L M Ericsson (Publ) Multi-layer video stream decoding
US10419778B2 (en) * 2013-01-04 2019-09-17 Sony Corporation JCTVC-L0227: VPS_extension with updates of profile-tier-level syntax structure
US9351009B2 (en) * 2013-04-05 2016-05-24 Sharp Kabushiki Kaisha Marking pictures for inter-layer prediction
US9532067B2 (en) * 2013-04-05 2016-12-27 Sharp Kabushiki Kaisha Decoding of inter-layer reference picture set and reference picture list construction
US9807421B2 (en) * 2013-04-05 2017-10-31 Sharp Kabushiki Kaisha NAL unit type restrictions
US20140301477A1 (en) * 2013-04-07 2014-10-09 Sharp Laboratories Of America, Inc. Signaling dpb parameters in vps extension and dpb operation
US9591321B2 (en) * 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
CN103237213B (zh) * 2013-04-08 2016-03-30 华为技术有限公司 视频编码方法和视频解码方法及相关装置
CN105210370B (zh) 2013-07-10 2019-04-12 夏普株式会社 运动图像解码装置
US20150373350A1 (en) * 2014-06-20 2015-12-24 Qualcomm Incorporated Temporal motion vector prediction (tmvp) indication in multi-layer codecs

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI647946B (zh) * 2016-06-30 2019-01-11 北京奇藝世紀科技有限公司 一種圖像編解碼方法及裝置
US10819994B2 (en) 2016-06-30 2020-10-27 Beijing Century Technology., Ltd Image encoding and decoding methods and devices thereof

Also Published As

Publication number Publication date
JP6515159B2 (ja) 2019-05-15
US20200107027A1 (en) 2020-04-02
IL245013B (en) 2020-04-30
US20170214923A1 (en) 2017-07-27
JP6212212B2 (ja) 2017-10-11
KR20160068936A (ko) 2016-06-15
US10547853B2 (en) 2020-01-28
CN105706451A (zh) 2016-06-22
EP3989585A1 (en) 2022-04-27
KR102143707B1 (ko) 2020-08-11
JP2018026833A (ja) 2018-02-15
US9648333B2 (en) 2017-05-09
MY178305A (en) 2020-10-07
KR20180069136A (ko) 2018-06-22
WO2015054634A2 (en) 2015-04-16
WO2015054634A3 (en) 2015-06-11
TW201921933A (zh) 2019-06-01
EP3056004A2 (en) 2016-08-17
KR101869882B1 (ko) 2018-06-25
CN109905703B (zh) 2023-11-17
IL245013A0 (en) 2016-05-31
CN109905703A (zh) 2019-06-18
TWI646825B (zh) 2019-01-01
TWI704801B (zh) 2020-09-11
US20150103886A1 (en) 2015-04-16
CN105706451B (zh) 2019-03-08
JP2017500764A (ja) 2017-01-05
JP2019146239A (ja) 2019-08-29

Similar Documents

Publication Publication Date Title
JP6515159B2 (ja) Hevc拡張のための高レベル構文
US10841615B2 (en) Systems and methods for model parameter optimization in three dimensional based color mapping
JP6574223B2 (ja) 複数レイヤビデオ符号化のためのコーデックアーキテクチャ
TWI616087B (zh) 可縮放高效率視訊編碼(hevc)參考圖集(rps)傳訊
US20190037225A1 (en) Parallel decoding method for layered video coding
US20150189322A1 (en) Sub-bitstream Extraction Process for HEVC Extensions
US20140010291A1 (en) Layer Dependency and Priority Signaling Design for Scalable Video Coding
US10616597B2 (en) Reference picture set mapping for standard scalable video coding
CN110572662A (zh) 用于多层视频编码的组合可分级性处理