TWI667911B - 視訊編碼裝置及方法及視訊解碼裝置 - Google Patents

視訊編碼裝置及方法及視訊解碼裝置 Download PDF

Info

Publication number
TWI667911B
TWI667911B TW103121067A TW103121067A TWI667911B TW I667911 B TWI667911 B TW I667911B TW 103121067 A TW103121067 A TW 103121067A TW 103121067 A TW103121067 A TW 103121067A TW I667911 B TWI667911 B TW I667911B
Authority
TW
Taiwan
Prior art keywords
layer
inter
video
layers
reference layers
Prior art date
Application number
TW103121067A
Other languages
English (en)
Other versions
TW201526612A (zh
Inventor
何永
葉言
何玉文
修小玉
Original Assignee
Vid衡器股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid衡器股份有限公司 filed Critical Vid衡器股份有限公司
Publication of TW201526612A publication Critical patent/TW201526612A/zh
Application granted granted Critical
Publication of TWI667911B publication Critical patent/TWI667911B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一種可提供視訊資料處理的視訊編碼裝置。該視訊編碼裝置可以接收多個視訊代表格式子集。該多個視訊代表格式子集可以對應於多個層。該多個視訊代表子集中的每一個可以包括一個或多個視訊代表參數值。視訊編碼裝置可以接收與當前層關聯的視訊代表格式子集索引(如,在跨層參數集中)。視訊編碼裝置可以通過使用視訊代表格式子集索引來確定與當前層關聯的多個視訊代表格式子集中的一個視訊代表格式子集。

Description

視訊編碼裝置及方法及視訊解碼裝置
相關申請的交叉引用
本申請要求2013年6月18日提交的美國臨時專利申請No.61/836,552、2013年6月19日提交的美國臨時專利申請No.61/837,116、2013年6月27日提交的美國臨時專利申請No.61/840,380和2013年7月30日提交的美國臨時專利申請No.61/860,221的權益,其內容通過引用合併於此。
數位視訊壓縮技術,例如,提高數位視訊通信效率、分佈和/或消耗的高效能視訊編碼(HEVC),正不斷的發展。與傳統數位視訊服務(例如,TV信號)相比,視訊應用可以被部署在異構環境中。這種異構性可存在於用戶端側以及網路側。可縮放的視訊編碼機制可被用於一次性地在高解析度編碼視訊訊號,但可以允許根據某些應用要求的和/或用戶端裝置支援的特定的速率和解析度對流子集進行解碼。
提供一種包括可縮放的視訊編碼技術的視訊壓縮技術以改進終端用戶體驗和/或服務品質。例如,可縮放的視訊編碼可通過一個或多個參數集由高級語法設計來實現。但是,被用信號發送的參數集和語法元素可能無效率地耗費可貴的通信頻寬和/或處理資源。
提供一種系統、方法和工具以實現視訊資料處理。視訊編碼裝置接收多個視訊代表(representation)格式子集。視訊編碼裝置可以接收多個視訊代表格式子集的計數。多個視訊代表格式子集對應於多個層。例如,多個視訊代表格式子集中的第一視訊代表格式子集對應於第一層,多個視訊代表格式子集中的第二視訊代表格式子集對應於第二層或多層。
多個視訊代表子集中的每一個可以包括一個或多個視訊代表參數值。參數值可以包括亮度樣本中圖像寬度的指示、亮度樣本中圖像高度的指示、一個或多個亮度陣列樣本的位元深度的指示、一個或多個色度陣列樣本的位元深度的指示、或者色度格式索引的指示中的至少一個。
視訊編碼裝置可以接收與當前層關聯的視訊代表格式子集索引。例如,視訊代表格式子集索引可以在跨層參數集和/或序列參數集SPS中被接收。
視訊編碼裝置可以通過使用視訊代表格式子集索引來確定與當前層關聯的多個視訊代表格式子集中的一個視訊代表格式子集。
視訊編碼裝置可以將活動參考層的數目和直接參考層的數量進行比較。基於活動參考層的數目和直接參考層的數目的比較,視訊編碼裝置可以確定是否在切片級標頭中包括活動參考層的指示。
視訊編碼裝置可包括用於層間預測的圖像的指示,例如,如果活動參考層的數目不等於直接參考層的數目。視訊編碼裝置可以忽略用於層間預測的圖像的指示,例如,如果活動參考層的數目等於直接參考層的數目。
視訊解碼裝置可以接收包含一個或多個層的位元串流。在接收到的位元串流中的活動參考層數目不等於直接參考層數目的條件下,視訊解碼裝置可以接收層間預測層語法元素。層間預測層語法元素指示參考圖像層ID清單,其可以被當前層的當前圖像用於層間預測。
視訊解碼裝置可以得到層間預測層語法元素,例如,如果活動參考層的數目等於直接參考層的數目。層間預測層語法元素可以根據當前層的直接參考層的層ID被推斷出。
以下結合多個附圖詳細描述示例性實施例。雖然該描述提供了可能的實施的具體實例,但應注意到這些細節只是示範性的並不限制本申請的範圍。
在視訊編碼系統中,在用戶端裝置側,N-屏場景(即具有變化的螢幕尺寸和/或顯示能力的裝置上消耗視訊內容,例如智慧型電話、平板電腦、PC、HDTV等等)預計將繼續。在通信網路側,視訊可以通過網際網路、WiFi網路、移動通信網路(例如,3G、4G等等)中的一個或多個,或者是其中的組合進行傳輸。
為了改進用戶體驗(例如,對於用戶端裝置的終端用戶)和/或視訊服務品質,可縮放的視訊編碼可以被執行。基於可縮放的視訊編碼,視訊訊號可以一次性地在高解析度下被編碼。這種視訊訊號可以從一個多個與視訊訊號關聯的視訊串流的一個或多個子集中被解碼,例如,根據特定應用需求的和/或用戶端支援的特定速率和/或解析度。解析度可以包括一個或多個視訊參數,例如空間解析度(例如,圖像尺寸)、時間解析度(例如,訊框速率)和視訊品質(例如,主觀品質,例如平均意見值MOS、和/或客觀品質,例如PSNR、SSIM、或VQM)。其他被使用的視訊參數還包括色度格式(例如,YUV420、YUV422、或 YUV444)、位元深度(例如,8位元或10位元視訊)、複雜度、視點、域(例如,色域)、和/或尺寸比(例如,16:9或4:3)。
視訊標準包括支援可縮放模式的工具和/或輪廓。例如,高效能視訊編碼被配置以支援可縮放的視訊編碼。HEVC的可縮放延長可以支援空間可縮放性(例如,可縮放位元串流可以包括在多於一個的空間解析度上的相應信號),品質可縮放性(例如,可縮放位元串流可以包括在多於一個品質水準上的相應信號),和標準可縮放性(例如,可縮放位元串流可以包括使用H.264/AVC編碼的基礎層和使用HEVC編碼的一個或多個增強層)中的一個或多個。可縮放視訊可以被延長到3D視訊,例如,多視點可縮放性被執行(例如,可縮放位元串流可以包括2D和3D視訊訊號)。應注意到的是,雖然可縮放HEVC設計的各個方面可以包括空間和/或品質可縮放性的使用,如同在此描述的,但是在此描述的技術可以應用到一個或多個的其他可縮放類型。
HEVC的可縮放延長(SHVC)可以根據基於參考索引的框架被執行。基於參考索引的框架可以在塊級別和/或低於塊級別上維持操作完整,以使單層編解碼器邏輯可以在採用該框架的可縮放編碼系統中被重用,基於參考索引的框架可以簡化可縮放編解碼器的設計。這種框架可以支持不同的可縮放性類型,例如,通過結合高級語法信令和/或層間處理模組,以實現編碼效率。例如,執行高級語法變換以支援層間處理和/或SHVC的多層信令。例如,可以根據基於參考索引的框架來執行這種語法變換。
可縮放視訊編碼可以支援一個或多個層(例如,多層)。每層都可以被設計成賦能一個或多個空間可縮放性、時間可縮放性、SNR可縮放性、或其他類型的可縮放性。可縮放位元串流可以包括混合可縮放層,並且為了能夠被解碼,一個或多個相應增強層可以依賴一個或多個較低層。層間過程可以產生層間參考圖像(ILR)樣本和/或運動場資訊,例如以增強一個或多個增強層的預測精確度。
多個參數集被指定給一個HEVC實現和/或一個或多個相應延長。例如,一個視訊參數集(VPS)可以包括一個或多個由多層共用的語法元素。VPS可以包括用於位元串流提取、能力交換和/或會話協商的資訊(例如,最大層數和/或設定檔,等級(tier)和級別資訊中的一個或多個)。
序列參數集(SPS)可以包括對一個或多個編碼視訊序列中的編碼切片(例如,所有編碼切片)來說共同的資訊,例如,跨越時間間隔的一系列視訊圖像。該資訊可以包括圖像解析度、位元深度、編碼塊尺寸等等中的一個或多個。
圖像參數集(PPS)可以包括圖像級別資訊,該資訊可以包括初始量化值,編碼工具賦能和/或去賦能標誌等等中的一個或多個。PPS中攜帶的資訊可以在相當長的持續時間內保持不變,例如,多個圖像的持續時間,以使該資訊不會被頻繁的更新。可以在切片級別上變換的資訊可以被包括在切片標頭中。
一個或多個參數集,例如VPS、SPS和/或PPS可以在帶外傳輸(例如,在一些應用場景中,使用可靠通道)。高級語法設計允許多層參考單個SPS(例如,相同SPS)。例如,這可以用於多視點和/或SNR可縮放性。對於空間可縮放性,例如由於不同的視訊解析度,一個或多個層(例如,每層)可以參考相應的不同SPS。如果SPS中的一個或多個參數(例如,大多數參數)在多層間是完全相同的,那麼通過刪除這種冗餘以節省位元速率是可取的。一個或多個這樣的參數可以由多層共用。
在節省位元速率的示例性方法中,可以執行SPS到SPS預測,該預測被用於從基礎層和/或其他依賴層的SPS參數預測一個或多個增強層SPS參數,例如可縮放性清單、參考圖像集(RPS)等等。該SPS到SPS的預測可以引入不同層之間參數集的依賴性。
在節省位元速率的另一示例中,可以執行VPS到SPS預測,該預測可以將一個或多個多層間共用的參數重新設置給VPS,並可以基於VPS中相應參數來預測一個或多個共用SPS參數(例如,每層的SPS參數)。
HEVC延長中SPS實現和/或VPS的設計準則包括如下中的一個或多個。VPS可以包括一個或多個有利於位元串流提取和/或能力交換的參數。VPS延長中可以包括與解碼圖像緩存(DPB)相關的參數。
參數集(例如,層間參數集IPS)可以被實現,其聚合通過在多層間共用的一個或多個高級語法元素。一個或多個層(例如,每層)可以參考一個或多個IPS參數,其節省相應負擔位元。
IPS可被用於在可縮放性HEVC視訊編碼系統中,例如,由於IPS可以不在基礎層中被攜帶,IPS的大小不會對基礎層子資料流產生影響。IPS,例如,通過促進多層間的一個或多個共用參數的預測,來提供高級信令效率。IPS的實現可以在視訊編碼系統中去除解析依賴,例如,由於被典型地放置在不同參數集中的一個或多個參數可能被包含在同一IPS中,因而,對每個參數的解析可以不依賴於其他不同參數集的解析結果。
IPS可以適用於可縮放性編碼系統中的一個或多個增強層,以至於IPS NAL單元的nuh_layer_id值對於合格的位元串流可以不為0。例如,合格位元串流的一個或多個IPS NAL單元(例如所有IPS NAL單元)的nuh_layer_id值可以等於1。
第1A圖至第1C圖是示出IPS示例的語法表。如第1A圖至第1C圖中示出的,IPS可以包括可以在VPS中攜帶的 一個或多個參數並且可以為多層編碼之目的而被設計。參數可以包括,例如,max_sublayer_for_ilp_plus1 和 direct_dependency_type。這種IPS的實現可以減小VPS的尺寸。 由於一個或多個層可以共用相同的或非常相似的RPS,IPS可以包括與一個或多個層相關的RPS。
用於一個或多個相似目的並呈現於SPS中的一個或多個參數可以被分成相應的子集,子集包括視訊格式子集、編碼參數子集、縮放清單子集、縮放偏移子集、或VUI子集中的一個或多個。在IPS中,一個或多個子集(例如,每個子集)可以具有相應的多個參數值。這樣可以允許增強層通過在IPS和子集中進行索引來參考多個參數值。例如,第一視訊格式集(如,格式0)可以指定720p格式,且第二視訊格式集(如,格式1)可以指定1080p格式。對於具有四層(如,層0為720p層,層1、層2和層3為1080p層)的混合空間和/或SNR縮放性編碼系統,基礎層(如,層0)SPS可以參考ips_video_format_subset(0),而增強層(如,層1、2和3)可以參考ips_video_format_subset(1)。在這種示例中,數量被減少的(例如最小的)語法元素可以被用信號發送以覆蓋多層使用的參數。
下列內容用於如第1A圖至第1C圖所示的示例IPS語法表的條目。語法元素ips_inter_layer_view_parameter_set_id可以標識其他語法元素參考的IPS。語法元素num_video_format_subsets可以指定視訊格式語法結構(ips_video_format_subset)的數量。語法元素num_coding_param_subsets可以指定編碼參數語法結構(ips_coding_param_subset)的數量。語法元素num_pcm_param_subsets可以指定PCM編碼參數語法結構(ips_pcm_param_subset)的數量。語法元素num_scaling_list_subsets可以指定可縮放清單結構(ips_scaling_list_subset)的數量。語法元素num_scaled_ref_layer_offset_subset可以指定可縮放參考層偏移結構(ips_scaled_ref_layer_offset_subset)的數量。語法元素num_vui_param_subsets可以指定VUI參數結構(ips_vui_param_subset)。
一個或多個視訊代表格式可以被分成為子集。一個或多個子集可以在參數集(如,IPS)中被用信號發送。子集可以被一個或多個層參考。例如,第一層可以參考第一子集。一個或多個層可以參考第二子集。每層可以參考子集的索引來獲取視訊代表語法值。一個或多個子集,例如,在IPS中,可以被執行以進一步節省位元信令IPS語法元素(如,負擔位元)。例如,侷限於給定子集的第一組參數值的參數值的絕對值可被用信號發送。對於參數值的一個或多個後續集,當前參數值集與先前參數值集之間相應的差值可被用信號發送。為了進行說明,ips_video_format_subset(0)可以指示720p格式(pic_width_in_luma_samples被設置成1280,且pic_height_in_luma_samples被設置成720),且ips_video_format_set(1)可以指示1080p格式(pic_width_in_luma_samples被設置成1920,且pic_height_in_luma_samples被設置成1080)。ips_video_format_set(0)與 ips_video_format_set(1)之間的差值被用信號發送,而不是通知1920和1080。按照該示例,針對寬度和高度的640和360之間的差值,分別地,在ips_video_format_set(1)中被用信號發送。
該IPS相應的語法表可以與第1A圖至第1C圖示出的相同,而描述符類型可以變成ue(v)或se(v),例如,對於可以作為差值用信號發送的參數,相關參數值可以通過如下方式獲得。
例如,如果S(i) 是給定子集中的第i組參數,則變數P(i, X)是第i參數組S(i)中的參數X,和/或變數 ParamValueInIPS(i, X)是針對在IPS中P(i, X) 被用信號發送的值。第i參數子集中的參數X的變數 ParamValue(i, X),P(i, X),可以從第i-1參數子集,P(i-1, X)中的參數X中獲取,例如,通過如下方式。 if ( i == 0 ) ParamValue(i, X) = ParamValueInIPS(i, X) else ParamValue(i, X) = ParamValue(i-1, X) + ParamValueInIPS(i, X)
如同第2A圖至第2C圖和第3圖中所描述的,SPS和/或其延長可以分別被簡化。增強層SPS語法表可以,例如通過包括對IPS參數集索引的參考,而被簡化,而不是針對一個或多個增強層而在SPS中攜帶相似的語法元素。
一個或多個SPS語法元素(例如,所有語法元素)可以針對基礎層(nuh_layer_id = 0)保持完整,如同第2A圖至第2C圖中陰影條目所表示的。這種方式可以允許與單層HEVC規範的向後相容性。根據IPS實現而被添加到SPS中的示例性語法元素通過第2A圖至第2C圖和第3圖中的斜體文字表示出來。
如下內容應用於如第2A圖至第2C圖和第3圖所示的簡化的SPS和延長語法表中的條目。如第2A圖至第2C圖和第3圖所示,語法元素sps_inter_layer_view_parameter_set_id可以指定活動參數集(例如,IPS)中ips_inter_layer_view_parameter_set_id的值。參數集中用信號發送的語法元素ips_video_format_subsets_index可以將索引指定到包含在活動參數集中的視訊代表格式語法結構清單中。語法元素ips_video_format_subsets_index可以指定應用於參考該SPS的層的代表格式語法結構。ips_video_format_subsets_index的範圍可以從0到num_video_format_subsets_index(不含端點)。語法元素ips_coding_param_subsets_index可以將索引指定到包含在活動IPS中的編碼參數語法結構清單中。ips_coding_param_subsets_index的範圍可以從0到num_coding_param_subsets_index(不含端點)。ips_scaling_list_subsets_index可以將索引指定到包含在活動IPS中的可縮放清單語法結構清單中。ips_scaling_list_subsets_index的範圍可以從0到num_scaling_list_subsets_index(不含端點)。ips_pcm_param_subsets_index可以將索引指定到包含在活動IPS中的PCM參數語法結構清單中。ips_pcm_param_subsets_index的取值範圍可以從0到num_pcm_param_subsets_index(不含端點)。ips_vui_param_subsets_index可以將索引指定到包含在活動IPS中的VUI語法結構清單中,ips_vui_param_subsets_index的取值範圍可以從0到num_vui_param_subsets_index(不含端點)。ips_scaled_ref_layer_offset_subset_index可以將索引指定到包含在活動IPS中的視訊格式語法結構清單。ips_scaled_ref_layer_offset_subsets_index的取值範圍可以從0到num_scaled_ref_layer_offset_subsets_index(不含端點)。
這些示例性的語法結構索引允許增強層獲取多個參數值,例如,通過索引到IPS和特定子集。例如,為了獲取層(如,增強層EL)的pic_width_in_luma_samples,增強層EL可以通過IPS標識(sps_inter_layer_view_parameter_set_id),例如,呈現在給定EL的SPS中,定位(locate)到關聯活動IPS。使用EL SPS中的索引ips_video_format_subsets_index的值,EL可以定位到呈現在關聯活動IPS中的特定視訊格式子集,ips_video_format_subset(ips_video_format_subsets_index)。EL的pic_width_in_luma_samples值可以從呈現在ips_video_format_subset (ips_video_format_subsets_index)中的pic_width_in_luma_samples的相應參數值中被獲取,例如,直接根據此處所描述的第一示例性IPS信令方法。可替換地,pic_width_in_luma_samples值可以從ParamValue (ips_video_format_subsets_index, pic_width_in_luma_samples)中被獲取,例如,根據此處所描述的第二示例性IPS信令方法。該EL的pic_height_in_luma_samples值可以通過相似方式被獲取。第4圖示出了從IPS獲取參數的示例。一個或多個其他參數子集中的一個或多個其他參數的值可以通過相似方式被獲取。
IPS原始位元組序列有效載荷(RBSP)可以包括一個或多個被一個或多個SPS RBSP參考的參數。每個IPS RBSP最初被認為是非活動的,例如,在解碼過程操作啟動時。在示例性解碼過程操作期間,最多有一個IPS RBSP被認為是活動的。任何IPS RBSP的啟動會導致之前處於活動狀態的IPS RBSP去啟動。
當IPS RBSP並未已經處於活動狀態且通過SPS RBSP的啟動(如,其中sps_inter_layer_view_parameter_set_id等於ips_inter_layer_view_parameter_set_id值)而被參考時,IPS RBSP可以被啟動。被啟動的IPS RBSP被稱為活動IPS RBSB直到其被去啟動,例如,由於另一個IPS RBSP的啟動。具有特定ips_inter_layer_view_parameter_subset_id值的IPS RBSP可以在被啟動之前對解碼過程可用。
切片標頭可以包括從一個切片到另一個切片而變換的資訊以及圖像相關資訊,圖像相關資訊對於一些切片和/或圖像類型來說是相關的或者是小的。在視訊編碼標準中,如,可縮放延長的高效能視訊編碼(HEVC)(SHVC),被設計用於層間預測的語法元素可以包括樣本預測,且動作預測具有固有冗餘。切片標頭的位元代價可以通過消除特定冗餘度來減少,例如,通過一些調整信令邏輯。
表1VPS延長語法表示例。表2示出了用於視訊編碼標準,如SHVC的切片標頭語法示例。
如表1中說明的,max_one_active_ref_layer_flag可以在VPS延長中被用信號發送以指定,例如,是否來自一個層或多於一個層的一個或多個圖像可以被用於可縮放系統中的層間預測。該標誌可以施加限制以允許可縮放系統中來自一個層的層間參考圖像。當可縮放設定檔和/或級別被定義時,這種限制是可取的。基於max_one_active_ref_layer_flag的設定,切片標頭(如表2所示)中的語法元素num_inter_layer_ref_pics_minus1可能在或不在切片標頭中被用信號發送。當max_one_active_ref_layer_flag等於1時,num_inter_layer_ref_pic_minus1可以被推斷為0,因此而不被用信號發送,並且一個參考層的層ID可以在切片標頭中被用信號發送,否則(例如,當max_one_active_ref_layer_flag為0時),num_inter_layer_ref_pic_minus1可以被用信號發送。切片標頭中的num_inter_layer_ref_pic_minus1標誌之後跟著(num_inter_layer_ref_pics_minus1 + 1)個層的層ID。
max_one_active_ref_layer_flag可以被max_num_active_ref_layers_minus1標誌取代,max_num_active_ref_layers_minus1標誌的描述符類型可以為ue(v) (如表3所示)。語法元素可以指示在解碼過程中被使用以用於能力交換目的的最大參考層。適當的設定檔和/或級別約束被定義。語法元素可以比1位元標誌更加靈活。
當max_num_active_ref_layers_minus1等於0時,num_inter_layer_ref_pics_minus1不在切片標頭中被用信號發送(例如,被省略)。假使最多一個參考層被允許層間預測,VPS延長中的這種語法元素的位元代價與原始max_one_active_ref_layer_flag的位元代價相同(例如,1位元)。在這種情況下,視訊解碼裝置可以推斷層間預測層語法元素,表4示出了切片片段段頭示例。 表4
變數NumActiveRefLayerPics可基於max_num_active_ref_layers_minus1獲得。例如,該變數可通過如下方式獲得: 偽代碼1: if( nuh_layer_id == 0 || NumDirectRefLayers[nuh_layer_id] == 0 || !inter_layer_pred_enabled_flag ) NumActiveRefLayerPics = 0 else if( max_num_active_ref_layers_minus1 == 0 || NumDirectRefLayers[nuh_layer_id] == 1 ) NumActiveRefLayerPics = 1 else NumActiveRefLayerPics = num_inter_layer_ref_pics_minus1+1
如表4中說明的,例如當活動參考層的數量(如,NumActiveRefLayerPics)與直接參考層(如,NumDirectRefLayers[num_layer_id])的數量不同時,inter_layer_pred_layer_idc可被用信號發送。例如當活動參考層的數量(如,NumActiveRefLayerPics)與直接參考層(如,NumDirectRefLayers[num_layer_id])的數量相同時,inter_layer_pred_layer_idc不被呈現在位元串流中。例如,切片標頭中的inter_layer_pred_layer_idc是冗餘的。在這種情況下,圖像被用於層間預測的指示可被跳過。在這種情況下,inter_layer_pred_layer_idc可以從如偽代碼2中說明的方式被獲取或被推斷出。變數NumDirectRefLayers的值可以在標準中被提供,如SHVC。 偽代碼2: if (NumActiveRefLayerPics = NumDirectRefLayers[nuh_layer_id] ) { for( j = 0; j < nuh_layer_id; j++ ) { if( direct_dependency_flag[nuh_layer_id][j] ) { RefLayerId[nuh_layer_id][j] = layer_id_in_nuh[j] inter_layer_pred_layer_idc[j] = RefLayerId[nuh_layer_id][j] } } }
如果切片不是一個從屬切片,從錯誤恢復(resilience)角度考慮,切片標頭可以提供給圖像中的每個切片。由於一個圖像可以包括一個或多個切片並且切片標頭可以提供給每個切片,切片標頭的位元代價應當比其他參數集,如SPS(序列參數集),PPS(圖像參數集)等的位元代價受到更多的關注。與切片標頭相比,這些參數集不經常被提供。
在視訊編碼標準,如SHVC中,變數,例如NumActiveRefLayerPics、inter_layer_pred_layer_idc、collocated_ref_layer_idx對於編碼圖像的每個切片來說可以是相同的。因此,SPS 延長、 PPS、APS 或 IPS中的語法元素,例如,inter_layer_pred_enable_flag、num_inter_layer_ref_pics_minus1、inter_layer_pred_layer_idc、inter_layer_sample_pred_only_flag、alt_collocated_indicate_flag 和 collocated_ref_layer_idx(而不是切片標頭)可以被發送以使對於圖像中的每個切片來說相同語法不被重複。表5示出了在SPS延長中被用信號發送的語法元素。 表5
在將語法元素從切片標頭中重新設置到參數集中時,依賴於在其他參數集中用信號發送參數值的情況可以被改變以避免多個參數集之間的解析依賴。表5示出了當相關語法元素從切片標頭中重新設置到SPS延長時的SPS延長語法表示例。
在一些應用中,層間預測相關信令(如,inter_layer_pred_enabled_flag、inter_layer_sample_pred_only_flag等)在切片之間或圖像之間是變化的。對於這類應用,發送切片標頭中的語法元素會帶來不希望的信令負擔。SPS延長(或PPS,IPS)中可能會增加標誌,例如用於指示是否在切片段頭中呈現層間預測相關語法元素。表6示出了在SPS延長中用信號發送的語法元素示例。表7示出了相應的切片標頭示例。 表6
sample_prediction_present_slice_present_flag等於1表明層間樣本預測相關語法元素,如inter_layer_pred_enable_flag、num_inter_layer_ref_pics_minus1、inter_layer_pred_layer_idc、inter_layer_sample_pred_only_flag被呈現在切片標頭中。sample_prediction_present_slice_present_flag等於0表明相關樣本預測語法元素不被呈現在切片片段頭中。當不呈現時,語法元素的值可基於一個或多個變數推斷出。例如,偽代碼3提供了如何推斷語法元素值的示例。 偽代碼3: if ( sample_prediction_slice_present_flag == 0)) { inter_layer_pred_enabled_flag = NumSamplePredRefLayers[nuh_layer_id] ? 1 : 0 if (inter_layer_pred_enable_flag) { num_inter_layer_ref_pics_minus1 = NumSamplePredRefLayers[nuh_layer_id] – 1 for (i = 0; j = 0; i < nuh_layer_id; i++) if (SamplePredEnabledFlag[nuh_layer_id][i]) inter_layer_pred_layer_idc[j++] = layer_id_in_nuh[i] } }
變數NumSamplePredRefLayers、NumSamplePredLayers 和 SamplePredEnabledFlag在視訊編碼標準,如SHVC中被提供。當sample_prediction_slice_present_flag等於0時,樣本預測語法元素inter_layer_sample_pred_only可被推斷出等於0。motion_prediction_slice_present_flag等於1表明層間動作預測相關語法元素,如alt_collocated_indication_flag、collocated_ref_layer_idx等可以呈現在切片標頭中。motion_prediction_slice_present_flag等於0表明層間動作預測相關語法元素不呈現在增強層切片片段頭中。這些語法元素的值可基於一個或多個變數推斷出來。例如,偽代碼4提供了如何推斷語法元素值的示例。NumMotionPredRefLayers和/或MotionPredRefLayerId由視訊編碼標準,如SHVC提供。 偽代碼4: if ( motion_prediction_slice_present_flag == 0)) { alt_collocated_indication_flag = NumMotionPredRefLayers[nuh_layer_id] ? 1 : 0 if (alt_collocated_indication_flag) collocated_ref_layer_idx = MotionPredRefLayerId[nuh_layer_id][NumMotionPredRefLayers[nuh_layer_id]-1] }
如偽代碼4所示,如果至少一個動作預測參考層可用,則層間動作資訊(如,而不是時間運動資訊)可以用於時間運動向量預測。並置的參考層可被設置為最靠近當前增強層的運動預測參考層。其他運動預測參考層可被指定為並置參考層。例如,最低運動預測參考層MotionPredRefLayerId[nuh_layer_id][0],而不是最近參考層,可被用作TMVP的預設並置參考層。
語法元素inter_layer_sample_pred_only_flag等於1表明當解碼當前圖像時,使用EL中時間參考圖像的層間預測是不被允許的。參考圖像清單L0和L1不包括時間參考圖像。不論切片的網路提取層NAL的單元類型,inter_layer_sample_pred_only_flag可在每個切片中被用信號發送。增強層EL的暫態解碼器刷新IDR圖像可以是不使用時間參考圖像進行層間預測的圖像。inter_layer_sample_pred_only_flag可基於EL中的IDR NAL單元被確定。如表8中所示的條件(如,(nal_unit_type! = IDR_W_RADL && nal_unit_type != IDR_N_LP))可能被應用。
當inter_layer_sample_pred_only_flag等於1時,可用參考圖像可以是層間參考圖像。由於在SHVC中,來自層間參考圖像的運動向量可能等於0,因而時間運動向量預測(TMVP)可能被旁路並且切片標頭中與TMVP相關的每個語法元素可能被跳過。inter_layer_sample_pred_only_flag可能被利用以忽略運動預測信令。
WTRU可不使用inter_layer_sample_pred_only_flag來確定用於層間預測的參考圖像。例如,WTRU不接收inter_layer_sample_pred_only_flag,但WTRU可以確定用於層間預測的參考圖像。WTRU的層間預測的推斷,例如,不使用時間預測,可不依賴於inter_layer_sample_pred_only_flag。如果inter_layer_sample_pred_only_flag不在位元串流中被用信號發送(例如,與/或不被WTRU接收),WTRU可推斷時間參考圖像。例如,WTRU通過檢查RPS(例如,RPS中的標誌used_by_curr_pic_flag、used_by_curr_pic_s0_flag 和 used_by_curr_pic_s1_flag可以被設置為0)來檢測時間參考圖像未被用於當前切片。時間運動向量預測TMVP過程可被旁路,例如,如果時間參考圖像沒有被用於當前切片的編碼。例如,其他相關語法元素可被跳過(例如,可同樣被跳過)。
slice_temporal_mvp_enabled_flag可基於增強層(例如,nuh_layer_id > 0)的sps_temporal_mvp_enabled_flag (例如在SHVC中被提供的) 和/或inter_layer_sample_pred_only_flag來被用信號發送。表9示出了該種信令的示例。例如,變數InterRefEnabledInRPLFlag可根據如下方式獲得:如果NumSamplePredRefLayers[nuh_layer_id]和NumActiveRefLayerPics大於0,InterRefEnabledInRPLFlag可被設置等於!inter_layer_sample_pred_only_flag;否則,InterRefEnabledInRPLFlag可被設置等於1。
為了使slice_temporal_mvp_enabled_flag取決於inter_layer_sample_pred_only_flag,inter_layer_sample_pred_only_flag的信令和樣本預測語法結構(如表9中所示)可先於slice_temporal_mvp_enabled_flag被確定或被用信號發送。當slice_temporal_mvp_enabled_flag沒被用信號發送(例如,由於inter_layer_sample_pred_only_flag被設置等於1),slice_temporal_mvp_enabled_flag可被推斷等於0。
當slice_temporal_mvp_enabled_flag為0時,語法元素,例如alt_collocated_indication_flag、collocated_ref_layer_idx、collocated_from_l0_flag 和/或 collocated_ref_idx可被跳過(如表9中所示)。
信令順序(其中slice_temporal_mvp_enabled_flag可先於inter_layer_sample_pred_only_flag被用信號發送)可被保持。如表10中所示,條件(InterRefEnabledInRPLFlag)可應用於用信號發送TMVP參數。InterRefEnabledInRPLFlag的獲取可在視訊編碼標準,如SHVC中被指明。變數InterRefEnabledInRPLFlag可通過如下方式獲得:如果NumSamplePredRefLayers[nuh_layer_id]大於0並且NumActiveRefLayerPics大於0,InterRefEnabledInRPLFlag可被設置等於!inter_layer_sample_pred_only_flag;否則,InterRefEnabledInRPLFlag可被設置等於1。slice_temporal_mvp_enabled_flag的值可通過如下方式發生改變:如果InterRefEnabledInRPLFlag等於0,則slice_temporal_mvp_enabled_flag可被設置等於0。
時間亮度運動向量預測的推導過程可發生改變,且變數mvLXCol 和 availableFlagLXCol被獲得。例如,slice_temporal_mvp_enabled_flag 等於 0 或者 InterRefEnabledInRPLFlag 等於 0,mvLXCol之成分 (例如兩個) 可被設置等於 0, 並且 availableFlagLXCol 可被設置等於0。
視訊編碼裝置(如,基於SHVC編碼標準的)可在切片標頭中用信號發送一個或多個語法元素(例如,兩個語法元素),alt_collocated_indication_flag 和/或 collocated_ref_layer_idx以指示用於層間運動預測的參考層。原始時間運動向量預測(TMVP)可使用語法元素collocated_from_l0_flag和collocated_ref_idx來指示用於TMVP的參考圖像。相同的信令可應用到層間運動預測,以便多餘的語法元素alt_collocated_indication_flag和collocated_ref_layer_idx可不被用信號發送(如,可被忽略)。表11示出了示例通用切片片段頭語法。
alt_collocated_indication_flag 和 collocated_ref_layer_idx可由視訊編碼標準,如HEVC提供。用於TMVP的一些層間參考圖像可不被用於樣本預測。參考圖像清單中的層間參考圖像的索引可用於指示TMVP的層間並置參考圖像。參考圖像清單中的層間參考圖像的索引可不被用於層間樣本預測。施加對位元串流的限制,使得對應於層間參考圖像的參考索引不被任何增強層圖像的預測塊參考。 表11
用於用信號發送SNR可縮放性的系統和/或方法被提供。在這些系統和/或方法中,信令應在不同縮放性之間予以區分。例如,空間可縮放性可區別於SNR可縮放性,且反之亦然。在一個實施例中,指示符、標誌、或其他識別符或資訊可用來區分SNR縮放和空間可縮放性。此外,基於指示符,如SNR可縮放性指示符,該信令可指示是否調用或執行重採樣過程,(如,針對樣本)和/或運動預測。
如此處所描述的,已存在的國際視訊標準(如MPEG-2視訊、H.263、MPEG4視覺和H.264)每一個可包括或具有支援可縮放性模式的工具和/或設定檔。但是,縮放HEVC可能現在並不支持此可縮放性編碼(其由這些已存在標準支援)。因此,HEVC可被延長以支援該可縮放性編碼,該可縮放性編碼包括如下內容中的至少一項:空間可縮放性(即,可縮放位元串流可在多於一個空間解析度上用信號發送),品質可縮放性(即,可縮放位元串流包括處於多於一個品質級別上的信號)和標準可縮放性(即,可縮放位元串流包括使用H.264/AVC編碼的基礎層和一個或多個使用HEVC編碼的增強層)。在示例實施例中,被HEVC支援的品質可縮放性可以也包括SNR可縮放性。此外,由於現在3D視訊越來越受歡迎,可縮放性的附加延長(如,可縮放位元串流包括2D和/或3D視訊訊號)將被提供和/或使用(如,在MPEG中描述或定義的)。
用於HEVC可縮放和多視點延長的公共規範可包括用於HEVC可縮放性延長(SHVC)的基於參考索引的框架。在該框架下,SHVC的語法,語義和解碼過程被提供。基於參考索引的框架可以在塊級別和/或低於塊級別上維持一個或操作完整,以使存在的單層編解碼器邏輯可以在可縮放編碼系統中被重用。框架可以簡化可縮放性編解碼器的設計,並且可以進一步通過結合高級語法信令和層間處理模組而靈活的支援不同的可縮放性類型以實現編碼效率。多種新高級語法變化可被提供和/或支援層間處理和SHVC的多層信令。
為了用信號發送HEVC中的這種可縮放性,如在此處描述的系統和/或方法被提供。例如,空間可縮放性可區別於SNR可縮放性,反之亦然。在一個實施例中,指示符、標誌、或其他識別符或資訊可用來區分SNR可縮放性和空間可縮放性。此外,基於指示符,如SNR可縮放性指示符,該信令可指示是否調用或執行重採樣過程,(如,針對樣本)和/或運動預測。
可縮放視訊編碼可支援多個層,且每個層可支援空間可縮放性,時間可縮放性,SNR(信號雜訊比)可縮放性和/或任何其他類型的可縮放性。可縮放位元串流可以具有混合可縮放層,並且每個增強層可以依賴一個或多個將被解碼的較低層。層間過程可以產生層間參考圖像(ILR)樣本和/或運動場資訊,以增強或改進增強層編碼效率。
SNR縮放性信令被提供和/或使用。對於空間可縮放性,視訊可在不同解析度和不同層上被編碼。例如,基礎層視訊可具有720p解析度,增強層可具有1080p解析度。此外,對於SNR可縮放性,視訊解析度可在多層間相同,但不同的層可在不同的品質水準上被編碼。例如,基礎層以33dB被編碼,而增強層以36dB被編碼。在SHVC中,語法元素,如scalability_mask,可包含在參數集(如,視訊參數集(VPS))中以區分多視點可縮放性和空間/SNR可縮放性(如,表12中所示)。 表12 可縮放性ID到可縮放性維度的映射
但是,如今在SHVC中,scalability_mask語法可能無法區分空間可縮放性和SNR可縮放性。例如,空間可縮放性和SNR可縮放性可能是兩種不同的可縮放性,兩種不同的縮放性可能使用不同的編解碼器操作和記憶體分配。這些區別的示例如下所示。參考層運動場和參考層圖像樣本的重採樣過程可用於空間可縮放性但不能用於SNR可縮放性。此外,一些層間濾波器,如固定可替換重採樣濾波器(如,在核心實驗SCE3中評估的),可獲得在SNR可縮放性上的改進性能增益,但可能不能應用於空間可縮放性。應用可將單環路設計(如,該設計被SVC(H.264的可縮放延長)支持)用於SNR可縮放性而不是用於空間可縮放性。採樣網格(如,目前正經歷核心實驗SCE1)可解決與空間可縮放性,而不是SNR可縮放性,相關的特定問題。
如在此該,提供一種在高級語法中區分空間縮放和SNR可縮放性的系統、方法和工具,以使編碼器和解碼器操作可根據被支援的相關編碼工具而被配置和/或初始化。
例如,如今在SHVC中,SNR可縮放性可根據比例因數,如在重採樣過程(如2013年4月SHVC工作草案 JCTVC-M1008的G.8.1.4中描述的重採樣過程)中指定的ScaleFactorX被推斷出。當ScaleFactorX等於1,可縮放性為SNR可縮放性。可縮放性可在解析SPS和SPS延長後獲得。其他信令選擇可被提供以定址(address)重採樣過程和SNR可縮放性的信令,從而減少或避免(如,通過避免解析)多餘的編解碼器操作和記憶體分配和/或存取。
分別的可縮放性維度可被分配給空間和SNR可縮放性,例如,以區分空間和SNR可縮放性。表13示出了修改後的可縮放維度表的示例實施例,其中空間和SNR可縮放性具有不同的或分別的值。 表13 提案的可縮放性ID到可縮放性維度的映射
如表13所示,除了視點標識ViewId和 依賴性標識DependencyId,變數SnrId[layer_id_in_nuh[i]]被提供和/或被用作第i層的SNR識別符。根據示例實施例,SnrId通過如下方式獲得: for (i = 0; i <= vps_max_layers_minus1; i++) { for( smIdx= 0, j =0; smIdx< 16; smIdx ++ ) if( ( i != 0 ) && scalability_mask[smIdx] ) ScalabilityId[i][smIdx] = dimension_id[i][j++] else ScalabilityId[i][smIdx] = 0 ViewId[layer_id_in_nuh[i]] = ScalabilityId[i][0] DependencyId [layer_id_in_nuh[i]] = ScalabilityId[i][1] SnrId [layer_id_in_nuh[i]] = ScalabilityId[ i ][ 2 ] }
此外,例如,為了區分空間和SNR可縮放性,SNR可縮放性標誌被提供和/或被使用。例如,SNR可縮放性標誌可被添加到參數集延長(如,視訊參數集(VPS)延長)中以指示如表14中所示的SNR可縮放性。
根據示例實施例,如果或當SNR_scalability_flag等於1時,nuh_layer_id等於layer_id_in_nuh[i]的層和nuh_layer_id等於layer_id_in_nuh[j]的層之間的可縮放性可以指定或指示SNR可縮放性。如果或當SNR_scalability_flag等於0時,nuh_layer_id等於layer_id_in_nuh[i]的層和nuh_layer_id等於layer_id_in_nuh[j]的層之間的可縮放性不是SNR可縮放性(如,不能指定或指示SNR可縮放性)。此外,如果或當SNR_scalability_flag未被提供時,它被推斷等於0。
如在此描述的,解碼可例如作為重採樣過程的一部分而被執行。與示例性重採樣過程相關的解碼過程可通過如下方式執行。如果PicWidthInSamplesL等於RefLayerPicWidthInSamplesL,PicHeightInSamplesL等於RefLayerPicHeightInSamplesL,並且ScaledRefLayerLeftOffset、ScaledRefLayerTopOffset、ScaledRefLayerRightOffset和/或ScaledRefLayerBottomOffset的值中的每一個等於0,rsPicSample可被設置為rlPicSample並且rsPicMotion可被設置成等於rlPicMotion,例如,當alt_collocated_indication_flag等於1。rsPic可通過如下方式得到。圖像樣本重採樣過程(如,在2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.1的子條款中指定的)可被調用,並以rlPicSample樣本值作為輸入,rsPicSample的被重採樣樣本值作為輸出。當alt_collocated_indication_flag等於1,圖像運動場重採樣過程(如,2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.2的子條款中指定的)可被調用,並以rlPicMotion作為輸入,rsPicMotion的被重採樣運動場作為輸出。
使用此處描述的SNR_scalability_flag,示例性的重採樣過程可通過如下方式被提供。例如,如果SNR_scalability_flag被設置成等於1,rsPicSample 可被設置成等於rlPicSample。此外,當alt_collocated_indication_flag等於1且如果SNR_scalability_flag被設置成等於1,rsPicMotion可被設置成rlPicMotion。rsPic可通過如下方式獲得。圖像樣本重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.1的子條款中指定的)可被調用,並以rlPicSample樣本值作為輸入,rsPicSample的被重採樣樣本值作為輸出。當alt_collocated_indication_flag等於1,圖像運動場重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.2的子條款中指定的)可被調用,並以rlPicMotion作為輸入,rsPicMotion的被重採樣運動場作為輸出。
在示例性實施例中,一個或多個例外可被提供和/或呈現。一個該種例外可包括或可能是混合標準可縮放性,其中,基礎層(BL)是AVC編碼的。視訊編碼尺寸在HEVC EL 和 AVC BL之間是不同的。例如,當AVC基礎層(BL)和HEVC增強層(EL)同樣對1920x1080視訊進行編碼時,解碼BL參考圖像尺寸可為1920x1088,同時增強編碼圖像尺寸可為1920x1080(如,這是由於AVC和HEVC標準應用不同的填充過程)。雖然亮度和/或色度樣本的重採樣不是必須的,但解碼後的參考圖像(1920x1088)可不被直接用於預測EL 圖像(1920x1080),且相應的裁剪區域可被拷貝到ILR圖像。
如在此描述的,多種方法可被用於解決該種例外。例如,在一種方法中,當BL和EL視訊編碼尺寸相同而無需考慮一個或多個縮放偏移值時,SNR_scalability_flag可被限制成1。這種限制可在位元串流一致性限定中被提供和/或施加以保證編碼器可適當地設置SNR_scalability_flag的值。在這種情況下,針對上述1920x1080 混合標準可縮放性,SNR_scalability_flag可被設置成0並且層間參考圖像可根據重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.21的子條款中指定的)而從1920x1088 AVC基礎層圖像獲得。
在一個方法中,當比例因數,ScaleFactorX(如G.8.1.4中指定的)等於1時,SNR_scalability_flag可被設置為1。在該方法中,重採樣過程可被進一步修改以覆蓋如下特殊情況。除rlPic和 rsPic(如,在SHVC WD G.8.1.4定義的)之外,另一個被裁減參考層圖像rcPic可被添加到重採樣過程。變數CroppedRefLayerPicWidthInSamplesLCroppedRefLayerPicWidthinSamplesL 可各自被設置成在亮度樣本單位下等於rcPic的寬度和高度。變數rcPicSample可進一步被定義成指定亮度和色度成分的rcPic的樣本值的一組樣本陣列。此外,rcPicMotion可被定義成指定rcPic壓縮運動場的一組變數陣列。
變數RefLayerPicWidthInSamplesLRefLayerPicHeightInSamplesL 可各自被設置成在亮度樣本單位下等於被解碼的參考層圖像rcPic的寬度和高度。亮度樣本位置[xP][yP]可指定rlPic的左上樣本。此外,變數rc左側開始rcLeftStart,rc右側結束rcRightEnd,rc上部開始rcTopStart 和 rc下部結束rcBottomEnd可通過如下方式獲得: rcLeftStart = xP +可縮放參考層左側偏移ScaledRefLayerLeftOffset rcRightEnd = xP + (RefLayerPicWidthInSamplesL – 1) +可縮放參考層右側偏移ScaledRefLayerRightOffset rcTopStart = yP +可縮放參考層上部偏移ScaledRefLayerTopOffset rcBottomEnd =yP + (RefLayerPicHeightInSamplesL – 1) +可縮放參考層下部偏移ScaledRefLayerBottomOffset
rcPic可通過裁剪rlPic的左上位置(rcLeftStart, rcTopStart)和右下位置(rcRightEnd, rcBottomEnd)獲得。第5圖示出了裁剪的示例。如第5圖所示,當縮放偏移不等於0時,rcPic可從rlPic獲得。
重採樣過程可按如下方式提供。如果SNR_scalability_flag被設置成1,rsPicSample可被設置成等於rcPicSample,並且當alt_collocated_indication_flag等於1時,rsPicMotion可被設置成等於rcPicMotion。rsPic可通過如下方式獲得。圖像樣本重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.1的子條款中指定的)可被調用,並以rlPicSample樣本值作為輸入,rsPicSample的被重採樣樣本值作為輸出。圖像運動場重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.2的子條款中指定的)可被調用,並以rlPicMotion作為輸入,rsPicMotion的被重採樣運動場作為輸出,如當alt_collocated_indication_flag等於1時。
空間和SNR可縮放性可被區分以,例如,避免沒必要的重採樣操作和/或記憶體分配。額外或追加的語法元素可在參數集延長(如表15中所示視訊參數集(VPS)延長)中被用信號發送以指示重採樣過程是否被旁路。
resampling_buffer_enable_flag[i][j]可等於0以指示或指定第i層和第j層之間的重採樣過程可被旁路並且無重採樣緩衝器被分配。resampling_buffer_enable_flag等於1指示或指定用於圖像樣本或運動值的重採樣過程的相關緩衝器被調用。當resampling_buffer_enable_flag沒有呈現,則預設值為0。重採樣過程將按如下方式修改。如果resampling_buffer_enable_flag被設置成0,rsPicSample可被設置等於rlPicSample,並且當alt_collocated_indication_flag等於1,rsPicMotion 可被設置成等於 rlPicMotion。rsPic可按如下方式獲得。圖像樣本重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.1的子條款中指定的)可被調用,並以rlPicSample樣本值作為輸入,以rsPicSample的被重採樣樣本值作為輸出。此外,當alt_collocated_indication_flag等於1,圖像運動場重採樣過程(如2013年4月SHVC工作草案JCTVC-M1008 G.8.1.4.2的子條款中指定的)可被調用,並以rlPicMotion作為輸入,以rsPicMotion的被重採樣運動場作為輸出。
resampling_buffer_enable_flag可不與direct_dependency_type語法元素結合。resampling_buffer_enable_flag可被如表17所示被用信號發送(如,單獨用信號發送)。resampling_buffer_enable_flag可提供靈活性以使被重採樣參考圖像和運動可被用於不同於樣本預測和/或運動預測的其他目的。例如,被重採樣的運動可被用於產生混合層間參考圖像。
resampling_buffer_enable_flag可不與direct_dependency_type語法元素結合。resampling_buffer_enable_flag可被作為SNR_scalability_flag被用信號發送(如,單獨用信號發送),而resampling_buffer_enable_flag可被放置在SPS或SPS延長或其他任何合適的參數集中。表17示出了SPS延長中的信令SNR_scalability_flag的示例實施例。如表17中示出的語法元素num_SNR_scalability_flags可指示被用信號發送標誌的數量。num_SNR_scalability_flags的值可等於當前增強層的參考層的數量。num_scaled_ref_layer_offsets可等於當前增強層的參考層的數量。如表19所示,語法元素num_SNR_scalability_flags 和 num_scaled_ref_layer_offsets可合併成一個語法元素並作為一個語法元素而被用信號發送,如,num_ref_layers。
鑒於在此描述的SNR可縮放性信令,編解碼器操作可用信號發送一個或多個語法元素以節省被用信號發送位元的數量,從而提高效率。例如,如在此描述的SNR_scalability_flag(如,可被添加到之前該的VPS延長中)可用於不同的應用場景中。
例如,SNR_scalability_flag可被提供給採樣網格轉移信令和/或被採樣網格移位信令使用。採樣網格移位元資訊可使用多種技術和/或方法被採樣(如,2013年4月JCTVC-M0465提出的“Signaling of phase offset in up-sampling process and chroma sampling location”)。例如,採樣網格資訊可通過相位偏移呈現標誌和亮度和或色度相位偏移參數在SPS延長中被用信號發送。由於採樣相位移位可用於空間可縮放性,提出的SNR_scalability_flag可用作避免不必要的在用於SNR可縮放性的位元串流中呈現之語法元素的條件。表18示出了使用SNR_scalability_flag信令作為確定是否用信號發送額外採樣網格參數的條件的示例語法表。 表18 提出的SPS延長中的採樣網格資訊
可縮放參考層偏移被提供或被使用。例如,在SPS延長中被用信號發送的可縮放參考層偏移語法元素可被用於對齊基礎層和增強層。在SNR可縮放性中,可縮放偏移可為0並且因此,通過這些偏移的信令依賴於SNR_scalability_flag,額外的位元可通過跳過SNR可縮放層的縮放偏移信令而被節省下來。表19示出了該種信令的示例。 表19 序列參數集延長語法
num_ ref_layer的語義可能無法精確的匹配於VPS中用信號發送的依賴層(如,參考層)的數量,在VPS中,num_ ref_layers指定呈現在SPS中的可縮放參考層偏移參數集的數量。在實施例中,num_ ref_layers的值可處於0到63(含端點)的範圍內。語義可按如下方式修改,num_ ref_layers可指定或指示呈現在SPS中的可縮放參考層偏移參數集的數量。num_ ref_layers的值可等於NumDirectRefLayers[nuh_layer_id](如,作為位元串流一致性限定的一部分以及在2013年4月SHVC工作草案 JCTVC-M1008的F.7.4.3.1.1中指定的)。
層間過濾信令可被提供和/或使用。例如,開關整數位置濾波器(如,2013年4月JCTVC-M0273中描述的濾波器,在整數位置上非SCE4可開關 濾波器,其可在層間過濾上的核心實驗(SCE3)中提供)可實現對於SNR可縮放性而不是空間可縮放性的性能增益。因此,多種過濾開關方法可被提供和/或使用。例如,過濾開關可在切片標頭中被用信號發送,並且,在其他實施例中,ILR和過濾ILR可被插入到用於層間預測的參考圖像清單(RPL)。例如,當SNR_scalability_flag被設置成0,如由於該濾波器無法改進空間可縮放性場景的性能時,切片標頭中的一位元語法元素可被旁路。在另一個示例中,當SNR_scalability _flag被設置成0,如由於過濾ILR圖像不被添加到參考圖像集和參考圖像清單,活動層間參考圖像的數量可被減小。用信號發送SNR可縮放性指示符可針對空間可縮放性情況提前節省DPB記憶體尺寸和簡化參考圖像清單構建過程。SNR_scalability_flag可在重採樣過程中被參考以針對空間可縮放性(SNR_scalability_flag被設置成0)旁路可開關整數位置濾波器(如,2013年4月JCTVC-M0273中描述的濾波器,在整數位置上非SCE4可開關濾波器),以便減少編解碼器操作複雜性和記憶體分配。
多個標誌可在參數集(如,視訊參數集)中被用信號發送。每個標誌可指示與可縮放位元串流的層(例如基礎層和依賴增強層)相關的重採樣過程是否需要執行。在標誌指示不需要重採樣過程的情況下,重採樣緩衝器的分配可被旁路。在標誌指示需要重採樣過程的情況下,一個或多個重採樣緩衝器可被分配並且與一個參考圖像樣本相關的參考圖像樣本或運動中的一個或多個的重採樣將被排程。
在此描述的信令可被用於,例如,任何網路或在此描述的合適的網路元素中。例如,在此描述的信令可根據與例如第6A圖至第6E圖所示出的示例無線通信系統100的無線通信系統和/或其元件關聯的裝置(如,視訊串流裝置)執行的可縮放視訊編碼而被執行。
第6A圖描述了在其中可以實施和/或使用一個或更多個實施方式的示例通信系統100的系統圖。通信系統100可以是向多個用戶提供內容,例如語音、資料、視訊、消息發送、廣播等的多重存取系統。通信系統100可以使多個無線用戶通過系統資源分享(包括無線頻寬)存取這些內容。例如,通信系統100可以使用一種或多種通道存取方法,例如分碼多重存取(CDMA)、分時多重存取(TDMA)、分頻多重存取(FDMA)、正交FDMA(OFDMA)、單載波FMDA(SC-FDMA)等。
如第6A圖所示,通信系統100可以包括無線發射/接收單元(WTRU)102a、102b、102c、和/或102d(其通常或整體上被稱為WTRU 102),無線電存取網路(RAN)103、104、105、核心網路106、106b、106c、公共交換電話網路(PSTN)108、網際網路110和其他網路112。不過應該理解的是,揭露的實施方式考慮到了任何數量的WTRU、基地台、網路和/或網路元件。WTRU 102a、102b、102c、和/或102d的每一個可以是配置為在無線環境中進行操作和/或通信的任何類型的裝置。作為示例,可以將WTRU 102a、102b、102c、和/或102d配置為發送和/或接收無線信號,並可以包括用戶設備(UE)、基地台、固定或者移動用戶單元、傳呼器、行動電話、個人數位助理(PDA)、智慧型電話、筆記型電腦、上網本、個人電腦、無線感測器、消費電子產品等等。
通信系統100還可以包括基地台114a和基地台114b。基地台114a、114b的每一個都可以是配置為與WTRU 102a、102b、102c、和/或102d中的至少一個無線介面以便於存取一個或者更多個通信網路,例如核心網路106、106b、106c、網際網路110和/或網路112的任何裝置類型。作為示例,基地台114a、和/或114b可以是基地台收發台(BTS)、節點B、演進的節點B(e節點B)、家庭節點B、家庭eNB、網站控制器、存取點(AP)、無線路由器等等。雖然基地台114a、114b的每一個被描述為單獨的元件,但是應該理解的是,基地台114a、114b可以包括任何數量互連的基地台和/或網路元件。
基地台114a可以是RAN 103、104、105的一部分,該RAN 103、104、105還可以包括其他基地台和/或網路元件(未顯示),例如基地台控制器(BSC)、無線電網路控制器(RNC)、中繼節點等。可以將基地台114a和/或基地台114b配置為在特定地理區域之內發送和/或接收無線信號,該區域可以被稱為胞元(未顯示)。胞元還可以被劃分為胞元扇區。例如,與基地台114a關聯的胞元可以劃分為三個扇區。因此,在一種實施方式中,基地台114a可以包括三個收發器,即每一個用於胞元的一個扇區。在另一種實施方式中,基地台114a可以使用多輸入多輸出(MIMO)技術,因此可以將多個收發器用於胞元的每一個扇區。
基地台114a和/或114b可以通過空中介面115、116、117與WTRU 102a、102b、102c、和/或102d中的一個或者更多個通信,該空中介面115、116、117可以是任何合適的無線通信鏈路(例如,射頻(RF)、微波、紅外(IR)、紫外線(UV)、可見光等)。可以使用任何合適的無線電存取技術(RAT)來建立空中介面115、116、117。
更具體地,如上所述,通信系統100可以是多重存取系統,並可以使用一種或者多種通道存取方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 103、104、105中的基地台114a和WTRU 102a、102b、和/或102c可以使用例如通用移動電信系統(UMTS)陸地無線電存取(UTRA)的無線電技術,其可以使用寬頻CDMA(WCDMA)來建立空中介面115、116、117。WCDMA可以包括例如高速封包存取(HSPA)和/或演進的HSPA(HSPA+)的通信協定。HSPA可以包括高速下行鏈路封包存取(HSDPA)和/或高速上行鏈路封包存取(HSUPA)。
在另一種實施方式中,基地台114a和WTRU 102a、102b、和/或102c可以使用例如演進的UMTS陸地無線電存取(E-UTRA)的無線電技術,其可以使用長期演進(LTE)和/或高級LTE(LTE-A)來建立空中介面115、116、117。
在其他實施方式中,基地台114a和WTRU 102a、102b、102c可以使用例如IEEE802.16(即,全球互通微波存取(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫行標準 2000(IS-2000)、暫行標準95(IS-95)、暫行標準856(IS-856)、全球移動通信系統(GSM)、GSM演進的增強型資料速率(EDGE)、GSM EDGE(GERAN)等等的無線電技術。
第6A圖中的基地台114b可以是無線路由器、家庭節點B、家庭e節點B或者存取點,例如,並且可以使用任何適當的RAT以方便局部區域中的無線連接,例如商業場所、住宅、車輛、校園等等。在一種實施方式中,基地台114b和WTRU 102c、102d可以實施例如IEEE 802.11的無線電技術來建立無線區域網路(WLAN)。在另一種實施方式中,基地台114b和WTRU 102c、102d可以使用例如IEEE 802.15的無線電技術來建立無線個人區域網路(WPAN)。在另一種實施方式中,基地台114b和WTRU 102c、102d可以使用基於蜂巢的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A等)來建立微微胞元或毫微微胞元。如第6A圖所示,基地台114b可以具有到網際網路110的直接連接。因此,基地台114b可以不需要經由核心網路106、106b、106c而存取到網際網路110。
RAN 103、104、105可以與核心網路106、106b、106c通信,該核心網路106、106b、106c可以是被配置為向WTRU 102a、102b、102c、和/或102d中的一個或更多個提供語音、資料、應用和/或基於網際網路協定語音(VoIP)服務等的任何類型的網路。例如,核心網路106、106b、106c可以提供呼叫控制、計費服務、基於移動位置的服務、預付費呼叫、網際網路連接、視訊分配等和/或執行高級安全功能,例如用戶認證。雖然第6A圖中未示出,應該理解的是,RAN 103、104、105和/或核心網路106、106b、106c可以與使用和RAN 103、104、105相同的RAT或不同RAT的其他RAN進行直接或間接的通信。例如,除了連接到正在使用E-UTRA無線電技術的RAN 103、104、105之外,核心網路106、106b、106c還可以與使用GSM無線電技術的另一個RAN(未示出)通信。
核心網路106、106b、106c還可以充當WTRU 102a、102b、102c、和/或102d存取到PSTN 108、網際網路110和/或其他網路112的閘道。PSTN 108可以包括提供普通老式電話服務(POTS)的電路交換電話網路。網際網路110可以包括使用公共通信協定的互聯電腦網路和裝置的全球系統,該協定例如有TCP/IP網際網路協定組中的傳輸控制協定(TCP)、用戶資料報協定(UDP)和網際網路協定(IP)。網路112可以包括被其他服務提供者擁有和/或營運的有線或無線的通信網路。例如,網路112可以包括連接到一個或更多個RAN的另一個核心網路,該RAN可以使用和RAN 103、104、105相同的RAT或不同的RAT。
通信系統100中的WTRU 102a、102b、102c、和/或102d的某些或全部可以包括多模式能力,即WTRU 102a、102b、102c、和/或102d可以包括用於在不同無線鏈路上與不同無線網路進行通信的多個收發器。例如,第6A圖中示出的WTRU 102c可被配置為與基地台114a通信,該基地台114a可以使用基於蜂巢的無線電技術,以及與基地台114b通信,該基地台114b可以使用IEEE 802無線電技術。
第6B圖描述了WTRU 102示例的系統圖。如第6B圖所示,WTRU 102可以包括處理器118、收發器120、發射/接收元件122、揚聲器/麥克風124、數字鍵盤126、顯示器/觸控板128、不可移除記憶體130、可移除記憶體132、電源134、全球定位系統(GPS)晶片組136和其他週邊設備138。應該理解的是,WTRU 102可以在保持與實施方式一致時,包括前述元件的任何子組合。而且,實施方式考慮了基地台114a和114b和/或基地台114a和114b可以表示的節點(諸如但不侷限於收發台(BTS)、節點B、網站控制器、存取點(AP)、家庭節點B、演進型家庭節點B(e節點B)、家庭演進型節點B(HeNB)、家庭演進型節點B閘道和代理節點等)可以包括第6B圖所描繪和這裡描述的一些或所有元件。
處理器118可以是通用處理器、專用處理器、常規處理器、數位訊號處理器(DSP)、多個微處理器、與DSP核相關聯的一個或更多個微處理器、控制器、微控制器、專用積體電路(ASIC)、場可程式設計閘陣列(FPGA)電路、任何其他類型的積體電路(IC)、狀態機等等。處理器118可執行信號編碼、資料處理、功率控制、輸入/輸出處理和/或使WTRU 102運行於無線環境中的任何其他功能。處理器118可以耦合到收發器120,該收發器120可耦合到發射/接收元件122。雖然第6B圖描述了處理器118和收發器120是單獨的部件,但是可以理解的是,處理器118和收發器120可以一起整合在電子封裝或晶片中。
發射/接收元件122可以被配置為通過空中介面115、116、117將信號發送到基地台(例如,基地台114a),或從基地台(例如,基地台114a)接收信號。例如,在一種實施方式中,發射/接收元件122可以是被配置為發送和/或接收RF信號的天線。在另一種實施方式中,發射/接收元件122可以是被配置為發送和/或接收例如IR、UV或可見光信號的發射器/檢測器。在另一種實施方式中,發射/接收元件122可以被配置為發送和接收RF和光信號兩者。應當理解,發射/接收元件122可以被配置為發送和/或接收無線信號的任何組合。
另外,雖然發射/接收元件122在第6B圖中描述為單獨的元件,但是WTRU 102可以包括任意數量的發射/接收元件122。更具體的,WTRU 102可以使用例如MIMO技術。因此,在一種實施方式中,WTRU 102可以包括用於通過空中介面115、116、117發送和接收無線信號的兩個或更多個發射/接收元件122(例如,多個天線)。
收發器120可以被配置為調變要由發射/接收元件122發送的信號和/或解調由發射/接收元件122接收的信號。如上面提到的,WTRU 102可以具有多模式能力。因此收發器120可以包括使WTRU 102經由多個例如UTRA和IEEE 802.11的RAT通信的多個收發器。
WTRU 102的處理器118可以耦合到下述設備,並且可以從下述設備中接收用戶輸入資料:揚聲器/麥克風124、數字鍵盤126和/或顯示器/觸控板128(例如,液晶顯示器(LCD)顯示單元或有機發光二極體(OLED)顯示單元)。處理器118還可以輸出用戶資料到揚聲器/麥克風124、數字鍵盤126和/或顯示器/觸控板128。另外,處理器118可以從任何類型的適當的記憶體存取資訊,並且可以儲存資料到任何類型的適當的記憶體中,例如不可移除記憶體130和/或可移除記憶體132。不可移除記憶體130可以包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、硬碟或任何其他類型的記憶體裝置。可移除記憶體132可以包括用戶身份模組(SIM)卡、記憶棒、安全數位(SD)儲存卡等等。在其他實施方式中,處理器118可以從在實體位置上沒有位於WTRU 102上,例如位於伺服器或家用電腦(未示出)上的記憶體存取資訊,並且可以將資料儲存在該記憶體中。
處理器118可以從電源134接收電能,並且可以被配置為分配和/或控制到WTRU 102中的其他部件的電能。電源134可以是給WTRU 102供電的任何適當的裝置。例如,電源134可以包括一個或更多個乾電池(例如,鎳鎘(NiCd)、鎳鋅(NiZn)、鎳氫(NiMH)、鋰離子(Li-ion)等等),太陽能電池,燃料電池等等。
處理器118還可以耦合到GPS晶片組136,該GPS晶片組136可以被配置為提供關於WTRU 102當前位置的位置資訊(例如,經度和緯度)。WTRU 102可以通過空中介面115、116、117從基地台(例如,基地台114a、114b)接收加上或取代GPS晶片組136資訊之位置資訊和/或基於從兩個或更多個鄰近基地台接收的信號的定時來確定其位置。應當理解,WTRU 102在保持實施方式的一致性時,可以通過任何適當的位置確定方法獲得位置資訊。
處理器118可以耦合到其他週邊設備138,該週邊設備138可以包括一個或更多個提供附加特性、功能和/或有線或無線連接的軟體和/或硬體模組。例如,週邊設備138可以包括加速計、電子羅盤、衛星收發器、數位相機(用於照片或視訊)、通用序列匯流排(USB)埠、振動裝置、電視收發器、免持耳機、藍芽(Bluetooth®)模組、調頻(FM)無線電單元、數位音樂播放機、媒體播放機、視訊遊戲機模組、網際網路瀏覽器等等。
第6C圖描述了根據實施方式的RAN 103和核心網路106的系統圖。如上面提到的,RAN 103可使用UTRA無線電技術通過空中介面115與WTRU 102a、102b和/或102c通信。RAN 103還可以與核心網路106通信。如第6C圖所示,RAN 103可以包括節點B 140a、140b、140c,節點B 140a、140b、140c的每一個包括一個或更多個用於通過空中介面115與WTRU 102a、102b、和/或102c通信的收發器。節點B 140a、140b、和/或140c的每一個可以與RAN 103內的特定胞元(未顯示)關聯。RAN 103還可以包括RNC 142a和/或142b。應當理解的是,RAN 103在保持實施方式的一致性時,可以包括任意數量的節點B和RNC。
如第6C圖所示,節點B 140a和/或140b可以與RNC 142a通信。此外,節點B 140c可以與RNC 142b通信。節點B 140a、140b、和/或140c可以通過Iub介面分別與RNC 142a、142b通信。RNC 142a、142b可以通過Iur介面相互通信。RNC 142a、142b的每一個可以被配置以控制其連接的各個節點B 140a、140b、和/或140c。另外,RNC 142a、142b的每一個可以被配置以執行或支援其他功能,例如外環功率控制、負載控制、准入控制、封包排程、切換控制、巨集分集、安全功能、資料加密等等。
第6C圖中所示的核心網路106可以包括媒體閘道(MGW)144、移動交換中心(MSC)146、服務GPRS支援節點(SGSN)148、和/或閘道GPRS支持節點(GGSN)150。儘管前述元件的每一個被描述為核心網路106的部分,應當理解的是,這些元件中的任何一個可以被不是核心網路營運商的實體擁有或營運。
RAN 103中的RNC 142a可以通過IuCS介面連接至核心網路106中的MSC 146。MSC 146可以連接至MGW 144。MSC 146和MGW 144可以向WTRU 102a、102b、和/或102c提供到電路切換式網路(例如PSTN 108)的存取,以便於WTRU 102a、102b、和/或102c和傳統陸地線路通信裝置之間的通信。
RAN 103中RNC 142a還可以通過IuPS介面連接至核心網路106中的SGSN 148。SGSN 148可以連接至GGSN 150。SGSN 148和GGSN 150可以向WTRU 102a、102b、和/或102c提供到封包交換網路(例如網際網路110)的存取,以便於WTRU 102a、102b、和/或102c和IP賦能裝置之間的通信。
如上所述,核心網路106還可以連接至網路112,網路112可以包括由其他服務提供者擁有或營運的其他有線或無線網路。
第6D圖描述了根據實施方式的RAN 104和核心網路106b的系統圖。如上面提到的,RAN 104可使用E-UTRA無線電技術通過空中介面116與WTRU 102a、102b、和/或102c通信。RAN 104還可以與核心網路106b通信。
RAN 104可包括e節點B 170a、170b、和/或170c,但可以理解的是,RAN 104可以包括任意數量的e節點B而保持與各種實施方式的一致性。eNB 170a、170b、和/或170c的每一個可包括一個或更多個用於通過空中介面116與WTRU 102a、102b、和/或102c通信的收發器。在一種實施方式中,e節點B 170a、170b、和/或170c可以使用MIMO技術。因此,e節點B 170a例如可以使用多個天線來向WTRU 102a發送無線信號和/或從其接收無線信號。
e節點B 170a、170b、和/或170c的每一個可以與特定胞元關聯(未顯示),並可以被配置為處理無線資源管理決策、切換決策、在上行鏈路和/或下行鏈路中的用戶排程等等。如第6D圖所示,e節點B 170a、170b、和/或170c可以通過X2介面相互通信。
第6D圖中所示的核心網路106b可以包括移動性管理實體(MME)172、服務閘道174和/或封包資料網路(PDN)閘道176。雖然前述單元的每一個被描述為核心網路106b的一部分,應當理解的是,這些單元中的任意一個可以由除了核心網路營運商之外的實體擁有和/或營運。
MME 172可以經由S1介面連接到RAN 104中的e節點B 170a、170b、和/或170c的每一個,並可以作為控制節點。例如,MME 172可以負責WTRU 102a、102b、和/或102c的用戶認證、承載啟動/去啟動、在WTRU 102a、102b、和/或102c的初始附著期間選擇特定服務閘道等等。MME 172還可以提供控制平面功能,用於在RAN 104和使用例如GSM或者WCDMA的其他無線電技術的其他RAN(未顯示)之間切換。
服務閘道174可以經由S1介面連接到RAN 104中的eNB 170a、170b、和/或170c的每一個。服務閘道174通常可以向/從WTRU 102a、102b、和/或102c路由和轉發用戶資料封包。服務閘道174還可以執行其他功能,例如在eNB間切換期間錨定用戶平面、當下行鏈路資料對於WTRU 102a、102b、和/或102c可用時觸發傳呼、管理和儲存WTRU 102a、102b、和/或102c的上下文(context)等等。
服務閘道174還可以連接到PDN閘道176,PDN閘道176可以向WTRU 102a、102b、和/或102c提供到封包交換網路(例如網際網路110)的存取,以便於WTRU 102a、102b、和/或102c與IP賦能裝置之間的通信。
核心網路106b可以便於與其他網路的通信。例如,核心網路106b可以向WTRU 102a、102b、和/或102c提供到電路切換式網路(例如PSTN 108)的存取, 以便於WTRU 102a、102b、和/或102c與傳統陸地線路通信裝置之間的通信。例如,核心網路106b可以包括IP閘道(例如IP多媒體子系統(IMS)伺服器),或者與之通信,該IP閘道作為核心網路106b與PSTN 108之間的介面。另外,核心網路106b可以向WTRU 102a、102b、和/或102c提供到網路112的存取,該網路112可以包括被其他服務提供者擁有和/或營運的其他有線或無線網路。
第6E圖描述了根據實施方式的RAN 105和核心網路106c的系統圖。RAN 105可以是使用IEEE 802.16無線電技術通過空中介面117與WTRU 102a、102b、和/或102c進行通信的存取服務網路(ASN)。如下面進一步討論的,WTRU 102a、102b、和/或102c,RAN 105和核心網路106c的不同功能實體之間的鏈路可以被定義為參考點。
如第6E圖所示,RAN 105可以包括基地台180a、180b、和/或180c和ASN閘道182,但應當理解的是,RAN 105可以包括任意數量的基地台和ASN閘道而與實施方式保持一致。基地台180a、180b、和/或180c的每一個可以與RAN 105中特定胞元(未示出)關聯並可以包括一個或更多個通過空中介面117與WTRU 102a、102b、和/或102c通信的收發器。在一個實施方式中,基地台180a、180b、和/或180c可以使用MIMO技術。因此,基地台180a例如使用多個天線來向WTRU 102a發送無線信號,或從其接收無線信號。基地台180a、180b、和/或180c可以提供移動性管理功能,例如呼叫交遞(handoff)觸發、隧道建立、無線電資源管理,訊務分類、服務品質(QoS)策略執行等等。ASN閘道182可以充當訊務聚集點,並且負責傳呼、快取用戶設定檔、路由到核心網路106c等等。
WTRU 102a、102b、和/或102c和RAN 105之間的空中介面117可以被定義為使用802.16規範的R1參考點。另外,WTRU 102a、102b、和/或102c的每一個可以與核心網路106c建立邏輯介面(未顯示)。WTRU 102a、102b、和/或102c和核心網路 106c之間的邏輯介面可以定義為R2參考點,其可以用於認證、授權、IP主機(host)配置管理和/或移動性管理。
基地台180a、180b、和/或180c的每一個之間的通信鏈路可以定義為包括便於WTRU切換和基地台間轉移資料的協定的R8參考點。基地台180a、180b、和/或180c和ASN閘道182之間的通信鏈路可以定義為R6參考點。R6參考點可以包括用於促進基於與WTRU 102a、102b、和/或102c的每一個關聯的移動性事件的移動性管理的協定。
如第6E圖所示,RAN 105可以連接至核心網路106c。RAN 105和核心網路106c之間的通信鏈路可以定義為包括例如便於資料轉移和移動性管理能力的協定的R3參考點。核心網路106c可以包括移動IP本地代理(MIP-HA)184,認證、授權、計費(AAA)伺服器186和閘道188。儘管前述的每個元件被描述為核心網路106c的部分,應當理解的是,這些元件中的任意一個可以由不是核心網路營運商的實體擁有或營運。
MIP-HA可以負責IP位址管理,並可以使WTRU 102a、102b、和/或102c在不同ASN和/或不同核心網路之間漫遊。MIP-HA 184可以向WTRU 102a、102b、和/或102c提供封包交換網路(例如網際網路110)的存取,以促進WTRU 102a、102b、和/或102c和IP賦能裝置之間的通信。AAA伺服器186可以負責用戶認證和支援用戶服務。閘道188可促進與其他網路交互工作。例如,閘道可以向WTRU 102a、102b、和/或102c提供電路切換式網路(例如PSTN 108)的存取,以促進WTRU 102a、102b、和/或102c和傳統陸地線路通信裝置之間的通信。此外,閘道188可以向WTRU 102a、102b、和/或102c提供網路112,其可以包括由其他服務提供者擁有或營運的其他有線或無線網路。
儘管未在第6E圖中顯示,應當、可以和/或將理解的是,RAN 105可以連接至其他ASN,並且核心網路106c可以連接至其他核心網路。RAN 105和其他ASN之間的通信鏈路可以定義為R4參考點,其可以包括協調RAN 105和其他ASN之間的WTRU 102a、102b、和/或102c的移動性的協定。核心網路106c和其他核心網路之間的通信鏈路可以定義為R5參考點,其可以包括促進本地核心網路和被訪問核心網路之間的互通的協定。
雖然上面以特定的組合描述了特徵和元件,但是本領域普通技術人員可以理解,每個特徵或元件可以單獨的使用或與其他的特徵和元件進行組合使用。此外,這裡描述的方法可以用電腦程式、軟體或韌體實現,其可包含到由電腦或處理器執行的電腦可讀媒體中。電腦可讀媒體的示例包括電子信號(通過有線或無線連接傳送)和電腦可讀儲存媒體。電腦可讀儲存媒體的示例包括,但不限制為,唯讀記憶體(ROM)、隨機存取記憶體(RAM)、暫存器、快取記憶體、半導體記憶體裝置、磁性媒體(例如內部硬碟和抽取式磁碟)、磁光媒體和光媒體(例如CD-ROM碟片和數位多功能碟片(DVD))。與軟體關聯的處理器用於實現射頻收發器,用於WTRU、UE、終端、基地台、RNC或任何主機電腦。
100‧‧‧通信系統
102、102a、102b、102c、102d‧‧‧無線發射/接收單元(WTRU)
104‧‧‧無線電存取網路(RAN)
106、106b、106c‧‧‧核心網路
108‧‧‧公共交換電話網路(PSTN)
110‧‧‧網際網路
112‧‧‧其他網路
114a、114b‧‧‧基地台
116‧‧‧空中介面
118‧‧‧處理器
120‧‧‧收發器
122‧‧‧發射/接收元件
124‧‧‧揚聲器/麥克風
126‧‧‧數字鍵盤
128‧‧‧顯示器/觸控板
130‧‧‧不可移除記憶體
132‧‧‧可移除記憶體
134‧‧‧電源
136‧‧‧全球定位系統(GPS)晶片組
138‧‧‧週邊設備
140a、140b、140c‧‧‧節點B
142a、142b‧‧‧無線電網路控制器(RNC)
144‧‧‧媒體閘道(MGW)
146‧‧‧移動交換中心(MSC)
148‧‧‧服務GPRS支援節點(SGSN)
150‧‧‧閘道GPRS支持節點(GGSN)
170a、170b、170c‧‧‧e節點B
172‧‧‧移動性管理實體(MME)
174‧‧‧服務閘道
176‧‧‧封包資料網路(PDN)閘道
180a、180b、180c‧‧‧基地台
182‧‧‧存取服務網路(ASN)閘道
184‧‧‧移動IP本地代理(MIP-HA)
186‧‧‧認證、授權、計費(AAA)伺服器
188‧‧‧閘道
BL‧‧‧基礎層
EL‧‧‧增強層
Iub、IuCS、IuPS、Iur、S1、X2‧‧‧介面
R1、R3、R6、R8‧‧‧參考點
rc‧‧‧變數
rcPic‧‧‧參考層圖像
第1A圖至第1C圖是示出層間參數集示例的語法表。 第2A圖至第2C圖是示出簡化的序列參數集示例的語法表。 第3圖是示出簡化的序列參數集延長示例的語法表。 第4圖是示出從層間參數集合中得到視訊編碼和/或解碼參數的示例過程。 第5圖示出了參考圖像的裁剪示例。 第6A圖是在其中一個或更多個揭露的實施例可得以實現的示例通信系統的系統圖。 第6B圖是可在第6A圖所示的通信系統中使用的示例無線發射/接收單元(WTRU)的系統圖。 第6C圖是可在第6A圖所示的通信系統中使用的示例無線電存取網路和示例核心網路的系統圖。 第6D圖是可在第6A圖所示的通信系統中使用的另一示例無線電存取網路和示例核心網路的系統圖。 第6E圖是可在第6A圖所示的通信系統中使用的另一示例無線電存取網路和示例核心網路的系統圖。

Claims (8)

  1. 一種視訊編碼方法,包括:確定活動參考層的一數目;比較活動參考層的該數目與直接參考層的一數目;基於活動參考層的該數目與直接參考層的該數目的該比較,確定是否將該活動參考層的一指示包括在一切片級標頭中;以及產生包括一或多個層的一位元串流,其中在活動參考層的該數目不等於直接參考層的該數目的情況下,在該位元串流中包括用於層間預測的一圖像的該指示,以及在活動參考層的該數目等於直接參考層的該數目的情況下,不在該位元串流中包括用於層間預測的一圖像的該指示。
  2. 如申請專利範圍第1項所述的方法,其中該指示是一圖像的一層ID。
  3. 一種視訊解碼方法,包括:接收包括一或多個層的一位元串流,其中在該接收到的位元串流中的活動參考層的一數目不等於直接參考層的一數目的情況下,在該位元串流中接收一層間預測層語法元素,其中該層間預測層語法元素表明能被一當前層的一當前圖像用於層間預測的一參考圖像層ID清單,以及在該接收到的位元串流中的活動參考層的一數目等於直接參考層的一數目的情況下,推斷一層間預測層語法元素。
  4. 如申請專利範圍第3項所述的方法,更包括:在活動參考層的該數目等於直接參考層的該數目的情況下,從該當前層的一直接參考層的一層ID推斷出該層間預測層語法元素。
  5. 一種視訊編碼裝置,包括:一處理器,被配置為:確定活動參考層的一數目;比較活動參考層的該數目與直接參考層的一數目;基於活動參考層的該數目與直接參考層的該數目的該比較,確定是否將該活動參考層的一指示包括在一切片級標頭中;以及產生包括一或多個層的一位元串流,其中在活動參考層的該數目不等於直接參考層的該數目的情況下,該處理器被配置為在該位元串流中包括用於層間預測的一圖像的該指示,以及在活動參考層的該數目等於直接參考層的該數目的情況下,該處理器被配置為不在該位元串流中包括用於層間預測的一圖像的該指示。
  6. 如申請專利範圍第5項所述的視訊編碼裝置,其中該指示是一圖像的一層ID。
  7. 一種視訊解碼裝置,包括:一處理器,被配置為:接收包括一或多個層的一位元串流,其中在該接收到的位元串流中的活動參考層的一數目不等於直接參考層的一數目的情況下,在該位元串流中接收一層間預測層語法元素,其中該層間預測層語法元素表明能被一當前層的一當前圖像用於層間預測的一參考圖像層ID清單;以及在該接收到的位元串流中的活動參考層的一數目等於直接參考層的一數目的情況下,推斷一層間預測層語法元素。
  8. 如申請專利範圍第7項所述的視訊解碼裝置,在活動參考層的該數目等於直接參考層的該數目的情況下,該處理器更被配置為從該當前層的一直接參考層的一層ID推斷出該層間預測層語法元素。
TW103121067A 2013-06-18 2014-06-18 視訊編碼裝置及方法及視訊解碼裝置 TWI667911B (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201361836552P 2013-06-18 2013-06-18
US61/836,552 2013-06-18
US201361837116P 2013-06-19 2013-06-19
US61/837,116 2013-06-19
US201361840380P 2013-06-27 2013-06-27
US61/840,380 2013-06-27
US201361860221P 2013-07-30 2013-07-30
US61/860,221 2013-07-30

Publications (2)

Publication Number Publication Date
TW201526612A TW201526612A (zh) 2015-07-01
TWI667911B true TWI667911B (zh) 2019-08-01

Family

ID=51136856

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103121067A TWI667911B (zh) 2013-06-18 2014-06-18 視訊編碼裝置及方法及視訊解碼裝置

Country Status (9)

Country Link
US (1) US10104374B2 (zh)
EP (2) EP3011747A1 (zh)
JP (2) JP2016523483A (zh)
KR (2) KR102115075B1 (zh)
CN (1) CN105393542B (zh)
IL (1) IL243101B (zh)
MY (1) MY174134A (zh)
TW (1) TWI667911B (zh)
WO (1) WO2014205067A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140087971A (ko) 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치
US9648326B2 (en) 2013-07-02 2017-05-09 Qualcomm Incorporated Optimizations on inter-layer prediction signalling for multi-layer video coding
WO2015006281A2 (en) * 2013-07-09 2015-01-15 Sony Corporation High level syntax improvement on inter-layer prediction for shvc/mv-hevc
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
CN105210370B (zh) * 2013-07-10 2019-04-12 夏普株式会社 运动图像解码装置
MX348561B (es) * 2013-07-12 2017-06-20 Sony Corp Aparato y método para la codificación de imágenes.
KR102318785B1 (ko) 2013-10-14 2021-10-27 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징
US9681145B2 (en) 2013-10-14 2017-06-13 Qualcomm Incorporated Systems and methods for inter-layer RPS derivation based on sub-layer reference prediction dependency
US10547834B2 (en) * 2014-01-08 2020-01-28 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
CN104093028B (zh) * 2014-06-25 2019-02-01 中兴通讯股份有限公司 一种设备能力协商的方法和装置
CA3171803A1 (en) 2014-09-30 2016-04-07 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
KR20170069957A (ko) * 2014-10-08 2017-06-21 엘지전자 주식회사 3d 비디오 코딩에서 카메라 파라미터 처리 방법 및 장치
CN106664405B (zh) 2015-06-09 2020-06-09 微软技术许可有限责任公司 用调色板模式对经逸出编码的像素的稳健编码/解码
US20170359575A1 (en) * 2016-06-09 2017-12-14 Apple Inc. Non-Uniform Digital Image Fidelity and Video Coding
EP3721624A1 (en) * 2017-12-06 2020-10-14 V-Nova International Limited Methods and apparatuses for hierarchically encoding and decoding a bytestream
AU2020418299A1 (en) * 2019-12-31 2022-07-28 Huawei Technologies Co., Ltd. Encoder, decoder and corresponding methods and apparatus
US20230319302A1 (en) * 2020-03-31 2023-10-05 Lg Electronics Inc. Image encoding/decoding method and apparatus for determining sublayer on basis of whether or not to make reference between layers, and method for transmitting bitstream
US11563980B2 (en) * 2020-04-02 2023-01-24 Qualcomm Incorporated General constraint information syntax in video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080165850A1 (en) * 2007-01-08 2008-07-10 Qualcomm Incorporated Extended inter-layer coding for spatial scability
TW200943967A (en) * 2007-12-10 2009-10-16 Qualcomm Inc Resource-adaptive video interpolation or extrapolation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US78854A (en) * 1868-06-16 William adair
KR100931870B1 (ko) 2005-04-13 2009-12-15 노키아 코포레이션 비디오 데이터를 효과적으로 코딩 및 디코딩하는 방법,장치 및 시스템
WO2007148906A1 (en) * 2006-06-19 2007-12-27 Lg Electronics, Inc. Method and apparatus for processing a vedeo signal
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
US8059714B2 (en) * 2006-07-10 2011-11-15 Sharp Laboratories Of America, Inc. Methods and systems for residual layer scaling
US7840078B2 (en) * 2006-07-10 2010-11-23 Sharp Laboratories Of America, Inc. Methods and systems for image processing control based on adjacent block characteristics
US8532176B2 (en) * 2006-07-10 2013-09-10 Sharp Laboratories Of America, Inc. Methods and systems for combining layers in a multi-layer bitstream
CA2661981C (en) * 2006-11-09 2013-01-15 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
WO2008060126A1 (en) * 2006-11-17 2008-05-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
WO2010043773A1 (en) * 2008-10-17 2010-04-22 Nokia Corporation Sharing of motion vector in 3d video coding
US20120050475A1 (en) 2009-05-01 2012-03-01 Dong Tian Reference picture lists for 3dv
US8411746B2 (en) * 2009-06-12 2013-04-02 Qualcomm Incorporated Multiview video coding over MPEG-2 systems
US8780999B2 (en) * 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
WO2012122246A1 (en) * 2011-03-10 2012-09-13 Vidyo, Inc. Dependency parameter set for scalable video coding
US10237565B2 (en) * 2011-08-01 2019-03-19 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
KR101652928B1 (ko) * 2012-01-31 2016-09-01 브이아이디 스케일, 인크. 스케일러블 고효율 비디오 코딩(hevc)을 위한 참조 픽처 세트(rps) 시그널링
KR20140087971A (ko) * 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080165850A1 (en) * 2007-01-08 2008-07-10 Qualcomm Incorporated Extended inter-layer coding for spatial scability
TW200943967A (en) * 2007-12-10 2009-10-16 Qualcomm Inc Resource-adaptive video interpolation or extrapolation

Also Published As

Publication number Publication date
US20160134868A1 (en) 2016-05-12
KR20160021222A (ko) 2016-02-24
KR20170121317A (ko) 2017-11-01
JP6420429B2 (ja) 2018-11-07
JP2016523483A (ja) 2016-08-08
JP2017212752A (ja) 2017-11-30
MY174134A (en) 2020-03-10
EP3522540A1 (en) 2019-08-07
KR102115075B1 (ko) 2020-05-25
CN105393542B (zh) 2019-04-09
TW201526612A (zh) 2015-07-01
US10104374B2 (en) 2018-10-16
EP3011747A1 (en) 2016-04-27
IL243101B (en) 2020-03-31
CN105393542A (zh) 2016-03-09
WO2014205067A1 (en) 2014-12-24

Similar Documents

Publication Publication Date Title
TWI667911B (zh) 視訊編碼裝置及方法及視訊解碼裝置
JP6515159B2 (ja) Hevc拡張のための高レベル構文
TWI674792B (zh) 在多層視訊編碼中空間層取樣格網資訊
US10321130B2 (en) Enhanced deblocking filters for video coding
TWI675585B (zh) 可調整視訊編碼的移動資訊傳訊
US10616597B2 (en) Reference picture set mapping for standard scalable video coding
US20140010291A1 (en) Layer Dependency and Priority Signaling Design for Scalable Video Coding
TW201507443A (zh) 基於單迴路解碼之多層視訊編碼
WO2014028838A1 (en) Slice based skip mode signaling for multiple layer video coding
US20220353520A1 (en) Dynamic adaptation of volumetric content component sub-bitstreams in streaming services