TWI784348B - 視訊圖片資訊之指定技術 - Google Patents
視訊圖片資訊之指定技術 Download PDFInfo
- Publication number
- TWI784348B TWI784348B TW109139668A TW109139668A TWI784348B TW I784348 B TWI784348 B TW I784348B TW 109139668 A TW109139668 A TW 109139668A TW 109139668 A TW109139668 A TW 109139668A TW I784348 B TWI784348 B TW I784348B
- Authority
- TW
- Taiwan
- Prior art keywords
- picture
- sub
- slice
- current picture
- video
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
提供了一種用於指定子圖片的佈局的方法。 視訊解碼器從位元流接收資料,以將其解碼為視訊的當前圖片。 視訊解碼器為當前圖片的多個子圖片的位置和大小解析位元流。 在解析過程中,將跳過第一個子圖片的位置和最後一個子圖片的大小。 視訊解碼器根據子圖片的位置和大小來重構當前圖片和子圖片。
Description
本公開總體上涉及視訊編解碼。特別地,本公開涉及指定(specify)子圖片佈局、切片結構和圖片識別的方法。
除非本文另外指出,否則本節中描述的方法不是後面列出的申請專利範圍的現有技術,並且不被包括在本節中而被承認為現有技術。
高效視訊編解碼(HEVC)是由視訊編解碼聯合協作團隊(JCT-VC)開發的最新國際視訊編解碼標準。從重構信號中預測輸入視訊信號,該重構信號是從編解碼圖片區域中得出的。預測殘差信號通過線性變換進行處理。對變換係數進行量化,並與位元流中的其他輔助資訊一起進行熵編解碼。在對去量化的變換係數進行逆變換之後,從預測信號和重構殘差信號生成重構信號。通過環路濾波進一步處理重構信號,以去除編解碼偽像。解碼的圖片存儲在訊框緩衝器中,以預測輸入視訊信號中的未來圖片。
在HEVC中,編解碼圖片被劃分為由相關聯的編解碼樹單元(CTU)表示的非重疊正方形塊區域。編解碼圖片可以由切片的集合表示,每個切片包括整數個CTU。切片中的各個CTU按光柵掃描順序進行處理。可以使用訊框內預測或訊框間預測來解碼雙預測(B)切片,其中訊框內預測或訊框間預測使用至多兩個運動矢量和參考索引來預測每個塊的採樣值。使用訊框內預測或訊框間預測使用最多一個運動矢量和參考索引對預測(P)切片進行解碼,
以預測每個塊的樣本值。僅使用訊框內預測來對訊框內(I)切片進行解碼。
可使用遞歸四叉樹(QT)結構將CTU劃分為多個不重疊的編解碼單元(CU),以適應各種局部運動和紋理特徵。CTU也可以使用帶有二進制和三進制拆分(binary and ternary split)的帶有嵌套多類型樹(nested multi-type tree)的四叉樹劃分為一個或多個較小尺寸的CU。所得的CU分區可以為正方形或矩形。
為每個CU指定一個或多個預測單元(PU)。預測單元與關聯的CU語法一起,作為用於發信(signal)預測器資訊的基本單元。使用指定的預測過程來預測PU內部相關像素樣本的值。可以使用殘差四叉樹(RQT)結構來進一步劃分CU,以用於表示相關聯的預測殘差信號。RQT的葉節點對應於變換單元(TU)。變換單元由大小為8x8、16x16或32x32的亮度樣本的變換塊(TB)或大小為4x4的四個亮度樣本的變換塊和4:2:0顏色格式的圖片的色度樣本的兩個相應變換塊組成。將整數變換應用於變換塊,並且將量化係數的水平值(level value)與其他輔助資訊一起在位元流中進行熵編解碼。
術語編解碼樹塊(CTB)、編解碼塊(CB)、預測塊(PB)和變換塊(TB)被定義為指定與CTU、CU、PU和TU。因此,CTU由一個亮度CTB、兩個色度CTB和相關的語法元素組成。類似的關係對於CU、PU和TU也有效。樹分割通常同時應用於亮度和色度,但是當達到色度的某些最小大小時會例外。
以下發明內容僅是說明性的,而無意於以任何方式進行限制。即,提供以下概述以介紹本文描述的新穎和非顯而易見的技術的概念、重點、益處和優點。選擇和並非所有實施方式將在下面的詳細描述中進一步描述。因此,以下發明內容既不旨在標識所要求保護的主題的必要特徵,也不旨在用於
確定所要求保護的主題的範圍。
本公開的一些實施例提供了一種用於指定子圖片的佈局的方法。視訊解碼器從位元流接收資料,以將其解碼為視訊的當前圖片。解碼器解析多個子圖片的位置和大小的位元流,並且在解析期間跳過第一子圖片的位置和最後一個子圖片的大小。視訊解碼器根據多個子圖片的位置和大小來重構當前圖片和當前圖片的子圖片。
如果在當前圖片中編解碼了多個子圖片,則解碼器接收位元流中當前圖片的第一子圖片的大小的指定。在位元流中未指定當前圖片的第一子圖片的位置、最後子圖片的位置和大小。解碼器可以接收關於不是最後圖片的第二子圖片的尺寸和位置的指定。解碼器推斷出第一子圖片的位置。解碼器還可以推斷出最後一個子圖片的位置和大小。
如果在當前圖片中僅編解碼一個子圖片(或沒有子圖片),則解碼器推斷當前圖片的唯一子圖片的位置和大小。當前圖片中唯一子圖片的位置和大小未在位元流中指定。
在一些實施例中,解碼器從位元流接收當前圖片的圖片報頭中的當前圖片的圖片順序計數。在一些實施例中,當在位元流中重複當前圖片的圖片報頭時,在位元流中發信圖片順序計數。在這些情況下,圖片順序計數可用作將重複的圖片報頭與當前圖片相關聯的標識符。
在一些實施例中,當允許將當前圖片劃分為多個基於非圖塊的光柵掃描切片時,解碼器從位元流接收指示是否在當前圖片中編解碼了多個切片的指示。在一些實施例中,當當前圖片被劃分成多個基於非圖塊的光柵掃描切片並且在當前圖片中對多個切片進行編解碼時,解碼器從切片報頭中的位元流接收切片中的多個CTU的指定。
在一些實施例中,當當前圖片被劃分成非矩形切片(或光柵掃描
切片)時,解碼器從位元流接收關於在圖塊中是否編解碼多個切片的指定。在一些實施例中,當當前圖片被劃分成非矩形切片並且當在圖塊中對多個切片進行編解碼時,解碼器從位元流接收切片中的多個CTU的指定。
100、200:視訊圖片
211、212:圖塊
221、222、223:切片
300:視訊編碼器
305:視訊源
308:減法器
309:殘差信號
310:變換模組
311:量化模組
313、613:預測像素資料
314:逆量化模組
315:逆變換模組
317:重構像素資料
319、619:重構殘差
320:圖片內估計模組
325、625:訊框內預測模組
330、630:運動補償模組
335:運動估計模組
340、640:訊框間預測模組
345、645:環路濾波器
350、650:重構圖片緩衝器
365、665:MV緩衝器
375、675:MV預測模組
390:熵編碼器
395、695:位元流
410、710:圖片劃分引擎
415:速率/失真資訊
420、720:圖片分區指定
430、730:圖片分區佈局
500、800:過程
510~560、810~860:框
600:視訊解碼器
611:逆量化模組
610:逆變換模組
617:解碼像素資料
655:顯示設備
690:解析器
900:電子系統
905:匯流排
910:處理單元
915:圖形處理單元
920:系統記憶體
925:網路
930:只讀記憶體
935:永久存儲設備
940:輸入設備
945:輸出設備
包括附圖以提供對本公開的進一步理解,並且附圖被併入本公開並構成本公開的一部分。附圖示出了本公開的實施方式,並且與描述一起用於解釋本公開的原理。可以理解的是,附圖不一定按比例繪製,因為為了清楚地說明本公開的概念,某些組件可能被顯示為與實際實現中的尺寸不成比例。
第1圖示出了視訊圖片中僅具有一個圖塊或沒有圖塊分區(tile partition)的切片。
第2圖示出了具有在光柵掃描中的圖塊中具有切片的視訊圖片。
第3圖說明實例視訊編碼器。
第4圖說明實現子圖片佈局、切片結構和圖片識別的指定的視訊編碼器的部分。
第5圖概念性地示出了用於指定子圖片佈局、切片結構和圖片識別的過程。
第6圖示出了示例視訊解碼器。
第7圖說明視訊解碼器的接收並應用子圖片佈局、切片結構和圖片識別的指定的部分。
第8圖概念性地示出了用於接收子圖片佈局、切片結構和圖片識別的指定的過程。
第9圖概念性地示出了用於實現本公開的一些實施例的電子系統。
在下面的詳細描述中,通過示例的方式闡述了許多具體細節,以提供對相關教導的透徹理解。基於本文描述的教導的任何變化、派生和/或擴展
均在本公開的保護範圍內。在一些實例中,可以以相對較高的水平而不詳細地描述與本文公開的一種或多種示例實現有關的眾所周知的方法、過程、組件和/或電路,以避免不必要地混淆本公開的教導的各方面。
子圖片是主視訊圖片的次要或輔助圖片或訊框。可以顯示圖片、視訊、文本或其他類型的資料的子圖片與主視訊圖片的視訊資料分開編解碼。多個子圖片可以與視訊圖片相關聯,並且根據佈局將相關聯的子圖片定位在圖片內。可以在包括視訊圖片的序列的序列參數集(sequence parameter set,簡寫為SPS)中指定子圖片佈局。下面的表1是SPS的示例語法表,其中包括子圖片佈局的指定。
在一些實施例中,在視訊圖片的圖片參數集(PPS)中發信視訊圖片的切片佈局資訊。圖塊切片(slice-in-tile)中的視訊圖片是其中將圖塊劃分為多個切片的視訊圖片。在一些實施例中,對於圖塊切片圖片中的矩形切片,切片的佈局也在圖片的PPS中指定。當切片大小等於圖塊大小時,由於寬度是圖塊寬度,因此僅以CTU為單位發信切片高度。下表2是用於PPS的示例語
法表,其中包括圖塊和切片語法結構,用於切片佈局指定的統一和不統一的切片列和行。
本公開的一些實施例提供一種用於在視訊編解碼器(編碼器或解碼器)處改善SPS中的子圖片佈局的發信的方法。在一些實施例中,為了在SPS中發信子圖片佈局,視訊編解碼器可以在圖片中僅存在一個子圖片時推斷尺寸資訊。當未發信通知子圖片或圖片中只有一個子圖片時,該圖片是具有已知位置和尺寸資訊的子圖片。在一些實施例中,當圖片中存在多個子圖片時,視訊編解碼器可推斷出第一子圖片的左上位置並推斷出最後子圖片位置。第一個子圖片的左上位置為[0,0],最後一個子圖片為圖片的右下方區域。表3顯示了用於指定子圖片佈局的修改後的SPS語法。
換言之,當在當前圖片中編解碼兩個或更多個子圖片時,在位元流中指定當前圖片的第一子圖片(i=0)的大小(例如,由subpic_width_minus1指示的寬度或subpic_height_minus1指示的高度),但是未在位元流中指定最後一個子圖片(i=sps_num_subpics_minus1)的位置(例如,由subpic_ctu_top_left指示的左上位置)和大小。對於除了第一和最後一個子圖片(例如,第二子圖片)以外的每個子圖片,在位元流中指定子圖片的大小和位置。在一些實施例中,當前圖片的第一子圖片的位置、最後子圖片的位置和大小是由視訊編碼器或解碼器推斷的,並且不在位元流中發信。當當前圖片中只有一個子圖片時,當前圖片的唯一子圖片的位置和大小將由視訊編碼器或解碼器推斷出來,而不會在位元流中發信。
切片可以是基於圖塊的或基於非圖塊的。非圖塊切片是未劃分為圖塊的圖片中的切片,或者這些切片不受圖塊邊界的約束。圖塊切片是劃分為圖塊的圖片中的切片,,這些切片受限於圖塊邊界。光柵掃描切片是按光柵掃描順序由一系列CTU定義的切片,因此可能不是矩形的。
對於基於圖塊的光柵掃描切片,將切片劃分用作用於指定切片的
中間資料分組層。但是,可能不允許某些編解碼工具跨越圖塊分區邊界(例如,空間合併模式、仿射合併模式、訊框內預測等),從而可能在某種程度上降低編解碼效率。對於一些應用而言,使用合理數量的切片分區或不使用切片分區可能是有利的。
在一些實施例中,當以CTU為單位指定切片分區時,用於光柵掃描切片的圖塊分區是可選的。在一些實施例中,語法元素no_pic_partition_flag等於1表示沒有圖片分區應用於引用PPS的每個圖片。這可能意味著圖片中只有一個圖塊或沒有圖塊分區。雖然不存在圖塊分區參數,但是可以基於一組推斷規則來推斷該參數。這被稱為圖片內切片(slice-in-picture)情況。在一些實施例中,在圖片內切片的情況下,基於光柵掃描以CTU為單位指定切片。
第1圖示出了視訊圖片100中的僅具有一個圖塊或沒有圖塊分區的切片,或者圖片內切片的情況。可以將視訊圖片100視為僅具有一個圖塊或完全沒有圖塊分割,並且其中的切片是基於非圖塊的切片。如圖所示,切片的佈局受到圖片邊界的限制,而不是受任何圖塊的邊界限制,因此切片被視為圖片的分區而不是圖塊的分區。視訊圖片100中的切片在光柵掃描中以CTU為單位指定。
在一些實施例中,當當前圖片被劃分成多個基於非圖塊的光柵掃描切片(或非矩形切片)時,在位元流中指定是否在當前圖片中對多個切片進行編解碼(圖片內切片的情況)。當將當前圖片劃分為多個基於非圖塊的光柵掃描切片,並且在當前圖片中對多個切片進行編解碼時,切片的大小將根據CTU進行指定。具體而言,在位元流中指定切片中CTU的數量。表4A和4B分別示出了針對在畫面內切片情況的PPS和切片報頭。
語法元素subpics_present_flag的值為1表示一個或多個子圖片存在於編解碼分層視訊序列(coded layer-wise video sequence,簡寫為CLVS)的每個編解碼圖片中,並且子圖片參數存在於SPS原始字節序列有效載荷(RBSP)語法中。subpics_present_flag的值等於0表示CLVS中的每個編解碼圖片中都沒有子圖片,並且SPS RBSP語法中沒有子圖片參數。在一些實施例中,當位元流是子位元流提取過程的結果並且該位元流僅包含輸入位元流到子位元流提取過程的子圖片的子集時,在SPS的RBSP中subpics_present_flag的值被設置為1。當subpics_present_flag等於0時,CLVS中的每個編解碼圖片可以被視為位元流提取和合併過程中的子圖片。
語法元素sps_num_subpics_minus1的值加1指定子圖片的數量。在一些實施例中,將sps_num_subpics_minus1的範圍限制為0到254。如果不存在,則推斷sps_num_subpics_minus1的值等於0。sps_num_subpics_minus1的值等於0
表示CLVS中的每個編解碼圖片都是該子圖片。
語法元素rect_slice_flag的值等於0表示每個切片內的圖塊或CTU處於光柵掃描順序,並且切片資訊未在PPS中發信。rect_slice_flag的值等於1指定每個切片內的圖塊或CTU覆蓋圖片的矩形區域,並且在PPS中發信切片資訊。如果不存在,則推斷rect_slice_flag為等於1。當subpics_present_flag等於1時,推斷rect_slice_flag的值等於1。當raster_scan_slice_in_pic_enabled_flag等於1時,推斷rect_slice_flag的值等於0。
語法元素no_pic_partition_flag的值等於1表示未將圖塊分區應用於引用PPS的圖片。no_pic_partition_flag的值等於0表示引用PPS的每個圖片可以劃分為一個以上的圖塊或切片。
語法元素raster_scan_slice_in_pic_enabled_flag的值等於0表示沒有光柵掃描切片分區應用於參考PPS的每個圖片。raster_scan_slice_in_pic_enabled_flag的值等於1表示當no_pic_partition_flag等於1時,每個引用PPS的圖片都可以劃分為一個以上的光柵掃描切片。如果不存在,則將raster_scan_slice_in_pic_enabled_flag的值推斷為等於0。
語法元素single_slice_per_subpic_flag的值等於1表示每個子圖片包含且僅包含一個矩形切片。single_slice_per_subpic_flag的值為0表示每個子圖片可以包含一個或多個矩形切片。當single_slice_per_subpic_flag等於1時,推斷num_slices_in_pic_minus1等於sps_num_subpics_minus1。當single_slice_per_subpic_flag等於1並且sps_num_subpics_minus1等於0時,則推斷num_slices_in_pic_minus1等於0(即,當前圖片是子圖片,並且僅包含一個矩形切片)。
語法元素slices_in_pic_present_flag的值等於1表示當前圖片中存在多個切片。slices_in_pic_present_flag的值等於0表示當前圖片中不存在多個切
片。如果不存在,則將slices_in_pic_present_flag推斷為等於0。
語法元素num_ctus_in_slice_minus1的值加1指定當前切片中的CTU數。當slices_in_pic_present_flag等於1時,num_ctus_in_slice_minus1的值被限制在0到PicSizeInCtbsY-1(包括兩端)的範圍內。如果不存在,則推斷num_ctus_in_slice_minus1等於PicSizeInCtbsY-1。
語法元素slice_address指定切片的切片地址。當slice_address不存在時,slice_address的值推斷為0。
如果slices_in_pic_present_flag等於1,則以下條件適用:
- 切片地址是圖片的CTB光柵掃描中切片中的第一個CTB。
- slice_address的長度為Ceil(Log2(PicSizeInCtbsY))位元。
- slice_address的值應在0到PicSizeInCtbsY-1之間(包括0和PicSizeInCtbsY-1),並且slice_address的值不得等於同一編碼圖片的任何其他編碼切片NAL單元的slice_address的值。
否則,如果rect_slice_flag等於0,則適用以下條件:
- 切片地址是光柵掃描圖塊索引。
- slice_address的長度為Ceil(Log2(NumTilesInPic))位元。
- slice_address的值應在0到NumTilesInPic-1之間(包括0和NumTilesInPic-1)。
否則(rect_slice_flag等於1),適用以下條件:
- 切片地址是第SubPicIdx個子圖片中切片的切片索引。
- slice_address的長度為Ceil(Log2(NumSlicesInSubpic[SubPicIdx]))位元。
- slice_address的值應在0到NumSlicesInSubpic[SubPicIdx]-1之間的範圍內(包括0和NumSlicesInSubpic[SubPicIdx]-1)。
在一些實施例中,對於位元流一致性(bitstream conformance),
適用以下約束:
- 如果rect_slice_flag等於0或subpics_present_flag等於0,則slice_address的值不得等於同一編解碼圖片的任何其他編解碼切片NAL單元的slice_address的值。
- 否則,slice_subpic_id和slice_address的值對不應等於同一編解碼圖片的任何其他編解碼切片NAL單元的slice_subpic_id和slice_address的值對。
- 當rect_slice_flag等於0時,圖片的切片應按其slice_address值的升序排列。
- 圖片的切片形狀應使每個CTU在解碼時應使其整個左邊界和整個頂部邊界由圖片邊界組成,或由先前解碼的CTU的邊界組成。
語法元素num_tiles_in_slice_minus1的值加1(如果存在)指定切片中的圖塊數。num_tiles_in_slice_minus1的值應在0到NumTilesInPic-1之間(包括0和NumTilesInPic-1)。
變量NumCtuInCurrSlice(其指定當前切片中的CTU的數目)以及列表CtbAddrInCurrSlice[i](其中i的範圍為0至NumCtuInCurrSlice-1(包括1和NumCtuInCurrSlice-1),其指定在切片中的第i個CTB的圖片光柵掃描地址)的導出如下:
在一些實施例中,允許光柵掃描切片的圖塊內切片(slice-in-tile)情況,並且切片可以是矩形或可以不是矩形。在一些實施例中,語法元素no_pic_partition_flag等於0指定了可以將參考PPS的每個圖片劃分成一個以上的圖塊或切片。在一些實施例中,對於光柵掃描圖塊內切片的情況,在圖塊內以光柵掃描的CTU為單位指定每個切片。
第2圖示出了視訊圖片200中在圖塊中按光柵掃描的切片,(或在光柵掃描圖塊中切片的情況下)具有在圖塊中的切片。視訊圖片200具有由圖塊邊界分開的兩個圖塊211和212。每個圖塊都包括受圖塊邊界限制的按光柵掃描的切片,例如圖塊211中的非矩形切片221和222,以及圖塊212中的非矩形切片
223。在一些實施例中,當當前圖片被劃分為非矩形切片(或光柵掃描切片)時,在位元流中指定是否在一個圖塊中編解碼多個切片。當在一個圖塊中編解碼多個切片時,在位元流中指定切片中的CTU數。表5顯示了光柵掃描圖塊中切片的情況下的切片報頭語法。
語法元素slices_in_tile_present_flag的值等於1表示在切片中存在多個切片。slices_in_tile_present_flag的值等於0表示當前圖塊中不存在多個切片。如果不存在,則將slices_in_tile_present_flag推斷為等於0。
語法元素num_ctus_in_slice_minus1的值加1指定當前切片中的CTU數。當slices_in_tile_present_flag的值等於1時,num_ctus_in_slice_minus1的值應在0到TileSizeInCtbsY-1範圍內(包含0和TileSizeInCtbsY-1),其中TileSizeInCtbsY=RowHeight[tileY] * RowWidth[tileX],tileX是包含當前切片的圖塊列索引,而tileY是包含當前切片的圖塊行索引。如果不存在,則推斷num_ctus_in_slice_minus1等於PicSizeInCtbsY-1。
語法元素slice_address的值指定切片的切片地址。如果不存在,則將slice_address的值推斷為等於0。
如果slices_in_tiie_present_flag等於1,則以下條件適用:
- 切片地址是圖片按CTB光柵掃描該切片中的第一個CTB。
- slice_address的長度為Ceil(Log2(TileSizeInCtbsY))位元。
- slice_address的值應在0到TileSizeInCtbsY-1(含0和TileSizeInCtbsY-1)
範圍內,並且slice_address的值不得等於同一編解碼圖片的任何其他編解碼切片NAL單元的slice_address的值。
否則,如果rect_slice_flag等於0,則適用以下條件:
- 切片地址是光柵掃描圖塊索引。
- slice_address的長度為Ceil(Log2(NumTilesInPic))位元。
- slice_address的值應在0到NumTilesInPic-1之間(包括0和NumTilesInPic-1)。
否則(rect_slice_flag等於1),適用以下條件:
- 切片地址是第SubPicIdx個子圖片中切片的切片索引。
- slice_address的長度為Ceil(Log2(NumSlicesInSubpic[SubPicIdx]))位元。
- slice_address的值應在0到NumSlicesInSubpic[SubPicIdx]-1之間(包括0和NumSlicesInSubpic[SubPicIdx]-1)。
在一些實施例中,對於位元流一致性,適用以下約束:
- 如果rect_slice_flag等於0或subpics_present_flag等於0,則slice_address的值不得等於同一編解碼圖片的任何其他編解碼切片NAL單元的slice_address的值。
- 否則,slice_subpic_id和slice_address的值對不應等於同一編解碼圖片的任何其他編解碼切片NAL單元的slice_subpic_id和slice_address的值對。
- 當rect_slice_flag等於0時,圖片的切片應按其slice_address值的升序排列。
- 圖片的切片形狀應使每個CTU在解碼時應使其整個左邊界和整個頂部邊界由圖片邊界組成或由先前解碼的CTU的邊界組成。
語法元素num_tiles_in_slice_minus1加1的值(如果存在)指定切片中的圖塊數。num_tiles_in_slice_minus1的值應在0到NumTilesInPic-1之間(包括0和NumTilesInPic-1)。
變量NumCtuInCurrSlice(其指定當前切片中的CTU的數目)以及列表CtbAddrInCurrSlice[i](其中i的範圍為0至NumCtuInCurrSlice-1(包括0和NumCtuInCurrSlice-1),其指定切片中第i個CTB的圖片光柵掃描地址)的導出如下:
在編解碼視訊中,圖片的圖片報頭(picture header,簡寫為PH)可以用作圖片的開頭。與存儲多個圖片(該多個圖片引用該PPS)通用的資訊的PPS不同,圖片的圖片報頭存儲圖片獨有(unique)的資訊。圖片的圖片報頭可以存儲圖片的參數,這些參數對於圖片的不同切片保持相同。例如,在一些實施例中,在圖片報頭中指定圖片的圖片順序計數。圖片的圖片次序計數可用於編碼或解碼圖片,例如,用於創建用於訊框間預測的合併候選的內插(interpolated)或外推(extrapolated)運動矢量。當重複圖片報頭作為丟失檢測機制(loss detection mechanism)時,圖片順序計數還可以用作圖片的標識符。表6A示出了指定圖片順序計數的圖片報頭。
語法元素ph_pic_order_cnt_lsb以MaxPicOrderCntLsb為模數指定當前圖片的圖片順序計數。ph_pic_order_cnt_lsb語法元素的長度為log2_max_pic_order_cnt_lsb_minus4+4位元。ph_pic_order_cnt_lsb的值應在0到MaxPicOrderCntLsb-1(包含0以及MaxPicOrderCntLsb-1)範圍內。當發生PH重複時,語法元素ph_pic_order_cnt_lsb可用作標識符。在所有重複圖片報頭中,ph_pic_order_cnt_lsb的值均相同。在一些實施例中,圖片報頭還可以包括圖片報頭重複標誌。表6B示出了包括圖片順序計數和圖片報頭重複標誌(repetition flag)的圖片報頭。
語法元素ph_repetition_present_flag的值等於1表示存在ph_pic_order_cnt_lsb用於與PH關聯的編解碼圖片。對於已編解碼圖片,圖片報頭重複可能會或可能不會發生。ph_repetition_flag的值等於0表示不存在ph_pic_order_cnt_lsb。
在一些實施例中,圖片中的切片中的每個切片報頭具有語法元素slice_pic_order_cnt_lsb,其語法值等於PH中的ph_pic_order_cnt_lsb。表7顯示了
指定圖片順序計數的切片報頭。
在一些實施例中,切片報頭語法元素slice_pic_order_cnt_lsb的值在編解碼圖片的所有切片報頭中是相同的,並且對於與圖片或PH相關聯的切片,slice_pic_order_cnt_lsb的值等於圖片的PH中的ph_pic_order_cnt_lsb。在一些實施例中,當PH語法元素ph_pic_order_cnt_lsb不存在時,SH語法元素slice_pic_order_cnt_lsb以MaxPicOrderCntLsb為模數指定當前圖片的圖片順序計數。slice_pic_order_cnt_lsb語法元素的長度為
log2_max_pic_order_cnt_lsb_minus4+4位元。slice_pic_order_cnt_lsb的值應在0到MaxPicOrderCntLsb-1(含0和MaxPicOrderCntLsb-1)範圍內。當存在ph_pic_order_cnt_lsb時,與PH相關的切片的slice_pic_order_cnt_lsb應等於ph_pic_order_cnt_lsb。
在一些實施例中,當當前圖片是漸進解碼刷新(gradual decoding refresh,簡寫為GDR)圖片時,根據RpPicOrderCntVal=PicOrderCntVal+recovery_poc_cnt導出變量RpPicOrderCntVal。
視訊編解碼器必須遵循前述語法設計以便生成合法的位元流,並且只有在解析過程符合前述語法設計的情況下,視訊解碼器才能夠正確地解碼位元流。當在位元流中跳過語法時,編碼器和解碼器應將語法值設置為推斷值,以確保編碼和解碼結果匹配。
第3圖示出了示例性視訊編碼器300。如圖所示,視訊編碼器300從視訊源305接收輸入視訊信號,並將該信號編碼為位元流395。視訊編碼器300具有用於對來自視訊源305的信號進行編碼的若干組件或模組。至少包括從以下模組中選擇的一些組件:變換模組310、量化模組311、逆量化模組314、逆變換模組315、圖片內估計模組320、訊框內預測模組325、運動補償模組330、運動估計模組335,環路濾波器345,重構圖片緩衝器350,MV緩衝器365和MV預測模組375以及熵編碼器390。運動補償模組330和運動估計模組335是訊框間預測模組340的一部分。
在一些實施例中,模組310-390是由計算設備或電子設備的一個或多個處理單元(例如,處理器)執行的軟體指令的模組。在一些實施例中,模組310-390是由電子設備的一個或多個集體電路(IC)實現的硬體電路的模組。儘管將模組310-390圖示為單獨的模組,但是某些模組可以組合為單個模組。
視訊源305提供原始視訊信號,該原始視訊信號無需壓縮即可呈現每個視訊訊框的像素資料。減法器308計算視訊源305的原始視訊像素資料與來自運動補償模組330或訊框內預測模組325的預測像素資料313之間的差。變換模組310轉換該差(或殘差像素資料或殘差信號309)成變換係數(例如,通過執行離散餘弦變換或DCT)。量化模組311將變換係數量化為量化資料(或量化係數)312,其由熵編碼器390編碼為位元流395。
逆量化模組314對量化資料(或量化係數)312解量化以獲得變換係數,並且逆變換模組315對變換係數執行逆變換以產生重構殘差319。重構殘差319與預測像素資料313相加以產生重構像素資料317。在一些實施例中,重構像素資料317被臨時存儲在行緩衝器(line buffer)(未示出)中,以用於圖片內預測和空間MV預測。重構像素由環路濾波器345濾波,並存儲在重構圖片緩衝器350中。在一些實施例中,重構圖片緩衝器350是視訊編碼器300外部的記憶體。在一些實施例中,重構圖片緩衝器350是視訊編碼器300內部的記憶體。
圖片內估計模組320基於重構的像素資料317執行訊框內預測以產生訊框內預測資料。訊框內預測資料被提供給熵編碼器390以被編解碼為位元流395。訊框內預測資料還被訊框內預測模組325使用以產生預測像素資料313。
運動估計模組335通過產生參考存儲在重構圖片緩衝器350中的先前解碼的訊框像素資料的MV來執行訊框間預測。這些MV被提供給運動補償模組330以產生預測像素資料。
代替對位元流中的完整的實際MV進行編碼,視訊編碼器300使用MV預測來生成預測的MV,並且將用於運動補償的MV與預測的MV之間的差編碼為殘差運動資料並存儲在位元流395中。
MV預測模組375基於參考MV生成預測的MV,參考MV是為了對先前的視訊訊框進行編碼而生成的,即,用於執行運動補償的運動補償MV。MV
預測模組375從MV緩衝器365中的先前視訊訊框中擷取參考MV。視訊編碼器300將針對當前視訊訊框生成的MV存儲在MV緩衝器365中,作為用於生成預測MV的參考MV。
MV預測模組375使用參考MV來創建預測的MV。可以通過空間MV預測或時間MV預測來計算預測的MV。熵編碼器390將當前訊框的預測MV和運動補償MV(MC MV)之間的差(殘差運動資料)編碼到位元流395中。
熵編碼器390通過使用諸如上下文自適應二進制算術編解碼(CABAC)或霍夫曼編碼的熵編解碼技術將各種參數和資料編碼到位元流395中。熵編碼器390將各種報頭元素、標誌以及量化的變換係數312和殘差運動資料作為語法元素編解碼到位元流395中。位元流395又被存儲在存儲設備中或通過通信介質(例如網路)被傳輸到解碼器。
環路濾波器345對重構的像素資料317執行濾波或平滑操作,以減少編解碼的偽像,特別是在像素塊的邊界處。在一些實施例中,執行的濾波操作包括樣本自適應偏移(SAO)。在一些實施例中,濾波操作包括自適應環路濾波器(ALF)。
第4圖說明視訊編碼器300的實施子圖片佈局、切片結構和圖片識別的指定的部分。具體地,圖片劃分引擎410基於一組速率/失真資訊415為熵編碼器390生成一組圖片分區指定(picture partitioning specification)420。這些圖片分區指定420包括切片佈局資訊、子圖片佈局資訊和切片佈局資訊。熵編碼器390相應地在位元流395的SPS、PPS、或PH裏發信標誌或參數,例如子圖片的位置和大小、圖塊內切片或圖片內切片指示,光柵掃描切片或矩形切片指示。熵編碼器390還可在位元流395中的圖片報頭中發信圖片順序計數和圖片報頭重複指示。圖片分區引擎410還將相應的圖片分區佈局430提供給變換模組310、圖片內估計模組320、圖片內預測模組325、訊框間預測模組340等,因此這些模組可
以根據子圖片、圖塊和切片佈局對當前圖片進行編碼。
第5圖概念性地示出了用於指定子圖片佈局、切片結構和圖片標識的過程500。在一些實施例中,計算設備的一個或多個處理單元(例如,處理器)實現編碼器300,通過執行存儲在計算機可讀介質中的指令來執行過程500。在一些實施例中,實現編碼器300的電子設備執行過程500。
編碼器從原始像素資料接收資料,以將其編解碼為位元流中的視訊的當前圖片(在框510處)。編碼器確定在當前圖片中是否對多個子圖片進行了編解碼(在框515處)。如果是,則處理進行到520。如果在當前圖片中僅編解碼一個子圖片(或沒有子圖片),則處理進行到555。
在框520,編碼器發信關於位元流中當前圖片的第一子圖片的大小的指定。在位元流中未指定第一子圖片的位置、當前圖片的最後子圖片的位置和大小。在一些實施例中,編碼器在位元流中發信多個子圖片的位置和大小,而在發信期間將第一子圖片的位置和最後子圖片的大小作為推斷值。
編碼器可以發信第二子圖片(不是最後的圖片)的大小和位置的指定(在框530處)。編碼器推斷第一子圖片的位置(在框540)。編碼器還推斷最後一個子圖片的位置和大小(在框550)。然後,該過程進行到框560。
在框555,編碼器推斷當前圖片的唯一子圖片的位置和大小。當前圖片中唯一子圖片的位置和大小未在位元流中指定。然後,編碼器進行到560。編碼器將當前圖片和子圖片編碼到位元流中(在560處)。子圖片根據指定的和/或推斷的子圖片的位置和大小進行編碼。
在一些實施例中,編碼器還將當前圖片的圖片報頭中的當前圖片的圖片順序計數發信到位元流中。在一些實施例中,當在位元流中重複用於當前圖片的圖片報頭時(例如,當存在ph_repetition_resent_flag以指示圖片報頭被重複時),在位元流中發信圖片順序計數。在這些情況下,圖片順序計數可用作
將重複的圖片報頭與當前圖片相關聯的標識符。在一些實施例中,還在當前圖片的切片報頭中發信當前圖片的圖片順序計數,並且在切片報頭中發信的圖片順序計數具有與在圖片報頭中發信的圖片順序計數相同的值。
在一些實施例中,當允許將當前圖片劃分為多個光柵掃描切片(或非矩形切片)(例如,光柵scan_slice_in_pic_enabled標誌)時,編碼器在位元流中指定是否在當前圖片中對多個切片進行編解碼(例如slices_pic_present_flag)。在一些實施例中,當當前圖片被劃分為多個光柵掃描切片並且在當前圖片中對多個切片進行編解碼時,編碼器在切片報頭中指定切片中的多個CTU(例如,num_ctus_in_slice_minus1)。
在一些實施例中,當當前圖片被劃分為非矩形切片(或光柵掃描切片)(例如,rect_slice_flag=0)時,編碼器指定是否在位元流中的切片中對多個切片進行編解碼(例如,slices_in_tile_present_flag))。在一些實施例中,當當前圖片被劃分成非矩形切片並且當在圖塊中對多個切片進行編解碼時,編碼器在位元流中指定切片中的多個CTU(例如,num_ctus_in_slice_minus1)。
第6圖示出了示例視訊解碼器600,該示例視訊解碼器600接收並應用子圖片佈局、切片結構和圖片標識的指定。如圖所示,視訊解碼器600是圖片解碼或視訊解碼電路,其接收位元流695並將位元流的內容解碼為視訊訊框的像素資料以供顯示。視訊解碼器600具有用於解碼位元流695的若干組件或模組,包括選自逆量化模組611、逆變換模組610、訊框內預測模組625、運動補償模組630、環路濾波器645、解碼圖片緩衝器650、MV緩衝器665、MV預測模組675和解析器690中的一些組件。運動補償模組630是訊框間預測模組640的一部分。
在一些實施例中,模組610-690是由計算設備的一個或多個處理單元(例如,處理器)執行的軟體指令的模組。在一些實施例中,模組610-690
是由電子設備的一個或多個IC實現的硬體電路的模組。儘管模組610-690被示為單獨的模組,但是一些模組可以組合成單個模組。[0098]解析器690(或熵解碼器)接收位元流695,並根據由視訊編解碼或圖片編解碼標准定義的語法執行初始解析。解析的語法元素包括各種報頭元素,標誌以及量化的資料(或量化的係數)612。解析器690通過使用諸如上下文自適應二進制算術編解碼(CABAC)或上下文編解碼的熵編解碼技術解析各種語法元素。霍夫曼編解碼。
逆量化模組611對量化資料(或量化係數)612進行去量化以獲得變換係數,並且逆變換模組610對變換係數616執行逆變換以產生重構殘差信號619。重構殘差信號619與來自訊框內預測模組625或運動補償模組630的預測像素資料613相加,以生成解碼像素資料617。解碼像素資料由環路濾波器645濾波,並存儲在解碼圖片緩衝器650中。在一些實施例中,解碼圖片緩衝器650是視訊解碼器600外部的記憶體。在一些實施例中,解碼圖片緩衝器650是視訊解碼器600內部的記憶體。
訊框內預測模組625從位元流695接收訊框內預測資料,並據此從存儲在解碼圖片緩衝器650中的解碼像素資料617中生成預測像素資料613。在一些實施例中,解碼像素資料617也被存儲在用於圖片內預測和空間MV預測的行緩衝器(未示出)中。
在一些實施例中,解碼圖片緩衝器650的內容用於顯示。顯示設備655或者檢索解碼圖片緩衝器650的內容以直接顯示,或者將解碼圖片緩衝器的內容檢索到顯示緩衝器。在一些實施例中,顯示設備通過像素傳輸從解碼圖片緩衝器650接收像素值。
運動補償模組630根據運動補償MV(MC MV)從存儲在解碼圖片緩衝器650中的解碼像素資料617中生成預測像素資料613。通過將從位元流695接收到的殘差運動資料與從MV預測模組675接收到的預測MV相加,可以對
這些運動補償MV進行解碼。
MV預測模組675基於為解碼先前的視訊訊框而生成的參考MV(例如,用於執行運動補償的運動補償MV)來生成預測的MV。MV預測模組675從MV緩衝器665中檢索先前視訊訊框的參考MV。視訊解碼器600將為解碼當前視訊訊框而生成的運動補償MV存儲在MV緩衝器665中,作為用於產生預測MV的參考MV。
環路濾波器645對解碼的像素資料617執行濾波或平滑操作,以減少編解碼的偽像,特別是在像素塊的邊界處。在一些實施例中,執行的濾波操作包括樣本自適應偏移(SAO)。在一些實施例中,濾波操作包括自適應環路濾波器(ALF)。
第7圖說明視訊解碼器600的部分,其接收並應用子圖片佈局、切片結構和圖片識別的指定。具體地,熵解碼器690解析位元流695以用於與圖片分割有關的語法元素,包括在位元流695的SPS、PPS或切片報頭中的諸如子圖片的位置和大小、圖塊內切片或圖片內切片指示、光柵掃描切片或矩形切片指示的標誌或參數。熵解碼器690還解析圖片報頭中的圖片順序計數和圖片報頭重複指示。基於解析的語法元素,熵解碼器690生成用於圖片分區引擎710的一組圖片分區資訊720。圖片分區引擎710將相應的圖片分區佈局730提供給逆變換模組610、圖片內預測模組625、訊框間預測模組640等,因此這些模組可以根據子圖片、圖塊和切片佈局來重構當前圖片。
第8圖概念性地示出了用於接收子圖片佈局、切片結構和圖片標識的指定的過程800。在一些實施例中,計算設備的一個或多個處理單元(例如,處理器)實現解碼器600通過執行存儲在計算機可讀介質中的指令來執行過程800。在一些實施例中,實現解碼器600的電子裝置執行過程800。
解碼器從位元流接收資料以將其解碼為視訊的當前圖片(在框
810處)。解碼器確定在當前圖片中是否編解碼了多個子圖片(在框815)。如果是,則處理進行到820。如果在當前圖片中僅編解碼一個子圖片(或沒有子圖片),則處理進行到855。
在框820處,解碼器接收針對位元流中當前圖片的第一子圖片的大小的指定。在位元流中未指定當前圖片的第一子圖片的位置、最後子圖片的位置和大小。在一些實施例中,解碼器為多個子圖片的位置和大小解析位元流,並且在解析期間跳過第一子圖片的位置和最後一個子圖片的大小。
解碼器可以接收關於第二子圖片(不是最後的圖片)的大小和位置的指定(在框830處)。解碼器推斷第一子圖片的位置(在框840)。解碼器還推斷最後一個子圖片的位置和大小(在框850)。然後,該過程進行到框860。
在框855,解碼器推斷當前圖片的唯一子圖片的位置和大小。當前圖片中唯一子圖片的位置和大小未在位元流中指定。然後,解碼器進行到860。解碼器重構當前圖片和子圖片(在框860處)。根據指定的和/或推斷的子圖片的位置和大小來重構子圖片。
在一些實施例中,解碼器還從位元流接收當前圖片的圖片報頭中的當前圖片的圖片順序計數。在一些實施例中,當在位元流中重複用於當前圖片的圖片報頭時(例如,當存在ph_repetition_resent_flag以指示圖片報頭被重複時),在位元流中發信圖片順序計數。在這些情況下,圖片順序計數可用作將重複的圖片報頭與當前圖片相關聯的標識符。在一些實施例中,還在當前圖片的切片報頭中發信當前圖片的圖片順序計數,並且在切片報頭中發信的圖片順序計數具有與在圖片報頭中發信的圖片順序計數相同的值。
在一些實施例中,當允許將當前圖片劃分為多個光柵掃描切片(或非矩形切片)(例如,光柵scan_slice_in_pic_enabled標誌)時,解碼器從位元流接收指示是否在當前圖片中編解碼了多個切片(例如
slices_pic_present_flag)。在一些實施例中,當當前圖片被劃分成多個光柵掃描切片並且在當前圖片中對多個切片進行編解碼時,解碼器從切片報頭中接收來自位元流切片中的多個CTU的指定(例如,num_ctus_in_slice_minus1)。
在一些實施例中,當當前圖片被劃分為非矩形切片(或光柵掃描切片)(例如,rect_slice_flag=0)時,解碼器從位元流接收關於是否在圖塊中對多個切片進行編解碼的指定(例如slices_in_tile_present_flag)。在一些實施例中,當當前圖片被劃分成非矩形切片並且當在圖塊中對多個切片進行編解碼時,解碼器從位元流接收切片中的多個CTU的指定(例如,num_ctus_in_slice_minus1)。
在一些實施例中,編碼器可以發信(或生成)位元流中的一個或多個語法元素,使得解碼器可以從位元流中解析所述一個或多個語法元素。
許多上述特徵和應用被實現為被指定為記錄在計算機可讀存儲介質(也稱為計算機可讀介質)上的一組指令的軟體過程。當這些指令由一個或多個計算或處理單元(例如,一個或多個處理器、處理器的核心或其他處理單元)執行時,它們使處理單元執行指令中指示的動作。計算機可讀介質的示例包括但不限於CD-ROM、閃存驅動器、隨機存取記憶體(RAM)晶片、硬碟驅動器、可擦可程式化只讀記憶體(EPROM)、電可擦可程式化只讀記憶體(EEPROM)等。計算機可讀介質不包括無線或通過有線連接傳遞的載波和電子信號。
在本說明書中,術語“軟體”旨在包括駐留在只讀記憶體中的韌體或存儲在磁性記憶體中的應用程式,其可以被讀入記憶體中以由處理器進行處理。而且,在一些實施例中,可以將多個軟體發明實現為較大程式的子部分,
同時保留不同的軟體發明。在一些實施例中,多種軟體發明也可以被實現為單獨的程式。最後,一起實現此處描述的軟體發明的單獨程式的任何組合都在本公開的範圍內。在一些實施例中,軟體程式在被安裝以在一個或多個電子系統上運行時,定義了一種或多種實施和執行軟體程式的操作的特定機器實現。
第9圖概念性地示出了利用其來實現本公開的一些實施例的電子系統900。電子系統900可以是計算機(例如,台式計算機、個人計算機、平板計算機等)、電話、PDA或任何其他種類的電子設備。這樣的電子系統包括各種類型的計算機可讀介質以及用於各種其他類型的計算機可讀介質的接口。電子系統900包括匯流排905、處理單元910、圖形處理單元(GPU)915、系統記憶體920、網路925、只讀記憶體930、永久存儲設備935、輸入設備940和輸出設備945。
匯流排905共同代表通信地連接電子系統900的眾多內部設備的所有系統匯流排、外圍設備匯流排和晶片組匯流排。例如,匯流排905將處理單元910與GPU 915、只讀記憶體930、系統記憶體920和永久存儲設備935進行通信連接。
處理單元910從這些各種存儲單元中檢索要執行的指令和要處理的資料,以便執行本公開的處理。在不同的實施例中,一個或多個處理單元可以是單個處理器或多核處理器。一些指令被傳遞到GPU 915並由其執行。GPU915可以卸載各種計算或補充由處理單元910提供的圖片處理。
只讀記憶體(ROM)930存儲由處理單元910和電子系統的其他模組使用的靜態資料和指令。另一方面,永久存儲設備935是讀寫存儲設備。該設備是即使在電子系統900關閉時也存儲指令和資料的非易失性存儲單元。本公開的一些實施例使用大容量存儲設備(諸如磁碟或光碟及其對應的磁碟驅動器)作為永久存儲設備935。
其他實施例使用可移動存儲設備(例如軟碟、閃存設備等,及其對應的磁碟驅動器)作為永久存儲設備。像永久存儲設備935一樣,系統記憶體920是讀寫存儲設備。然而,與存儲設備935不同,系統記憶體920是易失性讀寫記憶體,例如隨機存取記憶體。系統記憶體920存儲處理器在運行時使用的一些指令和資料。在一些實施例中,根據本公開的過程被存儲在系統記憶體920、永久存儲設備935和/或只讀記憶體930中。例如,各種存儲單元包括用於根據一些實施例處理多媒體剪輯的指令。處理單元910從這些各種存儲單元中檢索要執行的指令和要處理的資料,以便執行一些實施例的處理。
匯流排905還連接到輸入和輸出設備940和945。輸入設備940使用戶能夠向電子系統傳達資訊並選擇命令。輸入設備940包括字母數位鍵盤和指示設備(也稱為“光標控制設備”),照相機(例如,網路攝像頭),麥克風或用於接收語音命令的類似設備等。輸出設備945顯示由電子系統生成的圖片或其他輸出資料。輸出設備945包括打印機和顯示設備,例如陰極射線管(CRT)或液晶顯示器(LCD),以及揚聲器或類似的音頻輸出設備。一些實施例包括既充當輸入設備又充當輸出設備的設備,例如觸摸屏。
最後,如第9圖所示,匯流排905還通過網路適配器(未示出)將電子系統900耦合到網路925。以這種方式,計算機可以是計算機網路的一部分(例如局域網(“LAN”)、廣域網(“WAN”)、或內聯網、或網路網,例如因特網)。電子系統900的任何或所有組件可以與本公開結合使用。
一些實施例包括電子組件,例如微處理器,將計算機程式指令存儲在機器可讀或計算機可讀介質(或者稱為計算機可讀存儲介質、機器可讀介質或機器可讀存儲介質)中的存儲和記憶體。這種計算機可讀介質的一些示例包括RAM、ROM、只讀光碟(CD-ROM)、可記錄光碟(CD-R)、可重寫光碟
(CD-RW)、只讀數位多功能光碟(例如,DVD-ROM、雙層DVD-ROM)、各種可記錄/可重寫DVD(例如DVD-RAM、DVD-RW、DVD+RW等)、閃存(例如SD卡、mini-SD卡、micro-SD卡等)、磁性和/或固態硬碟驅動器、只讀和可記錄的Blu-Ray®光碟、超密度光碟、任何其他光學或磁性介質以及軟碟。該計算機可讀介質可以存儲可由至少一個處理單元執行的計算機程式,並且該計算機程式包括用於執行各種操作的指令集。計算機程式或計算機代碼的示例包括諸如由編譯器產生的機器代碼,以及包括由計算機、電子部件或使用解釋器的微處理器執行的高級代碼的文件。
儘管以上討論主要是指執行軟體的微處理器或多核處理器,但是許多上述特徵和應用是由一個或多個集體電路執行的,例如專用集體電路(ASIC)或現場可程式化控制器門陣列(FPGA)。在一些實施例中,這樣的集體電路執行存儲在電路本身上的指令。另外,一些實施例執行存儲在可程式化邏輯設備(PLD),ROM或RAM設備中的軟體。
如在本說明書和本申請的任何申請專利範圍中所使用的,術語“計算機”、“服務器”、“處理器”和“記憶體”均指電子或其他技術設備。這些術語不包括個人或人群。為了說明的目的,術語“顯示”或“顯示”表示在電子設備上顯示。如本說明書和本申請的任何申請專利範圍中所使用的,術語“計算機可讀介質”、“計算機可讀媒介”和“機器可讀介質”完全限於有形的物理對象,該有形的物理對像以可被計算機讀取的形式存儲資訊。這些術語不包括任何無線信號、有線下載信號和任何其他臨時信號。
儘管已經參考許多具體細節描述了本公開,但是所屬領域具有通常知識者將認識到,在不脫離本公開的精神的情況下,可以以其他具體形式來體現本公開。另外,許多附圖(包括第5圖和第8圖)在概念上示出了過程。這些過程的特定操作可能無法按照所示和所描述的確切順序執行。可以不在一個
連續的一系列操作中執行特定操作,並且可以在不同的實施例中執行不同的特定操作。此外,該過程可以使用幾個子過程來實現,或者作為更大的宏過程的一部分來實現。因此,所屬領域具有通常知識者將理解,本公開不受限於前述說明性細節,而是由所附申請專利範圍限定。
文中描述的主題有時示出了包含在其它不同部件內的或與其它不同部件連接的不同部件。應當理解:這樣描繪的架構僅僅是示例性的,並且,實際上可以實施實現相同功能的許多其它架構。在概念意義上,實現相同功能的部件的任何布置是有效地“相關聯的”,以使得實現期望的功能。因此,文中被組合以獲得特定功能的任意兩個部件可以被視為彼此“相關聯的”似實現期望的功能,而不管架構或中間部件如何。類似地,這樣相關聯的任意兩個部件還可以被視為彼此“可操作地連接的”或“可操作地耦接的”,以實現期望的功能,並且,能夠這樣相關聯的任意兩個部件還可以被視為彼此“操作上可耦接的”,以實現期望的功能。“操作上可耦接的”的具體示例包含但不限於:實體地可聯結和/或實體地相互、作用的部件、和/或無線地可相互作用和/或無線地相互作用的部件、和/或邏輯地相互作用的和/或邏輯地可相互作用的部件。
此外,關於文中基本上任何複數和/或單數術語的使用,只要對於上下文和/或應用是合適的,所屬技術領域具有通常知識者可以將複數變換成單數,和/或將單數變換成複數。為清楚起見,這裡可以明確地闡述各種單數/複數排列。
所屬技術領域具有通常知識者將會理解,通常,文中所使用的術語,特別是在所附申請專利範圍(例如,所附申請專利範圍中的主體)中所使用的術語通常意在作為“開放性”術語(例如,術語“包含”應當被解釋為“包含但不限幹”,術語“具有”應當被解釋為“至少具有”,術語“包含”應當被解釋為“包含但不限幹”等)。所屬技術領域具有通常知識者還將理解,如果意在所介紹的申請專利
範圍陳述對象的具體數目,則這樣的意圖將會明確地陳述在申請專利範圍中,在缺乏這樣的陳述的情況下,不存在這樣的意圖。例如,為了幫助理解,所附申請專利範圍可以包含使用介紹性短語“至少一個”和“一個或更多個”來介紹申請專利範圍陳述對象。然而,這樣的短語的使用不應當被解釋為:用不定冠詞“一個(a或an)”的申請專利範圍陳述對象的介紹將包含這樣介紹的申請專利範圍陳述對象的任何申請專利範圍限制為只包含一個這樣的陳述對象的發明,即使在同一申請專利範圍包含介紹性短語“一個或更多個”或“至少一個”以及諸如“一個(a)”或“一個(an)”之類的不定冠詞的情況下(例如,“一個(a)”和/或“一個(an)”應當通常被解釋為意味著“至少一個”或“一個或更多個”)也如此;上述對以定冠詞來介紹申請專利範圍陳述對象的情況同樣適用。另外,即使明確地陳述了介紹的申請專利範圍陳述對象的具體數目,但所屬技術領域具有通常知識者也會認識到:這樣的陳述通常應當被解釋為意味著至少所陳述的數目(例如,僅有“兩個陳述對象”而沒有其他修飾語的陳述通常意味著至少兩個陳述對象,或兩個或更多個陳述對象)。此外,在使用類似於“A、B和C中的至少一個等”的慣用語的情況下,通常這樣的結構意在所屬技術領域具有通常知識者所理解的該慣用語的含義(例如,“具有A、B和C中的至少一個的系統”將包含但不限於具有單獨的A、單獨的B、單獨的C、A和B─起、A和C一起、B和C一起和/或A、B和C一起的系統等)。在使用類似於“A、B或C中的至少一個等”的慣用語的情況下,通常這樣的結構意在所屬技術領域具有通常知識者所理解的該慣用語的含義(例如,“具有A、B或C中的至少一個的系統”將包含但不限於具有單獨的A、單獨的B、單獨的C、A和B─起、A和C一起、B和C一起和/或A、B和C一起的系統等)。所屬技術領域具有通常知識者將進一步理解,不管在說明書、申請專利範圍中還是在附圖中,表示兩個或更多個可替換的術語的幾乎任意析取詞和/或短語應當理解成考慮包含術語中的一個、術語中的任一個或所有兩個術語的可能
性。例如,短語“A或B”應當被理解成包含“A”、“B”、或“A和B”的可能性。
從前述內容可以理解,本文已經出於說明的目的描述了本公開的各種實施方式,並且在不脫離本公開的範圍和精神的情況下可以進行各種修改。因此,本文公開的各種實施方式不旨在是限制性的,真正的範圍和精神由所附申請專利範圍指示。
500:過程
510~560:框
Claims (18)
- 一種視訊解碼方法,包括:從位元流接收資料,以將其解碼為視訊的當前圖片;解析該位元流以獲取多個子圖片的位置和大小,其中在解析過程中跳過第一子圖片的位置和最後一個子圖片的大小,該第一子圖片的該位置指示該當前圖片中的像素位置,該最後一個字圖片的大小指示該最後一個子圖片的寬度或高度;以及根據該多個子圖片的位置和大小,重構該當前圖片和該當前圖片的該多個子圖片。
- 如請求項1所述之視訊解碼方法,其中,從該位元流中解析該當前圖片的第二子圖片的大小和位置。
- 如請求項1所述之視訊解碼方法,還包括:推斷該當前圖片的該第一個子圖片的該位置,該最後一個子圖片的該位置和該大小。
- 如請求項1所述之視訊解碼方法,還包括:當在該當前圖片中僅編解碼一個子圖片時,推斷該當前圖片的該子圖片的位置和大小,其中,從該位元流中既不解析該當前圖片中的該子圖片的該位置,也不解析其大小。
- 如請求項1所述之視訊解碼方法,還包括:從該位元流中從該當前圖片的圖片報頭接收該當前圖片的圖片順序計數。
- 如請求項5所述之視訊解碼方法,其中在該當前圖片的一個或多個切片報頭中發信圖片順序計數,其中在該一個或多個切片報頭中發信的該圖片順序計數具有與該圖片報頭中發信的該圖片順序計數相同的值。
- 如請求項5所述之視訊解碼方法,其中,當在該位元流中重複 用於該當前圖片的該圖片報頭時,在該位元流中發信該圖片順序計數。
- 如請求項1所述之視訊解碼方法,還包括:當該當前圖片被劃分為多個基於非圖塊的光柵掃描切片時,接收有關在該當前圖片中是否對多個切片進行編解碼的指定。
- 如請求項1所述之視訊解碼方法,還包括:當該當前圖片被劃分為多個基於非圖塊的光柵掃描切片,並且在該當前圖片中對多個切片進行編解碼時,從該位元流中接收切片中多個編解碼樹單元的指定。
- 如請求項1所述之視訊解碼方法,還包括:當該當前圖片被劃分為非矩形切片時,接收有關是否從該位元流的一個圖塊中對多個切片進行編解碼的指定。
- 如請求項1所述之視訊解碼方法,還包括:當將該當前圖片劃分為非矩形切片,以及在一個圖塊中對多個切片進行編解碼時,從該位元流接收切片中多個編解碼樹單元的指定。
- 一種視訊編解碼方法,包括:接收要被編碼或解碼的像素塊的資料作為視訊的當前圖片的當前塊;接收包括該當前圖片的圖片順序計數的圖片報頭;以及基於該圖片順序計數對該當前圖片進行編碼或解碼。
- 如請求項12所述之視訊編解碼方法,其中,該圖片報頭存儲對於該當前圖片唯一併且對於該當前圖片的不同切片通用的參數。
- 如請求項12所述之視訊編解碼方法,還包括:當在位元流中重複該當前圖片的該圖片報頭時,在該圖片報頭中發信或從該圖片報頭中解析該當前圖片的該圖片順序計數。
- 如請求項12所述之視訊編解碼方法,其中,進一步在該當前 圖片中的多個切片的每個切片報頭中發信該圖片順序計數。
- 如請求項15所述之視訊編解碼方法,其中,在每個切片報頭中發信的該圖片順序計數具有與在該圖片報頭中發信的該圖片順序計數相同的值。
- 一種電子裝置,包括:視訊編碼器電路,配置為執行以下操作:從原始像素資料中接收資料,以將其編碼為位元流中的視訊的當前圖片;在該位元流中發信多個子圖片的位置和大小,其中在發信過程中略過第一子圖片的位置和最後一個子圖片的大小,該第一子圖片的該位置指示該當前圖片中的像素位置,該最後一個字圖片的大小指示該最後一個子圖片的寬度或高度;以及根據該多個子圖片的該位置和大小對該當前圖片和該當前圖片的該多個子圖片進行編碼。
- 如請求項17所述之電子裝置,其中,當僅存在一個子圖片時,在發信時略過將該子圖片的位置和大小。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962935115P | 2019-11-14 | 2019-11-14 | |
US62/935,115 | 2019-11-14 | ||
US201962940333P | 2019-11-26 | 2019-11-26 | |
US62/940,333 | 2019-11-26 | ||
US201962943832P | 2019-12-05 | 2019-12-05 | |
US62/943,832 | 2019-12-05 | ||
US17/096,329 | 2020-11-12 | ||
US17/096,329 US11785214B2 (en) | 2019-11-14 | 2020-11-12 | Specifying video picture information |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202131684A TW202131684A (zh) | 2021-08-16 |
TWI784348B true TWI784348B (zh) | 2022-11-21 |
Family
ID=75909088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109139668A TWI784348B (zh) | 2019-11-14 | 2020-11-13 | 視訊圖片資訊之指定技術 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11785214B2 (zh) |
TW (1) | TWI784348B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021060505A1 (ja) * | 2019-09-27 | 2021-04-01 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、および復号方法 |
CN114747213A (zh) * | 2019-09-27 | 2022-07-12 | Sk电信有限公司 | 用于获取关于从画面拆分的子单元的信息的方法和装置 |
US20230076537A1 (en) * | 2019-12-19 | 2023-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Picture header prediction |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130089134A1 (en) * | 2011-10-10 | 2013-04-11 | Qualcomm Incorporated | Efficient signaling of reference picture sets |
US20190082178A1 (en) * | 2016-03-30 | 2019-03-14 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding video using picture division information |
US20190158825A1 (en) * | 2016-06-27 | 2019-05-23 | Huawei Technologies Co., Ltd. | Encoding Method and Device and Decoding Method and Device |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130089152A1 (en) * | 2011-10-05 | 2013-04-11 | Qualcomm Incorporated | Signaling picture identification for video coding |
CA2898150C (en) * | 2012-01-30 | 2017-11-14 | Samsung Electronics Co., Ltd. | Method and apparatus for video encoding for each spatial sub-area, and method and apparatus for video decoding for each spatial sub-area |
JP2015106747A (ja) * | 2013-11-28 | 2015-06-08 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
CN110731083A (zh) * | 2017-02-23 | 2020-01-24 | 真实网络公司 | 视频编码系统和方法中的编码块位流结构和语法 |
WO2018221368A1 (ja) * | 2017-05-31 | 2018-12-06 | シャープ株式会社 | 動画像復号装置、及び動画像符号化装置 |
US11039143B2 (en) * | 2017-11-20 | 2021-06-15 | Qualcomm Incorporated | Memory reduction for context initialization with temporal prediction |
-
2020
- 2020-11-12 US US17/096,329 patent/US11785214B2/en active Active
- 2020-11-13 TW TW109139668A patent/TWI784348B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130089134A1 (en) * | 2011-10-10 | 2013-04-11 | Qualcomm Incorporated | Efficient signaling of reference picture sets |
US20190082178A1 (en) * | 2016-03-30 | 2019-03-14 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding video using picture division information |
US20190158825A1 (en) * | 2016-06-27 | 2019-05-23 | Huawei Technologies Co., Ltd. | Encoding Method and Device and Decoding Method and Device |
Also Published As
Publication number | Publication date |
---|---|
US20210152826A1 (en) | 2021-05-20 |
US11785214B2 (en) | 2023-10-10 |
TW202131684A (zh) | 2021-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI751771B (zh) | 視訊和影像編解碼中之高階信息發信 | |
TWI723448B (zh) | 圖像以及視訊資料中編碼單元的熵編解碼 | |
TWI792074B (zh) | 發信圖像以及視訊的塊分割 | |
TWI784348B (zh) | 視訊圖片資訊之指定技術 | |
US11284077B2 (en) | Signaling of subpicture structures | |
TWI792149B (zh) | 量化相關參數之傳訊技術 | |
TWI785502B (zh) | 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 | |
TWI830629B (zh) | 轉換省略區塊之傳訊編碼技術 | |
US20210176475A1 (en) | Specifying Layout In Video Pictures | |
TWI797560B (zh) | 跨層參考限制條件 | |
CN114902567A (zh) | 视频编解码中的子图像信令 | |
TWI692972B (zh) | 一種編碼/解碼的方法及電子裝置 | |
JP7405990B2 (ja) | コーディングされたピクチャ内における復号順を実装する技術 | |
TWI750802B (zh) | 視訊編解碼方法及裝置 | |
TW202349954A (zh) | 自適應編解碼的圖像以及視訊資料 | |
TW202349951A (zh) | 塊分區圖像及視訊資料 | |
TW202341736A (zh) | 視訊編解碼方法及裝置 | |
TW202325025A (zh) | 具有編碼參數的局部照明補償 |