TWI785502B - 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 - Google Patents

在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 Download PDF

Info

Publication number
TWI785502B
TWI785502B TW110105529A TW110105529A TWI785502B TW I785502 B TWI785502 B TW I785502B TW 110105529 A TW110105529 A TW 110105529A TW 110105529 A TW110105529 A TW 110105529A TW I785502 B TWI785502 B TW I785502B
Authority
TW
Taiwan
Prior art keywords
slice
current
chunks
chunk
video
Prior art date
Application number
TW110105529A
Other languages
English (en)
Other versions
TW202133611A (zh
Inventor
徐志瑋
魯林 陳
陳俊嘉
蕭裕霖
黃毓文
陳慶曄
莊子德
Original Assignee
聯發科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 聯發科技股份有限公司 filed Critical 聯發科技股份有限公司
Publication of TW202133611A publication Critical patent/TW202133611A/zh
Application granted granted Critical
Publication of TWI785502B publication Critical patent/TWI785502B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

提供將視訊畫面(picture)的切片(slice)分割為切片組塊(slice chunk)的一種視訊系統。一視訊解碼器接收來自一位元流的資料以被解碼作為一視訊的一當前畫面。當該當前畫面的一畫面參數集中的一第一語法元素指示出該當前畫面的一或多個切片被允許分割為多個切片組塊時,以及當該當前畫面的一當前切片的一切片標頭中的一第二語法元素指示出該當前切片的資料被以二或多個切片組塊加以編碼與傳遞時,視訊解碼器剖析與指明該當前切片的切片組塊的尺寸大小和位置,以及基於該當前切片的切片組塊重構該當前畫面。

Description

在分塊中指明切片之切片組塊的視訊編解碼方法及電子 裝置
本揭示通常涉及視訊編解碼。尤其,本揭示關於對一視訊畫面中的切片加以發信的方法。
除非此處另有說明外,本小節所描述的方法相對於下面列出的請求項而言不是先前技術,並且不因納入於本小節而被認為承認是先前技術。
高效率視訊編解碼(High Efficiency Video Coding,HEVC)的標準,是由視訊編碼聯合協作小組(Joint Collaborative Team on Video Coding,JCT-VC)所開發的國際視訊編解碼標準。輸入的視訊信號是從重構後信號加以預測,而此重構後信號是從編解碼畫面區域所加以推導。預測殘差信號是藉由一線性轉換加以處理。轉換係數以及其他邊信息一起被量化與熵編碼於位元流中。在對去量化轉換係數進行逆轉換之後,重構後信號是由預測信號與重構後殘差信號所產生。重構後信號進一步藉由環路濾波器加以處理來去除編解碼偽影。解碼後畫面被儲存於幀緩衝器中以用於預測輸入視訊信號中的後續畫面。
在HEVC中,一編解碼的畫面被分割成非重疊的方形塊區域以 相關聯的編解碼樹單元(coding tree unit,CTU)來表示。可以使用遞迴四叉樹(recursive quadtree,QT)結構將一CTU分割為多個非重疊編解碼單元(CU),以適應各種局部運動和紋理的特徵。藉由具有巢狀式多重-類型樹的一四叉樹使用二叉與三叉樹分割,一CTU可以被分割為一或多個尺寸大小較小的CU。所生成的CU分割可以是方形或長方形的形狀。
對於每一CU則會具體指定一或複數個預測單元PU。PU(與相關聯的CU語法)是作為發信預測子信息的一基本單元。然後使用所指定的預測程序,來預測PU內相關聯像素樣本的數值。使用殘差的四叉樹(RQT)結構,一CU可進一步被分割來代表相關聯的預測殘差信號。RQT結構的樹葉節點(leaf nodes)對應於轉換單元(TUs)。一轉換單元包含有數個亮度樣本(luma samples,大小為8x8、16x16或32x32)的一轉換塊(TB)或是數個亮度樣本(大小為4x4)的四個轉換塊,以及數個彩度樣本(chroma樣本,4:2:0顏色形式的一畫面)的二個相對應轉換塊。一整數轉換會應用在一轉換塊,而量化係數的等級(level)數值會與其他附加信息一起熵編解碼於位元流中。
編碼樹單元(CTU)、編碼塊(CB)、預測塊(PB)與轉換塊(TB)名詞定義是用來表明各自相關聯於CTU、CU、PU與TU的一個顏色成分的二維樣本陣列。因此一CTU是由一亮度CTB、二彩度CTB與相關聯的語法元素所組成。相似的關係也適用於CU、PU與TU。樹分割通常同時應用於亮度與彩度二者,雖然當彩度達到了某些最小大小限制時會有些例外情況。
一個經過編碼的畫面可以藉由一些切片的集合來表示,每一切片包括多個整數的CTU。在一切片中的CTU是以光柵掃描的順序(raster scanning order)逐個來處理的。一雙向預測(bi-predictive,B)切片可以用幀內預測或幀間預測來解碼,其使用最多兩個運動向量與參考索引來預測每一塊的樣本值。一預測(predictive,P)切片可以用幀內預測或幀間預測來解碼,其使用最多一 個運動向量與參考索引來預測每一塊的樣本值。一幀內(intra,I)切片則僅用幀內預測來解碼。
一編解碼畫面也可以被分割為獨立的長方形區域,稱為分塊(tile)。不同的塊在邏輯上是獨立的,因此可以藉由視訊編碼器或解碼器並行加以處理,因而提高了編解碼效率。
以下發明內容僅是說明性的,不打算以任何方式加以限制。也就是說,以下發明內容被提供以介紹此處所描述的新且非顯而易知的技術的概念、重點、好處和優勢。選擇性而不是將所有的實施方式在下面的詳細說明中進行進一步描述。因此,以下發明內容不用於決定所要求主題的本質特徵,也不用於決定所要求主題的範圍。
本揭示的有些實施例提供將視訊畫面的切片(slice)分割為切片組塊(slice chunk)的一種視訊系統。一視訊解碼器接收來自一位元流的資料以被解碼作為一視訊的一當前畫面。當該當前畫面的一畫面參數集中的一第一語法元素指示出該當前畫面的一或多個切片被允許分割為多個切片組塊時,以及當該當前畫面的一當前切片的一切片標頭中的一第二語法元素指示出該當前切片的資料包含於二或多個切片組塊並且加以傳遞時,視訊解碼器剖析與指明該當前切片的切片組塊的尺寸大小和位置,以及基於該當前切片的切片組塊重構該當前畫面。指明該當前切片的切片組塊的尺寸大小和位置;以及基於該當前切片的切片組塊重構該當前畫面。每一切片組塊是被包含於以及被傳遞於一不同NAL單元中。
在一些實施例中,一切片組塊的尺寸大小在該位元流中被指明為在該切片組塊中的CTU的行數。在一些實施例中,在切片標頭的一語法元素指 示出一特定切片組塊是否被編碼於該當前切片的一第一切片組塊。在一些實施例中,藉由識別包括該當前切片的一分塊中的一CTU行(CTU row),在切片標頭的一語法元素指明一特定切片組塊的一地址。在一些實施例中,該位元流中的語法元素識別相對應於一特定切片組塊的一開始的一編解碼樹單元,以及相對應於該特定切片組塊的一結束的一編解碼樹單元。
在一些實施例中,該當前切片被分割為多個分塊。在一些實施例中,當該當前切片不是一長方形切片時,該當前切片的一切片地址是藉由識別在該當前切片的一特定分塊來加以指明,其中該當前切片的一切片地址是藉由將一切片中的分塊的一數目加入於一先前編解碼切片的一地址中來加以推導與指明。
200:視訊編碼器
100:畫面
101、102、103:分塊
111、112、113:切片
121、122、123:切片組塊
200:視訊編碼器
205:視訊源
208:減法器
209:殘差信號
210:轉換模組
211:量化模組
212:已量化係數
213:已預測像素資料
214:逆量化模組
215:逆轉換模組
216:轉換係數
217:已重構像素資料
219:已重構殘差
220:幀內-畫面估計模組
225:幀內-畫面預測模組/幀內-預測模組
230:運動補償模組
235:運動估計模組
240:幀間-預測模組
245:迴路濾波器
250:已重構畫面緩衝器
265:MV緩衝器
275:MV預測模組
290:熵編碼器
295:位元流
315:速率/失真信息
310:畫面分割引擎
320:畫面分割規格
330:畫面分割佈局
400:程序
410~450:區塊
500:視訊解碼器
510:逆轉換模組
511:逆量化模組
512:已量化係數
513:已預測像素資料
516:轉換係數
517:已解碼像素資料
519:已重構殘差信號
525:幀內-畫面預測模組/幀內-預測模組
530:運動補償模組
540:幀間-預測模組
545:迴路濾波器
550:已解碼畫面緩衝器
555:顯示裝置
565:MV緩衝器
575:MV預測模組
590:剖析器(熵解碼器)
595:位元流
610:畫面分割引擎
620:畫面分割規格/畫面分割信息
630:畫面分割佈局
700:程序
710~750:區塊
800:電子系統
805:匯流排
810:處理單元
815:影像處理單元
820:系統記憶體
825:網路
830:唯讀記憶體
835:永久存儲裝置
840:輸入設備
845:輸出設備
下列圖式用以提供本發明的進一步理解,並被納入且構成本發明的一部分。這些圖式說明瞭本發明的實施方式,並與說明書一起用以解釋本發明的原理。為了清楚地說明本發明的概念,與實際實施方式中的尺寸相比,一些元件可以不按照比例被示出,這些圖式無需按照比例繪製。
第1圖繪示出在一畫面的一分塊(tile)中的一切片(slice)的切片組塊(slice chunk)。在圖中,虛線顯示該切片組塊的邊界。
第2圖繪示出一示例的視訊編碼器,當編碼一視訊畫面時可以將切片分割為切片組塊。
第3圖繪示出將分塊、切片、與切片組塊進行編碼的視訊編碼器的部分。
第4圖概念性繪示出用來編碼視訊畫面的一程序,於該視訊畫面中切片可以被分割為切片組塊。
第5圖繪示出可以重構視訊畫面的一示例視訊解碼器,於該視訊畫面中切片可 以被分割為切片組塊。
第6圖繪示出接收與應用分塊、切片、與切片組塊的規格(specification)的視訊解碼器的部分。
第7圖概念性繪示出用來解碼視訊畫面的一程序,於該視訊畫面中切片可以被分割為切片組塊。
第8圖概念性地繪示出本揭示的一些實施例可以於其中加以施行實作的一電子系統。。
在下面詳細的說明書中,為了透徹理解相關教示內容,透過舉例的方式進行說明大量具體的細節。基於本文所描述的教示內容的任何改變、推導和/或拓展均在本發明的保護範圍內。為了避免不必要地混淆本發明的教示內容的方面,關於此處所公開的一個或者複數個示例性實施方式中已知的方法、程式、元件和/或電路,在有些時候會用相對較高的層次加以描述而不細說。
I. 分塊與切片
一切片(slice)是(完全(exclusively)包含在一單一網路抽象層(NAL)單元中)一整數數目的完整分塊(tile)或在一畫面的一分塊之中一整數數目的連續完整CTU行。單一NAL單位的尺寸大小是在編碼後用於輸出和傳遞(到網絡或存儲)的尺寸大小。通常,使用較小的切片尺寸大小有降低編解碼效率的風險,然而使用較大的切片尺寸大小有增加處理延遲(processing delay)的風險並對低延時(low latency)應用產生負面影響。
在一些實施例中,分塊和矩形切片的結構在一視訊畫面的一畫面參數集(PPS)中指明。下面表格1是用於PPS的一示例語法表格,其中包括分塊和切片語法結構,以用於切片佈局規格的均勻和非均勻(non-uniform)二者 的分塊欄(column)與行(row)。
Figure 110105529-A0305-02-0008-1
Figure 110105529-A0305-02-0009-2
一切片-於-分塊的視訊畫面(或切片-於-分塊的情況)是將分塊分割為切片的一視訊畫面。在一些實施例中,對在切片-於-分塊的畫面中的長方形切片,切片的佈局也在適用於畫面的PPS中被指明;而由於切片寬度是分塊寬度,因此僅以CTU為單位對切片高度加以發信或推導。當切片尺寸大小等於分塊尺寸大小時,由於寬度是分塊寬度,因此僅以CTU為單位對切片高度加以發信。
II. 切片組塊
對於本揭示的一些實施例,一切片組塊是在一畫面的一分塊之中包含有一整數數目的連續完整CTU行的一部分切片(partial slice)。在一分塊之內的一切片可被順序地分割為多於一個以上的單元。這樣的單元可以被稱為“切片組塊”(或任何其他預定義的命名)。每一組塊(類似於一切片)完全(exclusively)包含在一單一NAL單元中以進行傳遞。然後切片組塊所傳送的NAL單元被依序地加以解碼。
在一些實施例中,在一畫面的一分塊中的一切片的多個切片組塊被指明按解碼順序。藉由允許將切片分割為切片組塊,每一切片的切片資料可以以較小的(NAL)單位加以傳遞,這可以幫助低延遲視訊應用來滿足延遲的要求,而切片的視頻內容可以基於所傳遞的切片資料(而與切片組塊無關)來加以重建。
第1圖繪示出在一畫面的一分塊(tile)中的一切片的切片組塊(slice chunk)。在圖中,虛線顯示該切片組塊的邊界。如圖所繪示,一畫面100包括分塊101、102、和103。分塊103被分割為三個切片111、112、和113。切片111和112沒有切片組塊。切片113被分割為切片組塊121、122、和123。切片113的資料以相對應於三個切片組塊121-123的三個NAL單元加以傳送,但是來自所有三個組塊的切片資料被一起編碼為一個切片113。
一切片標頭是在實際切片資料之前的切片的一部分。切片標頭提供用於切片資料解碼的特定信息,即切片所屬的畫面之內的編解碼CTU。在一些實施例中,一切片的每一切片組塊具有其自己的相對應切片標頭和切片資料。在一些實施例中,切片標頭具有一旗標以指示出相對應切片資料是否為一完整切片的資料或是一切片組塊的資料,並且如果是,則具有一旗標以指示出切片資料是否為該切片中一第一切片組塊的資料。
下面表格2A-C顯示用來發信切片組塊的語法元素。
Figure 110105529-A0305-02-0010-3
Figure 110105529-A0305-02-0011-4
Figure 110105529-A0305-02-0011-5
Figure 110105529-A0305-02-0012-6
Figure 110105529-A0305-02-0012-7
Figure 110105529-A0305-02-0013-8
pps_slice_chunk_enabled_flag的數值等於1指明參考該PPS的編解碼畫面的切片標頭中,語法元素multi_slice_chunks_flag存在。pps_slice_chunk_enabled_flag的數值等於0指明參考該PPS的編解碼畫面的切片標頭中,語法元素multi_slice_chunks_flag不存在。
multi_slice_chunks_flag的數值等於1指明切片被分割為多個切片組塊,以及當前切片資料是一切片組塊資料(而不是一完整的切片資料),以及每一不存在的切片標頭語法元素的數值被推論等於切片標頭中相對應切片標頭語法元素的數值。multi_slice_chunks_flag的數值等於0指明切片未被分割為多個切片組塊,並且當前切片資料是一完整的切片資料。如果不存在,multi_slice_chunks_flag的數值被推論等於0。
first_slice_chunk_in_slice_flag的數值等於1(如果存在時)指明當前切片組塊按解碼順序是切片的第一切片組塊。first_slice_chunk_in_slice_flag的數值等於0指明當前切片組塊按解碼順序不是切片的第一切片組塊。
在一些實施例中,在切片標頭中的條件測試 “if(!multi_slice_chunks_flag||multi_slice_chunks_flag && first_slice_chunk_in_slice_flag)”可以被移除,以便總是傳送完整的切片標頭語法元素。
語法元素slice_address指明切片的切片地址。當不存在時,slice_address的數值被推論為等於0。當rect_slice_flag等於1而且NumSlicesInSubpic[CurrSubpicIdx]等於1時,slice_address的數值被推論為等於0
如果rect_slice_flag等於0,適用以下:
- 切片地址是光柵掃描分塊索引。
- slice_address的長度為Ceil(Log2(NumTilesInPic))位元。
- slice_address的數值應該在0到NumTilesInPic-1之間(包括二端)的範圍。
否則(rect_slice_flag等於1),適用以下:
- 切片地址是切片的次畫面-層級切片索引。
- slice_address的長度為Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))位元。
slice_address的數值應該在0到NumSlicesInSubpic[CurrSubpicIdx]-1(包括兩端)的範圍。位元流規約要求應用以下約束:
- 如果rect_slice_flag等於0或subpic_info_present_flag等於0,slice_address的數值不應該等於同一編解碼畫面的任何其他編解碼切片NAL單元的slice_address的數值。
- 否則,當multi_slice_chunks_flag等於0時,slice_subpic_id與slice_address的數值對(pair)不應該等於同一編解碼畫面的任何其他編解碼切片NAL單元的 slice_subpic_id與slice_address數值對。
- 否則,slice_address與slice_chunk_address數值對不應該等於同一編解碼畫面的任何其他編解碼切片組塊NAL單元的slice_address與slice_chunk_address數值對。
- 否則,slice_subpic_id、slice_addres、與slice_chunk_address數值的三元組(triplet或3-tuple)不應該等於同一編解碼畫面的任何其他編解碼切片組塊NAL單元的slice_subpic_id、slice_address、與slice_chunk_address數值的三元組。
- 一畫面的切片形狀應該使得每一CTU(當解碼後)其整個左方邊界與整個上方邊界由一畫面邊界組成(consisting of)或是由先前解碼後的CTU的邊界組成。
num_ctu_rows_in_slice_chunk_minus1的數值加1(如果存在時)指定當前切片組塊中CTU行的數目。num_ctu_rows_in_slice_chunk_minus1的數值應該在0到RowHeight[tileY]-2(包括兩端)的範圍,其中tileY是當前分塊的分塊行索引。
對一切片組塊的切片資料,變數StartCtuNum與EndCtuNum被用來藉由標別相對應於切片組塊的開始和結束的CTU來指明切片組塊的開始和結束。變數StartCtuNum與EndCtuNum以如下加以推導:
Figure 110105529-A0305-02-0015-15
Figure 110105529-A0305-02-0016-16
變數num_ctu_rows_in_slice_chunk_minus1+1或NumCtuRowsInPrevSliceChunks儲存前一個切片組塊中CTU行的數目。在一些實施例中,變數StartCtuNum和EndCtuNum以如下加以推導:
Figure 110105529-A0305-02-0016-17
在第1圖的例子中,切片111與112沒有被分割為切片組塊,而切片113被分成了多個切片組塊,如multi_slice_chunks_flag所指示出。切片組塊121是切片113中的第一切片組塊,如first_slice_chunk_flag所指示出。每一切片組塊可以藉由識別一開始CTU與一結束CTU與/或其包含的CTU行數的數目來加以指明。例如,對於切片組塊122,StartCtuNum指定“18”,其為切片113內識別在切片組塊122開始處的CTU的一索引或數字,而EndCtuNum指明“44”,其為切片113內識別在切片組塊122結束處的CTU的一索引或數字。NumCtuRowsInPrevSliceChunks指明“3”,因為切片組塊122中有3個CTU行(row)。
在一些實施例中,語法元素first_slice_chunk_in_slice_flag可以由一語法元素slice_chunk_address(用於指示出該切片的當前切片組塊中的第一CTU行的CTU行索引)加以代替。當slice_chunk_address的數值等於0時,當前切片組塊是在解碼順序的切片的第一切片組塊。表格2D顯示了一切片標頭語法結構,其中slice_chunk_address被用於指示出該切片的當前切片組塊中的第一CTU行。
Figure 110105529-A0305-02-0017-9
Figure 110105529-A0305-02-0018-10
語法元素slice_chunk_address指明在分塊內的切片中切片組塊的切片組塊地址。slice_chunk_address是在切片組塊中第一CTU行的CTU行索引。在一些實施例中,變數StartCtuNum和EndCtuNum(分別指明當前切片組塊中的開始CTU和結束CTU)以如下加以推導:
Figure 110105529-A0305-02-0018-18
在一些實施例中,在切片標頭中的條件測試“if(!multi_slice_chunks_flag||multi_slice_chunks_flag && slice_chunk_address=0)”可以被移除,以便總是傳送完整的切片標頭語法元素。
III. 切片地址
分塊與長方形切片語法結構被指明於表格1的PPS中,涵蓋了用於切片佈局的均勻和非均勻(non-uniform)二者的分塊欄(column)與行(row)。第二小節描述了具有包括多個切片的一分塊的視訊畫面。然而,一視訊畫面也可能具有包括多個分塊的一切片。在一些實施例中,對包括多個分塊的一切片, 一相對應的切片標頭對一切片地址與分塊的一數目加以發信。表格3繪示了一切片標頭語法結構,其中切片地址被發信,而且切片中用於光柵掃描切片的相對應分塊的數目也被發信。
Figure 110105529-A0305-02-0019-11
Figure 110105529-A0305-02-0020-12
Figure 110105529-A0305-02-0021-13
語法元素slice_address指明切片的切片地址。當不存在時,slice_address的數值被推論為等於0。如果rect_slice_flag等於0,適用以下:
- 切片地址是切片中第一分塊的光柵掃描分塊索引。
- slice_address的長度為Ceil(Log2(NumTilesInPic))位元。
- slice_address的數值應該在0到NumTilesInPic-1之間(包括二端)的範圍。
否則(rect_slice_flag等於1),適用以下:
- 切片地址是切片的次畫面-層級切片索引。
- slice_address的長度為Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))位 元。
- slice_address的數值應該在0到NumSlicesInSubpic[CurrSubpicIdx]-1之間(包括二端)的範圍。
在一些實施例中,以下約束應用於切片地址:
- 如果rect_slice_flag等於0或subpic_info_present_flag等於0,slice_address的數值不應該等於同一編解碼畫面的任何其他編解碼切片NAL單元的slice_address的數值。
- 否則,該slice_subpic_id與slice_address的數值對(pair)不應該等於同一編解碼畫面的任何其他編解碼切片NAL單元的slice_subpic_id與slice_address的數值對。
- 一畫面的切片形狀應該使得每一CTU(當解碼後)其整個左方邊界與整個上方邊界由一畫面邊界組成(consisting of)或是由先前解碼後的CTU的邊界組成。
語法元素num_tiles_in_slice_minus1加1(如果存在)指明在該切片中的分塊數目。num_tiles_in_slice_minus1的數值應該在0到NumTilesInPic-1之間(包括二端)的範圍。
在一些實施例中,用於一畫面中的光柵掃描切片的切片地址被推導或推論,而不是被顯性地加以發信,因為當前切片地址等於前一個切片地址加上前一個切片中的分塊的數目,而第一切片地址等於0。具體而言,語法元素slice_address(當不存在時)被推論為等於0。對一些實施例,表格4繪示出了用於指明切片地址的切片標頭的一片段(segment)。
表格4:
Figure 110105529-A0305-02-0023-14
具體而言,如果rect_slice_flag等於0,適用以下:
- 切片地址是切片中第一分塊的光柵掃描分塊索引。
- 變數NextSliceAddress(指明下一個切片的切片地址)被初始化為0以用於畫面中的第一切片。
- slice_address的數值以如下加以推導:slice_address=NextSliceAddres
NextSliceAddress+=num_tiles_in_slice_minus1+1
否則(rect_slice_flag等於1),適用以下:
- 切片地址是切片的次畫面-層級切片索引。
- slice_address的長度為Ceil(Log2(NumSlicesInSubpic[CurrSubpicIdx]))位元。
- slice_address的數值被約束在0到NumSlicesInSubpic[CurrSubpicIdx]-1之間(包括二端)的範圍。
在一些實施例中,以下約束被應用:
- 如果rect_slice_flag等於0或subpic_info_present_flag等於0,slice_address的數值不等於同一編解碼畫面的任何其他編解碼切片NAL單元的slice_address的數值。
- 否則,該slice_subpic_id與slice_address的數值對(pair)不應該等於同一編解碼畫面的任何其他編解碼切片NAL單元的slice_subpic_id與slice_address的數 值對。
- 一畫面的切片形狀應該使得每一CTU(當解碼後)其整個左方邊界與整個上方邊界由一畫面邊界組成(consisting of)或是由先前解碼後的CTU的邊界組成。
IV. VCL NAL單元的順序及其與編解碼畫面的關聯
在一些實施例中,在一編解碼畫面之內的視訊編解碼層(VCL)NAL單元的順序被約束如下:對一編解碼畫面的任何兩個編解碼切片或切片組塊NAL單元A和B,假設subpicIdxA與subpicIdxB是它們各自的子畫面層級索引數值,sliceAddrA與sliceddrB是它們的slice_address數值,而且sliceChunkAddrA與sliceChunkAddrB是切片組塊它們各自的slice_chunk_address的數值,
- 當以下任何條件為真時,編解碼切片或切片組塊NAL單元A應該在編解碼切片或切片組塊NAL單元B之前:
- subpicIdxA小於subpicIdxB。
- subpicIdxA等於subpicIdxB,而且sliceAddrA小於sliceAddrB。
- subpicIdxA等於subpicIdxB,sliceAddrA等於sliceAddrB,而且sliceChunkAddrA小於sliceChunkAddrB。
語法元素slice_address指明切片的切片地址。如果不存在,slice_address的數值被推論為等於0。當rect_slice_flag等於1並且NumSlicesInSubpic[CurrSubpicIdx]等於1時,slice_address的數值被推論為等於0。
V. 示例性的視訊編碼器
第2圖繪示出一示例性的視訊編碼器200,當編碼一視訊畫面時 可以將切片分割為切片組塊。如圖所示,視訊編碼器200從一視訊源205接收輸入視訊信號並將該信號編碼進位元流295。視訊編碼器200具有若干組件或模組以將來自視訊源205的信號加以編碼,至少包括有些組件是選擇自轉換模組210、量化模組211、逆量化模組214、逆轉換模組215、幀內-畫面估計模組320、幀內-預測模組225、運動補償模組230、運動估計模組235、迴路濾波器245、已重構畫面緩衝器250、MV緩衝器265、MV預測模組275以及熵編碼器290。運動補償模組230與運動估計模組235是幀間-預測模組240的一部份。
在一些實施例中,模組210-290是由計算設備或電子裝置的一個或複數個處理單元(例如,處理器)所執行的軟體指令的模組。在一些實施例中,模組210-290是由電子裝置的一個或複數個積體電路(integrated circuit,IC)所實現的硬體電路的模組。雖然模組210-290被示出為分開的模組,但是一些模組可以被組合成單一個模組。
視訊源205提供原始視訊信號,其呈現沒有壓縮的每個視訊幀的像素資料。減法器208計算視訊源205的原始視訊像素資料與來自於運動補償模組230或者幀內-預測模組225的已預測像素資料213之間的差。轉換模組210將此差(或殘差像素資料或殘差信號209)轉換為轉換係數(例如,透過執行離散餘弦轉換,或DCT)。量化模組211將轉換係數量化為已量化資料(或已量化係數)212,其由熵編碼器290編碼進位元流295中。
逆量化模組214逆量化已量化資料(或已量化係數)212,以獲得轉換係數,而逆轉換模組215對轉換係數執行逆轉換以產生已重構殘差219。已重構殘差219與已預測像素資料213相加以生成已重構像素資料217。在一些實施例中,已重構像素資料217被暫時存儲在一線緩衝器(未示出)中以用於幀內-畫面預測和空間MV預測。已重構像素由迴路濾波器245進行濾波並被存儲在已重構畫面緩衝器250中。在一些實施例中,已重構畫面緩衝器250是在視 訊編碼器200之外的一記憶體。在一些實施例中,已重構畫面緩衝器250是在視訊編碼器200之內的一記憶體。
幀內-畫面估計模組220基於已重構像素資料217執行幀內-預測,以產生幀內預測資料。幀內-預測資料被提供給熵編碼器290以被編碼進位元流295中。幀內-預測資料也被幀內-預測模組225使用,以產生已預測像素資料213。
運動估計模組235藉由提供MV給存儲在已重構畫面緩衝器250中的先前已解碼視訊幀的參考像素資料,來執行幀間-預測。這些MV被提供給運動補償模組230以產生已預測像素資料。
不用將完整實際MV編碼進位元流中,視訊編碼器200使用MV預測來產生已預測MV,並且將用於運動補償的MV與已預測MV之間的差被編碼為殘差運動資料並被存儲在位元流295中。
MV預測模組275基於參考MV來產生已預測MV,所述參考MV是在編碼先前視訊幀所產生的,也就是用於執行運動補償的運動補償MV。MV預測模組275從MV緩衝器265中取回來自先前視訊幀的參考MV。視訊編碼器200將所產生以用於當前視訊幀的MV存儲在MV緩衝器265中,以作為用於產生已預測MV的參考MV。
MV預測模組275使用參考MV來創建已預測MV。已預測MV可以由空間MV預測或時間MV預測來加以計算。當前視訊幀(殘差運動資料)的已預測MV與運動補償MV(MC MV)之間的差值由熵編碼器290編碼進位元流295中。
熵編碼器290透過使用諸如上下文適應性二進制算術編碼(Context-based Adaptive Binary Arithmetic Coding,CABAC)或霍夫曼編碼(Huffman encoding)的熵編解碼技術,將各種參數和資料編碼進位元流295中。 熵編碼器290將各種標頭元素、旗標、以及已量化轉換係數212與殘差運動資料,一起編碼為語法元素進入位元流295中。然後位元流295被存儲於存儲裝置中或透過諸如網路的通信介質被傳輸至一解碼器。
迴路濾波器245對已重構像素資料217進行濾波運算或平滑操作運算以減少編解碼偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括取樣自適應偏移(Sample Adaptive Offset,SAO)。在一些實施例中,濾波操作包括自適應迴路濾波器(Adaptive Loop Filter,ALF)。
第3圖繪示出將分塊、切片、與切片組塊進行編碼的視訊編碼器200的部分。具體來說,基於一組硬體與速率/失真信息315,一畫面分割引擎310產生一組畫面分割規格320以用於熵編碼器290中。這些畫面分割規格320可以包括關於分塊、切片、和切片組塊的位置和尺寸大小信息。
熵編碼器290相對應地發信旗標或參數,例如在位元流295的SPS、PPS、或切片標頭中的切片與/或切片組塊的位置與尺寸大小(有些切片與切片組塊的位置與尺寸大小被推論而未被發信)、切片組塊致能指示、多個切片組塊指示、在切片指示中的第一切片組塊、切片組塊的開始與結束的索引等。畫面分割引擎310也提供相對應的畫面分割佈局330給轉換模組210、幀內-畫面估計模組220、幀內-畫面預測模組225、幀間-預測模組240等,使得這些模組可以依據分塊、切片、與切片組塊的佈局來編碼當前畫面。
對被分割為切片組塊的一切片,編碼器200進行預測、轉換、和其他像素操作以產生切片的轉換係數,而熵編碼器290將切片資料打包為相對應於不同切片組塊的不同NAL單元以進行傳遞。
第4圖概念性繪示出用來編碼視訊畫面的一程序400,於該視訊畫面中切片可以被分割為切片組塊。在一些實施例中,一計算裝置的一或多個處理單元(例如,一處理器)藉由執行存儲在一計算機可讀取媒介中中的指令 來實作編碼器200來進行程序400。在一些實施例中,實作編碼器200的一電子裝置進行程序400。
編碼器接收(在區塊410)像素資料以被編碼作為一視訊的一當前畫面進入一位元流中。
編碼器決定(在區塊420)該當前畫面的切片是否被允許分割為多個切片組塊。在一些實施例中,在該當前畫面的一PPS中的一第一語法元素(即,slice_chunk_enable_flag)被用來指示出該當前畫面的一或多個切片是否被允許分割為多個切片組塊。如果該當前畫面的切片被允許分割為多個切片組塊時,程序進行至區塊430。否則,編碼器編碼(在區塊425)該當前畫面而在傳遞時不將該當前畫面的切片分割為切片組塊。
在區塊430,編碼器決定一當前在被編碼的切片是否被分割為二或多個切片組塊。在一些實施例中,該當前畫面被分割為多個分塊而且該當前切片是多個分塊之一的一分割。在一些實施例中,在該當前畫面的當前切片的一切片標頭中的一第二語法元素(例如multi_slice chunk_flag)被用來指示出該當前切片是否被分割為二或多個切片組塊。如果該當前切片被分割為多個切片組塊時,程序進行至區塊440。否則,編碼器編碼(在區塊435)該當前切片而在傳遞時不將該當前切片分割為切片組塊。
在區塊440,編碼器指明(在區塊440)該當前切片的切片組塊的尺寸大小和位置。在一些實施例中,一切片組塊的尺寸大小被指明在該位元流中(語法元素num_ctu_rows_in_slice_chunk)作為在該切片組塊的編解碼樹單元(CTU)的一行數目(number of rows)。在一些實施例中,一語法元素(在切片標頭的first_slice_chunk_flag)指示出一特定切片組塊是否為被編解碼於該當前切片的一第一切片組塊。在一些實施例中,藉由識別包括該當前切片的分塊中的一CTU行,一第三語法元素(切片組塊的地址在切片標頭中)指明一特 定切片組塊的一地址。在一些實施例中,該位元流中的語法元素識別相對應於一特定切片組塊的開始的一編解碼樹單元,以及相對應於該特定切片組塊的結束的一編解碼樹單元(在切片資料中的StartCtuNum與EndCtuNum)。編碼器依據所指明的切片組塊的尺寸大小和位置,將當前切片的切片組塊編碼(在區塊450)到位元流中。每一切片組塊被傳遞於一不同NAL單元中。
在一些實施例中,該當前切片被分割為多個分塊。如果該當前切片不是一長方形切片(即,切片是一光柵掃描(raster scan)切片)時,該當前切片的一切片地址是藉由識別在該切片中的一特定分塊的一語法元素來加以指明。如果該當前切片不是一長方形切片(即,切片是一逐行掃描切片)時,該當前切片的一切片地址是藉由將一切片中的分塊的一數目加入於一先前編解碼切片的一地址中來加以指明。
VI. 示例性的視訊解碼器
在一些實施例中,一編碼器可以發信(或產生)在位元流中的一或多個語法元素,使得一解碼器可以從位元流中剖析所述一或多個語法元素。
第5圖繪示出一示例性的視訊解碼器500,來重構視訊畫面(其中切片被分割為切片組塊)。如圖所示,視訊解碼器500是一影像-解碼或視訊-解碼電路,其接收一位元流595並將位元流的內容解碼為視訊幀的像素資料以用於顯示。視訊解碼器500具有用於解碼位元流595的若干組件或模組,包括有些組件是選擇自一逆量化模組511、一逆轉換模組510、一幀內-預測模組525、一運動補償模組530、一迴路濾波器545、一已解碼畫面緩衝器550、一MV緩衝器565、一MV預測模組575與一剖析器590。運動補償模組530是幀間-預測模組540的一部份。
在一些實施例中,模組510-590是由計算設備的一個或複數個處理單元(例如,處理器)所執行的軟體指令的模組。在一些實施例中,模組510-590 是由電子設備的一個或複數個積體電路所實現的硬體電路的模組。雖然模組510-590被表示為分開的模組,但是一些模組可以被組合成單一個模組。
剖析器590(或熵解碼器)接收位元流595,並且根據由視訊-編解碼或影像-編解碼標準所定義的語法來進行初步剖析。所剖析的語法元素包括各種標頭元素、旗標、以及已量化資料(或已量化係數)512。剖析器590藉由使用諸如上下文適應性二進制算術編碼(context-adaptive binary arithmetic coding,CABAC)或霍夫曼編碼的熵編解碼技術來剖析出各種語法元素。
逆量化模組511對已量化資料(或已量化係數)512進行去量化(de-quantize)以獲得轉換係數,並且逆轉換模組510對轉換係數516執行逆轉換運算以產生已重構殘差信號519。已重構殘差信號519與來自於幀內-預測模組525或運動補償模組530的已預測像素資料513相加,以產生已解碼像素資料517。已解碼像素資料由迴路濾波器545濾波並被存儲在已解碼畫面緩衝器550中。在一些實施例中,已解碼畫面緩衝器550是在視訊解碼器500之外的一記憶體。在一些實施例中,已解碼畫面緩衝器550是在視訊解碼器500之內的一記憶體。
幀內-預測模組525從位元流595接收幀內-預測資料,並且據此從存儲在已解碼畫面緩衝器550中的已解碼像素資料517來產生已預測像素資料513。在一些實施例中,已解碼像素資料517也被存儲在用於幀內-畫面預測和空間MV預測的一線緩衝器(未示出)中。
在一些實施例中,已解碼畫面緩衝器550的內容被用於顯示。顯示裝置555直接取出已解碼畫面緩衝器550的內容以進行顯示,或將已解碼畫面緩衝器的內容取回到一顯示緩衝器。在一些實施例中,顯示裝置透過一像素傳輸從已解碼畫面緩衝器550來接收像素值。
運動補償模組530根據運動補償MV(MC MV),從存儲在已 解碼畫面緩衝器550中的已解碼像素資料517來產生已預測像素資料513。這些運動補償MV透過將自位元流595接收的殘差運動資料與自MV預測模組575接收的預測MV相加而被解碼。
MV預測模組575基於參考MV來產生已預測MV,所述參考MV是在解碼先前視訊幀所產生的,也就是用於執行運動補償的運動補償MV。MV預測模組575從MV緩衝器565中取回先前視訊幀的參考MV。視訊解碼器500將產生用來解碼當前視訊幀的運動補償MV存儲在MV緩衝器565中,以作為用於產生已預測MV的參考MV。
迴路濾波器545對已解碼像素資料517執行濾波操作或平滑操作,以減少編解碼偽影,特別是在像素塊的邊界處。在一些實施例中,所執行的濾波操作包括取樣自適應偏移(Sample Adaptive Offset,SAO)。在一些實施例中,濾波操作包括自適應迴路濾波器(Adaptive Loop Filter,ALF)。
第6圖繪示出接收與應用分塊、切片、與切片組塊的規格(specification)的視訊解碼器500的部分。具體來說,熵解碼器590為與畫面分割相關的語法元素而剖析位元流595,包括旗標或參數,例如在位元流595的SPS、PPS、或切片標頭中的切片與/或切片組塊的位置與尺寸大小(有些切片與切片組塊的位置與尺寸大小被推論而未被發信)、切片組塊致能指示、多個切片組塊指示、在切片指示中的第一切片組塊、切片組塊的開始與結束的索引等。
對被分割為切片組塊的一切片,熵解碼器590接收在相對應於不同切片組塊的不同NAL單元中的資料的傳遞,而視訊解碼器500的其他部分對切片的切片資料進行預測、轉換、與其他像素操作。例如,當處理第1圖的切片113時,切片113的資料被傳遞於相對應於三個切片組塊121-123的三個NAL單元,但是來自所有三個組塊的資料被一起解碼為一個切片。
基於所解析的語法元素,熵解碼器590產生一組畫面分割信息 620以用於一畫面分割引擎610。畫面分割引擎610將相對應的畫面分割佈局630提供給逆轉換模組510、幀內-畫面預測模組525、幀間-預測模組540等,使得這些模組可以依據分塊、切片、與切片組塊的佈局來重構當前畫面。
第7圖概念性繪示出一程序700來解碼視訊畫面(其中切片可以被分割為切片組塊)。在一些實施例中,藉由執行儲存於一電腦可讀取媒介上的指令,實施解碼器500的一計算裝置上的一個或複數個處理單元(例如,處理器)會執行程序700。在一些實施例中,實施解碼器500的一電子裝置會執行程序700。
解碼器接收(在區塊710)來自一位元流的資料以被解碼作為一視訊的一當前畫面。
解碼器決定(在區塊720)該當前畫面的切片是否被允許分割為多個切片組塊。在一些實施例中,在該當前畫面的一PPS中的一第一語法元素(即,slice_chunk_enable_flag)被用來指示出該當前畫面的一或多個切片是否被允許分割為多個切片組塊。如果該當前畫面的切片被允許分割為多個切片組塊時,程序進行至區塊730。否則,解碼器重構(在區塊725)該當前畫面而不將該當前畫面的切片分割為切片組塊。
在區塊730,解碼器決定一當前在被編碼的切片是否被分割為二或多個切片組塊。換言之,當前切片是否被分割為二或更多個片段組塊,使得每一切片組塊以不同的NAL單元被傳遞。在一些實施例中,該當前畫面被分割為多個分塊而且該當前切片是多個分塊之一的一分割。在一些實施例中,在該當前畫面的當前切片的一切片標頭中的一第二語法元素(例如multi_slice chunk_flag)被用來指示出該當前切片是否被分割為二或多個切片組塊。如果該當前切片被分割為多個切片組塊時,程序進行至區塊740。否則,解碼器重構(在區塊735)該當前切片而不將該當前切片分割為切片組塊。
在區塊740,解碼器指明(在區塊740)該當前切片的切片組塊的尺寸大小和位置。在一些實施例中,一切片組塊的尺寸大小被指明在該位元流中(語法元素num_ctu_rows_in_slice_chunk)為在該切片組塊的編解碼樹單元(CTU)的一行數目(number of rows)。在一些實施例中,一語法元素(在切片標頭的first_slice_chunk_flag)指示出一特定切片組塊是否為被編解碼於該當前切片的一第一切片組塊。在一些實施例中,藉由識別包括該當前切片的分塊中的一CTU行,一第三語法元素(切片組塊的地址在切片標頭中)指明一特定切片組塊的一地址。在一些實施例中,該位元流中的語法元素識別相對應於一特定切片組塊的開始的一編解碼樹單元,以及相對應於該特定切片組塊的結束的一編解碼樹單元(在切片資料中的StartCtuNum與EndCtuNum)。編碼器依據所指明的切片組塊的尺寸大小和位置,將當前切片的切片組塊編碼(在區塊750)到位元流中。每一切片組塊被傳遞於一不同NAL單元中。
在一些實施例中,該當前切片被分割為多個分塊。如果該當前切片不是一長方形切片(即,切片是一光柵掃描(raster scan)切片)時,該當前切片的一切片地址是藉由識別在該切片中的一特定分塊的一語法元素來加以指明。如果該當前切片不是一長方形切片(即,切片是一光柵掃描切片)時,該當前切片的一切片地址是藉由將一切片中的分塊的一數目加入於一先前編解碼切片的一地址中來加以指明。
VII. 示例的電子系統
很多上述的特徵和應用可以被實現為軟體處理,其被指定為記錄在電腦可讀存儲介質(computer readable storage medium)(也被稱為電腦可讀介質)上的指令集。當這些指令由一個或者複數個計算單元或者處理單元(例如,一個或者複數個處理器、處理器核或者其他處理單元)來執行時,則這些指令使得該處理單元執行這些指令所表示的動作。電腦可讀介質的示例包括但 不限於CD-ROM、快閃記憶體驅動器(flash drive)、隨機存取記憶體(random access memory,RAM)晶片、硬碟、可讀寫可程式設計唯讀記憶體(erasable programmable read only memory,EPROM),電可擦除可程式設計唯讀記憶體(electrically erasable programmable read-only memory,EEPROM)等。該電腦可讀介質不包括透過無線或有線連接的載波和電信號。
在本說明書中,術語“軟體”意味著包括唯讀記憶體中的韌體或者存儲在磁存儲裝置中的應用程式,該應用程式可以被讀入到記憶體中以用於處理器進行處理。同時,在一些實施例中,複數個軟體發明可以作為更大程式的子部分來實現,而保留不同的軟體發明。在一些實施例中,複數個軟體發明可以作為分開的程式來實現。最後,一起實現此處所描述的軟體發明的分開的程式的任何結合是在本發明的範圍內。在一些實施例中,當被安裝以在一個或者複數個電子系統上進行操作時,軟體程式定義了一個或者複數個特定的機器實現方式,該機器實現方式執行和實施該軟體程式的操作。
第8圖概念性地繪示一電子系統800,本揭示的一些實施例可以於其中加以實施。電子系統800可以是電腦(例如,臺式電腦、個人電腦、平板電腦等)、電話、PDA或者其他種類的電子設備。這個電子系統包括各種類型的電腦可讀媒質和用於各種其他類型的電腦可讀媒質的介面。電子系統800包括匯流排805、處理單元810、影像處理單元(graphics-processing unit,GPU)815、系統記憶體820、網路825、唯讀記憶體(read-only memory,ROM)830、永久存儲裝置835、輸入設備840和輸出設備845。
匯流排805集體表示與大量的電子系統800通信連接的內部設備的所有系統匯流排、外設匯流排和晶片組匯流排。例如,匯流排805透過影像處理單元615、唯讀記憶體830、系統記憶體820和永久存儲裝置835,與處理單元810通信連接。
對於這些各種記憶體單元,處理單元810取回執行的指令和處理的資料,以為了執行本發明的處理。在不同實施例中,該處理單元可以是單個處理器或者多核處理器。某些指令被傳輸影像處理單元815和並被其執行。該影像處理單元815可以卸載各種計算或補充由處理單元810提供的影像處理。
唯讀記憶體830存儲處理單元810或者電子系統的其他模組所需要的靜態資料和指令。另一方面,永久存儲裝置835是一種讀寫記憶體設備(read-and-write memory)。這個設備是一種非易失性(non-volatile)記憶體單元,其即使在電子系統800關閉時也存儲指令和資料。本發明的一些實施例使用大容量存儲設備(例如磁片或光碟及其相應的磁碟機)作為永久存儲裝置835。
其他實施例使用卸載式存儲裝置設備(如軟碟、快閃記憶體設備等,以及其相應的磁碟機)作為該永久存儲裝置。與永久存儲裝置835一樣,系統記憶體820是一種讀寫記憶體設備。但是,與存儲裝置835不一樣的是,該系統記憶體820是一種易失性(volatile)讀寫記憶體,例如隨機讀取記憶體。系統記憶體820存儲一些處理器在運行時需要的指令和資料。在一些實施例中,根據本發明的處理被存儲在該系統記憶體820、永久存儲裝置835和/或唯讀記憶體830中。例如,各種記憶體單元包括用於根據一些實施例的處理多媒體剪輯的指令。對於這些各種記憶體單元,處理單元810取回執行的指令和處理的資料,以為了執行某些實施例的處理。
匯流排805也連接到輸入設備840和輸出設備845。該輸入設備840使得使用者溝通資訊並選擇指令到該電子系統上。該輸入設備840包括字母數位元鍵盤和指點設備(也被稱為“遊標控制設備”),攝像機(如網路攝像機(webcam)),用於接收語音命令的麥克風或類似的設備等。輸出設備845顯示由電子系統生成的圖像或以其他方式輸出的資料。輸出設備845包括印表機 和顯示裝置,例如陰極射線管(cathode ray tube,CRT)或液晶顯示器(liquid crystal display,LCD),以及揚聲器或類似的音訊輸出設備。一些實施例包括諸如同時用作輸入設備和輸出設備的觸控式螢幕等設備。
最後,如第8圖所示,匯流排805也透過網路介面卡(未示出)將電子系統800耦接到網路825。在這個方式中,電腦可以是電腦網路(例如,局域網(local area network,LAN)、廣域網路(wide area network,WAN)或者內聯網)或者網路的網路(例如互聯網)的一部分。電子系統800的任一或者所有元件可以與本發明結合使用。
一些實施例包括電子元件,例如,微處理器、存儲裝置和記憶體,其將電腦程式指令存儲到機器可讀介質或者電腦可讀介質(可選地被稱為電腦可讀存儲介質、機器可讀介質或者機器可讀存儲介質)。電腦可讀介質的一些實例包括RAM、ROM、唯讀光碟(read-only compact disc,CD-ROM),可燒錄光碟(recordable compact disc,CD-R)、可讀寫光碟(rewritable compact disc,CD-RW)、唯讀數位通用光碟(read-only digital versatile disc)(例如,DVD-ROM,雙層DVD-ROM)、各種可記錄/可讀寫DVD(例如DVD RAM、DVD-RW、DVD+RW等)、快閃記憶體(如SD卡、迷你SD卡,微SD卡等)、磁性和/或固態硬碟、唯讀和可燒錄藍光®(Blu-Ray®)盤、超高密度光碟和其他任何光學介質或磁介質,以及軟碟。電腦可讀介質可以存儲由至少一個處理單元執行的電腦程式,並且包括用於執行各種操作的指令集。電腦程式或電腦代碼的示例包括機器代碼,例如編譯器產生的機器代碼,以及包含由電腦、電子元件或微處理器使用注釋器(interpreter)而執行的高級代碼的文檔。
當以上討論主要是指執行軟體的微處理器或多核處理器時,很多上述的功能和應用程式由一個或複數個積體電路執行,如特定應用的積體電路(application specific integrated circuit,ASIC)或現場可程式設計閘陣列(field programmable gate array,FPGA)。在一些實施例中,這種積體電路執行存儲在該電路本身上的指令。此外,一些實施例執行存儲在可程式設計邏輯器件(programmable logic device,PLD),ROM或RAM設備中的軟體。
如本發明的說明書和任一請求項中所使用,術語“電腦”、“伺服器”、“處理器”和“記憶體”均指電子設備或其他技術設備。這些術語不包括人或群體。為了本說明書的目的,術語顯示或顯示裝置指在電子設備上進行顯示。如本發明的說明書和任一請求項中所使用,術語“電腦可讀介質”、“電腦可讀媒質”和“機器可讀介質”完全局限於有形的、實體的物體,其以電腦可讀的形式存儲資訊。這些術語不包括任何無線信號、有線下載信號和其他任何短暫信號。
在結合許多具體細節的情況下描述了本發明時,本領域通常知識者將認識到,本發明可以以其他具體形式而被實施,而不脫離本發明的精神。此外,大量的圖(包括第4圖第7圖)概念性示出了處理。這些處理的具體操作可以不以所示以及所描述的確切順序來被執行。這些具體操作可用不在一個連續的操作系列中被執行,並且不同的具體操作可以在不同的實施例中被執行。另外,該處理透過使用幾個子處理而被實現,或者作為更大巨集處理的部分。因此,本領域通常知識者將能理解的是,本發明不受前述說明性細節的限制,而是由請求項加以界定。
附加的說明
本文所描述的主題有時表示不同的元件,其包含在或者連接到其他不同的元件。可以理解的是,所描述的結構僅是示例,實際上可以由許多其他結構來實施,以實現相同的功能。從概念上講,任何實現相同功能的組件的排列實際上是“相關聯的”,以便實現所需的功能。因此,不論結構或中間部件,為實現特定的功能而組合的任何兩個元件被視為“相互關聯”,以實現所需的功能。同樣,任何兩個相關聯的元件被看作是相互“可操作連接”或“可操作耦接”,以實 現特定功能。能相互關聯的任何兩個組件也被視為相互“可操作地耦合”以實現特定功能。可操作連接的具體例子包括但不限於物理可配對和/或物理上相互作用的元件,和/或無線可交互和/或無線上相互作用的元件,和/或邏輯上相互作用和/或邏輯上可交互的元件。
此外,關於基本上任何複數和/或單數術語的使用,本領域的技術人員可以根據上下文和/或應用從複數轉換為單數和/或從單數到複數。為清楚起見,本文明確規定了不同的單數/複數排列。
此外,本領域的通常知識者可以理解,通常,本發明所使用的術語特別是請求項中的,如請求項的主題,通常用作“開放”術語,例如,“包括”應解釋為“包括但不限於,“有”應理解為“至少有”“包括”應解釋為“包括但不限於”等。本領域的通常知識者可以進一步理解,若計畫介紹特定數量的請求項內容,將在請求項內明確表示,並且,在沒有這類內容時將不顯示。例如,為幫助理解,下面請求項可能包含短語“至少一個”和“一個或複數個”,以介紹請求項內容。然而,這些短語的使用不應理解為暗示使用不定冠詞“a”或“an”介紹請求項內容,而限制了任何特定的請求項。甚至當相同的請求項包括介紹性短語“一個或複數個”或“至少有一個”,不定冠詞,例如“a”或“an”,則應被解釋為表示至少一個或者更多,對於用於介紹請求項的明確描述的使用而言,同樣成立。此外,即使明確引用特定數量的介紹性內容,本領域通常知識者可以認識到,這樣的內容應被解釋為表示所引用的數量,例如,沒有其他修改的“兩個引用”,意味著至少兩個引用,或兩個或兩個以上的引用。此外,在使用類似於“A、B和C中的至少一個”的表述的情況下,通常如此表述是為了本領域通常知識者可以理解該表述,例如,“系統包括A、B和C中的至少一個”將包括但不限於單獨具有A的系統,單獨具有B的系統,單獨具有C的系統,具有A和B的系統,具有A和C的系統,具有B和C的 系統,和/或具有A、B和C的系統,等。本領域通常知識者進一步可理解,無論在說明書中、請求項中或者附圖中,由兩個或兩個以上的替代術語所表現的任何分隔的單詞和/或短語應理解為,包括這些術語中的一個,其中一個,或者這兩個術語的可能性。例如,“A或B”應理解為,“A”,或者“B”,或者“A和B”的可能性。
從前述可知,為了說明目的,此處已描述了各種實施方案,並且在不偏離本發明的範圍和精神的情況下,可以進行各種變形。因此,此處所公開的各種實施方式不用於限制,專利申請範圍表示真實的範圍和精神。
400:程序
410~450:區塊

Claims (12)

  1. 一種視訊解碼方法,包括:接收來自一位元流的資料以被解碼作為一視訊的一當前畫面;當該當前畫面的一畫面參數集中的一第一語法元素指示出該當前畫面的一或多個切片被允許分割為多個切片組塊時,以及當該當前畫面的一當前切片的一切片標頭中的一第二語法元素指示出該當前切片的資料被以二或多個切片組塊加以傳遞時:指明該當前切片的切片組塊的尺寸大小和位置,其中該當前切片包含該切片組塊;以及基於該當前切片的切片組塊重構該當前畫面。
  2. 如請求項1所述的視訊解碼方法,其中該當前畫面被分割為多個分塊而且該當前切片是多個分塊之一的一分割。
  3. 如請求項1所述的視訊解碼方法,其中一切片組塊的一尺寸大小被指明在該位元流中作為該切片組塊的編解碼樹單元的一行數目。
  4. 如請求項1所述的視訊解碼方法,其中一第三語法元素指示出一特定切片組塊是被編解碼於該當前切片的一第一切片組塊。
  5. 如請求項1所述的視訊解碼方法,其中藉由識別包括該當前切片的一分塊中的一編解碼樹單元的行,一第三語法元素指明一特定切片組塊的一地址。
  6. 如請求項1所述的視訊解碼方法,其中該位元流中的語法元素識別相對應於一特定切片組塊的一開始的一編解碼樹單元,以及相對應於該特定切片組塊的一結束的一編解碼樹單元。
  7. 如請求項1所述的視訊解碼方法,其中該當前切片被分割為多個分塊。
  8. 如請求項7所述的視訊解碼方法,其中當該當前切片不是一長方形切片時,該當前切片的一切片地址是藉由識別在該當前切片的一特定分塊來加以指明。
  9. 如請求項8所述的視訊解碼方法,其中當該當前切片不是一長方形切片時,該當前切片的一切片地址是藉由將一切片中的分塊的一數目加入於一先前編解碼切片的一地址中來加以指明。
  10. 如請求項1所述的視訊解碼方法,其中該當前切片的不同切片組塊是被包含於以及被傳遞於不同網路抽象層單元中。
  11. 一種視訊編碼方法,包括:接收像素資料以被編碼作為一視訊的一當前畫面進入一位元流中;當該當前畫面的一畫面參數集中的一第一語法元素指示出該當前畫面的一或多個切片被允許分割為多個切片組塊時,以及當該當前畫面的一當前切片的一切片標頭中的一第二語法元素指示出該當前切片的資料被以二或多個切片組塊加以傳遞時:指明該當前切片的切片組塊的尺寸大小和位置,其中該當前切片包含該切片組塊;以及藉由編碼該當前切片的切片組塊來編碼該當前畫面進入該位元流中。
  12. 一種電子裝置,包括:一視訊解碼器電路被配置來進行操作,包括:接收來自一位元流的資料以被解碼作為一視訊的一當前畫面;當該當前畫面的一畫面參數集中的一第一語法元素指示出該當前畫面的一或多個切片被允許分割為多個切片組塊時,以及當該當前畫面的一當前切片的一切片標頭中的一第二語法元素指示出該當前切片的資料被以二或多個切片組塊加以傳遞時: 指明該當前切片的切片組塊的尺寸大小和位置,其中該當前切片包含該切片組塊;以及基於該當前切片的切片組塊重構該當前畫面。
TW110105529A 2020-02-18 2021-02-18 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置 TWI785502B (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US202062977822P 2020-02-18 2020-02-18
US62/977,822 2020-02-18
US202062983785P 2020-03-02 2020-03-02
US62/983,785 2020-03-02
US202062993750P 2020-03-24 2020-03-24
US62/993,750 2020-03-24
US202063002410P 2020-03-31 2020-03-31
US63/002,410 2020-03-31
US17/178,134 US11405649B2 (en) 2020-02-18 2021-02-17 Specifying slice chunks of a slice within a tile
US17/178,134 2021-02-17

Publications (2)

Publication Number Publication Date
TW202133611A TW202133611A (zh) 2021-09-01
TWI785502B true TWI785502B (zh) 2022-12-01

Family

ID=77273287

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110105529A TWI785502B (zh) 2020-02-18 2021-02-18 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置

Country Status (2)

Country Link
US (1) US11405649B2 (zh)
TW (1) TWI785502B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021100863A1 (en) * 2019-11-22 2021-05-27 Sharp Kabushiki Kaisha Systems and methods for signaling tiles and slices in video coding
CN115136606A (zh) * 2020-02-19 2022-09-30 字节跳动有限公司 参考图片列表的权重的信令通知
KR20220143859A (ko) * 2020-02-21 2022-10-25 알리바바 그룹 홀딩 리미티드 크로마 신호를 처리하기 위한 방법
KR20220146647A (ko) * 2020-05-19 2022-11-01 구글 엘엘씨 품질-정규화된 비디오 트랜스코딩을 위한 동적 파라미터 선택
WO2023129680A1 (en) * 2021-12-29 2023-07-06 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices on probability calculation for context-based adaptive binary arithmetic coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103947207A (zh) * 2011-10-26 2014-07-23 高通股份有限公司 用于图片分割方案的统一设计
CN104160702A (zh) * 2011-11-04 2014-11-19 高通股份有限公司 具有包含多个经编码图片分区的网络抽象层单元的视频译码
TW201524192A (zh) * 2013-10-23 2015-06-16 Qualcomm Inc 多層視訊檔案格式設計

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112690004B (zh) * 2018-09-14 2023-01-13 华为技术有限公司 一种视频译码中的基于分块的寻址方法,译码器以及视频译码设备
CA3114453C (en) * 2018-09-28 2023-07-18 Zte Corporation Video encoding and decoding methods and apparatus
JP7427688B2 (ja) * 2019-03-06 2024-02-05 シャープ株式会社 ビデオ符号化におけるタイルグループ情報をシグナリングするためのシステム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103947207A (zh) * 2011-10-26 2014-07-23 高通股份有限公司 用于图片分割方案的统一设计
CN104160702A (zh) * 2011-11-04 2014-11-19 高通股份有限公司 具有包含多个经编码图片分区的网络抽象层单元的视频译码
TW201524192A (zh) * 2013-10-23 2015-06-16 Qualcomm Inc 多層視訊檔案格式設計

Also Published As

Publication number Publication date
TW202133611A (zh) 2021-09-01
US11405649B2 (en) 2022-08-02
US20210258613A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
TWI751771B (zh) 視訊和影像編解碼中之高階信息發信
TWI785502B (zh) 在分塊中指明切片之切片組塊的視訊編解碼方法及電子裝置
TWI792074B (zh) 發信圖像以及視訊的塊分割
TWI830629B (zh) 轉換省略區塊之傳訊編碼技術
TWI792149B (zh) 量化相關參數之傳訊技術
US11284077B2 (en) Signaling of subpicture structures
US11303898B2 (en) Coding transform coefficients with throughput constraints
US11936890B2 (en) Video coding using intra sub-partition coding mode
TWI784348B (zh) 視訊圖片資訊之指定技術
TWI784362B (zh) 視訊編解碼方法及裝置
TWI751811B (zh) 多重轉換選擇的發信
TWI797560B (zh) 跨層參考限制條件
JP2020526145A (ja) 境界の強制的な区分けの改善
TWI692972B (zh) 一種編碼/解碼的方法及電子裝置
CN115336280A (zh) 用于视频编解码中的高级语法的方法和设备
TWI796579B (zh) 量化矩陣之發信
TWI753585B (zh) 一種視訊編解碼方法及裝置
TWI750802B (zh) 視訊編解碼方法及裝置
TW202341736A (zh) 視訊編解碼方法及裝置
TW202349954A (zh) 自適應編解碼的圖像以及視訊資料
TW202325025A (zh) 具有編碼參數的局部照明補償
JP2024523793A (ja) コーデック方法、コードストリーム、符号化装置、復号化装置及びコンピュータ記憶媒体
CN114175653A (zh) 用于视频编解码中的无损编解码模式的方法和装置