TWI504237B - 視訊寫碼中之緩衝預測資料 - Google Patents
視訊寫碼中之緩衝預測資料 Download PDFInfo
- Publication number
- TWI504237B TWI504237B TW101126095A TW101126095A TWI504237B TW I504237 B TWI504237 B TW I504237B TW 101126095 A TW101126095 A TW 101126095A TW 101126095 A TW101126095 A TW 101126095A TW I504237 B TWI504237 B TW I504237B
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- frame prediction
- prediction mode
- blocks
- video
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本發明係關於視訊寫碼,且更具體而言係關於視訊資料之熵寫碼。
本申請案主張2011年7月20日申請之美國臨時申請案第61/509,933號及2011年8月10日申請之美國臨時申請案第61/522,136號的優先權,該等臨時申請案中之每一者的內容特此以全文引用之方式併入。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲機、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電傳會議器件、視訊串流器件等等。數位視訊器件實施諸如以下各者之視訊壓縮技術:描述於由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊寫碼(AVC))定義之標準、目前在開發中的高效率視訊寫碼(HEVC)標準及此等標準之擴展中的視訊壓縮技術。視訊器件可藉由實施此等視訊壓縮技術而更有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖片內)預測及/或時間(圖片間)預測以減小或移除視訊序列中所固有之冗餘。對於基於區
塊之視訊寫碼,可將視訊片段(亦即,視訊圖片或視訊圖片之一部分)分割成視訊區塊,其亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。使用關於同一圖片中之相鄰區塊中之參考樣本的空間預測來編碼圖片之框內寫碼(I)之片段中的視訊區塊。圖片之框間寫碼(P或B)片段中之視訊區塊可使用關於同一圖片中之相鄰區塊中之參考樣本的空間預測或關於其他參考圖片中之參考樣本之時間預測。
空間或時間預測引起針對待寫碼之區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間寫碼區塊。根據框內寫碼模式及殘餘資料來編碼框內寫碼區塊。為了進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而得到殘餘變換係數,可接著量化殘餘變換係數。可掃描最初在二維陣列中配置的經量化之變換係數以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至更多壓縮。
一般而言,本發明描述用於寫碼視訊資料之技術。舉例而言,本發明之該等技術包括減小在視訊寫碼中執行預測技術時經緩衝之資料的量。亦即,空間預測(亦即,框內預測)或時間預測(亦即,框間預測)可用以減小或移除視訊序列中之冗餘。在基於區塊之視訊寫碼中,可將來自一區塊之視訊資料用作一或多個其他視訊資料區塊的預測資
訊。與當前正寫碼之區塊的一或多個相鄰區塊相關聯之預測資訊可經儲存(亦即,緩衝),使得此預測資訊可用於寫碼該當前區塊。本發明之該等技術係關於限制在寫碼期間所緩衝的來自相鄰區塊之預測資訊的量。根據本發明之一些態樣,一種視訊寫碼器件在寫碼當前區塊時可避免使用來自定位於當前正被寫碼之視訊資料區塊上方的視訊資料區塊(例如,稱作「上方相鄰區塊」)的預測資訊。
在一實例中,本發明之態樣係關於一種寫碼視訊資料之方法,該方法包括判定一視訊資料區塊之預測資訊,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中該區塊之該預測資訊係基於來自該經寫碼單元中之一或多個其他區塊的預測資訊,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的預測資訊;及基於該所判定預測資訊寫碼該區塊。
在另一實例中,本發明之態樣係關於一種用於寫碼視訊資料之裝置。在此實例中,該裝置包括一或多個處理器,該一或多個處理器經組態以:判定一視訊資料區塊之預測資訊,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中該區塊之該預測資訊係基於來自該經寫碼單元中之一或多個其他區塊的預測資訊,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的預測資訊;及基於該所判定預測資訊寫碼該區塊。
在另一實例中,本發明之態樣係關於一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在執行時使得一或多個處理器進行以下操作:判定一視訊資料區塊之預測資訊,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中該區塊之該預測資訊係基於來自該經寫碼單元中之一或多個其他區塊的預測資訊,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的預測資訊;及基於該所判定預測資訊寫碼該區塊。
在另一實例中,本發明之態樣係關於一種用於寫碼視訊資料之裝置。在此實例中,該裝置包括:用於判定一視訊資料區塊之預測資訊的構件,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中該區塊之該預測資訊係基於來自該經寫碼單元中之一或多個其他區塊的預測資訊,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的預測資訊;及用於基於該所判定預測資訊寫碼該區塊的構件。
本發明之一或多個態樣的細節陳述於附圖及下文之描述中。本發明中所描述之技術的其他特徵、目標及優點將自描述及圖式且自申請專利範圍而顯而易見。
視訊寫碼器件可試圖藉由利用空間及/或時間冗餘來壓縮視訊資料。舉例而言,視訊編碼器可藉由相對於相鄰之
先前寫碼的區塊來寫碼區塊而利用空間冗餘。同樣,視訊編碼器可藉由相對於先前寫碼的圖片之資料寫碼區塊來利用時間冗餘。詳言之,視訊編碼器可根據空間相鄰區塊之資料或根據先前經寫碼圖片之資料預測當前區塊。視訊編碼器可接著將區塊之殘餘計算為區塊之實際像素值與區塊之所預測像素值之間的差。因而,區塊之殘餘可包括像素(或空間)域中之逐像素差值。
關於框內寫碼,視訊編碼器可根據預定義的框內預測模式產生預測性區塊。視訊編碼器可自當前正編碼之區塊之值減去預測性區塊的值以產生殘餘資料區塊。視訊編碼器可在經編碼位元串流中傳訊框內預測模式及殘餘資料區塊,該經編碼位元串流可由視訊解碼器解碼。解碼器可產生相同預測性區塊(例如,使用相同框內預測模式),且藉由組合殘餘資料與預測性區塊之資料來重建構經編碼視訊區塊。
新興HEVC標準可使用多達35或35個以上框內預測模式。為了減小傳訊由視訊編碼器選擇之框內預測模式所需的位元之數目,視訊編碼器可識別已寫碼的視訊區塊(諸如,一或多個空間相鄰區塊)的框內預測模式。基於此等相鄰區塊之框內預測模式,視訊編碼器可識別當前視訊區塊之最可能框內預測模式。最可能框內預測模式表示基於當前視訊區塊之上下文的最有可能用於編碼當前區塊的框內預測模式。上下文可(例如)由用於相鄰區塊之框內預測模式、當前區塊之大小及其他因子的某一組合來定義。由
視訊編碼器使用以判定當前視訊區塊之上下文的因子亦為可由視訊解碼器辨別的。因此,視訊編碼器所判定之最可能框內預測模式亦可由視訊解碼器判定,而不必顯式地傳訊至視訊解碼器。最可能框內預測模式可能或可能不與實際用以編碼當前區塊的框內預測模式相同。實際框內預測模式可由視訊編碼器基於哪一框內預測模式產生經重建構視訊之最佳品質來判定。
視訊編碼器可產生用於包括於位元串流中之指示最可能框內預測模式是否與當前視訊區塊之實際預測模式相同的語法元素。語法元素可(例如)為單一位元,其中「1」指示實際框內預測模式為最可能框內預測模式,且「0」指示實際框內預測模式並非最可能框內預測模式。因此,當當前視訊區塊之實際框內預測模式為最可能框內預測模式時,可使用單一位元(在此實例中為「1」)將當前視訊區塊之實際框內預測模式自編碼器傳訊至解碼器。在實際框內預測模式並非最可能框內預測模式之例子中,可藉由第一位元之後的碼字(亦即,為「0」之第一位元繼之以碼字)傳訊實際框內預測。
關於框間寫碼,視訊編碼器可產生運動向量以(例如)根據另一視訊圖片或片段來識別預測性視訊資料區塊,其可用以預測當前正編碼之區塊之值。視訊編碼器可自當前區塊之值減去預測性區塊的值以產生殘餘資料區塊。一般而言,視訊編碼器可在可由視訊解碼器解碼之經編碼位元串流中傳訊運動向量及殘餘資料。解碼器可在經解碼圖片緩
衝器中之一組經解碼區塊中找出同一預測性區塊(例如,基於運動向量),且藉由組合殘餘資料與預測性區塊之資料來重建構經編碼視訊區塊。
在一些狀況下,亦應用運動向量之預測性寫碼以進一步減小傳達運動向量所需的資料量。在此狀況下,並非編碼並傳達運動向量自身,而是編碼器編碼並傳達相對於已知(或可知)運動向量的運動向量差(MVD)。可與MVD一起使用以定義當前運動向量的已知運動向量可藉由所謂的運動向量預測因子(MVP)來定義。
可實施在即將到來之HEVC標準中稱作自適應性運動向量預測(AMVP)之程序,其中運動向量候選者集合係根據空間及時間方向上的若干相鄰區塊而建置。運動向量候選者集合包括針對MVP之複數個候選者。在此狀況下,視訊編碼器基於對編碼率及失真的分析(例如,使用所謂速率失真成本分析)而自候選者集合選擇最準確的預測因子。可將運動向量預測因子索引(mvp_idx)傳輸至視訊解碼器以告知解碼器在何處找到MVP,亦即,哪一MVP候選者將用於解碼。亦傳達MVD。解碼器可組合MVD與MVP(由運動向量預測因子索引定義),以便重建構運動向量。
所謂「合併模式」亦可為可用的,在該模式中,正被寫碼之當前視訊區塊繼承了相鄰視訊區塊之運動資訊(例如,運動向量、參考預測索引、預測方向或其他資訊)。索引值可用以識別當前視訊區塊自哪一相鄰區塊繼承其運動資訊(例如,相對於時間上鄰近之圖框在頂部、右上、
左側或相同定位)。合併模式使用來自若干個候選區塊中之一者的運動資訊,但並不依賴於MVD。
因此,本發明大體上將「預測資訊」稱作用於產生預測性視訊資料區塊的框內預測資訊及/或框間預測資訊。亦即,關於框內寫碼,預測資訊可指代用於寫碼視訊資料區塊之框內寫碼模式。在相鄰區塊之框內寫碼模式被用於寫碼區塊(例如,使用上文所描述之最可能模式導出程序)的實例中,預測資訊亦可指代此等相鄰框內寫碼模式。另外或替代性地,對於框間預測而言,預測資訊可指代用以寫碼視訊資料區塊的運動資訊(例如,運動向量、參考圖片索引、預測方向,或其他資訊)。在相鄰區塊之運動資訊被用於寫碼區塊(例如,使用上文所描述之AMVP及合併模式程序)的實例中,預測資訊亦可指代此等相鄰運動資訊。
在任何狀況下,預測資訊可儲存至所謂「線緩衝器」,使得預測資訊在寫碼期間可用於參考。關於框內寫碼,視訊寫碼器可儲存針對每一區塊之框內預測模式。關於框間寫碼,視訊寫碼器可儲存針對每一區塊的運動資訊(例如,運動向量(mvx,mvy)、參考圖片索引(ref_idx)、預測方向(inter_dir),或其他資訊)。線緩衝器可儲存與定位於當前正寫碼之區塊或片段上方且通常延伸越過圖片之整個寬度的一行區塊相關聯的預測資訊。
線緩衝器可包括可由視訊寫碼器存取之記憶體。線緩衝器可在緩衝整個圖框之預測資訊(其可為相對大量資料)與
緩衝待在寫碼期間存取之具有最高可能性的預測資訊之間求得平衡。亦即,在一些實例中,僅最頻繁使用之預測資訊可儲存至線緩衝器以便使緩衝器之大小儘可能小。
然而,隨著視訊解析度及圖框之寬度(例如,自右向左越過給定視訊圖框之像素的數目)增大,儲存於線緩衝器中之資料量亦增大。在一些實例中,小達4×4個像素之視訊資料區塊可用以寫碼圖片。作為一實例,1920×1080像素圖片(例如,對於1080p視訊而言)可包括多達495個4×4像素區塊。因此,若儲存每一視訊資料區塊之預測資訊,則可需要視訊寫碼器將相對大量的資料儲存至線緩衝器。
本發明之技術大體上係關於限制或減小在寫碼期間經緩衝的來自相鄰區塊之預測資訊量。舉例而言,並非在寫碼當前區塊時使用上方相鄰區塊之預測資訊,而是在一些實施例中,視訊寫碼器件可基於來自左側相鄰區塊的預測資訊來判定預測資訊。在其他實例中,視訊寫碼器件可基於來自上方相鄰區塊之資料來判定預測資訊,但僅在當前區塊係較大分割區(例如,如下文更詳細描述,在新興高效率視訊寫碼(HEVC)標準中稱作最大寫碼單元(LCU))之子區塊,且此子區塊並不與另一LCU接界時才這樣做。如下文所描述之多種其他技術亦可用以減小在視訊寫碼期間經緩衝之預測性資訊的量。
根據本發明之技術,限制經緩衝之資料量可減小與寫碼視訊資料相關聯的複雜性。舉例而言,本發明之態樣可允許視訊寫碼器件緩衝較少資料,進而減小與此緩衝相關聯
的記憶體要求。此外,減少預測資訊所來源於之位置可改良熵寫碼效率及/或輸貫量。舉例而言,本發明之技術可經實施以改良剖析輸貫量。亦即,隨著視訊寫碼器接收視訊資料,可根據特定剖析程序(例如,波前剖析)來剖析(例如,讀取及分段)視訊資料。在一些實例中,剖析程序可包括在剖析一或多個初始LCU(例如,片段中之最上及/或最左LCU)之後剖析片段的每一LCU。剖析LCU可允許視訊寫碼器形成多個處理線緒(例如,用於並行處理),其中每一線緒包括一或多個經剖析LCU。
然而,歸因於預測資訊相依性,某些線緒可依賴於其他線緒,此情形對於並行處理應用程式可能非最佳的。舉例而言,第一線緒可依賴於由第二不同線緒處理的資料,此情形可使得第一線緒等待,直至第二線緒已處理了資料為止。亦即,通常直至資料為有用的點才剖析資料,且接著資料被寫碼。在習知波前之狀況下,視訊寫碼器可減緩寫碼第一(例如,頂部)波前的資料。彼情形又可使得下一線緒停止,該使下一線緒停止使得再下一線緒停止,等等。根據本發明之態樣,藉由消除預測資訊相依性,一線緒減緩將不影響正被處理之其他線緒。關於剖析,此意謂線緒之剖析器不需要參考其他線緒,而是可針對每一線緒獨立地操作。
在一實例中,為了說明之目的,假設當前正被寫碼之LCU定位於片段之頂部列下方,其中片段之一或多個LCU定位於當前片段上方。在此實例中,用於寫碼當前LCU之
預測資訊可包括於上部相鄰LCU(例如,定位於當前LCU上方的LCU)中。亦即,用於寫碼當前LCU的預測資訊可依賴於上部相鄰LCU的一或多個值(例如,框內預測模式、運動資訊或其類似者)。因此,當前LCU在可寫碼當前LCU之前可能必須等待上部相鄰LCU被寫碼。引入此潛時可減緩寫碼程序,特別是在並行處理應用程式中。可實施本發明之態樣以減小此相依性,進而減小上述潛時的可能性。
圖1為說明可利用用於有效儲存預測資訊之技術的實例視訊編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括源器件12,源器件12提供稍後待由目的地器件14解碼之經編碼視訊資料。詳言之,源器件12經由電腦可讀媒體16將視訊資料提供至目的地器件14。源器件12及目的地器件14可包含廣泛範圍之器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手機(諸如,所謂「智慧型」電話)、所謂「智慧型」板、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲機、視訊串流器件,或其類似者。在一些狀況下,源器件12及目的地器件14可經配備以進行無線通信。
目的地器件14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14之任何類型的媒體或器件。在一實例中,電腦可讀媒體16可包含用以使源器件12能夠將經編碼視訊資料直接即時傳輸至目的地器件14之通信媒體。可根據通信標準(諸如,無線通信協定)調變經編
碼視訊資料,且將經編碼視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的任何其他設備。
在一些實例中,經編碼資料可自輸出介面22輸出至儲存器件。類似地,可藉由輸入介面自儲存器件存取經編碼資料。儲存器件可包括多種分散式或本端存取之資料儲存媒體中之任一者,諸如,硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體。在又一實例中,儲存器件可對應於可儲存由源器件12產生之經編碼視訊的檔案伺服器或另一中間儲存器件。目的地器件14可經由串流或下載而自儲存器件存取所儲存視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將該經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括web伺服器(例如,針對網站)、FTP伺服器、網路附加儲存(NAS)器件,或本地磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)而存取經編碼視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機,等等),或兩者之組
合。經編碼視訊資料自儲存器件之傳輸可為串流傳輸、下載傳輸,或其組合。
本發明可大體上涉及視訊編碼器20將某資訊「傳訊」至諸如視訊解碼器30的另一器件。然而,應理解,視訊編碼器20可藉由使某些語法元素與視訊資料之各種經編碼部分相關聯來傳訊資訊。亦即,視訊編碼器20可藉由將某些語法元素儲存至視訊資料之各種經編碼部分的標頭來「傳訊」資料。在一些狀況下,此等語法元素可在由視訊解碼器30接收並解碼之前經編碼並儲存(例如,儲存至儲存媒體34或檔案伺服器36)。因此,術語「傳訊」可通常指代用於解碼經壓縮視訊資料之語法或其他資料的傳達,不管此傳達是即時或幾乎即時抑或在一時間跨度上(諸如當在編碼時將語法元素儲存至記錄媒體,該等語法元素可接著在儲存至此媒體之後的任何時間由解碼器件擷取時可能發生)發生。
本發明之技術(該等技術大體上係關於預測資料之有效儲存)未必限於無線應用或設定。該等技術可應用於支援多種多媒體應用中之任一者的視訊寫碼,該等多媒體應用諸如空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如HTTP上之動態適應性串流(DASH))、編碼至資料儲存媒體上之數位視訊、儲存於資料儲存媒體上的數位視訊的解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應
用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。根據本發明,源器件12之視訊編碼器20可經組態以應用用於寫碼運動向量且用於在HEVC及其擴展(諸如,多視角或三維視訊(3DV)擴展)中執行雙向預測的技術。在其他實例中,源器件及目的地器件可包括其他組件或配置。舉例而言,源器件12可自外部視訊源18(諸如,外部攝影機)接收視訊資料。同樣地,目的地器件14可與外部顯示器件介面連接,而非包括整合式顯示器件。
圖1之所說明系統10僅為一實例。可藉由任何數位視訊編碼及/或解碼器件來執行用於有效儲存預測資料的技術。儘管通常本發明之技術係由視訊編碼器件來執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「CODEC」)來執行。此外,亦可由視訊預處理器執行本發明之技術。源器件12及目的地器件14僅為此等寫碼器件之實例,其中源器件12產生用於傳輸至目的地器件14的經寫碼視訊資料。在一些實例中,器件12、14可以實質上對稱之方式操作,使得器件12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊器件12、14之間的單向或雙向視訊傳輸,(例如)以用於視訊串流、視訊播放、視訊廣播或視訊電話。
源器件12之視訊源18可包括一視訊俘獲器件,諸如,視
訊攝影機、含有先前俘獲之視訊的視訊存檔,及/或接收來自視訊內容提供者之視訊的視訊饋入介面。作為另一替代例,視訊源18可產生基於電腦圖形之資料作為來源視訊,或實況視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源器件12與目的地器件14可形成所謂攝影機電話或視訊電話。然而,如上文所提及,本發明中所描述之技術可一般適用於視訊寫碼,且可應用於無線及/或有線應用。在每一狀況下,可由視訊編碼器20編碼經俘獲、經預俘獲或電腦產生之視訊。經編碼視訊資訊可接著由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括暫態媒體,諸如無線廣播或有線網路傳輸;或儲存媒體(亦即,非暫時性儲存媒體),諸如硬碟、隨身碟、光碟、數位影碟、藍光光碟,或其他電腦可讀媒體。在一些實例中,網路伺服器(未圖示)可自源器件12接收經編碼視訊資料,並(例如)經由網路傳輸將經編碼視訊資料提供至目的地器件14。類似地,媒體生產設施(諸如,光碟壓製設施)之計算器件可自源器件12接收經編碼視訊資料,並生產含有經編碼視訊資料的光碟。因此,在各種實例中,可理解電腦可讀媒體16包括具有各種形式之一或多個電腦可讀媒體。
目的地器件14之輸入介面28接收來自電腦可讀媒體16之資訊。電腦可讀媒體16之資訊可包括由視訊編碼器20定義之語法資訊(其亦由視訊解碼器30使用),該語法資訊包括
描述區塊及其他經寫碼單元(例如,GOP)的特性及/或處理之語法元素。詳言之,本發明將「經寫碼單元」稱作資料單元,該資料單元包括諸如片段、圖片、波前集合或圖塊的多個區塊。因此,應將術語「經寫碼單元」理解為包括多個區塊,例如,多個最大寫碼單元(LCU)。此外,不應將術語「經寫碼單元」與如在HEVC中使用之術語「寫碼單元」或CU混淆。顯示器件32向使用者顯示經解碼之視訊資料,且可包含多種顯示器件中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中的高效率視訊寫碼(HEVC)標準之視訊寫碼標準而操作,且可符合HEVC測試模型(HM)。HEVC之最新工作草案(WD)(且下文稱作HEVC WD7)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wgll/JCTVC-I1003-v5.zip獲得,較新版本可自http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wgll/JCTVC-I1003-v6.zip獲得,該兩個版本特此如同被全文闡述一般以引用的方式併入本文中。或者,視訊編碼器20及視訊解碼器30可根據其他專屬或工業標準(諸如,ITU-T H.264標準,替代地被稱作MPEG-4,第10部分,進階視訊寫碼(AVC))或此等標準之擴展而操作。然而,本發明之技術不限於任何特定寫碼標準。視訊寫碼標準之其他實例包括MPEG-2及ITU-T H.263。
作為被稱為聯合視訊小組(JVT)的集體合作之產物,ITU-T H.264/MPEG-4(AVC)標準係由ITU-T視訊寫碼專家組(VCEG)連同ISO/IEC動畫專家組(MPEG)制定。在一些態樣中,可將本發明中所描述之技術應用於大體上符合H.264標準之器件。H.264標準由ITU-T研究組在ITU-T推薦標準H.264「Advanced Video Coding for generic audiovisual services」中描述且發佈於2005年3月,該H.264標準可在本文中被稱作H.264標準或H.264規範,或H.264/AVC標準或規範。聯合視訊小組(JVT)繼續致力於對H.264/MPEG-4 AVC之擴展。
JCT-VC正致力於HEVC標準之開發。HEVC標準化努力係基於視訊寫碼器件之演進型模型(被稱作HEVC測試模型(HM))。HM設想了視訊寫碼器件相對於根據(例如)ITU-T H.264/AVC的現有器件之若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。
一般而言,HM之工作模型描述:視訊圖框或圖片可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大寫碼單元(LCU)之序列。位元串流內之語法資料可定義LCU之大小,LCU為就像素數目而言之最大寫碼單元。片段包括呈寫碼次序之多個連續樹型區塊。視訊圖片可被分割成一或多個片段。每一樹型區塊可根據四元樹而分裂成數個寫碼單元(CU)。一般而言,四元樹資料結構包括每CU一節點,其中根節點對應於樹形區塊。若CU被分裂成四個子
CU,則對應於CU之節點包括四個葉節點,其中每一葉節點對應於子CU中之一者。
四元樹資料結構中之每一節點可提供對應CU之語法資料。舉例而言,四元樹中之節點可包括分裂旗標,該分裂旗標指示對應於節點之CU是否被分裂成子CU。CU之語法元素可被遞歸式地定義,且可視CU是否被分裂成子CU而定。若CU不被進一步分裂,則可將CU稱作葉CU。在本發明中,葉CU之四個子CU亦將稱作葉CU,即使不存在原始葉CU的顯式分裂亦然。舉例而言,若16×16大小之CU未經進一步分裂,則四個8×8子CU亦將被稱作葉CU,儘管16×16 CU從未被分裂。
CU具有與H.264標準之巨集區塊類似的用途,惟CU不具有大小區別。舉例而言,可將樹形區塊分裂成四個子節點(亦稱作子CU),且每一子節點又可為上代節點,並被分裂成另外四個子節點。被稱作四元樹之葉節點的最終不能分裂之子節點包含亦稱作葉CU的寫碼節點。與經寫碼位元串流相關聯之語法資料可定義被稱作最大CU深度之樹型區塊可分裂的最大次數,且亦可定義寫碼節點之最小大小。因此,位元串流亦可定義最小寫碼單元(SCU)。本發明使用術語「區塊」來指代HEVC之內容脈絡中之CU、PU或TU中的任一者,或其他標準之內容脈絡中之類似資料結構(例如,H.264/AVC中之巨集區塊及其子區塊)。此外,本發明可使用術語「經寫碼單元」來描述預定義的數量之視訊資料,該預定義的數量之視訊資料可包括兩個或
兩個以上視訊資料區塊。亦即,例如,經寫碼單元可指代圖片、片段、圖塊或圖塊集合、波前集合,或包括視訊資料之任何其他預定義單元。因此,不應將術語「經寫碼單元」與術語「寫碼單元」或CU混淆。
CU包括一寫碼節點及與該寫碼節點相關聯的預測單元(PU)及變換單元(TU)。CU之大小對應於寫碼節點之大小,且形狀必須為正方形。CU之大小可在自8×8像素直至具有最大64×64像素或大於64×64像素的樹型區塊之大小的範圍內。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)將CU分割成一或多個PU。分割模式可在CU是經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼之間而不同。PU之形狀可分割成非正方形。與CU相關聯之語法資料亦可描述(例如)根據四元樹將CU分割成一或多個TU。TU之形狀可為正方形或非正方形(例如,矩形)。
HEVC標準允許根據TU之變換,其對於不同CU可係不同的。TU通常基於針對經分割LCU定義之給定CU內的PU之大小而設定大小,儘管此情形可能並非總是為該狀況。TU的大小通常與PU相同或小於PU。在一些實例中,可使用稱為「殘餘四元樹」(RQT)之四元樹結構將對應於CU之殘餘樣本再分成數個較小單元。RQT之葉節點可被稱作變換單元(TU)。與TU相關聯之像素差值可經變換以產生可經量化的變換係數。
葉CU可包括一或多個預測單元(PU)。一般而言,PU表
示對應於對應CU之全部或一部分的空間區域,且可包括用於擷取PU之參考樣本的資料。此外,PU包括關於預測之資料。舉例而言,當PU經框內模式編碼時,PU之資料可包括於殘餘四元樹(RQT)內,該殘餘四元樹(RQT)可包括描述對應於PU之TU之框內預測模式的資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義該PU之一或多個運動向量的資料。定義PU之運動向量的資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖片,及/或運動向量之參考圖片清單(例如,清單0、清單1或清單C)。
具有一或多個PU之葉CU亦可包括一或多個變換單元(TU)。如上文所論述,可使用RQT(亦稱作TU四元樹結構)來指定變換單元。舉例而言,分裂旗標可指示葉CU是否被分裂成四個變換單元。接著,每一變換單元可被進一步分裂成其他子TU。當TU不被進一步分裂時,可將TU稱作葉TU。通常,對於框內寫碼而言,屬於葉CU之所有葉TU共用同一框內預測模式。亦即,大體上將同一框內預測模式應用於計算葉CU之所有TU的預測值。對於框內寫碼而言,視訊編碼器20可使用框內預測模式計算每一葉TU的殘餘值,作為CU之對應於該TU的部分與原始區塊之間的差。TU未必限於PU之大小。因此,TU可大於或小於PU。對於框內寫碼而言,可使PU與同一CU之對應葉TU相同定位。在一些實例中,葉TU之最大大小可對應於對應葉CU
之大小。
此外,亦可使葉CU之TU與稱作殘餘四元樹(RQT)之各別四元樹資料結構相關聯。亦即,葉CU可包括指示葉CU被分割成TU之方式的四元樹。TU四元樹之根節點通常對應於葉CU,而CU四元樹之根節點通常對應於樹型區塊(或LCU)。RQT之未經分裂的TU被稱作葉TU。一般而言,除非另有註釋,否則本發明使用術語CU及TU來分別指代葉CU及葉TU。
視訊序列通常包括一系列視訊圖片。圖片群組(GOP)通常包含一系列的一或多個視訊圖片。GOP可包括GOP之標頭、圖片中之一或多者之標頭中或別處的語法資料,該語法資料描述包括於GOP中之數個圖片。圖片之每一片段可包括描述各別片段之編碼模式的片段語法資料。視訊編碼器20通常對個別視訊片段內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之寫碼節點。視訊區塊可具有固定或變化之大小,且可根據指定寫碼標準而在大小上不同。
作為一實例,HM支援按各種PU大小之預測。假定特定CU之大小為2N×2N,則HM支援按2N×2N或N×N之PU大小之框內預測,及按2N×2N、2N×N、N×2N或N×N之對稱PU大小的框間預測。HM亦支援按2N×nU、2N×nD、nL×2N及nR×2N之PU大小之用於框間預測之不對稱分割。在不對稱分割中,CU之一方向未被分割,而另一方向被分割成25%與75%。CU之對應於25%分割之部分係由「n」繼之以
「上」、「下」、「左」或「右」之指示來指示。因此,例如,「2N×nU」指代水平地分割為頂部上之2N×0.5N PU及底部上之2N×1.5N PU的2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換地使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊將在垂直方向上具有16個像素(y=16)且在水平方向上具有16個像素(x=16)。同樣地,N×N區塊通常在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負整數值。可以列及行配置區塊中之像素。此外,區塊不必在水平方向上具有與垂直方向上相同之數目個像素。舉例而言,區塊可包含N×M個像素,其中M不必等於N。
在使用CU之PU進行框內預測性或框間預測性寫碼之後,視訊編碼器20可計算CU之TU的殘餘資料。PU可包含描述在空間域(亦被稱作像素域)中產生預測性像素資料之方法或模式的語法資料,且TU可包含在將(例如)離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換的變換應用於殘餘視訊資料之後的變換域中之係數。該殘餘資料可對應於未經編碼之圖片之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著變換該等TU以產生CU之變換係數。
在進行任何變換以產生變換係數之後,視訊編碼器20可執行變換係數之量化。量化通常指代將變換係數量化以可能地減小用以表示該等係數之資料的量,從而提供進一步
壓縮的程序。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。舉例而言,n
位元值在量化期間可降值捨位至m
位元值,其中n
大於m
。
在量化之後,視訊編碼器可掃描變換係數,從而自包括經量化變換係數之二維矩陣產生一維向量。掃描可經設計以將較高能量(且因此較低頻率)係數置放於陣列之前部,且將較低能量(且因此較高頻率)係數置放於陣列之後部。在一些實例中,視訊編碼器20可利用預定義掃描次序來掃描經量化之變換係數以產生可經熵編碼的串行化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化之變換係數以形成一維向量之後,視訊編碼器20可(例如)根據以下各者而對該一維向量進行熵編碼:上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率間隔分割熵(PIPE)寫碼或另一熵編碼方法。視訊編碼器20亦可將與經編碼視訊資料相關聯的語法元素熵編碼以供視訊解碼器30在解碼視訊資料時使用。
一般而言,由視訊解碼器30執行之視訊解碼程序可包括與由視訊編碼器20執行之編碼技術互逆之技術。儘管大體上為互逆的,但在一些例子中,視訊解碼器30可執行類似於由視訊編碼器20執行之技術的技術。視訊解碼器30亦可依賴於在所接收位元串流中所含有的語法元素或其他資料,該所接收位元串流包括關於視訊編碼器20所描述之資料。
根據本發明之態樣,視訊編碼器20及/或視訊解碼器30可實施本發明之用於限制在寫碼期間(例如,在線緩衝器中)經緩衝的來自相鄰區塊之資料量的技術。舉例而言,視訊編碼器20及/或視訊解碼器30可限制來自相鄰區塊之在寫碼期間經緩衝之預測資訊的量。如上文所提及,預測資訊可包括框內預測資訊(例如,框內寫碼模式)或運動資訊(例如,運動向量、參考圖片索引、預測方向,或其他資訊)。根據本發明之態樣,並非在寫碼當前區塊時使用以上方相鄰區塊的預測資訊,在一些實例中,視訊編碼器20及/或視訊解碼器30可基於來自左側相鄰區塊之預測資訊來判定預測資訊。在其他實例中,視訊編碼器20及/或視訊解碼器30可基於來自上方相鄰區塊之資料來判定預測資訊,但僅在當前區塊係較大分割區之子區塊(例如,如下文更詳細描述,在新興高效率視訊寫碼(HEVC)標準中稱作最大寫碼單元(LCU)),且此子區塊並不與另一LCU接界時才這樣做。如下文所描述之多種其他技術亦可用以減小在視訊寫碼期間由視訊編碼器20及/或視訊解碼器30緩衝的預測性資訊之量。
視訊編碼器20及視訊解碼器30各自可在適用時實施為多種合適編碼器或解碼器電路中之任一者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其
中任一者可整合為經組合之視訊編碼器/解碼器(CODEC)的部分。包括視訊編碼器20及/或視訊解碼器30之器件可包含積體電路、微處理器及/或無線通信器件(諸如,蜂巢式電話)。
儘管未在圖1中展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或分開的資料串流中之音訊與視訊兩者的編碼。若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
圖2為說明可實施本發明中所描述之用於有效儲存預測資訊之技術的實例視訊編碼器20的方塊圖。視訊編碼器20可執行視訊片段內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖片內之視訊的空間冗餘。框間寫碼依賴於時間預測以減小或移除視訊序列之鄰近圖片內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指代若干基於時間之壓縮模式中的任一者。
如圖2中所展示,視訊編碼器20接收待編碼之視訊資料。在圖2之實例中,視訊編碼器20包括模式選擇單元40、求和器50、變換處理單元52、量化單元54、熵編碼單元56,及參考圖片記憶體64。模式選擇單元40又包括運動估計單元42、運動補償單元44、框內預測單元46及分割單
元48。對於視訊區塊重建構而言,視訊編碼器20亦包括反量化單元58、反變換處理單元60,及求和器62。亦可包括解區塊濾波器(圖2中未展示)以對區塊邊界進行濾波以自經重建構之視訊移除方塊效應假影。若需要,該解區塊濾波器將通常對求和器62之輸出進行濾波。除解區塊濾波器外,亦可使用額外迴路濾波器(迴路內濾波器或迴路後濾波器)。為了簡潔並未展示此等濾波器,但若需要,該等濾波器可對求和器50之輸出進行濾波(作為迴路內濾波器)。
在編碼程序期間,視訊編碼器20接收待寫碼之視訊圖片或片段。可將圖片或片段劃分成多個視訊區塊。運動估計單元42及運動補償單元44執行所接收視訊區塊相對於一或多個參考圖片中之一或多個區塊的框間預測性寫碼,以提供時間壓縮。框內預測單元46可替代性地執行所接收視訊區塊相對於處於與待寫碼之區塊相同的圖片或片段中之一或多個相鄰區塊的框內預測性寫碼,以提供空間壓縮。視訊編碼器20可執行多個寫碼遍次,(例如)以選擇視訊資料之每一區塊的適當寫碼模式。
此外,分割單元48可基於對先前寫碼遍次中之先前分割方案的評估而將視訊資料之區塊分割成子區塊。舉例而言,分割單元48可最初將圖片或片段分割成LCU,且基於速率失真分析(例如,速率失真最佳化)將每一LCU分割成子CU。模式選擇單元40可進一步產生一指示將LCU分割成數個子CU的四元樹資料結構。四元樹之葉節點CU可包括
一或多個PU及一或多個TU。
模式選擇單元40可(例如)基於誤差結果而選擇寫碼模式(框內或框間)中之一者,且將所得的經框內或框間寫碼之區塊提供至求和器50以產生殘餘區塊資料及提供至求和器62以重建構經編碼區塊以用作參考圖片。模式選擇單元40亦將語法元素(諸如,運動向量、框內模式指示符、分割資訊及其他此語法資訊)提供至熵編碼單元56。
可高度整合運動估計單元42與運動補償單元44,但出於概念之目的而對其分離地加以說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。舉例而言,運動向量可指示,當前視訊圖片內之視訊區塊的PU相對於參考圖片(或其他經寫碼單元)內之預測性區塊(其係相對於當前圖片(或其他經寫碼單元)內之正寫碼之當前區塊)的移位。如上文所提及,運動向量可構成預測資訊。
預測性區塊為被發現與待寫碼之區塊在像素差方面緊密匹配之區塊,可藉由絕對差之和(SAD)、平方差之和(SSD)或其他差量度來判定像素差。在一些實例中,視訊編碼器20可計算儲存於參考圖片記憶體64中之參考圖片之次整數像素位置的值。舉例而言,視訊編碼器20可內插參考圖片之四分之一像素位置、八分之一像素位置或其他分數像素位置之值。因此,運動估計單元42可執行相對於完整像素位置及分數像素位置之運動搜尋,且輸出具有分數像素精度的運動向量。
運動估計單元42藉由比較PU之位置與參考圖片之預測性區塊之位置而計算框間寫碼片段中之視訊區塊之PU的運動向量。參考圖片可選自第一參考圖片清單(清單0)或第二參考圖片清單(清單1),該等清單中之每一者識別儲存於參考圖片記憶體64中的一或多個參考圖片。運動估計單元42將所計算出之運動向量發送至熵編碼單元56及運動補償單元44。
在一些實例中,並非發送當前PU之實際運動向量,運動估計單元42可預測運動向量以進一步減小傳達運動向量所需的資料量。在此狀況下,並非編碼並傳達運動向量自身,運動估計單元42可產生相對於已知(或可知)運動向量的運動向量差(MVD)。可與MVD一起使用以定義當前運動向量的已知運動向量可藉由所謂運動向量預測因子(MVP)來定義。一般而言,為了係有效MVP,正用於預測之運動向量必須指向與當前正寫碼之運動向量所指向的參考圖片相同的參考圖片。
在一些實例中,運動估計單元42可建置運動向量預測因子候選者清單,該清單包括作為MVP之候選者的若干在空間及/或時間方向上的相鄰區塊。當多個運動向量預測因子候選者為可用的(來自多個候選區塊)時,運動估計單元42可根據預定選擇準則來判定當前區塊的運動向量預測因子。舉例而言,運動估計單元42可基於對編碼率及失真之分析(例如,使用速率失真成本分析或其他寫碼效率分析)自候選者集合選擇最準確的預測因子。在其他實例中,運
動估計單元42可產生運動向量預測因子候選者的平均值。選擇運動向量預測因子之其他方法亦為可能的。
在選擇了運動向量預測因子之後,運動估計單元42可判定運動向量預測因子索引(mvp_flag),該索引(mvp_flag)可用以向視訊解碼器(例如,諸如視訊解碼器30)告知在含有MVP候選區塊之參考圖片清單中何處找到MVP。運動估計單元42亦可判定當前區塊與所選擇MVP之間的MVD。MVP索引及MVD可用以重建構運動向量。
在一些實例中,運動估計單元42可替代地實施所謂「合併模式」,在該「合併模式」中,運動估計單元42可「合併」預測性視訊區塊之運動資訊(諸如,運動向量、參考圖片索引、預測方向或其他資訊)與當前視訊區塊。因此,關於合併模式,當前視訊區塊繼承了來自另一已知(或可知)視訊區塊的運動資訊。運動估計單元42可建置合併模式候選者清單,該清單包括作為合併模式之候選者的若干在空間及/或時間方向上之相鄰區塊。運動估計單元42可判定索引值(例如,merge_idx),該索引值可用以向視訊解碼器(例如,諸如視訊解碼器30)告知在含有合併候選區塊之參考圖片清單中何處找到合併視訊區塊(亦即,自其獲得運動資訊之區塊)。
根據本發明之態樣,運動估計單元42可限制來自相鄰區塊之在編碼期間經緩衝之運動資訊(例如,運動向量、參考圖片索引、預測方向或其他資訊)的量。舉例而言,並非基於來自上方相鄰區塊之運動資訊判定當前區塊之MVP
或合併候選者,運動估計單元42可基於來自左側相鄰區塊之運動資訊來判定用於編碼當前區塊的運動資訊。在其他實例中,運動估計單元42可基於來自上方相鄰區塊之資料來判定當前區塊的運動資訊,但僅在當前區塊為LCU之子區塊且上方相鄰區塊係來自同一LCU時才這樣做。在又其他實例中,運動估計單元42可實施其他技術(例如,如下文更詳細描述之子取樣、內插等等)以減小在編碼期間經緩衝之運動資訊的量。
由運動補償單元44執行之運動補償可涉及基於由運動估計單元42判定之運動向量取得或產生預測性區塊。再一次,在一些實例中,運動估計單元42及運動補償單元44可在功能上整合。在接收到當前視訊區塊之PU之運動向量後,運動補償單元44隨即可在參考圖片清單中之一者中找到運動向量所指向的預測性區塊。如下文所論述,求和器50藉由自正被寫碼之當前視訊區塊的像素值減去預測性區塊之像素值從而形成像素差值來形成殘餘視訊區塊。一般而言,運動估計單元42執行關於明度分量之運動估計,且運動補償單元44針對色度分量及明度分量兩者使用基於明度分量計算的運動向量。模式選擇單元40亦可產生與視訊區塊及視訊片段相關聯的供視訊解碼器30在解碼視訊片段之視訊區塊時使用的語法元素。
作為如上文所描述的由運動估計單元42及運動補償單元44執行之框間預測之替代例,框內預測單元46可框內預測當前區塊。詳言之,框內預測單元46可判定使用框內預測
模式來編碼當前區塊。在一些實例中,框內預測單元46(例如)在分開的編碼遍次期間可使用各種框內預測模式編碼當前區塊,且框內預測單元46(或在一些實例中模式選擇單元40)可自經測試模式中選擇使用適當框內預測模式。
舉例而言,框內預測單元46可使用速率失真分析而計算各種經測試框內預測模式之速率失真值,且在經測試模式中選擇具有最好速率失真特性之框內預測模式。速率失真分析通常判定經編碼區塊與原始未經編碼之區塊(其經編碼以產生經編碼區塊)之間的失真(或誤差)之量,以及用以產生經編碼區塊之位元率(亦即,位元數目)。框內預測單元46可根據失真及速率計算各種經編碼區塊之比率以判定哪一框內預測模式展現區塊之最好速率失真值。
在一些實例中,框內預測單元46可使用所謂最可能模式來指示所選擇框內預測模式。舉例而言,框內預測單元46可基於包括先前經編碼區塊之上下文模型來指示當前區塊的框內預測模式。在一實例中,假定區塊之自左至右、自頂部至底部之編碼次序,框內預測單元46可基於在相對頂部且相對左側與當前區塊接界之先前經編碼區塊來判定最可能模式。此等區塊可具有與當前區塊具有相同之框內模式的高機率。
在一實例中,若在當前區塊之頂部及左側之區塊係以不同模式編碼,則框內預測單元46可根據由框內預測模式46維持之預定義的框內模式分級(例如,框內模式之根據模
式編號的數值分級)選擇具有較低數值分級之框內模式作為最可能模式。在另一實例中,若在當前區塊之頂部及左側之區塊係以不同模式編碼,則框內預測單元46可選擇預定義的預設模式(諸如,DC框內模式)作為最可能模式。然而,在當前區塊之上下文包括一個以上框內模式時選擇最可能模式的程序僅作為實例來提供,且框內預測單元46可經組態而以多種其他方式來判定最可能模式。
在判定最可能框內模式之後,框內預測單元46可基於最可能模式與用以編碼當前區塊之所選擇框內模式的比較來設定旗標(例如,most_probable_mode旗標)。舉例而言,若最可能模式與當前區塊之所選擇框內模式相同,則框內預測單元46可將最可能模式旗標設定為值1,從而指示所選擇框內模式與最可能模式為相同的。在此實例中,不需要額外位元來傳訊所選擇模式。亦即,在接收到已設定為1之最可能模式旗標之後,視訊解碼器(諸如視訊解碼器30)即可再生(例如)用於判定如由編碼器使用之最可能模式的相同程序,且接著使用最可能模式來解碼所接收區塊。
若最可能模式與當前區塊之所選擇框內模式不同,則框內預測單元46可將最可能模式旗標設定為值0,從而指示該等模式為不同的。在此實例中,可需要額外位元來傳訊用以編碼當前區塊的實際框內模式(例如,直接或藉由至相鄰區塊中之另一區塊的索引)。根據一些實例,框內預測單元46可維持框內模式之數值分級,其中最常用之框內模式具有最低數值分級。在此等實例中,框內預測單元46
可基於數值分級或另一數值識別符來傳訊用以編碼當前區塊的實際框內模式。
根據本發明之態樣,框內預測單元46可限制來自相鄰區塊之在編碼期間經緩衝之預測資訊(例如,框內模式資料)的量。舉例而言,並非基於來自上方相鄰區塊之框內模式資料來判定當前區塊之最可能框內模式,框內預測單元46可基於左側相鄰區塊之框內模式來判定用於編碼當前區塊的最可能框內模式。亦即,例如,框內預測單元46可在不判定來自上方相鄰區塊之框內模式的情況下僅基於左側相鄰區塊之框內模式來判定用於解碼當前區塊的最可能框內模式。在其他實例中,框內預測單元46可基於來自一或多個左側相鄰區塊及一上方相鄰區塊之資料來判定當前區塊的最可能框內模式,但僅在當前區塊為LCU之子區塊且上方相鄰區塊係來自同一LCU時才這樣做。在又其他實例中,框內預測單元46可實施其他技術(例如,如下文更詳細描述之子取樣、內插等等)以減小在編碼期間經緩衝之框內模式資料的量。
視訊編碼器20藉由自正寫碼之原始視訊區塊減去來自模式選擇單元40之預測資料而形成殘餘視訊區塊。求和器50表示執行此減法運算之(多個)組件。變換處理單元52將變換(諸如,離散餘弦變換(DCT)或概念上類似之變換)應用於殘餘區塊,從而產生包含殘餘變換係數值之視訊區塊。變換處理單元52可執行概念上類似於DCT之其他變換。亦可使用小波變換、整數變換、次頻帶變換或其他類型之變
換。在任何狀況下,變換處理單元52將變換應用於殘餘區塊,從而產生殘餘變換係數之區塊。該變換可將殘餘資訊自像素值域轉換至變換域(諸如,頻域)。
變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化該等變換係數以進一步減小位元率。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化之變換係數之矩陣的掃描。或者,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56熵寫碼經量化之變換係數。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率間隔分割熵(PIPE)寫碼或另一熵寫碼技術。在基於上下文之熵寫碼的狀況下,上下文可係基於相鄰區塊。
關於CABAC,熵編碼單元56可選擇上下文模型,該上下文模型對上下文進行操作以編碼與視訊資料之區塊相關聯的符號。舉例而言,熵編碼單元56可使用每一語法元素之機率估計來熵編碼視訊資料區塊的每一語法元素。機率估計可指示元素具有給定值的似然度。機率估計可包括於亦稱作上下文模型之機率模型內。熵編碼單元56可藉由判定語法元素之上下文資訊(或更簡化地「上下文」)來選擇上下文模型。針對每一上下文定義不同機率模型。在寫碼
語法元素之後,熵編碼單元56可基於語法元素之實際值來更新所選擇上下文模型,以反映最新機率估計。亦即,例如,熵編碼單元56可更新選擇上下文模型以轉變至新上下文模型的方式。
在藉由熵編碼單元56進行之熵寫碼之後,可將經編碼位元串流傳輸至另一器件(例如,視訊解碼器30)或經存檔(例如,至記錄媒體)以供稍後傳輸或擷取。反量化單元58及反變換處理單元60分別應用反量化及反變換,以在像素域中重建構殘餘區塊(例如)供稍後用作參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖片記憶體64之圖片中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重建構之殘餘區塊以計算次整數像素值以供用於運動估計中。求和器62將經重建構之殘餘區塊加至由運動補償單元44產生之運動補償預測區塊,以產生經重建構之視訊區塊以供儲存於參考圖片記憶體64中。經重建構之視訊區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖片中之區塊進行框間寫碼。
以此方式,視訊編碼器20為視訊寫碼器的實例,該視訊寫碼器可執行一種包括以下步驟之方法:判定視訊資料之第一區塊之預測資訊,其中該第一區塊包括於經寫碼視訊資料單元內,其中第一區塊係在經寫碼單元中之區塊的頂部列下方;基於第一視訊資料區塊之預測資訊而不基於來自經寫碼單元中之頂部列區塊之預測資訊判定經寫碼單元
中之在頂部列區塊下方之第二視訊資料區塊的預測資訊;及基於所判定的第二區塊之預測資訊來寫碼第二區塊。
圖3為說明可實施本發明中所描述之用於熵寫碼視訊資料之技術的實例視訊解碼器30之方塊圖。在圖3之實例中,視訊解碼器30包括熵解碼單元80、預測單元81、反量化單元86、反變換單元88、求和器90,及參考圖片記憶體92。預測單元81包括運動補償單元82及框內預測單元84。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊片段之視訊區塊及相關聯之語法元素的經編碼視訊位元串流。視訊解碼器30之熵解碼單元80熵解碼該位元串流以產生經量化之係數、運動向量及其他語法元素。
視訊解碼器30可接收視訊片段層級及/或視訊區塊層級的語法元素。舉例而言,作為背景,視訊解碼器30可接收已經壓縮成所謂「網路抽象層單元」或NAL單元以用於經由網路傳輸的經壓縮視訊資料。每一NAL單元可包括識別儲存至NAL單元之資料之類型的標頭。存在兩種類型之通常儲存至NAL單元之資料。第一類型之儲存至NAL單元的資料為視訊寫碼層(VCL)資料,該資料包括經壓縮視訊資料。第二類型之儲存至NAL單元的資料稱作非VCL資料,該非VCL資料包括額外資訊,諸如定義大量NAL單元共有之標頭資料的參數集合,及補充增強資訊(SEI)。
舉例而言,參數集合可含有序列層級標頭資訊(例如,在序列參數集合(SPS)中)及偶爾改變之圖片層級標頭資訊
(例如,在圖片參數集合(PPS)中)。含有於參數集合中之偶爾改變之資訊並不需要針對每一序列或圖片進行重複,藉此改良了寫碼效率。此外,參數集合之使用允許實現標頭資訊之頻帶外傳輸,藉此避免了需要用於錯誤恢復(error resilience)之冗餘傳輸。
如上文關於圖2之視訊編碼器20所描述,熵解碼單元80可類似於熵編碼單元56而組態。舉例而言,熵寫碼單元80可選擇上下文模型,該上下文模型對上下文進行操作以解碼與視訊資料區塊相關聯的符號。亦即,熵寫碼單元80可使用每一語法元素之機率估計來熵解碼視訊資料區塊的每一語法元素。
熵解碼單元80將運動向量及其他經解碼語法元素轉遞至預測單元81。當視訊片段經寫碼為框內寫碼(I)片段時,預測單元81之框內預測單元84可基於所傳訊之框內預測模式(例如,直接或藉由至相鄰區塊中之另一區塊的索引作為最可能模式來傳訊)及來自當前圖片之先前經解碼區塊之資料而產生當前視訊片段之視訊區塊的預測資料。當視訊圖片經寫碼為框間寫碼(亦即,B、P或GPB)片段時,預測單元81之運動補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素而產生當前視訊片段之視訊區塊的預測性區塊。可自參考圖片清單中之一清單內的參考圖片中之一者產生預測性區塊。視訊解碼器30可基於儲存於參考圖片記憶體92中之參考圖片使用預設建構技術來建構參考圖片清單,清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素而判定當前視訊片段之視訊區塊的預測資訊,且使用該預測資訊以產生正經解碼之當前視訊區塊的預測性區塊。舉例而言,運動補償單元82使用一些所接收之語法元素以判定用以寫碼視訊片段之視訊區塊的預測模式(例如,框內預測或框間預測)、框間預測片段類型(例如,B片段、P片段或GPB片段)、片段之參考圖片清單中之一或多者的建構資訊、片段之每一框間編碼視訊區塊之運動向量、片段之每一框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊片段中之視訊區塊的其他資訊。
運動補償單元82亦可基於內插濾波器執行內插。運動補償單元82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元82可根據所接收之語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。
根據本發明之態樣,運動補償單元82可限制來自相鄰區塊之在解碼期間經緩衝之運動資訊(例如,運動向量、參考圖片索引、預測方向或其他資訊)的量。舉例而言,並非基於來自上方相鄰區塊之運動資訊判定當前區塊之MVP或合併候選者,運動補償單元82可基於來自左側相鄰區塊之運動資訊來判定用於解碼當前區塊的運動資訊。在其他實例中,運動補償單元82可基於來自上方相鄰區塊之資料來判定當前區塊的運動資訊,但僅在當前區塊為LCU之子
區塊且上方相鄰區塊係來自同一LCU時才這樣做。在又其他實例中,運動補償單元82可實施其他技術(例如,如下文更詳細描述之子取樣、內插等等)以減小在解碼期間經緩衝之運動資訊的量。
根據本發明之態樣,框內預測單元84可限制來自相鄰區塊之在解碼期間經緩衝之預測資訊(例如,框內模式資料)的量。舉例而言,並非基於來自上方相鄰區塊之框內模式資料來判定當前區塊之最可能框內模式,框內預測單元84可基於左側相鄰區塊之框內模式來判定用於解碼當前區塊的最可能框內模式。亦即,例如,框內預測單元84可在不判定來自上方相鄰區塊之框內模式的情況下僅基於左側相鄰區塊之框內模式來判定用於解碼當前區塊的最可能框內模式。在其他實例中,框內預測單元84可基於來自一或多個左側相鄰區塊及一上方相鄰區塊之資料來判定當前區塊的最可能框內模式,但僅在當前區塊為LCU之子區塊且上方相鄰區塊係來自同一LCU時才這樣做。在又其他實例中,框內預測單元84可實施其他技術(例如,如下文更詳細描述之子取樣、內插等等)以減小在解碼期間經緩衝之框內模式資料的量。
反量化單元86將位元串流中所提供且由熵解碼單元80解碼的經量化之變換係數反量化(亦即,解量化)。反量化程序可包括使用由視訊編碼器20針對視訊片段中之每一視訊區塊所計算的量化參數,以判定量化程度及(同樣地)應該應用之反量化的程度。
反變換處理單元88將反變換(例如,反DCT、反整數變換或概念上類似之反變換程序)應用於變換係數,以便在像素域中產生殘餘區塊。根據本發明之態樣,反變換處理單元88可判定將變換應用至殘餘資料的方式。亦即,例如,反變換處理單元88可判定RQT,該RQT表示變換(例如,DCT、整數變換、小波變換或一或多個其他變換)被應用至與所接收視訊資料之區塊相關聯之殘餘明度樣本及殘餘色度樣本的方式。
在運動補償單元82基於運動向量及其他語法元素產生當前視訊區塊之預測性區塊之後,視訊解碼器30藉由將來自反變換處理單元88之殘餘區塊與由運動補償單元82所產生的對應預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此加法運算之(多個)組件。若需要,亦可應用解區塊濾波器來對經解碼區塊進行濾波,以便移除方塊效應假影。其他迴路濾波器(在寫碼迴路中抑或在寫碼迴路之後)亦可用以使像素轉變平滑化,或以其他方式改良視訊品質。接著將給定圖片中之經解碼視訊區塊儲存於參考圖片記憶體92中,該參考圖片記憶體92儲存用於後續運動補償之參考圖片。參考圖片記憶體92亦儲存經解碼視訊以用於稍後在顯示器件(諸如,圖1之顯示器件32)上呈現。
以此方式,視訊解碼器30為視訊解碼器的實例,該視訊解碼器可執行一種包括以下步驟之方法:判定視訊資料之第一區塊之預測資訊,其中該第一區塊包括於經寫碼視訊資料單元內,其中第一區塊係在經寫碼單元中之區塊的頂
部列下方;基於第一視訊資料區塊之預測資訊而不基於來自經寫碼單元中之頂部列區塊之預測資訊來判定經寫碼單元中之在頂部列區塊下方之第二視訊資料區塊的預測資訊;及基於第二區塊之所判定預測資訊來寫碼第二區塊。
圖4A及圖4B為說明實例四元樹150及對應最大寫碼單元172的概念圖。圖4A描繪實例四元樹150,該四元樹150包括以階層式樣式配置之節點。四元樹150可與(例如)根據所提議HEVC標準之樹型區塊相關聯。四元樹(諸如,四元樹150)中之每一節點可為無子節點之葉節點,或具有四個子節點。在圖4A之實例中,四元樹150包括根節點152。根節點152具有四個子節點,該等子節點包括葉節點156A至156C(葉節點156)及節點154。因為節點154並非葉節點,所以節點154包括四個子節點,該等子節點在此實例中為葉節點158A至158D(葉節點158)。
四元樹150可包括描述對應最大寫碼單元(LCU)(在此實例中,諸如LCU 172)之特性的資料。舉例而言,四元樹150根據其結構可描述LCU至子CU的分裂。假定LCU 172具有2N×2N之大小。在此實例中,LCU 172具有四個子CU 176A至176C(子CU 176)及174,每一子CU具有大小N×N。將子CU 174進一步分裂成四個子CU 178A至178D(子CU 178),每一子CU具有大小N/2×N/2。在此實例中,四元樹150之結構對應於LCU 172之分裂。亦即,根節點152對應於LCU 172,葉節點156對應於子CU 176,節點154對應於子CU 174,且葉節點158對應於子CU 178。
四元樹150之節點的資料可描述對應於節點之CU是否經分裂。若CU經分裂,則四個額外節點可存在於四元樹150中。在一些實例中,可類似於以下偽碼地實施四元樹之節點:split_flag值可為表示對應於當前節點之CU是否經分裂的一位元值。若CU未經分裂,則split_flag值可為「0」,而若CU經分裂,則split_flag值可為「1」。關於四元樹150之實例,分裂旗標值之陣列可為101000000。
如上文所提及,CU深度可指代諸如LCU 172之LCU已被劃分的程度。舉例而言,根節點152可對應於CU深度零,而節點154及葉節點156可對應於CU深度一。此外,葉節點158可對應於CU深度二。根據本發明之態樣,CU及/或TU深度可用作用於熵寫碼某些語法元素的上下文。在一實例中,為了解釋的目的,相較於葉節點158A,可使用不
同上下文模型來熵寫碼與葉節點156A相關聯的一或多個語法元素,此係因為葉節點156A位於深度一處,而葉節點158A位於深度二處。
雖然圖4A說明CU四元樹之實例,但應理解,類似四元樹可應用至葉節點CU的TU。亦即,葉節點CU可包括描述CU之TU之分割的TU四元樹(稱作殘餘四元樹(RQT))。TU四元樹可大體上類似於CU四元樹,唯TU四元樹可個別地傳訊CU之TU的框內預測模式外。
根據本發明之一些態樣,視訊寫碼器(諸如視訊編碼器20及/或視訊解碼器30)可基於來自某些相鄰CU之預測資訊來判定當前區塊的預測資訊。舉例而言,如下文更詳細描述,視訊寫碼器可基於諸如子CU 176A之相鄰CU來判定子CU 178C的預測資訊。在一些實例中,視訊寫碼器可避免基於諸如上方相鄰子CU 178之某些相鄰CU來判定預測資訊。然而,根據本發明之態樣,如下文更詳細描述,倘若上方相鄰CU之資訊並不需要儲存至線緩衝器,視訊寫碼器就可使用上方相鄰CU判定預測資訊。
舉例而言,根據本發明之態樣,視訊寫碼器可基於上方相鄰子CU 178A來判定子CU 178C的預測資訊,此係因為上方相鄰子CU 178A位於與子CU 178C之LCU相同之LCU(亦即,LCU 172)中。在一些實例中,在寫碼LCU時,與LCU之所有CU相關聯的資料為可用的(例如,無外部緩衝)。因此,根據本發明之態樣,視訊寫碼器可在不緩衝預測資訊之情況下使用與LCU之區塊相關聯的預測資訊。
亦即,根據本發明之態樣,視訊寫碼器可基於上方相鄰子CU 178A而不在線緩衝器中緩衝子CU 178A之預測資訊地判定子CU 178C的預測資訊。
圖5為說明在框內寫碼區塊時可藉以判定最可能框內模式之實例相鄰區塊的圖。舉例而言,為了解釋的目的,假定視訊解碼器(諸如,視訊解碼器30)當前正解碼語法元素,該語法元素指示當前區塊180內之像素的特定預測模式(例如,框內預測模式)。在此實例中,視訊解碼器30可識別來自上方相鄰區塊182及左側相鄰區塊184之框內預測模式以判定當前語法元素的上下文。因此,用以熵解碼當前語法元素之上下文模型可視上方相鄰區塊182及左側相鄰區塊184的框內預測模式而定。
在此實例中,視訊解碼器30可儲存或緩衝指示上方相鄰區塊182及左側相鄰區塊184之框內預測模式的資料,使得此資料在執行框內預測時為可用的。舉例而言,視訊解碼器30可將上方相鄰區塊182之框內預測模式儲存至一在含有區塊180至184之圖片之寬度上延伸的線緩衝器中,使得框內預測模式可用於充當寫碼當前區塊180的上下文。
然而,隨著視訊解析度及圖框之寬度(例如,自右向左越過給定視訊圖框之像素的數目)增大,儲存於線緩衝器中之資料量亦增大。在一些實例中,如上文所提及,小至4×4個像素之視訊資料區塊可用以寫碼圖片。作為一實例,1920×1080像素圖片(例如,對於1080p視訊而言)可包括具有多達495個4×4像素區塊的寬度。每一區塊可具有相
關聯的框內預測模式。藉由35個潛在框內預測模式,視訊解碼器30可針對495個區塊中之每一者儲存高達六個位元之框內預測資訊。因此,若圖片之每一區塊的框內預測模式皆儲存至線緩衝器(該線緩衝器在展示於圖5中之實例中包括區塊182),可要求視訊解碼器30將相對大量之資料儲存至線緩衝器。
本發明之技術大體上係關於限制在寫碼期間經緩衝的來自相鄰區塊之框內模式資料的量。亦即,本發明之態樣係關於限制用於在執行最可能模式導出時使用之儲存至線緩衝器的框內模式資料之量。如關於圖7且在本發明中之其他地方更詳細描述,根據本發明之一些態樣,視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可基於左側相鄰區塊184(以及如圖8之實例中所展示,一或多個其他左側相鄰區塊)但不基於上方相鄰區塊182來判定當前區塊180的最可能框內模式。在此實例中,視訊寫碼器可避免將上方相鄰區塊182之框內模式儲存至線緩衝器,此係因為該框內模式並不用以判定當前區塊180的最可能框內模式。
在其他實例中,視訊寫碼器可基於上方相鄰區塊182來判定當前區塊180之框內模式,但僅在上方相鄰區塊182係來自與當前區塊180之LCU相同的LCU時才這樣做。在此實例中,上方相鄰區塊182之框內模式可為可用的(在不儲存於線緩衝器中之情況下),此係因為LCU之所有資訊在LCU之寫碼期間通常為可用的。然而,若上方相鄰區塊182係來自不同LCU,則與上方相鄰區塊182相關聯之資料
可與不同LCU包括在一起(例如,在經編碼位元串流中)。因此,在該實例中,如上文所描述,視訊寫碼器可需要緩衝框內模式,此情形需要記憶體資源且亦可防止LCU之並行寫碼。如下文所描述之多種其他技術亦可用以減小在視訊寫碼期間經緩衝之預測性資訊的量。
圖6為說明在執行運動向量預測(包括AMVP及合併模式)時的潛在運動向量預測因子候選者的圖。亦即,對於當前正被寫碼之區塊188而言,來自相鄰區塊A0
、A1
、B0
、B1
及B2
之運動資訊(例如,包含水平分量及垂直分量之運動向量、運動向量索引、預測方向或其他資訊)可用以預測區塊188的運動資訊。此外,與時間上相同定位之區塊COL相關聯的運動資訊亦可用以預測區塊188之運動資訊(例如,參考圖片中之相同定位區塊)。在運動向量預測之內容脈絡中,相鄰區塊A0
、A1
、B0
、B1
及B2
以及相同定位之區塊COL在下文通常可稱作運動向量預測因子候選者。
在一些實例中,在執行運動向量預測時可識別展示於圖6中之運動向量預測因子候選者(例如,產生MVD抑或執行合併模式)。在其他實例中,在執行合併模式與運動向量預測時可識別不同候選者。亦即,視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可識別與用於執行運動向量預測之運動向量預測因子候選者集合不同的用於執行合併模式之運動向量預測因子候選者集合。
在一實例中,為了執行合併模式,視訊編碼器(諸如,視訊編碼器20)可最初判定來自運動向量預測因子候選者
之哪些運動向量可用於與區塊188合併。亦即,在一些例子中,來自運動向量預測因子候選者中之一或多者的運動資訊可能歸因於(例如)運動向量預測因子候選者正被框內寫碼、尚未經寫碼或不存在而為不可用的(例如,運動向量預測因子候選者中之一或多者位於另一圖片或片段中)。視訊編碼器20可建構運動向量預測因子候選者清單,該清單包括可用的運動向量預測因子候選區塊中的每一者。
在建構候選者清單之後,視訊編碼器20可自候選者清單選擇待用作當前區塊100之運動向量的運動向量。在一些實例中,視訊編碼器20可自候選者清單中選擇與區塊188之運動向量最好地匹配之運動向量。亦即,視訊編碼器20可根據速率失真分析自候選者清單選擇運動向量。
視訊編碼器20可提供使用合併模式編碼區塊188的指示。舉例而言,視訊編碼器20可設定旗標或其他語法元素,從而指示使用合併模式來預測區塊188的運動向量。在一實例中,視訊編碼器20可藉由設定merge_flag[x0][y0]指示:根據運動向量預測因子候選者推斷區塊188的框間預測參數。在此實例中,陣列索引x0、y0可指定預測區塊之左上明度樣本相對於圖片(或片段)之左上明度樣本的位置(x0,y0)。
此外,在一些實例中,視訊編碼器20可提供索引,從而識別區塊188自哪個合併候選者繼承運動向量。舉例而言,merge_idx[x0][y0]可指定合併候選者索引,該索引識
別合併候選者清單中的圖片,且其中x0、y0指定預測區塊之左上明度樣本相對於圖片(或片段)之左上明度樣本的位置(x0,y0)。
視訊解碼器(諸如,視訊解碼器30)可執行類似步驟以在解碼區塊188時識別適當合併候選者。舉例而言,視訊解碼器30可接收使用合併模式預測區塊188的指示。在一實例中,視訊解碼器30可接收merge_flag[x0][y0],其中(x0,y0)指定預測區塊之左上明度樣本(對應於區塊中之像素)相對於圖片(或片段)之左上明度樣本的位置。雖然關於明度樣本進行描述,但上文所描述之技術亦可針對色度樣本來執行。
在一些實例中,視訊解碼器30可在合併候選區塊之運動資訊與區塊188之前按比例縮放運動向量預測因子。舉例而言,若運動向量預測因子指代位於不同於由區塊188參考之預測性區塊的時間位置之參考圖片中之預測性區塊(例如,區塊188之實際運動向量),則視訊解碼器30可按比例縮放運動向量預測因子。舉例而言,視訊解碼器30可按比例縮放運動向量預測因子,使得該預測因子指代與區塊188之參考圖片相同的參考圖片。在一些實例中,視訊解碼器30可根據圖片次序計數(POC)值之差來按比例縮放運動向量預測因子。在選擇運動向量預測因子之後,視訊解碼器30可合併與運動向量預測因子相關聯之運動資訊與區塊188的運動資訊。
此外,視訊解碼器30可建構合併候選者清單。舉例而
言,視訊解碼器30可接收指示可用於運動向量預測的視訊區塊的一或多個語法元素(例如,旗標)。視訊解碼器30可基於所接收旗標建構合併候選者清單。若若干合併候選者具有相同運動向量及相同參考索引,則可自清單移除(亦即,剪除)一些冗餘合併候選者。
視訊解碼器30可根據所接收索引識別適當合併候選者。舉例而言,視訊解碼器30可接收索引,其識別區塊188自哪一合併候選者繼承運動向量。在一實例中,merge_idx[x0][y0]可指定合併候選者索引,該索引識別合併候選者清單中的圖片,且其中x0、y0指定預測區塊之左上明度樣本相對於圖片(或片段)之左上明度樣本的位置(x0,y0)。
視訊編碼器20及視訊解碼器30可實施類似程序,以執行視訊資料之當前區塊的運動向量預測。舉例而言,視訊編碼器20可最初判定來自運動向量預測因子候選者之哪些運動向量可用作MVP。來自運動向量預測因子候選者中之一或多者的運動資訊可歸因於(例如)運動向量預測因子候選者正被框內寫碼、尚未經寫碼或不存在而為不可用的(例如,未包括於圖片或片段中,諸如在圖片或片段中之頂部列區塊上方的區塊)。
為了判定哪些運動向量預測因子候選者為可用的,視訊編碼器20可又根據基於預定優先權之方案分析運動向量預測因子候選者中的每一者。舉例而言,對於每一運動向量預測因子候選者而言,視訊編碼器20可判定運動向量預測因子是否與區塊188的實際運動向量指代相同參考圖片。
若運動向量預測因子指代相同參考圖片,則視訊編碼器20可將運動向量預測因子候選者添加至MVP候選者清單。若運動向量預測因子不指代相同參考圖片,則運動向量預測因子可在添加至MVP候選者清單之前被按比例縮放(例如,如上文所論述,基於POC距離按比例縮放)。
關於經相同定位之區塊COL,若經相同定位之區塊包括一個以上運動向量預測因子(例如,將COL預測為B圖框),則視訊編碼器20可根據當前清單及當前參考圖片(針對區塊188)選擇時間運動向量預測因子中的一者。視訊編碼器20可接著將所選擇時間運動向量預測因子添加至運動向量預測因子候選者清單。
視訊編碼器20可藉由設定enable_temporal_mvp_flag來傳訊一或多個運動向量預測因子為可用的。在建置候選者清單之後,視訊編碼器20可自候選者中選擇待用作區塊100之運動向量預測因子的運動向量。在一些實例中,視訊編碼器20可根據速率失真分析來選擇候選運動向量。
視訊編碼器20可使用識別候選者清單中之MVP的MVP索引(mvp_flag)來傳訊所選擇運動向量預測因子。舉例而言,視訊編碼器20可設定mvp_10_flag[x0][y0]來指定清單0之運動向量預測因子索引,其中x0、y0指定候選區塊之左上明度樣本相對於圖片之左上明度樣本的位置(x0,y0)。在另一實例中,視訊編碼器20可設定mvp_11_flag[x0][y0]來指定清單1之運動向量預測因子索引,其中x0、y0指定候選區塊之左上明度樣本相對於圖片之左上明度樣本的位
置(x0,y0)。在又其他實例中,視訊編碼器20可設定mvp_lc_flag[x0][y0]來指定清單c之運動向量預測因子索引,其中x0、y0指定候選區塊之左上明度樣本相對於圖片之左上明度樣本的位置(x0,y0)。
視訊編碼器20亦可產生運動向量差值(MVD)。MVD可構成所選擇運動向量預測因子與區塊188之實際運動向量之間的差。視訊編碼器20可將MVD與MVP索引一起傳訊。
視訊解碼器30可執行類似操作以使用運動向量預測因子來判定當前區塊的運動向量。舉例而言,視訊解碼器30可在參數集合(例如,圖片參數集合(PPS))中接收指示,其指示針對一或多個圖片啟用運動向量預測。亦即,在一實例中,視訊解碼器30可在PPS中接收enable_temporal_mvp_flag。當特定圖片參考enable_temporal_mvp_flag等於零的PPS時,可將參考圖片記憶體中之參考圖片標註為「未用於時間運動向量預測」。
若實施運動向量預測,則在接收到區塊188之後,視訊解碼器30即可建構MVP候選者清單。視訊解碼器30可使用上文關於視訊編碼器20所論述之相同方案來建構MVP候選者清單。在一些例子中,視訊解碼器30可執行類似於上文關於視訊編碼器20所描述之運動向量按比例縮放的運動向量按比例縮放。舉例而言,若運動向量預測因子並未指代與區塊188的參考圖片相同的參考圖片,則運動向量預測因子在添加至MVP候選者清單之前可被按比例縮放(例如,如上文所論述,基於POC距離按比例縮放)。視訊解碼
器30可使用識別候選者清單中之MVP的所接收MVP索引(mvp_flag)來識別區塊188之適當運動向量預測因子。視訊解碼器30可接著使用MVP及所接收MVD來產生區塊100的運動向量。
應理解,僅為了舉例而提供展示於圖6中之運動向量預測因子候選區塊,且為了預測運動資訊可使用較多、較少或不同區塊。
在任何狀況下,視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可儲存或緩衝A0
、A1
、B0
、B1
、B2
及相同定位的區塊COL的運動資訊,使得此資料可用於產生MVD或執行合併模式。舉例而言,視訊寫碼器可將上方相鄰區塊B0
、B1
及B2
之運動資訊(例如,運動向量、參考圖片索引、預測方向或其他資訊)儲存於在含有該等區塊之圖片的寬度上延伸之線緩衝器中,使得在區塊188之框間預測期間該運動資訊可用於參考。
然而,如上文所提及,儲存至線緩衝器之資料的量可為相對巨大的。舉例而言,1920×1080像素圖片(例如,對於1080p視訊而言)可包括具有多達495個4×4像素區塊的寬度,每一區塊潛在地具有其自己的運動資訊。此外,可存在可用於寫碼每一圖片之高達16個參考圖片。因此,當儲存線緩衝器中的圖片之每一區塊的所有運動資訊時,可要求視訊寫碼器將相對大量的資料儲存至線緩衝器。
根據本發明之態樣,視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可限制判定區塊188之運動資訊所根據之
位置的數目,以減小在寫碼期間儲存至線緩衝器之資料的量。亦即,例如,並非根據所有A0
、A1
、B0
、B1
及B2
判定用於寫碼區塊188的運動資訊(例如,MVP或合併候選者),視訊寫碼器可僅基於該等候選者之子集來判定區塊188的運動資訊。根據本發明之態樣,視訊寫碼器可基於左側相鄰區塊A1
及A0
以及相同定位之區塊COL而不基於上方相鄰區塊B0
、B1
或B2
來判定區塊188的運動資訊。亦即,例如,視訊寫碼器可僅基於左側相鄰區塊A1
及A0
以及相同定位之區塊COL來判定區塊188的運動資訊。在此實例中,視訊寫碼器可避免將與上方相鄰區塊B0
、B1
或B2
相關聯之運動資訊儲存至線緩衝器,此係因為該運動資訊並不用以判定用於寫碼區塊188的MVP或合併候選者。
在其他實例中,視訊寫碼器可基於上方相鄰區塊B0
、B1
或B2
中之一或多者(例如,除A1
及A0
以及相同定位之區塊COL外)判定區塊188的運動資訊,但僅在上方相鄰區塊係來自與當前區塊188的LCU相同的LCU時才這樣做。在此實例中,上方相鄰區塊B0
、B1
或B2
之運動資訊可為可用的(在不儲存於線緩衝器中之情況下),此係因為在LCU之寫碼期間LCU之所有資訊通常為可用的。如下文所描述之多種其他技術亦可用以減小在視訊寫碼期間經緩衝之運動資訊的量。
圖7為說明根據本發明之態樣的可藉以判定預測資訊之實例相鄰區塊的方塊圖。展示於圖7中之實例大體上被描述為由視訊寫碼器執行。應理解,在一些實例中,圖7之
技術可由上文所描述之視訊編碼器20(圖1及圖2)或視訊解碼器30(圖1及圖3)來進行。在其他實例中,圖7之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者來執行。
視訊寫碼器可當前正在寫碼(例如,框間寫碼或框內寫碼)經寫碼單元191的當前區塊190。經寫碼單元191通常可包括預定義數量之視訊資料,該預定義數量之視訊資料包括視訊資料之多個區塊,諸如LCU、片段、圖塊或圖塊集合、波前集合,或包括多個視訊資料區塊的任何其他預定義單元。雖然上方相鄰區塊194、左側相鄰區塊192及區塊196在圖7之實例中大體上被展示為未經劃分區塊,但應理解,此等區塊可被劃分成一或多個較小區塊。
根據本發明之態樣,並非將來自上方相鄰區塊194之預測資訊用於寫碼區塊190,視訊寫碼器可僅使用來自左側相鄰區塊192的預測資訊(例如,框內或框間預測資訊)。舉例而言,視訊寫碼器在執行當前區塊190之框間預測或框內預測時可能不使用來自上方相鄰區塊194或不鄰近於當前區塊190定位的先前經寫碼區塊196的資料。在此實例中,與在寫碼期間使用所有相鄰區塊之預測資訊(例如,如圖5及圖6中所展示)的情況相比較,視訊寫碼器可緩衝較少資料。舉例而言,假定64×64個像素之最大LCU大小及4×4個像素之最小CU大小,視訊解碼器30可潛在地緩衝與僅16個視訊資料區塊(例如,64/4=16個潛在左側相鄰區塊)相關聯的資料。
藉由限制上下文資訊所來源於之位置,如圖7之實例中所展示並描述,視訊寫碼器可減小為了預測而緩衝之資料的量。此外,視訊寫碼器可增大剖析輸貫量。舉例而言,如上文所提及,視訊解碼器(諸如,視訊解碼器30)可根據特定剖析程序(例如,波前剖析)來剖析所接收視訊資料。在視訊解碼器30並不根據諸如上方相鄰區塊194之某些相鄰區塊判定預測資訊的實例中,視訊解碼器30可消除相依性以改良剖析輸貫量及並行地處理視訊資料的能力。此外,消除相依性可減小預測導出誤差之可能性,藉此進一步改良剖析程序。
圖8為說明可藉以判定用於寫碼區塊之預測資訊之實例相鄰區塊的另一方塊圖。在展示於圖8中之實例中,視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)可基於左側相鄰區塊L及底部左側相鄰區塊BL來判定當前正被寫碼之區塊200的預測資訊。與展示於圖7中之實例相比較,圖8之實例添加了藉以導出預測資訊之額外左側相鄰區塊。
在展示於圖8中之實例中,如同展示於圖7中之實例一樣,可能根本不需要用於儲存相對於當前區塊200之上方相鄰區塊的預測資訊(例如,框內模式或運動資訊)之線緩衝器。如上文所解釋,LCU可經分割成不同配置的CU。因此,圖8之區塊L及BL可為同一LCU之不同CU。
關於框內預測,區塊L及區塊BL可皆使用同一框內預測模式進行寫碼,但在一些例子中,區塊L及區塊BL可使用不同框內預測模式進行寫碼。基於區塊L之框內預測模式
及區塊BL之框內預測模式,可判定當前區塊200的最可能框內預測模式。舉例而言,若使用(預定義數目個框內模式中的)模式6來寫碼區塊L及BL兩者,則區塊200之最可能框內預測模式亦可能為模式6。再一次,模式6可能並非區塊200之實際預測模式,但考慮到區塊200之上下文(亦即,相鄰於區塊200之區塊的預測模式),模式6可為區塊200之統計上最可能的模式。
在另一實例中,為了改良寫碼效率並避免冗餘,若區塊L及BL具有相同框內預測模式,則當前區塊200左側的第三區塊亦可用於判定最可能模式。應注意,區塊L及BL(或第三左側區塊)不需要直接鄰近於區塊200,而是可在區塊200之左側的一或多行處。若區塊L及區塊BL分別使用模式3及8來編碼,則區塊200之最可能模式可能為模式3、模式8或不同模式。針對特定上下文之最可能模式可藉由識別對於該上下文係統計上最可能之框內預測模式來做出選擇。藉由避免將上方區塊用於判定最可能模式,可消除對儲存上方區塊之框內預測模式的線緩衝器的需要。
關於框間預測,可儲存相鄰於區塊200之區塊的包括以下各者之運動資訊:指示運動向量之x及y座標的運動向量(mvx,mvy)、指示參考圖框清單中之參考圖框的參考索引(ref_idx),及指示使用哪一參考圖框清單(例如,L0或L1)的預測方向(inter_dir)。在一些實例中,所有此等運動資訊可儲存於對應線緩衝器中。根據本發明之態樣,視訊寫碼器可僅儲存區塊L及區塊BL之運動資訊,且排除上方相
鄰區塊的運動資訊。
根據一些實例,可藉由產生額外運動候選者來補償與減小用於運動向量預測之候選者之數目相關聯的可能效能損失。舉例而言,如以下實例表1中所展示,視訊寫碼器可使用諸如區塊L及BL之運動資訊的可用運動資訊產生額外運動候選者。
如表1之實例中所展示,視訊寫碼器可使用來自區塊L及BL之運動資訊產生運動合併候選者(2)、(3)及(4)。亦即,候選者L及BL之運動資訊(inter_dir、ref_idx及mv)可用以產生新運動候選者。在此實例中,mvLX_Y可表示第Y候選者中清單X的運動向量,mvLX'_Y可表示參考清單中第N參考圖片中之mvLX_Y,refN的經處理運動向量。展示於表1中之所產生運動資訊可藉由按比例縮放、偏移、截割或以其他方式修改現有運動資訊來產生。
雖然關於L及BL描述圖8之實例,但如上文所提及,亦可使用其他區塊(例如,額外區塊、並不鄰近於區塊200之區塊等等)。此外,關於合併模式(例如,如表1中所展示)所描述之技術可使用一MVD類似地應用至運動向量預測。
圖9為說明可藉以判定用於寫碼區塊之預測資訊之實例
相鄰區塊的另一方塊圖。舉例而言,本發明之態樣包括基於複數個左側相鄰區塊L00至L0N、L10至L1N、L20至L2N、BL0至BLN等等來判定當前區塊205的預測資訊。在一些實例中,視訊寫碼器可基於來自正被寫碼的區塊之左側一個以上行的區塊來判定預測資訊。亦即,關於框間寫碼,可藉由選自複數個左側相鄰區塊之區塊來建構最終運動向量候選者清單。關於框內寫碼,來自複數個左側相鄰區塊之框內模式可用於最可能模式導出。
如圖9之實例中所展示,額外左側相鄰區塊(例如,在接界區塊LN0之左側)可用以抵消與不緩衝左側相鄰區塊之預測資訊相關聯的可能寫碼效能損失。舉例而言,在一些例子中,上方相鄰區塊之框內模式可與區塊205之框內模式匹配。在其他例子中,與上方相鄰區塊相關聯之運動向量可與區塊205之運動向量匹配或接近匹配。在此等例子中,在寫碼期間防止視訊寫碼器擷取上方相鄰區塊之資料可導致寫碼效能損失,此係由於視訊寫碼器可被迫找尋較不準確的預測因子。然而,藉由增大視訊寫碼器可自其擷取資料從而判定預測資訊的左側相鄰區塊之數目,可增大找到相對高品質預測因子的可能性。
在一些實例中,展示於圖9中之左側相鄰區塊可為形成同一LCU之部分的不同CU。在其他實例中,左側相鄰區塊可包括於不同LCU中。
圖10為說明可藉以判定用於寫碼區塊之預測資訊之實例相鄰區塊的另一圖。舉例而言,與不儲存與上方相鄰區塊
相關聯之任何資料形成對比,減小用於預測用途(例如,框間寫碼或框內寫碼)之線緩衝器資料的另一方式為減小儲存至線緩衝器之區塊的數目。在展示於圖10中之實例中,區塊210當前正被寫碼,而區塊212先前已經寫碼。在一些實例中,與區塊214A及214B(共同為區塊214)相關聯之預測資訊(例如,框內模式或運動資訊)可儲存至線緩衝器。
然而,根據本發明之態樣,可僅將與區塊214相關聯之資料的一子集儲存至線緩衝器。亦即,在展示於圖10中之實例中,可將與區塊214A相關聯之預測資訊儲存至線緩衝器,而可自線緩衝器省略與區塊214B相關聯的預測資訊。雖然圖10之實例展示區塊214A及214B具有相等大小,但在其他實例中,可實施僅允許將區塊214之預測資訊之一部分儲存至線緩衝器的不同子取樣方案。亦即,在其他實例中,區塊214A可大於或小於區塊214B。
在展示於圖10中之實例中,若視訊寫碼器(諸如,視訊編碼器20或視訊解碼器30)需要判定來自區塊214A中之一者的預測資訊,則視訊寫碼器可自緩衝器讀取該預測資訊。亦即,例如,若區塊214A中之一者包括區塊210之最可能模式判定的上下文,則視訊寫碼器可自線緩衝器讀取框內模式。
或者,若視訊寫碼器需要判定來自區塊214B中之一者的預測資訊,則視訊寫碼器可基於儲存於緩衝器中之預測資訊的子集導出該區塊之預測資訊。導出可(例如)基於複製
一或多個附近區塊214A之儲存於緩衝器中的預測資訊,內插儲存於緩衝器中之運動資訊,或基於區塊214A之所儲存預測資訊以某一其他方式導出預測資訊。
圖11為說明截割(例如,減小位元深度)儲存至緩衝器之運動向量之實例的概念圖。亦即,例如,減小儲存至線緩衝器之預測資訊(且更具體而言,用於框間預測之運動向量)的量之另一方式可為減小在儲存每一運動向量之每一分量時使用的位元之數目。
在此實例中,如圖11之實例中所展示,儲存至線緩衝器之每一運動向量(例如,與上部相鄰區塊相關聯之運動向量)可經截割至N個位元,其中每一運動向量最初為M個位元(M大於N)。在圖11之實例中,M等於12且N等於8,儘管亦可實施其他數目個位元。應理解,展示於圖11中之整數的特定表示可能不對應於實體表示(稱為2補數算術),而是為了解釋而提供。藉由展示於圖11中之實例位元截割,無子像素(「子像素(sub-pel)」)準確度之運動向量的最大範圍為64。當運動為小時,此截割對寫碼效率可具有相對小之影響或無影響。
圖12為說明截割儲存至線緩衝器之運動向量之實例的另一概念圖。舉例而言,若相對運動向量為相對大的,則可截割較少有效位元。亦即,在圖12之實例中,已截割了三個最高有效位元及sub-pel位元中的一者。更具體而言,在圖12之實例中,移除¼-pel或sub-pel準確度,且移除3個最高有效位元,儘管可實施不同組態。自最高或最低有效位
元移除之位元的數目(例如,如圖11及圖12中所展示)可在諸如SPS或PPS之參數集合中予以指定。
圖13為說明LCU之邊界CU的圖。舉例而言,LCU 240由區塊242接界,區塊242可包括一或多個其他LCU。在展示於圖13中之實例中,LCU 240包括與區塊242共用邊界之邊界CU 244,及不與區塊242共用邊界的內部CU 246。LCU 240之每一CU可具有相關聯的PU。
在一些實例中,如上文所描述,視訊寫碼器可使用來自上方相鄰區塊之預測資訊(例如,框內模式或運動資訊)寫碼LCU 240的PU。CU 246之上方相鄰PU的預測資訊可易於得到,此係由於此等PU包括於同一LCU 242中。然而,為了在寫碼CU 244之邊界PU時存取來自上方相鄰區塊242的預測資訊,視訊寫碼器必須存取來自不同於正寫碼之LCU 240的LCU之此資訊。為了(例如)在不存取在視訊寫碼器外部之記憶體的情況下為可用的,視訊寫碼器可將此上方相鄰預測資訊儲存至線緩衝器。
將此統一方案應用於LCU 240之所有PU(包括用以儲存邊界CU 244之資訊的緩衝器)可輔助硬體實施簡單性。亦即,所有PU可存取來自相同相對位置的預測資訊。然而,在寫碼期間排除來自在不同於含有區塊244、246之LCU的LCU中的上方相鄰區塊242的資料而不加以擷取可減小儲存至線緩衝器之資料的量。此外,在寫碼期間排除來自上方相鄰區塊242的資料而不加以擷取亦可使可能由於依靠LCU 240外部之CU而引入之不準確性的影響最小化,藉此
改良寫碼效能。亦即,若來自上方相鄰區塊242之資料形成另一片段之被丟失或以其他方式遭破壞的部分,則視訊寫碼器仍可寫碼邊界CU 244.
因此,貫穿本發明所描述之技術可僅應用至LCU之PU的子集。亦即,例如,用於限制儲存至線緩衝器之資料的量之技術可僅應用至LCU 240之可能需要存取線緩衝器的邊界CU 244。
圖14為一說明用於減小在視訊寫碼期間經緩衝之預測資訊之量的實例技術之流程圖。展示於圖14中之實例大體上被描述為由視訊寫碼器執行。應理解,在一些實例中,圖14之技術可由上文所描述之視訊編碼器20(圖1及圖2)或視訊解碼器30(圖1及圖3)來進行。在其他實例中,圖14之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者來執行。
視訊寫碼器可接收用於熵寫碼的經寫碼單元(例如,圖片、片段、圖塊、波前集合及其類似者)之視訊資料的區塊(260)。根據本發明之態樣,可使視訊資料區塊定位於經寫碼單元中之區塊的頂部列下方。在一些實例中,當前正寫碼之區塊可為與上方相鄰子CU包括於同一LCU中的子CU。在其他實例中,區塊可定位於LCU之邊緣處,使得上方相鄰區塊與當前區塊屬於不同的LCU。
視訊寫碼器可接著基於經寫碼單元中之一或多個其他區塊的預測資訊但並不基於經寫碼單元之頂部列中的區塊來判定區塊之預測資訊(262)。舉例而言,若對第一區塊進行
框間預測,則視訊寫碼器可判定與第一區塊相關聯之運動資訊(例如,運動向量、參考圖片索引、預測方向或其他資訊)。或者,若對第一區塊進行框內預測,則視訊寫碼器可判定第一區塊之框內模式。
在一些實例中,根據本發明之態樣,並非基於上方相鄰區塊來判定區塊之預測資訊,視訊寫碼器可使用來自左側相鄰區塊的預測資訊。在一些實例中,左側相鄰區塊可包括於與當前正被寫碼區塊之LCU相同之LCU內。在其他實例中,左側相鄰區塊可包括於與當前正被寫碼區塊之LCU不同之LCU內。如上文所提及,在一些實例中,一或多個其他區塊可直接鄰近於當前正被寫碼的區塊而定位,或可距該區塊若干個區塊而定位。
在另一實例中,視訊資料區塊可包括LCU之一或多個區塊,且頂部列區塊可包括一或多個其他LCU。在此實例中,根據本發明之態樣,視訊寫碼器可使用與LCU的其他區塊相關聯的預測資訊判定區塊之預測資訊,但將頂部列的上方相鄰區塊(其包括於其他LCU中)排除在外。為了說明,在一實例中,正被寫碼的區塊可包括LCU之第一子CU,且上方相鄰區塊可包括一或多個其他LCU。亦假定第二子CU定位於第一子CU上方(在同一LCU中)。在此實例中,視訊寫碼器可使用基於定位於第一子CU上方之第二子CU的資訊判定第一子CU的預測資訊。
視訊寫碼器可接著基於所判定預測資訊寫碼區塊(264)。舉例而言,如下文關於圖15及圖16更詳細描述,若
區塊為經框內寫碼區塊,則視訊寫碼器可藉由基於來自一或多個其他區塊之框內預測模式判定區塊之最可能模式來寫碼區塊。或者,如下文關於圖17及圖18更詳細描述,若當前區塊為經框間寫碼區塊,則視訊寫碼器可藉由基於來自一或多個其他區塊之運動資訊判定MVD(或合併資訊)來寫碼區塊。
應理解,關於圖14所展示並描述之步驟僅作為一實例而提供。亦即,圖14之方法之步驟不必以展示於圖14中之次序執行,且可執行較少、額外或替代性步驟。
圖15為說明用於減小在視訊編碼中執行框內預測時經緩衝之預測資訊之量的實例技術之流程圖。雖然關於視訊編碼器20進行描述,但應理解,關於圖15所描述之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者執行。
在展示於圖15中之實例中,視訊編碼器20可判定第一視訊資料區塊之框內預測模式(270)。視訊編碼器20亦可判定第二視訊資料區塊之框內預測模式(272)。根據本發明之態樣,視訊編碼器20可基於第一區塊之框內預測模式判定第二區塊的框內預測模式,但僅在第一區塊並非第二區塊之上方相鄰區塊的情況下才這樣做(274)。若第一區塊係上方相鄰區塊,則視訊編碼器20可基於一或多個其他區塊來判定第二區塊的最可能框內模式。亦即,可排除上方相鄰區塊而不將其考慮為第一區塊。在一些實例中,視訊編碼器20僅可在第一區塊係來自不同於第二區塊之LCU之LCU
的情況下應用上方相鄰區塊限制。
視訊編碼器20可判定所判定的最可能框內模式是否與第二區塊之所判定框內模式相同(276)。若最可能框內模式與第二區塊之所判定框內模式相同(步驟276之是分支),則視訊編碼器可在經編碼位元串流中提供最可能模式之指示(278)。根據一些實例,視訊編碼器20可在經編碼位元串流中設定最可能模式旗標,藉此指示最可能模式被用以框內寫碼第二區塊。在此實例中,如下文關於圖16更詳細描述,在解碼最可能模式旗標之後,視訊解碼器(諸如,視訊解碼器30)即可再生最可能模式導出程序以判定用以編碼第二區塊的框內模式。若最可能框內模式與第二區塊之框內模式不同(步驟276之否分支),則視訊編碼器20可在經編碼位元串流中提供用以編碼區塊之框內模式的指示(280)。
應理解,關於圖15所展示並描述之步驟僅作為一實例而提供。亦即,圖15之方法之步驟不必以展示於圖15中之次序執行,且可執行較少、額外或替代性步驟。
圖16為說明用於減小在視訊解碼中執行框內預測時經緩衝之預測資訊之量的實例技術之流程圖。雖然關於視訊解碼器30進行描述,但應理解,關於圖16所描述之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者執行。
視訊解碼器30最初可判定第一視訊資料區塊之框內預測模式(290)。視訊解碼器30亦可接收第二區塊之最可能框內
模式的指示(292)。舉例而言,在一些實例中,視訊解碼器30可接收最可能模式旗標,該最可能模式旗標指示最可能框內模式是否被用以框內預測第二區塊之像素。
視訊解碼器30可基於接收到之指示來判定最可能框內模式是否與用於解碼第二區塊之框內模式相同(294)。若最可能框內模式為用於解碼第二區塊之適當框內模式(步驟294之是分支),則視訊解碼器30可判定第二區塊的最可能框內模式(296)。舉例而言,根據本發明之態樣,視訊解碼器30可基於第一區塊之框內預測模式判定第二區塊的框內預測模式,但僅在第一區塊並非第二區塊之上方相鄰區塊的情況下才這樣做。若第一區塊係上方相鄰區塊,則視訊解碼器30可基於一或多個其他區塊來判定第二區塊的最可能框內模式。在一些實例中,視訊解碼器30僅可在第一區塊係來自不同於第二區塊之LCU之LCU的情況下應用上方相鄰區塊限制。
視訊解碼器30可接著使用最可能框內模式解碼第二區塊(298)。亦即,例如,視訊解碼器30可使用最可能框內預測模式預測第二區塊,且基於預測性值與所接收殘餘值之組合判定第二區塊的像素值。
若最可能框內模式並非用於解碼第二區塊之適當框內模式(步驟294之否分支),則視訊解碼器30可(例如)基於某一所接收傳訊而判定用於解碼第二區塊的框內模式(300)。在其他實例中,視訊解碼器30可將預設框內模式應用於第二區塊。在任何狀況下,視訊解碼器30可接著基於所判定框
內模式解碼第二區塊(302)。亦即,例如,視訊解碼器30可使用所判定框內預測模式預測第二區塊,且基於預測性值與所接收殘餘值之組合判定第二區塊的像素值。
應理解,關於圖16所展示並描述之步驟僅作為一實例而提供。亦即,圖16之方法之步驟不必以展示於圖16中之次序執行,且可執行較少、額外或替代性步驟。
圖17為說明用於減小在視訊編碼中執行框間預測時經緩衝之預測資訊之量的實例技術之流程圖。雖然關於視訊編碼器20進行描述,但應理解,關於圖17所描述之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者執行。
在圖17中之實例中,視訊編碼器20可判定第一視訊資料區塊之運動資訊(310)。視訊編碼器20亦可判定第二視訊資料區塊之運動資訊(312)。根據本發明之態樣,視訊編碼器20可基於第一區塊之運動向量判定第二區塊的MVP,但僅在第一區塊並非第二區塊之上方相鄰區塊的情況下才這樣做(314)。若第一區塊係上方相鄰區塊,則視訊編碼器20可基於一或多個其他區塊來判定第二區塊的MVP。在一些實例中,視訊編碼器20僅可在第一區塊係來自不同於第二區塊之LCU之LCU的情況下應用上方相鄰區塊限制。
視訊編碼器20亦可在經編碼位元串流中提供所判定MVP之指示(316)。亦即,視訊編碼器20可識別MVP所屬於之區塊。此外,視訊編碼器20可將MVD與MVP一起包括於經編碼位元串流中。
儘管關於判定MVP並產生MVD進行描述,但應理解,關於圖17所描述之技術亦可用於合併模式。亦應理解,關於圖17所展示並描述之步驟僅作為一實例而提供。亦即,圖17之方法之步驟不必以展示於圖17中之次序執行,且可執行較少、額外或替代性步驟。
圖18為說明用於減小在視訊編碼中執行框間預測時經緩衝之預測資訊之量的實例技術之流程圖。雖然關於視訊解碼器30進行描述,但應理解,關於圖18所描述之技術可由多種其他處理器、處理單元、諸如編碼器/解碼器(CODEC)的基於硬體之寫碼單元及其類似者來執行。
在展示於圖18中之實例中,視訊解碼器30可判定第一視訊資料區塊之運動資訊(330)。視訊解碼器30亦可接收第二視訊資料區塊之運動向量預測因子的指示(332)。根據本發明之態樣,視訊解碼器30可基於第一區塊之運動向量判定第二區塊的MVP,但僅在第一區塊並非第二區塊之上方相鄰區塊的情況下才這樣做(334)。亦即,視訊解碼器30僅可在第一區塊並非第二區塊之上方相鄰區塊的情況下將來自第一區塊之運動向量添加至MVP候選者清單。若第一區塊係上方相鄰區塊,則視訊解碼器30可基於一或多個其他區塊來判定第二區塊的MVP。在一些實例中,視訊解碼器30僅可在第一區塊係來自不同於第二區塊之LCU之LCU的情況下應用上方相鄰區塊限制。
視訊解碼器30可藉由組合第一區塊之運動向量(在第一區塊用作MVP之例子中)與所接收MVD來判定第二區塊的
運動資訊。視訊解碼器30可接著使用所判定運動資訊解碼第二區塊(336)。亦即,視訊解碼器30可擷取由運動向量識別之預測性區塊,且基於預測性區塊與所接收殘餘值之組合判定第二區塊的像素值。
儘管關於判定MVP並產生MVD進行描述,但應理解,關於圖18所描述之技術亦可用於合併模式。亦應理解,關於圖18所展示並描述之步驟僅作為一實例而提供。亦即,圖18之方法之步驟不必以展示於圖18中之次序執行,且可執行較少、額外或替代性步驟。
此外,應理解,視實例而定,本文中所描述之任何方法的某些動作或事件可以不同序列執行、可經添加、合併或完全省去(例如,並非所有所描述動作或事件皆對於方法之實踐為必要的)。此外,在某些實例中,動作或事件可(例如)經由多線緒處理、中斷處理或多個處理器同時而非順序執行。此外,雖然為了清晰將本發明之某些態樣描述為由單一模組或單元執行,但應理解,本發明之技術可由與視訊寫碼器相關聯之單元或模組的組合來執行。
在一或多個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合實施。若在軟體中實施,則功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且由基於硬體之處理單元執行。電腦可讀媒體可包括對應於有形媒體(諸如,資料儲存媒體)之電腦可讀儲存媒體或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處之任何媒體。
以此方式,電腦可讀媒體通常可對應於(1)非暫態的有形電腦可讀儲存媒體或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例且非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接被適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。
然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他瞬時媒體,而是替代地針對非瞬時有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。上述各者之組合亦應包括於電腦可讀媒體之範疇內。
指令可由諸如以下各者之一或多個處理器執行:一或多
個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代前述結構或適於實施本文中所描述之技術之任何其他結構中的任一者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態以用於編碼及解碼的專用硬體及/或軟體模組內,或併入組合之編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
可在包括無線手機、積體電路(IC)或一組IC(例如,晶片組)之廣泛多種器件或裝置中實施本發明之技術。各種組件、模組或單元描述於本發明中以強調經組態以執行所揭示之技術之器件的功能態樣,但不一定要求藉由不同硬體單元實現。更確切而言,如上文所描述,各種單元可組合於編碼解碼器硬體單元中或由交互操作之硬體單元的集合(包括如上文所描述之一或多個處理器)結合合適的軟體及/或韌體來提供。
已描述了本發明之各種態樣。此等及其他態樣係在以下申請專利範圍之範疇內。
10‧‧‧實例視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
40‧‧‧模式選擇單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
48‧‧‧分割單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換處理單元
62‧‧‧求和器
64‧‧‧參考圖片記憶體
80‧‧‧熵解碼單元
81‧‧‧預測單元
82‧‧‧運動補償單元
84‧‧‧框內預測單元
86‧‧‧反量化單元
88‧‧‧反變換單元
90‧‧‧求和器
92‧‧‧參考圖片記憶體
150‧‧‧四元樹
152‧‧‧根節點
154‧‧‧節點
156A‧‧‧葉節點
156B‧‧‧葉節點
156C‧‧‧葉節點
158A‧‧‧葉節點
158B‧‧‧葉節點
158C‧‧‧葉節點
158D‧‧‧葉節點
172‧‧‧對應最大寫碼單元
174‧‧‧子寫碼單元(子CU)
176A‧‧‧子寫碼單元(子CU)
176B‧‧‧子寫碼單元(子CU)
176C‧‧‧子寫碼單元(子CU)
178A‧‧‧子寫碼單元(子CU)
178B‧‧‧子寫碼單元(子CU)
178C‧‧‧子寫碼單元(子CU)
178D‧‧‧子寫碼單元(子CU)
180‧‧‧當前區塊
182‧‧‧上方相鄰區塊
184‧‧‧左側相鄰區塊
188‧‧‧當前正被寫碼之區塊
190‧‧‧當前區塊
191‧‧‧經寫碼單元
192‧‧‧左側相鄰區塊
194‧‧‧上方相鄰區塊
196‧‧‧區塊
200‧‧‧當前正被寫碼之區塊
205‧‧‧當前區塊
210‧‧‧區塊
212‧‧‧區塊
214A‧‧‧區塊
214B‧‧‧區塊
240‧‧‧最大寫碼單元(LCU)
242‧‧‧區塊
244‧‧‧邊界寫碼單元(邊界CU)
246‧‧‧內部寫碼單元(內部CU)
A0
‧‧‧相鄰區塊
A1
‧‧‧相鄰區塊
B0
‧‧‧相鄰區塊
B1
‧‧‧相鄰區塊
B2
‧‧‧相鄰區塊
BL‧‧‧底部左側相鄰區塊
BL0至BLN‧‧‧左側相鄰區塊
COL‧‧‧時間上相同定位之區塊
L‧‧‧左側相鄰區塊
L00至L0N‧‧‧左側相鄰區塊
L10至L1N‧‧‧左側相鄰區塊
L20至L2N‧‧‧左側相鄰區塊
圖1為說明可利用本發明中所描述之技術的實例視訊編碼及解碼系統的方塊圖。
圖2為說明可實施本發明中所描述之技術的實例視訊編碼器之方塊圖。
圖3為說明可實施本發明中所描述之技術的實例視訊解
碼器之方塊圖。
圖4A及圖4B為說明實例四元樹及對應的最大寫碼單元(LCU)的概念圖。
圖5為說明可根據其判定最可能的框內模式的實例相鄰區塊的圖。
圖6為說明運動向量預測因子候選者之實例位置的圖。
圖7為說明可根據其判定用於寫碼區塊之預測資訊的實例相鄰區塊的圖。
圖8為說明可根據其判定用於寫碼區塊之預測資訊的實例相鄰區塊的另一圖。
圖9為說明可根據其判定用於寫碼區塊之預測資訊的實例相鄰區塊的另一圖。
圖10為說明可根據其判定用於寫碼區塊之預測資訊的實例相鄰區塊的另一圖。
圖11為說明截割一或多個相鄰區塊之預測資訊的實例之概念圖。
圖12為說明截割一或多個相鄰區塊之預測資訊的實例之另一概念圖。
圖13為說明最大寫碼單元之邊界寫碼單元的方塊圖。
圖14為說明用於減小在視訊寫碼期間經緩衝之預測資訊之量的實例技術之流程圖。
圖15為說明用於減小在執行框內預測時經緩衝之預測資訊之量的實例技術之流程圖。
圖16為說明用於減小在執行框內預測時經緩衝之預測資
訊之量的實例技術之流程圖。
圖17為說明用於減小在執行框間預測時經緩衝之預測資訊之量的實例技術之流程圖。
圖18為說明用於減小在執行框間預測時經緩衝之預測資訊之量的實例技術之流程圖。
10‧‧‧實例視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
Claims (48)
- 一種寫碼視訊資料之方法,該方法包含:判定一視訊資料區塊之框內預測模式,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中判定該框內預測模式包含基於一最可能框內預測模式而判定該框內預測模式,該最可能框內預測模式係基於來自該經寫碼單元中之一或多個其他區塊的一框內預測模式,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的一框內預測模式;及基於該所判定之框內預測模式寫碼該區塊。
- 如請求項1之方法,其中該經寫碼單元包含一圖片、一片段、一圖塊及一波前集合中的一者。
- 如請求項1之方法,其中該一或多個其他區塊包含該區塊之一或多個左側相鄰區塊。
- 如請求項3之方法,其中該一或多個其他區塊直接鄰近於該區塊。
- 如請求項3之方法,其中該一或多個其他區塊包括並非直接鄰近於該區塊的一或多個區塊。
- 如請求項1之方法,其中判定該區塊之該最可能框內預測模式進一步包含基於一第一左側相鄰第一區塊及定位於該區塊下方之一第二左側相鄰區塊來判定該最可能框內預測模式。
- 如請求項1之方法,其中該區塊包含一最大經寫碼單元 LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU之區塊,且其中該最可能框內模式判定並不基於該一或多個其他LCU之該等區塊的框內預測模式。
- 如請求項1之方法,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中判定該區塊之該最可能模式包含基於來自該第一LCU之一第二子CU的一框內預測模式判定該最可能模式,其中該第二子CU定位於該第一LCU中之該第一子CU上方。
- 如請求項1之方法,其中寫碼該區塊包含基於該最可能框內預測模式編碼該區塊,且其中編碼該區塊包含:使用該區塊之一框內預測模式框內預測用於編碼該區塊的殘餘值;判定該區塊之該框內預測模式是否與該所判定最可能框內預測模式匹配;在一經編碼位元串流中指示該區塊之該框內預測模式是否與該最可能框內預測模式匹配。
- 如請求項1之方法,其中寫碼該區塊包含基於該最可能框內預測模式解碼該區塊,且其中解碼該區塊包含:基於該區塊之一框內預測模式是否與該所判定最可能框內預測模式匹配來判定用於解碼該區塊的一框內預測模式;使用該所判定的用於解碼該區塊之框內預測模式框內 預測該區塊的殘餘值;組合該區塊之該框內預測殘餘值與所接收殘餘值。
- 如請求項1之方法,其中:判定該預測資訊包含判定該視訊資料區塊之運動資訊;判定該區塊之該預測資訊包含基於該一或多個其他區塊之該運動資訊而不基於來自該經寫碼單元中之該頂部列的區塊的運動資訊來判定該區塊之運動資訊;及寫碼該區塊包含基於該所判定運動資訊寫碼該區塊。
- 如請求項11之方法,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU,且其中該運動資訊判定並不基於該一或多個其他LCU的運動資訊。
- 如請求項11之方法,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中判定該區塊之該運動資訊包含基於來自該第一LCU之一第二子CU的運動資訊判定該運動資訊,其中該第二子CU係在該第一LCU中之該第一子CU上方。
- 如請求項11之方法,其中寫碼該區塊包含編碼該區塊,且其中:基於該一或多個其他區塊之該運動資訊判定該區塊之該預測資訊包含基於該一或多個其他區塊之該運動資訊 判定該區塊的一運動向量預測因子;及編碼該區塊包含在一經編碼位元串流中指示該運動向量預測因子。
- 如請求項11之方法,其中寫碼該區塊包含解碼該區塊,且其中:基於該區塊之一框內預測模式是否與該所判定最可能框內預測模式匹配來判定用於解碼該區塊的一框內預測模式;使用該所判定的用於解碼該區塊之框內預測模式框內預測該區塊的殘餘值;組合該區塊之該框內預測殘餘值與所接收殘餘值以重建構該區塊。
- 一種用於寫碼視訊資料之裝置,該裝置包含經組態以進行以下操作的一或多個處理器:判定一視訊資料區塊之一框內預測模式,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中為了判定該框內預測模式,該一或多個處理器經組態以基於一最可能框內預測模式而判定該框內預測模式,該最可能框內預測模式係基於來自該經寫碼單元中之一或多個其他區塊的一框內預測模式,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的一框內預測模式;及基於該所判定之框內預測模式寫碼該區塊。
- 如請求項16之裝置,其中該經寫碼單元包含一圖片、一 片段、一圖塊及一波前集合中的一者。
- 如請求項16之裝置,其中該一或多個其他區塊包含該區塊之一或多個左側相鄰區塊。
- 如請求項18之裝置,其中該一或多個其他區塊直接鄰近於該區塊。
- 如請求項18之裝置,其中該一或多個其他區塊包括並非直接鄰近於該區塊的一或多個區塊。
- 如請求項16之裝置,其中為了判定該區塊之該最可能框內預測模式,該一或多個處理器經進一步組態以基於一第一左側相鄰第一區塊及定位於該區塊下方之一第二左側相鄰區塊來判定該最可能框內預測模式。
- 如請求項16之裝置,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU之區塊,且其中該最可能框內模式判定並不基於該一或多個其他LCU之該等區塊的框內預測模式。
- 如請求項16之裝置,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中為了判定該區塊之該最可能模式,該一或多個處理器經組態以基於來自該第一LCU之一第二子CU的一框內預測模式判定該最可能模式,其中該第二子CU定位於該第一LCU中之該第一子CU上方。
- 如請求項16之裝置,其中該裝置包含一視訊編碼器,且 其中為了寫碼該區塊,該一或多個處理器經組態以基於該最可能框內預測模式編碼該區塊,且其中為了編碼該區塊,該一或多個處理器經組態以:使用該區塊之一框內預測模式框內預測用於編碼該區塊的殘餘值;判定該區塊之該框內預測模式是否與該所判定之最可能框內預測模式匹配;在一經編碼位元串流中指示該區塊之該框內預測模式是否與該最可能框內預測模式匹配。
- 如請求項16之裝置,其中該裝置包含一視訊解碼器,其中為了寫碼該區塊,該一或多個處理器經組態以基於該最可能框內預測模式解碼該區塊,且其中為了解碼該區塊,該一或多個處理器經組態以:基於該區塊之一框內預測模式是否與該所判定最可能框內預測模式匹配來判定用於解碼該區塊的一框內預測模式;使用該所判定的用於解碼該區塊之框內預測模式框內預測該區塊的殘餘值;組合該區塊之該框內預測殘餘值與所接收殘餘值。
- 如請求項16之裝置,其中:為了判定該預測資訊,該一或多個處理器經組態以判定該視訊資料區塊之運動資訊;為了判定該區塊之該預測資訊,該一或多個處理器經組態以基於該一或多個其他區塊之運動資訊而不基於來 自該經寫碼單元中之該頂部列的區塊的運動資訊來判定該區塊之運動資訊;及為了寫碼該區塊,該一或多個處理器經組態以基於該所判定運動資訊寫碼該區塊。
- 如請求項26之裝置,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU,且其中該運動資訊判定並不基於該一或多個其他LCU的運動資訊。
- 如請求項26之裝置,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中為了判定該區塊之該運動資訊,該一或多個處理器經組態以基於來自該第一LCU之一第二子CU的運動資訊判定該運動資訊,其中該第二子CU係在該第一LCU中之該第一子CU上方。
- 如請求項26之裝置,其中該裝置包含一視訊編碼器,其中為了寫碼該區塊,該一或多個處理器經組態以編碼該區塊,且其中為了編碼該區塊,該一或多個處理器經組態以:基於該一或多個其他區塊之該運動資訊判定該區塊之該預測資訊包含基於該一或多個其他區塊之該運動資訊判定該區塊的一運動向量預測因子;及編碼該區塊包含在一經編碼位元串流中指示該運動向量預測因子。
- 如請求項26之裝置,其中該裝置包含一視訊解碼器,其中為了寫碼該區塊,該一或多個處理器經組態以解碼該區塊,且其中為了解碼該區塊,該一或多個處理器經組態以:基於該區塊之一框內預測模式是否與該所判定最可能框內預測模式匹配來判定用於解碼該區塊的一框內預測模式;使用該所判定的用於解碼該區塊之框內預測模式框內預測該區塊的殘餘值;組合該區塊之該框內預測殘餘值與所接收殘餘值以重建構該區塊。
- 一種儲存有指令之非暫時性電腦可讀儲存媒體,該等指令在執行時使得一或多個處理器進行以下操作:判定一視訊資料區塊之一框內預測模式,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中為了判定該框內預測模式,該指令使得該一或多個處理器基於一最可能框內預測模式而判定該框內預測模式,該最可能框內預測模式係基於來自該經寫碼單元中之一或多個其他區塊的一框內預測模式,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的一框內預測模式;及基於該所判定之框內預測模式寫碼該區塊。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中該經寫碼單元包含一圖片、一片段、一圖塊及一波前集合中的 一者。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中該一或多個其他區塊包含該區塊之一或多個左側相鄰區塊。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中為了判定該區塊之該最可能框內預測模式,該等指令使得該一或多個處理器基於一第一左側相鄰第一區塊及定位於該區塊下方之一第二左側相鄰區塊來判定該最可能框內預測模式。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU之區塊,且其中該最可能框內模式判定並不基於該一或多個其他LCU之該等區塊的框內預測模式。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中為了判定該區塊之該最可能模式,該等指令使得該一或多個處理器基於來自該第一LCU之一第二子CU的一框內預測模式判定該最可能模式,其中該第二子CU定位於該第一LCU中之該第一子CU上方。
- 如請求項31之非暫時性電腦可讀儲存媒體,其中:為了判定該預測資訊,該等指令使得該一或多個處理器判定該視訊資料區塊之運動資訊; 為了判定該區塊之該預測資訊,該等指令使得該一或多個處理器基於該一或多個其他區塊之運動資訊而不基於來自該經寫碼單元中之該頂部列的區塊的運動資訊來判定該區塊之運動資訊;及為了寫碼該區塊,該等指令使得該一或多個處理器基於該所判定運動資訊寫碼該區塊。
- 如請求項37之非暫時性電腦可讀儲存媒體,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU,且其中該運動資訊判定並不基於該一或多個其他LCU的運動資訊。
- 如請求項37之非暫時性電腦可讀儲存媒體,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中為了判定該區塊之該運動資訊,該等指令使得該一或多個處理器基於來自該第一LCU之一第二子CU的運動資訊判定該運動資訊,其中該第二子CU係在該第一LCU中之該第一子CU上方。
- 一種用於寫碼視訊資料之裝置,該裝置包含:用於判定一視訊資料區塊之一框內預測模式之構件,其中該區塊包括於一經寫碼視訊資料單元中且定位於該經寫碼單元中之上方相鄰區塊的一頂部列下方,且其中該用於判定該框內預測模式之構件包含用於基於一最可能框內預測模式而判定該框內預測模式之構件,該最可 能框內預測模式係基於來自該經寫碼單元中之一或多個其他區塊的一框內預測模式,但並不基於來自該經寫碼單元中之該頂部列的區塊中之任一者的一框內預測模式;及用於基於該所判定之框內預測模式寫碼該區塊之構件。
- 如請求項40之裝置,其中該經寫碼單元包含一圖片、一片段、一圖塊及一波前集合中的一者。
- 如請求項40之裝置,其中該一或多個其他區塊包含該區塊之一或多個左側相鄰區塊。
- 如請求項40之裝置,其中用於判定該區塊之該最可能框內預測模式的構件進一步包含用於基於一第一左側相鄰第一區塊及定位於該區塊下方之一第二左側相鄰區塊來判定該最可能框內預測模式的構件。
- 如請求項40之裝置,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU之區塊,且其中該最可能框內模式判定並不基於該一或多個其他LCU之該等區塊的框內預測模式。
- 如請求項40之裝置,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中用於判定該區塊之該最可能模式的構件包含用於基於來自該第一LCU之一第二子CU的一框內預測模式判定該最可能模式的構件,其中該第 二子CU定位於該第一LCU中之該第一子CU上方。
- 如請求項40之裝置,其中:用於判定該預測資訊之構件包含用於判定該視訊資料區塊之運動資訊的構件;用於判定該區塊之該預測資訊之構件包含用於基於該一或多個其他區塊之該運動資訊而不基於來自該經寫碼單元中之該頂部列的區塊的運動資訊來判定該區塊之運動資訊的構件;及用於寫碼該區塊之構件包含用於基於該所判定運動資訊寫碼該區塊的構件。
- 如請求項46之裝置,其中該區塊包含一最大寫碼單元LCU之一或多個區塊,且該頂部列的區塊包含一或多個其他LCU,且其中該運動資訊判定並不基於該一或多個其他LCU的運動資訊。
- 如請求項46之裝置,其中該區塊包含該經寫碼單元之一第一最大寫碼單元(LCU)的一第一子寫碼單元(CU),其中該頂部列的區塊包含該經寫碼單元之係在該第一LCU上方的一第二LCU,且其中用於判定該區塊之該運動資訊的構件包含用於基於來自該第一LCU之一第二子CU的運動資訊判定該運動資訊的構件,其中該第二子CU係在該第一LCU中之該第一子CU上方。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161509933P | 2011-07-20 | 2011-07-20 | |
US201161522136P | 2011-08-10 | 2011-08-10 | |
US13/550,377 US9699456B2 (en) | 2011-07-20 | 2012-07-16 | Buffering prediction data in video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201313033A TW201313033A (zh) | 2013-03-16 |
TWI504237B true TWI504237B (zh) | 2015-10-11 |
Family
ID=47555728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101126095A TWI504237B (zh) | 2011-07-20 | 2012-07-19 | 視訊寫碼中之緩衝預測資料 |
Country Status (15)
Country | Link |
---|---|
US (1) | US9699456B2 (zh) |
EP (1) | EP2735153A2 (zh) |
JP (1) | JP5869122B2 (zh) |
KR (1) | KR101521060B1 (zh) |
CN (1) | CN103688541B (zh) |
AU (1) | AU2012284123B2 (zh) |
BR (1) | BR112014001124A2 (zh) |
CA (1) | CA2842037C (zh) |
IL (1) | IL230281B (zh) |
MX (1) | MX338116B (zh) |
MY (1) | MY167510A (zh) |
RU (1) | RU2573744C2 (zh) |
TW (1) | TWI504237B (zh) |
WO (1) | WO2013012867A2 (zh) |
ZA (1) | ZA201401264B (zh) |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5857244B2 (ja) * | 2011-03-07 | 2016-02-10 | パナソニックIpマネジメント株式会社 | 動き補償装置、動画像符号化装置、動画像復号装置、動き補償方法、プログラム、及び集積回路 |
CN106101727B (zh) | 2011-08-04 | 2019-10-08 | 寰发股份有限公司 | 基于上下文自适应二进制算术编码的方法及装置 |
JP5768662B2 (ja) * | 2011-10-31 | 2015-08-26 | 富士通株式会社 | 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム |
US9154796B2 (en) * | 2011-11-04 | 2015-10-06 | Qualcomm Incorporated | Intra-mode video coding |
KR20130050149A (ko) * | 2011-11-07 | 2013-05-15 | 오수미 | 인터 모드에서의 예측 블록 생성 방법 |
US8693551B2 (en) | 2011-11-16 | 2014-04-08 | Vanguard Software Solutions, Inc. | Optimal angular intra prediction for block-based video coding |
US9531990B1 (en) | 2012-01-21 | 2016-12-27 | Google Inc. | Compound prediction using multiple sources or prediction modes |
CN104247423B (zh) * | 2012-03-21 | 2018-08-07 | 联发科技(新加坡)私人有限公司 | 可伸缩视频编码系统的帧内模式编码方法和装置 |
US9185414B1 (en) | 2012-06-29 | 2015-11-10 | Google Inc. | Video encoding using variance |
US9621905B2 (en) * | 2012-06-29 | 2017-04-11 | Qualcomm Incorporated | Tiles and wavefront parallel processing |
US9288484B1 (en) | 2012-08-30 | 2016-03-15 | Google Inc. | Sparse coding dictionary priming |
CN102883163B (zh) * | 2012-10-08 | 2014-05-28 | 华为技术有限公司 | 用于运动矢量预测的运动矢量列表建立的方法、装置 |
US9106922B2 (en) * | 2012-12-19 | 2015-08-11 | Vanguard Software Solutions, Inc. | Motion estimation engine for video encoding |
US9628790B1 (en) | 2013-01-03 | 2017-04-18 | Google Inc. | Adaptive composite intra prediction for image and video compression |
US9210424B1 (en) | 2013-02-28 | 2015-12-08 | Google Inc. | Adaptive prediction block size in video coding |
US20140286413A1 (en) * | 2013-03-25 | 2014-09-25 | Qualcomm Incorporated | Disabling sign data hiding in video coding |
US9300906B2 (en) | 2013-03-29 | 2016-03-29 | Google Inc. | Pull frame interpolation |
US10904551B2 (en) * | 2013-04-05 | 2021-01-26 | Texas Instruments Incorporated | Video coding using intra block copy |
US9374578B1 (en) | 2013-05-23 | 2016-06-21 | Google Inc. | Video coding using combined inter and intra predictors |
US9510024B2 (en) * | 2014-09-12 | 2016-11-29 | Spotify Ab | System and method for early media buffering using prediction of user behavior |
US9313493B1 (en) | 2013-06-27 | 2016-04-12 | Google Inc. | Advanced motion estimation |
US9813730B2 (en) * | 2013-12-06 | 2017-11-07 | Mediatek Inc. | Method and apparatus for fine-grained motion boundary processing |
US9609343B1 (en) | 2013-12-20 | 2017-03-28 | Google Inc. | Video coding using compound prediction |
JP2015185897A (ja) * | 2014-03-20 | 2015-10-22 | パナソニックIpマネジメント株式会社 | 画像符号化方法及び画像符号化装置 |
US11323733B2 (en) * | 2014-05-23 | 2022-05-03 | Qualcomm Incorporated | Predictor palette initialization in palette-based video coding |
JP6482191B2 (ja) * | 2014-06-12 | 2019-03-13 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
WO2015200822A1 (en) * | 2014-06-26 | 2015-12-30 | Huawei Technologies Co., Ltd | Method and device for reducing a computational load in high efficiency video coding |
US9153017B1 (en) | 2014-08-15 | 2015-10-06 | Google Inc. | System and method for optimized chroma subsampling |
KR101746426B1 (ko) * | 2015-07-13 | 2017-06-13 | 동국대학교 산학협력단 | HEVC 4x4 인트라 예측 하드웨어 장치 |
US9807416B2 (en) | 2015-09-21 | 2017-10-31 | Google Inc. | Low-latency two-pass video coding |
RU2652424C2 (ru) * | 2016-02-29 | 2018-04-26 | Общество с ограниченной ответственностью "ВизКом" | Способ и система организации спутникового телевидения с буферизацией на наземном транспорте |
US9432668B1 (en) * | 2016-03-15 | 2016-08-30 | NGCodec Inc. | Apparatus and method for inter and intra mode selection and block partitioning |
CN114449287A (zh) * | 2016-03-16 | 2022-05-06 | 联发科技股份有限公司 | 视频编码的样式基础的运动向量推导之方法及装置 |
US10593015B2 (en) | 2016-05-04 | 2020-03-17 | Texas Instruments Incorporated | Apparatus and method for efficient motion estimation |
US11638027B2 (en) | 2016-08-08 | 2023-04-25 | Hfi Innovation, Inc. | Pattern-based motion vector derivation for video coding |
US10694202B2 (en) * | 2016-12-01 | 2020-06-23 | Qualcomm Incorporated | Indication of bilateral filter usage in video coding |
CN110100440B (zh) * | 2016-12-22 | 2023-04-25 | 株式会社Kt | 一种用于对视频进行解码、编码的方法 |
EP3565248A4 (en) * | 2016-12-28 | 2020-12-02 | LG Electronics Inc. -1- | INTERPREDICTION-BASED IMAGE PROCESSING METHOD AND DEVICE FOR IT |
US12063387B2 (en) | 2017-01-05 | 2024-08-13 | Hfi Innovation Inc. | Decoder-side motion vector restoration for video coding |
US20180199057A1 (en) * | 2017-01-12 | 2018-07-12 | Mediatek Inc. | Method and Apparatus of Candidate Skipping for Predictor Refinement in Video Coding |
US11496747B2 (en) | 2017-03-22 | 2022-11-08 | Qualcomm Incorporated | Intra-prediction mode propagation |
US10630978B2 (en) * | 2017-05-12 | 2020-04-21 | Blackberry Limited | Methods and devices for intra-coding in video compression |
EP3410717A1 (en) * | 2017-05-31 | 2018-12-05 | Thomson Licensing | Methods and apparatus for candidate list pruning |
CN117336511A (zh) * | 2017-07-06 | 2024-01-02 | Lx 半导体科技有限公司 | 图像编码方法、图像解码方法、发送方法和数字存储介质 |
US11889100B2 (en) * | 2017-11-14 | 2024-01-30 | Qualcomm Incorporated | Affine motion vector prediction in video coding |
US10771781B2 (en) * | 2018-03-12 | 2020-09-08 | Electronics And Telecommunications Research Institute | Method and apparatus for deriving intra prediction mode |
CN118381906A (zh) * | 2018-03-21 | 2024-07-23 | Lx 半导体科技有限公司 | 图像编码/解码方法、存储介质以及图像数据的发送方法 |
CN118018725A (zh) | 2018-05-10 | 2024-05-10 | 三星电子株式会社 | 视频编码方法和设备以及视频解码方法和设备 |
US10469869B1 (en) | 2018-06-01 | 2019-11-05 | Tencent America LLC | Method and apparatus for video coding |
US10587885B2 (en) * | 2018-06-04 | 2020-03-10 | Tencent America LLC | Method and apparatus for merge mode with additional middle candidates in video coding |
EP3817388A4 (en) | 2018-06-26 | 2021-08-11 | NEC Corporation | DEVICE AND METHOD FOR VIDEO CODING OR DECODING, PROGRAM AND RECORDING MEDIA |
US10798394B2 (en) * | 2018-06-27 | 2020-10-06 | Avago Technologies International Sales Pte. Limited | Low complexity affine merge mode for versatile video coding |
MX2020012688A (es) | 2018-06-27 | 2021-02-15 | Kt Corp | Metodo y aparato para procesar se?ales de video. |
US11509889B2 (en) | 2018-06-27 | 2022-11-22 | Kt Corporation | Method and apparatus for processing video signal |
CN110662057B (zh) * | 2018-06-29 | 2022-06-21 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、设备以及存储比特流的方法 |
WO2020009515A1 (ko) * | 2018-07-05 | 2020-01-09 | 엘지전자 주식회사 | Ctu 단위의 버퍼 압축을 이용한 영상 코딩 방법 및 그 장치 |
US11606575B2 (en) | 2018-07-10 | 2023-03-14 | Qualcomm Incorporated | Multiple history based non-adjacent MVPs for wavefront processing of video coding |
KR20210028652A (ko) | 2018-07-16 | 2021-03-12 | 인터디지털 브이씨 홀딩스 인코포레이티드 | 광각 인트라 예측 및 위치 의존적 인트라 예측 조합 |
EP3821626A4 (en) * | 2018-08-09 | 2021-08-04 | Huawei Technologies Co., Ltd. | HISTORY-BASED INTRA MODE CODING PROCESS AND APPARATUS |
CN117729327A (zh) * | 2018-09-03 | 2024-03-19 | 华为技术有限公司 | 用于帧内预测的方法和装置 |
WO2020057504A1 (en) * | 2018-09-17 | 2020-03-26 | Mediatek Inc. | Methods and apparatuses of combining multiple predictors for block prediction in video coding systems |
US11570442B2 (en) * | 2019-06-05 | 2023-01-31 | Qualcomm Incorporated | Reducing motion field storage for prediction of video data using non-rectangular prediction modes |
KR20220157765A (ko) * | 2021-05-21 | 2022-11-29 | 삼성전자주식회사 | 영상 부호화 장치 및 이의 동작 방법 |
US11854264B2 (en) | 2021-06-18 | 2023-12-26 | Kyndryl, Inc. | Speculative actions based on predicting negative circumstances |
WO2023230443A2 (en) * | 2022-05-23 | 2023-11-30 | Bytedance Inc. | Method, apparatus, and medium for video processing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310507A1 (en) * | 2007-06-15 | 2008-12-18 | Qualcomm Incorporated | Adaptive coding of video block prediction mode |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1668111A (zh) | 1997-12-01 | 2005-09-14 | 三星电子株式会社 | 运动向量预测方法 |
US7236524B2 (en) | 2002-05-28 | 2007-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for image intra-prediction mode communication |
US7289674B2 (en) | 2002-06-11 | 2007-10-30 | Nokia Corporation | Spatial prediction based intra coding |
US7599435B2 (en) | 2004-01-30 | 2009-10-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Video frame encoding and decoding |
KR101104828B1 (ko) | 2004-12-09 | 2012-01-16 | 삼성전자주식회사 | 움직임 벡터 연산 장치 및 그 방법 |
KR100703748B1 (ko) | 2005-01-25 | 2007-04-05 | 삼성전자주식회사 | 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치 |
CN101167357B (zh) | 2005-04-26 | 2011-09-07 | 皇家飞利浦电子股份有限公司 | 用于处理具有分组序列和与分组有关的定时信息的数据流的设备和方法 |
US7603141B2 (en) | 2005-06-02 | 2009-10-13 | Qualcomm, Inc. | Multi-antenna station with distributed antennas |
KR100678911B1 (ko) * | 2005-07-21 | 2007-02-05 | 삼성전자주식회사 | 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치 |
JP4712643B2 (ja) | 2006-08-17 | 2011-06-29 | 富士通セミコンダクター株式会社 | フレーム間予測処理装置、フレーム間予測方法、画像符号化装置及び画像復号装置 |
KR101364532B1 (ko) | 2007-01-03 | 2014-02-18 | 삼성전자주식회사 | 인접 파티션의 크기를 고려한 움직임 벡터 예측 방법,장치, 인코더, 디코더 및 복호화 방법 |
JP5026092B2 (ja) | 2007-01-12 | 2012-09-12 | 三菱電機株式会社 | 動画像復号装置および動画像復号方法 |
CN107105257B (zh) | 2007-06-29 | 2020-08-28 | 威勒斯媒体国际有限公司 | 图像编码装置、图像编码方法、图像译码装置、图像译码方法 |
EP2188979A2 (en) | 2007-09-10 | 2010-05-26 | Nxp B.V. | Method and apparatus for motion estimation in video image data |
BRPI0818444A2 (pt) * | 2007-10-12 | 2016-10-11 | Qualcomm Inc | codificação adaptativa de informação de cabeçalho de bloco de vídeo |
US8542748B2 (en) | 2008-03-28 | 2013-09-24 | Sharp Laboratories Of America, Inc. | Methods and systems for parallel video encoding and decoding |
US8619856B2 (en) | 2008-10-03 | 2013-12-31 | Qualcomm Incorporated | Video coding with large macroblocks |
CN102246526B (zh) | 2008-12-10 | 2014-10-29 | 株式会社日立制作所 | 运动图像解码方法以及装置、运动图像编码方法以及装置 |
WO2010102935A1 (en) | 2009-03-09 | 2010-09-16 | Thomson Licensing | Estimation of the prediction mode for the intra coding mode |
US8965395B2 (en) | 2009-06-05 | 2015-02-24 | Qualcomm Incorporated | Positioning of user equipment in a wireless communication network |
KR101702553B1 (ko) * | 2009-07-04 | 2017-02-03 | 에스케이 텔레콤주식회사 | 영상 부호화/복호화 방법 및 장치 |
EP2299717A1 (en) | 2009-09-10 | 2011-03-23 | Thomson Licensing | Method and apparatus for image encoding using Hold-MBs, and method and apparatus for image decoding using Hold-MBs |
US20110274162A1 (en) * | 2010-05-04 | 2011-11-10 | Minhua Zhou | Coding Unit Quantization Parameters in Video Coding |
US9100658B2 (en) | 2009-12-17 | 2015-08-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for video coding |
KR101768207B1 (ko) | 2010-01-19 | 2017-08-16 | 삼성전자주식회사 | 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치 |
US8891438B2 (en) | 2010-09-08 | 2014-11-18 | Intel Corporation | Packet-data network and methods for RAN-agnostic multimedia content distribution |
US20120106622A1 (en) * | 2010-11-03 | 2012-05-03 | Mediatek Inc. | Method and Apparatus of Slice Grouping for High Efficiency Video Coding |
PL3379833T3 (pl) * | 2011-10-18 | 2021-12-13 | Lg Electronics Inc. | Sposób intra-predykcji i jego urządzenie |
-
2012
- 2012-07-16 US US13/550,377 patent/US9699456B2/en active Active
- 2012-07-17 MX MX2014000760A patent/MX338116B/es active IP Right Grant
- 2012-07-17 EP EP12745595.4A patent/EP2735153A2/en not_active Ceased
- 2012-07-17 MY MYPI2014000023A patent/MY167510A/en unknown
- 2012-07-17 KR KR1020147004481A patent/KR101521060B1/ko active IP Right Grant
- 2012-07-17 CN CN201280035931.4A patent/CN103688541B/zh active Active
- 2012-07-17 JP JP2014521717A patent/JP5869122B2/ja active Active
- 2012-07-17 CA CA2842037A patent/CA2842037C/en active Active
- 2012-07-17 AU AU2012284123A patent/AU2012284123B2/en active Active
- 2012-07-17 WO PCT/US2012/047073 patent/WO2013012867A2/en active Application Filing
- 2012-07-17 BR BR112014001124A patent/BR112014001124A2/pt not_active Application Discontinuation
- 2012-07-17 RU RU2014106273/08A patent/RU2573744C2/ru active
- 2012-07-19 TW TW101126095A patent/TWI504237B/zh active
-
2014
- 2014-01-01 IL IL230281A patent/IL230281B/en active IP Right Grant
- 2014-02-19 ZA ZA2014/01264A patent/ZA201401264B/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310507A1 (en) * | 2007-06-15 | 2008-12-18 | Qualcomm Incorporated | Adaptive coding of video block prediction mode |
Non-Patent Citations (1)
Title |
---|
An automatic mode decision method for intra frame coding and decoding, MPEG meeting, 03-12-2001, No. M7719.^&rn^ * |
Also Published As
Publication number | Publication date |
---|---|
US9699456B2 (en) | 2017-07-04 |
ZA201401264B (en) | 2021-05-26 |
KR101521060B1 (ko) | 2015-05-15 |
CA2842037A1 (en) | 2013-01-24 |
RU2014106273A (ru) | 2015-08-27 |
CA2842037C (en) | 2017-06-06 |
AU2012284123A1 (en) | 2014-02-13 |
US20130022119A1 (en) | 2013-01-24 |
WO2013012867A2 (en) | 2013-01-24 |
KR20140039082A (ko) | 2014-03-31 |
CN103688541B (zh) | 2018-10-02 |
MX2014000760A (es) | 2014-05-07 |
RU2573744C2 (ru) | 2016-01-27 |
IL230281B (en) | 2018-02-28 |
CN103688541A (zh) | 2014-03-26 |
JP5869122B2 (ja) | 2016-02-24 |
JP2014525198A (ja) | 2014-09-25 |
TW201313033A (zh) | 2013-03-16 |
WO2013012867A3 (en) | 2013-05-16 |
EP2735153A2 (en) | 2014-05-28 |
AU2012284123B2 (en) | 2016-01-14 |
MY167510A (en) | 2018-09-04 |
MX338116B (es) | 2016-04-01 |
BR112014001124A2 (pt) | 2017-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI504237B (zh) | 視訊寫碼中之緩衝預測資料 | |
JP5869108B2 (ja) | メモリ効率的コンテキストモデリング | |
JP6580576B2 (ja) | ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法 | |
TWI535269B (zh) | 執行視訊寫碼之運動向量預測 | |
TWI527440B (zh) | 在視訊寫碼中針對高效率視訊寫碼(hevc)延伸之多層之低複雜度支援 | |
TW202027508A (zh) | 對以歷史為基礎之運動向量預測器之改良 | |
TW201904285A (zh) | 在視訊寫碼中之增強的解塊濾波設計 | |
TW201701671A (zh) | 運動向量之儲存及發信解析度 | |
TW201729595A (zh) | 針對視訊寫碼使用與位置相關之預測組合之改良視訊幀內預測 | |
TWI558179B (zh) | 對視訊寫碼發信長期參考圖像 | |
TW201711461A (zh) | 片級內部區塊複製及其他視訊寫碼改善 | |
TW201707448A (zh) | 用於視訊資料中特定圖像幀間寫碼之搜索區域判定 | |
TW201640894A (zh) | 用於視訊寫碼之重疊運動補償 | |
TW201444350A (zh) | 方形區塊預測 | |
JP2018511234A (ja) | コード化パラメータのhevc予測についての利用可能性検査を低減するためのパディング | |
CN111200735A (zh) | 一种帧间预测的方法及装置 | |
TWI543590B (zh) | 用於可縮放視訊寫碼之空間運動向量縮放 | |
TW201921938A (zh) | 具有在用於視訊寫碼之隨機存取組態中之未來參考訊框之可調適圖像群組結構 | |
TW202031052A (zh) | 用於照明補償模式之刪剪 | |
WO2020042758A1 (zh) | 一种帧间预测的方法及装置 |