TWI526057B - 利用非線性縮放及適應性來源區塊大小之階層式運動估算 - Google Patents
利用非線性縮放及適應性來源區塊大小之階層式運動估算 Download PDFInfo
- Publication number
- TWI526057B TWI526057B TW102106221A TW102106221A TWI526057B TW I526057 B TWI526057 B TW I526057B TW 102106221 A TW102106221 A TW 102106221A TW 102106221 A TW102106221 A TW 102106221A TW I526057 B TWI526057 B TW I526057B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- image layer
- source block
- size
- layer
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/56—Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/53—Multi-resolution motion estimation; Hierarchical motion estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/207—Analysis of motion for motion estimation over a hierarchy of resolutions
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本發明係關於利用非線性縮放及適應性來源區塊大小之階層式運動估算。
視頻編解碼器基本上使用運動估算(ME),藉由移除或減少在視頻訊框之間的時間冗餘而來改善視頻壓縮性能。就編碼一輸入區塊而言,傳統ME係在使用一指定搜尋視窗於至少一參考視框中的編碼器模組上被施行,以發現一運動向量,該運動向量會將某種差度量最小化,譬如在由運動向量所指向之輸入來源區塊與參考區塊之間的絕對差值和(SAD)。該運動向量資訊隨後可被傳送到一解碼器模組,以用於運動補償。
一般而言,藉由使用更大的搜尋視窗,可在ME使用期間得到更高的編碼增益。不過,使用更大的搜尋視窗可增加編碼複雜度。更者,當使用硬體加速時,ME搜尋視
窗尺寸可能被晶片上的記憶體尺寸限制而限制。為了解決此問題,種種高級視頻編解碼器,譬如高級視頻編碼(AVC)、可縮放視頻編碼(SVC)、VP8等等,使用階層式運動估算(HME)技術來延伸該搜尋範圍,然而其仍使用一相當小的搜尋視窗。在典型的HME中,全解析度視頻訊框會以倍數二被連續地縮減取樣成複數個較低解析度縮減取樣影像層,且經由ME所得到的運動向量預測器則會被向上傳播經過該影像層並且被精細化,以識別該全解析度視頻訊框之區塊或基底層的運動向量。
除了將該影像階層縮放兩倍數以外,當在較低解析度縮減尺寸層上進行ME時,典型的HME方案也可使用一相應縮放、固定尺寸與形狀的來源區塊。例如,就16×16全解析度來源尺寸而言,習知的HME方案可使用8×8來源尺寸於第一縮減取樣層、4×4來源尺寸於第二縮減取樣層等等。不過,特別相關於低能量或平面影像內容,此些方法會因為錯誤地識別局部最小量來產生次最佳化預測器,其更遠離該影像內容中的細節。
100‧‧‧視頻編碼器系統
102‧‧‧現有視頻訊框
104‧‧‧運動估算模組
106‧‧‧參考視頻訊框
108‧‧‧運動補償模組
110‧‧‧轉換與量化模組
112‧‧‧亂度編碼模組
114‧‧‧解量化與反轉換模組
116‧‧‧重新架構訊框
118‧‧‧內預測模組
200‧‧‧影像層階層
202‧‧‧基底影像層
204‧‧‧第一影像層
206‧‧‧第二影像層
300‧‧‧影像層階層
302‧‧‧基底影像層
304‧‧‧第一層
306‧‧‧第二層
400‧‧‧運動估算模組
402‧‧‧階層式運動估算模組
403‧‧‧預處理模組
404‧‧‧運動搜尋引擎
405‧‧‧輸入訊框資料
406‧‧‧記憶體
408‧‧‧影像層
410‧‧‧運動呼叫資料
412‧‧‧預測器
416‧‧‧運動向量
500‧‧‧實例過程
502‧‧‧區塊
504‧‧‧區塊
506‧‧‧區塊
508‧‧‧區塊
600‧‧‧非線性影像層階層
602‧‧‧全解析度訊框
604‧‧‧第一階影像層
606‧‧‧第二階影像層
700‧‧‧實例傳播方案
702‧‧‧預測器
704‧‧‧來源區塊
706‧‧‧較低解析度影像層
708‧‧‧巨型區塊
710‧‧‧更高解析度影像層
712‧‧‧巨型區塊
714‧‧‧預測器
716‧‧‧來源區塊
718‧‧‧巨型區塊
800‧‧‧適應性來源區塊尺寸方案
802‧‧‧巨型區塊
804‧‧‧巨型區塊
806‧‧‧巨型區塊
808‧‧‧巨型區塊
810‧‧‧更高解析度影像層
812‧‧‧適應性成形來源區塊
814‧‧‧適應性成形來源區塊
816‧‧‧適應性成形來源區塊
818‧‧‧更低解析度縮減取樣層
820‧‧‧預測器
822‧‧‧預測器
824‧‧‧預測器
826‧‧‧巨型區塊
828‧‧‧預測器
830‧‧‧來源區塊
900‧‧‧實例過程
902‧‧‧區塊
904‧‧‧區塊
906‧‧‧區塊
1000‧‧‧實例系統
1002‧‧‧平台
1005‧‧‧晶片組
1010‧‧‧處理器
1012‧‧‧記憶體
1014‧‧‧儲存器
1015‧‧‧圖形子系統
1016‧‧‧軟體應用
1018‧‧‧無線電
1020‧‧‧顯示器
1022‧‧‧使用者介面
1030‧‧‧內容服務裝置
1040‧‧‧內容傳送裝置
1050‧‧‧導航控制器
1060‧‧‧網路
1100‧‧‧小形狀因數裝置
1102‧‧‧外殼
1104‧‧‧顯示器
1106‧‧‧輸入/輸出(I/O)裝置
1108‧‧‧天線
1112‧‧‧導航功能
在此所說明的材料係藉由實例且不藉由附圖中的限制來顯示。為了簡化與釐清說明,在該圖式中所顯示的元件不一定按比率繪製。例如,一些元件的尺寸可相關於其他元件被誇張化,以用於釐清。更者,在視為適當之處,參考標籤會在該等圖式之間被重複,以指出對應或類似的元
件。在該圖式中:圖1係為一實例視頻編碼器系統的顯示圖;圖2係為一實例非線性影像縮放方案的顯示圖;圖3係為一實例非線性影像縮放方案的顯示圖;圖4顯示一實例運動估算模組;圖5係為顯示一實例過程的流程圖;圖6係為一實例混合縮放方案的顯示圖;圖7係為一實例傳播方案的顯示圖;圖8係為一實例適應性來源區塊尺寸方案的顯示圖;圖9係為顯示一實例過程的流程圖;圖10係為一實例系統的顯示圖;以及圖11顯示一實例裝置,全部均根據本發明的至少一些實施過程來排列。
一或多個實施例或實施過程現在參考附圖來說明。雖然特定架構與排列被討論,但是應該理解的是,這麼做僅僅為了說明性目的。熟諳該相關技術人士將認可,其他架構與排列可被應用而沒有背離該說明之精神與範圍。那些熟諳該相關技術者將明瞭,在此所說明的技術與/或排列也可被使用於除了在此所說明的種種其他系統與應用中。
雖然以下說明陳述在譬如晶片上系統(SoC)架構之架構中被表明的種種實施過程,例如,在此所說明之技術與/或排列的實施過程不限於特定架構與/或計算系統,
且可藉由類似目的之任何架構與/或計算系統來實施。譬如,應用例如複數個積體電路(IC)晶片與/或封裝物與/或種種計算裝置與/或消費性電子(CE)裝置(譬如機上盒、智慧型手機等等)的種種架構,可實施在此所說明的技術與/或排列。更者,雖然以下說明可陳述種種具體細節,譬如系統元件之邏輯實施過程、型態與相互關係、邏輯分佈/整合選擇等等,但是所提出申請的主題則可在沒有此些具體細節下被實施。在其他實例中,一些材料,譬如,舉例來說,控制結構與全軟體指令序列,可能不被詳細地顯示,而不與在此所揭露的材料混淆。
在此所揭露的材料可以硬體、韌體、軟體或其任何組合來實施。在此所揭露的材料也可如儲存在機器可讀取媒體上的指令來實施,其係可由一或多個處理器來讀取與執行。機器可讀取媒體可包括以機器(例如,計算裝置)可讀取形式來儲存或傳送資訊的任何媒體與/或機構。例如,機器可讀取媒體可包括唯讀記憶體(ROM);隨機存取記憶體(RAM);磁碟儲存媒體;光學儲存媒體;快閃記憶體裝置;電性、光學、聲音或其他型式的傳播訊號(例如,載波、紅外線訊號、數位訊號等等)以及其他。
在該說明書中對〝一種實施過程〞、〝一實施過程〞、〝一實例實施過程〞等等的參考,意指所說明的實施過程可包括特定特徵、結構或特色,但是每一實施例不一定包括該特定特徵、結構或特色。更者,此等片語不一定意指相同實施過程。更者,當特定特徵、結構或特色結
合一實施例來說明時,它被主張是在熟諳該技藝者的知識內,以影響結合其他實施過程的此些特徵、結構或特色,不管是否被明確地說明於此。
圖1顯示根據本發明的實例視頻編碼器系統100。在種種實施過程中,視頻編碼器系統100可被架構以根據一或多個高級視頻編解碼標準來進行視頻壓縮與/或實施視頻編解碼,譬如,舉例來說,H.264/AVC標準(見國際標準組織(ISO)/國際電機工業委員會(IEC)聯合技術委員會(JTCI)與電信標準化部門(ITU-T)、H.264/AVC-〝一般視聽服務的高級視頻編碼〞ITU-T Rec.H.264與ISO/IEC 14496-10(第四代動態影像解壓縮協定(MPEG-4)第10段)2005第3版)(以下統稱:〝AVC標準〞)且其延伸包括可縮放視頻編碼(SVC)延伸(見聯合決議ITU-T Rec.H.264與ISO/IEC 14496-10/Amd.3可縮放視頻編碼,2007年7月5日)(以下統稱:〝SVC標準〞)。雖然系統100與/或其它系統、方案或過程在此可被說明於AVC標準的上下文中,但是本發明不限於任何特定視頻編碼標準或規格。例如,在種種實施過程中,根據其他高級視頻標準,譬如VP8、MPEG-2、VC1(電影電視工程師協會(SMPTE)421M標準)與類似物,編碼器系統100可被架構以進行視頻壓縮與/或實施視頻編解碼。
在種種實施例中,視頻與/或媒體處理器可實施視頻編碼器系統100。系統100的種種元件可在軟體、韌體與
/或硬體與/或其任何組合之內實施。例如,系統100的種種元件可至少部份藉由計算系統或系統晶片(SoC)的硬體來提供,其係譬如可在計算裝置、通訊裝置、消費性電子(CE)裝置或類似物中被發現。例如,至少部份的系統100可藉由處理邏輯所執行的軟體與/或韌體指令來提供,譬如一或多個中央處理單元(CPU)處理器核心、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)等等。
在編碼器系統100中,現有視頻訊框102可被提供到運動估算模組104。系統100可以光柵掃瞄順序、以影像巨型區塊為單元來處理現有訊框102。當編碼器系統100以內預測模組來操作時(如所示),運動估算模組104可因應現有視頻訊框102與參考視頻訊框106來產生剩餘的訊號。運動補償模組108隨後可使用參考視頻訊框106與運動估算模組104所提供的剩餘訊號來產生預測訊框。該預測訊框隨後可從現有訊框102以及被提供到一轉換與量化模組110的結果中減去。該區塊隨後可被轉換(使用一區塊轉換)並且被量化,以產生一組量化轉換係數,其係可藉由亂度編碼模組112被重新排序並且被亂度編碼,以產生由視頻編碼器系統100所提供的一部份壓縮位元流(例如,網路抽象層(NAL)位元流)。在種種實施過程中,除了使用以解碼每一區塊的邊信息以外,視頻編碼器系統100所提供的位元流可包括亂度編碼係數(例如,預測模組、量化參數、運動向量資訊等等),其係並且可被
提供到在此所說明用於轉換或儲存的其他系統與/或裝置。
轉換與量化模組110的輸出也可被提供到解量化與反轉換模組114。解量化與反轉換模組114可實施藉由轉換與量化模組110所進行之操作的反向,且解量化與反向轉換模組114的輸出可結合該預測訊框以產生一重新架構訊框116。當編碼器系統100以內預測模組來操作時,內預測模組118可使用重新架構訊框116來進行已知的內預測方案,其係在此將不會有更詳細的說明。
一般而言,訊框102可藉由分成一或多片巨型區塊而被分配,以用於系統100之壓縮(例如,具有對應色度樣本的16×16亮度樣本)。更者,每一巨型區塊也可被分為巨型區塊分割與/或分為用於運動補償預測的次巨型區塊分割。在根據本發明的種種實施過程中,巨型區塊分割可以具有種種尺寸,包括但不限於16×16、16×8、8×16,同時次巨型區塊分割也可具有種種尺寸,包括但不限於8×8、8×4、4×8與4×4。不過,應該注意的是,上述僅僅為實例巨型區塊分割與次巨型區塊分割形狀與尺寸,本發明不限於任何特定巨型區塊分割與次巨型區塊分割形狀與/或尺寸。誠如在此所使用地,術語〝區塊〞可指視頻資料的巨型區塊、巨型區塊分割或次巨型區塊分割。
在種種實施過程中,一切片可被指定為I(內)、P(預測)、B(雙-預測)、SP(切換P)或SI(切換I)型切片。一般而言,一訊框可包括不同切片型態。更者,
訊框可被指定為非參考訊框或者可被使用當作訊框間預測參考的參考訊框。在P切片中,時間(非空間)預測可藉由估算訊框之間的運動來進行。在B切片中,兩運動向量,代表每一巨型區塊分割或次巨型區塊分割的兩運動估算,可被使用於時間預測或運動預測。此外,相關於顯示順序,運動可從發生在過去或未來的複數個圖像被估算。在種種實施過程中,運動可在種種巨型區塊或次巨型區塊分割階上被估算,以例如對應以上所提及的16×8、8×16、8×8、8×4、4×8或4×4尺寸。
在種種實施過程中,一明顯的運動向量可被編碼,以用於每一巨型區塊或次巨型區塊分割。在運動估算處理期間內,一系列的次巨型區塊形狀候選者(例如,16×16、16×8、8×16、8×8、8×4、4×8與4×4)可被搜尋,且將呈現該視頻與該結果之逼真度所必要的位元數目之間之取捨最佳化的運動估算方案可被實施。
在種種實施過程中,來源區塊的時間預測可藉由搜尋在由與該來源區塊相關聯的兩或多個預測器所識別之一或多個參考訊框中的複數個目標區域來進行。在種種實施過程中,預測器可任意決定、可依據相鄰巨型區塊來決定、或者可基於種種其他已知方法來決定。
系統100的種種元件可在軟體、韌體與/或硬體與/或其任何組合之內實施。例如,系統100的種種元件可至少部分由計算SoC之硬體(譬如可在CE系統中被發現)來提供。那些熟諳該技藝者可認可視頻編碼器系統100可
包括額外元件(例如,過濾器模組等等),為了清楚起見,其係不會在圖1中被描寫。
根據本發明,在階層式運動估算(HME)方案中之影像層之間應用非線性縮放可提供種種優點。例如,如在以上背景部分之記載,線性縮放技術縮減取樣影像兩倍。例如,當縮減取樣兩倍時,線性縮放技術會產生影像層,其具有全解析度影像訊框之資料內容的四分之一,因而要求對應數量的計算資源產生該影像層並且儲存該影像層。此外,縮放兩倍可僅僅改善運動搜尋速度四倍。雖然線性縮放技術可縮放四倍以進一步減少資源使用並且改善搜尋速度,但是在影像資料以及因此影像細節中結果產生的十六倍減少則可能產生較不令入滿意的運動估算結果。相形之下,當根據本發明來應用非線性縮放時,影像層解析度則可減少以保留計算資源,同時保留充分的影像層解析度以維持運動估算逼真度。例如,施加非線性縮放倍數三倍會造成影像資料九倍減少,相較於線性縮放兩倍,將可提供改善的搜尋速度。一般來說,藉由根據本發明來應用非線性縮放,不同的非線性縮放倍數可被應用以動力地平衡計算資源使用與運動搜尋速度,而不失運動估算逼真度。
如在此所使用地,術語縮減取樣說明使用種種非線性縮放過程與方案而從較高解析度的影像層來產生較低解析度(縮減取樣)的影像層。那些熟諳該技藝者可認可,與縮減取樣同義的用語,譬如次取樣,可被使用來說明相同或類似的過程。更者,如在此所使用地,非線性縮放意指
影像解析度的改變,其起因於以大於二的倍數將影像訊框或層縮減取樣。
根據本發明,視頻編碼器系統100可使用運動估算模組104來進行一或多個區塊匹配演算法,該演算法實施應用非線性縮放於影像層之間的種種階層式運動估算(HME)方案。在種種實施過程中,視頻編碼器系統100可運用運動估算模組104來實施HME方案,以運用非線性縮放於全解析度基底層與一或多個較低解析度、縮減取樣影像層之間。例如,圖2顯示根據本發明之一實例非線性影像層階層200。藉由非限制性實例,圖2的種種項目在此將參考圖1的實例視頻編碼器系統100來說明。
在種種實施過程中,當進行HME以產生一或多個影像層時,可應用非線性縮放,其中一輸入、全解析度(或基底)影像訊框的每一尺寸以大於二的倍數來縮減取樣。更者,在種種實施例中,大於二且小於四的非線性縮放倍數則可被施加。如在圖2所示,實例現有訊框影像層階層200包括基底影像層202(例如,對應現有訊框102),其係以大於二的倍數被非線性縮放,以產生比基底階影像層202還具有更低解析度的第一影像層204(第一階)。第一層204也被非線性縮放,以產生第二影像層206(第二階),其具有比第一影像層204更低的解析度。
在種種實施過程中,相同的非線性縮放倍數可被施加,以產生層204與206。例如,為了產生層204,基底層202的每一尺寸可以倍數三來縮減取樣,而為了產生層
206,層204的每一尺寸也可以倍數三來縮減取樣。不過,如以下更詳細的解釋,本發明不限於特定的非線性縮放倍數並且涵蓋考量以任何大於二的倍數之縮減取樣,與/或在影像層階之間應用不同的縮放倍數。更者,在以下也將進一步解釋地,本發明不限於僅僅非線性縮放的應用,並涵蓋考量應用非線性與線性縮放倍數兩者的影像層階層。
當進行HME時,影像層階層200可結合參考影像訊框的對應影像層階層來使用。例如,圖3顯示在相應參考訊框非線性影像層階層300之上下文中的階層200。在本實例中,階層300包括基底影像層302(例如,對應參考訊框106)以及兩縮減取樣層:第一層304,藉由施加相同非線性縮放到基底層302來產生,如在形成階層200之層204中所應用;以及第二層306,藉由施加相同非線性縮放到第一階層304所產生。如以下更詳細的解釋,當進行現有訊框102之基底層202之種種巨型區塊的HME處理時,非線性影像層階層200與300可被應用。
雖然在此所描述的非線性影像層階層200與300包括三階的影像解析度,但是應該理解的是,根據本發明的非線性影像層階層之產生可具有任何數目的影像層。一般而言,根據本發明的非線性影像層階層可根據特定應用的要求或輸入影像訊框的特性來產生,例如包括影像的尺寸、影像的內容等等。例如,更大的輸入影像訊框可能需要使用超過三影像層的更大非線性影像層階層。更者,應該理
解的是,為了清楚起見,在圖2與3中種種物體的相對尺寸與/或尺寸可能已經被誇大。
在種種實施例中,當進行運動估算處理時,視頻編碼器系統100可應用運動估算模組104以實施根據本發明的運動估算(ME)方案。圖4顯示根據本發明的實例ME模組400。藉由非限制性實例,ME模組400可藉由視頻編碼器系統100的模組104來實施。
根據本發明,ME模組400包括HME模組402、預處理模組403、運動搜尋引擎404與記憶體406。誠如以下更詳細的解釋,模組400可應用種種非線性縮放方案,以產生現有訊框影像層的非線性階層(例如,階層200)以及參考訊框影像層的非線性階層(例如,階層300)。當如此進行時,模組400可使用預處理模組403,以從包括現有與參考影像訊框的輸入訊框資料405產生影像層(例如,現有訊框102與至少一參考訊框106)。預處理模組403隨後可將對應一或多個現有與/或參考影像層408的像素資料儲存在記憶體406中。因應從HME模組402所接收的運動呼叫資料410,運動搜尋引擎404可使用影像層408來進行種種巨型區塊的HME於現有訊框102中。當如此進行時,搜尋引擎404可存取記憶體406,以得到對應至少部分影像層408的像素資料。
在種種實施過程中,呼叫資料410可具體指定在一參考訊框影像層中的至少一目標搜尋區域,以及在現有訊框102之對應影像層中的一來源區塊位置。運動搜尋引擎
404隨後可應用已知的運動估算方法來得到該來源區塊的一或多個運動向量或預測器412並且可提供預測器412給HME模組402。HME模組402隨後可使用預測器412以產生現有影像訊框之種種巨型區塊的運動向量416。
在種種實施例中,引擎404係以硬體來實施,而軟體可實施HME模組402與預處理模組403。例如,在一些實施例中,引擎404可藉由ASIC邏輯來實施,然而HME模組402與預處理模組403可藉由譬如一或多個處理器核心之邏輯所執行的軟體指令來提供。不過,本發明不限於此方面,且HME模組402、預處理模組403與/或搜尋引擎404可藉由硬體、韌體與/或軟體的任何組合來實施。此外,記憶體406係為任何型態的記憶體,譬如揮發性記憶體(例如,靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)等)或者非揮發性記憶體(例如,快閃記憶體等)等等。在非限制性實例中,記憶體406可藉由快取記憶體來實施。
圖5顯示根據本發明種種實施過程之實例過程500的流程圖。過程500包括一或多個操作、功能或動作,如由圖5之區塊502、504、506與508的其中一個或多個所顯示。藉由非限制性實例,過程500將參考圖2與3的非線性階層200與300、圖1的視頻編碼器系統100與圖4的運動估算模組400而被說明於此。在種種實施過程中,過程500可形成由編碼器系統100所實施之運動估算過程的至少部分的區塊匹配演算法(BMA)。
過程500起始於區塊502,在此,一現有影像訊框與一參考影像訊框可被接收。在種種實施過程中,區塊502包含HME模組402,以接收呈現有訊框102之亮度像素值與參考訊框106之亮度像素值形式的訊框資料405。在區塊502所接收的訊框資料不限於任何特別的影像訊框資料並且可具有任何解析度、資料深度與/或資料格式。
在區塊504,非線性縮放可被施加到現有影像訊框,以產生至少第一現有影像層。例如,參考圖3,非線性縮放可被施加到基底層202,以產生對應第一現有影像層的第一階層204。額外的現有影像層也可在區塊504上產生。例如,區塊504也可包含施加非線性縮放到層204,以產生對應第二現有影像層的第二階層206,以此類推。
在區塊506,非線性縮放可被施加到參考影像訊框,以產生至少第一參考影像層。例如,再度參考圖3,非線性縮放可被施加到參考訊框基底層302,以產生對應第一參考影像層的第一階層304。額外的參考影像層也可在區塊506上產生。例如,區塊506也可包含施加非線性縮放到層304,以產生對應第二參考影像層的第二階層206,以此類推。
根據種種實施過程,在區塊504與506上所應用的非線性縮放可包括以具有大於二之值的倍數(N)來縮放現有影像層的每一尺寸。例如,在非限制性實例中,就具有解析度1080p以至於它包括1920行乘以1080列之亮像素值(例如,1920×1080)的現有影像訊框而言(例如,訊
框102),區塊502包含以N=3來縮放每一尺寸,以產生具有640行乘以360列之亮像素值(例如,640×360)之解析度的第一現有影像層。
在種種實施過程中,非整數或分數縮放倍數可被使用。例如,在另一非限制性實例中,就具有1080p解析度或者1920×1080像素值的現有影像訊框而言,區塊502包含以N=2.5的倍數來縮放每一尺寸,以產生具有解析度768×432像素值的第一現有影像層。例如,以N=2.5來縮放,其係可由將一影像擴增取樣兩倍並且隨後將該擴增取樣影像縮減取樣五倍來實施,以產生對應的影像層。當然,視一輸入影像訊框的解析度而定,不同的整數或者非整數非線性縮放倍數可根據本發明來應用,以產生種種影像層解析度。
更者,本發明不限於僅僅應用產生具有整數解析度值之影像層的非線性縮放倍數。例如,在非限制性實例中,就具有解析度1920×1080像素值的現有影像訊框而言,區塊502可包含將每一尺寸縮放三倍,以產生具有解析度640×360的第一現有影像層。將相同倍數N=3施加到640×360第一現有影像層,將會產生具有解析度213.33×120的第二現有影像層。在此些實施過程中,在結果所產生影像層中的分數訊框尺寸(在此實例中,分數影像行)可被忽略,或者可使用已知的技術(例如,指派最靠近的鄰近像素值等等)以像素值替換之。
此外,根據本發明的混合非線性縮放方案可應用非線
性縮放於一些影像層之間,同時可應用線性縮放於相同非線性影像層階層內的其他影像層之間。例如,圖6顯示一混合方案非線性影像層階層600,在此一全解析度訊框602(例如,一現有訊框或參考訊框)會受到非線性縮放,以產生第一階影像層604。層604隨後受到線性縮放,以產生第二階影像層606。例如,在非限制性實例中,假如基底層602具有解析度1080p,那麼非線性縮放倍數N=3則可被施加,以產生具有解析度640×360的第一階層604。第一階層604隨後可受到倍數N=2的線性縮放,以產生具有解析度320×180的第二階層606。在另一非限制性實例中,就1280×720的影像訊框602解析度而言,非整數的非線性縮放倍數N=2.5可被施加,以產生具有解析度512×288的第一階層604。第一階層604可隨後會受到兩倍的線性縮放,以產生具有解析度256×144的第二階層606。在其他實施過程中,線性縮放可被施加,以產生第一影像層,然而非線性縮放可被施加到第一影像層以產生第二影像層,以此類推。
根據種種實施過程,在區塊504與506的非線性縮放可結合種種過濾技術來進行。例如,當在區塊504與506上使用非線性縮放倍數來縮減取樣時,影像層可受到使用許多已知平滑化或局部平均操作子、核心或過濾器之任一個的低通過濾,譬如,但不限於3×3平滑化過濾器、5×5平滑化過濾器或類似物。例如,在非限制性實例中,3×3平滑化過濾器可具有形式
不過,當在區塊504與506上進行縮減取樣時,本發明不限於應用平滑化過濾器。例如,當進行區塊504與506時,最鄰近的次取樣可被應用。此外,在種種實施過程中,已知的減退抽樣過濾器可被施加在區塊504與506。
參考圖4,區塊504與506可藉由預處理模組403來進行。例如,區塊504包含模組403,其係施行非線性縮放於現有訊框102上,以產生模組403可儲存在記憶體406中的一或多個縮減取樣影像層。同樣地,區塊504包含模組403,其係於參考訊框106上施行非線性縮放,以產生模組403也可儲存在記憶體406中的一或多個縮減取樣影像層。當施行區塊504與506時,預處理模組403可應用如以上所說明的種種過濾技術。
過程500可在區塊508截止,在此,階層式運動估算可被施行,以至少部分因應第一現有影像層的來源區塊與第一參考影像層。在種種實施過程中,區塊508可包括產生對應第一現有影像層之來源區塊的運動向量場。最佳候選運動向量隨後可在使用已知運動向量成本估計技術之運動向量場內被識別。
再度參考圖2與3,就基底層202的已知巨型區塊208(例如,16×16巨型區塊)而言,階層式運動估算可
使用第二階層206的對應來源區塊210而在區塊508上施行,以施行在參考訊框影像層階層300之第二階層306中對應搜尋區域(沒顯示)的運動搜尋。起因於使用巨型區塊210之運動搜尋的最佳候選運動向量或預測器,隨後可被傳播到第一階層204,以用於進一步運動搜尋的精細化。
在傳播期間內,預測器的座標可藉由相同非線性縮放倍數而被擴增取樣(例如,相乘),該非線性縮放倍數可被使用於區塊504與506,以產生現有與參考影像層。傳播到第一階層204的該預測器隨後可被使用以施行精細化的運動搜尋,以用於在階層300之第一階層304中搜尋區域內(沒顯示)之層204的至少一巨型區塊212。最後,在非線性階層200與300的實例中,產生用於階204的預測器可被傳播到階202,且運動搜尋可被完成以用於全解析度巨型區塊208。
再度參考圖4,在種種實施過程中,在區塊508上所施行的階層運動估算可包含HME模組402,其係發出呼叫資料410,以具體指定在參考訊框影像層中的至少一目標搜尋區域以及在現有訊框102之對應影像層中的來源區塊位置。因應呼叫資料410,運動搜尋引擎404隨後可應用已知的運動估算方法,使用影像層408來得到該來源區塊用的一或多個運動向量或預測器412,並且可提供預測器412到HME模組402。例如,引擎404可儲存一對應的運動向量場於記憶體406中,以由HME模組402所存
取。HME模組402隨後可使用預測器412來產生現有影像訊框之種種巨型區塊的運動向量416。例如,HME模組402可應用已知的運動向量成本估計技術,以從運動向量場決定一或多個最佳運動向量候選者。
在種種實施過程中,在區塊508上之運動估算期間內所傳播的預測器可能不會對準在更高解析度層中的巨型區塊邊界。圖7顯示一實例傳播方案700,在此,與較低解析度影像層706之來源區塊704相關聯的預測器702可重疊與更高解析度影像層710之對應巨型區塊708相關聯的巨型區塊邊界。例如,假定一非線性縮放倍數N=3,假如來源區塊704具有尺寸8×8,那麼當預測器702被擴增取樣到層710時將具有尺寸24×24,而且,假定巨型區塊708具有尺寸16×16,預測器702將對準巨型區塊708,但也將重疊巨型區塊708的邊界以對準層710之下一巨型區塊712的一半。同樣地,用於層706之下一來源區塊716的預測器714,當被傳播到層710時,可重疊在層710中的巨型區塊712與下一巨型區塊718兩者。
因此,根據種種實施例,當在區塊508上進行階層式運動估算時,更高解析度影像層的巨型區塊可與從較低解析度影像層被擴增取樣之超過一個的預測器相關聯。例如,在圖7的實例中,預測器702與714兩者對準層710的巨型區塊712。根據本發明,當超過一個的預測器對準巨型區塊時,可施加種種方法。例如,預測器702與714兩者可被使用於使用以施行巨型區塊712用的運動估算。
或者,藉由依據重疊程度來決定預測器702與714的加權平均值,被修改的預測器可被產生用於巨型區塊712。在方案700的實例中,在此預測器702與714相等地重疊巨型區塊712,預測器702與714的中值可被使用當作巨型區塊712的改良預測器。在其他實施過程中,一已知巨型區塊的最佳預測器可被選擇當作與巨型區塊具有最大程度重疊等等的預測器。
在種種實施過程中,區塊508的階層式運動估算包括種種方法,為了清楚起見,其係在此不會被更詳細地解釋。例如,複數個預測器,譬如最佳的四個預測器,可在影像層之間被傳播。在另一實例中,用於傳播的最佳預測器可因應鄰近巨型區塊的預測器來決定。清楚地,許多額外的時間與/或空間最佳化技術可結合在此所說明的方法被應用。
根據本發明,HME也可使用適應性決定的來源區塊尺寸來施行。例如,圖8顯示根據本發明的一實例適應性來源區塊尺寸方案800。在實例方案800中,更高解析度影像層810(例如,基底層)的種種巨型區塊802、804、806與808使用從更低解析度縮減取樣層818之種種、適應性成形來源區塊812、814與816得到的預測器。在圖8的特定實例中,巨型區塊802使用與來源區塊812相關聯的預測器820,巨型區塊804使用與來源區塊814相關聯的預測器822,且巨型區塊806與808兩者使用與不同尺寸來源區塊816相關聯的單一預測器824。在一種實例
中,巨型區塊802-808係為16×16區塊,來源區塊812與814係為8×8區塊,且來源區塊816係為8×16區塊。
方案800之呈現在此僅僅為了當作非限制性實例來討論之目的,其係並且不打算準確地描繪一真實影像處理方案。例如,那些熟諳該技藝者將認可,巨型區塊802-808不一定相關於層810等等來按比例描繪。更者,本發明不限於適應性決定來源區塊的任何特定尺寸與/或形狀。
藉由適應性決定來源區塊尺寸,根據本發明的HME方案可提供種種優點。例如,適應性決定來源區塊尺寸可提供用於高能量影像區域與/或受到複雜運動之影像區域中的更準確運動估算,同時也提供較佳的運動向量內聚於較低複雜度的影像區域與/或呈現更均勻運動的影像區域中。相較之下,在沒有適應性來源區塊尺寸決定之下,HME處理可能會對影像複雜度不靈敏,其係可造成不準確的運動估算於複雜的影像區域中與/或不良的運動向量內聚於較不複雜的影像區域中。一般而言,根據本發明來適應性決定來源區塊尺寸,可允許具有運動估算逼真度之計算資源使用的改善平衡。
根據本發明,來源區塊的尺寸與/或形狀可因應時間與/或空間影像特徵來適應性決定。例如,在影像層中物體820的存在可造成與特定巨型區塊相關聯的種種空間影像特徵(例如,邊緣的存在或不存在):在此實例中,巨型區塊802-808。因此,在種種實施過程中,當施行HME時,在巨型區塊802與804內邊緣的出現可被使用
以有利地選擇來源區塊812與814的更小尺寸。藉由選擇來源區塊812與814的更小尺寸,可得到更高準確度的預測器,以較佳說明對應巨型區塊802與804的更詳細影像區域。
另一方面,在巨型區塊806與808內的更均勻影像特徵(例如,邊緣之缺乏)可被使用來有利地選擇這些巨型區塊用的更大來源區塊尺寸。因此,藉由選擇來源區塊816的更大尺寸且藉由施加結果所產生之預測器到巨型區塊806與808兩者,更大的預測器內聚可被提供用於巨型區塊806與808。例如,在方案800的實例中,在此巨型區塊806與808可被期待呈現類似的運動特徵(例如,巨型區塊806與808兩者係與物體820之更均勻、內部分相關聯),改善的預測器內聚則可使一跨越預測器更有可能地匹配預測器824,從而避免冗長的運動搜尋。在此實例中,使用更大尺寸的來源區塊816來產生巨型區塊806與808兩者的預測器,可增加先前產生用於巨型區塊806之預測器可被使用當作巨型區塊808之跨越預測器的可能性。作為另一實例,出現在影像層810之相當低能量區域中的一組四個巨型區塊826可有利地使用與在影像層818中之一相對應組四個來源區塊830相關聯的單一預測器828。雖然圖8的實例從具有8×8與8×16尺寸的來源區塊的角度已說明於此,但是本發明涵蓋考量到任一尺寸的來源區塊,包括16×16、16×8、8×16、8×8、8×4、4×8、4×4等等。
根據本發明,時間影像特徵也可被利用以適應性地決定區塊來源尺寸。例如,更大的來源區塊尺寸可被選擇用於具有均勻運動歷史的影像區域。對於空間複雜區域甚至也適用。因此,在此些情況中,用於一或多個相鄰巨型區塊的先前決定預測器可被使用以決定現有巨型區塊的來源區塊尺寸。
圖9顯示根據本發明種種實施過程之實例過程900的流程圖。過程900包括如圖9區塊902、904與906之其中一或多個所顯示的一或多個操作、功能或動作。藉由非限制性實例,過程900將參考圖8的方案800、圖1的視頻編碼器系統100與圖4的HME模組400而說明於此。在種種實施過程中,過程900可形成由編碼器系統100所實施之運動估算過程的至少部分區塊匹配演算法(BMA)。
過程900可起始於區塊602,在此一縮減取樣的影像層可從一影像訊框產生。例如,如參考圖5而說明於上,預處理模組403可從輸入訊框資料405產生至少一較低解析度影像層。在種種實施過程中,預處理模組403可利用線性或非線性縮放倍數,以產生一縮減取樣的影像層於區塊902。
在區塊904,在縮減取樣之影像層中的來源區塊尺寸可被適應性決定。在種種實施過程中,區塊904可包括因應與在縮減取樣影像層中來源區塊之位置相關聯的空間與/或時間影像特徵來決定來源區塊的尺寸。在種種實施過
程中,適應性決定在區塊904之來源區塊的尺寸可包括決定該來源區塊尺寸以因應該影像訊框的預處理。例如,預處理模組403可施行預處理,譬如邊緣檢測與類似物,以決定該輸入影像訊框的影像複雜度,並且可提供對應的影像複雜度資訊418到HME模組402。因應資訊418,HME模組402可決定一對應的來源區塊尺寸,以使用於一已知巨型區塊的運動估算目的。例如,更小的來源區塊尺寸可被使用於具有更大影像複雜度之影像區域中的巨型區塊。
在種種實施過程中,在區塊904適應性決定來源區塊的尺寸,可包括因應輸入影像訊框的運動向量成本估計分析來即時決定該來源區塊尺寸。例如,當決定已知巨型區塊的來源區塊尺寸時,HME模組402可產生許多候選來源區塊尺寸之每一個的預測器,並且依據倍數的分析,譬如每一候選來源區塊尺寸之位移訊框差的尺寸,可選出該來源區塊的特定候選來源區塊尺寸。
過程900在區塊906截止,在此,階層式運動估算可被施行以用於該影像訊框的巨型區塊,其至少部分使用該來源區塊與縮減取樣的參考影像層。在種種實施過程中,區塊906以類似在圖5區塊508之上下文中之以上所討論的方式來進行,在此階層式運動估算可使用在區塊904所適應性決定的來源區塊尺寸來施行。
雖然如在圖5與9中所顯示之實例過程500與900的實施過程可包括以所顯示順序所示全部區塊的進行,但是本發明卻不限於此方面,且在種種實例中,過程500與
900的實施過程可包括僅僅進行所示的一子集區塊與/或以所示的不同順序來進行。
此外,圖5與9之區塊的任一個或多個可被進行,以因應由一或多個電腦程式產品所提供的指令。此類程式產品可包括訊號承受媒體,其係提供當例如由一處理器所執行時可提供在此所說明之功能的指令。該電腦程式產品係以任何型式的機器可讀取媒體來提供。因此,例如,包括一或多個處理器核心的處理器可進行在圖5與9所顯示的一或多個區塊,以因應藉由機器可讀取媒體而傳送到處理器的程式代碼與/或指令或指令集。一般而言,機器可讀取媒體可傳送呈程式代碼與/或指令或指令集之形式的軟體,其係會造成在此所說明的任一裝置與/或系統,來實施至少部分的視頻編碼器系統100與/或ME模組400。
如在此所說明之任一實施過程中所使用地,名詞〝模組〞意指被架構以提供在此所說明功能之軟體、韌體與/或硬體之任何組合。軟體可以軟體套件、代碼與/或指令集或指令來實施,且〝硬體〞,如在此所說明之任一實施過程中所使用地,可包括例如,個別或呈任何組合,固線式電路、可程式電路、狀態機器電路與/或韌體,其係儲存由可程式電路所執行的指令。該模組可集合或個別地以形成部分更大系統的電路來實施,例如,積體電路(IC)、晶片上系統(SoC)等等。
圖10顯示根據本發明的實例系統1000。在種種實施過程中,系統1000可為一媒體系統,雖然系統1000不受
限於此上下文。例如,系統1000可被併入一個人電腦(PC)、膝上型電腦、超薄膝上型電腦、平板電腦、觸控板、可攜式電腦、手持式電腦、掌上型電腦、個人數位助理(PDA)、蜂巢式電話、組合蜂巢式電話/個人數位助理、電視、智慧型裝置(例如智慧型手機、智慧型平板電腦或智慧型電視)、行動網際網路裝置(MID)、訊息發送裝置、資料通訊裝置、照相機(例如,傻瓜相機、超級變焦相機、數位單眼相機(DSLR))等等。
在種種實施過程中,系統1000包括被耦合到顯示器1020的平台1002。平台1002可接收來自內容裝置的內容,譬如內容服務裝置1030或內容傳送裝置1040或其他類似內容來源。包括一或多個導航功能的導航控制器1050可被使用以與例如平台1002與/或顯示器1020互動。這些元件的每一個在以下均有更詳細的說明。
在種種實施過程中,平台1002可包括晶片組1005、處理器1010、記憶體1012、儲存器1014、圖形子系統1015、應用1016與/或無線電1018的任一組合。晶片組1005可提供互通於處理器1010、記憶體1012、儲存器1014、圖形子系統1015、應用1016與/或無線電1018之間。例如,晶片組1005可包括能夠與儲存器1014提供互通的儲存配接器(沒被描繪)。
處理器1010可以複雜指令集電腦(CISC)或減少指令集電腦(RISC)處理器、x86指令集相容處理器、多核心或任何其他微處理器或中央處理單元(CPU)來實施。
在種種實施過程中,處理器1010可為雙核心處理器、雙核心行動處理器等等。
記憶體1012可以揮發性記憶體裝置來實施,譬如,但不限於隨機存取記憶體(RAM)、動態隨機存取記憶體(DRAM)、或靜態RAM(SRAM)。
儲存器1014可以非揮發性儲存裝置來實施,譬如,但不限於,磁碟驅動器、光碟驅動器、磁帶驅動器、內儲存裝置、附加儲存裝置、快閃記憶體、電池備份SDRAM(同步DRAM)、與/或網路存取儲存裝置。在種種實施過程中,例如,當複數個硬體驅動器被包括時,儲存器1014可包括增加儲存性能提高保護給重要的數位媒體的技術。
圖形子系統1015可施行影像之處理,譬如用於顯示的定格或視頻。可能圖形子系統1015是圖形處理單元(GPU)或視覺處理單元(VPU)。類比或數位介面可被使用以溝通地耦合圖形子系統1015與顯示器1020。例如,介面可為高清晰度多媒體介面、顯示埠、無線HDMI、與/或無線HD適用技術的任一個。圖形子系統1015可被整合入處理器1010或晶片組1005。在一些實施過程中,圖形子系統1015可為溝通地耦合到晶片組1005的單機系統卡。
在此所說明的該圖形與/或視頻處理技術可以種種硬體架構來實施。例如,圖形與/或視頻功能可被整合到一晶片組內。或者,分開的圖形與/或視頻處理器則可被使
用。誠如仍另一實施過程,該圖形與/或視頻功能可由一般目的之處理器所提供,包括多核心處理器。在進一步實施例中,該功能可在消費性電子裝置中實施。
無線電1018包括能夠使用種種適當無線通訊技術來傳送與接收訊號的一或多個無線電。此等技術包含經由一或多個無線網路的通訊。實例無線網路包括(但不限於)無線局部區域網路(WLAN)、無線個人區域網路(WPAN)、無線都會網路(WMAN)、蜂巢式網路與衛星網路。在經過此些網路的通訊中,無線電1018可根據任何版本的一或多個可應用標準來操作。
在種種實施過程中,顯示器1020包括任一電視型態的監視器或顯示器。顯示器1020例如包括電腦顯示螢幕、觸控式螢幕顯示器、視頻監視器、類似電視裝置與/或電視。顯示器1020可為數位與/或類比。在種種實施過程中,顯示器1020可為全像顯示器。顯示器1020也可為可接收視覺投射的透明表面。此些投射可傳送種種形式的資訊、影像與/或物體。例如,此些投射可為行動式擴增實境(MAR)應用的視覺重疊。在一或多個軟體應用1016之控制下,平台1002可顯示使用者介面1022於顯示器1020上。
在種種實施過程中,內容服務裝置1030可藉由任何全國性、國際性與/或獨立性服務來主持,其係並且因此可例如經由網際網路而存取到平台1002。內容服務裝置1030可被耦合到平台1002與/或到顯示器1020。平台
1002與/或內容服務裝置1030可被耦合到網路1060,以將媒體資訊通訊(例如,發送與/或接收)至與自網路1060。內容傳送裝置1040也可被耦合到平台1002與/或到顯示器1020。
在種種實施過程中,內容服務裝置1030包括有線電視盒、個人電腦、網路、電話、能夠傳送數位資訊與/或內容的網路驅動裝置或設備、以及能夠經由網路1060或直接地在內容提供者與平台1002與顯示器1020之間單向或雙向通訊內容的任何其他類似裝置。將理解的是,該內容可經由網路1060單向與/或雙向地通訊至與自系統1000與內容提供者中的任一元件。內容實例可包括任一媒體資訊,例如包括視頻、音樂、醫藥與遊戲資訊等等。
內容服務裝置1030可接收譬如有線電視程式化的內容,包括媒體資訊、數位資訊與/或其他內容。內容提供者的實例可包括任一有線或衛星電視或無線電或網際網路內容提供者。所提供的實例不意味著以任一方式來限制根據本發明的實施過程。
在種種實施過程中,平台1002可接收來自具有一或多個導航特徵之導航控制器1050的控制訊號。控制器1050的導航特徵可被使用以與例如使用者介面1022互動。在種種實施例中,導航控制器1050可為一點選裝置,其可為允許使用者輸入空間(例如,連續與多維)資料到電腦內的電腦硬體元件(具體地說,人類介面裝置)。許多系統,譬如圖形使用者介面(GUI)與電視與
監視器允許使用者使用肢體姿勢來控制與提供資料到電腦或電視。
藉由被顯示在顯示器上之指標、游標、聚焦環、或其他視覺指示器的移動,控制器1050之導航功能的移動可在顯示器(例如,顯示器1020)上被複製。例如,在軟體應用1016的控制下,放置在導航控制器1050上的導航功能可被映射到例如顯示於使用者介面1022上的視覺導航功能。在種種實施例中,控制器1050可能並非分開的元件,但卻被整合到平台1002與/或顯示器1020內。不過,本發明不限於在此所顯示或說明的元件或上下文中。
在種種實施過程中,驅動器(沒顯示)可包括致使使用者立即開啟與關閉平台1002之技術,就像例如當被致能時、在一開始啟動以後以按鈕觸控的電視。程式邏輯可允許平台1002將內容流入到媒體配接器或其他內容服務裝置1030或內容傳送裝置1040,甚至在平台〝關閉〞時。此外,晶片組1005可包括用於例如5.1環繞聲音音頻與/或高清晰度7.1環繞聲音音頻的硬體與/或軟體支持。驅動器可包括用於積體圖形平台的圖形驅動器。在種種實施例中,該圖形驅動器可包含一週邊元件互連(PCI)Express圖形卡。
在種種實施過程中,在系統1000中所顯示的任一個或多個元件可被整合。例如,平台1002與內容服務裝置1030可被整合,或者平台1002與內容傳送裝置1040可被整合,或者例如平台1002、內容服務裝置1030與內容
傳送裝置1040可被整合。在種種實施例中,平台1002與顯示器1020可為一整合單元。例如顯示器1020與內容服務裝置1030可被整合,或者顯示器1020與內容傳送裝置1040可被整合。這些實例不意味著限制本發明。
在種種實施例中,系統1000可以無線系統、有線系統或兩者的組合來實施。當以無線系統來實施時,系統1000可能包括適合在無線共享媒體上通訊的元件與介面,譬如一或多個天線、傳送器、接收器、收發器、放大器、過濾器、控制邏輯等等。無線共享媒體的實例包括無線光譜部分,譬如射頻光譜等等。當以有線系統實施時,系統1000可能包括適合在有線通訊媒體上通訊的元件與介面,譬如輸入/輸出(I/O)配接器、連接I/O配接器與相應有線通訊媒體的物理連接器、網路介面卡(NIC)、磁碟控制器、視頻控制器、音頻控制器等等。有線通訊媒體的實例包括導線、纜線、金屬引線、印刷電路板(PCB)、背面、交換機晶元、半導體材料、雙絞線、共軸纜線、光纖等等。
平台1002可建立一或多個邏輯或物理通道以傳送資訊。該資訊包括媒體資訊與控制資訊。媒體資訊可意指代表用於使用者之內容的任何資料。內容實例例如可包括來自語音交談、視訊會議、串流視頻、電子郵件(〝email〞)訊息、聲音郵件訊息、文數符號、圖形、影像、視頻、文字等等的資料。來自語音交談的資料例如是語音資訊、靜默時期、背景雜訊、人為背景雜訊、音調
等等。控制資訊可意指代表打算用於一自動系統之命令、指令或控制字的任何資料。例如,控制資訊可被使用以將媒體資訊路由經過一系統,或者下令一節點以預定方式來處理該媒體資訊。不過,該等實施例不限於該等元件或者在圖10所示或說明的上下文中。
如以上所說明地,系統1000可以變化物理型態或形狀因數來實施。圖11顯示小形狀因數裝置1100的實施過程,其中系統1000可被實施。在種種實施例中,例如,裝置1100可以具有無線性能的行動計算裝置來實施。行動計算裝置可意指具有處理系統與行動電源或供應(譬如例如一或多個電池)的任何裝置。
如以上所說明,行動計算裝置的實例可包括個人電腦(PC)、膝上型電腦、超薄膝上型筆電、平板電腦、觸控板、可攜式電腦、手持式電腦、掌上型電腦、個人數位助理(PDA)、蜂巢式電話、組合蜂巢式電話/個人數位助理、電視、智慧型裝置(例如智慧型手機、智慧型平板電腦或智慧型電視)、行動網際網路裝置(MID)、訊息發送裝置、資料通訊裝置、照相機(例如,傻瓜相機、超級變焦相機、數位單眼相機(DSLR))等等。
行動計算裝置的實例也可包括被安排以由人穿戴的電腦,譬如手腕電腦、手指電腦、環電腦、眼鏡電腦、皮帶夾電腦、臂章電腦、鞋電腦、服飾電腦與其他可穿戴電腦。在種種實施例中,例如,行動計算裝置可以能夠執行電腦應用以及聲音通訊與/或資料通訊的智慧型手機來實
施。雖然一些實施例可藉由實例、用以智慧型手機來實施的行動計算裝置來說明,但是可理解的是,其他實施例也可使用其他無線行動計算裝置來實施。該等實施例不限於此上下文。
如圖11所示,裝置1100可包括外殼1102、顯示器1104、輸入/輸出(I/O)裝置1106、與天線1108。裝置1100也可包括導航功能1112。顯示器1104可包括用於顯示適合行動計算裝置之資訊的任何適當顯示單元。I/O裝置1106可包括用於輸入資訊到行動計算裝置內的任何適當I/O裝置。I/O裝置1106的實例可包括文數字鍵盤、數字鍵板、觸控板、輸入鍵、按鈕、切換器、搖桿開關、麥克風、喇叭、聲音辨認裝置與軟體等等。資訊也可藉由麥克風(沒顯示)被輸入到裝置1100內。此資訊可藉由聲音辨認裝置(沒顯示)被數字化。該等實施例不限於此上下文。
種種實施例可使用硬體元件、軟體元件或兩者之組合來實施。硬體元件的實例可包括處理器、微處理器、電路、電路元件(例如電晶體、電阻器、電容器、電感器等等)、積體電路、特殊應用積體電路(ASIC)、可程式化邏輯裝置(PLD)、數位訊號處理器(DSP)、場可程式化閘極陣列(FPGA)、邏輯閘極、暫存器、半導體裝置、晶片、微晶片、晶片組等等。軟體的實例可包括軟體元件、程式、應用、電腦程式、應用程式、系統程式、機器程式、操作系統軟體、中間軟體、韌體、軟體模組、常
式、子常式、函數、方法、程序、軟體介面、應用程式介面(API)、指令集、計算代碼、電腦代碼、代碼段、電腦代碼段、字元、數值、符號或其任何組合。決定一實施例是否使用硬體元件與/或軟體元件來實施,可能會根據許多因素而有所不同,譬如希望的計算率、功率位準、熱容差、處理週期預算、輸入資料率、輸出資料率、記憶體資源、資料匯流排速率與其他設計或性能限制。
至少一實施例的一或多個態樣可藉由被儲存在機器可讀取媒體上的代表性指令來實施,其係代表在該處理器內的種種邏輯,當由一機器讀取時,其係會造成該機器製造邏輯,以施行在此所說明的技術。此些代表,被認為是〝智慧財產權<IP>核心〞,可被儲存在實體、機器可讀取媒體並且可被供應到種種用戶或製造設備,以載入到真實製造該邏輯或處理器的製造機器。
雖然在此所陳述的特定特徵已經參考種種實施過程來說明,但是此說明不意在以限制意義來詮釋。因此,被熟諳本發明所屬之技藝人士所清楚明瞭之在此所說明之實施過程的種種改良以及其他實施過程,其係被認為在本發明的精神與範圍內。
根據本發明,現有影像訊框與參考影像訊框可被接收。非線性縮放可被施加到現有影像訊框,以產生至少一第一現有影像層,且非線性縮放可被施加到參考影像訊框,以產生至少一第一參考影像層。階層式運動估算隨後可被施行,以至少部分回應第一現有影像層的來源區塊與
第一參考影像層。在種種實例中,施加非線性縮放到現有影像訊框,對應以具有值大於二的縮放倍數來縮放現有影像訊框的每一尺寸。在一些實例中,該縮放倍數可具有大於二且小於四的值。在種種實例中,施行階層式運動估算可包括產生對應第一現有影像層的來源區塊的一運動向量場以及識別在該運動向量場中的最佳候選運動向量。在種種實例中,非線性縮放可被施加到第一現有影像層,以產生第二現有影像層。在其他實例中,線性縮放可被施加到第一現有影像層,以產生第二現有影像層。例如,該線性縮放可以倍數二對應縮放第一現有影像層的每一尺寸。
根據本發明,縮減取樣影像層可從一影像訊框產生,在該縮減取樣影像層中來源區塊的尺寸可被適應性地決定,且階層式運動估算可被施行,以用於該影像訊框的一巨型區塊,其至少部分使用該來源區塊與一縮減取樣參考影像層。在種種實例中,適應性決定該來源區塊的尺寸可包括決定該來源區塊的尺寸,以因應與該縮減取樣影像層中來源區塊之位置相關聯的影像特徵。該影像特徵係為時間或空間影像特徵。在種種實例中,適應性決定該來源區塊的尺寸可包括決定該來源區塊尺寸以因應該影像訊框的預處理。該影像訊框的預處理可包括決定該影像訊框的影像複雜度。在種種實例中,適應性決定該來源區塊的尺寸可包括即時決定該來源區塊尺寸以因應運動向量成本估計。
Claims (17)
- 一種運動估算方法,包含:接收一現有影像訊框與一參考影像訊框;施加非線性縮放到該現有影像訊框,以產生至少一第一現有影像層;施加非線性縮放到該參考影像訊框,以產生至少一第一參考影像層;以及至少部分因應該第一現有影像層的來源區塊與該第一參考影像層,來施行階層式運動估算。
- 如申請專利範圍第1項之方法,其中施加非線性縮放到該現有影像訊框,包含以具有大於二之值的縮放倍數來縮放該現有影像訊框的每一尺寸。
- 如申請專利範圍第1項之方法,其中該縮放倍數包含大於二且小於四的值。
- 如申請專利範圍第1項之方法,其中施行階層式運動估算包含:產生一對應該第一現有影像層之該來源區塊的運動向量場;以及識別在該運動向量場中的最佳候選運動向量。
- 如申請專利範圍第1項之方法,進一步包含:施加非線性縮放到該第一現有影像層,以產生第二現有影像層。
- 如申請專利範圍第1項之方法,進一步包含:施加線性縮放到該第一現有影像層,以產生第二現有 影像層。
- 如申請專利範圍第6項之方法,其中施加線性縮放到該第一現有影像層包含將該第一現有影像層的每一尺寸縮放兩倍。
- 至少一種機器可讀取媒體,包含因應在一計算裝置上所執行、導致該計算裝置實施如申請專利範圍第1項至第7項任一項之方法的複數個指令。
- 一種運動估算裝置,其包含:至少一處理器;以及包含電腦程式碼之至少一記憶體,其中該電腦程式碼被組態以藉由該至少一處理器,使該裝置至少執行如申請專利範圍第1項至第7項任一項之方法。
- 一種運動估算方法,包含:從一影像訊框產生一縮減取樣影像層;在該縮減取樣影像層中,適應性地決定來源區塊的尺寸;以及至少部分地使用該來源區塊與縮減取樣參考影像層,來施行該影像訊框之巨集區塊的階層式運動估算。
- 如申請專利範圍第10項之方法,其中適應性決定該來源區塊的尺寸包含因應與在該縮減取樣影像層中該來源區塊之位置相關聯的影像特徵,來決定該來源區塊的尺寸。
- 如申請專利範圍第11項之方法,其中該影像特徵包含至少一時間或空間影像特徵。
- 如申請專利範圍第10項之方法,其中適應性決定該來源區塊的尺寸包含因應該影像訊框的預處理來決定該來源區塊尺寸。
- 如申請專利範圍第13項之方法,其中該影像訊框的預處理包含決定該影像訊框的影像複雜度。
- 如申請專利範圍第10項之方法,其中適應性決定該來源區塊的尺寸包含因應運動向量成本估計來即時決定該來源區塊尺寸。
- 至少一種機器可讀取媒體,包含因應在一計算裝置上所執行、導致該計算裝置實施如申請專利範圍第10項至第15項任一項之方法的複數個指令。
- 一種運動估算裝置,其包含:至少一處理器;以及包含電腦程式碼之至少一記憶體,其中該電腦程式碼被組態以藉由該至少一處理器,使該裝置至少執行如申請專利範圍第10項至第15項任一項之方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2012/029294 WO2013137890A1 (en) | 2012-03-15 | 2012-03-15 | Hierarchical motion estimation employing nonlinear scaling and adaptive source block size |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201352009A TW201352009A (zh) | 2013-12-16 |
TWI526057B true TWI526057B (zh) | 2016-03-11 |
Family
ID=49161621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102106221A TWI526057B (zh) | 2012-03-15 | 2013-02-22 | 利用非線性縮放及適應性來源區塊大小之階層式運動估算 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9532048B2 (zh) |
EP (1) | EP2826021A4 (zh) |
CN (1) | CN104169971B (zh) |
TW (1) | TWI526057B (zh) |
WO (1) | WO2013137890A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2826021A4 (en) | 2012-03-15 | 2016-04-27 | Intel Corp | HIERARCHICAL MOTION ESTIMATION EMPLOYING NON-LINEAR SCALING AND AN ADAPTIVE SOURCE BLOCK SIZE |
TWI564682B (zh) * | 2015-02-17 | 2017-01-01 | 緯創資通股份有限公司 | 具色彩匹配之全像模組及具全像模組之顯示裝置與穿戴裝置 |
US10019360B2 (en) * | 2015-09-26 | 2018-07-10 | Intel Corporation | Hardware predictor using a cache line demotion instruction to reduce performance inversion in core-to-core data transfers |
US10360708B2 (en) * | 2016-06-30 | 2019-07-23 | Snap Inc. | Avatar based ideogram generation |
US10432559B2 (en) | 2016-10-24 | 2019-10-01 | Snap Inc. | Generating and displaying customized avatars in electronic messages |
US10979728B2 (en) | 2017-04-24 | 2021-04-13 | Intel Corporation | Intelligent video frame grouping based on predicted performance |
WO2020009801A1 (en) * | 2018-07-01 | 2020-01-09 | Google Llc | Analysis and visualization of subtle motions in videos |
KR20220066045A (ko) * | 2019-09-19 | 2022-05-23 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 비디오 코딩의 스케일링 윈도우 |
CN117615155A (zh) | 2019-09-19 | 2024-02-27 | 北京字节跳动网络技术有限公司 | 视频编解码中的参考样点位置推导 |
EP4026336A4 (en) | 2019-10-05 | 2022-12-07 | Beijing Bytedance Network Technology Co., Ltd. | LEVEL-BASED SIGNALING OF VIDEO CODING TOOLS |
WO2021068956A1 (en) | 2019-10-12 | 2021-04-15 | Beijing Bytedance Network Technology Co., Ltd. | Prediction type signaling in video coding |
JP7414980B2 (ja) | 2019-10-13 | 2024-01-16 | 北京字節跳動網絡技術有限公司 | 参照ピクチャリサンプリングと映像コーディングツールとの間の相互作用 |
US11558637B1 (en) * | 2019-12-16 | 2023-01-17 | Meta Platforms, Inc. | Unified search window to support multiple video encoding standards |
BR112022012807A2 (pt) | 2019-12-27 | 2022-09-27 | Beijing Bytedance Network Tech Co Ltd | Método de processamento de vídeo, aparelho para processar dados de vídeo e meios não transitórios legíveis por computador |
CN112291561B (zh) * | 2020-06-18 | 2024-03-19 | 珠海市杰理科技股份有限公司 | Hevc最大编码块运动向量计算方法、装置、芯片及存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003036978A1 (en) * | 2001-10-26 | 2003-05-01 | Koninklijke Philips Electronics N.V. | Method and apparatus for spatial scalable compression |
US20040091047A1 (en) | 2002-11-11 | 2004-05-13 | Sony Corporation | Method and apparatus for nonlinear multiple motion model and moving boundary extraction |
KR100534207B1 (ko) * | 2002-12-09 | 2005-12-08 | 삼성전자주식회사 | 비디오 부호화기의 움직임 추정기 및 그 방법 |
US7158158B1 (en) * | 2003-03-12 | 2007-01-02 | Apple Computer, Inc. | Method and apparatus for nonlinear anamorphic scaling of video images |
US7697610B2 (en) * | 2004-09-13 | 2010-04-13 | Microsoft Corporation | Variable block size early termination for video coding |
KR100655040B1 (ko) * | 2005-11-24 | 2006-12-06 | 주식회사 휴맥스 | 디지털 영상신호 스케일링 방법 |
US8548056B2 (en) * | 2007-01-08 | 2013-10-01 | Qualcomm Incorporated | Extended inter-layer coding for spatial scability |
TWI345735B (en) | 2007-11-30 | 2011-07-21 | Univ Nat Cheng Kung | A method for deciding the coding mode of an image macro block |
CN102057398B (zh) * | 2008-06-13 | 2013-11-06 | 上海惠普有限公司 | 处理超分辨率目标图像 |
US8254439B2 (en) * | 2009-05-08 | 2012-08-28 | Mediatek Inc. | Apparatus and methods for motion vector correction |
WO2011060159A2 (en) | 2009-11-11 | 2011-05-19 | Cinnafilm, Inc. | Single frame artifact filtration and motion estimation |
US8325815B2 (en) * | 2010-02-08 | 2012-12-04 | Himax Technologies Limited | Method and system of hierarchical motion estimation |
US20120281759A1 (en) * | 2010-03-31 | 2012-11-08 | Lidong Xu | Power efficient motion estimation techniques for video encoding |
TWI404422B (zh) | 2010-04-14 | 2013-08-01 | Himax Tech Ltd | 階層式動作估計的方法與系統 |
US20130148732A1 (en) | 2011-12-13 | 2013-06-13 | Jason D. Tanner | Variable block sized hierarchical motion estimation |
EP2826021A4 (en) | 2012-03-15 | 2016-04-27 | Intel Corp | HIERARCHICAL MOTION ESTIMATION EMPLOYING NON-LINEAR SCALING AND AN ADAPTIVE SOURCE BLOCK SIZE |
-
2012
- 2012-03-15 EP EP12871413.6A patent/EP2826021A4/en not_active Withdrawn
- 2012-03-15 US US13/977,392 patent/US9532048B2/en active Active
- 2012-03-15 WO PCT/US2012/029294 patent/WO2013137890A1/en active Application Filing
- 2012-03-15 CN CN201280071369.0A patent/CN104169971B/zh active Active
-
2013
- 2013-02-22 TW TW102106221A patent/TWI526057B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US20140044368A1 (en) | 2014-02-13 |
EP2826021A4 (en) | 2016-04-27 |
TW201352009A (zh) | 2013-12-16 |
WO2013137890A1 (en) | 2013-09-19 |
CN104169971B (zh) | 2020-08-25 |
CN104169971A (zh) | 2014-11-26 |
US9532048B2 (en) | 2016-12-27 |
EP2826021A1 (en) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI526057B (zh) | 利用非線性縮放及適應性來源區塊大小之階層式運動估算 | |
CN109565587B (zh) | 具有上下文解码和重构旁路的视频编码的方法和系统 | |
KR102587638B1 (ko) | 비디오 코딩을 위해 이웃 블록 패턴을 이용하는 모션 추정 방법 및 시스템 | |
CN104756498B (zh) | 跨层运动向量预测 | |
US20140254678A1 (en) | Motion estimation using hierarchical phase plane correlation and block matching | |
CN107113435B (zh) | 分区模式和变换尺寸确定方法、装置、系统及介质 | |
JP6060394B2 (ja) | クロスレイヤー・クロスチャネル残差予測 | |
EP3910941A1 (en) | Parallel video encoding of coding units from neighboring largest coding units | |
US20190045198A1 (en) | Region adaptive data-efficient generation of partitioning and mode decisions for video encoding | |
JP2016506165A (ja) | インターレイヤの動きデータ継承 | |
KR20150070313A (ko) | 다수의 독립 코딩 스트림들 사이에서 공유된 모션 추정을 포함하는 비디오 코딩 | |
CN112312140A (zh) | 用于视频编码的内容和量化自适应编码结构决策 | |
US20150016530A1 (en) | Exhaustive sub-macroblock shape candidate save and restore protocol for motion estimation | |
TWI551118B (zh) | 用於殘值預測的移動估測之方法 | |
US10869041B2 (en) | Video cluster encoding for multiple resolutions and bitrates with performance and quality enhancements | |
US20130148732A1 (en) | Variable block sized hierarchical motion estimation | |
US10687054B2 (en) | Decoupled prediction and coding structure for video encoding | |
US10104373B2 (en) | Content based video encoding for wireless display | |
CN107743707B (zh) | 低位率视频编解码 | |
WO2013158125A1 (en) | Performance and bandwidth efficient fractional motion estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |