TW200926830A - Efficient transformation techniques for video coding - Google Patents

Efficient transformation techniques for video coding Download PDF

Info

Publication number
TW200926830A
TW200926830A TW097137391A TW97137391A TW200926830A TW 200926830 A TW200926830 A TW 200926830A TW 097137391 A TW097137391 A TW 097137391A TW 97137391 A TW97137391 A TW 97137391A TW 200926830 A TW200926830 A TW 200926830A
Authority
TW
Taiwan
Prior art keywords
conversion
blocks
video
block
video material
Prior art date
Application number
TW097137391A
Other languages
English (en)
Inventor
Raghavendra C Nagaraj
De Dzwo Hsu
Stephen Molloy
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200926830A publication Critical patent/TW200926830A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

200926830 九、發明說明: 【發明所屬之技術領域】 本發明係關於數位視頻處理’且更明確地說’係關於對 視頻資料之基於區塊之編碼。 【先前技術】 . 可將視頻能力併入多種設備中’包括數位電視、數位直 播系統、無線通信設備、個人數位助理(PDA)、膝上型電 腦、桌上型電腦、數位相機、數位記錄設備、蜂巢式或衛 ❹ 星無線電電話、視頻遊戲顧問(counsel)、掌上型遊戲設備 等。數位視頻編碼可在產生、修改、傳輸、儲存、記錄及 播放全運動多媒體序列方面提供優於習知類比系統之顯著 改良。廣播網路可使用視頻編碼以促進向無線用戶設備廣 播多媒體(音訊-視頻)序列之一或多個頻道。亦使用視頻編 碼來支援視頻電話(VT)應用,諸如藉由蜂巢式無線電電話 召開視頻會議。 已針對編碼數位視頻序列建立若干不同之編碼標準。舉 © 例而言,運動圖像專家組(MPEG)已開發出包括MPEG-1、 MPEG-2及MPEG-4之若干標準。其他標準包括國際電信協 會(ITU) H.263標準及 H.264標準、Apple Computer (Cupertino, California)開發的 QuickTime™技術、Microsoft Corporation (Redmond, Washington)開發的 Windows™ 視頻、Intel Corporation 開發的 IndeoTM、RealNetworks,Inc.(Seattle, Washington)開發的 RealVideo™ 及 SuperMac,Inc 開發的 CinepakTM。此外,不斷湧現及發展出新的標準^ MPEG-4 134564.doc 200926830 之第10部分「近階視頻編碼(AVC)」中亦陳述ITU H.264標 準。 多數視頻編碼技術利用基於區塊之編碼,其將視頻圖框 劃分為像素區塊且使該等區塊與視頻序列中之其他圖框的 區塊相關。藉由對當前區塊與另一圖框之預測區塊之間的 - 差異進行編碼’可達成資料壓縮。通常使用術語「巨集區 . 塊」來界定視頻圖框之與搜尋空間(其通常為視頻序列之 前一前或後一圖框的一子集)進行比較的離散區塊。亦可 Ο 將巨集區塊進一步再分為分區或子分區。ITU H.264標準 支援16乘16之巨集區塊、16乘8之分區、8乘16之分區、8 乘8之分區、8乘4之子分區、4乘8之子分區及4乘4之子分 區。其他標準可支援不同大小之區塊、巨集區塊、分區及/ 或子分區。 對於視頻圖框中之每一區塊(巨集區塊、分區或子分 區)’編碼器將一或多個緊接在前之視頻圖框(及/或後續圖 ❾框)的類似大小之區塊進行比較以識別一類似區塊,其稱 作「預測區塊」或「最佳匹配」。將當前視頻區塊與其他 圖框之視頻區塊進行比較的過程通常稱作運動估計。一旦 ㈣待編碼之給定區塊識別出「最佳匹配」,編碼器便可 對當前區塊與最佳匹配之間的差異進行編碼。對當前區塊 -最佳匹S&之間的差異進行編碼的過程包括稱作運動補償 之過程。運動補償包含產生一差異區塊(稱作剩餘者),其 包括指示與待編碼之當前區塊與最佳匹配之間的差異之資 訊。詳言之,運動補償通常稱作使用運動向量取得最佳匹 134564.doc 200926830 配且接著自輸入區塊中減去最佳匹配以產生剩餘者的動 作。可對剩餘者執行諸如熵編碼之額外編碼步驟以進一步 壓縮位元流。 【發明内容】 本發明描述可在視頻編碼中使用之有效率轉換技術。詳 ' 言之,在計算與視頻資料之第二區塊之轉換相關聯之計算 • 的中間結果時重新使用與視頻資料之第一區塊之轉換相關 聯之計算的中間結果。可在運動估計過程期間使用有效率 ® 轉換技術,其中搜尋空間之視頻區塊被轉換,但本發明不 必在此方面受限。根據本發明,搜尋空間可拆分為多個不 同之4乘4像素區塊,且該等不同之4乘4像素區塊可相互重 疊。 可對4乘4像素區塊之列執行一維轉換以 且接著可對該等中間結果之一行執行一維轉換。夂果可 首先對行執行-維轉換,且接著對該等中間結果之一列執
行-維轉換。在任一情形中’給定搜尋空間中之不同4乘* 像素區塊之間的重疊,彳重新使用(例如,與稍後轉換共 用)中間結果中之至少―些結果,而無需執行相同計算。 亦揭示—種有效率架構以用於實施本文中描述之技術。 —在—實例中,本發明提供-種包含對視頻資料之區塊執 仃轉換的方法’其中執行轉換包括在視頻資料之第二區塊
Hi:換中重新使用與視頻資料之第-區塊之第::換 相關聯的—或多個計算。 在另-實例中,本發明提供-種設備,其包含—對視頻 134564.doc 200926830 資料之區塊執行轉換的視頻編碼器^在執行轉換時,視頻 編碼器在視頻資料之第二區塊的第二轉換中重新使用與視 頻資料之第一區塊之第一轉換相關聯的一或多個計算。 在另一實例中,本發明提供一種設備,其包含用於對視 頻資料之區塊執行轉換的構件,及用於在視頻資料之第二 區塊的第二轉換中重新使用與視頻資料之第一區塊之第一 轉換相關聯之一或多個計算的構件。 本文中所描述之技術可以硬體、軟體、韌體或其任一組 合實施。若以軟體實施,則該軟體可執行於數位信號處理 器(DSP)或其他類型之處理器或設備中。執行技術之軟體 可最初儲存於電腦可讀媒體中,且載入並執行於處理器或 其他設備中以允許使用本文中描述之技術進行視頻編碼。 因此,本發明亦預期一種電腦可讀媒體,其包含當在視 頻編碼設備中執行時引起該設備對視頻資料之區塊執行轉 換的指令,其中在執行轉換時,該等指令引起該設備在視 頻資料之第二區塊的第二轉換中重新使用與視頻資料之第 區塊之第一轉換相關聯的一或多個計算。 此外,本發明預期一種經組態以對視頻資料之區塊執行 轉換的電路,其中在執行轉換時,該電路在視頻資料之第 —區塊的第二轉換中重新使用與視頻資料之第一區塊之第 一轉換相關聯的一或多個計算。 另外,如下文中更詳細描述,可使用管線輸送技術來加 速有效率轉換技術,且可建構轉置記憶體以促進有效率管 線輸送。附圖及以下描述中陳述各種實施例之額外細節。 134564.doc 200926830 其他特徵、目標及優勢將自描述及圖式且自申請專利範圍 變得顯而易見。 【實施方式】 本發明描述可能在視頻編碼中有用之有效率轉換技術。 如下文中更詳細描述,在視頻資料之第二區塊的轉換中重 新使用與視頻資料之第一區塊之轉換相關聯之計算的中間 結果。該等技術可能尤其有用於在轉換搜尋空間之視頻區 塊的運動估計過程期間執行之整數轉換或正向離散餘弦轉 > 換。然而,可在與視頻編碼相關聯之其他轉換情形中使用 該等技術》實際上,該等技術可能有用於任何類型之線性 轉換、整數轉換及可能其他轉換情形。 根據本發明,可將(任意大小之)搜尋空間拆分為諸如4 乘4像素區塊之多個不同視頻區塊。在搜尋空間内界定之 不同4乘4像素區塊可相互重疊。作為一實例,雖然5乘5像 素搜尋空間可界定四個不同之4乘4像素區塊,但可使用對 _ 部分解析度之内插以在5乘5像素搜尋空間内界定更多之4 乘4像素區塊。當將4乘4像素區塊自像素域轉換至空間頻 率域時可使用搜尋空間。在自一域向另一域進行此轉換期 間通$對4乘4像素區塊執行兩遍一維轉換。對諸行執/ 第一遍一維轉換以產生水平空間頻率分量(稱作中間妗 果),且對一或多列執行第二遍一維轉換以產生垂直空間 頻率分量。一般熟習此項技術者將認識到,可輕易地對列 執行第一遍一維轉換且可對行執行第二遍一維轉換。 可對4乘4像素區塊之諸行執行一維轉換以產 注王1f間結 134564.doc •10· 200926830 果,且接著可對該等中間結果中之一列執行一維轉換。給 定搜尋空間中之不同4乘4像素區塊之間的重疊,可重新使 用中間結果中之至少一些結果,而無需執行相同計算。以 此方式,可避免計算以促進效率。亦揭示例示性硬體架 構’其可達成對本文中描述之技術的有效率之實施。在此 , 情形中,可使用管線輸送技術來加速視頻資料之區塊集合 . 的有效率轉換技術’且可建構轉置記憶體以促進有效率管 線輸送。 〇 圖1為說明可實施本發明之技術的視頻編碼設備之例示 性視頻編碼器1 〇的方塊圖。實際上,多種設備可建構一視 頻編碼器,其可受益於本發明之教示。作為實例,視頻編 碼器10可用於數位電視、數位直播系統、無線通信設備 (例如’手機)、個人數位助理(pda)、膝上型電腦、桌上 型電腦、數位相機、數位記錄設備、蜂巢式或衛星無線電 電話、視頻遊戲顧問、掌上型遊戲設備等。廣播網路可使 用視頻編碼以促進向無線用戶設備廣播多媒體(音訊_視頻) ® 序列之一或多個頻道。亦使用視頻編碼來支援視頻電話 (VT)應用,諸如藉由蜂巢式無線電電話召開視頻會議,以 及多種其他應用。 如圖1所示’視頻編碼器10接收輸入巨集區塊(MB)。通 常使用術語「巨集區塊J來定義視頻圖框之與搜尋空間進 行比較並被編碼的離散區塊。亦可將巨集區塊進一步再分 為分區或子分區。ITU H.264標準支援16乘16之巨集區 塊、16乘8之分區、8乘16之分區、8乘8之分區、8乘4之子 134564.doc 200926830 分區、4乘8之子分區及4乘4之子分區。其他標準可支援不 同大小之區塊、巨集區塊、分區及/或子分區。在任一情 形中’雖然可使用術語「巨集區塊」來描述本發明之態 樣,但本文中所描述之技術可能在對包括巨集區塊、分 區、子分區或其他視頻區塊大小之任意大小之視頻資料區 塊進行編碼的過程中有用。 如圖1所示,對於每一輸、MB,產生一預測區塊(在圖j 中標記為「Pred」)。預測區塊有時被稱作最佳匹配。經由 單元12自輸入MB中減去預測區塊以產生一剩餘者(在圖i 中標記為「Res」)^剩餘者包含一資料區塊,其指示輸入 MB與用以對輸入MB進行編碼之預測區塊之間的差異。可 藉由運動向量(或内編碼之内向量)來識別預測區塊。對於 内編碼,預測區塊位於與輸入MB相同之圖框内。對於間 編碼,預測區塊位於與輸入MB不同之圖框内。運動向量 (或内編碼之内向量)識別編碼時所使用之預測區塊。間編 碼可為預測的(P),此意謂預測區塊係基於前一圖框;或 雙向的(B),此意謂預測區塊係基於視頻序列之前一或後 一圖框。 在產生剩餘者(Res)後,便對剩餘者執行轉換及量化。 轉換單元14及量化單元16分別執行轉換及量化。亦可執行 熵編碼以產生一輸出位元流。熵編碼單元18執行熵編碼, 此可達成進一步壓縮。熵編碼可包括向位元集合分配碣及 使碼長與機率相匹配。視頻編碼中熟知且常用各種類型之 熵編瑪。 134564.doc -12- 200926830 在視頻編碼器10之預測迴路中,反向量化單元22及反向 轉換單元24對剩餘者執行反向量化及反向轉換以本質上顛 倒由單元12及14執行之轉換及量化。由加法器單元%將預 測區塊加回至重新建構之剩餘者。這本質上在預測迴路中 重新形成輸入ΜΒ»可由解塊單元28來對重新建構之^^^的 邊緣進行濾波且將其儲存在記憶體3 〇中。 量化原則上涉及縮小被轉換之信號的動態範圍。動態範
圍之縮小影響藉由熵編碼產生之位元的數目(速率)。此亦 在剩餘者中引入損失’其可導致原始灿與重新建構之仙 略有不同。此等差異通常稱作量化誤差或失真。量化強度 係由量化參數來判定的1大之量化參數導致較高之失 真’但可降低編碼率。 預/則迴路可為内預測迴路或間預測迴路。及ITu H.263通常僅支援間預測。Ιτυ Η ·支援内預測及間預測 兩者在圖1之視頻編碼!l1G中,控制信號可選擇迴路 為内預測較間預測H本發明之技術亦可在僅支援 内編碼或間編碼之系統中起作用。 在内預測時’單元34執行空間估計及空間補償。在此情 形中單兀34將重新建構之MB與同一視頻圖框内之相鄰 巨集區塊進行比較以產生—内預測器區塊。内預測器區塊 本質上係重新建構之MB的最佳匹配,其將導致對剩餘者 之良好壓縮。内預測可有助於減少空間冗餘。 ▲在間預測時’單;η:36執行運動估計及運動補償。運動估 6十將重新建構之MB與先前或未來圖框之區塊進行比較以 134564.doc 13 200926830 產生一間預測器。間預測器為重新建構之MB的最佳匹 配,但不同於内預測器,間預測器來自一或多個不同視頻 圖框。間預測可有助於減少時間冗餘。通常,利用時間冗 餘可對視頻序列之壓縮產生大於利用空間冗餘的影響。換 言之’ MB之間編碼通常達成優於内編碼之壓縮。 本發明之技術大體與諸如正向離散餘弦轉換之轉換有 關。雖然可在運動估計過程期間實施該等技術,但本發明 在此方面不受限制。為描述起見,本發明將描述在運動估 計期間執行之技術,但亦可在執行轉換之其他情形中使用 此等技術或類似技術。 運動估计係可由視頻編碼器執行之計算密集型過程。大 量计算可能係歸因於可在運動估計中考慮的大量潛在預測 器。實務上,運動估計通常涉及在包含一或多個先前圖框 (或後續圖框)之子集的搜尋空間中搜尋間預測器。可基於 成本函數或量度來檢查來自搜尋空間之候選者,其通常係 藉由執行差異计算來界定的,諸如絕對差之和(SAD)、平 方差之和(SSD)、轉換後之絕對差之和(SATD)或轉換後之 平方差之和(SSTD)。一旦計算出用於搜尋空間中之所有候 選者的量度,便可選擇最小化量度之候選者作為間預測 器。因此,影響運動估計之主要因素可能為搜尋空間之大 小、搜尋方法及各種成本函數。成本函數本質上量化了當 前圖框之原始區塊與搜尋區域之候選區塊之間的冗餘二 在準確率及失真方面量化冗餘。 圖2展示基於轉換之量度構架。圖2所示之區塊可包含由 134564.doc 14 200926830 運動估計器(諸如圖!所示之單元36)執行的功能。雖然圖2 中說明例不性位70長度,但本發明之技術不限於S何特定 位7G長度。又,運動估計涉及將待編碼之區塊與搜尋空間 内之多個候選者進行比較以找出該搜尋空間内與待編碼之 區塊最佳匹配的一區塊。根據本發明,可在速率及失真方 面界定最佳匹配。 為元成運動估计,分析待編碼之區塊與給定搜尋空間區 塊之間的剩餘能量。藉由自各別搜尋空間區塊之像素減去 待編碼之區塊之相應像素的過程來獲得每一剩餘候選者。 差異(Diff)模組β在圖2中(例如)經由SAD、SSD、satd或 SSTD技術完成此。接著,使用可執行正向離散餘弦轉換 之正向轉換引擎(FTE)44將剩餘區塊轉換至頻率域中。可 接著分析經轉換之剩餘區塊的速率及失真特性。詳言之, 速率失真估計(RDE)模組46本質上估計在給定量化參數Qp 情況下將導致之此給定搜尋空間區塊的速率(R)及失真 (D)。RDE模組46接著基於拉格朗日原理將r及〇組合成為 單一成本量度(=Ε)+λκ),在量度至少部分視R&D而定的情 況下,其可稱作速率失真量度。可對所有候選搜尋空間區 塊之成本進行比較且選擇導致最小成本之任一者以用於編 碼。 應注意,上文中計算之成本量度對應於被編碼之區塊及 具有4乘4像素大小之搜尋空間區塊。對於大於4乘4像素之 區塊大小,可使用多個4乘4像素區塊以延伸至較大區塊。 在此情形中,藉由累加延伸至較大區塊之所有4乘4單元區 134564.doc 200926830 塊的成本量度來計算較大區塊之成本。雖然以下描述關注 於4乘4像素之區塊大小,但該等技術可應用於其他大小之 區塊。 正向轉換引擎(FTE)44通常為任何基於轉換之量度計算 的基礎模組。由於轉換之線性本質,可交換差異模組42與 . FTE 44之級。根據本發明,交換差異模組心與卩^^ 44之次 • 序可允許轉換期間之計算節省。所描繪之區塊之輸入及輸 出之記法為輸入之(行)x(列)x(用以表示值之位元的數 參 目)。 圖3展示圖2之替代,其中圖2之差異模組42與FTE 44的 次序被交換。圖3之組件形成運動估計器單元之部分。雖 然出於例示性目的說明位元長度,但可使用其他位元長 度。在圖3中,兩個不同iFTE 52A及52B(例如)經由整數 轉換或正向離散餘弦轉換而轉換待編碼之區塊(「編碼區 塊」)及被考慮之搜尋空間區塊。在此情形t,在轉換後 _ 由差異單元54來執行差異計算。刪模組56接著估計在給 定量化參數QP情況下將導致之此給定搜尋空間區塊的速率 ()及失真(D)。rde模組56可基於拉格朗日原理,將r及ρ ”且σ成為單一成本(=〇+λκ)。接著可在運動估計單元(例 如,圖1之單元36)中,比較所有候選搜尋空間區塊之成 本’且可選擇導致最小成本之任-候選者以用於編碼。 運動估計之基本問題係自搜尋空間⑷中找出待編碼之區 塊(編碼區塊,Μ &「旦 e)的「最佳匹配」。可將編碼區塊及搜 尋空間〇)定義為: 134564.doc -16- (1)200926830 eoo e〇l 泛02 ^03 ^10 en 沒12 ^13 ^20 ^21 ^22 ^23 ^30 β31 泛32 ^33 沒00 50. ^02 503 *^04 ^10 5.ι 512 •5.4 ^20 ^2. S22 523 ^24 沒30 ^34 *^42 *^44 如可見,可針對《5中之四個搜尋點來匹 為: ί = Γί(0,0) s(0,l) L*y〇,〇) ^(1,1) 其中
^(0,0)=
^(U)= S00 $01 ^02 S03 S10 511 ^12 sn S20 •^2. S22 ^23 .^30 ^3. ^32 ^33 •^01 S02 夕03 ^04 5,2 ^.3 S22 ^23 ^24 .^3, *^32 丨33 V 、丨。 ^11 ^12 ^13" ^20 S22 方23 ^30 S32 .^40 ^42 ^43. ^.2 sn ^4' •^21 522 S23 ^3. *^32 S33 ^34 Λ. ^42 S43 ^44. 注意,(搜尋)點(例如,s(0,0)、s(0,l)、 被描繪為具有相等之水平與垂直維度的區 配e,其可描繪(2)(3)(4)(5)(6) s(l,0)或 s(l,l)) 塊。s(0,0)可稱 134564.doc -17- 200926830 作區塊00 ’ S(0,1)可稱作區塊01,s(l 0)可稱作區塊1〇且 s(l,l)可稱作區塊11。一搜尋點亦可描繪一具有不等之水 平與垂直維度的區塊。圖11展示具有出於說明性目的而展 示之與此實例一致之一些所界定之搜尋點及區塊的8x8搜 尋區域。為在中找出e之最佳匹配’可將剩餘區塊r(xj)計 . 算為: (7) 1 ' 一 2 j將剩餘區塊r(x,_y)轉換 -1 r(x,y) = e-s(x,y) x,^e0,l '1 1 1
接著,經由轉換矩陣2 1 1 1 -1-1 1 -2 2 至空間頻率域。 R\v (x,y) '1 1 1 1 ' ^',v (^>y) 2 1 -1 - 2 及’2vO,_y) 1 -1 _ 1 1 r2V(x,y) R\Ax,y). _1 -2 2 -1 v e 0,1,2,3 (8)
Rh〇(x,y) "1 1 1 1 · R\〇 (x>y) RM>y) 21-1-2 R\^ (x,y) Rhi{^y) 1 -1 -1 1 R\2(x>y) l - 2 2 -1 β\3 (x,y)_ h e 0,1,2,3
在方程式8中,變數v表示垂直行,且在方程式9中,變 數Λ表示水平列。轉換矩陣由整數組成,在一些情形中, 其稱作整數轉換’且在其他情形中,其稱作離散餘弦轉 換。離散餘弦轉換(DCT)可為整數轉換或「實數」轉換。 一般熟習此項技術者將認識到,轉換矩陣可由整數或實數 形成。可注意到,可使用4點一維(1_D)轉換來產生視頻區 134564.doc -18- 200926830 塊之空間頻率域分量。可首先對所有行應用4點丨-D轉換以 產生第一遍令間結果且接著可在第二遍中對中間結果之所 有列應用4點1-D轉換。圓4中展示1 _d轉換之「蝶形實 施」,其使用加法器集合以不同方式組合輸入從而產生不 同輸出。蠻力法將針對柯〇 〇)、价〇1)、价1〇)或价丨丨)之計算 - 使用八個單獨之1 -D轉換。在蠻力法中,獨立處理每一搜 • 尋點且不存在對中間結果π(〇,〇)、π(ο,ι)、Λ,(1,0)、职卬之 重新使用。對於高解析度電視(HDTV),若僅使用一垂直 ® 引擎及一水平引擎來搜尋整個圖框,則輸送量可能過慢而 無法促成對視頻圖框之即時呈現。因此,如下文中更詳細 描述,對於HDTV或其他應用,為加快搜尋速度,可並行 使用多個垂直引擎及水平引擎。 如圖4所示,可將一丨—D四輸入轉換視為具有多個級。變 數x〇、Xi、x2及x3表示轉換之輸入,且L、乃及力表示 轉換的四個經轉換之輸出。值raj及rCj為乘法常數。 因此,上方具有「c」之箭頭意謂彼箭頭之輸出係將輸入 ® 值(箭頭左側)與值「c」相乘的結果。值「p」表示字長, 亦即,進入各個級中之位元的數目。 若如圖3所示使用經修改_之構架,則可重新使用轉換之 中間結果。詳言之,與方程式(7)、(8)及(9)對比,可如下 獲得經二維轉換之zeOj)。 κ(χ^) = Ε~3(χ,γ) x,^e0,l 其中 134564.doc -19- E,0V E\v E\., 0 12 3 因此 200926830 ^ 〇v Kx^y) s\v (^,^) ^2v (x,y) _s\v (x,y) '1 1 1 1 ' 2 1 -1 — 2 〜0,少) 1 一 1 — 1 1 1 -2 2 一 1· s3v(x>y). sh〇(x,y) sh^y) ^H2(x^y) •Kw) Ί 1 1 1 " ~s\0 (x,y) 2 1 -1 - 2 S\, (x,y) 1 一 1 -1 1 S\2 (x,y) 」 1 -2 2 -1 S\3 (x,y)_ h e 0,1,2,3 2 1 — 1 — 2 _1 -1 1 2 2 一 1 已0v 1 -1 — 2 一 1 — 1 1 —2 2 -1 0,1,2,3 (11) (12) € 0,1,2,3 (13) 2v e 3v.
E, E' 五丨 E Λ0 h\ h2 A3. e 0,1,2,3 ’轉換可由之轉換變為之轉換 τυ «ί
G 利用<0,0)(方程式3)與《5(0,1)(方程式4)之行重疊且利用 小,〇)(方程式5)與s(l,l)(方程式6)之行重疊。可重新使用 $'(〇,〇)之第一遍中間結果(亦即,與行相關聯之結果)以避免 對β(〇,1)之第一遍中間結果(亦即,與行相關聯之結果)的ί 複計算。類似地,可重新使用5Χ1,0)之第一遍中間結果 即’與行相關聯之結果)以避免對y(U)之第一遍中間結岸 (亦即’與行相關聯之結果)的重複計算.下文中更詳細深 釋了對中間結果之此重新使用(亦稱作共用)。 為說明重新使用(例如’共用)概念,作為實例考慮可廉 經二維轉換之<〇,〇)計算為: 134564.doc •20- 200926830 Ί 1 1 1 乂 (〇,〇)_ 〜(〇,〇) 2 1 -1 — 2 心(〇,〇) 1 -1 -1 1 _〜(〇,〇) •1 - 2 2 —1 v e 0,1,2,3 (15) X(〇,〇)- '1 1 1 1 乂。(〇,〇)_ ^,(0,0) 2 1 -1 -2 八_ 心(〇,〇) 1 -1-1 1 s\2 (〇,〇) Λ3 (〇,〇)_ 1 —2 2 — 1 h e 0,1,2,3 此外’可將5(0,1)計算為: (16) ❹ (0,1) 1 1 1 1 乂 (0,1)_ (0,1) 2 1 -1 -2 〜(〇,i) 〜⑽ 1 -1 -1 1 〜(〇,i) (0,1). 1 -2 2 -1_ ^ο(θ,ΐ)' •1 1 1 1 _ 乂 0(0,1)_ shlm) 2 1 -1 -2 A, (0,1) sh2m 1 一 1 -1 1 s\2 (0,1) sh3m_ 1 -2 2 -1 (0,1)_ v g 0,1,2,3 h e 0,1,2,3 (17) (18) 根據方程式(3)及(4)可注意到: ^)(0,0) = ^-,)(04) v g 0,1,2,3 η € 1,2,3
(19) 因此,得出: s'V⑷(〇,〇) = 丨)(0,1) V e 0,1,2,3 « e 1,2,3 (20) 此意謂,對於《 e 1,2,3,可重新使用與β(〇,〇)相關聯之第 一遍中間結果來計算與S'(0,1)相關聯之第一遍中間結果。 可注意到,重新使用可消除否則在計算β(0,1)時所需要之 八個1-D行轉換中的三者。因此,在第一遍期間可達成1 d 轉換之高達37·5個百分比的節省。應指出,价π # 1 小藉由使 s(0,0)之列與s(l,0)之列重疊來處理視頻區塊,—> & & ’在該情形 134564.doc -21 - 200926830 :可在第—遍時對列施加Μ列轉a,之後對第-遍所 得到之行進行行轉換之第二遍。換言之可不考慮水 平轉換與垂直轉換之次序來應用本發明之技術。 大體而a,為在NxM搜尋空間中搜尋4χ4區塊之最佳匹 配,總共存在(N_3)x(M_3)個搜尋點。其中Ν表示水平方向 上之〜像素汁數且Μ表示垂直方向上之總像素計數。為了 • 德能夠針對即時視頻編碼及時完成搜尋最佳匹配之任 務,可設計並同時執行多個1D引擎。假設並行使用 ® 「尸1」個水平引擎單元以加速搜尋,且若經 垂直轉換之資料被有效率地共用,則僅需要「A:+l」個垂 直引擎單元。其中k=(j+3)/4之整數。在設計視頻編碼架構 時’功率消耗及矽面積為轉換引擎效能之重要折衷因素。 圖5為說明可使用本文所述之計算重新使用技術以用於 轉換以及管線輸送技術之架構的方塊圖。可使用圖5所示 之架構實例來實現FTE 52B。此處,使用四個水平引擎 (j=3),且因此為具有在此設計架構中共用之有效率資料, ® 可使用兩個垂直引擎(k=2)。如圖5所示,FTE 60包括隨機 存取記憶體(RAM)62、兩個垂直引擎(VE(O) 64A及VE(1) • 64B)、兩個轉置記憶體ΤΜ 65A及TM 65B以及四個水平引 擎(HE(O) 66A、HE(1) 66B、HE(2) 66C及 HE(3) 66D) » FTE 60可在垂直及水平方向上實施4乘4正向轉換。通 常’首先執行垂直轉換還是水平轉換無關緊要。換言之, 可在其他實施中交換轉換序列(垂直及水平)。因此,在其 他實施中,可在垂直轉換之前執行水平轉換。在圖5中, 134564.doc 22- 200926830 垂直轉換為第一轉換操作,隨後為水平轉換。 ❹ 如圖5所示,架構利用四個水平引擎66八_66]3及兩個垂 直引擎及64B。RAM 62可含有供應至垂直引擎64八及 64B之搜尋空間像素。垂直引擎MA及64b連接至轉置記憶 體65A及65B,且轉置記憶體65A及65B向水平引擎66A_ 66D供應資料。可以1D脈動陣列之形式對水平引擎 66D進行組態。在下文更詳細描述之—些實例中,可基於 4x4轉換來設計水平$|擎及垂直引擎。然而,轉換大小可 為任意大小(例如,NxN),且不同大小之轉換可改變硬體 引擎設計,但仍實現與重新使用中間計算相關聯的優勢。 如上文中所;主意’本文中描述之技術可能能夠在所執行 之1D轉換的數目方面達成高達37.5個百分比之縮減。缺 所示之架構可達成僅25個百分比之縮減。隨著水 曾:數目增加,由於可發生更多共用,因此可改良計 算縮減置。為維持+ k i 2丨放 十Ο個水千引擎,可能需要五個垂直引 擎**在此情形中,外直@θ Μ $ ㈣。大體而▲算縮減"可變為 口 ,對於N個水平引擎,·可能需要 l+CeilUN-OM)個垂直引墼r v、二 犯為要 擎 〇向正無窮㈣捨入。可 藉由下式給出計算縮減之通用式: ^[(垂直引擎之數目+水平引擎之數目), (水平引擎之數目+水平引擎之數目)] 圖6為說明可根據 詳言之,圖6用曲線表 叶算節省的曲線圖。 上)而達成之計算節省^ 的數目(X轴 u的百分比(y轴上)。大體而言,搜尋 134564.doc -23· 200926830 點之數目可等於水平引擎之數目(假設首先執行垂直轉 換且接著為水平轉換如—實例,16個水平引擎應覆 蓋16個搜尋點。因此,在圖6之X軸上的值16處,此對應於 曲線圖上之34.4%節省。 圖7為說明作為可並行搜尋之搜尋點》目之魏的轉換 引擎之數目的曲線圖。圖7用曲線表示針對可並行搜尋之 • 搜尋點之不同數目(x轴上)的水平引擎之數目(y軸上)、垂 直引擎之數目(y軸上)及水平引擎與垂直引擎之組合數目(y ❹ 轴上)〇 又,可在FTE中使用多個水平引擎以改良轉換輸送量及 資料共用。為確保FTE引擎可在相對較小之區域内促進有 效率資料共用及低功率消耗,可以不同方式設計FTE之垂 直引擎與水平引擎。詳言之,為節省時鐘功率,藉由以像 素時鐘率之二分之一或四分之一進行計時來設計引擎中之 大多數資料暫存器。表丨、表2及表3(以下)說明可使用之計 時機制。 ® 圖8說明例示性垂直轉換引擎80(亦稱作垂直引擎)。垂 直引擎80包括各種暫存器R0(81A)、R1(81B)、p()(8ie)、 PU81D)、P2(81E)及 Rf(81F);多工器 82A、82B、82C、 82D、82E及82F;及加法器85A及85B。垂直引擎80直接自 RAM 62處接收像素資料(圖5)。可用垂直引擎肋來實施技 術’其中垂直引擎80對輸入像素資料重新定序、重新配置 内部資料路徑且將所廣播之像素輸入資料鎖存至指定之暫 存器。 134564.doc -24· 200926830 表1展不針對搜尋點s(00)及搜尋點s(i〇)之部分(其在時 鐘週期十六處開始其轉換)的垂直弓I擎8〇之例示性資料流 及時序j詳言之,給定連續時鐘週期上之輸入(I/P),表1 展不此等不同暫存器之内容。輸出(Ο/P)可對應於暫存器 Rf(81F)之内容。又,可使用「被劃分之」時鐘信號,在 凊形中垂直引擎80之等效計時功率在每一時鐘週期處 - 理3個暫存器。 大體而言,對於搜尋點s(i,j),來自RAM 62之像素資料 ® 如下經重新定序 U,),外+3,·/+/),Φ·+1,_/·+/),外+2, ·/ + 0 ’ /e0’l,2,3。在時鐘2η週期處啟用暫存器R〇(8lA)以鎖 存像素資料小,y+/),φ·+1,洲,/e〇123。暫存器ri⑻B) 每兩個時鐘週期鎖存輸入像素資料。在時鐘2n+l週期處啟 用暫存器R0(81A)時鐘以鎖存像素資料…+3, ;+/),外>2, ·/ ) /e〇’l’2’3。對於用以保持中間轉換資料之暫存器p〇 81C ' PI 81D、Ρ2 81Ε,在週期4η+1處啟用p〇(81c)時鐘以 _ 鎖存 φ·,7·+/),巾+3y+/),pi(8iD)在週期 4n + 2 鎖存小, 7·+0 _ 小.+3, _/+/),且 P2(81E)在週期 4n+3鎖存…+1,)+/) + W+2,^/),在週期4n+4處鎖存外+^十/卜外+乙少⑺’此 處η 〇 1 2…,k0,1,2,3。使用暫存器Rf(8lF)來保持最 終轉換結果,且在每一時鐘週期啟用其。對於搜尋點 s(i,j),經垂直轉換之輸出序列為$,(〖·,7.+^), _/+/),6^0+1,7.+/), _5(/+3,)+/),/e〇1,2,3。 134564.doc -25- 200926830表1
時間 I/P 0 s00 1 s00 1 s30 2 s30 2 slO 3 slO 3 s20 4 s20 4 s01 5 sOl 5 s31 6 s31 6 sll 7 sll 7 s21 8 s21 8 s02 9 s02 9 s32 10 s32 10 sl2 11 sl2 11 s22 12 s22 12 s03 垂直引擎VE(0)輸入及輸出時序表 R1 R0 PO PI P2 垂直O/P sOO sOO s30 sOO s00+s30 s30 sOO s00+s30 s30 slO s00+s30 s00-s30 s30 slO s0(Hs30 s00-s30 s20 slO s00+s30 s00-s30 sl(Ks20 s00+s30+sl0+s20 fSOO) s20 slO s00+s30 s00-s30 sl0+s20 s00+s3(H^sl0+s20 (SOO) s20 sOl s00+s30 s00-s30 sl0-s20 s00+s30_sl0-s20 (S'20) s20 sOl s00+s30 s00-s30 sl0-s20 s00+s30-sl0-s20 (S'20) s31 sOl s01+s31 s00-s30 sl0-s20 2s00-2s30+sl0-s20 (S’10) s31 sOl s01+s31 s00-s30 sl0-s20 2s00-2s30+sl0-s20 (S’10) s31 sll s01+s31 s01-s31 sl0-s20 s00-s30-2sl0+2s20 (S,30) s31 sll s01+s31 s01-s31 sl0«s20 s00~s30-2sl0+2s20 (S'30) s21 sll s01+s31 s01-s31 sll+s21 s01+s31+sl l+s21 (SOI) s21 sll s01+s31 s01-s31 sll+s21 s01+s31+sll+s21 (SOI) s21 s02 s01+s31 s01-s31 sll-s21 s01+s31-sll-s21 (S,21) s21 s02 s01+s31 s01-s31 sll-s21 s01+s31-sll-s21 (S,21) s32 s02 s02+s32 s01-s31 sll-s21 2s01-2s31+sll-s21 (S,ll> s32 s02 s02+s32 s01-s31 sll-s21 2s01-2s31+sll-s21 (S'll) s32 sl2 s02+s32 s02-s32 sll-s21 s01-s31-2sll+2s21 (S,31) s32 sl2 s02+s32 s02-s32 sll-s21 s01-s31-2sll+2s21 (S'31) s22 sl2 s02+s32 s02-s32 sl2+s22 s02+s32+sl2+s22 (S,02> s22 sl2 s02+s32 s02-s32 sl2+s22 s02+s32+sl2+s22 (Sf02) 134564.doc •26· 200926830 ❹ ❿ 13 s03 13 s33 14 s33 14 sl3 15 sl3 15 s23 16 s23 16 slO 17 slO 17 s40 18 s40 18 s20 19 s20 19 s30 20 s30 20 sll 21 sll 21 s41 s22 s03 s02+s32 s02-s32 sl2-s22 s02+s32_sl2-s22 (S,22) s22 s03 s02+s32 s02-s32 sl2-s22 s02+s32-sl2-s22 (S'22) s33 s03 s03+s33 s02-s32 sl2-s22 2s02-2s32+sl2-s22 (S'12) s33 s03 s03+s33 s02-s32 sl2-s22 2s02-2s32+sl2-s22 (Sf12) s33 sl3 s03+s33 s03-s33 sl2-s22 s02-s32-2sl2+2s22 (S’32) s33 sl3 s03+s33 s03-s33 sl2-s22 s02-s32-2sl2+2s22 (S'32) s23 sl3 s03+s33 s03-s33 sl3+s23 s03+s33+sl3+s23 (S,03) s23 sl3 s03+s33 s03-s33 sl3+s23 s03+s33+s 13+s23 (Sf03) s23 slO s03+s33 s03-s33 sl3-s23 s03+s33-sl3_s23 (S,23) s23 slO s03+s33 s03-s33 sl3-s23 s03+s33-sl3_s23 (S,23) s40 slO sl0+s40 s03-s33 sl3_s23 2s03-2s33+sl3-s23 (S,13) s40 slO sl0+s40 s03-s33 sl3_s23 2s03-2s33+sl3-s23 (S,13) s40 s20 sl0+s40 sl0,s40 sl3-s23 s03-s33-2sl3+2s23 (Sf33) $40 s20 sl0+s40 sl0-s40 sl3-s23 s03-s33-2sl3+2s23 (S’33) s30 s20 sl0+s40 sl0-s40 s20+s30 sl0+s40+s20+s30 (S'10) s30 s20 sl0+s40 sl0-s40 s20+s30 sl0+s40+s20+s30 (S’10) s30 sll sl0+s40 sl0-s40 s20-s30 sl0+s40-s20-s30 (S^O) s30 sll sl0+s40 sl0_s40 s20-s30 sl0+s40-s20-s30 (S,30) 在表1中,第四行中所說明之方波表示系統時鐘。垂直 引擎80中之所有資料可在此系統時鐘之上升邊緣處被暫 存。 為使水平引擎可有效率地共用經垂直轉換之資料,其須 以順序次序取用4x4垂直轉換之資料,存在少數不同次序 以使有效率資料共用起作用,此處所示之實例僅為其中一 -27- 134564.doc 200926830 者。為最小化功率消耗,期望水平引擎立即消耗經垂直轉 換之資料。轉置暫存器TM 65A、65B經設計以臨時儲存並 改組經垂直轉換之資料。圖12描繪垂直及水平引擎之輸入 及輸出序列。圖13描繪對水平引擎之經垂直轉換之資料重 新定序所需的最小TM暫存器。 - 為了水平引擎(諸如圖5之引擎66A-66D)中之有效率處 - 理需要最小化對記憶體之存取。此外,需要在棄用所有 被存取之資料之前對其進行處理。為有效率地適應此等目 鲁 標’可使用兩種不同類型之水平引擎ΗΕ(0) 90及HE⑴ 100。1^(0)90可對應於水平引擎66八(圖5),且1^〇)1〇〇 可對應於引擎66B-66D中之每一者。 每一水平引擎取用四個資料申,其為資料序列〇、資料 序列1、資料序列2及資料序列3。如下描繪該等序列: 序列 〇 : W,/),外· +1,7 W + 2,力,外 + 3, y·) 序列 1 :外-,_/ + 1),外 + 1,/ + 1),外 + 2,_/ + 1),外 + 3,_/ + 1) 序列 2 : ^,) + 2),5^ + 1,/ + 2),5^ + 2,/ + 2)^(/ + 3,) + 2) ® 序列 3 : W,y + 3),*S’〇,+ lJ + 3),W + 2,y + 3),^ + 3J + 3) 表示經垂直轉換之像素資料。對於水平引擎HE(0), 所有四個序列資料均自垂直引擎VE(0)輸入。 對於水平引擎HE(1) 100,其序列〇及序列1輸入資料係 來自ΗΕ(0) 90之暫存器91B及91C資料,序列2資料係來自 ΗΕ(0) 90之92H的共用資料輸出,且HE(1) 100之序列3資 料係直接來自垂直引擎VE(1) 80。 對於水平引擎HE(2) 100,其序列0資料輸入係來自 134564.doc • 28· 200926830 ΗΕ(0) 90之暫存器91C,序列丨資料係來自HE(〇)之92H的共 用資料輸出,序列2資料係來自HE(1) 1〇〇之共用資料輸出 92H,且HE(2)之序列3資料係直接來自垂直弓丨擎 80 〇 對於水平引擎ΗΕ(υ l00(其中其輸入資料序列〇、 ' 序列1及序列2分別使用其相鄰水平引擎HEG-3)、HE(j-2) 及HE(j-l)之共用資料輸出多工器1〇2H。HE⑴之序列3資料 始終直接來自垂直引擎VE(k)輸出。其中k=(j+3)/4之整 ❹ 數。 以下表2及表3展示水平引擎HE(〇) 9〇&HE(1) 1〇〇之輸 入、輸出及内部控制時序。注意,每四個時鐘週期僅啟用 一次 R0(91A)、R1(91B)、R2(91C)、R3(91D)及 R〇(l〇lA), 且中間暫存器P〇(91E,ΐοΐΒ)、p1(91f,ΐ(π〇每兩個時鐘 週期鎖存資料。 圖9說明例示性水平轉換引擎ηε(0) 90(亦稱作水平引擎 ΗΕ(0))。圖10說明一例示性水平轉換引擎HE(j) 10〇。圖9 之水平引擎90包括標記為R〇(9l A)、R1(91B)、R2(91C)、 R3(91D)、P0(91E)、P1(91F)及 Rf(91G)之各種暫存器;多 工器 92A、92B、92C、92D、92E、92F、92G、92H ;及加 法器95A及95B。圖10之水平引擎10〇包括標記為 R0(101A)、Ρ0(101Β)、Ρ1(1〇1〇 及 Rf(l〇lD)之各種暫存 器;多工器 102A ' 102B、102C、102D、102E、102F、 102G、102H及1021 ;及加法器ι〇5Α及105B。應注意,圖 8、圖9及圖10所示之暫存器在每一各別引擎中可包含實體 134564.doc 29- 200926830 結構,但儲存結構可能相互類似。換言之,例如,圖8之 暫存器RO(81A)與圖9之暫存器R〇(91A)相異。 水平引擎ΗΕ(0) 90可經設計以轉換第一4乘4像素行區塊 (來自ΝχΜ大小之搜尋區域的搜尋點s(〇,〇)、s(1〇>、...、 s(M-3,0))。相比之下,可重複使用水平引擎HE(j) 1〇〇(圖 • 所示)來轉換行區塊中之剩餘者(搜尋點s(〇j)、 • sG’j)、…、s(M_3,j),(1句;圖 9之水平引擎 HE(0) 90可對應於圖5之ΗΕ(0) 66A,且圖9之水平引擎HE⑴1 00 © 可對應於圖5之ΗΕ(1) 66Β、HE(2) 66C及HE(3) 66D中的每 一者。 水平引擎ΗΕ(0) 90將來自垂直引擎VE(0)(圖5)之所廣播 之順序像素資料鎖存至四個四分之一像素計時資料暫存器 R〇(91A)、R1(91B)、R2(91C)及 R3(91D)中,執行中間轉換 功能,且接著將結果儲存在暫存器P0(01E)&P1(91F)中。 暫存器P0(01E)及P1(91F)儲存資料以用於第二蝶形操作, 且將結果傳遞至最終暫存器Rf(91 g)。 鎖存在水平引擎90之暫存器r〇(91A)、R1(91B)、 R2(91C)及R3(91D)中的資料可被接著之三個水平引擎 . HE(1)、HE(2)、HE(3)(見 66B-66D 或圖 5)共用。大體而 言’對於每一水平引擎HEC0 1〇〇(其中户!、2或3),輸入資 料來自對ΗΕ(0)輸出、VE(1)輸出及「先前」HE〇.)引擎進 行多工。 表2展示時序以及如何在水平引擎ηε(〇)·ηε(3)之間共用 資料。詳言之,表2展示對搜尋點s(〇,〇)、s(1,〇)、 134564.doc -30- 200926830 s(2,0)、…等起作用之水平引擎hE(0) 66A的時序資訊。在 週期〇處開始之像素資料S,00係與搜尋點s(〇,〇)相關聯之4乘 4區塊的第一像素。在週期16處開始之資料s,1〇係指搜尋 點s(l,0)之4乘4區塊的第一像素,等等。藉由將類似之時 序關係應用於表2所呈現之搜尋點,表2可輕易地延伸至結 束搜尋點s ( Μ - 3,0 )。 表2
水平弓 擎HE(C 時間 VP 0 s,oo 1 s,oo 1 S,01 2 S'01 2 S,02 3 S'02 3 S,03 4 S,03 4 S'10 5 S,10 5 S,ll 6 S,ll 6 S,12 7 S,12 7 S'13 8 S,13 8 S,20 9 S,20 9 S,21 Η£0 R0 R1 R2 R3 PI P0 水平引擎O/P S'OO S'OO S'OO S'01 S'OO s-oi S’OO S,01 S,02 S’01+S,02 S'OO S,01 S,02 SO1+SO2 S’OO SOI S,02 S,03 S,01+S,02 S'OO+S'03 8Ό0+8'30+8Ί0+ S,20 (S00) S'OO S'01 S,02 S,03 SOl+S'02 S,0(HS,03 S,00+S,30+S,10+ S,20 (SOO) S'10 S,01 S'02 S’03 S'OO-S'03 S'OO+S'03 S,00+S,30-S,10-Sv20 (S02) S'10 S'01 S'02 S'03 S'OO-S'03 S,0OfS,03 SOO+S'SO-S'IO-S'20 (S02) S'10 S,ll S'02 S,03 S'OO-S'03 S'Ol-S'02 2S,00-2S,30+S,10· S'20 (SOI) S'10 S,ll S,02 S'03 S'OO-S'03 S'Ol-S'02 2S*00>2S*30+S*10· S'20 (SOI) Sf10 S’ll S'12 S,03 S'll+S'12 S?01-Sf02 S’00-S,30>2S,10+ 2S’20 (S03) S,10 S,ll S,12 S,03 S,ll+S,12 S'Ol-S'02 S,00-S,30-2S'10+ 2S'20 (S03) S'10 S’ll S'12 S,13 S'll+S'12 S,10+S.13 S'10+S’13+S,ll+ S'12 (S10) S'10 S’ll S’12 S,13 S'll+S'12 S'10+S'13 S'lO+S'lS+S'lH· S'12 (S10) S'20 S,ll S,12 S,13 S'IO-S'13 S'IO+S’13 S,10+S,13-S,ll- S,12(S12) S,20 S’ll S’12 Sf13 S,10-S’13 S'IO+S'13 S,10+S,13-S,ll-S,12 (S12) -31- 134564.doc 200926830
10 S,21 10 S,22 11 S,22 11 S,23 12 S,23 12 S'30 13 S,30 13 S'31 14 S,31 14 S,32 15 S,32 15 S'33 16 S,33 16 S,10 17 Sf10 17 S,ll 18 S'll 18 S,12 19 S,12 19 S’13 20 S,13 20 S,20 21 S,20 21 S,21 S,20 S,21 S,12 S’13 S'IO-S'13 S,ll-S,12 2S,10-2S,13+Sfll- S’12(S11) S'20 S,21 Sf12 S,13 S,10_S,13 S’ll-S,12 2S,10-2S,13+S,11· S,12 (Sll) Sf20 S,21 S’22 S’13 S,21+S,22 S,ll-S,12 S’10-S,13-2S,11+ 2S,12(S13) S,20 S’21 Sf22 S,13 S,21+S,22 S,ll-S,12 S10-S13-2S’11+ 2S,12 (S13) S,20 S,21 S’22 S'23 Sf21+Sf22 S’20+S,23 8^0+873+8^1+ S,22 (S20) S,20 S’21 S,22 S,23 S'21+S'22 S'20+S'23 S,20+Sf23 十 S21+ S’22 (S20) S,30 S,21 S,22 S,23 S'20-S'23 S?20+Sf23 S20+S’23-S’31_ Sf32 (S22) S*30 S,21 S,22 S,23 S,20-S,23 S’20+S,23 s^o+s^a-s'si- S,32 (S22) S'30 S’31 S,22 S,23 S'20-S'23 S,21-S,22 2S,20-2S,23+S,21-Sf22 (S21) S'30 S’31 S,22 Sf23 S,20-S,23 S,21-S,22 2S,20-2S,23+S,21-S’22 (S21) S'30 S,31 S’32 S'23 S’31+S,32 S'21-S'22 S’20-S,23-2S,21+ 2S,22 (S23) S’30 S’31 S,32 S'23 S'31+S'32 S?20-S'23-2S?2I+ 2S,22 (S23) S,30 S,31 S,32 S,33 S,31+Sf32 S(30+Sf33 S*30+S,33+S’31+ Sf32 (S30) S’30 S’31 S’32 Sf33 S,31+S,32 S,30+S,33 S*30+S33+S31+ S’32 (S30) S'lO S'31 Sf32 S,33 S,30-S,33 ^30+^33 ^30+^33-^31-S,32 (S32) S,10 S,31 S'32 S,33 S,30-S,33 S?30+Sf33 S30+Sf33-S31-S,32 (S32) S'lO S,ll S'32 S,33 S,30-S,33 S,31-S,32 2S,30_2S,33+S,31-S'32 (S31) S'lO S,ll S'32 S'33 S,30-S’33 S'31-S'32 2S'30-2S'33+S'31-S,32 (S31) S’lO S’ll S,12 S,33 S,ll+S,12 S,31-S’32 S30-S’33-2S31+ 2S’32 (S33) S'lO S'll S’12 S,33 S’ll+S’12 S,31-S’32 S30-S33-2S31+ 2S'32 (S33) S'lO s-ll Sf12 S,13 S,ll+S,12 S,10+S'13 S,10+S,13+S,ll+ S’12 (S10) s-io S’ll S,12 S’13 S’ll+S,12 Sf10+S,13 S10+S13+S11+ S’12 (S10) S,20 S’ll S’12 S'13 Sf10-S,13 S,10+S,13 S,10+S’13-S,ll-S’12 (S12) S,20 S’ll S-12 S,13 S,10-S,13 S,10+S,13 S,10+S,13-S,ll· S’12 (S12) 134564.doc -32- 200926830 22 S,21 22 S,22 23 S,22 23 S'23 S,20 S,21 S,12 S,13 S,10-S,13 S,ll-S,12 2S,10-2S*13+S,11_ S,12 iSll) S,20 S'21 S,12 S,13 S,10"S,13 S,ll-S,12 2840-2843+8^1-S'12 (Sll) S,20 S,21 S'22 S'13 S’21+S*22 S'H-S'12 S,10-S'13-2S,11+ 2S'12 (S13) S,20 S,21 S,22 S,13 S,21+S,22 S'll-S,12 S,10-S,13-2S,11+ 2S'12 CS13) 表3顯示搜尋點s(0,l)之4x4匹配區域之HE(1)引擎的16像 素時序及自週期十七開始之搜尋點s(l,l)之像素時序的部 分。表3中之資料序列0、序列1及序列3為來自水平引擎 HE(0)之Rl、R2及R3暫存器值的複本,其在水平引擎 ❹ HEOhHEp)之間共用。表3中列出暫存器值以說明ηε(0) 與HE(1)之間的時序關係及資料流。顯著地,藉由使用 「被劃分之」像素時鐘頻率,可藉由使用更多暫存器而達 成等效之計時功率。舉例而言,HE(1)可在一設計中具有 a十時功率等效於2.25個暫存器的四個實體暫存器,且 ΗΕ(0)可具有計時功率等效於三個暫存器的七個暫存器。 表3 水平弓 時間 I/P 0 _1 1 SOI 2 S'01 2 S,02 3 S,02 3 S,03 4 S,03 4 S,04 5 S,04 5 S,ll 6 S,ll 擎HE(1)輸出時床矣 序列0 序列1 序列2 R0 PI P0 水平引擎O/P S'01 S'01 S'01 S,02 S'01 S,02 SOI S,02 S'03 S,02+S,03 S'01 S,02 S,03 SO2+SO3 SOI S,02 S'03 Sv04 S,02+S,03 S,01+S,04 S,01+S'04+S,02+ S'03 (SOI) S'01 S,02 S,03 S,04 S,02+S,03 S,01+S,04 S,01+S,04+S,02+ S'03 (SOI) S,ll S,02 S,03 S’04 SOl-S'04 SO1+SO4 S,01+S,04-S,02-S'03 (S03) 134564.doc -33- 200926830 6 S’12 7 Sf12 7 S'13 8 S’13 8 S,14 9 S,14 9 S,21 10 S,21 10 S’22 11 S,22 11 S,23 12 S,23 12 S’24 13 S,24 13 S,31 14 S'31 14 S,32 15 S’32 15 S,33 16 S,33 16 S,34 17 S,34 17 S’ll 18 S,ll S’ll S,02 S'03 S,04 Sf01-Sf04 S’01+S,04 S*01+SW4-SW2-S,03 (S03) S,ll S,12 S,03 S,04 S'Ol-S'04 SO2-SO3 2S,01- 2S,04+S,02-S,03 (S02) S,ll S,12 S'03 S’04 S'01-S?04 SO2-SO3 2SO1-2SO4+ SO2-SO3 (S02) S’ll S,12 S’13 Sf04 S!12+S43 SO2-SO3 ^01-^04-2^02+ 2S,03 (S04) Sfll S,12 S,13 S’04 S'12+S'13 SO2-SO3 8^1^^4-28^2+ 2S,03 (S04) S’ll S,12 S,13 S,14 S,12+S’13 S'll+S'14 S,ll+S14十 S’12+ S,13(S11) S,ll S,12 S,13 S'14 S,12 十 S,13 S,ll+S,14 S’ll+S’M+S’m S,13(S11) S,21 Sf12 S,13 ST14 S,ll-S,14 S,ll+S,14 S,ll+S,14-S'12-S'13 (S13) S?21 Sf12 S,13 S,14 S,ll-S,14 S’ll+S,14 S^ll+S^^S'n- S,13(S13) Sf21 S,22 Sf13 S,14 S,11_S,14 S'12-S,13 2S,11-2S,14+ Sf12-Sf13 (S12) S,21 S,22 S-13 S,14 S,ll-S,14 S,12-S,13 2Sfll-2S,14+ S,12-S,13(S12) Sf21 S’22 S,23 S,14 S*22+S13 S'12-S'13 S,11-S,14-2S’12+ 2S,13 (S14) Sf21 S,22 S!23 S,14 S,22十 S’23 S'12-S’13 ^11^14-2^12+ 2S’13 (S14) S,21 Sf22 S,23 Sf24 S,22+Sf23 S’21+S’24 S?21+S!24+Sf22+ Sf23 (S21) Sf21 S’22 S’23 S’24 Sf22+S?23 S,21+S,24 S,21+S’24+S,22+ S,23 (S21) S,31 S’22 S,23 S,24 S,21-S,24 S’21+S,24 SIl+SW-SM· S,23 (S23) S,31 S’22 S,23 S,24 S,21-S’24 S21+S24 S,21+S,24-S,22· S,23 (S23) S’31 S,32 Sf23 S,24 Sf21-S!24 S'22-S'23 2S'21-2S'24+ S,22-S,23 (S22) S'31 S,32 S'23 S’24 S,21-S,24 S,22-S,23 2S,21-2S,24+ S,22-S,23 (S22) S,31 S'32 S,33 S,24 Sf32+Sf33 Sf22-S'23 S'21-S'24-2S'22+ 2S'23 (S24) Sf31 S,32 S,33 S’24 Sf32+S'33 S,22-S,23 S’21-S’24-2S,22+ 2S,23 (S24) S,31 S,32 S,33 S,34 S,32+Sf33 S,31+S’34 S,31+S,34+S-32+ S,33 (S31) S’31 S,32 S,33 S,34 S32+S33 S’31+S,34 Sf31+S-34+S,32+ S’33 (S31) S,ll S,32 S’33 S,34 S,31-S,34 S,31+S,34 S*31+S’34-S32· S’33 (S33) 134564.doc -34· 200926830 18 S,12 S,ll S,32 S,33 S,34 S'31-S'34 S31+S34 S’31+S*34-S*32-S'33 (S33) 19 S,12 S,ll S,12 S,33 S'34 S,31-S,34 S,32-S'33 2S’31-2S,34+ Sf32-Sf33 (S32) 19 S,13 S,ll S,12 S'33 S'34 S,31-S,34 S,32-S,33 2Sf31-2Sf34+ Sf32-Sf33 (S32) — L 20 S,13 S'll S,12 S,13 S’34 S,12+S,13 S'32-S'33 S’31-S’34-2S32+ 2S,33 (S34) 20 S,14 S,ll S,12 S,13 S,34 S,12+S,13 S'32-S'33 S,31-S,34>2S,32+ 2S,33 (S34) 21 S,14 S'll S'12 S,13 S,14 S,12+S,13 S'll+S'14 S,ll+S,14+S,12+ S,13 (Sll) 21 S,21 S'll S,12 S,13 S,14 S,12+S'13 S,ll+S,14 S,ll+S,14+S,12+ S'13 (Sll) 22 S,21 S,21 S,12 S-13 S,14 S'll-S'14 S'll+S'14 S,ll+S,14-S,12-S,13 (S13) 22 S,22 S,21 S,12 S,13 Sf14 S'll-S'14 S'll+S'14 S,ll+S,14-S,12-S,13 (S13) 23 S,22 S'21 S,22 S,13 S,14 S,ll-S,14 S,12-S,13 2S,11-2S,14+ S,12-S,13 (S12> 23 S,23 S,21 S,22 S,13 S,14 S,ll-S,14 S,12-S,13 2S,11-2S,14+ S'12-S'13 CS12) 表 4展示 VE(0)、VE(1)、ΗΕ(0)、HE(1)、HE(2)及 HE(3) 之間的例示性時序關係。詳言之,表4說明垂直引擎VE(k) 與水平弓丨擎HE(j)(k=〇、1。j=〇、1、2、3)之間的輸入時序 關係及如何在水平引擎HE⑴之間共用經垂直轉換之資 料。表4僅提供搜尋點Ml乃之時序資訊,其中卜〇、1、 “、4,j = 〇、1、…、3。可輕易地針對所有……搜尋 點開發出類似之時序圖案,其中i=〇、1、2.....M_3 ; j=0、1.....N-3 〇 表4
134564.doc •35- 200926830
ουΠ,Ο) SO(0,4) SO(1,0) SO(0,4) SO(0,4) SO(0,4) 5 SO(1,1) S'0(0,5) SO(1,1) S'〇(l,l) SO(0,5) SO(0,5) 6 SO(1,2) SO(0,6) SO(1,2) S'0(l,2) S,0(l,2) SO(0,6) 7 S,0(l,3) SO(0,7) SO(1,3) SO(1,3) S,0(l,3) S'0(l,3) 8 SO(2,0) SO(1,4) S_0(2,0) SO(1,4) SO(1,4) SO(1,4) 9 SO(2,1) SO(1,5) SO(2,1) SO(2,1) SO(1,5) S’0(l,5) 10 SO(2,2) SO(1,6) SO(2,2) SO(2,2) S,0(2,2) SO(1,6) 11 S,0(2,3) SO(1,7) SO(2,3) S,0(2,3) SO(2,3) S'0(2,3) 12 SO(3,0) S,0(2,4) SO(3,0) SO(2,4) SO(2,4) S'0(2,4) 13 S,0(3,l) S,0(2,5) SO(3,1) SO(3,1) S'0(2,5) S'0(2,5) 14 S'0(3,2) SO(2,6) SO(3,2) S,0(3,2) SO(3,2) SO(2,6) 15 S'0(3,3) S,0(2,7) S,0(3,3) SO(3,3) SO(3,3) S'0(3,3) 16 S'l(l,〇) SO(3,4) S,1(1,0) S'0(3,4) S,0(3,4) S'0(3,4) 17 S'l(U) S,0(3,5) S,l(l,l) S,l(l,l) SO(3,5) SO(3,5) 18 S,l(l,2) SO(3,6) S 丨 1(1,2) S'l(l,2) S'l(l,2) SO(3,6) 19 S'l(l,3) SO(3,7) S'10,3) S'ia,3) S'10,3) S'U1,3) 20 S'1(2,0) S'l(l,4) S’1(2,0) S,l(l,4) S'l(l,4) S 丨 1(M) 21 S'l(2,l) S'l(l,5) S'K2,1) S’l(2,l) S'10,5) S'l(l,5) 22 S'1(2,2) S'l(l,6) S'1(2,2) S'l(2,2) S'1(2,2) 8-1(1,6) 23 S'l(2,3) S,l(l,7) S'l(2,3) S,l(2,3) S'1(2,3) S'1(2,3) 24 S'1(3,0) S,l(2,4) S'1(3,0) S'1(2,4) S,l(2,4) S'1(2,4) 25 S'l(3,l) S'1(2,5) S'l(3,l) S,l(3,l) S,l(2,5) S,l(2,5) 26 S'1(3,2) S,l(2,6) S'1(3,2) S'l(3,2) S’l(3,2) S'l(2,6) 27 S'l(3,3) S'l(2,7) S'l(3,3) S,l(3,3) S,l(3,3) S'l(3,3) 28 S'1(4,0) S’l(3,4) S'1(4,0) S'l(3,4) S'l(3,4) S'l(3,4) 29 S'l(4,l) S,U3,5) S,l(4,l) S'l(4,l) S'l(3,5) S'l(3,5) 30 S'U4,2) S'1(3,6) S'l(4,2) S'l(4,2) S'l(4,2) S'l(3,6) 31 S'l(4,3) S'l(3,7) S,l(4,3) S'l(4,3) S'l(4,3) S'l(4,3) 32 S'2(2,0) S'l(4,4) S'2(2,0) S,l(4,4) S'1(4,4) S'l(4,4) 33 S'2(2,l) S'l(4,5) S'2(2,l) S'2(2,l) S'l(4,5) S'l(4,5) 34 S'2(2,2) S'l(4,6) S'2(2,2) S'2(2,2) S'2(2,2) S,l(4,6) 35 S'2(2,3) S'l(4,7) S'2(2,3) S,2(2,3) S'2(2,3) S'2(2,3) 36 S'2(3,0) S'2(2,4) S'2(3,0) S'2(2,4) S'2(2,4) S'2(2,4) 37 S'2(3,l) S'2(2,5) S'2(3,l) smi) S'2(2,5) S'2(2,5) 38 S'2(3,2) S'2(2,6) S'2(3,2) S'2(3,2) S'2(3,2) S'2(2,6) 39 S'2(3,3) S'2(2,7) S'2(3,3) S'2(3,3) S'2(3,3) S'2(3,3) 40 S'2(4,0) S'2(3,4) S'2(4,0) S'2(3,4) S'2(3,4) S'2(3,4) 41 S'2(4,l) S'2(3,5) S'2(4,l) S'2(4,l) S'2(3,5) S'2(3,5) 42 S'2(4,2) S'2(3,6) S'2(4,2) S’2(4,2) S'2(4,2) S'2(3,6) 43 S,2(4,3) S'2(3,7) S'2(4,3) S'2(4,3) S'2(4,3) S'2(4,3) 44 S'2(5,0) S'2(4,4) S'2(5,0) S'2(4,4) S'2(4,4) S'2(4,4) 45 S'2(5,l) S'2(4s5) S'2(5,l) S'2(5,l) S'2(4,5) S'2C4,5) 46 S'2(5,2) S'2(4,6) S'2(5,2) S'2(5,2) S,2(5,2) S 丨 2(4,6) 47 S,2(5,3) S'2(4,7) S'2(5,3) S'2(5,3) S,2(5,3) S,2(5,3) 48 S'3(3,0) S,2(5,4) S,3(3,0) S'2(5,4) S'2(5,4) S’2(5,4) 49 S'3(3,l) S'2(5,5) S'3(3,l) S'3(3,l) S,2(5,5) S'2(5,5) 50 S'3(3,2) S'2(5,6) S'3(3,2) S,3(3,2) S'3(3,2) S'2(5,6) 51 S'3(3,3) S'2(5,7) S'3(3,3) S'3(3,3) S,3(3,3) S'3(3,3) 52 S'3(4,0) S'3(3,4) S'3(4,0) S,3(3,4) S'3(3,4) S,3(3,4) 134564.doc • 36· 200926830 以4,1) S'3(3,5) S'3(4,l) S,3(4,l) S'3(3,5) S'3(3,5) 54 S'3(4,2) S'3(3,6) S'3(4,2) S'3(4,2) S'3(4,2) S'3(3,6) 55 S'3(4,3) S'3(3,7) S'3(4,3) S,3(4,3) S'3(4,3) S'3(4,3) 56 S'3(5,0) S'3(4,4) S'3(5,0) S'3(4,4) S,3(4,4) S'3(4,4) 57 S'3(5,l) S'3(4,5) S'3(5,l) S,3(5,l) S'3(4,5) S'3(4,5) 58 S'3(5,2) S'3(4,6) S'3(5,2) S'3(5,2) S'3(5,2) S'3(4,6) 59 S'3(5,3) S'3(4,7) S’3(5,3) S'3(5,3) S'3(5,3) S'3(5,3) 60 S'3(6,0) S'3(5,4) S,3(6,0) S'3(5,4) S,3(5,4) S’3(5,4) 61 S'3(6,l) S'3(5,5) S'3(6,l) S'3(6,l) S'3(5,5) S'3(5,5) 62 S'3(6,2) S'3(5,6) S'3(6,2) S'3(6,2) S'3(6,2) S 丨 3(5,6) 63 S'3(6,3) S'3(5,7) S’3(6,3) S'3(6,3) S'3(6,3) S'3(6,3) 64 S'4(4,0) S'3(6,4) S'4(4,0) S'3(6,4) S'3(6,4) S'3(6,4) 65 S'4(4,l) S'3(6,5) S'4(4,l) S'4(4,l) S'3(6,5) S'3(6,5) 66 S'4(4,2) S'3(6,6) S'4(4,2) S'4(4,2) S'4(4,2) S'3(6,6) 67 S'4(4,3) S'3(6,7) S’4(4,3) S'4(4,3) S'4(4,3) S'4(4,3) 68 S'4(5,0) S'4(4,4) S'4(5,0) S'4(4,4) S’4(4,4) S'4(4,4) 69 S’4(5,l) S,4(4,5) S'4(5,l) S,4(5,l) S,4(4,5) S'4(4,5) 70 S'4(5,2) S'4(4,6) S'4(5,2) S'4(5,2) S'4(5,2) S'4(4,6) 71 S,4(5,3) S’4(4,7) S'4(5,3) S,4(5,3) S,4(5,3) S'4(5,3) 72 S'4(6,0) S'4(5,4) S'4(6,0) S,4(5,4) S,4(5,4) S'4(5,4) 73 S,4(6,l) S'4(5,5) S'4(6,l) S,4(6,l) S,4(5,5) S'4(5,5) 74 S,4(6,2) S'4(5,6) S'4(6,2) S'4(6,2) S'4(6,2) S'4(5,6) 75 S,4(6,3) S'4(5,7) S,4(6,3) S'4(6,3) S'4(6,3) S'4(6,3) 76 S'4(7,0) S'4C6,4) S'4(7,0) S'4(6,4) S'4(6,4) S'4(6,4) 77 S'4(7,l) S'4(6,5) S'4(7,l) S.4(7,l) S'4(6,5) S'4(6,5) 78 S'4(7,2) S'4(6,6) S'4(7,2) S'4(7,2) S'4(7,2) S,4(6,6) 79 S'4(7,3) S'4(6,7) S'4(7,3) S'4(7,3) S'4(7,3) S'4(7,3) FTE轉換架構不僅由引擎來判定,亦由垂直引擎與水平 引擎之間流動的資料來判定。由於該架構可包含像素速率 I 管線式設計,因此引擎之間的任何偏斜資料流均可停止管 ❹ 線。為避免此問題,可在引擎之間使用轉置記憶體65A及 65B以缓衝並考量資料之時序。 * 本發明之技術允許以管線方式關於視頻資料之區塊集合 . 來執行轉換。詳言之,水平引擎與垂直引擎可針對轉換之 至少部分同時操作以使資料經管線輸送通過FTE 60(圖 5)。舉例而言,如圖5所示,可由垂直引擎64A及64B來處 理資料,且可將輸出儲存在轉置記憶體65A及65B中。在 處理與第一視頻區塊相關聯之垂直資料中的所有者之後, 134564.doc -37- 200926830 垂直引擎64Α及64Β便可接著處理與第二視頻區塊相關聯 之垂直資料(在適當時重新使用中間結果)。轉置記憶體 65Α及65Β允許在需要時對垂直引擎64Α及64Β之輸出進行 儲存,之後該資料可能藉由水平引擎66A-66D中之一者處 理。以此方式,資料經管線輸送通過FTE 60。 大體而言,垂直引擎64Α或64Β中之一者之資料產生與 水平引擎66A-66D中之一者之消耗之間的時序偏斜之最大 Ο
量界疋所需轉置s己憶體(ΤΜ)的最小量。為在轉化之間具有 最小ΤΜ,通常建議: 1.最小化饋送器引擎(產生器)與接受器(消耗)引擎之間 的資料時序偏斜,且 2.儘快消耗所產生之饋送器引擎資料。 建構ΤΜ之一方式係使用隨機存取記憶體(RAM)。基於 RAM之設計的缺點為: 1. Ram之位址大小(等於時序偏斜且小於16個時鐘週期) 為小的,且RAM之形狀在實體設計中可能不會有效 率。顯著地,在兩個4乘4轉換之間,最大時序偏斜 可月b為15個時鐘週期。 社母一 4乘4轉換 — 1^· 鐘週期期間多次讀取及寫人記憶體。此意謂讀須 以像素時料率之兩倍執行,除非使用兩之 ram。 吁 5己憶體測試邏輯抵消 3·對於較小之基於RAM的設計 了其面積優勢。 I34564.doc -38· 200926830 給定此等因素’當矽上之實體實施不遭遇困難時,可考 慮在垂直引擎與水平引擎之間使用ram作為轉置記憶體。 另一 TM設計方法為基於暫存器之設計。可不考慮使用 轉置記憶體還是轉置暫存器而使用相同之管線輸送技術。 圖11說明可如何在搜尋空間中界定輸入區塊。圖12說明垂 直引擎與水平引擎之間的輸入及輸出資料流。以圖12所示 之方式記錄索引以有助於相對於水平引擎輸入資料來重新
排序垂直引擎輸入資料及垂直引擎輸出資料可改良轉換過 程之效率。具有S〇〇、s3〇、sl〇、s2〇.....s〇1.....⑶ 序列中之像素輸入的垂直引擎設計可使用最少之組件。在 此情形中,VE轉換輸出遵照s,00、s,2〇、s,1〇、 S,3°.....S'33格式。可藉由將索引記錄在一陣列中以記 下輸入垂直引擎資料向輸出垂直引擎資料之重新排序而以 純邏輯方式完成此。記錄索引允許將資料儲存在一位置上 :無需更新記憶體,且消除了不必要之寫入操作。一般熟 習此項技術者應亦認識到,亦可完成藉由將資料重新寫入 記憶體來進行重新排序。 為共用輸入資料,期望水平引擎輸入呈順序格式。在此 It形中,可使用管線輸送技術,藉此水平弓I擎與垂直引擎 相對於視頻資料之管線並行起作I對於有效率之管線式 資料處理,只要垂直引擎產生之第一資料可用,水平引擎 便可輸入其。因此,水平輸入可呈s,00、s.01、s,〇2、 S03.....s’33序列格式。將圖12之垂直引擎輸出序列 (ver. Ο/P seq,)與水平引擎輸入序列(H〇r ι/ρ叫)進行比 134564.doc -39- 200926830 較,最大對應差異為13-4=9,其指示在此情形中可能需要 九個轉置(transposition)(轉置(transpose))暫存器。一般熟 習此項技術者將認識到,較大之區塊大小可需要不同數目 之轉置暫存器。該數目係關於資料可用於處理之最早時 間。藉由選擇適當數目之轉置暫存器,可以有效率之方式 來支援管線輸送使得避免額外暫存器。在此情形中,九個 . 轉置暫存器可能足以儲存所有必要資料持續足夠時間以允 許儘可能快地在資料處理管線中使用該資料,而無需額外 φ 或過度量的記憶體或暫存器。 圖13描繪可在垂直引擎與水平引擎之間使用之轉置暫存 器(TR)的數目。圖13之左側上的數字為時標。因此,在此 實例中’垂直引擎在時間T1輸出S,00,其在T2輸出S,20, 且依此類推。圖13中之陰影區域表示垂直引擎(饋送器)輸 出在被水平(受體)引擎消耗之前,其在TR中儲存多久。此 處,水平引擎自時間T1 0開始消耗垂直引擎之輸出,且在 時間T25完成。圖12之右侧上的數字表示每一時標上所需 ® iTR的數目,其等於灰色區域之總量。圖13所估計之總 TR亦為九個。注意,時間13上之像素數目被直接饋入水平 引擎中而無需鎖存至TR中。 已描述若干技術及實例。所描述之技術可在硬體、軟 體、韌體或其任一組合中實施《若實施於軟體中,則本文 中所描述之技術可具體化於一包含指令之電腦可讀媒體 中,該等指令在於錢中執行時執行上文所述之技術中的 -或多者。舉例而言,該等指令在被執行時可引起視頻編 134564.doc •40· 200926830 碼設備對視頻資料之區塊執行轉換,其中執行轉換包括在 視頻資料之第二區塊的第二轉換中重新使用與視頻資料之 第一區塊之第一轉換相關聯的計算。 電腦可讀媒體可包含諸如同步動態隨機存取記憶體 (SDRAM)之隨機存取s己憶體(RAM)、唯讀記憶體、 • 非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯 . 讀記憶體(EEPR〇M)、快閃記憶體、磁性或光學資料儲存 媒體,及其類似媒體。該等指令可由一或多個處理器或其 ⑩ 他機器執行,諸如一或多個數位信號處理器(DSP)、通用 微處理器、一或多個特殊應用積體電路(ASIC)、一或多個 場可程式化邏輯陣列(FPGA)或其他等效之積體或離散邏輯 電路。在一些實施例中,可在經組態以用於編碼及解碼音 訊或多媒體資訊之專用軟體模組或硬體單元中提供本文中 所描述之功能性,或將其併入組合之多媒體編碼器-解碼 器(CODEC)中。 若實施於硬體電路中,則本發明可針對一種經組態以對 視頻資料之區塊執行轉換的電路,其中在執行轉換時,該 電路在視頻資料之第二區塊的第二轉換中重新使用與視頻 .資料之第一區塊之第一轉換相關聯的一或多個計算。舉例 而言,電路可包含一積體電路或形成晶片組之電路集合。 電路可包含ASIC、FPGA、各種邏輯電路、積體電路或其 組合。 此等及其他實施例在以下申請專利範圍之範峰内。 【圖式簡單說明】 134564.doc -41 - 200926830 圖為說明可實施本發明之技術的視頻編碼設備之 性視頻編瑪器的方塊圖。 ’、 圖2及圖3為說明可實施包括轉換之運動估計過程之部分 之組件的方塊圖。 刀 圖4為說明用於執行一維轉換之蝶形實施的圖式。 圖5為說明可將計算共用技術用於本文所述之轉換之架 構的方塊圖。 圖6為說明可根據本發明而達成之計算節省的曲線圖。 圖7為說明作為可並行搜尋之搜尋點數目之函數的轉換 引擎數目的曲線圖。 圖8為說明例示性垂直引擎之方塊圖。 圖9為說明可用以轉換搜尋空間之第一 4乘4像素區塊之 例示性水平引擎的方塊圖。 圖10為說明可用以在由圖8所示之水平引擎所執行之轉 換之後轉換搜尋空間之剩餘4乘4像素區塊之例示性水平引 擎的方塊圖。 圖11為搜尋空間内之區塊的概念圖,其說明至垂直引擎 中之輸入區塊。 圖12為說明水平引擎與垂直引擎之間的資料流之圖。 圖13為說明可位於水平引擎與垂直引擎之間的轉置暫存 器中之時序及資料流的方塊圖。 【主要元件符號說明】 10 視頻編碼器 12 單元 134564.doc -42- 200926830 14 轉換單元 16 量化單元 18 彌編碼單元 22 反向量化單元 24 反向轉換單元 - 26 加法器單元 ^ 28 解塊單元 30 記憶體 φ 32 控制信號 34 單元 36 單元 42 差異(Diff)模組 44 正向轉換引擎(FTE) 46 速率失真估計(RDE)模組 52Α FTE 52Β FTE ❹ 54 差異單元 56 RDE模組 60 FTE 62 隨機存取記憶體 64Α 垂直引擎 64Β 垂直引擎 65Α 轉置記憶體 65Β 轉置記憶體 134564.doc -43- 200926830 φ 66Α 水平引擎 66Β 水平引擎 66C 水平引擎 66D 水平引擎 80 垂直轉換引擎/垂直引擎 81 A 暫存器R0 81B 暫存器R1 81C 暫存器P0 81D 暫存器P1 81E 暫存器P2 81F 暫存器Rf 82A 多工器 82B 多工器 82C 多工器 82D 多工器 82E 多工器 82F 多工器 85A 加法器 85B 加法器 90 水平引擎 91A 暫存器R0 91B 暫存器R1 91C 暫存器R2 91D 暫存器R3 -44- 134564.doc 200926830 91E 暫存器P〇 91F 暫存器PI 91G 最終暫存器Rf 92A 多工器 92B 多工器 • 92C 多工器 92D 多工器 92E 多工器 φ 92F 多工器 92G 多工器 92Η 多工器 95Α 加法器 95Β 加法器 101Α 暫存器R0 101Β 暫存器P0 101C 暫存器P1 ® 101D 暫存器Rf 102A 多工器 102B 多工器 102C 多工器 102D 多工器 102E 多工器 102F 多工器 102G 多工器 134564.doc -45- 200926830
102H 多工器 1021 多工器 105A 加法器 105A 加法器 a 乘法常數 c 乘法常數 MB 巨集區塊 P 字長 Pred 預測區塊 QP 量化參數 Res 剩餘者 S00-S77 序列 S'oo-S'ss 序列 S(i,j)、… 搜尋點 sun、... 經垂直轉換之像素資料 T1-T26 時間 x〇 變數 xi 變數 X2 變數 X3 變數 y〇 變數 yi 變數 Y2 變數 ys 變數 -46- 134564.doc

Claims (1)

  1. 200926830 十、申請專利範圍: 1. '種設備,盆a人 其匕3 —對視頻資料之區塊執行轉換之視頻 次瑪器其中在執行該等轉換時,該視頻編碼器在視頻 >料之第一區塊之一第二轉換中,重新使用與視頻資 料之第一區塊之一第一轉換相關聯的一或多個計算。 2.如清求項1之設備,其中該視頻編碼器執行來自由整數 . 及離散餘弦轉換(DCT)所構成之群組的轉換。 3. 如請求項1之設備,其中該視頻編碼器包括一運動估計 〇 器,且該運動估計器包括一執行該等轉換之轉換引擎》 4. 如請求項3之設備,其中視頻資料之該第一區塊及視頻 ^料之该第二區塊包含與搜尋空間相關聯之視頻資料, 其中該轉換引擎亦對待編碼之視頻資料之一區塊執行一 轉換。 5. 如請求項1之設備,其中該視頻編碼器對定義於搜尋空 間中之視頻資料的四個或四個以上區塊執行轉換,其中 該視頻編碼器在對定義於該搜尋空間中之視頻資料之該 © 等區塊中之至少三者進行該等轉換時重新使用計算。 6. 如請求項1之設備, 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之列進行的1 ' 維轉換以產生中間結果,及對該等中間結果之一行進行 的1維轉換;且 其中該等經重新使用之計算包含該等中間結果中之至 少一· 〇 134564.doc 200926830 7.如請求項6之設備其中該 換之一畦玄#。 頻編碼器包括執行該等轉 換之或多個水平引擎及—或轉 8.如請求項7之讲偌^ 且5丨#。 喟/之叹備,該視頻編碼器進一 或多個水平引擎歲# 含位於該一 轉置記憶體,以緩衝並考岸來自=擎:間的-或多個 出資料相對於至該等引擎中义者之輸 9.如請求項km: 者輸入資料的時序。 於視頻資料之區塊之一集人i線方式相對 σ而執行’且其中兮楚 擎與該等垂直引擎斜科兮绝 、7平引 作。直引擎針對該等轉換中之至少部分同時操 1〇·如請求項8之設備’其中該視頻編碼器: 相對於該輸出資料,記錄盥 值;且 錄與该輸入資料相關聯之索引 經由該等索引值,相對 資料。 Μ該輸出資料重新排序該輸入 11. 如請求項7之設備,該視頻 或多個水平引擎與节—m田 纟包含位於該一 :引擎與“多個垂直引擎之間之轉置暫存 -一集σ,以緩衝並考慮來自該等引擎中之 出資料相對於至該等W擎中之之輸 12. 如請求項11之設備,其中 ,广的時序。 * Τ該痒轉換係以一管線 於視頻資料之區塊之-集合而執行,且其中該等水平 作。 +對該等轉換中之至少部分同時操 13. 如請求項11之設備’其中該視頻編碼器: 134564.doc 200926830 相對於該輸出資料,記錄與該輪入資料相關聯之索引 值;且 經由該等索引值’相對於該輸出資料重新排序該輸入 資料。 I4.如凊求項1之設備,其中該設備包含一無線通信設備。 . 丨5.如請求項1之設備,其中該設備包含一高解析度電視 (HDTV) 〇 16. 如請求項1之設備, ® 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之行進行的1 維轉換以產生中間結果,及對該等中間結果之一列進行 的1維轉換,且 其中該等經重新使用之計算包含該等中間結果中之至 少一些者。 17. —種方法,其包含對視頻資料之區塊執行轉換其中執 行該等轉換包括在視頻資料之一第二區塊之一第二轉換 ® 中重新使用與視頻資料之一第一區塊之一第一轉換相關 聯的一或多個計算。 18. 如請求項17之方法, 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之列進行的j 維轉換以產生中間結果,及對該等中間結果之一行進行 的1維轉換,且 其中該等經重新使用之計算包含該等中間結果中之至 134564.doc 200926830 少一些者。 19.如請求項17之方法, 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之行進行的1 維轉換以產生中間結果,及對該等中間結果之一列進行 的1維轉換,且 • 其中該等經重新使用之計算包含該等中間結果中之至 少一些者。 〇 20. —種設備,其包含: 用於對視頻資料之區塊執行轉換的構件;及 用於在視頻資料之一第二區塊之一第二轉換中重新使 用與視頻資料之一第一區塊之一第一轉換相關聯之一或 多個計算的構件。 21. 如請求項20之設備, 其中視頻資_料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之列進行的i 維轉換以產生中間結果,及對該等中間結果之一行進行 的1維轉換,且 . 其中該等經重新使用之計算包含該等中間結果中之至 少一些者。 22. 種電腦可讀媒體,其包含在一視頻編碼設備中執行時 使該設備對視頻資料之區塊執行轉換的指令,其中在執 行該等轉換時,該等指令使該設備在視頻資料之一第二 區塊之一第二轉換中重新使用與視頻資料之一第一區塊 134564.doc • 4 · 200926830 之一第一轉換相關聯的一或多個計算。 23.如請求項22之電腦可讀媒體, 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之列進行的1 維轉換以產生中間結果,及對該等中間結果之一行進行 • 的1維轉換,且 • 其中該等經重新使用之計算包含該等中間結果中之至 少一些者。 Ο 24· 一種電路,其經組態以對視頻資料之區塊執行轉換,其 中在執行該等轉換時,該電路在視頻資料之一第二區塊 之一第二轉換中重新使用與視頻資料之一第一區塊之— 第一轉換相關聯的一或多個計算。 25.如請求項24之電路, 其中視頻資料之該等區塊包含4乘4像素區塊, 其中該等轉換包含對該等4乘4像素區塊之列進行的i 維轉換以產生中間結果,及對該等中間結果之一行進行 ’的1維轉換,且 其中該等經重新使用之計算包含該等中間結果中之至 少一些者。 134564.doc
TW097137391A 2007-09-26 2008-09-26 Efficient transformation techniques for video coding TW200926830A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/861,804 US8654833B2 (en) 2007-09-26 2007-09-26 Efficient transformation techniques for video coding

Publications (1)

Publication Number Publication Date
TW200926830A true TW200926830A (en) 2009-06-16

Family

ID=40471543

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097137391A TW200926830A (en) 2007-09-26 2008-09-26 Efficient transformation techniques for video coding

Country Status (7)

Country Link
US (1) US8654833B2 (zh)
EP (1) EP2198621A2 (zh)
JP (1) JP5512524B2 (zh)
KR (2) KR101235132B1 (zh)
CN (1) CN102067606B (zh)
TW (1) TW200926830A (zh)
WO (1) WO2009042943A2 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100846870B1 (ko) * 2006-07-06 2008-07-16 한국전자통신연구원 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법
US20080204598A1 (en) * 2006-12-11 2008-08-28 Lance Maurer Real-time film effects processing for digital video
KR101403338B1 (ko) * 2007-03-23 2014-06-09 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US8208065B2 (en) * 2008-07-30 2012-06-26 Cinnafilm, Inc. Method, apparatus, and computer software for digital video scan rate conversions with minimization of artifacts
US9110849B2 (en) * 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US9069713B2 (en) * 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US8762441B2 (en) * 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9075757B2 (en) * 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US9118898B2 (en) * 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
US9081733B2 (en) * 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
US8451904B2 (en) 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
JP5375676B2 (ja) * 2010-03-04 2013-12-25 富士通株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
AU2012326873B2 (en) * 2011-10-17 2015-12-24 Kt Corporation Method and apparatus for encoding/decoding image
WO2013109838A1 (en) * 2012-01-20 2013-07-25 Sony Corporation Chroma quantization parameter extension
US9554152B2 (en) 2013-07-12 2017-01-24 Qualcomm Incorporated Concurrent processing of horizontal and vertical transforms
EP3083609B1 (en) 2013-12-19 2018-08-15 Merck Sharp & Dohme Corp. Hiv protease inhibitors
US10356440B2 (en) * 2014-10-01 2019-07-16 Qualcomm Incorporated Scalable transform hardware architecture with improved transpose buffer
CN104811696B (zh) * 2015-04-17 2018-01-02 北京奇艺世纪科技有限公司 一种视频数据的编码方法和装置
US10567800B2 (en) * 2016-11-29 2020-02-18 Qualcomm Incorporated Transform hardware architecture for video coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60179481A (ja) * 1984-02-24 1985-09-13 Nitto Electric Ind Co Ltd 金属粉末結合用組成物
IT8921420V0 (it) * 1989-07-13 1989-07-13 Telettra Spa Sistema e circuito per il calcolo di trasformata discreta bidimensionale.
JPH07200539A (ja) 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd 二次元dct演算装置
GB2305798B (en) * 1995-09-28 1999-10-20 Sony Uk Ltd Spatial frequency-domain video signal processing
US5894430A (en) 1996-05-20 1999-04-13 Matsushita Electric Industrial Co., Ltd. Orthogonal transform processor
US5796434A (en) * 1996-06-07 1998-08-18 Lsi Logic Corporation System and method for performing motion estimation in the DCT domain with improved efficiency
US6414992B1 (en) 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
JP2000222578A (ja) 1999-02-02 2000-08-11 Matsushita Electric Ind Co Ltd パターンマッチング方法および動きベクトル検出方法
US20040028127A1 (en) 2002-08-06 2004-02-12 Raghavan Subramaniyan Method and apparatus for reducing computational complexity in video encoders
US7756351B2 (en) 2003-12-19 2010-07-13 Stmicroelectronics, Inc. Low power, high performance transform coprocessor for video compression
EP2373033A3 (en) * 2004-01-30 2011-11-30 Panasonic Corporation Picture coding and decoding method, apparatus, and program thereof
EP1730846A4 (en) 2004-03-10 2010-02-24 Sindhara Supermedia Inc METHODS AND DEVICES FOR COMPRESSING DIGITAL IMAGE DATA WITH MOTION PREDICTION
CN100433837C (zh) 2004-03-18 2008-11-12 华中科技大学 视频编码的整数变换方法
US8595281B2 (en) * 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
US8849884B2 (en) * 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
CN100450184C (zh) 2006-07-12 2009-01-07 浙江大学 运用于图像编码和视频编码的离散余弦变换方法
US20080107176A1 (en) * 2006-11-02 2008-05-08 General Instrument Corporation Method and Apparatus for Detecting All Zero Coefficients

Also Published As

Publication number Publication date
US8654833B2 (en) 2014-02-18
EP2198621A2 (en) 2010-06-23
KR20120066681A (ko) 2012-06-22
JP5512524B2 (ja) 2014-06-04
CN102067606B (zh) 2014-09-17
CN102067606A (zh) 2011-05-18
JP2011509538A (ja) 2011-03-24
US20090080515A1 (en) 2009-03-26
WO2009042943A3 (en) 2010-12-29
KR20100068470A (ko) 2010-06-23
KR101235132B1 (ko) 2013-02-20
WO2009042943A2 (en) 2009-04-02

Similar Documents

Publication Publication Date Title
TW200926830A (en) Efficient transformation techniques for video coding
CN109565590B (zh) 用于视频编解码的基于模型的运动向量推导
US9357228B2 (en) Motion estimation of images
BR112019013832A2 (pt) restauração de vetor de movimento de lado de decodificador para codificação de vídeo
RU2429531C2 (ru) Преобразования с общими множителями
US5563813A (en) Area/time-efficient motion estimation micro core
US20160080764A1 (en) Encoding system using motion estimation and encoding method using motion estimation
Kim et al. A novel VLSI architecture for full-search variable block-size motion estimation
Seidel et al. Energy-efficient SATD for beyond HEVC
Pastuszak Architecture design of the H. 264/AVC encoder based on rate-distortion optimization
Li et al. Serial and parallel FPGA-based variable block size motion estimation processors
Ismail et al. High performance architecture for real-time HDTV broadcasting
Cancellier et al. Energy-efficient Hadamard-based SATD architectures
Joshi et al. Vlsi architecture of block matching algorithms for motion estimation in high efficiency video coding
US20050131979A1 (en) Apparatus for calculating absolute difference value, and motion estimation apparatus and motion picture encoding apparatus which use the apparatus for calculating the absolute difference value
Berns et al. A flexible motion estimation chip for variable size block matching
Park A sub-pixel motion estimation skipping method for fast HEVC encoding
Cho et al. An embedded merging scheme for H. 264/AVC motion estimation
Song et al. An adaptive motion estimation architecture for H. 264/AVC
CN1283107C (zh) 快速运动预测方法及其装置
Vayalil High efficiency video coding processor with Residue Number System
Pathak et al. Novel Low-Complex 4× 4 and 16× 16 Intra-prediction Architecture for Error Concealment for H. 264
Cho et al. An embedded merging scheme for VLSI implementation of H. 264/AVC motion estimation modules
Yahi et al. A speed FPGA hardware accelerator based FSBMA-VBSME used in H. 264/AVC
Moshnyaga et al. A data reusing architecture for MPEG video coding