TW201335769A - 使用奇偶整數轉換影像處理 - Google Patents

使用奇偶整數轉換影像處理 Download PDF

Info

Publication number
TW201335769A
TW201335769A TW101141217A TW101141217A TW201335769A TW 201335769 A TW201335769 A TW 201335769A TW 101141217 A TW101141217 A TW 101141217A TW 101141217 A TW101141217 A TW 101141217A TW 201335769 A TW201335769 A TW 201335769A
Authority
TW
Taiwan
Prior art keywords
conversion
matrix
video
unit
order
Prior art date
Application number
TW101141217A
Other languages
English (en)
Inventor
Jie Dong
Yan Ye
Original Assignee
Vid Scale Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid Scale Inc filed Critical Vid Scale Inc
Publication of TW201335769A publication Critical patent/TW201335769A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)

Abstract

公開了用於對資料(例如殘留視頻資料)進行轉換的整數轉換、和/或整數轉換操作的方法、設備以及系統。在這些方法、設備以及系統中,設備中可以包括處理器和記憶體。該記憶體包括一組轉換矩陣、以及能夠由所述處理器執行以使用所述一組轉換矩陣中的任意轉換矩陣來對資料(例如殘留視頻資料)進行轉換的指令。所述一組轉換矩陣中的每個轉換矩陣可以是正交的,或可替換地可以是近似正交的並可以被完全因式分解。所述一組轉換矩陣中的每個轉換矩陣可以具有不同數量的元素。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之間的差值滿足給定的臨界值;並且所述基本向量接近離散餘弦轉換(DCT)矩陣的對應基本向量。

Description

使用奇偶整數轉換影像處理
數位視頻能力可以合併到多種設備中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、可擕式電腦或桌上型電腦、數位相機、數位錄影設備、視頻遊戲設備、視頻遊戲控制臺、移動電話、衛星或其他無線電電話等等。許多數位視頻設備實施視頻壓縮技術來更高效地傳送和接收數位視頻資訊,該視頻壓縮技術包括例如由移動圖像專家組(MPGA)(諸如MPEG-2、MPEG-4)、以及國際電信聯盟(ITU)(諸如ITU-T H.263,或者ITU-T H.264/MPEG-4第十部分高級視頻編碼(AVC))、以及這些標準的擴展定義的標準中所描述的視頻壓縮技術。
視頻壓縮技術可以執行空間預測和/或時間預測(temporal prediction)來減少或去除視頻序列內在的冗餘。對於基於塊的視頻編碼,可以將視頻訊框或片分成塊(“視頻塊”)。根據不同的編碼技術,訊框內編碼(intra-coded)(I)的訊框或片中的視頻塊通過使用相對於相鄰塊的空間預測而被編碼。訊框間編碼(inter-coded)(P或B)中的訊框或片中的視頻塊可以使用相對於同一訊框或片中的相鄰視頻塊的空間預測、或者相對於其他參考訊框中的視頻塊的時間預測。
公開了用於對資料(例如殘留(residual)視頻資料)進行轉換的整數轉換、和/或整數轉換操作的方法、設備以及系統。在這些方法、設備以及系統中,設備中可以包括處理器和記憶體。該記憶體可以包括一組轉換矩陣、以及能夠由所述處理器執行以使用所述一組轉換矩陣中的任意矩陣來對資料(例如殘留視頻資料)進行轉換的指令。所述一組轉換矩陣中的每個轉換矩陣是正交的,並且具有不同數量的元素。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數(norm)之間的差值滿足給定的臨界值;並且所述基本向量大致對應於離散餘弦轉換(DCT)矩陣的基本向量。
可替換地,所述一組轉換矩陣中的每個轉換矩陣可以近似正交,具有不同數量的元素並且可被完全因式分解(factorization)。
在所述方法、設備以及系統中,還可以包括一種使用N階整數轉換來處理殘留視頻資料的方法。該方法可以包括:在第一預處理(preconditioning)單元處接收視頻資料(例如殘留視頻資料)的向量,並且在第一預處理單元處對視頻資料(例如殘留視頻資料)的向量進行處理以形成用於轉換的第一和第二中間輸出向量。該方法還可以包括:在第一轉換單元處接收第一中間輸出向量,並且在第一轉換單元處對第一中間輸出向量進行轉換,以使用N/2階整數偶數部分轉換矩陣和N/2階整數奇數部分矩陣的基本向量來形成偶數索引的轉換係數。該方法還可以包括:在第二轉換單元處接收第二中間輸出向量,並且在第二轉換單元處對第二中間輸出向量進行轉換,以通過對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理來形成奇數索引的轉換係數。N/2階整數矩陣可以一起對N階轉換矩陣的奇數部分進行因式分解。
可從以下描述中獲取更詳細的理解,這些描述是結合附圖通過舉例給出的。類似於詳細的描述,這些附圖中的圖都是示例。因此,附圖和詳細描述中不能被看作是限制,而其他同樣有效的實施例也是可能的和可行的。此外,在圖中相同的參考數字表示相同的元件,其中:
第1A圖是示出一個示例性視頻編碼和解碼系統的框圖,在該系統中可以執行和/或實施一個或多個實施方式;
第1B圖是示出用於與視頻編碼和/或解碼系統(例如如第1A圖的系統)一起使用的一個示例性視頻編碼器單元的框圖;
第1C圖是示出用於與視頻編碼器單元(例如如第1A圖至第1B圖的視頻編碼器單元)一起使用的一個示例性視頻編碼器的框圖;
第1D圖是示出用於與視頻編碼器單元(例如如第1A圖至第1B圖的視頻編碼器單元)一起使用的一個示例性視頻解碼器的框圖;
第2圖示出了根據一個非限制性實施方式的示例性32階轉換矩陣;
第3A圖至第3B圖是示出用於執行K階轉換的部分因式分解的示例性結構的框圖;
第4A圖至第4B圖是示出用於執行32階轉換的部分因式分解的示例性結構的框圖;
第5A圖至第5B圖是示出用於執行8階轉換的完全因式分解的示例性結構的框圖;
第6A圖至第6B圖是示出用於執行16階轉換的完全因式分解的示例性結構的框圖;
第7A圖至第7B圖是示出用於執行32階轉換的完全因式分解的示例性結構的框圖;
第8圖示出了根據一個非限制性實施方式的通信系統;
第9A圖是一個示例性通信系統的系統圖,在該通信系統中可以實施所公開的一個或多個實施方式;
第9B圖是可以在第9A圖所示的通信系統中使用的一個示例性無線發射/接收單元(WTRU)的系統圖;以及
第9C圖至第9E圖是可以在第9A圖所示的通信系統中使用的一個示例性無線電存取網路和示例性核心網路的系統圖。
在下面的詳細描述中,列出了許多具體細節來提供對所公開的實施方式和/或示例的透徹理解。但是,可以理解的是可以在不使用這裏列出的一些或所有特定細節的情況下實施這些實施方式和示例。在其他實例中,沒有詳細描述公知的方法、過程、元件以及電路,從而不會使得下面的描述不清楚。另外,這裏沒有具體描述的實施方式和示例可以代替或結合這裏所公開的實施方式和其他示例。
示例性系統架構
第1A圖是示出一個示例性視頻編碼和解碼系統10的框圖,在該系統10中可以執行和/或實施一個或多個實施方式。系統10可以包括源設備12,該源設備12經由通信通道16來傳送編碼後的視頻資訊給目的設備14。
源設備12和目的設備14可以是多種設備中的任意一種。在一些實施方式中,源設備12和目的設備14可以包括無線發射和/或接收單元(WTRU),例如可以通過通信通道16來傳送視頻資訊(在這種情況下,通信通道16包括無線鏈路)的無線手持設備或任意無線設備。但是,在這裏描述的、公開的或以其他方式顯性、隱性地、固有地提供的(統稱為“提供的”)方法、設備以及系統不必限為無線應用或設置。例如,這些技術可以應用於空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路視頻傳輸、在儲存媒體上編碼的編碼後的數位視頻、或者其他情況。因此,通信通道16可以包括和/或可以是適於傳輸編碼後的視頻資料的無線或有線媒介的任意組合。
源設備12可以包括視頻編碼器單元18、發射和/或接收(Tx/Rx)單元20以及Tx/Rx元件22。如圖所示,可選地,源設備12可以包括視頻源24。目的設備14可以包括Tx/Rx元件26、Tx/Rx單元28以及視頻解碼器單元30。Tx/Rx單元20、28中的每一個可以是或者包括發射機、接收機、或者發射機和接收機的組合(例如收發器或發射機-接收機)。Tx/Rx元件22、26中的每一個可以是例如天線。根據所公開的內容,源設備12的視頻編碼器單元18和/或目的設備的視頻解碼器單元30可以被配置為和/或適於(統稱為適合)應用這裏提供的編碼技術。
源和目的設備12、14可以包括其他元件/元件或裝置。例如,源設備12可以適於接收來自外部視頻源的視頻資料。並且,目的設備14可以與外部顯示設備(未示出)連接,而不是包括和/或使用(例如集成的)顯示設備32。在一些實施方式中,可以將由視頻編碼器單元18產生的資料流程傳遞給其他設備而無需將資料調變到載波信號上,例如通過直接資料傳遞,其中所述其他設備可以調變或不調變資料以進行傳輸。
第1圖示出的系統10僅僅是一個示例。這裏提供的技術可以由數位視頻編碼和/或解碼設備執行。雖然這裏提供的技術一般可以由單獨的視頻編碼和/或視頻解碼設備執行,但是所述技術還可以由組合的視頻編碼器/解碼器(通常稱為編解碼器(CODEC))來執行。此外,這裏提供的技術還可以由視頻預處理器等等執行。源設備12和目的設備14僅僅是這種編碼設備的示例:在該編碼設備中,源設備12產生(和/或接收視頻資料和產生)編碼後的視頻資訊以用於傳輸給目的設備14。在一些實施方式中,設備12、14可以按照基本對稱的方式操作,從而設備12、14中的每一個包括視頻編碼和解碼元件和/或元件(統稱為“元件”)。因此,系統10可以支援設備12、14之間的單向和雙向視頻傳輸中的任意一種(用於例如視頻流、視頻重播、視頻廣播、視頻電話以及視頻會議中的任意一種)。在一些實施方式中,源設備12可以是例如適於產生(和/或接收視頻資料和產生)編碼後的視頻資訊以用於一個或多個目的設備14的流伺服器,其中目的設備可以通過有線和/或無線通信系統與源設備12通信。
外部視頻源和/或所述視頻源24可以是和/或包括視頻採集設備,例如視頻攝像機、包含先前採集的視頻和或從視頻內容提供商供應的視頻的視頻存檔。可替換地,外部視頻源和/或所述視頻源24可以產生基於電腦圖形的資料作為源視頻、或者直播視頻、存檔視頻以及電腦產生的視頻的組合。在一些實施方式中,如果視頻源24是視頻攝像機,源設備12和目的設備14可以是可拍照手機或視頻手機,或者由可拍照手機或視頻手機實現。但是,如上所述,這裏提供的技術一般可應用於視頻編碼,並且可應用於無線和/或有線應用。在任意情況下,視頻編碼器單元18可以對所採集的、預先採集的、電腦產生的視頻、供應的視頻、或其他類型的視頻資料(統稱為“未編碼的視頻”)進行編碼,以形成編碼後的視頻資訊。
Tx/Rx單元20可以調變編碼後的視頻資訊,例如根據通信標準來進行調變,從而形成運載編碼後的視頻資訊的一個或多個調變信號。Tx/Rx單元20還可以將調變信號傳遞給其發射機以進行傳輸。該發射機可以經由Tx/Rx元件22來將調變信號傳送給目的設備14。
在目的設備14處,Tx/Rx單元28可以經由Tx/Rx元件26接收來自通過通道16的調變信號。Tx/Rx單元28可以對調變信號進行解調以獲得編碼後的視頻資訊。Tx/Rx單元28可以將編碼後的視頻資訊傳送給視頻解碼器單元30。
視頻解碼器單元30可以對編碼後的視頻資訊進行解碼以獲得解碼後的視頻資料。編碼後的視頻資訊可以包括由視頻編碼器單元18定義的語法資訊。語法資訊可以包括一個或多個元素(“語法元素”);一些或所有元素可用於對編碼後的視頻資訊進行解碼。語法元素可以包括例如編碼後的視頻資訊的特徵。語法元素還可以包括用於形成編碼後的視頻資訊的未編碼的視頻的特徵和/或描述對其進行的處理。
視頻解碼器單元30可以輸出解碼後的視頻資料以用於稍後的儲存和/或顯示在外部顯示器(未示出)上。可替換地,視頻解碼器單元30可以將解碼後的視頻資料輸出給顯示設備32。顯示設備32可以是和/或包括適於向用戶顯示解碼後的視頻資料的多種顯示設備中的單個、多個、其組合、多個的組合。這些顯示設備的示例包括液晶顯示器(LCD)、等離子顯示器、有機發光二極體(OLED)顯示器、陰極射線管(CRT)等等。
通信通道16可以是任意無線或有線通信媒介,例如射頻(RF)頻譜、或者一個或多個物理傳輸線,或者是無線和有線媒介的任意組合。通信通道16可以形成基於封包的網路(例如區域網路)、廣域網路、或者全球網路(例如網際網路)的一部分。通信通道16通常代表任意合適的通信媒介、或者不同通信媒介的集合,以用於將來自源設備12的視頻資料傳送給目的設備14(包括有線或無線媒介的任意合適的組合)。通信通道16可以包括路由器、交換機、基地台、或者可用於促進從源設備12到目的設備14的通信的任意其他設備。下面參考第8圖、第9A圖至第9E圖提供了可以促進設備12、14之間的這種通信的一個示例性通信系統的細節。下面也提供了可代表12、14的設備的細節。
視頻編碼器單元18和視頻解碼器單元30可以根據一種或多種標準和/或規範來操作,例如MPEG-2、H.261、H.263、H.264、H.264/AVC、H.264,其根據SVC擴展(“H.264/SVC”)而擴展。但是,可以理解,這裏提供的方法、設備以及系統可應用於根據(和/或相容)不同標準實施的其他視頻編碼器、解碼器和/或編解碼器(CODEC),或者應用於專用視頻編碼器、解碼器和/或編解碼器(包括將來還要開發的視頻編碼器、解碼器和/或編解碼器)。但是,這裏公開的技術還不限於任意特定的編碼標準。
上面提及的H.264/AVC的相關部分可以從國際電信聯盟得到,稱為ITU-T建議H.264,或者更特別地,“ITU-T Rec. H.264以及ISO/IEC 14496-10 (MPEG4-AVC),2010年3月的‘Advanced Video Coding for Generic Audiovisual Services(用於通用視聽服務的高級視頻編碼)’版本5”,其在這裏被合併引用,並且在這裏可以稱為H.264標準或H.264規範、或者H.264/AVC標準或規範。H.264/AVC標準是由ITU-T視頻編碼專家組(VCEG)與ISO/ IEC MPEG一起制定的合作關係(稱為聯合視頻組(JVT))的產物。根據一些方面,這裏提供的技術可應用於一般符合H.264標準的設備。JVT繼續為擴展H.264/AVC標準而努力。
在ITU-T的各種論壇中,如關鍵技術領域(KTA)論壇,已開展了推進H.264/AVC標準的工作。至少一些論壇已經部分地推進了顯示了比H.264/AVC標準顯示的編碼效率更高的編碼效率的編碼技術。例如,ISO/ IEC MPEG與ITU-T的VCEG已經建立了關於視頻編碼(JCT-VC)的聯合協作小組,其已經開始開發下一代視頻編碼和/或壓縮標準,稱為高效視頻編碼(HEVC)標準。根據一些方面,這裏提供的技術可以提供相對於和/或根據H.264/AVC和/或HEVC(當前起草的)標準的編碼改進。
雖然在第1A圖至第1D圖中沒有示出,但是根據一些方面,視頻編碼器和視頻解碼器單元18、30中的每一個可以包括音頻編碼器和/或解碼器或者與其集成(如果合適)。視頻編碼器和視頻解碼器單元18、30可以包括合適的複用-解複用(MUX-DEMUX)單元、或者其他硬體和/或軟體,以處理以普通的資料流程或可替換地單獨的資料流程的形式的音頻和視頻的編碼。如果可應用,則複用-解複用單元可以符合例如ITU-T建議H.223複用器協定、或者例如用戶資料報協定(UDP)之類的其他協定。
視頻編碼器和視頻解碼器單元18、30中的每一個或多個可以包括在一個或多個編碼器或解碼器中;任意一個可以整合為編解碼器的一部分,並且可以與各自的相機、電腦、移動設備、用戶設備、廣播設備、機頂盒、伺服器等等整合或以其他方式合併在一起。此外,視頻編碼器單元18和視頻解碼器單元30可以分別實施為多種合適編碼器和解碼器電路中的任意一者,例如一個或多個微處理器、數位信號處理器(DSP)、專用積體電路(ASIC)、現場可程式閘陣列(ASIC)、離散邏輯、軟體、硬體、韌體或其任意組合。可替換地,視頻編碼器和視頻解碼器單元18、30中的任一者或兩者可以基本以軟體實施,並且從而,視頻編碼器單元18和/或視頻解碼器單元30的元件的運行可以由合適軟體指令執行,該軟體指令由一個或多個處理器(未示出)執行。另外,除了處理器之外,該實施方式還可以包含晶片外(off-chip)元件,例如外部記憶體(例如以非揮發性記憶體的形式)、輸入/輸出介面等等。
在其他實施方式中,視頻編碼器單元18和視頻解碼器單元30中的每一個的一些元件可以實施為硬體,而其他元件可以使用合適的軟體指令來實施,該軟體指令由一個或多個處理器(未示出)執行。在視頻編碼器和/或視頻解碼器單元18、30的元件的運行可以由一個或多個處理器執行的軟體指令來執行的任意實施方式中,這種軟體指令可以維持在電腦可讀媒介上,該電腦可讀媒介包括磁片、光碟、以及CPU可讀的任意其他揮發性(例如隨機存取記憶體(RAM))或非揮發性(例如唯讀記憶體(ROM))大容量儲存系統。電腦儲存媒體可以包括合作或互連的電腦可讀媒介,其排他性地在處理系統上存在,或者分佈可處於處理系統本地或遠端的多個互連的處理系統之間。
第1B圖是示出用於與視頻編碼和/或解碼系統(例如如1A的系統10)一起使用的一個示例性視頻編碼器單元18的框圖。視頻編碼器單元18可以包括視頻編碼器33、輸出緩衝器34以及系統控制器36。類似於視頻編碼器單元18,作為一個整體,視頻編碼器33(或者其一個或多個元件)可以根據一個或多個標準和/或規範來實施,例如H.261、H.263、H.264、H.264/AVC、H.264/SVC、HEVC等等。但是,應當理解這裏提供的方法、設備以及系統可應用於根據不同標準實施的其他視頻編碼器、或者專用編解碼器,包括將來還要開發的編解碼器。
視頻編碼器33可以接收從視頻源(諸如視頻源24和/或外部的視頻源)提供的視頻信號。該視頻信號可以包括未編碼的信號。視頻編碼器33可以對未編碼的視頻進行編碼,並在其輸出提供編碼後的(即壓縮的)視頻位元流(BS)。
可以將編碼後的視頻位元流BS提供給輸出緩衝器34。輸出緩衝器34可以緩衝編碼後的視頻位元流BS,並提供該編碼後的視頻位元流BS作為緩衝的位元流(BBS)以經由通信通道16進行傳輸。
可以將從輸出緩衝器34輸出的緩衝的位元流BBS提供給儲存設備(未示出)以進行稍後的觀看或傳輸。可替換地,視頻編碼器單元18可以被配置用於可視通信,在該可視通信中,緩衝的位元流BBS可以經由通信通道16在規定的不變的和/或可變的位元率(例如具有很低或最小的延遲)而被傳送。
編碼後的視頻位元流BS以及相應的緩衝的位元流BBS可以運載編碼後的視頻資訊的位元。緩衝的位元流BBS的位元可以被整理為編碼後的視頻訊框流。編碼後的視頻訊框可以是如本領域技術人員可以理解的訊框內編碼訊框(例如I訊框)、間編碼訊框(例如B訊框或P訊框)等等。編碼後的視頻訊框流可以被整理為例如一系列GOP,其中每個GOP的編碼後的視頻訊框以特定順序排列。一般地,每個GOP以訊框內編碼訊框(例如I訊框)開始,隨後是一個或多個訊框間編碼訊框(例如P訊框和/或B訊框)。每個GOP通常僅包括單個的訊框內編碼訊框;但是任意GOP可以包括多個訊框內編碼訊框。注意傳統的B訊框不能用於即時的、低延遲的應用(這是因為,舉例來說,與例如單向預測(P訊框)相比,雙向預測通常引起額外的編碼延遲)。如本領域技術人員可以理解的,可以支持另外和/或其他訊框類型,並且可以修改特定排序的編碼後的視頻訊框。
每個GOP可以包括語法資料(“GOP語法資料”)。GOP語法資料可以部署在GOP的標頭中、GOP的一個或多個訊框的標頭中、或者其他位置。GOP語法資料可以指示各個GOP的編碼後的視頻訊框的排序、數量和/或類型,和/或以其他方式描述個各GOP的編碼後視頻訊框。每個編碼後的視頻訊框可以包括語法資料(“編碼後的訊框語法資料”)。編碼後的訊框語法資料可以指示或以其他方式描述用於各個編碼後的視頻訊框的編碼模式。
系統控制器36可以監視不同的參數和/或與通道16相關聯的限制、視頻編碼器單元18的可計算能力、用戶的需求等等,並且可以建立目標參數以提供適用於規定的限制和/或通道16的條件的參與體驗品質(QoE)。可以根據規定的限制和/或通道條件來不時地調整一個或多個目標參數。舉例來說,可以使用用於評估視頻品質的一個或多個度量(包括例如統稱為編碼後的視頻序列的相對感知品質的度量)來從數量上估計QoE。測量的編碼後的視頻序列的相對感知(perceptive)品質(例如通過使用峰值信號噪訊比(“PSNR”)度量)由編碼後的位元流BS的位元率(BR)來控制。可以調整一個或多個目標參數(包括例如量化參數(QP))來在與編碼後的位元流BS的位元率BR相關聯的限制下最大化視頻的相對感知品質。
第1C圖是示出用於與視頻編碼器單元(例如如第1A圖至第1B圖的視頻編碼器單元18)一起使用的一個示例性視頻編碼器33的框圖。視頻編碼器33可以包括輸入38、模式決定和編碼器控制器單元40、空間預測單元42、運動/時間預測單元44、第一加法器46、轉換單元48、量化單元50、熵(entropy)編碼單元52、反量化單元54、反轉換單元56、第二加法器58、濾波器60、參考圖片儲存器62以及輸出64。視頻編碼器33可以包括另外的元件和/或不同元件。為了簡潔和清楚,沒有示出這些元件。
此外,第1C圖中示出的以及在這裏提供的視頻編碼器33的細節僅僅用於說明,而真正的實施可以不同。真實世界的實施可以包括例如更多的、更少的和/或不同的元件,和/或與第1C圖所示的佈置不同地佈置。例如,雖然轉換單元48與量化單元50被分開示出,但是在一些真正的實施中,例如在使用H.264標準的核心轉換的實施中,可以高度整合所述轉換單元48與量化單元50的一些或所有功能。類似地,反量化單元54和反轉換單元56在一些真實世界實施(例如,H.264標準相容實施)中可以高度整合,但是為了概念目的同樣可以分開示出。
如上所示,視頻編碼器33可以在其輸入38處接收視頻信號。視頻編碼器33可以從所接收到的未編碼的視頻產生編碼後的視頻資訊,並從該視頻編碼器33的輸出64將編碼後的視頻資訊(例如任意訊框內或訊框間)以編碼後的視頻位元流BS的形式輸出。視頻編碼器33可以例如作為混合視頻編碼器來運行,並使用基於塊的編碼過程來對未編碼的視頻進行編碼。當執行該編碼過程時,視頻編碼器33通常針對未編碼視頻的單獨訊框、圖片、圖像(統稱為“未編碼的圖片”)進行操作。
為了促進基於塊的編碼過程,視頻編碼器33可以在其輸入38處將每個未編碼的圖片分片、分割、分開或者以其他方式分段(統稱為“分段”)為多個未編碼的視頻塊。在一些實例中,視頻編碼器33可以首先將未編碼的圖片分段為多個未編碼的視頻分段(例如片),並且然後將每個未編碼的視頻分段分段為未編碼的視頻塊。視頻編碼器33可以將未編碼的視頻塊傳遞、供應、發送或以其他方式提供給空間預測單元42、運動/時間預測單元44和/或第一加法器46。如下面詳細描述的,可以逐塊地提供未編碼的視頻塊。
空間預測單元42可以接收未編碼的視頻塊,並將該視頻塊以訊框內模式(intra-mode)編碼。訊框內模式指的是基於空間的壓縮的若干個模式中的任意一種,並且在訊框內模式中編碼是嘗試提供對未編碼的圖片的基於空間的壓縮。基於空間的壓縮(如果存在)可以是減少或移除未編碼的圖片內的視頻資訊的空間冗餘的結果。在形成預測塊的過程中,空間預測單元42可以相對於已經被編碼(“編碼的視頻塊”)和/或重新構建(“重新構建的視頻塊”)的未編碼的圖片的一個或多個視頻塊來執行每個未編碼視頻塊的空間預測(或“訊框內預測”)。編碼後的視頻塊和/或重新構建的視頻塊可以鄰近、接近、或非常靠近未編碼的視頻塊。
運行/時間預測單元44可以接收來自輸入38的未編碼的視頻塊,並將該未編碼的視頻塊以訊框間模式(inter-mode)編碼。訊框間模式指的是基於時間的壓縮的幾種模式中的任意一種,包括例如P模式(單向預測)或B模式(雙向預測)。在訊框間模式中編碼是嘗試提供對未編碼的圖片的基於時間的壓縮。基於時間的壓縮(如果存在)可以是減少或移除未編碼的圖片與一個或多個參考(例如相鄰)圖片之間的視頻資訊的時間冗餘的結果。運行/時間預測單元44可以相對於參考圖片的一個或多個視頻塊(“參考視頻塊”)來執行每個未編碼視頻塊的時間預測(或“訊框間預測”)。執行的時間預測可以是單向預測(例如對於P模式)或者可替換地雙向預測(例如對於B模式)。
在單向預測的情況下,參考視頻塊可以來自先前編碼和/或重新構建的圖片,並且在一些情況下,來自僅一個先前編碼和/或重新構建的圖片。編碼後的圖片和/或重新構建的圖片可以鄰近、接近、或非常靠近未編碼的圖片。
在雙向預測的情況下,參考視頻塊可以來自一個或多個先前編碼和/或重新構建的圖片、以及視頻流的一個或多個其他未編碼的圖片。編碼後的圖片和/或重新構建的圖片和其他未編碼的圖片可以鄰近、接近、或非常靠近未編碼的圖片。
如果支援多個參考圖片(如同最近的視頻編碼標準(例如H.264/AVC或HEVC)的情況),則對於每個視頻塊,可以將其參考圖片索引發送給熵編碼單元52,以用於隨後的輸出和/或傳輸。參考索引可以用於識別時間預測來自參考圖片儲存器62中的哪個或哪些參考圖片。
雖然用於運動估計和運動補償的運動/時間預測單元44的功能通常是高度集中的,但是其還可以由分開的實體或單元(未示出)來實現。可以執行運動估計相對於參考圖片視頻塊來估計每個未編碼視頻塊的運動,並且可以涉及產生未編碼的視頻塊的運動向量。運動向量可以指示預測塊相對於正被編碼的未編碼視頻塊的移位元。該預測塊是根據像素差值發現非常匹配正被編碼的未編碼的視頻塊的參考圖片視頻塊。所述匹配可以由絕對差值的和(SAD)、平方差的和(SSD)、或者其他差值度量來確定。運動補償可以涉及基於由運動估計確定的運動向量來取得或產生預測塊。
運動/時間預測單元44可以通過比較未編碼的視頻塊與來自儲存在參考圖片儲存器64中的參考圖片的參考視頻塊,來計算未編碼的視頻塊的運動向量。運動/時間預測單元44可以計算包括在參考圖片儲存器62中的參考圖片的部分像素位置的值。在一些情況下,加法器58或視頻編碼器33的另一單元可以計算重新構建的視頻塊的部分像素位置值,並且然後將重新構建的視頻塊和部分像素位置的計算的值儲存在參考圖片儲存器62中。運動/時間預測單元44還可以插入參考圖片(例如I訊框或P訊框的參考圖片)的亞整數像素(sub-intergal pixel)。
運動/時間預測單元44可以被配置為相對於選擇的運動預測運算元(predictor)來對運動向量進行編碼。由運動/時間預測單元44選擇的運動預測運算元可以是例如等於已被編碼的相鄰塊的運動向量的平均值的向量。為了對未編碼視頻塊的運動向量進行編碼,運動/時間預測單元44可以計算運動向量與運動預測運算元之間的差值以形成運動向量差值。
H.264將一組可能的參考訊框稱為“列表”。儲存在參考圖片儲存器62中的一組參考圖片可以對應於這種參考訊框列表。運動/時間預測單元44可以比較來自參考圖片儲存器62的參考圖片的參考視頻塊與未編碼的視頻塊(例如P訊框或B訊框的視頻塊)。當參考圖片儲存器62中的參考圖片包括亞整數像素的值,由運動/時間預測單元44計算的運動向量可以指參考圖片的亞整數像素位置。運動/時間預測單元44可以發送所計算的運動向量給熵編碼單元52以及運動/時間預測單元44的運動補償功能。運動/時間預測單元44(或其運動補償功能)可以相對於正被編碼的未編碼視頻塊來計算預測塊的差錯值。運動/時間預測單元44可以基於預測塊來計算預測資料。
模式決定和編碼器控制器單元40可以選擇一種編碼模式:訊框內模式或訊框間模式。模式決定和編碼器控制器單元40可以基於例如速率失真最佳化方法和/或每種模式中產生的錯誤結果來選擇編碼模式。
視頻編碼器33可以通過從正被編碼的未編碼視頻塊中減去從運動/時間預測單元42提供的預測資料來形成殘留塊(“殘留視頻塊”)。加法器46代表執行該減去操作的一個或多個元件。
轉換單元48可以對殘留視頻塊應用轉換以將該殘留視頻塊從像素值域轉換到轉換域,例如頻域。該轉換可以是例如這裏提及的任意一種轉換:離散餘弦轉換(DCT)、或類似概念的轉換。其他轉換的例子包括H.264中定義的那些:小波轉換、整數轉換、子帶轉換等等。在任意情況下,由轉換單元48對殘留視頻塊應用轉換會產生殘留視頻塊的轉換係數的相應塊(“殘留轉換係數”)。這些殘留轉換係數可以表示殘留視頻塊的頻率分量的量級。轉換單元48可以將殘留轉換係數和運動向量轉發給量化單元50。
量化單元50可以量化殘留轉換係數以進一步減小編碼後的位元率。量化過程可以例如減小與一些或所有殘留轉換係數相關聯的位元深度(bit depth)。在一些情況下,量化單元50可以將殘留轉換係數的值除以與QP對應的量化水平,以形成量化後的轉換係數塊。量化的程度可以通過調整QP值來修改。一般地,量化單元50應用量化以使用期望個數的量化步長來表示殘留轉換係數;使用的步長的個數(或相應地,量化水平的值)可以確定用於表示殘留視頻塊的編碼後的視頻位元數。量化單元50可以從位元控制器(未示出)獲得QP值。在量化之後,量化單元50可以提供量化後的轉換係數和運動向量給熵編碼單元50和反量化單元54。
熵編碼單元52可以對量化後的轉換係數應用熵編碼以形成熵編碼係數(即位元流)。熵編碼單元52可以使用自適應可變長度編碼(CAVLC)、上下文自適應二進位算術編碼(CABAC)或另一種熵編碼技術來形成熵編碼係數。如本領域技術人員的理解,CABAC需要上下文資訊(“上下文”)的輸入。該上下文可以基於例如相鄰視頻塊。
熵編碼單元52可以按照粗(raw)編碼視頻位元流的形式提供熵編碼係數和運動向量給內位元流格式器(未示出)。該位元流格式器可以通過將另外的資訊添加到粗編碼視頻位元流來形成提供給輸出緩衝器34(第1B圖)的編碼後的視頻位元流BS,所述另外的資訊包括標頭、和/或使得視頻解碼器30能夠從粗編碼視頻位元流解碼編碼後的視頻塊的其他資訊。在熵編碼之後,從熵編碼單元52提供給輸出緩衝器34的編碼後的視頻位元流BS可以經由通道16而被傳送給目的設備14或者存檔以用於稍後的傳輸或獲取。
在一些實施方式中,除了熵編碼之外,熵編碼單元52或視頻編碼器33的另一單元還可以被配置為執行其他編碼功能。例如,熵編碼單元52可以被配置為確定視頻塊的CBP值。另外,在一些實施方式中,熵編碼單元52可以執行視頻塊中的量化轉換係數的運行(run)長度編碼。例如,熵編碼單元52可以應用鋸齒掃描(zigzag scan)或其他掃描模式以安排視頻塊中的量化轉換係數並對零的運行進行編碼以用於進一步壓縮。熵編碼單元52還可以用合適的語法元素來構建標頭資訊以用於編碼後的視頻位元流BS中的傳輸。
反量化單元54和反轉換單元56可以分別應用反量化和反轉換以在像素域中重新構建殘留視頻塊,例如從而稍後用作參考視頻塊的一個(例如參考圖片列表中的參考圖片的一個內)。
模式決定和編碼器控制器單元40可以通過將重新構建的殘留視頻塊添加到參考圖片儲存器62中儲存的參考圖片的一個的預測塊來計算參考視頻塊。模式決定和編碼器控制器單元40還可以將一個或多個插入濾波器應用到重新構建的殘留視頻塊以計算亞整數像素值(例如對於半像素位置)以用於運動估計。
加法器58可以將重新構建的殘留視頻塊添加到運動補償預測視頻塊以產生重新構建的視頻塊,從而儲存在參考圖片儲存器62中。運動/時間預測單元44(或其運動估計功能和/或其運動補償功能)可以將重新構建(像素值域)的視頻塊用作參考塊的一個,以用於對隨後的未編碼視頻中的未編碼視頻塊進行間編碼。
濾波器60可以包括解塊(deblock)濾波器。解塊濾波器可以操作來去除可能出現在重新構建的宏塊(macro-block)中的視覺偽像(visual artifact)。這些偽像可能是在編碼過程中由於例如使用不同的編碼模式(例如I型、P型或B型)而引入的。偽像可能出現在例如接收到的視頻塊的邊界處和/或邊緣處,並且解塊濾波器可以操作來使得視頻塊的邊界處和/或邊緣處平滑以改進視覺品質。如果需要,解塊濾波器通常會對加法器58的輸出進行濾波。
第1D圖是示出用於與視頻解碼器單元(例如如第1A圖至第1B圖的視頻解碼器單元30)一起使用的一個示例性視頻解碼器35的框圖。視頻解碼器35可以包括輸入66、熵解碼單元68、運動補償預測單元70、空間預測單元72、反量化單元74、反轉換單元76、參考圖片儲存器80、濾波器82、加法器78以及輸出84。視頻解碼器35可以執行解碼處理,其一般與關於視頻編碼器33(第1C圖)提供的編碼過程是相對的。所述解碼過程可以如下執行。
運動補償預測單元70可以基於從熵解碼單元68接收到的運動向量來產生預測資料。運動向量可以相對於對應於該被編碼的運動向量的視頻塊的運動預測運算元被編碼。運動補償預測單元70可以確定運動預測運算元為例如鄰近將要被解碼的視頻塊的塊的運動向量的中值。在確定運動預測運算元之後,運動補償預測單元70可以通過從編碼後的視頻位元流BS提取運動向量差值、以及將運動預測運算元加上運動向量差值來對編碼後的運動向量進行解碼。運動補償預測單元70可以將運動預測運算元量化到與編碼後的運動向量相同的解析度(resolution)。可替換地,運動補償預測單元70可以為所有編碼後的運動預測運算元使用相同的精度。可替換地,運動補償預測單元70可以被配置為使用上述方法中的任意一種,並通過分析包括在從編碼後的視頻位元流BS獲得的序列參數集合、分片參數集合、或圖片參數集合中的資料來確定要使用哪種方法。
在對運動向量進行解碼之後,運動補償預測單元70可以從參考圖片儲存器80的參考圖片中提取由運動向量標識的預測視頻塊。如果運動向量指向部分像素位置,例如半像素,則運動補償預測單元70可以為部分像素位置插入值。運動補償預測單元70可以使用自適應插入濾波器或固定的插入濾波器來插入這些值。此外,運動補償預測單元70可以從接收到的編碼後的視頻位元流BS獲得要使用濾波器82中的哪個濾波器的指示以及(在一些實施方式中)針對濾波器82的係數。
空間預測單元72可以使用在編碼後的視頻位元流BS中接收到的訊框內預測模式來從空間上鄰近的塊形成預測視頻塊。反量化單元74可以對在編碼後的視頻位元流BS中提供且由熵解碼單元68解碼的量化塊係數進行反量化,即去量化。反量化過程可以包括常規的過程,例如由H.264定義的過程。反量化過程還可以包括為每個視頻塊使用由視頻編碼器33計算的量化參數QP來確定量化的程度,並且同樣地確定可以應用的反量化的程度。
反轉換單元76可以將反轉換(例如這裏提供的轉換中的任意一種的反轉換:反DCT、反整數轉換、或者概念上類似的反轉換過程)應用到轉換係數來在像素域中產生殘留視頻塊。運動補償預測單元70可以產生運動補償塊(可能基於插入濾波器執行插入)。要用於具有亞像素精度的運動估計的插入濾波器的識別字可以包括在視頻塊的語法元素中。運動補償預測單元70可以使用視頻編碼器33在對視頻塊進行編碼期間使用的插入濾波器來計算用於參考塊的亞整數像素的插入值。運動補償預測單元70可以根據接收到的語法資訊來確定由視頻編碼器33使用的插入濾波器,並使用該插入濾波器來產生預測塊。
運動補償預測單元70可以使用一些語法資訊來確定用於編碼編碼後的視頻序列的一個或多個圖片的視頻塊的大小、描述如何分割編碼後的視頻序列的訊框的每個視頻塊的分割資訊、指示如何對每個分割進行編碼的模式、用於每個訊框間編碼視頻塊的一個或多個參考圖片、以及用於對編碼後的視頻序列進行解碼的其他資訊。
加法器78可以對由運動補償預測單元70或空間預測單元72產生的殘留塊和相應的預測塊進行求和以形成解碼後的視頻塊。在需要的情況下,還可以應用解塊濾波器(例如濾波器82)對解碼後的視頻塊進行濾波以去除塊效應(blockiness)偽像。然後解碼後的視頻塊被儲存在參考圖片儲存器80中,其提供參考視頻塊來用於隨後的運動補償,並且還產生解碼後的視頻來在顯示設備上呈現(例如第1圖的顯示設備34)。
在每個視頻塊經歷編碼和/或解碼過程時,該視頻塊的視頻資訊可以不同地表示。例如,視頻塊可以包括:(i)像素域中的像素資料;(ii)表示未編碼視頻塊與預測塊之間的像素差的殘留資料(“殘留”);(iii)轉換域中的轉換係數(例如,在應用轉換之後);以及(iv)量化轉換域中的量化轉換係數。
每個視頻塊可以具有給定的尺寸或者統稱為“大小”。視頻塊大小可以取決於編碼標準。例如,H.264標準支援不同視頻塊大小的訊框內預測,例如用於亮度(luma)分量的16x16、8x8或4x4、和用於色度分量的8x8,並且支持不同塊大小的訊框間預測,例如用於亮度分量的16x16、16x8、8x16、8x8、8x4、4x8以及4x4、和用於色度分量的相應縮放的大小。在H.264標準中,尺寸為16像素乘16像素的視頻塊一般稱為巨集塊(MB),而尺寸小於16像素乘16像素的視頻塊一般稱為部分MB(“MB部分”)。在HEVC中,稱為“編碼單元”或“CU”的視頻塊可以用於更有效地壓縮高解析度(例如1080p及以上)的視頻信號。在HEVC中,CU大小在參數序列集合中設定,並且可以設定為最大為64x64像素或最小為4x4像素。還可以將CU分割為預測單元(PU),對於該分割可以應用單獨的預測方法。每個視頻塊(MB、CU、PU等)可以通過使用空間預測單元42和/或運動/時間預測單元44來處理。
如這裏使用的,“NxN”和“N乘N”可互換使用以表示在垂直和水平尺寸中的分量(例如像素、殘留、轉換係數、量化轉換係數等)方面的塊大小,例如16x16元素或16乘16元素。一般地,16x16視頻塊將在垂直方向具有16個元素(y=16)且在水平方向具有16個元素(x=16)。類似地,NxN塊一般在垂直方向具有N個元素且在水平方向具有N個元素,其中N代表非負整數值。視頻塊中的元素可以按照行和列來佈置。此外,視頻塊可以在水平方向和垂直方向具有相同或不同數量的像素。例如,視頻塊可以包括NxM個像素,其中M不必等於N。
H.264/AVC標準規定了4階和8階整數轉換,稱為T4和T8,如下給出:


這兩個整數轉換T4和T8是正交的,並具有很低的複雜度。但是這些轉換的基本向量與DCT基本不同,並且因此性能一般比DCT差得多。另外,基本向量的範數彼此不同。為了實現相反特性(reversibility)和能量保存,縮放過程必須在轉換之後執行,以彌補該缺點,這增加了計算複雜度和儲存需求。另外,這種縮放矩陣通常隨著轉換的不同而不同。例如,4階轉換和8階轉換T4和T8需要使用不同的縮放矩陣。不同縮放矩陣的使用進一步增加了編解碼器設計和實施的複雜性,並且使得在需要另外的轉換時難以支持該另外的轉換。
如上所述,在HEVC中,CU大小和PU大小最大可以為64x64元素,並且需要大於4階和8階的轉換。當前,在HEVC中使用四種轉換大小:4階、8階、16階以及32階。
這裏公開具有一組轉換矩陣的設備和有形的電腦可讀儲存媒介。所述一組轉換矩陣中的每個轉換矩陣是正交的,並且具有不同數量的元素。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之差滿足給定的臨界值。並且基本向量接近DCT矩陣的相應的基本向量。給定的臨界值可以為:例如當滿足該臨界值時,其指示基本向量的範數之差不顯著(例如在特定程度的精度內)。可替換地,給定的臨界值可以為當被滿足時指示基本向量的範數大約相等之臨界值。在一個實施方式中,根據失真的測量,基本向量接近對應的DCT基本向量。在一個實施方式中,根據滿足預定義的臨界值的失真的測量,基本向量接近對應的DCT基本向量。
在這裏還公開了用於產生和/或使用N階整數轉換(稱為TN)的方法、設備以及系統,其中N可以是4、8、16、32等。在這裏公開的各個實施方式中,轉換的“階”可以使用其他標記來表達,例如術語“K階”等等。
N階整數轉換TN中的每個可以是正交的。當為正交的時,這些N階整數轉換 TN可以使得重新構建的誤差的平均能量等於量化誤差的平均能量(與非正交轉換不同),並且從而比非正交轉換具有更好的轉換性能。
每個N階整數轉換TN可以具有帶有幾乎相等的範數(“TN基本向量範數”)的基本向量(“TN基本向量”)。例如,TN基本向量範數之差可以小於給定的臨界值。例如,TN基本向量可以接近DCT的基本向量(“DCT基本向量”)。TN基本向量與DCT基本向量之差可以根據DCT失真來測量。並且當DCT失真小於預定義的臨界值時,TN基本向量可以接近DCT基本向量。DCT失真的計算可以包括轉換的所有或部分基本向量。在一個實施方式中,TN的DCT失真可以計算如下。首先,TN基本向量中的每個向量被規範化。TN基本向量可以通過將TN基本向量中的每個向量除以其自身的範數而被規範化。然後,DCT失真可以使用等式(3)和(4)計算如下:

其中ICTN是規範化的TN,並且DCTN是NxN DCT矩陣,以及

其中S是轉換的基本向量集。S可以包括所有基本向量(例如s可以是{0, 1, 2, …, N-1})或者部分基本向量(例如s可以是{0, 1, 2, 7, 10, …})。
在一個實施方式中,N階整數轉換TN可以具有顯示特定的對稱性和結構的各自的轉換矩陣。這些對稱性和結構可以有利於使用快速演算法,例如這裏公開的演算法。在一個實施方式中,可以使用16位算術來實現對N階整數轉換TN的正轉換、量化、去量化和/或反轉換中的任意一種。
這裏還公開了N階轉換族(family),其中N是8、16以及32。同一族的每個轉換TN可以具有相同的結構(“轉換族結構”)。例如,8階轉換族中的轉換T8可以都具有8階轉換族結構。16階轉換族中的轉換T16可以都具有16階轉換族結構,並且32階轉換族中的轉換T32可以都具有32階轉換族結構。轉換族結構可以允許相應族的每個轉換TN被完全因式分解並且使用快速演算法來實施。除了使用完全因式分解實施之外,每個族的轉換內的許多實施方式(像N階整數轉換,稱為TN)可以:(i)是正交的或近似正交的,並且(ii)具有幾乎相等的範數的基本向量。這些基本向量也可以接近DCT的基本向量。此外,這些實施方式的正轉換、量化、去量化和/或反轉換中的任意一種可以使用被配置為使用16位元算術的結構執行和/或實現。可替換地,所述實施方式的正轉換、量化、去量化和/或反轉換中的任意一種也可以使用被配置為使用其他算術格式之結構執行和/或以配置為使用其它算術格式之結構實現。
N階整數轉換的示例性轉換矩陣

在一個實施方式中,K階轉換TK可以使用中間矩陣(稱為 )來形成。根據一個實施方式,中間矩陣 可以根據中間轉換係數矩陣與偶數奇數分解矩陣的矩陣乘法來表示。中間轉換係數矩陣可以包括偶數部分和奇數部分。將偶數奇數分解矩陣應用到K階轉換TK可以將K階轉換TK分解為偶數部分和奇數部分。偶數部分可以是例如N/2階(即較低階)轉換Tk/2,而奇數部分可以是較低階轉換矩陣Pk/2。在一個實施方式中,中間矩陣 可以表示如下:

其中K=2Z,Z是正整數, 可以是中間轉換係數矩陣,並且 可以是偶數奇數分解矩陣。在該偶數奇數分解矩陣中,IN和JN可以定義如下:

從中間矩陣 到N階轉換矩陣TN的轉換可以如下執行:

例如,根據一個實施方式,用於形成8階轉換T8的中間矩陣(稱為 可以根據中間轉換係數矩陣 與偶數奇數分解矩陣 的矩陣乘法來表示。例如中間矩陣 可以表示如下:

中間轉換係數矩陣 可以包括偶數部分和奇數部分。偶數部分可以是4階轉換T4的轉換矩陣(即較低階N/2,其中N=8),而奇數部分可以是較低階矩陣P4。根據一個實施方式,4階轉換T4(或關於等式(9),“較低階偶數部分矩陣”)可以如下表示:

4階轉換T4的轉換係數可以基於多個因素根據經驗確定。這些因素可以包括:例如,所有轉換係數為整數、4階轉換T4為正交的、T4基本向量範數相等或幾乎相等(例如滿足一個臨界值)、以及T4基本向量接近DCT基本向量(例如滿足DCT失真小於預定義的臨界值的條件)。
根據一個實施方式,較低階矩陣P4(或關於等式(9),“較低階偶數部分矩陣”)可以表示如下:

較低階矩陣P4的元素可以基於多個因素根據經驗確定。這些因素可以包括:例如,所有元素為整數、較低階矩陣P4為正交的、較低階矩陣P4基本向量範數相等或幾乎相等(例如滿足一個臨界值)、以及較低階矩陣P4基本向量接近DCT基本向量(例如滿足DCT失真小於預定義的臨界值的條件)。
偶數奇數分解矩陣的I4和J4可以分別按照上面的等式(6)和(7)來表示。
根據等式(8)-(11),8階整數轉換T8可以表示如下:

在一個實施方式中,N階整數變形TN中的每個可以根據較低階整數轉換來表示。例如,根據一個實施方式,用於形成16階轉換T16的中間矩陣

可以根據中間轉換係數矩陣 與偶數奇數分解矩陣 的矩陣乘法來表示。中間轉換係數矩陣 可以包括偶數部分和奇數部分。偶數部分可以是8階(即較低階)轉換T8,並且奇數部分可以是較低階轉換矩陣P4。中間矩陣 可以表示如下:

其中P8可以定義如下:

基於等式(6)-(8)以及(13)-(14),16階轉換矩陣T16可以表示如下:

在一個實施方式中,N階整數轉換TN中的每個可以根據較低階整數轉換來表示。根據一個實施方式,用於形成32階轉換T32的中間矩陣 可以根據中間轉換係數矩陣 與偶數奇數分解矩陣 的矩陣乘法來表示。中間轉換係數矩陣 可以包括偶數部分和奇數部分。偶數部分可以是16階(即較低階)轉換T16,並且奇數部分可以是較低階矩陣矩陣P16。中間矩陣 可以表示如下:

在一個實施方式中,等式(16)的較低階矩陣P16可以定義如下:

其中 是用於小波分解的較低階中間矩陣,W可以是16x16小波轉換,一個示例可以示出如下:


小波轉換可以是例如哈爾(Haar)轉換。所述小波轉換也可以是其他小波轉換。用於小波分解的較低階中間矩陣中的P8可以是較低階8轉換T8(即N/4即轉換)。基於等式(6)-(8)和(16)-(18),可以產生第2圖中示出的32階轉換矩陣T32
示例操作
參考第1C圖至第1D圖,對於視頻編碼器33和視頻解碼器35,到視頻編碼器33的轉換單元48的輸入的動態範圍與視頻解碼器35的反轉換74的輸出的動態範圍可以相同。對於視頻編碼器33和/或視頻解碼器35中的轉換操作,該動態範圍可以首先被檢測到,並且然後由位元深度(“BD”)表示。舉例來說,如果動態範圍是[-255,255],則BD等於8。如果動態範圍是[-1023,1023],則BD等於10。在確定動態範圍後,可以計算變數ΔBD。例如,變數ΔBD可以計算為BD-8。
隨後,在視頻編碼器33中,預測殘留塊XMXN(其大小是 )在轉換單元48、量化單元50、反量化單元54以及反轉換單元56中被處理。下面更詳細地提供這四個視頻處理的操作。如這裏所使用的,在反量化單元54和反轉換單元56執行的操作可以分別稱為去量化和反轉換。在視頻解碼器35中,在反量化單元74和反轉換單元76中執行的操作通常與在反量化單元54和反轉換單元56中執行的操作相同。

正轉換
到正轉換的輸入可以是預測殘留塊,記作XMxN。為了對XMxN執行2-D正轉換,XMxN中的M列和N行在每個方向連續地轉換,分別稱為水平和垂直正轉換。可以首先形成水平和垂直正轉換。
如果先執行了水平正轉換,則XMxN可以首先右乘 (上標T表示轉置),並且右移適當數量的位元以適應16位元算術。結果可以為UMxN,表示如下:

其中上述TN ,並且“>>”意思是右移。因數ffwd,h用於取整(rounding),並且範圍可以為 。在這裏為了描述簡單,ffwd,h可以等於
在水平正轉換之後可以對中間塊UMxN執行垂直正轉換。垂直正轉換的過程可以如下:

並且因數ffwd,v的範圍可以為 ,並且為了描述簡單, ffwd,h可以等於

但是,如果先執行垂直正轉換,則XMxN可以首先左乘TM,並且右移適當數量的位元以適應16位元算術。結果可以為UMxN,表示如下:


其中因數ffwd,v用於取整,並且範圍可以為 。在這裏為了描述簡單,ffwd,v可以等於
在垂直正轉換之後可以對中間塊UMxN執行水平正轉換。水平正轉換的過程可以如下:

其中因數ffwd,h的範圍應當為 ,並且為了描述簡單,可以等於

量化
量化的輸入可以是2-D正轉換的輸出,即YMxN。用於YMxN中的所有元素的量化過程可以是相同的或不同的。給定元素YMxN(i,j)(0≦i≦ M-1, 0≦j≦N-1)及相關聯的量化步長WMxN(i,j),則量化過程可以如下:

其中fMxN,q(i,j)是用於取整的因數,並且範圍可以為 。在這裏為了描述簡單,fMxN,q(i,j)可以等於 。在等式(23)中,SMxN(i,j)和QMxN(i,j)可以滿足如下關係:




其中 意思是乘以SMxN(i,j),並且然後使用右移QMxN(i,j)位元來接近除以量化步長WMxN(i,j)。可以通過增加右移位元QMxN(i,j)的數量來更加精確接近。
去量化
去量化可以用於使用輸入ZMxN來重新構建YMxN。重新構建的塊記作Y’MxN。從直觀上看,Y’MxN(i,j)可以等於ZMxN(i,j)乘以量化步長WMxN(i,j)。但是WMxN(i,j)不必是整數,並且因此也可以執行類似於(24)的接近以進行去量化,如等式(25)中所示:


類似地,大的 意思是高精度。去量化過程可以如下:



fMxN,dq(i,j)是用於取整的因數,並且範圍應當為 。在這裏為了描述簡單,fMxN,dq(i,j)可以等於和/或取決於 。注意 的值小於0意味著左移,在這種情況下,fMxN,dq(i,j)可以設定為0。
反轉換
到反轉換的輸入可以是去量化塊Y'MxN。為了對Y'MxN執行2-D反轉換,分別使用水平和垂直反轉換對Y'MxN中的M列和N行順序地轉換。可以首先執行水平或垂直反轉換。
如果先執行了水平反轉換,則Y'MxN可以首先右乘TN,並且右移適當數量的位元以適應16位元算術。結果可以為中間塊VMxN,表示如下:

因數finv,h範圍可以為[0,256]。在這裏為了描述簡單,finv,h可以等於128。
在水平反轉換之後可以對中間塊VMxN執行垂直反轉換。垂直反轉換的過程可以如下:


其中因數finv,v的範圍可以為 ,並且為了描述簡單,可以等於
如果先執行垂直反轉換,則Y'MxN可以首先左乘 ,並且右移適當
數量的位元以適應16位元算術。得到的中間塊VMxN表示如下:


因數finv,v用於取整,並且範圍可以為[0,256]。在這裏為了描述簡單, finv,v可以等於128。
在垂直反轉換之後可以對中間塊VMxN執行水平反轉換。水平反轉換的過程可以如下:


其中因數finv,v範圍可以為 ,並且為了描述簡單,可以等於



下表1總結了在以上公開的操作的每個步驟之後的動態範圍(假設在垂直轉換之前執行執行水平轉換)。從表中可以證明,所有過程可以使用16位元算術來實施。
表1 各種操作之後的動態範圍(先執行水平轉換)

正轉換/反轉換的因式分解
正轉換和反轉換的定義包括矩陣乘法,例如等式(19)-(22)和(27)-(30)。對於某些實施平臺,矩陣乘法的複雜度高。這裏提供了矩陣乘法的簡化。至少一些簡化是基於轉換TN的對稱性、奇數部分、用於小波分解的較低階中間矩陣、以及小波分解矩陣等等進行的。
用於轉換的一般部分因式分解
第3A圖至第3B圖是示出用於執行K階轉換的部分因式分解的示例性結構的框圖。第3A圖中示出了用於執行K階轉換 的部分因式分解的示例性正轉換結構、單元或單元(統稱為“單元”)300。正轉換單元300可以分解為兩級。第一級可以包括1級單元302,而第2級可以包括2級單元304、306。假設輸入向量為x=[x0,x1,...,xk-1]T,1級單元302可以適於執行 和x的矩陣乘法,如下:

其中a=[a0,a1,...,ak-1]T是1級單元302的中間轉換結果輸出和2級單元304、306的輸入。2級單元304、306可以將中間轉換結果a分為兩部分,稱為a=[a0,a1,...,ak-1]T的第一半和第二半。中間轉換結果a的第一半稱為[a0,a1,...,ak-1]T,其可以輸入到2.1級單元304中。2.1級單元304可以與Tk/2執行矩陣乘法,例如,表示如下:

其中[f0,f2,...,fk-2]T代表轉換矩陣TN的輸出處的偶數索引的元素。[f0,f2,...,fk-2]T的每個元素對應於轉換矩陣TK的偶數部分的基本向量。另外,注意其是1-D正轉換的輸出。中間轉換結果a的第二半稱為[ak/2,ak/2-1,...,ak-1]T,其可以輸入到2.2級單元306中。2.2級單元306可以與Pk/2執行矩陣乘法,例如,如下:

其中[f1,f3,...,fk-1]T代表轉換矩陣TN的輸出處的奇數索引的元素。[f1,f3,...,fk-1]T的每個元素對應於轉換矩陣TK的奇數部分的基本向量。
第3B圖中示出了用於執行K階轉換 的部分因式分解的示例性反向轉換單元350。反向轉換單元350可以分解為兩級。第一級可以包括1級單元352和354,而第2級可以包括2級單元356。 f=[f0,f1,...,fk-1]T的偶數索引的元素和奇數索引的元素可以首先被單獨地分組,並且如圖所示,分別輸入到1.1級單元352和1.2級單元354。1.1級單元352可以執行 與[f0,f2,...,fk-2]T的矩陣乘法;並且1.2級單元354可以執行 與[f1,f3,...,fk-1]T的矩陣乘法,例如,如下所示:

1.1級單元352和1.2級單元354的輸出可以分別是中間反轉換結果b=[b0,b1,...bk-1]T的第一半和第二半。中間反轉換結果b可以輸入到2級單元356。2級單元356可以執行 與b的矩陣乘法,例如,如下所示:



2級單元356還可以將偶數部分和奇數部分合併成最終輸出轉換係數。
用於32階轉換的示例性因式分解
例如,當K等於32時,用於32階轉換的正轉換2.2級單元306和反轉換1.2級單元354中的每個可以分別被因式分解為兩個級400和450,如第4A圖和第4B圖所示。如第4A圖所示,2.2級單元306可以使用2.2.1級單元402、2.2.2級單元404以及2.2.3級單元406來實施。在單元402、404以及406中完成的矩陣乘法可以如下所示:

其中c=[c0,c1,...c15]T可以是16×1 中間向量。
如第4B圖所示,1.2級單元354可以使用1.2.1級單元452、1.2.2級單元454以及1.2.3級單元456來實施。由單元452、454以及456實施的矩陣乘法可以如下所示:


其中d=[d0,d1,...d15]T可以是16×1 中間向量。

8階轉換的示例性結構
如上所述,轉換矩陣T8可以包括偶數部分較低階轉換矩陣和較低階奇數部分矩陣。較低階偶數部分矩陣可以是例如任意的4階轉換的轉換矩陣T4(例如包括等式(10)的轉換矩陣T4)。較低階偶數部分矩陣可以是P4,該P4可以由10個參數定義,稱為{a, b, c, d, e, f, i, j, h, k},如下所示:


較低階偶數部分矩陣P4可以等於三個N/2階矩陣即 以及 的乘法。也就是說,較低階偶數部分矩陣 。在一個實施方式中,三個N/2階偶數矩陣 以及 可以表示如下:

在一個實施方式中,如等式(33)所示,由2.2級單元306執行的操作可以執行如下:

該等式的意思是與Pk/2進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。類似地,對於反轉換,等式(35)所示的1.2級單元354的操作可以執行如下:

該等式的意思是與 進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。
第5A圖至第5B圖是示出用於執行8階轉換的完全因式分解的示例性結構的框圖。用於參數集{a, b, c, d, e, f, i, j, h, k }的示例性值包括{3, 2, 5, 1, 37, 24, 37, 48, 1, 1}和{3, 2, 5, 1, 144, 99, 72, 99, 0.5, 1}。等式(10)的較低階矩陣P4可以使用例如示例性值{3, 2, 5, 1, 37, 24, 37, 48, 1, 1}被產生。
16階轉換的示例性結構
如上所述,轉換矩陣T16可以包括偶數部分較低階轉換矩陣和較低階奇數部分矩陣。較低階偶數部分矩陣可以是例如任意8階轉換的轉換矩陣T8,包括例如上述標題為“8階轉換的示例性結構”的部分討論的轉換矩陣T8。較低階奇數部分矩陣可以是P8,該P8可以由10個參數定義,這10個參數稱為{a, b, c, d, e, f, g, h, k, l, i, j},如下所示:

較低階奇數部分P8可以等於四個N/2階矩陣的乘法,這四個N/2階矩陣即 以及 。也就是 。在一個實施方式中,四個N/2階矩陣 以及 可以表示如下:

在一個實施方式中,如等式(33)所示的可以由2.2級單元306執行的運算可以執行如下:

該等式的意思是與P8進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。類似地,對於反轉換,如等式(35)所示的1.2級單元354的運算可以執行如下:

該等式的意思是與 進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。
第6A圖至第6B圖是示出用於執行16階轉換的完全因式分解的示例性結構的框圖。下面的表II中示出了用於參數集{a, b, c, d, e, f, g, h, k, l, i, j}的示例性值:



32階轉換的示例性結構
如上所述,轉換矩陣T32可以包括偶數部分較低階轉換矩陣和較低階奇數部分矩陣。較低階偶數部分矩陣可以是例如任意16階轉換的轉換矩陣T16,包括例如上述標題為“16階轉換的示例性結構”的部分討論的轉換矩陣T16。較低階奇數部分矩陣可以是P16,該P16可以由兩個矩陣X和Y的矩陣乘法來定義,即P16=Y×X。然後由等式(33)提供的處理可以分解為兩級,分別如等式(54)和(55)所示:

其中c=[c0,c1,...,c15]是中間結果。類似地,對於反轉換,由等式(35)提供的處理還可以分解為兩級,分別如等式(56)和(57)所示:


其中d=[d0,d1,...,d15] 也是中間結果。
X可以由五(5)個參數{A, a2, B, b1, b2}定義,如下所示:

矩陣X可以等於四個N/2階矩陣即 以及 的乘法。也就是 。在一個實施方式中,這四個N/2階矩陣 以及 可以表示如下:


等式(54)中的運算可以進一步分解和執行如下:



該等式的意思是與X進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。類似地,等式(57)中的運算也可以進一步分解和執行如下:

該等式的意思是與XT進行的矩陣乘法可以完全因式分解為與 以及 順序地進行的矩陣乘法。
第7A圖至第7B圖是示出用於執行32階轉換的完全因式分解的示例性結構的框圖。 用於參數集X {A, a2, B, b1, b2}的示例性值為{3, 2, 5, 2, 5}、{3, 2, 13, 5, 12}、{7, 5, 5, 2, 5}以及{7, 5, 13, 5, 12}。
下面描述對Y進行因式分解的過程,以促進(55)和(56)中的快速演算法。
首先,c中元素可以分組為四個向量,即c0=[c0,c1,c14,c15]、c1=[c2,c3,c12,c13]、c2=[c4,c5,c10,c11]以及c3=[c6,c7,c8,c9]。然後可以分別對c0、c1、c2以及c3應用矩陣乘法,如下所示:


等式(65)-(68)中的四個輸出向量可以形成向量e,  e=[e0,e1,e2,...,e15]其中e與等式(55)中的輸出向量[f1,f3,...,f31]相同。換句話說,通過使用一些重新排序的運算,等式(55)中的16x16矩陣乘法可以因式分解為從等式(65)到(68)的四個4x4矩陣乘法。在等式(65)到(68)中,Y0、Y1、Y2以及Y3可以分別在等式(69)-(72)中定義如下:

下面的表III-VI中示出了用於參數集的示例性值:
表III 用於{e1, f1, g1, h1, j1, k1, m1, n1}的實施方式


表IV 用於{e2, f2, g2, h2, j2, k2, m2, n2}的實施方式

表V 用於{e3, f3, g3, h3, j3, k3, m3, n3}的實施方式

表VI 用於{e4, f4, g4, h4, j4, k4, m4, n4}的實施方式

作為反轉換的一部分,等式(56)中的運算可以按照類似的方式分解。
舉例來說,首先,將等式(56)中的[f1,f3,...,f31]看作向量g,g=[g0,g1,...,g15]。g中的元素可以分組為四個向量:g0=[g0,g8,g7,g15]、g1=[g4,g12,g3,g11]、g2=[g2,g10,g5,g13]以及g3=[g6,g14,g1,g9]。然後分別對g0、g1、g2以及g3應用矩陣乘法,如等式(73)-(76)所示:

等式(73)-(76)中的四個輸出向量可以形成等式(56)中的輸出向量d,d=[d0,d1,d2,...,d15] 。換句話說,通過使用一些重新排序的運算,等式(56)中的16x16矩陣乘法可以因式分解為從等式(73)到(76)的四個4x4矩陣乘法。
示例性正向和反向轉換運算
到正轉換的輸入可以是預測殘留塊,記作XMxN。為了對XMxN執行2-D正轉換,XMxN中的M列和N行在每個維度中順序地轉換,分別稱為水平和垂直正轉換。可以首先形成水平或垂直正轉換。
如果首先執行水平正轉換,則XMxN可以首先右乘 (上標T是轉置)並且右移適當數量的位元以適應16位元算術。結果UMxN可以表示如下:


注意“>>”意思是右移。因數ffwd,h用於取整,並且範圍可以為 。為了描述簡單,ffwd,h可以等於

在水平正轉換之後可以對中間塊UMxN執行垂直正轉換。垂直正轉換的過程可以如下:

其中因數ffwd,v的範圍可以為 ,並且為了描述簡單,可以等於
如果先執行垂直正轉換,則XMxN可以首先左乘TM,並且右移適當數量的位元以適應16位元算術。結果UMxN可以表示如下:


其中因數ffwd,v用於取整,並且範圍可以為 。在這裏為了描述簡單,ffwd,v可以等於
在垂直正轉換之後可以對中間塊UMxN執行水平正轉換。水平正轉換的過程可以如下:

其中因數ffwd,h的範圍可以為 ,並且為了描述簡單,可以等於
到反轉換的輸入是去量化的塊Y'MxN。為了對Y'MxN執行2D反轉換,分別使用水平和垂直反轉換對Y'MxN中的M列和N行以順序的方式進行轉換。可以首先執行水平和垂直反轉換。
如果先執行了水平反轉換,則Y'MxN可以首先右乘TN,並且右移適當數量的位元以適應16位元算術。結果VMxN可以表示如下:



其中因數finv,h範圍可以為 。在這裏為了描述簡單, finv,h可以等於
在水平反轉換之後可以對中間塊VMxN執行垂直反轉換。垂直反轉換的過程可以如下:


其中因數finv,v的範圍可以為 ,並且為了描述簡單,可以等於
如果先執行垂直反轉換,則Y'MxN可以首先左乘 ,並且右移適當數量的位元以適應16位元算術。得到的中間塊VMxN表示如下:

其中因數finv,v用於取整,並且範圍可以為 。在這裏為了描述簡單,finv,v可以等於
在垂直反轉換之後可以對中間塊VMxN執行水平反轉換。水平反轉換的過程可以如下:


其中因數finv,v範圍可以為 ,並且為了描述簡單,可以等於
示例性通信系統
第8圖示出了根據一個非限制性實施方式的通信系統。如圖所示,編碼器802可以經由連接808與通信網路804進行通信。編碼器802可以使用這裏提供的元件和處理。此外,連接808可以是有線連接或無線連接。解碼器806也可以經由連接810與通信網路806進行通信。解碼器806也可以使用這裏提供的元件和處理。此外,連接810可以是有線連接或無線連接。通信網路806可以是任意合適類型的通信系統,如下文參考第9A圖、第9B圖、第9C圖、第9D圖以及第9E圖更詳細提供的。編碼器806可以合併到多種終端中的任意一種終端中,例如(不是用於限制)數位電視、無線通信設備、無線廣播系統、個人數位助理(PDA)、筆記本電腦或桌上型電腦、平板電腦、數位相機、數位記錄設備、視頻遊戲設備、視頻遊戲控制臺、行動或衛星無線電電話、數位媒體播放機等等。
第9A圖是可以在其中可實現一個或多個公開的實施方式的示例通信系統900的示圖。通信系統900可以是用於提供諸如語音、資料、視頻、消息、廣播等內容給多個無線用戶的多重存取系統。通信系統900能夠使得多個無線用戶通過共用系統資源(包括無線頻寬)來存取存取這些內容。例如,通信系統900可以使用一種或多種通道存取方法,例如分碼多重存取(CDMA)、分時多重存取(TDMA)、分頻多重存取(FDMA)、正交FDMA(OFDMA)、單載波FDMA(SC-FDMA)等。
如第9A圖所示,通信系統900可以包括無線發射/接收單元(WTRU)902a、902b、902c、902d和無線電存取網路(RAN)904、核心網路906、公共交換電話網路(PSTN)908、網際網路910和其他網路912,但是應當理解,所公開的實施方式預期了任意數量的WTRU、基地台、網路和/或網路元件。WTRU 902a、902b、902c、902d中的每一個可以是被配置為在無線環境中工作和/或通信的任何類型的設備。舉例來說,WTRU 902a、902b、902c、902d可被配置為發送和/或接收無線信號,並且可包括用戶設備(UE)、移動站、固定或移動用戶單元、傳呼機、行動電話、個人數位助理(PDA)、智慧型電話、膝上型電腦、上網本、個人電腦、無線感測器、消費類電子產品、或者能夠接收和處理壓縮的視頻通信的任意其他終端。
通信系統900還可以包括基地台914a和基地台914b。基地台914a、914b中的每一個可以是任何類型的被配置為與WTRU 902a、902b、902c、902d中的至少一個進行無線連接以便於存取例如核心網路906、網際網路910和/或網路912那樣的一個或多個通信網路的裝置。作為例子,基地台914a、914b可以是基地台收發台(BTS)、節點B、e節點B、家用節點B、家用e節點B、站點控制器、存取點(AP)、無線路由器等等。雖然基地台914a、914b分別被畫為單個元件,但是可以理解基地台914a、914b可以包括任意數量的互連的基地台和/或網路元件。
基地台914a可以是RAN 904的一部分,該RAN 904還可以包括其他基地台和/或網路元件(未示出),例如基地台控制器(BSC)、無線電網路控制器(RNC)、中繼節點等。基地台914a和/或基地台914b可以被配置為在特定地理區域內發送和/或接收無線信號,該特定地理區域被稱作胞元(未示出)。所述胞元還可以被分成胞元磁區。例如,與基地台914a相關聯的胞元被分成三個磁區。如此,在一個實施方式中,基地台914a可以包括三個收發器,即,針對胞元的每個磁區使用一個收發器。在另一實施方式中,基地台914a可以使用多輸入多輸出(MIMO)技術,因此,可以針對胞元的每個磁區使用多個收發器。
基地台914a、914b可以通過空中介面916與WTRU 902a、902b、902c、902d中的一個或多個通信,所述空中介面916可以是任何適當的無線通信鏈路(例如射頻(RF)、微波、紅外線(IR)、紫外線(UV)、可見光等等)。可以使用任何適當的無線電存取技術(RAT)來建立空中介面916。
更具體而言,如上所述,通信系統900可以是多重存取系統且可以採用一種或多種通道存取方案,諸如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 904中的基地台914a和WTRU 902a、902b、902c可以實現諸如通用移動電信系統(UMTS)陸地無線電存取(UTRA)之類的無線電技術,其中該無線電技術可以使用寬頻CDMA(WCDMA)來建立空中介面916。WCDMA可以包括諸如高速封包存取(HSPA)和/或演進型HSPA(HSPA+)之類的通信協定。HSPA可以包括高速下行鏈路封包存取(HSDPA)和/或高速上行鏈路封包存取(HSUPA)。
在另一實施方式中,基地台914a和WTRU 902a、902b、902c可以實現諸如演進型UMTS陸地無線電存取(E-UTRA)之類的無線電技術,其中該無線電技術可以使用LTE和/或高級LTE(LTE-A)來建立空中介面916。
在其他實施方式中,基地台914a和WTRU 902a、902b、902c可以實現諸如IEEE 802.16(即全球互通微波存取(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、臨時標準2000(IS-2000)、臨時標準95(IS-95)、臨時標準856(IS-856)、全球移動通信系統(GSM)、增強型資料速率GSM演進(EDGE)、GSM EDGE(GERAN)等無線電技術。
第9A圖中的基地台914b可以是諸如無線路由器、家用節點B、家用e節點B、或存取點,並且可以利用任何適當的RAT來促進諸如營業場所、家庭、車輛、校園等局部區域中的無線連接。在一個實施方式中,基地台914b和WTRU 902c、902d可以實施諸如IEEE 802.11之類的無線電技術以建立無線區域網路(WLAN)。在另一實施方式中,基地台914b和WTRU 902c、902d可以實施諸如IEEE 802.15之類的無線電技術以建立無線個人區域網路(WPAN)。在另一實施方式中,基地台914b和WTRU 902c、902d可以利用基於胞元的RAT(例如WCDMA、CDMA2000、GSM、LTE、LTE-A等)以建立微微胞元或毫微微胞元。如第9A圖所示,基地台914b可以具有到網際網路910的直接連接。因此,基地台914b可以不需要經由核心網路906存取網際網路910。
RAN 904可以與核心網路906通信,該核心網路906可以是被配置為向WTRU 902a、902b、902c、902d中的一個或多個提供語音、資料、應用程式、和/或網際網路協定語音(VoIP)服務的任何類型的網路。例如,核心網路906可以提供呼叫控制、計費服務、基於移動位置的服務、預付費呼叫、網際網路連接、視頻分發等,和/或執行諸如用戶認證等高級安全功能。雖然第9A圖未示出,但應認識到RAN 904和/或核心網路906可以與跟RAN 904採用相同的RAT或不同的RAT的其他RAN進行直接或間接通信。例如,除連接到可以利用E-UTRA無線電技術的RAN 904之外,核心網路906還可以與採用GSM無線電技術的另一RAN(未示出)通信。
核心網路906還可以充當用於WTRU 902a、902b、902c、902d存取PSTN 908、網際網路910、和/或其他網路912的閘道。PSTN 908可以包括提供普通老式電話服務(POTS)的電路交換電話網路。網際網路910可以包括使用公共通信協定的互連電腦網路和設備的全局系統,所述公共通信協定例如為傳輸控制協定(TCP)/網際協定(IP)網際網路協定族中的TCP、用戶資料報協定(UDP)和IP。網路912可以包括由其他服務提供商所擁有和/或操作的有線或無線通信網路。例如,網路912可以包括連接到可以與RAN 904採用相同的RAT或不同的RAT的一個或多個RAN的另一核心網路。
通信系統900中的某些或全部WTRU 902a、902b、902c、902d可以包括多模式能力,即WTRU 902a、902b、902c、902d可以包括用於通過不同的無線鏈路與不同的無線網路通信的多個收發器。例如,第9A圖所示的WTRU 902c可以被配置為與可以採用胞元式無線電技術的基地台914a通信,且與可以採用IEEE 802無線電技術的基地台914b通信。
第9B圖是示例WTRU 902的系統圖。如第9B圖所示,WTRU902可以包括處理器918、收發器920、發射/接收元件922、揚聲器/麥克風924、數字鍵盤926、顯示器/觸控板928、不可移除記憶體930、可移除記憶體932、電源934、全球定位系統(GPS)晶片組936、以及其他週邊設備938。應認識到WTRU 902可以在保持與實施方式一致的同時,包括前述元件的任何子組合。
處理器918可以是通用處理器、專用處理器、常規處理器、數位信號處理器(DSP)、圖形處理單元(GPU)、多個微處理器、與DSP核相關聯的一個或多個微處理器、控制器、微控制器、專用積體電路(ASIC)、現場可程式閘陣列(FPGA)電路、任何其他類型的積體電路(IC)、狀態機等等。處理器918可以執行信號編碼、資料處理、功率控制、輸入/輸出處理、和/或使得WTRU 902能夠在無線環境中操作的任何其他功能。處理器918可以耦合到收發器920,收發器920可以耦合到發射/接收元件922。雖然第9B圖將處理器918和收發器920描繪為分別的元件,但應認識到處理器918和收發器920可以被一起整合在電子元件或晶片中。
發射/接收元件922可以被配置為通過空中介面916向基地台(例如基地台914a)發射信號或從基地台(例如基地台914a)接收信號。例如,在一個實施方式中,發射/接收元件922可以是被配置為發射和/或接收RF信號的天線。在另一實施方式中,發射/接收元件922可以是被配置為發射和/或接收例如IR、UV、或可見光信號的發射器/檢測器。在另一實施方式中,發射/接收元件922可以被配置為發射和接收RF和光信號兩者。應認識到發射/接收元件922可以被配置為發射和/或接收無線信號的任何組合。
另外,雖然發射/接收元件922在第9B圖中被描繪為單個元件,但個WTRU 902可以包括任何數目的發射/接收元件922。更具體而言,WTRU 902可以採用MIMO技術。因此,在一個實施方式中,WTRU 902可以包括用於通過空中介面916來發射和接收無線信號的兩個或更多個發射/接收元件922(例如多個天線)。
收發器920可以被配置為調變將由發射/接收元件922發射的信號並對由發射/接收元件922接收到的信號進行解調。如上所述,WTRU 902可以具有多模式能力。因此,例如,收發器920可以包括用於使得WTRU 902能夠經由諸如UTRA和IEEE 802.11之類的多種RAT通信的多個收發器。
WTRU 902的處理器918可以耦合到揚聲器/麥克風924、數字鍵盤926、和/或顯示器/觸控板928(例如液晶顯示器(LCD)顯示單元或有機發光二極體(OLED)顯示單元),並且可以從這些元件接收用戶輸入資料。處理器918還可以向揚聲器/擴音器924、數字鍵盤926、和/或顯示器/觸控板928輸出用戶資料。另外,處理器918可以存取來自任意類型的合適的記憶體(例如不可移除記憶體930和可移除記憶體932)的資訊,或者將資料儲存在該記憶體中。不可移除記憶體930可以包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、硬碟、或任何其他類型的記憶體儲存設備。可移除記憶體932可以包括用戶身份單元(SIM)卡、記憶棒、安全數位(SD)儲存卡等。在其他實施方式中,處理器918可以存取來自在物理上不位於WTRU 902上(諸如在伺服器或家用電腦(未示出))的記憶體的資訊並將資料儲存在該記憶體中。
處理器918可以從電源934接收電力,並且可以被配置為分配和/或控制到WTRU 902中的其他元件的電力。電源934可以是用於為WTRU 902供電的任何適當設備。例如,電源934可以包括一個或多個乾電池(例如鎳鎘(NiCd)、鎳鋅(NiZn)、鎳氫(NiMH)、鋰離子(Li)等等)、太陽能電池、燃料電池等等。
處理器918還可以耦合到GPS晶片組936,GPS晶片組936可以被配置為提供關於WTRU 902的當前位置的位置資訊(例如,經度和緯度)。WTRU 902可以通過空中介面916從基地台(例如基地台914a、914b)接收加上或取代GPS晶片組936資訊之位置資訊和/或基於從兩個或更多個附近的基地台接收到信號的時序來確定其位置。應認識到WTRU 902可以在保持與實施方式一致的同時,通過任何適當的位置確定方法來獲取位置資訊。
處理器918還可以耦合到其他週邊設備938,週邊設備938可以包括提供附加特徵、功能和/或有線或無線連接的一個或多個軟體和/或硬體單元。例如,週邊設備938可以包括加速計、電子指南針、衛星收發器、數位相機(用於拍照或視頻)、通用串列匯流排(USB)埠、振動設備、電視收發器、免提耳機、藍芽R單元、調頻(FM)無線電單元、數位音樂播放器、媒體播放器、視頻遊戲機單元、網際網路瀏覽器等等。
第9C圖是根據一個實施方式的RAN 904和核心網路906的系統圖。如上所述,RAN 904可使用UTRA無線電技術通過空中介面916來與WTRU 902a、902b、902c進行通信。該RAN 904還可與核心網路906進行通信。如第9C圖所示,RAN 904可包括節點B 940a、940b、940c,其中每個都可包含一個或多個收發器,以用於通過空中介面916與WTRU 902a、902b、902c進行通信。該節點B 940a、940b、940c中的每一個可與RAN 904內的特定胞元(未示出)相連接。RAN 904還可以包括RNC 942a、942b。應當理解,在與實施方式保持一致的情況下,RAN 904可以包括任何數量的節點B和RNC。
如第9C圖所示,節點B 940a、940b可以與RNC 942a進行通信。此外,節點B 940c可以與RNC 942b進行通信。節點B 940a、940b、940c可以經由Iub介面分別與RNC 942a、942b進行通信。RNC 942a、942b可以通過Iub介面相互通信。RNC 942a、942b的每一個可以被配置為分別控制其所連接的節點B 940a、940b、940c。此外,可將RNC 942a、942b中的每一個可以被配置為執行或支援其他功能,例如外環功率控制、負載控制、許可控制、封包調度、切換控制、巨集分集、安全功能、資料加密等。
第9C圖中所示的核心網路906可以包括媒體閘道(MGW)944、移動交換中心(MSC)946、服務GPRS支援節點(SGSN)948和/或閘道GPRS支持節點(GGSN)950。雖然將前述組件表示為核心網路906的一部分,但是應該理解,這些組件中任何一部分都可由核心網路運營商以外的實體所有和/或操作。
RAN 904中的RNC 942a可經由IuCS介面連接至核心網路906中的MSC 946。可將MSC 946連接至MGW 944。MSC 946和MGW 944可向WTRU 902a、902b、902c提供對例如PSTN 908的電路交換網路的存取,從而促進WTRU 902a、902b、902c與傳統陸線通信設備之間的通信。
還可將RAN 904中的RNC 942a經由IuPS介面連接至核心網路906中的SGSN 948。SGSN 948可連接至GGSN 950。SGSN 948和GGSN 950可向WTRU 902a、902b、902c提供針對例如網際網路910的封包交換網路的存取,從而促進WTRU 902a、902b、902c與IP致能設備之間的通信。
如上所述,還可將核心網路906連接至網路912,網路912可包括由其他服務提供商所有和/或操作的有線或無線網路。
第9D圖是根據另一個實施方式的RAN 904和核心網路906的系統圖。如上所述,RAN 904可使用E-UTRA無線技術通過空中介面916與WTRU 902a、902b和902c通信。RAN 904還可以與核心網路906通信。
RAN 904可包括e節點B 960a、960b、960c,但是應當理解的是在保持與實施方式的一致性的同時RAN 904可以包括任意數量的e節點B。e節點B 960a、960b、960c中的每一個可包括一個或多個收發器,以用於通過空中介面916與WTRU 902a、902b、902c通信。在一個實施方式中,e節點B 960a、960b、960c可以利用MIMO技術。e節點B 960a例如可以使用多天線來向WTRU 902發送無線信號和從其接收無線信號。
e節點B 960a、960b、960c中的每一個可以與特定胞元相關聯(未顯示),並可以被配置為處理無線電資源管理決策、切換決策、上行鏈路和/或下行鏈路中的用戶調度等等。如第9D圖所示,e節點B 960a、960b、960c可以通過X2介面與彼此通信。
第9D圖中所示的核心網路906可以包括移動性管理閘道閘道(MME)962、服務閘道964、和封包資料網路(PDN)閘道966等。雖然前述單元的每一個顯示為核心網路906的一部分,但是應當理解這些單元中的任意一個都可以由除了核心網路運營商之外的其他實體擁有和/或運營。
MME 962可以經由S1介面連接到RAN 904中的e節點B 960a、960b、960c中的每一個,並作為控制節點。例如,MME 962可以負責認證WTRU 902a、902b、902c的用戶、承載啟動/去啟動、在WTRU 902a、902b、902c的初始附著期間選擇特定服務閘道等等。MME 962還可以提供控制平面功能以用於在RAN 904和使用其他無線電技術例如GSM或者WCDMA的其他RAN(未顯示)之間切換。
服務閘道964可以經由S1介面連接到RAN 904中的e節點B 960a、960b、960c中的每一個。服務閘道964通常可以向/從WTRU 902a、902b、902c路由和轉發用戶資料封包。服務閘道964還可以執行其他功能,例如在e節點B間切換期間錨定用戶平面、當下行鏈路資料對於WTRU 902a、902b、902c可用時觸發傳呼、管理和儲存WTRU 902a、902b、902c的上下文等等。
服務閘道964還可以被連接到PDN閘道966,PDN閘道966可以向WTRU 902a、902b、902c提供到封包交換網路(例如網際網路910)的存取,以便於WTRU 902a、902b、902c與IP致能設備之間的通信。
核心網路906可以便於與其他網路的通信。例如,核心網路906可以向WTRU 902a、902b、902c提供到電路交換網路(例如PSTN 908)的存取,以便於WTRU 902a、902b、902c與傳統陸地線路通信設備之間的通信。例如,核心網路906可以包括IP閘道(例如IP多媒體子系統(IMS)伺服器),或者與之通信,該IP閘道作為核心網路906與PSTN 908之間的介面。另外,核心網路906可以向WTRU 902a、902b、902c提供到網路912的存取,該網路912可以包括其他服務提供商擁有和/或操作的有線或無線網路。
第9E圖是根據另一個實施方式的RAN 904和核心網路906的系統圖。RAN 904可以是採用IEEE 802.16無線電技術以通過空中介面916與WTRU 902a、902b、902c通信的存取服務網路(ASN)。如下所述,WTRU 902a、902b、902c、RAN 904、以及核心網路906的不同功能實體之間的通信鏈路可以定義為參考點。
如第9E圖所示,RAN 904可以包括基地台970a、970b、970c以及ASN閘道972,但是應當理解的是在與實施方式保持一致的同時,RAN 904可以包括任意數量的基地台和ASN閘道。基地台970a、970b、970c每個可以與RAN 904中的特定胞元(未示出)相關聯,並且每個可以包括一個或多個收發器,以通過空中介面916與WTRU 902a、902b、902c通信。在一個實施方式中,基地台970a、970b、970c可以實施MIMO技術。從而,舉例來說,基地台970a可以使用多個天線來傳送無線信號給WTRU 902a,並且接收來自該WTRU 902a的信號。基地台970a、970b、970c還可以提供移動性管理功能,例如切換觸發、隧道建立、無線電資源管理、訊務分類、服務品質(QoS)策略實施等等。ASN閘道972可以用作訊務彙聚點,並且可以負責傳呼、緩存用戶簡檔、路由到核心網路906等等。
WTRU 902a、902b、902c與RAN 904之間的空中介面916可以被定義為實施IEEE 802.16規範的R1參考點。另外,WTRU 902a、902b、902c中的每個WTRU可以建立與核心網路906的邏輯介面(未示出)。WTRU 902a、902b、902c與核心網路906之間的邏輯介面可以定義為R2參考點,該R2參考點可以用於認證、授權、IP主機管理、和/或移動性管理。
基地台970a、970b、970c中的每個基地台之間的通信鏈路可以定義為R8參考點,該R8參考點可以包括用於促進WTRU切換和基地台之間的資料傳遞的協定。基地台970a、970b、970c與ASN閘道972之間的通信鏈路可以定義為R6參考點。R6參考點可以包括用於促進基於與WTRU 902a、902b、902c中的每個WTRU相關聯的移動性事件的移動性管理的協定。
如第9E圖所示,RAN 904可以連接到核心網路906。RAN 904與核心網路906之間的通信鏈路可以定義為R3參考點,該R3參考點包括用於促進例如資料傳遞和移動性管理能力的協定。核心網路906可以包括移動IP家用代理(MIP-HA)974、認證、授權、記賬(AAA)伺服器976、以及閘道978。雖然前述元件中的每個元件被描述為核心網路906的一部分,但是可以理解這些元件中的任意元件都可以由除核心網路運營商之外的實體擁有和/或運營。
MIP-HA 974可以負責IP位址管理,並使得WTRU 902a、902b、902c能夠在不同ASN和/或不同核心網路之間進行漫遊。MIP-HA 974可以為WTRU 902a、902b、902c提供針對封包切換網路(例如網際網路910)的存取,以促進WTRU 902a、902b、902c與IP致能設備之間的通信。AAA伺服器976可以負責用戶認證和支援用戶服務。閘道978可以促進與其他網路的互通。例如,閘道978可以為WTRU 902a、902b、902c提供針對電路交換網路(例如PSTN 908)的存取,以促進WTRU 902a、902b、902c與傳統陸線通信設備之間的通信。例如,閘道978可以為WTRU 902a、902b、902c提供針對網路912(可以包括由其他服務提供商擁有和/或操作的其他有線或無線網路)的存取。
雖然在第9E圖中沒有示出,但是可以理解的是RAN 904可以連接到其他ASN,並且核心網路906可以連接到其他核心網路。RAN 904與其他ASN之間的通信鏈路可以被定義為R4參考點,該R4參考點可以包括用於協調WTRU 902a、902b、902c在RAN 904與其他RAN之間的移動性。核心網路906與其他核心網路之間的通信鏈路可以被定義為R5參考,該R5參考可以包括用於促進本地核心網路與受訪核心網路之間的互通的協定。
實施例
下面提供用於整數轉換和/或整數轉換運算、用於對資料(例如殘留視頻資料)進行轉換的方法、設備和系統的不同實施例。在一個實施例(“第一實施例”)中,一種設備可以包括處理器和記憶體。記憶體可以包括一組轉換矩陣、以及能夠由所述處理器執行以使用所述一組轉換矩陣中的任意矩陣來對資料(例如殘留視頻資料)進行轉換的指令。所述一組轉換矩陣中的每個轉換矩陣是正交的,並且具有不同數量的元素。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之間的差值滿足給定的臨界值,並且所述基本向量大致接近離散餘弦轉換(DCT)矩陣的對應基本向量。
在一個實施例(“第二實施例”)中,所述一組轉換矩陣中的每個轉換矩陣可以近似正交,具有不同數量的元素,並且能夠完全因式分解。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之間的差值可以滿足給定的臨界值;並且所述基本向量可以接近DCT矩陣的對應基本向量。
在一個實施例中,例如在第一實施例和/或第二實施例中,給定的臨界值可以是以下臨界值:當滿足該臨界值時,該臨界值指示所述基本向量的範數之間的差值不大(例如在某一精度程度內)。
在一個實施例中,例如在第一實施例和/或第二實施例中,給定的臨界值可以是以下臨界值:當滿足該臨界值時,該臨界值指示所述基本向量的範數大致相等。
在一個實施例中,例如在第一實施例、第二實施例和/或任意隨後提供的在前的實施例(“相關實施例”)中,根據失真的測量,所述基本向量接近離散餘弦轉換(DCT)矩陣的對應基本向量(例如根據滿足預定義的臨界值的失真的測量)。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述失真的測量可以基於DCT矩陣。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述失真的測量可以至少基於基本向量和DCT矩陣的對應基本向量的一部分。

在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述失真的測量可以至少部分根據等式(3)和(4)來定義,其中DCTN是具有M×N個元素的DCT矩陣,S是從一組轉換矩陣中選擇的轉換矩陣的一組基本向量,ICTN是具有M×N個元素的選擇的轉換矩陣並且其具有的每個基本向量是標準化的,並且 是DCTN的轉置矩陣。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,一組基本向量可以包括選擇的轉換矩陣的一些或所有基本向量。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,一組轉換矩陣中的每個轉換矩陣可以分解為偶數部分和奇數部分。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,一組轉換矩陣中的每個轉換矩陣可以包括2Nx2N個元素,並且N可以是正數。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,偶數部分和奇數部分的每個可以包括2N-1x2N-1個元素。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,偶數部分可以由因數M縮放,並且M可以是正數。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,由奇數部分進行的轉換可以包括將2N-2階轉換應用到從一層小波分解得到的每個子帶的結果。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述結果可以由因數M縮放,並且M可以是正數。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述小波轉換可以是哈爾(Haar)轉換。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述記憶體還可以包括:能夠由所述處理器執行以產生所述一組轉換矩陣並將該組轉換矩陣儲存在所述記憶體中的指令。
在一個實施例中,例如在第一實施例、第二實施例和/或任意相關實施例中,所述設備可以是視頻編碼器、視頻解碼器以及WTRU中的任意一者。
在一個實施例(“第三實施例”)中,一種有形的電腦可讀儲存媒介可以在其上儲存一組轉換矩陣和能夠由所述處理器執行以使用所述一組轉換矩陣中的任意矩陣來對資料(例如殘留視頻編碼)進行轉換的指令。所述一組轉換矩陣中的每個轉換矩陣可以是正交的,並且可以具有不同數量的元素。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之間的差值可以滿足給定的臨界值;並且所述基本向量接近DCT矩陣的對應基本向量。
在一個可替換的第三實施例中,所述一組轉換矩陣中的每個轉換矩陣可以是近似正交的,具有不同數量的元素,並且可完全因式分解。各個數量的元素中的每個元素是整數。每個轉換矩陣的基本向量的範數之間的差值可以滿足給定的臨界值;並且所述基本向量可以接近離散餘弦轉換(DCT)矩陣的對應基本向量。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述給定的臨界值可以是以下臨界值:當滿足該臨界值時,該臨界值指示所述基本向量的範數差別不大(例如在某一精度程度內)。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述給定的臨界值可以是以下臨界值:當滿足該臨界值時,該臨界值指示所述基本向量的範數大致相等。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,根據失真的測量,所述基本向量可以接近DCT矩陣的對應基本向量。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,根據滿足預定義的臨界值的失真的測量,所述基本向量可以接近DCT矩陣的對應基本向量。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述失真的測量可以是基於DCT矩陣的。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述失真的測量可以是至少基於基本向量和DCT矩陣的對應基本向量的一部分。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述失真的測量可以至少部分根據等式(3)和(4)來定義,其中DCTN是具有M×N個元素的DCT矩陣,S是從一組轉換矩陣中選擇的轉換矩陣的一組基本向量,ICTN是具有M×N個元素的選擇的轉換矩陣並且其具有的每個基本向量是標準化的,並且 是DCTN的轉置矩陣。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,一組基本向量包括選擇的轉換矩陣的一些或所有基本向量。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,一組轉換矩陣中的每個轉換矩陣可以分解為偶數部分和奇數部分。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,一組轉換矩陣中的每個轉換矩陣可以包括2Nx2N個元素,並且N可以是正數。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,一組轉換矩陣中的每個轉換矩陣可以分解為偶數部分和奇數部分,並且偶數部分和奇數部分的每個包括2N-1x2N-1個元素。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,偶數部分可以由因數M縮放,並且M可以是正數。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,由奇數部分進行的轉換可以包括將2N-2階轉換應用到從一層小波分解得到的每個子帶的結果。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述結果可以由因數M縮放,並且M可以是正數。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述小波轉換可以是哈爾轉換。
在一個實施例中,例如在第三實施例、可替換的第三實施例和/或任意相關實施例中,所述有形的電腦可讀儲存媒介可以在其上儲存可由處理器執行以產生一組轉換矩陣的指令。
在一個實施例(“第四實施例”)中,一種用於形成N階整數轉換的轉換矩陣(“N階轉換矩陣”)以對殘留視頻資料進行轉換的方法,該方法可以包括:使用較低階轉換矩陣來形成中間轉換矩陣的偶數部分。該方法可以包括:獲得較低階轉換矩陣的較低階奇數部分。該方法可以包括通過使用較低階轉換矩陣的較低階奇數部分處理小波轉換的低頻子帶和高頻子帶的每個來形成中間轉換矩陣的奇數部分。該方法可以包括也將中間轉換矩陣應用到偶數-奇數組合矩陣。
在一個實施例中,例如在第四實施例中,獲得較低階奇數部分可以包括使用偶數-奇數分解矩陣來將較低階轉換矩陣分解為較低階奇數部分和較低階偶數部分。
在一個實施例中,例如在第四實施例和/或任意相干實施例中,N階轉換矩陣的每個基本向量可以具有各個數量的零交叉,並且該方法還包括:基於零交叉的數量對基本向量進行重新排序。
在一個實施例中,例如在第四實施例和/或任意相關實施例中,對基本向量進行重新排序可以包括通過增加零交叉的數量來對基本向量進行重新排序。
在一個實施例中,例如在第四實施例和/或任意相關實施例中,較低階轉換矩陣可以包括根據經驗確定的轉換係數。
在一個實施例中,例如在第四實施例和/或任意相關實施例中,小波轉換可以是哈爾轉換。
在一個實施例(“第五實施例”)中,一種被配置成形成N階整數轉換的轉換矩陣(“N階轉換矩陣”)以對殘留視頻資料進行轉換的設備,該設備可以包括:處理器和記憶體。該記憶體可以包括可由處理器執行的指令。該指令可以包括可由處理器執行以下操作的指令:(i)使用較低階轉換矩陣來形成中間轉換矩陣的偶數部分,(ii)獲得較低階轉換矩陣的較低階奇數部分,(iii)通過使用較低階轉換矩陣的較低階奇數部分處理小波轉換的低頻子帶和高頻子帶中的每個來形成中間轉換矩陣的奇數部分,和/或(iv)將中間轉換矩陣應用到偶數-奇數組合矩陣。
在一個實施例中,例如在第五實施例中,可由處理器執行以獲得較低階奇數部分的指令可以包括可由處理器執行以使用偶數-奇數分解矩陣來將較低階轉換矩陣分解為較低階奇數部分和較低階偶數部分的指令。
在一個實施例中,例如在第五實施例和/或任意相關實施例中,N階轉換矩陣的每個基本向量可以具有各個數量的零交叉,並且所述指令可以包括可由處理器執行以基於零交叉的數量對基本向量進行重新排序的指令。
在一個實施例中,例如在第五實施例和/或任意相關實施例中,可由處理器執行以對基本向量進行重新排序的指令可以包括可由處理器執行以通過增加零交叉的數量來對基本向量進行重新排序的指令。
在一個實施例中,例如在第五實施例和/或任意相關實施例中,較低階轉換矩陣可以包括根據經驗確定的轉換係數。
在一個實施例中,例如在第五實施例和/或任意相關實施例中,小波轉換可以包括哈爾轉換。
在一個實施例(“第六實施例”)中,一種用於形成N階整數轉換矩陣以對殘留視頻資料進行轉換的方法,該方法可以包括:將N階轉換矩陣分解為偶數部分和奇數部分。該方法可以包括:使用小波轉換將奇數部分分解為第一和第二子帶。該方法可以包括:使用較低N/4階轉換矩陣來處理第一子帶和第二子帶中的每個。
在一個實施例中,例如在第六實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例中,例如在第六實施例和/或任意相關實施例中,小波轉換可以是哈爾轉換。
在一個實施例(“第七實施例”)中,一種被配置用於形成N階整數轉換矩陣以對殘留視頻資料進行轉換的設備,該設備可以包括:處理器和記憶體。該記憶體可以包括可由處理器執行的指令。該指令可以包括可由處理器執行以下操作的指令:(i)將N階轉換矩陣分解為偶數部分和奇數部分,(ii)使用小波轉換將奇數部分分解為第一子帶和第二子帶,和/或(iii)使用較低的N/4階轉換矩陣來處理第一子帶和第二子帶的每個。
在一個實施例中,例如在第七實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例(“第八實施例”)中,一種使用N階整數轉換來處理殘留視頻資料的方法,該方法可以包括:在預處理(precondition)單元處接收殘留視頻資料的向量。該方法可以包括:在預處理單元處處理殘留視頻資料的向量以形成用於轉換的第一和第二中間輸出向量。該方法可以包括:分別在第一和第二較低階轉換單元處接收第一和第二中間輸出向量。該方法可以包括:在第一較低階轉換單元處對第一中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數。該方法可以包括:在第二較低階轉換單元處對第二中間輸出向量進行轉換,以使用N/2階整數矩陣基於N/4階奇數部分矩陣來形成奇數索引的轉換係數。
在一個實施例中,例如在第八實施例中,在預處理單元處處理殘留視頻資料的向量可以包括將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第八實施例和/或任意相關實施例中,在第一較低階轉換單元處對第一中間輸出向量進行轉換可以包括將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括N/2階整數轉換矩陣。
在一個實施例中,例如在第八實施例和/或任意相關實施例中,在第二較低階轉換單元處對第二中間輸出向量進行轉換可以包括產生第二中間輸出向量的第一子帶和第二子帶,和/或將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第八實施例和/或任意相關實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例(“第九實施例”)中,一種被配置成使用N階整數轉換來處理殘留視頻資料的設備,該設備可以包括:預處理單元、第一較低階轉換單元以及第二較低階轉換單元。所述預處理單元可以適於接收殘留視頻資料的向量。所述預處理單元可以適於處理殘留視頻資料的向量以形成用於轉換的第一和第二中間輸出向量。第一較低階轉換單元以及第二較低階轉換單元可以分別適於接收第一中間輸出向量和第二中間輸出向量。第一較低階轉換單元可以適於對第一中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數。第二較低階轉換單元可以適於對第二中間輸出向量進行轉換,以使用N/2階整數轉換基於N/4階奇數部分矩陣來形成奇數索引的轉換係數。
在一個實施例中,例如在第九實施例中,所述預處理單元可以適於在形成用於轉換的第一中間輸出向量和第二中間輸出向量時,將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第九實施例和/或任意相關實施例中,第一較低階轉換單元可以適於在對第一中間輸出向量進行轉換時,將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括N/2階整數轉換矩陣。
在一個實施例中,例如在第九實施例和/或任意相關實施例中,第二較低階轉換單元可以適於產生第二中間輸出向量的第一子帶和第二子帶,並且在對第二中間輸出向量進行轉換時,將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第九實施例和/或任意相關實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例(“第十實施例”)中,一種使用N階整數轉換來處理殘留視頻資料的方法,該方法可以包括:在預處理單元處接收殘留視頻資料的多個向量。該方法可以包括:在預處理單元處處理所述向量以形成各自的用於轉換的第一和第二中間輸出向量。該方法可以包括:分別在第一和第二較低階單元處接收第一和第二中間輸出向量。該方法可以包括:在第一較低階轉換單元處對第一中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數的第一集合。該方法可以包括:在第二較低階轉換單元處對第二中間輸出向量進行轉換,以使用N/2階整數矩陣基於N/4階奇數部分矩陣來形成奇數索引的轉換係數的第一集合。該方法可以包括:在預處理單元處接收從偶數索引的轉換係數的第一集合和奇數索引的轉換係數的第一集合形成的轉換矩陣的多個向量。該方法可以包括:在預處理單元處處理所述向量以形成各自的用於轉換的第三和第四中間輸出向量。該方法可以包括:分別在第一和第二較低階轉換單元處接收第三和第四中間輸出向量。該方法可以包括:在第一較低階轉換單元處對第三中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數的第二集合。該方法可以包括:在第二較低階轉換單元處對第四中間輸出向量進行轉換,以使用N/2階整數矩陣基於N/4階奇數部分矩陣來形成奇數索引的轉換係數的第二集合。
在一個實施例中,例如在第十實施例中,在預處理單元處劃分殘留視頻資料的向量可以包括將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,在第一較低階轉換單元處對第一中間輸出向量進行轉換可以包括將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或可以是N/2階整數轉換。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,在第二較低階轉換單元處對第二較低階中間輸出向量進行轉換可以包括產生第二中間輸出向量的第一子帶和第二子帶,和/或將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,在預處理單元處劃分所述向量可以包括將基本向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,在第一較低階轉換單元處對第三中間輸出向量進行轉換可以包括將中間轉換矩陣的偶數部分應用到第三中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或可以是N/2階整數轉換。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,在第二較低階轉換單元處對第四中間輸出向量進行轉換可以包括產生第二中間輸出向量的第一子帶和第二子帶,和/或將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例中,例如在第十實施例和/或任意相關實施例中,預處理單元、第一較低階轉換單元以及第二較低階轉換單元中的任意一者適於使用16位元算術來用於處理。
在一個實施例(“第十一實施例”)中,一種使用N階整數轉換來處理殘留視頻資料的設備,該設備可以包括:預處理單元、第一較低階轉換單元以及第二較低階轉換單元。所述預處理單元可以適於接收殘留視頻資料的多個向量。所述預處理單元可以適於處理所述向量以形成用於轉換的各自的第一和第二中間輸出向量。第一較低階轉換單元以及第二較低階轉換單元可以分別適於接收第一和第二中間輸出向量。第一較低階轉換單元可以適於對第一中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數的第一集合。第二較低階轉換單元可以適於對第二中間輸出向量進行轉換,以使用N/2階整數矩陣基於N/4階奇數部分矩陣來形成奇數索引的轉換係數的第一集合。預處理單元可以適於接收從偶數索引的轉換係數的第一集合和奇數索引的轉換係數的第一集合形成的轉換矩陣的多個向量。預處理單元可以適於處理所述向量以形成各自的用於轉換的第三和第四中間輸出向量。第一較低階轉換單元和第二較低階轉換單元可以適於分別接收第三和第四中間輸出向量。第一較低階轉換單元可以適於對第三中間輸出向量進行轉換,以使用N/2階整數轉換的基本向量來形成偶數索引的轉換係數的第二集合。第二較低階轉換單元可以適於對第四中間輸出向量進行轉換,以使用N/2階整數矩陣基於N/4階奇數部分矩陣來形成奇數索引的轉換係數的第二集合。
在一個實施例中,例如在第十一實施例中,所述預處理單元可以適於在形成用於轉換的第一中間輸出向量和第二中間輸出向量時,將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,第一較低階轉換單元處可以適於在對第一中間輸出向量進行轉換時,將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或可以是N/2階整數轉換。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,第二較低階轉換單元可以適於產生第二中間輸出向量的第一子帶和第二子帶,並且在對第二中間輸出向量進行轉換時,將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,所述預處理單元可以適於在形成用於轉換的第三中間輸出向量和第四中間輸出向量時,將基礎向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,第一較低階轉換單元可以適於在對第三中間輸出向量進行轉換時,將中間轉換矩陣的偶數部分應用到第三中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或可以是N/2階整數轉換。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,第二較低階轉換單元可以適於產生第二中間輸出向量的第一子帶和第二子帶,並且在對第四中間輸出向量進行轉換時,將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,第一子帶和第二子帶可以分別是低頻子帶和高頻子帶。
在一個實施例中,例如在第十一實施例和/或任意相關實施例中,預處理單元、第一較低階轉換單元以及第二較低階轉換單元中的任意一者適於使用16位元算術來用於處理。
在一個實施例(“第十二實施例”)中,一種使用N階整數轉換來處理殘留視頻資料的方法,該方法可以包括:在第一預處理單元處接收殘留視頻資料的向量,以及在第一預處理單元處處理殘留視頻資料的向量以形成用於轉換的第一和第二中間輸出向量。該方法可以包括:在第一轉換單元處接收第一中間輸出向量以及在第一轉換單元處對第一中間輸出向量進行轉換,以使用N/2階整數偶數部分轉換矩陣和N/2階整數奇數部分矩陣的基本向量來形成偶數索引的轉換係數。該方法可以包括:在第二轉換單元處接收第二中間輸出向量以及在第二轉換單元處對第二中間輸出向量進行轉換,以通過對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理來形成奇數索引的轉換係數。N/2階整數矩陣可以一起對N階轉換矩陣的奇數部分進行因式分解。
在一個實施例中,例如在第十二實施例中,連續的N/2階整數矩陣可以基於N/4階奇數部分矩陣,並且對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理可以包括產生第二中間輸出向量的第一子帶和第二子帶,和/或將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,在第一轉換單元處對第一中間輸出向量進行轉換可以包括將中間轉換矩陣的偶數部分應用到第一中間輸出向量,中間轉換矩陣的偶數部分可以包括或者可以是較低階轉換矩陣。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,在預處理單元處處理殘留視頻資料的向量可以包括將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,N階整數轉換可以是8階整數轉換,並且連續的N/2階整數矩陣可以包括或可以是三個連續的4階整數矩陣。
在一個實施例中,例如在之前的實施例中,第一個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱,第二個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,並且第三個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,N階整數轉換可以是16階整數轉換,並且連續的N/2階整數矩陣可以包括或可以是四個連續的8階整數矩陣。
在一個實施例中,例如在之前的實施例中,第一個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱,第二個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,第三個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,並且第四個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,N階整數轉換可以是8階整數轉換,並且對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理可以包括:(i)對通過第一個4階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個4階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,和/或對通過第三個4階整數矩陣的中間轉換元素的第二集合進行處理,以形成奇數索引的轉換係數。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,N階整數轉換可以是16階整數轉換,並且對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理可以包括:(i)對通過第一個8階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個8階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,(iii)對通過第三個8階整數矩陣的中間轉換元素的第二集合進行處理,以形成中間轉換元素的第三集合,和/或(iv)對通過第四個8階整數矩陣的中間轉換元素的第三集合進行處理,以形成奇數索引的轉換係數。
在一個實施例中,例如在第十二實施例和/或任意相關實施例中,N階整數轉換可以是32階整數轉換,並且對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理可以包括:(i)對通過第一個16階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個16階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,(iii)對通過第三個16階整數矩陣的中間轉換元素的第二集合進行處理,以形成中間轉換元素的第三集合,對通過第四個16階整數矩陣的中間轉換元素的第三集合進行處理,以通過各個4階整數矩陣將中間轉換元素的第三集合分解為用於轉換的四個向量,和/或(iv)將四個向量中的每個向量應用到各個4階整數矩陣以形成奇數索引的轉換係數。
在一個實施例(“第十三實施例”)中,一種用於使用N階整數轉換來處理殘留視頻資料的設備,該設備可以包括:預處理單元、第一轉換單元以及第二轉換單元。預處理單元處可以適於接收殘留視頻資料的向量。預處理單元處可以適於處理殘留視頻資料的向量以形成用於轉換的第一和第二中間輸出向量。第一轉換單元可以適於接收第一中間輸出。第一轉換單元可以適於對第一中間輸出向量進行轉換,以使用N/2階整數偶數部分轉換矩陣和N/2階整數奇數部分矩陣的基本向量來形成偶數索引的轉換係數。第二轉換單元可以適於接收第二中間輸出向量。第二轉換單元可以適於對第二中間輸出向量進行轉換,以通過對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理來形成奇數索引的轉換係數。N/2階整數矩陣可以一起對N階整數轉換矩陣的奇數部分進行因式分解。
在一個實施例中,例如在第十三實施例中,連續的N/2階整數矩陣可以基於N/4階奇數部分矩陣,並且第二轉換單元可以適於產生第二中間輸出向量的第一子帶和第二子帶,並且在對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理時將N/4階奇數部分矩陣應用到第一子帶和第二子帶中的每個子帶。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,第一轉換單元可以適於在對第一中間輸出向量進行轉換時將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或者可以是較低階轉換矩陣。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,預處理單元可以適於在形成用於轉換的第一和第二中間輸出向量時,將殘留視頻資料的向量應用到用於轉換的偶數-奇數分解矩陣。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,第一轉換單元可以適於在對第一中間輸出向量進行轉換時,將中間轉換矩陣的偶數部分應用到第一中間輸出向量,並且中間轉換矩陣的偶數部分可以包括或可以是較低階轉換矩陣。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,N階整數轉換可以是8階整數轉換,並且連續的N/2階整數矩陣可以包括或可以是三個連續的4階整數矩陣。
在一個實施例中,例如在之前的實施例中,第一個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱,第二個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,並且第三個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,N階整數轉換可以是16階整數轉換,並且連續的N/2階整數矩陣可以包括或可以是四個連續的4階整數矩陣。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,第一個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱,第二個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,第三個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,並且第四個連續的8階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,其中N階整數轉換可以是16階整數轉換,並且連續的N/2階整數矩陣可以包括或可以是四個連續的4階整數矩陣。
在一個實施例中,例如在之前的實施例中,第一個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱,第二個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,第三個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的零對稱,並且第四個連續的4階整數矩陣可以包括沿著一條對角線的偶對稱和沿著另一條對角線的奇對稱。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,N階整數轉換可以是8階整數轉換,並且當對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理時,第二轉換單元可以適於:(i)對通過第一個4階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個4階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,和/或(iii)對通過第三個4階整數矩陣的中間轉換元素的第二集合進行處理,以形成奇數索引的轉換係數。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,N階整數轉換可以是16階整數轉換,並且當對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理時,第二轉換單元可以適於:(i)對通過第一個8階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個8階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,(iii)對通過第三個8階整數矩陣的中間轉換矩陣的第二集合進行處理,以形成中間轉換元素的第三集合,和/或(iv)對通過第四個8階整數矩陣的中間轉換元素的第三集合進行處理,以形成奇數索引的轉換係數。
在一個實施例中,例如在第十三實施例和/或任意相關實施例中,N階整數轉換可以是32階整數轉換,並且當對通過連續的N/2階整數矩陣的第二中間輸出向量進行處理時,第二轉換單元可以適於:(i)對通過第一個16階整數矩陣的第二中間輸出向量進行處理,以形成中間轉換元素的第一集合,(ii)對通過第二個16階整數矩陣的中間轉換元素的第一集合進行處理,以形成中間轉換元素的第二集合,(iii)對通過第三個16階整數矩陣的中間轉換元素的第二集合進行處理,以形成中間轉換元素的第三集合,(iv)對通過第四個16階整數矩陣的中間轉換元素的第三集合進行處理,以通過各個4階整數矩陣將中間轉換元素的第三集合分解為用於轉換的四個向量,和/或將四個向量中的每個向量應用到各個4階整數矩陣以形成奇數索引的轉換係數。
結語
雖然上文以特定的組合描述了本發明的特徵和元素,但本領域的技術人員應認識到每個特徵或元素都可以被單獨地使用或與其他特徵和元素以任何方式組合使用。另外,可以在結合在電腦可讀媒體中的電腦程式、軟體、或固件中實施本發明所述的方法,以便由電腦或處理器執行。電腦可讀媒體的例子包括電信號(通過有線或無線連接發送的)和電腦可讀儲存媒體。電腦可讀儲存媒體的示例包括但不限於唯讀記憶體(ROM)、隨機存取記憶體(RAM)、暫存存器、快取記憶體、半導體記憶體裝置、磁媒體(諸如內部硬碟和可移動磁片)、磁光媒體、以及光學媒體,諸如CD-ROM磁片和數位多功能磁片(DVD)。與軟體相關聯的處理器可以用於實現射頻收發器,以在WTRU、UE、終端、基地台、RNC或任意主機中使用。
在不偏離本發明的範圍的情況下,以上的方法、設備以及系統的變化是可行的。根據可以應用的多種實施方式,可以理解所示出的實施方式僅是示例,並且不應被看作是對申請專利範圍的範圍的限制。例如,這裏提供的實施方式包括手持設備,該手持設備可以包括用於提供任意合適的電壓的任意合適的電源,或者可以與該電源一起使用,例如電池等。
此外,在上面提供的實施方式中,注意處理平臺、計算系統、控制器、以及包含處理器的其他設備。這些設備可以包含至少一個中央處理單元(“CPU”)和記憶體。根據電腦程式領域的技術人員的實踐,引用的動作和符號表示的操作或指令可以由不同CPU和記憶體執行。這種動作和操作或指令可以稱為被“執行”、“電腦執行”或“CPU執行”。
本領域技術人員可以理解所述動作和符號表示的操作或指令包括由CPU操作的電信號。電子系統表示以下資料位元:該資料位元可以引起得到轉換或減少電子信號以及維護儲存系統中的儲存位置處的資料位元,從而重配置或以其他方式改變CPU的操作以及對信號進行其他處理。維護資料位元所在的儲存位置是具有特定電、磁、光、或者對應或代表資料位元的有機特性的物理位置。應當理解示例性實施方式不限於上述平臺或CPU以及可以支援提供的方法的其他平臺和CPU。
資料位元也可以維護在電腦可讀媒介上,該電腦可讀媒介包括磁片、光碟、以及任意其他CPU可讀的揮發性(例如隨機存取記憶體(“RAM”))或非揮發性(例如隨機存取記憶體(“RAM”))大容量儲存系統。電腦可讀媒介可以包括協作或互連的電腦可讀媒介,該電腦可讀媒介排他性地存在於處理系統上或分佈在處理系統本地或遠端的多個互連的處理系統之間。應當理解的是示例性實施方式不限於上述記憶體並且其他平臺和記憶體可以支援所提供的方法。
本發明的描述中使用的元素、動作或指令都不是要理解為本發明決定性的或必不可少的,除非明確提出。另外,如這裏使用的,冠詞“一(個)”是要包括一項或多項。例如,短語“在一個實施方式中”中的冠詞“一個”是要包括:例如“在單個實施方式中”、“在多個實施方式中”、“在一個實施方式中”和/或“在所有實施方式中”。在要指代僅一項時,使用術語“單個”或類似語言。此外,這裏使用的多個項和/或多個類別的項的之前的術語“任意一個”是要包括“任意一個”、“任意組合”、“任意多個”和/或“任意多個的組合”的項和/或類別的項(單獨或與其他項和/或類別的項的組合)。此外,這裏使用的術語“集合”是要包括任意數量的項,報括零。另外,這裏使用的術語“數量”是要包括任意數量,包括零。
此外,申請專利範圍不應當被理解為限於所提供的順序或元素,除非說明了該效果。另外,在任意申請專利範圍中使用的術語“裝置”是要援引35 U.S.C. §112, ¶ 6或裝置加功能申請專利範圍格式,並且不帶有術語“裝置”的任意申請專利範圍不是這樣限定的。

10...示例性視頻編碼和解碼系統
12...源設備
14...目的設備
16...通信通道
18、30...視頻編碼器單元
20、28...發射和/或接收(Tx/Rx)單元
22、26...發射和/或接收(Tx/Rx)元件
24...視頻源
32...顯示設備
33...視頻編碼器
34...輸出緩衝器
35...示例性視頻解碼器
36...系統控制器
BS...位元流
BBS...緩衝的位元流
38、66...輸入
40...模式決定和編碼器控制器單元
42、72...空間預測單元
44...運動/時間預測單元
46、58、78...加法器
48...轉換單元
50...量化單元
52...熵編碼單元
54、74...反量化單元
56、76...反轉換單元
60、82...濾波器
62、80...參考圖片儲存器
64、84...輸出
68...熵解碼單元
70...運動補償預測單元
300...正轉換單元
302...K階正轉換1級單元
304...K階正轉換2.1級單元
306...K階正轉換2.2級單元
350...反向轉換單元
352...K階反轉換1.1級單元
354...K階反轉換1.2級單元
356...K階反轉換級單元
402...32階正轉換2.2.1級單元
404...32階正轉換2.2.2級單元
406...32階正轉換2.2.3級單元
452...32階反轉換1.2.1級單元
454...32階反轉換1.2.2級單元
456...32階反轉換1.2.3級單元
502...8階正轉換1級單元
504...4階正轉換1級單元
506...4階正轉換2.1級單元
508...4階正轉換2.2級單元
510...8階正轉換2級單元
512...8階正轉換3級單元
514...8階正轉換4級單元
552...4階反轉換1.1級單元
554...4階反轉換1.2級單元
556...4階反轉換2級單元
558...8階反轉換1級單元
560...8階反轉換2級單元
562...8階反轉換3級單元
564...8階反轉換4級單元
802...編碼器
804...通信網路
808、810...連接
806...解碼器
900...通信系統
902、902a、902b、902c、902d、WTRU...無線發射/接收單元
904、RAN...無線電存取網路
906...核心網路
908、PSTN...公共交換電話網路
910...網際網路
912...其他網路
914a、914b、970a、970b、970c...基地台
916...空中介面
918...處理器
920...收發器
922...發射/接收元件
924...揚聲器/麥克風
926...數字鍵盤
928...顯示器/觸控板
930...不可移除記憶體
932...可移除記憶體
934...電源
936...全球定位系統(GPS)晶片組
938...週邊設備
940a、940b、940c...節點B
942a、942b、RNC...無線電網路控制器
Iub、iur、IuCS、IuPS、X2、S1、R1、R3、R6、R8...介面
944、MGW...媒體閘道
946、MSC...移動交換中心
948、SGSN...服務GPRS支援節點
950、GGSN...閘道GPRS支持節點
960a、960b、960c...e節點B
962、MME...移動性管理閘道閘道
964...服務閘道
966...封包資料網路(PDN)閘道
972...存取服務網路(ASN)閘道
974、MIP-HA...移動IP家用代理
976...認證、授權、記賬(AAA)伺服器
978...閘道
300...正轉換單元
302...K階正轉換1級單元
304...K階正轉換2.1級單元
306...K階正轉換2.2級單元

Claims (16)

  1. 一種包括一處理器和一記憶體之設備,其中該記憶體包括一組轉換矩陣、以及能夠由所述處理器執行以使用該組轉換矩陣中的任一個來對資料進行轉換的指令,其中:
    該組轉換矩陣中的每個轉換矩陣是正交的,並且具有不同數量的元素;
    該各個數量的元素中的每個元素是一整數;
    每個轉換矩陣的基本向量的範數之間的差值滿足一給定的臨界值;以及
    所述基本向量接近一離散餘弦轉換(DCT)矩陣的對應基本向量。
  2. 一種包括一處理器和一記憶體之設備,其中該記憶體包括一組轉換矩陣、以及能夠由所述處理器執行以使用所述一組轉換矩陣中的任一個來對資料進行轉換的指令,其中:
    該組轉換矩陣中的每個轉換矩陣近似正交,具有不同數量的元素並可以被完全因式分解;
    該各個數量的元素中的每個元素是一整數;
    每個轉換矩陣的基本向量的範數之間的差值滿足一給定的臨界值;以及
    所述基本向量接近一離散餘弦轉換(DCT)矩陣的對應基本向量。
  3. 如申請專利範圍第1項和第2項中任一項所述的設備,其中所述記憶體還包括:能夠由所述處理器執行以產生該組轉換矩陣並將該組轉換矩陣儲存在所述記憶體中的指令。
  4. 如申請專利範圍第1項和第2項中任一項所述的設備,其中所述給定的臨界值包括:當被滿足時指示所述基本向量的該範數大致相等之一臨界值。
  5. 如申請專利範圍第1項和第2項中任一項所述的設備,其中根據失真的一測量,所述基本向量接近一離散餘弦轉換(DCT)矩陣的對應基本向量。
  6. 如申請專利範圍第1項和第2項中任一項所述的設備,其中根據一失真的測量,所述基本向量接近一離散餘弦轉換(DCT)矩陣的對應基本向量,該失真的測量滿足一預定義的臨界值。
  7. 如前述申請專利範圍第5項和第6項中任一項所述的設備,其中所述失真的測量是基於所述DCT矩陣的。
  8. 如申請專利範圍第5項至第7項中任一項所述的設備,其中所述失真的測量是至少基於所述基本向量以及所述DCT矩陣的該對應基本向量的一部分。
  9. 如前述申請專利範圍中任一項所述的設備,其中該組轉換矩陣中的每個轉換矩陣能夠分解成一偶數部分和一奇數部分。
  10. 如前述申請專利範圍中任一項所述的設備,其中該組轉換矩陣中的每個轉換矩陣包括2N×2N個元素,並且其中N是一正整數。
  11. 如申請專利範圍第10項所述的設備,其中該組轉換矩陣中的每個轉換矩陣能夠分解成一偶數部分和一奇數部分,並且其中所述偶數部分和奇數部分中的每一者包括2N-1×2N-1個元素。
  12. 如申請專利範圍第11項所述的設備,其中所述偶數部分由一因數M縮放,並且其中M是一正整數。
  13. 如申請專利範圍第11項所述的設備,其中根據所述奇數部分進行轉換包括將2N-2階轉換應用到從一層小波分解得到的每個子帶所得到的一結果。
  14. 如申請專利範圍第13項所述的設備,其中所述結果由一因數M縮放,並且其中M是一正整數。
  15. 如申請專利範圍第13項和第14項中任一項所述的設備,其中所述小波轉換是一哈爾轉換。
  16. 如前述申請專利範圍中任一項所述的設備,其中所述設備是以下任意一者:一視頻編碼器、視頻解碼器、以及一無線發射和/或接收單元(WTRU)。
TW101141217A 2011-11-07 2012-11-06 使用奇偶整數轉換影像處理 TW201335769A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161556823P 2011-11-07 2011-11-07
US201161556681P 2011-11-07 2011-11-07

Publications (1)

Publication Number Publication Date
TW201335769A true TW201335769A (zh) 2013-09-01

Family

ID=47297431

Family Applications (3)

Application Number Title Priority Date Filing Date
TW107104537A TW201842453A (zh) 2011-11-07 2012-11-06 使佣偶奇整數轉換視訊及資料處理
TW105126956A TW201729125A (zh) 2011-11-07 2012-11-06 使佣奇偶整數轉換影像處理
TW101141217A TW201335769A (zh) 2011-11-07 2012-11-06 使用奇偶整數轉換影像處理

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW107104537A TW201842453A (zh) 2011-11-07 2012-11-06 使佣偶奇整數轉換視訊及資料處理
TW105126956A TW201729125A (zh) 2011-11-07 2012-11-06 使佣奇偶整數轉換影像處理

Country Status (7)

Country Link
US (1) US10452743B2 (zh)
EP (1) EP2777287A2 (zh)
JP (1) JP6193869B2 (zh)
KR (1) KR20140098114A (zh)
CN (1) CN104067621B (zh)
TW (3) TW201842453A (zh)
WO (1) WO2013070605A2 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8913666B2 (en) 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
US9749633B2 (en) * 2012-01-19 2017-08-29 Vid Scale, Inc. System and method of video coding quantization and dynamic range control
US8983218B2 (en) 2012-04-11 2015-03-17 Texas Instruments Incorporated Virtual boundary processing simplification for adaptive loop filtering (ALF) in video coding
EP2920962A4 (en) * 2012-11-13 2016-07-20 Intel Corp ADAPTIVE TRANSFORMATION ENCODING OF CONTENT FOR NEXT GENERATION VIDEO
EP2952003B1 (en) 2013-01-30 2019-07-17 Intel Corporation Content adaptive partitioning for prediction and coding for next generation video
US9491460B2 (en) * 2013-03-29 2016-11-08 Qualcomm Incorporated Bandwidth reduction for video coding prediction
CN108200439B (zh) * 2013-06-14 2020-08-21 浙江大学 提高数字信号变换性能的方法及数字信号变换方法和装置
GB2517416A (en) * 2013-08-15 2015-02-25 Sony Corp Data encoding and decoding
US9516345B2 (en) 2014-03-17 2016-12-06 Qualcomm Incorporated Systems and methods for low complexity forward transforms using mesh-based calculations
US9432696B2 (en) 2014-03-17 2016-08-30 Qualcomm Incorporated Systems and methods for low complexity forward transforms using zeroed-out coefficients
JP2015185897A (ja) * 2014-03-20 2015-10-22 パナソニックIpマネジメント株式会社 画像符号化方法及び画像符号化装置
WO2016167538A1 (ko) * 2015-04-12 2016-10-20 엘지전자(주) 비디오 신호의 인코딩, 디코딩 방법 및 그 장치
US11134259B2 (en) * 2016-01-15 2021-09-28 Interdigital Madison Patent Holdings, Sas System and method for enhanced motion compensation using adaptive filtering
WO2017195917A1 (ko) * 2016-05-12 2017-11-16 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
CN106231318B (zh) * 2016-09-30 2020-04-28 浙江宇视科技有限公司 一种基于量化变换系数的视频加扰方法及装置
CN114531600B (zh) * 2022-02-18 2023-10-03 阿里巴巴(中国)有限公司 变换单元、现场可编程门阵列、芯片、电子设备、片上系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW241416B (zh) * 1992-06-29 1995-02-21 Sony Co Ltd
JPH08186815A (ja) 1994-12-28 1996-07-16 Pioneer Electron Corp サブバンド符号化方法
US5883823A (en) * 1997-01-15 1999-03-16 Sun Microsystems, Inc. System and method of a fast inverse discrete cosine transform and video compression/decompression systems employing the same
JP4209061B2 (ja) 2000-02-09 2009-01-14 富士フイルム株式会社 画像処理符号復号化方法および画像処理符号復号化システム、画像処理符号化装置および画像処理復号化装置、並びに記録媒体
WO2002015584A2 (de) 2000-08-12 2002-02-21 Robert Bosch Gmbh Verfahren zur ganzzahligen approximation von transformationskoeffizienten sowie coder und decoder
US6990506B2 (en) 2000-12-13 2006-01-24 Sharp Laboratories Of America, Inc. Integer cosine transform matrix for picture coding
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US7302105B2 (en) 2002-07-22 2007-11-27 Canon Kabushiki Kaisha Moving image coding apparatus, moving image decoding apparatus, and methods therefor
US7110338B2 (en) 2002-08-06 2006-09-19 Matsushita Electric Industrial Co., Ltd. Apparatus and method for fingerprinting digital media
US7372999B2 (en) 2002-09-09 2008-05-13 Ricoh Company, Ltd. Image coder and image decoder capable of power-saving control in image compression and decompression
EP1578134A1 (en) 2004-03-18 2005-09-21 STMicroelectronics S.r.l. Methods and systems for encoding/decoding signals, and computer program product therefor
US7487193B2 (en) 2004-05-14 2009-02-03 Microsoft Corporation Fast video codec transform implementations
WO2006034603A1 (en) * 2004-09-28 2006-04-06 Huawei Technologies Co., Ltd Video image encoding method
US7925097B2 (en) 2005-02-18 2011-04-12 Sanyo Electric Co., Ltd. Image display method, image coding apparatus, and image decoding apparatus
US7805476B2 (en) * 2005-06-27 2010-09-28 The Aerospace Corporation Extended Haar transform
US7689052B2 (en) * 2005-10-07 2010-03-30 Microsoft Corporation Multimedia signal processing using fixed-point approximations of linear transforms
US8331454B2 (en) * 2007-11-12 2012-12-11 Cisco Technology, Inc. Integer transform function for video compression systems
WO2010024907A1 (en) 2008-08-29 2010-03-04 Angel Decegama Systems and methods for compression transmission and decompression of video codecs
US8451904B2 (en) * 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
US9081733B2 (en) * 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
EP2498497A1 (en) * 2011-03-11 2012-09-12 Research In Motion Limited Method and system using prediction and error correction for the compact representation of quantization matrices in video compression

Also Published As

Publication number Publication date
CN104067621B (zh) 2018-03-27
WO2013070605A3 (en) 2013-08-08
TW201729125A (zh) 2017-08-16
JP2014535246A (ja) 2014-12-25
WO2013070605A2 (en) 2013-05-16
EP2777287A2 (en) 2014-09-17
US10452743B2 (en) 2019-10-22
JP6193869B2 (ja) 2017-09-06
KR20140098114A (ko) 2014-08-07
US20130114732A1 (en) 2013-05-09
TW201842453A (zh) 2018-12-01
CN104067621A (zh) 2014-09-24

Similar Documents

Publication Publication Date Title
JP6193869B2 (ja) 偶数−奇数整数変換を使用するビデオおよびデータの処理
JP6694031B2 (ja) 3次元ベースのカラーマッピングでのモデルパラメータ最適化のためのシステムおよび方法
US10237555B2 (en) System and method of video coding quantization and dynamic range control
JP6684867B2 (ja) Rgbビデオコーディングエンハンスメントのためのシステムおよび方法
CN107211134B (zh) 用于调色编码模式的逃逸色彩编码
TWI479869B (zh) 色調片段位準量化系數偏移及解塊
CN108462875B (zh) 视频解码方法及设备
JP6397902B2 (ja) スケーラブルビデオ符号化のためのレイヤ間予測
US20140241435A1 (en) Method for managing memory, and device for decoding video using same
KR20130105870A (ko) 적응적 비디오 코딩을 위한 시스템 및 방법
Kalra Comparative analysis of DIRAC PRO-VC-2, H. 264 AVC and AVS CHINA-P7
Murmu Fast motion estimation algorithm in H. 264 standard