TW201519637A - 位元率-誤差最佳化量化方法 - Google Patents

位元率-誤差最佳化量化方法 Download PDF

Info

Publication number
TW201519637A
TW201519637A TW102141141A TW102141141A TW201519637A TW 201519637 A TW201519637 A TW 201519637A TW 102141141 A TW102141141 A TW 102141141A TW 102141141 A TW102141141 A TW 102141141A TW 201519637 A TW201519637 A TW 201519637A
Authority
TW
Taiwan
Prior art keywords
bit rate
error
model
quantization method
norm
Prior art date
Application number
TW102141141A
Other languages
English (en)
Inventor
Tsung-Yau Huang
Homer Hong-Ming Chen
Chieh-Kai Kao
Original Assignee
Univ Nat Taiwan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Taiwan filed Critical Univ Nat Taiwan
Priority to TW102141141A priority Critical patent/TW201519637A/zh
Priority to US14/154,103 priority patent/US20150131719A1/en
Publication of TW201519637A publication Critical patent/TW201519637A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一種位元率-誤差最佳化量化方法,其可藉由一個或多個處理器予以執行。此方法包含以下步驟:首先,分別決定一位元率模型及一誤差模型;其次,根據位元率模型及誤差模型建立一位元率-誤差目標函式;接著,計算位元率-誤差(R-D)目標函式之一封閉式解;再來,根據一輸入圖框,對應執行封閉式解以產生一量化轉換係數。

Description

位元率-誤差最佳化量化方法
本發明係有關視訊編碼,特別是關於一種位元率-誤差最佳化量化方法。
鑑於現前一般所提出採用位元率-誤差最佳化量化架構於視訊編碼器之方法,雖其可部分獲得增進影片壓縮效果,然而此些方法於編碼過程中,往往因為必須進行使用窮舉搜尋及冗餘的熵編碼(entropy coding)程序,造成其運算複雜度過高,並且產生高計算負荷量,而無法獲致較佳之視訊編碼效率。
因此亟需發展出一種具高效率及低計算複雜度的新穎視訊編碼程序機制。
鑑於上述,本發明實施例的目的之一在於提出一種位元率-誤差最佳化量化方法,使得量化轉換係數的位元率得以於離線預先有效估測。本發明實施例的另一目的在於提出一種位元率-誤差最佳化之量化轉換係數的封閉式解(closed-form solution),以簡化最佳化程序的計算及降低運算量。
根據本發明實施例,位元率-誤差最佳化量化方法包含以下步驟:首先,分別決定一位元率模型及一誤差模型;;其次,根據位元率模型及誤差模型建立一位元率-誤差目標函式;接著,計算位元率-誤差(R-D)目標函式之一封閉式解;再來,根據一輸入圖框,對應執行封閉式解以產生一量化轉換係數。
第一圖顯示本發明實施例之位元率-誤差最佳化量化方法100的流程圖,其可使用處理器、軟體或其組合予以執行。以下所述實施例可適用於H.264/AVC視訊編碼標準,但不限定於此。
於步驟102,方法100決定一位元率模型(rate model)。在一實施例中,方法100係藉由一預設量化器及複數個訓練序列(training sequence),進行遞迴運算以產生位元率模型(rate model)。其中,預設量化器為中間平坦均勻量化器(mid-tread uniform quantizer)。更進一步地說,本實施例係依據資訊理論(Information theory)的基礎,建立位元率模型,從而使其具有簡單的數學形式,而位元率模型可表示如下:   其中α、β及γ為模型參數,為量化轉換係數的1-範數(1-norm),其定義為的絕對值,為該量化轉換係數的0-範數(0-norm),其中當時,;當,則
然而根據本實施例之一特徵,模型參數α及β係可藉由離線訓練方式予以決定之。另一方面,由於當量化轉換係數皆為零時,則對應導致零位元率(zero bitrate),因此模型參數γ可設定為零。故,位元率模型(rate model)可表示如下:
接著,請參考第二圖,其係顯示利用離線訓練以進行遞迴運算取得位元率模型之最佳模型參數的示意方塊圖。首先,透過預設之中間平坦均勻量化器(mid-tread uniform quantizer)對複數個訓練序列(training sequence)進行編碼,並取得一組編碼區塊(coded block) V0,且再藉以訓練取得一組模型參數。其中,在本實施例中,所使用之中間平坦均勻量化器為如下所示:其中,為下取整數運算,為量化步階尺寸(quantization step size),為預設尺寸因子,為編碼區塊(coding block)的轉換係數,為偏移係數(rounding offset),而在本實施例中,為0.5。
接著,再根據組模型參數,對應以遞迴方式運算並執行位元率誤差最佳化量化(RDOQ)之程序,進而對應更新產生量化器(RDOQ1)。接續,再藉由量化器(RDOQ1)重新對訓練序列進行編碼,取得另一組編碼區塊V1,且藉以估算取得另一組模型參數,並根據模型參數再執行RDOQ之程序,用以對應更新產生量化器(RDOQ2)。如此一來,經由上述之遞迴運算方式,將可獲取收斂之K階的模型參數,從而獲致位元率模型之最佳模型參數。同時,位元率模型之最佳模型參數亦可於離線預先依據各種可能條件、態樣及組合的輸入序列予以取得,並且據以預先建立位元率模型之最佳模型參數表格。
在步驟104中,方法100決定一誤差模型(distortion model)。在一實施例中,方法100則是依據輸入信號減去預測信號所得到的殘餘信號(residual signal)及其對應之重建殘餘信號( reconstructed residual signal),使用誤差平方和(sum of squared error, SSE)量測描述誤差模型(distortion model),而其可表示如下:其中,A為反轉換矩陣,表示2-範數(2-norm),其定義為所有元素的平方和,Ai為A之第i個列向量,為編碼區塊的轉換係數。
因此,在步驟106中,即可將由式(2)及式(3)分別所示之位元率模型及誤差模型,代入至以下之位元率-誤差極小化函式:其中代表最佳量化轉換係數,代表誤差模型,代表位元率模型。
如此從而可全面性地充分考慮到量化演算法與位元率模型間之相互影響以進行最佳化估算,以建立位元率-誤差(R-D)目標函式,其可表示如下:
然而,由於式(5)中的每一量化轉換係數是彼此互相分離,因此每一量化轉換係數可透過以下對應獨立模型方程式,以求出其最佳量化轉換係數
接著,在步驟108中,根據本實施例的特徵之一,式(6)可推導出如下的封閉式解(closed-form solution):其中; 再者其中,為上取整數運算。
在步驟110中,則可透過上述位元率-誤差模型的封閉式解,將每一輸入圖框代入執行計算,以對應獲得最佳化量化轉換係數。尤其,封閉式解中之模型參數係可預先透過離線訓練取得並建立其參數表格,因此當實際對輸入圖框進行編碼時,可即時根據輸入圖框之特徵進行動態對應查表,以即時取得最佳模型參數,而無須再消耗多餘的運算時間來計算此些模型參數。
根據上述方法100及其所揭示之位元率-誤差模型與封閉式解,相較於僅考量誤差或完全未考量誤差/位元率的傳統系統,本實施例之整體編碼效能及可靠度可獲得大幅度的提升與改善。同時,相較於一般傳統方法針對每一輸入圖框進行編碼對應執行運算其所需之模型參數,而造成高計算負荷量,本實施例則可藉由查表以立即獲取模型參數,大量降低位元率-誤差最佳化程序的計算量,從而有效提升使其效能。
以上所述僅為本發明之較佳實施例而已,並非用以限定本發明之申請專利範圍;凡其它未脫離發明所揭示之精神下所完成之等效改變或修飾,均應包含在下述之申請專利範圍內。
100‧‧‧方法
102‧‧‧步驟
104‧‧‧步驟
106‧‧‧步驟
108‧‧‧步驟
110‧‧‧步驟
第一圖顯示本發明實施例之位元率-誤差最佳化量化方法的流程圖。 第二圖顯示利用離線訓練以進行遞迴運算取得最佳模型參數的示意方塊圖。
100‧‧‧方法
102‧‧‧步驟
104‧‧‧步驟
106‧‧‧步驟
108‧‧‧步驟
110‧‧‧步驟

Claims (10)

  1. 一種位元率-誤差最佳化量化(RDOQ)方法,其中藉由一個或多個處理器執行該方法,該方法包含以下步驟: 決定一位元率模型(rate model); 決定一誤差模型(distortion model); 根據該位元率模型及該誤差模型,建立一位元率-誤差(R-D)目標函式; 計算該位元率-誤差目標函式之一封閉式解;及 根據一輸入圖框,執行該封閉式解以對應產生至少一量化轉換係數。
  2. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中該位元率模型之模型參數係根據一中間平坦均勻量化器(mid-tread uniform quantizer)及複數個訓練序列(training sequence),執行遞迴運算予以產生。
  3. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中係使用誤差平方和(sum of squared error, SSE)量測該誤差模型。
  4. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中該位元率模型表示為:其中為量化轉換係數,α、β及γ為模型參數,的1-範數(1-norm),其定義為的絕對值,的0-範數(0-norm),其中當時,,當,則
  5. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中該預設量化器為一中間平坦均勻量化器(mid-tread uniform quantizer):其中,為下取整數運算,為量化步階尺寸(quantization step size),為預設尺寸因子,為編碼區塊(coding block)的轉換係數,為偏移係數(rounding offset)。
  6. 如申請專利範圍第5項所述之位元率-誤差最佳化量化方法,其中該偏移係數為0.5。
  7. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中藉由誤差平方和所量測出以下誤差模型:其中,A為反轉換矩陣,表示2-範數(2-norm),其定義為所有元素的平方和,Ai為A之第i個列向量,為編碼區塊的轉換係數。
  8. 如申請專利範圍第1項所述之位元率-誤差最佳化量化方法,其中該位元率-誤差目標函式係藉由以下位元率-誤差極小化函式所得到:其中代表最佳量化轉換係數,代表誤差模型,代表位元率模型。
  9. 如申請專利範圍第8項所述之位元率-誤差最佳化量化方法,其中依據該位元率模型及該誤差模型,建立以下位元率-誤差目標函式:
  10. 如申請專利範圍第9項所述之位元率-誤差最佳化量化方法,其中每一該量化轉換係數對應具有以下最佳封閉式解:其中;  再者其中,為上取整數運算。
TW102141141A 2013-11-12 2013-11-12 位元率-誤差最佳化量化方法 TW201519637A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW102141141A TW201519637A (zh) 2013-11-12 2013-11-12 位元率-誤差最佳化量化方法
US14/154,103 US20150131719A1 (en) 2013-11-12 2014-01-13 Rate-distortion optimized quantization method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102141141A TW201519637A (zh) 2013-11-12 2013-11-12 位元率-誤差最佳化量化方法

Publications (1)

Publication Number Publication Date
TW201519637A true TW201519637A (zh) 2015-05-16

Family

ID=53043794

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102141141A TW201519637A (zh) 2013-11-12 2013-11-12 位元率-誤差最佳化量化方法

Country Status (2)

Country Link
US (1) US20150131719A1 (zh)
TW (1) TW201519637A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365981A (zh) * 2019-07-10 2019-10-22 中移(杭州)信息技术有限公司 一种视频编码方法、装置、电子设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102390162B1 (ko) 2015-10-16 2022-04-22 삼성전자주식회사 데이터 인코딩 장치 및 데이터 인코딩 방법
CN110418134B (zh) * 2019-08-01 2021-10-26 字节跳动(香港)有限公司 基于视频质量的视频编码方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder
US9729888B2 (en) * 2009-09-10 2017-08-08 Dolby Laboratories Licensing Corporation Speedup techniques for rate distortion optimized quantization
US8897370B1 (en) * 2009-11-30 2014-11-25 Google Inc. Bitrate video transcoding based on video coding complexity estimation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365981A (zh) * 2019-07-10 2019-10-22 中移(杭州)信息技术有限公司 一种视频编码方法、装置、电子设备及存储介质
CN110365981B (zh) * 2019-07-10 2021-12-24 中移(杭州)信息技术有限公司 一种视频编码方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20150131719A1 (en) 2015-05-14

Similar Documents

Publication Publication Date Title
US9118918B2 (en) Method for rate-distortion optimized transform and quantization through a closed-form operation
JP4741658B2 (ja) 映像コーディングデバイスにおけるac/dc予測に関する固定小数点整数除算
JP2013255252A5 (ja) 画像符号化方法、及び画像符号化装置
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
CN107846593B (zh) 一种率失真优化方法及装置
JP2006333444A (ja) ブロックベースのビデオエンコーダにおけるエンコーダ出力ビットレートを制御する方法、及び相応するビデオエンコーダ装置
JP2009239658A (ja) 復号システム、方法及びプログラム
TWI394462B (zh) 基於視覺感知的位元-失真最佳化位元分配的位元率控制方法
KR20150099165A (ko) Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치
TW201519637A (zh) 位元率-誤差最佳化量化方法
JP7480170B2 (ja) 画像予測方法、エンコーダー、デコーダー及び記憶媒体
CN108028938A (zh) 视频编码方法及装置
US10091514B1 (en) Apparatus and method for inter and intra mode selection and block partitioning
US20160127731A1 (en) Macroblock skip mode judgement method for encoder
JP5670226B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
US20140044167A1 (en) Video encoding apparatus and method using rate distortion optimization
US11863783B2 (en) Artificial intelligence-based image encoding and decoding apparatus and method
CN112243129B (zh) 视频数据处理方法、装置、计算机设备及存储介质
RU2587412C2 (ru) Управление скоростью передачи видео на основе гистограммы коэффициентов преобразования
JP5845761B2 (ja) 動画像符号化装置及びプログラム
JP6564315B2 (ja) 符号化装置、復号装置、及びプログラム
JP6075875B2 (ja) 変換量子化方法、変換量子化装置及び変換量子化プログラム
CN108900842B (zh) Y数据压缩处理方法、装置、设备及WebP压缩系统
JP5871602B2 (ja) 符号化装置
TW201601522A (zh) 基於最小可覺差之感知性視訊編碼方法