TW201618084A - 編碼器、解碼器、編碼及解碼的系統及方法 - Google Patents
編碼器、解碼器、編碼及解碼的系統及方法 Download PDFInfo
- Publication number
- TW201618084A TW201618084A TW104124172A TW104124172A TW201618084A TW 201618084 A TW201618084 A TW 201618084A TW 104124172 A TW104124172 A TW 104124172A TW 104124172 A TW104124172 A TW 104124172A TW 201618084 A TW201618084 A TW 201618084A
- Authority
- TW
- Taiwan
- Prior art keywords
- quantized
- value
- residual
- quantization
- inverse
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000013139 quantization Methods 0.000 claims abstract description 250
- 238000004590 computer program Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
多個實施例提供的一編碼器包括一量化階段、一熵編碼器、一殘餘量化階段以及一編碼訊號形成器。量化階段係設來使用一死區而量化一輸入訊號以得到複數個量化值。熵編碼器係設來使用一熵編碼方案而編碼這些量化值以得到複數個熵編碼值。殘餘量化階段係設來量化該量化階段所造成的一殘餘訊號,其中殘餘量化階段係設來視量化階段的死區決定至少一量化殘餘值。編碼訊號形成器係設來從這些熵編碼值與至少一量化殘餘值形成一編碼訊號。
Description
實施例關於一編碼器、一解碼器、包括一編碼器及一解碼器的一系統、一編碼方法以及一解碼方法。一些實施例關於在來源編碼中最佳化殘餘量化的裝置及方法。一些實施例關於一來源編碼方案其使用熵編碼來編碼一量化訊號在一已定數量的位元組。
熵編碼是一種有效率的工具供削減多個符號的重複來傳輸。其通常用在變換基礎編碼於頻譜線的量化之後。藉由削減一先驗機率分布,多個量化值可無耗損的以一減少數量的位元組來編碼。此原理是依靠產生代號其中長度是符號機率的功能。
位元消耗通常只有在寫入多個熵編碼符號至位元流之後才知道。通常不確定的是當最佳化量化階段時,需要知道位元消耗來最佳化率失真理論。更不確定的是,當位元流必須有一固定值於每訊框,即所知固定位元率,其係對多數通訊網路協定是一必要條件。
在一變換編碼器中,一組多個倍率因子通常藉在頻域塑形量化噪聲來定義量化。噪聲塑形係通常一心理聲學模型給定的感知到的失真以及引起的位元消耗二者的功能。然而,最後因子係通常僅在固定量化噪聲塑形之後才知道。一最佳化路徑能夠用來讓最佳化收斂。僅管如此,如此的最佳化係相對複雜且數量的疊代必須在實際應用嚴格限制。再者,為了降低更多複雜度,位元消耗係通常沒有完全計算而僅是估測。如果低估最終位元消耗,位元流將必須截短,其避免大部分時間。的確估測上將導致位元流的難以截短,其係等同讓量化飽和。因此,量化最佳化係通常設計來過估測位元消耗。如一結果少數位元組常常在最終位元流未削減。
為克服此問題,一殘餘(或第二)量化階段可加在削減最後
未使用位元組的第一量化階段之後。這些剩餘位元組然後可用來細化量化噪聲。這原理說明如下。
圖10顯示一變換編碼器10的一區塊圖。變換編碼器10包括一第一量化階段12、一殘餘量化階段14、一熵編碼器16、一熵編碼位元估測單元18、一多工器20以及一變換單元22。
變換單元22係設來將一輸入訊號從一時域變換至一頻域。第一量化階段12係設來量化輸入訊號在頻域至複數個量化頻譜值q。這些量化頻譜值q、在頻域x的輸入訊號以及一數量的剩餘位元組係輸入至殘餘(或第二)量化階段14其係設來細化第一量化階段12的輸出並提供複數個量化殘餘值qr。熵編碼器16係設來熵編碼這些量化頻譜值q以得到複數個熵編碼值e。多工器20係設來多工這些熵編碼值e、視第一量化階段14所提供的一資訊而定的多個倍率因子以及第二量化16所傳遞的這些量化殘餘值以得到一位元流。
圖10所示的變換編碼器10是設計來傳遞每訊框的某一目標數量的位元組。量化將調整供到達此目標,但因複雜度因素當調整量化步驟時僅有做熵編碼器位元消耗的一估測。再者,即使位元估測非常準確,仍不可能發現一組多個倍率因子其導至期待中的目標位元組。第一量化階段12之後,多個量化值係熵編碼。剩餘未削減位元組然後分派至殘餘量化其係細化第一量化階段12的輸出。殘餘量化階段14將多個量化頻譜值q、多個原始頻譜值x與一數量的剩餘位元組作為輸入。剩餘位元組的數量可以是一估測或真正數量的剩餘位元組。估測係通常使用於當一當地合成要求在編碼器側供例如做一切換決定於一閉迴路決定方式如其在AMR-WB+(Adaptive Multi-Rate Wide Band Extended,適應性多率寬帶擴展)所做。在這個情況下,殘餘編碼必須呼叫於熵編碼器16的最後呼叫之前。
在一般的變換編碼器10,殘餘量化階段14係對藉反向量化多個量化頻譜值所得到的一反向量化輸入訊號與原始輸入訊號之差異進行一簡單均勻純量量化。然而,通過率失真性能分析,可知均勻量化係僅最佳化於無記憶體與均勻地分散的來源。
因此,本發明的一目的是提供一改善的殘餘量化於非無記憶體與非均勻地分散的來源。
此目的可由獨立項解決。
多個實施例提供一編碼器包括一量化階段、一熵編碼器、一殘餘量化階段以及一編碼訊號形成器。量化階段係設來使用一死區來量化一輸入訊號以得到複數個量化值。熵編碼器係設來使用一熵編碼方案來編碼這些量化值以得到複數個熵編碼值。殘餘量化階段係設來量化該量化階段所造成的一殘餘訊號,其中殘餘量化階段係設來視量化階段的死區決定至少一量化殘餘值。編碼訊號形成器係設來從這些熵編碼值與至少一量化殘餘值形成一編碼訊號。
再者,多個實施例提供一解碼器其包括一編碼訊號剖析器、一熵解碼器以及一反向量化階段。編碼訊號剖析器係設來剖析一編碼訊號以得到複數個熵編碼值以及至少一量化殘餘值。熵解碼器係設來使用一熵編碼方案而解碼這些熵編碼值以得到複數個量化值。反向量化階段係設來反向量化這些量化值以得到一輸出訊號。再者,反向量化階段係設來細化一反向量化位準用來供得到視量化殘餘值及一死區而定的輸出訊號。
根據本發明的構想,(原始)輸入訊號與藉反向量化這些量化值所得到的一反向量化訊號之間的一誤差可降低甚至最佳化,這是藉在編碼器側的一殘餘量化階段其考慮用來量化輸入訊號與一反向量化階段在解碼器側的死區也考慮此死區當細化反向量化位準用來得到反向量化訊號(被稱為輸出訊號)。
再者,多個實施例提供一編碼方法。此方法包括使用一死區來量化一輸入訊號以得到複數個量化值;使用一熵編碼方案來編碼這些量化值以得到複數個熵編碼值;量化該量化階段的一量化所造成的一殘餘訊號並視量化階段的死區決定複數個量化殘餘值;從這些熵編碼值與這些量化殘餘值形成一位元流。
再者,本發明多個實施例提供一解碼方法,該方法包括剖析一編碼訊號以得到複數個熵編碼值與一量化殘餘值;使用一熵解碼方案來解碼這些熵編碼值以得到複數個量化值;使用一死區反向量化這些量化值
以得到一輸出訊號;以及細化一反向量化位準用來供得到視死區及量化殘餘值而定的輸出訊號。
10‧‧‧變換編碼器
12‧‧‧第一量化階段
14‧‧‧殘餘量化階段
16‧‧‧熵編碼器
18‧‧‧熵編碼位元估測、熵編碼位元估測單元
20‧‧‧多工器
22‧‧‧變換單元
100‧‧‧編碼器
102‧‧‧量化階段
104‧‧‧熵編碼器
106‧‧‧殘餘量化階段
106’‧‧‧殘餘量化器
108‧‧‧編碼訊號形成器
112‧‧‧量化值
120‧‧‧解碼器
122‧‧‧編碼訊號剖析器
124‧‧‧熵解碼器
126‧‧‧反向量化階段
130‧‧‧系統
140‧‧‧輸入訊號、原始頻譜
142‧‧‧量化值、頻譜
144‧‧‧熵編碼值
146‧‧‧量化殘餘值、殘餘量化位元流
148‧‧‧編碼訊號、位元流
150‧‧‧輸出訊號
152‧‧‧反向量化輸入訊號
154‧‧‧殘餘訊號
160‧‧‧反向量化器
162‧‧‧比較器、比較階段
164‧‧‧調節器、控制單元
170‧‧‧再現位準
172‧‧‧反向量化位準、再現位準
174、176‧‧‧細化反向量化位準、相對(細化)再現位準
200‧‧‧編碼方法
202~208‧‧‧步驟
220‧‧‧解碼方法
222~228‧‧‧步驟
q‧‧‧量化頻譜值
qr‧‧‧量化殘餘值
e‧‧‧熵編碼值
x‧‧‧頻譜值
本發明多個實施例將參考多個圖式說明。
圖1顯示根據一實施例的一編碼器的一區塊圖。
圖2顯示根據一實施例的一解碼器的一區塊圖。
圖3顯示根據一實施例的一系統的一區塊圖。
圖4顯示根據一實施例的殘餘量化階段的一區塊圖。
圖5顯示多個反向量化位準與量化門檻使用在一死區均勻門檻純量量化方案。
圖6顯示對一非零量化值的二細化反向量化位準。
圖7顯示對一零量化值的三細化反向量化位準。
圖8顯示根據一實施例的編碼方法的一流程圖。
圖9顯示根據一實施例的解碼方法的一流程圖。
圖10顯示使用一殘餘量化的傳統變換編碼器的一區塊圖。
相同或等效元件或元件具相同或等效功能係在以下說明之中標以相同或等效編號。
在以下描述中,透過本發明多個實施例提供多個細節陳述。然而,對於該領域熟知該項技藝者本發明多個實施例可無需這些特定細節來實踐。在其他例子中,已知結構及裝置係顯示在區塊圖而非在細節以避免混淆本發明實施例。此外,這些之後描述的不同實施例的特徵可彼此結合,除非特別註記。
既然熵編碼傳遞多個可變長度代號,這很困難在寫入位元流之前預估準確的位元消耗。然而,位元消耗是最佳化量化所需的。大多時間和複雜度因素,量化是次佳的且一些少數位元組仍未削減。殘餘量化是一第二層量化其係削減這些未使用的位元組供細化量化誤差。
以下所述的多個實施例提供一編碼器、一解碼器以及最佳化此殘餘量化的方法。
圖1顯示根據一實施例的一編碼器100的一區塊圖。編碼器100包括一量化階段102(例如一第一量化階段)、一熵編碼器104、一殘餘量化階段106(例如一第二量化階段)以及一編碼訊號形成器108。量化階段102係設來使用死區而量化一輸入訊號140以得到複數個量化值142(q)。熵編碼器104係設來使用一熵編碼方案而編碼這些量化值142(q)以得到複數個熵編碼值144(e)。殘餘量化階段106係設來量化在量化階段102的一量化所造成的一殘餘訊號,其中殘餘量化階段106係設來視量化階段102的死區決定至少一量化殘餘值146(qr)。編碼訊號形成器108係設來從這些熵編碼值144(e)與至少一量化殘餘值146(qr)形成一編碼訊號148。
本案是要減少甚至最佳化(原始)輸入訊號與在編碼器側一殘餘量化階段的輸入訊號的一量化版本的一反向量化版本之問的誤差,其考慮用來量化輸入訊號與一反向量化階段在解碼器側的死區也考慮此死區當細化反向量化位準用來得到反向量化訊號。
在多個實施例中,量化階段102可設來進行一死區均勻門檻純量量化(DZ-UTSQ)。
在多個實施例中,編碼訊號形成器108可設來藉附加至少一量化殘餘值146或複數個量化殘餘值146至這些熵編碼值144直到編碼訊號148包括傳輸至一解碼器可用的一最大長度而形成編碼訊號148。沒有限制位元流含有其他資訊如多個倍率因子定義第一量化階段噪聲塑形、多個預估係數用來塑形量化噪聲以及用在時域中輸出訊號的一後置濾波。
舉例來說,編碼訊號形成器108可設來提供一位元流作為編碼訊號148。藉此,編碼訊號形成器108例如一多工器可設來在位元流的一尾端加上至少一量化殘餘值146或複數個量化殘餘值146。編碼器100所產生的位元流可傳輸(例如傳送或廣播)至一解碼器或儲存在例如一非揮發性儲存媒體供之後藉一解碼器來解碼。藉此,位元流可使用多個資料訊框或多個資料封包來傳送或儲存,其中位元流可必須具有一固定規模(即此處指目標位元組)於每資料訊框或資料封包。
為了得到一位元流其具有一固定規模或一預定數量的目標
位元組,編碼訊號形成器108可設來附加多個量化殘餘值146至熵編碼值144直到位元流到達預定數量的目標位元組。當位元流包括預定長度或數量的目標位元組時,殘餘量化階段106可停止決定多個量化殘餘值146。
在多個實施例中,輸入訊號140可以是一頻域輸入訊號140。編碼器100可包括一變換單元設來變換一時域輸入訊號至頻域輸入訊號140。
圖2顯示根據一實施例的一解碼器120的一區塊圖。解碼器120包括一編碼訊號剖析器122、一熵解碼器124以及一反向量化階段126。編碼訊號剖析器122係設來剖析一編碼訊號148以得到複數個熵編碼值144(e)與至少一量化殘餘值146(qr)。熵解碼器124係設來使用一熵解碼方案而解碼這些熵編碼值144(e)以得到複數個量化值142(q)。反向量化階段126係設來反向量化這些量化值142(q)以得到一輸出訊號150。藉此,反向量化階段126係設來細化一反向量化位準用來得到視量化殘餘值146(qr)與使用在一編碼器100於一量化階段106供得到這些量化值142(q)的死區而定的輸出訊號150。
在多個實施例中,反向量化階段126可設來藉視死區決定一細化反向量化位準而細化反向量化位準。
舉例來說,反向量化階段126可設來視死區或更精確地視死區的一寬度決定一位準,藉其反向量化位準可以被細化,即增加或減少,以得到細化反向量化位準。再者,反向量化階段126可設來視死區決定至少二新的反向量化位準,以及得到輸出訊號150其藉由使用量化殘餘值146所指的至少二細化反向量化位準的其中之一出。換句話說,量化殘餘值146表示至少二細化反向量化位準的哪個出是用來得到輸出訊號150。
圖3顯示根據一實施例的一系統130的一區塊圖。系統130包括圖1中的編碼器100以及圖2中的解碼器120。
接著,將進一步說明編碼器100及解碼器120、以及編碼器100及解碼器120的特徵的共同行動或互動。
圖4顯示根據一實施例的殘餘量化階段106的一區塊圖。殘餘量化階段106可包括一殘餘量化器106’、一反向量化器160以及一比較
器162。反向量化器160可設來反向量化該量化階段102所提供的這些量化值142(q)以得到一反向量化輸入訊號152(x_q)。比較階段162可設來比較輸入訊號140(x)與反向量化輸入訊號152(x_q)以得到殘餘訊號154。殘餘量化器106’可設來量化該量化階段102所造成的殘餘訊號。
換句話說,殘餘量化區塊圖係如圖4所示。頻譜142(q)係反向量化並與原始頻譜140(x)比較。一第二層量化然後視剩餘位元組可用而定來進行。殘餘量化階段106所進行的第二量化步驟係通常一貪心法(greedy)量化,即量化係逐線進行並且各再量化值係獨立地從以下傳送的資訊來完成。在這方式下殘餘量化位元流146(qr)可被截短每當編碼訊號形成器108所提供的位元流148達到所需的規模。
如圖4,殘餘量化階段106可更包括一控制單元164,例如一調節器。控制單元164可設來控制或最佳化殘餘量化器106’。
舉例來說,控制單元164可設來控制殘餘量化器106’使得殘餘量化器106’量化視死區或更精確地視用在量化階段102供得到這些量化值142(q)的死區的一寬度而定的殘餘訊號154。再者,控制單元164可設來控制視一數量的目標位元組與一數量的消耗位元組而定的殘餘量化器106’(例如,熵編碼器所提供的熵編碼值144所消耗,或是熵編碼值144與殘餘量化器106’已經提供的(多個)量化殘餘值所消耗。再者,控制單元164可設來控制視反向量化器160所提供的一資訊而定的殘餘量化器106’。反向量化器160所提供的資訊可包含死區的寬度,其可以是固定的或適應性地修改,其也可包含一倍率因子用在第一量化階段供正規化頻譜與細化量化步驟,其也可包含量化值是否有被歸零的一表示。
在一般殘餘量化,殘餘量化階段所進行的Qr是差異x[i]-x_q[i]的一簡單均勻純量量化:If x[i]>x_q[i]
Qr[i]=(int)(0.5+(x[i]-x_q[i])/delta_r)
Else
Qr[i]=(int)(-0.5+(x[i]-x_q[i])/delta_r)
其中x[i]是輸入訊號140,其中x_Q[i]是反向量化輸入訊號152,其中
(int)是一數值簡化功能,其中delta_r是殘餘量化器Qr的量化步驟其通常小於用在第一量化器Q的量化步驟的delta。一般來說:delta_r=0.5*delta
本發明多個實施例解決關於殘餘量化的二個問題。第一個主要問題是如何得到最佳化Qr(殘餘量化階段106的功能)知道第一量化階段102。第二個問題是當數量的剩餘位元組必須估測時,如何最小化編碼器當地合成與解碼器合成之間的不匹配。
通過率失真效能分析,可知均勻量化(用在一般的殘餘量化)係僅最佳化於無記憶體以及均勻地分散的來源。如果一熵編碼後來使用,均勻量化是一高斯來源(Gaussian source)的準最佳化且在非常高位元率。在較低比率,接近的最佳化解法是具有一死區帶著均勻門檻純量量化(DZ-UTSQ)。此量化器家族是一大範圍的多個分布的準最佳化,例如高斯(Gaussian)、拉普拉斯(Laplacian)以及廣義的拉普拉斯(generalized Laplacian)。死區因子可藉由不同方法來最佳化。其可視分布的估測即時的最佳化。同樣的其可固定在一預設最佳值發現給預期的多個輸入訊號或依據一些測量來改編,像是頻譜的音調,其也反映了分布。
接著,將呈現一解決方法來最佳化視一第一階段DZ-UTSQ 102而定的殘餘量化階段106所進行的殘餘量化Qr。死區參數稱為dz,DZ-UTSQ 102係定義為:If x[i]>0
Q[i]=(int)(rounding_dz+(x[i])/delta)
Else
Q[i]=(int)(-rounding_dz+(x[i])/delta)
以及x_q[i]=delta*Q[i]
其中x[i]是輸入訊號140,其中x_Q[i]是反向量化輸入訊號152,其中(int)是一整數數值簡化功能,其中delta是量化步驟用在DZ-UTSQ 102,其中rounding_dz=1-dz/2。
圖5出示DZ-UTSQ 102方案,其中倍率是由delta所正規
化。死區通常大於步驟1的正規化胞(cell)規模。1.25的一死區是對大部分頻率變換音源取樣的好估測。如果訊號較吵其可降低,當其更音調時並可增大。
本發明多個實施例定義了誤差x[i]-x_q[i]的最佳化量化細化。因為殘餘編碼沒有被熵限制,沒有額外的死區採用於殘餘量化Qr。再者,第一量化階段102的量化誤差的分布係假定為均勻的在再現位準170所限定量化胞的左部分及右部分。其係高比率假設,即新的量化多個胞的規模是考慮為夠小來捨棄非平滑分散的誤差於胞之中。此假設對大部分目標位元率有效。
這有二主要情況:一取樣以一非零值來量化以及一取樣以一零值來量化。
對於一非零量化值,每取樣1個位元可分派供殘餘量化Qr,並定義二相對再現位準fac_m與fac_p:fac_p=0.5-rounding_dz*0.5=0.25*(dz)
fac_m=0.5*rounding_dz=0.5*(1-0.5*dz)
藉此,fac_p可表示一正規化絕對值,藉由其反向量化位準(或再現位準)172的一正規化絕對值係增加以得到二細化反向量化位準174、176的一第一個細化反向量化位準174。其中fac_m代表一正規化絕對值,藉由其反向量化位準172的正規化絕對值係減少以得到二細化反向量化位準174、176的一第二個細化反向量化位準176,其中dz是死區的一正規化寬度,其從圖6將更清楚。
圖6出示二相對(細化)再現位準174、176供1的再現位準172。以1位元額外的位元,再現位準172可以1-fac_m細化(導致第二個細化反向量化位準176)或以1+fac_p細化(導致第一個細化反向量化位準174)。原始胞係切割至二非均勻胞。因為Q的量化誤差(第一量化階段102的量化功能)是假設均勻地分散的於新的多個胞之中,由R-D效能而言殘餘量化Qr是最佳化的。請注意量化Q與從一嵌入量化的殘餘量化Qr,即位元分派至殘餘量化Qr可以捨棄且Q-1仍可以進行。
殘餘量化階段106所進行的殘餘量化Qr可以整理如下:
其中prm是殘餘量化階段106使用量化殘餘值所產生的一位元流,其中x[i]是輸入訊號,其中x_Q[i]是反向量化輸入訊號,其中n是一索引其係增加1對各非零量化值其係藉Qr細化,其中i是一索引其係增加1對各所得到的量化值。
反向Qr可表示如下:if(x_Q[i]>0 & n<N bits )then
else if(n<N bits )then
可看到反向Qr僅進行給Nbits第一位元組。這指編碼器可產生較編碼器或解碼器將實際解碼更多的位元組。此機制用於當剩餘數量的位元組係估測且於當地合成在編碼器側需要產生。期待的再現訊號係產生在編碼器,僅管解碼器可能視在位元流中真實剩餘可用位元組而定來解碼較多或較少的位元組。
或者是,多於1的位元可每取樣分派至Qr。以相同原則,多個最佳化再現位準供2冪次位元組Qr多個再現位準可以被定義。
對於一零量化值,殘餘量化Qr可分派在多於1位元之內。這原因是因感知因素其要求具有零作為再現位準。避免例如當靜默時創造一假的噪聲訊號。一3位準可變長度編碼可以使用:
0:編碼一零
10:負再現位準
11:正再現位準
計算一新的相對再現位準,fac_z:fac_z=dz/3
藉此,fac_z可代表一正規化絕對值藉由其反向量化位準172的一正規化絕對值係增加以得到二細化反向量化位準174、176的一第一個細化反向量化位準174以及一正規化絕對值藉由其反向量化位準的一正規
化絕對值係減少以得到二細化反向量化位準174、176的一第二個細化反向量化位準176,其中dz是死區的一正規化寬度,從圖7將更清楚。
圖7顯示殘餘量化階段106對一零量化值142所進行的殘餘量化Qr。接近零的胞係分在三個均勻的新胞。
殘餘量化階段106對一零量化值所進行的殘餘量化Qr可整理如下
if prm[n]==1 then
其中C視量化階段的死區而定並可計算為C=delta*(fac_z/2),其中prm是殘餘量化階段106使用量化殘餘值所產生的一位元流,其中x[i]是輸入訊號,其中x_Q[i]是反向量化輸入訊號。索引n係增加1對各再量化至零的零量化值,其中n是增加2對各再量化至非零值的零量化值。
反向Qr可然後表示為:if(n<N bits )then
本發明的多個實施例可容易地延伸用到原始量化胞中的分布不均勻的假設下。在這情況下,這些相對再現位準可依據量化誤差的分布衍生。達到此的一方法是將原始量化胞切割為非均勻新的較小多個胞。一第二死區參數也可以使用。
以下將描述編碼器100以及解碼器120的進一步實施例。
首先,說明編碼器100。
殘餘量化係一細化量化層其係細化第一SQ階段(或量化階段102)。其削減最後未使用位元組,即未使用位元組=目標_位元組-nb位元組,nb位元組是熵編碼器104所消耗的數量的位元組。殘餘量化採用貪心法(greedy)策略與無熵以在每當位元流到達所需規模時停止編碼。
細化包含將每線上的量化頻譜線再量化。首先,非零量化線
係以一1位元殘餘量化器來處理:
write_bit(0)
else then
write_bit(1)
藉此,X[k]是輸入訊號140的一縮放取樣,X[]是反向量化輸入訊號152的對應縮放取樣。
最後,如果剩餘位元組允許,零量化線被考慮並以3位準量化如下:fac_z=(1-rounding_dz).0.66
write_bit(0)
else then
write_bit(1)
write_bit((1+sgn(X[k]))/2)
藉此,X[k]是輸入訊號140的一縮放取樣,X[]是反向量化輸入訊號152的對應縮放取樣,fac_z可代表一正規化絕對值,藉由其反向量化位準172的一正規化絕對值係增加以得到二細化反向量化位準174、176的一第一個細化反向量化位準174,以及一正規化絕對值藉由其反向量化位準的一正規化絕對值係減少以得到二細化反向量化位準174、176的一第二個細化反向量化位準176,其中rounding_dz=1-dz/2。
然後,說明解碼器120。
剩餘位元組細化多個非零解碼線。讀取每非零頻譜值的1位元:fac_p=(1-rounding_dz)/2
fac_m=rounding_dz/2
if(read_bit()==0)then
else then
藉此,X[k]是輸入訊號140,X[]是反向量化輸入訊號152,fac_p可代表一正規化絕對值,藉由其反向量化位準(或再現位準)172的一正規化絕對值係增加以得到二細化反向量化位準174、176的一第一個細化反向量化位準174。fac_m可代表一正規化絕對值,藉由其反向量化位準172的正規化絕對值係減少以得到二細化反向量化位準174、176的一第二個細化反向量化位準176,其中rounding_dz=1-dz/2。
如果至少2位元組留下來讀取,一零值係細化為:fac_z=(1-rounding_dz).0.66
if(read_bit()==0)then
else then
if(read_bit()==0)then
else then
藉此,X[k]是輸入訊號140的一縮放取樣,X[]是反向量化輸入訊號152的對應縮放取樣,fac_z可代表一正規化絕對值,藉由其反向量化位準172的一正規化絕對值係增加以得到二細化反向量化位準174、176的一第一個細化反向量化位準174以及一正規化絕對值藉由其反向量化位準的一正規化絕對值係減少以得到二細化反向量化位準174、176的一第二個細化反向量化位準176,其中rounding_dz=1-dz/2。
圖8顯示根據一實施例的編碼方法200的一流程圖。方法200包括:一步驟202,使用一死區來量化一輸入訊號以得到複數個量化值;一步驟204,使用一熵編碼方案來編碼這些量化值以得到複數個熵編碼值;一步驟206,量化該量化階段的一量化所造成的一殘餘訊號並視量化階段的死區決定複數個量化殘餘值;以及一步驟208,從這些熵編碼值與這些量化殘餘值形成一位元流。
圖9顯示根據一實施例的解碼方法220的一流程圖。方法220包括:一步驟222,剖析一編碼訊號以得到複數個熵編碼值與一量化殘餘值;一步驟224,使用一熵解碼方案而解碼這些熵編碼值以得到複數個量
化值;一步驟226,使用一死區而反向量化這些量化值以得到一輸出訊號;以及一步驟228,細化一反向量化位準用來供得到視一死區及量化殘餘值而定的輸出訊號。
雖然一些方面已經描述在一裝置的內容,很清楚的是這些方面也代表對應方法的一描述,其中一區塊或裝置對應至一方法步驟或一方法步驟的特徵。類似的,描述在一方法步驟的內容的方面也代表一對應區塊或項目或一對應裝置的特徵的的一描述。方法步驟的一些或全部也可以藉由(或使用)一硬體裝置來執行,像是例如一微處理器、一可編程電腦或一電子電路。在一些實施例中,大多重要方法步驟的某一個或更多也可以執行在這種裝置上。
依據某個實作需求,本發明的實施例可實作在硬體或軟體。這實作可使用一數位儲存媒體來進行,例如一軟碟、一DVD、一藍光光碟、一CD、一ROM、一PROM、EPROM、一EEPROM或一快閃記憶體,其中儲存具電子可讀取控制訊號,其係與一可編程電腦系統協同操作(或能夠協同操作)使得分別的方法係進行。因此,數位儲存媒體可以是電腦可讀取的。
根據本發明的一些實施例包括一資料載體其具有電子可讀取控制訊號,其能夠與一可編程電腦系統協同運作,使得所述方法之一能夠進行。
一般來說,本發明實施例可實作為具程式碼的一電腦程式產品,當電腦程式產品執行在一電腦時,程式碼可運作來進行其中一種方法。程式碼可例如儲存在一機器可讀取載體。
其他實施例包括進行前述其中之一方法的電腦程式,儲存在一機器可讀取載體。
換句話說,本發明方法的一實施例因而是一電腦程式其具有一程式碼供進行所述方法之一當電腦程式運行在一電腦時。
本發明方法的再一實施例因而是一資料載體(或一數位儲存媒體、或一電腦可讀取媒體)其包括記錄於其的電腦程式供進行所述方法之一。此資料載體、數位儲存媒體、或電腦可讀取媒體典型上是有形的及
/或非暫態。
本發明方法的再一實施例因而是一資料串流或一連串的訊號其表現電腦程式供進行所述方法之一。此資料串流或一連串的訊號可以例如配置為經由一資料通訊連線例如網際網路來傳輸。
再一實施例包括一處理裝置,例如,一電腦或一可編程邏輯裝置,配置為或適宜進行所述方法之一。
再一實施例包括一電腦具安裝在其的電腦程式供進行所述方法之一。
根據本發明再一實施例包括一裝置或一系統配置為傳送(例如,電子地或光學地)供進行所述方法之一的一電腦程式至一接收器。接收器可以例如是一電腦、一行動裝置、一記憶裝置或類似物等。此裝置或系統可以例如包括一檔案伺服器供傳輸電腦程式至接收器。
在一些實施例中,一可編程邏輯裝置(例如,一現場可編程邏輯閘陣列)可以使用來進行所述方法的一些或全部功能。在一些實施例中,一現場可編程邏輯閘陣列可與一微處理器協同操作以進行所述方法之一。一般來說,這些方法較佳地藉由硬體裝置來進行。
在較佳實施例之詳細說明中所提出之具體實施例僅用以方便說明本發明之技術內容,而非將本發明狹義地限制於上述實施例,在不超出本發明之精神及以下申請專利範圍之情況,所做之種種變化實施,皆屬於本發明之範圍。
100‧‧‧編碼器
102‧‧‧量化階段
104‧‧‧熵編碼器
106‧‧‧殘餘量化階段
108‧‧‧編碼訊號形成器
140‧‧‧輸入訊號
142‧‧‧量化值
144‧‧‧熵編碼值
146‧‧‧量化殘餘值
148‧‧‧編碼訊號
q‧‧‧量化頻譜值
qr‧‧‧量化殘餘值
e‧‧‧熵編碼值
Claims (22)
- 編碼器(100),包括:一量化階段(102)設來使用一死區來量化一輸入訊號(140)以得到複數個量化值(142);一熵編碼器(104)設來使用一熵編碼方案來編碼該等量化值(142)以得到複數個熵編碼值(144);一殘餘量化階段(106)設來量化該量化階段(102)所造成的一殘餘訊號,其中該殘餘量化階段(106)係設來對於一非零量化值視該量化階段(102)的該死區而決定至少一量化殘餘值(146);以及一編碼訊號形成器(108)設來從該等熵編碼值(144)及該至少一量化殘餘值(146)形成一編碼訊號(148)。
- 如申請專利範圍第1項所述之編碼器(100),其中該殘餘量化階段(106)係設來對於一非零量化值視該量化階段(102)的該死區的一寬度決定至少一量化殘餘值(146)。
- 如申請專利範圍第2項所述之編碼器(100),其中該殘餘量化階段(106)包括:一反向量化器(160)設來反向量化視該量化階段(102)的該死區而定的該等量化值(112)以得到一反向量化輸入訊號(152);其中該殘餘量化階段(106)係設來決定該至少一量化殘餘值(146)使得該量化殘餘值(146)包括1位元供一非零量化值;以及其中該殘餘量化階段(106)係設來對於該非零量化值決定該量化殘餘值(146)包括一邏輯0如果該輸入訊號(140)小於該反向量化輸入訊號(152)對於該非零量化值,否則對於該非零量化值決定該量化殘餘值(146)包括一邏輯1。
- 如申請專利範圍第2項所述之編碼器(100),其中該殘餘量化階段(106)包括:一反向量化器(160)設來反向量化視該死區而定的該等量化值(142)以得到一反向量化輸入訊號(152);以及一比較器(162)設來比較該輸入訊號(140)與該反向量化輸入訊號 (152)。
- 如申請專利範圍第4項所述之編碼器(100),其中該比較器(162)係設來比較該輸入訊號(140)與該反向量化輸入訊號(152)以得到該殘餘訊號(154);其中該殘餘量化階段(106)係設來量化視該死區而定的該殘餘訊號(154)。
- 如申請專利範圍第5項所述之編碼器(100),其中該殘餘量化階段(106)係設來決定該至少一量化殘餘值(146)使得該量化殘餘值(146)包括1位元供一非零量化值;以及其中該殘餘量化階段係設來對於該非零量化值決定該量化殘餘值(146)包括一邏輯0如果該殘餘訊號(154)是負的對於該非零量化值,否則對於該非零量化值決定該量化殘餘值(146)包括一邏輯1。
- 如申請專利範圍第6項所述之編碼器(100),其中該殘餘量化階段(106)係設來決定該至少一量化殘餘值(146)使得該量化殘餘值(146)包括1位元對於一非零量化值,其中該殘餘量化階段(106)係設來基於該語法決定該量化殘餘值(146)
- 如申請專利範圍第5項所述之編碼器(100),其中該殘餘量化階段(106)係設來決定該量化殘餘值(146)使得該量化殘餘值(146)包括2位元組對於一零量化值,其中該殘餘量化階段(106)係設來基於該語法決定該量化殘餘值(146)
- 如申請專利範圍第1項所述之編碼器(100),其中該編碼訊號形成器(108)係設來藉附加該至少一量化殘餘值(146)或複數個量化殘餘值(146)至該等熵編碼值(144)直到該編碼訊號(148)包括傳輸至一解碼器可用的一最大長度而形成該編碼訊號(148)。
- 如申請專利範圍第1項所述之編碼器(100),其中該編碼訊號形成器(108)係設來提供一位元流作為該編碼訊號(148),該編碼訊號形成器(108)係設來從該等熵編碼值(144)與該等量化殘餘值(146)形成該位元流,其中該編碼訊號形成器(108)係設來附加該等量化殘餘值(146)至該等熵編碼值(144),其中該殘餘量化階段(106)包括:一殘餘量化器(106’);以及一調節器(164)設來控制該殘餘量化器(106’)以量化視用在該量化階段(102)該死區的一寬度而定的該殘餘訊號以得到該等量化值(142);其中該調節器(164)係設來得到一數量的目標位元組與一數量的消耗位元組;以及其中該調節器(164)係設來控制該殘餘量化階段以當該位元流包括該數量的目標位元組時停止決定多個量化殘餘值。
- 一種解碼器(120),包括:一編碼訊號剖析器(122)設來剖析一編碼訊號(148)以得到複數個熵編碼值(144)及至少一量化殘餘值(146);一熵解碼器(124)設來使用一熵解碼方案而解碼該等熵編碼值(144)以得到複數個量化值(142);以及一反向量化階段(126)設來反向量化該等量化值(142)以得到一輸 出訊號(150);其中該反向量化階段(126)係設來細化一反向量化位準(172)用來供得到視該量化殘餘值(146)及一死區而定的該輸出訊號(150)。
- 如申請專利範圍第11項所述之解碼器(120),其中該反向量化階段(126)係設來細化一反向量化位準(172)供視一量化殘餘值(146)及該死區的一寬度而定的一非零量化值。
- 如申請專利範圍第12項所述之解碼器(120),其中該反向量化階段(126)係設來細化藉視該死區決定一細化反向量化位準(174、176)的該反向量化位準(172)。
- 如申請專利範圍第13項所述之解碼器(120),其中該反向量化階段(126)係設來決定二細化反向量化位準(174、176)供一非零量化值,其中該反向量化階段(126)係設來得到該輸出訊號(150)藉由使用量化殘餘值所指的該二細化反向量化位準(174、176)的一出。
- 如申請專利範圍第14項所述之解碼器(120),其中該反向量化階段(126)係設來藉由一增加值增加該反向量化位準(172)的一正規化絕對值以得到該二細化反向量化位準的一第一個(174);其中該反向量化階段(126)係設來藉由一減少值減少該反向量化位準(172)的一正規化絕對值以得到該二細化反向量化位準的一第二個(174);以及其中該增加值與該減少值彼此不同。
- 如申請專利範圍第14項或第15項所述之解碼器(120),其中該反向量化階段(126)係設來基於該二因子決定該二細化反向量化位準(174、176)供一非零量化值:fac_p=0,25 * dz fac_m=0,5 *(1-0,5 * dz)其中fac_p表示一正規化絕對值藉由其該反向量化位準(172)的一正規化絕對值係增加以得到該二細化反向量化位準的一第一個(174),其中fac_m表示一正規化絕對值藉由其該反向量化位準(172)的該正規化絕對值係減少以得到該二細化反向量化位準的一第二個(176), 其中dz係該死區的一正規化寬度。16、如申請專利範圍第11項至第13項之其中一項所述之解碼器(120),其中該反向量化階段(126)係設來決定二細化反向量化位準(174、176)供一零量化值,其中該反向量化階段(126)係設來藉使用該反向量化位準(172)與量化殘餘值所指的二細化反向量化位準(174、176)其中之一出而得到該輸出訊號(150)。
- 如申請專利範圍第16項所述之解碼器(120),其中該反向量化階段(126)係設來藉一增加值增加該反向量化位準(172)的一正規化絕對值以得到該二細化反向量化位準(174)的一第一個;其中該反向量化階段(126)係設來藉一減少值減少該反向量化位準(172)的一正規化絕對值以得到該二細化反向量化位準(174)的一第二個。
- 如申請專利範圍第17項所述之解碼器(120),其中該反向量化階段(126)係設來基於該因子決定該二細化反向量化位準(174、176)供該零量化值:fac_z=dz/3其中fac_z表示一正規化絕對值藉由其該反向量化位準的一正規化絕對值(172)係增加以得到該二細化反向量化位準的一第一個(174)以及一正規化絕對值藉由其該反向量化位準(172)的一正規化絕對值係減少以得到該二細化反向量化位準的一第二個(176),其中dz係該死區的一正規化寬度。
- 一種系統,包括:如申請專利範圍第1項至第10項的其中一項所述之一編碼器(100);以及如申請專利範圍第11項至第18項的其中一項所述之一解碼器(120)。
- 一種編碼方法(200),包括:使用一死區來量化(202)一輸入訊號以得到複數個量化值;使用一熵編碼方案來編碼(204)該等量化值以得到複數個熵編碼值;量化(206)該量化階段的一量化所造成的一殘餘訊號並視該量化階段 的該死區決定複數個量化殘餘值;以及從該等熵編碼值與該等量化殘餘值形成(208)一位元流。
- 一種解碼方法(220),包括:剖析(222)一編碼訊號以得到複數個熵編碼值與一量化殘餘值;使用一熵解碼方案而解碼(224)該等熵編碼值以得到複數個量化值;反向量化(226)該等量化值以得到一輸出訊號;以及細化(228)一反向量化位準用來供得到視一死區及該量化殘餘值而定的該輸出訊號。
- 一種電腦程式,進行如申請專利範圍第20項或第21項的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178780.4A EP2980793A1 (en) | 2014-07-28 | 2014-07-28 | Encoder, decoder, system and methods for encoding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201618084A true TW201618084A (zh) | 2016-05-16 |
TWI582757B TWI582757B (zh) | 2017-05-11 |
Family
ID=51224867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104124172A TWI582757B (zh) | 2014-07-28 | 2015-07-24 | 編碼器、解碼器、編碼及解碼的系統及方法 |
Country Status (19)
Country | Link |
---|---|
US (3) | US10375394B2 (zh) |
EP (2) | EP2980793A1 (zh) |
JP (4) | JP6494741B2 (zh) |
KR (3) | KR20190101483A (zh) |
CN (2) | CN107079152B (zh) |
AR (1) | AR101547A1 (zh) |
AU (2) | AU2015295604B2 (zh) |
CA (1) | CA2956011C (zh) |
ES (1) | ES2688103T3 (zh) |
MX (1) | MX366803B (zh) |
MY (1) | MY178527A (zh) |
PL (1) | PL3175450T3 (zh) |
PT (1) | PT3175450T (zh) |
RU (1) | RU2678168C2 (zh) |
SG (1) | SG11201700695TA (zh) |
TR (1) | TR201815373T4 (zh) |
TW (1) | TWI582757B (zh) |
WO (1) | WO2016016122A1 (zh) |
ZA (1) | ZA201700513B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980793A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
KR102543505B1 (ko) * | 2018-03-29 | 2023-06-14 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 종속 양자화 |
CN112154502B (zh) * | 2018-04-05 | 2024-03-01 | 瑞典爱立信有限公司 | 支持生成舒适噪声 |
CN117729332A (zh) | 2018-09-24 | 2024-03-19 | 弗劳恩霍夫应用研究促进协会 | 使用或适用于与依赖标量量化的组合的变换系数的有效编码 |
CN113302688B (zh) * | 2019-01-13 | 2024-10-11 | 华为技术有限公司 | 高分辨率音频编解码 |
WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
US20220272342A1 (en) * | 2019-07-05 | 2022-08-25 | V-Nova International Limited | Quantization of residuals in video coding |
US10984808B2 (en) * | 2019-07-09 | 2021-04-20 | Blackberry Limited | Method for multi-stage compression in sub-band processing |
US11095311B2 (en) * | 2019-11-27 | 2021-08-17 | Qualcomm Incorporated | Quantization codeword selection for low cost parity checking |
CN115988215A (zh) * | 2022-12-12 | 2023-04-18 | 上海交通大学 | 可变码率图像压缩方法、系统、装置、终端及存储介质 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3501521B2 (ja) * | 1994-11-07 | 2004-03-02 | 三菱電機株式会社 | ディジタル映像信号再生装置および再生方法 |
JPH09324397A (ja) | 1996-06-03 | 1997-12-16 | Mitsubishi Paper Mills Ltd | たばこ用巻紙およびその製造方法 |
US6269192B1 (en) * | 1997-07-11 | 2001-07-31 | Sarnoff Corporation | Apparatus and method for multiscale zerotree entropy encoding |
EP1345331B1 (en) * | 2000-12-22 | 2008-08-20 | Sony Corporation | Encoder |
CN101448162B (zh) * | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
US6947886B2 (en) * | 2002-02-21 | 2005-09-20 | The Regents Of The University Of California | Scalable compression of audio and other signals |
EP1465349A1 (en) * | 2003-03-31 | 2004-10-06 | Interuniversitair Microelektronica Centrum Vzw | Embedded multiple description scalar quantizers for progressive image transmission |
JP4014098B2 (ja) * | 2003-06-26 | 2007-11-28 | 株式会社Kddi研究所 | 画像の階層的符号化装置および復号装置 |
US7738554B2 (en) * | 2003-07-18 | 2010-06-15 | Microsoft Corporation | DC coefficient signaling at small quantization step sizes |
US7602851B2 (en) * | 2003-07-18 | 2009-10-13 | Microsoft Corporation | Intelligent differential quantization of video coding |
CN102595131B (zh) | 2004-06-18 | 2015-02-04 | 汤姆逊许可公司 | 用于对图像块的视频信号数据进行编码的编码器 |
WO2006036763A2 (en) | 2004-09-22 | 2006-04-06 | Cyberdefender Corporation | System for distributing information using a secure peer-to-peer network |
WO2006047795A1 (en) * | 2004-10-27 | 2006-05-04 | Geoffrey Charles Wolf | Sealable container for drinking and temporarily sealing bottles |
WO2006108736A1 (fr) * | 2005-04-11 | 2006-10-19 | France Telecom | Procédé et dispositif de quantification progressive, procédé et dispositif de quantification inverse, programmes informatiques, signal et support de données correspondants |
KR100785855B1 (ko) * | 2005-07-19 | 2007-12-14 | 한국전자통신연구원 | 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법 |
WO2007011160A1 (en) * | 2005-07-19 | 2007-01-25 | Electronics And Telecommunications Research Institute | Apparatus and method of embedded quantizaton for the improved snr scalbilty |
US20070147497A1 (en) * | 2005-07-21 | 2007-06-28 | Nokia Corporation | System and method for progressive quantization for scalable image and video coding |
US7995649B2 (en) * | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
JPWO2008047795A1 (ja) * | 2006-10-17 | 2010-02-25 | パナソニック株式会社 | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
WO2008046492A1 (en) * | 2006-10-20 | 2008-04-24 | Dolby Sweden Ab | Apparatus and method for encoding an information signal |
US8498335B2 (en) | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
JP5618826B2 (ja) * | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
US8902972B2 (en) * | 2008-04-11 | 2014-12-02 | Qualcomm Incorporated | Rate-distortion quantization for context-adaptive variable length coding (CAVLC) |
CN103000178B (zh) * | 2008-07-11 | 2015-04-08 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
US8385404B2 (en) * | 2008-09-11 | 2013-02-26 | Google Inc. | System and method for video encoding using constructed reference frame |
US8326075B2 (en) * | 2008-09-11 | 2012-12-04 | Google Inc. | System and method for video encoding using adaptive loop filter |
WO2010091505A1 (en) * | 2009-02-13 | 2010-08-19 | Research In Motion Limited | Modified entropy encoding for images and videos |
CN101710990A (zh) | 2009-11-10 | 2010-05-19 | 华为技术有限公司 | 视频图像编码处理、解码处理方法和装置及编解码系统 |
FR2960335A1 (fr) * | 2010-05-18 | 2011-11-25 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
FR2969360A1 (fr) * | 2010-12-16 | 2012-06-22 | France Telecom | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
US9118918B2 (en) * | 2012-03-06 | 2015-08-25 | National Taiwan University | Method for rate-distortion optimized transform and quantization through a closed-form operation |
ES2644131T3 (es) * | 2012-06-28 | 2017-11-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en una codificación de audio utilizando un estimador mejorado de distibución de probabilidad |
US20140010277A1 (en) * | 2012-07-09 | 2014-01-09 | Qualcomm, Incorporated | Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id |
US9549182B2 (en) * | 2012-07-11 | 2017-01-17 | Qualcomm Incorporated | Repositioning of prediction residual blocks in video coding |
US9264713B2 (en) * | 2012-07-11 | 2016-02-16 | Qualcomm Incorporated | Rotation of prediction residual blocks in video coding with transform skipping |
US9648318B2 (en) * | 2012-09-30 | 2017-05-09 | Qualcomm Incorporated | Performing residual prediction in video coding |
US9661340B2 (en) * | 2012-10-22 | 2017-05-23 | Microsoft Technology Licensing, Llc | Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats |
US10390034B2 (en) * | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US9877035B2 (en) * | 2014-03-17 | 2018-01-23 | Qualcomm Incorporated | Quantization processes for residue differential pulse code modulation |
EP2980793A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
-
2014
- 2014-07-28 EP EP14178780.4A patent/EP2980793A1/en not_active Withdrawn
-
2015
- 2015-07-24 TW TW104124172A patent/TWI582757B/zh active
- 2015-07-24 PT PT15738954T patent/PT3175450T/pt unknown
- 2015-07-24 AU AU2015295604A patent/AU2015295604B2/en active Active
- 2015-07-24 RU RU2017104514A patent/RU2678168C2/ru active
- 2015-07-24 CN CN201580050928.3A patent/CN107079152B/zh active Active
- 2015-07-24 SG SG11201700695TA patent/SG11201700695TA/en unknown
- 2015-07-24 PL PL15738954T patent/PL3175450T3/pl unknown
- 2015-07-24 WO PCT/EP2015/067001 patent/WO2016016122A1/en active Application Filing
- 2015-07-24 KR KR1020197024306A patent/KR20190101483A/ko active Application Filing
- 2015-07-24 EP EP15738954.5A patent/EP3175450B1/en active Active
- 2015-07-24 KR KR1020177005691A patent/KR102014295B1/ko active IP Right Grant
- 2015-07-24 KR KR1020217038022A patent/KR102512937B1/ko active IP Right Grant
- 2015-07-24 ES ES15738954.5T patent/ES2688103T3/es active Active
- 2015-07-24 MX MX2017001238A patent/MX366803B/es active IP Right Grant
- 2015-07-24 JP JP2017504798A patent/JP6494741B2/ja active Active
- 2015-07-24 CN CN202110277333.9A patent/CN112954323A/zh active Pending
- 2015-07-24 TR TR2018/15373T patent/TR201815373T4/tr unknown
- 2015-07-24 CA CA2956011A patent/CA2956011C/en active Active
- 2015-07-24 MY MYPI2017000138A patent/MY178527A/en unknown
- 2015-07-28 AR ARP150102401A patent/AR101547A1/es unknown
-
2017
- 2017-01-23 ZA ZA2017/00513A patent/ZA201700513B/en unknown
- 2017-01-27 US US15/417,232 patent/US10375394B2/en active Active
-
2018
- 2018-11-06 AU AU2018260836A patent/AU2018260836B2/en active Active
-
2019
- 2019-03-05 JP JP2019039126A patent/JP6892467B2/ja active Active
- 2019-06-21 US US16/448,511 patent/US10735734B2/en active Active
-
2020
- 2020-07-08 US US16/923,909 patent/US20200344476A1/en active Pending
-
2021
- 2021-05-27 JP JP2021088848A patent/JP2021153305A/ja active Pending
-
2023
- 2023-09-15 JP JP2023150015A patent/JP2023169294A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI582757B (zh) | 編碼器、解碼器、編碼及解碼的系統及方法 | |
RU2585990C2 (ru) | Устройство и способ для выполнения кодирования методом хаффмана | |
AU2011311543B2 (en) | Apparatus and method for level estimation of coded audio frames in a bit stream domain | |
KR102072365B1 (ko) | 고급 양자화기 | |
US11315583B2 (en) | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits | |
TW201637002A (zh) | 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、及用以解碼經編碼音訊信號之方法 |