TWI395203B - 用於多重描述編碼系統之改良式相關與解相關變換技術 - Google Patents
用於多重描述編碼系統之改良式相關與解相關變換技術 Download PDFInfo
- Publication number
- TWI395203B TWI395203B TW095140015A TW95140015A TWI395203B TW I395203 B TWI395203 B TW I395203B TW 095140015 A TW095140015 A TW 095140015A TW 95140015 A TW95140015 A TW 95140015A TW I395203 B TWI395203 B TW I395203B
- Authority
- TW
- Taiwan
- Prior art keywords
- quantized
- transform
- signal
- coefficients
- correlation
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000009466 transformation Effects 0.000 claims description 71
- 230000006870 function Effects 0.000 claims description 52
- 238000013507 mapping Methods 0.000 claims description 42
- 238000013139 quantization Methods 0.000 claims description 40
- 238000000844 transformation Methods 0.000 claims description 27
- 230000002441 reversible effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 claims 6
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000011002 quantification Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 abstract description 11
- 230000008569 process Effects 0.000 abstract description 5
- 238000011084 recovery Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 35
- 230000003595 spectral effect Effects 0.000 description 33
- 239000011159 matrix material Substances 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000000265 homogenisation Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000000116 mitigating effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000010972 statistical evaluation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Color Television Systems (AREA)
- Error Detection And Correction (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
本發明大致係關於音訊和視訊編碼,且更具體地說,係關於多重描述編碼系統和技術。
多重描述(MD)編碼系統和技術將一來源訊號編碼成二或多個部份或“描述”,其之每一個包含一數量之資訊,其足以允許重建原始來源訊號之較低品質之版本。理想上,在一MD編碼系統中之解碼器可從一或多個這些描述來重建來源訊號之合理的摹本,但重建之摹本之可靠度隨著描述之數目增加而增加。
MD編碼系統背後之基本想法將一編碼訊號劃分成二或多個描述,如此使得每個描述表示原始來源訊號之一合理之摹本,且如此使得每個描述與其他描述分享一些資訊。在一MD編碼系統中之解碼器從盡可能多的這些描述中收集資訊,從包含在所接收之描述中之資訊來評估任何遺失之描述之內容,並從接收到的和評估的描述來重建來源訊號之一摹本。
MD編碼技術在其中一編碼訊號之一部份可能在傳輸期間遺失或損壞之多種不同的應用中都是有吸引力的,因為當傳輸通道狀況變得越來越有挑戰性時,它們可提供一重建摹本之品質上的和緩的退化。此特性對操作於相對損耗之傳輸通道上操作之無線封包網路來說是特別吸引人的。有關MD編碼系統和技術之額外的資訊可從下列得到:Goyal所作之“多重描述編碼:壓縮遇到網路”IEEE訊號處理雜誌,2001年九月。
已知許多MD技術可用來劃分編碼資訊為許多部份或描述。一些技術應用一相關變換至編碼資訊,其以一可逆轉或可逆方式來傳佈資訊為二或多個部份。每個部份可組合為一分離的位元串流或封包以供儲存或傳輸之用。不幸地,用於使用相關變換之已知技術會將量化雜訊注入被劃分成多個部份之編碼資訊中,其會使得由一解碼器重建之摹本之感知品質降低。再者,已知實現相關變換之方式需要大量計算,其要求可觀的計算資源數量來執行變換所需之計算。
所需者為一種應用相關變換至編碼資訊之方式,其若有的話也僅引入少量量化雜訊且可有效地加以實現。
根據本發明之一觀點,藉由應用一相關變換至量化訊號元素之集合以產生對應的變換係數之集合來處理一訊號以供在一多重描述編碼系統中使用,其中量化訊號元素之集合具有不同的量化解析度,其表示訊號之訊號成分,且相關變換允許藉由一互補解相關變換從該等變換係數中精確地回復該等量化訊號元素。
根據本發明之其他觀點,藉由應用一Hadamard變換至量化訊號元素之集合以產生從其推得變換係數之對應集合之值來處理一訊號以供使用於一多重編碼系統中,其中每個量化訊號元素之集合較對應之變換係數之集合來得較無相關。
根據本發明之其他觀點,藉由應用一解相關變換至從編碼訊號獲得之變換係數之集合以回復被輸入至一互補相關變換之量化訊號元素之集合之精確複本來處理一編碼訊號以供使用於一多重描述編碼系統中,其中該等量化訊號元素具有不同的量化解析度且表示一訊號之訊號成分。
根據本發明之一進一步之觀點,藉由應用一反轉Hadamard變換至從變換係數之集合推得之值來產生對應之量化訊號元素之集合來處理一編碼訊號以供使用於一多重描述編碼系統中,其中每個變換係數之集合較量化訊號元素之對應集合來得相關。
本發明之許多不同的觀點及其較佳實施例可藉由參考下列討論及附圖來較佳地了解,其中在幾個圖式中類似的參考數字指稱類似的元件。下列討論和圖式之內容係提出僅做為範例之用且不應被理解為表示對本發明之範圍之限制。
第1和2圖為在一可包含本發明之許多不同的觀點之編碼系統中之一傳送器和一接收器之示意方塊圖。
第3圖為一編碼器之一實施例之示意方塊圖。
第4圖為一解碼器之一實施例之示意方塊圖。
第5圖為使用具有同質量化解析度之量化器之一相關變換之第一層級之示意方塊圖。
第6圖為使用具有同質量化解析度之量化器之一解相關變換之最後一層級之示意方塊圖。
第7圖為使用具有異質量化解析度之量化器之一相關變換之第一層級之示意方塊圖。
第8圖為使用具有異質量化解析度之量化器之一解相關變換之最後一層級之示意方塊圖。
第9圖為使用具有異質量化解析度之量化器之具有三個層級之一相關變換之示意方塊圖。
第10圖為使用具有異質量化解析度之量化器之具有三個層級之一解相關變換之示意方塊圖。
第11圖為在其輸入上具有映射功能之一相關變換之示意方塊圖。
第12圖為在其輸入上具有逆映射功能之一解相關變換之示意方塊圖。
第13圖為可用來實現本發明之許多不同的觀點之一裝置之示意方塊圖。
第1圖為在一感知編碼系統中之一傳送器10之一範例之示意方塊圖。在此特定範例中,傳送器10應用分析濾波
器群至來源訊號2以產生頻率次帶訊號13,並應用感知模型14至次帶訊號13以評估來源訊號2之感知遮罩性質。編碼器16以根據從感知模型14所接收之控制資訊15所選擇之量化解析度來量化次帶訊號13之元素,並將量化的次帶訊號元素編碼為多重描述17,其係由格式化器18組合為一編碼訊號4。在較佳實施例中,編碼器16亦提供來源訊號2之一評估頻譜輪廓19以包括於編碼訊號4中。可將本發明之許多不同的觀點合併至編碼器16中以協助多重描述17之產生。
第2圖為在一感知編碼系統中之一接收器20之一範例之示意方塊圖。接收器20使用解格式化器22來從編碼訊號4獲得多重描述,且在較佳實施例中,從編碼訊號4中獲得來源訊號2之一評估之頻譜輪廓27。解碼器24從所有的或一些多重描述回復次帶訊號25之一複本。為來源訊號2之一重建之摹本之輸出訊號6係藉由應用合成濾波器群26至回復之次帶訊號25來產生的。可將本發明之許多不同的觀點合併至解碼器24中以協助多重描述23之處理。
分析和合成濾波器群12,26可以許多不同的方式來加以實現,其包括區塊和波形變換,如四分之一鏡像濾波器,遞歸濾波器和晶格濾波器之數位濾波器之群或串聯。在一音訊編碼系統之特定實施例中,其將於下面更詳細地討論,分析濾波器群12係由一修改的分立餘弦變換(MDCT)實現而合成濾波器群26係由一互補反轉修改分立餘弦變換(IMDCT)加以實現,其描述於下列中:Princen等人所作之“使用以時域別名消除為基礎之濾波器群設計之次帶/變換編碼”,1987聲音,語音和訊號處理國際會議記錄(ICASSP),1987年五月,第2161-64頁。根據此實施例,應用分析濾波器群12至來源訊號2之重疊區段,在每個區段中有2N個取樣,以產生MDCT係數之區塊或訊號元素,其表示來源訊號之頻譜成分。濾波器群在每個區塊中產生2N個係數。編碼器16以根據感知模型所選擇之變化的量化解析度來量化在每個區塊中之MDCT係數之一半,並將表示量化係數之資訊組合成編碼訊號4。應用合成濾波器群26至解碼器24從編碼訊號44回復之MDCT係數之區塊以產生具有每個2N個取樣之訊號取樣之區塊。僅每個區塊中之一半MDCT係數被加以編碼和輸入至解碼器24中,因為另一半MDCT係數包含冗餘資訊。這些取樣區塊以一特定方式組合,其消除了時域別名加工以產生輸出訊號6之區段,其為輸入之來源訊號2之摹本。
在此所討論之範例指稱感知編碼系統,其根據感知模型來量化諸如MDCT係數之訊號元素;然而,感知編碼之使用並非關鍵的。再者,本發明可使用於不使用濾波器群之編碼系統中,以將一來源訊號分成次帶訊號。本發明可使用於基本上量化任何型式之訊號元素之編碼系統中,諸如變換係數或訊號取樣,其係使用不同的量化解析度,其係根據所想要的任何標準選擇的。在下列討論中所指稱之MDCT係數,頻譜係數或頻譜成分和類似者僅是訊號元素之範例。
第3圖為編碼器16之一實施例之示意方塊圖,其中對來源訊號2之區段產生2N個MDCT係數或元素之一區塊。藉由使用回應從感知模型14所接收之控制資訊15而選擇之量化解析度之量化器162來量化在每個區塊中一半的MDCT係數。相關變換164被應用至量化的MDCT係數之區塊以產生相關變換(CT)係數之集合。傳佈器166產生來源訊號2之多重描述17,其係藉由傳佈CT係數為量化值之群組,其包含足夠的資訊來允許從一或多個群組重建來源訊號之不精確之摹本,但可從較大數量之群組重建更精確之摹本。該等群組被組合成編碼訊號4。在圖式中所示之實施例中,一頻譜輪廓評估器168獲得MDCT係數之變化型式並提供它們做為來源訊號2之一評估的頻譜輪廓19。多重描述17及評估之頻譜輪廓19可為熵編碼的。
在一示範性實施例中,由編碼訊號4所傳送之資訊係配置於封包中。對來源訊號2之一片段之CT係數於不同的封包中傳送。每個封包傳送對來源訊號2之二或多個片段之CT係數。此配置產生時間分集之型式,其加入延遲至編碼系統,但減少了任何MDCT係數之區塊之總損失之可能性。接收器20可從少於所有CT係數中重建對每個MDCT係數之區塊之可使用之資訊,其允許重建來源訊號2之一不精確之摹本,即使在傳輸期間損失或損壞了一些CT係數。
第4圖為解碼器24之一實施例之示意方塊圖,其中一反
轉傳佈器242從自編碼訊號4獲得之量化值之群組收集CT係數,其係使用為由傳佈器166執行之傳佈程序之反轉程序。若任何群組之量化值遺失或損壞,一或多個CT係數亦將遺失或損壞。係數評估器244獲得任何遺失或損壞CT係數之評估。當一或多個封包在傳輸期間損失或損壞時,接收器20可使用評估之頻譜輪廓27來改進重建之訊號之精確性。解相關變換246被應用至CT係數之集合以回復N個量化MDCT係數之區塊。若沒有來源訊號2之一特定片段之CT係數遺失或損壞的話,則由解相關變換246所回復之量化MDCT係數之區塊應相同於量化MDCT係數之區塊,其被輸入至相關變換164。若一些CT係數遺失或損壞,則係數評估器244及解相關變換246可使用許多內插和統計評估技術來從其他CT係數及評估之頻譜輪廓中推得遺失或損壞之CT係數之評估,以盡可能很少錯誤地產生量化之MDCT係數。這些統計技術之範例討論於Goyal等人所著之“相關變換之一般化多重描述”IEEE Trans.On Information Theory,vol.47,no.6,Sep.2001,pp.2199-2224。若對來源訊號2之一特定片段之所有CT係數遺失或損壞,則可使用其他型式之錯誤緩和,諸如重覆對一先前片段之資訊。
相關變換164可由彼此串聯之線性2x2變換之階或層級來實現的,其中每個2x2變換係於輸入值之對上操作以產生輸出值之對。可用來實現相關變換164之一已知之線性2變換可表示為:
其中yn,t=在全部T個層級中在恰於變換之層級t之前之在一N個係數之區塊中之量化MDCT係數n;以及α=一相關參數。
等式1中所表示之變換可由一電腦程式中之二個”for”迴圈來加以實現,其中在進行至下一個層級之前,在一特定層級或階層t中之2x2變換係於一區塊中之所有N個係數上操作。此相關變換可理解根據參數α為一混合一低頻MDCT係數之值與一高頻MDCT係數之值之變換。對大的α值來說,輸出值係由低頻係數之值來主導的,而對小的α值來說,輸出值係由高頻係數之值來主導的。隨著T的值增加,相關變換164執行的次數變多。由此相關變換所產生之輸出值構成CT係數之一集合,其可標註為{yn,T}對0nN-1。等式1中所表示之變換在許多實用的編碼系統中為一吸引人之選擇,因為有已知的最佳方法,藉由其可評估損失的或損壞的CT係數。例如,參看Goyal等人所作之IEEE Trans.On Info.Theory,vol.47,no.6,Sep.2001,如上述。
雖然T可設定至任何值,但設定T=log2(N)使得每個CT係數相關於每個MDCT係數。結果,使用T>log2(N)之值若有的話也只提供很少的額外錯誤緩和好處。在許多實用的音訊編碼系統中,N一般大於或等於512。在具有T=log2(N)之這樣一個系統中實現一相關變換所需之計算資源會是不可接受地大;因此,選擇小於log2(N)之對T之值會是必要的,諸如1,2,3或4。再者,因為CT係數被分成不同的描述,對T之值亦可描述對可使用之多個不同描述之限制。對等式1中所表示之相關變換來說,描述D之數目被設定為等於2T。
6.解相關變換MDCT係數可從CT係數中藉由一解相關變換來加以回復。互補之解相關變換246可表示為:
此變換可由一電腦程式中之二個”for”迴圈來加以實現,其中t具有等於T之初始值並減少至1。
7.傳佈器傳佈器166將CT係數之集合分組成相互排斥之CT係數之子集合。每個子集合構成來源訊號2之多重描述17之一。傳佈器建構描述如此使得每個描述包含相關於來源之足夠資訊以允許來源之低品質版本之回復。最好,描述被建構為使得若所有描述皆為可得的話,一解碼器可回復編碼來源訊號之一精確摹本。若任何描述損失或損壞,在解碼器可得之描述中之係數間之相關可用來評估遺失或損壞之資訊。
在一實施例中,傳佈器166建構D描述,其係藉由組合每個第D個係數至一個別的描述中之方式。若傳佈器166從例如四個描述中建構,則可將CT係數0,4,8,12,...組合至一第一描述中,可將CT係數1,5,9,13,...組合至一第二描述中,可將CT係數2,6,10,14,...組合至一第三描述中,以及可將CT係數3,7,11和15組合至一第四描述中。傳佈器166可以許多不同的方式來加以實現。
傳佈器166可以許多不同的方式來使得描述“多樣化”,諸如例如分離描述以供於不同的時間期間內傳輸(時間多樣化),以供使用不同的通道來傳輸(通道多樣化),或藉由使用這些和其他多樣化方法之許多不同的組合來做。做為其他範例,傳佈器166可從不同的來源群組幾個描述以供傳輸之用(來源多樣化)。
反轉傳佈器242從於系統訊號4中接收到之描述盡可能完整地形成CT係數之集合。可緩衝和處理在描述中之係數以逆轉任何多樣化方案之效果,諸如上述的那些。當對一已予來源之所有描述已被接收時,或當在解碼器上之任何即時性能限制要求來源之解碼必須進行時,反轉傳佈器242以反轉於由傳佈器166所執行之傳佈之方式來配置CT係數。
在如上述使用傳佈器166之一實現之編碼系統中,反轉傳佈器242可整理來自可用之描述之CT係數。若例如來自四個描述之第四個遺失或損壞,所整理之係數集合會包含CT係數0,1,2,X,4,5,6,X,8,9,10,X,12,13,14,X,...,其中符號X表示一遺失或損壞之係數。這些遺失或損壞之係數可從解碼器可得之CT係數中加以評估。在較佳實施例中,其提供編碼訊號4中之一評估頻譜輪廓者,此輪廓可以許多不同的輪廓評估技術來使用,諸如頻譜內插,頻譜重新均一化和低頻變異評估以改進評估之精確性。
基本上任何上述之估技術之組合可使用於頻譜輪廓評估器168中。頻譜內插和頻譜重新均一化為已知之技術,其描述於Lauber等人所作之“對壓縮數位音訊之錯誤隱藏”,Audio Eng.Soc.111t h
Convention,New York,Sep.2001。低頻變異評估描述於下。用來使用頻譜輪廓資訊評估遺失係數之統計技術可於Goyal等人所作之IEEE Trans.On Info.Theory,vol.47,no.6,Sep.2001中找到,如上述。
有二個關於相關和解相關變換之問題,其係直接從等式1和2實現的。第一個問題為增加之量化雜訊。在典型的編碼系統中,輸入至相關變換164之MDCT係數係由已以一根據來自感知模型14之控制資訊15選擇之量化解析度量化之值來表示的,以滿足感知標準和位元速率限制。然而,從等式1獲得之CT係數為一般不具有相同之量化解析度之值,因為參數α之值可選擇為符合編碼系統之需求。CT係數在組合至編碼訊號4之前加以量化以符合位元率限制。
CT係數之量化是不令人滿意的,因為其增加了將出現於由解碼器24所回復之MDCT係數中之雜訊。此雜訊上之增加會使得編碼訊號之感知品質降低。換句話說,CT係數之量化防止解碼器24回復輸入至編碼器16之相同MDCT係數。這些係數間之差會使其為可聽見之雜訊。
對所有α值皆存在此問題,除了對之外。若α具有此特定值,則原始之量化MDCT係數之精確回復是可能的,因為所有等式1和2中之矩陣之大小相同。執行相關和解相關變換所需之計算可表示為整數算術運算之單一大小調整。因為整數算術運算是無損耗的,所以輸入至等式1之相關變換之MDCT係數可由等式2之解相關變換精確地加以回復。
與等式1和2中之變換之直接實現相關之第二個問題為這些實現需要可觀的計算資源,即使是對適度的T值亦如此。此問題對於要求接收器20之便宜實現之那些應用之解碼器24中之解相關變換246來說特別嚴重。在下面描述對這二個變換之有效的實現。
1.無雜訊變換類比於等式1和2中之相關和解相關變換之變換分別於下式3和4中顯示。
在第5圖中,對八個MDCT係數之一區塊由一示意方塊圖顯示等式3中之相關變換之第一階層或層級t=1。音訊和視訊編碼系統一般處理具有相當更多的係數之區塊,但對在此所討論之範例選擇八個係數之一區塊來減少說明之複雜性。在圖式中之Q區塊表示量化器。A#區塊表示等式3中所示之三個2x2矩陣之一。例如,區塊A0表示等式右手邊上之第三個矩陣而區塊A2表示第一個矩陣。連接區塊之線顯示係數如何流經相關變換。八個量化MDCT係數(n=0至7)之區塊被輸入至在圖式左手邊上之標記為0至7之圓形端點上之變換。八個CT係數(n=0至8)之一集合被輸出至圖式之右手邊上之標記為0至7之圓形端點。未顯示於圖式中之變換之隨後的層級t=2接收這些CT係數並以類似之方式來處理它們。
在第6圖中,對八個CT係數之一集合由一示意方塊圖來顯示等式4中之解相關變換之最後階層或層級t=1。在圖式中之Q區塊表示量化器。B#區塊表示等式4中所示之三個2x2矩陣之一。例如,區塊B0表示等式之右手邊上之第三個矩陣,而區塊B2表示第一個矩陣。連接區塊之線表示係數如何在解相關變換中流動。從變換之先前層級t=2接收八個CT係數(n=0至7)之集合並將之輸入至圖式左手邊上標記為0至7之圓形端點。八個量化MDCT係數(n=0至7)之區塊被輸出至圖式右手邊上之標記為0至7之圓形端點。
若在二個變換之所有層級中之所有量化器Q以相同的量化解析度來量化其輸入且若它們遵守下列性質的話Q(p+q)=p+Q(q) (5a) Q(-p)=-Q(p) (5b)其中p和q為2向量,則等式3中所示之相關變換產生量化的CT係數,其不需要進一步的量化來符合位元率限制,不像等式1中所示之相關變換所產生之CT係數。輸入至等式3之相關變換之MDCT係數由等式4之解相關變換精確地回復。沒有加入量化雜訊。
不幸地,等式3和4中所示之變換在許多實際的編碼系統中不是有用的,因為加在量化器Q上之限制之故。所有的MDCT係數必須被以相同的量化解析度來加以量化且等式5a和5b中所表示之二個性質意味著僅可使用一致的奇對稱量化器。這些限制並非實際的。感知編碼系統以不同的量化解析度來量化MDCT係數以盡可能地利用心理聲音遮罩效應。再者,許多編碼系統使用非一致的量化器。加在量化器上之同質的和一致的量化解析度之限制可使用下述之技術來消除。
a)異質一致量化解析度無雜訊相關和解相關變換可以使用不同或異質量化解析度之量化器來加以實現。在下面討論演算法,其描述\在相關和解相關變換內之中間點上要使用哪個量化解析度。在變換內使用的所有量化解析度係從用來量化輸入之MDCT係數之量化解析度之集合中取得的。解碼器24必須能夠決定要使用哪個量化解析度。若必要的話,編碼器16可於編碼訊號4內包括任何解碼器24需要的資訊。
用來量化在輸入給一2x2矩陣中之一對值中之每個值之量化解析度會彼此不同。說明量化解析度如何透過相關和解相關變換來遵循係數會是有用的。
上述演算法在下面以一電腦程式原始碼之片段來表示,其具有BASIC程式語言之一些語法特徵之敘述。這些原始碼片段不表示實際的程式,而是被呈現來協助說明量化解析度如何描述與使用。對程式-1之原始碼片段描述一演算法,其描述對一相關變換之量化器。對程式-2之原始碼片段描述一演算法,其描述對一解相關變換之量化器。對程式-3和程式-4之原始碼片段分別描述了描述如何使用在一相關和一解相關變換中之許多不同的量化器之演算法。
原始碼片段具有使用下列標記之敘述:.Q{n}=用來量化MDCT係數n之量化器,其中0<n<N-1。.Q{n,t}=用來在變換層級t中量化yn,t之量化器,其中1<t<T。指出相關變換中之第一階層或層級為層級t=1而最後層級為層級t=T,但在解相關中之第一層級為層級t=T而最後的層級為層級t=1。
量化器Q{n}和Q{n,t}遵守等式5a和5b中之上述之性質,其可表示為:Q{n}(p+q)=p+Q{n}(q) (5c) Q{n}(-p)=-Q{n}(p) (5d) Q{n,t}(p+q)=p+Q{n,t}(q) (5e) Q{n,t}(-p)=-Q{n,t}(p) (5f)程式-1:描述對一相關變換之量化器Forn=0 to N-1//初始化變換層級1 Q{n,0}=Q{n} Fort=1 to T//初始化所有其他階段和層級 For n=0 to 1/2N-1 Q{2n,t}=Q{n,t-1} Q{2n+1,t}=Q{1/2N+n,t-1} 程式-2:描述對一解相關變換之量化器For n=0 to 1/2N-1//初始化變換層級T Q{2n,T}=Q{n} Q{2n+1,T}=Q{1/2N+n} Fort=T to 1 step-1//初始化所有其他層級 For n=0 to 1/2N-1 Q{2n,t-1}=Q{n,t} Q{2n+1,t-1}=Q{1/2N+n,t} 程式-3:描述如何在一相關變換內使用量化器For t=1 to T For n=0 to1
/2
N-1
標記(V
) Q { a , b , c } , Q { x , y , z }
表示由量化器Q{a,b,c}所做之一二元素向量V之第一元素之量化,以及由量化器Q{x,y,z}所做之向量V之第二元素之量化。
程式-4:描述如何在一解相關變換內使用量化器For t=T to 1 step-1 For n=0 to 1/2N-1
在等式6a至6c中之相關變換之第一階段或層級t=1係由第7圖中之示意方塊圖所示,對一八個MDCT係數之區塊。在圖式左手邊上標記為Q0至Q7之量化器並非變換之一部份,而是表示用來以不同的量化解析度量化MDCT係數之不同量化器162。例如,標記為Q3之區塊表示量化MDCT係數3之量化器162。標記為Q#之其他區塊表示變換層級內之量化器,其係用來量化個別的係數。用來量化一特定係數之量化解析度在整個層級中皆是相同的。例如,標記為Q3之所有量化器使用相同的量化解析度。A#區塊表示等式6a至6c中所示之2x2矩陣之一。例如,區塊A0表示出現在等式6a中之矩陣。連接區塊之線顯示係數如何在變換層級間流動。係數3通過此變換之層級之路徑以實線顯示。
等式7a至7c中解相關變換之最後的階段或層級t=1係由第8圖中之一示意方塊圖所示的,對一八個CT係數之集合。標記為Q#之區塊表示在變換層級內之量化器,其用來量化個別的係數。用來量化一特定係數之量化解析度在整個層級都是相同的。例如,標記為Q3之所有量化器使用相同的量化解析度。B#區塊表示等式7a至7c之集合中所示之2x2矩陣。例如,區塊B2表示等式7c中出現之矩陣。連接區塊之線顯示係數如何在變換層級間流動。係數3隨著通過此變換層級之路徑以實線顯示。
第9圖中之示意方塊圖說明相關變換中之層級t=1,2和3。在此圖式中之每個區塊表示所有2x2矩陣和對在一變換層級中之一對係數之量化器。例如,標記為AQ04,Q4之區塊表示三個區塊A0,A1和A2,其具有三對量化器Q0,Q4,其對第7圖上方上之係數0和4顯示。連接區塊之線顯示係數如何在三個變換層級間流動。係數3所跟隨通過變換之路徑係以實線顯示。
第10圖中之示意方塊圖說明解相關變換中之層級t=3,2和1。在此圖式中之每個區塊表示所有2x2矩陣和對一變換層級中之一對係數之量化器。例如,標記為BQ0,Q4之區塊表示三個區塊B0,B1和B2,其具有三對量化器Q0,Q4,其係對第8圖之上方上之係數0和4顯示的。連接區塊之線顯示係數如何在三個變換層級間流動。係數3跟隨通過變換之路徑係以實線顯示的。
b)非一致量化解析度等式5a至5f中表示之限制意指量化器函數必須一致和奇對稱。不幸地,許多編碼系統使用不符合這些限制之量化器。這些限制可藉由使用一映射函數F及其反轉F-1釋放以任意地映射量化MDCT係數至適於變換之中間一致量化係數及反之。中間係數係由相關和解相關變換處理,而映射函數F和F-1轉換任意量化MDCT係數為中間係數及再次轉回以提供一無雜訊系統。
映射函數F和F-1映射一量化層級之集合至其他量化層級之集合及反之。欲由函數F映射之量化層級可為不一致間隔的,但在映射之後之量化層級係為一致間隔的。映射函數F和F-1可以許多不同的方式來實現,其包括封閉式可解析表示式或搜尋表,其定義介於任意間隔之量化層級與一致間隔之值間之映射。映射函數F之輸出被輸入至相關變換,而解相關變換之輸出被輸入至反轉映射函數F-1。
可使用一或多個映射函數來映射在一區塊中之MDCT係數。例如,若一編碼系統形成群組MDCT係數來定義頻率次帶,則可對每個次帶使用一映射函數。或者,可對每個MDCT係數使用一不同的映射函數,如第11和12圖中所說明之範例中所示的。若使用超過一個映射函數,則在映射域中之特定值可對應至量化MDCT係數域中之超過一個之量化層級。例如,可使用一映射函數F0及其反轉F0-1來映射一特定MDCT係數X0,而使用一不同的映射函數F1及其反轉F1-1來映射一不同的MDCT係數X1。不同的映射函數Fn可映射不同的量化層級至相同的映射值。此不會造成問題,因為相關和解相關變換為一無雜訊系統,其允許映射係數之正確的值由解相關變換回復,且使用適當的反轉
映射函數Fn-1來將回復的係數值映射回其正確的量化層級。在表I中說明一範例。
參考表I,可量化MDCT係數X0至層級{0,1,2,4,8}之集合中之任何層級。可量化MDCT係數X1至層級{0,1,3,9}之集合中之任何層級,而可量化MDCT係數X2至層級{0,2,4,6,8}之集合中之任何層級。可使用映射函數F0,F1和F2之一集合來映射這些量化MDCT係數Xn為一致間隔之值Un,且可使用一對應之反轉映射函數F0-1,F1-1和F2-1之集合來將一致間隔之值Un映射回量化之MDCT係數Xn。在所示之範例中,映射函數F0映射X0之量化層級{0,1,2,4,8}至對U0之一致間隔之值{0,1,2,3,4};映射函數F1映射對X1之量化層級{0,1,3,9}至對U1之一致間隔之值{0,1,2,3};而映射函數F2映射對X2之量化層級{0,2,4,8}至對U2之一致間隔之值{0,1,2,3,4}。對應函數F0-1,F1-1和F2-1以逆轉方向來映射這些值和層級。
若將MDCT係數量化為X0=8,X1=3和X2=0,則函數F0映射X0=8至值U0=4,函數F1映射X1=3至值U1=2,而函數F2映射X2=0至值U2=0。可無雜訊地由等式6a至6c和7a至7c中所示之變換來處理映射值Un。反轉函數F0-1映射U0=4至X0=8,反轉函數F1-1映射U1-2至X1=3,而反轉函數F2-1
映射U2=0至X2=0,藉此回復對該等量化MDCT係數之正確的量化層級。
可以等式3和4中表示之變換以及等式6和7中表示之變換來使用映射函數。映射函數亦可與等式3和4中表示之變換使用,來將具有異質量化解析度之量化MDCT係數映射至具有同質量化解析度之量化MDCT係數。編碼器16可於編碼訊號4中包括任何解碼器24所需之控制資訊以使用適當的反轉映射函數。
上面所討論之相關和解相關變換之直接實現係計算密集的,因為這些變換必須一次一對地在許多對之值上運算。需要額外的資源來執行對等式3,4,6和7中表示之變換之過渡量化運算。此情況在需要接收器20之便宜實現之應用中是十分不令人滿意的。在下面描述一種更有效率地實現這些變換之方式。
可顯示在α
=½時,一快速Hadamard變換(FHT)可產生與藉由於等式1和2中表示之相關和解相關變換之直接實現所獲得之那些相同之結果。FHT實現可改進效率達超過70%,其中改進之精確數量視變換層級T和區塊大小N之數目而定。經驗研究已顯示,當幾個MDCT係數遺失或損壞時,選擇α
=½提供在相關變換引入之編碼訊號位元速率之增加和解碼訊號之感知品質之間之良好的交換條件。
等式1中表示之相關變換可由下列實現
以及等式2中表示之解相關變換可由下列實現
其中T=變換層級數目,其中T1 N=在一區塊中之MDCT係數之數目;D=描述之數目,其中D=2T;G=群組之數目,其中且T為使得G是偶數者;Xn=MDCT係數n,其中0nN-1;Yn,t=在變換層級t上之CT係數,其中1tT;以及Hk=k-層級Hadamard矩陣。
K層級Hadamard矩陣維度為2k乘2k且定義為
其中用以實現FHT之效率技術可以計算複雜度2 k
log2
(2 k
)來計算Hadamard矩陣Hk。有關FHT如何能夠實現之額外的資訊可從由Lee等人所做之”以一簡單矩陣因子化為基礎之快速Hadamard變換”,IEEE Trans.On Acoust.,Speech and Sig.Proc.,1986,vol.ASSSP-34,no.6,pp.1666-1667獲得。
等式8中所表示之相關變換將MDCT係數分成G群組之D係數,並使用FHT來計算對每個群組之Hadamard矩陣Hk。等式9中所表示之解相關變換類似地運整閱。
等式8和9中表示之變換之實現較如等式1和2中所表示之直接實現來得有效率得多,但解相關變換回復MDCT係數之精確值之能力仍受到較無效率之實現所加之相同限制。MDCT係數之完美回復是不可能的,除非MDCT係數係以相同的量化解析度來一致地量化。
加在MDCT係數之量化上之限制可藉由使用如上面所描述之映射函數以及如例如第11和12圖中所說明般來避免。可使用一或多個映射函數F來映射任意量化之MDCT係數至一致和同質量化過渡係數,其可無雜訊地由等式7和8中中所表示之變換來處理,且一或多個反轉映射函數F-1可將回復之過渡係數映射回原始的任意量化之MDCT係數。
上面所討論之不同的實現提供彼此相關之優點。等式6和7中所表示之變換實現允許在選擇相關參數α之值上的靈活性,以交換會加在一編碼系統上之位元速率和良好品質限制。等式8和9中所表示之變換實現規定了相關參數α之值,但其較有效率。這二個實現可以許多不同的方式中一起使用。
在一變化中,等式8和9之有效實現用來處理在一係數區塊中之MDCT係數之大部份,且使用具有對相關參數α之更最佳化的值之等式6和7之靈活實現,來處理對於訊號之感知品質來說更重要之頻譜之部份中之MDCT係數。介於二實現間之頻譜之劃分可為固定的或者其可被修改。
在其他變化七後,二實現被適應性地加以選擇以回應訊號特性或回應編碼系統之改變需求。
4.其他考量本發明之許多不同的觀點可有利地使用於編碼應用中,諸如無線多媒體應用,其中一編碼訊號之一部份可能於傳輸期間遺失或損壞者。模擬與經驗學習建議當於解碼器24中實現一或多個錯誤緩和技術時,可改進解碼之輸出訊號6之感知品質。
一種稱為“頻譜重均一化”之技術調整一或多個回復之次帶訊號25之大小以符合一評估之頻譜輪廓19。在其中解碼器24必須評估已遺三象或損壞之頻譜資訊之情況中,結果之輸出訊號6之頻譜輪廓可明顯地與原始來源訊號2之頻譜輪廓不同。頻譜均一化如所需調整一或多個次帶訊號25,以獲得一類似於原始頻譜輪廓之一頻譜輪廓。最好,評估之頻譜輪廓19包含對具有一一致之頻譜寬度之幾個次帶之每一個之頻譜大小。可如需要來使用非一致之次帶寬度,以滿足許多不同的系統或良好的品質要件。
一種稱為“內插”之技術為對一單一來源訊號2之時間分集之型式。在被輸入給編碼器16之前,相同訊號之不同的間隔被再次配置和時間多工。應用一適當的和反轉的程序至解碼器24之輸出。
一種稱為“重覆最後得知之值”之技術評估對評估之頻譜輪廓19之遺三象的或損壞的資訊。若任何輪廓資訊對原始訊號2之一特定片段為遺失的或損壞的,其可由其最後得知之值來加以取代。
類似於“重覆最後得知值”技術之技術可用來當其他技術失效或無法被使用時緩和錯誤之用。此技術取代編碼訊號4之遺失或損壞部份以一先前之部份。例如,若編碼訊號4配置於封包中,則一遺失封包之內容可由一先前封包之內容來加以取代。
一種稱為“低頻變異評估”之技術為一統計評估技術,其可使用於解碼器24中以推得低頻頻譜輪廓之評估。該技術利用CT係數間之相關,以從於編碼訊號4中所接收到的對較高頻MDCT係數之變異資訊及從由解碼器24所計算之CT係數之變異來評估低頻頻譜輪廓資訊。低頻變異評估可減少包括於編碼訊號4中之頻譜輪廓資訊之數量,其係藉由允許解碼器24依賴對僅一有限集合之較高頻係數之輪廓資訊之方式。
例如,假設有二個MDCT係數及一變換層級,如此使得在等式1中,N=2而T=1。則相關變換可寫為
其中y0,0和y1,0=分別為低和高頻MDCT係數,以及y0,1和y1,1=二個CT係數。
假設MDCT係數為未相關的,則在表示式11中之等式可用來找到對低頻MDCT係數y0,0之變異之二個不同的表示式:
在此所討論之解碼器24之實現需要由二個MDCT係數y0,0和y1,0之變異和所表示之頻譜輪廓資訊來使用上述之頻譜內插,重均一化和遺失係數技術。然而,表示式11提供對低頻MDCT係數y0,0之變異資訊之二個評估。這些評估僅視高頻MDCT係數y1,0之變異和一CT係數之變異而定。因為CT係數之變異可由解碼器24計算,所以僅有高頻MDCT係數y1,0之變異需於編碼訊號4中被提供給解碼器24。解碼器可選擇使用表示式11中之等式或者其可使用這些表示之平均或其他組合來推得低頻變異之一評估。
在典型的編碼系統之實施例中,N遠大於二且MDCT係數之變異與CT係數之變異間之關係一般不像上面所給予的那些那樣簡單的。再者,在編碼訊號4中之一些MDCT變異資訊,其可做為如上面所討論之評估頻譜輪廓般傳送者,可在至解碼器之途中遺失或損壞。在諸如這些之情況中,諸如平均之許多不同的技術可被使用來評估來自可得之MDCT變異資訊及可得之CT係數之低頻變異資訊。對相同變異資訊之其他的表示,諸如表示式11中對低頻變異資訊之二個等式使得這些技術成為可能。
A.實現包含本發明之許多不同的觀點之裝置可以許多不同的方式來實現,其包括用以由一電腦或一些其他包括諸如耦合至類似於在一一般用途電腦中所找到的那些之元件之數位訊號處理器(DSP)電路之更特定之元件之裝置所執行之軟體。第13圖為一可用來實現本發明之觀點之裝置70之示意方塊圖。處理器72提供計算資源。RAM 73為系統隨機存取記憶體(RAM),其係由處理器72用來做處理之用。ROM 74表示某型式之持久儲存裝置,諸如唯讀記憶體(ROM),其係用以儲存操作裝置70所需之程式,以及可能係用以執行本發明之許多不同的觀點。I/O控制75表示介面電路以藉由通訊頻道76,77之方式來接收和傳送訊號。在所示之實施例中,所有的主要系統元件連接至匯流排71,其可表示超過一個之實體或邏輯匯流排;然而,一匯流排架構並非實現本發明所需要的。
在由一般用途電腦系統所實現之實施例中,可包括額外的元件以對裝置做介面,諸如一鍵盤或滑鼠和一顯示器,以及用以控制一儲存裝置78,其具有一儲存媒體,諸如磁帶或磁碟,或一光學媒體。儲存媒體可用來記錄用以操作系統,工具和應用之指令,且可包括實現本發明之許多不同的觀點之程式。
實現本發明之許多不同的觀點所需之功能可由以許多不同的方式實現之元件來執行,其包括分立之邏輯元件,積體電路,一或多個ASIC和/或程式控制之處理器。這些元件實之方式對於本發明來說並不重要。
本發明之軟體實現可由許多不同的機器可讀取媒體來傳送,諸如基頻帶或頻譜上之調變通訊路徑,包括從超音波至紫外線頻率,或者使用基本上任何記錄技術來傳送資訊之儲存媒體,其包括磁帶,卡或碟,光學卡或碟,和可偵測之包括紙張之媒體上之記號。
2‧‧‧來源訊號
10‧‧‧傳送器
12‧‧‧分析慮波器群
13‧‧‧頻率次帶訊號
14‧‧‧感知模型
15‧‧‧控制資訊
16‧‧‧編碼器
17‧‧‧多重描述
18‧‧‧格式化器
19‧‧‧頻譜輪廓
20‧‧‧接收器
22‧‧‧解格式化器
23‧‧‧多重描述
24‧‧‧解碼器
25‧‧‧次帶訊號
26‧‧‧合成濾波器群
27‧‧‧頻譜輪廓
162‧‧‧量化器
164‧‧‧相關變換
166‧‧‧傳佈器
168‧‧‧頻譜輪廓評估器
242‧‧‧反轉傳佈器
244‧‧‧係數評估器
246‧‧‧解相關變換
71‧‧‧匯流排
72‧‧‧處理器
73‧‧‧RAM
74‧‧‧ROM
75‧‧‧I/O控制器
76、77‧‧‧通訊頻道
78‧‧‧儲存裝置
第1和2圖為在一可包含本發明之許多不同的觀點之編碼系統中之一傳送器和一接收器之示意方塊圖。
第3圖為一編碼器之一實施例之示意方塊圖。
第4圖為一解碼器之一實施例之示意方塊圖。
第5圖為使用具有同質量化解析度之量化器之一相關變換之第一層級之示意方塊圖。
第6圖為使用具有同質量化解析度之量化器之一解相關變換之最後一層級之示意方塊圖。
第7圖為使用具有異質量化解析度之量化器之一相關變換之第一層級之示意方塊圖。
第8圖為使用具有異質量化解析度之量化器之一解相關變換之最後一層級之示意方塊圖。
第9圖為使用具有異質量化解析度之量化器之具有三個層級之一相關變換之示意方塊圖。
第10圖為使用具有異質量化解析度之量化器之具有三個層級之一解相關變換之示意方塊圖。
第11圖為在其輸入上具有映射功能之一相關變換之示意方塊圖。
第12圖為在其輸入上具有反轉映射功能之一解相關變換之示意方塊圖。
第13圖為可用來實現本發明之許多不同的觀點之一裝置之示意方塊圖。
2...來源訊號
10...傳送器
12...分析慮波器群
13...頻率次帶訊號
14...感知模型
15...控制資訊
16...編碼器
17...多重描述
18...格式化器
19...頻譜輪廓
Claims (10)
- 一種用以在編碼系統中做訊號處理之方法,其包含下列步驟:接收數個量化訊號元素集合,每個量化訊號元素集合均表示一訊號之個別片段,其中該等量化訊號元素為具有不同的量化解析度之訊號成分的量化表示型態;對該等量化訊號元素集合應用一相關變換,以產生數個對應的變換係數集合,其中該相關變換係藉由一層或多層的數個量化函數之變換來實現,各層中的該等量化函數皆具有對應於該等量化訊號元素之該等不同量化解析度的異質量化解析度,每個量化訊號元素集合相較於對應的變換係數集合係較不相關,且該相關變換允許當沒有由於用來實現相關和解相關變換之算術計算之不夠準確所造成之錯誤時,藉由一互補解相關變換,將該等量化訊號元素由該等變換係數來精確回復;從該等變換係數集合推得數個量化值群組,其中個別的量化值群組含有可從中回復該訊號的一個或多個片段的一個不精確複本的足夠資訊,且其中可從增加該等量化值群組之數目來回復該訊號之該一個或多個片段的一個更精確的複本;以及產生載有表示該等量化值群組之資訊的一個或多個輸出訊號。
- 如申請專利範圍第1項之方法,其中該相關變換是由後頭緊接著該一層或多層的數個量化函數之變換的一個 可逆映射函數來實現的,且其中該可逆映射函數將該等量化訊號元素映射至一數值集合{x}中,該數值集合係根據使對於{x}中之所有x以及所有的實數y,Q(x+y)=x+Q(y),並且Q(-y)=-Q(y)的一量化函數Q來量化的。
- 如申請專利範圍第2項之方法,其中該可逆映射函數將該等量化訊號元素映射至一個或多個一致量化之值的集合中,在個別集合中的該等一致量化之值皆具有相同的量化解析度。
- 如申請專利範圍第1、2或3項之方法,其中各個該等多個變換皆係由一Hadamard變換所實現。
- 一種用以在編碼系統中做訊號處理之方法,其包含下列步驟:接收數個量化值群組,其中個別量化值群組均含有可從中回復一訊號之一個或多個片段的一個不精確複本的足夠資訊,並且其中可從增加該等量化值群組之數目來回復該訊號之該一或多個片段的一個更精確的複本;從該等量化值群組來推得數個變換係數集合;對該等變換係數集合應用一解相關變換,以產生數個對應的量化訊號元素集合,其中每個變換係數集合相較於對應的量化訊號元素集合係較為相關,且每個量化訊號元素集合均表示一訊號之一個別片段,其中該等量化訊號元素為具有不同的量化解析度的數個訊號成份 之量化表示型態,該解相關變換係由一層或多層的數個量化函數之變換來實現,在各層中的該等量化函數皆具有對應於該等量化訊號元素之該等不同量化解析度的異質量化解析度,且其中該解相關變換允許該等量化訊號元素由該等變換係數來精確回復,該等變換係數係在沒有由於用來實現相關和解相關變換之算術計算之不夠精確所造成的錯誤時,藉由一互補相關變換所產生;以及產生載有表示該等量化訊號元素集合之資訊的一個或多個輸出訊號。
- 如申請專利範圍第5項之方法,其中該解相關變換係由後頭緊接著該一層或多層的數個量化函數之變換的一個可逆映射函數來實現的,且其中該可逆映射函數映射來自於一個數值集合{x}中之該等量化訊號元素,該數值集合係根據使對於{x}中之所有x以及所有的實數y,Q(x+y)=x+Q(y),並且Q(-y)=-Q(y)的一量化函數Q來量化的。
- 如申請專利範圍第6項之方法,其中該可逆映射函數映射來自於一個或多個一致量化之值的集合之該等量化訊號元素,在個別集合中之該等一致量化之值具有相同的量化解析度。
- 如申請專利範圍第5、6或7項之方法,其中各個該等多個變換之皆係由一反轉Hadamard變換來實現。
- 一種用以在編碼系統內做訊號處理之裝置,該裝置包含 適於實行如申請專利範圍第1、2、3、4、5、6、7或8項之方法的所有步驟之構件。
- 一種載有含有多個指令之程式的媒體,該等指令適於使一裝置執行如申請專利範圍第1、2、3、4、5、6、7或8項之方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/312,230 US7536299B2 (en) | 2005-12-19 | 2005-12-19 | Correlating and decorrelating transforms for multiple description coding systems |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200729156A TW200729156A (en) | 2007-08-01 |
TWI395203B true TWI395203B (zh) | 2013-05-01 |
Family
ID=37891736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095140015A TWI395203B (zh) | 2005-12-19 | 2006-10-30 | 用於多重描述編碼系統之改良式相關與解相關變換技術 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7536299B2 (zh) |
EP (1) | EP1969593B1 (zh) |
JP (1) | JP4971357B2 (zh) |
CN (1) | CN101371294B (zh) |
AT (1) | ATE438174T1 (zh) |
DE (1) | DE602006008185D1 (zh) |
HK (1) | HK1120327A1 (zh) |
TW (1) | TWI395203B (zh) |
WO (1) | WO2007075230A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101989425B (zh) * | 2009-07-30 | 2012-05-23 | 华为终端有限公司 | 多描述音频编解码的方法、装置及系统 |
EP2306456A1 (en) * | 2009-09-04 | 2011-04-06 | Thomson Licensing | Method for decoding an audio signal that has a base layer and an enhancement layer |
TWI413110B (zh) * | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
US7932847B1 (en) * | 2009-12-04 | 2011-04-26 | Realtek Semiconductor Corp. | Hybrid coarse-fine time-to-digital converter |
US20110164672A1 (en) * | 2010-01-05 | 2011-07-07 | Hong Jiang | Orthogonal Multiple Description Coding |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
AU2012217216B2 (en) | 2011-02-14 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
AU2012217153B2 (en) | 2011-02-14 | 2015-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
PL3471092T3 (pl) | 2011-02-14 | 2020-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekodowanie pozycji impulsów ścieżek sygnału audio |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
CN102959620B (zh) | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
CN103534754B (zh) | 2011-02-14 | 2015-09-30 | 弗兰霍菲尔运输应用研究公司 | 在不活动阶段期间利用噪声合成的音频编解码器 |
JP5890963B2 (ja) * | 2011-03-17 | 2016-03-22 | 富士通株式会社 | データ保存プログラム及びデータ保存方法 |
RU2509437C1 (ru) * | 2012-07-17 | 2014-03-10 | Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт авиационных систем" | Способ формирования целочисленных ортогональных декоррелирующих матриц заданных размеров для прямого и обратного декоррелирующего преобразования видеоизображений и устройство для его осуществления |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
EP2956935B1 (en) | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
PL232466B1 (pl) * | 2015-01-19 | 2019-06-28 | Zylia Spolka Z Ograniczona Odpowiedzialnoscia | Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio |
KR101968456B1 (ko) | 2016-01-26 | 2019-04-11 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 양자화 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030138047A1 (en) * | 1999-07-28 | 2003-07-24 | Michael Orchard | Method and apparatus for accomplishing multiple description coding for video |
US20040141656A1 (en) * | 2002-11-15 | 2004-07-22 | Irvine Ann C. | Apparatus and method for multiple description encoding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6301222B1 (en) | 1997-10-24 | 2001-10-09 | Lucent Technologies Inc. | Signal data transmission over lossy packet networks |
US6330370B2 (en) | 1998-02-25 | 2001-12-11 | Lucent Technologies Inc. | Multiple description transform coding of images using optimal transforms of arbitrary dimension |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6345125B2 (en) | 1998-02-25 | 2002-02-05 | Lucent Technologies Inc. | Multiple description transform coding using optimal transforms of arbitrary dimension |
US6198412B1 (en) | 1999-01-20 | 2001-03-06 | Lucent Technologies Inc. | Method and apparatus for reduced complexity entropy coding |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0001727L (sv) | 2000-05-10 | 2001-11-11 | Global Ip Sound Ab | Överföring över paketförmedlade nät |
CN1672421A (zh) * | 2002-07-31 | 2005-09-21 | 皇家飞利浦电子股份有限公司 | 采用混合预测码执行多描述运动补偿的方法和装置 |
US20040102968A1 (en) | 2002-08-07 | 2004-05-27 | Shumin Tian | Mulitple description coding via data fusion |
KR100923297B1 (ko) * | 2002-12-14 | 2009-10-23 | 삼성전자주식회사 | 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치 |
-
2005
- 2005-12-19 US US11/312,230 patent/US7536299B2/en active Active
-
2006
- 2006-10-30 TW TW095140015A patent/TWI395203B/zh active
- 2006-11-16 WO PCT/US2006/044346 patent/WO2007075230A1/en active Application Filing
- 2006-11-16 JP JP2008547236A patent/JP4971357B2/ja active Active
- 2006-11-16 DE DE602006008185T patent/DE602006008185D1/de active Active
- 2006-11-16 AT AT06837671T patent/ATE438174T1/de not_active IP Right Cessation
- 2006-11-16 EP EP06837671A patent/EP1969593B1/en active Active
- 2006-11-16 CN CN2006800526415A patent/CN101371294B/zh active Active
-
2008
- 2008-09-30 HK HK08110892.0A patent/HK1120327A1/xx unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030138047A1 (en) * | 1999-07-28 | 2003-07-24 | Michael Orchard | Method and apparatus for accomplishing multiple description coding for video |
US20040141656A1 (en) * | 2002-11-15 | 2004-07-22 | Irvine Ann C. | Apparatus and method for multiple description encoding |
Also Published As
Publication number | Publication date |
---|---|
US20070150272A1 (en) | 2007-06-28 |
TW200729156A (en) | 2007-08-01 |
EP1969593A1 (en) | 2008-09-17 |
CN101371294A (zh) | 2009-02-18 |
WO2007075230A1 (en) | 2007-07-05 |
ATE438174T1 (de) | 2009-08-15 |
JP4971357B2 (ja) | 2012-07-11 |
CN101371294B (zh) | 2012-01-18 |
JP2009520237A (ja) | 2009-05-21 |
DE602006008185D1 (de) | 2009-09-10 |
HK1120327A1 (en) | 2009-03-27 |
US7536299B2 (en) | 2009-05-19 |
EP1969593B1 (en) | 2009-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI395203B (zh) | 用於多重描述編碼系統之改良式相關與解相關變換技術 | |
KR101143225B1 (ko) | 오디오 인코더 및 오디오 디코더에서의 컴퓨터 구현 방법및 컴퓨터 판독 가능 매체 | |
Gersho et al. | Vector quantization and signal compression | |
JP4689625B2 (ja) | 信号解析及び合成のための適応型混合変換 | |
JP2007506986A (ja) | マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置 | |
TWI515720B (zh) | 壓縮數位化音訊信號之方法、解碼已編碼壓縮數位化音訊信號之方法、及機器可讀儲存媒體 | |
JP4506039B2 (ja) | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム | |
JP4439522B2 (ja) | 離散値のシーケンスを有する信号を処理するための装置および方法 | |
RU2008101778A (ru) | Масштабируемый сжатый битовый поток аудио и кодек, использующий иерархический набор фильтров и многоканальное совместное кодирование | |
TW200406096A (en) | Improved low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding | |
RU2323469C2 (ru) | Устройство и способ для обработки, по меньшей мере, двух входных значений | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
TW200836492A (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
MXPA04012540A (es) | Sistema de codificacion de audio que usa caracteristicas de una senal descodificada para adaptar componentes espectrales sintetizados. | |
Haneche et al. | Compressed sensing-speech coding scheme for mobile communications | |
CN102158692B (zh) | 编码方法、解码方法、编码器和解码器 | |
KR20210003514A (ko) | 오디오의 고대역 부호화 방법 및 고대역 복호화 방법, 그리고 상기 방법을 수하는 부호화기 및 복호화기 | |
CN107077850B (zh) | 用于对子带组的子带配置数据进行编码或解码的方法和装置 | |
JPH11251917A (ja) | 符号化装置及び方法、復号化装置及び方法、並びに記録媒体 | |
Ben-Shalom et al. | Study of mutual information in perceptual coding with application for low bit-rate compression | |
JPH09135176A (ja) | 情報符号化装置および方法、情報復号化装置および方法、並びに情報記録媒体 | |
JP7438334B2 (ja) | Mdct分析/合成およびtdarに基づく不均一直交フィルタバンクを使用した時間変化する時間-周波数タイリング | |
Kim | Lossless wideband audio compression: Prediction and transform | |
KR20230116503A (ko) | 스칼라 양자화와 벡터 양자화를 이용한 부호화 방법 및 부호화 장치, 그리고 복호화 방법 및 복호화 장치 | |
Balasingham et al. | Are the wavelet transforms the best filter banks for image compression? |