TWI587291B - 音訊解碼/編碼裝置及其運作方法及電腦程式 - Google Patents
音訊解碼/編碼裝置及其運作方法及電腦程式 Download PDFInfo
- Publication number
- TWI587291B TWI587291B TW104126634A TW104126634A TWI587291B TW I587291 B TWI587291 B TW I587291B TW 104126634 A TW104126634 A TW 104126634A TW 104126634 A TW104126634 A TW 104126634A TW I587291 B TWI587291 B TW I587291B
- Authority
- TW
- Taiwan
- Prior art keywords
- sound source
- memory
- decoded
- memory state
- source frame
- Prior art date
Links
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000011017 operating method Methods 0.000 title 1
- 230000015654 memory Effects 0.000 claims description 472
- 238000005070 sampling Methods 0.000 claims description 126
- 238000012952 Resampling Methods 0.000 claims description 114
- 238000003786 synthesis reaction Methods 0.000 claims description 99
- 230000015572 biosynthetic process Effects 0.000 claims description 97
- 238000001914 filtration Methods 0.000 claims description 61
- 230000003044 adaptive effect Effects 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 40
- 230000002194 synthesizing effect Effects 0.000 claims description 34
- 230000005284 excitation Effects 0.000 claims description 31
- 239000004205 dimethyl polysiloxane Substances 0.000 claims description 21
- 235000013870 dimethyl polysiloxane Nutrition 0.000 claims description 21
- CXQXSVUQTKDNFP-UHFFFAOYSA-N octamethyltrisiloxane Chemical compound C[Si](C)(C)O[Si](C)(C)O[Si](C)(C)C CXQXSVUQTKDNFP-UHFFFAOYSA-N 0.000 claims description 21
- 238000004987 plasma desorption mass spectroscopy Methods 0.000 claims description 21
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 239000000872 buffer Substances 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明關於語音及音源編碼,特別關於一音源編碼器以及一音源解碼裝置供處理一音源訊號,對其輸入及輸出取樣率係從一先前訊框變化至一當前訊框。本發明也關於操作這些裝置的方法以及執行這些方法的電腦程式。
語音及音源編碼能受益於具有多節奏輸入及輸出,並且能夠即時以及無縫切換某一到另一取樣率。傳統的語音及音源編碼器使用一單一取樣率供一決定輸出位元率並且無法改變其若無完全重設系統的話。其在通訊中以及解碼訊號中創造一個不連續。
另一方面,適應性取樣率以及位元率允許一較高品質藉由選擇多個最佳化參數通常依來源與通道狀況二者而定。其也重要在達到一無縫轉變當改變輸入/輸出訊號的取樣率時。
再者,重要的是對於這種轉變限制複雜度增加。
現代語音及音源編碼,像是將至的跨LTE網路的3GPP EVS,將需要能夠利用這種功能。
有效率的語音及音源編碼器需要能夠改變其取樣率從一時域到其他較佳符合來源與通道狀況。取樣率的改變特別對連續線性濾波器是個問題,其係僅能用在如果其過去多個狀態顯示相同取樣率如當前時間區間至濾波器。
更多特別預估編碼維持在編碼器及解碼器於時間上及訊框不同多個記憶體狀態。在(CELP,code-excited linear prediction)這些多個記憶體通常是線性預估編碼(LPC)合成濾波記憶體,去加重濾波器記憶體以及適應性編碼簿。一直截方案是重設全部多個記憶體當一取樣率改變發
生時。這在解碼訊號中創造一個非常惱人的不連續。復原可說是非常久以及非常顯著的。
圖1顯示根據習知的一第一音源解碼裝置。藉這個音源解碼裝置可能可以無縫切換到一預估編碼當從一非-預估編碼方案來的話。這個完成可以藉由非-預估編碼器的解碼輸出的一反向濾波其供維持預估編碼器所需的多個濾波器狀態。完成的例子是在AMR-WB+及USAC供從一基於變換的編碼器,TCX,切換至一語音編碼器,ACELP。然而,在這二種編碼器中,取樣率是相同的。反向濾波可直接用在TCX的解碼音源訊號。再者,TCX在USAC及AMR-WB+傳送並利用也被反向濾波所需的LPC係數。LPC解碼係數是簡單再使用於反向濾波計算。值得一提的是反向濾波不被需要如果二預估編碼器間的切換是使用多個相同濾波器以及相同取樣率。
圖2顯示根據習知的一第二音源解碼裝置。在二編碼器具有不同取樣率的情況、或在相同預估編碼器但切換不同取樣率,前音源訊框的反向濾波如圖1所示不再充足。一直截方案是再取樣過去解碼輸出至新取樣率並且然後藉由反向濾波計算多個記憶體狀態。如果一些濾波器係數是取樣率依賴的如對LPC合成濾波器的情況,須做再取樣的過去的訊號的一額外分析。為了得到在新取樣率fs_2的該等LPC係數,自相關函數係重新計算且列文遜-杜賓演算法(Levinson-Durbin algorithm)用在再取樣的過去解碼取樣。這方案是非常需要計算的並難以用在真實實作。
為解決這問題是提供一改進設計供在多個音源處理裝置的多個取樣率的切換。
在一第一方面,問題藉由供解碼一位元流的一音源解碼裝置解決,其中音源解碼裝置包括:一預估解碼器供從該位元流產生一解碼音源訊框,其中該預估解碼器包括一參數解碼器從該位元流產生供該解碼音源訊框的一或多個音源參數,其中該預估解碼器包括一合成濾波裝置供藉由合成供該解碼音源訊框的該一或多個音源參數而產生該解碼音源訊框;一記憶裝置包括一或多個記憶體,其中各該等記憶體係設來儲存供該
解碼音源訊框的一記憶體狀態,其中該一或多個記憶體的供該記憶體狀態的該解碼音源訊框係被該合成濾波裝置使用來合成供該解碼音源訊框的該一或多個音源參數;以及一記憶體狀態再取樣裝置設來藉由再取樣一前記憶體狀態其供合成供一前解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個藉以決定該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數供該等多個記憶體的其中一或多個,其中該解碼音源訊框具有一取樣率,該前解碼音源訊框具有一前取樣率不同於該解碼音源訊框的該取樣率,以及設來儲存該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數供該等多個記憶體的其中一或多個到該分別的記憶體。
用語「解碼音源訊框」指當前正處理中的一音源訊框,用語「前解碼音源訊框」指一音源訊框其係當前正處理中的音源訊框之前已經被處理。
本發明允許一預估編碼方案來切換其內部取樣率無須再取樣整個多個緩衝區供重新計算其多個濾波器的多個狀態。藉由直接僅對必要的多個記憶體狀態再取樣,一低複雜度可維持當一無縫轉變仍可能。
根據本發明的一較佳實施例一或多個記憶體包括一適應性編碼簿記憶體設來儲存一適應性編碼簿記憶體狀態供決定供該解碼音源訊框的一或多個激發參數,其中該記憶體狀態再取樣裝置係設來藉由再取樣一前適應性編碼簿記憶體狀態供決定供該前解碼音源訊框的一或多個激發參數藉以決定該適應性編碼簿記憶體狀態其供決定供該解碼音源訊框的該一或多個激發參數,以及設來儲存該適應性編碼簿記憶體狀態供決定供該解碼音源訊框的該一或多個激發參數到該適應性編碼簿記憶體。
適應性編碼簿記憶體狀態例如是用在CELP裝置。
要能夠再取樣該等記憶體,在不同取樣率的記憶體規模必須依其涵蓋的時間期間而相同。換句話說,如果一濾波器在取樣率fs_2具有M階,更新在前取樣率fs_1的記憶體應涵蓋至少M*(fs_1)/(fs_2)取樣。
記憶體通常隨取樣率成比例在適應性編碼簿的情況,其係涵蓋解碼殘餘訊號約持續20ms不論取樣率SR為何,這不需要做額外記憶體
管理。
根據本發明的一較佳實施例一或多個記憶體包括一合成濾波記憶體設來儲存一合成濾波記憶體狀態供決定供該解碼音源訊框的一或多個合成濾波參數,其中該記憶體狀態再取樣裝置係設來藉由再取樣一前合成記憶體狀態供決定供該前解碼音源訊框的一或多個合成濾波參數藉以決定該合成濾波記憶體狀態其供決定供該解碼音源訊框的該一或多個合成濾波參數,以及設來儲存該合成記憶體狀態供決定供該解碼音源訊框的該一或多個合成濾波參數到該合成濾波記憶體。
合成濾波記憶體狀態可以是一LPC合成濾波狀態,其可例如使用在CELP裝置
如果記憶體的階數沒有與取樣率成比例,甚至是常數不論取樣率為何,一額外記憶體管理必須要做供能夠涵蓋最大可能期間。例如,AMR-WB+的LPC合成狀態階數總是16。在12.8kHz,最小取樣率其涵蓋1.25ms雖然其在48kHz僅表示0.33ms。為了能再取樣介於12.8kHz與48kHz間任何取樣率的緩衝區,LPC合成濾波狀態的記憶體必須從16取樣延長至60取樣,其表示在48kHz表示1.25ms。
記憶體再取樣可然後用以下虛擬碼來描述:mem_syn_r_size_old=(int)(1.25*fs_1/1000);mem_syn_r_size_new=(int)(1.25*fs_2/1000);mem_syn_r+L_SYN_MEM-mem_syn_r_size_new=resamp(mem_syn_r+L_SYN_MEM-mem_syn_r_size_old,mem_syn_r_size_old,mem_syn_r_size_new);其中resamp(x,1,L)輸出從1到L取樣的再取樣的輸入緩衝區x,L_SYN_MEM是記憶體涵蓋的取樣中規模最大的。在本例中其等於60取樣供fs_2<=48kHz。在任何取樣率,mem_syn_r必須以最新的L_SYN_MEM多個輸出取樣來更新。
For(i=0;i<L_SYM_MEM;i++)mem_syn_r[i]=y[L_frame-L_SYN_MEM+i];其中y[]是LPC合成濾波器的輸出,L_frame是在當前取樣率的訊框的
規模。
然而,合成濾波器將使用從mem_syn_r[L_SYN_MEM-M]到mem_syn_r[L_SYN_MEM-1]的多個狀態來進行。
根據本發明的一較佳實施例記憶體再取樣裝置是設在這種方式下:使用相同的多個合成濾波參數供解碼音源訊框的複數個子訊框。
最後的訊框的該等LPC係數係通常用來以5ms的一時間粒度來插入當前多個LPC係數。如果取樣率改變,插值不能被進行。如果LPC重新計算,插值可以使用新計算的多個LPC係數來進行。在本發明中,插值不能直接進行。在一實施例中,當一取樣率切換後該等LPC係數沒有插值在第一訊框中。對全部5ms子訊框,相同組的係數被使用。
根據本發明的一較佳實施例記憶體再取樣裝置是設在這種方式下:藉由變換供前解碼音源訊框的前合成濾波記憶體狀態到一功率頻譜以及藉由再取樣該功率頻譜而完成前合成濾波記憶體狀態的再取樣。
在本實施例中,如果最後的編碼器也是一預估編碼器或如果最後的編碼器也傳送一組LPC,像是TCX,該等LPC係數可在新取樣率fs_2估測而無須重做一整個LP分析。在取樣率fs_1的多個舊LPC係數係變換至一功率頻譜其係被再取樣。列文遜-杜賓演算法(Levinson-Durbin algorithm)然後用在從再取樣的功率頻譜演繹的自相關函數。
根據本發明的一較佳實施例一或多個記憶體包括一去加重記憶體設來儲存一去加重記憶體狀態供決定供解碼音源訊框的一或多個去加重參數,其中記憶體狀態再取樣裝置係設來藉由再取樣一前去加重記憶體狀態供決定供前解碼音源訊框的一或多個去加重參數藉以決定該去加重記憶體狀態其供決定供解碼音源訊框的一或多個去加重參數,以及設來儲存去加重記憶體狀態供決定供解碼音源訊框的一或多個去加重參數到去加重記憶體。
去加重記憶體狀態例如也用在CELP。
去加重通常具有1的一固定階數,其在12.8kHz表示0.0781ms。此期間在48kHz被3.75取樣涵蓋。4取樣的一記憶體緩衝區然後被需要如果採納前述方法。替代地,可使用一近似法跳過再取樣狀態。可
看到一非常粗糙的再取樣,其係包括保持最後的輸出取樣不論取樣率差異為何。此近似是大部分時間足夠以及能用於低複雜度因素。
根據本發明的一較佳實施例一或多個記憶體是設在這種方式下:供解碼音源訊框的一數量的儲存取樣係與解碼音源訊框的取樣率成比例。
根據本發明的一較佳實施例記憶體再取樣裝置是設在這種方式下:藉由線性插值完成該再取樣。
再取樣函式resamp()可以用任何再取樣方法來實作。在時域,一傳統LP濾波器及降取樣/過取樣是常用的。在一較佳實施例可採納一簡單線性插值,其係足以,其足以依品質供再取樣濾波多個記憶體。其允許節省甚至較多複雜度。也可能在頻域做再取樣。在最後的方案,不需要注意馬賽克(block artefacts)隨記憶體是一濾波器的僅開始狀態。
根據本發明的一較佳實施例記憶體狀態再取樣裝置係設來從記憶裝置取得前記憶體狀態供該等多個記憶體的其中一或多個。
本發明可用於當使用具不同內部取樣率的編碼方案。例如其可用的情況是當通道的可取得頻寬受限時使用一CELP以12.8kHz的一內部取樣率PSR供低位元率,當多個通道狀況較好時切換至16kHz內部取樣率SR供較高位元率。
根據本發明的一較佳實施例音源解碼裝置包括一反向濾波裝置設來供在該前取樣率該前解碼音源訊框的反向濾波以決定該前記憶體狀態供該等多個記憶體的其中一或多個,其中該記憶體狀態再取樣裝置係設來從該反向濾波裝置取得該前記憶體狀態供該等多個記憶體的其中一或多個。
這些特徵讓本發明能實作在這些情況,其中前音源訊框係由一非-預估解碼器所處理。
在本發明實施例中,反向濾波之前沒有使用再取樣。取而代之是多個記憶體狀態自己直接被再取樣。如果先前處理前音源訊框的解碼器是一預估解碼器像是CELP,反向解碼不須要且能跳過既然多個前記憶體狀態總是維持在前取樣率。
根據本發明的一較佳實施例記憶體狀態再取樣裝置係設來從另一音源處理裝置取得前記憶體狀態供該等多個記憶體的一或多個。
另一音源處理裝置可以例如是另一音源解碼器裝置或一家供噪聲產生裝置。
本發明可用在DTX模式,當多個啟用的訊框以一傳統CELP編碼在12.8kHz以及當非啟用部分以一16kHz噪聲產聲器(CNG)塑造。
本發明可用在例如當結合一TCX及一ACELP運行在不同取樣率。
本發明另一方面問題藉由供解碼一位元流操作一音源解碼裝置的方法解決,該方法包括:藉使用一預估解碼器從該位元流產生一解碼音源訊框,其中該預估解碼器包括一參數解碼器從該位元流產生供該解碼音源訊框的一或多個音源參數,其中該預估解碼器包括一合成濾波裝置供藉由合成供該解碼音源訊框的該一或多個音源參數而產生該解碼音源訊框;提供一記憶裝置其包括一或多個記憶體,其中各該等記憶體係設來儲存供該解碼音源訊框的一記憶體狀態,其中該一或多個記憶體的供該解碼音源訊框的該記憶體狀態係被該合成濾波裝置使用來合成供該解碼音源訊框的該一或多個音源參數;藉由再取樣一前記憶體狀態其供合成供一前解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個藉以決定該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數供該等多個記憶體的其中一或多個,其中該解碼音源訊框具有一取樣率,其中該前解碼音源訊框具有一前取樣率不同於該解碼音源訊框的該取樣率;以及儲存該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數供該等多個記憶體的其中一或多個到該分別的記憶體。
本發明一方面問題藉由一電腦程式解決,當其運行在一處理器時,執行根據本發明的方法。
本發明另一方面問題藉由供編碼一框化音源訊號的一音源編碼器解決,其中音源編碼器包括:
一預估編碼器從該框化音源訊號產生一編碼音源訊框,其中該預估編碼器包括一參數分析器從該框化音源訊號產生供該編碼音源訊框的一或多個音源參數,其中該預估編碼器包括一合成濾波裝置供藉由合成供一解碼音源訊框的一或多個音源參數而產生該解碼音源訊框,其中供該解碼音源訊框的該一或多個音源參數是供該編碼音源訊框的該一或多個音源參數;一記憶裝置包括一或多個記憶體,其中各該等記憶體係設來儲存供解碼音源訊框的一記憶體狀態,其中一或多個記憶體的供解碼音源訊框的記憶體狀態係被合成濾波裝置使用來合成供解碼音源訊框的一或多個音源參數;以及一記憶體狀態再取樣裝置設來藉由再取樣一前記憶體狀態其供合成供一前解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個藉以決定記憶體狀態其供合成供解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個,其中解碼音源訊框具有一取樣率,前解碼音源訊框具有一前取樣率不同於解碼音源訊框的取樣率,以及設來儲存記憶體狀態其供合成供解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個到分別的記憶體。
本發明主要在於音源解碼裝置。然而,其也可以用在音源編碼器。的確CELP是基於一分析逐合成(Analysis-by-Synthesis)原則,於此一當地解碼係進行在編碼器側。對此因素相同原則如對解碼器所述可用在編碼器側。再者,在一切換編碼的情況下,即ACELP/TCX,基於變換的編碼器可必須能夠更新語音編碼器的該等記憶體甚至在編碼器側在次訊框在編碼切換的情況下。為此,一當地解碼器係用在基於變換的編碼器供更新CELP的該等記憶體狀態。其可以是基於變換的編碼器運行在一不同於CELP的取樣率並且本發明可然後用在這種情況。
可理解的是音源編碼器的合成濾波裝置、記憶裝置、記憶體狀態再取樣裝置以及反向濾波裝置係等效於前述音源解碼裝置的合成濾波裝置、記憶裝置、記憶體狀態再取樣裝置以及反向濾波裝置。
根據本發明的一較佳實施例一或多個記憶體包括一適應性編碼簿記憶體設來儲存一適應性編碼簿記憶體狀態供決定供該解碼音源訊
框的一或多個激發參數,其中該記憶體狀態再取樣裝置係設來藉由再取樣一前適應性編碼簿記憶體狀態供決定供該前解碼音源訊框的一或多個激發參數藉以決定該適應性編碼簿記憶體狀態其供決定供該解碼音源訊框的該一或多個激發參數,以及設來儲存該適應性編碼簿記憶體狀態供決定供該解碼音源訊框的該一或多個激發參數到該適應性編碼簿記憶體。
根據本發明的一較佳實施例一或多個記憶體包括一合成濾波記憶體設來儲存一合成濾波記憶體狀態供決定供該解碼音源訊框的一或多個合成濾波參數,其中該記憶體狀態再取樣裝置係設來藉由再取樣一前合成記憶體狀態供決定供該前解碼音源訊框的一或多個合成濾波參數藉以決定該合成濾波記憶體狀態其供決定供該解碼音源訊框的該一或多個合成濾波參數,以及設來儲存該合成記憶體狀態供決定供該解碼音源訊框的該一或多個合成濾波參數到該合成濾波記憶體。
根據本發明的一較佳實施例記憶體狀態再取樣裝置是設在這種方式下:使用相同的多個合成濾波參數供解碼音源訊框的複數個子訊框。
根據本發明的一較佳實施例記憶體再取樣裝置是設在這種方式下:藉由變換供前解碼音源訊框的前合成濾波記憶體狀態到一功率頻譜以及藉由再取樣該功率頻譜而完成前合成濾波記憶體狀態的再取樣。
根據本發明的一較佳實施例一或多個記憶體包括一去加重記憶體設來儲存一去加重記憶體狀態供決定供解碼音源訊框的一或多個去加重參數,其中記憶體狀態再取樣裝置係設來藉由再取樣一前去加重記憶體狀態供決定供前解碼音源訊框的一或多個去加重參數藉以決定該去加重記憶體狀態其供決定供解碼音源訊框的一或多個去加重參數,以及設來儲存去加重記憶體狀態供決定供解碼音源訊框的一或多個去加重參數到去加重記憶體。
根據本發明的一較佳實施例一或多個記憶體是設在這種方式下:供解碼音源訊框的一數量的儲存取樣係與解碼音源訊框的取樣率成比例。
根據本發明的一較佳實施例記憶體再取樣裝置是設在這種
方式下:藉由線性插值完成該再取樣。
根據本發明的一較佳實施例記憶體狀態再取樣裝置係設來從記憶裝置取得前記憶體狀態供該等多個記憶體的其中一或多個。
根據本發明的一較佳實施例音源解碼裝置包括一反向濾波裝置設來供在該前取樣率該前解碼音源訊框的反向濾波以決定該前記憶體狀態供該等多個記憶體的其中一或多個,其中該記憶體狀態再取樣裝置係設來從該反向濾波裝置取得該前記憶體狀態供該等多個記憶體的其中一或多個。
根據本發明的一較佳實施例的音源編碼器,其中記憶體狀態再取樣裝置係設來從另一音源編碼器取得前記憶體狀態供該等多個記憶體的其中一或多個。
本發明另一方面問題藉由供編碼一框化音源訊號操作一音源編碼器的方法解決,該方法包括:藉使用一預估編碼器從該框化音源訊號產生一編碼音源訊框,其中該預估編碼器包括一參數分析器從該框化音源訊號產生供該編碼音源訊框的一或多個音源參數,其中該預估編碼器包括一合成濾波裝置供藉由合成供一解碼音源訊框的一或多個音源參數而產生該解碼音源訊框,其中供該解碼音源訊框的該一或多個音源參數是供該編碼音源訊框的該一或多個音源參數;提供一記憶裝置其包括一或多個記憶體,其中各該等記憶體係設來儲存供該解碼音源訊框的一記憶體狀態,其中該一或多個記憶體的供該解碼音源訊框的該記憶體狀態係被該合成濾波裝置使用來合成供該解碼音源訊框的該一或多個音源參數;藉由再取樣一前記憶體狀態其供合成供一前解碼音源訊框的一或多個音源參數供該等多個記憶體的其中一或多個藉以決定該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數供該等多個記憶體的其中一或多個,其中該解碼音源訊框具有一取樣率,其中該前解碼音源訊框具有一前取樣率不同於該解碼音源訊框的該取樣率;以及儲存該記憶體狀態其供合成供該解碼音源訊框的該一或多個音源參數
供該等多個記憶體的其中一或多個到該分別的記憶體。
本發明一方面問題藉由一電腦程式解決,當其運行在一處理器時,執行根據本發明的方法。
1‧‧‧音源解碼裝置
2‧‧‧預估解碼器
3‧‧‧參數解碼器
4‧‧‧合成濾波裝置
5‧‧‧記憶裝置
6‧‧‧記憶體
6a‧‧‧適應性編碼簿記憶體
6b‧‧‧合成濾波記憶體
6c‧‧‧去加重記憶體
7‧‧‧反向濾波裝置
8‧‧‧音源訊框再取樣裝置
9‧‧‧參數分析器
10‧‧‧記憶體狀態再取樣裝置
11‧‧‧激發模組
12‧‧‧延遲插入器
13‧‧‧合成濾波模組
14‧‧‧延遲插入器
15‧‧‧去加重模組
16‧‧‧延遲插入器
17‧‧‧反向濾波裝置
18‧‧‧去加重模組
19‧‧‧延遲插入器
20‧‧‧前加重記憶體
21‧‧‧分析濾波模組
22‧‧‧延遲插入器
23‧‧‧分析濾波模組
24‧‧‧延遲插入器
25‧‧‧適應性編碼簿記憶體
26‧‧‧再解碼器
27‧‧‧音源編碼器
28‧‧‧預估編碼器
29‧‧‧參數分析器
BS‧‧‧位元流
AF‧‧‧解碼音源訊框
AP‧‧‧音源參數
MS‧‧‧供音源訊框的記憶體狀態
SR‧‧‧取樣率
PAF‧‧‧前解碼音源訊框
IS‧‧‧詢問訊號
RS‧‧‧響應訊號
PSR‧‧‧前取樣率
LPCC‧‧‧線性預估編碼係數
PMS‧‧‧前記憶體狀態
AMS‧‧‧適應性編碼簿記憶體狀態
EP‧‧‧激發參數
PAMS‧‧‧前適應性編碼簿記憶體狀態
OS‧‧‧激發模組的輸出訊號
SMS‧‧‧合成濾波記憶體狀態
SP‧‧‧合成濾波參數
PSMS‧‧‧前合成濾波記憶體狀態
OS1‧‧‧合成濾波的輸出訊號
DMS‧‧‧去加重記憶體狀態
DP‧‧‧去加重參數
PDMS‧‧‧前去加重記憶體狀態
FAS‧‧‧框化音源訊號
EAF‧‧‧編碼音源訊框
本發明多個較佳實施例將隨後參考多個圖式說明。
圖1出示根據習知示意圖的一音源解碼裝置的一實施例。
圖2出示根據習知示意圖的一音源解碼裝置的一第二實施例。
圖3出示根據本發明示意圖的一音源解碼裝置的一第一實施例。
圖4出示根據本發明示意圖的音源解碼裝置的第一實施例的更多細部。
圖5出示根據本發明示意圖的一音源解碼裝置的一第二實施例。
圖6出示根據本發明示意圖的音源解碼裝置的第二實施例的更多細部。
圖7出示根據本發明示意圖的一音源解碼裝置的一第三實施例。
圖8出示根據本發明示意圖的一音源編碼器的一實施例。
圖1出示根據習知示意圖的一音源解碼裝置的一實施例。
根據習知的音源解碼裝置1包括:一預估解碼器2供從位元流BS產生一解碼音源訊框AF,其中預估解碼器2包括一參數解碼器3供從位元流BS產生供解碼音源訊框AF的一或多個音源參數AP,其中預估解碼器2包括一合成濾波裝置4供藉由合成供解碼音源訊框AF的一或多個音源參數AP而產生解碼音源訊框AF;一記憶裝置5包括一或多個記憶體6,其中各該等記憶體6係設來儲存供解碼音源訊框AF的一記憶體狀態MS,其中一或多個記憶體6的供解碼音源訊框AF的記憶體狀態MS係被合成濾波裝置4使用來合成供解碼音源訊框AF的一或多個音源參數AP;以及一反向濾波裝置7設來供一前解碼音源訊框PAF的反向濾波其具有與解碼音源訊框AF相同的取樣率SR。
對於合成該等音源參數AP,合成濾波器4傳送一詢問訊號IS至記憶體6,其中詢問訊號IS依一或多個音源參數AP而定。記憶體6回覆一響應訊號RS其係依詢問訊號IS以及供解碼音源訊框AF的記憶體
狀態MS而定。
習知音源解碼裝置在本實施例允許從一非預估音源解碼裝置切換至預估解碼器裝置1如圖1所示。然而,其仍需要非預估音源解碼裝置與預估解碼器裝置1使用相同取樣率SR。
圖2出示根據習知示意圖的一音源解碼裝置1的一第二實施例。除了圖1所示的音源解碼裝置1的特徵之外,圖2所示的音源解碼裝置1包括一音源訊框再取樣裝置8,其係設來再取樣具一前取樣率PSR的一前音源訊框PAF以產生具一取樣率SR的一前音源訊框PAF,其係音源訊框AF的一取樣率SR。
具取樣率SR的前音源訊框PAF係然後藉由參數分析器9分析其係設來決定多個LPC係數LPCC供具取樣率SR的前音源訊框PAF。這些LPC係數LPCC然後被反向濾波裝置7使用供具取樣率SR的前音源訊框PAF的反向濾波以決定供解碼音源訊框AF的記憶體狀態MS。
此方案是非常計算要求的且難以適用在真正實現。
圖3出示根據本發明示意圖的一音源解碼裝置的一第一實施例。
音源解碼裝置1包括:一預估解碼器2供從位元流BS產生一解碼音源訊框AF,其中預估解碼器2包括一參數解碼器3供從位元流BS產生供解碼音源訊框AF的一或多個音源參數AP,其中預估解碼器2包括一合成濾波裝置4供藉由合成供解碼音源訊框AF的一或多個音源參數AP而產生解碼音源訊框AF;一記憶裝置5包括一或多個記憶體6,其中各該等記憶體6係設來儲存供解碼音源訊框AF的一記憶體狀態MS,其中一或多個記憶體6的供解碼音源訊框AF的記憶體狀態MS被合成濾波裝置4使用來合成供解碼音源訊框AF的一或多個音源參數AP;以及一記憶體狀態再取樣裝置10設來藉由再取樣一前記憶體狀態PMS其供合成供一前解碼音源訊框PAF的一或多個音源參數供該等多個記憶體6的其中一或多個藉以決定記憶體狀態MS其供合成供解碼音源訊框AF的一或多個音源參數AP供該等多個記憶體6的其中一或多個,其中解碼音源
訊框(AF)具有一取樣率(SR),前解碼音源訊框PAF具有一前取樣率PSR不同於解碼音源訊框AF的取樣率SR,以及設來儲存記憶體狀態MS其供合成供解碼音源訊框AF的一或多個音源參數AP供該等多個記憶體6的其中一或多個到分別的記憶體6。
對於合成該等音源參數AP,合成濾波器4傳送一詢問訊號IS至記憶體6,其中詢問訊號IS依一或多個音源參數AP而定。記憶體6回覆一響應訊號RS其係依詢問訊號IS以及供解碼音源訊框AF的記憶體狀態MS而定。
用語「解碼音源訊框AF」指當前正處理中的一音源訊框,用語「前解碼音源訊框PAF」指一音源訊框其係當前正處理中的音源訊框之前已經被處理。
本發明允許一預估編碼方案來切換其內部取樣率無須再取樣整個多個緩衝區供重新計算其多個濾波器的多個狀態。藉由直接僅對必要的多個記憶體狀態MS再取樣,一低複雜度可維持當一無縫轉變仍可能。
根據本發明的一較佳實施例,記憶體狀態再取樣裝置10係設來從記憶裝置5取得供一或多個前記記憶體6的前記憶體狀態PMS;PAMS,PSMS,PDMS。
本發明可用於當使用具不同內部取樣率PSR,SR的編碼方案。例如其可用的情況是當通道的可取得頻寬受限時使用一CELP以12.8kHz的一內部取樣率PSR供低位元率,當多個通道狀況較好時切換至16kHz內部取樣率SR供較高位元率。
圖4出示根據本發明示意圖的音源解碼裝置的第一實施例的更多細部。如圖4所示,記憶裝置5包括一第一記憶體6a其係一適應性編碼簿6a、一第二記憶體6b其係一合成濾波記憶體6b、以及一第三記憶體6c其係一去加重記憶體6c。
該等音源參數AP係提供到至一激發模組11其係產生一輸出訊號OS其係被一延遲插入器12所延遲並傳送到適應性編碼簿記憶體6a作為一詢問訊號ISa。適應性編碼簿記憶體6a輸出一響應訊號RSa,其含有一或多個激發參數EP,其係提供到至激發模組11。
激發模組11的輸出訊號OS係更提供到至合成濾波模組13,其輸出一輸出訊號OS1。輸出訊號OS1係被一延遲插入器14所延遲並傳送到合成濾波記憶體6b作為一詢問訊號1Sb。合成濾波記憶體13輸出一響應訊號RSb,其含有一或多個合成參數SP,其係提供到至合成濾波記憶體13。
合成濾波模組13的輸出訊號OS1也提供到至去加重模組15,其係輸出解碼音源訊框AF在取樣率SR。音源訊框AF更被一延遲插入器16所延遲並fit至去加重記憶體6c作為一詢問訊號ISc。去加重記憶體6c輸出一響應訊號RSc,其含有一或多個去加重參數DP其係提供到至一去加重模組15。
根據本發明的一較佳實施例,一或多個記憶體6a,6b,6c包括一適應性編碼簿記憶體6a設來儲存一適應性編碼簿記憶體狀態AMS供決定供解碼音源訊框AF的一或多個激發參數EP,其中記憶體狀態再取樣裝置10係設來藉由再取樣一前適應性編碼簿記憶體狀態PAMS供決定供前解碼音源訊框PAF的一或多個激發參數藉以決定適應性編碼簿記憶體狀態AMS其供決定供解碼音源訊框AF的一或多個激發參數EP,以及設來儲存適應性編碼簿記憶體狀態AMS供決定供解碼音源訊框AF的一或多個激發參數EP到適應性編碼簿記憶體6a。
適應性編碼簿記憶體狀態AMS例如用在CELP裝置。
為了能再取樣該等記憶體6a,6b,6c,在不同取樣率SR,PSR的記憶體規模必須依其涵蓋的時間期間而相同。換句話說,如果一濾波器在取樣率SR具有M階,更新在前取樣率PSR的記憶體應涵蓋至少M*(PSR)/(SR)取樣。
記憶體6a通常隨取樣率SR成比例在適應性編碼簿的情況,其係涵蓋解碼殘餘訊號約持續20ms不論取樣率SR為何,這不需要做額外記憶體管理。
根據本發明的一較佳實施例,一或多個記憶體6a,6b,6c包括一合成濾波記憶體6b設來儲存一合成濾波記憶體狀態SMS供決定供解碼音源訊框AF的一或多個合成濾波參數SP,其中記憶體狀態再取樣裝置
1係設來藉由再取樣一前合成記憶體狀態PSMS供決定供前解碼音源訊框PAF的一或多個合成濾波參數藉以決定合成濾波記憶體狀態SMS其供決定供解碼音源訊框AF的一或多個合成濾波參數SP,以及設來儲存合成記憶體狀態SMS供決定供解碼音源訊框AF的一或多個合成濾波參數SP到合成濾波記憶體6b。
合成濾波記憶體狀態SMS可以是一LPC合成濾波狀態,其可例如使用在CELP裝置。
如果記憶體的階數沒有與取樣率SR成比例,甚至是常數不論取樣率為何,一額外記憶體管理必須要做供能夠涵蓋最大可能期間。例如AMR-WB+的LPC合成狀態階數總是16。在12.8kHz,最小取樣率其涵蓋1.25ms雖然其在48kHz僅表示0.33ms。為了能再取樣介於12.8kHz與48kHz間任何取樣率的緩衝區,LPC合成濾波狀態的記憶體必須從16取樣延長至60取樣,其表示在48kHz表示1.25ms。
記憶體再取樣可然後用以下虛擬碼來描述:mem_syn_r_size_old=(int)(1.25*PSR/1000);1mem_syn_r_size_new=(int)(1.25*SR/1000);mem_syn_r+L_SYN_MEM-mem_syn_r_size_new=resamp(mem_syn_r+L_SYN_MEM-mem_syn_r_size_old,mem_syn_r_size_old,mem_syn_r_size_new);其中resamp(x,1,L)輸出從1到L取樣的再取樣的輸入緩衝區x,L_SYN_MEM是記憶體涵蓋的取樣中規模最大的。在本例中其等於60取樣供SR<=48kHz。在任何取樣率,mem_syn_r必須以最新的L_SYN_MEM多個輸出取樣來更新。
For(i=0;i<L_SYM_MEM;i++)mem_syn_r[i]=y[L_frame-L_SYN_MEM+i];其中y[]是LPC合成濾波器的輸出,L_frame是在當前取樣率的訊框的規模。
然而,合成濾波器將使用從mem_syn_r[L_SYN_MEM-M]到mem_syn_r[L_SYN_MEM-1]的多個狀態來進行。
根據本發明的一較佳實施例記憶體再取樣裝置10是設在這種方式下:使用相同的多個合成濾波參數SP供解碼音源訊框AF的複數個子訊框。
最後的訊框PAF的該等LPC係數係通常用來以5ms的一時間粒度來插入當前多個LPC係數。如果取樣率從PSR變為SR,插值不能被進行。如果LPC重新計算,插值可以使用新計算的多個LPC係數來進行。在本發明中,插值不能直接進行。在一實施例中,當一取樣率切換後該等LPC係數沒有插值在第一訊框AF中。對全部5ms子訊框,相同組的係數被使用。
根據本發明的一較佳實施例記憶體再取樣裝置10是設在這種方式下:藉由變換供前解碼音源訊框PAF的前合成濾波記憶體狀態PSMS到一功率頻譜以及藉由再取樣該功率頻譜而完成前合成濾波記憶體狀態PSMS的再取樣。
在本實施例中,如果最後的編碼器也是一預估編碼器或如果最後的編碼器也傳送一組LPC,像是TCX,該等LPC係數可在新取樣率RS估測而無須重做一整個LP分析。在取樣率PSR的多個舊LPC係數係變換至一功率頻譜其係被再取樣。列文遜-杜賓演算法(Levinson-Durbin algorithm)然後用在從再取樣的功率頻譜演繹的自相關函數。
根據本發明的一較佳實施例一或多個記憶體6a,6b,6c包括一去加重記憶體6c設來儲存一去加重記憶體狀態DMS供決定供解碼音源訊框AF的一或多個去加重參數DP,其中記憶體狀態再取樣裝置10係設來藉由再取樣一前去加重記憶體狀態PDMS供決定供前解碼音源訊框PAF的一或多個去加重參數藉以決定去加重記憶體狀態DMS其供決定供解碼音源訊框AF的一或多個去加重參數DP,以及設來儲存去加重記憶體狀態DMS供決定供解碼音源訊框AF的一或多個去加重參數DP到去加重記憶體6c。
去加重記憶體狀態例如也用在CELP。
去加重通常具有1的一固定階數,其在12.8kHz表示0.0781ms。此期間在48kHz被3.75取樣涵蓋。4取樣的一記憶體緩衝區然
後被需要如果採納前述方法。替代地,可使用一近似法跳過再取樣狀態。可看到一非常粗糙的再取樣,其係包括保持最後的輸出取樣不論取樣率差異為何。此近似是大部分時間足夠以及能用於低複雜度因素。
根據本發明的一較佳實施例一或多個記憶體6;6a,6b,6c是設在這種方式下:供解碼音源訊框AF的一數量的儲存取樣係與解碼音源訊框AF的取樣率SR成比例。
根據本發明的一較佳實施例記憶體狀態再取樣裝置10是設在這種方式下:藉由線性插值完成該再取樣。
再取樣函式resamp()可以用任何再取樣方法來實作。在時域一傳統LP濾波器及降取樣/過取樣是常用的。在一較佳實施例可採納一簡單線性插值,其係足以,其足以依品質供再取樣濾波多個記憶體。其允許節省甚至較多複雜度。也可能在頻域做再取樣。在最後的方案,不需要注意馬賽克(block artefacts)隨記憶體是一濾波器的僅開始狀態。
圖5出示根據本發明示意圖的一音源解碼裝置的一第二實施例。
根據本發明的一較佳實施例音源解碼裝置1包括一反向濾波裝置17設來供在前取樣率PSR前解碼音源訊框PAF的反向濾波以決定前記憶體狀態PMS;PAMS,PSMS,PDMS供該等多個記憶體6;6a,6b,6c的其中一或多個,其中記憶體狀態再取樣裝置係設來從反向濾波裝置取得前記憶體狀態供該等多個記憶體的其中一或多個。
這些特徵讓本發明能實作在這些情況,其中前音源訊框PAF係由一非-預估解碼器所處理。
在本發明實施例中,反向濾波之前沒有使用再取樣。取而代之是多個記憶體狀態MS自己直接被再取樣。如果先前處理前音源訊框PAF的解碼器是一預估解碼器像是CELP,反向解碼不須要且能跳過既然多個前記憶體狀態PMS總是維持在前取樣率PSR。
圖6出示根據本發明示意圖的音源解碼裝置的第二實施例的更多細部。
如圖6所示,反向濾波裝置17包括一去加重模組18、一延
遲插入器19、一前加重記憶體20、一分析濾波模組21、另一延遲插入器22、一分析濾波模組23、另一延遲插入器24、以及一適應性編碼簿記憶體25。
在前取樣率PSR的前解碼音源訊框PAF係提供到去加重模組18以及延遲插入器19,從其提供到前加重記憶體20。如此在前取樣率建立的前去加重記憶體狀態PDMS然後傳送到記憶體狀態再取樣裝置10以及去加重模組18。
去加重模組18的輸出訊號提供到分析濾波模組21以及延遲插入器22,從其設到分析濾波模組23。藉如此做法,在前取樣率PSR的前合成記憶體狀態PSMS係被建立。前合成記憶體狀態PSMS然後傳送到記憶體狀態再取樣裝置10以及分析濾波器模組21。
再者,分析濾波模組21的輸出訊號設到延遲插入器24並進到適應性編碼簿記憶體25。藉此,在前取樣率PSR的前適應性編碼簿記憶體狀態PAMS可被建立,前適應性編碼簿記憶體狀態PAMS可然後傳送到記憶體狀態再取樣裝置10。
圖7出示根據本發明示意圖的一音源解碼裝置的一第三實施例。
根據本發明的一較佳實施例記憶體狀態再取樣裝置10係設來從另一音源處理裝置26取得前記憶體狀態PMS;PAMS,PSMS,PDMS供該等多個記憶體6的其中一或多個。
另一音源處理裝置26可以例如是另一音源解碼器裝置26或一家供噪聲產生裝置。
本發明可用在DTX模式,當多個啟用的訊框以一傳統CELP編碼在12.8kHz以及當非啟用部分以一16kHz噪聲產聲器(CNG)塑造。
本發明可用在例如當結合一TCX及一ACELP運行在不同取樣率。
圖8出示根據本發明示意圖的一音源編碼器的一實施例。
音源編碼器係設來編碼一框化音源訊號FAS。音源編碼器27包括:一預估編碼器28從框化音源訊號FAS產生一編碼音源訊框EAF,其
中預估編碼器28包括一參數分析器29從框化音源訊號FAS產生供編碼音源訊框EAV的一或多個音源參數AP,其中預估編碼器28包括一合成濾波裝置4供藉由合成供解碼音源訊框AF的一或多個音源參數AP而產生一解碼音源訊框AF,其中供解碼音源訊框AF的一或多個音源參數AP是供編碼音源訊框EAV的一或多個音源參數AP;一記憶裝置5包括一或多個記憶體6,其中各該等記憶體6係設來儲存供解碼音源訊框AF的一記憶體狀態MS,其中一或多個記憶體6的供解碼音源訊框AF的記憶體狀態MS係被合成濾波裝置4使用來合成供解碼音源訊框AF的一或多個音源參數AP;以及一記憶體狀態再取樣裝置10設來藉由再取樣一前記憶體狀態PMS其供合成供一前解碼音源訊框PAF的一或多個音源參數供該等多個記憶體6的其中一或多個藉以決定記憶體狀態MS其供合成供解碼音源訊框AF的一或多個音源參數AP供該等多個記憶體6的其中一或多個,其中解碼音源訊框AF具有一取樣率SR,前解碼音源訊框PAF具有一前取樣率PSR不同於解碼音源訊框AF的取樣率SR,以及設來儲存記憶體狀態MS其供合成供解碼音源訊框AF的一或多個音源參數AP供該等多個記憶體6的其中一或多個到分別的記憶體6。
本發明主要在於音源解碼裝置1。然而,其也可以用在音源編碼器27。的確CELP是基於一分析逐合成(Analysis-by-Synthesis)原則,於此一當地解碼係進行在編碼器側。對此因素相同原則如對解碼器所述可用在編碼器側。再者,在一切換編碼的情況下,即ACELP/TCX,基於變換的編碼器可必須能夠更新語音編碼器的該等記憶體甚至在編碼器側在次訊框在編碼切換的情況下。為此,一當地解碼器係用在基於變換的編碼器供更新CELP的該等記憶體狀態。其可以是基於變換的編碼器運行在一不同於CELP的取樣率並且本發明可然後用在這種情況。
對於合成該等音源參數AP,合成濾波器4傳送一詢問訊號IS至記憶體6,其中詢問訊號IS依一或多個音源參數AP而定。記憶體6回覆一響應訊號RS其係依詢問訊號IS以及供解碼音源訊框AF的記憶體狀態MS而定。
可理解的是音源編碼器27的合成濾波裝置4、記憶裝置5、記憶體狀態再取樣裝置10以及反向濾波裝置17係等效於前述音源解碼裝置1的合成濾波裝置4、記憶裝置5、記憶體狀態再取樣裝置10以及反向濾波裝置17。
根據本發明的一較佳實施例記憶體狀態再取樣裝置10係設來從記憶裝置5取得前記憶體狀態PMS供多個記憶體6的其中一或多個。
根據本發明的一較佳實施例一或多個記憶體6a,6b,6c包括一適應性編碼簿記憶體6a設來儲存一適應性編碼簿記憶體狀態AMS供決定供解碼音源訊框AF的一或多個激發參數EP,其中記憶體狀態再取樣裝置10係設來藉由再取樣一前適應性編碼簿記憶體狀態PAMS供決定供前解碼音源訊框PAF的一或多個激發參數藉以決定適應性編碼簿記憶體狀態AMS其供決定供解碼音源訊框AF的一或多個激發參數EP,以及設來儲存適應性編碼簿記憶體狀態AMS供決定供解碼音源訊框AF的一或多個激發參數EP到適應性編碼簿記憶體6a。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例一或多個記憶體6a,6b,6c包括一合成濾波記憶體6b設來儲存一合成濾波記憶體狀態SMS供決定供解碼音源訊框AF的一或多個合成濾波參數SP,其中記憶體狀態再取樣裝置10係設來藉由再取樣一前合成記憶體狀態PSMS供決定供前解碼音源訊框PAF的一或多個合成濾波參數藉以決定合成濾波記憶體狀態SMS其供決定供解碼音源訊框AF的一或多個合成濾波參數SP,以及設來儲存合成記憶體狀態SMS供決定供解碼音源訊框AF的一或多個合成濾波參數SP到合成濾波記憶體6b。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例記憶體狀態再取樣裝置10是設在這種方式下:使用相同的多個合成濾波參數SP供解碼音源訊框AF的複數個子訊框。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例記憶體再取樣裝置10是設在這種方式下:藉由變換供前解碼音源訊框PAF的前合成濾波記憶體狀態PSMS到一功率頻譜以及藉由再取樣該功率頻譜而完成前合成濾波記憶體狀態PSMS的再取樣。
根據本發明的一較佳實施例一或多個記憶體6;6a,6b,6c包括一去加重記憶體6c設來儲存一去加重記憶體狀態DMS供決定供解碼音源訊框AF的一或多個去加重參數DP,其中記憶體狀態再取樣裝置10係設來藉由再取樣一前去加重記憶體狀態PDMS供決定供前解碼音源訊框PAF的一或多個去加重參數藉以決定去加重記憶體狀態DMS其供決定供解碼音源訊框AF的一或多個去加重參數DP,以及設來儲存去加重記憶體狀態DMS供決定供解碼音源訊框AF的一或多個去加重參數DP到去加重記憶體6c。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例一或多個記憶體6;6a,6b,6c是設在這種方式下:供解碼音源訊框AF的一數量的儲存取樣係與解碼音源訊框AF的取樣率SR成比例。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例記憶體再取樣裝置10是設在這種方式下:藉由線性插值完成該再取樣。如圖4及前述圖4相關的說明。
根據本發明的一較佳實施例音源編碼器27包括一反向濾波裝置17設來供在前取樣率PSR前解碼音源訊框PAF的反向濾波以決定前記憶體狀態PMS供該等多個記憶體6的其中一或多個,其中記憶體狀態再取樣裝置10係設來從反向濾波裝置17取得前記憶體狀態PMS供該等多個記憶體6的其中一或多個。如圖5及前述圖5相關的說明。
反向濾波裝置17的細節如圖6及前述圖6相關的說明。
根據本發明的一較佳實施例記憶體狀態再取樣裝置10係設來從另一音源處理裝置取得前記憶體狀態PMS;PAMS,PSMS,PDMS供該等多個記憶體6;6a,6b,6c的一或多個。如圖7及前述圖7相關的說明。
關於解碼器以及編碼器以及所述實施例的方法,以下提及:
雖然一些方面已經描述在一裝置的內容,很清楚的是這些方面也代表對應方法的一描述,其中一區塊或裝置對應至一方法步驟或一方法步驟的特徵。類似的,描述在一方法步驟的內容的方面也代表一對應區塊或項目或一對應裝置的特徵的的一描述。
依據某個實作需求,本發明的實施例可實作在硬體或軟體。這實作可使用一數位儲存媒體來進行,例如一軟碟、一DVD、一CD、一
ROM、一PROM、EPROM、一EEPROM或一快閃記憶體,其中儲存具電子可讀取控制訊號,其係與一可編程電腦系統協同操作(或能夠協同操作)使得分別的方法係進行。
根據本發明的一些實施例包括一資料載體其具有電子可讀取控制訊號,其能夠與一可編程電腦系統協同運作,使得所述方法之一能夠進行。
一般來說,本發明實施例可實作為具程式碼的一電腦程式產品,當電腦程式產品執行在一電腦時,程式碼可運作來進行其中一種方法。程式碼可例如儲存在一機器可讀取載體。
其他實施例包括進行前述其中之一方法的電腦程式,儲存在一機器可讀取載體或一非暫態儲存媒體。
換句話說,本發明方法的一實施例因而是一電腦程式其具有一程式碼供進行所述方法之一當電腦程式運行在一電腦時。
本發明方法的再一實施例因而是一資料載體(或一數位儲存媒體、或一電腦可讀取媒體)其包括記錄於其的電腦程式供進行所述方法之一。
本發明方法的再一實施例因而是一資料串流或一連串的訊號其表現電腦程式供進行所述方法之一。此資料串流或一連串的訊號可以例如配置為經由一資料通訊連線例如網際網路來傳輸。
再一實施例包括一處理裝置,例如,一電腦或一可編程邏輯裝置,配置為或適宜進行所述方法之一。
再一實施例包括一電腦具安裝在其的電腦程式供進行所述方法之一。
在一些實施例中,一可編程邏輯裝置(例如,一現場可編程邏輯閘陣列)可以使用來進行所述方法的一些或全部功能。在一些實施例中,一現場可編程邏輯閘陣列可與一微處理器協同操作以進行所述方法之一。一般來說,這些方法較佳地藉由硬體裝置來進行。
雖然本發明已依據數個實施例說明,但仍有修改、變更及等效落入本發明之範圍。應注意實施本發明的方法及組成物有許多修改方式,
因此專利範圍解釋仍包括這些修改、變更及等效落入本發明的真正精神及範圍。
1‧‧‧音源解碼裝置
2‧‧‧預估解碼器
3‧‧‧參數解碼器
4‧‧‧合成濾波裝置
5‧‧‧記憶裝置
6‧‧‧記憶體
10‧‧‧記憶體狀態再取樣裝置
BS‧‧‧位元流
AF‧‧‧解碼音源訊框
AP‧‧‧音源參數
MS‧‧‧供音源訊框的記憶體狀態
SR‧‧‧取樣率
IS‧‧‧詢問訊號
RS‧‧‧響應訊號
PMS‧‧‧前記憶體狀態
Claims (26)
- 一種供解碼一位元流(BS)之音源解碼裝置,該音源解碼裝置(1)包括:一預估解碼器(2)供從該位元流(BS)產生一解碼音源訊框(AF),其中該預估解碼器(2)包括一參數解碼器(3)從該位元流(BS)產生供該解碼音源訊框(AF)的一或多個音源參數(AP),其中該預估解碼器(2)包括一合成濾波裝置(4)供藉由合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)而產生該解碼音源訊框(AF);一記憶裝置(5)包括一或多個記憶體(6;6a,6b,6c),其中各該等記憶體(6;6a,6b,6c)係設來儲存供該解碼音源訊框(AF)的一記憶體狀態(MS;AMS,SMS,DMS),其中該一或多個記憶體(6;6a,6b,6c)的供該解碼音源訊框(AF)的該記憶體狀態(MS;AMS,SMS,DMS)係被該合成濾波裝置(4)使用來合成供該解碼音源訊框(AF)的該一或多個音源參數(AP);以及一記憶體狀態再取樣裝置(10)設來藉由再取樣一前記憶體狀態(PMS;PAMS,PSMS,PDMS)其供合成供一前解碼音源訊框(PAF)的一或多個音源參數供該等多個記憶體(6;6a,6b,6c)的其中一或多個藉以決定該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個,其中該解碼音源訊框(AF)具有一取樣率(SR),該前解碼音源訊框(PAF)具有一前取樣率(PSR)不同於該解碼音源訊框(AF)的該取樣率(SR),以及設來儲存該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個到該分別的記憶體(6;6a,6b,6c)。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該一或多個記憶體(6;6a,6b,6c)包括一適應性編碼簿記憶體(6a)設來儲存一適應性編碼簿記憶體狀態(AMS)供決定供該解碼音源訊框(AF)的一或多個激發參數(EP),其中該記憶體狀態再取樣裝置(10)係設來藉由再取樣一前適 應性編碼簿記憶體狀態(PAMS)供決定供該前解碼音源訊框(PAF)的一或多個激發參數藉以決定該適應性編碼簿記憶體狀態(AMS)其供決定供該解碼音源訊框(AF)的該一或多個激發參數(EP),以及設來儲存該適應性編碼簿記憶體狀態(AMS)供決定供該解碼音源訊框(AF)的該一或多個激發參數(EP)到該適應性編碼簿記憶體(6a)。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該一或多個記憶體(6;6a,6b,6c)包括一合成濾波記憶體(6b)設來儲存一合成濾波記憶體狀態(SMS)供決定供該解碼音源訊框(AF)的一或多個合成濾波參數(SP),其中該記憶體狀態再取樣裝置(1)係設來藉由再取樣一前合成記憶體狀態(PSMS)供決定供該前解碼音源訊框(PAF)的一或多個合成濾波參數藉以決定該合成濾波記憶體狀態(SMS)其供決定供該解碼音源訊框(AF)的該一或多個合成濾波參數(SP),以及設來儲存該合成記憶體狀態(SMS)供決定供該解碼音源訊框(AF)的該一或多個合成濾波參數(SP)到該合成濾波記憶體(6b)。
- 如申請專利範圍第3項所述之音源解碼裝置,其中該記憶體再取樣裝置(10)是設在這種方式下:使用該等相同的多個合成濾波參數(SP)供該解碼音源訊框(AF)的複數個子訊框。
- 如申請專利範圍第3項所述之音源解碼裝置,其中該記憶體再取樣裝置(10)是設在這種方式下:藉由變換供該前解碼音源訊框(PAF)的該前合成濾波記憶體狀態(PSMS)到一功率頻譜以及藉由再取樣該功率頻譜而完成該前合成濾波記憶體狀態(PSMS)的該再取樣。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該一或多個記憶體(6;6a,6b,6c)包括一去加重記憶體(6c)設來儲存一去加重記憶體狀態(DMS)供決定供該解碼音源訊框(AF)的一或多個去加重參數(DP),其中該記憶體狀態再取樣裝置(10)係設來藉由再取樣一前去加重記憶體狀態(PDMS)供決定供該前解碼音源訊框(PAF)的一或多個去加重參數藉以決定該去加重記憶體狀態(DMS)其供決定供該解碼音源訊框(AF)的該一或多個去加重參數(DP),以及設來儲存該去加重記憶體狀態(DMS)供決定供該解碼音源訊框(AF)的該一或多個去加重參數(DP) 到該去加重記憶體(6c)。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該一或多個記憶體(6;6a,6b,6c)是設在這種方式下:供該解碼音源訊框(AF)的一數量的儲存取樣係與該解碼音源訊框(AF)的該取樣率(SR)成比例。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該記憶體狀態再取樣裝置(10)是設在這種方式下:藉由線性插值完成該再取樣。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該記憶體狀態再取樣裝置(10)係設來從該記憶裝置(5)取得該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該音源解碼裝置(1)包括一反向濾波裝置(17)設來供在該前取樣率(PSR)該前解碼音源訊框(PAF)的反向濾波以決定該等多個記憶體(6;6a,6b,6c)的其中一或多個的該前記憶體狀態(PMS;PAMS,PSMS,PDMS),其中該記憶體狀態再取樣裝置係設來從該反向濾波裝置取得該前記憶體狀態供該等多個記憶體的其中一或多個。
- 如申請專利範圍第1項所述之音源解碼裝置,其中該記憶體狀態再取樣裝置係設來從另一音源處理裝置(26)取得該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個。
- 一種供解碼一位元流(BS)之操作一音源解碼裝置(1)的方法,該方法包括:藉使用一預估解碼器(2)從該位元流(BS)產生一解碼音源訊框(AF),其中該預估解碼器(2)包括一參數解碼器(3)從該位元流(BS)產生供該解碼音源訊框(AF)的一或多個音源參數(AP),其中該預估解碼器(2)包括一合成濾波裝置(4)供藉由合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)而產生該解碼音源訊框(AF);提供一記憶裝置其(5)包括一或多個記憶體(6;6a,6b,6c),其中各該等記憶體(6;6a,6b,6c)係設來儲存供該解碼音源訊框(AF)的一記憶體狀態(MS;AMS,SMS,DMS),其中該一或多個記憶體(6;6a,6b, 6c)的供該解碼音源訊框(AF)的該記憶體狀態(MS;AMS,SMS,DMS)係被該合成濾波裝置(4)使用來合成供該解碼音源訊框(AF)的該一或多個音源參數(AP);藉由再取樣一前記憶體狀態(PMS;PAMS,PSMS,PDMS)其供合成供一前解碼音源訊框(PAF)的一或多個音源參數供該等多個記憶體(6;6a,6b,6c)的其中一或多個藉以決定該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個,其中該解碼音源訊框(AF)具有一取樣率(SR),其中該前解碼音源訊框(PAF)具有一前取樣率(PSR)不同於該解碼音源訊框(AF)的該取樣率(SR);以及儲存該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個到該分別的記憶體。
- 一種電腦程式,當運行在一處理器時,執行如申請專利範圍第12項所述之供解碼一位元流(BS)之操作該音源解碼裝置(1)的方法。
- 一種供編碼一框化音源訊號(FAS)之音源編碼器,該音源編碼器(27)包括:一預估編碼器(28)從該框化音源訊號(FAS)產生一編碼音源訊框(EAF),其中該預估編碼器(28)包括一參數分析器(29)從該框化音源訊號(FAS)產生供該編碼音源訊框(EAV)的一或多個音源參數(AP),其中該預估編碼器(28)包括一合成濾波裝置(4)供藉由合成供一解碼音源訊框(AF)的一或多個音源參數(AP)而產生該解碼音源訊框(AF),其中供該解碼音源訊框(AF)的該一或多個音源參數(AP)是供該編碼音源訊框(EAV)的該一或多個音源參數(AP);一記憶裝置(5)包括一或多個記憶體(6;6a,6b,6c),其中各該等記憶體(6;6a,6b,6c)係設來儲存供該解碼音源訊框(AF)的一記憶體狀態(MS;AMS,SMS,DMS),其中該一或多個記憶體(6;6a,6b,6c) 的供該解碼音源訊框(AF)的該記憶體狀態(MS;AMS,SMS,DMS)係被該合成濾波裝置(4)使用來合成供該解碼音源訊框(AF)的該一或多個音源參數(AP);以及一記憶體狀態再取樣裝置(10)設來藉由再取樣一前記憶體狀態(PMS;PAMS,PSMS,PDMS)其供合成供一前解碼音源訊框(PAF)的一或多個音源參數供該等多個記憶體(6;6a,6b,6c)的其中一或多個藉以決定該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個,其中該解碼音源訊框(AF)具有一取樣率(SR),該前解碼音源訊框(PAF)具有一前取樣率(PSR)不同於該解碼音源訊框(AF)的該取樣率(SR),以及設來儲存該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個到該分別的記憶體(6;6a,6b,6c)。
- 如申請專利範圍第14項所述之音源編碼器,其中該一或多個記憶體(6;6a,6b,6c)包括一適應性編碼簿記憶體(6a)設來儲存一適應性編碼簿記憶體狀態(AMS)供決定供該解碼音源訊框(AF)的一或多個激發參數(EP),其中該記憶體狀態再取樣裝置(10)係設來藉由再取樣一前適應性編碼簿記憶體狀態(PAMS)供決定供該前解碼音源訊框(PAF)的一或多個激發參數(EP)藉以決定該適應性編碼簿記憶體狀態(AMS)其供決定供該解碼音源訊框(AF)的該一或多個激發參數(EP),以及設來儲存該適應性編碼簿記憶體狀態(AMS)供決定供該解碼音源訊框(AF)的該一或多個激發參數(EP)到該適應性編碼簿記憶體(6a)。
- 如申請專利範圍第14項所述之音源編碼器,其中該一或多個記憶體(6;6a,6b,6c)包括一合成濾波記憶體(6b)設來儲存一合成濾波記憶體狀態(SMS)供決定供該解碼音源訊框(AF)的一或多個合成濾波參數(SP),其中該記憶體狀態再取樣裝置(1)係設來藉由再取樣一前合成記憶體狀態(PSMS)供決定供該前解碼音源訊框(PAF)的一或多個 合成濾波參數藉以決定該合成濾波記憶體狀態(SMS)其供決定供該解碼音源訊框(AF)的該一或多個合成濾波參數(SP),以及設來儲存該合成記憶體狀態(SMS)供決定供該解碼音源訊框(AF)的該一或多個合成濾波參數(SP)到該合成濾波記憶體(6b)。
- 如申請專利範圍第16項所述之音源編碼器,其中該記憶體狀態再取樣裝置(10)是設在這種方式下:使用該等相同的多個合成濾波參數(SP)供該解碼音源訊框(AF)的複數個子訊框。
- 如申請專利範圍第16項所述之音源編碼器,其中該記憶體再取樣裝置(10)是設在這種方式下:藉由變換供該前解碼音源訊框(PAF)的該前合成濾波記憶體狀態(PSMS)到一功率頻譜以及藉由再取樣該功率頻譜而完成該前合成濾波記憶體狀態(PSMS)的該再取樣。
- 如申請專利範圍第14項所述之音源編碼器,其中該一或多個記憶體(6;6a,6b,6c)包括一去加重記憶體(6c)設來儲存一去加重記憶體狀態(DMS)供決定供該解碼音源訊框(AF)的一或多個去加重參數(DP),其中該記憶體狀態再取樣裝置(10)係設來藉由再取樣一前去加重記憶體狀態(PDMS)供決定供該前解碼音源訊框(PAF)的一或多個去加重參數藉以決定該去加重記憶體狀態(DMS)其供決定供該解碼音源訊框(AF)的該一或多個去加重參數(DP),以及設來儲存該去加重記憶體狀態(DMS)供決定供該解碼音源訊框(AF)的該一或多個去加重參數(DP)到該去加重記憶體(6c)。
- 如申請專利範圍第14項所述之音源編碼器,其中該一或多個記憶體(6;6a,6b,6c)是設在這種方式下:供該解碼音源訊框(AF)的一數量的儲存取樣係與該解碼音源訊框(AF)的該取樣率(SR)成比例。
- 如申請專利範圍第14項所述之音源編碼器,其中該記憶體再取樣裝置(10)是設在這種方式下:藉由線性插值完成該再取樣。
- 如申請專利範圍第14項所述之音源編碼器,其中該記憶體狀態再取樣裝置(10)係設來從該記憶裝置(5)取得該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個。
- 如申請專利範圍第14項所述之音源編碼器,其中該音源編碼器(27) 包括一反向濾波裝置(17)設來供在該前取樣率(PSR)該前解碼音源訊框(PAF)的反向濾波以決定該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個,其中該記憶體狀態再取樣裝置(10)係設來從該反向濾波裝置(17)取得該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個。
- 如申請專利範圍第14項所述之音源編碼器,其中該記憶體狀態再取樣裝置係設來從另一音源處理裝置取得該前記憶體狀態(PMS;PAMS,PSMS,PDMS)供該等多個記憶體(6;6a,6b,6c)的其中一或多個。
- 一種供編碼一框化音源訊號之操作一音源編碼器(27)的方法,該方法包括:藉使用一預估編碼器(28)從該框化音源訊號(FAS)產生一編碼音源訊框(EAF),其中該預估編碼器(28)包括一參數分析器(29)從該框化音源訊號(FAS)產生供該編碼音源訊框(EAV)的一或多個音源參數(AP),其中該預估編碼器(28)包括一合成濾波裝置(4)供藉由合成供一解碼音源訊框(AF)的一或多個音源參數(AP)而產生該解碼音源訊框(AF),其中供該解碼音源訊框(AF)的該一或多個音源參數(AP)是供該編碼音源訊框(EAV)的該一或多個音源參數(AP);提供一記憶裝置其(5)包括一或多個記憶體(6;6a,6b,6c),其中各該等記憶體(6;6a,6b,6c)係設來儲存供該解碼音源訊框(AF)的一記憶體狀態(MS;AMS,SMS,DMS),其中該一或多個記憶體(6;6a,6b,6c)的供該解碼音源訊框(AF)的該記憶體狀態(MS;AMS,SMS,DMS)係被該合成濾波裝置(4)使用來合成供該解碼音源訊框(AF)的該一或多個音源參數(AP);藉由再取樣一前記憶體狀態(PMS;PAMS,PSMS,PDMS)其供合成供一前解碼音源訊框(PAF)的一或多個音源參數供該等多個記憶體(6;6a,6b,6c)的其中一或多個藉以決定該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP) 供該等多個記憶體(6;6a,6b,6c)的其中一或多個,其中該解碼音源訊框(AF)具有一取樣率(SR),該前解碼音源訊框(PAF)具有一前取樣率(PSR)不同於該解碼音源訊框(AF)的該取樣率(SR);以及儲存該記憶體狀態(MS;AMS,SMS,DMS)其供合成供該解碼音源訊框(AF)的該一或多個音源參數(AP)供該等多個記憶體(6;6a,6b,6c)的其中一或多個到該分別的記憶體(6;6a,6b,6c)。
- 一種電腦程式,當運行在一處理器時,執行如申請專利範圍第25項所述之供編碼一框化音源訊號之操作該音源編碼器(27)的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14181307.1A EP2988300A1 (en) | 2014-08-18 | 2014-08-18 | Switching of sampling rates at audio processing devices |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201612896A TW201612896A (en) | 2016-04-01 |
TWI587291B true TWI587291B (zh) | 2017-06-11 |
Family
ID=51352467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104126634A TWI587291B (zh) | 2014-08-18 | 2015-08-14 | 音訊解碼/編碼裝置及其運作方法及電腦程式 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10783898B2 (zh) |
EP (4) | EP2988300A1 (zh) |
JP (1) | JP6349458B2 (zh) |
KR (1) | KR102120355B1 (zh) |
CN (2) | CN106663443B (zh) |
AR (1) | AR101578A1 (zh) |
AU (1) | AU2015306260B2 (zh) |
BR (1) | BR112017002947B1 (zh) |
CA (1) | CA2957855C (zh) |
ES (2) | ES2828949T3 (zh) |
MX (1) | MX360557B (zh) |
MY (1) | MY187283A (zh) |
PL (2) | PL3183729T3 (zh) |
PT (1) | PT3183729T (zh) |
RU (1) | RU2690754C2 (zh) |
SG (1) | SG11201701267XA (zh) |
TW (1) | TWI587291B (zh) |
WO (1) | WO2016026788A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX362490B (es) * | 2014-04-17 | 2019-01-18 | Voiceage Corp | Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo. |
EP2988300A1 (en) * | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
US11601483B2 (en) * | 2018-02-14 | 2023-03-07 | Genband Us Llc | System, methods, and computer program products for selecting codec parameters |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101512639A (zh) * | 2006-09-13 | 2009-08-19 | 艾利森电话股份有限公司 | 用于语音/音频发送器和接收器的方法和设备 |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3982070A (en) * | 1974-06-05 | 1976-09-21 | Bell Telephone Laboratories, Incorporated | Phase vocoder speech synthesis system |
JPS60224341A (ja) * | 1984-04-20 | 1985-11-08 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化方法 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
US7446774B1 (en) * | 1998-11-09 | 2008-11-04 | Broadcom Corporation | Video and graphics system with an integrated system bridge controller |
TW479220B (en) * | 1998-11-10 | 2002-03-11 | Tdk Corp | Digital audio recording and reproducing apparatus |
MXPA01010913A (es) | 1999-04-30 | 2002-05-06 | Thomson Licensing Sa | Metodo y aparato para procesar datos de audio digitalmente codificados. |
US6829579B2 (en) | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
JP2004023598A (ja) * | 2002-06-19 | 2004-01-22 | Matsushita Electric Ind Co Ltd | 音声データ記録再生装置 |
JP3947191B2 (ja) * | 2004-10-26 | 2007-07-18 | ソニー株式会社 | 予測係数生成装置及び予測係数生成方法 |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
US7489259B2 (en) * | 2006-08-01 | 2009-02-10 | Creative Technology Ltd. | Sample rate converter and method to perform sample rate conversion |
CN101375330B (zh) * | 2006-08-15 | 2012-02-08 | 美国博通公司 | 丢包后解码音频信号的时间扭曲的方法 |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
GB2455526A (en) | 2007-12-11 | 2009-06-17 | Sony Corp | Generating water marked copies of audio signals and detecting them using a shuffle data store |
MY159110A (en) * | 2008-07-11 | 2016-12-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
MY152252A (en) * | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
EP4362014A1 (en) * | 2009-10-20 | 2024-05-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
GB2476041B (en) * | 2009-12-08 | 2017-03-01 | Skype | Encoding and decoding speech signals |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
US9594536B2 (en) * | 2011-12-29 | 2017-03-14 | Ati Technologies Ulc | Method and apparatus for electronic device communication |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
MX362490B (es) * | 2014-04-17 | 2019-01-18 | Voiceage Corp | Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo. |
FR3023646A1 (fr) * | 2014-07-11 | 2016-01-15 | Orange | Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame |
EP2988300A1 (en) * | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
-
2014
- 2014-08-18 EP EP14181307.1A patent/EP2988300A1/en not_active Withdrawn
-
2015
- 2015-08-14 CN CN201580044544.0A patent/CN106663443B/zh active Active
- 2015-08-14 MX MX2017002108A patent/MX360557B/es active IP Right Grant
- 2015-08-14 BR BR112017002947-2A patent/BR112017002947B1/pt active IP Right Grant
- 2015-08-14 ES ES15750069T patent/ES2828949T3/es active Active
- 2015-08-14 CA CA2957855A patent/CA2957855C/en active Active
- 2015-08-14 PL PL15750069T patent/PL3183729T3/pl unknown
- 2015-08-14 PT PT157500695T patent/PT3183729T/pt unknown
- 2015-08-14 PL PL20185071.6T patent/PL3739580T3/pl unknown
- 2015-08-14 MY MYPI2017000248A patent/MY187283A/en unknown
- 2015-08-14 CN CN202110649437.8A patent/CN113724719B/zh active Active
- 2015-08-14 AU AU2015306260A patent/AU2015306260B2/en active Active
- 2015-08-14 EP EP20185071.6A patent/EP3739580B1/en active Active
- 2015-08-14 JP JP2017510309A patent/JP6349458B2/ja active Active
- 2015-08-14 TW TW104126634A patent/TWI587291B/zh active
- 2015-08-14 EP EP15750069.5A patent/EP3183729B1/en active Active
- 2015-08-14 SG SG11201701267XA patent/SG11201701267XA/en unknown
- 2015-08-14 WO PCT/EP2015/068778 patent/WO2016026788A1/en active Application Filing
- 2015-08-14 RU RU2017108839A patent/RU2690754C2/ru active
- 2015-08-14 KR KR1020177006373A patent/KR102120355B1/ko active IP Right Grant
- 2015-08-14 EP EP24151606.1A patent/EP4328908A3/en active Pending
- 2015-08-14 ES ES20185071T patent/ES2980944T3/es active Active
- 2015-08-18 AR ARP150102651A patent/AR101578A1/es active IP Right Grant
-
2017
- 2017-02-10 US US15/430,178 patent/US10783898B2/en active Active
-
2020
- 2020-08-18 US US16/996,671 patent/US11443754B2/en active Active
-
2022
- 2022-08-05 US US17/882,363 patent/US11830511B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101512639A (zh) * | 2006-09-13 | 2009-08-19 | 艾利森电话股份有限公司 | 用于语音/音频发送器和接收器的方法和设备 |
US20090234645A1 (en) * | 2006-09-13 | 2009-09-17 | Stefan Bruhn | Methods and arrangements for a speech/audio sender and receiver |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
EP2613316A2 (en) * | 2012-01-03 | 2013-07-10 | Motorola Mobility, Inc. | Method and apparatus for processing audio frames to transition between different codecs |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI587291B (zh) | 音訊解碼/編碼裝置及其運作方法及電腦程式 | |
JP6941643B2 (ja) | 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器 | |
JP6838091B2 (ja) | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 | |
TWI613643B (zh) | 用於編碼多聲道信號的音訊編碼器與方法、用於解碼經編碼音訊信號的音訊解碼器與方法及相關電腦程式 | |
JP5978227B2 (ja) | 予測符号化と変換符号化を繰り返す低遅延音響符号化 | |
TWI479478B (zh) | 用以使用對齊的預看部分將音訊信號解碼的裝置與方法 | |
RU2675216C1 (ru) | Переход от кодирования/декодирования с преобразованием к кодированию/декодированию с предсказанием | |
CN112133315B (zh) | 确定用于编码lpd/fd过渡帧的预算 |