TW201923754A - 時間雜訊成形技術 - Google Patents
時間雜訊成形技術 Download PDFInfo
- Publication number
- TW201923754A TW201923754A TW107139531A TW107139531A TW201923754A TW 201923754 A TW201923754 A TW 201923754A TW 107139531 A TW107139531 A TW 107139531A TW 107139531 A TW107139531 A TW 107139531A TW 201923754 A TW201923754 A TW 201923754A
- Authority
- TW
- Taiwan
- Prior art keywords
- filter
- filtering
- tns
- impulse response
- encoder device
- Prior art date
Links
- 238000007493 shaping process Methods 0.000 title claims abstract description 18
- 230000002123 temporal effect Effects 0.000 title abstract description 7
- 238000001914 filtration Methods 0.000 claims abstract description 152
- 230000004044 response Effects 0.000 claims abstract description 104
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000005259 measurement Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 9
- 230000007423 decrease Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 8
- 238000012886 linear function Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 description 18
- 238000004590 computer program Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Picture Signal Circuits (AREA)
- Error Detection And Correction (AREA)
- Noise Elimination (AREA)
Abstract
存在用於執行時間雜訊成形之所論述方法及設備。一種設備可包含:一時間雜訊成形TNS工具,其用於對包括多個訊框之一資訊信號執行線性預測LP濾波;以及
一控制器,其經組配以控制該TNS工具使得該TNS工具藉由以下各者執行LP濾波:
一第一濾波器,其脈衝響應具有一較高能量;以及
一第二濾波器,其脈衝響應具有低於該第一濾波器之一能量,其中該第二濾波器並非一恆等濾波器,
其中該控制器經組配以基於一訊框量度而在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇。
一控制器,其經組配以控制該TNS工具使得該TNS工具藉由以下各者執行LP濾波:
一第一濾波器,其脈衝響應具有一較高能量;以及
一第二濾波器,其脈衝響應具有低於該第一濾波器之一能量,其中該第二濾波器並非一恆等濾波器,
其中該控制器經組配以基於一訊框量度而在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇。
Description
發明領域
本文中之實例係關於特定地用於執行時間雜訊成形(TNS)之編碼及解碼設備。
本文中之實例係關於特定地用於執行時間雜訊成形(TNS)之編碼及解碼設備。
發明背景
以下先前技術文件屬於先前技術:
[1]Herre、Jürgen及James D. Johnston之「藉由使用時間雜訊成形(TNS)增強感知音訊寫碼器之效能。(Enhancing the performance of perceptual audio coders by using temporal noise shaping (TNS).)」(101音訊工程學會會議,音訊工程學會,1996年)。
以下先前技術文件屬於先前技術:
[1]Herre、Jürgen及James D. Johnston之「藉由使用時間雜訊成形(TNS)增強感知音訊寫碼器之效能。(Enhancing the performance of perceptual audio coders by using temporal noise shaping (TNS).)」(101音訊工程學會會議,音訊工程學會,1996年)。
[2]Herre、Jurgen及James D. Johnston之「用於高品質感知音訊寫碼之連續信號自適應性濾波器組。(Continuously signal-adaptive filterbank for high-quality perceptual audio coding.)」(信號處理對音訊及聲學之應用,1997年,IEEE之1997 IEEE ASSP研討會,1997年)。
[3]Herre、Jürgen之「在感知音訊寫碼中之時間雜訊成形、量化及寫碼方法:教程介紹。(Temporal noise shaping, quantization and coding methods in perceptual audio coding: A tutorial introduction.)」(音訊工程學會會議:第17屆國際會議:高品質音訊寫碼。音訊工程學會,1999年)。
[4]Herre、Juergen Heinrich之「經由頻域中之LPC預測的時域中之感知雜訊成形。(Perceptual noise shaping in the time domain via LPC prediction in the frequency domain.)」(美國專利第5,781,888號,1998年7月14日)。
[5]Herre、Juergen Heinrich之「使用時間包絡成形之增強型聯合立體聲寫碼方法。(Enhanced joint stereo coding method using temporal envelope shaping.)」(美國專利第5,812,971號,1998年9月22日)。
[6]3GPP TS 26.403;通用音訊編解碼器音訊處理功能;增強型aacPlus通用音訊編解碼器;編碼器規格;進階音訊寫碼(AAC)部分。
[7]ISO/IEC 14496-3:2001;資訊技術-音訊寫碼-視覺物件-部分3:音訊。
[8]3GPP TS 26.445;用於增強型語音服務(Enhanced Voice Service,EVS)之編解碼器;詳細演算法描述。
時間雜訊成形(TNS)係在90年代開發的用於基於變換之音訊寫碼器的工具(會議論文[1至3]及專利[4至5])。此後,其已整合於諸如MPEG-2 AAC、MPEG-4 AAC、3GPP E-AAC-Plus、MPEG-D USAC、3GPP EVS、MPEG-H 3D音訊之主要的音訊寫碼標準中。
TNS可簡要地描述如下。在編碼器側且在量化之前,在頻域(FD)中使用線性預測LP對信號進行濾波,以便使信號在時域中平坦。在解碼器側且在反量化之後,在頻域中使用反預測濾波器濾回信號,以便在時域中使量化雜訊成形使得其被信號遮蔽。
TNS有效地減少含有諸如響板之尖銳攻擊的信號上所謂的預回聲假像。其對含有諸如話音的類似脈衝之信號的偽靜止系列亦有幫助。
TNS通常用於以相對較高之位元速率操作的音訊寫碼器中。當用於以低位元速率操作之音訊寫碼器中時,TNS有時可引入假像,從而使音訊寫碼器之品質降級。此等假像類似咔嗒聲或類似雜訊且出現在具有話音信號或音調音樂信號之大多數狀況中。
本發明文件中之實例准許抑制或減少TNS之損害,維持其優點。
以下若干實例准許獲得用於低位元速率音訊寫碼之改良TNS。
發明概要
根據實例,提供一種編碼器設備,其包含:
一時間雜訊成形TNS工具,其用於對包括多個訊框之一資訊信號執行線性預測LP濾波;以及
一控制器,其經組配以控制該TNS工具使得該TNS工具藉由以下各者執行LP濾波:
一第一濾波器,其脈衝響應具有一較高能量;以及
一第二濾波器,其脈衝響應具有低於該第一濾波器之該脈衝響應的一能量,其中該第二濾波器並非一恆等濾波器,
其中該控制器經組配以基於一訊框量度而在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇。
根據實例,提供一種編碼器設備,其包含:
一時間雜訊成形TNS工具,其用於對包括多個訊框之一資訊信號執行線性預測LP濾波;以及
一控制器,其經組配以控制該TNS工具使得該TNS工具藉由以下各者執行LP濾波:
一第一濾波器,其脈衝響應具有一較高能量;以及
一第二濾波器,其脈衝響應具有低於該第一濾波器之該脈衝響應的一能量,其中該第二濾波器並非一恆等濾波器,
其中該控制器經組配以基於一訊框量度而在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇。
已注意到,有可能移除有問題訊框上之假像,同時最少地影響其他訊框。
替代簡單地開啟/關閉TNS操作,有可能維持TNS工具之優點,同時減少其損害。因此,基於反饋之智慧型即時控制因此藉由簡單地在必要時減少濾波而非避免濾波來獲得。
根據實例,該控制器經進一步組配以:
修改該第一濾波器以便獲得該第二濾波器,在該第二濾波器中,該濾波器之脈衝響應能量減小。
修改該第一濾波器以便獲得該第二濾波器,在該第二濾波器中,該濾波器之脈衝響應能量減小。
因此,可在必要時建立具有減小之脈衝響應能量的該第二濾波器。
根據實例,該控制器經進一步組配以:
將至少一個調整因子應用於該第一濾波器以獲得該第二濾波器。
將至少一個調整因子應用於該第一濾波器以獲得該第二濾波器。
藉由智慧地修改該第一濾波器,可產生一濾波狀態,其不可藉由簡單地執行開啟/關閉TNS之操作來實現。獲得完全濾波與不濾波之間的至少一個中間狀態。若在必要時叫用此中間狀態,則其准許減少TNS之缺點,維持其正特性。
根據實例,該控制器經進一步組配以:
至少基於該訊框量度而定義該至少一個調整因子。
至少基於該訊框量度而定義該至少一個調整因子。
根據實例,該控制器經進一步組配以:
基於一TNS濾波判定臨限值而定義該至少一個調整因子,該TNS濾波判定臨限值用於在執行TNS濾波與不執行TNS濾波之間作出選擇。
基於一TNS濾波判定臨限值而定義該至少一個調整因子,該TNS濾波判定臨限值用於在執行TNS濾波與不執行TNS濾波之間作出選擇。
根據實例,該控制器經進一步組配以:
使用該訊框量度之一線性函數而定義該至少一個調整因子,該線性函數使得該訊框量度之一增加對應於該調整因子及/或該濾波器之脈衝響應能量的一增加。
使用該訊框量度之一線性函數而定義該至少一個調整因子,該線性函數使得該訊框量度之一增加對應於該調整因子及/或該濾波器之脈衝響應能量的一增加。
因此,有可能針對不同量度而定義不同的調整因子以獲得最適合於各訊框之濾波器參數。
根據實例,該控制器經進一步組配以將該調整因子定義為
其中係該TNS濾波判定臨限值,係該濾波類型判定臨限值,係一訊框量度且係一固定值。
其中係該TNS濾波判定臨限值,係該濾波類型判定臨限值,係一訊框量度且係一固定值。
由該TNS引起的假像出現在訊框中,其中預測增益在特定區間中,該特定區間在此處定義為高於該TNS濾波判定臨限值但小於該濾波判定臨限值之值的集合。在量度係預測增益之狀況下,且,由TNS引起之假像傾向於在1.5與2之間發生。因此,若干實例准許藉由針對減少濾波來克服此等損害。
根據實例,該控制器經進一步組配以藉由應用下式來修改該第一濾波器之參數以獲得該第二濾波器之參數:
其中係該第一濾波器之參數,係該調整因子使得,係該第二濾波器之參數且K係該第一濾波器之階數。
其中係該第一濾波器之參數,係該調整因子使得,係該第二濾波器之參數且K係該第一濾波器之階數。
此係容易的但係用於獲得該第二濾波器之參數使得脈衝響應能量相對於該第一濾波器之脈衝響應能量而減小的有效技術。
根據實例,該控制器經進一步組配以自一預測增益、該資訊信號之一能量及/或一預測誤差中之至少一者獲得該訊框量度。
此等量度准許容易且可靠地區別需要藉由該第二濾波器進行濾波之訊框與需要藉由該第一濾波器進行濾波之訊框。
根據實例,該訊框量度包含一預測增益,該預測增益計算為
其中係與該資訊信號之一能量相關聯的一項,且係與一預測誤差相關聯之一項。
其中係與該資訊信號之一能量相關聯的一項,且係與一預測誤差相關聯之一項。
根據實例,該控制器經組配以使得:
至少對於一預測增益之一減小及/或該資訊信號之一能量的一減小,該第二濾波器之脈衝響應能量減小,及/或至少對於該預測誤差之一增加,該第二濾波器之脈衝響應能量減小。
至少對於一預測增益之一減小及/或該資訊信號之一能量的一減小,該第二濾波器之脈衝響應能量減小,及/或至少對於該預測誤差之一增加,該第二濾波器之脈衝響應能量減小。
根據實例,該控制器經組配以:
比較該訊框量度與一濾波類型判定臨限值(例如,thresh2),以便在該訊框量度小於該濾波類型判定臨限值時藉由該第一濾波器執行一濾波。
比較該訊框量度與一濾波類型判定臨限值(例如,thresh2),以便在該訊框量度小於該濾波類型判定臨限值時藉由該第一濾波器執行一濾波。
因此,易於自動地確定使用該第一濾波器抑或使用該第二濾波器對該信號進行濾波。
根據實例,該控制器經組配以:
基於該訊框量度而在執行一濾波與不執行濾波之間作出選擇。
基於該訊框量度而在執行一濾波與不執行濾波之間作出選擇。
因此,亦有可能在不適當時完全避免TNS濾波。
在實例中,相同量度可使用兩次(藉由執行與兩個不同臨限值之比較):用於在該第一濾波器與該第二濾波器之間作出決策及用於決定是否進行濾波兩者。
根據實例,該控制器經組配以:
比較該訊框量度與一TNS濾波判定臨限值,以便在該訊框量度小於該TNS濾波判定臨限值時選擇避免TNS濾波。
比較該訊框量度與一TNS濾波判定臨限值,以便在該訊框量度小於該TNS濾波判定臨限值時選擇避免TNS濾波。
根據實例,該設備可進一步包含:
一位元串流編寫器,其準備具有藉由該TNS獲得之反射係數或其一經量化版本的一位元串流。
一位元串流編寫器,其準備具有藉由該TNS獲得之反射係數或其一經量化版本的一位元串流。
可儲存此等資料及/或將其傳輸至例如一解碼器。
根據實例,提供一種系統,其包含一編碼器側及一解碼器側,其中該編碼器側包含如上文及/或下文的一編碼器設備。
根據實例,提供一種用於對包括多個訊框之一資訊信號執行時間雜訊成形TNS濾波的方法,該方法包含:
- 對於各訊框,基於一訊框量度而在藉由脈衝響應具有一較高能量之一第一濾波器進行濾波與藉由脈衝響應具有低於該第一濾波器之該脈衝響應之該能量的一能量的一第二濾波器進行濾波之間作出選擇,其中該第二濾波器並非一恆等濾波器;
- 使用根據該第一濾波器與該第二濾波器之間的該選擇的濾波對該訊框進行濾波。
- 對於各訊框,基於一訊框量度而在藉由脈衝響應具有一較高能量之一第一濾波器進行濾波與藉由脈衝響應具有低於該第一濾波器之該脈衝響應之該能量的一能量的一第二濾波器進行濾波之間作出選擇,其中該第二濾波器並非一恆等濾波器;
- 使用根據該第一濾波器與該第二濾波器之間的該選擇的濾波對該訊框進行濾波。
根據實例,提供一種非暫時性儲存裝置,其儲存指令,該等指令在由一處理器執行時使該處理器執行上文及/或下文之方法的步驟中之至少一些及/或實施如上文或下文之系統及/或如上文及/或下文之設備。
較佳實施例之詳細說明
圖1展示編碼器設備10。編碼器設備10可用於處理(及傳輸及/或儲存)資訊信號,諸如音訊信號。資訊信號可分成一系列時間訊框。各訊框可例如在頻域FD中表示。FD表示可係各自在特定頻率下之一系列頻格。FD表示可係頻譜。
圖1展示編碼器設備10。編碼器設備10可用於處理(及傳輸及/或儲存)資訊信號,諸如音訊信號。資訊信號可分成一系列時間訊框。各訊框可例如在頻域FD中表示。FD表示可係各自在特定頻率下之一系列頻格。FD表示可係頻譜。
編碼器設備10尤其可包含用於對FD資訊信號13 (Xs
(n))執行TNS濾波之時間雜訊成形TNS工具11。編碼器設備10尤其可包含TNS控制器12。TNS控制器12可經組配以控制TNS工具11,使得TNS工具11使用至少一個較高脈衝響應能量線性預測(LP)濾波(例如,對於一些訊框)及使用至少一個較高脈衝響應能量LP濾波(例如,對於一些其他訊框)執行濾波。TNS控制器12經組配以基於與訊框相關聯之量度(訊框量度)執行較高脈衝響應能量LP濾波與較低脈衝響應能量LP濾波之間的選擇。第一濾波器之脈衝響應的能量高於第二濾波器之脈衝響應的能量。
FD資訊信號13 (Xs
(n))可例如獲自經修改之離散餘弦變換MDCT工具(或例如,經修改之離散正弦變換MDST),該工具已將訊框之表示自時域TD變換至頻域FD。
TNS工具11可例如使用一組線性預測(LP)濾波器參數14 (a(k))來處理信號,該等參數可能係第一濾波器14a之參數。TNS工具11亦可包含參數14' (aw
(k)),該等參數可能係第二濾波器15a (第二濾波器15a可具有相較於第一濾波器14a之脈衝響應具有較低能量的脈衝響應)之參數。參數14'可理解為參數14之經加權版本,且第二濾波器15a可理解為源自第一濾波器14a。參數尤其可包含以下參數(或其經量化版本)中之一或多者:LP寫碼LPC係數、反射係數RC、係數rci
(k)或其經量化版本rcq
(k)、反正弦反射係數ASRC、對數面積比LAR、線譜對LSP及/或線譜頻率LS或其他種類之此種參數。在實例中,有可能使用濾波器係數之任何表示。
TNS工具11之輸出可係FD資訊信號13 (Xs
(n))之經濾波版本15 (Xf
(n))。
TNS工具11之另一輸出可係一組輸出參數16,諸如反射係數rci
(k) (或其經量化版本rcq
(k))。
在組件11及12下游,位元串流寫碼器可將輸出15及16編碼至可傳輸(例如,以無線方式,例如使用諸如藍芽之協定)及/或儲存(例如,在大容量記憶體儲存單元中)之位元串流中。
TNS濾波提供通常不同於零之反射係數。TNS濾波提供通常不同於輸入之輸出。
圖2輸出可使用TNS工具11之輸出(或其經處理版本)的解碼器設備20。解碼器設備20尤其可包含TNS解碼器21及TNS解碼器控制器22。組件21及22可協作以獲得合成輸出23)。舉例而言,TNS解碼器21可輸入有如由解碼器設備20獲得的資訊信號之經解碼表示25 (例如,其經處理版本)。TNS解碼器21可在輸入(如輸入26)中獲得反射係數rci
(k) (或其經量化版本rcq
(k))。反射係數rci
(k)或rcq
(k)可係由編碼器設備10在輸出16處提供之反射係數rci
(k)或rcq
(k)的經解碼版本。
如圖1中所展示,TNS控制器12尤其可基於訊框量度17 (例如,預測增益或predGain)而控制TNS工具11。舉例而言,TNS控制器12可藉由在至少較高脈衝響應能量LP濾波及/或較低脈衝響應能量LP濾波之間及/或在濾波與不濾波之間作出選擇來執行濾波。除較高脈衝響應能量LP濾波及較低脈衝響應能量LP濾波以外,根據實例,至少一個中間脈衝響應能量LP濾波係可能的。
圖1中之參考數字17'係指自TNS控制器12提供至TNS工具14之資訊、命令及/或控制資料。舉例而言,可將基於量度17之決策(例如,「使用第一濾波器」或「使用第二濾波器」)提供至TNS工具14。亦可將關於濾波器之設定提供至TNS工具14。舉例而言,可將調整因子()提供至TNS濾波器以便修改第一濾波器14a來獲得第二濾波器15a。
量度17可係例如與訊框中之信號之能量相關聯的量度(例如,該量度可使得能量愈高,量度愈高)。該量度可係例如與預測誤差相關聯之量度(例如,該量度可使得預測誤差愈高,量度愈低)。該量度可係例如與預測誤差與信號能量之間的關係相關聯的值(例如,該量度可使得能量與預測誤差之間的比愈高,量度愈高)。該量度可係例如當前訊框之預測增益或與當前訊框之預測增益相關聯或成比例的值(諸如,預測增益愈高,量度愈高)。訊框量度(17)可與信號之時間包絡的平坦度相關聯。
已注意到,僅(或至少主要)在預測增益低時出現歸因於TNS之假像。因此,當預測增益高時,由TNS引起之問題不會出現(不太可能出現)且有可能執行完全TNS (例如,較高脈衝響應能量LP)。當預測增益極低時,可能較佳的係完全不執行TNS (不濾波)。當預測增益係中等的時,可能較佳的係藉由使用較低脈衝響應能量線性預測濾波(例如,藉由對LP係數或其他濾波係數及/或反射係數加權及/或使用脈衝響應具有較低能量之濾波器)來減小TNS之影響。較高脈衝響應能量LP濾波與較低脈衝響應能量LP濾波彼此不同之處在於,較高脈衝響應能量LP濾波定義為產生高於較低脈衝響應能量LP濾波之脈衝響應能量。濾波器之特徵一般在於脈衝響應能量,且因此有可能用濾波器之脈衝響應能量來識別濾波器。較高脈衝響應能量LP濾波意謂使用脈衝響應具有高於在較低脈衝響應能量LP濾波中使用之濾波器之能量的濾波器。
因此,根據當前實例,可藉由以下步驟計算TNS操作:
- 當量度(例如,預測增益)高(例如,超過濾波類型判定臨限值)時,執行高脈衝響應能量LP濾波;
- 當量度(例如,預測增益)中等(例如,在TNS濾波判定臨限值與濾波類型判定臨限值之間)時,執行低脈衝響應能量LP濾波;以及
- 當量度(例如,預測增益)低(例如,低於TNS濾波判定臨限值)時,不執行TNS濾波。
- 當量度(例如,預測增益)高(例如,超過濾波類型判定臨限值)時,執行高脈衝響應能量LP濾波;
- 當量度(例如,預測增益)中等(例如,在TNS濾波判定臨限值與濾波類型判定臨限值之間)時,執行低脈衝響應能量LP濾波;以及
- 當量度(例如,預測增益)低(例如,低於TNS濾波判定臨限值)時,不執行TNS濾波。
可例如使用具有高脈衝響應能量之第一濾波器來獲得高脈衝響應能量LP濾波。可例如使用具有較低脈衝響應能量之第二濾波器來獲得低脈衝響應能量LP濾波。第一及第二濾波器可係線性非時變(LTI)濾波器。
在實例中,可使用濾波器參數a(k) (14)描述第一濾波器。在實例中,第二濾波器可係第一濾波器之修改版本(例如,如由TNS控制器12獲得)。藉由按比例減小第一濾波器之濾波器參數(例如,使用參數使或使得,其中k係自然數使得,係第一濾波器之階數),可獲得第二濾波器(較低脈衝響應能量濾波器)。
因此,在實例中,當獲得濾波器參數時且基於量度,判定較低脈衝響應能量濾波係必要的,可修改(例如,按比例縮小)第一濾波器之濾波器參數以獲得待用於較低脈衝選擇能量濾波器之第二濾波器的濾波器參數。
圖3展示可在編碼器設備10處實施之方法30。
在步驟S31處,獲得訊框量度(例如,預測增益17)。
在步驟S32處,檢查訊框量度17是否高於TNS濾波判定臨限值或第一臨限值(在一些實例中,其可係1.5)。量度之實例可係預測增益。
若在S32處驗證到訊框量度17小於第一臨限值(thresh),則在S33處不執行濾波操作(可認為使用恆等濾波器,恆等濾波器係輸出與輸入相同之濾波器)。舉例而言,Xf
(n)= Xs
(n) (TNS工具11之輸出15與輸入13相同),及/或反射係數rci
(k) (及/或其經量化版本rc0
(k))亦設定為0。因此,解碼器設備20之操作(及輸出)將不受TNS工具11影響。因此,在S33處,可能既不使用第一濾波器亦不使用第二濾波器。
若在S32處驗證到訊框量度17大於TNS濾波判定臨限值或第一臨限值(thresh),則可在步驟S34處藉由比較訊框量度與濾波類型判定臨限值或第二臨限值(thresh2,其可大於第一臨限值且係例如2)來執行第二檢查。
若在S34處驗證到訊框量度17小於濾波類型判定臨限值或第二臨限值(thresh2),則在S35處執行較低脈衝響應能量LP濾波(例如,使用具有較低脈衝響應能量之第二濾波器,該第二濾波器並非恆定濾波器)。
若在S34處驗證到訊框量度17大於濾波類型判定臨限值或第二臨限值(thresh2),則在S36處執行較高脈衝響應能量LP濾波(例如,使用響應能量高於較低能量濾波器之第一濾波器)。
可針對後續訊框重複方法30。
在實例中,較低脈衝響應能量LP濾波(S35)可能與較高脈衝響應能量LP濾波(S36)的不同之處在於,可例如用不同值對濾波器參數14 (a(k))加權(例如,較高脈衝響應能量LP濾波可基於單位權重(unitary weight)且較低脈衝響應能量LP濾波可基於小於1之權重)。在實例中,較低脈衝響應能量LP濾波可能與較高脈衝響應能量LP濾波的不同之處在於,藉由執行較低脈衝響應能量LP濾波獲得之反射係數16可引起高於由藉由執行較高脈衝響應能量LP濾波獲得之反射係數所引起之減小的脈衝響應能量減小。
因此,當在步驟S36處執行較高脈衝響應能量濾波時,基於濾波器參數14 (a(k))而使用第一濾波器(該等參數因此係第一濾波器參數)。當在步驟S35處執行較低脈衝響應能量濾波時,使用第二濾波器。可藉由修改第一濾波器之參數(例如,藉由用小於1之權重加權)來獲得第二濾波器。
在其他實例中,步驟S31至S32至S34之順序可能不同:例如,S34可在S32之前。在一些實例中,步驟S32及/或S34中之一者可能係可選的。
在實例中,第一及/或第二臨限值中之至少一者可固定(例如,儲存於記憶體元件中)。
在實例中,可藉由減小濾波器之脈衝響應來獲得較低脈衝響應濾波,該減小係藉由調整LP濾波器參數(例如,LPC係數或其他濾波參數)及/或反射係數或用以獲得反射係數之中間值而實現。舉例而言,可將小於1之係數(權重)應用於LP濾波器參數(例如,LPC係數或其他濾波參數)及/或反射係數或用以獲得反射係數之中間值。
在實例中,調整(及/或脈衝響應能量之減小)可係(或依據)
其中係濾波類型判定臨限值(或可係例如2),係TNS濾波判定臨限值(且可係1.5),係常數(例如,在0.7與0.95之間,諸如在0.8與0.9之間的值,諸如0.85)。值可用以按比例調整LPC係數(或其他濾波參數)及/或反射係數。frameMetrics係訊框量度。
其中係濾波類型判定臨限值(或可係例如2),係TNS濾波判定臨限值(且可係1.5),係常數(例如,在0.7與0.95之間,諸如在0.8與0.9之間的值,諸如0.85)。值可用以按比例調整LPC係數(或其他濾波參數)及/或反射係數。frameMetrics係訊框量度。
在一個實例中,公式可係
其中係濾波類型判定臨限值(或可係例如2),係TNS濾波判定臨限值(且可係1.5),係常數(例如,在0.7與0.95之間,諸如在0.8與0.9之間的值,諸如0.85)。值可用以按比例調整LPC係數(或其他濾波參數)及/或反射係數。舉例而言,predGain可係預測增益。
其中係濾波類型判定臨限值(或可係例如2),係TNS濾波判定臨限值(且可係1.5),係常數(例如,在0.7與0.95之間,諸如在0.8與0.9之間的值,諸如0.85)。值可用以按比例調整LPC係數(或其他濾波參數)及/或反射係數。舉例而言,predGain可係預測增益。
自公式可見,frameMetrics (或)小於但接近其(例如,1.999)將引起脈衝響應能量之減小變弱(例如,)。因此,較低脈衝響應能量LP濾波可係多個不同的較低脈衝響應能量LP濾波中之一者,其各自之特徵在於不同的調整參數,例如根據訊框量度之值。
在較低脈衝響應能量LP濾波之實例中,量度之不同值可引起不同調整。舉例而言,較高預測增益可與較高較高值及相對於拳頭濾波器之較小脈衝響應能量減小相關聯。可被視為依賴於之線性函數。之增加將引起之增加,此又將縮減脈衝響應能量之減小。若減小,則亦減小,且脈衝響應能量亦將相應地減小。
因此,可用不同方式對同一信號之後續訊框進行濾波:
- 可使用第一濾波器(較高脈衝響應能量濾波)對一些訊框進行濾波,其中保持濾波器參數(14);
- 可使用第二濾波器(較低脈衝響應能量濾波)對一些其他訊框進行濾波,其中修改第一濾波器以獲得具有較低脈衝響應能量之第二濾波器(例如,修改濾波器參數14),從而相對於第一濾波器減小脈衝響應能量;
- 亦可使用第二濾波器(較低脈衝響應能量濾波)對一些其他訊框進行濾波,但使用不同調整(由於訊框量度之不同值)。
- 可使用第一濾波器(較高脈衝響應能量濾波)對一些訊框進行濾波,其中保持濾波器參數(14);
- 可使用第二濾波器(較低脈衝響應能量濾波)對一些其他訊框進行濾波,其中修改第一濾波器以獲得具有較低脈衝響應能量之第二濾波器(例如,修改濾波器參數14),從而相對於第一濾波器減小脈衝響應能量;
- 亦可使用第二濾波器(較低脈衝響應能量濾波)對一些其他訊框進行濾波,但使用不同調整(由於訊框量度之不同值)。
因此,對於各訊框,可定義特定的第一濾波器(例如,基於濾波器參數),而可藉由修改第一濾波器之濾波器參數來開發第二濾波器。
圖3A展示控制器12及TNS區塊11協作以執行TNS濾波操作之實例。
可獲得訊框量度(例如,預測增益) 17且將其與TNS濾波判定臨限值18a進行比較(例如,在比較器10a處)。若訊框量度17大於TNS濾波判定臨限值18a (thresh),則准許(例如,藉由選擇器11a)比較訊框量度17與濾波類型判定臨限值18b (例如,在比較器12a處)。若訊框量度17大於濾波類型判定臨限值18b,則啟動脈衝響應具有較高能量(例如,)之第一濾波器14a。若訊框量度17小於濾波類型判定臨限值18b,則啟動脈衝響應具有較低能量(例如,)之第二濾波器15a (元件12b指示由比較器12a輸出之二進位值的非)。脈衝響應具有較高能量之第一濾波器14a可執行具有較高脈衝響應能量之濾波S36,且脈衝響應具有較低能量之第二濾波器15a可執行具有較低脈衝響應能量之濾波S35。
圖3B及圖3C展示用於分別使用第一濾波器14a及第二濾波器15a之方法36及35(例如,分別用於步驟S36及S35)。
方法36可包含獲得濾波器參數14之步驟S36a。方法36可包含使用第一濾波器14a之參數執行濾波(例如,S36)的步驟S36b。步驟S35b可僅在判定(例如,在步驟S34處)訊框量度超過濾波類型判定臨限值時執行(例如,在步驟S35處)。
方法35可包含獲得第一濾波器14a之濾波器參數14的步驟S35a。方法35可包含定義調整因子(例如,藉由使用臨限值thresh及thresh2中之至少一者以及訊框量度)的步驟S35b。方法35可包含修改第一濾波器14a以獲得相對於第一濾波器14a具有較低脈衝響應能量之第二濾波器15a的步驟35c。特定而言,可藉由將調整因子(例如,如在S35b處獲得)應用於第一濾波器14a之參數14以獲得第二濾波器之參數來修改第一濾波器14a。方法35可包含執行藉由第二濾波器進行之濾波(例如,在方法30之S35處)的步驟S35d。可在判定(例如,在步驟S34處)訊框量度小於濾波類型判定臨限值時執行步驟S35a、S35b及S35c (例如,在步驟S35處)。
圖4展示可形成單個方法40之方法40' (編碼器側)及方法40'' (解碼器側)。方法40'及40''可具有的一些聯繫在於,根據方法40'操作之解碼器可將位元串流(例如,以無線方式,例如使用藍芽)傳輸至根據方法40''操作之解碼器。
下文論述方法40之步驟(指示為序列a)-b)-c)-d)-1)-2)-3)-e-f)及藉由序列S41'至S49'指示)。
a ) 步驟 S41 '
:可例如處理MDCT (或MDST)頻譜(FD值)之自相關,
其中係LP濾波器階數(例如,)。此處,可係輸入至TNS工具11之FD值。舉例而言,可指與具有索引之頻率相關聯的頻格。
其中係LP濾波器階數(例如,)。此處,可係輸入至TNS工具11之FD值。舉例而言,可指與具有索引之頻率相關聯的頻格。
b) 步驟 S42 '
:可對自相關加滯後窗:
加滯後窗(lag windowing)函數之實例可係例如:
其中係窗參數(例如,)。
加滯後窗(lag windowing)函數之實例可係例如:
其中係窗參數(例如,)。
c) 步驟 S43 ' :
可使用例如萊文森-德賓(Levinson-Durbin)遞迴程序估計LP濾波器係數,諸如:
其中係估計之LPC係數(或其他濾波參數),係對應反射係數且係預測誤差。
其中係估計之LPC係數(或其他濾波參數),係對應反射係數且係預測誤差。
d) 步驟 S44 ' :
在當前訊框中開啟/關閉TNS濾波的決策(步驟S44'或S32)可基於例如訊框量度,諸如預測增益:
若,則開啟TNS濾波
其中預測增益藉由下式計算
且係臨限值(例如,)。
1)步驟 S45 ' : 加權因子可藉由下式獲得(例如,在步驟S45'處)
其中係第二臨限值(例如,)且係最小加權因子(例如,)。可係例如濾波類型判定臨限值。
當時,使用第一濾波器14a。當時,使用第二濾波器15a (例如,在步驟S35b處)。
2)步驟 S46 ' : 可使用因子對LPC係數(或其他濾波參數)加權(例如,在步驟S46'處):
係取冪(例如, ) 。
3)步驟 S47 ' : 可使用例如以下程序將經加權之LPC係數(或其他濾波參數)轉換成反射係數(步驟S47'):
若,則開啟TNS濾波
其中預測增益藉由下式計算
且係臨限值(例如,)。
1)步驟 S45 ' : 加權因子可藉由下式獲得(例如,在步驟S45'處)
其中係第二臨限值(例如,)且係最小加權因子(例如,)。可係例如濾波類型判定臨限值。
當時,使用第一濾波器14a。當時,使用第二濾波器15a (例如,在步驟S35b處)。
2)步驟 S46 ' : 可使用因子對LPC係數(或其他濾波參數)加權(例如,在步驟S46'處):
係取冪(例如, ) 。
3)步驟 S47 ' : 可使用例如以下程序將經加權之LPC係數(或其他濾波參數)轉換成反射係數(步驟S47'):
e) 步驟 S48 ' :
若開啟TNS (例如,由於在S32處之判定),則可使用例如純量均勻量化在反正弦域中量化反射係數(步驟S48'):
其中係單位寬度(例如,)且係捨位至最近整數函數。
係接著使用例如算術編碼來編碼的量化器輸出指數。
係經量化之反射係數。
其中係單位寬度(例如,)且係捨位至最近整數函數。
係接著使用例如算術編碼來編碼的量化器輸出指數。
係經量化之反射係數。
f) 步驟 S49 ' :
若TNS開啟,則使用經量化之反射係數及格型濾波器結構對MDCT (或MDST)頻譜進行濾波(步驟S49')
可將位元串流傳輸至解碼器。連同資訊信號(例如,音訊信號)之FD表示,位元串流亦可包含控制資料,諸如藉由執行上文所描述之TNS操作(TNS分析)獲得的反射係數。
方法40'' (解碼器側)可包含步驟g) (S41'')及h) (S42''),其中若TNS開啟,則解碼經量化之反射係數且濾回經量化之MDCT (或MDST)頻譜。可使用以下程序:
編碼器設備50 (其可體現編碼器設備10及/或執行方法30及40'之操作中之至少一些)的實例展示於圖5中。
編碼器設備50可包含用於編碼輸入信號(其可係例如音訊信號)之多個工具。舉例而言,MDCT工具51可將資訊信號之TD表示變換成FD表示。頻譜雜訊成形器SNS工具52可執行例如雜訊成形分析(例如,頻譜雜訊成形SNS分析)且擷取LPC係數或其他濾波參數(例如,a(k) 14)。TNS工具11可如上所述且可由控制器12控制。TNS工具11可執行濾波操作(例如,根據方法30或40')且輸出資訊信號之經濾波版本及反射係數之版本兩者。量化器工具53可執行由TNS工具11輸出之資料的量化。算術寫碼器54可提供例如熵寫碼。雜訊位準工具55'亦可用於估計信號之雜訊位準。位元串流編寫器55可產生與輸入信號相關聯的可經傳輸(例如,無線,例如使用藍芽)及/或儲存的位元串流。
亦可使用頻寬偵測器58' (其可偵測輸入信號之頻寬)。其可提供關於信號之作用頻譜的資訊。在一些實例中,此資訊亦可用以控制寫碼工具。
編碼器設備50亦可包含長期後濾波工具57,其可輸入有輸入信號之TD表示,例如此後,TD表示已藉由減少取樣器工具56減少取樣。
解碼器設備60 (其可體現解碼器設備20及/或執行方法40''之操作中之至少一些)的實例展示於圖6中。
解碼器設備60可包含讀取位元串流(例如,如由設備50準備)之讀取器61。解碼器設備60可包含算術殘餘解碼器61a,其可利用FD中之例如由解碼器提供的數位表示(經恢復頻譜)執行例如熵解碼、殘餘解碼及/或算術解碼。舉例而言,解碼器設備60可包含雜訊提出工具62及全域增益工具63。解碼器設備60可包含TNS解碼器21及TNS解碼器控制器22。舉例而言,設備60可包含SNS解碼器工具65。解碼器設備60可包含反MDCT (或MDST)工具65'以將資訊信號之數位表示自FD變換至TD。長期後濾波可藉由LTPF工具66在TD中執行。可自頻寬偵測器58'獲得頻寬資訊68,例如應用於一些工具(例如,62及21)之調整。
此處提供以上設備之操作之實例。
時間雜訊成形(TNS)可由工具11使用以控制各變換窗內之量化雜訊的時間形狀。
在實例中,若TNS在當前圖框中處於作用中,則可每MDCT頻譜(或MDST頻譜或其他頻譜或其他FD表示)應用多達兩個濾波器。有可能應用多個濾波器及/或在特定頻率範圍上執行TNS濾波。在一些實例中,此僅係可選的。
在下表中給出用於各組態之濾波器數目以及各濾波器之開始及終止頻率:
可例如自頻寬偵測器58'發信諸如開始及終止頻率之資訊。
其中NB係窄頻帶,WB係寬頻帶,SSWB係半超寬頻帶,SWB係超寬頻帶且FB係全寬頻帶。
下文描述TNS編碼步驟。首先,分析可估計用於各TNS濾波器之反射係數的集合。接著,可量化此等反射係數。且最後,可使用經量化之反射係數對MDCT頻譜(或MDST頻譜或其他頻譜或其他FD表示)進行濾波。
針對每個TNS濾波器重複下文所描述之完整TNS分析,其中(num_tns_filters由上表提供)。
對於各,可如下計算經正規化之自相關函數(例如,在步驟S41'處)
其中
且
其中上表中給出及。
可使用例如下式對經正規化之自相關函數加滯後窗(例如,在S42'處):
其中
且
其中上表中給出及。
可使用例如下式對經正規化之自相關函數加滯後窗(例如,在S42'處):
上文所描述之萊文森-德賓遞迴可用以(例如,在步驟S43'處)獲得LPC係數或其他濾波參數及/或預測誤差。
在當前訊框中開啟/關閉TNS濾波器之決策係基於預測增益:
若,則開啟TNS濾波器
其中例如且預測增益例如獲得為
若,則開啟TNS濾波器
其中例如且預測增益例如獲得為
僅在開啟TNS濾波器之情況下(例如,在步驟S32已導致「是」之情況下)執行下文所描述之額外步驟。
加權因子藉由下式計算
其中,且
可使用因子對LPC係數或其他濾波參數加權(例如,在步驟S46'處)
可使用例如以下演算法將經加權之LPC係數或其他濾波參數轉換(例如,在步驟S47'處)成反射係數:
其中係用於TNS濾波器之最終估計反射係數。
其中,且
可使用因子對LPC係數或其他濾波參數加權(例如,在步驟S46'處)
可使用例如以下演算法將經加權之LPC係數或其他濾波參數轉換(例如,在步驟S47'處)成反射係數:
其中係用於TNS濾波器之最終估計反射係數。
若關閉TNS濾波器(例如,在步驟S32之檢查時的結果「否」),則反射係數可簡單地設定為0:.
現論述量化處理程序,例如,如在步驟S48'處執行。
對於各TNS濾波器,可例如使用純量均勻量化在反正弦域中量化所獲得之反射係數
且
其中且係例如捨位至最近整數函數。
可係量化器輸出指數且可係經量化之反射係數。
且
其中且係例如捨位至最近整數函數。
可係量化器輸出指數且可係經量化之反射係數。
可使用以下方法計算經量化之反射係數的階數
當且時,進行
當且時,進行
可接著如下計算當前訊框中由TNS消耗之位元數目
其中
且
其中
且
可在表中提供及之值。
可使用以下程序對MDCT (或MDST)頻譜(圖1中之輸入15)進行濾波:
其中係經TNS濾波之MDCT (或MDST)頻譜 (圖1中之輸入15)。
其中係經TNS濾波之MDCT (或MDST)頻譜 (圖1中之輸入15)。
參考在解碼器(例如,20、60)處執行之操作,可針對各TNS濾波器使用下式獲得經量化之反射係數
其中係量化器輸出指數。
其中係量化器輸出指數。
可接著使用以下演算法對如提供至TNS解碼器21之MDCT (或MDST)頻譜(例如,如自全域增益工具63獲得)進行濾波
其中係TNS解碼器之輸出。
6.關於本發明之論述
其中係TNS解碼器之輸出。
6.關於本發明之論述
如上文所解釋,TNS可有時引入假像,使音訊寫碼器之品質降級。此等假像類似咔嗒聲或類似雜訊且出現在具有話音信號或音調音樂信號之大多數狀況中。
觀察到,由TNS產生之假像僅在預測增益predGain低且接近臨限值thresh之訊框中出現。
吾人可想到增加臨限值將易於解決問題。但對於大多數訊框,甚至在預測增益低時仍開啟TNS實際上係有益的。
吾人提出之解決方案係在預測增益低時保持同一臨限值但調整TNS濾波器,以便減小脈衝響應能量。
存在實施此調整(其在一些狀況可被稱作「衰減」),例如在藉由減小例如LP濾波器參數來獲得脈衝響應能量之減小時)之許多方式。吾人可選擇使用加權,其可係例如加權
其中係在編碼器步驟c)中計算出之LP濾波器參數(例如,LPC係數),且係經加權之LP濾波器參數。取決於預測增益而產生調整(加權)因子使得針對較低預測增益而應用脈衝響應能量之較高減小()且使得針對較高預測增益,例如不存在脈衝響應能量之減小()。
其中係在編碼器步驟c)中計算出之LP濾波器參數(例如,LPC係數),且係經加權之LP濾波器參數。取決於預測增益而產生調整(加權)因子使得針對較低預測增益而應用脈衝響應能量之較高減小()且使得針對較高預測增益,例如不存在脈衝響應能量之減小()。
所提出之解決方案經證實在移除有問題訊框上之所有假像同時最少地影響其他訊框上極其有效。
現參看圖8(1)至圖8(3)。該等圖展示音訊信號之訊框(連續線)及對應TNS預測濾波器之頻率響應(虛線)。
圖8(1):響板信號(castanets signal)
圖8(2):調音管信號
圖8(3):話音信號
圖8(1):響板信號(castanets signal)
圖8(2):調音管信號
圖8(3):話音信號
預測增益與信號之時間包絡的平坦度有關(參見例如參考文獻[2]之章節3或參考文獻[3]之章節1.2)。
低預測增益暗示傾向平坦之時間包絡,而高預測增益暗示極不平坦之時間包絡。
圖8(1)展示極低預測增益(predGain=1.0)之狀況。其對應於非常靜止之音訊信號的狀況,具有平坦時間包絡。在此狀況下,predGain=1<thresh (例如,thresh=1.5):不執行濾波(S33)。
圖8(2)展示極高預測增益(12.3)之狀況。其對應於強烈且尖銳攻擊之狀況,具有高度不平坦之時間包絡。在此狀況下,predGain=12.3>thresh2 (threh2=2):在S36處執行較高脈衝響應能量濾波。
圖8(3)展示在thresh與thresh2之間的預測增益的狀況,例如在1.5至2.0之範圍中(高於第一臨限值,小於第二臨限值)。其對應於略微不平坦之時間包絡的狀況。在此狀況下,thresh<predGain<thresh2:使用具有較低脈衝響應能量之第二濾波器15a在S35處執行較低脈衝響應能量濾波。
7.其他實例
7.其他實例
圖7展示設備110,其可實施編碼設備10或50及/或執行方法30及/或40'之至少一些步驟。設備110可包含處理器111及儲存指令之非暫時性記憶體單元112,該等指令在由處理器111執行時可使處理器111執行TNS濾波及/或分析。設備110可包含輸入單元116,其可獲得輸入資訊信號(例如,音訊信號)。處理器111可因此執行TNS處理程序。
圖8展示可實施解碼器設備20或60及/或執行方法40'之設備120。設備120可包含處理器121及儲存指令之非暫時性記憶體單元122,該等指令在由處理器121執行時可使處理器121尤其執行TNS合成操作。設備120可包含輸入單元126,其可獲得在FD中之資訊信號(例如,音訊信號)的經解碼表示。處理器121可因此執行處理程序以獲得例如在TD中之資訊信號的經解碼表示。可使用輸出單元127將此經解碼表示提供至外部單元。舉例而言,輸出單元127可包含通訊單元以與外部裝置(例如,使用無線通訊,諸如藍芽)及/或外部儲存空間通訊。處理器121可將音訊信號之經解碼表示保存在本端儲存空間128中。
在實例中,系統110與120可為相同裝置。
取決於某些實施要求,實例可以硬體實施。可使用數位儲存媒體執行該實施,例如軟碟、數位多功能光碟(DVD)、藍光光碟、緊密光碟(CD)、唯讀記憶體(ROM)、可規劃唯讀記憶體(PROM)、可抹除及可規劃唯讀記憶體(EPROM)、電可抹除可規劃唯讀記憶體(EEPROM)或快閃記憶體,其上儲存有電子可讀控制信號,其與可規劃電腦系統協作(或能夠協作)使得執行各別方法。因此,數位儲存媒體可為電腦可讀的。
一般而言,實例可實施為具有程式指令之電腦程式產品,當電腦程式產品運行於電腦上時,程式指令操作性地用於執行該等方法中之一者。程式指令可例如儲存於機器可讀媒體上。
其他實例包含用於執行本文中所描述之方法中之一者、儲存於機器可讀載體上的電腦程式。換言之,方法之實例因此係電腦程式,其具有用於在電腦程式運行於電腦上時執行本文中所描述之方法中之一者的程式指令。
方法之另一實例因此係資料載體媒體(或數位儲存媒體,或電腦可讀媒體),其包含、上面記錄用於執行本文中所描述之方法中之一者的電腦程式。資料載體媒體、數位儲存媒體或記錄媒體係有形及/或非暫時性的,而非無形及暫時性的信號。
另一實例包含處理單元,例如電腦或可規劃邏輯裝置,其執行本文中所描述之方法中之一者。
另一實例包含電腦,該電腦具有安裝於其上的用於執行本文中所描述之方法中之一者的電腦程式。
另一實例包含將用於執行本文中所描述之方法中之一者的電腦程式傳送(例如,以電子方式或以光學方式)至接收器之設備或系統。舉例而言,接收器可係電腦、行動裝置、記憶體裝置或其類似者。舉例而言,設備或系統可包含用於將電腦程式傳送至接收器之檔案伺服器。
在一些實例中,可規劃邏輯裝置(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實例中,場可規劃閘陣列可與微處理器協作,以便執行本文中所描述之方法中之一者。一般而言,該等方法可由任何適當的硬體設備執行。
上述實例說明上文所論述的原理。應理解,本文中所描述之配置及細節之修改及變化將為顯而易見的。因此,其意欲由接下來之申請專利範圍之範圍限制,而非由藉助於本文中實例之描述及解釋所呈現的特定細節限制。
10、50‧‧‧編碼器設備/編碼器側
10a、12a‧‧‧比較器
11‧‧‧時間雜訊成形TNS工具/組件
11a‧‧‧選擇器
12‧‧‧TNS控制器/組件
12b‧‧‧元件
13‧‧‧FD資訊信號Xs
(n)/輸入
14‧‧‧線性預測(LP)濾波器參數a(k)
14a‧‧‧第一濾波器
14'‧‧‧參數aw
(k)
15‧‧‧FD資訊信號之經濾波版本Xf
(n)/輸出
15a‧‧‧第二濾波器
16‧‧‧輸出參數/輸出/反射係數
17‧‧‧訊框量度/預測增益
17'‧‧‧資訊、命令及/或控制資料
18a‧‧‧TNS濾波判定臨限值
18b‧‧‧濾波類型判定臨限值
20、60‧‧‧解碼器設備/解碼器側
21‧‧‧TNS解碼器/組件/工具
22‧‧‧TNS解碼器控制器/組件
23‧‧‧合成輸出
25‧‧‧經解碼表示
26‧‧‧輸入
30、35、36、40、40'、40''‧‧‧方法
51‧‧‧MDCT工具
52‧‧‧頻譜雜訊成形器SNS工具
53‧‧‧量化器工具
54‧‧‧算術寫碼器
55‧‧‧位元串流編寫器
55'‧‧‧雜訊位準工具
56‧‧‧減少取樣器工具
57‧‧‧長期後濾波工具
58'‧‧‧頻寬偵測器
61‧‧‧讀取器
61a‧‧‧算術殘餘解碼器
62‧‧‧雜訊填充工具
63‧‧‧全域增益工具
65‧‧‧SNS解碼器工具
65'‧‧‧反MDCT (或MDST)工具
66‧‧‧LTPF工具
68‧‧‧頻寬資訊
110‧‧‧編碼器設備/編碼器側/系統
111、121‧‧‧處理器
112、122‧‧‧非暫時性記憶體單元
116、126‧‧‧輸入單元
120‧‧‧設備/解碼器側/系統
127‧‧‧輸出單元
128‧‧‧本端儲存空間
S31、S32、S33、S34、S35、S35a、S35b、S35c、S35d、S36、S36a、S36b、S41'、S42'、S43'、S44'、S45'、S46'、S47'、S48'、S49'、S41''、S42''‧‧‧步驟
圖1展示根據實例之編碼器設備。
圖2展示根據實例之解碼器設備。
圖3展示根據實例之方法。
圖3A展示根據實例之技術。
圖3B及圖3C展示根據實例之方法。
圖4展示根據實例之方法。
圖5展示根據實例之編碼器設備。
圖6展示根據實例之解碼器設備。
圖7及圖8展示根據實例之編碼器設備。
圖8(1)至圖8(3)展示根據實例之信號演進。
Claims (25)
- 一種編碼器設備,其包含: 一時間雜訊成形TNS工具,其用於對包括多個訊框之一資訊信號執行線性預測LP濾波;以及 一控制器,其經組配以控制該TNS工具使得該TNS工具藉由以下各者執行LP濾波: 一第一濾波器,其脈衝響應具有一較高能量;以及 一第二濾波器,其脈衝響應具有低於該第一濾波器之該脈衝響應的一能量,其中該第二濾波器並非一恆等濾波器, 其中該控制器經組配以基於一訊框量度而在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇。
- 如請求項1之編碼器設備,其中該控制器經進一步組配以: 修改該第一濾波器以便獲得該第二濾波器,在該第二濾波器中,該濾波器之脈衝響應能量減小。
- 如請求項1或2之編碼器設備,其中該控制器經進一步組配以: 將至少一個調整因子應用於該第一濾波器以獲得該第二濾波器。
- 如前述請求項中任一項之編碼器設備,其經組配以藉由使用至少一個調整因子修改該第一濾波器之參數的振幅來修改該第一濾波器以獲得該第二濾波器。
- 如請求項3或4之編碼器設備,其中該控制器經進一步組配以: 基於用於在藉由該第一濾波器進行濾波與藉由該第二濾波器進行濾波之間作出選擇的一濾波類型判定臨限值而定義該至少一個調整因子。
- 如請求項3或4或5之編碼器設備,其中該控制器經進一步組配以: 基於至少該訊框量度而定義該至少一個調整因子。
- 如請求項3至6中任一項之編碼器設備,其中該控制器經進一步組配以: 基於用於在執行TNS濾波與不執行TNS濾波之間作出選擇的一TNS濾波判定臨限值而定義該至少一個調整因子。
- 如請求項3至7中任一項之編碼器設備,其中該控制器經進一步組配以: 使用該訊框量度之一線性函數定義該至少一個調整因子,該線性函數使得該訊框量度之一增加對應於該調整因子及/或該濾波器之脈衝響應能量的一增加。
- 如請求項3至8中任一項之編碼器設備,其經組配以將該調整因子定義為 其中係該TNS濾波判定臨限值,係該濾波類型判定臨限值,係一訊框量度,且係一固定值。
- 如請求項3至9中任一項之編碼器設備,其經組配以藉由應用下式來修改該第一濾波器之該等參數以獲得該第二濾波器之參數: 其中係該第一濾波器之參數,係該調整因子使得,係該第二濾波器之該等參數且K係該第一濾波器之階數。
- 如前述請求項中任一項之編碼器設備,其中該控制器經進一步組配以: 自一預測增益、該資訊信號之一能量及/或一預測誤差中之至少一者獲得該訊框量度。
- 如前述請求項中任一項之編碼器設備,其中該訊框量度包含一預測增益,該預測增益計算為 其中係與該資訊信號之一能量相關聯的一項,且係與一預測誤差相關聯之一項。
- 如前述請求項中任一項之編碼器設備,其中該控制器經組配以使得: 至少對於一預測增益之一減小及/或該資訊信號之一能量的一減小,該第二濾波器之脈衝響應能量減小,及/或至少對於該預測誤差之一增加,該第二濾波器之脈衝響應能量減小。
- 如前述請求項中任一項之編碼器設備,其中該控制器經進一步組配以: 比較該訊框量度與一濾波類型判定臨限值,以便在該訊框量度小於該濾波類型判定臨限值時藉由該第一濾波器執行一濾波。
- 如前述請求項中任一項之編碼器設備,其中該控制器經進一步組配以: 基於該訊框量度而在執行一濾波與不執行濾波之間作出選擇。
- 如請求項15之編碼器設備,其中該控制器經進一步組配以: 比較該訊框量度與一TNS濾波判定臨限值,以便在該訊框量度小於該TNS濾波判定臨限值時選擇避免TNS濾波。
- 如前述請求項中任一項之編碼器設備,其進一步包含: 一位元串流編寫器,其準備具有藉由該TNS工具獲得之反射係數或其一經量化版本的一位元串流。
- 如前述請求項中任一項之編碼器設備,該第一濾波器之濾波參數係在LP寫碼LPC係數及/或濾波器係數之任何其他表示之間作出選擇。
- 如前述請求項中任一項之編碼器設備,其中該資訊信號係一音訊信號。
- 如前述請求項中任一項之編碼器設備,其中該控制器經進一步組配以修改該第一濾波器以便獲得該第二濾波器,在該第二濾波器中,該濾波器之脈衝響應能量減小。
- 如前述請求項中任一項之編碼器設備,其中該訊框量度與該信號之時間包絡的平坦度相關聯。
- 一種系統,其包含一編碼器側及一解碼器側,其中該編碼器側包含如前述請求項中任一項之一編碼器設備。
- 一種用於對包括多個訊框之一資訊信號執行時間雜訊成形TNS濾波的方法,該方法包含: - 對於各訊框,基於一訊框量度而在藉由脈衝響應具有一較高能量之一第一濾波器進行濾波與藉由脈衝響應具有低於該第一濾波器之該脈衝響應之一能量的一第二濾波器進行濾波之間作出選擇,其中該第二濾波器並非一恆等濾波器; - 使用根據該第一濾波器與該第二濾波器之間的該選擇的濾波對該訊框進行濾波。
- 一種方法,其包含: - 在一編碼器側,編碼一資訊信號,該資訊信號係根據如請求項23之方法進行濾波; - 在一解碼器側,解碼該資訊信號。
- 一種非暫時性儲存裝置,其儲存指令,該等指令在由一處理器執行時使該處理器至少執行如請求項23或24之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201094.4 | 2017-11-10 | ||
EP17201094.4A EP3483880A1 (en) | 2017-11-10 | 2017-11-10 | Temporal noise shaping |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201923754A true TW201923754A (zh) | 2019-06-16 |
TWI701658B TWI701658B (zh) | 2020-08-11 |
Family
ID=60301908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107139531A TWI701658B (zh) | 2017-11-10 | 2018-11-07 | 時間雜訊成形技術 |
Country Status (18)
Country | Link |
---|---|
US (1) | US11127408B2 (zh) |
EP (2) | EP3483880A1 (zh) |
JP (1) | JP6990306B2 (zh) |
KR (1) | KR102428419B1 (zh) |
CN (1) | CN111587456B (zh) |
AR (1) | AR113480A1 (zh) |
AU (1) | AU2018363699B2 (zh) |
BR (1) | BR112020009104A2 (zh) |
CA (1) | CA3081781C (zh) |
ES (1) | ES2905911T3 (zh) |
MX (1) | MX2020004789A (zh) |
PL (1) | PL3707712T3 (zh) |
PT (1) | PT3707712T (zh) |
RU (1) | RU2740074C1 (zh) |
SG (1) | SG11202004204UA (zh) |
TW (1) | TWI701658B (zh) |
WO (1) | WO2019091978A1 (zh) |
ZA (1) | ZA202002520B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6642146B2 (ja) | 2015-03-31 | 2020-02-05 | 日立金属株式会社 | 窒化珪素系セラミックス集合基板及びその製造方法 |
CN113643713B (zh) * | 2021-10-13 | 2021-12-24 | 北京百瑞互联技术有限公司 | 一种蓝牙音频编码方法、装置及存储介质 |
Family Cites Families (151)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7099830B1 (en) * | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
ATE339759T1 (de) | 2003-02-11 | 2006-10-15 | Koninkl Philips Electronics Nv | Audiocodierung |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
KR101063562B1 (ko) | 2003-06-17 | 2011-09-07 | 파나소닉 주식회사 | 수신 장치, 전송 장치 및 송신 시스템 |
ES2354427T3 (es) | 2003-06-30 | 2011-03-14 | Koninklijke Philips Electronics N.V. | Mejora de la calidad de audio decodificado mediante la adición de ruido. |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
DE102004009954B4 (de) * | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
WO2005086138A1 (ja) | 2004-03-05 | 2005-09-15 | Matsushita Electric Industrial Co., Ltd. | エラー隠蔽装置およびエラー隠蔽方法 |
AU2006232364B2 (en) | 2005-04-01 | 2010-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007102782A2 (en) | 2006-03-07 | 2007-09-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for audio coding and decoding |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
WO2007138511A1 (en) | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
ATE496365T1 (de) * | 2006-08-15 | 2011-02-15 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
EP2099026A4 (en) | 2006-12-13 | 2011-02-23 | Panasonic Corp | POST-FILTER AND FILTERING METHOD |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US20110116542A1 (en) | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
EP2186087B1 (en) | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR101290622B1 (ko) | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
WO2009066869A1 (en) * | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
US9659568B2 (en) | 2007-12-31 | 2017-05-23 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
CN101981616A (zh) * | 2008-04-04 | 2011-02-23 | 松下电器产业株式会社 | 立体声信号变换装置、立体声信号逆变换装置及其方法 |
WO2009150290A1 (en) | 2008-06-13 | 2009-12-17 | Nokia Corporation | Method and apparatus for error concealment of encoded audio data |
BRPI0910784B1 (pt) | 2008-07-11 | 2022-02-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2346029T3 (pl) | 2008-07-11 | 2013-11-29 | Fraunhofer Ges Forschung | Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
MX2011003824A (es) | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
BRPI1005300B1 (pt) | 2009-01-28 | 2021-06-29 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Ten Forschung E.V. | Codificador de áudio, decodificador de áudio, informações de áudio codificado e métodos para codificar e decodificar um sinal de áudio com base em uma informação de áudio codificado e em uma informação de áudio de entrada. |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
WO2011042464A1 (en) * | 2009-10-08 | 2011-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
WO2011044700A1 (en) * | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
PL2473995T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
TWI451403B (zh) | 2009-10-20 | 2014-09-01 | Fraunhofer Ges Forschung | 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US9020812B2 (en) | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
EP2524371B1 (en) | 2010-01-12 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
KR101696632B1 (ko) | 2010-07-02 | 2017-01-16 | 돌비 인터네셔널 에이비 | 선택적인 베이스 포스트 필터 |
EP2596494B1 (en) | 2010-07-20 | 2020-08-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Audio decoder, audio decoding method and computer program |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101767175B1 (ko) | 2011-03-18 | 2017-08-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩에서의 프레임 요소 길이 전송 |
MX2013012301A (es) | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
WO2012152764A1 (en) * | 2011-05-09 | 2012-11-15 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
WO2013062392A1 (ko) * | 2011-10-27 | 2013-05-02 | 엘지전자 주식회사 | 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
MY157163A (en) | 2012-01-20 | 2016-05-13 | Fraunhofer Ges Forschung | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
WO2013149672A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US9305567B2 (en) | 2012-04-23 | 2016-04-05 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9558750B2 (en) | 2012-06-08 | 2017-01-31 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) * | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
CN110223704B (zh) * | 2013-01-29 | 2023-09-15 | 弗劳恩霍夫应用研究促进协会 | 对音频信号的频谱执行噪声填充的装置 |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
MX2021000353A (es) | 2013-02-05 | 2023-02-24 | Ericsson Telefon Ab L M | Método y aparato para controlar ocultación de pérdida de trama de audio. |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
BR112016008117B1 (pt) | 2013-10-18 | 2021-12-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificação de coeficientes espectrais de um espectro de um sinal de áudio |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
SG10201609186UA (en) | 2013-10-31 | 2016-12-29 | Fraunhofer Ges Forschung | Audio Decoder And Method For Providing A Decoded Audio Information Using An Error Concealment Modifying A Time Domain Excitation Signal |
CN105706166B (zh) | 2013-10-31 | 2020-07-14 | 弗劳恩霍夫应用研究促进协会 | 对比特流进行解码的音频解码器设备和方法 |
CA2928882C (en) | 2013-11-13 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107945809B (zh) | 2017-05-02 | 2021-11-09 | 大连民族大学 | 一种复调音乐多音高估计方法 |
-
2017
- 2017-11-10 EP EP17201094.4A patent/EP3483880A1/en not_active Withdrawn
-
2018
- 2018-11-06 SG SG11202004204UA patent/SG11202004204UA/en unknown
- 2018-11-06 CN CN201880086260.1A patent/CN111587456B/zh active Active
- 2018-11-06 KR KR1020207015836A patent/KR102428419B1/ko active IP Right Grant
- 2018-11-06 AU AU2018363699A patent/AU2018363699B2/en active Active
- 2018-11-06 JP JP2020524877A patent/JP6990306B2/ja active Active
- 2018-11-06 CA CA3081781A patent/CA3081781C/en active Active
- 2018-11-06 PT PT187966759T patent/PT3707712T/pt unknown
- 2018-11-06 PL PL18796675T patent/PL3707712T3/pl unknown
- 2018-11-06 ES ES18796675T patent/ES2905911T3/es active Active
- 2018-11-06 WO PCT/EP2018/080339 patent/WO2019091978A1/en unknown
- 2018-11-06 MX MX2020004789A patent/MX2020004789A/es unknown
- 2018-11-06 EP EP18796675.9A patent/EP3707712B1/en active Active
- 2018-11-06 BR BR112020009104-9A patent/BR112020009104A2/pt unknown
- 2018-11-06 RU RU2020118948A patent/RU2740074C1/ru active
- 2018-11-07 TW TW107139531A patent/TWI701658B/zh active
- 2018-11-09 AR ARP180103272A patent/AR113480A1/es active IP Right Grant
-
2020
- 2020-05-07 US US16/868,954 patent/US11127408B2/en active Active
- 2020-05-07 ZA ZA2020/02520A patent/ZA202002520B/en unknown
Also Published As
Publication number | Publication date |
---|---|
AR113480A1 (es) | 2020-05-06 |
US11127408B2 (en) | 2021-09-21 |
CN111587456A (zh) | 2020-08-25 |
CA3081781A1 (en) | 2019-05-16 |
US20200265850A1 (en) | 2020-08-20 |
JP6990306B2 (ja) | 2022-01-12 |
EP3707712A1 (en) | 2020-09-16 |
CN111587456B (zh) | 2023-08-04 |
PL3707712T3 (pl) | 2022-03-28 |
BR112020009104A2 (pt) | 2020-10-20 |
TWI701658B (zh) | 2020-08-11 |
WO2019091978A1 (en) | 2019-05-16 |
MX2020004789A (es) | 2020-08-13 |
EP3707712B1 (en) | 2021-12-01 |
RU2740074C1 (ru) | 2021-01-11 |
KR20200090793A (ko) | 2020-07-29 |
AU2018363699A1 (en) | 2020-05-21 |
PT3707712T (pt) | 2022-02-15 |
ZA202002520B (en) | 2021-10-27 |
CA3081781C (en) | 2022-10-04 |
KR102428419B1 (ko) | 2022-08-02 |
JP2021502597A (ja) | 2021-01-28 |
EP3483880A1 (en) | 2019-05-15 |
SG11202004204UA (en) | 2020-06-29 |
ES2905911T3 (es) | 2022-04-12 |
AU2018363699B2 (en) | 2020-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102237718B1 (ko) | 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법 | |
RU2580096C2 (ru) | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы | |
CA2955255C (en) | Apparatus and method for processing an audio signal using a harmonic post-filter | |
RU2691243C2 (ru) | Зависящее от гармоничности управление инструментом фильтрации гармоник | |
TWI642053B (zh) | 用以編碼音訊信號之音訊編碼器、用以編碼音訊信號之方法、及考量上頻帶中所檢出尖峰頻譜區域的電腦程式 | |
EP2951814B1 (en) | Low-frequency emphasis for lpc-based coding in frequency domain | |
TWI701658B (zh) | 時間雜訊成形技術 | |
CN111344784B (zh) | 控制编码器和/或解码器中的带宽 | |
KR20170132854A (ko) | 오디오 인코더 및 오디오 신호를 인코딩하는 방법 | |
US9640191B2 (en) | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal | |
US20240194209A1 (en) | Apparatus and method for removing undesired auditory roughness |