TW200947422A - Systems, methods, and apparatus for context suppression using receivers - Google Patents
Systems, methods, and apparatus for context suppression using receivers Download PDFInfo
- Publication number
- TW200947422A TW200947422A TW097137517A TW97137517A TW200947422A TW 200947422 A TW200947422 A TW 200947422A TW 097137517 A TW097137517 A TW 097137517A TW 97137517 A TW97137517 A TW 97137517A TW 200947422 A TW200947422 A TW 200947422A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- background sound
- audio signal
- audio
- processor
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 167
- 230000001629 suppression Effects 0.000 title claims description 50
- 238000004891 communication Methods 0.000 claims abstract description 29
- 230000005236 sound signal Effects 0.000 claims description 706
- 238000012545 processing Methods 0.000 claims description 160
- 230000005540 biological transmission Effects 0.000 claims description 36
- 230000003595 spectral effect Effects 0.000 claims description 33
- 238000002156 mixing Methods 0.000 claims description 26
- 230000005284 excitation Effects 0.000 claims description 20
- 230000009471 action Effects 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008901 benefit Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000001755 vocal effect Effects 0.000 claims description 2
- 230000000977 initiatory effect Effects 0.000 claims 7
- 238000003860 storage Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 82
- 230000008859 change Effects 0.000 description 14
- 238000004886 process control Methods 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000000926 separation method Methods 0.000 description 11
- 238000003491 array Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 239000009517 FM 100 Substances 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 235000012431 wafers Nutrition 0.000 description 3
- 101000981993 Oncorhynchus mykiss Myelin proteolipid protein Proteins 0.000 description 2
- 239000004106 carminic acid Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000009365 direct transmission Effects 0.000 description 2
- 238000001453 impedance spectrum Methods 0.000 description 2
- 230000009349 indirect transmission Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004334 sorbic acid Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 244000060234 Gmelina philippensis Species 0.000 description 1
- 206010019133 Hangover Diseases 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 241001135893 Themira Species 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000004148 curcumin Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000002000 scavenging effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000004173 sunset yellow FCF Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
200947422 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於話音信號之處理。 本專利申請案主張2008年1月28日申請且讓給給其受讓 人的標題為"SYSTEMS, METHODS,AND APPARATUS FOR CONTEXT PROCESSING"之臨時申請案第61/024,104號之優先 權。 本專利申請案係關於以下同在申請中之美國專利申請 ❿ 案: "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING USING MULTIPLE MICROPHONES”,其代理人 案號為071104U1,與本申請案同時申請,讓與給其受讓 人; "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT DESCRIPTOR TRANSMISSION",其代理人案號為 071104U3, 與本申請案同時申請,讓與給其受讓人;
❹ "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING USING MULTI RESOLUTION ANALYSIS",其代理 人案號為071104U4,與本申請案同時申請,讓與給其受讓 人;及 "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT REPLACEMENT BY AUDIO LEVEL”,其代理人案號為 071 104U5,與本申請案同時申請,讓與給其受讓人。 【先前技術】 134861.doc 200947422 用於语音乜號之通信及/或儲存的應用通常使用麥克風 來捕獲包括主揚聲器語音之聲音的音訊信號。音訊信號之 表示語音之部分稱為話音或話音分量。所捕獲之音訊信號 常常亦包括來自麥克風的周圍聲學環境之諸如背景聲音的 其他聲音。音訊信號之此部分稱為背景聲音或背景聲音分 量0 諸如話曰及^樂之音矾資訊藉由數位技術之傳輸已變得 廣泛’特別在長途電話、諸如網路電話(亦稱為ν〇ιρ,盆 中ip指示網際網路協定)之封包交換電話,及諸如蜂巢式 電話之數位無線電電話中。此種增長已造成減少用以經由 傳輸頻道傳送語音通信之資訊的量且同時維持重建的話音 之所感知品質的興趣。舉例而言,需要最佳地利用可用無 線系統頻寬。有效播用& Μ μ & 系統頻寬之一方法為使用信號壓縮 =術。對於載運話音信號之無線系統而言,出於此目的通 韦使用話音壓縮(或,,話音編碼")技術。 ❿ ^且態以藉由提取關於人話音產生之模型的參數而壓縮 "二之器件常常稱為語音編碼器、編解碼器、聲碼器、 此V::器” Γ話音編碼器”,且以下插述可互換地使用 I Hit常包括話音編碼器及話 二:=通常作為一系列稱為"訊框,,之樣本區段接收數 數量化I化’分析每一訊框以提取某些相關參數,且將參 有線或^編碼訊框。經編碼訊框經由傳輸頻道(亦即, 者^編、線網路連接)傳輸至包括解碼器之接收器。或 ,、編媽音訊信號可經儲存以供在以後時間進行操取及 13486l.doc 200947422 解碼。解碼器接收且處理經編碼訊框、對其進行反量化以 產出參數,且使用反量化參數重建話音訊框。 在一典型通話中’每一揚聲器靜寂約百分之六十之時 間。話音編碼器常常經組態以辨別含有話音之音訊信號之 訊框(有作用訊框”)與僅含有背景聲音或靜寂之音訊信號 之訊框(非有作用訊框”)。該編碼器可經組態以使用不同 編碼楔式及/或速率來編碼有作用與非有作用訊框。舉例 而。,非有作用訊框通常感知為載運極少或不載運資訊, Φ s話音編碼器常常經組態以使用比編碼有作用訊框少之位 元(亦即,較低位元速率)來編碼非有作用訊框。 用以編碼有作用訊框之位元速率之實例包括每訊框i7i 個位元、每訊框80個位元及每訊框4〇個位元。用以編碼非 有作用訊框之位元速率之實例包括每訊框16個位元。在蜂 巢式電話系統(尤其依照如由電信工業協會(Ariingt〇n,va) 發布之臨時標準(IS)_95(或類似工業標準)之系統)之背景聲 龜音中,此等四個位元速率亦分別稱為"全速率"、"半速率"、 霸"四分之-速率”及W分之—速率··。 【發明内容】 此文件描述處理包括第—音訊背景聲音之數位音訊信號 之方法。此方法包括自該數位音訊信號抑制第一音訊背景 聲曰’基於由第一麥克風產出之第一音訊信號來獲得背景 聲音受抑制信號。此方法亦包括混合第二音訊背景聲音與 基於背景聲音受抑制信號之信號以獲得背景聲音增強信 號。在此方法中,數位音訊信號係基於由不同於第一麥克 I3486I.doc 200947422 風之第二麥克風產出之第二音訊信號。此文件亦描述關於 此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理基於自第一轉換器接收之信號的數位 音訊仏號之方法。此方法包括自數位音訊信號抑制第一音 況者景聲音以獲得背景聲音受抑制信號;混合第二音訊背 景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音 增強信號;將基於(A)第二音訊背景聲音及(B)背景聲音增 強信號中之至少一者的信號轉換為類比信號;及使用第二 ®轉換器來產出基於類比信號之聲訊信號(audible signal)。 在此方法中,第一轉換器及第二轉換器兩者位於一共同外 殼内。此文件亦描述關於此方法之裝置、構件之組合及電 腦可讀媒體。 此文件亦描述處理經編碼音訊信號之方法。此方法包 括:根據-第-編碼方案解碼經編碼音訊信號之第一複數 個經編碼訊框以獲得包括話音分量及背景聲音分量之第一 經解碼音訊信號;根據第二編碼方案解碼經訊信號 ϋ數個經編碼訊“獲得第二經解碼音訊信號; 及’基於來自第二經解碼音訊信號之資訊,自基於第一經 解碼音訊信號之第三信號抑制背景聲音分量以獲得一背景 聲音受抑紹言^此文件亦描述關於此方法之裝置、構件 之組合及電腦可讀媒體。 、 景聲音分量之數位 此文件亦描述處理包括話音分量及背 音訊信號之方法。此方法包括·•自赵 目數位音讯信號抑制背景 聲音分量以獲得背景聲音受抑制#號.& 丨刺乜唬,編碼基於背景聲音 134861.doc 200947422 受抑制信號之信號以獲得經編碼音訊信號;選擇複數個音 訊背景聲音中之一者;及將關於所選音訊背景聲音之資訊 插入於基於經編碼音訊信號之信號中。此文件亦描述關於 此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊信號之方法。此方法包括自數位音訊信號抑制背景聲 音分量以獲得背景聲音受抑制信號;編碼基於背景聲音受 抑制信號之信號以獲得經編碼音訊信號;經由第一邏輯頻 ® 道,將經編碼音訊信號發送至第一實體;及,經由不同於 第一邏輯頻道之第二邏輯頻道,向第二實體發送(A)音訊 背景聲音選擇資訊及(B)識別第一實體之資訊。此文件亦 描述關於此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理經編碼音訊信號之方法。此方法包 括,在打動使用者終端機内,解碼經編碼音訊信號以獲得 經解碼音訊信號; 景聲音信號;及, 在行動使用者終端機内,產生一音訊背 在行動使用者終端機内,混合基於音訊 背景聲曰仏冑之信號與基於經解碼音訊信冑之信號。此文
之每一者具有不同之時間解析度; 134861.doc 总,該第一複數個序 :及混合基於所產生 -10- 200947422 音訊背景聲音信號之第一信號與基於背景聲音受抑制信號 之第二信號以獲得背景聲音增強信號。在此方法中,產生 音訊背景聲音信號包括將第一濾波應用至第一複數個序列 中之每一者。此文件亦描述關於此方法之裝置、構件之組 合及電腦可讀媒體。 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊信號之方法。此方法包括:自數位音訊信號抑制背景
聲音分量以獲得背景聲音受抑制信號;產生音訊背景聲音 信號;混合基於所產生音訊背景聲音信號之第一信號與一 基於背景聲音受抑制信號之第二信號以獲得背景聲音增強 信號;及計算基於數位音訊信號之第三信號之等級。在此 方法中,產生及混合中的至少一者包括基於第三信號之所 計算等級控制第一信號之等級。此文件亦描述關於此方法 之裝置、構件之組合及電腦可讀媒體。 此文件亦描述根據處理控制信號之狀態來處理數位音訊 信號之方法,#中數位音訊信號具有話音分量及背景聲音 分里。此方法包括在處理控制信號具有第—狀態時以第一 位元速率編碼缺少話音分量之數位音訊信號部分之訊框。 此方法包括在處理控制信號具有不同於第一狀態之第二狀 感時自數位音訊信號抑制背导.释* 坑仰制穹录聲音分量以獲得背景聲音受 抑制信號。此方法包括冰盧搜&立,& t l栝在處理控制信號具有第二狀態時混 合音訊背景聲音信號虚基於皆县鼓i < 一丞於走景聲音受抑制信號之信號以 獲得背景聲音增強信號。此方 在匕括在處理控制信號具有 第二狀態時以第二位元速率餻 逑年編碼缺少話音分量之背景聲音 134861.doc 200947422 增強仏號部分之訊框,其中第二位元速率高於第一位元速 率。此文件亦描述關於此方法之裝置、構件之組合及電腦 可讀媒體。 【實施方式】 儘管音訊信號之話音分量通常載運主要資訊,但背景聲 音分量亦在諸如電話之語音通信應用中起重要作用。由於 背景聲音分量存在於有作用及非有作用訊框兩者期間故 其在非有作用訊框期間之連續重現對於在接收器處提供連 ® 續及連通感係重要的。背景聲音分量之重現品質可能對於 逼真度及整體所感知品質亦係重要的,尤其對於嗜雜環境 中使用之免提式終端機而言。 諸如蜂巢式電話之行動使用者終端機允許語音通信應用 擴展於比先前更多之位置。結果,可能遭遇之不同音訊背 景聲音之數目增加。現存語音通信應用通常將背景聲音分 量視作雜訊,但一些背景聲音比其他背景聲音更結構化, 且可能更難可辨別地進行編碼。 瘳 ,二清形下,可能需要抑制及/或掩蔽音訊信號之背 景聲音分量。出於安全原因’舉例而言,可能需要在傳輸 或儲存之前自音訊信號移除背景聲音分量。或者,可能需 要向音訊信號添加不同背景聲音。舉例而言,可能需要造 成揚聲器在不同位置處及/或在不同環境中之錯覺。本文 揭不之組態包括可應用於語音通信及/或儲存應用中以移 除、增強及/或取代現存音訊背景聲音之系统、方法及裝 置明確地預期且特此揭示,本文揭示之組態可經調適用 134861.doc •12· 200947422 於封包交換式網路(舉例而言,根據諸如ν〇ιρ之協定配置 乂載運π θ傳輸之有線及/或無線網路)及/或電路交換式網 路中。亦明碑地預期且特此揭示,本文揭示之組態可經調 適:於窄頻編碼系統(例如,編碼約四千赫兹或五千赫兹 之音訊頻率範圍之系統)中及用於寬頻編碼系統(例如,編 馬大於五千赫灶之音訊頻率之系統)中包括全頻編碼系 統及分頻編碼系統。
除非月確由其上下文限制,否則術語”信號”在本文中用 來“其普通意義中之任一纟,包括如導線、匯流排或其 傳輸媒體上表達之記憶體位置(或記憶體位置之集合)之 狀〜、除非明確由其上下文限制,否則術語"產生"在本文 用來指示其普通意義中之任一者,諸如計算或以其他方式 產出⑤非明確由其上下文限制,否則術語”計算”在本文 用來指示其普通意義中之任一者’諸如計算、估計及/或 自θ ,7組值選擇。除非明確由其上下文限制,否則術語"獲 得"用來指示其普通意義中之任一者,諸如計算、導出、 接收(例如,自一外部器件)及/或擷取(例如,自儲存元件 =列)。在術語"包含”使用於本發明描述及申請專利範圍中 Η其並不排除其他元件或操作。術語"基於"(如,,Α係基 中)用來指示其普通意義中之任一者,包括以下情 形.(1)至少基於,,(例如,"Α至少基於Β,'),及(ii)"等同於” (例如’ ”A等同於B„)(若在特定上下文中為適當的)。 除非另外指示,否則具有特定特徵之裝置的操作之任何 揭不内容亦明確地意欲揭示具有類似特徵之方法(且反之 134861.doc 13 200947422 亦然)’且根據特定組態之裝置的操作之任何揭示内容亦 明確地意欲揭示根據類似組態之方法(且反之亦然卜除非 另外指示,否則術語,’背景聲音"(或,,音訊背景聲音")用來 指不音訊信號之不同於話音分量,且傳達來自揚聲器之周 圍環境的音訊資訊的分量,且術語,,雜訊"用來指示音訊信 號令並非話音分量之部分且不傳達來自揚聲器的周圍環境 之資訊的任何其他偽訊。
❹ 出於話音編碼目的,話音信號通常經數位化(或量化)以 獲得樣本流。可根據此項技料已知之各種方法(包括, 例如,脈碼調變(PCM)、壓擴_pCM及壓擴A律pcM)中 之任一者執行數位化處理。窄頻話音編碼器通常使用8版 之取樣速率,而寬頻話音編碼器通常使収高之取樣速率 (例如,12 或 16 kHz)。 將經數位化之話音信號處理為—系列訊框。此系列通常 實施為非重疊系列’但處理訊框或訊框片段(亦稱為子訊 框)之操作亦可包括其輸入中的一或多個鄰近訊框之片 段。話音信號之訊框通常足夠短從而信號之頻譜包絡可預 期在訊框上保持相對固定。訊框通常對應於話音信號之5 與35毫秒(或約40至200個樣本)之間,其中1〇、2〇及3〇毫秒 為共同訊框大小。通常所有訊框具有相同之長度,且在本 文描述之特定實例中假定均勻訊框長度。然而,亦明確地 預期且特此揭示’可使用非均勻訊框長度。 20毫秒的訊框長度在七千赫茲(kHz)之取樣速率下對應 於140個樣本,在8 kHz之取樣速率下對應於16〇個樣本, 134861.doc -14· 200947422 且在16 kHz之取樣速率下對應於32〇個樣本, ^ 1史用認 為適於特定應用之任何取樣速率。可用於話音編石馬之取樣 速率的另-實例為12.8 kHz,且另外之實例包括自128他 至3 8.4 kHz的範圍中之其他速率。 二展示經組態以接收音訊信號㈣(例如,—系列訊 丄產出相應經編碼音訊信號S2〇(例如,一系列經編碼 。框)之#音編碼ΜΠ)之方塊圖。語音編喝器如包括編 ❹ φ 碼方案選擇器2〇、有作用訊框編碼器3〇及非有作用訊框編 2器4〇。音訊信號Sl0為包括話音分量(亦即,主揚聲器語 音之聲音)及背景聲音分量(亦即,周圍環境或背景聲音)之 數位音訊信號。音訊信號S1〇通常為如由麥克風捕獲曰之類 比信號之經數位化版本。 編碼方案選擇器20經組態以辨別音訊信號si〇之有作用 ==有用作用訊框。此種操作亦稱為"語音作用㈣測” ^立日作用/生偵測”,且編碼方案選擇器2(>可經實施以包 ::作用性價測器或話音作用性偵測器 =擇器2。可經組態以輸出對於有作 於=用訊框為低之二元值編碼方案選擇信號。圖以展 二==案選擇器20產出之編碼方案選擇信號來控 S編碼器Xl〇的一對選擇器5〇a及50b之實例。 内令之-或夕個特性(諸如訊框能量、信 期性、頻譜分布(例如, ’ 類為有作用或過零率)將訊框分 有作用次非有作用。此種分類可包括將此種特性之值 13486l.doc -15- 200947422 或量值與一臨限值進行比較, 詈插,也丨ι 或將此種特性之改變之 量值(例如,相對於先前訊 變之 而山 μ 丹臨限值進行比較。Μ你丨 而吕,編碼方㈣擇!|2G可 量,且若能量值小於(或者,不大;^估计备别訊框之能 分類為非有作用。 值則將訊框 為mu 種選擇15可經組態以將訊框能量計算 為Λ框樣本的平方和。 編碼方案選擇器2〇之萁+丧
❹ (例如,300沿至2咖及一》例經組態以估計低頻帶 的每一者中^ (例如,2他至4剛中 (或者,不: 能量’且在每一頻帶的能量值小於 一 於)各別臨限值的情況下指示訊框為非有作用 ^此種選擇器可經組態以藉由將通帶錢應用至訊框及 ^經錢之訊框的樣本之平方和而計算頻帶中的訊框能 置广種§吾音作用性摘測操作之一實例描述於第三代合作 夥伴计劃2(3GPP2)標準文件c s〇〇14_c,vl 〇(2〇〇7年! 月)(以www.3gpp2,org線上可得)之章節4 7中。 另外或在替代例中,此種分類可基於來自—或多個先前 訊框及/或一或多個隨後訊框之資訊。舉例而言,可能需 要基於訊框特性之在兩個或兩4固以上訊框上求平均之值對 訊框進行分類。可能需要使用基於來自先前訊框(例如, 背景雜訊等級,SNR)之資訊之臨限值對訊框進行分類。亦 可能需要組態編碼方案選擇器20以將音訊信號S10中遵循 自有作用訊枢至非有作用訊框之轉變的第一訊框中之一或 多者分類為有作用的。在轉變之後以此種方式繼續先前分 類狀態之動作亦稱為"時滯(hangover),,。 134861.doc • 16 - 200947422 王有作用訊框編碣器30經組態以編碼音訊信號之有作用訊 框。編碼器30可經組態以根據諸如全速率、半速率或四分 之速率之位疋速率編碼有作用訊框。編碼器3〇可經組態 以根據諸如碼激勵線性預測(CELP)、原型波形内插(pwi) 或原型間距週期(ppp)之編碼肖式編碼有作用訊框。 有作用訊框編碼器3G之典型實施例經組態以產出包括頻 "曰資Λ的描述及時間資訊的描述之經編碼訊框。頻譜資訊 之描述可包括線性預測編碼(LPC)係數值之一或多個向 ©量,其指示經編碼話音之共振(亦稱為"共振峰")。頻譜資 訊之描述通常經量化,以使得LPC向量通常被轉換為可有 效進行量化之形式,諸如線頻譜頻率(LSF)、線頻譜對 (LSP)、導抗頻譜頻率(脱,immiuance㈣伽丨、 導抗頻譜對(ISP)、倒譜係數或對數面積比。時間資訊之描 述可包括亦通常經量化之激勵信號之描述。 非有作m編碼㈣經組“編碼㈣仙訊框。非 有作用訊框編碼器40通常經組態而以比有作用訊框編碼器 30使用之位元速率低之位元速率來編碼非有作用訊框。在 一實例中,非有作用訊框編碼請經組態以使用雜訊激勵 線性預測(NELP)編竭方案以八分之一速率編碼非有作用訊 框。非有作用訊框編碼器40亦可經組態以執行不連續傳輸 (DTX),以使得經編碼訊框(亦稱為"靜寂描述"或訊框) 針對少於音訊信號S10之所有非有作用訊框進行傳輸。 非有作用訊框編碼器4〇之典型實施例經組態以產出包括 頻譜資訊的描述及時間資訊的描述之經編碼訊框。頻譜資 134861.doc -17· 200947422 訊之描述可包括線性預測編碼(LPC)係數值之一或多個向 量。頻譜資訊之描述通常經量化,以使得LPC向量通常轉 換為如上文實例中的可有效進行量化之形式。非有作用訊 框編碼器40可經組態以執行具有比有作用訊框編碼器3〇執 行之LPC分析的階數低之階數的LPC分析,及/或非有作用 訊框編碼器40可經組態以將頻譜資訊之描述量化為比有作 用訊框編碼器3 0產出的頻譜資訊之量化描述少的位元。時 間資讯之描述可包括亦通常經量化之時間包絡之描述(例 ® 如,包括訊框之增益值及/或訊框的一系列子訊框中之每 一者的增益值)。 注意’編碼器30及40可共用共同結構。舉例而言,編碼 器30及40可共用LPC係數值之計算器(可能經組態以產出對 於有作用訊框與非有作用訊框具有不同階數之結果),但 具有分別不同之時間描述計算器。亦注意,話音編碼器 X10之軟體或韌體實施例可使用編碼方案選擇器2〇之輸出 以引導執行向一個或另一個訊框編碼器之流程,且此種實 施例可能不包括針對選擇器5〇a及/或針對選擇器5〇b之類 比。 可能需要組態編碼方案選擇器2 〇以將音訊信號s丨〇之每 -有作用訊框分類為若干不同類型中之一者。此等不同類 型可包括有聲話音(例如,表示母音聲之話音)之訊框、轉 變Λ框(例如,表不詞之開始或結束之訊框)及無聲話音(例 如表不摩擦聲之話音)之訊框。訊框分類可基於當前訊 框及/或一或多個先前訊框之一或多個特徵,諸如訊框能 13486].doc -18- 200947422 量、兩個或兩個以上不同頻帶中之每一者之訊 、 SNR、週期性、頻射貞斜及/或過零率。此種分類可包 此種因數之值或量值與臨限值進行比較及/或將 的改變之量值與臨限值進行比較。 因數 可能需要組態話音編碼使料同編碼位元速率 來,碼不同類型之有作用訊框(例如,以平衡網路需求斑 合置)。此種操作稱為"可變速率編碼"。舉例而言,可能 要組態話音編碼器X】 b ❹ 速率(例如,全速率)編 ==框’以更低位元速率(例如,四分之—速率)編碼 —、:1以中間位元速率(例如,半速率)或以更高位 70速率(例如,全速率)編碼有聲訊框。 人2展示編碼方案選擇㈣之實施肋可心根據訊框 3f的話音之類型選擇編碼特定訊框的位元速率之決策樹 二實例。在其他情形下,經選擇用於特定訊框之位元速 率亦可視諸如所要平均位元速率、在一系列訊框上之所要 =速率型式(其可用以支援所要平均位元速率)及/或經選 擇用於先前訊框之位元速率之準則而定。 在替代例中,可能需要組態話音編碼器X10以使 + 7㈣式來編碼不同類型之話音訊框。此種操作稱 二多重模式編碼,,。舉例而言,有聲話音之訊框傾向於具 月(亦即’繼續一個以上之訊框週期)之週期性結 傲 gn 且使用編碼此長期頻譜特徵之描述的編碼模 、碼有聲讯框(或有聲訊框之序列)通常係更加有效 種編竭模式之實例包括CELP、PWI及ρρρ。另一方 134861.doc 200947422 面,無聲訊框及非有作用訊框通常缺少任何顯著長期頻譜 特徵,且話音編碼器可經組態以使用諸如NELP之不嘗試 描述此種特徵的編碼模式來編碼此等訊框。 可能需要實施話音編碼器XI 0以使用多重模式編碼,以 使得訊框根據基於(例如)週期性或發音之分類使用不同模 式進行編碼。亦可能需要實施話音編碼器X10以針對不同 類型之有作用訊框使用位元速率與編碼模式之不同組合 (亦稱為”編碼方案”)。話音編碼器XI 0之此種實施例之一 ® 實例針對含有有聲話音之訊框及轉變訊框使用全速率 CELP方案,針對含有無聲話音之訊框使用半速率NELP方 案,且針對非有作用訊框使用八分之一速率NELP方案。 話音編碼器XI 0之此種實施例的其他實例支援用於一或多 個編碼方案之多重編碼速率,諸如全速率及半速率CELP 方案及/或全速率及四分之一速率PPP方案。多重方案編碼 器、解碼器及編碼技術之實例描述於(例如)標題為 "METHODS AND APPARATUS FOR MAINTAINING A TARGET ^ BIT RATE IN A SPEECH CODER"的美國專利第 6,330,532號中及 標題為"VARIABLE RATE SPEECH CODING"之美國專利第 6,691,084號中;及標題為"CLOSED-LOOP VARIABLE-RATE MULTIMODE PREDICTIVE SPEECH CODER"之美國專利申請 案第 09/191,643號中及標題為"ARBITRARY AVERAGE DATA RATES FOR VARIABLE RATE CODERS"之美國專利申請案第 11/625,788號中。 圖1B展示包括有作用訊框編碼器30之多項實施例30a、 134861.doc •20· 200947422 3〇b的話音編碼器χι〇之實施例χ2〇的方塊圖。編碼器3〇a ,’里組態以使用第一編碼方案(例如,全速率CELP)編碼第一 類有作用訊框(例如,有聲訊框),且編碼器3〇b經組態以使 用具有與第一編碼方案不同之位元速率及/或編碼模式之 第二編碼方案(例如,半速率NELp)來編碼第二類有作用訊 框(例如,無聲訊框)。在此情形下,選擇器52&及52b經組 態以根據由編碼方案選擇器22產出之具有兩個以上可能狀 ⑥的編碼方案選擇信號之狀態在各種訊框編碼器中進行選 ©擇。明確地揭示,話音編碼器χ2〇可以支援自有作用訊框 編碼器30之兩個以上不同實施例中進行選擇之方式進行擴 展。 話音編碼器Χ20之訊框編碼器中的一或多者可共用共同 構舉例而'^,此種編碼器可共用LPC係數值之計算器 (可能經組態以針對不同類之訊框產出具有不同階數之結 果I/但具有分別不同之時間描述計算器。舉例而言,編 _ 碼器3〇a及301?可具有不同激勵信號計算器。 h圖1B中所展示’話音編瑪器㈣亦可經實施以包括雜 訊抑制HH)。雜訊抑制器難組態及配置以對音訊信號 Sl〇執行雜訊抑制操作。此種操作可支援編碼方案選擇器 2〇對有作用與非有作用訊框之間的改良辨別及/或有作用 訊框編碼器30及/或非有作用訊框編碼器4〇之更佳編碼結 果雜訊抑制器1〇可經組態以將不同各別增益因數應用至 音訊信號之兩個或兩個以上不關率頻道中之每一者,其 中每一頻道之增益因數可基於頻道的雜訊能量或⑽之估 134861.doc -21 - 200947422 計。如與時域相對,可能需要在頻域中執行此種增益控 制’且此種組態之一實例描述於上文提及之3gPP2標準文 件C.S0014-C之章節4.4.3中。或者,雜訊抑制器1〇可經組 態以可能在頻域中將調適性濾波應用至音訊信號。歐洲電 信標準協會(ETSI)文件ES 202 0505 vl.l.5(2007年1月,以 wWW.etsi.org線上可得)之章節5丨描述自非有作用訊框估計 雜訊頻譜且基於所計算之雜訊頻譜對音訊信號執行兩階段 梅爾維納(mel-warped Wiener)濾波的此種組態之實例。 © 圖3 A展示根據一般組態之裝置χ i 〇 〇之方塊圖(亦稱為編 碼器、編碼裝置或用於編碼之裝置)。裝置XI00經組態以 自音訊信號S1 0移除現存背景聲音且將其取代為可能類似 或不同於現存背景聲音之所產生背景聲音。裝置X100包括 經組態及配置以處理音訊信號s丨〇以產出背景聲音增強音 矾信號S15之背景聲音處理器1〇〇。裝置χι〇〇亦包括話音編 碼器Xl0之實施例(例如,話音編碼器Χ20),其經配置以編 ❹馬者景聲音增強音訊信號s i 5以產出經編碼音訊信號。 包括諸如蜂巢式電話之裝置xioo的通信器件可經組態以在 將尨編碼音訊信號S2〇傳輸於有線、無線或光學傳輪頻道 (例如,藉由一或多個载波之射頻調變)中之前對經編碼音 訊信號S20執行進一步處理操作,諸如錯誤校正、冗餘及/ 或協疋(例如,以太網路、TCP/IP、CDMA2000)編碼。 圖3B展不背景聲音處理器1〇〇之實施例1〇2之方塊圖。背 尽聲3處理器102包括經組態及配置以抑制音訊信號Sl〇之 背牙、聲音分量以產出背景聲音受抑制音訊信號S13之背景 134861.doc -22- 200947422 聲音抑制器m。背景聲音處理器⑽亦包括經組態以根據 背景聲音選擇信號S40之狀態產出所產生背景聲音信號“ο 之背景聲音產生器12〇。背景聲音處理器1〇2亦包括:經組態 及配置以混合背景聲音受抑制音訊信號Sl3與所產生背景 聲音信號S50以產出背景聲音增強音訊信號su之背景聲音 混合器190。 曰 如Z3B中所示,背景聲音抑制器110經配置以在進行編 碼之則自音訊信號抑制現存背景聲音。背景聲音抑制器 ® 可實施為如上文所描述之雜訊抑制器1G的更加冒進之
版本(例如,藉由使用一或多個不同臨限值)。其他或另 外,背景聲音抑制器110可經實施以使用來自兩個或兩個 以上麥克風之音訊信號以抑制音訊信號s 1 〇之背景聲音分 量。圖3G展示包括背景聲音抑制器11〇之此種實施例 的背景聲g處理器1 〇2之實施例1 〇2A的方塊圖。背景聲音 抑制器110A經組態以抑制音訊信號sl〇之背景聲音分量, 舉例而。,其係基於由第一麥克風產出之音訊信號。背景 聲音抑制器110A經組態以藉由使用基於由第二麥克風產出 之音訊信號之音訊信號SA1(例如,另一數位音訊信號)而 執行此種操作。多重麥克風背景聲音抑制之合適實例揭示 於(例如)代理人案號為061521的標題為”APPARATUS AND METHOD OF NOISE AND ECHO REDUCTION"(Choy等人) 之美國專利申請案第11/864,906號中,及代理人案號為 080551之標題為"SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION"(Visser等人)的美國專利申請 134861.doc •23- 200947422 案第12/037,928號中。背景聲音抑制器u〇之多重麥克風實 施例亦可經組態以向編瑪方案選擇器2〇之相應實施例提供 資訊,用於根據(例如)代理人案號為〇61497之標題為 "MULTIPLE MICROPHONE VOICE ACTIVITY DETECTOR- (Ch〇y等人)的美國專利申請案第11/864,897號中揭示之技 術而改良話音作用性偵測效能。 圖3C至圖3F展示兩個麥克風K1〇及K2〇在包括裝置χι〇〇 之此種實施例(諸如蜂巢式電話或其他行動使用者終端機) ® $可攜式器件中或經組態以經由向此種可攜式器件之有線 或無線(例如,藍芽)連接進行通信的諸如耳機或頭戴式耳 機之免提式器件中之各種安裝組態。在此等實例中,麥克 風Κ10經配置以產出主要含有話音分量(例如,音訊信號 S10之類比前驅物)之音訊信號,且麥克風Κ2〇經配置以產 出主要含有背景聲音分量(例如,音訊信號SA1之類比前驅 物)之音訊信號。圖3(:展示麥克風K1〇安裝於器件之正面之 後且麥克風Κ20安裝於器件之頂面之後的配置之一實例。 =3D展示麥克風Κ10安裝於器件之正面之後且麥克風κ2〇 安裝於器件之側面之後的配置之一實例。圖托展示麥克風 κιο女裝於器件之正面之後且麥克風Κ2〇安裝於器件之底 面之後的配置之一實例。圖3F展示麥克風κ1〇安裝於器件 之正面(或内面)之後且麥克風Κ20安裝於器件之背面(或外 面)之後的配置之一實例。 背景聲音抑制器U〇可經組態以對音訊信號執行頻譜相 減操作。頻譜相減可預期抑制具有固定統計量之背景聲音 134861.doc •24- 200947422 分量,但對於抑制非固定之背景聲音可能無效。頻譜相減 可使用於具有一個麥克風之應用中以及來自多重麥克風之 信號可用之應用中。在一典型實例中,背景聲音抑制器 110之此種實施例經組態以分析音訊信號之非有作用訊框 以導出現存背景聲音之統計學描述,諸如眾多副頻帶(亦 稱為"頻率組")中之每一者中之背景聲音分量之能量等級, 且將相應頻率選擇性增益應用至音訊信號(例如,以基於 相應背景聲音能量等級衰減副頻帶中之每一者上之音訊信 φ 號)。頻譜相減操作之其他實例描述於s. F. Boll之 "Suppression of Acoustic Noise in Speech Using Spectral Subtraction,"(IEEE Trans. Acoustics, Speech and Signal Processing, 27(2): 112-120,1979 年 4 月)中;R. Mukai, S. Araki,H. Sawada 及 S. Makino 之”Removal of residual crosstalk components in blind source separation using LMS filters,"(Proc. of 12th IEEE Workshop on Neural Networks for Signal Processing,第 435-444 頁,Martigny,Switzerland, ® 2002 年 9 月)中;及 R. Mukai, S. Araki,H. Sawada及 S.
Makino 之"Removal of residual cross-talk components in blind source separation using time-delayed spectral subtraction,"(Proc. of ICASSP 2002,第 1789-1792 頁, 2002年5月)中。 另外或在替代實施例中,背景聲音抑制器110可經組態 以對音訊信號執行盲源分離(BSS,亦稱為獨立分量分析) 操作。盲源分離可用於信號自一或多個麥克風(除了用於 134861.doc -25- 200947422 捕獲音訊信號S10之麥克風之外)可得之應用中。盲源分離 可預期抑制固定之背景聲音以及具有非固定統計量之背景 聲音。描述於美國專利6,167,417(Parra等人)中之BSS操作 之一實例使用梯度下降法來計算用以分離源信號之濾波的 係數。BSS操作之其他實例描述於S· Amari,A. Cichocki及H. H. Yang之"A new learning algorithm for blind signal separation," (Advances in Neural Information Processing Systems 8, MIT Press, 1996)中;L. Molgedey及H. G. Schuster之"Separation of a mixture ❿ of independent signals using time delayed correlations," (Phys. Rev. Lett., 72(23): 3634-3637, 1994)中;及 L. Parra及 C. Spence 之 "Convolutive blind source separation of non-stationary sources," (IEEE Trans, on Speech and Audio Processing, 8(3): 320-327, 2000年5月)中。另外或在上文論述之實施例的替代例中, 背景聲音抑制器1〇〇可經組態以執行波束成形操作。波束 成形操作之實例揭示於(例如)上文提及之美國專利申請案 第11/864,897號(代理人案號061497)中及11.8&1*11评&1&1'丨等人 m w 之"Blind Source Separation Combining Independent Component
Analysis and Beamforming," (EURASIP Journal on Applied Signal Processing, 2003:11,1135-1146 (2003))中。 彼此靠近地定位之麥克風(諸如安裝於諸如蜂巢式電話 或免提式器件之護罩之共同外殼内之麥克風)可產出具有 高瞬時相關之信號。一般熟習此項技術者亦將認識到,一 或多個麥克風可置放於共同外殼(亦即,整個器件之護罩) 内之麥克風外殼中。此種相關可降級BSS操作之效能,且 134861.doc -26- 200947422 在種it形下可能需要在Bss操作之前解相關音訊信號。 解相關亦通常對於回音消除為有效的。解相關器可實施為 ==更少之抽頭(UP)或甚至三個或更少之抽頭的渡 ^ b m慮波器)。此種遽波器之抽頭權重可為 固疋的,或可根據輸入音訊信號之相關性進行選擇,且可 需要使用格㈣波器結構來實施解相關濾波器 ^❹⑽之此種實施例可經組態以對音訊信號的兩個 或兩個以上不[g] S丨#姓 ❹ φ 曰頻帶中之母一者執行分離的解相關操 作0 背景聲音抑制器110之實施例可經組態以在Bss操作之後 至^對經分離話音分量執行一或多個額外處理操作。舉例 可能需要背景聲音抑制器】】。至少對經分離話音分 解相關操作。可單獨地對經分離話音分量之兩個或 兩個以上不同副頻帶中之每一者執行此種操作。 έ能、Γ在替代例中,背景聲音抑制器1 ig之實施例可經 二基於經分離背景聲音分量對經分離話音分量執行非 諸如頻譜相減。可進-步自話音分量抑制 子’'曰之頻谱相減可根據經分離背景聲音分量之相 應副頻帶之等級而實施為隨時間變化之頻率選擇性增益。 另外或在替代例中,背景聲音抑制器110之實施例可經 ^態以對經分離話音分量執行令心截波操作。此種操作通 應用至與信號等級及/或話音作用性等級成比例 時間變化之信號°中心截波操作之-實例可表達為 對於ixMKC’o;否則,x[n]},其入 134861.doc •27· 200947422 本,y[n]為輸屮接_ ,且C為截波臨限值。中心截波操 之另一實例可矣、去A 、 衣建為y[n]={對於|x[n]丨<c,〇 ;否則, 啊刚跑n]|_C)},其中哪刚)指示χ[η]之正負號。 J能需要組態背景聲音抑制器U0以實質上完全自音訊 乜號移除現存背景聲音分量。舉例而言,可能需要裝置 Χ100用不同於現存 r 1 祝仔者景聲音分董之所產生背景聲音信號 =取量代現存背景聲音分量。在此種情形下,現存背景聲 量之實質上元全移除可能有助於減少經解碼音訊信號 巾現存背景聲音分量與取代背景聲音信號之間的可聽見的 ^ 另實例中,可能需要裝置X100經組態以隱藏現 '、聲曰77量,不官是否亦將所產生背景聲音信號S50 相加至音訊信號。 , '可能需要將背景聲音處理器100實施為可在兩個或兩個 '不同操作模式之間組態。舉例而言,可能需要提供 ⑷第—操作模式’其中背景聲音處理器1G0經組態以在現 ❿ 者景聲曰为里實質上保持不變地情形下傳遞音訊信號, 及(B)第一操作模式,其中背景聲音處理器i00經組態以實 質上完全移除現存背景聲音分量(可能將其取代為所產生 背景聲音信號S50)。對此種第一操作模式之支援(其可組 “為預叹模式)可能可使用於允許包括裝置X100的器件之 回溯相容性。在第一操作模式中,背景聲音處理器100可 銓組態以對音訊信號執行雜訊抑制操作(例如,如上文關 於雜訊抑制器10所描述)以產出雜訊受抑制音訊信號。 老景聲音處理器100之另外實施例可類似地經組態以支 13486I.doc • 28- 200947422 援兩個以上操作模式。與 ^ 牛例而言,此另外實施例可為可組 …以根據在自至少實質上無背景聲音抑制(例如,僅雜 訊抑制)至部分背景聲音抑制至至少實質 抑制之範圍中的三個式一加 没京耸曰 —個或二個以上模式中之可選模式而改變 現存背景聲音分量受抑制之程度。 Φ ❹ 圖4Α展不包括背景聲音處理器100之實施例104的裝置 χι〇〇之實施例χι〇2的方塊圖。背景聲音處理器1〇4經組態 以根據處理控制信號S3G之狀態而以上文插述的兩個或兩 個以上模式中之—者進行操作。處理控制信號S30之狀態 可由使用者控制(例如,經由圖形使用者介面、開關或其 他控制介面)’或者可由處理控制產生器340(如圖16中所說 明)產生包括諸如表之將一或多個變數(例如,實體位置、 細作模式)的不同值與處理控制信號S3〇之不同狀態相關聯 的索引資料結構之處理控制信號S3〇。在一實例中,處理 控制信號S30實施為二元值信號(亦即,旗標),其狀態指 不將傳遞還是抑制現存背景聲音分量。在此種情形下,背 景聲曰處理器1 〇4可以第一模式進行組態以藉由停用其元 件中之—或多者及/或自信號路徑移除此等元件(亦即,允 許音訊信號繞過此等元件)而傳遞音訊信號81〇,且可以第 一模式進行組態以藉由啟用此種元件及/或將其插入於信 號路徑中而產出背景聲音增強音訊信號S15。或者,背景 聲音處理器104可以第一模式進行組態以對音訊信號S10執 行雜訊抑制操作(例如,如上文關於雜訊抑制器1〇所描 述)’且可以第二模式進行組態以對音訊信號S10執行背景 134861.doc • 29- 200947422 聲音取代操作。在另一實例中’處理控制信號請具有兩 個以上可能狀態,每一狀態對應於背景聲音處理器之在自 =實質上無背景聲音抑制(例如’僅雜訊抑制)至部分背 景聲曰抑制至至少實質上完全的背景聲音抑制之範圍中的 二個或二個以上操作模式中之不同模式。 ❹ 旦Γ立ΒΓ背景聲音處理器104之實施例106之方塊圖。背 :::處理器106包括背景聲音抑制器110之實施例112, 制器112經組態以具有至少兩個操作模式:第 m ,、中貪景聲音抑制器n2經組態以在現存背 :隹"σ量實質上保持不變之情形下傳遞音訊信號S10, 插作模式’其中背景聲音抑制器112經組態以實質 =全自音訊信號S1Q移除現存背景聲音分 出:景聲音受抑制音訊信號叫可能需要實施背景4 施皆导棼立心 -操作模式為預設模式。可能需要實 #景聲θ抑制器112以在第-操作模式中對音訊信號執 抑制操作(例如,如上文關於雜訊抑制器丨。所描:) 以產出雜訊受抑制音訊信冑。 士背景聲音抑制器112可經實施以使得在其第-操作模式 繞過經組態以對音訊信號執行背景聲音抑制操作之一 或多個二件(例如’一或多個軟體及/或勒體常式)。其他或 另外’背景聲音抑制器112可經實施以藉由改變此錄香县 整咅;to *丨i I J 乂員她以稭由改變此種背景 、(例如,頻譜相減及/或BSS操作)之一或多個 臨限值而以不间描“ v X次多個 作。舉例而言,背景聲音抑制 、式進行組態以應用第一組臨限值來執行 134861.doc -30- 200947422 雜訊抑制操作,且可以第二模式進行組態以應用第二組臨 限值來執行背景聲音抑制操作。 處理控制信號S30可用以控制背景聲音處理器1〇4之一或 夕個其他元件。圖4B展示經組態以根據處理控制信號S30 之狀態進行操作的背景聲音產生器120之實施例122的實 例。舉例而言’可能需要根據處理控制信號S30之相應狀 態將背景聲音產生器122實施為經停用(例如,以減少功率 消耗)或以其他方式防止背景聲音產生器122產出所產生之 φ #景聲e信號S5〇。另外或其他,可能需要根據處理控制 仏號S30之相應狀態將背景聲音混合器19〇實施為經停用或 繞過’或以其他方式防止背景聲音混合器190混合其輸入 音訊信號與所產生背景聲音信號S50。 如上所述,話音編碼器χ丨〇可經組態以根據音訊信號 S10之或多個特性自兩個或兩個以上訊框編碼器中進行 選擇。同樣,在裝置Xi 00之實施例内,可不同地實施編碼 方案選擇器20以根據音訊信號請、背景聲音受抑制音訊 信號S13及/或背景聲音增強音訊信號S15之一或多個特性 產出編碼器選擇信號。圖5A說明此等信號與話音編碼器 X10之編碼器選擇操作之間的各種可能之相依性。圖6展示 裝置X100之特定實施例Χ110之方塊圖,其中編碼方案選 擇器20經組態以基於背景聲音受抑制音訊信號sn(如圖从 中之點B所指示)之一或多個特性(諸如訊框能量、兩個或 兩個以上不同頻帶中之每一者之訊框能量、snr、週期 性、頻譜傾斜及/或過零率)產出編碼器選擇信號。明確地 134861.doc 31 · 200947422 Z期且特此揭示’圖5A及圖6中建議之裝置綱的各種實 施:中之任—者亦可經組態以包括根據處理控制信號 ;如如闕於圖4A、圖4B所指述)的狀態及/或三個或 二個以上訊框編碼器(例如,如關於圖a所描述)㈣一者 之選擇來控制背景聲音抑制器110。 =需要實施裝置Xl00以將雜訊抑制及背景聲音抑制作
器100 ^作而執订。舉例而言,可能需要將背景聲音處理 之實施例添加至具有話音編碼器X20的現存實施例之 勺紅’而不移除m繞過雜訊抑制器10。圖5B說明在 之裝置χι〇〇的實施例中在基於音訊信號 編碼器心的編鳴器選擇操作之間的各種 L之相依性。圖7展示裝置幻00之特定實施例之方 裝置Χ120中編碼方案選擇器20經組態以基於雜訊 ^制曰訊信號si2(如圖5Β中之點Α所指示)之一或多個特 =❹訊框能量、兩個或兩個以上不同頻帶中之每一者 總訊框此量、SNR、週期性、頻譜傾斜及/或過零率)產出 ==信號。明確地預期且特此揭示,_及圖7t 括祀棱卢Xl00的各種實施例中之任一者亦可經组態以包 =艮據處理控制信號S30(例如,如關於圖4八、圖衝斤插 /的狀態及/或三個或三個以上訊框編碼 圖:;::r的-者之選擇來控制背景聲音抑制器": /景聲音抑制器⑽亦可經組態以包括雜訊抑制器10, s 了以其他方式可選擇地進行組態以對音訊信號si〇執广 雜訊抑制。舉例而t ’可能需要襄置X1。。根據處理控制: 13486I.doc -32- 200947422 號S30之狀態執行背景聲 自立訊作㈣… (其中現存背景聲音實質上 曰5 凡全移除)或者雜訊抑制(1中現存背f聲 音實質上保持不變)。一般而+⑪』。、中現存方景聲 . .. . D ’者景聲音抑制器110亦可 經組態以在執行背景聲音 ^^ p制之則對音訊信號S10及/或在 執灯方景聲音抑制之後對 无耵所传s訊抬號執行一或多個其他 處理操作(諸如濾波操作)。 Ο ❹ 如上所述,現存話音編碼器通常使用低位元速率及/或 DTX來編碼非有作心框。因此,經編碼非有作用訊框通 常含有極少背景聲音資訊。視由背景聲音選擇信號請指 不之特定背景聲音及/或背景聲音產生器12〇之特定實施例 而定’所產生背景聲音信號S5〇之聲音品質及資訊内容可 能大於原始背景聲音之聲音品質及資訊内容。在此種情形 下可需要使用比用來編碼僅包括原始背景聲音之非有 作用訊框的位元速率高之位元速率來編碼包括所產生背景 聲音信號S50的非有作用訊框。圖8展示包括至少兩個有作 用訊框編碼器30a、30b及編碼方案選擇器2〇及選擇器 50a、50b之相應實施例的裝置χι〇〇之實施例χΐ3〇的方塊 圖。在此實例中,裝置Χ13〇經組態以基於背景聲音增強信 號(亦即’在將所產生背景聲音信號S50相加至背景聲音受 抑制音訊信號之後)執行編碼方案選擇。儘管此種配置可 能導致語音作用性之錯誤偵測,但其在使用較高位元速率 來編碼背景聲音增強靜寂訊框之系統中亦可能係合意的。 明確地指出,如關於圖8所描述之兩個或兩個以上有作 用訊框編碼器及編碼方案選擇器20及選擇器50a、50b的相 134861.doc -33- 200947422 應實施例之特徵亦可包括於本文揭示之裝置X100的其他實 施例中。
背景聲音產生器120經組態以根據背景聲音選擇信號S4〇 之狀態產出所產生背景聲音信號S50。背景聲音混合器190 經組態及配置以混合背景聲音受抑制音訊信號s丨3與所產 生背景聲音信號S50以產出背景聲音增強音訊信號815〇在 一實例中’背景聲音混合器190實施為經配置以將所產生 背景聲音信號S50相加至背景聲音受抑制音訊信號sn之加 法器。可能需要背景聲音產生器i 2〇以可與背景聲音受抑 制音訊信號相容之形式產出所產生背景聲音信號S5〇。在 裝置X100之典型實施例中,舉例而言’所產生背景聲音信 號S50及由背t聲音抑制器11〇產出之音訊信號兩者皆為 PCM樣本之序列。在此種情形下,f景聲音混合器19〇可 經組態以#所產生背景聲音信號S5G與背景聲音受抑制音 訊信號SU(可能作為基於訊框之操作)之相應樣本對相 加’但亦可能實施背景聲音混合器19〇以對具有不同取樣 解析度之&號進行相加。音訊信號siq通常亦實施為p⑽ 樣本之序Θ纟_些情形下’背景聲音混合器剛經組態 以對背景聲音增強作缺拥> 強乜旎執仃一或多個其他處理操作(諸如 濾波操作)。 皮景聲日選擇仏號S4〇指示兩個或兩個以上背景聲音中 的至少一者之選挥。+ 一 擇在—實例中,背景聲音選擇信號S40 現?背景聲音之-或多個特徵之背景聲音選擇。 ’ °背景聲音選擇信號S4〇可係基於關於音訊信號 134861.doc 34 200947422 SI 0之一或多個非有作用訊框的一或多個時間及/或頻率特 性之資訊。編碼模式選擇器20可經組態而以此種方式產出 背景聲音選擇信號S40。或者,裝置XI00可經實施以包括 經組態而以此種方式產出背景聲音選擇信號S40之背景聲 音分類器320(例如,如圖7中所展示)。舉例而言,背景聲 音分類器可經組態以執行基於現存背景聲音之線頻譜頻率 (LSF)的背景聲音分類操作,諸如El-Maleh等人之吓以11^-level Noise Classification in Mobile Environments," (Proc. IEEE 〇 Int'l Conf. ASSP, 1999,第 I卷,第 237-240頁);美國專利第 6,782,361 號(El-Maleh 等人);及 Qian 等人之"Classified Comfort Noise Generation for Efficient Voice Transmission," (Interspeech 2006,Pittsburgh,PA,第 225-228 頁)中描述的彼 等操作。 在另一實例中,背景聲音選擇信號S40指示基於諸如關 於包括裝置X100之器件的實體位置之資訊(例如,基於自 全球定位衛星(GPS)系統獲得,經由三角測量或其他測距 ® 操作計算,及/或自基地台收發器或其他伺服器接收之資 訊)的一或多個其他準則之背景聲音選擇、使不同時間或 時間週期與相應背景聲音相關之排程,及使用者選擇之背 景聲音模式(諸如商務模式、舒緩模式、聚會模式)。在此 等情形下,裝置XI〇〇可經實施以包括背景聲音選擇器 330(例如,如圖8中所展示)。背景聲音選擇器330可經實施 以包括將不同背景聲音與上文提及之諸如準則的一或多個 變數之相應值相關聯的一或多個索引資料結構(例如, 134861.doc -35- 200947422 表p在另一實例中,背景聲音選擇信號S40指示一列兩個 或兩個以上背景聲音中的一者之使用者選擇(例如,自諸 如選單之圖形使用者介面)。背景聲音選擇信號S40之另外 之實例包括基於上文實例的任何組合之信號。 圖9A展示包括背景聲音資料庫〗3〇及背景聲音產生引擎 140之背景聲音產生器120的實施例122之方塊圖。背景聲 音資料庫120經組態以儲存描述不同背景聲音之多組參數 值。背景聲音產生引擎140經組態以根據根據背景聲音選 擇#破S40之狀態而選擇的一組所儲存之參數值來產生背 景聲音。 圖9B展示背景聲音產生器122之實施例124之方塊圖。在 此實例中’背景聲音產生引擎140之實施例144經組態以接 收背景聲音選擇彳5號840,且自背景聲音資料庫13〇的實施 例134擷取相應組之參數值。圖9C展示背景聲音產生器122 之另一實施例12 6之方塊圖。在此實例中,背景聲音資料 庫130之實施例1 36經組態以接收背景聲音選擇信號mo, 且將相應組之參數值提供至背景聲音產生引擎14〇之實施 例 14 6 〇 背景聲音資料庫130經組態以儲存兩個或兩個以上組之 描述相應背景聲音之參數值。背景聲音產生器12〇之其他 實施例可包括背景聲音產生引擎140之實施例,背景聲音 產生引擎14〇之該實施例經組態以自諸如伺服器之内容提 供者或其他非本端資料庫或自同級式網路(例如,如cheng 等人之 ”A Collaborative Privacy-Enhanced Alibi Ph〇ne,,,(Proc. lnt,l 134861.doc •36- 200947422
Conf. Grid and Pervasive C〇mputing ,第4〇5 414頁,丁以仏如§ TW,2006年5月)中所描述)下載對應於所選背景聲音之一 組參數值(例如,使用會話起始協定(SIp)之一版本,如當 前在1^0 3261中所描述,其以^¥%1丨6比〇%線上可得)。田 背景聲音產生器120可經組態而以經取樣之數位信號形 式(例如,如PCM樣本之序列)擷取或下載背景聲音。然 而,由於儲存及/或位元速率限制,此種背景聲音可能將 遠遠短於典型通信會話(例如,電話呼叫),從而要求在呼 ® 叫期間反覆不斷地重複相同背景聲音且導致對於收聽者而 5不可接爻地分散注意力之結果。或者,可能將需要大量 儲存及/或高位元速率下載連接以避免過度重複之結果。 或者,背景聲音產生引擎1 4〇可經組態以自諸如一組頻 譜及/或能量參數值之所擷取或所下載參數表示而產生背 景聲音。舉例而言,背景聲音產生引擎14〇可經組態以基 於可包括於SID訊框中之頻譜包絡(例如,LSF值之向量)的 描述及激勵信號的描述而產生背景聲音信號S5〇之多個訊 框。月景聲曰產生引擎140之此種實施例可經組態以逐訊 框地隨機化參數值之組以減小對所產生背景聲音的重複之 覺察。 可能需要背景聲音產生引擎140基於描述聲音結構 (sound texture)之範本產出所產生背景聲音信號S5〇。在一 此種實例中’背景聲音產生引擎140經组態以基於包括複 數個不同長度之自然顆粒之範本執行顆粒合成。在另一實 例中’背景聲音產生引擎140經組態以基於包括級聯時間 134861.doc -37- 200947422 頻率線性預測(CTFLP)分析(在CTFLp分析中,原始信號在 頻域中使用線性預測進行模型化,且此分析之剩餘部分接 著在頻域中使用線性預測進行模型化)之時域及頻域係數 的範本執行CTFLP合成。在另一實例中,背景聲音產生引 擎140經組態以基於包括多重解析分析(MRA)樹之範本執 行多重解析合成,該多重解析分析(MRA)樹描述至少一基 底函數在不同時間及頻率標度處之係數(例如,諸如多貝 西(Daubechies)按比例調整函數之按比例調整函數之係 ® 數,及諸如多貝西小波函數之小波函數之係數)。圖10展 示基於平均係數及詳細係數之序列的所產生背景聲音信號 S50之多重解析合成之一實例。 可忐需要背景聲音產生引擎14〇根據語音通信會話之預 期長度產出所產生背景聲音信號S5〇。在一此種實施例 中,背景聲音產生引擎M0經組態以根據平均電話呼叫長 度產出所產生背景聲音信號S50。平均呼叫長度之典型值 在一至四分鐘之範圍中,且背景聲音產生引擎140可經實 施以使用可根據使用者選擇而變化之預設值(例如,兩分 鐘)。 可能需要背景聲音產生引擎140產出所產生背景聲音信 號S50以包括基於相同範本之若干或許多不同背景聲音信 號截波。所要數目之不同截波可設定為預設值或由裝置 X100之使用者選擇,且此數目之典型範圍為五至二十。在 -此種實例中,背景聲音產生引擎14()經組態以根據基於 平均呼叫長度及不同截波之所要數目的截波長度計算不同 134861.doc •38- 200947422 截波中之每一者。截波長度通常比訊框長度大一、二成二 個數量級。在一實例中,平均呼叫長度值為兩分鐘,不同 截波之所要數目為十,且藉由將兩分鐘除以十而計算截波 長度為十二秒》 ' 在此等情形下,冑景聲音產生引擎140可經組態以產生 $要數目之不同截波(其各自係基於相同範本且具有所計 算之截波長度),〖串連或以其他方式組合此等截波以產 出所產生背景聲音信號S5〇。背景聲音產生引擎140可經組 ®〜、乂重複所產生背景聲音信號S5〇(若必要)(例如,若通信 之長度應超過平均呼叫長度)。可能需要組態背景聲音產 生引擎140以根據音訊信號sl〇自有聲至無聲訊框之轉變產 生新截波。 圖9D展示用於產出所產生背景聲音信號S5〇之可由背景 聲音產生引擎140的實施例執行之方法M1〇〇的流程圖。任 務丁100基於平均呼叫長度值及不同截波之所要數目計算戴 ©波長度。任務T200基於範本產生所要數目之不同截波。 務T300組合截波以產出所產生背景聲音信號S5〇。 任務T200可經組態以自包括MRA樹之範本產生背景聲音 信號截波。舉例而言’任務T200可經組態以藉由產生統計 學上類似於範本樹之新MRA樹且根據該新樹合成背景聲音 信號载波而產生每一截波。在此種情形下,任務T200可經 組態以將新MRA樹產生為範本樹之複本,其中—或多個 (可能全部)序列之一或多個(可能全部)係數由具有類似袓 系體(ancestor)(亦即,在更低解析度下之序列中)及/或前體 134861.doc -39- 200947422 (predeCessor)(亦即’在相同序列中)的範本樹之其他係數 取代。在另一實例中’任務T200經組態以根據藉/由向範本 係數值組的複本之每一值加上小隨機值而計算的新係數值 組產生每一戴波。 任務T200可經組態以根據音訊信號S10及/或基於其之信 號(例如,信號S12及/或S13)的一或多個特徵而按比例調整 背景聲音信號截波中之一或多者(可能全部)。此等特徵可 包括信號等級、訊框能量、SNR、一或多個梅爾頻率倒譜 〇 係數(MFCC)及/或對信號之語音作用性偵測操作之一或多 個結果。對於任務T200經組態以自所產生之樹合成截 波之情形而言,任務T200可經組態以對所產生MRA樹之係 數執行此種按比例調整。背景聲音產生器12〇之實施例可 經組態以執行任務T200之此種實施例。另外或在替代例 中,任務T300可經組態以對經組合之所產生背景聲音信號 執行此種按比例調整。背景聲音混合器19〇之實施例可經 組態以執行任務T3 00之此種實施例。 任務T300可經組態以根據相似性之量測組合背景聲音信 號戴波。任務T300可經組態以串連具有類似mfcc向量之 截波(例如’以根據候選截波組上之MFCC向量之相對相似 性串連截波)。舉例而言,任務T2〇0可經組態以最小化相 鄰截波之MFCC向量之間的在經組合載波串上計算的總距 離。對於任務T200經組態以執行CTFLP合成之情形而言, 任務T300可經組態以串連或以其他方式組合自類似係數產 生之截波。舉例而言,任務T2〇〇可經組態以最小化相鄰截 134861.doc •40- 200947422 波之LPC係數之間的在經組合截波串上計算的總距離。任 務T300亦可經組態以串連具有類似邊界瞬變之截波(例 如,以避免自一截波至下一截波之可聽見的不連續性)。 舉例而言,任務T200可經組態以最小化相鄰截波之邊界區 域上的能量之間的在經組合截波串上計算的總距離。在此 等實例中之任一者中,任務T300可經組態以使用疊加 (overlap-and_add)或交互混疊(cross-fade)操作(而非串連)來 組合相鄰截波。 © 如上文所描述,背景聲音產生引擎140可經組態以基於 可以允許低儲存成本及擴展非重複產生之緊密表示形式下 載或擷取的聲音結構之描述而產出所產生背景聲音信號 S50。此等技術亦可應用於視訊或視聽應用。舉例而言, 裝置X100之具有視訊能力的實施例可經組態以執行多重解 析合成操作以增強或取代視聽通信之視覺背景聲音(例 如,背景及/或照明特性)。 背景聲音產生引擎140可經組態以貫穿通信會話(例如, ® 電話呼叫)重複地產生隨機MRA樹。由於可預期較大樹需 要較長時間產生,故可基於延遲容許度選擇MRA樹之深 度。在另一實例中,背景聲音產生引擎14〇可經組態以使 用不同範本產生多個短MRA樹,及/或選擇多個隨機MRA 樹’且混合及/或串連此等樹中之兩者或兩者以上以獲得 樣本之較長序列。 可能需要組態裝置X100以根據增益控制信號S90之狀態 控制所產生背景聲音fs號S 5 0之等級。舉例而言,背景聲 134861.doc -41 - 200947422 音產生器120(或其元件,諸如背景聲音產生引擎14〇)可經 組態以根據增益控制信號S90之狀態(可能藉由對所產生背 景聲音信號S50或對信號S50的前驅物執行按比例調整操作 (例如’對範本樹或自範本樹產生之Mra樹之係數))在特定 等級上產出所產生背景聲音信號S5〇。在另一實例中,圖 1 3A展示包括按比例調整器(例如,乘法器)之背景聲音混 合器190的實施例192之方塊圖,該按比例調整器經配置以 根據增益控制信號S90之狀態對所產生背景聲音信號S5〇執 © 行按比例調整操作。背景聲音混合器192亦包括經組態以 將經按比例調整之背景聲音信號相加至背景聲音受抑制音 訊信號S13之加法器。 包括裝置X1 00之器件可經組態以根據使用者選擇來設定 增益控制信號S90之狀態。舉例而言,此種器件可裝備有 曰量控制(例如’開關或旋紐,或提供此種功能性之圖形 使用者介面),器件之使用者可藉由該音量控制選擇所產 生背景聲音信號S50之所要等級。在此情形下,器件可經 組態以根據所選等級設定增益控制信號S9〇之狀態。在另 一實例中,此種音量控制可經組態以允許使用者選擇所產 生彦景聲音信號S50相對於話音分量(例如,背景聲音受抑 制音訊信號S1 3)之等級之所要等級。 圖11A展示包括增益控制信號計算器195之背景聲音處理 器102的實施例108之方塊圖。增益控制信號計算器195經 組態以根據可隨時間改變之信號s丨3之等級計算增益控制 信號S90。舉例而言,增益控制信號計算器195可經組態以 134861.doc -42- 200947422 基於信號S13之有作用訊框的平均能量來設定增益控制信 號S90之狀態。另外或在任一此種情形之替代例中,包括 裝置X100之器件可裝備有音量控制,該音量控制經組態以 允許使用者直接控制話音分量(例如,信號s丨3)或背景聲 音增強音訊信號Sl5之等級,或間接控制此種等級(例如, 藉由控制前驅信號之等級)。 裝置X100可經組態以控制所產生背景聲音信號S5〇相對 於音訊信號sio、S12及S13中之一或多者的等級之等級, 可隨時間而變化。在—實例中,裝置X⑽經組態以根據 曰Λ彳5號S10之原始背景聲音的等級控制所產生背景聲音 號50之等級。裝置χι 〇〇之此種實施例可包括經組態以 才據在有作用訊框期間背景聲音抑制器Η 〇的輸入等級與 =出等級之間的關係(例如,差別)來計算增益控制信號 之増益控制信號計算器195的實施例。舉例而言,此種 =益=制計算器可經組態以根據音訊信號S10的等級與背 ® 汐聲θ又抑制音訊信號S13的等級之間的關係(例如,差 1、 算增益控制信號S90。此種增益控制計算器可經組 ^㈣音訊信號S1G之可自信號S1G及S13的有作用訊框
級而计算的SNR來計算增益控制信號“Ο。此種增益 徑制信號刮· # M 平均化°器可經組態以基於隨時間而平滑化(例如, 離w =)之輪入等級來計算增益控制信號S9〇,及/或可經組 想以輪φ u治 i S9〇。隨時間而平滑化(例如,平均化)之增益控制信號 實例中,裝置X100經組態以根據所要SNR控制所 13486I.doc -43- 200947422 2生背景聲音信號S50之等級。可特徵化為背景聲音增強 音訊信號S15之有作用訊框中的話音分量(例如,背景聲音 受抑制音訊信號813)之等級與所產生背景聲音信號S5〇之 等級之間的比率之SNR亦可稱為”信號背景聲音比”。所要 SNR值可為使用者選擇的,及/或在不同所產生背景聲音中 不同。舉例而言,不同所產生背景聲音信號S5〇可與不同 相應所要SNR值相關聯。所要SNR值之典型範圍為2〇犯至 25 dB。在另一實例中,裴置X丨〇〇經組態以控制所產生背 © 景聲音信號S50(例如,背景信號)之等級為小於背景聲音 受抑制音訊信號S13 (例如’前景信號)之等級。 圖11B展示包括增益控制信號計算器1%之實施例197的 者景聲音處理器102之實施例1〇9的方塊圖。增益控制計算 器197經組態及配置以根據(a)所要snr值與(B)信號si3與 S50之等級之間的比率之間的關係來計算增益控制信號 S90。在一實例中,若該比率小於所要snr值,則增益控 制信號S90之相應狀態使得背景聲音混合器192在較高等級 上混合所產生背景聲音信號S50(例如,以在將所產生背景 聲音信號S50相加至背景聲音受抑制信號813之前提高所產 生背景聲音信號S50之等級),且若該比率大於所要SNR 值,則增益控制信號S90之相應狀態使得背景聲音混合器 192在較低等級上混合所產生背景聲音信號S50(例如,以 在將信號S50相加至信號S13之前降低信號S50之等級)。 如上文所描述,增益控制信號計算器195經組態以根據 一或多個輸入信號(例如,S10 ' S13、S50)中之每一者的 134861.doc •44- 200947422 等級來計算增益控制信號S90之狀態。增益控制信號計算 器195可經組態以將輸入信號之等級計算為在一或多個有 作用訊框上進行平均之作雜麻丨5。+ JL·, 號振^或者,增益控制信號計 算器!95可經組態以將輸入信號之等級計算為在一或多個 有作用訊框上進行平均之信號能量。通常,訊框之能量計 算為訊框的經平方樣本之和。可能需要組態增益控制信號 計算器195以遽波(例如,平均化或平滑化)所計算等級及/ 或增益控制信號S90中之一或多者。舉例而言,可能需要 © 組態增益控制信號計算器!95以計算諸如81〇或su之輸入 信號的訊框能量之動態平均值(running average)(例如藉 由將-階或更高階之有限脈衝響應或無限脈衝響應遽波應 用至信號的經計算之訊框能量),且使用平均能量來計算 增益控制信號S90。同樣,可能需要組態增益控制信號計 算器195以在將增益控制信號S9〇輸出至背景聲音混合器 192及/或背景聲音產生器12〇之前將此種濾波應用至增益 控制信號S90。 ® 音訊信號S10之背景聲音分量的等級可能獨立於話音分 量之等級而改變,且在此種情形下,可能需要相應地改變 所產生月景聲音乜號850之等級。舉例而言,背景聲音產 生器120可經組態以根據音訊信號s丨〇之SNR改變所產生背 景聲音信號S50之等級。以此種方式,背景聲音產生器12〇 可經組態以控制所產生背景聲音信號s 5 〇之等級以接近音 訊信號S10中的原始背景聲音之等級。 為維持獨立於話音分量之背景聲音分量之錯覺,可能需 134861.doc -45- 200947422 要即使信號等級改變亦要維持惶定背景聲音等級。舉例而 言,歸因於說話者的嘴對於麥克風之方位的改變或歸因於 諸如音量調變或另-表達性效果之說話者語音的改變而可 能發生信號等級的改變。在此種情形下,可能需要所產生 背景聲音信號S50之等級在通信會話(例如,電話呼 持續時間中保持恆定。 立如本文描述之裝置Xl00的實施例可包括於經組態用於語 音通信或儲存之任何類型的器件中。此種器件之實例可包 ®括(但不限於)以下各物:電話、蜂巢式電話、頭戴式耳機 (例如,經組態以經由BluetGGthTM無線敎之一版本斑行 動使用者終端機全雙工地進行通信之耳機)、個人數位助 理(舰)、膝上型電腦、語音記錄器、遊戲機'音樂播放 機、數位相機。該器件亦可組態為用於無線通信之行動使 用者終端機,以使得如本文所描述之裝置χι〇〇之實施例可 括於其内,或可以其他方式經組態以向器件之傳輸器或 _ 收發器部分提供經編碼音訊信號S2〇。 用於語音通信之系、统(諸如用於有線及/或無線電話之系 ’’先)通吊包括眾多傳輪器及接收器。傳輸器及接收器可經 整〇或以其他方式作為收發器一起實施於共同外殼内。可 需要將裝置Χ100實施為對傳輸器或收發器之具有足夠可 用處理、儲存及可升級性之升級。舉例而言,可藉由將背 景聲音處理器100之元件(例如,在韌體更新中)添加至已包 括話音編碼器X10之實施例之器件而實現裝置X100之實施 例在一些情形下,可執行此種升級而不改變通信系統之 134861 ,d〇c •46- 200947422 任何其他部分。舉例而言,可能需要升級通信系統中之傳 輸器中的一或多者(例如’用於無線蜂巢式電話之系統中 的一或多個行動使用者終端機中之每一者的傳輸器部分) 以包括裝置Χ100之實施例,而不對接收器作出任何相應改 變。可能需要以使得所得器件保持為回溯可相容(例如, 以使得器件保持為能夠執行全部或實質上全部之不涉及背 景聲音處理器100的使用之其先前操作)之方式執行升級。 對於裝置Χ100之實施例用以將所產生背景聲音信號s5〇 ® 插入於經編碼音訊信號S20中之情形而言,可能需要說話 者(亦即,包括裝置X100之實施例的器件之使用者)能夠監 視傳輸。舉例而言,可能需要說話者能夠聽到所產生背景 聲音信號S50及/或背景聲音增強音訊信號S15。此種能力 對於所產生者景聲音彳g號§5〇不同於現存背景聲音之情形 而言可為尤其需要的。 因此’包括裝置X100之實施例的器件可經組態以將所產 生背景聲音信號S50及背景聲音增強音訊信號S15中的至少 一者反饋至耳機、揚聲器或位於器件之外殼内的其他音訊 轉換器;至位於器件之外殼内之音訊輸出插口;及/或至 位於器件之外殼内之短程無線傳輸器(例如,如與由藍芽 技術聯盟(Bluetooth Special Interest Group, Bellevue,WA) 發布之藍芽協定之一版本及/或另一個人區域網路協定相 容之傳輸器)。此種器件可包括經組態及配置以自所產生 背景聲音信號S50或背景聲音增強音訊信號S15產出類比信 號之數位至類比轉換器(DAC)。此種器件亦可經組態以在 134861.doc •47- 200947422 將類比信號應用至插口及/或轉換器之前對其執行一或多 個類比處理操作(例如’濾波、等化及/或放大)。裝置χι〇〇 可能但不必經組態以包括此種DAC及/或類比處理路徑。 在語音通信之解碼器端處(例如,在接收器處或在擷取 後),可能需要以類似於上文描述之編碼器側技術之方式 取代或增強現存背景聲音。亦可能需要實施此種技術而不 要求改變相應傳輸器或編碼裝置。 Φ ❹ 圖1 2 Α展不經組態以接收經編碼音訊信號S2〇且產出相 應經解碼音訊信號SU0之話音解碼器R1〇之方塊圖。語音 解碼器R10包括編碼方案偵測器6〇、有作用訊框解碼器7〇 及非有作用訊框解碼器80。經編碼音訊信號S2〇為可由話 音編碼ιιΧ1〇產出之數位信號。解碼器7〇及8〇可經組態以 對應於如上文所描述之話音編碼器χι〇的編碼胃,以使得 有作用訊框解碼器70經組態以解碼已由有作用訊框編碼器 30進行編碼之訊框,且非有作用訊框解碼器嶋組態以解 碼已由非有作用訊框編碼器40進行編碼之訊框。語音解碼 器㈣通常亦包括經組態以處理經解碼音訊信號川〇以減 /量化雜訊(例如’藉由強調共振峰頻率及^或衰減頻譜谷 值)之後遽波器(P〇stfmer),且亦可包括調適性增益控制。 包括解碼器R10之器件可包括經組態及配置以自經解碼音 :信號SU0產出類比信號以供輸出至耳機、揚聲器或其他 轉換益及/或位於器件的外殼内之音訊輸出插口的數 位至類比轉換器(DAC)。此種器件亦可經組態以在將類比 信號應用至插口及/或轉換器之前對其執行—或多個類比 13486I.doc -48- 200947422 處理操作(例如,遽波、等化及/或放大)。 編馬方案偵測器60經组離以如_冰上* 咖之當前訊框之編碼方案應於經編碼音訊信號 rs ^ 適^之編碼位元速率及/戋編 碼模式可由訊框之格★共- %千汉編 以執行, 工曰不。編碼方案偵測器60可經組態 以執仃速率偵測或自裝置 另一邻八文 θ解碼窃Rio嵌埋於其内)之 方荦偵L 層)接收速率指*。舉例而言,編碼 ❹ 封勺測可經組態以自多工子層接收指示位元速率之 '于ι類型指示符。或者,編碼 咭 茶須測器60可經組態以自 率^能量之—或多個參數判定經編碼訊框之位元速 麵时’編碼“經組態以針對特定位元速率 „ 個編碼模式’以使得經編碼訊框之位元速率亦指 不、=模式。在其他情形下,經編碼訊框可包括諸如一組 Γ 位元之識別對訊框進行編碼所根據的編碼模式之 貝"種資訊(亦稱為"編碼索引,,)可明確地或隱含地指 不編碼模式(例如,藉由指 言無效之值卜^由^對於其他可能之編碼模式而 圖UA展示由編碼方㈣測器的產出之編碼方案指示用 以控制話音解碼器Rl〇的一對選擇器90a及90b以選擇有作 用訊框解碼1170及非有作用訊框解碼H叫的—者之實 例。注意,話音解碼器Rl0之軟體或動體實施例可使用編 碼方案指不來引導向訊框解碼器中之一者或另一者之執行 流程’且此種實施例可能不包括針對選擇器9〇a及/或選擇 器9〇b之類比。圖12B展示去接剩·丨、,交& 又後對U多重編碣方案進行編碼 之有作用訊框的解碼之話音解碼請“實施例謂的實 I34861.doc -49- 200947422 任料徵可包括於本文描述之其他話音解碼器實施例令 t壬一者中。語音解碼器咖包括編碼方案偵測請之實 ΓΓΙ選擇器術、鳩之實施例❿,;及有作用訊 王碼盗70之實施例7〇a、鳩,其經組態以使用不同編碼 方^例如’全速率CELp及半速率職p)來解碼經編碼之 訊框。 有作用訊框解碼器70或非有作用訊框解碼器⑼之典型實 施例經組態以自經編碼訊框提取Lpc係數值(例如,經由反 ❿量化’繼之以經反量化向量向Lpc係數值形式之轉換),且 使用彼等值來組態合成濾波器。根據來自經編碼訊框之其 他值及/或基於偽隨機雜訊信號計算或產生之激勵信號用 來激勵合成濾波器以再現相應經解碼訊框。 注意,㊣個或兩個以上之訊框解碼器可共用制結構。 舉例而言,解碼器70及80(或解碼器7〇a、7沘及8〇)可共用 LPC係數值之計算器,其可能經組態以產出對於有作用訊 框與非有作用訊框具有不同階數之結果,但具有分別不同 之時間描述計算器。亦注意,話音解碼器R1〇之軟體或韌 體實施例可使用編碼方案偵測器6 〇之輸出來引導向訊框解 碼器中之一者或另一者之執行流程,且此種實施例可能不 包括針對選擇器90a及/或選擇器90b之類比。 圖13B展示根據一般組態之裝置R100(亦稱為解碼器解 碼裝置或用於解碼之裝置)之方塊圖。裝置R1〇〇經組態以 自經解碼音訊信號S110移除現存背景聲音且將其取代為可 能類似於或不同於現存背景聲音之所產生背景聲音。除話 134861.doc -50· 200947422 音解碼器R10之元件之外,裝置R100包括經組態及配置以 處理音訊信號siio以產出背景聲音增強音訊信號8115之背 景聲音處理器100之實施例200。包括裝置R1 〇〇之諸如蜂巢 式電話的通信器件可經組態以對自有線、無線或光學傳輸 頻道(例如’經由一或多個載波之射頻解調變)接收之信號 執行處理操作,諸如錯誤校正、冗餘及/或協定(例如,乙 太網路' TCP/IP、CDMA2000)編碼,以獲得經編碼音訊信 號 S20。 〇 如圖14 A中所展示,背景聲音處理器200可經組態以包括 背景聲音抑制器110之例項21〇 ’背景聲音產生器12〇之例 項220及背景聲音混合器19〇之例項29〇,其中此等例項根 據上文關於圖3B及圖4B描述之各種實施例中的任一者進 行組態(除背景聲音抑制器! 1〇之實施例以外,其使用來自 如上文所描述之可能不適用於裝置R1〇〇中的多重麥克風之 信號)。舉例而言,背景聲音處理器200可包括經組態以對 ❹音訊信號8110執行如上文關於雜訊抑制器10所描述之雜訊 抑制操作的冒進實施例(諸如維納(Wiener)濾波操作)以獲 得背景聲音受抑制音訊信號SU3之背景聲音抑制器11〇的 實施例。在另一實例中,背景聲音處理器200包括背景聲 音抑制器110之實施例,背景聲音抑制器11〇之該實施例經 組態以根據如上文所描述之現存背景聲音的統計學描述 (例如,音訊信號S 110之一或多個非有作用訊框)對音訊作 號S110執行頻譜相減操作以獲得背景聲音受抑制音訊信號 S113。另外或在對於任一此種情形之替代例中,背景聲音 134861.doc -51 - 200947422 處理器200可經組態以對音訊信號S1丨〇執行如上文所描述 之中心截波操作。 如上文關於背景聲音抑制器1〇〇所描述,可能需要將背 景聲音抑制器200實施為可在兩個或兩個以上不同操作模 式中進行組態(例如,自無背景聲音抑制至實質上完全背 景聲音抑制之範圍)。圖14Β展示包括經組態以根據處理控 制信號S30之例項S130的狀態進行操作之背景聲音抑制器 112的例項212及背景聲音產生器122的例項222之裝置ri〇〇 G 的實施例R110之方塊圖。 背景聲音產生器220經組態以根據背景聲音選擇信號S4〇 之例項S140之狀態產出所產生背景聲音信號S5〇之例項 S150。控制兩個或兩個以上背景聲音中的至少一者之選擇 的背景聲音選擇信號S140之狀態可能係基於一或多個準 則,諸如:關於包括裝置Rl〇〇之器件的實體位置之資訊 (例如,基於GPS及/或上文論述之其他資訊)、使不同時間 丨時間週期與相應背景聲音相關聯之排程、呼叫者之識別 碼(例如,如經由呼叫號碼識別(CNID)進行判定,亦稱 為"自動號碼識別"(ANI)或呼叫者識別發信號)、使用者選 擇之設定或模式(諸如商務模式、舒緩模式、聚會模式), 及/或一列兩個或兩個以上背景聲音中的一者之使用者選 擇(例如,經由諸如選單之圖形使用者介面)。舉例而言, 裝置R100可座實施以包括如上文所描述之使此種準則的值 與不同责景聲音相關聯之背景聲音選擇器33〇的例項。在 另一實例中,裝置R100經實施以包括如上文所描述之經組 134861.doc -52- 200947422 態以基於音訊信號S110的現存背景聲音之一或多個特性 (例如’關於音訊信號S110之一或多個非有作用訊框的一 或多個時間及/或頻率特性之資訊)產生背景聲音選擇信號 SU0的背景聲音分類器32〇之例項。背景聲音產生器22〇可 根據如上文所描述之背景聲音產生器120的各種實施例中 之任一者進行組態。舉例而言,背景聲音產生器22〇可經 組態以自本端儲存器擷取描述所選背景聲音之參數值,或 自諸如伺服器之外部器件下載此等參數值(例如,經由 © SIP)。可能需要組態f景聲音產生器22G以分別使產出背 景聲音選擇信號S50之起始及終止與通信會話(例如,電話 呼叫)之開始及結束同步。 處理控制is號S1 30控制背景聲音抑制器212之操作以啟 用或停用背景聲音抑制(亦即,以輸出具有音訊信號Sl 1〇 之現存背景聲音或者取代背景聲音之音訊信號)。如圖14B 中所展示,處理控制信號s〗3 〇亦可經配置以啟用或停用背 景聲音產生器222。或者,背景聲音選擇信號S14()可經組 態以包括選擇背景聲音產生器220之空輸出之狀態,或者 背景聲音混合器290可經組態以將處理控制信號sn〇接收 為如上文關於背景聲音混合器19〇所描述之啟用/停用控制 輸入。處理控制信號S 1 30可經實施以具有一個以上狀態, 以使得其可用以改變由背景聲音抑制器212執行之抑制之 等級。裝置R1 00之另外的實施例可經組態以根據接收器處 周圍聲音之等級控制背景聲音抑制的等級及/或所產生背 景聲音仏號S 150之等級。舉例而言,此種實施例可經組態 134861.doc •53· 200947422 以控制音訊信號S115之SNR與周圍聲音之等級成反比關係 (例如,如使用來自包括裝置Rl〇〇之器件的麥克風之信號 進行感測)。亦明確地指出,當選擇使用人工背景聲音時 可將非有作用訊框解碼器80斷電。 一般而言,裝置Rl〇0可經組態以藉由根據適當編碼方案 解碼每一訊框、抑制現存背景聲音(可能抑制可變之程度) 及根據某一等級添加所產生背景聲音信號sl5〇而處理有作 用訊框。對於非有作用訊框而言,裝置R1〇〇可經實施以解 ® 碼每一訊框(或每一 SID訊框)及添加所產生背景聲音信號 S150。或者,裝置R1〇〇可經實施以忽略或丟棄非有作用訊 框,且將其取代為所產生背景聲音信號815〇。舉例而言, 圖1 5展示經組態以在選擇背景聲音抑制時丟棄非有作用訊 框解碼器80之輸出的裝置R2〇〇之實施例。此實例包括經組 態以根據處理控制信號S130之狀態選擇所產生背景聲音信 號S150及非有作用訊框解碼器8〇的輸出中的一者之選擇器 250 〇 φ 裝置R1 00之另外的實施例可經組態以使用來自經解碼音 訊信號之一或多個非有作用訊框的資訊來改良由背景聲音 抑制器210應用之用於有作用訊框中的背景聲音抑制之雜 訊模型。另外或在替代例中,裝置R1 〇〇之此等另外的實施 例可經組態以使用來自經解碼音訊信號之一或多個非有作 用訊框的資訊來控制所產生背景聲音信號s丨5 〇之等級(例 如,以控制背景聲音增強音訊信號s丨丨5之SNR) ^裝置 R100亦可經實施以使用來自經解碼音訊信號之非有作用訊 134861.doc -54- 200947422 框的背景聲音資訊來補充經解碼音訊信號之一或多個有作 用訊框及/或經解碼音訊信號之一或多個其他非有作用訊 框内的現存背景聲音。舉例而言,此種實施例可用以取代 已歸因於如傳輸器處之過度冒進雜訊抑制及/或不足的編 碼速率或SID傳輸速率之因素而丟失的現存背景聲音。 如上所述,裝置R100可經組態以在產出經編碼音訊信號 S20之編碼器不作用及/或不改變之情形下執行背景聲音增 強或取代。裝置R1 00之此種實施例可包括於經組態以在相 © 應傳輸器(自其處接收信號S20)不作用及/或不改變的情形 下執行背景聲音增強或取代之接收器内。或者,裝置R1〇〇 可經組態以獨立地或根據編碼器控制而下載背景聲音參數 值(例如’自SIP伺服器)’及/或此種接收器可經組態以獨 立地或根據傳輸器控制而下載背景聲音參數值(例如,自 SIP伺服器)。在此等情形下’ 811>伺服器或其他參數值源 可經組態以使得編碼器或傳輸器之背景聲音選擇優先於解 碼器或接收器之背景聲音選擇。 了 Bb需要根據本文描述之原理(例如,根據裝置χίοο及 Ri〇〇之實施例)實施在背景聲音增強及/或取代的操作上進 行協作之話音編碼器及解碼器。在此種系統内,可將指示 所要背景聲音之資訊傳送至呈若干不同形式中之任一者之 解碼器。在第一類實例中,將背景聲音資訊傳送為描述, 該描述包括一組參數值,諸如LSF值及相應能量值序列之 向量(例如,靜寂描述符或SID),或諸如平均序列及相應 組之詳細序列(如圖1〇iMRA樹實例中所展示)。一組參數 134861.doc -55- 200947422 在第-可經量化以供傳輸為一或多個碼薄索引。 音識==背::景聲音資訊作為,個背景聲 將背景聲音^ 選擇資訊")傳送至料器。可 背景聲音之、、主/冑為對應於兩個或兩個以上不同音訊 引二心β早中之特定項目的索引。在此等情形下,索 ,月早目(其可儲存於本端或儲存於解碼器外括 φ ❿ 數值之相應背景聲音之描述。另外或在: :聲“线別符之替代例中,音訊背景聲音選擇資訊可 編竭器之實體位置及/或背景聲音模式之資訊。 在此等類中之任-者中,可直接及/或間接地將背景聲 η 蝙碼器傳送至解碍器。在直接傳輸中,編碼器將 背景聲音資訊在經編碼音訊信號S20内(亦即,經由相同邏 輯頻道及經由與話音分量相同之協定堆疊)及/或經由單獨 傳輸頻道(例如’可使用不同協定之資料頻道或其他單獨 ^輯頻道)發送至解碼器。圖16展示經組態以經由不同邏 輯:道(例如,在相同無線信號内或在不同信號内)傳輸所 選音訊背景聲音之話音分量及經編碼(例如,經量化)參數 值的裝置X100之實施例Χ200的方塊圖。在此特定實例 中,裝置Χ200包括如上文所描述之處理控制信號產生器 340之例項。 圖16中展示之裝置χ2〇〇之實施例包括背景聲音編碼器 150。在此實例中,背景聲音編碼器15〇經組態以產出基於 背景聲音描述(例如,一組背景聲音參數值S7〇)之經編碼 背景聲音信號S80。背景聲音編碼器15〇可經組態以根據認 134861.doc •56· 200947422 為適於特定應用之任何編碼方案產出經編碼背景聲音信號 S80此種編碼方案可包括諸如霍夫曼㈣編碼、算 術編碼、範圍編碼(range enc〇ding)及行程編碼(run iength_ encoding)之- &多個壓縮操作。此種編碼方案可為有損及/ 或無損的。此種編碼方案可經組態以產出具有固定長度之 、'σ果及/或具有可變長度之結果。此種編碼方案可包括量 化背景聲音描述之至少一部分。 背景聲音編碼器150亦可經组態以執行背景聲音資訊之 ❹協定編碼(例如,在運輸層及/或應用層處)。在此種情形 下’背景聲音編碼器15G可經組態以執行諸如封包形成及/ 或交握之-或多個相關操作。甚至可能需要組態背景聲音 編碼器150之此種實施例以發送背景聲音資訊而不執行任 何其他編碼操作。 圖17展示經組態以將識別或描述所選背景聲音之資訊編 碼為經編碼音訊信號S20的對應於音訊信號si〇之非有作用 訊框的訊框週期之裝置幻00的另—實施例χ2ι〇之方塊 圖。此等訊框週期在本文亦稱為"經編碼音訊信號s2〇之非 有作用訊框"。在一些情形下,可能在解碼器處導致延 遲,直至已接收所選背景聲音之足夠量之描述用於背景聲 音產生。 在-相關實例中’裝置X21G經組態以發送對應於本端地 儲存於解碼器處及/或自諸如伺服器之另一器件下載之背 景聲音描述(例如,在呼叫建立期間)之初始背景聲音識別 符,且亦經組態以發送對該背景聲音描述之隨後更S新(例 I34861.doc -57- 200947422 如,經由經編碼音訊信號S20之非有作用訊框)。圖18展示 經組態以將音訊背景聲音選擇資訊(例如,所選背景聲音 之識別符)編碼為經編碼音訊信號S2〇之非有作用訊框的裝 置X100之相關實施例X22〇的方塊圖。在此種情形下,裝 置X220可經組態以在通信會話之過程期間(甚至自一訊框 至下一訊框)更新背景聲音識別符。
圖18中展示之裝置Χ22〇的實施例包括背景聲音編碼器 150之實施例152。背景聲音編碼器152經組態以產出基於 音訊背景聲音選擇資訊(例如,背景聲音選擇信號之 經編碼背景聲音信號S80之例項S82,其可包括一或多個背 景聲音識別符及/或其他諸如實體位置及/或背景聲音模式 之指示之資訊。如上文關於背景聲音編碼器15〇所描述, 背景聲音編碼器1 52可經組態以根據認為適於特定應用及/ 或可經組態以執行背景聲音選擇資訊之協定編碼的任何編 碼方案產出經編碼背景聲音信號S82。 經組態以將背景聲音資訊編碼為經編碼音訊信號S2〇之 非有作用訊框的裝置X1〇〇之實施例可經組態以編碼每一非 有作用訊框内之此種背景聲音資訊或不連續地編碼此種背 景聲音資訊。在不連續傳輸(DTX)之一實例中,裝置X100 之此種實施例經組態以根據規則間隔(諸如每五秒或十 秒,或每128或256個訊框)將識別或描述所選背景聲音之 資訊編碼為經編碼音訊信號S2〇的一或多個非有作用訊框 之序列。在不連續傳輸(DTX)之另一實例中,裝置χι〇〇之 此種實施例經組態以根據諸如不同背景聲音的選擇之某一 134861.doc •58- 200947422 事件將此種資訊編碼為經編碼音訊信號S2〇的—或多個非 有作用訊框之序列。
裝置X21G及χ22〇經組態以根據處理控制信號s3()之狀態 執行現存背景聲音之編碼(亦即,舊版操作)或背景聲音取 代。在此等情形下,經編碼音訊信號S2〇可包括指示非有 作用訊框是否包括現存背景聲音或關於取代背景聲音之資 ,之旗標(例如’可能包括於每一非有作用訊框中:一或 夕個位π )。圖19及圖2〇展示組態為在非有作用訊框期間 不支援現存#景聲音之傳輸的相應裝置(分別為裝置Χ300 及裝置Χ300之實施例χ31〇)之方塊圖。在圖Η之實例中, 有:用訊框編碼器3G經組態以產出第—經編碼音訊信號 如,且編碼方案選擇器2〇經組態以控制選擇器鳩將經 景聲音信號S8〇插入於第一經編碼音訊信號之 非有作用訊框中以甚ψ笛_ β ^ 一 !編碼音訊信號8201)。在圖20 立冑作用訊棍編碼器3〇經組態以產出第一經編碼 —碼背景:音 =:器2°:組態以控制選擇器 D號882插入於第一經編碼音訊信號 〇a之非有作用訊框中以 _ 在此等實财,可能f 』碼音訊信號議。 包化形式(例*,作:;有作用訊框編碼器3〇而以封 音訊信號2〇a。在此等情形下=碼訊框)產出第—經編碼 碑方亲、H Μ 寻^下’選擇器渴可經紐態以如編 ==所指示將經編碼背景聲音信號插入於第- 作Π:::2;"之對應於背景聲音受抑制信號的非有 5 、匕例如,經編碼訊框)内的適當位置處,或 134861.doc •59· 200947422 者選擇器働可經組態以如編碼方案選擇器2〇所指示將由 背景聲音編碼器150或152產出之封包(例如,經編碼訊框) 插入於第-經編碼音訊信號S20a内的適當位置處。如上所 述,經編碼背景聲音信號S80可包括關於經編碼料聲音 信號_之資訊(諸如描述所選音訊背景聲音之一組參數 值),且經編碼背景聲音信號S82可包括關於經編碼背景聲 音信號S觀資訊(諸如識別—组音訊背景聲音中的—所選 背景聲音之背景聲音識別符)。 ❹ 在間接傳輸中’解碼器不僅經由與經編碼音訊信號s2〇 =同之邏輯頻道而且亦自諸如伺服器之不同實體接收背景 聲音資訊。舉例而t,解碼器可經組態以使用編碼器之識 別符(例如,統一資源識別符(聰)或統一資源定位符 (URL) ’如RFC 3986 t所描述’以〜购_,線上可 得)、解瑪器之識別符(例如,URL)及/或特定通信會話之 識別符來請求來自伺服器的背景聲音資訊。圖Μ展示解 碼器根據經由協定堆疊P2〇及經由第一邏輯頻道自編碼器 接收之資訊而經由協定堆叠ρι〇(例如,在背景聲音產生器 220及/或背景聲音解碼器攻内)及經由第二邏輯頻道自甸 服器下載背景聲音資訊之實例。堆疊川及㈣可為分離的 或可共用-或多個層(例如’實體層、媒體存取控制層及 邏輯鏈路層令之一或多者)。可使用諸如之協定執行可 以類似於下載鈴聲或音樂槽案或流的方式執行之背景聲音 負訊自4司服器至解碼器的下載。 在其他實例中,可藉由直接與間接傳輸之某一組合將背 134861.doc 200947422 景聲音資訊自編碼器傳送至解碼器。在—一般實例中 碼器將背景聲音資訊以一形式 ’ 八1例如,如音訊背景聲音選 擇資訊)發送至系統内之諸如伺 、 71 窃件,且盆他 器件將相應背景聲音資訊以另一 /、 仏式(例如,作為背哥聲 曰描述)發送至解碼器。在此種傳 ” 呀疋 < 将弋實例中,伺服 器經組態以將背景聲音㈣輸送至解碼器⑽接收用於來 自。解碼器之資訊之請求(亦稱為”推送,,)。舉例而言,伺服 ❹ 器可經組態以在呼叫建立期間將背景聲音資訊推送至解碼 器。圖21Β展示伺服器根據編碼器經由協定物30(例 如,在背景聲音編碼器152内)及經由第三邏輯頻道發送之 可包括解碼器的URL或其他識別符之資訊將背景聲音資訊 經由第二邏輯頻道下載至解碼器之實例。在此種情形下, 可使用諸如SIP的協定執行自編碼器至伺服器之傳送及/或 自飼服器至解碼H之傳送。此實例亦說明經編碼音訊信號 S20經由協定堆#P4G及經由第—邏輯頻道自編碼器至解碼 器之傳輸。堆疊P3G及P4G可為分離的,或可共用—或多個 層(例如,實體層、媒體存取控制層及邏輯鏈路層中之一 或多者)。 如圖21B中所展示之編碼器可經組態以藉由在呼叫建立 期間將INVITE訊息發送至伺服器而起始SIp會話。在一此 種實施例中,編碼器將諸如背景聲音識別符或實體位置 (例如,作為一組GPS座標)之音訊背景聲音選擇資訊發送 至伺服器。編碼器亦可將諸如解碼器之URI及/或編碼器之 URI的實體識別資訊發送至伺服器。若伺服器支援所選音 134861.doc -61 - 200947422 訊背景聲音,則其將ACK訊息發送至編碼器,且⑽會話 結束。 編碼器解碼器系統可經組態以藉由抑制編碼器處之現 存背景聲音或藉由抑制解碼器處之現存背景聲音而處理有 作用訊;。可藉由在編媽器處(而非解碼器處)執行背景聲 音抑制來實現一或多個潛在優點。舉例而言,有作用訊框 編碼器30可預期達成對背景聲音受抑制音訊信號比對現存 背景聲音未經抑制之音訊信號的更佳之編碼結果。亦可能 ©可在編碼器處得到諸如使用來自多重麥克風之音訊信號的 技術(例如,盲源分離)之更佳的抑制技術。亦可能需要說 話者能夠聽到與收聽者將聽到之背景聲音受抑制話音分量 相同之#景聲音受抑制話音分量,且在編碼器處執行背景 聲音抑制可用以支援此種特徵。當然,在編碼器及解碼器 兩者處實施背景聲音抑制亦係可能的。 可能需要在編碼器-解碼器系統内所產生背 ❿S150在編碼器及解碼器兩者處皆可用。舉例而'言,可能需 要說話者能夠聽到與收聽者將聽到之背景聲音増強音訊信 號相同之背景聲音增強音訊信號。在此種情形下,所選背 景聲音之描述可儲存於及/或下載至編碼器及解碼器兩 者此外,可能需要組態背景聲音產生器220以確定地產 出所產生背景聲音信號S150,以使得在解碼器處執行之背 景聲音產生操作可在編碼器處進行複製。舉例而言,背景 聲s產生器220可經組態以使用對於編碼器及解碼器兩者 白已知之一或多個值(例如,經編碼音訊信號S20之一或多 13486l.doc -62- 200947422 個值)以3十算可使用於產生操作中之任何隨機值或信號(諸 如用於CTFLP合成之隨機激勵信號)。 一編褐器·解碼器系統可經組態而以若干不同方式中之任 者處理非有作用訊框。舉例而言,編碼器可經組態以將 現存背景聲音包括於經編褐音訊信號S2〇内。包括現存背 景聲音可能對於支援舊版操作為需要的。此外,如上文所 論述,解碼器可經組態以使用現存背景聲音來支援背景聲 音抑制操作。 C 或者,編碼器可經組態以使用經編碼音訊信號S20之非 有作用訊框中之一或多者來載運關於所選背景聲音之資訊 (諸如一或多個背景聲音識別符及/或描述卜如圖Η中所展 不之褒置X300為不傳輸現存背景聲音的編碼器之一實例。 如域述,非有作用訊框中背景聲音識別符之編碼可用以 2諸如電話呼叫之通信會話期間支援更新所產生之背景聲 音信號S150。相應解碼器可經組態以快速且甚至可能逐訊 框地執行此種更新。 纟另-替代例中,編碼器可經組態以在非有作用訊框期 間傳輸極少或不傳輸位元,其可允許編碼器使用更高編碼 速率用於有作用訊框而不增加平均位元速率。視系統而 定’編碼器可能需要在每一非有作用訊框期間包括某一最 小數目之位元以便維持連接。 可能需要諸如裝置χι〇〇之實施例(例如,裝置X200、 X210或X220)或X300的編碼器發送所選音訊背景聲音之等 級隨時間的改變之指示。此種編碼器可經組態以在經編碼 134861.doc -63· 200947422 背景聲音信號S8G内及/或經由不同邏輯頻道將此種資訊發 送為參數值(例如’增益參數值卜在—實例中,所選背景 聲音之描述包括描述背景聲音的頻譜分布之資訊,且編碼 器經組態以將關於背景簦咅夕立> 、笨之9汛4級隨時間的改變之資 訊發送為單獨時間描述(其可以與頻譜描述不同之速率進 行更新)。在另一實例中’所選背景聲音之描述描述背景 聲音在第-時間標度(例如,在訊框或類似長度之其他間 隔上)上之頻譜及時間特性兩者,且編碼器經組態以將關 於背景聲音之音訊等級在第二時間標度(例如,諸如自訊 框至訊框之較長時間標度)上的改變之資訊發送為單獨時 間描述。可使用包括用於每一訊框之背景聲音增益值之單 獨時間描述來實施此種實例。 ❹ 在可應用至上文兩項實例中之任一者中之另一實例中, 使用不連續傳輸(在經編碼音訊信號mo之非有作用訊框内 或經由第二邏輯頻道)發送對所選背景聲音之描述之更 新,且亦使用不連續傳輸(在經編碼音訊信號S2〇之非有作 用訊框内,經由第二邏輯頻道,或經由另一邏輯頻道)發 送對單獨時間描述之更冑,兩個描述以不同間隔及/或根 據:同事件進行更新。舉例而言,此種編碼器可經組態以 比單獨時間描述更不頻繁地更新所選背景聲音之描述(例 如,每512、1024或2048個訊框對每四個、八個或十六個 訊框)。此種編碼器之另一實例經組態以根據現存背景聲 音的一或多個頻率特性之改變(及/或根據使用者選擇)而更 新所選背景聲音之描述,且經組態以根據現存背景聲音的 134861.doc • 64 - 200947422 等級之改變而更新單獨時間描述。 圖22、圖23及圖24說明經組態以執行背景聲音取代之用 於解碼的裝置之實例。圖22展示包括經組態以根據背景聲 曰選擇信號S1 40之狀態產出所產生背景聲音信號sl5〇的背 景聲a產生器220之例項的裝置R3〇〇之方塊圖。圖23展示 包括背景聲音抑制器210之實施例21 8的裝置R300之實施例 R3io的方塊圖。背景聲音抑制器218經組態以使用來自非 有作用訊框之現存背景聲音資訊(例如,現存背景聲音之 © 頻譜分布)來支援背景聲音抑制操作(例如,頻譜相減)^ 圖22及圖23中展示之裝置R300&R31〇i實施例亦包括 背景聲音解碼器252。背景聲音解碼器252經組態以執行經 編碼背景聲音信號S80之資料及/或協定解碼(例如,與上文 關於背景聲音編碼器15 2描述之編碼操作互補)以產出背景 聲音選擇信號S140。其他或另外,裝置R3〇〇&R31〇可經 實施以包括與如上文所描述之背景聲音編碼器丨“互補之 背景聲音解碼器25〇,其經組態以基於經編碼背景聲音信 號S80之相應例項產出背景聲音描述(例如,一組背景聲音 參數值)。 圖24展示包括背景聲音產生器22〇之實施例228的話音解 碼器R300之實施例r32〇的方塊圖。背景聲音產生器228經 組態以使用來自非有作用訊框之現存背景聲音資訊(例 如,關於現存背景聲音之能量在時域及/或頻域中的分布 之資訊)來支援背景聲音產生操作。 如本文描述之用於編碼的裝置(例如,裝置χι〇〇&χ3〇〇) 134861.doc •65· 200947422 及用於解碼的裝置(例如,裝置R1〇〇、R2〇〇及R3〇〇)之實施 例的各種元件可實施為駐留於(例如)同一晶片上或晶片組 中之兩個或兩個以上晶片中的電子及/或光學器件,但亦 可預期沒有此種限制之其他配置。此種裝置之一或多個元 件可整個地或部分地實施為經配置以在邏輯元件(例如, 電晶體、閘)的一或多個固定或可程式化陣列上執行之一 或多個組指令,該等邏輯元件諸如微處理器、嵌埋式處理 器、IP核心、數位信號處理器、FPGA(場可程式化閘陣 ©列)、ASSP(特殊應用標準產品)及ASIC(特殊應用積體電 路)。 此種裝置之實施例的-或多個%件用以執行任務或執行 與裝置之操作不直接相關的其他組指令(諸如關於裝置所 喪埋於其中之器件或系統之另一操作之任務)係可能的。 此種裝置之實施例之-或多個元件具有共同結構(例如, 用以執行在不同時間對應於不同元件之程式碼部分之處理 _ 器,經執行以執行在不同時間對應於不同元件之任務之一 組指令,或在不同時間執行不同元件之操作的電子及/或 光學器件之配置)亦係可能的。在一實例令,背景聲音抑 制器110、背景聲音產生器120及背景聲音混合器19〇實施 為經配置以在同-處理器上執行之指令組H㈣ 中’背景聲音處理11100及話音編碼器⑽經實施為經配置 以在同-處理器上執行之指令組。在另一實例中,背景聲 音處理11200及話音解碼器謂實施為經配置以在同一處理 器上執行之指令組。在另一實例中,背景聲音處理器 134861.doc •66· 200947422 ⑽、話音編碼ϋΧ1()及話音解碼器R1G實施為經配置以在 同一處理器上執行之指令組 ?曰7、.且在另一實例中,有作用訊框 編I器30及非有作用訊框編碼器4〇經實施以包括在不同時 間執行之相同組之指今。力另 α ?曰7在另一實例中,有作用訊框解碼 器70及非有作用訊框解碼器8〇經實施以包括在不同時間執 行之相同組之指令。 用於無線通信之器件(諸如蜂巢式電話或具有此種通信 能力之其他器件)可經組態以包括編碼器(例如,裝置幻㈧ ©或X300之實施例)及解碼器(例如,裝置R1〇〇、R2〇〇或 R300之實施例)兩者。在此種情形下,編碼器及解碼器具 有共同結構係可能的。在一此種實例中,編碼器及解碼器 經實施以包括、經配置以在同一處理器上執行之指令組。 本文描述之各種編碼器及解碼器的操作亦可視作信號處 理方法的特定實例。此種方法可實施為一組任務其一或 多者(可能全部)可由邏輯元件(例如,處理器、微處理器、 微控制器或其他有限狀態機)之一或多個陣列執行。任務 巾之一或多者(可能全部)亦可實施為可由一或多個邏輯元 件陣列執行之程式碼(例如,一或多個指令組),程式碼可 有形地實施於資料儲存媒體中。 圖25A展示根據所揭示組態之處理包括第一音訊背景聲 音的數位音訊信號之方法A100的流程圖。方法 任務及層。基於第一麥克風產出之第一音= 號,任務A110自數位音訊信號抑制第一音訊背景聲音以獲 得背景聲音受抑制信號。任務A120混合第二音訊背景聲音 134861.doc -67- 200947422 與基於背景聲音受抑制信號之信號以獲得背景聲音增強信 號。在此方法中,數位音訊信號係基於由不同於第一麥克 風之第二麥克風產出之第二音訊信號。舉例而言,可藉由 如本文描述之裝置X100或X300之實施例執行方法ai〇〇。 圖25B展示根據所揭示組態用於處理包括第一音訊背景 聲音之數位音訊信號的裝置AM100之方塊圖。裝置ami〇〇 包括用於執行方法A100之各種任務之構件。裝置AM1〇〇包 括用於基於由第一麥克風產出之第一音訊信號自數位音訊 © 信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之 構件AM10。裝置AM1〇〇包括用於混合第二音訊背景聲音 與基於背景聲音受抑制信號之信號以獲得背景聲音增強信 號之構件AM20。在此裝置中,數位音訊信號係基於由不 同於第一麥克風之第二麥克風產出之第二音訊信號。可使 用能夠執行此等任務之任何結構實施裝置AM100之各種元 件’該等結構包括用於執行本文揭示之此等任務的結構中 ❹ 之任一者(例如,一或多個指令組、一或多個邏輯元件陣 列等)。裝置AM 100之各種元件之實例在本文中揭示於裝 置X100及X300之描述中。 圖26A展示根據所揭示組態之根據處理控制信號的狀態 處理數位音訊信號之方法B100的流程圖,該數位音訊信號 具有話音分量及背景聲音分量。方法B 100包括任務B110、 B120、B130及B140。任務B110在處理控制信號具有第一 狀態時以第一位元速率編碼缺少話音分量之數位音訊信號 部分之訊框。任務B120在處理控制信號具有不同於第一狀 134861.doc -68- 200947422 態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號。任務B130在處理控制信號具有第二 狀態時混合音訊背景聲音信號與基於背景聲音受抑制信號 之仏號以獲得背景聲音增強信號。任務B140在處理控制信 號具有第二狀態時以第二位元速率編碼缺少話音分量之背 景聲音增強信號部分之訊框’第二位元速率高於第一位元 速率。舉例而言,可藉由如本文描述之裝置乂1〇〇之實施例 執行方法B100。 © 圖26B展示根據所揭示組態之用於根據處理控制信號的 狀態處理數位音訊信號之裝置BM100的方塊圖,該數位音 訊信號具有話音分量及背景聲音分量。裝置BM100包括用 於在處理控制信號具有第一狀態時以第一位元速率編碼缺 少話音分量之數位音訊信號部分之訊框的構件BM10。裝 置BM100包括用於在處理控制信號具有不同於第一狀態之 第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景 聲音受抑制信號之構件BM20。裝置BM100包括用於在處 〇 理控制信號具有第二狀態時混合音訊背景聲音信號與基於 背景聲音受抑制信號之信號以獲得背景聲音增強信號之構 件BM30。裝置BM100包括用於在處理控制信號具有第二 狀態時以第二位元速率編碼缺少話音分量之背景聲音增強 信號部分之訊框的構件BM40,第二位元速率高於第一位 元速率。可使用能夠執行此種任務之任何結構實施裝置 BM100之各種元件’該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、一或 13486I.doc -69- 200947422 多個邏輯元件陣列等)。裝置BM100之各種元件的實例在 本文中揭示於裝置XI 00之描述中。 . 圖27A展示根據所揭示組態之處理基於自第一轉換器接 收的信號之數位音訊信號的方法C100之流程圖。方法 C100包括任務C110、C120、C130及C140。任務C110自數 位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制 信號。任務C120混合第二音訊背景聲音與基於背景聲音受 抑制#號之信號以獲得背景聲音增強信號。任務cl3〇將基 © 於(A)第二音訊背景聲音及(B)背景聲音增強信號中的至少 一者之信號轉換為類比信號。任務cl4〇自第二轉換器產出 基於該類比信號之聲訊信號。在此方法中,第一轉換器及 第二轉換器兩者位於共同外殼内。舉例而言,可藉由如本 文描述之裝置XI 〇〇或X300之實施例執行方法C1 〇〇。 圖27B展示根據所揭示組態之用於處理基於自第一轉換 器接收的信號之數位音訊信號的裝置(::^11〇〇之方塊圊。裝 置CM100包括用於執行方法C100之各種任務之構件,裝置 CM 1 00包括用於自數位音訊信號抑制第一音訊背景聲音以 獲得背景聲音受抑制信號之構件(:1^110。裝置CM100包括 用於混合第二音訊背景聲音與基於背景聲音受抑制信號之 信號以獲得背景聲音增強信號之構件€河120。裝置CM100 包括用於將基於(A)第二音訊背景聲音及(B)背景聲音增強 信號中的至y 者之信號轉換為類比信號的構件cm 13 0。 裝置CM100包括用於自第二轉換器產出基於類比信號之聲 訊信號之構件CM140。在此裝置中,第一轉換器及第二轉 13486 丨.doc -70- 200947422 換器兩者位於共同外殼内。可使用能夠執行此等任務之任 何結構實施裝置CMUH)之各種元件,該等結構包括用於執 行本文揭示之此等任務的結構中之任一者(例如,一或多 個指令組、-或多個邏輯元件陣列等)。裝置cmi〇〇之各 種元件的實例在本文中揭示於裝置幻〇〇及幻〇〇之描述 中。 圖28A展示根據所揭示組態之處理經編碼音訊信號的方 法D100之流程圖。方法Dl〇〇包括任務du〇、di2〇及
D13 0。㈣D i! 〇根據第—編媽方案解碼經編碼音訊信號 之第一複數個經編碼訊框以獲得包括話音分量及背景聲音 分量之第一經解碼音訊信號。任務D12〇根據第二編碼方^ 解碼經編碼音訊信號之第二複數個經編碼訊框以獲得第二 經解碼音訊信號。|於來自第二經解媽音訊信號之資訊, 任細30自基於第-經解碼音訊信號之第三錢抑制背景 聲音分量以獲得背景聲音受抑制信冑。舉例而t,可藉由 如本文描述之裝置R100、R20〇4R3〇〇之實施例執行方法 D100。 圖28B展不根據所揭示組態之用於處理經編瑪音訊信號 的裝置DMH)0之方塊圖。裝置議⑽包括用於執行^ moo之各種任務之構件。裝置膽⑽包括用於根據第一編 碼方案解碼經編碼音訊信號之第一複數個經編碼訊框以獲 得包括話音分量及背景聲音分量的第一經解碼音訊信號之 構件DM1G。裝置DM⑽包括用於根據第二編碼方案解碼 經編碼音訊信號之第二複數個經編碼訊框以獲得第二經解 134861.doc •71· 200947422 碼音訊信號之構件DM20。裝置DM100包括用於基於來自 第二經解碼音訊信號之資訊自基於第一解碼音訊信號的第 二信號抑制背景聲音分量以獲得背景聲音受抑制信號之構 件DM3 0。可使用能夠執行此等任務之任何結構實施裝置 DM100之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、一或 多個邏輯元件陣列等)^裝置D M丨〇 〇之各種元件的實例在 本文中揭示於裝置Rl〇〇、R200及R300之描述中。 © 圖29A展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法E1〇〇的流程圖。方法E1〇〇 包括任務£110、£120、£130及£140。任務£11〇自數位音 訊信號抑制背景聲音分量以獲得背景聲音受抑制信號。任 務E120編碼基於背景聲音受抑制信號之信號以獲得經編碼 音訊信號。任務E1 30選擇複數個音訊背景聲音中的一者。 任務E14 0將關於所選音訊背景聲音之資訊插入於基於該經 編碼音訊信號之信號中。舉例而言,可藉由如本文描述之 ® 裝置X100或χ3〇〇之實施例執行方法E100。 圖29B展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置EM100的方塊圖。裝 置EM100包括用於執行方法E〗〇〇之各種任務之構件。裝置 EM1 00包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件EM10。裝置EM100包括用於 編碼基於背景聲音受抑制信號之信號以獲得經編碼音訊信 號之構件EM20。裝置EM100包括用於選擇複數個音訊背 134861.doc -72· 200947422 景聲音中的一者之構件腹30。裝置刪00包括用於將關 於所選音訊背景聲音之資訊插入於基於該經編碼音訊信號 的信號中之構件EM40。可使用能夠執行此等任務之任何 結構實«置之各種元件,料結構包㈣於執行 本文揭不之此等任務的結構中之任一者(例如,一或多個 指令組、一或多個邏輯元件陣列等)。裝置emi〇〇之各種 元件的實例在本文中揭示於裝置幻〇〇及幻〇〇之描述中。 圖30A展示根據所揭示組態之處理包括話音分量及背景 〇聲音分量的數位音訊信號之方法E200的流程圖。方法E2〇〇 包括任務E110、E120、以5〇及£16〇。任務El5〇將經編碼 音訊信號經由第一邏輯頻道發送至第一實體。任務E160向 第一實體且經由不同於第一邏輯頻道之第二邏輯頻道發送 (A)音訊背景聲音選擇資訊及(B)識別第一實體之資訊。舉 例而言,可藉由如本文描述之裝置xl〇〇4X3〇〇之實施例 執行方法E200。 ©圖30B展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置EM200的方塊圖。裝 置EM200包括用於執行方法E2〇〇之各種任務之構件。裝置 EM200包括如上文所描述之構件eM10及EM20。裝置 EM100包括用於將編碼音訊信號經由第一邏輯頻道發送至 第一實體之構件EM50。裝置EM100包括用於向第二實體 且經由不同於第一邏輯頻道之第二邏輯頻道發送(A)音訊 背景聲音選擇資訊及識別第一實體的資訊之構件 EM60。可使用能夠執行此等任務之任何結構實施裝置 134861.doc -73- 200947422 EM200之各種元件,料結構包括詩執行本文揭示之此 等任務的結構中之任-者(例如,-或多個指令組、一或 多個邏輯元件陣列等)。裝置讓之各種元件的實例在 本文中揭示於裝置幻〇〇及幻〇〇之描述中。 圖31A展示根據所揭示組態之處理經編碼音訊信號的方 法F100之流程圖。方法F1⑽包括任務F11G、叩咖別。 在行動使用者終端機内,任務F11(m碼經編碼音訊信號以 獲得經解碼音訊信號。在行動使用者終端機内,任務F120 產生音訊背景聲音信號。在行動使用者終端機0,任務 F130混合基於音訊背景聲音信號之信號與基於經解瑪音訊 信號之信號。舉例而言,可藉由如本文描述之裝置議、 R200或R3 00之實施例執行方法F1〇〇。 圖3 1B展示根據所揭示組態之用於處理經編碼音訊信號 且位於行動使用者終端機㈣裝置蘭⑽之方塊圖。^置 FM100包括用於執行方法η⑽之各種任務之構件。裝置 FM100包括用於解碼經編碼音訊信號以獲得經解碼音訊作 號之構件FM1〇。裝置FMl〇〇包括用於產生音訊背景聲音: 號之構件FM20。裝置FM1G()包㈣於混合基於音訊背= 音信號之信號與基於經解碼音訊信號之信號的構件 觸〇。可使用能夠執行此等任務之任何結構實施裝置 圓00之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令电 多個邏輯元件陣料)。裝置FM⑽之各種元件的實例在本 文中揭示於裝置R100、R200&R300之描述中。 134861.doc -74_ 200947422 圖32A展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法Gl〇〇的流程圖。方法 G100包括任務GUO、G12(^G130。任務G1〇〇自數位音訊 信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務 G120產生基於第一濾波及第一複數個序列之音訊背景聲音 信號,該第一複數個序列中之每一者具有不同時間解= 度。任務G120包括將第一濾波應用至第—複數個序列中之 每一者。任務G130混合基於所產生音訊背景聲音信號之第 © 一信號與基於背景聲音受抑制信號之第二信號以獲得背景 聲音增強信號。舉例而言,可藉由如本文描述之裝置 X100、X300、R100、R2〇〇4R3〇〇之實施例執行方法 G100。 圖32B展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置GM100的方塊圖。裝 置GM100包括用於執行方法G1〇〇之各種任務之構件。裝置 GM100包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件GM1〇。裝置GM1〇〇&括用於 產生基於第一濾波及第一複數個序列之音訊背景聲音信遮 之構件GM20,該第一複數個序列中之每一者具有不同時 間解析度。構件GM20包括用於將第一濾波應用至第一複 數個序列中之每-者之構件。裝置咖1〇〇包括用於混合基 於所產生音訊背景聲音信號之第一信號與基於背景聲音受 抑制信號之第二信號以獲得背景聲音增強信號之構= GM30。可使用旎夠執行此等任務之任何結構實施裝置 134861.doc -75- 200947422 GM100之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、一或 多個邏輯元件陣列等)。裝置G M丨〇 〇之各種元件的實例在 本文中揭示於裝置X1〇〇、X3〇〇、R1〇〇、R2〇(^R3〇〇之描 述中。 圖33 A展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法Hi〇〇的流程圖。方法 H100 包括任務 ΗΠ0、H120、H130、H140 及 H150。任務 ® HI 10自數位音訊信號抑制背景聲音分量以獲得背景聲音受 抑制信號。任務H120產生音訊背景聲音信號。任務H13〇 混合基於所產生音訊背景聲音信號之第一信號與基於背景 聲音受抑制信號之第二信號以獲得背景聲音增強信號。任 務H140計算基於數位音訊信號之第三信號之等級。任務 H120及H130中的至少一者包括基於第三信號之所計算等 級控制第一彳§號之等級。舉例而言,可藉由如本文描述之 裝置X10〇、X30〇、R100、R200或R300的實施例執行方法 财 H100。 圖3 3 B展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置HM100的方塊圖。裝 置HM100包括用於執行方法H1〇〇之各種任務之構件。裝置 Η Μ1 0 0包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件ΗΜ10。裝置ΗΜ100包括用於 產生音訊背景聲音信號之構件ΗΜ20。裝置ΗΜ100包括用 於混合基於所產生音訊背景聲音信號之第一信號與基於背 134861.doc -76- 200947422 景聲音受抑制信號之第二信號以獲得背景聲音增強信號的 構件HM30。裝置HM100包括用於計算基於數位音訊信號 之第二k號的等級之構件HM40。構件HM20及HM30中的 至少一者包括用於基於第三信號之所計算等級控制第一信 號的等級之構件。可使用能夠執行此等任務之任何結構實 施裝置HM100之各種元件,該等結構包括用於執行本文揭 示之此等任務的結構中之任一者(例如,一或多個指令 組、一或多個邏輯元件陣列等)^裝置HM100之各種元件 © 的實例在本文中揭示於裝置X100、X3〇〇、R100、R200及 R300之描述中。 提供所描述組態之前文陳述以使得任何熟習此項技術者 旎夠製造或使用本文揭示之方法及其他結構。本文展示且 描述之流程圖、方塊圖及其他結構僅為實例,且此等結構 之其他變體亦在本揭示案之範疇内。對此等組態之各種修 改係可能的,且亦可將本文呈現之一般原理應用至其他組 ,態。舉例而言,強調本揭示案之範脅不限於所說明之組 態。相反,明確地預期且特此揭示,對於如本文描述之不 同特定組態的特徵不彼此矛盾之任何情形而言,可組合此 等特徵以產出包括於本揭示案之範脅内的其他組態。舉例 而言,可組合背景聲音抑制、背景聲音產生及背景聲音混 。之各種組態中之任—者,只要此種組合不與本文中彼等 元件之描述矛盾即可。亦明確地預期且特此揭示,在連接 描述為在褒置之兩個或兩個以上元件之間的情況下,可能 存在-或多個介入元件(諸如遽波器),且在連接描述為在 134861.doc -77- 200947422 方法之兩個或兩個以上任務之間的情況下,可能存在一或 多個介入任務或操作(諸如濾波操作)。 可與如本文描述之編碼器及解碼器一起使用,或經調適 而與該等編碼器及解碼器一起使用的編解碼器之實例包 括:如描述於上文提及之3GPP2文件C.S0014-C中之增強 可變速率編解碼器(EVRC);如描述於ETSI文件ts 126 092 V6.0.0(第6章,2004年12月)中之調適性多重速率(AMR)話 音編解碼器;及如描述於ETSI文件ts 126 192 V6.0.0.(第6 ® 章,2004年12月)中之AMR寬頻話音編解碼器。可與如本 文描述之編碼器及解碼器一起使用的無線電協定之實例包 括臨時標準95(IS-95)及CDMA2000(如由電信產業協會 ((TIA),Arlington,VA)發布之規範中所描述)、AMR(如 ETSI文件TS 26.101中所描述)、GSM(全球行動通信系統, 如ETSI發布之規範中所描述)、UMTS(全球行動電信系 統,如ETSI發布之規範中所描述)及W_CDMA(寬頻分碼多 重存取,如由國際電信聯盟公布之規範中所描述)。
A 本文描述之組態可部分或整體地實施為硬連線電路、製 造於特殊應用積體電路中之電路組態’或載入於非揮發性 儲存器中之勒體程式或作為機器可讀程式碼自電腦可讀媒 體載入或載入於電腦可讀媒體中之軟體程式,此種程式碼 為可由諸如微處理器或其他數位信號處理單元之邏輯元件 之陣列執行的指令。電腦可讀媒體可為諸如半導體記憶體 (其可包括(但不限於)動態或靜態RAM(隨機存取記憶體)、 ROM(唯讀記憶體)及/或快閃RAM)或鐵電記憶體、磁電阻 134861.doc -78 - 200947422 記憶體、雙向記憶體、聚入 元件之陣列;諸如磁碟或=錢體或相變記憶體之儲存 存之任何其他電腦可讀=碟片媒體;或用於資料儲 .^ ^ w媒體。術語"軟體"應理解為包括源 私式碼、組合語言碼、機 機器碼、二元碼、韌體、宏代碼、 微碼、可由邏輯元件之陣列執行的任何-或多組或序列之 指令,及此等實例之任何組合。 ❹
▲本文揭不之方法中的每一者亦可有形地實施為(舉例而 I在上文列舉之一或多個電腦可讀媒體中)可由包括邏 輯兀件之陣列的機器(例如,處理器、微處理器、微控制 器或其他有限狀態機)讀取及/或執行之—或多組指令。因 此’本揭tf帛不意欲限於±文展示的組態,巾冑符合與本 文中以任何方式揭示之原理及新穎特徵(包括於形成原始 揭不案之一部分的所申請之附加申請專利範圍中)一致的 最廣泛範。 【圖式簡單說明】 圖1A展示話音編碼器χ1〇之方塊圖。 圖1Β展示話音編碼器Χ10之實施例X2〇之方塊圖。 圖2展示決策樹之一實例。 圖3Α展示根據一般組態之裝置Χ100之方塊圖。 圖3Β展示背景聲音處理器1〇〇之實施例1〇2之方塊圖。 圖3C-圖3F展示可攜式或免提式器件中兩個麥克風Κ10 及Κ20之各種安裝組態,且圖3g展示背景聲音處理器1〇2 之實施例102Α之方塊圖。 圖4A展示裝置χ100之實施例X102之方塊圖。 134861.doc -79- 200947422 圖4B展示背景聲音處理器1〇4之實施例ι〇6之方塊圖。 圖5 A說明音訊信號與編碼器選擇操作之間的各種可能之 相依性。 圖5B說明音訊信號與編碼器選擇操作之間的各種可能之 相依性。 圖ό展示裝置χιοο之實施例χι1〇之方塊圖。 圖7展示裝置XI 00之實施例乂丨2〇之方塊圖。 圖8展示裝置XI 〇〇之實施例χι 3〇之方塊圖。 © 圖9A展示背景聲音產生器120之實施例122之方塊圖。 圖9B展示背景聲音產生器ι22之實施例ι24之方塊圖。 圖9C展示背景聲音產生器ι22之另一實施例ι26之方塊 圖。 圖9D展示用於產出所產生背景聲音信號S50之方法Ml 00 之流程圖。 圖10展示多重解析背景聲音合成之過程之圖。 圖11A展示背景聲音處理器1〇2之實施例ι〇8之方塊圖。 傷 圖11B展示背景聲音處理器102之實施例109之方塊圖。 圖12A展示話音解碼器R1〇之方塊圖。 圖12B展示話音解碼器R1〇之實施例R2〇之方塊圖。 圖13A展不背景聲音混合器19〇之實施例ι92之方塊圖。 圖13B展不根據—組態之裝置尺1〇〇之方塊圖。 圖14A展示背景聲音處理器2〇〇之實施例之方塊圖。 圖14B展不裝置R1〇〇之實施例Rn〇之方塊圖。 圖15展示根據一組態之裝置尺2〇〇之方塊圖。 134861.doc -80- 200947422 圖16展示裝置χιοο之實施例χ2〇〇之方塊圖。 圖17展示裝置χιοο之實施例χ21〇之方塊圖。 圖18展示裝置XI 00之實施例χ22〇之方塊圖。 圖19展示根據一所揭示組態之裝置χ3〇〇之方塊圖。 圖20展示裝置χ300之實施例χ31〇之方塊圖。 圖21Λ展示自飼服器下載背景聲音資訊之實例。 圖21Β展不將背景聲音資訊下載至解碼器之實例。 圖22展示根據一所揭示組態之裝置R3〇〇之方塊圖。 ❹ 圖23展示裝置尺3〇〇之實施例R310之方塊圖》 圖24展不裝置r300之實施例尺32〇之方塊圖。 圖25 A展示根據一所揭示組態之方法A1 00之流程圖。 圖25B展不根據—所揭示組態之裝置am100之方塊圖。 圖26A展示根據一所揭示組態之方法則〇〇之流程圖。 圖26B展示根據一所揭示組態之裝置BM100之方塊圖。 圖27A展示根據一所揭示組態之方法c丨〇〇之流程圖。 ^ 圖27B展不根據一所揭示組態之裝置CM1 00之方塊圖。 圖28A展不根據一所揭示組態之方法di〇〇之流程圖。 圖28:8展示根據一所揭示組態之袭置DM100之方塊圖。 圖29A展不根據—所揭示組態之方&ei〇〇之流程圖。 圖29B展不根據一所揭示組態之裝置emi〇〇之方塊圖。 圖30A展不根據一所揭示組態之方法之流程圖。 圖30B展不根據一所揭示組態之裝置之方塊圖。 圖31A展不根據一所揭示組態之方法^⑽之流程圖。 圖3 1B展不根據—所揭示組態之裝置⑽之方塊圖。 134861.doc -81- 200947422 圖32Α展示根據_所揭示組態之方法〇⑽之流程圖。 圖32B展不根冑_所揭示組態之裝置⑽之方塊圖。 圖33A展示根攄— _ M 所褐不組態之方法HI 00之流程圖。 圖33B展示根播—^^曰_ 嫁一所揭示組態之裝置HM1 00之方塊圖。 在此等圖中,& _ 相同參考標號指代相同或類似元件。 【主要元件符號說明】
Ο 10 雜訊抑制器 20 編碼方案選擇器 22 編媽方案選擇器 30 有作用訊框編碼器 30a 有作用訊框編碼器 30b 有作用訊框編碼器 40 非有作用訊框編石馬 50a 選擇器 50b 選擇器 52a 選擇器 52b 選擇器 60 編碼方案偵測器 62 編碼方案偵測器 70 有作用訊框解碼器 70a 有作用訊框解碼器 70b 有作用訊樞解褐器 80 非有作用訊框解碼 90a 選擇器 134861.doc 82· 200947422
90b 選 擇 器 92a 選 擇 器 92b 選 擇 器 100 背 景 聲 音處理 器 102 背 景 聲 音處理 器 102A 背 景 聲 音處理 器 104 背 景 聲 音處理 器 106 背 景 聲 音處理 器 108 背 景 聲 音處理 器 109 背 景 聲 音處理 器 110 背 景 聲 音抑制 器 110A 背 景 聲 音抑制 器 112 背 景 聲 音抑制 器 120 背 景 聲 音產生 器 122 背 景 聲 音產生 器 124 背 景 聲 音產生 器 126 背 景 聲 音產生 器 130 背 景 聲 音資料庫 134 背 景 聲 音資料庫 136 背 景 聲 音資料庫 140 背 景 聲 音產生 引 擎 144 背 景 聲 音產生 引 擎 146 背 景 聲 音產生 引 擎 150 背 景 聲 音編碼 器 134861.doc -83- 200947422
152 190 192 195 197 200 210 212 218 220 222 228 250 背景聲音編碼器 背景聲音混合器 背景聲音混合器 增益控制信號計算器 增益控制信號計算器 背景聲音處理器 背景聲音抑制器 背景聲音抑制器 背景聲音抑制器 背景聲音產生器 背景聲音產生器 背景聲音產生器 選擇器
G 252 290 320 330 背景聲音解碼器 背景聲音混合器 背景聲音分類器 背景聲音選擇器 340 處理控制信號產生器 AM10用於基於第-麥克風產出之第—音訊信號自數 位音訊信號抑制第一音訊背景聲音以獲得背景 聲音受抑制信號之構件 AM2°用於混合第二音訊背景聲音與基於背景聲音受 抑制信號之信號以獲得背景聲音增強信號之構件 AM100 田& 松立 再干 用於處理包括第一音訊背景聲音之數位音訊信 134861.doc -84- 200947422 BM10 BM20 BM30 ❹ BM40 BM100 CM10 ❹ CM20 CM30 CM40 號的裝置 用於在處理控制信號具有第一狀態時以第一位 元速率編碼缺少話音分量之數位音訊信號部分 之訊框的構件 用於在處理控制信號具有不同於第一狀態之第 二狀態時自數位音訊信號抑制背景聲音分量以 獲得背景聲音受抑制信號之構件 用於在處理控制信號具有第二狀態時混合音訊 背景聲音信號與基於背景聲音受抑制信號之信 號以獲得背景聲音增強信號之構件 用於在處理控制信號具有第二狀態時以第二位 元速率編碼缺少話音分量之背景聲音增強信號 部分之訊框的構件 用於根據處理控制信號的狀態處理數位音訊信 號之裝置 用於自數位音訊信號抑制第一音訊背景聲音以 獲得背景聲音受抑制信號之構件 用於混合第二音訊背景聲音與基於背景聲音受 抑制信號之信號以獲得背景聲音增強信號之構件 用於將基於(A)第二音訊背景聲音及(B)背景聲 音增強信號中的至少一者之信號轉換為類比信 號的構件 用於自第二轉換器產出基於類比信號之聲訊信 號之構件 134861.doc -85- 200947422 CM 100 用於處理基於ή资 ±± ,. 吞於自第一轉換器接收的信號之數位 音訊信號的裝置 DM10用於根據第—編碼方案解碼經編碼音訊信號之 第複數個經編碼訊框以獲得包括話音分量及 者景聲音分量的第一經解碼音訊信號之構件 DM20用於根據第二編碼方案解碼經編碼音訊信號之 第二複數個經編碼訊框以獲得第二經解碼音訊 信號之構件
DM30用於基於來自第二經解碼音訊信號之資訊自基 於第一經解碼音訊信號的第三信號抑制背景聲 音分量以獲得背景聲音受抑制信號之構件 DM100用於處理經編碼音訊信號的裝置 ΕΜ10 用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件 ΕΜ20 用於編碼基於背景聲音受抑制信號之信號以獲 得經編碼音訊信號之構件 ΕΜ30 用於選擇複數個音訊背景聲音中的一者之構件 ΕΜ40 用於將關於所選音訊背景聲音之資訊插入於基 於經編碼音訊信號的信號中之構件 ΕΜ50 用於將經編碼音訊信號經由第一邏輯頻道發送 至第一實體之構件 ΕΜ60 用於向第二實體且經由不同於第一邏輯頻道之 第二邏輯頻道發送(Α)音訊背景聲音選擇資訊 及(Β)識別第一實體的資訊之構件 134861.doc -86- 200947422 EM100 EM200 FM10 FM20 FM30 ❹ FM100 GM10 GM20 GM30 ❿ GM100 HM10 HM20 HM30 用於處理包括話音分量及背景聲音分量的數位 音訊信號之裝置 用於處理包括話音分量及背景聲音分量的數位 音訊信號之裴置 用於解碼經編碼音訊㈣以獲得經解碼音訊信 號之構件 用於產生音訊背景聲音信號之構件 用於混合基於音訊背景聲音信號之信號與基於 經解碼音訊信號之信號的構件 用於處理經編碼音訊信號且位於行動使用者終 端機内的裝置 用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件 用於產生基於第一渡波及第一複數個序列之音 訊背景聲音信號之構件 用於混合基於所產生音訊背景聲音信號之第一 4吕號與基於背景聲音受抑制信號之第二信號以 獲得背景聲音增強信號之構件 用於處理包括話音分量及背景聲音分量的數位 音訊信號之裝置 用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件 用於產生音訊背景聲音信號之構件 用於混合基於所產生音訊背景聲音信號之第— 134861.doc -87 - 200947422 ❹
^號與基於背景聲音受抑制信號之第二信號以 獲仔背景聲音增強信號的構件 HM40 用於3十算基於數位音訊信號之第三信號的等級 之構件 HM100 用於處理包括話音分量及背景聲音分量的數位 音訊信號之裝置 K10 麥克風 K20 麥克風 P10 協定堆疊 P20 協定堆疊 P30 協定堆疊 P40 協定堆疊 RIO 話音解碼器 R20 話音解碼器 R100 經組態以自經解碼音訊信號移除現存料聲立 :將其取代為可能類似於或不同於現存背“ 曰之所產生背景聲音之裝置 、 R110 經組態以自經解碼音 且將盆取“除現存背景聲音 且將再取代為可能翻 9 音之所產生背景聲音之裝置 者尽聲 R200 經組態以在選㈣景聲音抑制時 訊框解碼器之輪出之裝置 衆非有作用 R300 話音解碼器/包括經組態以根據背 信號之狀態產出所產生背耗:選擇 曰唬的背景聲 I34861.doc •88- 200947422 音產生器之例項的裝置 R3 1 0 話音解碼器/包括經組態以根據背景聲音選擇 信號之狀態產出所產生背景聲音信號的背景聲 音產生器之例項的裝置 R320 話音解碼器/包括經組態以根據背景聲音選擇 信號之狀態產出所產生背景聲音信號的背景聲 音產生器之例項的裝置 S 1 0 音訊信號
S 1 2 雜訊受抑制音訊信號 S 1 3 背景聲音受抑制音訊信號 S15 背景聲音增強音訊信號 S20 經編碼音訊信號 S20a 第一經編碼音訊信號 S20b 第二經編碼音訊信號 S30 處理控制信號 S40 背景聲音選擇信號 S50 所產生背景聲音信號 S70 背景聲音參數值 S80 經編碼背景聲音信號 S82 經編碼背景聲音信號 S90 增益控制信號 S 110 經解碼音訊信號 S113 背景聲音受抑制音訊信號 S 115 背景聲音增強音訊信號 134861.doc 89- 200947422 S130 S140 S150 SA1 ΧΙΟ X20 X100 ❹ X102 X110 X120 Q X130 X200 處理控制信號 背景聲音選擇信號 所產生背景聲音信號 音訊信號 話音編媽器 話音編碼器 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 ,’·_£、且,“、以自音訊信说移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 134861.doc •90- 200947422 X210 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生背景聲音之裝置 X220 經組態以自音訊信號移除現存背景聲音且將其 取代為可能類似或不同於現存背景聲音之所產 生责景聲音之裝置 X300 組態為在非古从 立之值&樞期間不支援現存背景聲 曰之傳輸之裝置 〇 Χ310 组態為在非有作用# 音之傳輸之聚f 3·期間不支援現存背景聲 134861.doc -91 .
Claims (1)
- 200947422 十、申請專利範圍: 種處理一經編碼音訊信號之方法,該方法包含: 根據一第一編碼方案解碼該經編碼音訊信號之第一複 數個經編碼訊框以獲得一包括一話音分量及一背景聲音 刀量之第—經解碼音訊信號; 根據一第二編碼方案解碼該經編碼音訊信號之第二複 數個經編碼訊框以獲得一第二經解碼音訊信號;及 基於來自該第二經解碼音訊信號之資訊’自—基於該❹ 第經解碼音訊信號之第三信號抑制該背景聲音分量以 獲传—背景聲音受抑制信號。 2 -如請灰 TS 3 1之處理一經編碼音訊信號之方法,其中該抑 制該背景聲音分量包含:基於來自該第二經解碼音訊信 號之資訊對該第三信號執行一頻譜相減操作。 3.如請求 人項1之處理一經編碼音訊信號之方法其中該方 二匕3·計算該第二經解碼音訊信號之一等級;及 該所計算> @ & 典导獻 、’混合一音訊背景聲音信號與一基於該 號9 $抑制信號之信號,以獲得-背景聲音增強信 4. 如凊求項3之處一 算該第n &編料訊信號之方法,其中該計 碼音訊曰Μ號之—等級係基於在該第二經解 5. 如請求;=訊框上之-平均能量。 法包含: 、,編碣音訊信號之方法,其中該方 絰由—帛—邏輯頻道接 收一包括該經編碼音訊信號 之 I34861.doc 200947422 第一傳輪; ^由不同於該第—邏輯頻道之—第二邏輯頻道接收— 包括一紐參數值之第二傳輪;及 基於該組參數值,產生該音訊背景聲音信號。 6_如請求項5之處理-經編碼音訊信號之方法,其中該接 收一第二傳輸包含:在符合會話起始協定之-版本之— 訊息中接收該組參數值。 Ο ❹ 7.如咕求項1之處理-經編碼音訊信號之方法,其中嗲方 法包含: 丹Y忒方 算該第一經解竭音訊信號之一等級; 基於该所計算之等級,產生一音訊背景聲音信號;及 上混合該音訊背景聲音信號與一基於該背景聲音受抑制 ^號之k號以獲得一背景聲音增強信號。 8·如咕求項丨之處理一經編碼音訊信號之方法,其中該方 法包3,基於來自該第二經解碼音訊信號之資訊,產 一音訊背景聲音信號,·及 ^ ▲混合該音訊背景聲音信號與一基於該背景聲音受抑制 信號之信號以獲得一背景聲音增強信號。 · 9·如胡求項1之處理一經編碼音訊信號之方法,其中該 法包含接收一包括該經編碼音訊信號之無線傳輸,及 其中該接收、該解碼第一複數個經編蝎訊框、該解瑪 第二複數個經編碼訊框及該抑制該背景聲音分量在—共 同外殼内發生。 、 10·如請求項1之處理一經編碼音訊信號之方法,其中該接 134861.doc 200947422 :欠、該解碼第-複數個經編碼訊框、該解碼第二複數個 =喝訊框及該抑制該背景聲音分量在一行動使用 = 端機内發生。 ^ 11·如凊求们之處理―經編碼音訊信號之方法,其中該解 碼第二複數個經編碼訊框包含: 自該第—複數個經編碼訊框中之至少—者獲得複數 線性預測編碼係數值; 產生一基於一偽隨機雜訊信號之激勵信號;及 ❹ *據*亥複數個線性預測編碼係數值對該激勵信號進 濾波, 订 號 其中該第二經解碼音訊信號係基於該經濾波之激勵信 η 12. ❾ 一種用於處理-經編碼音訊信號之裝置,該裝置包含: 一第一訊框解碼器,其經組態以根據一第一編碼方案 解碼該經編料訊信號H數個經編碼訊框以獲得 -包括-話音分量及1景聲音分量之第—經解碼音訊 信號; 一第二訊框解碼器,其經組態以根據一第二編碼方案 解碼該經編碼I訊信冑之第二複數個經編碼訊框以獲得 一第二經解碼音訊信鍊;及 一背景聲音抑制器,其經組態而基於來自該第二經解 碼音訊信號之資訊自—基於該第一經解碼音訊信號之第 三信號抑制該背景聲音分量以獲得一背景聲音受抑制信 號。 134861.doc 200947422 13. 如請求項12之用於處理一經編碼音訊信號之裝置,其中 該背景聲音抑制器經組態以基於來自該第二經解碼音訊 仏號之身訊對該第三信號執行一頻譜相減操作。 14. 如吻求項12之用於處理一經編碼音訊信號之裝置,其中 該裝置包含: 增益控制信號計算器,其經組態以計算該第二經解 碼音訊信號之一等級;及 奇景聲音混合器’其經組態而基於該所計算之等級 〇 混合-音訊背景聲音信號與一基於該背景聲音受抑制信 號之信號以獲得一背景聲音增強信號。 15. 如叫求項14之用於處理—經編碼音訊信號之裝置,其中 或增益控制信號計算器經組態以基於在該第二經解碼信 號之至少一訊框上之—平均能量計算該等級。 16. 如請求項Η之用於處理—經編碼音訊信號之裝置,其中 該裝置包含: '傳輸;及 -接收器’其經組態以經由一第—邏輯頻道接收一包 括該經編碼音訊信號之第—傳輸且經由不同於該第一邏 輯頻道的一第二邏輯頻道接收一包括一組參數值之第: -背景聲音產生器’其經組態以基於該組參數值產生 該音訊背景聲音信號。 17.如請求項16之用於處理一經編碼音訊信號之裝置,其中 該接收器經組態以在符合會話起始協定之—版本的二訊 息中接收該組參數值。 ° 134861.doc 200947422 18. ❹ 19. ❿20· 21. 如叫求項12之用於處理一經編碼音訊信號之裝置,其中 該裝置包含: 増益控制彳§號計算器,其經組態以計算該第二經解 碼音訊信號之一等級; 一背景聲音產生器,其經組態以基於該所計算之等級 產生—音訊背景聲音信號;及 者景聲音混合器,其經組態以混合該音訊背景聲音 L號與一基於該背景聲青受抑制信號之信號來獲得一背 景聲音增強信號。 如凊求項12之用於處理一經編碼音訊信號之裝置,其中 該裝置包含一背景聲音產生器,該背景聲音產生器經組 態以基於來自該第二經解碼音訊信號之資訊產生一音訊 背景聲音信號;及 奇景聲音混合器,其經組態以混合該音訊背景聲音 L號與一基於該背景聲音受抑制信號之信號來獲得一背 景聲音增強信號。 如凊求項12之用於處理一經編碼音訊信號之裝置,其中 該裝置包含一接收器,該接收器經組態以接收一包括該 經編碼音訊信號之無線傳輸,且 其中該接收器、該第―訊框解碼器、該第二訊框解碼 器及該背景聲音抑制器係位於一共同外殼内。 如切求項12之用於處理一經編碼音訊信號之裝置,其中 該接收器、該第-訊框解碼器、該第二訊框解碼器及該 背景聲音抑制器係位於一行動使用者終端機内。 134861.doc 200947422 22·如請求項12之用於處理一經編碼音訊信號之裝置,其中 該第二訊框解碼器經組態以: 自該第二複數個經編碼訊框中之至少一者獲得複數個 線性預測編碼係數值; 產生一基於一偽隨機雜訊信號之激勵信號;及 根據該複數個線性預測編碼係數值對該激勵信號進行 濾波, 其中該第二經解碼音訊信號係基於該經濾波之激勵信 ❾ 號。 23. —種用於處理一經編碼音訊信號之裝置,該裝置包含: 用於根據一第一編碼方案解碼該經編碼音訊信號之第 一複數個經編碼訊框以獲得一包括一話音分量及一背景 聲音分量的第一經解碼音訊信號之構件; 用於根據一第二編碼方案解碼該經編碼音訊信號之第 一複數個經編碼訊框以獲得一第二經解碼音訊信號之構 件;及 ® Μ基於來自該第:經解碼音訊信號之資訊自一基於 該第一經解碼音訊信號的第三信號抑制該背景聲音分量 以獲得一背景聲音受抑制信號的構件。 24. 如凊求項23之用於處理一經編碼音訊信號之裝置,其中 該用於抑制該背景聲音分量之構件包含:用於基於來自 該第二經解碼音訊信號的資訊對該第三信號執行一頻譜 相減操作之構件。 25. 如請求項23之用於處理一經編碼音訊信號之裝置,其中 134861.doc •6- 200947422 該裝置包含:用於計算該第二經解碼音訊信號之—等級 之構件;及用於基於該所計算之等級混合-音訊背景聲 “5號與-基於該背景聲音受抑制信號的信號來獲得一 背景聲音增強信號之構件。 如π求項25之用於處理—經編碼音訊信號之裝置,其 =用於計算該第二經解碼信號之—等級之構件經組態以 基於在該第二經解碼信號的至少—訊框上之 計算該等級。 g敗*重 ❹27.如請求項25之用於虛理 用於處理一經編碼音訊信號之裝置, 該装置包含: 丹T 號構:輯頻道接"括該一訊信 用於經由不同;^节楚 R該第一邏輯頻道之一第 收一包括一組參數值之第二傳輸之構件;&頻道接 用於基於該組參數 件。 數值產生該音訊背景聲音信號之構 ❿ 2 8.如睛求項2 7之用於處 於處理一經編碼音訊信號之 該用於接收一第二傳輪 夏,、中 始協定的-版本之_=諸包含:用於在符合會話起 以如請求扣之用於處=接㈣組參數值之構件。 該裝置包含·· 經編碼音訊信號之裝置,其中 用於計算該第二經解碼立訊 用於基於該所計算:產:’ 一、級之構件; 構件;及 丨之等級產生—音訊背景聲音信號之 13486l.doc 200947422 用於混合該音訊背景聲音信號與一基於該背景聲音受 抑制仏號之彳§號來獲得一背景聲音增強信號之構件。 30. 如請求項23之用於處理一經編碼音訊信號之裝置,其中 該裝置包含用於基於來自該第二經解碼音訊信號之資訊 產生一音訊背景聲音信號之構件;及 用於混合該音訊背景聲音信號與一基於該背景聲音受 抑制信號之信號以獲得一背景聲音增強信號之構件。 31. 如請求項23之用於處理一經編碼音訊信號之裝置,其中 © 該裝置包含用於接收—包括該經編碼音訊信號之無線傳 輸之構件,且 其中該用於接收之構件、該用於解碼第―複數個經編 碼訊框之構件、該用於解碼第二複數個經編碼訊框之構 件及該用於抑制該f景聲音分量之構件係在—共同外殼 内發生。 32.如請求項23之用於處理一經編碼音訊信號之裝置,其中 ❿〜用於接收之構件、㈣於解碼帛—複數缝編碼訊框 之構件、該用於解碼第二複數個經編碼訊 用於抑制該背景聲音分量之椹杜总+ 再干及μ 機内發生。曰刀置之構件係在一行動使用者終端 33·如明求項23之用於處理—經編碼音訊信號之裝置,其中 該用於解碼第二複數個經編碼訊框之構件包含: 用於自該第二複數個經編碼訊框中之至少一者 數個線性預測編碼係數值之構件; ^ 用於產生一基於一偽隨機雜訊信號之激勵信號之構 134861.doc 200947422 件;及 用於根據該複數個線性預測編碼係數值對該激勵信號 進行濾波之構件, 其·中該第二經解碼音訊信號係基於該經濾波之激勵信 號。 34_ —種電腦可讀媒體,其包含用於處理一包括一話音分量 及一背景聲音分量之數位音訊信號之指令,當該等指令 由一處理器執行時使得該處理器: © 根據一第一編碼方案解碼該經編碼音訊信號之第一複 數個經編碼訊框以獲得一包括一話音分量及一背景聲音 分量之第一經解碼音訊信號; 根據一第二編碼方案解碼該經編碼音訊信號之第二複 數個經編碼訊框以獲得一第二經解碼音訊信號;及 基於來自該第二經解碼音訊信號之資訊,自一基於該 第一經解碼音訊信號之第三信號抑制該背景聲音分量以 獲得一背景聲音受抑制信號。 G 35.如請求項34之電腦可讀媒體,其中當由一處理器執行時 使得該處理器抑制該背景聲音分量之該等指令經組態以 使知該處理器基於來自該第二經解碼音訊信號的資訊對 該第二#號執行一頻譜相減操作。 3 6,如請求項34之電腦可讀媒體,其中該媒體包含當由—處 理器執行時使得該處理器計算該第二經解碼音訊信號之 一等級且基於該所計算的等級混合一音訊背景聲音信號 與一基於該背景聲音受抑制信號之信號以獲得一背景聲 134861.doc 200947422 37. 38. Ο 39. ❿ 40. 41. 音增強信號的指令。 如請求項36之電腦可讀媒體,其中當由一處理器執行時 使得該處理器計算該第二經解碼信號之一等級的該等指 令經組態以使得該處理器基於在該第二經解碼信號之至 少一訊框上的一平均能量計算該等級。 如請求項36之電腦可讀媒體,其中該媒體包含: 當由一處理器執行時使得該處理器經由一第一邏輯頻 道接收一包括該經編碼音訊信號之第一傳輸之指令; 當由一處理器執行時使得該處理器經由不同於該第— 邏輯頻道之一第二邏輯頻道接收一包括一組參數值的第 一傳輸之指令;及 Ϊ由處理器執行時使得該處理器基於該組參數值產 生該音訊背景聲音信號之指令。 如請求項38之電腦可讀媒體,其中當由一處理器執行時 使得該處理器接收一第二傳輸之該等指令經組態以使得 該處理器在符合會話起始協定的一版本之一訊息中接收 該組參數值。 如請求項34之電腦可讀媒體,其中該媒體包含指令,當 該等指令由一處理器執行時使得該處理器: 計算該第二經解碼音訊信號之一等級; 基於邊所计算之等級產生一音訊背景聲音信號;及 混合该音訊背景聲音信號與一基於該背景聲音受抑制 信號之信號以獲得一背景聲音增強信號。 如請求項34之電腦可讀媒體,其中該媒體包含指令,當 134861.doc 200947422 該等指令由一處理器執行時使得該處理器: 基於來自該第二經解碼音訊信號之資訊產生-音訊背 景聲音信號;及 # 混合該音訊背景聲音作 曰^戒與一基於該背景聲音受抑 信號之信號以獲得-背景聲音增強信號。 42.如請求項34之電腦可讀媒許 丨 购^賈媒體,其中該媒體與一經組離 接收一包括該經編碼音訊信號之無線傳輸的接收器:於 同一外殼内。 、 © 43.如請求項34之電腦可讀媒體,其中該媒體係位於 使用者終端機内。 44.如請求項34之電腦可讀媒體,其中當由一處理器執 使得該處理H解碼第二複數個經編碼絲之該等指令經 組態以使得該處理器: 自該第二複數個經編碼訊框中之至少一者獲得複數個 線性預測編碼係數值; 〇 產生一基於一偽隨機雜訊信號之激勵信號;及 根據該複數個線性預測編碼係數值對該激勵信號進行 濾、波, 其中該第二經解碼音訊信號係基於該經濾波之激勵信 號。 ° 4 5. —種處理一經編碼音訊信號之方法,該方法包含. 在一行動使用者終端機内,解碼該經編碼音訊信號以 獲得一經解碼音訊信號; 在該行動使用者終端機内,產生一音訊背景聲音信 134861.doc 200947422 號;及 在該行動使用者終端機内,混合一基於該音訊背景聲 音^號之信號與一基於該經解碼音訊信號之信號。 46. 如凊求項45之處理一經編碼音訊信號之方法,其中該方 法係在包括該經編碼音訊信號之電話呼叫期間執行。 47. 如凊求項45之處理一經編碼音訊信號之方法,其中該產 生曰訊责景聲音信號係基於與該經編碼音訊信號相關 聯之呼叫號碼識別資訊。 © 48.如明求項45之處理一經編碼音訊信號之方法,其中該經 編碼音訊信號包括複數個訊框,且其中該複數個訊框甲 之每一者包括一激勵信號之一描述。 49. 如研求項45之處理一經編碼音訊信號之方法,其中該方 法包含計算該經解碼音訊信號之一等級,且 其中該混合係基於該所計算之等級。 50. ^研求項49之處理一經編碼音訊信號之方法,其中該計 异⑽轉碼音訊信號之—等㈣基於在該轉碼音訊信 號的至少一訊框上之—平均能量。 51. 如:求項45之處理__數位音訊信號之方法,其中該產生 5月景聲音仏號包括基於第一複數個序列產生該音 走景聲號,該第一複數個序列中之每一者具有一 不同時間解析度。 、 二求項45之處理一數位音訊信號之方法,其中該產生 曰訊背景聲音尨號包括基於關於一執行該方法所在之 實體位置之資訊選擇複數個音訊背景聲音中的一者。 134861.doc -12- 200947422 53. 54. 55. ο 56. 57. ❹ 58. 59. 如明求項45之處理一數位音訊信號之方法,其中該產生 一音訊背景聲音信號包括基於來自該經編碼音訊信號之 資訊選擇複數個音訊背景聲音中的一者。 如清求項45之處理一數位音訊信號之方法,其中該經編 碼音訊信號之至少一非有作用訊框包括關於該音訊背景 聲音信號之資訊。 如凊求項45之處理一數位音訊信號之方法,其中該方法 〇含自該經編碼音訊信號之一系列非有作用訊框獲得關 於該音訊背景聲音信號之資訊’其中該系、列在該經編碼 曰訊彳5號内以在自一百至兩千個訊框之範圍中之一間隔 不連續地出現。 如請求項45之處理一數位音訊信號之方法,其中該經編 石馬:訊信號之至少―非有作用訊框包括描述該音訊背景 聲s彳s號之—等級隨時間推移之一所要改變的資訊。 如請求項45之處理一數位音訊信號之方法,其中該產生 曰訊者不聲音信號係基於來自該經編碼音訊信號之至 少一非有作用訊框之一組參數值。 如=求項45之處理__數位音訊信號之方法,其中該產生 曰訊月景聲音信號係基於來自該經編碼音訊信號之一 系列非有作用訊框之第一複數個序列,其中該第一複數 個序列中之每一者具有一不同時間解析度。 2求項45之處理-數位音訊信號之方法,其中該產生 曰凡者景聲日仏號係基於一來自該經編碼音訊信號之 至少一非有作用訊框之背景聲音識別符。 134861.doc -13- 200947422 60·如請求項45之處理一數位音訊信號之方法,其中該方法 包含經由一第一邏輯頻道接收該經編碼音訊信號,及經 由不同於該第-邏輯頻道之—第二邏輯頻道接收關於該 音訊背景聲音信號之資訊。 61.如請求項60之處理一數位音訊信號之方法,其中該方法 包含自一第一實體接收該經編碼音訊信號,及自不同於 該第一實體之一第二實體接收關於該音訊背景聲音信號 之資訊。 〇 62.如請求項61之處理一經編碼音訊信號之方法,其中該接 收關於該音訊背景聲音信號之資訊包含在符合會話起始 協定的一版本之一訊息中接收關於該音訊背景聲音信號 之該資訊。 63 ·如請求項62之處理一數位音訊信號之方法,其中接收關 於該音訊背景聲音信號之該資訊包括一背景聲音識別 符,且 其中該產生一音訊背景聲音信號係基於該背景聲音識 ® 別符。 64. 如請求項62之處理一數位音訊信號之方法,其中接收關 於該音訊背景聲音信號之該資訊包括一組參數值’且 其中該產生一音訊背景聲音信號係基於該組參數值。 65. 如請求項62之處理一數位音訊信號之方法’其中該訊息 包括識別該第二實體之資訊。 66. 如請求項65之處理一數位音訊信號之方法’其中識別該 第二實體之該資訊係一統一資源識別符。 134861.doc •14· 200947422 67. 〇 68. 69. 70. ❿ 71. 一種用於處理一經編碼音訊信號且位於一行動使用者終 端機内之裝置,該裝置包含: 、 解碼器,其經組態以解碼該經編碼音訊信號以獲得 一經解碼音訊信號; 者景聲音產生器,其經組態以產生一音訊背景聲音 信號;及 一背景聲音混合器,其經組態以混合一基於該音訊背 景聲音信號之信號與一基於該經解碼音訊信號之信號。 如請求項67之用於處理一經編碼音訊信號之裝置,其中 該裝置經組態以在一包括該經編碼音訊信號之電話呼叫 期間混合基於該音訊背景聲音信號的該信號與基於該經 解碼音訊信號之該信號。 如请求項67之用於處理一經編碼音訊信號之裝置,其中 該背景聲音產生器經組態以基於與該經編碼音訊信號相 關聯之呼叫號碼識別資訊產生該音訊背景聲音信號。 如請求項67之用於處理一經編碼音訊信號之裝置,其中 該經編碼音訊信號包括複數個訊框,且其中該複數個訊 框中之每一者包括一激勵信號之一描述。 如請求項67之用於處理一經編碼音訊信號之裝置,其中 該裝置包含一增益控制信號計算器,該增益控制信號計 算器經組態以計算該經解碼音訊信號之一等級,且 其中該背景聲音混合器經組態以基於該所計算之等級 混合基於該音訊背景聲音信號的該信號與基於該經解碼 音訊信號之該信號。 13486I.doc -15- 200947422 72. 73. φ 74. 75. 76. ❿ 77. 78. 如清求項71之用於處理—經編碼音訊信號之裝置,盆中 該增益控制信號計算諸組“基於在該經解碼音訊信 號之至夕tfl框上的一平均能量計算該經解碼音訊信號 之該等級。 如請求項67之用於處理一數位音訊信號之裝置,其中該 月景聲θ產生器經組態以基於第一複數個序列產生該音 訊背景聲音信號,該第-複數個序列中之每一者具有— 不同時間解析度。 如請求項67之用於處理一數位音訊信號之裝置,其中該 彦景聲音產生器經組態以基於關於該裝置之一實體位置 的資訊選擇複數個音訊背景聲音中之一者。 如”月求項67之用於處理一數位音訊信號之裝置,其中該 月景聲a產生器經組態以基於來自該經編碼音訊信號之 資訊選擇複數個音訊背景聲音中之一者。 如凊求項67之用於處理一數位音訊信號之裝置,其中該 經編碼音訊信冑之至少—非有作用訊框包括關於該音訊 背景聲音信號之資訊。 如凊求項67之用於處理一數位音訊信號之裝置,其中該 责景聲音產生器經組態以自該經編碼音訊信號之一系列 非有作用訊框獲得關於該音訊背景聲音信號之資訊,其 中該系列在該經編碼音訊信號内以在自一百至兩千個訊 框之範圍中之一間隔不連續地出現。 如請求項67之用於處理一數位音訊信號之裝置,其中該 經編碼音訊信號之至少一非有作用訊框包括描述該音訊 134861.doc 16- 200947422 背景聲音信號之一 訊0 等級隨時間推移 之一所要改變的資 79’ ^求項67之用於處理—數位音訊信號之裝置,其中該 背景聲音產生器經組態以基於來自該經編碼音訊信號之 至少—非有作用訊框的-組參數值產生該音訊背景聲音 信號。 8〇.:請求項67之用於處理一數位音訊信號之裝置,其中該 月景聲θ產生器經組態以基於來自該經編碼音訊信號之 士系列非有作用訊框的第一複數個序列產生一音訊背景 聲曰仏號,其中該第一複數個序列中之每一者具有一不 同時間解析度。 81. 如請求項67之用於處理一數位音訊信號之裝置,其中該 彦景聲音產生器經組態以基於一來自該經編碼音訊信號 之至少一非有作用訊框的背景聲音識別符產生一音訊背 景聲音信號。 82. 如明求項67之用於處理一數位音訊信號之裝置,其中該 裝置包含:一第一協定堆疊’其經組態以經由一第一邏 輯頻道接收該經編碼音訊信號;及一第二協定堆疊,其 經組態以經由不同於該第一邏輯頻道之一第二邏輯頻道 接收關於該音訊背景聲音信號的資訊。 83·如請求項82之用於處理一數位音訊信號之裝置,其中該 第一協定堆疊經組態以自一第一實體接收該經編碼音訊 信號’且其中該第二協定堆疊經組態以自不同於該第一 實體之一第二實體接收關於該音訊背景聲音信號之資 134861.doc -17· 200947422 訊。 84. 如請求項83之用於處理一經編碼音訊信號之裝置,其中 該第二協定堆疊經組態以在符合會話起始協定之一版本 的一訊息中接收關於該音訊背景聲音信號的該資訊。 85. 如請求項84之用於處理一數位音訊信號之裝置,其中關 於該音訊背景聲音信號之該資訊包括一背景聲音識別 符,且 其中該背景聲音產生器經組態以基於該背景聲音識別 〇 符產生該音訊背景聲音信號。 86·如請求項84之用於處理一數位音訊信號之裝置,其中關 於該音訊背景聲音信號之該資訊包括一組參數值,且 其中該背景聲音產生器經組態以基於該組參數值產生 該音訊背景聲音信號。 87. 如請求項84之用於處理一數位音訊信號之裝置,其中該 Λ息包括識別該第二實體之資訊。 88. 如請求項87之用於處理一數位音訊信號之裝置’其中識 ® 別該第二實體之該資訊係一統一資源識別符。 89. —種用於處理一經編碼音訊信號且位於一行動使用者終 端機内之裝置,該裝置包含: 用於解碼該經編碼音訊信號以獲得一經解碼音訊信號 之構件; 用於產生一音訊背景聲音信號之構件;及 用於混合一基於該音訊背景聲音信號之信號與一基於 該經解碼音訊信號之信號的構件。 134861.doc • 18 - 200947422 90.如請求項89之用於處理一經編碼音訊信號之裝置其中 該裝置經組態以在-包括該經蝙碼音訊信號之電話呼叫 期間混合基於該音訊背景聲音信號的該信號與基於該經 解碼音訊信號之該信號。 .如請求項89之用於處理一經編蝎音訊信號之裝置,其令 該用於產生之構件經組態以基於與該經編碼音訊信號相 關聯的呼叫號碼識別資訊產生該音訊背景聲音信號。 92. 如請求項89之用於處理一經編碼音訊信號之裝置,其中 © 該經料音訊錢包括複數個訊框’且其巾該複數個訊 框中之每一者包括一激勵信號之一描述。 93. 如請求項89之用於處理一經編碼音訊信號之裝置,其中 該裝置包含用於計算該經解碼音訊信號之一等級之構 件,且 其中該用於混合之構件經組態以基於該所計算的等級 混合基於該音訊背景聲音信號之該信號與基於該經解碼 音訊信號之該信號。 0 94.如請求項93之用於處理一經編碼音訊信號之裝置,其中 該用於計算之構件經㈣以基於在該經解碼音訊信號之 至少-訊框上的-平均能量計算該經解碼音訊信號之該 等級。 95·如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生,構件包括:用於基於第—複數個序列產生該 B訊煮厅、聲曰仏號之構件,該第一複數個序列中之每一 者具有一不同時間解析度。 I3486I.doc •19· 200947422 96. 如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生之構件經組態以基於關於該裝置之一實體位置 之資訊選擇複數個音訊背景聲音中之一者》 97. 如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生之構件經組態以基於來自該經編碼音訊信號之 資訊選擇複數個音訊背景聲音中之一者。 98. 如請求項89之用於處理一數位音訊信號之裝置,其中該 經編碼音訊信號之至少一非有作用訊框包括關於該音訊 〇 背景聲音信號之資訊。 99. 如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生之構件經組態以自該經編碼音訊信號之一系列 非有作用訊框獲得關於該音訊背景聲音信號之資訊,其 中該系列在該經編碼音訊信號内以在自—百至兩千個訊 框之範圍中之一間隔不連續地出現。 1〇〇·如請求項89之用於處理一數位音訊信號之裝置,其中該 〇 經編碼音訊信號之至少一非有作用訊框包括描述該音訊 背景聲音信號之一等級隨時間推移之—所要改變的資 訊0 101. 如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生之構件經組態以基於來自該經編碼音訊信號的 至少一非有作用訊框之一組參數值產生該音訊背景聲音 信號。 102. 如請求項89之用於處理一數位音訊信號之裝置,其中該 用於產生之構件經組態以基於來自該經編碼音訊信號之 134861.doc -20- 200947422 一系列非有作用訊框之第一複數個序列產生一音訊背景 聲音信號,丨中該第一複數個序列中之每一者具有一不 同時間解析度。 103.如請求項89之用於處理—數位音訊信號之裝置,其中該 用於產生之構件經組態以基於一來自該經編碼音訊信號 之至少一非有作用訊框之背景聲音識別符產生一音訊背 景聲音信號。 104_如請求項89之用於處理一數位音訊信號之裝置,其中該裝置包含用於經由-第一賴頻道接收該經編碼音訊信 號之第一構件,及用於經由不同於該第一邏輯頻道之一 第一邏輯頻道接收關於該音訊背景聲音信號的資訊之第 二構件。 105. 如靖求項1〇4之用於處理一數位音訊信號之裝置,其中 該用於接收之第-構件經組態以自-第一實體接收該經 編碼音訊信號,且其中該用於接收之第二構件經組態以 自不同於該第一實體的一第二實體接收關於該音訊背景 聲音信號之資訊。 106, 如請求項1〇5之用於處理一經編碼音訊信號之裝置,其 中"亥用於接收之第二構件經組態以在符合會話起始協定 的一版本之一訊息中接收關於該音訊背景聲音信號之該 資訊。 107.如請求項106之用於處理一數位音訊信號之裝置,其中 關於該音訊背景聲音信號之該資訊包括一背景聲音識別 符,且 134861.doc •21 200947422 其中該用於產生之構件經組態以基於該背景聲音識別 符產生該音訊背景聲音信號。 108.如請求項1〇6之用於處理一數位音訊信號之裝置,其中 關於該音訊背景聲音信號之該資訊包括—組參數值,且 其中該用於產生之構件經組態以基於該組參數值產生 該音訊背景聲音信號。 109.如凊求項1〇6之用於處理一數位音訊信號之裝置,其中 該訊息包括識別該第二實體之資訊。 © 110.如請求項109之用於處理一數位音訊信號之裝置,其中 識別該第二實體之該資訊係一統一資源識別符。 m. 一種包含用於處理一經編碼音訊信號之指令之電腦可讀 媒體,當該等指令由一行動使用者終端機之一處理器執 行時使得該處理器: 解碼該經編碼音訊信號以獲得一經解碼音訊信號; 產生一音訊背景聲音信號;及 ⑥合-基於該音訊背景聲音信號之信號與—基於該經 解碼音訊信號之信號。 瓜如請求項m之電腦可讀媒體,其中當由—行動使用者 終端機之—處理器執行時使得該處理器進行混合的該等 組態^使得該處理器在—包括該經編碼音訊信 話呼叫期㈣合基於該音訊背景聲音信號之該信 號/、基於該經解碼音訊信號之該信號。 113.如請求項lu之電腦可讀媒體其中當由一行動使 終端機之—處理器執行時使得該處理器產生-音訊背景 134861.doc -22· 200947422 聲音信號的該等指令經組態以:使得該處理器基於與該 經編碼音訊信號相關聯之呼叫號碼識別資訊產生該音訊 背景聲音信號。 114. 如請求項之電腦可讀媒體,其中該經編碼音訊信號 包括複數個訊框,且其中該複數個訊框中之每一者包括 一激勵信號之一描述。 115. 如請求項111之電腦可讀媒體,其中該媒體包括指令, 當該等指令由一行動使用者終端機之一處理器執行時使 © 彳于該處理器計算該經解碼音訊信號之一等級,且 其中當由一行動使用者終端機之一處理器執行時使得 該處理器進行混合之該等指令經組態以使得該處理器基 於該所計算之等級混合基於該音訊背景聲音信號之該信 號與基於該經解碼音訊信號之該信號。 116. 如請求項115之電腦可讀媒體,其中當由一行動使用者 終端機之一處理器執行時使得該處理器進行計算之該等 ❿ 扎令經組態以:使得該處理器基於在該經解碼音訊信號 的至少一訊框上之一平均能量計算該經解碼音訊信號之 該專級。 凊求項1U之電腦可讀媒體,其中當由一行動使用者 '、;端機之一處理器執行時使得該處理器產生一音訊背景 聲玲仏號的該等指令經組態以:使得該處理器基於第一 複數個序列產生該音訊背景聲音信號,㉟第一複數個序 列中之每一者具有一不同時間解析度。 如Μ求項111之電腦可讀媒體,其中當由一行動使用者 134861.doc •23- 200947422 終端機之一處理器執行時使得該處理器產生—音訊背景 聲音信號的該等指令經組態以:使得該處理器基於關於 該處理器之-實體位置的資訊選擇複數個音訊背景 中之一者。 曰 119.如請求項1U之電腦可讀媒體,其中當由一行動使用者 終端機之一處理器執行時使得該處理器產生一音訊背景 聲音信號之該等指令經組態以:使得該處理器基於來自 該經編碼音訊信號之資訊選擇複數個音訊背景聲音中之 © -者。 ⑽·如請求項m之電腦可讀媒體,其中該經編碼音訊信號 之至少一非有作用訊框包括關於該音訊背景聲音信號之 資訊。 121. 如請求項Hi之電腦可讀媒體,其中當由一行動使用者 終端機之一處理器執行時使得該處理器產生一音訊背景 聲音信號之該等指令經組態以:使得該處理器自該經編 碼音訊信號之—系列非有作用訊框獲得關於該音訊背景 冑音彳s號之資訊,其中該系列在該經編碼音訊信號内以 在自一百至兩千個訊框之範圍中之一間隔不連續地出 現。 122. 如請求項ni之電腦可讀媒體,其中該經編碼音訊信號 之至少一非有作用訊框包括描述該音訊背景聲音信號之 一等級隨時間推移之一所要改變的資訊。 123. 如請求項111之電腦可讀媒體,其中當由一行動使用者 終端機之一處理器執行時使得該處理器產生一音訊背景 134861.doc -24- 200947422 聲^柄該等指切m 該經編喝音訊信號之至少—非有作=處心基於來自 產生該音訊背景聲音信號。μ訊框的-組參數值 124. 如清求項i j j之電腦' 終端機之賣媒冑其十虽由-行動使用者 、、 處理器執行時使得該處理3|吝;+ a 聲音作铼M + & 才使付这處理器產生一音訊背景 …的該等指令經組態以:使得 該經編碼音訊作 地窃丞於求目 床丨 〇 一系列非有作用訊框的第一複數個 序列產生一音訊背景聲 Ο φ — Θ仏唬,、中該第一複數個序列 母—者具有—不同時間解析度。 125. Π:項111之電腦可讀媒體,其中當由-行動使用者 、、知▲之-處理器執行時使得該處理器產生一音訊背景 聲音信號的該等指令經組態以:使得該處理器基於一來 自該經編碼音訊信號之至少-非有作用訊桓的背景聲音 識別符產生一音訊背景聲音信號。 1如請求項⑴之電腦可讀媒體,其中該媒體包括⑷當由-行動使用者終端機之一處理器執行時使得該處理器經 由一第一邏輯頻道接收該經編碼音訊信號之指令,及(Β) 當由該處理器執行時使得該處理器經由不同於該第一邏 輯頻道之一第一邏輯頻道接收關於該音訊背景聲音信號 的資訊之指令。 127.如請求項126之電腦可讀媒體’其中當由一行動使用者 終端機之一處理器執行時使得該處理器經由一第一邏輯 頻道接收該經編碼音訊信號的該等指令經組態以使得該 處理器自一第一實體接收該經編碼音訊信號,且 I34861.doc -25- 200947422 其中當由該處理器執行時使得該處理器經由一第二邏 輯頻道接收關於該音訊背景聲音信號之資訊的該等指令 經組態以使得該處理器自不同於該第一實體之一第二實 體接收關於該音訊背景聲音信號的資訊。 128. 如請求項127之電腦可讀媒體,其中當由該處理器執行 時使得該處理器經由一第二邏輯頻道接收關於該音訊背 景聲音信號之資訊的該等指令經組態以:使得該處理器 在符合會話起始協定之一版本的一訊息中接收關於該音 訊背景聲音信號的該資訊。 129. 如請求項128之電腦可讀媒體,其中關於該音訊背景聲 音信號之該資訊包括一背景聲音識別符,且 其中當由一行動使用者終端機之一處理器執行時使得 該處理器產生一音訊背景聲音信號之該等指令經組態以 使得該處理器基於該背景聲音識別符產生該音訊背景聲 音信號。 130. 如請求項128之電腦可讀媒體,其中關於該音訊背景聲 音信號之該資訊包括一組參數值,且 其中當由一行動使用者終端機之一處理器執行時使得 該處理器產生一音訊背景聲音信號之該等指令經組態 以.使得該處理器基於該組參數值產生該音訊背景聲音 信號。 “曰 131. 如請求項128之電腦可讀媒體,其中該訊息包括識別該 第二實體之資訊。 ~ 132. 如請求項131之電腦可讀媒體,其中識別該第二實體之 該資訊係一統一資源識別符。 134861.doc -26-
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2410408P | 2008-01-28 | 2008-01-28 | |
US12/129,455 US8560307B2 (en) | 2008-01-28 | 2008-05-29 | Systems, methods, and apparatus for context suppression using receivers |
Publications (1)
Publication Number | Publication Date |
---|---|
TW200947422A true TW200947422A (en) | 2009-11-16 |
Family
ID=40899262
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097137522A TW200947423A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context replacement by audio level |
TW097137510A TW200933608A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context descriptor transmission |
TW097137517A TW200947422A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context suppression using receivers |
TW097137524A TW200933609A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context processing using multiple microphones |
TW097137540A TW200933610A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context processing using multi resolution analysis |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097137522A TW200947423A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context replacement by audio level |
TW097137510A TW200933608A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context descriptor transmission |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097137524A TW200933609A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context processing using multiple microphones |
TW097137540A TW200933610A (en) | 2008-01-28 | 2008-09-30 | Systems, methods, and apparatus for context processing using multi resolution analysis |
Country Status (7)
Country | Link |
---|---|
US (5) | US8554551B2 (zh) |
EP (5) | EP2245623A1 (zh) |
JP (5) | JP2011511962A (zh) |
KR (5) | KR20100129283A (zh) |
CN (5) | CN101903947A (zh) |
TW (5) | TW200947423A (zh) |
WO (5) | WO2009097023A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI471019B (zh) * | 2011-10-05 | 2015-01-21 | Inst Rundfunktechnik Gmbh | 用於內插第一與第二麥克風信號之內插電路 |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602006018618D1 (de) * | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
EP2453657A1 (en) | 2006-04-28 | 2012-05-16 | NTT DoCoMo, Inc. | Image predictive decoding device |
US20080152157A1 (en) * | 2006-12-21 | 2008-06-26 | Vimicro Corporation | Method and system for eliminating noises in voice signals |
ATE456130T1 (de) * | 2007-10-29 | 2010-02-15 | Harman Becker Automotive Sys | Partielle sprachrekonstruktion |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN102132494B (zh) * | 2008-04-16 | 2013-10-02 | 华为技术有限公司 | 通信方法和通信装置 |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP4407613A1 (en) * | 2008-07-11 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US8538749B2 (en) * | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
US8290546B2 (en) * | 2009-02-23 | 2012-10-16 | Apple Inc. | Audio jack with included microphone |
CN101847412B (zh) * | 2009-03-27 | 2012-02-15 | 华为技术有限公司 | 音频信号的分类方法及装置 |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
US10008212B2 (en) * | 2009-04-17 | 2018-06-26 | The Nielsen Company (Us), Llc | System and method for utilizing audio encoding for measuring media exposure with environmental masking |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
WO2011037587A1 (en) * | 2009-09-28 | 2011-03-31 | Nuance Communications, Inc. | Downsampling schemes in a hierarchical neural network structure for phoneme recognition |
US8903730B2 (en) * | 2009-10-02 | 2014-12-02 | Stmicroelectronics Asia Pacific Pte Ltd | Content feature-preserving and complexity-scalable system and method to modify time scaling of digital audio signals |
EP2491549A4 (en) * | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY |
CA2907353C (en) | 2009-10-20 | 2018-02-06 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values |
KR101309671B1 (ko) | 2009-10-21 | 2013-09-23 | 돌비 인터네셔널 에이비 | 결합된 트랜스포저 필터 뱅크에서의 오버샘플링 |
US20110096937A1 (en) * | 2009-10-28 | 2011-04-28 | Fortemedia, Inc. | Microphone apparatus and sound processing method |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8908542B2 (en) * | 2009-12-22 | 2014-12-09 | At&T Mobility Ii Llc | Voice quality analysis device and method thereof |
ES2532203T3 (es) * | 2010-01-12 | 2015-03-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, método para codificar y decodificar una información de audio y programa de computación que obtiene un valor de contexto de sub-región basado en una norma de valores espectrales previamente decodificados |
US9112989B2 (en) * | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9558755B1 (en) * | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
US8805697B2 (en) * | 2010-10-25 | 2014-08-12 | Qualcomm Incorporated | Decomposition of music signals using basis functions with time-evolution information |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
KR101726738B1 (ko) * | 2010-12-01 | 2017-04-13 | 삼성전자주식회사 | 음성처리장치 및 그 방법 |
US20140006019A1 (en) * | 2011-03-18 | 2014-01-02 | Nokia Corporation | Apparatus for audio signal processing |
RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
EP2774147B1 (en) * | 2011-10-24 | 2015-07-22 | Koninklijke Philips N.V. | Audio signal noise attenuation |
US9992745B2 (en) * | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
WO2013085507A1 (en) | 2011-12-07 | 2013-06-13 | Hewlett-Packard Development Company, L.P. | Low power integrated circuit to analyze a digitized audio stream |
CN103886863A (zh) * | 2012-12-20 | 2014-06-25 | 杜比实验室特许公司 | 音频处理设备及音频处理方法 |
KR101690899B1 (ko) | 2012-12-21 | 2016-12-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성 |
CA2948015C (en) * | 2012-12-21 | 2018-03-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Comfort noise addition for modeling background noise at low bit-rates |
KR20140089871A (ko) * | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 서버, 그 제어 방법 및 대화형 시스템 |
MY172161A (en) * | 2013-01-29 | 2019-11-15 | Fraunhofer Ges Forschung | Apparatus and method for generating a frequency enhanced signal using shaping of the enhancement signal |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9741350B2 (en) * | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
WO2014126520A1 (en) * | 2013-02-13 | 2014-08-21 | Telefonaktiebolaget L M Ericsson (Publ) | Frame error concealment |
WO2014188231A1 (en) * | 2013-05-22 | 2014-11-27 | Nokia Corporation | A shared audio scene apparatus |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
JP6098654B2 (ja) * | 2014-03-10 | 2017-03-22 | ヤマハ株式会社 | マスキング音データ生成装置およびプログラム |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
ES2838006T3 (es) * | 2014-07-28 | 2021-07-01 | Nippon Telegraph & Telephone | Codificación de señal de sonido |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
US9741344B2 (en) * | 2014-10-20 | 2017-08-22 | Vocalzoom Systems Ltd. | System and method for operating devices using voice commands |
US9830925B2 (en) * | 2014-10-22 | 2017-11-28 | GM Global Technology Operations LLC | Selective noise suppression during automatic speech recognition |
US9378753B2 (en) | 2014-10-31 | 2016-06-28 | At&T Intellectual Property I, L.P | Self-organized acoustic signal cancellation over a network |
DE112016000287T5 (de) | 2015-01-07 | 2017-10-05 | Knowles Electronics, Llc | Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung |
TWI595786B (zh) * | 2015-01-12 | 2017-08-11 | 仁寶電腦工業股份有限公司 | 基於時間戳記的音訊與視訊處理方法及其系統 |
DE112016000545B4 (de) | 2015-01-30 | 2019-08-22 | Knowles Electronics, Llc | Kontextabhängiges schalten von mikrofonen |
US9916836B2 (en) * | 2015-03-23 | 2018-03-13 | Microsoft Technology Licensing, Llc | Replacing an encoded audio output signal |
US10304467B2 (en) | 2015-04-24 | 2019-05-28 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
CN106210219B (zh) * | 2015-05-06 | 2019-03-22 | 小米科技有限责任公司 | 降噪方法及装置 |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US10373608B2 (en) * | 2015-10-22 | 2019-08-06 | Texas Instruments Incorporated | Time-based frequency tuning of analog-to-information feature extraction |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
CN107564512B (zh) * | 2016-06-30 | 2020-12-25 | 展讯通信(上海)有限公司 | 语音活动侦测方法及装置 |
JP6790817B2 (ja) * | 2016-12-28 | 2020-11-25 | ヤマハ株式会社 | 電波状態解析方法 |
US10797723B2 (en) | 2017-03-14 | 2020-10-06 | International Business Machines Corporation | Building a context model ensemble in a context mixing compressor |
US10361712B2 (en) | 2017-03-14 | 2019-07-23 | International Business Machines Corporation | Non-binary context mixing compressor/decompressor |
KR102491646B1 (ko) * | 2017-11-30 | 2023-01-26 | 삼성전자주식회사 | 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치 |
US10862846B2 (en) | 2018-05-25 | 2020-12-08 | Intel Corporation | Message notification alert method and apparatus |
CN108962275B (zh) * | 2018-08-01 | 2021-06-15 | 电信科学技术研究院有限公司 | 一种音乐噪声抑制方法及装置 |
WO2020039597A1 (ja) * | 2018-08-24 | 2020-02-27 | 日本電気株式会社 | 信号処理装置、音声通話端末、信号処理方法および信号処理プログラム |
WO2020133112A1 (zh) * | 2018-12-27 | 2020-07-02 | 华为技术有限公司 | 一种自动切换蓝牙音频编码方式的方法及电子设备 |
WO2020146870A1 (en) * | 2019-01-13 | 2020-07-16 | Huawei Technologies Co., Ltd. | High resolution audio coding |
US10978086B2 (en) | 2019-07-19 | 2021-04-13 | Apple Inc. | Echo cancellation using a subset of multiple microphones as reference channels |
CN111757136A (zh) * | 2020-06-29 | 2020-10-09 | 北京百度网讯科技有限公司 | 网页音频直播方法、装置、设备和存储介质 |
TWI849477B (zh) * | 2022-08-16 | 2024-07-21 | 大陸商星宸科技股份有限公司 | 具有迴音消除機制的音訊處理裝置及方法 |
Family Cites Families (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537509A (en) | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
SE502244C2 (sv) | 1993-06-11 | 1995-09-25 | Ericsson Telefon Ab L M | Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation |
SE501981C2 (sv) | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
JP3418305B2 (ja) | 1996-03-19 | 2003-06-23 | ルーセント テクノロジーズ インコーポレーテッド | オーディオ信号を符号化する方法および装置および知覚的に符号化されたオーディオ信号を処理する装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US5909518A (en) | 1996-11-27 | 1999-06-01 | Teralogic, Inc. | System and method for performing wavelet-like and inverse wavelet-like transformations of digital data |
US6301357B1 (en) | 1996-12-31 | 2001-10-09 | Ericsson Inc. | AC-center clipper for noise and echo suppression in a communications system |
US6167417A (en) * | 1998-04-08 | 2000-12-26 | Sarnoff Corporation | Convolutive blind source separation using a multiple decorrelation method |
EP1078354B1 (de) | 1998-05-11 | 2002-03-20 | Siemens Aktiengesellschaft | Verfahren und anordnung zur bestimmung spektraler sprachcharakteristika in einer gesprochenen äusserung |
TW376611B (en) | 1998-05-26 | 1999-12-11 | Koninkl Philips Electronics Nv | Transmission system with improved speech encoder |
US6549586B2 (en) | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US6717991B1 (en) * | 1998-05-27 | 2004-04-06 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for dual microphone signal noise reduction using spectral subtraction |
JP4196431B2 (ja) | 1998-06-16 | 2008-12-17 | パナソニック株式会社 | 機器内蔵型マイクロホン装置及び撮像装置 |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP3438021B2 (ja) | 1999-05-19 | 2003-08-18 | 株式会社ケンウッド | 移動体通信端末 |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6330532B1 (en) * | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
GB9922654D0 (en) | 1999-09-27 | 1999-11-24 | Jaber Marwan | Noise suppression system |
WO2001033814A1 (en) * | 1999-11-03 | 2001-05-10 | Tellabs Operations, Inc. | Integrated voice processing system for packet networks |
US6407325B2 (en) * | 1999-12-28 | 2002-06-18 | Lg Electronics Inc. | Background music play device and method thereof for mobile station |
JP4310878B2 (ja) | 2000-02-10 | 2009-08-12 | ソニー株式会社 | バスエミュレーション装置 |
WO2001075863A1 (en) * | 2000-03-31 | 2001-10-11 | Telefonaktiebolaget Lm Ericsson (Publ) | A method of transmitting voice information and an electronic communications device for transmission of voice information |
EP1139337A1 (en) | 2000-03-31 | 2001-10-04 | Telefonaktiebolaget L M Ericsson (Publ) | A method of transmitting voice information and an electronic communications device for transmission of voice information |
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US6873604B1 (en) * | 2000-07-31 | 2005-03-29 | Cisco Technology, Inc. | Method and apparatus for transitioning comfort noise in an IP-based telephony system |
JP3566197B2 (ja) * | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7260536B1 (en) * | 2000-10-06 | 2007-08-21 | Hewlett-Packard Development Company, L.P. | Distributed voice and wireless interface modules for exposing messaging/collaboration data to voice and wireless devices |
US7539615B2 (en) * | 2000-12-29 | 2009-05-26 | Nokia Siemens Networks Oy | Audio signal quality enhancement in a digital network |
US7165030B2 (en) * | 2001-09-17 | 2007-01-16 | Massachusetts Institute Of Technology | Concatenative speech synthesis using a finite-state transducer |
ES2268112T3 (es) | 2001-11-14 | 2007-03-16 | Matsushita Electric Industrial Co., Ltd. | Codificacion y descodificacion de audio. |
TW564400B (en) | 2001-12-25 | 2003-12-01 | Univ Nat Cheng Kung | Speech coding/decoding method and speech coder/decoder |
US7657427B2 (en) * | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7174022B1 (en) | 2002-11-15 | 2007-02-06 | Fortemedia, Inc. | Small array microphone for beam-forming and noise suppression |
US20040204135A1 (en) * | 2002-12-06 | 2004-10-14 | Yilin Zhao | Multimedia editor for wireless communication devices and method therefor |
EP1576602A4 (en) | 2002-12-28 | 2008-05-28 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM |
KR100486736B1 (ko) * | 2003-03-31 | 2005-05-03 | 삼성전자주식회사 | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 |
US7295672B2 (en) * | 2003-07-11 | 2007-11-13 | Sun Microsystems, Inc. | Method and apparatus for fast RC4-like encryption |
DK1509065T3 (da) | 2003-08-21 | 2006-08-07 | Bernafon Ag | Fremgangsmåde til behandling af audiosignaler |
US20050059434A1 (en) * | 2003-09-12 | 2005-03-17 | Chi-Jen Hong | Method for providing background sound effect for mobile phone |
US7162212B2 (en) * | 2003-09-22 | 2007-01-09 | Agere Systems Inc. | System and method for obscuring unwanted ambient noise and handset and central office equipment incorporating the same |
US7133825B2 (en) * | 2003-11-28 | 2006-11-07 | Skyworks Solutions, Inc. | Computationally efficient background noise suppressor for speech coding and speech recognition |
US7613607B2 (en) * | 2003-12-18 | 2009-11-03 | Nokia Corporation | Audio enhancement in coded domain |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
JP4162604B2 (ja) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
US7536298B2 (en) | 2004-03-15 | 2009-05-19 | Intel Corporation | Method of comfort noise generation for speech communication |
EP1735774B1 (en) | 2004-04-05 | 2008-05-14 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
JP4556574B2 (ja) | 2004-09-13 | 2010-10-06 | 日本電気株式会社 | 通話音声生成装置及び方法 |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
US8102872B2 (en) | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US20060215683A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for voice quality enhancement |
US7567898B2 (en) * | 2005-07-26 | 2009-07-28 | Broadcom Corporation | Regulation of volume of voice in conjunction with background sound |
US7668714B1 (en) * | 2005-09-29 | 2010-02-23 | At&T Corp. | Method and apparatus for dynamically providing comfort noise |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
US8041057B2 (en) | 2006-06-07 | 2011-10-18 | Qualcomm Incorporated | Mixing techniques for mixing audio |
JP2010519602A (ja) | 2007-02-26 | 2010-06-03 | クゥアルコム・インコーポレイテッド | 信号分離のためのシステム、方法、および装置 |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
JP4456626B2 (ja) * | 2007-09-28 | 2010-04-28 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ装置制御プログラムおよびディスクアレイ装置制御方法 |
US8175871B2 (en) | 2007-09-28 | 2012-05-08 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
-
2008
- 2008-05-29 US US12/129,483 patent/US8554551B2/en not_active Expired - Fee Related
- 2008-05-29 US US12/129,421 patent/US8483854B2/en not_active Expired - Fee Related
- 2008-05-29 US US12/129,455 patent/US8560307B2/en not_active Expired - Fee Related
- 2008-05-29 US US12/129,525 patent/US8600740B2/en not_active Expired - Fee Related
- 2008-05-29 US US12/129,466 patent/US8554550B2/en not_active Expired - Fee Related
- 2008-09-30 CN CN2008801214180A patent/CN101903947A/zh active Pending
- 2008-09-30 EP EP08871665A patent/EP2245623A1/en not_active Withdrawn
- 2008-09-30 KR KR1020107019222A patent/KR20100129283A/ko not_active Application Discontinuation
- 2008-09-30 WO PCT/US2008/078332 patent/WO2009097023A1/en active Application Filing
- 2008-09-30 TW TW097137522A patent/TW200947423A/zh unknown
- 2008-09-30 TW TW097137510A patent/TW200933608A/zh unknown
- 2008-09-30 JP JP2010544964A patent/JP2011511962A/ja active Pending
- 2008-09-30 EP EP08871915A patent/EP2245625A1/en not_active Withdrawn
- 2008-09-30 WO PCT/US2008/078327 patent/WO2009097021A1/en active Application Filing
- 2008-09-30 JP JP2010544962A patent/JP2011511961A/ja active Pending
- 2008-09-30 WO PCT/US2008/078329 patent/WO2009097022A1/en active Application Filing
- 2008-09-30 CN CN2008801198597A patent/CN101896964A/zh active Pending
- 2008-09-30 CN CN2008801206080A patent/CN101896971A/zh active Pending
- 2008-09-30 KR KR1020107019243A patent/KR20100125272A/ko not_active Application Discontinuation
- 2008-09-30 KR KR1020107019244A patent/KR20100113145A/ko not_active Application Discontinuation
- 2008-09-30 KR KR1020107019242A patent/KR20100125271A/ko not_active Application Discontinuation
- 2008-09-30 WO PCT/US2008/078324 patent/WO2009097019A1/en active Application Filing
- 2008-09-30 TW TW097137517A patent/TW200947422A/zh unknown
- 2008-09-30 TW TW097137524A patent/TW200933609A/zh unknown
- 2008-09-30 JP JP2010544963A patent/JP2011516901A/ja active Pending
- 2008-09-30 CN CN200880119860XA patent/CN101896969A/zh active Pending
- 2008-09-30 JP JP2010544966A patent/JP2011512550A/ja active Pending
- 2008-09-30 WO PCT/US2008/078325 patent/WO2009097020A1/en active Application Filing
- 2008-09-30 EP EP08871771A patent/EP2245624A1/en not_active Withdrawn
- 2008-09-30 CN CN2008801198722A patent/CN101896970A/zh active Pending
- 2008-09-30 EP EP08871634A patent/EP2245619A1/en not_active Withdrawn
- 2008-09-30 JP JP2010544965A patent/JP2011512549A/ja active Pending
- 2008-09-30 TW TW097137540A patent/TW200933610A/zh unknown
- 2008-09-30 KR KR1020107019225A patent/KR20100113144A/ko not_active Application Discontinuation
- 2008-09-30 EP EP08872004A patent/EP2245626A1/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI471019B (zh) * | 2011-10-05 | 2015-01-21 | Inst Rundfunktechnik Gmbh | 用於內插第一與第二麥克風信號之內插電路 |
US9226065B2 (en) | 2011-10-05 | 2015-12-29 | Institut Fur Rundfunktechnik Gmbh | Interpolation circuit for interpolating a first and a second microphone signal |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW200947422A (en) | Systems, methods, and apparatus for context suppression using receivers | |
JP5936236B2 (ja) | 音声変換のための方法、システム、およびコンピュータ・プログラム製品、ならびに音声変換を再構築するための方法およびシステム | |
JP2009098696A (ja) | 広帯域オーディオ信号の符号化/復号化装置およびその方法 | |
WO2022267754A1 (zh) | 语音编码、语音解码方法、装置、计算机设备和存储介质 | |
Koduri | Hybrid Transform Based Speech Band Width Enhancement Using Data Hiding. | |
CN116110424A (zh) | 一种语音带宽扩展方法及相关装置 | |
JP2006072269A (ja) | 音声符号化装置、通信端末装置、基地局装置および音声符号化方法 |