TW200933608A

TW200933608A - Systems, methods, and apparatus for context descriptor transmission

Info

Publication number: TW200933608A
Application number: TW097137510A
Authority: TW
Inventors: Khaled Helmi El-Maleh; Nagendra Nagaraja; Eddie L T Choy
Original assignee: Qualcomm Inc
Priority date: 2008-01-28
Filing date: 2008-09-30
Publication date: 2009-08-01
Also published as: CN101896964A; US8560307B2; WO2009097020A1; US20090192803A1; JP2011511961A; EP2245625A1; US20090192802A1; EP2245623A1; TW200933609A; KR20100113145A; WO2009097021A1; CN101903947A; JP2011511962A; WO2009097019A1; TW200947422A; CN101896971A; KR20100113144A; WO2009097022A1; KR20100129283A; US20090190780A1

Description

200933608 九、發明說明：【發明所屬之技術領域】本揭示案係關於話音信號之處理。本專利申請案主張2008年1月28曰申請且讓與給其受讓人的標題為"SYSTEMS, METHODS，AND APPARATUS FOR CONTEXT PROCESSING"之臨時申請案第 61/024,104 號之優先權。本專利申請案係關於以下同在申請中之美國專利申請 ❹ 案： "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING USING MULTIPLE MICROPHONES"，其代理人案號為071104U1，與本申請案同時申請，讓與給其受讓人； "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT SUPRESSION USING RECEIVERS"，其代理人案號為 071104U2，與本申請案同時申請，讓與給其受讓人； "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING USING MULTI RESOLUTION ANALYSIS”，其代理人案號為071104U4，與本申請案同時申請，讓與給其受讓人；及 "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT REPLACEMENT BY AUDIO LEVEL”，其代理人案號為 071104U5，與本申請案同時申請，讓與給其受讓人。【先前技術】 134862.doc 200933608 用於語音信號之通信及/或儲存的應用通常使用麥克風來捕獲包括主揚聲器語音之聲音的音訊信號。音訊信號之表不語音之部分稱為話音或話音分量。所捕獲之音訊信號常常亦包括來自麥克風的周圍聲學環境之諸如背景聲音的其他聲音。音訊信號之此部分稱為背景聲音或背景聲音分量。諸如話音及音樂之音訊資訊藉由數位技術之傳輸已變得廣泛，特別在長途電話、諸如網路電話（亦稱為v〇Ip，其 ® 中1p指示網際網路協定）之封包交換電話，及諸如蜂巢式電話之數位無線電電話中。此種增長已造成減少用以經由傳輸頻道傳送語音通信之資訊的量且同時維持重建的話音之所感知品質的興趣。舉例而言，需要最佳地利用可用無線系統頻寬。有效使用系統頻寬之一方法為使用信號壓縮技術。對於载運話音信號之無線系統而言，出於此目的通常使用話音壓縮（或”話音編碼„)技術。 φ 經組態以藉由提取關於人話音產生之模型的參數而壓縮話音之器件常常稱為語音編碼器、編解碼器、聲碼器、，，音訊編碼器"或"話音編碼器"，且以下描述可互換地使用此等術語。話音編碼器通常包括話音編碼器及話音解碼器。編碼器通常作為一系列稱為"訊框，，之樣本區段接收數位音訊信號，分析每一訊框以提取某些相關參數，且將參數量化為經編碼訊框。經編碼訊框經由傳輸頻道（亦即，有線或無線網路連接）傳輸至包括解碼器之接收器。或者，經編碼音訊信號可經儲存以供在以後時間進行擷取及解碼。 134862.doc 200933608 ^碼器接收且處職編碼贿、對其進行反量化以產出參，且使用反量化參數重建話音訊框。在-典型通話中’每一揚聲器靜寂約百分之六十之時間。話音編碼器常常經組態以辨別含有話音之音訊信號之訊框("有作用訊框，·)與僅含有背景聲音或靜寂之音訊信號之訊框（"非有作用訊框"）。該編碼器可經組態以使用不同編碼模式及/或速率來編碼有作用與非有作用訊框。舉例而言’非有作用訊框通常感知為載運極少或不載運資訊，罾且話音編碼器常常經組態以使用比編碼有作用訊框少之位疋（亦即，較低位元速率）來編碼非有作用訊框。用以編碼有作用訊桓之位元速率之實例包括每訊框ΐ7ΐ 個位元 '每訊框80個位元及每訊框4〇個位元。用以編碼非有作用訊框之位元速率之實例包括每訊框16個位元。在蜂巢式電話系統（尤其依照如由電信工業協會（Arlingt〇n，VA) 發布之臨時標準（IS)-95(或類似工業標準）之系統）之背景聲 • 音中，此等四個位元速率亦分別稱為"全速率"、"半速率"、 "四分之一速率"及"八分之一速率”。【發明内容】此文件描述處理包括第一音訊背景聲音之數位音訊信號之方法。此方法包括自該數位音訊信號抑制第一音訊背景聲音，基於由第一麥克風產出之第一音訊信號來獲得背景聲音受抑制信號。此方法亦包括混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號。在此方法中’數位音訊信號係基於由不同於第一麥克 134862.doc 200933608 風之第二麥克風產出之第二音訊信號。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理基於自第一轉換器接收之信號的數位音訊信號之方法❶此方法包括自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號；混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號；將基於（A)第二音訊背景聲音及（B)背景聲音增強信號中之至少一者的信號轉換為類比信號；及使用第二 ® 轉換器來產出基於類比信號之聲訊信號（audible signal)。在此方法中’第一轉換器及第二轉換器兩者位於一共同外殼内。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理經編碼音訊信號之方法。此方法包括：根據一第一編碼方案解碼經編碼音訊信號之第一複數個經編碼訊框以獲得包括話音分量及背景聲音分量之第— φ 經解碼音訊信號；根據第二編碼方案解碼經編碼音訊信號之第二複數個經編碼訊框以獲得第二經解碼音訊信號；及，基於來自第二經解碼音訊信號之資訊，自基於第一經解碼音訊信號之第三信號抑制背景聲音分量以獲得一背景聲音受抑制信號。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理包括話音分量及背景聲音分量之數位音訊信號之方法。此方法包括：自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號；編碼基於背景聲音 134862.doc 200933608 受抑制信號之信號以獲得經編碼音訊信號；選擇複數個音訊背景聲音中之一者；及將關於所選音訊背景聲音之資訊插入於基於經編碼音訊信號之信號中。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理包括話音分量及背景聲音分量之數位音訊信號之方法。此方法包括自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號；編碼基於背景聲音受抑制信號之信號以獲得經編碼音訊信號；經由第一邏輯頻 ® 道’將經編碼音訊信號發送至第一實體；及，經由不同於第一邏輯頻道之第二邏輯頻道，向第二實體發送（A)音訊背景聲音選擇資訊及（B)識別第一實體之資訊。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理經編碼音訊信號之方法。此方法包括’在行動使用者終端機内，解碼經編碼音訊信號以獲得經解碼音訊信號；在行動使用者終端機内，產生一音訊背 Q 景聲音信號；及，在行動使用者終端機内，混合基於音訊背承聲a乜號之仏號與基於經解碼音訊信號之信號。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理έί * 义〜理包括話音分量及背景聲音分量之數位音訊信號之方法。t 此方法包括：自數位音訊信號抑制背景聲音分董以獲得背哥眷立聲s梵抑制信號；產生基於第一濾波及第一複數個序列之立邱訊背景聲音信號，該第一複數個序列中之每一者具有 π之時間解析度；及混合基於所產生 134862.doc 200933608 音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號。在此方法中，產生音訊背景聲音信號包括將第一濾波應用至第一複數個序列中之每一者。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述處理包括話音分量及背景聲音分量之數位音訊信號之方法》此方法包括：自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號；產生音訊背景聲音 © 信號；混合基於所產生音訊背景聲音信號之第一信號與一基於背景聲音受抑制信號之第二信號以獲得背景聲音增強 k號，及計算基於數位音訊信號之第三信號之等級。在此方法中，產生及混合中的至少一者包括基於第三信號之所汁算等級控制第一信號之等級。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。此文件亦描述根據處理控制信號之狀態來處理數位音訊 ❹信號之方法，其中數位音訊信號具有話音分量及背景聲音分篁。此方法包括在處理控制信號具有第一狀態時以第一位元速率編碼缺少話音分量之數位音訊信號部分之訊框。此方法包括在處理控制信號具有不同於第一狀態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景聲音受 =信號。此方法包括在處理控制信號具有第二狀態時混合2背景聲音信號與基於背景聲音受抑制信號之信號以獲知为景聲曰增強k號。此方法包括在處理控制信號具有第二狀態肖以第^位元速率編碼缺少冑音分量之背景聲音 134862.doc 200933608 增強信號部分之訊框，其中第二位元速率高於第一位元速率。此文件亦描述關於此方法之裝置、構件之組合及電腦可讀媒體。【實施方式】儘管音訊信號之話音分量通常載運主要資訊，但背景聲音分量亦在諸如電話之語音通信應用中起重要作用。由於背景聲音分量存在於有作用及非有作用訊框兩者期間，故其在非有作用訊框期間之連續重現對於在接收器處提供連 ® 續及連通感係重要的。背景聲音分量之重現品質可能對於逼真度及整體所感知品質亦係重要的，尤其對於增雜環境中使用之免提式終端機而言。諸如蜂巢式電話之行動使用者終端機允許語音通信應用擴展於比先前更多之位置。結果，可能遭遇之不同音訊背景聲音之數目增加。現存語音通信應用通常將背景聲音分量視作雜訊，但一些背景聲音比其他背景聲音更結構化， ^ 且可能更難可辨別地進行編碼。在一些情形下，可能需要抑制及/或掩蔽音訊信號之背景聲音分量。出於安全原因，舉例而言，可能需要在傳輸或儲存之前自音訊信號移除背景聲音分量。或者，可能需要向音訊彳§號添加不同背景聲音。舉例而言，可能需要造成揚聲器在不同位置處及/或在不同環境中之錯覺。本文揭示之組態包括可應用於語音通信及/或儲存應用中以移除、增強及/或取代現存音訊背景聲音之系統、方法及裝置。明確地預期且特此揭示，本文揭示之組態可經調適用 I34862.doc -12- 200933608 於封包交換式網路（舉例而言，根據諸如·之協定配置以載運語音傳輸之有線及/或無線網路）及/或電路交換式網路中。亦明確地預期且特此揭示，本文揭示之組態可經調適用於窄頻編碼系統（例如，編碼約四千赫兹或五千赫兹之音訊頻率範圍之系統)中及用於寬頻編碼系統(例如，編碼大於五千赫兹之音訊頻率之系統）中，包括全頻編碼系統及分頻編碼系統。 ❹ ❾ 除非明確由其上下文限制，否則術語，·信號"在本文中用來指示其普通意義中之任一者，包括如導線、匯流排或其他傳輸媒體上表達之記憶體位置(或記憶體位置之集旬之狀態。除非明確由其上下文限制，否則術語"產生，·在本文用來指示其普通意義中之任一者，諸如計算或以其他方式產出。除非明確由其上下文限制’否則術語"計算"在本文用來指示其普通意義中之任一者，諸如計算、估計及/或自：组值選擇。除非明確由其上下文限制，否則術語"獲得用來“示其普通意義中之任一者，諸如計算、導出、接收（例如，自—外部器件）及/或擷取⑽如，自儲存元件陣列）。在術語"包含"使用於本發明描述及申請專利範圍中寺其並不排除其他元件或操作。術語，，基於"（如，，A係基中)用來指示其普通意義中之任一者，包括以下情形⑴至少基於"（例如，"A至少基於B")，及（ii)"等同於"（例如’ ’’A等同於B”)(若在狀上下文中為適當的）。除非2外指示，否則具有特定特徵之裝置的操作之任何揭丁内令亦明確地意欲揭示具有類似特徵之方法（且反之 134862.doc -13 - 200933608 亦然），且根據特定組態之裝置的操作之任何揭示内容亦明確地意欲揭示根據類似組態之方法（且反之亦然）。除非另外指示，否貝m語"背景聲音"（或"音訊背景聲音"）用來指示音訊信號之不同於話音分量，且傳達來自揚聲器之周圍環境的音訊資訊的分量，且術語，，雜訊"用來指示音訊信號中並非話音分量之部分且不傳逹來自揚聲器的周圍環境之資訊的任何其他偽訊。出於話音編碼目的，話音信號通常經數位化（或量化）以 €>獲得樣本流。可根據此項技術中已知之各種方法（包括，例如，脈碼調變（PCM)、壓擴V律pcM及壓擴A律pCM)中之任一者執行數位化處理。窄頻話音編碼器通常使用8 kHz之取樣速率，而寬頻話音編碼器通常使用更高之取樣速率（例如，12或16 kHz)。將經數位化之話音信號處理為一系列訊框。此系列通常實施為非重疊系列，但處理訊框或訊框片段（亦稱為子訊 Q框）之操作亦可包括其輸入中的一或多個鄰近訊框之片 •k話β彳s號之訊框通常足夠短從而信號之頻譜包絡可預期在訊框上保持相對固定。訊框通常對應於話音信號之五與35毫移（或約4〇至2〇〇個樣本）之間，其中1〇、2〇及毫秒為共同訊框大小。通常所有訊框具有相同之長度，且在本文描述之特定實例中假定均勻訊框長度。然而，亦明確地預期且特此揭示，可使用非均勻訊框長度。 2〇毫秒的訊框長度在七千赫茲（kHz)之取樣速率下對應於140個樣本，在8 kHz之取樣速率下對應於16〇個樣本， 134862.doc 14· 200933608 且在16 kHz之取樣速率下對應於32〇個樣本，伸可為適於特定應用之任何取樣速率1心話音編碼之1 速率的另—實例為12.8他，且另外之實例包括自12>8 kHz至3 8.4 kHz的範圍中之其他速率。圖1A展示經組態以接收音訊信號Sl〇(例如，—系列訊框）且產出相應經編碼音訊信號S2G(例如，n ^ ❹ 訊框）之話音編碼器X1G之方塊圖。語音編碼器川包括編碼方案選擇器20、有作用訊框編碼器3〇及非有作碼器4〇。音訊信號請為包括話音分量（亦即，主揚聲器語音之聲音）及背景聲音分量（亦即，周圍環境或背景聲音）之數位音訊信號。音訊信號sl〇通常為如由麥克風捕獲之類比信號之經數位化版本。編碼方案選擇器20經組態以辨別音訊信號si〇之有作用訊框與非有作用訊框。此種操作亦稱為，，語音作用性賴測’ s a作用f·生偵冑’且編碼方案選擇器2g可經實施以包〇括語音作用性债測器或話音作用性償測器。舉例而言，編碼方案選擇器20可經組態以輸出對於有作用訊框為高且對 j _有作用訊框為低之二$值編碼方案選擇信號。圖1八展示使用由編碼方案選擇器20產出之編碼方案選擇信號來控制話音編碼器χ10的一對選擇器5〇a及5〇b之實例。編碼方案選擇器20可經組態以基於訊框之能量及/或頻镨内容之-或多個特性（諸如訊框能量、信雜比（讀）、週期&、頻譜分布（例如，頻譜傾斜）及/或過零率）將訊框分 .貞為有作用或非有作用。此種分類可包括將此種特性之值 134S62.doc -15- 200933608 或量值與一臨限值進行比較，及/或將此種特性之改變之置值（例如，相對於先前訊框）與一臨限值進行比較。舉例而吕，編碼方案選擇器20可經組態以估計當前訊框之能量且若此量值小於（或者，不大於）一臨限值，則將訊框分類為非有作用。此種選擇器可經組態以將訊框能量計算為訊框樣本的平方和。編碼方案選擇器20之另一實施例經組態以估計低頻帶 (例如，300 Hz至2 kHz)及高頻帶（例如，2 kHz至4 kHz)t ©的每一者中當前訊框之能量，且在每一頻帶的能量值小於 (或者，不大於）各別臨限值的情況下指示訊框為非有作用的。此種選擇器可經組態以藉由將通帶濾波應用至訊框及計算經濾波之訊框的樣本之平方和而計算頻帶中的訊框能量。此種語音作用性偵測操作之一實例描述於第三代合作夥伴計劃2 (3GPP2)標準文件C.S00M_C，vl 〇 (“们年丄月）（以www.3gpp2.org線上可得）之章節4 7中。 ◎ 另外或在替代例中，此種分類可基於來自一或多個先前訊框及/或一或多個隨後訊框之資訊。舉例而言，可能需要基於訊框特性之在兩個或兩個以上訊框上求平均之值對訊框進行分類。可能需要使用基於來自先前訊框（例如，煮景雜訊等級，SNR)之資訊之臨限值對訊框進行分類。亦可能需要組態編碼方案選擇器20以將音訊信號sl〇中遵循自有作用訊框至非有作用訊框之轉變的第一訊框中之一或多者分類為有作用的。在轉變之後以此種方式繼續先前分類狀態之動作亦稱為"時滯（hangover)，·。 134862.doc 200933608 有作用訊框編碼器3G經組態以編碼音訊信號之有作用訊框。編碼器30可經組態以根據諸如全速率、半速率或四分速率之位元速率編碼有作用訊框。編碼器3 〇可經組熊以根據諸如碼激勵線性預測（CELp)、原型波形内插或原里間距週期（ppp)之編碼模式編碼有作用訊框。有作用訊框編碼器30之典型實施例經組態以產出包括頻 a資訊的描述及時間資訊的描述之經編碼訊框。頻譜資訊之描述可包括線性預測編碼（Lpc)係數值之一或多個向 ©量，其指示經編碼話音之共振（亦稱為"共振峰"）。頻譜資訊之描述通常經量化，以使得Lpc向量通常被轉換為可有效進行量化之形式，諸如線頻譜頻率（lsf)、線頻譜對 (LSP)、導抗頻譜頻率（ISF，immittance speetral frequency)、導抗頻譜對（ISP)、倒譜係數或對數面積比。時間資訊之描述可包括亦通常經量化之激勵信號之描述。非有作用訊框編碼器40經組態以編碼非有作用訊框。非〇有作用訊框編碼器40通常經組態而以比有作用訊框編碼器 30使用之位元速率低之位元速率來編碼非有作用訊框。在實例中’非有作用訊框編瑪器4G經組態以使用雜訊激勵線性預測（NELP)編碼方案以人分之—速率編碼非有作用訊框。非有作用訊框編碼器4〇亦可經組態以執行不連續傳輸 (DTX)，以使得經編碼訊框（亦稱為”靜寂描述"或π訊框）針對少於音訊信號S10之所有非有作用訊框進行傳輸。非有作用訊編碼器4G之典型實施例經組態以產出包括頻譜資訊的描述及時間資訊的描述之經編碼訊框。頻譜資 134862.doc -17· 200933608 訊之描述可包括線性預測編碼（Lpc)係數值之—或多個向量。頻譜資訊之描述通常經量化，以使得LPC向量通常轉換為如上文實例中的可有效進行量化之形式。非有作用訊框編碼器40可經組態以執行具有比有作用訊框編碼器3〇執行之LPC分析的階數低之階數的LPC分析，及/或非有作用訊框編碼器40可經組態以將頻譜資訊之描述量化為比有作用訊框編碼器30產出的頻譜資訊之量化描述少的位元。時間資訊之描述可包括亦通常經量化之時間包絡之描述（例如包括訊框之增益值及/或訊框的一系列子訊框中之每一者的增益值）。注意，編碼器30及40可共用共同結構。舉例而言，編碼器30及40可共用Lpc係數值之計算器（可能經組態以產出對於有作用訊框與非有作用訊框具有不同階數之結果），但具有分別不同之時間描述計算器。亦注意，話音編碼器 XI 〇之軟體或韌體實施例可使用編碼方案選擇器2〇之輸出 ❹以引導執行向—個或另一個訊框編碼S之流程，且此種實施例可能不包括針對選擇器50a及/或針對選擇器50b之類比。可能需要組態編碼方案選擇器20以將音訊信號S10之每一有作用訊框分類為若干不同類型中之一者。此等不同類型可包括有聲話音（例如，表示母音聲之話音）之訊框、轉變訊框（例如，表示詞之開始或結束之訊框）及無聲話音（例如，表不摩擦聲之話音）之訊框。訊框分類可基於當前訊框及/或一或多個先前訊框之一或多個特徵，諸如訊框能 134862.doc • 18 - 200933608 量、兩個或兩個以上不同頻帶中之每一者之訊框能量、 SNR、週期性、頻譜傾斜及/或過零率。此此種因數之值或量值與臨限值進行比較及/或將此^ = 的改變之量值與臨限值進行比較。 /可能需要組態話音編碼器川以使用不同編碼位元速率 f編碼不同類型之有作用訊框（例如，以平衡網路需求與谷量）。此種操作稱為”可變速率編碼"。舉例而言，可能需要組態話音編碼器Xl0以更高位元速率（例如，全速率）編碼轉變訊框’以更低位元速率（例如，四分之一速率）編碼無聲訊框，且以中間位元速率（例如，半速率）或以更高位疋速率（例如，全速率）編碼有聲訊框。人圖2展示編瑪方案選擇器2〇之實施例22可用以根據訊框含2的話音之類型選擇編碼特定訊框的位元速率之決策樹之實例。|其他情形下，經選擇用於特定訊框之位元速率亦可視諸如所要平均位元速率、在一系列訊框上之所要 ❿位疋速率型式（其可用以支援所要平均位元速率）及/或經選擇用於先前訊框之位元速率之準則而定。另外或在替代例中，可能需要組態話音編碼11X10以使不同編㈣式來編碼*賴^之話音訊框。此種操作稱右多重模式編碼”。舉例而言，有聲話音之訊框傾向於具與亦即’繼續-個以上之訊框週期)之週期性結構且關且使用編碼此長期頻譜特徵之描述的編碼模 $來編嫣有簦· 聲訊框（或有聲訊框之序列）通常係更加有效種編碼模式之實例包括CELP、PWI及PPP。另一方 134862.doc 200933608 面，無聲訊框及非有作用訊框通常缺少任何顯著長期頻譜特徵，且話音編碼器可經組態以使用諸如NELP之不嘗試描述此種特徵的編碼模式來編碼此等訊框。可能需要實施話音編碼器X10以使用多重模式編碼，以使得訊框根據基於（例如）週期性或發音之分類使用不同模式進行編碼。亦可能需要實施話音編碼器X10以針對不同類型之有作用訊框使用位元速率與編碼模式之不同組合 (亦稱為"編碼方案"）。話音編碼器X10之此種實施例之一 Ο 實例針對含有有聲話音之訊框及轉變訊框使用全速率 CELP方案，針對含有無聲話音之訊框使用半速率NELP方案，且針對非有作用訊框使用八分之一速率NELP方案。話音編碼器XI0之此種實施例的其他實例支援用於一或多

個編碼方案之多重編碼速率，諸如全速率及半速率CELP 方案及/或全速率及四分之一速率PPP方案。多重方案編碼器、解碼器及編碼技術之實例描述於（例如）標題為

_ "METHODS AND APPARATUS FOR MAINTAINING A 〇 TARGET BIT RATE IN A SPEECH CODER"的美國專利第 6,330,532號中及標題為"VARIABLE RATE SPEECH CODING” 之美國專利第6,691，084號中；及標題為''CLOSED-LOOP VARIABLE-RATE MULTIMODE PREDICTIVE SPEECH CODER"之美國專利申請案第09/191,643號中及標題為 "ARBITRARY AVERAGE DATA RATES FOR VARIABLE RATE CODERS"之美國專利申請案第ll/625,788號中。圖IB展示包括有作用訊框編碼器30之多項實施例30a、 134862.doc -20· 200933608 3Ob的話音編碼器χ丨〇之實施例χ2〇的方塊圖。編碼器3 經組態以使用第一編碼方案（例如，全速率CELp)編碼第一類有作用訊框（例如’有聲訊框），且編碼器3〇b經組態以使用具有與第一編碼方案不同之位元速率及/或編碼模式之第二編碼方案（例如，半速率NELP)來編碼第二類有作用訊框（例如，無聲訊框）。在此情形下，選擇器52a及52b經組態以根據由編碼方案選擇器22產出之具有兩個以上可能狀態的編碼方案選擇信號之狀態在各種訊框編碼器中進行選 ©擇。明確地揭示，話音編碼器χ2〇可以支援自有作用訊框編碼器30之兩個以上不同實施例中進行選擇之方式進行擴展。話音編碼器Χ20之訊框編碼器中的一或多者可共用共同結構。舉例而言，此種編碼器可共用Lpc係數值之計算器 (可能經組態以針對不同類之訊框產出具有不同階數之結果）’但具有分別不同之時間描述計算器。舉例而言編 D 碼器30a及30b可具有不同激勵信號計算器。如圖1B中所展示，話音編碼器χι〇亦可經實施以包括雜訊抑制器10。雜訊抑制器10經組態及配置以對音訊信號 S10執行雜訊抑制操作。此種操作可支援編碼方案選擇器 20對有作用與非有作用訊框之間的改良辨別及/或有作用訊框編碼器30及/或非有作用訊框編碼器4〇之更佳編碼結果。雜訊抑制器10可經組態以將不同各別增益因數應用至音訊信號之兩個或兩個以上不同頻率頻道中之每一者，立中每一頻道之增益因數可基於頻道的雜訊能量或snr之2 134862.doc -21· 200933608 計。如與時域相對，可能需要在頻域中執行此種增益控制，且此種組態之一實例描述於上文提及之3Gpp2標準文件C.S0014-C之章節4.4.3中。或者，雜訊抑制器1〇可經組態以可能在頻域中將調適性濾波應用至音訊信號。歐洲電信標準協會（ETSI)文件ES 202 0505 vl」5 (2〇〇7年1月以 www.etsi.org線上可得）之章節5·丨描述自非有作用訊框估計雜訊頻譜且基於所計算之雜訊頻譜對音訊信號執行兩階段梅爾維納（mel-Warped Wiener)濾波的此種組態之實例。 © 圖3A展示根據一般組態之裝置X100之方塊圖（亦稱為編碼器、編碼裝置或用於編碼之裝置）。裝置χι〇〇經組態以自音訊信號S10移除現存背景聲音且將其取代為可能類似或不同於現存背景聲音之所產生背景聲音。裝置χι〇〇包括經組態及配置以處理音訊信號Si〇以產出背景聲音増強音訊信號S15之背景聲音處理器100。裝置χι〇〇亦包括話音編碼器X10之實施例（例如，話音編碼器Χ20)，其經配置以編 ❹瑪背景聲音增強音訊信號Sl5以產出經編碼音訊信號82〇。包括諸如蜂巢式電話之裝置X丨0 0的通信器件可經組態以在將經編碼音訊信號S20傳輸於有線、無線或光學傳輸頻道 (例如’藉由一或多個載波之射頻調變）中之前對經編碼音訊信號S20執行進一步處理操作，諸如錯誤校正、冗餘及/ 或協定（例如，以太網路、TCP/IP、CDMA2000)編碼。圖3B展示背景聲音處理器1〇〇之實施例1〇2之方塊圖。背景聲音處理器102包括經組態及配置以抑制音訊信號s 1 〇之背景聲音分量以產出背景聲音受抑制音訊信號S13之背景 134S62.doc •22- 200933608 聲音抑制器110。背景聲音處理器102亦包括經組態以根據背景聲音選擇信號S40之狀態產出所產生背景聲音信號S50 之背景聲音產生器120。背景聲音處理器1〇2亦包括經組態及配置以混合背景聲音受抑制音訊信號S13與所產生背景聲音信號S50以產出背景聲音增強音訊信號815之背景聲音混合器190。如圖3B中所示，背景聲音抑制器i 10經配置以在進行編碼之前自音訊信號抑制現存背景聲音。背景聲音抑制器〇 ho可實施為如上文所描述之雜訊抑制器ίο的更加冒進之版本（例如，藉由使用一或多個不同臨限值）。其他或另外，背景聲音抑制器110可經實施以使用來自兩個或兩個以上麥克風之音訊信號以抑制音訊信號S10之背景聲音分量。圖3G展示包括背景聲音抑制器U0之此種實施例110A 的背景聲音處理器102之實施例i〇2A的方塊圖。背景聲音抑制器110A經組態以抑制音訊信號S10之背景聲音分量， φ 舉例而言，其係基於由第一麥克風產出之音訊信號。背景聲音抑制器110A經組態以藉由使用基於由第二麥克風產出之音訊彳§號之音訊信號SA1(例如，另一數位音訊信號）而執行此種操作《多重麥克風背景聲音抑制之合適實例揭示於（例如）代理人案號為061521的標題為"APPARATUS AND METHOD OF NOISE AND ECHO REDUCTION" (Choy 等人）之美國專利申請案第11/864,906號中，及代理人案號為 080551之標題為"SYSTEMS，METHODS, AND APPARATUS FOR SIGNAL SEPARATION" (Visser等人）的美國專利申請 134862.doc -23- 200933608 案第12/037,928號中。背景聲音抑制器11〇之多重麥克風實施例亦可經組態以向編碼方案選擇器2〇之相應實施例提供資訊，用於根據（例如）代理人案號為〇61497之標題為 MULTIPLE MICROPHONE VOICE ACTIVITY DETECTOR" (Choy等人）的美國專利申請案第11/864,897號中揭示之技術而改良話音作用性偵測效能。圖3C至圖3F展示兩個麥克風Kl〇及K2〇在包括裝置χι〇〇之此種實施例（諸如蜂巢式電話或其他行動使用者終端機） © 的可攜式器件中或經組態以經由向此種可攜式器件之有線或無線（例如，藍芽）連接進行通信的諸如耳機或頭戴式耳機之免提式器件中之各種安裝組態。在此等實例中，麥克風Κ10經配置以產出主要含有話音分量（例如，音訊信號 S10之類比前驅物）之音訊信號，且麥克風Κ2〇經配置以產出主要含有背景聲音分量（例如，音訊信號SA1之類比前驅物）之音訊信號。圖3C展示麥克風K10安裝於器件之正面之 ❿後且麥克風K20安裝於器件之頂面之後的配置之一實例。圖3D展示麥克風K10安裝於器件之正面之後且麥克風K2〇安裝於器件之側面之後的配置之一實例。圖3E展示麥克風 K10安装於器件之正面之後且麥克風K20安裝於器件之底面之後的配置之一實例。圖3F展示麥克風K10安裝於器件之正面（或内面）之後且麥克風K2〇安裝於器件之背面（或外面）之後的配置之一實例。背景聲音抑制器110可經組態以對音訊信號執行頻譜相減操作。頻譜相減可預期抑制具有固定統計量之背景聲音 134862.doc •24· 200933608 分量，但對於抑制非固定之背景聲音可能無效。頻譜相減可使用於具有一個麥克風之應用中以及來自多重麥克風之信號可用之應用中。在一典型實例中，背景聲音抑制器 110之此種實施例經組態以分析音訊信號之非有作用訊框以導出現存背景聲音之統計學描述，諸如眾多副頻帶（亦稱為”頻率組"）中之每一者中之背景聲音分量之能量等級，且將相應頻率選擇性增益應用至音訊信號（例如，以基於相應背景聲音能量等級衰減副頻帶中之每一者上之音訊信 © 號）。頻譜相減操作之其他實例描述於S. F. Boll之 "Suppression of Acoustic Noise in Speech Using Spectral Subtraction" (IEEE Trans. Acoustics, Speech and Signal Processing, 27(2): 112-120，1979 年 4 月）中；R. Mukai, S. Araki，H. Sawada 及 S. Makino 之"Removal of residual crosstalk components in blind source separation using LMS filters" (Proc. of 12th IEEE Workshop on Neural Networks _ for Signal Processing，第 435-444頁，Martigny，Switzerland，

G 2002 年 9 月）中；及 R. Mukai，S. Araki，H. Sawada 及 S. Makino 之"Removal of residual cross-talk components in blind source separation using time-delayed spectral subtraction" (Proc. of ICASSP 2002，第 1789-1792 頁，2002年 5 月）中。另外或在替代實施例中，背景聲音抑制器110可經組態以對音訊信號執行盲源分離（BSS，亦稱為獨立分量分析）操作。盲源分離可用於信號自一或多個麥克風（除了用於捕獲音訊信號S10之麥克風之外）可得之應用中。盲源分離 134862.doc -25- 200933608 可預期抑制固定之背景聲音以及具有非固定統計量之背景聲音。描述於美國專利6，167,417 (Parra等人）中之BSS操作之一實例使用梯度下降法來計算用以分離源信號之濾波的係數。BSS操作之其他實例描述於S· Amari, A. Cichocki及 Η. H. Yang之"A new learning algorithm for blind signal separation" (Advances in Neural Information Processing Systems 8, MIT Press, 1996)中；L· Molgedey 及 H. G. Schuster之"Separation of a mixture of independent signals ❹ using time delayed correlations" (Phys. Rev. Lett., 72(23): 3634-3637，1994)中；及 L. Parra及 C_ Spence之"Convolutive blind source separation of non-stationary sources" (IEEE Trans, on Speech and Audio Processing, 8(3): 320-327, 2000年5月）中。另外或在上文論述之實施例的替代例中，背景聲音抑制器1〇〇可經組態以執行波束成形操作。波束成形操作之實例揭示於（例如）上文提及之美國專利申請案第11/864,897號（代理人案號061497)中及凡8&1'11\¥&1&1'丨等人 ❹ 之"Blind Source Separation Combining Independent Component Analysis and Beamforming" (EURASIP Journal on Applied Signal Processing, 2003:1 1, 1135-1146 (2003)) 中o 彼此靠近地定位之麥克風（諸如安裝於諸如蜂巢式電話或免提式器件之護罩之共同外殼内之麥克風）可產出具有高瞬時相關之信號。一般熟習此項技術者亦將認識到，一或多個麥克風可置放於共同外殼（亦即，整個器件之護罩） 134862.doc -26- 200933608 内之麥克風外殼中。此種相關可降級BSS操作之效能，且在此種情形下可能需要在BSS操作之前解相關音訊信號。解相關亦通常對於回音消除為有效的。解相關器可實施為具有五個或更少之抽頭（tap)或甚至三個或更少之抽頭的濾波器（可能為調適性濾波器）。此種濾波器之抽頭權重可為固疋的’或可根據輸入音訊信號之相關性進行選擇，且可能需要使用格形濾波器結構來實施解相關濾波器。背景聲音抑制器110之此種實施例可經組態以對音訊信號的兩個 Ο或兩個以上不同副頻帶中之每一者執行分離的解相關操作。方景聲3抑制器！丨〇之實施例可經組態以在操作之後至^對經分離話音分量執行—或多個額外處理操作。舉例而吕’可能需要f景聲音抑制器m至少對經分離話音分量執行解相關操作。可單獨地對經分離話音分量之兩個或兩個以上不同副頻帶中之每一者執行此種操作。

组離以卜:二替代例中’背景聲音抑制器U。之實施例可、1 =基：經分離背景聲音分量對經分離話音分量㈣現存背St，諸如頻譜相減。可進-步自話音分量㈣之頻譜相減可根據經分離背景聲音分量之* =級而實施為隨時間變化之頻率選擇性增益。組態二背景聲音抑制器U〇之實施例可⑧ 常將增益/用曰分量執行中心截波操作。此種操料地隨時間變化之信號…截波=用：等級成㈣趣作之一實例可表達為 134862.doc •27- 200933608 y[n] = {對於丨x[n]丨<C，〇 ;否則，χ[η]}，其中χ[η]為輪入樣本’ y[n]為輸出樣本，且C為截波臨限值。中心截波操作之另一實例可表達為y[n] = {對於丨χ[η]丨<C，〇 ;否則，

Sgn(X[n])(|X[n]|-C)}，其中sgn(x[n])指示 χ[η]之正負號。可能需要組態背景聲音抑制器丨1〇以實質上完全自音訊信號移除現存背景聲音分量。舉例而言，可能需要裴置 X100用不同於現存背景聲音分量之所產生背景聲音信號 S50取代現存背景聲音分量。在此種情形下現存背景聲 © " it實質上完全移除可能有助於減少經解碼音訊信號中現存背景聲音分量與取代背景聲音信號之間的可聽見的干擾。在另一實例中，可&需要裝置X100經組態以隱藏現存背景聲音分量，不管是否亦將所產生背景聲音信號s5〇相加至音訊信號。可能需要將背景聲音處理器刚實施為可在兩個或兩個以上不同操作模式之間組態。舉例而言，可能需要提供 ❾（A=操作模式，其中背景聲音處理器_經組態以在現予责景聲曰刀置實質上保持不變地情形下傳遞音訊信號， ()^ 一操作模式，其中背景聲音處理器經組態以實疋王移除現存背景聲音分量（可能將其取&為所產生景聲曰乜號S50)。對此種第一操作模式之支援(其可組 I'為預設模式）可能可^由田& , 了使用於允許包括裝置XI00的器件之 Z湖相容性。在第_操作模式中，背景聲音處理器⑽可 =態以對音訊信號執行雜訊抑制操作（例如，如上文關、訊抑制器10所描述）以產出雜訊受抑制音訊信號。 134862.doc •28- 200933608 背景聲曰處理器1〇〇之另外實施例可類似地經組態以支援兩個以上操作模式。舉例而言，此另外實施例可為可組態的以根據在自至少實質上無背景聲音抑制（例如，僅雜訊抑制）至。p分背景聲音抑制至至少實質上完全背景聲音抑制之fe圍中的二個或三個以上模式中之可選模式而改變現存为景聲音分量受抑制之程度。 ❹

圖4A展示包括背景聲音處理器100之實施例104的裝置 X100之實施例X102的方塊圖。背景聲音處理器1〇4經組態以根據處理控制信號S3〇之狀態而以上文描述的兩個或兩個以上模式中之一者進行操作。處理控制信號ss〇之狀態可由使用者控制（例如，經由圖形使用者介面、開關或其他控制介面），或者可由處理控制產生器340(如圖16中所說明）產生包括諸如表之將一或多個變數（例如，實體位置、操作模式）的不同值與處理控制信號S30之不同狀態相關聯的索引資料結構之處理控制信號S30。在一實例中，處理控制信號S30實施為二元值信號（亦即，旗標），其狀態指示將傳遞還是抑制現存背景聲音分量。在此種情形下，背景聲音處理器104可以第一模式進行組態以藉由停用其元件中之一或多者及/或自信號路徑移除此等元件（亦即，允許音訊信號繞過此等元件）而傳遞音訊信號S10，且可以第二模式進行組態以藉由啟用此種元件及/或將其插入於信號路徑中而產出背景聲音增強音訊信號S15。或者，背景聲音處理器1〇4可以第一模式進行組態以對音訊信號S10執行雜訊抑制操作（例如，如上文關於雜訊抑制器1 〇所描 134862.doc •29· 200933608 述），且可以第二模式進行組態以對音訊信號_執行背景聲音取代操作。在另-實例中，處理控制信號s3〇具有兩個以上可能狀態，每-狀態對應於背景聲音處理器之在自至少實質上無背景聲音抑制(例如，僅雜訊抑制)至部分背景聲音抑制至至少實質上完全的背景聲音抑制之範圍中的二個或三個以上操作模式中之不同模式。圖4B展示背景聲音處理器104之實施之m t ❹ Ο f聲音處理器106包括背景聲音抑制器u〇之實施例112, 背景聲音抑制器112經組態以具有至少兩個操作模式：第 -操作模式，《中背景聲音抑制器ιΐ2經組態以在現存背景聲音分量實質上保持不變之情形下傳遞音訊信號請，及第二操作模式’纟中背景聲音抑制器m經組態以實質上完全自音訊信號810移除現存背景聲音分量(亦即，以產出背景聲音受抑制音訊信號S13)。可能需要實施背景聲音抑制器112以使得第-操作模式為預設模式。可能需要實施背景聲音抑制考黑要貫以在第-操作模式中對音訊信號執 i訊P制操作（例如，如上文關於雜訊抑制器10所描述）以產出雜訊受抑制音訊信號。背：聲音抑制器112可經實施以使得在其第一操作模式中，繞過經組態以對音訊信號執行背景聲音抑制操作之一 =卜個^件（例如，—或多個軟體及/或㈣常式）。其他或聲音抑制=(::制器112可經實施以藉由改變此種背景臨限值而二=^譜相減及/或刪操作）之一或多個门模式進行操作。舉例而言，背景聲音抑制 I34862.doc 200933608 器112可以第一模式進行組態以應用第一組臨限值來執行雜訊抑制操作，且可以第二模式進行組態以應用第二組臨限值來執行背景聲音抑制操作。處理控制信號S30可用以控制背景聲音處理器1〇4之一或多個其他元件。圖4B展示經組態以根據處理控制信號S30 之狀態進行操作的背景聲音產生器120之實施例122的實例。舉例而言’可能需要根據處理控制信號S30之相應狀態將背景聲音產生器122實施為經停用（例如，以減少功率 ^消耗）或以其他方式防止背景聲音產生器122產出所產生之背景聲音信號S5〇 ^另外或其他，可能需要根據處理控制 k號830之相應狀態將背景聲音混合器19〇實施為經停用或繞過，或以其他方式防止背景聲音混合器19〇混合其輸入音訊信號與所產生背景聲音信號S50。如上所述，話音編碼器X10可經組態以根據音訊信號 S10之一或多個特性自兩個或兩個以上訊框編碼器中進行 ❹選擇。同樣’在裝置χ100之實施例内，可不同地實施編碼方案選擇器20以根據音訊信號§1〇、背景聲音受抑制音訊信號S13及/或背景聲音增強音訊信號S15之一或多個特性產出編碼器選擇信號。圖5A說明此等信號與話音編碼器 χ1〇之編碼器選擇操作之間的各種可能之相依性。圖6展干裝置ΧΗ)0之特定實施例X11G之方塊圖，丨中編喝方案選擇器2〇經組態以基於背景聲音受抑制音訊信號SU(如圖5a 中之點B所指示）之一或多個特性（諸如訊框能量、兩個兩個以上不同頻帶中之每—者之訊框能量、崎如 134862.doc 31 200933608 性、頻譜傾斜及/或過零率）產出編碼器選擇信號。明確地預期且特此揭示’圖5A及圖6中建議之裝置X100的各種實施例中之任一者亦可經組態以包括根據處理控制信號 S30(例如，如關於圖4A、圖沾所描述）的狀態及/或三個或二個以上訊框編碼器（例如，如關於圖1B所描述）中的一者之選擇來控制背景聲音抑制器n〇。可能需要實施裝置X100以將雜訊抑制及背景聲音抑制作為單獨操作而執行。舉例而言，可能需要將背景聲音處理 ❿器1〇0之實施例添加至具有話音編碼器X20的現存實施例之器件，而不移除、停用或繞過雜訊抑制器1〇。圖5B說明在包括雜訊抑制器10之裝置χι〇〇的實施例中在基於音訊信號 Sl〇之仏號與話音編碼器Χ20的編碼器選擇操作之間的各種可能之相依性。圖7展示裝置χι〇〇之特定實施例χΐ2〇之方塊圖，在裝置Χ120中編碼方案選擇器2〇經組態以基於雜訊受抑制音訊信號Sl2(如圖5Β中之點a所指示）之一或多個特 Q丨生（諸如訊框能量、兩個或兩個以上不同頻帶中之每一者的訊框能量、SNR、週期性、頻譜傾斜及/或過零率）產出編碼器選擇信號。明確地預期且特此揭示，圖5B及圖7中建議之裝置Xl00的各種實施例中之任一者亦可經組態以包括根據處理控制信號S3〇(例如’如關於圖从、圖4B所描述）的狀態及/或三個或三個以上訊框編蜗器（例如，如關於圖1B所描述)中的-者之選擇來控制背景聲音抑制器110。背景聲音抑制器川亦可經組態以包括雜訊抑制器10, 或可以其他方式可選擇地進行組態以對音訊信號_執行 134862.doc •32· 200933608 雜訊抑制。舉例而言’可能需要裝置χι〇〇根據處理控制信號㈣之狀態執行背景聲音抑制(其中現存背景聲音實質上自音訊信號全移除）或者雜訊抑制（其中現存背景聲音實質上保持不變)。一般而言，背景聲音抑制器110亦可經組態以在執行背景聲音抑制之前對音訊信號S1〇及/或在執行背景聲音抑制之後對所得音訊信號執行—或多個其他處理操作（諸如濾波操作）。 ❹ ❹ 如上所述，現存話音編碼器通常使用低仅元速率及/或 DTX來編碼非有作m因此，經編碼非有㈣訊框通常含有極少背景聲音資訊。視由背景聲音選擇信號S40指不之特定背景聲音及/或背景聲音產生器120之特定實施例而定’所I生背景聲音信號85〇之聲音品質及資訊内容可能大於原始背景聲音之聲音品質及資訊内容。在此種情形下，可能需要使用比用來編碼僅包括原始背景聲音之非有作用訊框的位元速率高之位元速率來編碼包括所產生背景聲音信號S50的非有作用訊框。圖8展示包括至少兩個有作用訊框編碼器30a、30b及編碼方案選擇器2〇及選擇器 5〇a、50b之相應實施例的裝置χι〇〇之實施例χΐ3〇的方塊圖。在此實例中，裝置Χ130經組態以基於背景聲音增強信號（亦即，在將所產生背景聲音信號S5〇相加至背景聲音受抑制音訊信號之後）執行編碼方案選擇。儘管此種配置可能導致語音作用性之錯㈣測，但其在使用較高位元速率來編碼背景聲音増強靜寂訊框之系統中亦可能係合意的。明確地指出，如關於圖8所描述之兩個或兩個以上有作 134862.doc •33· 200933608 用訊框編碼器及編碼方案選擇器20及選擇器50a、50b的相應實施例之特徵亦可包括於本文揭示之裝置乂10〇的其他實施例中》背景聲音產生器120經組態以根據背景聲音選擇信號S4〇之狀態產出所產生背景聲音信號S50。背景聲音混合器19〇經組態及配置以混合背景聲音受抑制音訊信號s丨3與所產生背景聲音、號850以產出背景聲音增強音訊信號815〇在一實例中，背景聲音混合器190實施為經配置以將所產生背景聲音信號S50相加至背景聲音受抑制音訊信號si3之加法器。可能需要背景聲音產生器12〇以可與背景聲音受抑制音訊信號相容之形式產出所產生背景聲音信號s5〇。在裝置XHH)之典型實施例中，舉例而言，所產生背景聲音信號S50及由背景聲音抑制器110產出之音訊信號兩者皆為 PCM樣本之序列。在此種情形下，背景聲音混合器州可經組態以將所產生背景聲音信號S5Q與背景聲音受抑制音 ❹ 訊信號叫可能作為基於訊框之操作）之相應樣本對相加，但亦可能實施背景聲音混合器19〇以對具有不同取樣

解析度之信號進行相加。音訊信號_通常亦實施為PCM 樣本之序列。在-些情形·P，t景聲音混“ 以對背景聲音增強信號執行一、〜洗波操作）。個其他處理操作(諸如背景聲音選擇信號S40指示兩個或兩個的指至少-者之選[在一實例背景聲日中牙景聲音選擇信號S40 不基於現存，景聲音之一或多個特徵之背景聲音選擇。 134862.doc •34· 200933608 舉例而言，背景聲音選擇信號S40可係基於關於音訊信號 S10之一或多個非有作用訊框的一或多個時間及/或頻率特性之資訊。編碼模式選擇器2〇可經組態而以此種方式產出背景聲音選擇信號S40。或者，裝置χιοο可經實施以包括經組態而以此種方式產出背景聲音選擇信號S4〇之背景聲音分類器320(例如，如圖7中所展示舉例而言，背景聲音分類器可經組態以執行基於現存背景聲音之線頻譜頻率 (LSF)的背景聲音分類操作，諸如E1_Maleh等人之” Frame_ ^ ^eve^ Noise Classification in Mobile Environments" (Proc. IEEE Int'l Conf. ASSP，1999，第 I卷，第 237-240頁）；美國專利第6,782,361號（El-Maleh等人）；及Qian等人之 "Classified Comfort Noise Generation for Efficient Voice

Transmission (Interspeech 2006, Pittsburgh，PA，第 225. 228頁）中描述的彼等操作。在另一實例中，背景聲音選擇信號S4〇指示基於諸如關〇於包括裝置XI00之器件的實體位置之資訊（例如，基於自全球疋位衛星（GPS)系統獲得，經由三角測量或其他測距操作計算，及/或自基地台收發器或其他伺服器接收之資訊）的一或多個其他準則之背景聲音選擇、使不同時間或時間週期與相應背景聲音相關之排程，及使用者選擇之背景聲音模式（諸如商務模式、舒緩模式、聚會模式^在此等情形下，裝置X100可經實施以包括背景聲音選擇器 33〇(例如，如圖8中所展示）。背景聲音選擇器33〇可經實施以包括將不同背景聲音與上文提及之諸如準則的一或多個 134862.doc •35- 200933608 變數之相應值相關聯的一或多個索引資料結構（例如，表）。在另一實例中，背景聲音選擇信號S40指示一列兩個或兩個以上背景聲音中的一者之使用者選擇（例如，自諸如選單之圖形使用者介面）。背景聲音選擇信號S40之另外之實例包括基於上文實例的任何組合之信號。圖9A展示包括背景聲音資料庫13〇及背景聲音產生引擎 140之背景聲音產生器12〇的實施例122之方塊圖。背景聲音資料庫120經組態以儲存描述不同背景聲音之多組參數 ❹值。背景聲音產生引擎WO經組態以根據根據背景聲音選擇信號S40之狀態而選擇的一組所儲存之參數值來產生背景聲音。圖9B展示背景聲音產生器122之實施例124之方塊圖。在此實例中’背景聲音產生引擎140之實施例144經組態以接收背景聲音選擇信號S40,且自背景聲音資料庫13〇的實施例134操取相應組之參數值。圖％展示背景聲音產生器122 ◎ 之另一實施例126之方塊圖。在此實例中，背景聲音資料庫130之實施例136經組態以接收背景聲音選擇信號S4〇，且將相應組之參數值提供至背景聲音產生引擎14〇之實施例 146 〇背景聲音資料庫13〇經組態以儲存兩個或兩個以上組之描述相應背景聲音之參數值。背景聲音產生器120之其他實施例可包括背景聲音產生引擎140之實施例，背景聲音產生引擎140之該實施例經組態以自諸如伺服器之内容提供者或其他非本端資料庫或自同級式網路（例如，如cheng 134862.doc -36- 200933608 等人之"A Collaborative Privacy-Enhanced Alibi Phone" (Proc· Int 1 Conf. Grid and Pervasive Computing ,第 4〇5_ 414頁，Taichung，TW，2006年5月）中所描述）下載對應於所選奇景聲音之一組參數值（例如，使用會話起始協定 (SIP)之一版本，如當前在RFC 3261中所描述，其以 www.ietf.org線上可得）。背景聲音產生器120可經組態而以經取樣之數位信號形式（例如，如PCM樣本之序列）擷取或下載背景聲音。然 © 而，由於儲存及/或位元速率限制，此種背景聲音可能將遠遠短於典型通信會話（例如，電話呼叫），從而要求在呼叫期間反覆不斷地重複相同背景聲音且導致對於收聽者而 °不可接受地为散注意力之結果。或者，可能將需要大量儲存及/或高位元速率下載連接以避免過度重複之結果。或者’背景聲音產生引擎14〇可經組態以自諸如一組頻譜及/或能量參數值之所擷取或所下載參數表示而產生背 Q 景聲音。舉例而言，背景聲音產生引擎140可經組態以基於可包括於SID訊框中之頻譜包絡（例如，LSF值之向量）的描述及激勵信號的描述而產生背景聲音信號S5〇之多個訊框。背景聲音產生引擎140之此種實施例可經組態以逐訊框地隨機化參數值之組以減小對所產生背景聲音的重複之覺察。可能需要背景聲音產生引擎140基於描述聲音結構 (sound texture)之範本產出所產生背景聲音信號S5〇。在一此種實例中，背景聲音產生引擎140經組態以基於包括複 134862.doc •37· 200933608 數個不同長度之自然顆粒之範本執行顆粒合成。在另一實例中，背景聲音產生引擎丨4〇經組態以基於包括級聯時間頻率線性預測（CTFLP)分析（在CTFLp分析中，原始信號在頻域中使用線性預測進行模型化，且此分析之剩餘部分接著在頻域中使用線性預測進行模型化）之時域及頻域係數的範本執行CTFLP合成。在另一實例中，背景聲音產生引擎140經組態以基於包括多重解析分析（MRA)樹之範本執行多重解析合成，該多重解析分析（MRA)樹描述至少一基 ® 底函數在不同時間及頻率標度處之係數（例如，諸如多貝西（Daubechies)按比例調整函數之按比例調整函數之係數’及諸如多貝西小波函數之小波函數之係數）。圖1〇展示基於平均係數及詳細係數之序列的所產生背景聲音信號 S50之多重解析合成之一實例。可能需要背景聲音產生引擎140根據語音通信會話之預期長度產出所產生背景聲音信號S50。在一此種實施例 q 中，背景聲音產生引擎140經組態以根據平均電話呼叫長度產出所產生背景聲音信號S50。平均呼叫長度之典型值在一至四分鐘之範圍中，且背景聲音產生引擎14〇可經實施以使用可根據使用者選擇而變化之預設值（例如，兩分鐘）。十。在可能需要背景聲音產生引擎140產出所產生背景聲音信號S50以包括基於相同範本之若干或許多不同背景聲音信號截波。所要數目之不同截波可設定為預設值或由裝置 X100之使用者選擇，且此數目之典型範圍為五至 134862.doc -38 · 200933608 2種實例中，背景聲音產生引擎i4〇經組態以根據基於平均呼叫長度及不同截波之所要數目的截波長度計算不同截波中之每一者。截波長度通常比訊框長度大―、二或三個數量級。在一實例中’平均呼叫長度值為兩分鐘，不同截波之所要數目為十，且藉由將兩分鐘除以十而計算截波長度為十二秒。在此等情形下’背景聲音產生引擎14〇可經組態以產生所要數目之不同截波（其各自係基於相同範本且具有所計算之截波長度）’且串連或以其他方式組合此等截波以產出所產生背景聲音信號S50。背景聲音產生引擎MO可經組態以重複所產生背景聲音信號S5〇(若必要）（例如，若通信之長度應超過平均呼叫長度）。可能需要組態背景聲音產生引擎140以根據音訊信號S10自有聲至無聲訊框之轉變產生新截波。圖9D展示用於產出所產生背景聲音信號S5〇之可由背景 ◎ 聲音產生引擎140的實施例執行之方法M1 〇〇的流程圖。任務T100基於平均呼叫長度值及不同截波之所要數目計算截波長度。任務T200基於範本產生所要數目之不同截波。任務T300組合截波以產出所產生背景聲音信號85〇。任務T200可經組態以自包括MRA樹之範本產生背景聲音信號截波。舉例而言，任務T200可經組態以藉由產生統計學上類似於範本樹之新MRA樹且根據該新樹合成背景聲音信號截波而產生每一截波。在此種情形下，任務T2〇〇可經組態以將新MR A樹產生為範本樹之複本，其中一或多個 134862.doc -39- 200933608 (可能全部）序列之一或多個（可能全部）係數由具有類似袓系體（ancestor)(亦即’在更低解析度下之序列中）及/或前體 (predecessor)(亦即，在相同序列中）的範本樹之其他係數取代。在另一實例中’任務T200經組態以根據藉由向範本係數值組的複本之每一值加上小隨機值而計算的新係數值組產生每一截波。任務T200可經組態以根據音訊信號si〇及/或基於其之信號（例如，信號S12及/或S13)的一或多個特徵而按比例調整 ® 背景聲音信號截波中之一或多者（可能全部）。此等特徵可包括信號等級、訊框能量、SNR、一或多個梅爾頻率倒譜係數（MFCC)及/或對信號之語音作用性摘測操作之一或多個結果。對於任務T200經組態以自所產生之MRA樹合成截波之情形而言，任務T200可經組態以對所產生MRA樹之係數執行此種按比例調整。背景聲音產生器12〇之實施例可經組態以執行任務T200之此種實施例。另外或在替代例 φ 中’任務T300可經組態以對經組合之所產生背景聲音信號執行此種按比例調整。背景聲音混合器19〇之實施例可經組態以執行任務T300之此種實施例。任務T300可經組態以根據相似性之量測組合背景聲音信號截波。任務T300可經組態以串連具有類似MFCC向量之截波（例如，以根據候選截波組上之MFCC向量之相對相似性串連截波）。舉例而言，任務T200可經組態以最小化相鄰截波之MFCC向量之間的在經組合截波串上計算的總距離。對於任務T200經組態以執行CTFLP合成之情形而言， 134862.doc -40- 200933608 任務Τ300可經組態以串連或以其他方式組合自類似係數產生之截波。舉例而言，任務Τ200可經組態以最小化相鄰截波之LPC係數之間的在經組合截波串上計算的總距離。任務Τ300亦可經組態以串連具有類似邊界瞬變之截波（例如，以避免自一截波至下一截波之可聽見的不連續性）。舉例而言，任務Τ200可經組態以最小化相鄰截波之邊界區域上的能量之間的在經組合截波串上計算的總距離。在此等實例中之任一者中，任務Τ300可經組態以使用疊加 © (overlap-and-add)或交互混疊（cross-fade)操作（而非串連）來組合相鄰截波。如上文所描述，背景聲音產生引擎14〇可經組態以基於可以允許低儲存成本及擴展非重複產生之緊密表示形式下載或擷取的聲音結構之描述而產出所產生背景聲音信號 S50 ^此等技術亦可應用於視訊或視聽應用。舉例而言，裝置XI00之具有視訊能力的實施例可經組態以執行多重解 0 析合成操作以增強或取代視聽通信之視覺背景聲音（例如，背景及/或照明特性）。背景聲音產生引擎140可經組態以貫穿通信會話（例如，電話呼叫）重複地產生隨機MRA樹。由於可預期較大樹需要較長時間產生，故可基於延遲容許度選擇MRA樹之深度。在另一實例中，背景聲音產生引擎140可經組態以使用不同範本產生多個短MRA樹，及/或選擇多個隨機MRA 樹，且混合及/或串連此等樹中之兩者或兩者以上以獲得樣本之較長序列。 134862.doc • 41 · 200933608 可能需要組態裝置XI00以根據增益控制信號S90之狀態控制所產生背景聲音信號S50之等級。舉例而言，背景聲音產生器120(或其元件，諸如背景聲音產生引擎14〇)可經組態以根據增益控制信號S90之狀態（可能藉由對所產生背景聲a L號S50或對信號S50的前驅物執行按比例調整操作 (例如’對範本樹或自範本樹產生之MRA樹之係數）)在特定等級上產出所產生背景聲音信號S50。在另一實例中，圖 13A展示包括按比例調整器（例如，乘法器）之背景聲音混 ©合器19〇的實施例192之方塊圖，該按比例調整器經配置以根據增益控制信號S90之狀態對所產生背景聲音信號S5〇執打按比例調整操作。背景聲音混合器192亦包括經組態以將經按比例調整之背景聲音信號相加至背景聲音受抑制音訊信號S13之加法器。包括裝置XI00之器件可經組態以根據使用者選擇來設定增益控制信號S90之狀態。舉例而言，此種器件可裝備有 Q 音量控制（例如，開關或旋鈕，或提供此種功能性之圖形使用者介面），器件之使用者可藉由該音量控制選擇所產生#景聲音“號850之所要等級。在此情形下，器件可經組態以根據所選等級設定増益控制信號S90之狀態。在另一實例中，此種音量控制可經組態以允許使用者選擇所產生背景聲音信號S50相對於話音分量（例如，背景聲音受抑制音訊信號S13)之等級之所要等級。圖11A展示包括增益控制信號計算器195之背景聲音處理器102的實施例1〇8之方塊圖。增益控制信號計算器經 134862.doc -42- 200933608 組態以根據可隨時間改變之信號S13之等級計算增益控制信號S90。舉例而言，增益控制信號計算器195可經組態以基於信號S13之有作用訊框的平均能量來設定增益控制信號S90之狀態。另外或在任一此種情形之替代例中，包括裝置X10G之器件可裝備有音量控制，該音量控制經組態以允許使用者直接控制話音分量（例如，信號Sl3)或背景聲音增強音訊信號815之等級，或間接控制此種等級（例如，藉由控制前驅信號之等級）。 © 裝置X100可經組態以控制所產生背景聲音信號S50相對於音訊信號S1〇、S12及S13中之一或多者的等級之等級，其可隨時間而變化。在-實例中，裝置χι贿組態以根據 S訊托號S10之原始背景聲音的等級控制所產生背景聲音七號S50之等級。裝置χι 〇〇之此種實施例可包括經組態以根據在有作用訊框期間背景聲音抑制器11〇的輸入等級與輸出等級之間的關係（例如，差別）來計算增益控制信號 Q S90之増益控制信號計算器195的實施例。舉例而言，此種增益控制計算器可經組態以根據音訊信號si〇的等級與背景聲音焚抑制音訊信號S13的等級之間的關係（例如，差另J )來什算增益控制信號S9〇。此種增益控制計算器可經組態以根據音訊信號S10之可自信號sl〇及su的有作用訊框之等級而計算的SNR來計算増益控制信號S9(^此種增益控制信號計算器可經組態以基於隨時間而平滑化（例如，平均化）之輸入等級來計算增益控制信號S9()，及/或可經組態以輸出隨時間而平滑化（例如，平均化）之增益控制信號 134862.doc •43- 200933608 S90 ° 實例中’裝置XlG()經組態以根據所要SNR控制所生背景聲音信號S50之等級。可特徵化為背景聲音增強音訊信號S15之有作用訊框中的話音分量（例如，背景聲音广抑制曰訊號813)之等級與所產生背景聲音信號請之等級之間的比率之s NR亦可稱為"信號背景聲音比"。所要 SNR值可為使用者選擇的，及/或在不騎產生背景聲音中不肖。舉例而言同所產生背景聲音信號㈣可與不同相應所要SNR值相關聯。所要SNR值之典型範圍為犯至 25 dB。在另一實例中，裝置χι〇〇經組態以控制所產生背景聲音信號S50(例如，背景信號）之等級為小於背景聲音嗳抑制音訊信號S13(例如，前景信號）之等級。圖11B展示包括增益控制信號計算器195之實施例197的背景聲音處理器102之實施例109的方塊圖。增益控制計算器197經組態及配置以根據（A)所要SNR值與（B)信號su與 Q S5〇之等級之間的比率之間的關係來計算增益控制信號 S90。在一實例中，若該比率小於所要SNR值，則増益控制信號S90之相應狀態使得背景聲音混合器j92在較高等級上混合所產生背景聲音信號S50(例如，以在將所產生背景聲音信號S50相加至背景聲音受抑制信號S13之前提高所產生jI*景聲a信號S50之等級）’且若該比率大於所要snr 值’則增益控制信號S90之相應狀態使得背景聲音混合器 192在較低等級上混合所產生背景聲音信號S5〇(例如，以在將信號S50相加至信號S13之前降低信號S50之等級）。 134862.doc -44· 200933608 如上文所描述’增益控制信號計算器19 5經組態以根據一或多個輸入信號（例如，S10、S13、S50)中之每一者的等級來計算增益控制信號S90之狀態。增益控制信號計算器195可經組態以將輸入信號之等級計算為在一或多個有作用訊框上進行平均之信號振幅。或者，增益控制信號計算器195可經組態以將輸入信號之等級計算為在一或多個有作用訊框上進行平均之信號能量。通常，訊框之能量計算為訊框的經平方樣本之和。可能需要組態增益控制信號 ©计算器I95以濾波（例如，平均化或平滑化）所計算等級及/ 或增益控制仏號S90中之一或多者。舉例而言，可能需要組態增益控制信號計算器195以計算諸如Sl〇或sn之輸入信號的訊框能量之動態平均值（running average)(例如，藉由將一階或更高階之有限脈衝響應或無限脈衝響應濾波應用至信號的經計算之訊框能量），且使用平均能量來計算增益控制信號S90。同樣，可能需要組態增益控制信號計〇算器195以在將增益控制信號S9〇輸出至背景聲音混合器 192及/或背景聲音產生器12〇之前將此種濾波應用至增益控制信號S90。音訊信號S10之背景聲音分量的等級可能獨立於話音分量之等級而改變，且在此種情形下，可能需要相應地改變所產生背景聲音信號S50之等級。舉例而言，背景聲音產生器120可經組態以根據音訊信號Sl〇之SNR改變所產生背景聲音信號S50之等級。以此種方式，背景聲音產生器12〇可經組態以控制所產生背景聲音信號s 5 〇之等級以接近音 134862.doc -45- 200933608 訊k號si〇中的原始背景聲音之等級。為維持獨立於話音分量之背景聲音分量之錯覺，可能需要即使k號等級改變亦要維持恆定背景聲音等級。舉例而 °歸因於說話者的嘴對於麥克風之方位的改變或歸珥於諸如a量調變或另一表達性效果之說話者語音的改變而可能發生信號等級的改變。在此種情形下，可能需要所產生背景聲曰彳s號S50之等級在通信會話（例如，電話呼叫）的持續時間中保持恆定。 Ο 如本文描述之裝置XI00的實施例可包括於經組態用於語音通仏或儲存之任何類型的器件中。此種器件之實例可包括（但不限於）以下各物：電話、蜂巢式電話、頭戴式耳機 (例如，經組態以經由Bluet00thTM無線協定之一版本與行動使用者終端機全雙工地進行通信之耳機）、個人數位助理（PDA)、膝上型電腦、語音記錄器、遊戲機、音樂播放機、數位相機。該器件亦可組態為用於無線通信之行動使 Q 用者終端機，以使得如本文所描述之裝置X100之實施例可包括於其内，或可以其他方式經組態以向器件之傳輸器或收發器部分提供經編碼音訊信號S2〇。用於語音通信之系統（諸如用於有線及/或無線電話之系統）通常包括眾多傳輸器及接收器。傳輸器及接收器可經整合或以其他方式作為收發器一起實施於共同外殼内。可能需要將裝置XI00實施為對傳輸器或收發器之具有足夠可用處理、儲存及可升級性之升級。舉例而言，可藉由將背景聲音處理器1 00之元件（例如，在韌體更新中）添加至已包 134862.doc -46- 200933608 括話音編碼器X1G之實施例之器件而實現裝置χι⑽之實施例。在-些情形下，可執行此種升級而不改變通信系統之任何八他。P刀。舉例而言，可能需要升級通信系統中之傳輸器中的或多者（例如’用於無線蜂巢式電話之系統中的一或多個行動使用者終端機中之每一者的傳輸器部分）以包括裝置X100之實施例，而不對接收器作出任何相應改變。可能需要以使得所得器件保持為回溯可相容（例如，則吏得器件保持為能夠執行全部或實質上全部之不涉及背 ©景聲音處理器1GG的使用之其先前操作）之方式執行升級。對於裝置χιοο之實施例用以將所產生背景聲音信號S5〇插入於經編碼音訊信號S20中之情形而言，可能需要說話者（亦即，包括裝置X100之實施例的器件之使用者）能夠監視傳輸。舉例而言，可能需要說話者能夠聽到所產生背景聲音信號S50及/或背景聲音增強音訊信號S15。此種能力對於所產生背景聲音信號S50不同於現存背景聲音之情形而言可為尤其需要的。因此’包括裝置X1 〇〇之實施例的器件可經組態以將所產生背景聲音信號S50及背景聲音增強音訊信號S15中的至少一者反饋至耳機、揚聲器或位於器件之外殼内的其他音訊轉換器；至位於器件之外殼内之音訊輸出插口；及/或至位於器件之外殼内之短程無線傳輸器（例如，如與由藍芽技術聯盟（Bluetooth Special Interest Group，Bellevue，WA) 發布之藍芽協定之一版本及/或另一個人區域網路協定相容之傳輸器）。此種器件可包括經組態及配置以自所產生 134862.doc -47· 200933608 背景聲音仏號S50或背景聲音增強音訊信號S15產出類比信號之數位至類比轉換器（DAC)。此種器件亦可經組態以在將類比信號應用至插口及/或轉換器之前對其執行一或多個類比處理操作（例如，濾波、等化及/或放大卜装置χι〇〇可能但不必經組態以包括此種DAC及/或類比處理路徑。在語音通信之解碼器端處（例如，在接收器處或在擷取後）’可能需要以類似於上文描述之編碼器側技術之方式取代或增強現存背景聲音。亦可能需要實施此種技術而不 © 要求改變相應傳輸器或編碼裝置。圖12A展不經組態以接收經編碼音訊信號S2〇且產出相應經解碼音訊信號S11〇之話音解碼器R1〇之方塊圖。語音解碼器R10包括編碼方案偵測器6〇、有作用訊框解碼器7〇及非有作用訊框解碼器80。經編碼音訊信號S20為可由話曰編碼器XI 0產出之數位信號。解碼器7〇及可經組態以對應於如上文所描述之話音編碼器χι〇的編碼器，以使得〇有作用訊框解碼器70經組態以解碼已由有作用訊框編碼器 30進行編碼之訊框，且非有作用訊框解碼器8〇經組態以解碼已由非有作用訊框編碼器4〇進行編碼之訊框。語音解碼器Ri〇通常亦包括經組態以處理經解碼音訊信號su〇以減少篁化雜訊（例如，藉由強調共振峰頻率及/或衰減頻譜谷值）之後渡波器（postfilter) ’且亦可包括調適性增益控制。 C括^碼器R丨〇之器件可包括經組態及配置以自經解碼音 2信號Sl10產出類比信號以供輸出至耳機、揚聲器或其他音訊轉換器及/或位於器件的外殼内之音訊輸出插口的數 134862.doc •48· 200933608 比轉換器（DAC)。此種器件亦可經組態以在將類比 :號應用至插口及/或轉換器之前對其執行一或多個類比處理操作（例如，濾波、等化及/或放大）。編碼方㈣測器60經組態以指示對應於經編碼音訊信號 M0之當前訊框之編碼方案。適#之編碼位元速率及/或編碼模式可由訊框之格式指示^編碼方案彳貞測㈣可經组離以執行速率偵測或自裝置（話音解碼器R1〇嵌埋於其内）之 ❹

另一部分（諸如多工子層）接收速率指示。舉例而言，編喝方案價測器60可經組態以自多工子層接收指示位元速率之封包類型指示符。或者’編碼方㈣測請可經組態以自諸如訊框能量之一或多個參數判定經編碼訊框之位元逮率。在一些應用中，編碼系統經組態以針對特定位元速率僅使用一個編碼模式，以使得經編碼訊框之位元速率亦指示編碼模[在其他情形下，經編碼訊框可包括諸如一組 =或多個位元之識別對訊框進行編碼所根據的編碼模式之資訊。此種資訊（亦稱為"編碼索引"）可明確地或隱含地指示編碼模式（例如，藉由指示對於其他可能之編碼模式而言無效之值）。圖12A展示由編碼方案偵測器6〇產出之編碼方案指示用以控制話音解碼器R10的一對選擇器9〇a及9〇b以選擇有作用訊框解碼器70及非有作用訊框解碼器8〇中的一者之實例。注意，話音解碼器R10之軟體或韌體實施例可使用編碼方案指示來引導向訊框解碼器中之一者或另一者之執行流程，且此種實施例可能不包括針對選擇器9〇&及/或選擇 134862.doc -49- 200933608 器9〇b之類比。圖12B展示支援對以多重編碼方案進行編碼之有作用訊框的解碼之話音解碼器Rl〇之實施例r2〇的實例’其特徵可包括於本文描述之其他話音解碼器實施例中之任—者中。語音解碼器R20包括編碼方案偵測器6〇之實施例62 ;選擇器9〇a、90b之實施例92a、92b ;及有作用訊框解碼器70之實施例70a、70b，其經組態以使用不同編碼方案（例如，全速率CELP及半速率NELp)來解碼經編碼之訊框。有作用訊框解碼器70或非有作用訊框解碼器8〇之典型實施例經組態以自經編碼訊框提取Lpc係數值（例如，經由反置化，繼之以經反量化向量向LPC係數值形式之轉換），且使用彼等值來組態合成濾波器。根據來自經編碼訊框之其他值及/或基於偽隨機雜訊信號計算或產生之激勵信號用來激勵合成濾波器以再現相應經解碼訊框。注意，兩個或兩個以上之訊框解碼器可共用共同結構。 ©舉例而言，解碼器70及80(或解碼器70a、7〇b及80)可共用 LPC係數值之計算器，其可能經組態以產出對於有作用訊框與非有作用訊框具有不同階數之結果，但具有分別不同之時間描述a十算器。亦注意，話音解碼器ri〇之軟體或勒體實施例可使用編碼方案债測器60之輸出來引導向訊框解 /中者或另者之執行流程，且此種實施例可能不包括針對選擇器90a及/或選擇器9〇b之類比。圖13B展示根據_般組態之裝置Ri〇〇(亦稱為解碼器、解碼裝置或用於解碼之裝置）之方塊圖。裝置ri⑽經組態以 134862.doc •50- 200933608 自經解碼音訊信號S110移除現存背景聲音且將其取代為可能類似於或不同於現存背景聲音之所產生背景聲音。除話音解碼器R10之元件之外，裝置R100包括經組態及配置以處理音訊信號S110以產出背景聲音增強音訊信號8115之背景聲音處理器100之實施例200。包括裝置尺100之諸如蜂巢式電話的通信器件可經組態以對自有線、無線或光學傳輸頻道（例如，經由一或多個載波之射頻解調變）接收之信號執行處理操作，諸如錯誤校正、冗餘及/或協定（例如，以 ©太網路、TCP/IP、CDMA2000)編碼，以獲得經編碼音訊信號 S20 〇 ❹ 如圖14A中所展示，背景聲音處理器2〇〇可經組態以包括背景聲音抑制器110之例項21〇，背景聲音產生器12〇之例項220及背景聲音混合器19〇之例項29〇，其中此等例項根據上文關於圖3B及圖4B描述之各種實施例中的任一者進行組態（除背景聲音抑制器110之實施例以外，其使用來自如上文所描述之可能不適用於裝置Ri〇〇中的多重麥克風之信號)。舉例而言，背景聲音處理器·可包括經組態以對音訊信號sm執行如上文關於雜訊抑制器1〇所描述之雜訊抑制操作的冒it實施例(諸如維納(wiener)滤波操作)以獲得背景聲音受抑制音訊信號S113之背景聲音抑制器110的實施例在另實例中，背景聲音處理器2⑽包括背景聲音抑制器110之實施例，昔县獻立1 A 貝犯灼牙景聲音抑制器110之該實施例經組態以根據如上文所描述之从·之現存背景聲音的統計學描述 (例如，音訊信號S110之一线容彻沾士 ^多個非有作用訊框）對音訊信 134862.doc 51 200933608 號S110執行頻譜相減操作以獲得背景聲音受抑制音訊信號 S113。另外或在對於任一此種情形之替代例中，背景聲音處理器200可經組態以對音訊信號S110執行如上文所描述之中心截波操作。如上文關於背景聲音抑制器100所描述，可能需要將背景聲音抑制器200實施為可在兩個或兩個以上不同操作模式中進行組態（例如，自無背景聲音抑制至實質上完全背景聲音抑制之範圍）。圖14B展示包括經組態以根據處理控 © 制信號S3〇之例項S130的狀態進行操作之背景聲音抑制器 112的例項212及背景聲音產生器122的例項222之裝置Ri〇〇的實施例R110之方塊圖。背景聲音產生器220經組態以根據背景聲音選擇信號S4〇之例項S 14 〇之狀態產出所產生背景聲音信號S 5 0之例項 S150。控制兩個或兩個以上背景聲音中的至少一者之選擇的背景聲音選擇信號§14〇之狀態可能係基於一或多個準〇則諸如.關於包括裝置尺1〇〇之器件的實體位置之資訊 (例如基於GPS及/或上文論述之其他資訊）、使不同時間或時間週期與相應背景聲音相關聯之排程、呼叫者之識別 ”焉（例如如、棱由呼叫號竭識別⑽⑴）進行判S ,亦稱為 ^號碼識别（ANI)或呼叫者識別發信號H用者㈣之5又定或模式（諸如商'疏捣·+、 + 商務模式、舒緩模式、聚會模式），及/ 或一列兩個或兩個以上背 ,,,, 背景聲音中的一者之使用者選擇 (例如，經由諸如選早之圖形使用者介面）。舉例而言，裝置R100可經實施以如上文所描述之使此種準則的值與 134862.doc -52· 200933608 不同背景聲音相關聯之背景聲音選擇器33〇的例項。在另一實例中’裝置R100經實施以包括如上文所描述之經組態以基於音訊信號S110的現存背景聲音之一或多個特性（例如，關於音訊信號S110之一或多個非有作用訊框的一或多個時間及/或頻率特性之資訊）產生背景聲音選擇信號8140 的背景聲音分類器320之例項。背景聲音產生器22〇可根據如上文所描述之背景聲音產生器12〇的各種實施例中之任一者進行組態。舉例而言，背景聲音產生器22〇可經組態〇以自本端儲存器擷取描述所選背景聲音之參數值，或自諸如伺服器之外部器件下載此等參數值（例如，經由SIP)。可能需要組態背景聲音產生器220以分別使產出背景聲音選擇信號S50之起始及終止與通信會話（例如，電話呼叫）之開始及結束同步。處理控制信號S130控制背景聲音抑制器212之操作以啟用或停用背景聲音抑制（亦艮P，以輸出具有音訊信號S110 ❹之現存背景聲音或者取代背景聲音之音訊信號）。如圖_ 中所展示，處理控制信號813〇亦可經配置以啟用或停用背景聲音產生器222。或者，背景聲音選擇信號sl4〇可經組態以包括選擇背景聲音產生器22〇之空輸出之狀態，或者背景聲音混合器290可經組態以將處理控制信號su〇接收為如上文關於背景聲音混合器19〇所描述之啟用/停用控制輸入。處理控制信號8130可經實施以具有一個以上狀態，以使得其可用以改變由背景聲音抑制器212執行之抑制之等級。裝置R100之另外的實施例可經組態以根據接收器處 134862.doc -53- 200933608 周圍聲音之等級控制背景聲音抑制的等級及/或所產生背景聲音信號S150之等級。舉例而言，此種實施例可經組態以控制音訊信號S115之SNR與周圍聲音之等級成反比關係 (例如’如使用來自包括裝置R100之器件的麥克風之信號進行感測）。亦明確地指出，當選擇使用人工背景聲音時可將非有作用訊框解碼器80斷電。一般而言，裝置R100可經組態以藉由根據適當編碼方案解碼每一訊框、抑制現存背景聲音（可能抑制可變之程度） ® 及根據某一等級添加所產生背景聲音信號S150而處理有作用訊框。對於非有作用訊框而言，裝置R1 〇〇可經實施以解碼每一訊框（或每一 SID訊框）及添加所產生背景聲音信號 S150。或者，裝置R100可經實施以忽略或丟棄非有作用訊框’且將其取代為所產生背景聲音信號S i 5〇。舉例而言，圖15展示經組態以在選擇背景聲音抑制時丟棄非有作用訊框解碼器80之輸出的裝置R200之實施例。此實例包括經組 0 態以根據處理控制信號S130之狀態選擇所產生背景聲音信號S150及非有作用訊框解碼器80的輸出中的一者之選擇器 250 〇裝置R100之另外的實施例可經組態以使用來自經解碼音訊"ί§號之一或多個非有作用訊框的資訊來改良由背景聲音抑制器210應用之用於有作用訊框中的背景聲音抑制之雜訊模型。另外或在替代例中，裝置Rl〇〇之此等另外的實施例可經組態以使用來自經解碼音訊信號之一或多個非有作用訊框的資訊來控制所產生背景聲音信號sl5〇之等級（例 134862.doc -54- 200933608 如，以控制背景聲音增強音訊信號8115之SNR)。裝置 R100亦可經實施以使用來自經解碼音訊信號之非有作用訊框的背景聲音資訊來補充經解碼音訊信號之一或多個有作用訊框及/或經解碼音訊信號之一或多個其他非有作用訊框内的現存背景聲音。舉例而言，此種實施例可用以取代已歸因於如傳輸器處之過度冒進雜訊抑制及/或不足的編碼速率或SID傳輸速率之因素而丟失的現存背景聲音。如上所述，裝置R100可經組態以在產出經編碼音訊信號 © S20之編碼器不作用及/或不改變之情形下執行背景聲音增強或取代。裝置R100之此種實施例可包括於經組態以在相應傳輸器（自其處接收信號S20)不作用及/或不改變的情形下執行背景聲音增強或取代之接收器内。或者，裝置ri〇〇可經組態以獨立地或根據編碼器控制而下載背景聲音參數值（例如，自SIP伺服器），及/或此種接收器可經組態以獨立地或根據傳輸器控制而下載背景聲音參數值（例如，自 • SIP伺服器）。在此等情形下，SIP伺服器或其他參數值源可經組態以使得編碼器或傳輸器之背景聲音選擇優先於解碼器或接收器之背景聲音選擇。可倉b需要根據本文描述之原理（例如，根據裝置χιό。及 Rl〇〇之實施例）實施在背景聲音增強及/或取代的操作上進行協作之話音編碼器及解瑪器。在此種系統内，可將指示所要背景聲音之資訊傳送至呈若干不同形式中之任一者之解碼器。在第一類實例中，將背景聲音資訊傳送為描述，該描述包括一組參數值，諸如LSF值及相應能量值序列之 134862.doc •55- 200933608 =如序：描述符科或諸如平均序列及相應值（例如^ _之MRA樹實例中所展示）。一組參數值（伊/如’向量）可經量傳輸為一或多個碼薄索引。在第一類實例中，將背景聲音資音識別符(亦稱為"昔县鼓立，或多個背景聲將背哥塾i: 擇資訊”)傳送至解碼器。可 '、聲曰識別符實施為對應於兩個或背景磬音夕、、本e a 从上不R音訊聲曰之凊单中之特定項目的索引。在此等情形下，索 ❹ Ο =一單::1 其:儲存於本端或儲存於解…卜部)可包括 ::二::::==:r 在… a訊背景聲音選擇資訊可匕括&不編碼器之實體位置及/或背景聲音模式之資訊。在此等類中之任一者中，可直接及/或間接地將背景聲 ==碼器傳送至解碼器。在直接傳輪中，編碼器將方景聲θ資訊在經編碼音訊信號S20内（亦即，經由相同邏 t頻道及經由與話音分量相同之協定堆叠）及/或經由單獨傳輸頻道（例如’可使用不同協定之資料頻道或其他單獨邏輯頻道）發送至解碼器。圖16展示經組態以經由不同邏輯頻道（例如，在相同無線信號内或在不同信號内）傳輸所選音訊背景聲音之話音分量及經編碼（例如，經量化）參數值的裝置χ100之實施例X200的方塊圖。在此特定實例中，裝置X200包括如上文所描述之處理控制信號產生器 3 4 0之例項。圖16中展示之裝置·之實施例包括背景聲音編w 15〇。在此實例中，背景聲音編碼器15〇經組態以產出基於 134862.doc •56- 200933608 背景聲音描述（例如’ 一組背景聲音參數值S7〇)之經編碼背景聲音信號S80 ^背景聲音編碼器15〇可經組態以根據認為適於特定應用之任何編碼方案產出經編碼背景聲音信號 S80。此種編碼方案可包括諸如霍夫曼（Huffman)編碼算術編碼、範圍編碼（range enc〇ding)及行程編碼（runlength· encoding)之一或多個壓縮操作。此種編碼方案可為有損及/ 或無損的。此種編碼方案可經組態以產出具有固定長度之結果及/或具有可變長度之結果。此種編碼方案可包括量 ® 化背景聲音描述之至少一部分。为景聲音編碼器15〇亦可經組態以執行背景聲音資訊之協定編碼（例如，在運輸層及/或應用層處）^在此種情形下，背景聲音編碼器15〇可經組態以執行諸如封包形成及/ 或交握之一或多個相關操作。甚至可能需要組態背景聲音編碼器150之此種實施例以發送背景聲音資訊而不執行任何其他編碼操作。 Q 圖17展示經組態以將識別或描述所選背景聲音之資訊編碼為經編碼音訊信號S2〇的對應於音訊信號sl〇之非有作用訊框的訊框週期之裝置χι〇〇的另一實施例χ2ι〇之方塊圖。此等訊框週期在本文亦稱為，，經編碼音訊信號之非有作用訊框在一些情形下，可能在解碼器處導致延遲，直至已接收所選背t聲音之足夠量之描述用於背景聲在-相關實例中’裝置X21G經組態以發送對應於本端地儲存於解碼器處及/或自諸如伺服器之命1干下栽之背 134862.doc •57- 200933608 景聲音描述(例如，在呼叫建立期間)之初始背景聲音識別符且亦經組態以發送對該背景聲音描述之隨後更新（例如，經由經編碼音訊信號S20之非有作用訊框）。圖18展示經組態以將音訊背景聲音選擇資訊（例如，所選背景聲音之識別符）編碼為經編碼音訊信號咖之非有作用訊框的裝置X100之相關實施例X22〇的方塊圖。在此種情形下，裝置X220可經組態以在通信會話之過程期間（甚至自一訊框至下一訊框）更新背景聲音識別符。圖18中展示之裝置χ22〇的實施例包括背景聲音編碼器 150之實施例152。背景聲音編碼器152經組態以產出基於音訊背景聲音選擇資訊（例如，背景聲音選擇信號Μ㈨之經編碼背景聲音信號S80之例項S82，其可包括一或多個背景聲音識別符及/或其他諸如實體位置及/或背景聲音模式之指示之資訊。如上文關於背景聲音編碼器15〇所描述，背景聲音編碼器152可經組態以根據認為適於特定應用及/ 或可經組態以執行背景聲音選擇資訊之協定編碼的任何編碼方案產出經編碼背景聲音信號S82。經組態以將背景聲音資訊編碼為經編碼音訊信號S2〇之非有作用訊框的裝置XI00之實施例可經組態以編碼每一非有作用訊框内之此種背景聲音資訊或不連績地編碼此種背景聲音資訊。在不連續傳輸（DTX)之一實例中，裝置χι〇〇之此種實施例經組態以根據規則間隔（諸如每五秒戍十秒’或每128或256個訊框）將識別或描述所選背景聲音之資訊編碼為經編碼音訊信號S20的一或多個非有作用訊框 134862.doc -58- 200933608 之序列。在不連續傳輸（DTX)之另一實例中，裝置χι〇〇之此種實施例經組態以根據諸如不同背景聲音的選擇之某一事件將此種資訊編碼為經編碼音訊信號S2〇的一或多個非有作用訊框之序列。裝置X210及χ220經組態以根據處理控制信號s3〇之狀態執行現存背景聲音之編碼（亦即，舊版操作）或背景聲音取代。在此等情形下，經編碼音訊信號S2〇可包括指示非有作用訊框疋否包括現存背景聲音或關於取代背景聲音之資 °訊之旗標（例如，可能包括於每一非有作用訊框中之一或多個位元）圖19及圖20展示組態為在非有作用訊桓期間不支援現存背景聲音之傳輸的相應裝置（分別為裝置χ3〇〇及裝置Χ300之實施例χ3 1〇)之方塊圖。在圖19之實例中，有作用訊框編碼器30經組態以產出第一經編碼音訊信號 S2〇a，且編碼方案選擇器20經組態以控制選擇器50b將經編碼背景聲音信號S8〇插入於第一經編碼音訊信號S2〇a之 ❹非有作用訊框中以產出第二經編碼音訊信號S20b。在圖20 之實例中’有作用訊框編碼器3〇經組態以產出第一經編碼音訊信號S20a，且編碼方案選擇器2〇經組態以控制選擇器 50b將經編碼背景聲音信號S82插入於第一經編碼音訊信號 S2〇a之非有作用訊框中以產出第二經編碼音訊信號S20b。在此等實例中’可能需要組態有作用訊框編碼器3 0而以封包化形式（例如，作為一系列經編碼訊框）產出第一經編碼音訊信號20a。在此等情形下，選擇器501)可經組態以如編碼方案選擇器20所指示將經編碼背景聲音信號插入於第一 134862.doc -59- 200933608 經編碼音訊信號―之對應於背景聲音受抑制信號的非有作用訊框之封包（例如，經編碼訊框）内的適當位置處或㈣擇器5Gb可經組態以如編碼方案選擇器2()所指示將由背景聲音編碼器15〇或152產出之封包（例如，經編碼訊框）插入於第一經編碼音訊信號82〇3内的適當位置處。如上所述。、-里編碼责景聲音信號S8〇可包括關於經編瑪背景聲音信號S80之資訊（諸如描述所選音訊背景聲音之一組參數值），且經編碼背景聲音信號S82可包括關於經編碼背景聲〇音信號S80之資訊（諸如識別一組音訊背景聲音中的一所選背景聲音之背景聲音識別符）。在間接傳輸中，解碼器不僅經由與經編碼音訊信號S2〇不同之邏輯頻道而且亦自諸如伺服器之不同實體接收背景聲音資訊。舉例而言，解碼器可經組態以使用編碼器之識別符（例如，統一資源識別符（URI)或統一資源定位符 (URL)，如RFC 3986中所描述，以靠西—線上可 Q 得）、解碼器之識別符（例如，URL)及/或特定通信會話之識別符來請求來自伺服器的背景聲音資訊。圖21A展示解碼器根據經由協定堆疊P20及經由第一邏輯頻道自編碼器接收之資訊而經由協定堆疊P10(例如，在背景聲音產生器 220及/或背景聲音解碼器252内）及經由第二邏輯頻道自伺服器下載背景聲音資訊之實例β堆疊p1〇及p2〇可為分離的或可共用—或多個層（例如，實體層、媒體存取控制層及邏輯鏈路層中之一或多者）。可使用諸如SIP之協定執行可以類似於下載鈴聲或音樂檔案或流的方式執行之背景聲音 134862.doc 200933608 資訊自伺服器至解碼器的下載。在其他實例中，可藉由直接與間接傳輸之某叫且人將背景聲音= 纽自編碼器傳送至解碼器。在般實例中，編碼器將背景聲音資訊以一形式（例如， X曰訊背景聲音潠擇資訊）發送至系統内之諸如伺服器 η 器件，且其他器件將相應背景聲音資訊以另一形式(例如，# 景音描述）發送至解碼器。在此種傳送由’、 _ ΤΤ弋X例中，伺服〇 ❹ 器經組態謂背景聲音f訊輸送至解碼llr^接收用於來自解碼器之資訊之請求（亦稱為"推送"）。舉例而言，飼服器可經組態以在呼叫建立期間將背景聲音資訊推迸至解碼器。圖21B展示伺服器根據編碼器經由協定堆疊㈣(例如’在背景聲音編碼器152内）及經由第三邏輯頻道發送之可包括解碼器的URL或其他識別符之資訊將背景聲音資訊經由第二邏輯頻道下載至解碼器之實例。在此種情形下，可使用諸如SIP的協定執行自編碼器至伺服器之傳送及/或自伺服器至解碼器之傳送。此實例亦說明經編碼音訊信號 S20經由協定堆疊P40及經由第一邏輯頻道自編碼器至解碼器之傳輸。堆疊P30及P40可為分離的，或可共用—或多個層（例如，實體層、媒體存取控制層及邏輯鏈路層中之一或多者）。如圖21B中所展示之編碼器可經組態以藉由在呼叫建立期間將INVITE訊息發送至伺服器而起始SIp會話。在一此種實施例中，編碼器將諸如背景聲音識別符或實體位置 (例如，作為一組GPS座標）之音訊背景聲音選擇資訊發送 134862.doc •61 · 200933608 至伺服器。編碼器亦可將諸如解碼器之URI及/或編碼器之 URI的實體識別資訊發送至伺服器。若伺服器支援所選音訊者景聲音，則其將ACK訊息發送至編碼器，且SIP會話結束。〇 ❹ 編碼器-解碼器系統可經組態以藉由抑制編碼器處之現存背景聲音或藉由抑制解碼器處之現存背景聲音而處理有作用訊框。可藉由在編碼器處（而非解碼器處）執行背景聲音抑制來實現"'或多個潛在優點。舉例而言，有作用訊框，碼器30可預期達成對背景聲音受抑制音訊信號比對現存背景聲音未經抑制之音訊信號的更佳之編碼結果。亦可能 2編碼$處得到諸如使用來自多重麥克風之音訊信號的 ,(例如，盲源分離）之更佳的抑制技術。亦可能話者能夠聽到與收聽者將聽到之背景聲音受抑制話音分： ====話音分*，且在編碼器處執行” 兩者處實施;;=:特徵。#然’在編碼器及解-器貧景聲音抑制亦係可能的。了此需要在編碼器·解碼器系統内所產 S150在編碼器环京聲曰k唬及解碼15兩者處皆可用。舉例而言，可能要說話者能夠聽到與收聽者將聽到之皆寻罄立需號相同之背景聲聲音增強音訊信景馨立’、聲日増強音訊信號。在此種情形下，所選昔景聲音之描述可蚀六所選老儲存於及/或下載至編碼器及解碼者。此外，可能兩冊，人螂嗎1§兩此而要組態背景聲音產生器220以確定地盡出所產生背景聲音伊雏夂地產景聲音產生操作可^號㈣，以使得在解碼器處執行之背 ” 在編碼器處進行複製。舉例而言，背景 134862.doc •62· 200933608 聲音產生器220可經組態以使用對於編碼器及解碼器兩者皆已知之一或多個值（例如，經編碼音訊信號S20之一或多個值）以計算可使用於產生操作中之任何隨機值或信號（諸如用於CTFLP合成之隨機激勵信號）。編碼器-解碼器系統可經組態而以若干不同方式中之任一者處理非有作用訊框。舉例而言，編碼器可經組態以將現存背景聲音包括於經編碼音訊信號S2〇内。包括現存背景聲音可能對於支援舊版操作為需要的。此外，如上文所 © 論述，解碼器可經組態以使用現存背景聲音來支援背景聲音抑制操作。或者’編碼器可經組態以使用經編碼音訊信號S20之非有作用訊框中之一或多者來載運關於所選背景聲音之資訊 (諸如或多個背景聲音識別符及/或描述）。如圖19中所展不之裝置X300為不傳輸現存背景聲音的編碼器之一實例。如上所述，非有作用訊框中背景聲音識別符之編碼可用以 Q 在諸如電話呼叫之通信會話期間支援更新所產生之背景聲曰k號S150。相應解碼器可經組態以快速且甚至可能逐訊框地執行此種更新。在另一替代例中’編碼器可經組態以在非有作用訊框期間傳輸極少或不傳輸位元，其可允許編碼器使用更高編碼速率用於有作用訊框而不增加平均位元速率。視系統而疋，編碼器可能需要在每一非有作用訊框期間包括某一最小數目之位元以便維持連接。可能需要諸如裝置X100之實施例（例如，裝置X2〇〇、 134862.doc •63· 200933608 X210或X220)或X300的編碼器發送所選音訊背景聲音之等級隨時間的改變之指示。此種編碼器可經組態以在經編碼背景聲音信號S80内及/或經由不同邏輯頻道將此種資訊發送為參數值（例如，增益參數值在一實例中，所選背景聲音之描述包括描述背景聲音的頻譜分布之資訊，且編碼器經組態以將關於背景聲音之音訊等級隨時間的改變之資訊發送為單獨時間描述（其可以與頻譜描述不同之速率進行更新）。在另一實例中，所選背景聲音之描述描述背景 © 聲音在第一時間標度（例如，在訊框或類似長度之其他間隔上）上之頻譜及時間特性兩者，且編瑪器經組態以將關於背景聲音之音訊等級在第二時間標度（例如，諸如自訊框至訊框之較長時間標度）上的改變之資訊發送為單獨時間描述。可使用包括用於每一訊框之背景聲音增益值之單獨時間描述來實施此種實例。在可應用至上文兩項實例中之任一者中之另一實例中， Q使用不連續傳輸（在經編碼音訊信號S20之非有作用訊框内或經由第二邏輯頻道）發送對所選背景聲音之描述之更新，且亦使用不連續傳輸（在經編碼音訊信號S2〇之非有作用訊框内，經由第二邏輯頻道，或經由另一邏輯頻道）發送對單獨時間描述之更新，兩個描述以不同間隔及/或根據不同事件進行更新《舉例而言，此種編碼器可經組態以比單獨時間描述更不頻繁地更新所選背景聲音之描述（例如，每512、1024或2048個訊框對每四個、八個或十六個訊框）。此種編碼器之另一實例經組態以根據現存背景聲 134862.doc -64- 200933608 音的一或多個頻率特性之改變（及/或根據使用者選擇）而更新所選背景聲音之描述’且經組態以根據現存背景聲音的等級之改變而更新單獨時間描述。圖22、圖23及圖24說明經組態以執行背景聲音取代之用於解碼的裝置之實例。圖22展示包括經組態以根據背景聲音選擇信號S140之狀態產出所產生背景聲音信號sl5〇的背景聲音產生器220之例項的裝置R3〇〇之方塊圖。圖23展示包括背景聲音抑制器210之實施例218的裝置R300之實施例 O R3 10的方塊圖。背景聲音抑制器21 8經組態以使用來自非有作用訊框之現存背景聲音資訊（例如，現存背景聲音之頻譜分布）來支援背景聲音抑制操作（例如，頻譜相減）。圖22及圖23中展示之裝置们〇〇及们1〇之實施例亦包括背景聲音解碼器252。背景聲音解碼器252經組態以執行經編碼背景聲音信號S80之資料及/或協定解碼（例如，與上文關於貪景聲音編碼152描述之編碼操作互補）以產出背景 ❹聲音選擇信號S140。其他或另外，裝置R3〇〇AR31〇可經實施以包括與如上文所描述之背景聲音編碼器Η〇互補之背景聲音解碼器250，其經組態以基於經編碼背景聲音信號S80之相應例項產出背景聲音描述（例如，—組背景聲音參數值）。圖24展示包括背景聲音產生器22〇之實施例228的話音解碼器R3〇0之實施例R320的方塊圖。背景聲音產生器^經組態以使用來自非有作用訊框之現存背景聲音資訊（例如，關於現存背景聲音之能量在時域及/或頻域中的分布 134862.doc -65· 200933608 之資訊）來支援背景聲音產生操作。如本文描述之用於編碼的裝置（例如，裝置XI00及X300) 及用於解碼的裝置（例如，裝置Rl〇〇、R2〇〇及R3〇〇)之實施例的各種元件可實施為駐留於（例如）同一晶片上或晶片組中之兩個或兩個以上晶片中的電子及/或光學器件，但亦可預期沒有此種限制之其他配置。此種裝置之一或多個元件可整個地或部分地實施為經配置以在邏輯元件（例如，電晶體、閘）的一或多個固定或可程式化陣列上執行之一 ❹或多個組指令’該等邏輯元件諸如微處理器、嵌埋式處理器、IP核心、數位信號處理器、FPGA(場可程式化閘陣列）、ASSP(特殊應用標準產品）及ASIC(特殊應用積體電路）。此種裝置之實施例的一或多個元件用以執行任務或執行與裝置之操作不直接相關的其他組指令（諸如關於裝置所嵌埋於其中之器件或系統之另一操作之任務）係可能的。 φ 此種裝置之實施例之一或多個元件具有共同結構（例如，用以執行在不同時間對應於不同元件之程式碼部分之處理器經執行以執行在不同時間對應於不同元件之任務之一 ^或在不同時間執行不同元件之操作的電子及/或光:器件之配置）亦係可能的。在一實例中，背景聲音抑制器110彦景聲音產生器120及背景聲音混合器J 90實施為經配置以在同一處理器上執行之指令組。在另一實例中’背景聲音處理器1GG及話音編碼HX1G經實施為經配置 x在同處理器上執行之指令組。在另一實例中，背景聲 134862.doc -66- 200933608 音處理器200及話音解碼器R10實施為經配置以在同一處理器上執行之指令組。在另一實例中，背景聲音處理器 1〇〇、話音編碼器χ10及話音解碼器R10實施為經配置以在同一處理器上執行之指令組。在另一實例中，有作用訊框編碼器30及非有作用訊框編碼器4〇經實施以包括在不同時間執行之相同組之指令。在另一實例中，有作用訊框解碼器70及非有作用訊框解碼器8〇經實施以包括在不同時間執行之相同組之指令。用於無線通信之器件（諸如蜂巢式電話或具有此種通信能力之其他器件）可經組態以包括編碼器（例如，裝置χι〇〇或Χ300之實施例）及解碼器（例如，裝置r1〇〇、们〇〇或 R300之實施例）兩者。在此種情形下，編碼器及解碼器具有共同結構係可能的。在一此種實例中，編碼器及解碼器經實施以包括經配置以在同一處理器上執行之指令組。本文也述之各種編碼器及解碼器的操作亦可視作信號處理方法的特定實例。此種方法可實施為一組任務，其一或多者（可能全部）可由邏輯元件（例如，處理器、微處理器、微控制器或其他有限狀態機）之一或多個陣列執行。任務中之一或多者（可能全部）亦可實施為可由一或多個邏輯元件陣列執行之程式碼（例如，一或多個指令組），程式碼可有形地實施於資料儲存媒體中。圖25A展示根據所揭示組態之處理包括第一音$背景聲音的數位音訊信號之方法A100的流程圖。方法A1〇〇包括任務A110及A120。基於第一麥克風產出之第一音訊信 134862.doc -67- 200933608 號，任務A110自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號。任務A120混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號。在此方法中，數位音訊信號係基於由不同於第一麥克風之第二麥克風產出之第二音訊信號。舉例而言，可藉由如本文描述之裝置χ100或X300之實施例執行方法A1〇〇。圖25B展示根據所揭示組態用於處理包括第一音訊背景聲音之數位音訊信號的裝置AM100之方塊圖。裝置ΑΜι 〇〇 © 包括用於執行方法A1 00之各種任務之構件。裝置am 100包括用於基於由第一麥克風產出之第一音訊信號自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之構件AM10。裝置AM100包括用於混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號之構件AM20。在此裝置中，數位音訊信號係基於由不同於第一麥克風之第二麥克風產出之第二音訊信號。可使 ^ 用能夠執行此等任務之任何結構實施裝置AM 100之各種元件’該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如’一或多個指令組、一或多個邏輯元件陣列等）。裝置AM100之各種元件之實例在本文中揭示於裝置X100及X300之描述中。圖26A展示根據所揭示組態之根據處理控制信號的狀態處理數位音訊信號之方法B100的流程圖，該數位音訊信號具有話音分量及背景聲音分量。方法B100包括任務B110、 B120、B130及B140。任務B110在處理控制信號具有第一 134862.doc • 68 - 200933608 狀態時以第—彳立元速率編碼缺少話音分量之數位音訊信號部分之訊框。任務B120在處理控制信號具有不同於第一狀態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務B 130在處理控制信號具有第二狀態'時混合音訊背景聲音信號與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號。任務B140在處理控制信號具有第二狀態時以第二位元速率編碼缺少話音分量之背景聲音增強信號部分之訊框，第二位元速率高於第一位元 ® 速率。舉例而言，可藉由如本文描述之裝置XI00之實施例執行方法B100。圖26B展示根據所揭示組態之用於根據處理控制信號的狀態處理數位音訊信號之裝置BM100的方塊圖，該數位音訊信號具有話音分量及背景聲音分量。裝置BM100包括用於在處理控制信號具有第一狀態時以第一位元速率編碼缺少話音分量之數位音訊信號部分之訊框的構件BM1 0。裝 q 置8^1100包括用於在處理控制信號具有不同於第一狀態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件BM20。裝置BM100包括用於在處理控制信號具有第二狀態時混合音訊背景聲音信號與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號之構件BM30。裝置BM100包括用於在處理控制信號具有第二狀態時以第二位元速率編碼缺少話音分量之背景聲音增強信號部分之訊框的構件BM40，第二位元速率高於第一位元速率。可使用能夠執行此種任務之任何結構實施裝置 134862.doc •69- 200933608 TD A A 1 f\ f\ ->» Jtr <▲-· >_i

本文中揭示於裝置X100之描述中。掲不組態之處理基於自第一轉換器接乳信號的方法C100之流程圖。方法 C120、C130&cl4〇。任務 cu〇自數

位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制 ©信號。任務C120混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號。任務cl3〇將基於（A)第二音訊背景聲音及（B)背景聲音增強信號中的至少一者之信號轉換為類比信號。任務cl4〇自第二轉換器產出基於該類比k號之聲訊信號。在此方法中，第一轉換器及第二轉換器兩者位於共同外殼内。舉例而言，可藉由如本文描述之裝置X100或X300之實施例執行方法C100。 ◎ 圖27B展示根據所揭示組態之用於處理基於自第一轉換器接收的信號之數位音訊信號的裝置CM100之方塊圖。裝置CM100包括用於執行方法C100之各種任務之構件。裝置 CM1 00包括用於自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之構件CM10。裝置CM100包括用於混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號之構件CM20。裝置CM100 包括用於將基於（A)第二音訊背景聲音及（B)背景聲音增強信號中的至少一者之信號轉換為類比信號的構件CM3 0。 134862.doc • 70· 200933608 裝置CM 1 〇〇包括用於自第二轉換器產出基於類比信號之聲訊信號之構件CM4 0。在此裝置中，第一轉換器及第二轉換器兩者位於共同外殼内。可使用能夠執行此等任務之任何結構實施裝置CM100之各種元件，該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如，一或多個指令組、一或多個邏輯元件陣列等）。裝置CM1 〇〇之各種元件的實例在本文中揭示於裝置幻〇〇及又3〇〇之描述中。 © 圖28A展示根據所揭示組態之處理經編碼音訊信號的方法D100之流程圖。方法D1〇〇包括任務d11〇、d12〇及 D1 30。任務D110根據第一編碼方案解碼經編碼音訊信號之第一複數個經編碼訊棺以獲得包括話音分量及背景聲音分量之第一經解碼音訊信號。任務D12〇根據第二編碼方案解碼經編碼音訊信號之第二複數個經編碼訊框以獲得第二經解碼音訊信號。基於來自第二經解碼音訊信號之資訊， Q 任務Dl3〇自基於第一經解碼音訊信號之第三信號抑制背景聲音分量以獲得背景聲音受抑制信號。舉例而言，可藉由如本文描述之裝置R100、厌2〇〇或尺3〇〇之實施例執行方法 D100。圖28B展示根據所揭示組態之用於處理經編碼音訊信號的裝置DM100之方塊圖。裝置DMl〇〇包括用於執行方法 D100之各種任務之構件。裝置DM100包括用於根據第一編碼方案解媽經編碼音訊信號之第一複數個經編碼訊框以獲得包括話音分量及背景聲音分量的第一經解碼音訊信號之 134862.doc -71- 200933608 構件DM1〇。裝置DM100包括用於根據第二編碼方案解碼經編碼音訊信號之第二複數個經編碼訊框以獲得第二經解碼音訊信號之構件DM20。裝置DMl〇〇包括用於基於來自第一經解碼音訊彳§號之資訊自基於第一解碼音訊信號的第二信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件DM3 0。可使用能夠執行此等任務之任何結構實施裝置 DM100之各種元件，該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如，一或多個指令組、一或 © 多個邏輯元件陣列等）。裝置DM100之各種元件的實例在本文中揭示於裝置R100、R200及R3〇〇之描述中。圖29 A展示根據所揭示組態之處理包括話音分量及背景聲音分量的數位音訊信號之方法E100的流程圖。方法E1〇〇包括任務E110、E120、E130及E140。任務E110自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務E120編碼基於背景聲音受抑制信號之信號以獲得經編碼 ^ 音訊信號。任務E13〇選擇複數個音訊背景聲音中的一者。任務E140將關於所選音訊背景聲音之資訊插入於基於該經編碼音訊信號之信號中《舉例而言’可藉由如本文描述之裝置又100或又300之實施例執行方法£1〇〇。圖29B展示根據所揭示組態之用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置EM100的方塊圖。裝置EM100包括用於執行方法Εΐοο之各種任務之構件。裝置 EM1 00包括用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件EM10。裝置EM100包括用於 134862.doc -72- 200933608 編碼基於背景聲音受抑制信號之信號以獲得經編碼音訊信號之構件EM20。裝置EM100包括用於選擇複數個音訊背景聲曰中的一者之構件EM30。裝置EM100包括用於將關於所選音訊背景聲音之資訊插入於基於該經編碼音訊信號的k號中之構件EM40。可使用能夠執行此等任務之任何結構實施裝置EM 1 〇〇之各種元件，該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如，一或多個札令組、一或多個邏輯元件陣列等）^裝置EM1〇〇之各種 © 元件的實例在本文中揭示於裝置X100及X3〇〇之描述中。圖30A展示根據所揭示組態之處理包括話音分量及背景聲音分量的數位音訊信號之方法以〇〇的流程圖。方法E2〇〇包括任務E110、E120、E150及E160。任務E150將經編碼音訊信號經由第一邏輯頻道發送至第一實體。任務E16〇向第一實體且經由不同於第一邏輯頻道之第二邏輯頻道發送 (A)音訊背景聲音選擇資訊及（B)識別第一實體之資訊。舉 ❿例而吕，可藉由如本文描述之裝置χΐ 〇〇或χ3〇〇之實施例執行方法Ε200。圖30Β展示根據所揭示組態之用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置ΕΜ2〇〇的方塊圖。裝置ΕΜ200包括用於執行方法Ε2〇〇之各種任務之構件。裝置 ΕΜ200包括如上文所描述之構件£]^10及ΕΜ20。裝置 ΕΜ200包括用於將編碼音訊信號經由第一邏輯頻道發送至第一實體之構件ΕΜ50 ^裝置ΕΜ200包括用於向第二實體且經由不同於第一邏輯頻道之第二邏輯頻道發送（Α)音訊 134862.doc -73- 200933608 背景聲音選擇資訊及（B)識別第一實體的資訊之構件 EM60。可使用能夠執行此等任務之任何結構實施裝置 EM200之各種元件，該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如，一或多個指令組、一或多個邏輯元件陣列等）❶裝置E M 2 〇〇之各種元件的實例在本文中揭示於裝置X100及X300之描述中。圖31A展示根據所揭示组態之處理經編碼音訊信號的方法F100之流程圖。方法F100包括任務Fu〇、F12〇及Fl3〇。 ©在行動使用者終端機内，任務F110解碼經編碼音訊信號以獲得經解碼音訊信號。在行動使用者終端機内，任務F12〇產生音訊背景聲音信號。在行動使用者終端機内，任務 F130混合基於音訊背景聲音信號之信號與基於經解碼音訊仏號之信號。舉例而言，可藉由如本文描述之裝置R1 〇〇、 R200或R300之實施例執行方法F1〇〇。圖3 1B展不根據所揭示組態之用於處理經編碼音訊信號 q 且位於行動使用者終端機内的裝置FM100之方塊圖。裝置 FM100包括用於執行方法pi 〇〇之各種任務之構件。裝置 FM 100包括用於解碼經編碼音訊信號以獲得經解碼音訊信號之構件FM10。裝置FM100包括用於產生音訊背景聲音信號之構件FM20。裝置FM100包括用於混合基於音訊背景聲音信號之信號與基於經解碼音訊信號之信號的構件 FM30。可使用能夠執行此等任務之任何結構實施裝置 FM100之各種元件，該等結構包括用於執行本文揭示之此等任務的結構中之任一者（例如，一或多個指令組、一或 134862.doc -74 - 200933608 多個邏輯元件陣列等）。裝置FM100之各種元件的實例在本文中揭示於裝置尺1〇〇、R2〇〇&R3〇〇之描述中。圖32A展示根據所揭示組態之處理包括話音分量及背景聲音分量的數位音訊信號之方法Gi 〇〇的流程圖。方法 G100包括任務〇110、〇12〇及〇130。任務G1〇〇自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務 G120產生基於第一遽波及第一複數個序列之音訊背景聲音信號’該第一複數個序列中之每一者具有不同時間解析 © 度。任務G120包括將第一濾波應用至第一複數個序列中之每一者。任務G130混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號。舉例而言’可藉由如本文描述之褒置 X100、X300、Rioo、R200或R300之實施例執行方法 G1 00 〇圖32B展示根據所揭示組態之用於處理包括話音分量及 ❹背景聲音分量的數位音訊信號之裝置GM100的方塊圖。裝置GM100包括用於執行方法G1〇〇之各種任務之構件。裝置 GM100包括用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件GM10。裝置〇皿1〇〇包括用於產生基於第一渡波及第一複數個序列之音訊背景聲音信號之構件GM20，該第一複數個序列中之每一者具有不同時間解析度。構件GM20包括用於將第一濾波應用至第一複數個序列中之每一者之構件。裝置GM丨〇〇包括用於混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受 134862.doc -75- 200933608 抑制信號之第二信號以獲得背景聲音增強信號之構件 GM30。可使用能夠執行此等任務之任何結構實施裝置 GM1 00之各種凡件，該等結構包括用於執行本文揭示之此等任務的結構中之任-者（例如，一或多個指令組、一或多個邏輯元件陣列等）。裝置_〇〇之各種元件的實例在本文t揭示於裝置X100、χ300、R1〇〇 '尺2〇〇及R3〇〇之描述中。圖33A展示根據所揭示組態之處理包括話音分量及背景 ©聲音分量的數位音訊信號之方法H100的流程圖。方法 H100 包括任務 H110、H120、H130、H140 及 H150。任務 H110自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務H120產生音訊背景聲音信號。任務H13〇混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號。任務H140計算基於數位音訊信號之第三信號之等級。任務 ❹ H120及H130中的至少一者包括基於第三信號之所計算等級控制第一信號之等級。舉例而言，可藉由如本文描述之裝置X100、X300、Rl〇〇、R200或R3 00的實施例執行方法 H100。圖33B展示根據所揭示組態之用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置HMloo的方塊圖。裝置HM100包括用於執行方法H100之各種任務之構件。裝置 HM100包括用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件HM10。裝置HM100包括用於 134862.doc • 76· 200933608 產生音訊背景聲音信號之構件別^加。裝置HM1〇()包括用於混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號的構件HM30。裝置HM1〇〇包括用於計算基於數位音訊信號之第一信號的等級之構件HM40。構件HM20及HM30中的至少一者包括用於基於第三信號之所計算等級控制第一信號的等級之構件。可使用能夠執行此等任務之任何結構實施裝置HM100之各種元件，該等結構包括用於執行本文揭 Ο示之此等任務的結構中之任一者（例如，一或多個指令組、一或多個邏輯元件陣列等）。裝置HM1〇〇之各種元件的實例在本文中揭示於裝置χι〇〇、χ3〇〇、r⑽、汉2〇〇及 R300之描述中。提供所描述組態之前文陳述以使得任何熟習&項技術者能夠製造或使用本文揭示之方法及其他結構。本文展示且描述之流程圖、方塊圖及其他結構僅為實例，且此等結構 ❹之其他變體亦在本揭示案之範嘴内。對此等組態之各種修改係可能的，且亦可將本文呈現之一般原理應用至其他組態。舉例而言，強調本揭示案之料*限於所說明之组態。相反’明確地預期且特此揭示，對於如本文描述之不同特定組態的特徵不彼此矛盾之任何情形而言’可組合此等特徵以產出包括於本揭示案之範嘴内的其他組態。舉例而言，可組合背景聲音抑制、背景聲音產生及背景聲音混 α之各種’、a L中之任者’只要此種組合不與本文中彼等元件之描述矛盾即可。亦明確地預期且特此揭示’在連接 134862.doc •77- 200933608 描述為在裝置之兩個或兩個以上元件之間的情況下，可能存在一或多個介入元件（諸如濾波器），且在連接描述為在方法之兩個或兩個以上任務之間的情況下，可能存在一或多個介入任務或操作（諸如濾波操作）。可與如本文描述之編碼器及解碼器一起使用，或經調適而與該等編碼器及解碼器一起使用的編解碼器之實例包括：如描述於上文提及之3GPP2文中之增強可變速率編解碼器（EVRC);如描述於ETSI文件TS 126 092 ® V6.0.0(第6章，2004年12月）中之調適性多重速率（AMR)話音編解碼器；及如描述於ETSI文件TS 126 192 V6 〇〇 (第6 章，2004年12月）中之AMR寬頻話音編解碼器。可與如本文描述之編瑪器及解碼器一起使用的無線電協定之實例包括臨時標準95 (IS-95)及CDMA2000(如由電信產業協會 ((TIA)，Arlington，VA)發布之規範中所描述）、AMR(如 ETSI文件丁S 26.101中所描述）、GSM(全球行動通信系統， ◎ 如ETSI發布之規範中所描述）、UMTS(全球行動電信系統，如ETSI發布之規範中所描述）及w-CDMA(寬頻分碼多重存取’如由國際電信聯盟公布之規範中所描述）。本文描述之組態可部分或整體地實施為硬連線電路、製造於特殊應用積體電路中之電路組態，或載入於非揮發性儲存器中之韌體程式或作為機器可讀程式碼自電腦可讀媒體載入或載入於電腦可讀媒體中之軟體程式，此種程式碼為可由諸如微處理器或其他數位信號處理單元之邏輯元件之陣列執行的指令。電腦可讀媒體可為諸如半導體記憶體 134862.doc • 78 · 200933608 =* 於)動態或靜態RAM(隨機存取記憶體)、或快閃_)或鐵電記憶體、磁電阻了皇雙向記憶體、聚合物記憶體或相變記憶體之儲存二件之陣列；諸如磁碟或光叙W媒體；或用於資料储 2任何其他電腦可讀㈣。術語"軟體"應理解為包括源程式碼、组合語言碼、機器碼、二元碼、勃體、宏代碼、微碼、可由邏輯元件之陣列執行的任何一或多組或序列之心令’及此等實例之任何組合。

士本文揭示之方法中的每一者亦可有形地實施為(舉例而 ::在上文列舉之一或多個電腦可讀媒體中)可由包括邏輯元件之陣列的機器(例如，處理器、微處理器、微控制器或其他有限狀態機）讀取及/或執行之一或多組指令。因此本揭示案不意欲限於上文展示的組態，而應符合與本文中以任何方式揭示之原理及新穎特徵（包括於形成原始揭示案之一部分的所申請之附加申請專利範圍中）一致的最廣泛範_。【圖式簡單說明】圖1A展示話音編碼器χ1〇之方塊圖。圖1Β展示話音編碼器Χ10之實施例χ2〇之方塊圖。圖2展示決策樹之一實例。圖3Α展示根據一般組態之裝置χι〇〇之方塊圖。圖3Β展示背景聲音處理器100之實施例102之方塊圖。圖3C-圖3F展示可攜式或免提式器件中兩個麥克風Κ10 及Κ20之各種安裝組態，且圖3g展示背景聲音處理器1〇2 134862.doc •79· 200933608 之實施例102 A之方塊圖。圖4A展示裝置χιοο之實施例乂1〇2之方塊圖。圖4B展示背景聲音處理器1〇4之實施例1〇6之方塊圖。圖5 A說明音訊信號與編碼器選擇操作之間的各種可能之相依性。圖5B說明音訊信號與編碼器選擇操作之間的各種可能之相依性。圖6展示裝置χιοο之實施例χ11〇之方塊圖。圖7展示裝置χιοο之實施例幻2〇之方塊圖。圖8展示裝置Χ100之實施例幻3〇之方塊圖。圖9Α展示背景聲音產生器120之實施例122之方塊圖。圖9Β展示背景聲音產生器122之實施例124之方塊圖。圖9C展示背景聲音產生器ι22之另一實施例ι26之方塊圖。圖9D展示用於產出所產生背景聲音信號S50之方法Ml 00 流程圖。圖10展示多重解析背景聲音合成之過程之圖。圖11A展示背景聲音處理器1〇2之實施例1〇8之方塊圖。圖11B展示背景聲音處理器ι〇2之實施例ι〇9之方塊圖。圖12A展示話音解碼器R1〇之方塊圖。圖12B展示話音解碼器R1〇之實施例R2〇之方塊圖。圖13A展示背景聲音混合器19〇之實施例ι92之方塊圖。圖13B展示根據一組態之裝置R1〇〇之方塊圖。圖14A展示背景聲音處理器2〇〇之實施例之方塊圖。 134862.doc •80· 200933608 圖14B展示裝置R100之實施例R110之方塊圖。圖15展示根據一組態之裝置R200之方塊圖。圖16展示裝置X100之實施例X200之方塊圖。圖17展示裝置X100之實施例X210之方塊圖。圖18展示裝置X100之實施例X220之方塊圖。圖19展示根據一所揭示組態之裝置X300之方塊圖。圖20展示裝置X300之實施例X310之方塊圖。圖21A展示自伺服器下載背景聲音資訊之實例。 Ο 圖2 1B展示將背景聲音資訊下載至解碼器之實例。圖22展示根據一所揭示組態之裝置R300之方塊圖。圖23展示裝置R300之實施例R3 10之方塊圖。圖24展示裝置R300之實施例R320之方塊圖。圖25A展示根據一所揭示組態之方法A100之流程圖。圖25B展示根據一所揭示組態之裝置AM100之方塊圖。圖26A展示根據一所揭示組態之方法B100之流程圖。圖26B展示根據一所揭示組態之裝置BM1 00之方塊圖。圖27A展示根據一所揭示組態之方法C100之流程圖。圖27B展示根據一所揭示組態之裝置CM100之方塊圖。圖28A展示根據一所揭示組態之方法D100之流程圖。圖28B展示根據一所揭示組態之裝置DM100之方塊圖。圖29A展示根據一所揭示組態之方法E100之流程圖。圖29B展示根據一所揭示組態之裝置EM100之方塊圖。圖30A展示根據一所揭示組態之方法E200之流程圖。圖30B展示根據一所揭示組態之裝置EM200之方塊圖。 134862.doc -81 - 200933608 圖展不根據一所揭示組態之方法fi〇〇之流程圖。圖31B展示根據一所揭不組態之裝置FM100之方塊圖圖32A展示根據一所才课所揭不組態之方法G100之流程圖。圖32B展示根據一所 _ 课所揭不組態之裝置GM100之方塊圖圖33A展示根據一一汀揭不組態之方法H100之流程圖。 ^33Β^㈣―所揭示組態之裝置麵〇()之方塊圖 =圓:，相同參考標號指代相同或類似元件。【主要兀件符號說明】 10

雜訊抑制器 ❹ 20223030a30b4050a 編碼方案選擇器編碼方案選擇器有作用訊框編碼器有作用訊框編碼器有作用訊框編碼器非有作用訊框編碼器選擇器 50b52a52b60627070a70b 選擇器選擇器選擇器鵠碼方案偵測器碥碼方案偵測器有作用訊框解碼器有作用訊框解瑪器有作用訊框解碼器 134862.doc -82- 200933608

80 非有作用訊框解碼器 90a 選擇器 90b 選擇器 92a 選擇器 92b 選擇器 100 背景聲音處理器 102 背景聲音處理器 102A 背景聲音處理器 104 背景聲音處理器 106 背景聲音處理器 108 背景聲音處理器 109 背景聲音處理器 110 背景聲音抑制器 110A 背景聲音抑制器 112 背景聲音抑制器 120 背景聲音產生器 122 背景聲音產生器 124 背景聲音產生器 126 背景聲音產生器 130 背景聲音資料庫 134 背景聲音資料庫 136 背景聲音資料庫 140 背景聲音產生引擎 144 背景聲音產生引擎 134862.doc -83 · 200933608 146 背景聲音產生引擎 150 背景聲音編碼器 152 背景聲音編碼器 190 背景聲音混合器 192 背景聲音混合器 195 增益控制信號計算器 197 增益控制信號計算器 200 背景聲音處理器 ❹ 210 背景聲音抑制器 212 背景聲音抑制器 218 背景聲音抑制器 220 背景聲音產生器 222 背景聲音產生器 228 背景聲音產生器 250 選擇器 ^ 252 背景聲音解碼器 290 背景聲音混合器 320 背景聲音分類器 330 背景聲音選擇器 340 處理控制信號產生器 AM10 用於基於第一麥克風產出之第一音訊信號自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之構件 134862.doc -84- 200933608 AM20 AM100 BM10 ❸ BM20 BM30 BM40 ❹ BM100 CM10 CM20 用於混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號之構件用於處理包括第一音訊背景聲音之數位音訊信號的裝置用於在處理控制信號具有第一狀態時以第一位70速率編碼缺少話音分量之數位音訊信號部分之訊框的構件用於在處理控制信號具有不同於第一狀態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件用於在處理控制信號具有第二狀態時混合音訊背景聲音信號與基於背景聲音受抑制信號之信號以獲得背景聲音增強信號之構件用於在處理控制信號具有第二狀態時以第二位元速率編碼缺少話音分量之背景聲音增強信號部分之訊框的構件用於根據處理控制信號的狀態處理數位音訊信號之裝置用於自數位音訊信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之構件用於混合第二音訊背景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音増強信號之構件 ^ 134862.doc -85 - 200933608 CM30 CM40 CM100 DM10 ❹ DM20 DM30 ❹ DM100 EM10 EM20 用於將基於（A)第二音訊背景聲音及（B)背景聲音增強信號中的至少一者之信號轉換為類比信號的構件用於自第二轉換器產出基於類比信號之聲訊信號之構件用於處理基於自第一轉換器接收的信號之數位音訊信號的裝置用於根據第一編碼方案解碼經編碼音訊信號之第一複數個經编碼訊框以獲得包括話音分量及背景聲音分量的第一經解碼音訊信號之構件用於根據第二編碼方案解碼經編碼音訊信號之第二複數個經编碼訊框以獲得第二經解碼音訊信號之構件用於基於來自第二經解碼音訊信號之資訊自基於第一經解碼音訊信號的第三信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件用於處理經編碼音訊信號的裝置用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件用於編碼基於背景聲音受抑制信號之信號以獲传經編碼音訊信號之構件 134862.doc • 86 - 200933608 EM30 EM40 EM50 EM60 EM100 EM200 FM10 FM20 ❾ FM30 FM100 GM10 GM20 用於選擇複數個音訊背景聲音中的一者之構件用於將關於所選音訊背景聲音之資訊插入於基於經編碼音訊信號的信號中之構件用於將經編碼音訊信號經由第一邏輯頻道發送至第一實體之構件用於向第二實體且經由不同於第一邏輯頻道之第二邏輯頻道發送（A)音訊背景聲音選擇資訊及（B)識別第一實體的資訊之構件用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置用於解碼經編碼音訊信號以獲得經解碼音訊信號之構件用於產生音訊背景聲音信號之構件用於混合基於音訊背景聲音信號之信號與基於經解碼音訊信號之信號的構件用於處理經編碼音訊信號且位於行動使用者終端機内的裝置用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件用於產生基於第一濾波及第一複數個序列之音訊背景聲音信號之構件 134862.doc -87- 200933608 GM30 用於混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號之構件 GM1 00 用於處理包括話音分量及背景聲音分量的數位音訊信號之裝置 HM10 用於自數位音訊信號抑制背景聲音分量以獲得背景聲音受抑制信號之構件 HM20 用於產生音訊背景聲音信號之構件

HM30 用於混合基於所產生音訊背景聲音信號之第一信號與基於背景聲音受抑制信號之第二信號以獲得背景聲音增強信號的構件 HM4° 用於計算基於數位音訊信號之第三信號的等級之構件 HM100 K10 K20 P10 P20 P30 P40 R10 R20 用於處理包括話音分量及背景聲音分量位音訊信號之襞置麥克風麥克風協定堆疊協定堆疊協定堆疊協定堆疊話音解碼器話音解碼器 I34862.doc -88· 200933608 R100 =組態以自經解碼音訊信號移除現存背景聲二：其取代為可能類似於或不同於現存背景聲音之所產生背景聲音之裝置 R110 f組態以自經料音訊信號移除現存背景聲可能類似於或不同於現存背景聲曰之所產生背景聲音之裝置 R200 經組態以在選擇背景聲音抑制用訊框解碼器之輸出之裝i *棄非有作 ❹ R300 碼器/包括經組態以根據背景聲音選產出所產生背景聲音信號的背景聲S產生器之例項的裝置 R310 碼器/包括經組態以根據背景聲音選之狀態產出所產生背景聲音信號的背景聲音產生器之例項的裝置 ❹ R320 話音解碼器/包括經組態以根據背 =號之狀態產出所產生背景聲音信號的背景耷音產生器之例項的裝置 S10 音訊信號 S12 雜訊受抑制音訊信號 S13 背景聲音受抑制音訊信號 S15 背景聲音增強音訊信號 S20 經編碼音訊信號 S20a 第一經編碼音訊信號 S20b 第二經編碼音訊信號 S30 處理控制信號 134862.doc -89 - 200933608 S40 背景聲音選擇信號 S50 所產生背景聲音信號 S70 背景聲音參數值 S80 經編碼背景聲音信號 S82 經編蝎背景聲音信號 S90 增益控制信號 S110 經解碼音訊信號 S113 背景聲音受抑制音訊信號 ❹ S115 背景聲音增強音訊信號 S130 處理控制信號 S140 背景聲音選擇信號 S150 所產生背景聲音信號 SA1 音訊信號 X10 話音編石馬器 Χ20 話音編瑪器 ❹ Χ100 自音訊信號移除現存背景聲音且將可能類似或不同於現存背景聲音之所產生者景聲音之裝置 - X102 自音訊信號移除現存背景聲音且將其取代為可能類似或不同於現存背所產生背景聲音之裝置 ’、9 X110 ί = 2音訊信號移除現存背景聲音且將所產生背景聲音之裝置曰之 134862.doc 200933608 ❹ X120 X130 X200 X210 X220 X300 X310 JL取ί以自音訊信號移除現存背景聲音且將 ’、代為可能類似或不同於現存背景聲音所產生背景聲音之裝置 2 以自音訊信號移除現存背景聲音且將八取代為可能類似或不同於現存背景聲音之所產生背景聲音之裝置經組態以自音訊信號移除現存背景聲音且將其取代為可能類似或不同於現存背景聲音之所產生背景聲音之裝置經組態以自音訊信號移除現存背景聲音且將其取代為可能類似或不同於現存背景聲音之所產生背景聲音之裝置經組態以自音訊信號移除現存背景聲音且將其取代為可能類似或不同於現存背景聲音之所產生背景聲音之裝置組態為在非有作用訊框期間不支援現存背景聲音之傳輸之裝置組態為在非有作用訊框期間不支援現存背景聲音之傳輸之裝置 134862.doc •91·

Claims

200933608 十、申請專利範圍： 1. 一種處理一數位音訊信號之方法，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，該方法包含：自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；編碼一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號； © 選擇複數個音訊背景聲音中之一者；及將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號之信號中。 2. 3.

5. 如請求項1之處理一數位音訊信號之方法，其中關於該所選音訊背景聲音之該資訊包括：一識別該所選音訊背景聲音之背景聲音識別符》如凊求項1之處理一數位音訊信號之方法，其中關於該所選音訊背景聲音之該資訊包含：包括一組參數值的該所選音訊背景聲音之一描述。 μ 如叫求項3之處理一數位音訊信號之方法，其中該組數值包货估第一複數個序列，該第一複數個序列中之每一者具有〜不同時間解析度。如請求1 + 之處理一數位音訊信狐，該背景聲立八“ ” W抑制操作。量包含對該數位音訊信號執行一頻譜相減 6.如請求力之處理-數位音訊信號之方法，“該抑制 134862.doc 200933608 該背景聲音分量包含：基於該數位音訊信號之複數個非有作用訊框計算複數個增益因數值；及將該複數個不同增益因數中之每一者應用至一基於該數位音訊信號的信號之-有作用訊框的—相應副頻帶。

如請求項1之處理一數位音訊信號之方法，其中該抑制該背景聲音分量係基於來自位於一共同外殼内之兩個不同麥克風之資訊。如凊求項1之處理一數位音訊信號之方法，其中該選擇複數個音訊背景聲音巾之—者係基於關於執行該方法所在的一實體位置之資訊。 9. 如請求項1之處理一數位音訊信號之方法，其中該編碼包括對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析。 10. 如明求項1之處理一數位音訊信號之方法，其中該經編 Q 碼音訊信號包含複數個經編碼訊框，每一經編碼訊框包括一激勵信號之一描述。 11. 如请求項1之處理一數位音訊信號之方法，其中該將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊k號的信號中包括：將該資訊插入於該經編碼音訊信號之對應於該數位音訊信號的非有作用訊框之複數個訊框週期中的至少一者中。 12. 如請求項11之處理一數位音訊信號之方法其中該將該資訊插入於該經編碼音訊信號之對應於該數位音訊信號 134862.doc 200933608 的非有作用訊框之複數個訊框週期中的至少一者中係以在自該數位音訊信號之一百至兩千個訊框的範圍中之一間隔不連續地執行。 13. 如請求項丨之處理一數位音訊信號之方法，其中關於該所選音訊背景聲音之該資訊包括：描述該音訊背景聲音之一等級隨時間推移之一所要改變的資訊。 14. 如請求項！之處理一數位音訊信號之方法，其進一步包含：自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號；混合一第二音訊背景聲音與一基於該背景聲音受抑制 k號之信號以獲得一背景聲音增強信號；將一基於（A)該第二音訊背景聲音及（B)該背景聲音增強信號中之至少一者的信號轉換為一類比信號；及使用一揚聲器產出一基於該類比信號之聲訊信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。 15. 如請求項14之處理一數位音訊信號之方法該方法包含對-基於該背景聲音增強信號之信號執行—線性預測編碼分析。 16·如請求項15之處理—數位音訊信號之方法，該方法包含使用-位於該共同外殼内之傳輸器，傳輸一基於該執行線性預測編碼分析之一結果之信號。 17.如請求項14之處理_數位音訊信號之方法，纟中該自該數位音訊信號抑制一第一音訊背景聲音係基於由一第二 134862.doc 200933608 麥克風產出之一音訊信號。 18. —種用於處理—數位音訊信號之裝置，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，該裝置包含：一背景聲音抑制器，其經組態以自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；一編碼器，其經組態以編碼一基於該背景聲音受抑制 k號之信號以獲得一經編碼音訊信號；一背景聲音選擇器，其經組態以選擇複數個音訊背景聲音中之一者；及一背景聲音編碼器，其經組態以將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號之信號中。 19. 如請求項18之用於處理一數位音訊信號之裝置，其中關於該所選音訊背景聲音之該資訊包括：一識別該所選音訊背景聲音之背景聲音識別符。 20. 如請求項18之用於處理一數位音訊信號之裝置，其中關於該所選音訊背景聲音之該資訊包含：包括一組參數值的該所選音訊背景聲音之一描述。 21_如請求項20之用於處理一數位音訊信號之裝置，其中該組參數值包括第一複數個序列，該第一複數個序列中之每一者具有一不同時間解析度。 22.如請求項18之用於處理一數位音訊信號之裝置，其中該背景聲音抑制器經組態以：對該數位音訊信號執行一頻 134862.doc -4 - 200933608 譜相減操作。 23.如请求項18之用於虎裡一、處一數位音訊信號之裝置，其中該方景聲音抑制器經組態以：之複數個非有作用訊框計算複數基於該數位音訊信號個增益因數值；及將該複數個不同増益因數中之每一者應用至—基於該數位S訊仏號的信號之一有作用訊框的一相應副頻帶。 24. 如4求項18之用於處理一數位音訊信號之裝置，其中該 ©背景聲音抑制器經組態以：基於來自位於一共同外殼内之兩個不同麥克風的資訊抑制該背景聲音分量。 25. 如明求項18之用於處理一數位音訊信號之裝置，其中該者景聲音選擇器經組態以：基於關於該裝置之一實體位置的資訊選擇複數個音訊背景聲音中之一者。 26. 如凊求項18之用於處理一數位音訊信號之裝置，其中該編碼器經組態以：對一基於該背景聲音受抑制信號之信 ❾ 號執行線性預測編碼分析。 27. 如請求項18之用於處理一數位音訊信號之裝置，其中該經編碼音訊信號包含複數個經編碼訊框，每一經編碼訊框包括一激勵信號之一描述。 28. 如請求項18之用於處理一數位音訊信號之裝置，其中該背景聲音編碼器經組態以：將該資訊插入於該經編碼音訊信號之對應於該數位音訊信號的非有作用訊框之複數個訊框週期中的至少一者中。 29. 如請求項28之用於處理一數位音訊信號之裝置’其中該 134862.doc 200933608 背景聲音編碼器經組態以：將該資訊以在自該數位音訊信號之一百至兩千個訊框的範圍中之一間隔不連續地插入於該經編碼音訊信號的對應於該數位音訊信號之非有作用訊框的複數個訊框週期中之至少一者中。 30_如請求項18之用於處理一數位音訊信號之裝置，其中關於該所選音訊背景聲音之該資訊包括：描述該音訊背景聲音之一等級隨時間推移之一所要改變之資訊。 31.如请求項18之用於處理一數位音訊信號之裝置，其進一 Φ 步包含：一背景聲音抑制器’其經組態以自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號；一背景聲音混合器，其經組態以混合一第二音訊背景聲音與一基於該背景聲音受抑制信號之信號以獲得一背景聲音增強信號；一轉換器’其經組態以將一基於（A)該第二音訊背景 Q 聲曰及（B)該背景聲音增強信號中的至少一者的信號轉換為一類比信號；及揚聲器’其經組態以產出一基於該類比信號之聲訊信號，八中u麥克風及該揚聲器兩者位於一共同外殼内。 32_如請求項31之用於處理—數位音訊信號之裝置，該裝置包a 對—基於該背景聲音增強信號之信號執行f線性預測編碼分析之編碼器。 32之用於處理—數位音訊信號之裝置，該裝置 134862.doc 200933608 包含一位於該共同外殼内且經组態以傳輸一基於該線性預測編碼分析之一結果之信號的傳輸器。 34. 如請求項31之用於處理一數位音訊信號之裝置，其中該背景聲音抑制器經組態以：基於由一第二麥克風產出之一音訊信號自該數位音訊信號抑制該第一音訊背景聲音。 35. —種用於處理一數位音訊信號之裝置，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，該裝置包含：用於自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號之構件；用於編碼一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號之構件；用於選擇複數個音訊背景聲音中之一者的構件；及用於將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號的信號中之構件。 36. 如請求項35之用於處理一數位音訊信號之裝置，其中關於該所選音訊背景聲音之該資訊包括：—識別該所選音訊背景聲音之背景聲音識別符。 3 7_如明求項35之用於處理一數位音訊信號之裝置，其中關於該所選曰訊者景聲音之該資訊包含：該所選音訊背景聲音之包括一組參數值之一描述。 38.如請求項37之料處理—數位音訊信號之裝置，其中該組參數值包括第—複數個序列，該第-複數個序列中之 134862.doc 200933608 每一者具有一不同時間解析度。 -如請求項35之用於處理—數位音訊用於抑制該背景聲音分量之播从 I置其中該 y 量之構件包含：用於對該數位音訊k諕執行一頻譜相減操作之構件。復如請求㈣之料處理—數位音訊信號用於抑制該背景聲音分量之構件包含：其“ 用於基於該數位音訊信號之複數個非有作用訊框計算複數個增益因數值之構件；及

益因數中之每一者應用至一基之一有作用訊框的一相應副頻用於將該複數個不同增於該數位音訊信號的信號帶之構件。 41.如請求項35之用於虛理於處理一數位音訊信號之裝置，其中該用於抑制該背景聲音分量之構件經組態以：基於來自位於-共同外殼内之兩個不同麥克風之資訊抑制該背景聲音分量。 42. 如請求項35之用於處理一數位音訊信號之裝置，其中該用於選擇複數個音訊背景聲音中之一者之構件經組態以：基於關於該裝置之一實體位置的資訊選擇該音訊背景聲音。 43. 如請求項35之用於處理一數位音訊信號之裝置，其中該用於編碼之構件包括··用於對一基於該背景聲音受抑制 fg號的信號執行線性預測編碼分析之構件。 44·如請求項35之用於處理一數位音訊信號之裝置，其中該經編碼音訊信號包含複數個經編碼訊框，每一經編瑪訊 134862.doc -8 - 200933608 框包括一激勵信號之一描述。 45. 如明求項35之用於處理一數位音訊信號之裝置，其中該用於將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號的信號中之構件包括：用於將該資訊插入於該經編碼音訊信號中的對應於該數位音訊信號之非有作用訊框的複數個訊框週期中之至少一者中的構件。 46. 如請求項45之用於處理一數位音訊信號之裝置，其中該用於將該資訊插入於該經編碼音訊信號之對應於該數位 © 音訊信號的非有作用訊框之複數個訊框週期中的至少一者中之構件經組態而以在自該數位音訊信號的一百至兩千個訊框之範圍中的一間隔不連續地執行此插入。 47·如請求項35之用於處理一數位音訊信號之裝置，其中關於該所選音訊背景聲音之該資訊包括：描述該音訊背景聲音之一等級隨時間推移之一所要改變的資訊。 48·如請求項35之用於處理一數位音訊信號之裝置，其進一步包含： 0 用於自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號之構件；用於混合一第二音訊背景聲音與一基於該背景聲音受抑制k號之信號以獲得一背景聲音增強信號之構件；用於將一基於（A)該第二音訊背景聲音及（B)該背景聲音增強信號中的至少一者之信號轉換為一類比信號之構件；及一揚聲器’其經組態以產出一基於該類比信號之聲訊 134862.doc 200933608 49. 50. ©51. 52. Ο 53. 信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。如研求項48之用於處理一數位音訊信號之裝置，該裝置包含用於對一基於該背景聲音增強信號之信號執行一線性預測編碼分析之構件。如印求項49之用於處理一數位音訊信號之裝置，該裝置包含位於該共同外殼内且經組態以傳輸一基於該線性預測編碼分析之一結果的信號之傳輸構件。如請求項48之用於處理一數位音訊信號之裝置，其中該用於抑制之構件經組態以：基於由一第二麥克風產出之一音§fl信號自該數位音訊信號抑制該第一音訊背景聲音。 ' 一種電腦可讀媒體，其包含用於處理一數位音訊信號之指令，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，當該等指令由一處理器執行時使得該處理器：自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；編碼一基於該背景聲音受抑制信號之信號以獲得一經編瑪音訊信號；選擇複數個音訊背景聲音中之一者；及將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號之信號。如請求項52之電腦可讀媒體，其中關於該所選音訊背景 134862.doc -10· 200933608 聲音之該資訊包括：一識別該所選音訊背景聲音之背景聲音識別符。 ' 54 55. ❹56. 57. ❹ 58. 59. 如請求項52之電腦可讀媒體，其中關於該所選音訊背景聲音之該資訊包含：該所選音訊背景聲音的包括一組參數值之一描述。如請求項54之電腦可讀媒體，其中該組參數值包括第一複數個序列，該第-複數個序列中之每—者具有一不同時間解析度。如請求項52之電腦可讀媒體，其中當由一處理器執行時使得該處S器抑制該背景聲音分量之該等指令經組熊以：使得該處刻對該數位音訊信號執行—頻譜相減^ 竹〇 ' 如請求項52之電腦可讀媒體，其中當由一處理器執行時使得該處理器抑制該背景聲音分量之該等指令經組態以使得該處理器：基於該數位音訊信號之複數個非有作用訊框計算複數個增益因數值；及將該複數個不同增益因數中之每一者應用至一基於該數位音訊信號的錢之—有作用訊框的-相應副頻帶/ 如請求項52之電腦可讀媒體，其中當由—處理器使得該處理器抑制該背景聲音分量之該等指令經組態二付該：理器基於來自位於一共同外殼内的兩個不同麥克風之資訊抑制該背景聲音分量。如請求項52之電腦可讀媒體，其中當由-處理器執行時 134862.doc 200933608 使得該處理器選擇複數個音訊背景聲音中之一者之該等指令經組態以：使得該處理器基於關於該處理器之一實體位置的資訊選擇該音訊背景聲音。 60·如請求項52之電腦可讀媒體，其中當由一處理器執行時使得該處理器進行編碼之該等指令經組態以：使得該處理器對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析。 61. 如請求項52之電腦可讀媒體，其中該經編碼音訊信號包 ® 含複數個經編碼訊框，每一經編碼訊框包括一激勵信號之一描述。 62. 如請求項52之電腦可讀媒體，其中當由一處理器執行時使得該處理器將關於該所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號的信號中之該等指令經組態以··使得該處理器將該資訊插入於該經編碼音訊信號的對應於該數位音訊信號的非有作用訊框之複數個訊框週 P 期中之至少一者中。 63. 如請求項62之電腦可讀媒體，其中當由一處理器執行時使得該處理器將該資訊插入於該經編碼音訊信號之對應於該數位音訊信號之非有作用訊框的複數個訊框週期中的至少一者中之該等指令經組態以.：使得該處理器以在自該數位音訊信號之一百至兩千個訊框的範圍中之一間隔不連續地執行此插入。 64. 如請求項52之電腦可讀媒體，其中關於該所選音訊背景聲音之該資訊包括：描述該音訊背景聲音之一等級隨時 134862.doc -12- 200933608 間推移之一所要改變之資訊。 65. 如請求項52之電腦可讀媒體，其中當該等指令由一處理器執行時使得該處理器：自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號；混合一第二音訊背景聲音與一基於該背景聲音受抑制信號之信號以獲得一背景聲音增強信號；將一基於（A)該第二音訊背景聲音及（B)該背景聲音增 © 強信號中的至少一者之信號轉換為一類比信號；及使用一揚聲器來產出一基於該類比信號之聲訊信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。 66. 如請求項65之電腦可讀媒體，該媒體包含當由一處理器執行時使得該處理器對一基於該背景聲音增強信號之信號執行一線性預測編碼分析之指令。 67. 如請求項66之電腦可讀媒體，該媒體包含當由一處理器 ❹ 執行時使得該處理器使用一位於該共同外殼内之傳輸器來傳輸一基於該線性預測編碼分析的一結果之信號的指令0 68. 如請求項65之電腦可讀媒體，其中當由一處理器執行時使得該處理器抑制該第一音訊背景聲音之該等指令經組態以：使得該處理器基於由一第二麥克風產出的一音訊信號自該數位音訊信號抑制該第—音訊背景聲音。 69. 種處理一數位音訊信號之方法，該數位音訊信號係基於自一麥克風接收之信號，該數位音訊信號包括一話 134862.doc •13· 200933608 音分量及一背景聲音分量’該方法包含：自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；編碼一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號；經由一第一邏輯頻道’將該經編碼音訊信號發送至一第一實體；及 ❹ 70. 71. Ο 72. 73. 74. 經由不同於該第一邏輯頻道之一第二邏輯頻道，向一第二實體發送（Α)音訊背景聲音選擇資訊及（β)識別該第一實體之資訊。如請求項69之處理一數位音訊信號之方法，其中該向一第二實體發送包括在符合會話起始協定之一版本的一訊 «ί»中向該第一實體發送（Α)該音訊背景聲音選擇資訊及 (Β)識別該第一實體之該資訊中的至少—者。如請求項69之處理一數位音訊信號之方法，其中識別該第一實體之該資訊係一統一資源識別符。，請求項69之處理一數位音訊信號之方法，其中該音訊背景聲音選擇資訊包括：關於一執行該方法所在之實體位置之資訊。 Ζ求項69之處理—數位音訊信號之方法，其中該方法匕含選擇複數個音訊背景聲音中之一者，且背景簦：^訊背景聲音選擇資訊包括—識別該所選音訊 *景聲音之背景聲音識別符。如-求項73之處理_數位音訊信號之方法，其中該選擇 134862.doc •14· 200933608 複數個音訊背景聲音中之—者係基於關於一執行該方法所在之實體位置之資訊。 75_如請求項69之處理一數位音訊信號之方法，其中該抑制該背景聲音分量包含：對一基於該數位音訊信號之信號執行一頻譜相減操作。 76·如請求項69之處理一數位音訊信號之方法，其中該抑制該背景聲音分量包含：基於該數位音訊信號之複數個非有作用訊框計算〇個增益因數值；及將該複數個不同增益因數中之每一者應用至—基於該數位音訊信號的信號之一有作用訊框的一相應副頻帶。 77. 如請求項69之處理一數位音訊信號之方法，其中該抑制該背景聲音分量係基於來自位於一共同外殼内之兩個不同麥克風之資訊。 78. 如請求項69之處理一數位音訊信號之方法，其中該編碼 ❹ 包括對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析。 79. 如請求項69之處理一數位音訊信號之方法，其中該經編碼音訊信號包含複數個經編碼訊框’每一經編碼訊框包括一激勵信號之一描述。 80. 如請求項69之處理一數位音訊信號之方法，其進一步包含：自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號； 134862.doc -15· 200933608 混合一第二音訊背景聲音與一基於該背景聲音受抑制信號之信號以獲得一背景聲音增強信號； 81. Ο 82. 83. 84. Ο 將一基於（Α)該第二音訊背景聲音及（Β)該背景聲音增強信號中的至少—者之信號轉換為一類比信號；及使用一揚聲器來產出一基於該類比信號之聲訊信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。如请求項80之處理一數位音訊信號之方法，該方法包含對一基於該背景聲音增強信號之信號執行一線性預測編碼分析。如請求項81之處理一數位音訊信號之方法，該方法包含使用一位於該共同外殼内之傳輸器傳輸一基於該執行一線性預測編碼分析之一結果的信號。如請求項80之處理一數位音訊信號之方法，其中該自該數位音訊信號抑制一第一音訊背景聲音係基於由一第二麥克風產出之一音訊信號。一種用於處理一數位音訊信號之裝置，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，該裝置包含：一背景聲音抑制器’其經組態以自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；一編碼器’其經組態以編碼一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號；一背景聲音編碼器’其經組態以將關於所選音訊背景聲音之資訊插入於一基於該經編碼音訊信號之信號中； 134862.doc •16- 200933608 一第一協定堆疊’其經組態以經由一第一邏輯頻道將該經編碼音訊信號發送至一第一實體；及不同於該第一協定堆疊之一第二協定堆疊，其經組態以經由不同於該第一邏輯頻道之一第二邏輯頻道向一第二實體發送（A)音訊背景聲音選擇資訊及識別該第一實體之資訊。 85. 如請求項84之用於處理一數位音訊信號之裝置，其中該第二協定堆疊經組態以：在符合會話起始協定之一版本 © 的一訊息中向該第二實體發送該音訊背景聲音選擇資訊及（B)識別該第一實體之該資訊中的至少一者。 86. 如請求項84之用於處理一數位音訊信號之裝置，其中識別該第一實體之該資訊係一統一資源識別符。 87. 如請求項84之用於處理一數位音訊信號之裝置，其中該 s訊背景聲音選擇資訊包括：關於該裝置之一實體位置之資訊。 ❹88.如請求項84之用於處理一數位音訊信號之裝置，其中該裝置包含一經組態以選擇複數個音訊背景聲音中之一者之背景聲音選擇器，且其中該音訊背景聲音選擇資訊包括一識別該所選音訊背景聲音之背景聲音識別符。 89. 如請求項88之用於處理一數位音訊信號之裝置，其中該背景聲音選擇器經組態以基於關於該裝置之一實體位置之資訊選擇複數個音訊背景聲音中之一者。 90. 如請求項84之用於處理一數位音訊信號之裝置，其中該 134862.doc •17- 200933608 彦景聲音抑制器經組態以對一基於該數位音訊信號之信號執行一頻譜相減操作。 91. ©92. 93. 94. ❹ 95. 如清求項84之用於處理一數位音訊信號之裝置，其中該背景聲音抑制器經組態以：基於該數位音訊信號之複數個非有作用訊框計算複數個增益因數值；及將該複數個不同增益因數中之每一者應用至一基於該數位g訊信號的信號之一有作用訊框的一相應副頻帶。如明求項84之用於處理一數位音訊信號之裝置，其中該貪景聲a抑制器、經、组態以基於來自位於一共同外殼内之兩個不同麥克風的資訊抑制該背景聲音分量。如請求項84之用於處理一數位音訊信號之裝置’其中該編碼器經組態以對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析。如請求項84之用於處理一數位音訊信號之裝置，其中該、差編碼日訊k號包含複數個經編碼訊框，每—經編碼訊框包括一激勵信號之一描述。如明求項84之用於處理一數位音訊信號之裝置，其進一步包含：月景聲g抑制器’其經組態以自該數位音訊信號抑制第曰訊者景聲音以獲得一背景聲音受抑制信號； #景聲S混合器，其經組態以混合一第二音訊背景聲曰與基於該背景聲音受抑制信號之信號以獲得一背景聲音增強信號； 134862.doc -18- 200933608 一轉換器，其經組態以將一基於（A)該第二音訊背景聲音及（B)該背景聲音增強信號中的至少一者之信號轉換為一類比信號；及一揚聲器，其經組態以產出一基於該類比信號之聲訊信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。 96. e 97. 98. 〇 99. 如请求項95之用於處理一數位音訊信號之裝置，該裝置包含一編碼器’該編碼器經組態以對一基於該背景聲音增強信號之信號執行一線性預測編碼分析。如請求項96之用於處理一數位音訊信號之裝置，該裝置包含一傳輸器’該傳輸器位於該共同外殼内且經組態以傳輸一基於該線性預測編碼分析之一結果的信號。如請求項95之用於處理一數位音訊信號之裝置，其中該背景聲音抑制器經組態以：基於由一第二麥克風產出之一音訊信號自該數位音訊信號抑制該第一音訊背景聲音。一種用於處理一數位音訊信號之裝置，該數位音訊信號係基於一自一麥克風接收之信號，該數位音訊信號包括一話音分量及一背景聲音分量，該裝置包含：用於自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號之構件；用於編碼一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號之構件；用於經由一第一邏輯頻道向一第一實體發送該經編碼 134862.doc -19- 200933608 音訊信號之構件；及用於經由不同於該第—邏輯頻道之_第二邏輯頻道向 -第二實體發送（A)音訊f景聲音選擇資訊及（B)識別該第一實體之資訊之構件。 ·如請求項99之用於處理—數位音訊信號之裝置，其中該用於向第-實體進行發送之構件包括：用於在符合會話起始協定t 本之一訊息中向該第二實體發送⑷該音訊背景聲音選擇資訊及⑻識別該第一實體的該資訊中〇的至少一者之構件。 1〇1·如請求項99之用於處理一數位音訊信號之裝置，其中識別該第-實體之該資訊係一統一資源識別符。 102.如請求項99之用於處理一數位音訊信號之裝置，其中該音訊背景聲音選擇資訊包括：關於該裝置之一實體位置之資訊。胤如請求項99之用於處理一數位音訊信號之裝置，其中該裝置包含用於選擇複數個音訊背景聲音中之—者之構件，且其中該音訊背景聲音選擇資訊包括一識別該所選音訊背景聲音之背景聲音識別符。 104.如請求項103之用於處理一數位音訊信號之裝置，其中該用於選擇之構件經組態以基於關於該裝置的—實體位置之資訊選擇複數個音訊背景聲音中之一者。 105·如叫求項99之用於處理一數位音訊信號之裝置，其中該用於抑制該背景聲音分量之構件包含：用於對—基於該 134862.doc 200933608 數位音訊信號的信號執行一頻譜相減操作之構件。狐如請求項99之用於處理—數位音訊信號之裝置，主中該用於抑制該背景聲音分量之構件包含：用於基於該數位音訊信號之複數個非有作用訊框計算複數個増益因數值之構件；及用於將該複數個不同增益因數中之每一者應用至—基於該數位音訊信號的信號之—有作用訊框的—相應副頻帶之構件。 ® 107.如請求項99之用於處理一數位音訊信號之裝置，其中該用於抑制該背景聲音分量之構件經組態以：基於來自位於一共同外殼内的兩個不同麥克風之資訊抑制該背景聲音分量。 108·如請求項99之用於處理一數位音訊信號之裝置，其中該用於編碼之構件包括：用於對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析之構件。 109.如請求項99之用於處理一數位音訊信號之裝置，其中該經編瑪音訊信號包含複數個經編碼訊框，每一經編碼訊框包括一激勵信號之一描述。 110·如請求項99之用於處理一數位音訊信號之裝置，其進— 步包含：用於自該數位音訊信號抑制一第一音訊背景聲音以獲得一背景聲音受抑制信號之構件；用於混合一第二音訊背景聲音與一基於該背景聲音受抑制信號之信號以獲得一背景聲音增強信號之構件； 134862.doc -21- 200933608 用於將一基於（A)該第二音訊背景聲音及（B)該背景聲音增強錢中的至少一者之信號轉換為—類比信號之構件；及一揚聲器，其經組態以產出一基於該類比信號之聲訊信號，其中該麥克風及該揚聲器兩者位於一共同外殼内。 111. 如請求項110之用於處理一數位音訊信號之裝置，該裝置包含用於對一基於該背景聲音增強信號之信號執行一〇線性預測編碼分析之構件。 112. 如請求項U1之用於處理一數位音訊信號之裝置，該裝置包含用於傳輸之構件，該用於傳輸之構件位於該共同外殼内且經組態以傳輸一基於該線性預測編碼分析之一結果的信號。 113. 如請求項110之用於處理一數位音訊信號之裝置，其中該用於抑制之構件經組態以··基於由一第二麥克風產出 q =一音訊信號自該數位音訊信號抑制該第一音訊背景聲 114. 一種包含用於處理一包括一話音分量及一背景聲音分量之數位音訊信號的指令之電腦可讀媒體，該等指令當由一處理器執行時使得該處理器：自該數位音訊信號抑制該背景聲音分量以獲得一背景聲音受抑制信號；編竭一基於該背景聲音受抑制信號之信號以獲得一經編碼音訊信號； 134862.doc -22- 200933608 邏輯頻道向一第规田實體發送該經編媽音訊信號；及二同於該第—邏輯頻道之-第二邏輯頻道向-第一實體發送（A)音訊背景聲實體之資訊。 θ選擇貝訊及(B)識別該第一 115.如請求項114之電腦可靖拔時使得該處理器H 理器執行填以n/ 實體進行發送之料指令經組 ❹ ❹ 使Μ處理器在符合會話起㈣定之-版本的一訊息中向該第二實體發送貝趙發送（Α)該音訊背景聲音選擇 (B)識別該第一實體之該資訊中的至少一者。 116·如請求項m之電腦可讀媒體，其中識別該第該資訊係一統一資源識別符。 U7·如請求項114之電腦可讀媒體，其中該音訊背擇資訊包括：關於該處理器之-實體位置之資訊曰 ⑽·如請求項m之電腦可讀媒體，其中該媒體包含去由一處理器執行時使得該處理器選擇複數個音訊: 之一者之指令，且、π曰T 其士中該音訊背景聲音選擇資訊包括一識別該所選音訊背景聲音之背景聲音識別符。 11 119. 如請求項118之電腦可讀媒體，盆 /、丁田田一處理時使得該處理器選擇複數個音訊背景聲音中之—者之該專指令經組態以：使得該處理器基於關於該處理器之一實體位置的資訊選擇複數個音訊背景聲音中之 120. 如請求項114之電腦可讀媒體，其中者丹甲*由一處理器執行 134862.doc -23· 200933608 乂得：處理器抑制該背景聲音分量之該等指令經組態 V該處理器對—基於該數位音訊信號之信號執行一頻譜相減操作。 ⑵.如請，項114之電腦可讀媒體，其中當由一處理器執行夺使%•該處理器抑制該背景聲音分量之該等指令經組態以使得該處理器：基於該數位音訊信號之複數個非有作用訊框計算複數個增益因數值；及將該複數個不同增益因數中之每一者應用至一基於該數位音訊信號之信號之一有作用訊框之一相應副頻帶。 122. 如請求項114之電腦可讀媒體其中當由一處理器執行時使得該處理器抑制該背景聲音分量之該等指令經組態以’使得該處理器基於來自位於一共同外殼内的兩個不同麥克風之資訊抑制該背景聲音分量。 123. 如請求項114之電腦可讀媒體，其中當由一處理器執行時使得該處理器進行編碼之該等指令經組態以：使得該處理器對一基於該背景聲音受抑制信號之信號執行線性預測編碼分析。 124. 如請求項114之電腦可讀媒體，其中該經編碼音訊信號包含複數個經編碼訊框，每一經編碼訊框包括一激勵信號之一描述。 125. 如請求項114之電腦可讀媒體，其中當該等指令由一處理器執行時使得該處理器：自該數位音訊信號抑制一第一音訊背景聲音以獲得一 134862.doc • 24· 200933608 背景聲音受抑制信號；混合一第二音訊背景聲音與一基於該背景聲音受抑制信號之仏號以獲得一背景聲音增強信號；將一基於（A)該第二音訊背景聲音及（B)該背景聲音增強信號中的至少一者之信號轉換為一類比信號；及使用一揚聲器來產出一基於該類比信號之聲訊信號，中該麥克風及該揚聲器兩者位於一共同外殼内。 126. 如請求項125之電腦可讀媒體，該媒體包含當由一處理 ® 器執行時使得該處理器對一基於該背景聲音增強信號之信號執行一線性預測編碼分析之指令。 127. 如請求項126之電腦可讀媒體，該媒體包含當由一處癦器執行時使得該處理器使用一位於該共同外殼内之傳輸器來傳輸一基於該線性預測編碼分析的—結果之信號的指令。 128. ❿ 如請求項125之電腦可讀媒體’其中當由—處理器執行時使得該處理器抑制該第一音訊背景聲音之該等指令鎳組態以：使得該處理器基於由一第二麥克風產出之〆音訊信號自該數位音訊信號抑制該第一音訊背景聲音。 134862.doc 25·