TW200933610A - Systems, methods, and apparatus for context processing using multi resolution analysis - Google Patents

Systems, methods, and apparatus for context processing using multi resolution analysis Download PDF

Info

Publication number
TW200933610A
TW200933610A TW097137540A TW97137540A TW200933610A TW 200933610 A TW200933610 A TW 200933610A TW 097137540 A TW097137540 A TW 097137540A TW 97137540 A TW97137540 A TW 97137540A TW 200933610 A TW200933610 A TW 200933610A
Authority
TW
Taiwan
Prior art keywords
background sound
signal
sequences
audio
audio signal
Prior art date
Application number
TW097137540A
Other languages
English (en)
Inventor
Nagendra Nagaraja
Khaled Helmi El-Maleh
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200933610A publication Critical patent/TW200933610A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

200933610 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於話音信號之處理。 本專利申請案主張2〇〇8年1月28曰申請且讓與給其受讓 人的標題為"SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING"之臨時申請案第61/024,104號之優 先權。 本專利申請案係關於以下同在申請中之美國專利申請 〇 案: "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT PROCESSING USING MULTIPLE MICROPHONES",其代理人案 號為071104U1,與本申請案同時申請,讓與給其受讓人; "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT SUPRESSION USING RECEIVERS",其代理人案號為071104U2, 與本申請案同時申請,讓與給其受讓人; "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT G DESCRIPTOR TRANSMISSION",其代理人案號為 071104U3, 與本申請案同時申請,讓與給其受讓人;及 "SYSTEMS, METHODS, AND APPARATUS FOR CONTEXT REPLACEMENT BY AUDIO LEVEL”,其代理人案號為 071104U5, 與本申請案同時申請,讓與給其受讓人。 【先前技術】 用於語音信號之通信及/或儲存的應用通常使用麥克風 來捕獲包括主揚聲器語音之聲音的音訊信號。音訊信號之 134863.doc 200933610 表示θ之部分稱為話音或話音分量。所捕獲之音訊信號 常常亦包括來自麥克風的周圍聲學環境之諸如背景聲音的 其他聲音。音訊信號之此部分稱為背景聲音或背景聲音分 量。 諸如話音及音樂之音訊資訊藉由數位技術之傳輸已變得 廣泛,特別在長途電話、諸如網路電話(亦稱為ν〇Ιρ,其 中ip指示網際網路協定)之封包交換電話,及諸如蜂巢式 電話之數位無線電電話中。此種增長已造成減少用以經由 傳輸頻道傳送語音通信之資訊的量且同時維持重建的話音 之所感知品質的興趣。舉例而言,需要最佳地利用可用無 線系統頻寬。彳錢用系統頻寬之一方法為使用信號壓縮 技術對於載運話音信號之無線系統而言,出於此目的通 吊使用話音壓縮(或”話音編碼”)技術。 經組態以藉由提取關於人話音生成之模型的參數而壓縮 話s之器件常常稱為語音編碼器、編解碼器、聲碼器、龙 φ ''音訊編碼器"或"話音編碼器",且以下描述可互換地使用 此等術浯《話音編碼器通常包括話音編碼器及話音解碼 器。編碼器通常作為一系列稱為"訊框,,之樣本區段接收數 位音訊信號,分析每一訊框以提取某些相關參數,且將參 數量化為經編碼訊框。經編碼訊框經由傳輸頻道(亦即, 有線或無線網路連接)傳輸至包括解碼器之接收器。或 者,經編碼音訊信號可經儲存以供在以後時間進行擷取及 解碼解碼器接收且處理經編碼訊框、對其進行反量化以 產生參數,且使用反量化參數重建話音訊框。 134863.doc 200933610 在-典型通話中’每一揚聲器靜寂約百分之六十之時 間。話音編碼器常常經組態以辨別含有話音之音訊信號之 訊框活動訊框”)與僅含有背景聲音或靜寂之音訊信號之 訊框("不活動訊框")。該編碼器可經組態以使用不同編碼 模式及/或速率來編碼活動與不活動訊框。舉例而言,不 活動訊框通常感知為載運極少或不載運資訊,且話音編碼 器常常經組態以使用比編碼活動訊框少之位元(亦即,較 低位元速率)來編碼不活動訊框。 © 用以編碼活動訊框之位元速率之實例包括每訊框171個 位兀、每訊框80個位元及每訊框4〇個位元。用以編碼不活 動訊框之位元速率之實例包括每訊框16個位元。在蜂巢式 電話系統(尤其依照如由電信工業協會(ArHngt〇n,VA)發布 之臨時標準(IS)_95(或類似工業標準)之系統)之背景聲音 中,此等四個位元速率亦分別稱為"全速率"、"半速率"、 "四分之一速率”及"八分之一速率"。 【發明内容】 ❿ 此文件描述處理包括第一音訊背景聲音之數位音訊信號 之方法。此方法包括自該數位音訊信號抑制第一音訊背景 聲音,基於由第一麥克風產生之第一音訊信號來獲得背景 聲音受抑制信號。此方法亦包括混合第二音訊背景聲音與 基於背景聲音受抑制信號之信號以獲得背景聲音增強信 號。在此方法中,數位音訊信號係基於由不同於第一麥克 風之第二麥克風產生之第二音訊信號。此文件亦描述關於 此方法之裝置、構件之組合及電腦可讀媒體。 134863.doc 200933610 此文件亦描述處理基於自第一轉換器接收之信號的數位 音訊信號之方法。此方法包括自數位音訊信號抑制第一音 訊背景聲音以獲得背景聲音受抑制信號;混合第二音訊背 景聲音與基於背景聲音受抑制信號之信號以獲得背景聲音 增強信號;將基於(A)第二音訊背景聲音及(B)背景聲音增 強信號中之至少一者的信號轉換為類比信號;及使用第二 轉換器來產生基於類比信號之可聞信號。在此方法中,第 一及第二轉換器兩者位於一共同外殼内。此文件亦描述關 〇 於此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理經編碼音訊信號之方法《此方法包 括:根據一第一編碼方案解碼經編碼音訊信號之第一複數 個經編碼訊框以獲得包括話音分量及背景聲音分量之第一 經解碼音訊信號;根據第二編碼方案解碼經編碼音訊信號 之第二複數個經編碼訊框以獲得第二經解碼音訊信號; 及’基於來自第二經解碼音訊信號之資訊,自基於第一經 ©解碼音訊信號之第三信號抑制背景聲音分量以獲得一背景 聲音受抑制信號。此文件亦描述關於此方法之裝置、構件 之組合及電腦可讀媒體。 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊信號之方法。此方法包括:自數位音訊信號抑制背景 聲音分量以獲得背景聲音受抑制信號;編碼基於背景聲音 受抑制信號之信號以獲得經編碼音訊信號;選擇複數個音 訊背景聲音中之一者;及將關於所選音訊背景聲音之資訊 插入於基於經編碼音訊信號之信號中。此文件亦描述關於 134863.doc 200933610 此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊信號之方法。此方法包括自數位音訊信號抑制背景聲 音分量以獲得背景聲音受抑制信號;編碼基於背景聲音受 抑制信號之信號以獲得經編碼音訊信號;經由第一邏輯頻 道,將經編碼音訊信號發送至第一實體;及,經由不同於 第一邏輯頻道之第二邏輯頻道,向第二實體發送(A)音訊 背景聲音選擇資訊及識別第一實體之資訊。此文件亦 © 描述關於此方法之裝置、構件之組合及電腦可讀媒體。 此文件亦描述處理經編碼音訊信號之方法。此方法包 括’在行動使用者終端機内,解碼經編碼音訊信號以獲得 經解碼音訊化號,在行動使用者終端機内,生成一音訊背 景聲音信號·’及,在行動使用者終端機内,混合基於音訊 背景聲音信號之信號與基於經解碼音訊信號之信號。此文 件亦描述關於此方法之裝置、構件之組合及電腦可讀媒 體0 ❹ 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊k號之方法。此方法包括:自數位音訊信號抑制背景 聲音分量以獲得背景聲音受抑制信號;生成基於第一渡波 及第-複數個序列之音訊背景聲音信號,該第一複數個序 列中之每一者具有不同之時間解析度;及混合基於所生成 音訊背景聲音信號之第一信號與基於背景聲音受抑制信號 之第二信號以獲得背景聲音增強信號。在此方法中,生成 音訊背景聲音信號包括將第一遽波應用至第一複數個序列 134863.doc 200933610 中之每一者。此文件亦描述關於此方法 取且稱件之組 合及電腦可讀媒體。 此文件亦描述處理包括話音分量及背景聲音分量之數位 音訊信號之方法。此方法包括:自數位音訊信號抑制背旦 聲音分量以獲得背景聲音受抑制信號;生成音訊背景聲= 信號;混合基於所生成音訊背景聲音信號之第一信號與: 基於背景聲音受抑制信號之第二信號以獲得背景聲音增強 信號;及計算基於數位音訊信號之第三信號之等級❶在此 © 方法中,生成及混合中的至少一者包括基於第三信號之所 計算等級控制第一信號之等級。此文件亦描述關於此方法 之裝置、構件之組合及電腦可讀媒體。 此文件亦描述根據處理控制信號之狀態來處理數位音訊 信號之方法,其中數位音訊信號具有話音分量及背景聲音 分量。此方法包括在處理控制信號具有第一狀態時以第一 位元速率編碼缺少話音分量之數位音訊信號部分之訊框。 _ 此方法包括在處理控制信號具有不同於第一狀態之第二狀 態時自數位音訊信號抑制背景聲音分量以獲得背景聲音受 抑制信號。此方法包括在處理控制信號具有第二狀態時混 合音訊背景聲音信號與基於背景聲音受抑制信號之信號以 獲得背景聲音增強信號。此方法包括在處理控制信號具有 第二狀態時以第二位元速率編碼缺少話音分量之背景聲音 增強信號部分之訊框,其中第二位元速率高於第一位元速 率。此文件亦描述關於此方法之裝置、構件之組合及電腦 可讀媒體。 134863.doc 200933610 【實施方式】 儘管音訊信號之話音分量通常載運主要資訊,但背景聲 音分量亦在諸如電話之語音通信應用中起重要作用。由於 背景聲音分量存在於活動及不活動訊框兩者期間,故其在 不活動訊框期間之連續重現對於在接收器處提供連續及連 通感係重要的。背景聲音分量之重現品質可能對於逼真度 及整體所感知品質亦係重要的,尤其對於嘈雜環境中使用 之免持終端機而言。 諸如蜂巢式電話之行動使用者終端機允許語音通信應用 擴展於比先前更多之位置。結果,可能遭遇之不同音訊背 景聲音之數目增加。現存語音通信應用通常將背景聲音分 量視作雜訊,但一些背景聲音比其他背景聲音更結構化, 且可能更難可辨別地進行編碼。 在一些情形下,可能需要抑制及/或掩蔽音訊信號之背 景聲音分量。出於安全原因,舉例而t,可能需要在傳輸 或儲存之前自音訊信號移除背景聲音分量。或者,可能需 要向音訊信號添加不同背景聲音。舉例而言,可能需要造 成揚聲器在不同位置處及/或在不同環境中之錯覺。本文 揭示之組態包括可應用於語音通信及/或儲存應用中以移 除、增強及/或取代現存音訊背景聲音之系統、方法及裝 置明確地預期且特此揭示,本文揭示之組態可經調適用 於封包交換式網路(舉例而言,根據諸如v〇Ip之協定配置 以载運浯音傳輸之有線及/或無線網路)及/或電路交換式網 路中。亦明確地預期且特此揭示,本文揭示之組態可經調 I34863.doc 200933610 適用於窄頻編碼系統(例如’編碼約四千赫兹或五千赫兹 之音訊頻率範圍之系統)令及用於寬頻編碼系統(例如,編 碼大於五千赫兹之音訊頻率之系統)中,包括全頻編碼系 統及分頻編碼系統。 除非明確由其上下文限制,否則術語,,信號"在本文中用 來指示其普通意義中之任一者’包括如導線、匯流排或其 他傳輸媒體上表達之記憶體位置(或記憶體位置之集合)之 狀態。除非明確由其上下文限制,否則術語"生成"在本文 〇肖來指示其普通意義中之任一者,諸如計算或以其他方式 產生。除非明確由其上下文限制,否則術語”計算”在本文 用來扣不其普通意義中之任一者,諸如計算、估計及,或 自厂組值選擇。除非明確由其上下文限制,否則術語"獲 得"用來指示其普通意義中之任一者,諸如計算、導出、 接收(例如,自-外部器件)及/或掏取(例如,自儲存元件 陣列)。在術語"包含”使用於本發明描述及申請專利範圍中 ◎時,其並不排除其他元件或操作。術語"基於”(如"A係基 於B"中)用來指示其普通意義中之任一者,包括以下情 形:⑴"至少基於"(例如,"八至少基於B”),及⑻"等同於" (例如’ "A等同於8”)(若在特定上下文中為適當的卜 除非另外指不,否則具有特定特徵之裝置的操作之任何 揭示内容亦明確地意欲揭示具有類似特徵之方法(且反之 亦然),且根據特定組態之裝置的操作之任何揭示内容亦 明確地意欲揭示根據類似組態之方法(且反之亦然)。除非 另外指示,否則術語"背景聲音"(或"音訊背景聲音")用來 134863.doc 200933610 指示音訊信號之不同於話音分量,且傳達來自揚聲器之周 圍環境的音訊資訊的分量,且術語”雜訊"用來指示音訊信 號中並非話音分量之部分且不傳達來自揚聲器的周圍環境 之資訊的任何其他偽訊。 出於話音編碼目的’話音信號通常經數位化(或量化)以 獲得樣本流。可根據此項技術中已知之各種方法(包括, 例如,脈碼調變(PCM)、壓擴从律PCM及壓擴八律pcM)中 之任一者執行數位化處理。窄頻話音編碼器通常使用8 kHz ® 之取樣速率,而寬頻話音編碼器通常使用更高之取樣速率 (例如,12或 16 kHz)。 將經數位化之話音信號處理為一系列訊框。此系列通常 實施為非重疊系列,但處理訊框或訊框片段(亦稱為子訊 框)之操作亦可包括其輸入中的一或多個鄰近訊框之片 段。話音信號之訊框通常足夠短從而信號之頻譜包絡可預 期在訊框上保持相對固定。訊框通常對應於話音信號之五 ❹與35毫秒(或約4〇至200個樣本)之間,其中1〇、2〇及3〇毫秒 為共同訊框大小。通常所有訊框具有相同之長度,且在本 文描述之特定實例中假定均勻訊框長度。然而,亦明確地 預期且特此揭示’可使用非均勻訊框長度。 20毫秒的訊框長度在七千赫茲(kHz)之取樣速率下對應 於140個樣本,在8 kHz之取樣速率下對應於16〇個樣本, 且在16 kHz之取樣速率下對應於320個樣本,但可使用認 為適於特定應用之任何取樣速率。可用於話音編碼之取樣 速率的另一實例為12,8 kHz,且另外之實例包括自12 8 kHz 134863.doc -14· 200933610 至3 8.4 kHz的範圍中之其他速率。 圖1A展示經組態以接收音訊信號Sl〇(例如,一系列訊 框)且產生相應經編碼音訊信號S20(例如,一系列經編碼 訊框)之話音編碼器X10之方塊圖。語音編碼器χι〇包括編 碼方案選擇器20、活動訊框編碼器30及不活動訊框編碼器 40。音訊信號S10為包括話音分量(亦即,主揚聲器#立之 聲音)及背景聲音分量(亦即,周圍環境或背景聲音)之數位 音訊信號。音訊信號S10通常為如由麥克風捕獲之類比信 ❹號之經數位化版本。 編碼方案選擇器20經組態以辨別音訊信號sl〇之活動訊 框與不活動訊框。此種操作亦稱為,,語音活動性偵測"或 活音活動性偵測",且編碼方案選擇器2〇可經實施以包括 語音活動性偵測器或話音活動性偵測器。舉例而言,編碼 方案選擇器20可經組態以輸出對於活動訊框為高且對於不 活動訊框為低之二元值編碼方案選擇信號。圖1A展示使用 ❾力編碼方案選擇器2〇產生之編碼方案選擇信號來控制話音 編碼器X10的一對選擇器50a及50b之實例。 編碼方案選擇器20可經組態以基於訊框之能量及/或頻 譜内容之一或多個特性(諸如訊框能量、信雜比(SNR)、週 期陡、頻譜分布(例如,頻譜傾斜)及/或過零率)將訊框分 類為活動或不活動。此種分類可包括將此種特性之值或量 值與臨限值進行比較’及/或將此種特性之改變之量值 (例如,相對於先前訊框)與一臨限值進行比較。舉例而 °編碼方案選擇器2〇可經組態以估計當前訊框之能量, 134863.doc _ 15· 200933610 且若能量值小於(或者,不大於)一臨限值,則將訊框分類 為不活動。此種選擇器可經組態以將訊框能量計算為訊框 樣本的平方和。 編碼方案選擇器20之另-實施例經組態以估計低頻帶 (例如’ 300沿至2 kHz)及高頻帶(例如,2他至々服)中 的每一者中當前訊框之能量,且在每一頻帶的能量值小於 (或者,不大於)各別臨限值的情況下指示訊框為不活動 ^。此種選擇器可經組態以藉由將通㈣波應用至訊框及 指經慮波之訊框的樣本之平方和而計算頻帶十的訊框能 量。此種語音活動性偵測操作之一實例描述於第三代合作 夥伴計劃2(3GPP2)標準文件c.s〇〇14_c,w 〇(2〇〇7年t 月)(以www.3gpp2.org線上可得)之章節4 7中。 另外或在替代例中,此種分類可基於來自一或多個先前 訊框及/或一或多個隨後訊框之資訊。舉例而言,可能需 要基於訊框特性之在兩個或兩個以上訊框上求平均之值對 ❿^進行分類。可能需要使用基於來自先前訊框⑽如, 背景雜訊等級,SNR)之資訊之臨限值對訊框進行分類。亦 可能需要組態編碼方案選擇器2〇以將音訊信號sl〇中遵循 自活動訊框至不活動訊框之轉變的第一訊框中之一或多者 分類為活動的。在轉變之後以此種方式繼續先前分類狀態 之動作亦稱為"時滯(hangover)" 〇 活動訊框編碼器30經組態以編碼音訊信號之活動訊框。 編碼器30可經組態以根據諸如全速率、半速率或四分之一 速率之位元速率編碼活動訊框。編碼器3〇可經組態以根據 134863.doc • 16· 200933610 諸如碼激勵線性預測(CELP)、原型波形内插(PWI)或原型 間距週期(PPP)之編碼模式編碼活動訊框。 活動訊框編碼器30之典型實施例經組態以產生包括頻譜 資訊的描述及時間資訊的描述之經編碼訊框。頻譜資訊之 描述可包括線性預測編碼(LPC)係數值之一或多個向量, 其指示經編碼話音之共振(亦稱為,,共振峰,,)。頻譜資訊之 描述通常經量化,以使得LPC向量通常被轉換為可有效進 灯量化之形式,諸如線頻譜頻率(LSF)、線頻譜對(Lsp)、 © 導抗頻譜頻率(ISF ’ immittance spectral frequency)、導抗 頻4對(ISP)、倒譜係數或對數面積比。時間資訊之描述可 包括亦通常經量化之激勵信號之描述。 不活動訊框編碼器40經組態以編碼不活動訊框。不活動 訊框編碼器40通常經組態而以比活動訊框編碼器3〇使用之 位το速率低之位元速率來編碼不活動訊框。在一實例中, 不活動訊框編碼器40經組態以使用雜訊激勵線性預測 (NELP)編碼方案以八分之一速率編碼不活動訊框。不活動 訊框編碼器40亦可經組態以執行不連續傳輸(DTX),以使 得經編碼訊框(亦稱為"靜寂描述"或SID訊框)針對少於音訊 信號S10之所有不活動訊框進行傳輸。 不活動訊框編碼器40之典型實施例經組態以產生包括頻 »曰_貝訊的描述及時間資訊的描述之經編碼訊框。頻譜資訊 之描述可包括線性預測編碼(LPC)係數值之一或多個向 量。頻譜資訊之描述通常經量化,以使得Lpc向量通常轉 換為如上文實例中的可有效進行量化之形式。不活動訊框 134863.doc •17- 200933610 編碼器40可經組態以執行具有比活動訊框編瑪器3〇執行之 LPC为析的階數低之階數的LPC分析,及/或不活動訊框編 碼器4〇可經組態以將頻譜資訊之描述量化為比活動訊框編 碼器30產生的頻譜資訊之量化描述少的位元。時間資訊之 描述可包括亦通常經量化之時間包絡之描述(例如,包括 訊框之增益值及/或訊框的一系列子訊框中之每一者的增 益值)。 注意,編碼器30及40可共用共同結構。舉例而言,編碼 © 11 30及4G可共訂PC係數值之計算n(可能經組態以產生對 於活動訊框與不活動訊框具有不同階數之結果),但具有 刀别不同之時間描述計算器。亦注意,話音編碼器X1 〇之 軟體或勤體實施例可使用、編碼方案選擇器2〇之輸出以引導 執行向個或另—個訊框編碼器之流程,且此種實施例可 能不包括針對選擇器5〇a及/或針對選擇器5〇b之類比。 可能需要組態編碼方案選擇器2〇以將音訊信號sl〇之每 ❾-活動訊框分類為^干不同類型中之—者。此等不同類型 可包括有聲話音(例如,表示母音聲之話音)之訊框、轉變 訊框(例如,表不詞之開始或結束之訊框)及無聲話音(例 ^表不摩擦聲之話音)之訊框。訊框分類可基於當前訊 或或夕個先前訊框之一或多個特徵,諸如訊框能 量、兩個或兩個以上不同頻帶中之每一者之訊框能量、 SNR週期性、頻譜傾斜及/或過零率。此種分類可包括將 此種因翁3»· + θ 双之值或量值與臨限值進行比較及/或將此種因數 的改變之量值與臨限值進行比較。 134863.doc 200933610 可能需要組態話音編碼器χ 來編碼不同類型m 使用不同編碼位元速率 1之活動訊框(例如,以 量)。此種操作稱為,,可鐵、*玄 ^+衡網路需求與容 組態話音編二 碼”。舉例而言,可能需要 轉變訊框,以p j如,全速率)編碼 以更低位元速率(例如,四分之 聲訊框,且以& A t 刀之一速率)編碼無 乂宁間位7G速率(例如,半速 速率(例如,全料)編射聲訊^ 兩位元 ❹含ΓΓΖ編碼方案選擇器2〇之實施例22可用以根據訊框 之-二:=擇編碼特定訊框的位元速率之決策樹 /在其他㈣τ ’經選擇詩特定職之位元速 ”可視諸如所要平輕元㈣、在—_ =型式(其可用以支援所要平均位元速率)及/或: 擇用於先前訊框之位元速率之準則而定。 另外或在替代例中,可能需要組態話音編碼ϋΧ10以使 用不同編碼模式來編碼不同類型之話音訊框。此種操作稱 〇為彡重模式編碼"。舉例而言,有聲話音之訊框傾向於具 有^期(亦即,繼續一個以上之訊框週期)之週期性結構且 與音高相關,且使用編碼此長期頻譜特徵之描述的編碼模 式來編碼有聲訊框(或有聲訊框之序列)通常係更加有效 的。此種編碼模式之實例包括CELP、PWI及ρρρ。另一方 面,無聲訊框及不活動訊框通常缺少任何顯著長期頻譜特 徵’且話音編碼器可經組態以使用諸如NELP之不嘗試描 述此種特徵的編碼模式來編瑪此等訊框。 可能需要實施話音編碼器X10以使用多重模式編碼,以 134863.doc •19· 200933610 使得訊框根據基於(例如)週期性或發音之分類使用不同模 式進行編碼。亦可能需要實施話音編碼器Χίο以針對不同 類型之活動訊框使用位元速率與編碼模式之不同組合(亦 稱為"編碼方案")。話音編碼器XI0之此種實施例之一實例 針對含有有聲話音之訊框及轉變訊框使用全速率CELP方 案,針對含有無聲話音之訊框使用半速率NELP方案,且 針對不活動訊框使用八分之一速率NELP方案。話音編碼 器X10之此種實施例的其他實例支援用於一或多個編碼方 〇 案之多重編碼速率,諸如全速率及半速率CELP方案及/或 全速率及四分之一速率PPP方案。多重方案編碼器、解碼 器及編碼技術之實例描述於(例如)標題為"METHODS AND APPARATUS FOR MAINTAINING A TARGET BIT RATE IN A SPEECH CODER"的美國專利第6,330,532號中及標題為 "VARIABLE RATE SPEECH CODING"之美國專利第 6,691,084 號中;及標題為"CLOSED-LOOP VARIABLE-RATE MULTIMODE PREDICTIVE SPEECH CODER"之美國專利申請案 Ο w 第 09/191,643號中及標題為"ARBITRARY AVERAGE DATA RATES FOR VARIABLE RATE CODERS"之美國專利申請 案第11/625,788號中。 圖1B展示包括活動訊框編碼器30之多個實施例30a、30b 的話音編碼器X10之實施例X20的方塊圖。編碼器30a經組 態以使用第一編碼方案(例如,全速率CELP)編碼第一類活 動訊框(例如,有聲訊框),且編碼器30b經組態以使用具有 與第一編碼方案不同之位元速率及/或編碼模式之第二編 134863.doc • 20· 200933610 碼方案(例如,半速率NELP)來編碼第二類活動訊框(例 如,無聲訊框)。在此情形下,選擇器52a及521?經組態以 根據由編碼方案選擇器22產生之具有兩個以上可能狀態的 編碼方案選擇俏號之狀態在各種訊框編碼器中進行選擇。 明確地揭示,話音編碼器X20可以支援自活動訊框編碼器 3〇之兩個以上不同實施例中進行選擇之方式進行擴展。
❹, 話θ編瑪器X20之訊框編碼器中的一或多者可共用共同 結構。舉例而言’此種編碼器可共用Lpc係數值之計算器 (可能經組態以針對不同類之訊框產生具有不同階數之結 果),但具有分別不同之時間描述計算器。舉例而言,編 碼器3〇a及30b可具有不同激勵信號計算器。 如圖1B中所展示,話音編碼器χι〇亦可經實施以包括雜 訊抑制器10。雜訊抑制器10經組態及配置以對音訊信號 Sl〇執行雜訊抑制操作。此種操作可支援編碼方案選擇器 2〇對活動與不活動訊框之間的改良辨別及/或活動訊框編 碼器30及/或不活動訊框編碼㈣之更佳編碼結果。雜訊 抑制器Η)可經組態以將不同各別增益⑽應用i音訊信號 之兩個或兩個以上不同頻率頻道中之每一者,其中每一頻 道之增益因數可基於頻道的雜訊能量或SNR之估計。如與 時域相對’可能需要在頻域中執行此種增益控制,且此種 組態之-實漏述於上文提及之3咖2標準文狀_4_ 章即4.4.3中或者,雜訊抑制器1 〇可經組態以可能在 頻域中將調適性濾波應用至音訊信號。歐洲電信標準協會 以 www.etsi.org線 (ETSI)文件 ES 202 0505 v1.1.5(20〇mm 134863.doc -21 - 200933610 上可知)之章節5·1描述自不活動訊框估計雜訊頻譜且基於 所計算之雜訊頻譜對音訊信號執行兩階段梅爾維納(mel_ warped Wiener)濾波的此種組態之實例。 圖3 A展示根據一般組態之裝置χ丨〇〇之方塊圖(亦稱為編 碼器、編碼裝置或用於編碼之裝置)。裝置χι 〇〇經組態以 自音訊信號S10移除現存背景聲音且將其取代為可能類似 或不同於現存背景聲音之所生成背景聲音。裝置χι〇〇包括 經組態及配置以處理音訊信號S10以產生背景聲音增強音 © 訊信號S15之背景聲音處理器1〇〇。裝置xl〇〇亦包括話音編 碼器Χ10之實施例(例如,話音編碼器χ2〇),其經配置以編 碼背景聲音增強音訊信號S15以產生經編碼音訊信號S2〇。 包括諸如蜂巢式電話之裝置χ丨〇 〇的通信器件可經組態以在 將經編碼音訊信號S2〇傳輸於有線、無線或光學傳輸頻道 (例如,藉由一或多個載波之射頻調變)中之前對經編碼音 訊信號S20執行進一步處理操作,諸如錯誤校正、冗餘及/ ❹或協定(例如,以太網路、TCP/IP、CDMA2〇〇〇)編碼。 圖3B展示背景聲音處理器100之實施例1〇2之方塊圖。背 景聲曰處理器102包括經組態及配置以抑制音訊信號s丨〇之 煮景聲曰分量以產生背景聲音受抑制音訊信號S13之背景 聲音抑制器110。背景聲音處理器1〇2亦包括經組態以根據 背景聲音選擇信號S4〇之狀態產生所生成背景聲音信號S5〇 之背景聲音生成器120。背景聲音處理器102亦包括經組態 及配置以混合背景聲音受抑制音訊信號S13與所生成背景 聲0彳》號S50以產生背景聲音增強音訊信號S15之背景聲音 134863.doc -22- 200933610 混合器190。 如圖3B中所示,背景聲音抑制器110經配置以在進行編 碼之前自音訊信號抑制現存背景聲音。背景聲音抑制器 110可實施為如上文所描述之雜訊抑制器10的更加冒進之 版本(例如,藉由使用一或多個不同臨限值)。其他或另 外,背景聲音抑制器110可經實施以使用來自兩個或兩個 以上麥克風之音訊信號以抑制音訊信號s 10之背景聲音分 量。圖3G展示包括背景聲音抑制器110之此種實施例110A Ο 的背景聲音處理器102之實施例102A的方塊圖。背景聲音 抑制器110A經組態以抑制音訊信號S10之背景聲音分量, 舉例而言,其係基於由第一麥克風產生之音訊信號。背景 聲音抑制器110A經組態以藉由使用基於由第二麥克風產生 之音訊信號之音訊信號SA1(例如,另一數位音訊信號)而 執行此種操作。多重麥克風背景聲音抑制之合適實例揭示 於(例如)代理人案號為061521的標題為"APPARATUS AND METHOD OF NOISE AND ECHO REDUCTION"(Choy等人) ® 之美國專利申請案第11/864,906號中,及代理人案號為 080551之標題為"SYSTEMS,METHODS,AND APPARATUS FOR SIGNAL SEPARATION"(Visser 等人)的美國專利申請 案第12/037,928號中。背景聲音抑制器110之多重麥克風實 施例亦可經組態以向編碼方案選擇器20之相應實施例提供 資訊,用於根據(例如)代理人案號為061497之標題為 "MULTIPLE MICROPHONE VOICE ACTIVITY DETECTOR" (Choy等人)的美國專利申請案第11/864,897號中揭示之技 134863.doc •23· 200933610 術而改良話音活動性偵測效能。 圖3C至圖31?展示兩個麥克風K10及K20在包括裝置X1〇〇 之此種實施例(諸如蜂巢式電話或其他行動使用者終端機) 的可攜式器件中或經組態以經由向此種可攜式器件之有線 或無線(例如,藍芽)連接進行通信的諸如耳機或頭戴式耳 機之免持器件中之各種安裝組態。在此等實例中,麥克風 KI0經配置以產生主要含有話音分量(例如,音訊信號S10 之類比刖驅物)之音訊信號,且麥克風K20經配置以產生主 ©要:有背景聲音分量(例如,音訊信號SA1之類比前驅物) 之音訊信號。圖3C展示麥克風κίο安裝於器件之正面之後 且麥克風K20安裝於器件之頂面之後的配置之一實例。圖 3D展示麥克風K1〇安裝於器件之正面之後且麥克風κ2〇安 裝於器件之侧面之後的配置之一實例。圖3Ε展示麥克風 κίο安裝於器件之正面之後且麥克風Κ2〇安裝於器件之底 面之後的配置之一實例。圖3F展示麥克風K1〇安裝於器件 診之正面(或内面)之後且麥克風Κ20安裝於器件之背面(或外 面)之後的配置之一實例。 背景聲音抑制器丨10可經組態以對音訊信號執行頻譜相 減操作。頻譜相減可預期抑制具有固定統計量之背景聲音 分量’但對於抑制非固定之背景聲音可能無效。頻譜相減 可用於具有一個麥克風之應用中及來自多重麥克風之信號 可用之應用中。在一典型實例中,背景聲音抑制器11〇之 此種實施例經組態以分析音訊信號之不活動訊框,以導出 現存背景聲音之統計學描述,諸如眾多子頻帶(亦稱為"頻 134863.doc 24- 200933610 率組")中之每一者中之背景聲音分量的能量等級,且將相 應之頻率選擇性增益應用至音訊信號(例如,以基於相應 背景聲音能量等級衰減子頻帶中之每一者上的音訊信 號)。頻譜相減操作之其他實例描述於S. F. Boll之 "Suppression of Acoustic Noise in Speech Using Spectral Subtraction" (IEEE Trans. Acoustics, Speech and Signal Processing, 27(2): 112-120, 1979年4月)中;R_ Mukai, S. Araki,H. Sawada及S· Makino 之"Removal of residual crosstalk components in blind G source separation using LMS filters"(Proc. of 12th IEEE Workshop on Neural Networks for Signal Processing,第 435-444 頁, Martigny,Switzerland,2002年9月)中;及R. Mukai, S· Araki,Η. Sawada及 S. Makino之"Removal of residual cross-talk components in blind source separation using time-delayed spectral subtraction" (Proc. ofICASSP2002,第 1789-1792頁,2002年5月)中。 另外或在替代實施例中,背景聲音抑制器110可經組態 以對音訊信號執行盲源分離(BSS,亦稱為獨立分量分析) ® 操作。盲源分離可用於信號可得自一或多個麥克風(除了 用於捕獲音訊信號S10之麥克風之外)之應用中。盲源分離 可預期抑制固定之背景聲音以及具有非固定統計量之背景 聲音。描述於美國專利6,167,417(Parra等人)中之BSS操作 之一實例使用梯度下降法來計算用以分離源信號之濾波的 係數。BSS操作之其他實例描述於S. Amari,A. Cichocki及H. Η· Yang之"A new learning algorithm for blind signal separation" (Advances in Neural Information Processing Systems 8, MIT Press, 134863.doc •25· 200933610 1996)中;L_ Molgedey及H. G. Schuster之"Separation of a mixture of independent signals using time delayed correlations," (Phys. Rev. Lett., 72(23): 3634-3637,1994)中;及L. Parra及 C. Spence之"Convolutive blind source separation of non-stationary sources" (IEEE Trans, on Speech and Audio Processing,8(3): 320-327, 2000年 5 月)中。另外或 在上文論述之實施例的替代例中,背景聲音抑制器100可 經組態以執行波束成形操作。波束成形操作之實例揭示於 (例如)上文提及之美國專利申請案第11/864,897號(代理人 ❹ 案號 061497)中及 H. Saruwatari 等人之"Blind Source Separation Combining Independent Component Analysis and Beamforming" (EURASIP Journal on Applied Signal Processing, 2003:11,1135-1146 (2003))中。 彼此靠近地定位之麥克風(諸如安裝於諸如蜂巢式電話 或免持器件之護罩之共同外殼内的麥克風)可產生具有高 瞬時相關之信號。一般熟習此項技術者亦將認識到,一或 多個麥克風可置放於共同外殼(亦即,整個器件之護罩)内 W 之麥克風外殼中。此種相關可降級BSS操作之效能,且在 此種情形下,可能需要在BSS操作之前解相關音訊信號。 解相關通常亦對回音消除有效。解相關器可實施為具有五 個或更少之抽頭(tap)或甚至三個或更少之抽頭的濾波器 (可能為調適性濾波器)。此種濾波器之抽頭權重可為固定 的,或可根據輸入音訊信號之相關性進行選擇,且可能需 要使用格形濾波器結構來實施解相關濾波器。背景聲音抑 制器110之此種實施例可經組態以對音訊信號的兩個或兩 134863.doc -26- 200933610 個同子頻帶中之每-者執行分離的解相關操作。 至/1、對r/抑制器11G之實施例可經組態以在Bss操作之後 刀離$音分量執行—或多個額外處理操作。舉例 量;:能需要背景聲音抑制器110至少對經分離話音分 兩個仃々目關操作。可單獨地對經分離話音分量之兩個或 兩個以上不同子頻帶中之每—者執行此種操作。 Ο ❹ 组離以卜:在替代例中’背景聲音抑制器110之實施例可經 ,,基於經分離背景聲音分量對經分離話音分量執行諸 現存皆县致立 操作。可進-步自話音分量抑制 應子㈣曰之頻譜相減可根據經分離背景聲音分量之相 'H級而實施為隨時間變化之頻率選擇性增益。 =卜或在替代例中,背景聲音抑制器11G之實施例可經 常將增益應用至與;;等執截波操作,^ 地隨時間變化之,號中或話音活動性等級成比例 …d中心截波操作之-㈣可表達為 於丨χ[η]丨〈C1;對於|χ[啦c,x[n]},其中χ[η]為 , y[n]為輸出樣本,且C為截波臨限值。中心截 波操作之另—實例可表達為_=(對於|x,C,0 ;對於 _]的,神M)(丨轉〇},其巾帅⑷)指 正負號。 可能需要組態背景聲音抑制器11〇以實質上完全… 信號移除現存背景聲音分量。舉例而言,可能需要裝置 X100用不同於現存背景聲音分量之所生成背景聲音信號 S50取代現存背景聲音分量。在此種情形下,現存背 134863.doc •27· 200933610 曰刀量之實質上完全移除可能有助於減少經解碼音訊信號 中現存背景聲音分量與取代背景聲音信號之間的可聞干 :县ΐί一實例中,可能需要裝置X100經組態以隱藏現存 ’、θ分量,不管是否亦將所生成背景聲音信號S50相 加至音訊信號。 ❹ 、可能需要將背景聲音處理器ι⑽實施為可在兩個或兩個 、不同操作模式之間組態。舉例而言,可能需要提供 ⑷第旦一操作模式,其中背景聲音處理器1GG經組態以在現 存奇系聲曰刀量實質上保持不變地情形下傳遞音訊信號, 及,第二操作模式,其中背景聲音處理器職組;以實 質上凡全移除現存背景聲音分量(可能將其取代為所生成 背景聲音信號S50)。對此種第一操作模式之支援(其可組 態為預設模式)可能可使用於允許包括裝置χι〇〇的器件之 回湖相容性。在第一操作模式中,背景聲音處理器100可 經組態以對音訊信號執行雜訊抑制操作(例如,如上文關 於雜訊抑制器10所描述)以產生雜訊受抑制音訊信號。 ,背景聲音處理器100之另外實施例可類似地經組態以支 极兩個以上操作模式。舉例而言’此另外實施例可為可組 態的以根據在自至少實質上無背景聲音抑制(例如,僅雜 訊抑制)至部分背景聲音抑制至至少實質上完全背景聲音 抑制之範圍中的三個或三個以上模式中之可選模式而改變 現存背景聲音分量受抑制之程度。 圖4Α展示包括背景聲音處理器1〇〇之實施例刚的裝置 X刚之實施例χ1〇2的方塊圖。背景聲音處理器1〇4經組態 134863.doc •28· 200933610 〇
以根據處理控制信號S30之狀態而以上文描述的兩個或兩 個以上模式中之一者進行操作。處理控制信號S30之狀態 可由使用者控制(例如,經由圖形使用者介面、開關或其 他控制介面)’或者可由處理控制生成器34〇(如圖16中所說 明)生成包括諸如表之將一或多個變數(例如,實體位置、 操作模式)的不同值與處理控制信號S3〇之不同狀態相關聯 的索引資料結構之處理控制信號S3〇。在一實例中,處理 控制信號S30實施為二元值信號(亦即,旗標),其狀態指 示將傳遞還是抑制現存背景聲音分量。在此種情形下,背 景聲音處理器104可以第一模式進行組態以藉由停用其元 件中之一或多者及/或自信號路徑移除此等元件(亦即,允 許音訊信號繞過此等元件)而傳遞音訊信號si〇,且可以第 二模式進行組態以藉由啟用此種元件及/或將其插入於信 號路徑中而產生背景聲音增強音訊信號si5。或者,背景 聲音處理HHM可以第—模式進行組態以對音訊信號請執 行雜訊抑制操作(例如’如上文關於雜訊抑制器1〇所描 述)’且可以第二模式進行組態以對音訊信號S10執行背景 聲曰取代操作。在另一實例中,處理控制信號具有兩 個以上可能狀態,每—狀態對應於背景聲音處理器之在自 至少實質上無背景聲音抑制(例如,僅雜訊抑制)至部分背 景聲音抑制至至少實質上完全的背景聲音抑制之範圍中的 三個或三個以上操作模式中之不同模式。 圖4B展示背景聲音處理器1〇4之實施例應之方塊圖。背 景聲曰處理器106包括背景聲音抑制器ιι〇之實施例⑴, 134863.doc -29- 200933610 2景聲音抑制器112經組態以具有至少兩個操作模式 =作模式,其中背景聲音抑制器112經組態以 景聲音分量實質上伴杜π鐵^ 及盆下傳遞音訊信號_, 上!模式…背景聲音抑制器⑴經組態以實質 -全“訊信號sl〇移除現存背景聲音分量(亦即,以產 生背景聲音受抑制音訊信號SI3)e可能需要實 抑制器112以使得笸一猫诛樹a * «豕掌曰 ❹
施背导馨立,為預設模式。可能需要實 '、θ 17制器112以在第一操作模式中對音訊传號執 行雜訊抑制操作(例如,如上文關於雜訊抑㈣^執 以產生雜訊受抑制音訊信號。 所描过) 背景聲音抑制器112可經實施以使得在其第—操作模式 ,繞過經組態以對音訊信號執行背景聲音抑制操作之一 =個二件(例如,—或多個軟體及/或㈣常式)。其他或 另:’背景聲音抑制器112可經實施以藉由改變此種背景 聲曰抑制操作(例如,頻譜相減及/或BSS操作)之一或多個 =2值而以不同模式進行操作。舉例而言,背景聲音抑制 112可以第—模式進行組態以應用第一組臨限值來執行 ” 5卩制操作,且可以第二模式進行組態以應用第二組臨 限值來執行背景聲音抑制操作。 處理控制信號S30可用以控制背景聲音處理器1〇4之一 多個其他开彼 、 件。圖4B展示經組態以根據處理控制信號S3〇 之狀態進行操作的背景聲音生成器120之實施例122的實 例。舉例而士 a 5 ’可能需要根據處理控制信號S30之相應狀 〜將背景聲音生成器122實施為經停用(例如,以減少功率 134863.doc 30· 200933610 ,耗)或以其他方式防止背景聲音生成器122產生所生成之 背景聲音k號S50 »另外或其他,可能需要根據處理控制 信號S30之相應狀態將背景聲音混合器刚實施為經停用或 繞過或以其他方式防止背景聲音混合器19〇混合其輸入 音訊信號與所生成背景聲音信號S5〇。 如上所述,話音編碼器Xl〇可經組態以根據音訊信號 S10之或多個特性自兩個或兩個以上訊框編碼器中進行 選#同樣’在裝置X100之實施例内,編碼方案選擇器20 Ο可不⑽進行實施以根據音訊信號si〇、背景聲音受抑制 音訊信號S13及/或背景聲音增強音訊信號si5之一或多個 特性產生編碼器選擇信號。圖5A說明此等信號與話音編碼 器X10之編碼器選擇操作之間的各種可能之相依性。圖6展 不裝置X1GG之特定實施例X11G之方塊圖,其中編碼方案 選擇器20經組態以基於背景聲音受抑制音訊信號⑴(如圖 A中之點B所指不)之一或多個特性(諸如訊框能量、兩個 〇或兩個以上不同頻帶中之每一者之訊框能量、SNR、週期 性、頻譜傾斜及/或過零率)產生編碼器選擇信號。明確地 預期且特此揭示,圖5A及圖6中建議之裝置X⑽的各種實 施例中之任一者亦可經組態以包括根據處理控制信號 S一30(例如’如關於圖从、圖4B所描述)的狀態及,或三個或 二個以上訊框編碼器(例如,如關於圖1B所描述)中的—者 之選擇來控制背景聲音抑制器11()。 可能需要實施裝置Xl〇〇以將雜訊抑制及背景聲音抑制作 為單獨操作而執行。舉例而言,可能需要將背景聲音處理 134863.doc •31- 200933610 器100之實施例添加至具有話音編碼器χ20的現存實施例之 器件’而不移除、停用或繞過雜訊抑制器i 0。圖5Β說明在 包括雜訊抑制器10之裝置Χ100的實施例中在基於音訊信號 sl〇之信號與話音編碼器Χ20的編碼器選擇操作之間的各種
可旎之相依性》圖7展示裝置XI〇〇之特定實施例χΐ2〇之方 塊圖,在裝置Χ120中編碼方案選擇器2〇經組態以基於雜訊 受抑制音訊信號S12(如圖5Β中之點Α所指示)之一或多個特 性(諸如訊框能量、兩個或兩個以上不同頻帶中之每一者 的訊框能量、SNR、週期性、頻譜傾斜及/或過零率)產生 編碼器選擇信號。明確地預期且特此揭示,圖5B及圖7中 建礒之裝置X1GG的各種實施例中之任—者亦可經組態以包 括根據處理控制信號S30(例如,如關於圖4A、圖4b所描 述)的狀態及/或三個或三個以上訊框編碼器(例如,如關於 圖1B所描述)中的—者之選擇來控制背景聲音抑制器ιι〇。 背景聲音抑制器110亦可經組態以包括雜訊抑制器1〇, 或可以其他方式可選擇地進行組態以對音訊信號si〇執行 :訊抑制。舉例而言’可能需要裝置χ⑽根據處理控制信 號咖之狀態執行背景聲音抑制(其中現存背景聲音實質上 :音訊信號S10完全移除)或者雜訊抑制(其 =質上保持不變)。一般而言,背景聲音抑制器HO亦可 ==背景聲音抑制之前對音訊信號Si。及/或在 ,仃貪景聲音抑制之後對所得音訊信號執行—或多 處理操作(諸如濾波操作)。 一 、 如上所述, 現存話音編喝器通常使 用低位元速率及/或 134863.doc •32- 200933610 來縞螞不活動訊框。因此,經編碼不活動訊框通常含 有極景聲音資訊。視由背景聲音選擇信號s4〇指示之 特定煮景聲音及/或背景聲音生成器120之特定實施例而 定所生成背景聲音信號S50之聲音品質及資訊内容可能 牙京聲g之聲日〇〇質及資訊内容。在此種情形 下,可能需要使用比用來編碼僅包括原始背景聲音之不活 動訊框的位^速帛高之位元速率來編碼包括戶斤生成背景聲 θ仏號S50的不活動訊框。圖8展示包括至少兩個活動訊框 ©編碼器3〇a、3〇b及編碼方案選擇器2〇及選擇器他、働之 相應實施例的裝置X100之實施例χπ〇的方塊圖。在此實 例中,裝置XI 30經組態以基於背景聲音增強信號(亦即, 在將所生成背景聲音信號S50相加至背景聲音受抑制音訊 L號之後)執行編碼方案選擇β儘管此種配置可能導致語 音活動性之錯誤偵測,但其在使用較高位元速率來編碼背 景聲音增強靜寂訊框之系統中亦可能係合意的。 明確地指出,如關於圖8所描述之兩個或兩個以上活動 ® 訊框編碼器及編碼方案選擇器20及選擇器5〇a、5〇b的相應 實施例之特徵亦可包括於本文揭示之裝置χ1〇〇的其他實施 例中。 背景聲音生成器120經组態以根據背景聲音選擇信號S4〇 之狀態產生所生成背景聲音信號S50。背景聲音混合器19〇 經組態及配置以混合背景聲音受抑制音訊信號S13與所生 成背景聲音信號S50以產生背景聲音增強音訊信號su。在 一實例中’背景聲音混合器190實施為經配置以將所生成 134863.doc -33- 200933610 背景聲音信號S50相加至背景聲音受抑制音訊信_3之加 法器。可能需要背景聲音生成器12〇以可與背景聲音受抑 制音訊信號相容之形式產生所生成背景聲音信號S5〇。在 裝置X100之典型實施例中’舉例而言,所生成背景聲音信 號S50及由背景聲音抑制器110產生之音訊信號兩者皆為 PCM樣本之序列。在此種情形下’背景聲音混合器19〇可 經組態以將所生成背景聲音信號S5〇與背景聲音受抑制音 訊信號S13(可能作為基於訊框之操作)之相應樣本對相 © 加,但亦可能實施背景聲音混合器190以對具有不同取樣 解析度之信號進行相加。音訊信號sl〇通常亦實施為pcM 樣本之序列。在一些情形下,背景聲音混合器19〇經組態 以對背景聲音增強信號執行一或多個其他處理操作(諸如 濾波操作)。 背景聲音選擇信號S40指示兩個或兩個以上背景聲音中 的至少一者之選擇。在一實例中,背景聲音選擇信號s4〇 私不基於現存背景聲音之一或多個特徵之背景聲音選擇。 舉例而。,背景聲音選擇信號S4〇可係基於關於音訊信號 S 10之一或多個不活動訊框的一或多個時間及/或頻率特性 之資訊。編碼模式選擇器2〇可經組態而以此種方式產生背 景聲音選擇信號S40。或者,裝置χι〇〇可經實施以包括經 組態而以此種方式產生背景聲音選擇信號S4〇之背景聲音 分類器320(例如,如圖7中所展示)。舉例而言,背景聲音 刀類器可經組態以執行基於現存背景聲音之線頻譜頻率 (LSF)的方景聲音分類操作,諸如El-Maleh等人之,,Frame- I34863.doc -34- 200933610 level Noise Classification in Mobile Environments" (Proc. IEEE Int’l Conf. ASSP,1999 ’ 第 I卷,第 237-240頁);美國 專利第6,782,361號(El-Maleh等人);及Qjan等人之 "Classified Comfort Noise Generation for Efficient Voice
Transmission" (Interspeech 2006,Pittsburgh,PA,第 225- 228頁)中描述的彼等操作e 在另一實例中’背景聲音選擇信號S40指示基於諸如關 於包括裝置XI 00之器件的實體位置之資訊(例如,基於自 ❹全球定位衛星(GPS)系統獲得,經由三角測量或其他測距 操作計算’及/或自基地台收發器或其他伺服器接收之資 訊)的一或多個其他準則之背景聲音選擇、使不同時間或 時間週期與相應背景聲音相關之排程,及使用者選擇之背 景聲音模式(諸如商務模式、舒緩模式、聚會模式)。在此 等情形下’裝置XI〇〇可經實施以包括背景聲音選擇器 33〇(例如,如圖8中所展示)。背景聲音選擇器330可經實施 以包括將不同背景聲音與上文提及之諸如準則的一或多個 變數之相應值相關聯的一或多個索引資料結構(例如, 表)。在另一實例中,背景聲音選擇信號S4〇指示一列兩個 或兩個以上背景聲音中的一者之使用者選擇(例如,自諸 如選單之圖形使用者介面)。背景聲音選擇信號S4〇之另外 之實例包括基於上文實例的任何組合之信號。 圖9A展示包括背景聲音資料庫ι3〇及背景聲音生成引擎 140之老景聲音生成器12〇的實施例ία之方塊圖。背景聲 音資料庫120經組態以儲存描述不同背景聲音之多組參數 134863.doc -35- 200933610 值。背景聲音生成引擎140經組態以根據根據背景聲音選 擇信號S40之狀態而選擇的一組所儲存之參數值來生成背 景聲音。 圖9B展示背景聲音生成器122之實施例124之方塊圖。在 此實例中,背景聲音生成引擎140之實施例144經組態以接 收背景聲音選擇信號S40,且自背景聲音資料庫13〇的實施 例134擷取相應組之參數值。圖9c展示背景聲音生成器ι22 之另一實施例126之方塊圖。在此實例中,背景聲音資料 © 庫130之實施例136經組態以接收背景聲音選擇信號S4〇, 且將相應組之參數值提供至背景聲音生成引擎14〇之實施 例 14 6 〇 背景聲音資料庫130經組態以儲存兩個或兩個以上組之 描述相應背景聲音之參數值。背景聲音生成器12〇之其他 實施例可包括背景聲音生成引擎14〇之實施例,背景聲音 生成引擎14 0之該實施例經組態以自諸如伺服器之内容提 供者或其他非本地資料庫或自點對點網路(例如,如Cheng 等人之"A Collaborative Privacy-Enhanced Alibi Phone”(Proc. Int'l Conf· Grid and Pervasive Computing,第 405-414 頁,Taichung, TW,2006年5月)中所描述)下載對應於所選背景聲音之一 組參數值(例如’使用會話起始協定(Sip)之一版本,如當 前在RFC 3 261中所描述,其以www.ietf.org線上可得)。 貪景聲曰生成12 0可經組態而以經取樣之數位信號形 式(例如,如PCM樣本之序列)擷取或下載背景聲音。然 而,由於儲存及/或位元速率限制,此種背景聲音可能將 134863.doc -36· 200933610 遠遠短於典型通#會話(例如,電話呼叫),從而要求在呼 叫期間反覆不斷地重複相同背景聲音且導致對於收聽者而 言不可接受地分散注意力之結果。或者,可能將需要大量 儲存及/或高位元速率下載連接以避免過度重複之结果。 或者,背景聲音生成引擎140可經組態以自諸如一組頻 譜及/或能量參數值之所擷取或所下載參數表示而生成背 景聲音。舉例而言,背景聲音生成引擎14〇可經組態以基 於可包括於SID訊框中之頻譜包絡(例如,LSF值之向量)的 ❹描述及激勵信號的描述而生成背景聲音信號S5〇之多個訊 框。背景聲音生成引擎140之此種實施例可經組態以逐訊 框地隨機化參數值之組以減小對所生成背景聲音的重複之 覺察。 可能需要背景聲音生成引擎14〇基於描述聲音結構之模 板產生所生成背景聲音信號S5〇 ^在一此種實例中,背景 聲曰生成引擎140經組態以基於包括複數個不同長度之自 ❹然顆粒之模板執行顆粒合成。在另一實例中,背景聲音生 成引擎140經組態以基於包括級聯時間頻率線性預測 (CTFLP)分析(在CTFLp分析中,原始信號在頻域中使用線 性預測進行模型化,且此分析之剩餘部分接著在頻域中使 用線性預測進行模型化)之時域及頻域係數的模板執行 CTFLP合成。在另一實例中’背景聲音生成引擎14〇經組 態以基於包括多重解析分析(MRA)樹之模板執行多重解析 合成’該多重解析分析(MRA)樹描述至少一基底函數在不 同時間及頻率標度處之係數(例如’諸如多貝西(Daubechies) 134863.doc -37- 200933610 定標函數之定標函數之係數,及諸如多貝西小波函數之小 波函數之係數)。圖1 〇展示基於平均係數及詳細係數之序 列的所生成背景聲音信號S50之多重解析合成之一實例。 可能需要背景聲音生成引擎140根據語音通信會話之預 期長度產生所生成背景聲音信號S50 ^在一此種實施例 中’背景聲音生成引擎140經組態以根據平均電話呼叫長 度產生所生成背景聲音信號S50。平均呼叫長度之典型值 在一至四分鐘之範圍中,且背景聲音生成引擎14〇可經實 〇 施以使用可根據使用者選擇而變化之預設值(例如,兩分 鐘)〇 可能需要背景聲音生成引擎140產生所生成背景聲音信 號S50以包括基於相同模板之若干或許多不同背景聲音信 號截波。所要數目之不同截波可設定為預設值或由裝置 X100之使用者選擇,且此數目之典型範圍為五至二十。在 :此種實财’背景聲音生成引擎140經組態以根據基於 平均呼叫長度及不同截波之所要數目的截波長度計算不同 截波中之每纟。截波長度通常比訊框長度大一、二 個數量級。在一营如& T U 一 Α 一 ^. 實例中,平均呼叫長度值為兩分鐘,不同 截波之所要數目发丄 -. 為十,且藉由將兩分鐘除以十而計算 長度為十二秒。 / 在此等情形下, 冑景聲0生成引擎140可經組態以生成 不同截波(其各自係基於相同模板且具有所計 算之截波長度),且由舱4、 · .^ ^ 串聯或以其他方式組合此等截波以產 景聲音信號S50。背景聲音生成引擎14〇可經組 134863.doc -38- 200933610 態以重複所生成背景聲音信號S50(若必要例如,若通信 之長度應超過平均呼叫長度可能需要組態背景聲音生 成引擎140以根據音訊信號S10自有聲至無聲訊框之轉變生 成新截波。 圖9D展示用於產生所生成背景聲音信號S5〇之可由背景 聲音生成引擎140的實施例執行之方法Ml〇〇的流程圖。任 務T100基於平均呼叫長度值及不同截波之所要數目計算截 波長度。任務T200基於模板生成所要數目之不同截波。任 © 務T300組合截波以產生所生成背景聲音信號85〇。 任務T200可經組態以自包括MRA樹之模板生成背景聲音 信號截波。舉例而言’任務T200可經組態以藉由生成統計 學上類似於模板樹之新MRA樹且根據該新樹合成背景聲音 信號截波而生成每一截波。在此種情形下,任務T2〇〇可經 組態以將新MRA樹生成為模板樹之複本,其中一咬多個 (可能全部)序列之一或多個(可能全部)係數由具有類似祖 系體(ancestor)(亦即,在更低解析度下之序列中)及/或前體 〇 (predecessor)(亦即,在相同序列中)的模板樹之其他係數 取代。在另一實例中,任務T200經組態以根據藉由向模板 係數值組的複本之每一值加上小隨機值而計算的新係數值 組生成每一戴波。 任務T200可經組態以根據音訊信號sl〇及/或基於其之_ 號(例如,信號S12及/或S13)的一或多個特徵而定標背景聲 音信號截波中之一或多者(可能全部)。此等特徵可包括传 號等級、訊框能量、SNR、一或多個梅爾頻率倒譜係數 134863.doc -39- 200933610 (MFCC)及/或對信號之語音活動性偵測操作之一或多個結 果。對於任務T200經組態以自所生成之MRA樹合成截波之 情形而言,任務T200可經組態以對所生成MRA樹之係數執 行此種定標。背景聲音生成器120之實施例可經組態以執 行任務T200之此種實施例。另外或在替代例中,任務T300 可經組態以對經組合之所生成背景聲音信號執行此種定 標。背景聲音混合器190之實施例可經組態以執行任務 T300之此種實施例。 © 任務T300可經組態以根據相似性之量測組合背景聲音信 號截波。任務T300可經組態以串聯具有類似MFCC向量之 截波(例如,以根據候選截波組上之MFCC向量之相對相似 性串聯截波)。舉例而言,任務T200可經組態以最小化相 鄰截波之MFCC向量之間的在經組合截波串上計算的總距 離。對於任務T200經組態以執行CTFLP合成之情形而言, 任務T3 00可經組態以串聯或以其他方式組合自類似係數生 成之截波。舉例而言,任務T200可經組態以最小化相鄰截 ® 波之LPC係數之間的在經組合截波串上計算的總距離。任 務T300亦可經組態以串聯具有類似邊界暫態之截波(例 如,以避免自一截波至下一截波之可聞不連續性)。舉例 而言,任務T200可經組態以最小化相鄰截波之邊界區域上 的能量之間的在經組合截波串上計算的總距離。在此等實 例中之任一者中,任務T300可經組態以使用疊加(overlap-and-add)或交互混疊(cross-fade)操作(而非串聯)來組合相 鄰截波。 134863.doc -40- 200933610 如上文所描述,背景聲音生成引擎140可經組態以基於 可以允許低儲存成本及擴展非重複生成之緊密表示形式下 載或擷取的聲音結構之描述產生所生成背景聲音信號 S50。此等技術亦可應用於視訊或視聽應用。舉例而言, 裝置X100之具有視訊能力的實施例可經組態以執行多重解 析合成操作以增強或取代視聽通信之視覺背景聲音(例 如,背景及/或照明特性)。 背景聲音生成引擎1 40可經組態以貫穿通信會話(例如, © 電話呼叫)重複地生成隨機MRA樹。由於可預期較大樹需 要較長時間生成,故可基於延遲容許度選擇MRA樹之深 度。在另一實例中,背景聲音生成引擎14〇可經組態以使 用不同模板生成多個短MRA樹,及/或選擇多個隨機mra 樹,且混合及/或串聯此等樹中之兩者或兩者以上以獲得 樣本之較長序列。 可能需要組態裝置X100以根據增益控制信號S9〇之狀態 控制所生成背景聲音信號S50之等級。舉例而言,背景聲 六.1 » 曰生成器120(或其元件,諸如背景聲音生成引擎14〇)可經 組態以根據增益控制信號S90之狀態(可能藉由對所生成背 景聲音信號S50或對信號S50的前驅物執行定標操作(例 如,對模板樹或自模板樹生成之MRA樹之係數))在特定等 級上產生所生成背景聲音信號S50。在另一實例中,圖i3A 展示包括定標器(例如’多工器)之背景聲音混合器19〇的實 施例192之方塊圖,該定標器經配置以根據增益控制信號 S90之狀態對所生成背景聲音信號S5〇執行定標操作。背景 134863.doc -41 - 200933610 聲音混合器192亦包括經組態以將經定標之背景聲音信號 相加至背景聲音受抑制音訊信號S13之加法器。 丨 包括裝置X1 0 0之器件可經組態以根據使用者選擇來設定 增益控制信號S90之狀態。舉例而言,此種器件可裝備有 音量控制(例如,開關或旋鈕,或提供此種功能性之圖形 使用者介面),器件之使用者可藉由該音量控制選擇所生 成背景聲音信號S50之所要等級。在此情形下,器件可經 組態以根據所選等級設定增益控制信號S9〇之狀態。在另 ©-實例中,此種音量控制可經組態以允許使用者選擇所生 成背景聲音信號S50相對於話音分量(例如,背景聲音受抑 制音訊信號S13)之等級之所要等級。 圖11A展示包括增益控制信號計算器195之背景聲音處理 器102的實施例1〇8之方塊圖。增益控制信號計算器195經 組態以根據可隨時間改變之信號S13之等級計算增益控制 信號S90。舉例而言,增益控制信號計算器195可經組態以 基於信號S13之活動訊框的平均能量來設定增益控制信號 S90之狀態。另外或在任一此種情形之替代例中包括裝 置XI 00之器件可裝備有音量控制’該音量控制經組態以允 許使用者直接控制話音分量(例如,信號S13)或背景聲音 增強音訊k號S1 5之等級,或間接控制此種等級(例如,藉 由控制前驅信號之等級)。 裝置X100可經組態以控制所生成背景聲音信號S5〇相對 於音訊信號S10、S12及S13中之一或多者的等級之等級, 其可隨時間而變化。在一實例中,裝置χι 〇〇經組態以根據 134863.doc •42· 200933610 音訊信號S10之原始背景聲音的等級控制所生成背景聲音 信號S50之等級。裝置X i 〇〇之此種實施例可包括經組態以 根據在活動訊框期間背景聲音抑制器11〇的輸入等級與輸 出等級之間的關係(例如,差別)來計算增益控制信號S9〇 之增益控制信號計算器195的實施例。舉例而言,此種增 益控制計算器可經組態以根據音訊信號S丨〇的等級與背景 聲音受抑制音訊信號S13的等級之間的關係(例如,差別) 來計算增益控制信號S90。此種增益控制計算器可經組態 © 以根據音訊信號S10之可自信號S10及S13的活動訊框之等 級而計算的SNR來計算增益控制信號S9〇。此種增益控制 信號計算器可經組態以基於隨時間而平滑化(例如,平均 化)之輸入等級來計算增益控制信號S9〇,及/或可經組態以 輸出隨時間而平滑化(例如,平均化)之增益控制信號 S90 〇 在另一實例中,裝置X100經組態以根據所要SNR控制所 生成背景聲音信號S50之等級^可特徵化為背景聲音增強 音訊信號S15之活動訊框中的話音分量(例如,背景聲音受 抑制音訊信號S13)之等級與所生成背景聲音信號S5〇之等 級之間的比率之SNR亦可稱為"信號背景聲音比"。所要 SNR值可為使用者選擇的,及/或在不同所生成背景聲音中 不同。舉例而言,不同所生成背景聲音信號S50可與不同 相應所要SNR值相„。所要隨值之典型範圍為2〇犯至 25 dB。在另一實例中,裝置xioo經組態以控制所生成背 景聲音信號S50(例如,背景信號)之等級為小於背景聲音 I34863.doc •43- 200933610 焚抑制音訊信號S13(例如,前景信號)之等級。 圖11B展不包括增益控制信號計算器195之實施例^?的 彦景聲音處理器102之實施例1〇9的方塊圖。增益控制計算 器197經組態及配置以根據(A)所要SNR值與⑺)信號Si3與 S50之等級之間的比率之間的關係來計算增益控制信號 S90。在一實例中,若該比率小於所要SNR值,則増益控 制仏號S90之相應狀態使得背景聲音混合器} 92在較高等級 上混合所生成背景聲音信號S5〇(例如,以在將所生成背景 © 聲音信號S50相加至背景聲音受抑制信號S13之前提高所生 成背景聲音信號S50之等級),且若該比率大於所要SNR 值,則增益控制信號S90之相應狀態使得背景聲音混合器 192在較低等級上混合所生成背景聲音信號S5〇(例如,以 在將信號S50相加至信號S13之前降低信號S50之等級)。 如上文所描述,增益控制信號計算器195經組態以根據 一或多個輸入信號(例如,S10、S13、S50)中之每一者的 等級來計算增益控制信號S90之狀態。增益控制信號計算 器19 5可經組態以將輸入信號之等級計算為在一或多個活 動訊框上進行平均之jg號振幅。或者,增益控制信號計算 器195可經組態以將輸入信號之等級計算為在一或多個活 動訊框上進行平均之信號能量。通常,訊框之能量計算為 訊框的經平方樣本之和。可能需要組態增益控制信號計算 器195以濾波(例如,平均化或平滑化)所計算等級及/或增 益控制k號S90中之一或多者。舉例而言,可能需要組態 增益控制信號計算器195以計算諸如S10或S13之輸入信號 134863.doc 200933610 的訊框能量之動態平均值(running average)(例如藉由將 一階或更高階之有限脈衝響應或無限脈衝響應濾波應用至 信號的經計算之訊框能量),且使用平均能量來計算增益 控制信號S90。同樣,可能需要組態增益控制信號計算器 195以在將增益控制信號S9〇輸出至背景聲音混合器192及/ 或背景聲音生成器120之前將此種濾波應用至增益控制信 號S90 。 ° 音訊信號S10之背景聲音分量的等級可能獨立於話音分 量之等級而改變’且在此種情形下,可能需要相應地改變 所生成彦景聲音信號S50之等級。舉例而言,背景聲音生 成器120可經組態以根據音訊信號Sl〇之SNR改變所生成背 景聲音信號S50之等級。以此種方式,背景聲音生成器12〇 ❹ ❹ 可經組態以控制所生成背景冑音信號枷之等級以接近音 訊信號S10中的原始背景聲音之等級。 為維持獨立於話音分量之背景聲音分量之錯覺,可能需 要即使信號等級改變亦要維純定#景聲音等級。舉例而 言’歸因於說話者的嘴對於麥克風之方位的改變或歸因於 諸如音量調變或另一表達性效果之說話者語音的改變而可 能發生信號等級的改變Q在此種情形τ,可能需要所生成 背景聲音信號S50之等級在通信會話(例如,電話呼叫)的 持績時間中保持恆定。 立如=文描述之裝置X⑽的實施财包括於經組態用於語 音通信或儲存之任何類型的H件I此種器件之實例可包 括(但不限於)以下各物:電話、蜂巢式電話、頭戴式耳機 134863.doc -45- 200933610 (例如,經組態以經由Bbet〇〇thTM無線協定之一版本與行 動使用者終端機全雙工地進行通信之耳機)、個人數位助 理(PDA)、膝上型電腦、語音記錄器、遊戲機、音樂播放 機、數位相機。該器件亦可組態為用於無線通信之行動使 用者終端機,以使得如本文所描述之裝置χι〇〇之實施例可 包括於其内,或可以其他方式經組態以向器件之傳輸器或 收發器部分提供經編碼音訊信號S2〇。
用於語音通信之系統(諸如用於有線及/或無線電話之系 統)通常包括眾多傳輸器及接收器。傳輸器及接收器可經 整^或以其他方式作為收發器一起實施於共同外殼内。可 能需要將裝置X100實施為對傳輸器或收發器之具有足夠可 用處理、儲存及可升級性之升級。舉例而言可藉由將背 景聲音處理器100之元件(例如,在韌體更新中)添加至已包 括話音編碼器XU)之實施例之器件而實現裝置x⑽之實施 例。在—些情形下,可執行此種升級而不改變通信系統之 任何其他部分。舉例而言’可能需要升級通信系統中之傳 輸器中的一或多者(例b,用於無線蜂巢式電話之系統中 的一或多個行動使用者終端機中之每—者的傳㈣部分) 以包括裝置xm之實施例’而不對接收器作出任何相應改 變。可能需要以使得所得器件保持為回溯可相容(例如, 以使得器件保持為能夠執行全部或實質上全部之不涉及背 景聲音處理HHH)的使用之其先前操作)之方式執行升級。 對:裝置副之實施例用以將所生成背景聲音信細 插入於經編碼音訊信號咖中之情形而言,可㈣要說話 134863.doc -46 - 200933610 者(亦即,包括裝置X100之實施例的器件之使用者)能夠監 視傳輸。舉例而言,可能需要說話者能夠聽到所生成背景 聲音信號S50及/或背景聲音增強音訊信號S15。此種能力 對於所生成背景聲音信號S5〇不同於現存背景聲音之情形 而言可為尤其需要的。 因此包括裝置X1 〇〇之實施例的器件可經組態以將所生 成背景聲音信號S50及背景聲音增強音訊信號S15中的至少 一者反饋至耳機、揚聲器或位於器件之外殼内的其他音訊 ® 轉換器;至位於器件之外殼内之音訊輸出插口;及/或至 位於器件之外殼内之短程無線傳輸器(例如,如與由藍芽 技術聯盟(Bluetooth Special Interest Group,Bellevue,WA)發布 之藍芽協定之一版本及/或另一個人區域網路協定相容之 傳輸器)。此種器件可包括經組態及配置以自所生成背景 聲音信號S50或背景聲音增強音訊信號S15產生類比信號之 數位至類比轉換器(DAC)。此種器件亦可經組態以在將類 ^ 比信號應用至插口及/或轉換器之前對其執行一或多個類 比處理操作(例如,濾波、等化及/或放大)。裝置XI00可能 但不必經組態以包括此種DAC及/或類比處理路徑。 在曰通之解碼器端處(例如’在接收器處或在擷取 後)可此需要以類似於上文描述之編碼器側技術之方式 取代或增強現存背景聲音。亦可能需要實施此種技術而不 要求改變相應傳輸器或編碼裝置。 圖i2A展示經組態以接收經編碼音訊信號s2〇且產生相 應經解碼音訊信號S110之話音解碼器R10之方塊圖。語音 134863.doc •47· 200933610 解碼器R10包括編碼方案偵測器6〇、活動訊框解碼器7〇及 不活動訊框解碼器80。經編碼音訊信號S2〇為可由話音編 碼器X10產生之數位信號。解碼器70及80可經組態以對應 於如上文所描述之話音編碼器χι〇的編碼器,以使得活動 訊框解碼器7 0經組態以解碼已由活動訊框編碼器3 〇進行編 碼之訊框,且不活動訊框解碼器8〇經組態以解碼已由不活 動訊框編碼器40進行編碼之訊框。語音解瑪器㈣通常亦 包括經組態以處理經解碼音訊信號811〇以減少量化雜訊 ©(例如,藉由強調共振峰頻率及/或衰減頻譜谷值)之後滤波 器(P〇stfmer) ’且亦可包括調適性增益控制。包括解碼器 Rio之器件可包括經組態及配置以自經解碼音訊信號川〇 產生類比信號以供輸出至耳機、揚聲器或其他音訊轉換器 及/或位於器件的外殼内之音訊輸出插口的數位至類比轉 換器(DAC)。此種器件亦可經組態以在將類比信號應用至 插口及/或轉換器之前對其執行—或多個類比處理操作(例 如’濾波、等化及/或放大)。
D 編财案偵測H 60餘態㈣示對應於_碼音訊信號 820之當前訊框之編瑪方案。適當之編碼位元速率及/或編 碼模式可由訊框之格式指示。編碼方案偵測請可經组觸 以執行速率偵測或自裝置(話音解碼器R職埋於其内)之 另一部分(諸如多工子層)接收速率指示。舉例而言,編碼 方㈣測器6〇可經組態以自多工子層接收指示位元速率之 封包類型指不符。或者,編碼方案價測器60可經組態以自 諸如訊㈣量之—❹鮮㈣H㈣餘之位元速 134863.doc -48- 200933610 率在。應用中,編碼系統經組態以針對特定位元速 僅使用-個編碼模式,以使得經編碼訊框之位元速率奸 不編碼模心在其他情形下,經編碼訊框可包括諸如一: 或夕個位70之識別對訊框進行編碼所根據的編碼模式之 資訊此種貝況(亦稱為,,編碼索引可明確地或隱含地指 示編碼模式(例如,藉由指示對於其他可能之編碼模式而 言無效之值)。 圖12A展示由編碼方㈣測器6()產生之編碼方案指示用 ©以控制話音解碼器Rl〇的一對選擇器9〇a及鳩以選擇活動 訊框解碼器70及不活動訊框解碼器8〇中的一者之實例。注 意,話音解碼器R10之軟體或韌體實施例可使用編碼方案 指示來引導向訊框解碼器中之一者或另一者之執行流程, 且此種實施例可能不包括針對選擇器9〇a及/或選擇器9〇b 之類比。圖12B展示支援對以多重編碼方案進行編碼之活 動讯框的解碼之話音解碼器R1 〇之實施例R2〇的實例,其 特徵可包括於本文描述之其他話音解碼器實施例中之任一 ® 者中。語音解碼器R20包括編碼方案偵測器60之實施例 62 ;選擇器90a、90b之實施例92a、92b ·,及活動訊框解碼 器70之實施例70a、70b,其經組態以使用不同編碼方案 (例如,全速率CELP及半速率NELP)來解碼經編碼之訊 框。 活動訊框解碼器70或不活動訊框解碼器8〇之典型實施例 經組態以自經編碼訊框提取LPC係數值(例如,經由反量 化,繼之以經反量化向量向LPC係數值形式之轉換),且使 134863.doc -49- 200933610 用彼等值來組態合成濾波器。根據來自經編碼訊框之其他 值及/或基於偽隨機雜訊信號計算或生成之激勵信號用來 激勵合成濾、波器以再現相應經解碼訊框。 注意,兩個或兩個以上之訊框解碼器可共用共同結構。 舉例而言,解碼器70及8〇(或解碼器70a、7〇1)及8〇)可共用 LPC係數值之計算器,其可能經組態以產生對於活動訊框 與不活動訊框具有不同階數之結果,但具有分別不同之時 間描述計算H。亦注意,言舌音解碼器R1〇之軟體或勒體實 ❹施例可使用編碼方案偵測器6〇之輸出來引導向訊框解碼器 中之一者或另一者之執行流程,且此種實施例可能不包括 針對選擇器90a及/或選擇器901)之類比。 圖13B展示根據一般組態之裝置R1〇〇(亦稱為解碼器、解 碼裝置或用於解碼之裝置)之方塊圖。裝置尺1〇〇經組態以 自經解碼音訊信號su〇移除現存背景聲音且將其取代為可 能類似於或不同於現存背景聲音之所生成背景聲音。除話 ❹音解碼器R10之元件之外,裝置R100包括經組態及配置以 處理音訊信號siio以產生背景聲音增強音訊信號8115之背 景聲曰處理器100之實施例200。包括裝置尺100之諸如蜂巢 式電話的通信器件可經組態以對自有線、無線或光學傳輸 頻道(例如,經由一或多個載波之射頻解調變)接收之信號 執行處理操作,諸如錯誤校正、冗餘及/或協定(例如,以 太網路、TCP/IP、CDMA2000)編碼,以獲得經編碼音訊信 號 S20。 ° 〇 如圖WA中所展示,背景聲音處理器2〇0可經組態以包括 134863.doc -50- 200933610 背景聲音抑制器no之例項210,背景聲音生成器ι2〇之例 項220及背景聲音混合器190之例項290,其中此等例項根 據上文關於圖3B及圖4B描述之各種實施例中的任一者進 行組態(除背景聲音抑制器11 〇之實施例以外,其使用來自 如上文所描述之可能不適用於裝置R100中的多重麥克風之 信號)。舉例而言’背景聲音處理器200可包括經組態以對 音訊信號S110執行如上文關於雜訊抑制器1〇所描述之雜訊 抑制操作的冒進實施例(諸如維納(Wiener)濾波操作)以獲 © 得背景聲音受抑制音訊信號S113之背景聲音抑制器11〇的 實施例。在另一實例中’背景聲音處理器200包括背景聲 音抑制器11 0之實施例,背景聲音抑制器丨丨〇之該實施例經 組態以根據如上文所描述之現存背景聲音的統計學描述 (例如,音訊信號S110之一或多個不活動訊框)對音訊信號 S110執行頻譜相減操作以獲得背景聲音受抑制音訊信號 S113。另外或在對於任一此種情形之替代例中背景聲音 處理器200可經組態以對音訊信號su〇執行如上文所描述 之中心截波操作。 如上文關於背景聲音抑制器1 00所描述,可能需要將背 景聲音抑制器200實施為可在兩個或兩個以上不同操作模 式中進行組態(例如,自無背景聲音抑制至實質上完全背 景聲音抑制之範圍)。圖14B展示裝置尺1〇〇之實施例R11〇的 方塊圖,裝置R100包括經組態以根據處理控制信號S3〇之 例項S130的狀態進行操作之背景聲音抑制器ιΐ2的例項212 及背景聲音生成器122的例項222。 134863.doc 51 200933610 背景聲音生成器220經組態以根據背景聲音選擇信號S4〇 之例項S140之狀態’產生所生成背景聲音信號S5〇之例項 S150。控制兩個或兩個以上背景聲音中之至少一者之選擇 的背景聲音選擇信號S140的狀態可能係基於一或多個準 則’諸如:關於包括裝置R1〇〇之器件之實體位置的資訊 (例如,基於GPS及/或上文論述之其他資訊)、使不同時間 或時間週期與相應背景聲音相關聯之排程、呼叫者之識別 碼(例如,如經由呼叫號碼識別(CNID)進行判定,亦稱為 © ”自動號碼識別"(ANI)或呼叫者識別發信號)、使用者選擇 之設定或模式(諸如商務模式、舒緩模式、聚會模式),及/ 或一列兩個或兩個以上背景聲音中之一者的使用者選擇 (例如,經由諸如選單之圖形使用者介面)。舉例而言,裝 置R1 00可經實施以包括如上文所描述之使此種準則之值與 不同背景聲音相關聯之背景聲音選擇器33〇的例項。在另 一實例中’裝置R100經實施以包括如上文所描述之經組態 以基於音訊信號S110之現存背景聲音之一或多個特性(例 ® 如,關於音訊信號sll〇之一或多個不活動訊框之一或多個 時間及/或頻率特性的資訊)生成背景聲音選擇信號sl4〇之 背景聲音分類器320的例項。背景聲音生成器22〇可根據如 上文所描述之背景聲音生成器120之各種實施例中之任一 者進行組態。舉例而言,背景聲音生成器22〇可經組態以 自本地儲存器擷取描述所選背景聲音之參數值,或自諸如 伺服器之外部器件下載此等參數值(例如,經由Sip)。可能 需要組態背景聲音生成器220,以分別使產生背景聲音選 134863.doc 52· 200933610 擇信號S50之起始及終止與 儿與通k會話(例如 開始及結束同步。 (灼如,電話呼叫)之 處理控制信號S130控制昔晷敫立α 用电傳㈣^立 聲音抑制器212之操作以啟 用或停用者景聲音抑制(亦即, 夕Ϊ目六办且热Α 乂輸出具有音訊信號S110 之見存皮景聲音或者取代背 年曰< 9訊k唬)。如圖14Β 〒所展示,處理控制信號sn 豸130亦可經配置以啟用或停用背 景聲音生成器222。或者,哲具致立、^ 者景聲曰選擇信號S 140可經組 態以包括選擇背景聲音生成器 ❹ Ο ^ 玍成*器220之空輸出之狀態,或者 旁景聲σ器290可經組態以將處理控制信號§㈣接收 為如上文關於背景聲音混合器19〇所描述之啟用/停用控制 輸入。處理控制信號8130可經實施以具有一個以上狀態, 使得其可用以改變由背景聲音抑制器212執行之抑制之等 級。裝置R1G0之另外的實施例可經組態以根據接收器處周 圍聲音之等級控制背景聲音抑制的等級,及/或所生成背 景聲音信號S150之等級。舉例而言,此種實施例可經組態 以控制音訊信號S11 5之SNR與周圍聲音之等級成反比關係 (例如,如使用來自包括裝置R1 00之器件之麥克風的信號 進行感測)。亦明確地指出,當選擇使用人工背景聲音 時’可將不活動訊框解碼器80斷電。 一般而言,裝置R100可經組態以藉由根據適當編碼方案 解碼每一訊框、抑制現存背景聲音(可能抑制可變之程度) 及根據某一等級添加所生成背景聲音信號S150而處理活動 訊框。對於不活動訊框而言,裝置R100可經實施以解碼每 一訊框(或每一 SID訊框)及添加所生成背景聲音信號 134863.doc • 53· 200933610 SI 50。或者’裝置Ri〇〇可經實施以忽略或丟棄不活動訊 框’且將其取代為所生成背景聲音信號S150。舉例而言, 圖15展示經組態以在選擇背景聲音抑制時丟棄不活動訊拖 解碼器80之輸出的裝置R200之實施例。此實例包括經組態 以根據處理控制信號S1 30之狀態選擇所生成背景聲音信號 S1 50及不活動訊框解碼器80的輸出中的一者之選擇器 250 ° 裝置R1 00之另外的實施例可經組態以使用來自經解鳴音 〇 訊信號之一或多個不活動訊框的資訊來改良由背景聲音抑 制器210應用之用於活動訊框中的背景聲音抑制之雜訊模 型。另外或在替代例中,裝置R100之此等另外的實施例可 經組態以使用來自經解碼音訊信號之一或多個不活動訊框 的資訊來控制所生成背景聲音信號S 1 50之等級(例如,以 控制背景聲音增強音訊信號S115之SNR) »裝置Rl〇〇亦可 經實施以使用來自經解碼音訊信號之不活動訊框的背景聲 音資訊來補充經解碼音訊信號之一或多個活動訊框及/或 ◎ 經解碼音訊信號之一或多個其他不活動訊框内的現存背景 聲音。舉例而言,此種實施例可用以取代已歸因於如傳輸 器處之過度冒進雜訊抑制及/或不足的編碼速率或SID傳輸 速率之因素而丟失的現存背景聲音。 如上所述’裝置R100可經組態以在產生經編碼音訊信號 S20之編碼器不作用及/或不改變之情形下執行背景聲音增 強或取代。裝置R100之此種實施例可包括於經組態以在相 應傳輸器(自其處接收信號S20)不作用及/或不改變的情形 134863.doc -54- 200933610 下執行背景聲音增強或取代之接收器内。或者,裝置R1〇〇 可經組態以獨立地或根據編碼器控制而下載背景聲音參數 值(例如,自SIP伺服器),及/或此種接收器可經組態以獨 立地或根據傳輸器控制而下載背景聲音參數值(例如,自 SIP伺服器)。在此等情形下,SIP伺服器或其他參數值源 可經組態以使得編碼器或傳輸器之背景聲音選擇優先於解 碼器或接收器之背景聲音選擇。 可能需要根據本文描述之原理(例如,根據裝置X100及 © R1GG之實施例)實施在f景聲音增強及/或取代的操作上進 行協作之話音編碼器及解碼器。在此種系統内,可將指示 所要背景聲音之資訊傳送至呈若干不同形式中之任一者之 解碼器。在第一類實例中,將背景聲音資訊傳送為描述, 該描述包括一組參數值,諸如LSF值及相應能量值序列之 向量:例如,靜寂描述符或SID),或諸如平均序列及相應 組之詳細序列(如圖10之MRA樹實例中所展示)。一組參數 〇值(例如,向量)可經量化以供傳輸為-或多個碼薄索引。 在第二類實例中,將背景聲音資訊作為一或多個背景聲 音識別符(亦稱為”背景聲音選擇資訊")傳送至 、 將背景聲音識別符實施為對應於兩個或兩個以 背:聲音之清單中之特定項目的索引。在此等情形下:索 引π單項目(其可儲存於本地或儲存於解碼器外部)可包括 包,-組參數值之相應背景聲音之描述。另外或在一或多 個背景聲音識別符之#代例中’音訊背景聲音選擇資訊可 包括指示編碼器之實體位置及/或背景聲音模式之資訊。 I34863.doc 55· 200933610 立在此等類中之任一者中,可直接及/或間接地將背景聲 1資訊自編碼器傳送至解碼器。在直接傳輸中,編碼器將 背景聲音資訊在經編碼音訊信號S2〇内(亦即,經由相同邏 輯頻道及經由與話音分量相同之協定堆10及/或經 傳輸頻道(例如,可使用不同協定之資料頻道或其他單獨 邏輯頻道)發送至解碼器。圖16展示經組態以經由不同邏 輯頻道(例如,在相同無線信號内或在不同信號内)傳輸所 選a訊奇景聲音之話音分量及經編碼(例如,經量化)參數 © 值的裝置Xl〇〇之實施例X200的方塊圖。在此特定實例 中’裝置X200包括如上文所描述之處理控制信號生成器 340之例項。 圖16中展示之裝置χ2〇〇之實施例包括背景聲音編碼器 150 °在此實例中’背景聲音編碼器ι5〇經組態以產生基於 背景聲音描述(例如’ 一組背景聲音參數值S7〇)之經編碼 皮景聲音信號S 8 0。背景聲音編瑪器15 〇可經組態以根據認 為適於特定應用之任何編碼方案產生經編碼背景聲音信號 〇 S80 °此種編碼方案可包括諸如霍夫曼(Huffman)編碼、算 術編碼、範圍編碼(range encoding)及行程編碼(run-lengthencoding)之一或 多個壓 縮操作 。 此種 編碼方案可為有損及/ 或無損的。此種編碼方案可經組態以產生具有固定長度之 結果及/或具有可變長度之結果。此種編碼方案可包括量 化背景聲音描述之至少一部分。 背景聲音編碼器150亦可經組態以執行背景聲音資訊之 協定編碼(例如,在運輸層及/或應用層處)。在此種情形 134863.doc -56- 200933610 下’背景聲音編碼器150可經組態以執行諸如封包形成及/ 或交握之-或多個相關操作。甚至可能需要組態背景聲音 編碼器150之此種實施例以發送背景聲音資訊而不執行任 何其他編碼操作。 圖17展示經組態以將識別或描述所選背景聲音之資訊編 碼為經編碼音訊信號S2〇的對應於音訊信號si〇之不活動訊 框的訊框週期之裝置xl〇〇的另一實施例χ2ι〇之方塊圖。 此等訊框週期在本文亦稱為"經編碼音訊信號S20之不活動 ❹訊框”。在-些情形下,可能在解碼器處導致延遲,直至 已接收所it背景聲音之足夠量之描述用於背景聲音生成。 在一相關實例中,裝置X210經組態以發送對應於本地地 儲存於解碼器處及/或自諸如伺服器之另一器件下載之背 景聲音描述(例如,在呼叫建立期間)之初始背景聲音識別 符,且亦經組態以發送對該背景聲音描述之隨後更新(例 如,經由經編碼音訊信號S20之不活動訊框圖18展示經 組態以將音訊背景聲音選擇資訊(例如,所選背景聲音之 識別符)編碼為經編碼音訊信號S2〇之不活動訊框的裝置 X100之相關實施例Χ220的方塊圖。在此種情形下,裝置 Χ220可經組態以在通信會話之過程期間(甚至自一訊框至 下一訊框)更新背景聲音識別符。 圖18中展示之裝置Χ220的實施例包括背景聲音編碼器 150之實施例152。背景聲音編碼器152經組態以產生基於 音訊背景聲音選擇資訊(例如,背景聲音選擇信號S4〇)之 經編碼背景聲音信號S80之例項S82,其可包括一或多個背 134863.doc •57 · 200933610 景聲音識別符及/或其他諸如實體位置及/或背景聲音模式 之指示之資訊。如上文關於背景聲音編碼器150所描述, 背景聲音編碼器丨5 2可經組態以根據認為適於特定應用及/ 或可經組態以執行背景聲音選擇資訊之協定編碼的任何編 碼方案產生經編碼背景聲音信號S82。 經組1、以將责景聲音資訊編碼為經編碼音訊信號s2〇之 不活動訊框的裝置Xl〇〇之實施例可經組態以編碼每一不活 ❹ ❹ 動訊框内之此種背景聲音資訊或不連續地編碼此種背景聲 音資訊。在不連續傳輸(DTX)之一實例中,裝置χι〇〇之此 種實施例經組態以根據規則間隔(諸如每五秒或十秒,或 每128或256個訊框)將識別或描述所選背景聲音之資訊編 碼為經編碼音訊信號S2〇的一或多個不活動訊框之序列。 在不連續傳輸(DTX)之另一實例中,裝置χι〇〇之此種實施 例經組態以根據諸如不同背景聲音的選擇之某一事件將此 種資訊編碼為經編碼音訊信號S2〇的一或多個不活動訊框 之序列。 裝置X210及X220經組態以根據處理控制信號S3〇之狀態 執行現存背景聲音之編碼(亦即,舊版操作)或背景聲音取 代。在此等情形下,經編碼音訊信號S2〇可包括指示不活 動訊框是否包括現存背景聲音或關於取代背景聲音之資訊 之旗標(例如,可能包括於每一不活動訊框中之一或多個 位元)。圖19及圖20展示組態為在不活動訊框期間不支援 現存背景聲音之傳輸的相應裝置(分別為裝置χ3〇〇及裝置 Χ300之實施例Χ310)之方塊圖。在圖19之實例中活動訊 134863.doc 58 200933610 框編碼器30經組態以產生第一經編碼音訊信號S2〇a,且編 碼方案選擇器20經組態以控制選擇器501)將經編碼背景聲 音信號S80插入於第一經編碼音訊信號S2〇a之不活動訊框 中以產生第二經編碼音訊信號S20b。在圖20之實例中,活 動訊框編碼器30經組態以產生第一經編碼音訊信號S2〇a, 且編碼方案選擇器20經組態以控制選擇器5〇b將經編碼背 景聲音信號S82插入於第一經編碼音訊信號82〇&之不活動
❹ 气忙中以產生第一經編碼音訊信號;§ 2 0 b。在此等實例中, 可鲍需要組態活動訊框編碼器3 〇而以封包化形式(例如, 作為一系列經編碼訊框)產生第一經編碼音訊信號2〇a。在 此等情形下,選擇器5〇b可經組態以如編碼方案選擇器2〇 所指示將經編碼背景聲音信號插入於第一經編碼音訊信號 S20a之對應於背景聲音受抑制信號的不活動訊框之封包 (例如,經編碼訊框)内的適當位置處,或者選擇器5〇b可經 組態以如編碼方案選擇器20所指示將由背景聲音編碼器 1 50或1 52產生之封包(例如,經編碼訊框)插入於第一經編 碼音訊信號S20a内的適當位置處◎如上所述,經編碼背景 聲音信號S80可包括關於經編碼背景聲音㊣號_之資訊 (諸如描述所選音矾背景聲音之一組參數值),且經編碼背 景聲音信號S82可包括關於經編碼背景聲音信號S8〇之資訊 (諸如識別-組音訊背景聲音中的__所選背景聲音之背景 聲音識別符)。 不 在門接傳輸中’解碼器不僅經由與經編碼音訊信號S20 同之邏輯頻道而且亦自諸如伺服器之不同實體接收背景 134863.doc -59- 200933610 聲音資訊。舉例而t,解碼器可經組態以使用編碼器之識 別符(例如,統一資源識別符(URI)或統一資源定位符 (URL)如RFC 3986中所描述,以www」etf 〇rg線上可 得)、解碼器之識別符(例如,URL)及/或特定通信會話之 識別符來請求來自飼服器的背景聲音資訊。圖2ia展示解 碼器根據經由協定堆疊P2〇及經由第一邏輯㈣自編❹ 〇 接收之資訊而經由較堆疊piQ(例如,在背景聲音生成器 220及/或背景聲音解碼器加内)及經由第二邏輯頻道自伺 服器下載背景聲音資訊之實例Q堆疊ρι〇及p2〇可為分離的 或可共用一或多個層(例如’實體層、媒體存取控制層及 邏輯鏈路層t之-或多者)。可使用諸如sip之協定執行可 以類似於下载鈐聲或音樂樓案或流的方式執行之背景聲音 資訊自伺服器至解碼器的下載。 在其他實例中’可藉由直接與間接傳輸之某一組合將背 景聲音資訊自編碼器傳送至解碼器。在_ —般實例中 碼器將背景聲音資訊以—形式(例如,如音訊背景聲 擇資訊)發送至系統内之諸如飼服器之另一器件,且其他 器件將相應背景聲音資訊以另一形式(例如,作為背 音描述)發送至解碼器。在此種傳送之特定實例中,伺服 器經組態以將料^資讀心解Μ**純用 自解碼器之資訊之請求(亦稱為"推送")。舉例而言,词服 器可經組態以在呼叫建立期間將背景聲音資訊推送至解碼 器。圖2職示伺服器根據編碼器經由協定堆疊P30(例 如,在背景聲音編碼器152内)及經由第三邏輯頻道發送之 134863.doc -60- 200933610 可包括解瑪器的URL或其他識別符之資訊將背景聲音資訊 經由第二邏輯頻道下載至解碼器之實例。在此種情形下, 可使用諸如SIP的協定執行自編碼器至伺服器之傳送及/或 自伺服器至解碼器之傳送。此實例亦說明經編碼音訊信號 S20經由協定堆疊P4〇及經由第一邏輯頻道自編碼器至解碼 器之傳輸。堆疊P30及P40可為分離的,或可共用一或多個 層(例如,實體層、媒體存取控制層及邏輯鏈路層中之一 或多者)。
如圖21B中所展示之編碼器可經組態以藉由在呼叫建立 期間將INVITE訊息發送至伺服器而起始SIp會話。在一此 種實施例中,編碼器將諸如f景聲音識別符或實體位置 (例如,作為一組GPS座標)之音訊背景聲音選擇資訊發送 至伺服器。編碼器亦可將諸如解碼器之聰及/或編碼器之 聰的實體識別資訊發送至聽器。若伺服器支援所選音 訊背景聲音’則其將ACK訊息發送至編碼器,且sip會話 =碼器_解碼H系統可經組態以藉由㈣編碼器處之現 子背景聲音或藉由抑制解碼器處之現存背景聲音而處理活 7桓。可藉由在編碼器處(而非解碼器處)執行背景聲音 實現—或多個潛在優點。舉例而言,活動訊框編瑪 預期達成對背景聲音受抑制音訊信號比對現存背景 (例如’盲源分離)之更佳的抑制技術。亦可能需要說話者 134863.doc -61 - 200933610 此夠k到與收聽者將聽到之背景聲音受 之背景簦立典& 活曰分量相同 才景聲曰受抑制話音分量’且在編 抑制可用LV ± Μ , 乂爷1仃者景聲音 支援此種特徵。當然,在編碼器及解碼器雨去 ^施背景聲音抑制亦係可能的。 " 可能需要在編碼器-解碼器系統内所 S150在編碼器及解 京聲《 #戒 ^ 及解碼器兩者處皆可用。舉例而言,
要說話者能夠聽到與收聽者將聽到之背景聲音增強立 號相同之背景聲音增強音訊信號。在此種情形下,所選; :聲音之描述可儲存於及,或下載至編碼器及解碼= 此外,可&需要組態背景聲音生成器22〇以確定地產 生所^成背景聲音信號815(),以使得在解碼器處執行之背 景聲音生成操作可在編碼器處進行複製。舉例而言,背景 聲音生成器22G可經組態以使用對於編碼器及解碼器兩者 皆已知之一或多個值(例如,經編碼音訊信號“Ο之一或多 個值)以計算可使用於生成操作中之任何隨機值或信號(諸 如用於CTFLP合成之隨機激勵信號)。 編碼器-解碼器系統可經組態而以若干不同方式中之任 者處理不活動訊框。舉例而言,編碼器可經組態以將現 存背景聲音包括於經編碼音訊信號S2〇内。包括現存背景 聲音可能對於支援舊版操作為需要的。此外,如上文所論 述,解碼器可經組態以使用現存背景聲音來支援背景聲音 抑制操作。 或者,編碼器可經組態以使用經編碼音訊信號S2〇之不 活動訊框中之一或多者來載運關於所選背景聲音之資訊 134863.doc •62- 200933610 (諸如一或多個背景聲音識別符及/或描述)。如圖i9中所展 不之裝置X300為不傳輸現存背景聲音的編碼器之一實例。 如上所述,不活動訊框中背景聲音識別符之編碼可用以在 諸如電話呼叫4通信會話肖間支援更新所生成《背景聲音 仏號S150 ^相應解碼器可經組態以快速且甚至可能逐訊框 地執行此種更新。 在另一替代例中,編碼器可經組態以在不活動訊框期間 傳輸極少或不傳輸位元,其可允許編碼器使用更高編碼速 ©率用於活動訊框而不增加平均位元速率。視系統而定,編 碼器可能需要在每一不活動訊框期間包括某一最小數目之 位元以便維持連接。 可能需要諸如裝置χΐθθ之實施例(例如,裝置Χ2〇〇、 Χ210或Χ220)或Χ3〇〇的編碼器發送所選音訊背景聲音之等 級隨時間的改變之指示。此種編碼器可經組態以在經編碼 背景聲音信號S80内及/或經由不同邏輯頻道將此種資訊發 ❹送為參數值(例如,增益參數值)。在一實例中,所選背景 聲音之描述包括描述背景聲音的頻譜分布之資訊,且編碼 器經組態以將關於背景聲音之音訊等級隨時間的改變之資 訊發送為單獨時間描述(其可以與頻譜描述不同之速率進 行更新)°在另一實例中,所選背景聲音之描述描述背景 聲音在第一時間標度(例如,在訊框或類似長度之其他間 隔上)上之頻譜及時間特性兩者,且編碼器經組態以將關 於背景聲音之音訊等級在第二時間標度(例如,諸如自訊 框至訊框之較長時間標度)上的改變之資訊發送為單獨時 134863.doc •63 · 200933610 間描述。可使用包括用於每一訊框之背景聲音增益值之單 獨時間描述來實施此種實例。 在可應用至上文兩個實例中之任一者中之另一實例中, 使用不連績傳輸(在經編碼音訊信號S20之不活動訊框内或 經由第二邏輯頻道)發送對所選背景聲音之描述之更新, 且亦使用不連續傳輸(在經編碼音訊信號S2〇之不活動訊框 内,經由第二邏輯頻道,或經由另一邏輯頻道)發送對單 獨時間描述之更新,兩個描述以不同間隔及/或根據不同 © 事件進行更新。舉例而言,此種編碼器可經組態以比單獨 時間描述更不頻繁地更新所選背景聲音之描述(例如,每 512、1024或2048個訊框對每四個、八個或十六個訊框)。 此種編碼器之另一實例經組態以根據現存背景聲音的一或 多個頻率特性之改變(及/或根據使用者選擇)而更新所選背 景聲音之描述’且經組態以根據現存背景聲音的等級之改 變而更新單獨時間描述。 圖22、圖23及圖24說明經組態以執行背景聲音取代之用 於解碼的裝置之實例。圖22展示包括經組態以根據背景聲 音選擇信號S140之狀態產生所生成背景聲音信號sl5〇的背 景聲音生成器220之例項的裝置R3〇〇之方塊圖。圖23展示 包括背景聲音抑制器210之實施例218的裝置R3〇〇之實施例 R3io的方塊圖。背景聲音抑制器218經組態以使用來自不 活動訊框之現存背景聲音資訊(例如,現存背景聲音之頻 譜分布)來支援背景聲音抑制操作(例如,頻譜相減)。 圖22及圖23中展示之裝置R3 00及R3 10之實施例亦包括 134863.doc -64- 200933610 背景聲音解碼器252。背景聲音解碼器252經組態以執行經 編碼背景聲音信號S80之資料及/或協定解碼(例如,與上文 關於者景聲音編碼152描述之編瑪操作互補)以產生背景 聲音選擇信號S140。其他碑另外,裝置R300及R31〇可經 實施以包括與如上文所描述之背景聲音編碼器15〇互補之 背景聲音解碼器250,其經組態以基於經編鳴背景聲音信 被S 8 0之相應例項產生背景聲音描述(例如,一組背景聲音 參數值)。 〇 圖24展示包括背景聲音生成器220之實施例228的話音解 碼器R300之實施例R320的方塊圖。背景聲音生成器228經 組態以使用來自不活動訊框之現存背景聲音資訊(例如, 關於現存背景聲音之能量在時域及/或頻域中的分布之資 訊)來支援背景聲音生成操作》 如本文描述之用於編碼的裝置(例如,裝置χ100及X3〇〇) 及用於解碼的裝置(例如,裝置R100、R200及R300)之實施 例的各種元件可實施為駐留於(例如)同一晶片上或晶片組 ® 中之兩個或兩個以上晶片中的電子及/或光學器件,但亦 可預期沒有此種限制之其他配置《此種裝置之一或多個元 件可整個地或部分地實施為經配置以在邏輯元件(例如, 電晶體、閘)的一或多個固定或可程式化陣列上執行之一 或多個組指令’該等邏輯元件諸如微處理器、嵌埋式處理 器、IP核心、數位信號處理器、FPGA(場可程式化閘陣 列)、ASSP(特殊應用標準產品)及ASIC(特殊應用積體電 路)0 134863.doc -65· 200933610
❹ 此種裝置之實施例的一或多個元件用以執行任務或執 與裝置之操作不直接相關的其他組指令(諸如關於農 钱埋於其中之器件或系統之另一操作之任務)係可能的。 此種裝置之實施例之一或多個元件具有共同結構(例如, 用以執行在不同時間對應於不同元件之程式碼部分之處理 器,經執行以執行在不同時間對應於不同元件之任務之一 組指令,或在不同時間執行不同元件之操作的電子及/或 光學器件之配置)亦係可能的。在—實例中,背景聲音抑 制器m、背景聲音生成器12〇及背景聲音混合器⑽實施 為經配'以在同一處理器上執行之指令組。在另一實例 中’背景聲音處理11100及話音編碼器X1Q經實施為經配置 以在同-處理器上執行之指令組。在另一實例中,背景聲 音處理器200及話音解碼器R1Q實施為經配置以在同一處理 器上執行之指令組。在另一實例中,背 ⑽、話音編碼器X1G及話音解碼器⑽實施為經配置以在 同一處理器上執行之指令組。在另—實例中活動訊框編 碼器30及不活動訊框編碼㈣經實施以包括在不同時間執 行之相同組之和令。在另一實例中,活動訊框解碼器川及 不活動訊框解碼請經實施以包括在不,間執行之相同 組之指令。 用於無線通1&之||件(諸如蜂巢式電話或具有此種通信 能力之其他器件)可經組態以包括編碼器(例如,裝置χι〇〇 或Χ300之實施例)及解碼器(例如,裝置Μ 〇〇、R2〇〇或 R300之實施例)兩者。在此種情形下,編碼器及解碼器具 134863.doc -66 - 200933610 有共同結構係可能的。在一此種實例中,編碼器及解碼器 經實施以包括經配置以在同一處理器上執行之指令組。 本文描述之各種編碼器及解碼器的操作亦可視作信號處 理方法的特定實例。此種方法可實施為一組任務,其—或 多者(可能全部)可由邏輯元件(例如,處理器、微處理器、 微控制器或其他有限狀態機)之一或多個陣列執行。任務 中之一或多者(可能全部)亦可實施為可由邏輯元件之一或 夕個陣列執行之程式碼(例如,一或多個指令組),程式巧 〇 可有形地實施於資料儲存媒體中。 圖25Α展示根據所揭示組態之處理包括第一音訊背景聲 音的數位音訊信號之方法Α1〇〇的流程圖。方法αι〇〇包括 任務八11〇及八120。基於第一麥克風產生之第一音訊信 號,任務Α110自數位音訊信號抑制第一音訊背景聲音以獲 得责景聲s爻抑制信號。任務Α120混合第二音訊背景聲音 與基於背景聲音受抑制信號之信號以獲得背景聲音增強信 〇 號。在此方法中,數位音訊信號係基於由不同於第一麥克 風之第二麥克風產生之第二音訊信號。舉例而言,可藉由 如本文描述之裝置X100或Χ300之實施例執行方法Ai〇〇。 圖25B展示根據所揭示組態用於處理包括第一音訊背景 聲音之數位音訊信號的裝置AM1〇〇i方塊圖。裝置ami〇〇 包括用於執行方法A1〇〇之各種任務之構件。裝置包 括用於基於由第一麥克風產生之第一音訊信號自數位音訊 信號抑制第一音訊背景聲音以獲得背景聲音受抑制信號之 構件AM10。裝置AMl〇〇包括用於混合第二音訊背景聲音 134863.doc -67- 200933610 與基於背景聲音受抑制信號之信號以獲得背景聲音增強信 號之構件AM20。在此裝置中,數位音訊信號係基於由不 同於第一麥克風之第二麥克風產生之第二音訊信號。可使 用能夠執行此等任務之任何結構實施裝置AM100之各種元 件’該等結構包括用於執行本文揭示之此等任務的結構中 之任一者(例如,一或多個指令組、邏輯元件之一或多個 陣列等)。裝置AM100之各種元件之實例在本文中揭示於 裝置X100及Χ3〇〇之描述中。 © 圖26A展示根據所揭示組態之根據處理控制信號的狀態 處理數位音訊信號之方法B1〇〇的流程圖,該數位音訊信號 具有話音分量及背景聲音分量。方法B1 〇〇包括任務B110、 B120、B130及B14C^任務Bll〇在處理控制信號具有第一 狀態時以第一位元速率編碼缺少話音分量之數位音訊信號 部分之訊框。任務B120在處理控制信號具有不同於第一狀 態之第二狀態時自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號。任務B130在處理控制信號具有第二 狀態時混合音訊背景聲音信號與基於背景聲音受抑制信號 之信號以獲得背景聲音增強信號。任務B 14〇在處理控制信 號具有第二狀態時以第二位元速率編碼缺少話音分量之背 景聲音增強信號部分之訊框,第二位元速率高於第一位元 速率。舉例而言,可藉由如本文描述之裝置X丨〇〇之實施例 執行方法B100。 圖26B展示根據所揭示組態之用於根據處理控制信號的 狀態處理數位音訊信號之裝置BM100的方塊圖,該數位音 134863.doc -68 · 200933610 訊信號具有話音分量及背景聲音分量。裝置BMl 00包括用 於在處理控制信號具有第一狀態時以第一位元速率編碼缺 少話音分量之數位音訊信號部分之訊框的構件BM10。裝 置BM1 00包括用於在處理控制信號具有不同於第一狀態之 第二狀態時自數位音訊信號抑制背景聲音分量以獲得背景 聲音受抑制信號之構件BM20。裝置BM100包括用於在處 理控制信號具有第二狀態時混合音訊背景聲音信號與基於 Ο
背景聲音受抑制信號之信號以獲得背景聲音增強信號之構 件BM30。裝置BM100包括用於在處理控制信號具有第二 狀態時以第二位元速率編碼缺少話音分量之背景聲音增強 信號部分之訊框的構件BM40,第二位元速率高於第一位 元速率。可使用能夠執行此種任務之任何結構實施裝置 BM1 00之各種元件’該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、邏輯 儿件之一或多個陣列等)。裝置BM1〇〇之各種元件的實例 在本文中揭示於裝置XI 00之描述中。 圖27A展示根據所揭示組態之處理基於自第一轉換器接 收的信號之數位音訊信號的方法cl〇〇之流程圖。方法 C100包括任務C110、C120、C13(^C140。任務cii〇自數 =音訊信號抑㈣-音訊背景聲音以獲得f景聲音受抑制 L號 壬務C120混合第二音訊背景聲音與基於背景聲音受 抑制信號之信號以獲得背景聲音增強信號。任務cn〇將基 於⑷第二音訊背景聲音及(B)背景聲音增強信號中的至少 一者之信號轉換為類比信號。任務CU0自第二轉換器產生 134863.doc -69 - 200933610 基於該類比信號之可聞信號。在此方法中,第一及第二轉 換器兩者位於共同外殼内。舉例而言,可藉由如本文描述 之裝置又100或乂300之實施例執行方法€100。 圖27B展示根據所揭示組態之用於處理基於自第一轉換 器接收的信號之數位音訊信號的裝置CM100之方塊圖。裝 置CM100包括用於執行方法C100之各種任務之構件。裝置 CM 100包括用於自數位音訊信號抑制第一音訊背景聲音以 獲得背景聲音受抑制信號之構件CM10。裝置CM100包括 © 用於混合第二音訊背景聲音與基於背景聲音受抑制信號之 信號以獲得背景聲音增強信號之構件CM20。裝置CM 100 包括用於將基於(A)第二音訊背景聲音及(B)背景聲音增強 仏號中的至少一者之信號轉換為類比信號的構件CM3 〇。 裝置CM1 00包括用於自第二轉換器產生基於類比信號之可 聞信號之構件CM40。在此裝置中,第一及第二轉換器兩 者位於共同外殼内。可使用能夠執行此等任務之任何結構 實施裝置CM100之各種元件,該等結構包括用於執行本文 揭示之此等任務的結構中之任一者(例如,一或多個指令 組、邏輯元件之一或多個陣列等)β裝置CM1〇〇之各種元 件的實例在本文中揭示於裝置幻〇〇及幻〇〇之描述中。 圖2 8 Α展示根據所揭示組態之處理經編碼音訊信號的方 法D100之流程圖。方法D1〇〇包括任務Du〇、di2〇及 D13 0任務D11 〇根據第一編碼方案解碼經編碼音訊信號 之第一複數個經編碼訊框以獲得包括話音分量及背景聲音 分量之第-經解碼音訊信號。任務m2〇根據第二編碼方案 134863.doc •70· 200933610 解碼經編碼音訊信號之第二、複數個經編碼訊框以獲得第二 經解碼音訊信號。基於來自第二經解碼音訊信號之資訊, 任務D130自基於第一經解碼音訊信號之第三信號抑制背景 聲音分量以獲得背景聲音受抑制信號。舉例而言,可藉由 如本文描述之裝置Rl〇0、汉2〇〇或幻〇〇之實施例執行方法 D100 〇 圖28B展示根據所揭示組態之用於處理經編碼音訊信號 的裝置DM100之方塊圖。裝置DM1〇〇包括用於執行方法 O D100之各種任務之構件。裝置DM100包括用於根據第一編 碼方案解碼經編碼音訊信號之第一複數個經編碼訊框以獲 得包括話量及背景聲音分量的帛—經解碼音訊信號之 構件DM1G。裝置麵⑽包括用於根據第二編碼方案解碼 經編碼音訊信號之第二複數個經編碼訊框以獲得第二經解 碼音訊信號之構件DM2〇e裝置DM1〇〇包括用於基於來自 第二經解碼音訊信號之資訊自基於第一解碼音訊信號的第 ◎三信號抑制背景聲音分量以獲得背景聲音受抑制信號之構 件DM30。可使用能夠執行此等任務之任何結構實施裝置 DM100之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、邏輯 元件之一或多個陣列等裝置DM1〇〇之各種元件的實例 在本文中揭示於裝置R100、R2〇〇&R3〇〇之描述中。 圖29A展示根據所揭示組態之處理包括話音分量及背景 聲曰刀量的數位音訊信號之方法E1〇〇的流程圖。方法ei〇〇 包括任務E110、E120、E13〇及E14〇。任務En〇自數位音 134863.doc •71 - 200933610 §孔k號抑制背景聲音分量以獲得背景聲音受抑制信號。任 務Ε120編碼基於背景聲音受抑制信號之信號以獲得經編碼 音訊信號。任務Ε130選擇複數個音訊背景聲音中的一者。 任務Ε140將關於所選音訊背景聲音之資訊插入於基於該經 編碼音訊信號之信號中。舉例而言’可藉由如本文描述之 裝置乂100或又3 00之實施例執行方法£100。 圖29Β展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置ΕΜ100的方塊圖。裝 ® 置EM100包括用於執行方法Ε100之各種任務之構件,裝置 ΕΜ1 00包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件ΕΜ10。裝置ΕΜ100包括用於 編碼基於背景聲音受抑制信號之信號以獲得經編碼音訊信 號之構件ΕΜ20。裝置ΕΜ100包括用於選擇複數個音訊背 景聲音中的一者之構件ΕΜ3 0。裝置ΕΜ100包括用於將關 於所選音訊背景聲音之資訊插入於基於該經編碼音訊信號 ◎ 的信號中之構件ΕΜ40。可使用能夠執行此等任務之任何 結構實施裝置ΕΜ100之各種元件,該等結構包括用於執行 本文揭示之此等任務的結構中之任一者(例如,一或多個 指令組、邏輯元件之一或多個陣列等)。裝置εΜ100之各 種元件的實例在本文中揭示於裝置X1 〇〇及X3〇〇之描述 中。 圖30Α展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法以〇〇的流程圖。方法Ε2〇〇 包括任務E110、E120、E150及E160。任務E150將經編碼 134863.doc •72· 200933610 音訊信號經由第一邏輯頻道發送至第一實體。任務E160向 第二實體且經由不同於第一邏輯頻道之第二邏輯頻道發送 (A)音訊背景聲音選擇資訊及(B)識別第一實體之資訊。舉 例而言,可藉由如本文描述之裝置X100或X300之實施例 執行方法E200。 圖30B展不根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置EM200的方塊圖。裝 置EM200包括用於執行方法E2〇〇之各種任務之構件。裝置 © EM200包括如上文所描述之構件EM1〇及EM2〇。裝置 EM200包括用於將編碼音訊信號經由第一邏輯頻道發送至 第一實體之構件EM50。裝置EM200包括用於向第二實體 且經由不同於第一邏輯頻道之第二邏輯頻道發送音訊 背景聲音選擇資訊及(B)識別第一實體的資訊之構件 EM60。可使用能夠執行此等任務之任何結構實施裝置 EM200之各種元件,該等結構包括用於執行本文揭示之此 ❹等任務的結構中之任一者(例如,一或多個指令組、邏輯 元件之一或多個陣列等)。裝置EM2〇〇之各種元件的實例 在本文中揭示於裝置X100及X3〇〇之描述中。 圖3 1A展示根據所揭示組態之處理經編碼音訊信號的方 法F100之流程圖。方法F1〇〇包括任務fu〇 fi2〇及Fi3〇。 在行動使用者終端機内,任務F11〇解碼經編碼音訊信號以 獲得經解碼音訊信號。在行動使用者終端機内,任務Fl2〇 生成音訊背景聲音信號。在行動使用者終端機内,任務 F130混合基於音訊背景聲音信號之信號與基於經解碼音訊 134863.doc •73· 200933610 信號之信號。舉例而古,π姑丄,, ° 可藉由如本文描述之裝置R1 〇〇 R200或R300之實施例執行方法fi〇〇。 圖31B展示根棱所姐 课所揭τ組態之用於處理經編媽音訊信號 且位於行動使用者終端機内的裝置__之胃。裝置 Ο
FM100包括用於執行方法F1〇〇之各種任務之構件。裝置 FM100包括用於解碼經編碼音訊信號以獲得經解碼音訊信 號之構件FM1G。裝括用於生成音訊背景聲音信 號之構件FM2G。裝置FM1⑻包括用於混合基於音訊背景聲 音信號之信號與基於經解碼音訊信號之信號的構件 FM30。可使用能夠執行此等任務之任何結構實施裝置 FM100之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、邏輯 7L件之一或多個陣列等)。裝置1?]^1〇〇之各種元件的實例在 本文中揭示於裝置Rl〇〇、R200及R3〇〇之描述中。 圖32A展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法G1 〇〇的流程圖。方法 G100包括任務G110、G120及G130。任務G100自數位音訊 信號抑制背景聲音分量以獲得背景聲音受抑制信號。任務 G120生成基於第一濾波及第一複數個序列之音訊背景聲音 仏號,該第一複數個序列中之每一者具有不同時間解析 度。任務G120包括將第一濾波應用至第一複數個序列中之 每一者。任務G13 0混合基於所生成音訊背景聲音信號之第 一信號與基於背景聲音受抑制信號之第二信號以獲得背景 聲音增強信號。舉例而言,可藉由如本文描述之裝置 134863.doc •74· 200933610 χιοο、x3〇o、Rioo、R200或R300之實施例執行方法 G1 00 ° ❹
圖32B展示根據所揭示組態之用於處理包括話音分量及 背景聲音分量的數位音訊信號之裝置〇]^1〇〇的方塊圖。裝 置GM100包括用於執行方法G1〇〇之各種任務之構件。裝置 GM100包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件GM10。裝置GM1〇〇包括用於 生成基於第一濾波及第一複數個序列之音訊背景聲音信號 之構件GM20,該第一複數個序列中之每一者具有不同時 間解析度。構件GM20包括用於將第一濾波應用至第一複 數個序列中之每-者之構件。裝置GM⑽包括用於混合基 於所生成B訊为景聲音信號之第一信號與基於背景聲音受 抑制k號之第二信號以獲得背景聲音增強信號之構件 GM3 0可使用能夠執行此等任務之任何結構實施裝置 GM100之各種元件,該等結構包括用於執行本文揭示之此 等任務的結構中之任一者(例如,一或多個指令組、邏輯 元件之一或多個陣列等)。裝置GM100之各種元件的實例 在本文中揭示於裝置X100、X300、Rl〇〇、R2〇〇及R3〇〇之 描述中0 士圖33 A展示根據所揭示組態之處理包括話音分量及背景 聲音分量的數位音訊信號之方法m〇〇的流程圖。方法 H100 包括任務 H110、H12〇、Hn〇、Hi4(^Hi5〇。任務 HI 10自數位音訊信號抑制背景聲音分量以獲得背景聲音受 抑制信號。任務H120生成音訊背景聲音信號。任務Hl3〇 134863.doc •75- 200933610 混合基於所生成音訊背景聲音信號之第一信號與基於背景 聲音受抑制信號之第二信號以獲得背景聲音増強信號。任 務H140計算基於數位音訊信號之第三信號之等級。任務 H120及H130中的至少一者包括基於第三信號之所計算等 級控制第一信號之等級。舉例而言,可藉由如本文描述之 裝置X100、X300、R100、R200或R300的實施例執行方法 H100。 圖3 3B展示根據所揭示組態之用於處理包括話音分量及 © 背景聲音分量的數位音訊信號之裝置HM100的方塊圖。裝 置HM100包括用於執行方法H100之各種任務之構件。裝置 HM100包括用於自數位音訊信號抑制背景聲音分量以獲得 背景聲音受抑制信號之構件HM10。裝置HM100包括用於 生成音訊背景聲音信號之構件HM20。裝置HM100包括用 於混合基於所生成音訊背景聲音信號之第一信號與基於背 景聲音受抑制信號之第二信號以獲得背景聲音增強信號的 構件HM30。裝置HM100包括用於計算基於數位音訊信號 之第三信號的等級之構件HM40。構件HM20及HM30中的 至少一者包括用於基於第三信號之所計算等級控制第一信 號的等級之構件。可使用能夠執行此等任務之任何結構實 施裝置HM100之各種元件,該等結構包括用於執行本文揭 示之此等任務的結構中之任一者(例如,一或多個指令 組、邏輯元件之一或多個陣列等)。裝置HM1 〇〇之各種元 件的實例在本文中揭示於裝置χι〇〇、χ3〇〇、R1〇〇、R2〇〇 及R3 00之描述中。 134863.doc •76- 200933610 提供所描述組態之前文陳述 能豹制^+ 任何熟習此項技術者 此夠“或使用本文揭示之方法及其他結構。本文展示且 描述之流程圖、方塊圖及其他 ’、 固夂具他結構僅為實例,且此等結構 之其他變體亦在本揭示牵之銘邊h “ 揭不案之範疇内。對此等組態之各種修 改係可能的,且亦可將本文呈 1 m. 身又原理應用至其他組
:。〇而言’強調本揭示案之範疇不限於所說明之组 也。相反’明確地預期且特此揭示,對於如本文描述之不 冋特定組態的特徵不彼此矛盾之任何情形而言’可植合此 等特徵以產生包括於本揭示案之料内的其他組態。舉例 而言,可組合背景聲音抑制、背景聲音生成及背景聲音混 合之各種组態中之任一者,只要此種組合不與本文中彼等 元件之描述矛盾即可。亦明確地預期且特此揭示,在連接 描述為在裝置之兩個或兩個以上元件之間的情況下,可能 存在-或多個介人元件(諸如驗器),且在連接描述為在 方法之兩個或兩個以上任務之間的情況下,可能存在一或 多個介入任務或操作(諸如濾波操作)。 可與如本文描述之編碼器及解碼器一起使用,或經調適 而與該等編碼器及解碼器一起使用的編解碼器之實例包 括如描述於上文提及之3Gpp2文件C.S0014-C中之增強 可變速率編解碼器(EVRC);如描述kETSI文件Ts 126 〇92 V6.0.0(第6早,2004年〗2月)中之調適性多重速率(AMR)話 音編解碼器’•及如描述於ETSI文件丁s 126 192 V6 〇 〇 (第6 章,2004年12月)中之AMR寬頻話音編解碼器。可與如本 文描述之編碼器及解碼器一起使用的無線電協定之實例包 134863.doc -77· 200933610 括臨時標準95(IS-95)及CDMA2000(如由電信產業協會 ((TIA),Arlington,VA)發布之規範中所描述)、AMR(如 ETSI文件TS 26.101中所描述)、GSM(全球行動通信系統, 如ETSI發布之規範中所描述)、UMTS(全球行動電信系 統,如ETSI發布之規範中所描述)及W-CDMA(寬頻分碼多 重存取’如由國際電信聯盟公布之規範中所描述)。 本文描述之組態可部分或整體地實施為硬連線電路、製 造於特殊應用積體電路中之電路組態,或載入於非揮發性 〇 儲存器中之韌體程式或作為機器可讀程式碼自電腦可讀媒 體載入或載入於電腦可讀媒體中之軟體程式,此種程式碼 為可由諸如微處理器或其他數位信號處理單元之邏輯元件 之陣列執行的指令。電腦可讀媒體可為諸如半導體記憶體 (其可包括(但不限於)動態或靜態RAM(隨機存取記憶體)、 ROM(唯讀記憶體)及/或快閃RAM)或鐵電記憶體、磁電阻 記憶體、雙向記憶體、聚合物記憶體或相變記憶體之儲存 _ 元件之陣列;諸如磁碟或光碟之碟片媒體;或用於資料儲 存之任何其他電腦可讀媒體。術語"軟體"應理解為包括源 程式碼、組合語言碼、機器碼、二元碼、韌體、宏代碼、 微碼、可由邏輯元件之陣列執行的任何一或多組或序列之 指令,及此等實例之任何組合。 一本文揭示之方法中的每一者亦可有形地實施為(舉例而 5 ’在上文列舉之-或多個電腦可讀媒體中)可由包括邏 輯元件之陣列的機器(例如,處理器、微處理器、微控制 器或其他有限狀態機)讀取及,或執行之一或多組指令。因 134863.doc -78· 200933610 此,本揭示案不意欲限於上文展示的組態,而應符合與本 文中以任何方式揭示之原理及新穎特徵(包括於形成原始 揭示案之一部分的所申請之附加申請專利範圍中)一致的 最廣泛範疇。 【圖式簡單說明】 圖1A展示話音編碼器χιο之方塊圖。 圖1B展示話音編碼器XI 〇之實施例χ2〇之方塊圖。 圖2展示決策樹之一實例。 © 圖3A展示根據一般組態之裝置XI〇〇之方塊圖。 圖3B展示背景聲音處理器1〇〇之實施例1〇2之方塊圖。 圖3C-圖3F展示可攜式或免持器件中兩個麥克風K10及 K20之各種安裝組態,且圖3G展示背景聲音處理器102之 實施例102A之方塊圖。 圖4A展示裝置X100之實施例χι〇2之方塊圖。 圖4B展示背景聲音處理器1〇4之實施例106之方塊圖。 圖5 A說明音訊信號與編碼器選擇操作之間的各種可能之 〇 w 相依性。 圖5B說明音訊信號與編碼器選擇操作之間的各種可能之 相依性。 圖6展示裝置X100之實施例χΐΐ〇之方塊圖》 圖7展示裝置X100之實施例X120之方塊圖。 圖8展示裝置X100之實施例X130之方塊圖。 圖9A展示背景聲音生成器120之實施例122之方塊圖。 圖9B展示背景聲音生成器122之實施例124之方塊圖。 134863.doc -79- 200933610 圖9C展示背景聲音生成器122之另一實施例126之方塊 圖。 圖9D展示用於產生所生成背景聲音信號S50之方法Ml 00 之流程圖。 圖10展示多重解析度背景聲音合成之過程之圖。 圖11A展示背景聲音處理器1〇2之實施例108之方塊圖。 圖11B展示背景聲音處理器1〇2之實施例109之方塊圖。 圖12A展示話音解碼器Ri〇之方塊圖。 © 圖12B展示話音解碼器Ri〇之實施例R20之方塊圖。 圖13 A展示背景聲音混合器190之實施例192之方塊圖。 圖13B展示根據一組態之裝置ri〇〇之方塊圖。 圖14A展示背景聲音處理器200之實施例之方塊圖。 圖14B展示裝置Rl〇〇之實施例rii〇之方塊圖。 圖1 5展示根據一組態之裝置R2〇〇之方塊圖。 圖16展示裝置X100之實施例χ2〇〇之方塊圖。 圖17展示裝置X100之實施例X210之方塊圖。 〇 圖18展示裝置X100之實施例X220之方塊圖。 圖19展示根據一所揭示組態之裝置χ3〇〇之方塊圖。 圖20展示裝置X300之實施例X310之方塊圖。 圖2 1A展示自伺服器下載背景聲音資訊之實例。 圖21B展示將背景聲音資訊下載至解碼器之實例。 圖22展示根據一所揭示組態之裝置R3〇〇之方塊圖。 圖23展示裝置R300之實施例尺31〇之方塊圖。 圖24展示裝置R300之實施例尺320之方塊圖。 134863.doc •80· 200933610 圖2 5 A展示根墟一 _ 很據所揭示組態之方法A100之流程圖。 W 展示根據一所揭示組態之裝置AMI 00之方塊圖。 圖26^展不根據一所揭示組態之方法B1〇〇之流程圖。 展不根據一所揭示組態之裝置BM100之方塊圖。 圖展不根據一所揭示組態之方法C1 00之流程圖。 圖展不根據一所揭示組態之裝置CM100之方塊圖。 圖八展不根據一所揭示組態之方法D100之流程圖。 展不根據一所揭示組態之裝置DM1 00之方塊圖。 圖29^展不根據一所揭示組態之方法E1 〇〇之流程圖。 展示根據一所揭示組態之裝置EM100之方塊圖。 圖A展不根據一所揭示組態之方法E2〇〇之流程圖。 圖展不根據一所揭示組態之裝置EM200之方塊圖。 圖3 A展不根據-所揭示組態之方法川❹之流程圖。 圖展不根據一所揭示組態之裝置FM100之方塊圖。 圖32八展不根據一所揭示組態之方法G100之流程圖。 ❹ 圖展不根據一所揭示組態之裝置OM100之方塊圖。 展不根據一所揭示組態之方法H1〇〇之流程圖。 圖 展不根據一所揭示組態之裝置ϋΜΙΟΟ之方塊圖。 在此等圖中,相同參考標號指代相同或類似元件。 【主要元件符號說明】 10 雜訊抑制器 20 編碼方案選擇器 22 編碼方案選擇器 30 活動訊框編碼器 134863.doc * 81 - 200933610
30a 活動訊框編碼器 30b 活動訊框編碼器 40 不活動訊框編碼器 50a 選擇器 50b 選擇器 52a 選擇器 52b 選擇器 60 編碼方案偵測器 62 編碼方案偵測器 70 活動訊框解碼器 70a 活動訊框解碼器 70b 活動訊框解碼器 80 不活動訊框解碼器 90a 選擇器 90b 選擇器 92a 選擇器 92b 選擇器 100 背景聲音處理器 102 背景聲音處理器 102A 背景聲音處理器 104 背景聲音處理器 106 背景聲音處理器 108 背景聲音處理器 109 背景聲音處理器 134863.doc -82- 200933610
110 背景聲音抑制器 110A 背景聲音抑制器 112 背景聲音抑制器 120 背景聲音生成器 122 背景聲音生成器 124 背景聲音生成器 126 背景聲音生成器 130 背景聲音資料庫 134 背景聲音資料庫 136 背景聲音資料庫 140 背景聲音生成引擎 144 背景聲音生成引擎 146 背景聲音生成引擎 150 背景聲音編碼器 152 背景聲音編碼器 190 背景聲音混合器 192 背景聲音混合器 195 增益控制信號計算器 197 增益控制信號計算器 200 背景聲音處理器 210 背景聲音抑制器 212 背景聲音抑制器 218 背景聲音抑制器 220 背景聲音生成器 134863.doc -83 - 200933610 ❹ 222 228 250 252 290 320 330 340 ΑΜ10 AM20 Ο AM100 BM10 BM20 BM30 背景聲音生成器 背景聲音生成器 選擇器 背景聲音解碼器 背景聲音混合器 背景聲音分類器 背景聲音選擇器 處理控制信號生成器 用於基於第一麥克風產生之第一音訊信號自 數位音訊信號抑制第一音訊背景聲音以獲得 背景聲音受抑制信號之構件 用於混合第二音訊背景聲音與基於背景聲音 受抑制仏號之信號以獲得背景聲音增強信號 之構件 用於處理包括第一音訊背景聲音之數位音訊 信號的裝置 用於在處理控制信號具有第一狀態時以第一 位元速率編碼缺少話音分量之數位音訊信號 部分之訊框的構件 用於在處理控制信號具有不同於第一狀態之 第一狀態時自數位音訊信號抑制背景聲音分 量以獲得背景聲音受抑制信號之構件 用於在處理控制信號具有第二狀態時混合音 訊背景聲音信號與基於背景聲音受抑制信號 134863.doc -84 - 200933610 Ο
ΒΜ40 ΒΜ100 CM10 CM20 CM30 CM40 CM100 DM10 DM20 之信號以獲得背景聲音增強信號之構件 用於在處理控制信號具有第二狀態時以第二 位元速率編碼缺少話音分量之背景聲音増^ 信號部分之訊框的構件 用於根據處理控制信號的狀態處理數位音訊 信號之裝置 用於自數位音訊信號抑制第一音訊背景聲立 以獲得背景聲音受抑制信號之構件 用於混合第二音訊背景聲音與基於背景聲立 受抑制信號之信號以獲得背景聲音增強信號 之構件 ; 用於將基於(A)第二音訊背景聲音及(B)背景 聲音增強信號中的至少一者之信號轉換為類 比信號的構件 用於自第二轉換器產生基於類比信號之可聞 信號之構件 用於處理基於自第一轉換器接收的信號之數 位音訊信號的裝置 用於根據第一編碼方案解碼經編碼音訊信號 之第一複數個經編碼訊框以獲得包括話音分 篁及方景聲音分量的第一經解碼音訊信號之 構件 用於根據第二編碼方案解碼經編碼音訊信號 之第二複數個經編碼訊框以獲得第二經解瑪 134863.doc -85- 200933610 DM30 DM100 EM10 EM20 ❹ EM30 EM40 EM50 EM60 ❹ EM100 EM200 FM10 FM20 音訊信號之構件 用於基於來自第二經解碼音訊信號之資訊自 基於第一經解碼音訊信號的第三信號抑制背 景聲音分量以獲得背景聲音受抑制信號之構件 用於處理經編碼音訊信號的裝置 用於自數位音訊信號抑制背景聲音分量以獲 得背景聲音受抑制信號之構件 用於編碼基於背景聲音受抑制信號之信號以 獲得經編碼音訊信號之構件 用於選擇複數個音訊背景聲音中的一者之構件 用於將關於所選音訊背景聲音之資訊插入於 基於經編碼音訊信號的信號中之構件 用於將經編碼音訊信號經由第一邏輯頻道發 送至第一實體之構件 用於向第二實體且經由不同於第一邏輯頻道 之第二邏輯頻道發送(A)音訊背景聲音選擇 資訊及(B)識別第一實體的資訊之構件 用於處理包括話音分量及背景聲音分量的數 位音訊信號之裝置 用於處理包括話音分量及背景聲音分量的數 位音訊信號之震置 用於解竭經編瑪音訊信E以獲得經解馬音訊 信號之構件 用於生成音訊背景聲音信號之構件 134863.doc -86- 200933610 用於混合基於音訊背景聲音信號之信號與基 於經解碼音訊信號之信號的構件 用於處理經編碼音訊信號且位於行動使用者 終端機内的裝置 用於自數位音訊信號抑制背景聲音分量以獲 得背景聲音受抑制信號之構件 用於生成基於第一渡波及第一複數個序列之 音訊背景聲音信號之構件 Ο 用於混合基於所生成音訊背景聲音信號之第 一信號與基於背景聲音受抑制信號之第二信 號以獲得背景聲音增強信號之構件 用於處理包括話音分量及背景聲音分量的數 位音訊信號之裝置
FM30 FM100 GM10 GM20 GM30 GM100 HM10 HM20 HM30 HM40 用於自數位音訊信號抑制背景聲音分量以獲 得背景聲音受抑制信號之構件 用於生成音訊背景聲音信號之構件 用於混合基於所生成音訊背景聲音信號之第 一信號與基於背景聲音受抑制信號之第二信 號以獲得背景聲音增強信號的構件 用於計算基於數位音訊信號之第三信號的等 級之構件 HM100 用於處理包括話音分量及背景聲音分量的數 位音訊信號之裝置 K10 麥克風 134863.doc -87- 200933610 K20 P10 P20 P30 P40 RIO R20 RlOO ❹ RllO R200 R300 ❹ R310 R320 麥克風 協定堆疊 協定堆疊 協定堆疊 協定堆疊 話音解碼器 話音解碼器
立 听螂首訊信號移除現存背景聲 二:其取代為可能類似於或不同於現存背 景聲音之所生成背景聲音之裝I 丄組態以自_碼音訊錢移除現存背景聲 音且將其取代為可能類似於或不同於現存背 景聲音之所生成背景聲音之裝置 經組態以在選擇背景聲音抑制時丢棄不活動 訊框解碼器之輸出之裝置 話音解碼器/包括經組態以根據背景聲音選 擇信號之狀態產生所生成背景聲音信號的背 景聲音生成器之例項的裝置 話音解碼器/包括經組態以根據背景聲音選 擇信號之狀態產生所生成背景聲音信號的背 景聲音生成器之例項的裝置 話音解碼器/包括經組態以根據背景聲音選 擇信號之狀態產生所生成背景聲音信號的背 景聲音生成器之例項的裝置 134863.doc • 88- 200933610 S10 音訊信號 S12 雜訊受抑制音訊信號 S13 背景聲音受抑制音訊信號 S15 背景聲音增強音訊信號 S20 經編碼音訊信號 S20a 第一經編碼音訊信號 S20b 第二經編碼音訊信號 S30 處理控制信號 Ο S40 背景聲音選擇信號 S50 所生成背景聲音信號 S70 背景聲音參數值 S80 經編碼背景聲音信號 S82 經編碼背景聲音信號 S90 增益控制信號 S110 經解碼音訊信號 S113 背景聲音受抑制音訊信號 〇 S115 背景聲音增強音訊信號 S130 處理控制信號 S140 背景聲音選擇信號 S150 所生成背景聲音信號 SA1 音訊信號 X10 話音編碼器 X20 話音編碼器 X100 經組態以自音訊信號移除現存背景聲音且將 134863.doc -89- 200933610 X102 X110 ❹ X120 X130 X200 Ο Χ210 Χ220 Χ300 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信絲除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 經組態以自音訊信號移除現存背景聲音且將 其取代為可能類似或不同於現存背景聲音之 所生成背景聲音之裝置 組態為在不活動訊框期間不支援現存背景聲 134863.doc 200933610 音之傳輸之裝置 X310 組態為在不活動訊框期間不支援現存背景聲 音之傳輸之裝置
134863.doc •91 -

Claims (1)

  1. 200933610 十、申請專利範圍: 1.種處理-包括一話音分量及一背景聲音分量之數位音 訊信號之方法,該方法包含: 抑制該數位音訊信號之該背景聲音分量,以獲得-背 景聲音受抑制信號; 成基於一第一濾波及第一複數個序列之音訊背景 聲音信號’該第-複數個序列中之每—者具有—不同時 間解析度;及 ° 一混合-基於該所生成音訊背景聲音信號之第一信號與 一基於該背景聲音受抑制信號之第二信號,以獲得一背 景聲音增強信號, 其中該生成一音訊背景聲音信號包括將該第一濾波應 用至該第一複數個序列t之每一者。 2.如請求項1之處理一數位音訊信號之方法,其中該第一 複數個序列中之至少一者係基於將該第一濾波應用至該 第一複數個序列中之另一者之結果。 ® 3.如明求項丄之處理一數位音訊信號之方法其中該第一 滤波係基於一小波函數。 4·如凊求項1之處理一數位音訊信號之方法,其中該所生 成音訊背景聲音信號係基於一不同於該第一濾波之第二 濾波及一不同於該第一複數個序列之第二複數個序列, 該第—複數個序列中之每一者具有一不同時間解析度, 且 其中該生成一音訊背景聲音信號包括將該第二濾波應 134863.doc 200933610 用至δ玄第二複數個序列中之每一者。 5. 如明求項4之處理一數位音訊信號之方法,其中該第二 濾、波係基於一小波函數。 6. 如研求項1之處理一數位音訊信號之方法,其中該所生 成曰·^身景聲曰號係基於不同於該第一複數個序列之 第三複數個序列,且 其中該生成一音訊背景聲音信號包括針對該第三複數 個序列中之每一者,基於該第一複數個序列中之至少一 © 者來計算該序列,且 其中該生成一音訊背景聲音信號包括將該第一濾波應 用至該第二複數個序列中之每一者。 7·如請求項1之處理一數位音訊信號之方法其中該方法 包含編碼一基於該背景聲音增強信號之第三信號以獲得 一經編碼音訊信號, 其中該經編碼音訊信號包含一系列訊框,該系列訊框 0 中之每一者包括描述一激勵信號之資訊。 8·如請求項1之處理一數位音訊信號之方法,其中該生成 -音訊背景聲音信號包括基於—包括該第__複數個序列 之模板生成複數個截波, 其中該複數個截波中之每一者係基於該模板之一相應 變異,且 其中該生成一音訊背景聲音信號包括組合該複數個截 波以產生該音訊背景聲音信號。 9. 一種用於處理一包括一話音分量及一背景聲音分量之數 134863.doc • 2 - 200933610 位音訊信號之裝置,該裝置包含: 一背景聲音抑制器,其經組態以抑制該數位音訊信號 之一背景聲音,以獲得一背景聲音受抑制信號; 一背景聲音生成器,其經組態以生成一基於一第一濾 波及第一複數個序列之音訊背景聲音信號,該第一複數 個序列中之每一者具有一不同時間解析度;及 一背景聲音混合器,其經組態以混合一基於該音訊背 景聲音信號之第一信號與一基於該背景聲音受抑制信號 © 之第二信號,以產生一背景聲音增強信號, 其中該背景聲音生成器經組態以將該第一濾波應用至 該第一複數個序列中之每一者。 10. 如凊求項9之用於處理一數位音訊信號之裝置,其中該 第一複數個序列中之至少一者係基於一將該第一濾波應 用至該第一複數個序列中之另一者的結果。 11. 如請求項9之用於處理一數位音訊信號之裝置,其中該 0 第一濾波係基於一小波函數。 如明求項9之用於處理一數位音訊信號之裝置,其中該 所生成音訊背景聲音信號係基於一不同於該第一濾波之 第一濾波及一不同於該第一複數個序列之第二複數個序 列,該第二複數個序列中之每一者具有一不同時間解析 度,且 其中該貪景聲音生成器經組態以將該第二濾波應用至 該第二複數個序列中之每一者。 13.如咕求項12之用於處理一數位音訊信號之裝置,其中該 134863.doc 200933610 第一慮波係基於一小波函數。 14. 如請求項9之用於處理一數位音訊信號之裝置,其中該 所生成曰訊者景聲音信號係基於不同於該第一複數 列之第三複數個序列,且 序 其中該貪π聲音生成器經組態以針對該第三複數個序 列中之每一者,基於該第一複數個序列中之至少一者來 計算該序列,且 其中該背景聲音生成器經組態以將該第一遽波應用至 © 該第三複數個序列中之每一者。 15, 如請求項9之用於處理一數位音訊信號之褒置,其中該 裝置包含一經組態以編碼一基於該背景聲音增強信號之 第三信號以獲得一經編碼音訊信號之編碼器, 其中該經編碼音訊信號包含一系列訊框,該系列訊框 中之每一者包括描述一激勵信號之資訊。 16·如請求項9之用於處理一數位音訊信號之裝置,其中該 煮景聲音生成器經組態以基於一包括該第一複數個序列 之模板生成複數個截波, 其中該複數個截波中之每一者係基於該模板之一相應 變異,且 其中該背景聲音生成器經組態以組合該複數個截波以 產生該音訊背景聲音信號。 17. —種用於處理一包括一話音分量及一背景聲音分量之數 位音訊信號之裝置,該裝置包含: 用於抑制該數位音訊信號之該背景聲音分量以獲得一 134863.doc •4- 200933610 背景聲音受抑制信號之構件; 二ί成一基於一第一減波及第-複數個序列… ㈣之構件’該第-複數個序列中之每一者具 有一不同時間解析度;及 异 用於混合一基於該所生成音 凡考景聲音信號之第一户 號與一基於該背景聲音受抑制信號之第二信號以獲得: 背景聲音增強信號之構件, 獲诗 〇
    其中該用於生成一音訊背景聲音信號之構件包括用於 :該第-濾、波應用至該第—複數個序列中之每—者的構 1如請求項17之用於處理—數位音訊信號之裝置, 第-複數個序列中之至少—者係基於—將該第_應乂 用至該第-複數個序列中之另一者的結果。 w應 Α如請求項17之用於處理—數位音訊信號之裝置,其中該 第一渡波係基於一小波函數。 20.如請求項17之用於處理一數位音訊信號之裝置,其中該 所生成音tfl背景冑音信號係基於一不同於該第一滤波之 第二渡波&一不同於該第一複數個序列之第二複數個序 列,該第二複數個序歹丨Jjl g #夕j中之每一者具有一不同時間解析 度,且 其中該肖於生成—音訊背景聲音信號之構件包括用於 將該第二溏、波應肖i該第二複數個㈣中之每一者的構 件。 21·如請求項20之用於處理一數位音訊信號之裝置,其中該 134863.doc 200933610 第二濾波係基於一小波函數。 22. 如請求項17之用於處理一數位音訊信號之裝置,其中談 所生成音訊背景聲音信號係基於不同於該第一複數個序 列之第三複數個序列,且 其中該用於生成一音訊背景聲音信號之構件包括用於 計算該第三複數個序列以使得該第三複數個序列中之每 一者係基於該第一複數個序列中之至少一者的構件且 其中該用於生成一音訊背景聲音信號之構件包括用於 © 將該第一濾波應用至該第三複數個序列中之每一者的構 件。 23. 如請求項17之用於處理一數位音訊信號之裝置,其中該 方法包含用於編碼一基於該背景聲音增強信號之第三信 號以獲得一經編碼音訊信號之構件, 其中該經編碼音訊信號包含一系列訊框,該系列訊框 中之每一者包括描述一激勵信號之資訊。 24. 如請求項17之用於處理一數位音訊信號之裝置,其中該 用於生成一音訊背景聲音信號之構件包括用於基於一包 括該第一複數個序列之模板生成複數個截波之構件, 其中該複數個截波中之每一者係基於該模板之一相應 變異,且 其中該用於生成一音訊背景聲音信號之構件包括用於 組合該複數個截波以產生該音訊背景聲音信號之構件。 25. —種包含用於處理一包括一話音分量及一背景聲音分量 之數位音訊信號之指令的電腦可讀媒體,當該等指令由 134863.doc * 6 - 200933610 處理器執行時,使該處理器·· 抑制該數位音訊信號之唁皆 景聲音受抑制信號,·㈣音分量,以獲得一背 濾波及第一複數個序列之音訊背景 生成一基於一第 聲音信號,該第一 間解析度;及 複數個序列中之每一 者具有一不同時 广基於該所生成音訊背景聲音信號之第一信號與 ❹ 26. Ο 27. 28. 於該背景聲音受抑制信號之第二信號,以獲得一背 景聲音增強信號, ,、中虽由-處理器執行時使該處理器生成—音訊背景 聲音信號之該等指令包括备士 ._ 7匕栝备由一處理器執行時使該處理 器將該第-濾波應用至該第一複數個序列中之每一者的 指令。 如請求項25之電腦可讀媒體,其中該第一複數個序列中 之至> 者係基於一將該第一濾波應用至該第一複數個 序列中之另一者的結果。 如請求項25之電腦可讀媒體,其中該第—濾波係基於一 小波函數。 如請求項25之電腦可讀媒體,其中該所生成音訊背景聲 音信號係基於-不同於該第—渡波之H皮及一不同 於該第-複數個序列之第二複數個序列,該第二複數個 序列中之每一者具有一不同時間解析度,且 其中當由一處理器執行時使該處理器生成一音訊背景 聲音信號之該等指令經組態以使該處理器將該第二濾波 134863.doc 200933610 應用至該第二複數個序列中之每一者。 29, 如請求項28之電腦可讀 小波函數。 、 、中該第二濾波係基於一 30. 如請求項25之電腦可讀 ^ « 、,其中該所生成音訊背景聲 列,且 該第一複數個序列之第三複數個序 其中當由一處理器執行 錾立π缺姑 使該處理器生成一音訊背景 聲音乜號之該等指令經纟 不 〇 ❹ ^ ^ . 、 &、以使該處理器計算該第三複 數個序列,以使該第三 设 m . —複數個序列中之每一者係基於該 第一複數個序列中的至少—者且 二::由處理器執行時使該處理器生成一音訊背景 曰L號之該等&令K態以使該處理器將該第一遽波 應用至該第三複數個序列中之每一者。 如請求項25之電腦可讀媒體,其中該媒體包含當由一處 理器執行時使該處理3|媼踩 M ^ , 編蝎—基於該背景聲音增強信號 之第三信號以獲得—經編瑪音訊信號之指令, 其中該經編碼音訊信號包含一系列訊框,該系列訊框 中之每一者包括描述一激勵信號之資訊。 32,如請求項25之電腦可讀媒體,其中當由一處理器執行時 使該處理器生成-音訊背景聲音信號之該等指令經組態 以使該處理nm括該第—複數個序列之模板生成 複數個截波,
    之每一者係基於該模板之一相應 134863.doc 200933610 其中當由一處理器執行時使該處理器生成一音訊背景 聲音信號之該等指令經組態以使該處理器組合該複數個 截波以產生該音訊背景聲音信號。
    134863.doc -9-
TW097137540A 2008-01-28 2008-09-30 Systems, methods, and apparatus for context processing using multi resolution analysis TW200933610A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2410408P 2008-01-28 2008-01-28
US12/129,466 US8554550B2 (en) 2008-01-28 2008-05-29 Systems, methods, and apparatus for context processing using multi resolution analysis

Publications (1)

Publication Number Publication Date
TW200933610A true TW200933610A (en) 2009-08-01

Family

ID=40899262

Family Applications (5)

Application Number Title Priority Date Filing Date
TW097137517A TW200947422A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context suppression using receivers
TW097137524A TW200933609A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context processing using multiple microphones
TW097137522A TW200947423A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context replacement by audio level
TW097137510A TW200933608A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context descriptor transmission
TW097137540A TW200933610A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context processing using multi resolution analysis

Family Applications Before (4)

Application Number Title Priority Date Filing Date
TW097137517A TW200947422A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context suppression using receivers
TW097137524A TW200933609A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context processing using multiple microphones
TW097137522A TW200947423A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context replacement by audio level
TW097137510A TW200933608A (en) 2008-01-28 2008-09-30 Systems, methods, and apparatus for context descriptor transmission

Country Status (7)

Country Link
US (5) US8554551B2 (zh)
EP (5) EP2245624A1 (zh)
JP (5) JP2011512549A (zh)
KR (5) KR20100113144A (zh)
CN (5) CN101903947A (zh)
TW (5) TW200947422A (zh)
WO (5) WO2009097021A1 (zh)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101295729B1 (ko) * 2005-07-22 2013-08-12 프랑스 텔레콤 비트 레이트­규모 가변적 및 대역폭­규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법
CA2656123A1 (en) * 2006-04-28 2007-11-08 Ntt Docomo, Inc. Image predictive coding device, image predictive coding method, image predictive coding program, image predictive decoding device, image predictive decoding method and image predictive decoding program
US20080152157A1 (en) * 2006-12-21 2008-06-26 Vimicro Corporation Method and system for eliminating noises in voice signals
ATE456130T1 (de) * 2007-10-29 2010-02-15 Harman Becker Automotive Sys Partielle sprachrekonstruktion
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN102132494B (zh) * 2008-04-16 2013-10-02 华为技术有限公司 通信方法和通信装置
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
AU2009267459B2 (en) * 2008-07-11 2014-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US8290546B2 (en) * 2009-02-23 2012-10-16 Apple Inc. Audio jack with included microphone
CN101847412B (zh) * 2009-03-27 2012-02-15 华为技术有限公司 音频信号的分类方法及装置
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
US10008212B2 (en) * 2009-04-17 2018-06-26 The Nielsen Company (Us), Llc System and method for utilizing audio encoding for measuring media exposure with environmental masking
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
WO2011037587A1 (en) * 2009-09-28 2011-03-31 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8903730B2 (en) * 2009-10-02 2014-12-02 Stmicroelectronics Asia Pacific Pte Ltd Content feature-preserving and complexity-scalable system and method to modify time scaling of digital audio signals
JP5793500B2 (ja) * 2009-10-19 2015-10-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声区間検出器及び方法
CA2778325C (en) 2009-10-20 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
EP3998606B8 (en) 2009-10-21 2022-12-07 Dolby International AB Oversampling in a combined transposer filter bank
US20110096937A1 (en) * 2009-10-28 2011-04-28 Fortemedia, Inc. Microphone apparatus and sound processing method
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8908542B2 (en) * 2009-12-22 2014-12-09 At&T Mobility Ii Llc Voice quality analysis device and method thereof
BR122021008581B1 (pt) * 2010-01-12 2022-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
US9112989B2 (en) * 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9558755B1 (en) * 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US8805697B2 (en) * 2010-10-25 2014-08-12 Qualcomm Incorporated Decomposition of music signals using basis functions with time-evolution information
US8831937B2 (en) * 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
KR101726738B1 (ko) * 2010-12-01 2017-04-13 삼성전자주식회사 음성처리장치 및 그 방법
WO2012127278A1 (en) * 2011-03-18 2012-09-27 Nokia Corporation Apparatus for audio signal processing
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
ITTO20110890A1 (it) 2011-10-05 2013-04-06 Inst Rundfunktechnik Gmbh Interpolationsschaltung zum interpolieren eines ersten und zweiten mikrofonsignals.
JP6190373B2 (ja) * 2011-10-24 2017-08-30 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ信号ノイズ減衰
US9992745B2 (en) * 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
IN2014CN04097A (zh) 2011-12-07 2015-07-10 Qualcomm Inc
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
CN111145767B (zh) * 2012-12-21 2023-07-25 弗劳恩霍夫应用研究促进协会 解码器及用于产生和处理编码频比特流的系统
BR112015014212B1 (pt) 2012-12-21 2021-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Geração de um ruído de conforto com alta resolução espectro-temporal em transmissão descontínua de sinais de audio
KR20140089871A (ko) 2013-01-07 2014-07-16 삼성전자주식회사 대화형 서버, 그 제어 방법 및 대화형 시스템
PT2951825T (pt) 2013-01-29 2022-02-02 Fraunhofer Ges Forschung Aparelho e método para geração de um sinal aprimorado em frequência utilizando suavização temporal de sub-bandas
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
PL3098811T3 (pl) * 2013-02-13 2019-04-30 Ericsson Telefon Ab L M Ukrywanie błędu ramki
US20160155455A1 (en) * 2013-05-22 2016-06-02 Nokia Technologies Oy A shared audio scene apparatus
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
JP6098654B2 (ja) * 2014-03-10 2017-03-22 ヤマハ株式会社 マスキング音データ生成装置およびプログラム
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
WO2016017238A1 (ja) * 2014-07-28 2016-02-04 日本電信電話株式会社 符号化方法、装置、プログラム及び記録媒体
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9741344B2 (en) * 2014-10-20 2017-08-22 Vocalzoom Systems Ltd. System and method for operating devices using voice commands
US9830925B2 (en) * 2014-10-22 2017-11-28 GM Global Technology Operations LLC Selective noise suppression during automatic speech recognition
US9378753B2 (en) 2014-10-31 2016-06-28 At&T Intellectual Property I, L.P Self-organized acoustic signal cancellation over a network
DE112016000287T5 (de) 2015-01-07 2017-10-05 Knowles Electronics, Llc Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung
TWI595786B (zh) * 2015-01-12 2017-08-11 仁寶電腦工業股份有限公司 基於時間戳記的音訊與視訊處理方法及其系統
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
US9916836B2 (en) * 2015-03-23 2018-03-13 Microsoft Technology Licensing, Llc Replacing an encoded audio output signal
US10304467B2 (en) 2015-04-24 2019-05-28 Sony Corporation Transmission device, transmission method, reception device, and reception method
CN106210219B (zh) * 2015-05-06 2019-03-22 小米科技有限责任公司 降噪方法及装置
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
US10373608B2 (en) * 2015-10-22 2019-08-06 Texas Instruments Incorporated Time-based frequency tuning of analog-to-information feature extraction
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN107564512B (zh) * 2016-06-30 2020-12-25 展讯通信(上海)有限公司 语音活动侦测方法及装置
JP6790817B2 (ja) * 2016-12-28 2020-11-25 ヤマハ株式会社 電波状態解析方法
US10797723B2 (en) 2017-03-14 2020-10-06 International Business Machines Corporation Building a context model ensemble in a context mixing compressor
US10361712B2 (en) 2017-03-14 2019-07-23 International Business Machines Corporation Non-binary context mixing compressor/decompressor
KR102491646B1 (ko) * 2017-11-30 2023-01-26 삼성전자주식회사 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치
US10862846B2 (en) 2018-05-25 2020-12-08 Intel Corporation Message notification alert method and apparatus
CN108962275B (zh) * 2018-08-01 2021-06-15 电信科学技术研究院有限公司 一种音乐噪声抑制方法及装置
WO2020039597A1 (ja) * 2018-08-24 2020-02-27 日本電気株式会社 信号処理装置、音声通話端末、信号処理方法および信号処理プログラム
JP7130878B2 (ja) * 2019-01-13 2022-09-05 華為技術有限公司 高分解能オーディオコーディング
US10978086B2 (en) 2019-07-19 2021-04-13 Apple Inc. Echo cancellation using a subset of multiple microphones as reference channels
CN111757136A (zh) * 2020-06-29 2020-10-09 北京百度网讯科技有限公司 网页音频直播方法、装置、设备和存储介质

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
SE502244C2 (sv) 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
SE501981C2 (sv) 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5742734A (en) 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JP3418305B2 (ja) 1996-03-19 2003-06-23 ルーセント テクノロジーズ インコーポレーテッド オーディオ信号を符号化する方法および装置および知覚的に符号化されたオーディオ信号を処理する装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US5909518A (en) 1996-11-27 1999-06-01 Teralogic, Inc. System and method for performing wavelet-like and inverse wavelet-like transformations of digital data
US6301357B1 (en) 1996-12-31 2001-10-09 Ericsson Inc. AC-center clipper for noise and echo suppression in a communications system
US6167417A (en) * 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
DE59901018D1 (de) 1998-05-11 2002-04-25 Siemens Ag Verfahren und anordnung zur bestimmung spektraler sprachcharakteristika in einer gesprochenen äusserung
TW376611B (en) 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
US6549586B2 (en) 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6717991B1 (en) * 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
JP4196431B2 (ja) 1998-06-16 2008-12-17 パナソニック株式会社 機器内蔵型マイクロホン装置及び撮像装置
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
JP3438021B2 (ja) 1999-05-19 2003-08-18 株式会社ケンウッド 移動体通信端末
US6782361B1 (en) 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
US6330532B1 (en) 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
GB9922654D0 (en) 1999-09-27 1999-11-24 Jaber Marwan Noise suppression system
AU1359601A (en) * 1999-11-03 2001-05-14 Tellabs Operations, Inc. Integrated voice processing system for packet networks
US6407325B2 (en) * 1999-12-28 2002-06-18 Lg Electronics Inc. Background music play device and method thereof for mobile station
JP4310878B2 (ja) 2000-02-10 2009-08-12 ソニー株式会社 バスエミュレーション装置
EP1139337A1 (en) 2000-03-31 2001-10-04 Telefonaktiebolaget L M Ericsson (Publ) A method of transmitting voice information and an electronic communications device for transmission of voice information
AU2001260154A1 (en) * 2000-03-31 2001-10-15 Telefonaktiebolaget Lm Ericsson (Publ) A method of transmitting voice information and an electronic communications device for transmission of voice information
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US6873604B1 (en) * 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
US7260536B1 (en) * 2000-10-06 2007-08-21 Hewlett-Packard Development Company, L.P. Distributed voice and wireless interface modules for exposing messaging/collaboration data to voice and wireless devices
CN100393085C (zh) * 2000-12-29 2008-06-04 诺基亚公司 数字网络中的音频信号质量增强
US7165030B2 (en) 2001-09-17 2007-01-16 Massachusetts Institute Of Technology Concatenative speech synthesis using a finite-state transducer
EP1374230B1 (en) 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding
TW564400B (en) 2001-12-25 2003-12-01 Univ Nat Cheng Kung Speech coding/decoding method and speech coder/decoder
US7657427B2 (en) * 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7174022B1 (en) 2002-11-15 2007-02-06 Fortemedia, Inc. Small array microphone for beam-forming and noise suppression
US20040204135A1 (en) * 2002-12-06 2004-10-14 Yilin Zhao Multimedia editor for wireless communication devices and method therefor
AU2003285787A1 (en) 2002-12-28 2004-07-22 Samsung Electronics Co., Ltd. Method and apparatus for mixing audio stream and information storage medium
KR100486736B1 (ko) 2003-03-31 2005-05-03 삼성전자주식회사 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치
US7295672B2 (en) * 2003-07-11 2007-11-13 Sun Microsystems, Inc. Method and apparatus for fast RC4-like encryption
DK1509065T3 (da) 2003-08-21 2006-08-07 Bernafon Ag Fremgangsmåde til behandling af audiosignaler
US20050059434A1 (en) 2003-09-12 2005-03-17 Chi-Jen Hong Method for providing background sound effect for mobile phone
US7162212B2 (en) 2003-09-22 2007-01-09 Agere Systems Inc. System and method for obscuring unwanted ambient noise and handset and central office equipment incorporating the same
US7133825B2 (en) 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4162604B2 (ja) * 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
US7536298B2 (en) 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
WO2005098821A2 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
JP4556574B2 (ja) 2004-09-13 2010-10-06 日本電気株式会社 通話音声生成装置及び方法
US7454010B1 (en) 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US20060215683A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for voice quality enhancement
US7567898B2 (en) * 2005-07-26 2009-07-28 Broadcom Corporation Regulation of volume of voice in conjunction with background sound
US7668714B1 (en) * 2005-09-29 2010-02-23 At&T Corp. Method and apparatus for dynamically providing comfort noise
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8041057B2 (en) 2006-06-07 2011-10-18 Qualcomm Incorporated Mixing techniques for mixing audio
KR20090123921A (ko) * 2007-02-26 2009-12-02 퀄컴 인코포레이티드 신호 분리를 위한 시스템, 방법 및 장치
US8175871B2 (en) * 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
JP4456626B2 (ja) * 2007-09-28 2010-04-28 富士通株式会社 ディスクアレイ装置、ディスクアレイ装置制御プログラムおよびディスクアレイ装置制御方法
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level

Also Published As

Publication number Publication date
US8554550B2 (en) 2013-10-08
WO2009097020A1 (en) 2009-08-06
JP2011512549A (ja) 2011-04-21
WO2009097021A1 (en) 2009-08-06
KR20100125271A (ko) 2010-11-30
US20090192790A1 (en) 2009-07-30
KR20100125272A (ko) 2010-11-30
US20090192791A1 (en) 2009-07-30
TW200947422A (en) 2009-11-16
KR20100129283A (ko) 2010-12-08
CN101896964A (zh) 2010-11-24
KR20100113144A (ko) 2010-10-20
EP2245624A1 (en) 2010-11-03
US8554551B2 (en) 2013-10-08
US8600740B2 (en) 2013-12-03
JP2011516901A (ja) 2011-05-26
JP2011512550A (ja) 2011-04-21
WO2009097022A1 (en) 2009-08-06
CN101896970A (zh) 2010-11-24
JP2011511961A (ja) 2011-04-14
CN101903947A (zh) 2010-12-01
US8560307B2 (en) 2013-10-15
EP2245625A1 (en) 2010-11-03
US20090190780A1 (en) 2009-07-30
CN101896971A (zh) 2010-11-24
TW200947423A (en) 2009-11-16
CN101896969A (zh) 2010-11-24
WO2009097023A1 (en) 2009-08-06
EP2245619A1 (en) 2010-11-03
WO2009097019A1 (en) 2009-08-06
US20090192803A1 (en) 2009-07-30
TW200933608A (en) 2009-08-01
KR20100113145A (ko) 2010-10-20
JP2011511962A (ja) 2011-04-14
EP2245623A1 (en) 2010-11-03
TW200933609A (en) 2009-08-01
EP2245626A1 (en) 2010-11-03
US8483854B2 (en) 2013-07-09
US20090192802A1 (en) 2009-07-30

Similar Documents

Publication Publication Date Title
TW200933610A (en) Systems, methods, and apparatus for context processing using multi resolution analysis
JP6474877B2 (ja) ハーモニックオーディオ信号の帯域幅拡張
CN108140399A (zh) 用于超宽带音乐的自适应噪声抑制
JP2017062512A (ja) オーディオ・データを処理するための方法、装置、及びシステム
JP2005241761A (ja) 通信装置及び信号符号化/復号化方法
CN115512711A (zh) 语音编码、语音解码方法、装置、计算机设备和存储介质