TWI693596B - 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件 - Google Patents

用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件 Download PDF

Info

Publication number
TWI693596B
TWI693596B TW108112945A TW108112945A TWI693596B TW I693596 B TWI693596 B TW I693596B TW 108112945 A TW108112945 A TW 108112945A TW 108112945 A TW108112945 A TW 108112945A TW I693596 B TWI693596 B TW I693596B
Authority
TW
Taiwan
Prior art keywords
audio
decoder
band
frame
frames
Prior art date
Application number
TW108112945A
Other languages
English (en)
Other versions
TW201928946A (zh
Inventor
凡卡特拉曼 S 阿堤
文卡塔 薩伯拉曼亞姆 強卓 賽克哈爾 奇比亞姆
福維克 瑞得倫
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201928946A publication Critical patent/TW201928946A/zh
Application granted granted Critical
Publication of TWI693596B publication Critical patent/TWI693596B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Telephone Function (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一種器件包括經組態以接收一音訊串流之一音訊訊框的一接收器。該器件亦包括一解碼器,其經組態以產生與該音訊訊框相關聯之第一經解碼語音,且判定被分類為與頻帶有限內容相關聯之音訊訊框的一計數。該解碼器經進一步組態以基於該第一經解碼語音輸出第二經解碼語音。可根據該解碼器之一輸出模式產生該第二經解碼語音。可至少部分基於音訊訊框之該計數而選擇該輸出模式。

Description

用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件
本發明大體上係關於音訊頻寬選擇。
器件之間的音訊內容之傳輸可使用一或多個頻率範圍而進行。音訊內容可具有小於編碼器頻寬且小於解碼器頻寬之頻寬。在編碼及解碼音訊內容之後,經解碼音訊內容可包括至高於初始音訊內容之頻寬的頻帶中之頻譜能量洩漏,其可不利地影響經解碼音訊內容之品質。舉例而言,窄頻內容(例如,0-4千赫茲(kHz)之第一頻率範圍內的音訊內容)可使用在0-8 kHz之第二頻率範圍內操作的寬頻寫碼器進行編碼及解碼。當使用寬頻寫碼器編碼/解碼窄頻內容時,寬頻寫碼器之輸出可包括高於初始窄頻信號之頻寬的頻帶中之頻譜能量洩漏。雜訊可降級初始窄頻內容之音訊品質。經降級音訊品質可由非線性功率放大或由動態範圍壓縮放大,其可實施於輸出窄頻內容之行動器件的話音處理鏈中。
在一特定態樣中,一種器件包括經組態以接收一音訊串流之一音訊訊框的一接收器。該器件亦包括一解碼器,其經組態以產生與該音訊訊框相關聯之第一經解碼語音,且判定被分類為與頻帶有限內容相關聯之音訊訊框的一計數。該解碼器經進一步組態以基於該第一經解碼語音輸出第二經解碼語音。可根據該解碼器之一輸出模式而產生該第二經解碼語音。可至少部分基於該音訊訊框計數而選擇該輸出模式。 在另一特定態樣中,一種方法包括在一解碼器處產生與一音訊串流之一音訊訊框相關聯的第一經解碼語音。該方法亦包括:至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的一數目而判定該解碼器之一輸出模式。該方法進一步包括基於該第一經解碼語音而輸出第二經解碼語音。可根據該輸出模式而產生該第二經解碼語音。 在另一特定態樣中,一種方法包括在一解碼器處接收一音訊串流之多個音訊訊框。該方法進一步包括:回應於接收一第一音訊訊框,在該解碼器處判定對應於該等多個音訊訊框中與頻帶有限內容相關聯之音訊訊框的一相對計數的一量度。該方法亦包括:基於該解碼器之一輸出模式選擇一臨限,且基於該量度與該臨限之一比較而將該輸出模式自一第一模式更新至一第二模式。 在另一特定態樣中,一種方法包括在一解碼器處接收一音訊串流之第一音訊訊框。該方法亦包括:判定在該解碼器處所接收且被分類為與寬頻內容相關聯之包括該第一音訊訊框的連續音訊訊框的一數目。該方法進一步包括:回應於連續音訊訊框之該數目大於或等於一臨限,將與該第一音訊訊框相關聯之一輸出模式判定為一寬頻模式。 在另一特定態樣中,一種裝置包括用於產生與一音訊串流之一音訊訊框相關聯之第一經解碼語音的構件。該裝置亦包括:用於至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的一數目而判定一解碼器之一輸出模式的構件。該裝置進一步包括用於基於該第一經解碼語音而輸出第二經解碼語音的構件。可根據該輸出模式而產生該第二經解碼語音。 在另一特定態樣中,一種電腦可讀儲存器件,其儲存指令,該等指令當由一處理器執行時使得該處理器執行包括以下項之操作:產生與一音訊串流之一音訊訊框相關聯的第一經解碼語音,及至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的一計數而判定一解碼器之一輸出模式。該等操作亦包括基於該第一經解碼語音輸出第二經解碼語音。可根據該輸出模式而產生該第二經解碼語音。 本發明的其它方面、優點和特徵將在審閱申請案之後變得顯而易見,該申請案包括以下部分:附圖說明、實施方式及申請專利範圍。
相關申請案的交叉參考 本申請案主張2015年4月5日遞交的名稱為「AUDIO BANDWIDTH SELECTION」之美國臨時專利申請案第62/143,158號之權益,該申請案明確地以全文引用之方式併入本文中。 下文參考圖式描述本發明之特定態樣。在描述中,共同特徵藉由共同參考編號指示。如本文所使用,各種術語僅僅用於描述特定實施之目的,且並不意欲限制實施。舉例而言,除非上下文以其他方式明確地指示,否則單數形式「一」及「該」意欲同樣包括複數形式。可進一步理解,術語「包含」可與「包括」互換使用。另外,應理解,術語「其中」可與「在…的情況下」互換使用。如本文中所使用,用以修飾元件(諸如,結構、組件、操作等等)之序數術語(例如,「第一」、「第二」、「第三」等等)本身不指示元件相對於另一元件之任何優先性或次序,而是僅將元件與具有相同名稱(如果不使用序數術語)之另一元件區別開。如本文所使用,術語「集合」指一或多個特定元件,且術語「複數個」指多個(例如,兩個或兩個以上)特定元件。 在本發明中,在解碼器處接收之音訊封包(例如,經編碼音訊訊框)可經解碼以產生與頻率範圍(諸如,寬頻頻率範圍)相關聯之經解碼語音。解碼器可偵測經解碼語音是否包括與頻率範圍之第一子範圍(例如,低頻帶)相關聯的頻帶有限內容。若經解碼語音包括頻帶有限內容,則解碼器可進一步處理經解碼語音以移除與頻率範圍之第二子範圍(例如,高頻帶)相關聯的音訊內容。藉由移除與高頻帶相關聯之音訊內容(例如,頻譜能量洩漏),解碼器可輸出頻帶有限(例如,窄頻)語音,而不管最初解碼音訊封包以具有較大頻寬(例如,遍及寬頻頻率範圍)。另外,藉由移除與高頻帶相關聯之音訊內容(例如,頻譜能量洩漏),在編碼及解碼頻帶有限內容之後的音訊品質可得以改良(例如,藉由衰減輸入信號頻寬上的頻譜洩漏)。 為進行說明,對於在解碼器處接收之每一音訊訊框,解碼器可將音訊訊框分類為與寬頻內容或窄頻內容(例如,窄頻頻帶有限內容)相關聯。舉例而言,對於特定音訊訊框,解碼器可判定與低頻帶相關聯之第一能量值,且可判定與高頻帶相關聯之第二能量值。在一些實施中,第一能量值可與低頻帶之平均能量值相關聯,且第二能量值可與高頻帶之能量峰值相關聯。若第一能量值與第二能量值之比大於臨限(例如,512),則特定訊框可被分類為與頻帶有限內容相關聯。在分貝(dB)域中,此比可解譯為差。(例如,(第一能量)/(第二能量)>512等於10*log10 (第一能量/第二能量)=10*log10 (第一能量)-10*log10 (第二能量)>27.097 dB)。 可基於多個音訊訊框之分類器選擇解碼器之輸出模式(諸如輸出語音模式,例如,寬頻模式或頻帶有限模式)。舉例而言,輸出模式可對應於解碼器之合成器之操作模式,諸如解碼器之合成器之合成模式。為選擇輸出模式,解碼器可識別一組最近所接收之音訊訊框,且判定被分類為與頻帶有限內容相關聯之訊框的數目。若輸出模式被設定成寬頻模式,則被分類為具有頻帶有限內容之訊框的數目可與特定臨限進行比較。若與頻帶有限內容相關聯之訊框的數目大於或等於特定臨限,則輸出模式可自寬頻模式變化至頻帶有限模式。若輸出模式被設定成頻帶有限模式(例如,窄頻模式),則被分類為具有頻帶有限內容之訊框的數目可與第二臨限進行比較。第二臨限可為低於特定臨限的值。若訊框之數目小於或等於第二臨限,則輸出模式可自頻帶有限模式變化至寬頻模式。藉由基於輸出模式使用不同臨限,解碼器可提供滯後,從而可幫助避免不同輸出模式之間的頻繁切換。舉例而言,若實施單一臨限,則當訊框之數目在大於或等於單一臨限與小於單一臨限之間逐個訊框地來回振盪時,輸出模式將在寬頻模式與頻帶有限模式之間頻繁切換。 另外地或替代地,回應於解碼器接收被分類為寬頻音訊訊框之特定數目個連續音訊訊框,輸出模式可自頻帶有限模式變化至寬頻模式。舉例而言,解碼器可監視所接收之音訊訊框,以偵測被分類為寬頻訊框的經連續接收之音訊訊框的特定數目。若輸出模式為頻帶有限模式(例如,窄頻模式)且經連續接收之音訊訊框的特定數目大於或等於臨限值(例如,20),則解碼器可將輸出模式自頻帶有限模式轉變至寬頻模式。藉由自頻帶有限輸出模式轉變至寬頻輸出模式,解碼器可提供原本將在解碼器保持於頻帶有限輸出模式中的情況下受到抑制的寬頻內容。 由所揭示之態樣中之至少一者提供的一個特定優點為:經組態以解碼寬頻頻率範圍上之音訊訊框的解碼器可選擇性地在窄頻頻率範圍上輸出頻帶有限內容。舉例而言,解碼器可藉由移除高頻帶頻率之頻譜能量洩漏來選擇性地輸出頻帶有限內容。移除頻譜能量洩漏可減少頻帶有限內容之音訊品質的降級,該降級在頻譜能量洩漏未被移除的情況下原本將被體驗。另外,解碼器可使用不同臨限判定何時將輸出模式自寬頻模式切換至頻帶有限模式及何時自頻帶有限模式切換至寬頻模式。藉由使用不同臨限,解碼器可避免在短時段期間於多個模式之間反覆轉變。另外,藉由監視所接收之音訊訊框以偵測被分類為寬頻訊框的經連續接收之音訊訊框的特定數目,解碼器可自頻帶有限模式快速轉變至寬頻模式,以提供原本將在解碼器保持為頻帶有限模式的情況下受到抑制之寬頻內容。 參看圖1,揭示了可操作以偵測頻帶有限內容之系統的特定說明性態樣,且通常將其指定為100。系統100可包括第一器件102(例如,源器件)及第二器件120(例如,目的地器件)。第一器件102可包括編碼器104,且第二器件120可包括解碼器122。第一器件102可經由網路(圖中未示)與第二器件120通信。舉例而言,第一器件102可經組態以將諸如音訊訊框112(例如,經編碼音訊資料)之音訊資料傳輸至第二器件120。另外地或替代地,第二器件120可經組態以將音訊資料傳輸至第一器件102。 第一器件102可經組態以使用編碼器104來編碼輸入音訊資料110(例如,語音資料)。舉例而言,編碼器104可經組態以編碼輸入音訊資料110(例如,經由遠端麥克風或位於第一器件102本端之麥克風以無線方式接收的語音資料),以產生音訊訊框112。編碼器104可分析輸入音訊資料110以提取一或多個參數,且可將該等參數量化成二進位表示,例如,將其量化成位元集合或二進位資料封包,諸如音訊訊框112。為進行說明,編碼器104可經組態以將語音信號壓縮成時間區塊、劃分成時間區塊,或進行該兩者操作以產生訊框。可將每一時間區塊(或「訊框」)之持續時間選擇為足夠短的,使得可預期信號之頻譜包絡保持相對固定。在一些實施中,第一器件102可包括多個編碼器,諸如經組態以編碼語音內容之編碼器104,及經組態以編碼非語音內容(例如,音樂內容)之另一編碼器(圖中未示)。 編碼器104可經組態以按取樣率(Fs)對輸入音訊資料110進行取樣。以赫茲(Hz)為單位的取樣率(Fs)為每秒之輸入音訊資料110的樣本數目。輸入音訊資料110之信號頻寬(例如,輸入內容)可理論上介於零(0)與一半取樣率(Fs/2)之間,諸如範圍[0, (Fs/2)]。若信號頻寬小於Fs/2,則輸入信號(例如,輸入音訊資料110)可被稱為頻帶有限的。另外,頻帶有限信號之內容可被稱為頻帶有限內容。 經寫碼頻寬可指示音訊寫碼器(編碼解碼器)寫碼之頻率範圍。在一些實施中,音訊寫碼器(編碼解碼器)可包括諸如編碼器104之編碼器、諸如解碼器122之解碼器,或該兩者。如本文中所描述,使用如16千赫茲(kHz)的經解碼語音之取樣率提供系統100之實例,此使得信號頻寬可能為8 kHz。8 kHz之頻寬可對應於寬頻(「WB」)。4 kHz之經寫碼頻寬可對應於窄頻(「NB」),且可指示寫碼處於0-4 kHz之範圍內的資訊,而該0-4 kHz範圍之外的其他資訊被捨棄。 在一些態樣中,編碼器104可提供等於輸入音訊資料110之信號頻寬的經編碼頻寬。若經寫碼頻寬大於信號頻寬(例如,輸入信號頻寬),則信號編碼及傳輸可歸因於資料被用以編碼輸入音訊資料110並不包括信號資訊的頻率範圍之內容而具有減少之效率。另外,若經寫碼頻寬大於信號頻寬,則在使用諸如代數碼激勵線性預測(ACELP)寫碼器之時域寫碼器的情況下,可出現至輸入信號不具有能量之高於信號頻寬的頻率區中的能量洩漏。頻譜能量洩漏可能不利於與經寫碼信號相關聯之信號品質。或者,若經寫碼頻寬小於輸入信號頻寬,則寫碼器可不傳輸包括於輸入信號中之全部資訊(例如,在經寫碼信號中,可省略輸入信號中所包括的高於Fs/2之頻率處的資訊)。傳輸少於輸入信號之全部資訊可降低經解碼語音之可懂度及生動性。 在一些實施中,編碼器104可包括或對應於適應性多重速率寬頻(AMR-WB)編碼器。AMR-WB編碼器可具有8 kHz之寫碼頻寬,且輸入音訊資料110可具有小於該寫碼頻寬的輸入信號頻寬。為進行說明,輸入音訊資料110可對應於NB輸入信號(例如,NB內容),如曲線圖150中所說明。在曲線圖150中,NB輸入信號在4至8 kHz區中具有零能量(即,並不包括頻譜能量洩漏)。編碼器104(例如,AMR-WB編碼器)可產生音訊訊框112,在曲線圖160中,該音訊訊框在被解碼時包括4至8 kHz範圍中的洩漏能量。在一些實施中,可在無線通信中在第一器件102處自耦接至第一器件102之器件(圖中未示)接收輸入音訊資料110。或者,輸入音訊資料110可包括由第一器件102諸如經由第一器件102之麥克風接收之音訊資料。在一些實施中,輸入音訊資料110可包括於音訊串流中。可自耦接至第一器件102之器件接收音訊串流之一部分,且可經由第一器件102之麥克風接收音訊串流之另一部分。 在其他實施中,編碼器104可包括或對應於具有AMR-WB互操作性模式之增強型話音服務(EVS)編碼解碼器。當經組態以在AMR-WB互操作性模式中操作時,編碼器104可經組態以支援與AMR-WB編碼器相同的寫碼頻寬。 音訊訊框112可自第一器件102傳輸(例如,以無線方式傳輸)至第二器件120。舉例而言,可在諸如有線網路連接、無線網路連接,或其組合之通信頻道上將音訊訊框112傳輸至第二器件120之接收器(圖中未示)。在一些實施中,音訊訊框112可包括於自第一器件102傳輸至第二器件120的一系列音訊訊框(例如,音訊串流)中。在一些實施中,指示對應於音訊訊框112之經寫碼頻寬的資訊可包括於音訊訊框112中。音訊訊框112可經由基於第三代合作夥伴計劃(3GPP) EVS協定的無線網路進行傳達。 第二器件120可包括經組態以經由第二器件120之接收器接收音訊訊框112的解碼器122。在一些實施中,解碼器122可經組態以接收AMR-WB編碼器之輸出。舉例而言,解碼器122可包括具有AMR-WB互操作性模式之EVS編碼解碼器。當經組態以在AMR-WB互操作性模式中操作時,解碼器122可經組態以支援與AMR-WB編碼器相同的寫碼頻寬。解碼器122可經組態以處理資料封包(例如,音訊訊框),以解量化經處理資料封包而產生音訊參數,且使用經解量化音訊參數再合成語音訊框。 解碼器122可包括第一解碼級123、偵測器124、第二解碼級132。第一解碼級123可經組態以處理音訊訊框112,以產生第一經解碼語音114及話音活動性決策(VAD) 140。可將第一經解碼語音114提供至偵測器124,至第二解碼級132。VAD 140可由解碼器122用以作出一或多個判定,如本文中所描述,可由解碼器122輸出至解碼器122之一或多個其他組件,或其一組合。 VAD 140可指示音訊訊框112是否包括有用的音訊內容。有用音訊內容之一實例為作用中語音而非僅僅靜默期間之背景雜訊。舉例而言,解碼器122可基於第一經解碼語音114判定音訊訊框112是否係作用中的(例如,包括作用中語音)。VAD 140可設定成值1,以指示特定訊框係「作用中的」或「有用的」。或者,VAD 140可設定成值0,以指示特定訊框係「非作用」訊框,諸如不含音訊內容之訊框(例如,僅包括背景雜訊)。儘管VAD 140被描述為由解碼器122判定,但在其他實施中,VAD 140可由第二器件120之不同於解碼器122的一組件判定,且可被提供至解碼器122。另外地或替代地,儘管VAD 140被描述為基於第一經解碼語音114,但在其他實施中,VAD 140可直接基於音訊訊框112。 偵測器124可經組態以將音訊訊框112(例如,第一經解碼語音114)分類為與寬頻內容或頻帶有限內容(例如,窄頻內容)相關聯。舉例而言,解碼器122可經組態以將音訊訊框112分類為窄頻訊框或寬頻訊框。窄頻訊框之分類可對應於音訊訊框112被分類為具有頻帶有限內容(例如,與頻帶有限內容相關聯)。至少部分基於音訊訊框112之分類,解碼器122可選擇輸出模式134,諸如窄頻(NB)模式或寬頻(WB)模式。舉例而言,輸出模式可對應於解碼器之合成器之操作模式(例如,合成模式)。 為進行說明,偵測器124可包括分類器126、追蹤器128,及平滑化邏輯130。分類器126可經組態以將音訊訊框分類為與頻帶有限內容(例如,NB內容)或寬頻內容(例如,WB內容)相關聯。在一些實施中,分類器126產生作用訊框之分類,但並不產生非作用訊框之分類。 為判定音訊訊框112之分類,分類器126可將第一經解碼語音114之頻率範圍劃分成多個頻帶。說明性實例190描繪被劃分成多個頻帶之頻率範圍。頻率範圍(例如,寬頻)可具有0-8 kHz之頻寬。頻率範圍可包括一低頻帶(例如窄頻)及一高頻帶。低頻帶可對應於頻率範圍(例如,窄頻)之第一子範圍(例如,第一集合),諸如0-4 kHz。高頻帶可對應於頻率範圍之第二子範圍(例如,第二集合),諸如4-8 kHz。寬頻可被劃分成多個頻帶,諸如頻帶B0-B7。多個頻帶中之每一者可具有相同頻寬(例如,實例190中的1 kHz之頻寬)。高頻帶之一或多個頻帶可被指定為轉變頻帶。轉變頻帶中之至少一者可鄰近於低頻帶。儘管寬頻被說明為劃分成8個頻帶,但在其他實施中,寬頻可劃分成8個以上或8個以下頻帶。舉例而言,作為說明性的非限制性實例,寬頻可劃分成各具有400 Hz之頻寬的20個頻帶。 為說明分類器126之操作,第一經解碼語音114(與寬頻相關聯)可被劃分成20個頻帶。分類器126可判定與低頻帶之頻帶相關聯的第一能量量度及與高頻帶之頻帶相關聯的第二能量量度。舉例而言,第一能量量度可為低頻帶之頻帶的平均能量(或功率)。作為另一實例,第一能量量度可為低頻帶之頻帶之一子集的平均能量。為進行說明,子集可包括頻率範圍800-3600 Hz內的頻帶。在一些實施中,可在判定第一能量量度之前將權重值(例如,乘數)應用於低頻帶之一或多個頻帶。將權重值應用於特定頻帶可在計算第一能量量度時對特定頻帶賦予更多優先性。在一些實施中,可對低頻帶中的最接近高頻帶的一或多個頻帶賦予優先性。 為判定對應於特定頻帶之能量的量,分類器126可使用正交鏡相濾波器組、帶通濾波器、複合低延遲濾波器組、另一組件,或另一技術。另外地或替代地,分類器126可藉由求出每一頻帶之信號分量之平方和來判定特定頻帶之能量的量。 可基於構成高頻帶之一或多個頻帶的能量峰值判定第二能量量度(例如,該一或多個頻帶不包括被視為轉變頻帶之頻帶)。為了進一步解釋,為了判定峰值能量,可不考慮高頻帶之一或多個轉變頻帶。可忽略該一或多個轉變頻帶,此係由於該一或多個轉變頻帶可相比高頻帶之其他頻帶具有來自低頻帶內容的較多頻譜洩漏。因此,該一或多個轉變頻帶可不指示高頻帶是否包括有意義的內容或僅包括頻譜能量洩漏。舉例而言,構成高頻帶之頻帶的能量峰值可為第一經解碼語音114之在轉變頻帶(例如,具有4.4 kHz之上限的轉變頻帶)以上的最大偵測頻帶能量值。 在判定(低頻帶之)第一能量量度及(高頻帶之)第二能量量度之後,分類器126可使用第一能量量度及第二能量量度執行一比較。舉例而言,分類器126可判定第一能量量度與第二能量量度之間的比是否大於或等於臨限量。若該比大於臨限量,則第一經解碼語音114可被判定為不具有高頻帶中的有意義的音訊內容(例如,4-8 kHz)。舉例而言,高頻帶可被判定為主要包括歸因於寫碼(低頻帶之)頻帶有限內容的頻譜洩漏。因此,若該比大於臨限量,則音訊訊框112可被分類為具有頻帶有限內容(例如,NB內容)。若該比小於或等於臨限量,則音訊訊框112可被分類為與寬頻內容(例如,WB內容)相關聯。臨限量可為諸如512之預定值,作為說明性的非限制性實例。或者,可基於第一能量量度判定臨限量。舉例而言,臨限量可等於第一能量量度除以值512。值512可對應於第一能量量度之對數與第二能量量度之對數之間的約27 dB的差(例如,10*log10 (第一能量量度)-10*log10 (第二能量量度))。在其他實施中,可計算第一能量量度與第二能量量度之比,且將其與臨限量進行比較。參看圖2描述被分類為具有頻帶有限內容及寬頻內容的音訊信號之實例。 追蹤器128可經組態以維持由分類器126產生之一或多個分類的記錄。舉例而言,追蹤器128可包括記憶體、緩衝器,或可經組態以追蹤分類之其他資料結構。為進行說明,追蹤器128可包括經組態以維持對應於特定數目(例如,100)之最近產生之分類器的資料之緩衝器(例如,分類器126對於100個最近訊框的分類輸出)。在一些實施中,追蹤器128可維持每一訊框(或每一作用訊框)進行更新的純量值。純量值可表示由分類器126分類為與頻帶有限(例如,窄頻)內容相關聯之訊框之相對計數的長期量度。舉例而言,純量值(例如,長期量度)可指示被分類為與頻帶有限(例如,窄頻)內容相關聯的所接收訊框之百分比。在一些實施中,追蹤器128可包括一或多個計數器。舉例而言,追蹤器128可包括:用以計數所接收訊框之數目(例如,作用訊框之數目)的第一計數器、經組態以計數被分類為具有頻帶有限內容之訊框之數目的第二計數器、經組態以計數被分類為具有寬頻內容之訊框之數目的第三計數器,或其一組合。另外地或替代地,該一或多個計數器可包括:用以計數被分類為具有頻帶有限內容的連續(及最近)接收之訊框之數目的第四計數器、經組態以計數被分類為具有寬頻內容的連續(及最近)接收之訊框之數目的第五計數器,或其一組合。在一些實施中,至少一個計數器可經組態為遞增的。在其他實施中,至少一個計數器可經組態為遞減的。在一些實施中,追蹤器128可回應於VAD 140指示特定訊框係作用訊框而遞增所接收之作用訊框之數目的計數。 平滑化邏輯130可經組態以判定輸出模式134,諸如選擇輸出模式134作為寬頻模式及頻帶有限模式(例如,窄頻模式)中之一者。舉例而言,平滑化邏輯130可經組態以回應於每一音訊訊框(例如,每一作用音訊訊框)而判定輸出模式134。平滑化邏輯130可實施長期方法以判定輸出模式134,使得輸出模式134並不在寬頻模式與頻帶有限模式之間頻繁交替。 平滑化邏輯130可判定輸出模式134,且可將輸出模式134之指示提供至第二解碼級132。平滑化邏輯130可基於由追蹤器128提供之一或多個量度判定輸出模式134。作為說明性的非限制性實例,該一或多個量度可包括:所接收訊框之數目、作用訊框(例如,由話音活動性決策指示為作用中/有用的訊框)之數目、被分類為具有頻帶有限內容之訊框之數目、被分類為具有寬頻內容之訊框之數目等等。可將作用訊框之數目量測為自以下二者中的最新事件以來由VAD 140指示(例如,分類)為「作用中/有用的」訊框之數目:輸出模式已顯式切換(諸如自頻帶有限模式切換至寬頻模式)的上次事件,通信(例如,電話通話)之起點。另外,平滑化邏輯130可基於先前或現存(例如,當前)輸出模式及一或多個臨限131判定輸出模式134。 在一些實施中,平滑化邏輯130可在所接收訊框之數目小於或等於第一臨限數目的情況下將輸出模式134選擇為寬頻模式。在額外或替代性實施中,平滑化邏輯130可在作用訊框之數目小於第二臨限的情況下將輸出模式134選擇為寬頻模式。第一臨限數目可具有值20、50、250或500,作為說明性的非限制性實例。作為說明性的非限制性實例,第二臨限數目可具有值20、50、250或500。若所接收訊框之數目大於第一臨限數目,則平滑化邏輯130可基於被分類為具有頻帶有限內容之訊框的數目、被分類為具有寬頻內容之訊框的數目、由分類器126分類為與頻帶有限內容相關聯之訊框之相對計數的長期量度、被分類為具有寬頻內容的連續(及最近)接收之訊框之數目,或其一組合而判定輸出模式134。在滿足第一臨限數目之後,偵測器124可認為追蹤器128已積聚足夠分類,從而使平滑化邏輯130能夠選擇輸出模式134,如本文中進一步描述。 為進行說明,在一些實施中,平滑化邏輯130可基於被分類為具有頻帶有限內容之所接收訊框之相對計數相比於適應性臨限的一比較而選擇輸出模式134。可自藉由追蹤器128追蹤之分類的總數判定被分類為具有頻帶有限內容之所接收訊框之相對計數。舉例而言,追蹤器128可經組態以追蹤特定數目(例如,100)的最近分類之作用訊框。為進行說明,所接收作用訊框之數目的計數可上限於(例如,受限於)特定數目。在一些實施中,被分類為與頻帶有限內容相關聯之所接收訊框的數目可表示為一比或百分比以指示被分類為與頻帶有限內容相關聯之訊框之相對數目。舉例而言,所接收作用訊框之數目的計數可對應於一或多個訊框之群組,且平滑化邏輯130可判定被分類為與頻帶有限內容相關聯的一或多個訊框在群組中的百分比。因此,將所接收訊框之數目的計數設定為初始值(例如,值零)可具有將百分比重設為值零的效果。 可藉由平滑化邏輯130根據先前輸出模式134(諸如應用於由解碼器122處理之先前音訊訊框的先前輸出模式)選擇(例如設定)適應性臨限。舉例而言,先前輸出模式可為最近使用之輸出模式。若先前輸出模式為寬頻內容模式,則可將適應性臨限選擇為第一適應性臨限。若先前輸出模式為頻帶有限內容模式,則可將適應性臨限選擇為第二適應性臨限。第一適應性臨限之值可大於第二適應性臨限之值。舉例而言,第一適應性臨限可與值90%相關聯,且第二適應性臨限可與值80%相關聯。作為另一實例,第一適應性臨限可與值80%相關聯,且第二適應性臨限可與值71%相關聯。基於先前輸出模式將適應性臨限選擇為多個臨限值中之一者可提供滯後,從而可幫助避免輸出模式134在寬頻模式與頻帶有限模式之間頻繁切換。 若適應性臨限為第一適應性臨限(例如,先前輸出模式為寬頻模式),則平滑化邏輯130可將被分類為具有頻帶有限內容之所接收訊框的數目與第一適應性臨限進行比較。若被分類為具有頻帶有限內容之所接收訊框的數目大於或等於第一適應性臨限,則平滑化邏輯130可將輸出模式134選擇為頻帶有限模式。若被分類為具有頻帶有限內容之所接收訊框的數目小於第一適應性臨限,則平滑化邏輯130可維持先前輸出模式(例如,寬頻模式)作為輸出模式134。 若適應性臨限為第二適應性臨限(例如,先前輸出模式為頻帶有限模式),則平滑化邏輯130可將被分類為具有頻帶有限內容之所接收訊框的數目與第二適應性臨限進行比較。若被分類為具有頻帶有限內容之所接收訊框的數目小於或等於第二適應性臨限,則平滑化邏輯130可將輸出模式134選擇為寬頻模式。若被分類為與頻帶有限內容相關聯之所接收訊框的數目大於第二適應性臨限,則平滑化邏輯130可維持先前輸出模式(例如,頻帶有限模式)作為輸出模式134。藉由在滿足第一適應性臨限(例如,較高適應性臨限)時自寬頻模式切換至頻帶有限模式,偵測器124可提供頻帶有限內容由解碼器122接收的高機率。另外,藉由在滿足第二適應性臨限(例如,較低適應性臨限)時自頻帶有限模式切換至寬頻模式,偵測器124可回應於頻帶有限內容由解碼器122接收之較低機率而改變模式。 儘管平滑化邏輯130被描述為使用被分類為具有頻帶有限內容之所接收訊框的數目,但在其他實施中,平滑化邏輯130可基於被分類為具有寬頻內容之所接收訊框的相對計數選擇輸出模式134。舉例而言,平滑化邏輯130可將被分類為具有寬頻內容之所接收訊框的相對計數與設定為第三適應性臨限及第四適應性臨限中之一者的適應性臨限進行比較。第三適應性臨限可具有與10%相關聯之值,且第四適應性臨限可具有與20%相關聯之值。當先前輸出模式為寬頻模式時,平滑化邏輯130可將被分類為具有寬頻內容之所接收訊框的數目與第三適應性臨限進行比較。若被分類為具有寬頻內容之所接收訊框的數目小於或等於第三適應性臨限,則平滑化邏輯130可將輸出模式134選擇為頻帶有限模式,否則輸出模式134可保持為寬頻模式。當先前輸出模式為窄頻模式時,平滑化邏輯130可將被分類為具有寬頻內容之所接收訊框的數目與第四適應性臨限進行比較。若被分類為具有寬頻內容之所接收訊框的數目大於或等於第四適應性臨限,則平滑化邏輯130可將輸出模式134選擇為寬頻模式,否則輸出模式134可保持為頻帶有限模式。 在一些實施中,平滑化邏輯130可基於被分類為具有寬頻內容的連續(及最近)接收之訊框的數目判定輸出模式134。舉例而言,追蹤器128可維持被分類為與寬頻內容相關聯(例如,未被分類為與頻帶有限內容相關聯)的經連續接收之作用訊框的計數。在一些實施中,計數可係基於(例如,包括)諸如音訊訊框112之當前訊框,只要該當前訊框被識別為作用訊框且分類為與寬頻內容相關聯即可。平滑化邏輯130可獲得被分類為與寬頻內容相關聯的經連續接收之作用訊框的計數,且可將該計數與臨限數目進行比較。作為說明性的非限制性實例,臨限數目可具有7或20之值。若計數大於或等於臨限數目,則平滑化邏輯130可將輸出模式134選擇為寬頻模式。在一些實施中,寬頻模式可認為輸出模式134之預設模式,且當計數大於或等於臨限數目時,輸出模式134可保持為寬頻模式而不變。 另外地或替代地,回應於被分類為具有寬頻內容的連續(及最近)接收之訊框的數目大於或等於臨限數目,平滑化邏輯130可使得追蹤所接收訊框之數目(例如,作用訊框之數目)的計數器設定成初始值,諸如值零。將追蹤所接收訊框之數目(例如,作用訊框之數目)的計數器設定成值零可具有迫使輸出模式134設定成寬頻模式的效果。舉例而言,至少在所接收訊框之數目(例如,作用訊框之數目)大於第一臨限數目之前,輸出模式134可設定成寬頻模式。在一些實施中,所接收訊框之數目的計數可在輸出模式134自頻帶有限模式(例如,窄頻模式)切換至寬頻模式的任何時候設定成初始值。在一些實施中,回應於被分類為具有寬頻內容的連續(及最近)接收之訊框的數目大於或等於臨限數目,追蹤最近分類為具有頻帶有限內容之訊框之相對計數的長期量度可重設成初始值,諸如值零。或者,若被分類為具有寬頻內容的連續(及最近)接收之訊框的數目小於臨限數目,則平滑化邏輯130可進行如本文中所描述之一或多個其他判定,以選擇(與諸如音訊訊框112之所接收音訊訊框相關聯的)輸出模式134。 除平滑化邏輯130將被分類為與寬頻內容相關聯的經連續接收之作用訊框的計數與臨限數目進行比較之外或作為其代替,平滑化邏輯130可判定特定數目個最近所接收之作用訊框中的被分類為具有寬頻內容(例如,未被分類為具有頻帶有限內容)之經先前接收之作用訊框的數目。作為說明性的非限制性實例,最近接收之作用訊框的特定數目可為20。平滑化邏輯130可將(特定數目個最近接收之作用訊框中的)被分類為具有寬頻內容的經先前接收之作用訊框的數目與第二臨限數目(可與適應性臨限具有相同或不同值)進行比較。在一些實施中,第二臨限數目為固定(例如,非適應性)臨限。回應於判定被分類為具有寬頻內容的經先前接收之作用訊框的數目被判定為大於或等於第二臨限數目,平滑化邏輯130可執行與參考平滑化邏輯130判定被分類為與寬頻內容相關聯的經連續接收之作用訊框的計數大於臨限數目的步驟而描述的相同操作中之一或多者。回應於判定被分類為具有寬頻內容的經先前接收之作用訊框的數目被判定為小於第二臨限數目,平滑化邏輯130可進行如本文中所描述之一或多個其他判定,以選擇(與諸如音訊訊框112之所接收音訊訊框相關聯的)輸出模式134。 在一些實施中,回應於VAD 140指示音訊訊框112為作用訊框,平滑化邏輯130可判定音訊訊框112之低頻帶的平均能量(或低頻帶之一頻帶子集的平均能量),諸如第一經解碼語音114之平均低頻帶能量(替代地,低頻帶之一頻帶子集的平均能量)。平滑化邏輯130可將音訊訊框112之平均低頻帶能量(或替代地,低頻帶之一頻帶子集的平均能量)與諸如長期量度之臨限能量值進行比較。舉例而言,臨限能量值可為多個先前接收之訊框的平均低頻帶能量值之平均值(或替代地,低頻帶之一頻帶子集的平均能量之平均值)。在一些實施中,多個先前接收之訊框可包括音訊訊框112。若音訊訊框112之低頻帶的平均能量值小於多個先前接收之訊框的平均低頻帶能量值,則追蹤器128可選擇不使用126對於音訊訊框112的分類決策更新對應於由分類器126分類為與頻帶有限內容相關聯之訊框之相對計數的長期量度的值。或者,若音訊訊框112之低頻帶的平均能量值大於或等於多個先前接收之訊框的平均低頻帶能量值,則追蹤器128可選擇使用126對於音訊訊框112的分類決策更新對應於由分類器126分類為與頻帶有限相關聯之訊框之相對計數的長期量度的值。 第二解碼級132可根據輸出模式134處理第一經解碼語音114。舉例而言,第二解碼級132可接收第一經解碼語音114,且根據輸出模式134可輸出第二經解碼語音116。為進行說明,若輸出模式134對應於WB模式,則第二解碼級132可經組態以輸出(例如,產生)第一經解碼語音114作為第二經解碼語音116。或者,若輸出模式134對應於NB模式,則第二解碼級132可選擇性地輸出第一經解碼語音之一部分作為第二經解碼語音。舉例而言,第二解碼級132可經組態以「零化」或替代地衰減第一經解碼語音114之高頻帶內容,且對第一經解碼語音114之低頻帶內容執行最終合成以產生第二經解碼語音116。曲線圖170說明具有頻帶有限內容(且不具有高頻帶內容)之第二經解碼語音116的一實例。 在操作期間,第二器件120可接收多個音訊訊框之第一音訊訊框。舉例而言,第一音訊訊框可對應於音訊訊框112。VAD 140(例如,資料)可指示第一音訊訊框為作用訊框。回應於接收第一音訊訊框,分類器126可將第一音訊訊框之第一分類產生為頻帶有限訊框(例如,窄頻訊框)。第一分類可儲存於追蹤器128處。回應於接收到第一音訊訊框,平滑化邏輯130可判定所接收音訊訊框之數目小於第一臨限數目。替代地,平滑化邏輯130可判定作用訊框之數目(其被量測為自以下二者中的最新事件以來由VAD 140指示(例如,識別)為「作用中/有用的」訊框之數目:輸出模式已顯式地自頻帶有限模式切換至寬頻模式的上次事件或通話之起點)小於第二臨限數目。因為所接收音訊訊框之數目小於第一臨限數目,所以平滑化邏輯130可將對應於輸出模式134之第一輸出模式(例如,預設模式)選擇為寬頻模式。可在所接收音訊訊框之數目小於第一臨限數目的情況下選擇預設模式,與與頻帶有限內容相關聯之所接收訊框的數目無關,且與已被分類為具有寬頻內容(例如,不具有頻帶有限內容)的經連續接收之訊框的數目無關。 在接收第一音訊訊框之後,第二器件可接收多個音訊訊框中之第二音訊訊框。舉例而言,第二音訊訊框可為第一音訊訊框之後的下一所接收訊框。VAD 140可指示第二音訊訊框為作用訊框。所接收作用音訊訊框之數目可回應於第二音訊訊框為作用訊框而遞增。 基於第二音訊訊框為作用訊框,分類器126可將第二音訊訊框之第二分類產生為頻帶有限訊框(例如,窄頻訊框)。第二分類可儲存於追蹤器128處。回應於接收第二音訊訊框,平滑化邏輯130可判定所接收之音訊訊框(例如,所接收之作用音訊訊框)的數目大於或等於第一臨限數目。(應注意,標識「第一」及「第二」區分訊框,且未必指示在所接收訊框之序列中訊框之次序或位置。舉例而言,第一訊框可為訊框序列中所接收的第7個訊框,且第二訊框可為訊框序列中的第8個訊框。)回應於所接收音訊訊框之數目大於第一臨限數目,平滑化邏輯130可基於先前輸出模式(例如,第一輸出模式)設定適應性臨限。舉例而言,適應性臨限可被設定成第一適應性臨限,此係由於第一輸出模式為寬頻模式。 平滑化邏輯130可將被分類為具有頻帶有限內容之所接收訊框的數目與第一適應性臨限進行比較。平滑化邏輯130可判定被分類為具有頻帶有限內容之所接收訊框的數目大於或等於第一適應性臨限,且可將對應於第二音訊訊框之第二輸出模式設定為頻帶有限模式。舉例而言,平滑化邏輯130可將輸出模式134更新為頻帶有限內容模式(例如,NB模式)。 第二器件120之解碼器122可經組態以接收諸如音訊訊框112之多個音訊訊框,且識別具有頻帶有限內容的一或多個音訊訊框。基於被分類為具有頻帶有限內容之訊框的數目(被分類為具有寬頻內容之訊框的數目,或兩者),解碼器122可經組態以選擇性地處理所接收訊框,以產生且輸出包括頻帶有限內容(且不包括高頻帶內容)之經解碼語音。解碼器122可使用平滑化邏輯130來確保解碼器122不在輸出寬頻經解碼語音及頻帶有限經解碼語音之間頻繁地切換。另外,藉由監視所接收音訊訊框以偵測被分類為寬頻訊框的經連續接收之音訊訊框的特定數目,解碼器122可自頻帶有限輸出模式快速轉變至寬頻輸出模式。藉由自頻帶有限輸出模式快速轉變至寬頻輸出模式,解碼器122可提供原本將在解碼器122保持於頻帶有限輸出模式的情況下受到抑制的寬頻內容。使用圖1之解碼器122可導致改良的信號解碼品質以及改良的使用者體驗。 圖2描繪了曲線圖,其經描繪為說明音訊信號之分類。音訊信號之分類可由圖1之分類器126執行。第一曲線圖200說明將第一音訊信號分類為包括頻帶有限內容。在第一曲線圖200中,第一音訊信號之低頻帶部分之平均能量位準與第一音訊信號之高頻帶部分(不包括轉變頻帶)之峰值能量位準之間的比大於臨限比。第二曲線圖250說明將第二音訊信號分類為包括寬頻內容。在第二曲線圖250中,第二音訊信號之低頻帶部分之平均能量位準與第二音訊信號之高頻帶部分(不包括轉變頻帶)之峰值能量位準之間的比小於臨限比。 參看圖3及圖4,描繪了說明與解碼器之操作相關聯之值的表。該解碼器可對應於圖1之解碼器122。如圖3至圖4中所使用,音訊訊框序列指示音訊訊框在解碼器處被接收的次序。分類指示對應於所接收音訊訊框之分類。每一分類可由圖1之分類器126判定。WB之分類對應於被分類為具有寬頻內容之訊框,且NB之分類對應於被分類為具有頻帶有限內容之訊框。百分比窄頻指示被分類為具有頻帶有限內容的最近接收之訊框的百分比。百分比可係基於最近接收之訊框的數目,諸如200或500個訊框,作為說明性的非限制性實例。適應性臨限指示可應用於特定訊框之百分比窄頻以判定將被用以輸出與特定訊框相關聯之音訊內容的輸出模式的臨限。輸出模式指示用以輸出與特定訊框相關聯之音訊內容的模式(例如,寬頻模式(WB)或頻帶有限(NB)模式)。輸出模式可對應於圖1之輸出模式134。計數連續WB可指示已被分類為具有寬頻內容的經連續接收之訊框的數目。作用訊框計數指示由解碼器接收之作用訊框的數目。訊框可由諸如圖1之VAD 140的VAD識別為作用訊框(A)或非作用訊框(I)。 第一表300說明輸出模式之變化及回應於輸出模式之變化的適應性臨限之變化。舉例而言,可接收訊框(c),且可將其分類為與頻帶有限內容(NB)相關聯。回應於接收到訊框(c),窄頻訊框之百分比可大於或等於為90的適應性臨限。因此,輸出模式自WB變化至NB,且適應性臨限可經更新為值83,其將應用於隨後接收之訊框(諸如訊框(d))。適應性值可維持為值83,直至回應於訊框(i),窄頻訊框之百分比小於適應性臨限83為止。回應於窄頻訊框之百分比小於為83的適應性臨限,輸出模式自NB變化至WB,且適應性臨限可經更新為用於隨後接收之訊框(諸如訊框(j))的值90。因此,第一表300說明適應性臨限之變化。 第二表350說明輸出模式可回應於已被分類為具有寬頻內容的經連續接收之訊框的數目(計數連續WB)大於或等於臨限值而改變。舉例而言,臨限值可等於值7。為進行說明,訊框(h)可為被分類為寬頻訊框的第七個依序接收之訊框。回應於接收到訊框(h),輸出模式可自頻帶有限模式(NB)切換,且設定成寬頻模式(WB)。因此,第二表350說明回應於已被分類為具有寬頻內容的經連續接收之訊框的數目而改變輸出模式。 第三表400說明並不使用被分類為具有頻帶有限內容之訊框的百分比與適應性臨限的比較來判定輸出模式,直至已由解碼器接收臨限數目個作用訊框為止的實施。舉例而言,作用訊框之臨限數目可等於50,作為說明性的非限制性實例。訊框(a)-(aw)可對應於與寬頻內容相關聯之輸出模式,而不管被分類為具有頻帶有限內容之訊框的百分比。可基於被分類為具有頻帶有限內容之訊框的百分比與適應性臨限的比較判定對應於訊框(ax)之輸出模式,此係由於作用訊框計數可大於或等於臨限數目(例如,50)。因此,第三表400說明禁止改變輸出模式,直至已接收臨限數目個作用訊框為止。 第四表450說明回應於訊框被分類為非作用訊框的解碼器之操作的實例。另外,第四表450說明並不使用被分類為具有頻帶有限內容之訊框的百分比與適應性臨限的比較來判定輸出模式,直至已由解碼器接收臨限數目個作用訊框為止。舉例而言,作用訊框之臨限數目可等於50,作為說明性的非限制性實例。 第四表450說明可不針對被識別為非作用訊框之訊框判定分類。另外,在判定具有頻帶有限內容之訊框的百分比(百分比窄頻)時可不考慮被識別為非作用之訊框。因此,若特定訊框被識別為非作用,則不將適應性臨限用於比較中。此外,識別為非作用之訊框的輸出模式可為用於最近接收之訊框的相同輸出模式。因此,第四表450說明回應於包括被識別為非作用訊框之一或多個訊框之訊框序列的解碼器操作。 參考圖5,揭示了操作解碼器之方法之特定說明性實例的流程圖,且通常將其指定為500。該解碼器可對應於圖1之解碼器122。舉例而言,方法500可由圖1之第二器件120(例如,解碼器122、第一解碼級123、偵測器124、第二解碼級132)或其一組合執行。 方法500包括:在502,在解碼器處產生與音訊串流之音訊訊框相關聯的第一經解碼語音。音訊訊框及第一經解碼語音可分別對應於圖1之音訊訊框112及第一經解碼語音114。第一經解碼語音可包括低頻帶分量及高頻帶分量。高頻帶分量可對應於頻譜能量洩漏。 方法500亦包括:在504,至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的數目而判定解碼器之輸出模式。舉例而言,輸出模式可對應於圖1之輸出模式134。在一些實施中,輸出模式可被判定為窄頻模式或寬頻模式。 方法500進一步包括:在506,基於第一經解碼語音輸出第二經解碼語音,其中根據輸出模式輸出該第二經解碼語音。舉例而言,第二經解碼語音可包括或對應於圖1之第二經解碼語音116。若輸出模式為寬頻模式,則第二經解碼語音可與第一經解碼語音實質上相同。舉例而言,若第二經解碼語音與第一經解碼語音相同或在第一經解碼語音之容限範圍內,則第二經解碼語音之頻寬與第一經解碼語音之頻寬實質上相同。容限範圍可對應於設計容限、製造容限、與解碼器相關聯之操作容限(例如,處理容限),或其一組合。若輸出模式為窄頻模式,則輸出第二經解碼語音可包括維持第一經解碼語音之低頻帶分量,且衰減第一經解碼語音之高頻帶分量。另外地或替代地,若輸出模式為窄頻模式,則輸出第二經解碼語音可包括衰減與第一經解碼語音之高頻帶分量相關聯的一或多個頻帶。在一些實施中,高頻帶分量的衰減或與高頻帶相關聯之頻帶中之一或多者的衰減可意謂著「零化」高頻帶分量或「零化」與高頻帶內容相關聯之頻帶中的一或多者。 在一些實施中,方法500可包括:判定基於與低頻帶分量相關聯之第一能量量度及與高頻帶分量相關聯之第二能量量度的比值。方法500亦可包括將比值與分類臨限進行比較,及回應於比值大於分類臨限而將音訊訊框分類為與頻帶有限內容相關聯。若音訊訊框與頻帶有限內容相關聯,則輸出第二經解碼語音可包括:衰減第一經解碼語音之高頻帶分量以產生第二經解碼語音。替代地,若音訊訊框與頻帶有限內容相關聯,則輸出第二經解碼語音可包括將與高頻帶分量相關聯之一或多個頻帶的能量值設定為特定值以產生第二經解碼語音。作為說明性的非限制性實例,特定值可為零。 在一些實施中,方法500可包括將音訊訊框分類為窄頻訊框或寬頻訊框。窄頻訊框之分類對應於與頻帶有限內容相關聯。方法500亦可包括:判定對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之第二計數的量度值。多個音訊訊框可對應於在圖1之第二器件120處接收的音訊串流。多個音訊訊框可包括音訊訊框(例如,圖1之音訊訊框112)及第二音訊訊框。舉例而言,與頻帶有限內容相關聯之音訊訊框之第二計數可維持(例如,儲存)於圖1的追蹤器128處。為進行說明,與頻帶有限內容相關聯之音訊訊框的第二計數可對應於維持於圖1之追蹤器128處的特定量度值。方法500亦可包括:基於量度值(例如,音訊訊框之第二計數)選擇諸如參考圖1之系統100所描述之適應性臨限的臨限。為進行說明,可使用音訊訊框之第二計數選擇與音訊訊框相關聯之輸出模式,且可基於輸出模式選擇適應性臨限。 在一些實施中,方法500可包括:判定與多個頻帶中關聯於第一經解碼語音之低頻帶分量的第一集合相關聯的第一能量量度,及判定與多個頻帶中關聯於第一經解碼語音之高頻帶分量的第二集合相關聯的第二能量量度。判定第一能量量度可包括:判定多個頻帶之第一集合之一頻帶子集的平均能量值及將第一能量量度設定為等於平均能量值。判定第二能量量度可包括:判定多個頻帶之第二集合中的具有多個頻帶之第二集合之最高偵測能量值的特定頻帶,及將第二能量量度設定為等於最高偵測能量值。第一子範圍及第二子範圍可互斥。在一些實施中,第一子範圍及第二子範圍由頻率範圍之轉變頻帶隔開。 在一些實施中,方法500可包括:回應於接收音訊串流之第二音訊訊框,判定在解碼器處接收且分類為具有寬頻內容的連續音訊訊框之第三計數。舉例而言,具有寬頻內容的連續音訊訊框之第三計數可維持(例如,儲存)於圖1之追蹤器128處。方法500可進一步包括:回應於具有寬頻內容的連續音訊訊框之第三計數大於或等於臨限而將輸出模式更新為寬頻模式。為進行說明,若在504處判定的輸出模式為與頻帶有限模式相關聯,則輸出模式可在具有寬頻內容的連續音訊訊框之第三計數大於或等於臨限的情況下經更新為寬頻模式。另外,若連續音訊訊框之第三計數大於或等於臨限,則可獨立於基於被分類為具有頻帶有限內容之音訊訊框的數目(或被分類為具有寬頻內容之訊框的數目)與適應性臨限的比較而更新輸出模式。 在一些實施中,方法500可包括:在解碼器處判定對應於多個第二音訊訊框中與頻帶有限內容相關聯之第二音訊訊框的相對計數的量度值。在特定實施中,判定量度值可回應於接收音訊訊框而予以執行。舉例而言,圖1之分類器126可判定對應於與頻帶有限內容相關聯之音訊訊框之計數的量度值,如參看圖1所描述。方法500亦可包括基於解碼器之輸出模式而選擇臨限。可基於量度值與臨限之比較而將輸出模式自第一模式選擇性地更新為第二模式。舉例而言,圖1之平滑化邏輯130可將輸出模式自第一模式選擇性地更新為第二模式,如參看圖1所描述。 在一些實施中,方法500可包括判定音訊訊框是否為作用訊框。舉例而言,圖1之VAD 140可指示音訊訊框為作用的抑或為非作用的。回應於判定音訊訊框為作用訊框,可判定解碼器之輸出模式。 在一些實施中,方法500可包括在解碼器處接收音訊串流之第二音訊訊框。舉例而言,解碼器122可接收圖3的音訊訊框(b)。方法500亦可包括判定第二音訊訊框是否為非作用訊框。方法500可進一步包括回應於判定第二音訊訊框為非作用訊框而維持解碼器之輸出模式。舉例而言,分類器126可回應於VAD 140指示第二音訊訊框為非作用訊框而不輸出分類,如參看圖1所描述。作為另一實例,偵測器124可維持先前輸出模式,且可回應於VAD 140指示第二音訊訊框為非作用訊框而不根據第二訊框判定輸出模式134,如參看圖1所描述。 在一些實施中,方法500可包括在解碼器處接收音訊串流之第二音訊訊框。舉例而言,解碼器122可接收圖3的音訊訊框(b)。方法500亦可包括:判定在解碼器處接收且被分類為與寬頻內容相關聯之包括第二音訊訊框的連續音訊訊框的數目。舉例而言,圖1之追蹤器128可計數且判定被分類為與寬頻內容相關聯之連續音訊訊框的數目,如參考圖1及圖3所描述。方法500可進一步包括:回應於被分類為與寬頻內容相關聯之連續音訊訊框的數目大於或等於臨限而將與第二音訊訊框相關聯之第二輸出模式選擇為寬頻模式。舉例而言,圖1之平滑化邏輯130可回應於被分類為與寬頻內容相關聯的連續音訊訊框之數目大於或等於臨限而選擇輸出模式,如參考圖3之第二表350所描述。 在一些實施中,方法500可包括:選擇寬頻模式作為與第二音訊訊框相關聯之第二輸出模式。方法500亦可包括回應於選擇寬頻模式而將與第二音訊訊框相關聯之輸出模式自第一模式更新為寬頻模式。方法500可進一步包括:回應於將輸出模式自第一模式更新為寬頻模式,將所接收音訊訊框之計數設定為第一初始值,將對應於音訊串流中與頻帶有限內容相關聯之音訊訊框的相對計數之量度值設定為第二初始值,或該兩者,如參考圖3之第二表350所描述。在一些實施中,第一初始值及第二初始值可為相同值,諸如零。 在一些實施中,方法500可包括在解碼器處接收音訊串流之多個音訊訊框。多個音訊訊框可包括該音訊訊框及第二音訊訊框。方法500亦可包括:回應於接收第二音訊訊框,在解碼器處判定對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框的相對計數的量度值。方法500可包括基於解碼器之輸出模式之第一模式選擇一臨限。第一模式可與在第二音訊訊框之前接收的音訊訊框相關聯。方法500可進一步包括基於量度值與臨限之比較而將輸出模式自第一模式更新為第二模式。第二模式可與第二音訊訊框相關聯。 在一些實施中,方法500可包括:在解碼器處判定對應於被分類為與頻帶有限內容相關聯之音訊訊框的數目的量度值。方法500亦可包括基於解碼器之先前輸出模式而選擇臨限。可進一步基於量度值與臨限之比較而判定解碼器之輸出模式。 在一些實施中,方法500可包括在解碼器處接收音訊串流之第二音訊訊框。方法500亦可包括:判定在解碼器處接收且被分類為與寬頻內容相關聯之包括第二音訊訊框的連續音訊訊框的數目。方法500可進一步包括:回應於連續音訊訊框之數目大於或等於臨限而將與第二音訊訊框相關聯之第二輸出模式選擇為寬頻模式。 方法500可因此使得解碼器能夠選擇用以輸出與音訊訊框相關聯之音訊內容的輸出模式。舉例而言,若輸出模式為窄頻模式,則解碼器可輸出與音訊訊框相關聯之窄頻內容,且可避免輸出與音訊訊框相關聯之高頻帶內容。 參考圖6,揭示了處理音訊訊框之方法之特定說明性實例的流程圖,且通常將其指示為600。音訊訊框可包括或對應於圖1之音訊訊框112。舉例而言,方法600可由圖1之第二器件120(例如,解碼器122、第一解碼級123、偵測器124、分類器126、第二解碼級132),或其一組合執行。 方法600包括:在602,在解碼器處接收音訊串流之音訊訊框,該音訊訊框與頻率範圍相關聯。音訊訊框可對應於圖1之音訊訊框112。頻率範圍可與諸如0-8 kHz的寬頻頻率範圍(例如,寬頻頻寬)相關聯。寬頻頻率範圍可包括低頻帶頻率範圍及高頻帶頻率範圍。 方法600亦包括:在604,判定與頻率範圍之第一子範圍相關聯的第一能量量度,及在606,判定與頻率範圍之第二子範圍相關聯的第二能量量度。第一能量量度及第二能量量度可由圖1之解碼器122(例如,偵測器124)產生。第一子範圍可對應於低頻帶(例如,窄頻)之一部分。舉例而言,若低頻帶具有0-4 kHz之頻寬,則第一子範圍可具有0.8-3.6 kHz之頻寬。第一子範圍可與音訊訊框之低頻帶分量相關聯。第二子範圍可對應於高頻帶之一部分。舉例而言,若高頻帶具有4-8 kHz之頻寬,則第二子範圍可具有4.4-8 kHz之頻寬。第二子範圍可與音訊訊框之高頻帶分量相關聯。 方法600進一步包括:在608,基於第一能量量度及第二能量量度判定是否將音訊訊框分類為與頻帶有限內容相關聯。頻帶有限內容可對應於音訊訊框之窄頻內容(例如,低頻帶內容)。包括於音訊訊框之高頻帶中的內容可與頻譜能量洩漏相關聯。第一子範圍可包括多個第一頻帶。多個第一頻帶之每一頻帶可具有相同頻寬,且判定第一能量量度可包括計算多個第一頻帶之兩個或兩個以上頻帶的平均能量值。第二子範圍可包括多個第二頻帶。多個第二頻帶之每一頻帶可具有相同頻寬,且判定第二能量量度可包括判定多個第二頻帶之能量峰值。 在一些實施中,第一子範圍及第二子範圍可互斥。舉例而言,第一子範圍及第二子範圍可由頻率範圍之轉變頻帶隔開。轉變頻帶可與高頻帶相關聯。 方法600可因此使得解碼器能夠分類音訊訊框是否包括頻帶有限內容(例如,窄頻內容)。將音訊訊框分類為具有頻帶有限內容可使得解碼器能夠將解碼器之輸出模式(例如,合成模式)設定為窄頻模式。當輸出模式設定為窄頻模式時,解碼器可輸出所接收音訊訊框之頻帶有限內容(例如,窄頻內容),且可避免輸出與所接收音訊訊框相關聯的高頻帶內容。 參考圖7,揭示了操作解碼器之方法之特定說明性實例的流程圖,且通常將其指定為700。該解碼器可對應於圖1之解碼器122。舉例而言,方法700可由圖1之第二器件120(例如,解碼器122、第一解碼級123、偵測器124、第二解碼級132),或其一組合執行。 方法700包括:在702,在解碼器處接收音訊串流之多個音訊訊框。多個音訊訊框可包括圖1之音訊訊框112。在一些實施中,方法700可包括:對於多個音訊訊框之每一音訊訊框,在解碼器處判定訊框是否與頻帶有限內容相關聯。 方法700包括:在704,回應於接收第一音訊訊框,在該解碼器處判定對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之相對計數的量度值。舉例而言,量度值可對應於NB訊框之計數。在一些實施中,量度值(例如,被分類為與頻帶有限內容相關聯之音訊訊框的計數)可被判定為訊框之數目的百分比(例如,達至最近接收之作用訊框的100)。 方法700亦包括:在706,基於解碼器之輸出模式(其與在第一音訊訊框之前接收的音訊串流之第二音訊訊框相關聯)選擇臨限。舉例而言,該輸出模式(例如,一輸出模式)可對應於圖1之輸出模式134。輸出模式可為寬頻模式或窄頻模式(例如,頻帶有限模式)。臨限可對應於圖1之一或多個臨限131。可將臨限選擇為具有第一值之寬頻臨限或具有第二值之窄頻臨限。第一值可大於第二值。回應於判定輸出模式為寬頻模式,可將寬頻臨限選擇為臨限。回應於判定輸出模式為窄頻模式,可將窄頻臨限選擇為臨限。 方法700可進一步包括:在708,基於量度值與臨限之比較而將輸出模式自第一模式更新為第二模式。 在一些實施中,可部分基於音訊串流之第二音訊訊框選擇第一模式,其中在第一音訊訊框之前接收第二音訊訊框。舉例而言,回應於接收第二音訊訊框,可將輸出模式設定為寬頻模式(例如,在此實例中,第一模式為寬頻模式)。在選擇臨限之前,對應於第二音訊訊框之輸出模式可經偵測為寬頻模式。回應於判定輸出模式(其對應於第二音訊訊框)為寬頻模式,可選擇寬頻臨限作為臨限。若量度值大於或等於寬頻臨限,則可將輸出模式(其對應於第一音訊訊框)更新為窄頻模式。 在其他實施中,回應於接收第二音訊訊框,可將輸出模式設定為窄頻模式(例如,在此實例中,第一模式為窄頻模式)。在選擇臨限之前,對應於第二音訊訊框之輸出模式可經偵測為窄頻模式。回應於判定輸出模式(其對應於第二音訊訊框)為窄頻模式,可選擇窄頻臨限作為臨限。若量度值小於或等於窄頻臨限,則可將輸出模式(其對應於第一音訊訊框)更新為寬頻模式。 在一些實施中,與第一音訊訊框之低頻帶分量相關聯的平均能量值可對應於與第一音訊訊框之低頻帶分量之頻帶子集相關聯的特定平均能量。 在一些實施中,方法700可包括:對於多個音訊訊框中的被指示為作用訊框之至少一音訊訊框,在解碼器處判定該至少一音訊訊框是否與頻帶有限內容相關聯。舉例而言,解碼器122可如參看圖2所描述的基於音訊訊框112之能量位準判定音訊訊框112與頻帶有限內容相關聯。 在一些實施中,在判定量度值之前,可將第一音訊訊框判定為作用訊框,且可判定與第一音訊訊框之低頻帶分量相關聯的平均能量值。回應於判定平均能量值大於臨限能量值,且回應於判定第一音訊訊框為作用訊框,量度值可自第一值更新為第二值。在量度值更新為第二值之後,可回應於接收到第一音訊訊框而將量度值識別為具有第二值。方法500可包括回應於接收到第一音訊訊框而識別第二值。舉例而言,第一值可對應於寬頻臨限,且第二值可對應於窄頻臨限。解碼器122可先前經設定為寬頻臨限,且解碼器可如參考圖1及圖2所描述的回應於接收音訊訊框112而選擇窄頻臨限。 另外地或替代地,回應於判定平均能量值小於或等於臨限值或第一音訊訊框並非為作用訊框,可維持量度值(例如,未被更新)。在一些實施中,臨限能量值可係基於多個所接收訊框之平均低頻帶能量值,諸如過去20個訊框(其可包括或可不包括第一音訊訊框)之平均低頻帶能量的平均值。在一些實施中,臨限能量值可係基於自通信(例如,電話通話)之起點接收的多個作用訊框(其可包括或可不包括第一音訊訊框)之經平滑化平均低頻帶能量。作為一實例,臨限能量值可係基於自通信之起點接收的所有作用訊框之經平滑化平均低頻帶能量。出於說明之目的,此平滑化邏輯之特定實例可為:
Figure 02_image001
, 其中為
Figure 02_image003
為自起點(例如,來自訊框0)起所有作用訊框之低頻帶的經平滑化平均能量,其基於當前音訊訊框(訊框「n」,其在此實例中亦被稱為第一音訊訊框)之平均低頻帶能量(nrg_LB(n))進行更新,
Figure 02_image005
為自起點起的所有作用訊框之低頻帶的不包括當前訊框之能量的平均能量(例如,自訊框0至訊框「n-1」且不包括訊框「n」之作用訊框的平均值)。 繼續該特定實例,可將第一音訊訊框之平均低頻帶能量(nrg_LB (n ))與基於位於第一音訊訊框之前且包括第一音訊訊框之平均低頻帶能量的所有訊框之平均能量
Figure 02_image003
進行計算的低頻帶之經平滑化平均能量進行比較,若發現平均低頻帶能量(nrg_LB (n ))大於低頻帶之經平滑化平均能量(
Figure 02_image007
,則可基於是否將第一音訊訊框分類為與寬頻內容或頻帶有限相關聯的判定,更新700中所描述之對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之相對計數的量度值,諸如參看圖6的608處所描述。若發現平均低頻帶能量(nrg_LB (n ))小於或等於低頻帶之經平滑化平均能量(
Figure 02_image007
,則可不更新參考方法700所描述的對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之相對計數的量度值。 在替代實施中,可用與第一音訊訊框之低頻帶分量之頻帶子集相關聯的平均能量值替換與第一音訊訊框之低頻帶分量相關聯的平均能量值。另外,臨限能量值亦可基於過去20個訊框(其可包括或可不包括第一音訊訊框)之平均低頻帶能量的平均值。替代地,臨限能量值可係基於與頻帶子集相關聯之經平滑化平均能量值,其中該頻帶子集對應於自諸如電話通話之通信之起點的所有作用訊框之低頻帶分量。作用訊框可包括或可不包括第一音訊訊框。 在一些實施中,對於由VAD指示為非作用訊框的多個音訊訊框之每一音訊訊框,解碼器可將輸出模式維持為與最近接收之作用訊框之特定模式相同。 方法700可因此使解碼器能夠更新(或維持)用以輸出與所接收音訊訊框相關聯之音訊內容的輸出模式。舉例而言,解碼器可基於所接收音訊訊框包括頻帶有限內容之判定將輸出模式設定為窄頻模式。解碼器可回應於偵測到解碼器正在接收不包括頻帶有限內容之額外音訊訊框而將輸出模式自窄頻模式變化為寬頻模式。 參考圖8,揭示了操作解碼器之方法之特定說明性實例的流程圖,且通常將其指定為800。該解碼器可對應於圖1之解碼器122。舉例而言,方法800可由圖1之第二器件120(例如,解碼器122、第一解碼級123、偵測器124、第二解碼級132)或其一組合執行。 方法800包括:在802,在解碼器處接收音訊串流之第一音訊訊框。舉例而言,第一音訊訊框可對應於圖1之音訊訊框112。 方法800亦包括:在804,判定在解碼器處所接收且被分類為與寬頻內容相關聯之包括第一音訊訊框的連續音訊訊框之計數。在一些實施中,在804處所參考的計數可替代地為(由諸如圖1之VAD 140的所接收VAD分類的)連續作用訊框之計數,該等連續作用訊框包括在解碼器處接收且被分類為與寬頻內容相關聯的第一音訊訊框。舉例而言,連續音訊訊框之計數可對應於由圖1之追蹤器128追蹤的連續寬頻訊框之數目。 方法800進一步包括:在806,回應於連續音訊訊框之計數大於或等於臨限,將與第一音訊訊框相關聯之一輸出模式判定為寬頻模式。臨限可具有大於或等於一之值。作為說明性的非限制性實例,臨限之值可為二十。 在替代性實施中,方法800可包括:維持具有特定大小之佇列緩衝器,該佇列緩衝器之大小等於臨限(例如,二十,作為說明性的非限制性實例);及用來自分類器126的過去連續臨限數目個訊框(或作用訊框)之包括第一音訊訊框之分類的分類(與寬頻內容相關聯抑或與頻帶有限內容相關聯)更新佇列緩衝器。佇列緩衝器可包括或對應於圖1之追蹤器128(或其組件)。若發現如由佇列緩衝器指示的被分類為與頻帶有限內容相關聯之訊框(或作用訊框)的數目為零,則其等效於判定包括被分類為寬頻之第一訊框的連續訊框(或作用訊框)之數目大於或等於臨限。舉例而言,圖1之平滑化邏輯130可判定是否發現如由佇列緩衝器指示的被分類為與頻帶有限內容相關聯之訊框(或作用訊框)的數目為零。 在一些實施中,回應於接收第一音訊訊框,方法800可包括:判定第一音訊訊框為作用訊框;及遞增所接收訊框之計數。舉例而言,可基於諸如圖1之VAD 140的VAD將第一音訊訊框判定為作用訊框。在一些實施中,所接收訊框之計數可回應於第一音訊訊框為作用訊框而遞增。在一些實施中,所接收作用訊框之計數可上限於(例如,受限於)最大值。舉例而言,最大值可為100,作為說明性的非限制性實例。 另外,回應於接收第一音訊訊框,方法800可包括:將第一音訊訊框之分類判定為相關聯的寬頻內容或窄頻內容。可在判定第一音訊訊框之分類之後判定連續音訊訊框之數目。在判定連續音訊訊框之數目之後,方法800可判定所接收訊框之計數(或所接收作用訊框之計數)是否大於或等於第二臨限,諸如為50的臨限,作為說明性的非限制性實例。可回應於判定所接收作用訊框之計數小於第二臨限而將與第一音訊訊框相關聯之輸出模式判定為寬頻模式。 在一些實施中,方法800可包括:回應於連續音訊訊框之數目大於或等於臨限,將與第一音訊訊框相關聯之輸出模式自第一模式設定為寬頻模式。舉例而言,第一模式可為窄頻模式。回應於基於判定連續音訊訊框之數目大於或等於臨限而將輸出模式自第一模式設定為寬頻模式,可將所接收音訊訊框之計數(或所接收作用訊框之計數)設定為初始值,諸如值零,作為說明性的非限制性實例。另外地或替代地,回應於基於判定連續音訊訊框之數目大於或等於臨限而將輸出模式自第一模式設定為寬頻模式,可將如參考圖7之方法700所描述的對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之相對計數的量度值設定為初始值,諸如值零,作為說明性的非限制性實例。 在一些實施中,在更新輸出模式之前,方法800可包括:判定被設定為輸出模式的先前模式。該先前模式可與音訊串流中位於第一音訊訊框之前的第二音訊訊框相關聯。回應於判定先前模式為寬頻模式,可維持先前模式,且該先前模式可與第一訊框相關聯(例如,第一模式及第二模式兩者均可為寬頻模式)。替代地,回應於判定先前模式為窄頻模式,可將輸出模式自與第二音訊訊框相關聯之窄頻模式設定(例如,變化)為與第一音訊訊框相關聯之寬頻模式。 方法800可因此使得解碼器能夠更新(或維持)用以輸出與所接收音訊訊框相關聯之音訊內容的該輸出模式(例如,一輸出模式)。舉例而言,解碼器可基於所接收音訊訊框包括頻帶有限內容之判定將輸出模式設定為窄頻模式。解碼器可回應於偵測到解碼器正在接收不包括頻帶有限內容之額外音訊訊框而將輸出模式自窄頻模式變化為寬頻模式。 在特定態樣中,圖5至圖8之方法可由以下項實施:場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、諸如中央處理單元(CPU)之處理單元、數位信號處理器(DSP)、控制器、另一硬體器件、韌體器件,或其任何組合。作為一實例,圖5至圖8之方法中的一或多者可單獨地或以組合形式由執行指令之處理器執行,如關於圖9及圖10所描述。為進行說明,圖5之方法500的一部分可與圖6至圖8之方法中之一者的第二部分組合。 參考圖9,描繪了器件(例如,無線通信器件)之特定說明性實例的方塊圖,且通常將其指示為900。在各種實施中,器件900可相比圖9中所說明的具有較多或較少組件。在說明性實例中,器件900可對應於圖1之系統。舉例而言,器件900可對應於圖1之第一器件102或第二器件120。在說明性實例中,器件900可根據圖5至圖8之方法中之一或多者進行操作。 在特定實施中,器件900包括處理器906(例如,CPU)。器件900可包括一或多個額外處理器,諸如處理器910(例如,DSP)。處理器910可包括編碼解碼器908,諸如語音編碼解碼器、音樂編碼解碼器或其一組合。處理器910可包括經組態以執行語音/音樂編碼解碼器908之操作的一或多個組件(例如,電路)。作為另一實例,處理器910可經組態以執行一或多個電腦可讀指令以執行語音/音樂編碼解碼器908之操作。因此,編碼解碼器908可包括硬體及軟體。儘管語音/音樂編碼解碼器908被說明為處理器910之組件,但在其他實例中,語音/音樂編碼解碼器908之一或多個組件可包括於處理器906、編碼解碼器934、另一處理組件或其一組合中。 語音/音樂編碼解碼器908可包括解碼器992,諸如聲碼器解碼器。舉例而言,解碼器992可對應於圖1之解碼器122。在一特定態樣中,解碼器992可包括經組態以偵測音訊訊框是否包括頻帶有限內容之偵測器994。舉例而言,偵測器994可對應於圖1之偵測器124。 器件900可包括記憶體932及編碼解碼器934。編碼解碼器934可包括數位/類比轉換器(DAC) 902及類比/數位轉換器(ADC) 904。揚聲器936、麥克風938或該兩者可耦接至編碼解碼器934。編碼解碼器934可自麥克風938接收類比信號,使用類比/數位轉換器904將該等類比信號轉換為數位信號,及將該等數位信號提供至語音/音樂編碼解碼器908。語音/音樂編碼解碼器908可處理數位信號。在一些實施中,語音/音樂編碼解碼器908可將數位信號提供至編碼解碼器934。編碼解碼器934可使用數位/類比轉換器902將數位信號轉換為類比信號,且可將類比信號提供至揚聲器936。 器件900可包括經由收發器950 (例如,傳輸器、接收器或該兩者)耦接至天線942的無線控制器940。器件900可包括記憶體932,諸如電腦可讀儲存器件。記憶體932可包括指令960,諸如可由處理器906、處理器910或其一組合執行以執行圖5至圖8之方法中的一或多者的一或多個指令。 作為說明性實例,記憶體932可儲存在由處理器906、處理器910或其一組合執行時使得處理器906、處理器910或其一組合執行包括以下項之操作的指令:產生與音訊訊框(例如,圖1之音訊訊框112)相關聯之第一經解碼語音(例如,圖1之第一經解碼語音114);及至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的計數而判定解碼器(例如,圖1之解碼器122或解碼器992)的輸出模式。該等操作可進一步包括:基於第一經解碼語音而輸出第二經解碼語音(例如,圖1之第二經解碼語音116),其中根據輸出模式(例如,圖1之輸出模式134)產生第二經解碼語音。 在一些實施中,該等操作可進一步包括:判定與關聯於音訊訊框的頻率範圍之第一子範圍相關聯的第一能量量度;及判定與該頻率範圍之第二子範圍相關聯的第二能量量度。該等操作亦可包括:基於第一能量量度及第二能量量度而判定將音訊訊框(例如,圖1之音訊訊框112)分類為與窄頻訊框相關聯抑或與寬頻訊框相關聯。 在一些實施中,該等操作可進一步包括:將音訊訊框(例如,圖1之音訊訊框112)分類為窄頻訊框或寬頻訊框。該等操作亦可包括:判定對應於多個音訊訊框(例如,圖3之音訊訊框a-i)中與頻帶有限內容相關聯之音訊訊框之第二計數的量度值;及基於該量度值選擇臨限。 在一些實施中,該等操作可進一步包括:回應於接收音訊串流之第二音訊訊框,判定被分類為具有寬頻內容的在解碼器處接收之連續音訊訊框的第三計數。該等操作可包括:回應於連續音訊訊框之第三計數大於或等於臨限,將輸出模式更新為寬頻模式。 在一些實施中,記憶體932可包括可由處理器906、處理器910或其一組合執行以使得處理器906、處理器910或其一組合執行如參考圖1之第二器件120所描述之功能,從而執行圖5至圖8的方法中之一或多者的至少一部分或其一組合的程式碼(例如,經解譯或經編譯程式指令)。為進一步說明,實例1描繪可經編譯及儲存於記憶體932中的說明性偽碼(例如,簡化的浮點C程式碼)。偽碼說明關於圖1至圖8描述之態樣的可能實施。偽碼包括並非為可執行碼之部分的註解。在偽碼中,註解之開端由前向斜線及星號(例如,「/*」)指示,且註解之末端由星號及前向斜線(例如,「*/」)指示。為進行說明,註解「COMMENT」可作為/*COMMENT*/出現在偽碼中。 在所提供之實例中,「==」運算子指示等同性比較,從而「A==B」在A之值等於B之值時具有真值,且否則具有假值。「&&」運算子指示邏輯AND操作。「||」運算子指示邏輯OR操作。「>」(大於)運算子表示「大於」,「>=」運算子表示「大於或等於」,且「<」運算子指示「小於」。在數字之後的項「f」指示浮點(例如,十進位)數字格式。「st->A」項指示A為狀態參數(即,「->」字元並不表示邏輯或算術運算)。 在所提供之實例中,「*」可表示乘法運算,「+」或「sum」可表示加法運算,「-」可指示減法運算,且「/」可表示除法運算。「=」運算子表示賦值(例如,「a=1」將值1賦予至變數「a」)。其他實施可包括除實例1之條件集合以外或作為其代替的一或多個條件。實例 1 /*C-Code modified:*/ if(st->VAD == 1) /*VAD equalling 1 indicates that a received audio frame is active, the VAC may correspond to the VAD 140 of FIG. 1*/ { st->flag_NB = 1; /*Enter the main detector logic to decide bandstoZero*/ } else { st->flag_NB = 0; /*This occurs if (st-> VAD == 0) which indicates that a received audio fram is inactive. Do not enter the main detector logic, instead bandstoZero is set to the last bandstoZero (i.e., use a previous output mode selection).*/ } IF(st->flag_NB == 1) /*Main Detector logic for active frames*/ { /* set variables */ Word32 nrgQ31; Word32 nrg_band[20], tempQ31, max_nrg; Word16 realQ1, imagQ1, flag, offset, WBcnt; Word16 perc_detect, perc_miss; Word16 tmp1, tmp2, tmp3, tmp; realQ1 = 0; imagQ1 = 0; set32_fx(nrg_band, 0, 20); /* associated with dividing a wideband range into 20 bands */ max_nrg = 0; offset = 50; /*threshold number of frames to be received prior to calculating a percentage of frames classified as having band limited content*/ WBcnt = 20; /*threshold to be used to compare to a number of consecutive received frames having a classification associated with wideband content */ perc_miss = 80; /* second adaptive threshold as described with reference to the system 100 of FIG. 1 */ perc_detect = 90; /*first adaptive threshold as described with reference to the system 100 of FIG. 1 */ st->active_frame_counter=st->active_frame_counter+1; if(st ->active_frame_cnt_bwddec > 99) {/*Capping the active_frame_cnt to be <= 100*/ st ->active_frame_cnt_bwddec = 100; } FOR (i = 0; i < 20; i++) /* energy based bandwidth detection associated with the classifier 126 of FIG. 1 */ { nrgQ31 = 0; /* nrgQ31 is associated with an energy value */ FOR (k = 0; k < nTimeSlots; k++) { /* Use quadratiure mirror filter (QMF) analysis buffers energy in bands */ realQ1 = rAnalysis[k][i]; imagQ1 = iAnalysis[k][i]; nrgQ31 = (nrgQ31 + realQ1*realQ1); nrgQ31 = (nrgQ31 + imagQ1*imagQ1); } nrg_band[i] = (nrgQ31); } for(i = 2; i < 9; i++) /*calculate an average energy associated with the low band. A subset from 800 Hz to 3600 Hz is used. Compare to a max energy associated with the high band. Factor of 512 is used (e.g., to determine an energy ratio threshold).*/ { tempQ31 = tempQ31 + w[i]*nrg_band[i]/7.0; } for(i = 11; i < 20; i++) /*max_nrg is populated with the maximum band energy in the subset ofHB bands. Only bands from 4.4 kHz to 8 kHz are considered */ { max_nrg = max(max_nrg, nrg_band[i]); } if(max_nrg < tempQ31/512.0) /*compare average low band energy to peak hb energy*/ flag = 1; /* band limited mode classified*/ else flag = 0; /* wideband mode classified*/ /* The parameter flag holds the decision of the classifier 126 */ /*Update the flag buffer with the latest flag. Push latest flag at the topmost position of the flag_buffer and shift the rest of the values by 1, thus the flag_buffer has the last 20 frames' flag info. The flag buffer may be used to track the number of consecutive frames classified as having wideband content.*/ FOR(i = 0; i < WBcnt-1; i++) { st->flag_buffer[i] = st->flag_buffer[i+1]; } st->flag_buffer[WBcnt-1] = flag; st->avg_nrg_LT = 0.99*avg_nrg_LT + 0.01*tempQ31; if(st->VAD == 0 || tempQ31 < st->avg_nrg_LT/200) { update_perc = 0; } else { update_perc = 1; } if(update_perc == 1) /*When reliability creiterion is met. Determine percentage of classified frames that are associated with band limited content*/ { if(flag == 1) /*If instantaneous decision is met, increase perc*/ { st->perc_bwddec = st->perc_bwddec + (100-st->perc_bwddec)/(active_frame_cnt_bwddec); /*no. of active frames*/ } else /*else decrease perc*/ { st->perc_bwddec = st->perc_bwddec - st->perc_bwddec/(active_frame_cnt_bwddec); } } if( (st->active_frame_cnt_bwddec > 50) ) /* Until the active count > 50, do not do change the output mode to NB. Which means that the default decision is picked which is WideBand mode as output mode*/ { if ((st->perc_bwddec >= perc_detect) || (st->perc_bwddec >= perc_miss && st->last_flag_filter_NB == 1) && (sum(st->flag_buffer, WBcnt) > WBcnt_thr)) { /*final decision (output mode) is NB (band limited mode)*/ st->cldfbSyn_fx->bandsToZero = st->cldfbSyn fx-> total_bands - 10; /*total bands at 16 kHz sampling rate = 20. In effect all bands above the first 10 bands which correspond to narrowband content may be attenuated to remove spectral noise leakage*/ st->last_flag_filter_NB = 1; } else { /* final decision is WB */ st->last_flag_filter_NB = 0; } } if(sum_s(st->flag_buffer, WBcnt) == 0) /*Whenever the number of consecutive WB frames exceeds WBcnt, do not change output mode to NB. In effect the default WB mode is picked as the output mode. Whenever WB mode is picked “due to number of consecutive frames being WB”, reset (e.g., set to an initial value) the active_frame_cnt as well as the perc_bwddec */ { st->perc_bwddec = 0.0f; st->active_frame_cnt_bwddec = 0; st->last_flag_filter_NB = 0; } } else if (st->flag_NB == 0) /*Detector logic for inactive speech, keep decision same as last frame*/ { st->cldfbSyn_fx->bandsToZero = st->last_frame_bandstoZero; } /*After bandstoZero is decided*/ if(st->cldfbSyn_fx->bandsToZero == st->cldfbSyn_fx->total_bands - 10) { /*set all the bands above 4000Hz to 0*/ } /*Perform QMF synthesis to obtain the final decoded speech after bandwidth detector*/ 記憶體932可包括可由處理器906、處理器910、編碼解碼器934、器件900之另一處理單元或其一組合執行以執行本文中揭示之方法及程序(諸如圖5至圖8之方法中之一或多者)的指令960。圖1之系統100之一或多個組件可經由專用硬體(例如,電路)、藉由執行指令(例如,指令960)以執行一或多個任務之處理器,或由其一組合實施。作為實例,記憶體932或處理器906、處理器910、編碼解碼器934或其一組合之一或多個組件可為記憶體器件,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可移除磁碟或光碟唯讀記憶體(CD-ROM)。記憶體器件可包括指令(例如,指令960),該等指令在由電腦(例如,編碼解碼器934中之處理器、處理器906、處理器910或其一組合)執行時可使電腦執行圖5至圖8之方法中之一或多者的至少一部分。作為一實例,記憶體932或處理器906、處理器910、編碼解碼器934之一或多個組件可為包括指令(例如,指令960)之非暫時性電腦可讀媒體,該等指令在由電腦(例如,編碼解碼器934中之處理器、處理器906、處理器910或其一組合)執行時使得電腦執行圖5至圖8的方法中之一或多者的至少一部分。舉例而言,電腦可讀儲存器件可包括指令,該等指令在由處理器執行時可使得該處理器執行包括以下項之操作:產生與音訊串流之音訊訊框相關聯的第一經解碼語音,及至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的計數而判定解碼器之輸出模式。該等操作亦可包括:基於第一經解碼語音輸出第二經解碼語音,其中根據輸出模式產生該第二經解碼語音。 在一特定實施中,器件900可包括於系統級封裝或系統單晶片器件922中。在一些實施中,記憶體932、處理器906、處理器910、顯示器控制器926、編碼解碼器934、無線控制器940,及收發器950包括於系統級封裝或系統單晶片器件922中。在一些實施中,輸入器件930及電源供應器944耦接至系統單晶片器件922。此外,在特定實施中,如圖9中所說明,顯示器928、輸入器件930、揚聲器936、麥克風938、天線942及電源供應器944位於系統單晶片器件922外部。在其他實施中,顯示器928、輸入器件930、揚聲器936、麥克風938、天線942及電源供應器944中之每一者可耦接至系統單晶片器件922之組件,諸如系統單晶片器件922之介面或控制器。在說明性實例中,器件900對應於通信器件、行動通信器件、智慧型電話、蜂巢式電話、膝上型電腦、電腦、平板電腦、個人數位助理、機上盒、顯示器件、電視、遊戲主機、音樂播放器、收音機、數位視訊播放器、數位視訊光碟(DVD)播放器、光學光碟播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統、基地台、交通工具,或其任何組合。 在說明性實例中,處理器910可操作以執行參考圖1至圖8描述之方法或操作的全部或一部分。舉例而言,麥克風938可俘獲對應於使用者語音信號之音訊信號。ADC 904可將所俘獲音訊信號自類比波形轉換成由數位音訊樣本組成之數位波形。處理器910可處理數位音訊樣本。 編碼解碼器908之編碼器(例如,聲碼器編碼器)可壓縮對應於經處理語音信號之數位音訊樣本,且可形成一封包序列(例如,數位音訊樣本之經壓縮位元的表示)。該封包序列可儲存於記憶體932中。收發器950可調變序列之每一封包,且可經由天線942傳輸經調變資料。 作為另一實例,天線942可經由網路接收對應於由另一器件發送之封包序列的傳入封包。傳入封包可包括諸如圖1之音訊訊框112的音訊訊框(例如,經編碼音訊訊框)。解碼器992可解壓縮且解碼所接收封包,以產生經重建構音訊樣本(例如,對應於合成音訊信號,諸如圖1之第一經解碼語音114)。偵測器994可經組態以偵測音訊訊框是否包括頻帶有限內容,將訊框分類為與寬頻內容或窄頻內容(例如,頻帶有限內容)相關聯,或其一組合。另外地或替代地,偵測器994可選擇諸如圖1之輸出模式134的輸出模式,其指示解碼器之音訊輸出為NB抑或WB。DAC 902可將解碼器992之輸出自數位波形轉換為類比波形,且可將經轉換波形提供至揚聲器936以用於輸出。 參考圖10,描繪了基地台1000之特定說明性實例的方塊圖。在各種實施中,基地台100可相比圖10中所說明的具有較多組件或較少組件。在說明性實例中,基地台1000可包括圖1之第二器件120。在說明性實例中,基地台1000可根據圖5至圖6之方法中的一或多者、實例1至實例5中之一或多者,或其一組合操作。 基地台1000可為無線通信系統之部分。無線通信系統可包括多個基地台及多個無線器件。無線通信系統可為長期演進(LTE)系統、分碼多重存取(CDMA)系統、全球行動通信系統(GSM)系統、無線區域網路(WLAN)系統,或一些其他無線系統。CDMA系統可實施寬頻CDMA (WCDMA)、CDMA 1X、演進資料最佳化(EVDO)、分時同步CDMA (TD-SCDMA),或一些其他版本之CDMA。 無線器件亦可被稱作使用者設備(UE)、行動台、終端機、存取終端機、用戶單元、台等。無線器件可包括蜂巢式電話、智慧型電話、平板電腦、無線數據機、個人數位助理(PDA)、手持型器件、膝上型電腦、智慧筆記型電腦、迷你筆記型電腦、平板電腦、無線電話、無線區域迴路(WLL)台、藍芽器件等。無線器件可包括或對應於圖9之器件900。 各種功能可由基地台1000之一或多個組件(及/或在未經圖示之其他組件中)執行,諸如發送及接收訊息及資料(例如,音訊資料)。在一特定實例中,基地台1000包括處理器1006(例如,CPU)。基地台1000可包括轉碼器1010。轉碼器1010可包括語音及音樂編碼解碼器1008。舉例而言,轉碼器1010可包括經組態以執行語音及音樂編碼解碼器1008之操作的一或多個組件(例如,電路)。作為另一實例,轉碼器1010可經組態以執行一或多個電腦可讀指令,從而執行語音及音樂編碼解碼器1008之操作。儘管語音及音樂編碼解碼器1008被說明為轉碼器1010之組件,但在其他實例中,語音及音樂編碼解碼器1008之一或多個組件可包括於處理器1006、另一處理組件或其一組合中。舉例而言,解碼器1038(例如,聲碼器解碼器)可包括於接收器資料處理器1064中。作為另一實例,編碼器1036(例如,聲碼器解碼器)可包括於傳輸資料處理器1066中。 轉碼器1010可起到在兩個或兩個以上網路之間轉碼訊息及資料的作用。轉碼器1010可經組態以將訊息及音訊資料自第一格式(例如,數位格式)轉換至第二格式。為進行說明,解碼器1038可解碼具有第一格式之經編碼信號,且編碼器1036可將經解碼信號編碼成具有第二格式之經編碼信號。另外地或替代地,轉碼器1010可經組態以執行資料速率調適。舉例而言,轉碼器1010可在不改變音訊資料之格式的情況下降頻轉換資料速率或升頻轉換資料速率。為進行說明,轉碼器1010可將64 kbit/s信號降頻轉換成16 kbit/s信號。 語音及音樂編碼解碼器1008可包括編碼器1036及解碼器1038。編碼器1036可包括一偵測器及多個編碼級,如參考圖9所描述。解碼器1038可包括一偵測器及多個解碼級。 基地台1000可包括記憶體1032。諸如電腦可讀儲存器件之記憶體1032可包括指令。指令可包括可由處理器1006、轉碼器1010或其一組合執行的一或多個指令,以執行圖5至圖6之方法、實例1至實例5,或其一組合中的一或多者。基地台1000可包括耦接至一天線陣列之多個傳輸器及接收器(例如,收發器),諸如第一收發器1052及第二收發器1054。天線陣列可包括第一天線1042及第二天線1044。天線陣列可經組態以無線方式與一或多個無線器件通信,諸如圖9之器件900。舉例而言,第二天線1044可自無線器件接收資料串流1014(例如,位元串流)。資料串流1014可包括訊息、資料(例如,經編碼語音資料),或其一組合。 基地台1000可包括諸如空載傳輸連接之網路連接1060。網路連接1060可經組態以與無線通信網路之核心網路或一或多個基地台通信。舉例而言,基地台1000可經由網路連接1060自核心網路接收第二資料串流(例如,訊息或音訊資料)。基地台1000可處理第二資料串流以產生訊息或音訊資料,且經由天線陣列之一或多個天線將訊息或音訊資料提供至一或多個無線器件,或經由網路連接1060將訊息或音訊資料提供至另一基地台。在特定實施中,作為說明性的非限制性實例,網路連接1060可為廣域網路(WAN)連接。 基地台1000可包括耦接至收發器1052、1054、接收器資料處理器1064,及處理器1006之解調器1062,且接收器資料處理器1064可耦接至處理器1006。解調器1062可經組態以解調接收自收發器1052、1054之經調變信號,且將經解調資料提供至接收器資料處理器1064。接收器資料處理器1064可經組態以自經解調資料提取訊息或音訊資料,且將該訊息或音訊資料發送至處理器1006。 基地台1000可包括傳輸資料處理器1066及傳輸多輸入多輸出(MIMO)處理器1068。傳輸資料處理器1066可耦接至處理器1006及傳輸MIMO處理器1068。傳輸MIMO處理器1068可耦接至收發器1052、1054及處理器1006。傳輸資料處理器1066可經組態以自處理器1006接收訊息或音訊資料,且基於諸如CDMA或正交分頻多工(OFDM)之寫碼方案寫碼該等訊息或該音訊資料,作為說明性的非限制性實例。傳輸資料處理器1066可將經寫碼資料提供至傳輸MIMO處理器1068。 可使用CDMA或OFDM技術將經寫碼資料與諸如導頻資料之其他資料多工,以產生經多工資料。可接著由傳輸資料處理器1066基於特定調變方案(例如,二進位相移鍵控(「BPSK」)、正交相移鍵控(「QSPK」)、M階相移鍵控(「M-PSK」)、M階正交振幅調變(「M-QAM」)等)調變(即,符號映射)經多工資料,以產生調變符號。在特定實施中,可使用不同調變方案調變經寫碼資料及其他資料。用於每一資料串流之資料速率、寫碼,及調變可藉由由處理器1006執行之指令來判定。 傳輸MIMO處理器1068可經組態以自傳輸資料處理器1066接收調變符號,且可進一步處理調變符號,且可對該資料執行波束成形。舉例而言,傳輸MIMO處理器1068可將波束成形權重應用於調變符號。波束成形權重可對應於天線陣列之一或多個天線(自該等天線傳輸調變符號)。 在操作期間,基地台1000之第二天線1044可接收資料串流1014。第二收發器1054可自第二天線1044接收資料串流1014,且可將資料串流1014提供至解調器1062。解調器1062可解調資料串流1014之經調變信號,且將經解調資料提供至接收器資料處理器1064。接收器資料處理器1064可自經解調資料提取音訊資料,且將經提取音訊資料提供至處理器1006。 處理器1006可將音訊資料提供至轉碼器1010以用於轉碼。轉碼器1010之解碼器1038可將音訊資料自第一格式解碼成經解碼音訊資料,且編碼器1036可將經解碼音訊資料編碼成第二格式。在一些實施中,編碼器1036可使用比自無線器件的接收速率更高的資料速率(例如,升頻轉換)或更低的資料速率(例如,降頻轉換)來編碼音訊資料。在其他實施中,音訊資料可未經轉碼。儘管轉碼(例如,解碼及編碼)被說明為由轉碼器1010執行,但轉碼操作(例如,解碼及編碼)可由基地台1000之多個組件執行。舉例而言,解碼可由接收器資料處理器1064執行,且編碼可由傳輸資料處理器1066執行。 解碼器1038及編碼器1036可逐個訊框地判定資料串流1014之每一所接收訊框對應於窄頻訊框抑或寬頻訊框,且可選擇對應解碼輸出模式(例如,窄頻輸出模式或寬頻輸出模式)及對應編碼輸出模式以轉碼(例如,解碼及編碼)訊框。可經由處理器1006將在編碼器1036處產生之經編碼音訊資料(諸如經轉碼資料)提供至傳輸資料處理器1066或網路連接1060。 可將來自轉碼器1010之經轉碼音訊資料提供至傳輸資料處理器1066,用於根據諸如OFDM之調變方案進行寫碼,以產生調變符號。傳輸資料處理器1066可將調變符號提供至傳輸MIMO處理器1068,以供進一步處理及波束成形。傳輸MIMO處理器1068可應用波束成形權重,且可經由第一收發器1052將調變符號提供至天線陣列之一或多個天線,諸如第一天線1042。因此,基地台1000可將對應於自無線器件接收之資料串流1014的經轉碼資料串流1016提供至另一無線器件。經轉碼資料串流1016可具有與資料串流1014不同的編碼格式、資料速率,或該兩者。在其他實施中,可將經轉碼資料串流1016提供至網路連接1060,用於傳輸至另一基地台或核心網路。 基地台1000可因而包括儲存指令之電腦可讀儲存器件(例如,記憶體1032),該等指令在由處理器(例如,處理器1006或轉碼器1010)執行時使得處理器執行包括以下項之操作:產生與音訊串流之音訊訊框相關聯的第一經解碼語音;及至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的計數而判定解碼器之輸出模式。該等操作亦可包括:基於第一經解碼語音輸出第二經解碼語音,其中根據輸出模式產生該第二經解碼語音。 結合所描述之態樣,一種裝置可包括用於產生與音訊訊框相關聯之第一經解碼語音的構件。舉例而言,用於產生之構件可包括或對應於以下項:解碼器122、圖1之第一解碼級123、編碼解碼器934、語音/音樂編碼解碼器908、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以產生第一經解碼語音之一或多個其他結構、器件、電路、模組或指令,或其一組合。 該裝置亦可包括:用於至少部分基於被分類為與頻帶有限內容相關聯之音訊訊框的數目而判定解碼器之輸出模式的構件。舉例而言,用於判定之構件可包括或對應於以下項:解碼器122、偵測器124、圖1之平滑化邏輯130、編碼解碼器934、語音/音樂編碼解碼器908、解碼器992、偵測器994、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以判定輸出模式之一或多個其他結構、器件、電路、模組或指令,或其一組合。 該裝置亦可包括用於基於第一經解碼語音輸出第二經解碼語音的構件。可根據輸出模式而產生該第二經解碼語音。舉例而言,用於輸出之構件可包括或對應於以下項:解碼器122、圖1之第二解碼級132、編碼解碼器934、語音/音樂編碼解碼器908、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以輸出第二經解碼語音之一或多個其他結構、器件、電路、模組或指令,或其一組合。 該裝置可包括用於判定對應於多個音訊訊框中與頻帶有限內容相關聯之音訊訊框之計數的量度值的構件。舉例而言,用於判定量度值之構件可包括或對應於以下項:解碼器122、圖1之分類器126、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以判定量度值之一或多個其他結構、器件、電路、模組或指令,或其一組合。 該裝置亦可包括用於基於量度值選擇一臨限的構件。舉例而言,用於選擇一臨限之構件可包括或對應於以下項:解碼器122、圖1之平滑化邏輯130、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以基於量度值選擇臨限的一或多個其他結構、器件、電路、模組或指令,或其一組合。 該裝置可進一步包括用於基於量度值與臨限之比較而將輸出模式自第一模式更新為第二模式的構件。舉例而言,用於更新輸出模式之構件可包括或對應於以下項:解碼器122、圖1之平滑化邏輯130、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以更新輸出模式之一或多個其他結構、器件、電路、模組或指令,或其一組合。 在一些實施中,該裝置可包括用於判定在用於產生第一經解碼語音之構件處接收且被分類為與寬頻內容相關聯的連續音訊訊框之數目的構件。舉例而言,用於判定連續音訊訊框之數目的構件可包括或對應於以下項:解碼器122、圖1之追蹤器128、解碼器992、經程式化以執行圖9之指令960的處理器906、910中之一或多者、圖10之處理器1006或轉碼器1010、用以判定連續音訊訊框之數目的一或多個其他結構、器件、電路、模組或指令,或其一組合。 在一些實施中,用於產生第一經解碼語音之構件可包括或對應於一語音模型,且用於判定輸出模式之構件及用於輸出第二經解碼語音之構件可各自包括或對應於處理器及儲存可由處理器執行之指令的記憶體。另外地或替代地,用於產生第一經解碼語音之構件、用於判定輸出模式之構件,及用於輸出第二經解碼語音之構件可整合至解碼器、機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、個人數位助理(PDA)、電腦或其一組合。 在上述描述之態樣中,所執行的各種功能已被描述為由某些組件或模組執行,諸如圖1之系統100的組件或模組、圖9之器件900、圖10之基地台1000,或其一組合。然而,組件及模組之此劃分僅係為了說明。在替代性實例中,由特定組件或模組所執行之功能可替代地劃分於多個組件或模組之中。此外,在其他替代性實例中,圖1、圖9,及圖10之兩個或兩個以上組件或模組可整合至單一組件或模組中。圖1、圖9及圖10中所說明之每一組件或模組可使用硬體(例如,ASIC、DSP、控制器、FPGA器件等)、軟體(例如,可由處理器執行之指令),或其任何組合來實施。 熟習此項技術者將進一步瞭解,結合本文所揭示之態樣所描述的各種說明性邏輯區塊、組態、模組、電路及演算法步驟可作為電子硬體、由處理器執行的電腦軟體,或兩者的組合進行實施。上文大體在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。所述功能性實施為硬體還是處理器可執行指令取決於特定應用及強加於整個系統的設計約束。對於每一特定應用而言,熟習此項技術者可以變化之方式實施所描述之功能性,但不應將此等實施決策解釋為導致脫離本發明之範疇。 結合本文中所揭示之態樣所描述的方法或演算法之步驟可直接包括於硬體、由處理器執行之軟體模組或該兩者之組合中。軟體模組可駐留於RAM、快閃記憶體、ROM、PROM、EPROM、EEPROM、暫存器、硬碟、可移除磁碟、CD-ROM,或此項技術中已知的任何其他形式之非暫時儲存媒體中。特定儲存媒體可耦接至處理器,以使得處理器可自儲存媒體讀取資訊及向儲存媒體寫入資訊。在替代例中,儲存媒體可整合至處理器。處理器及儲存媒體可駐留於ASIC中。ASIC可駐留於計算器件或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算器件或使用者終端機中。 提供先前描述以使熟習此項技術者能夠進行或使用所揭示之態樣。熟習此項技術者將易於瞭解對此等態樣之各種修改,且本文中定義之原理可應用於其他態樣而不脫離本發明之範疇。因此,本發明並不意欲限於本文中所展示態樣,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
100‧‧‧系統 102‧‧‧第一器件 104‧‧‧編碼器 110‧‧‧輸入音訊資料 112‧‧‧音訊訊框 114‧‧‧第一經解碼語音 116‧‧‧第二經解碼語音 120‧‧‧第二器件 122‧‧‧解碼器 123‧‧‧第一解碼級 124‧‧‧偵測器 126‧‧‧分類器 128‧‧‧追蹤器 130‧‧‧平滑化邏輯 131‧‧‧臨限 132‧‧‧第二解碼級 134‧‧‧輸出模式 140‧‧‧話音活動性決策(VAD) 150‧‧‧曲線圖 160‧‧‧曲線圖 170‧‧‧曲線圖 190‧‧‧實例 200‧‧‧第一曲線圖 250‧‧‧第二曲線圖 300‧‧‧第一表 350‧‧‧第二表 400‧‧‧第三表 450‧‧‧第四表 500‧‧‧方法 600‧‧‧方法 700‧‧‧方法 800‧‧‧方法 900‧‧‧器件 902‧‧‧數位/類比轉換器(DAC) 904‧‧‧類比/數位轉換器(ADC) 906‧‧‧處理器 908‧‧‧編碼解碼器 910‧‧‧處理器 922‧‧‧系統單晶片器件 926‧‧‧顯示器控制器 928‧‧‧顯示器 930‧‧‧輸入器件 932‧‧‧記憶體 934‧‧‧編碼解碼器 936‧‧‧揚聲器 938‧‧‧麥克風 940‧‧‧無線控制器 942‧‧‧天線 944‧‧‧電源供應器 950‧‧‧收發器 960‧‧‧指令 992‧‧‧解碼器 994‧‧‧偵測器 1000‧‧‧基地台 1006‧‧‧處理器 1008‧‧‧語音及音樂編碼解碼器 1010‧‧‧轉碼器 1014‧‧‧資料串流 1016‧‧‧經轉碼資料串流 1032‧‧‧記憶體 1036‧‧‧編碼器 1038‧‧‧解碼器 1042‧‧‧第一天線 1044‧‧‧第二天線 1052‧‧‧第一收發器 1054‧‧‧第二收發器 1060‧‧‧網路連接 1062‧‧‧解調器 1064‧‧‧接收器資料處理器 1066‧‧‧傳輸資料處理器 1068‧‧‧傳輸多輸入多輸出(MIMO)處理器
圖1為包括一解碼器且可操作以基於音訊訊框選擇輸出模式的系統之實例的方塊圖; 圖2包括說明基於頻寬的音訊訊框分類之實例的曲線圖; 圖3包括用以說明圖1之解碼器的操作之態樣的表; 圖4包括用以說明圖1之解碼器的操作之態樣的表; 圖5為說明操作解碼器之方法之一實例的流程圖; 圖6為說明分類音訊訊框之方法之一實例的流程圖; 圖7為說明操作解碼器之方法之另一實例的流程圖; 圖8為說明操作解碼器之方法之另一實例的流程圖; 圖9為可操作以偵測頻帶有限內容之器件之特定說明性實例的方塊圖;及 圖10為可操作以選擇編碼器之基地台之特定說明性態樣的方塊圖。
100‧‧‧系統
102‧‧‧第一器件
104‧‧‧編碼器
110‧‧‧輸入音訊資料
112‧‧‧音訊訊框
114‧‧‧第一經解碼語音
116‧‧‧第二經解碼語音
120‧‧‧第二器件
122‧‧‧解碼器
123‧‧‧第一解碼級
124‧‧‧偵測器
126‧‧‧分類器
128‧‧‧追蹤器
130‧‧‧平滑化邏輯
131‧‧‧臨限
132‧‧‧第二解碼級
134‧‧‧輸出模式
140‧‧‧話音活動性決策(VAD)
150‧‧‧曲線圖
160‧‧‧曲線圖
170‧‧‧曲線圖
190‧‧‧實例

Claims (40)

  1. 一種音訊頻寬選擇的器件,其包含:一接收器,其經組態以接收一音訊串流之一音訊訊框,該音訊訊框包括指示該音訊訊框之一經寫碼頻寬之資訊;及一解碼器,其經組態以:產生與該音訊訊框相關聯之第一經解碼語音;至少部分基於指示該經寫碼頻寬之該資訊來判定該解碼器之一輸出模式,其中由該解碼器之該輸出模式指示之一頻寬模式與指示該經寫碼頻寬之該資訊所指示之一頻寬模式不同;及基於該第一經解碼語音輸出第二經解碼語音,該第二經解碼語音係根據該輸出模式產生。
  2. 如請求項1之器件,其中該解碼器經組態以將該音訊訊框分類為一窄頻訊框或一寬頻訊框,且其中一窄頻訊框之一分類對應於與頻帶有限內容相關聯之該音訊訊框。
  3. 如請求項1之器件,其中該音訊訊框之該經寫碼頻寬指示該音訊訊框之一第一頻寬,其中該音訊訊框係基於具有一第二頻寬之輸入音訊資料,其中該第一頻寬大於該第二頻寬,且其中該第二經解碼語音具有該第二頻寬。
  4. 如請求項1之器件,其中當該輸出模式包含一寬頻模式時,第二經解 碼語音對應於該第一經解碼語音,其中該第一經解碼語音係基於指示該經寫碼頻寬之該資訊而產生,且其中該第一經解碼語音具有對應於該經寫碼頻寬之一第一頻寬。
  5. 如請求項1之器件,其中當該輸出模式包含一窄頻模式時,該第二經解碼語音包括該第一經解碼語音之一部分。
  6. 如請求項1之器件,其中該解碼器包括一偵測器,該偵測器經組態以基於音訊訊框之一或多個計數而選擇該輸出模式,且其中該等音訊訊框之該一或多個計數包括經接收之作用音訊訊框之一計數、連續寬頻訊框之一計數、連續頻帶有限訊框之一計數、寬頻訊框之一相對計數、頻帶有限訊框之一計數或其等之一組合。
  7. 如請求項1之器件,其中該解碼器包括一偵測器,該偵測器經組態以基於與被分類為與一特定頻帶相關聯之音訊訊框之一計數相關聯的一量度值(metric value)及基於被分類為與寬頻內容相關聯之連續音訊訊框的一數目而選擇該輸出模式。
  8. 如請求項1之器件,其中該解碼器包括:一分類器,其經組態以將該音訊訊框分類為寬頻內容或頻帶有限內容;及一追蹤器,其經組態以維持由該分類器產生之一或多個分類的一記錄,其中該追蹤器包括一緩衝器、一記憶體或一或多個計數器中 之至少一者。
  9. 如請求項1之器件,其中該接收器及該解碼器整合至一行動通信器件或一基地台。
  10. 如請求項1之器件,其進一步包含:一解調器,其耦接至該接收器,該解調器經組態以解調該音訊串流;一處理器,其耦接至該解調器;及一編碼器,其耦接至該處理器。
  11. 如請求項10之器件,其中該接收器、該解碼器、該解調器、該處理器、及該編碼器整合至一行動通信器件。
  12. 如請求項10之器件,其中該接收器、該解碼器、該解調器、該處理器,及該編碼器整合至一基地台。
  13. 一種解碼器操作之方法,該方法包含:在一解碼器處產生與一音訊串流之一音訊訊框相關聯的第一經解碼語音,該音訊訊框包括指示該音訊訊框之一經寫碼頻寬之資訊;至少部分基於指示該經寫碼頻寬之該資訊來判定該解碼器之一輸出模式,其中由該解碼器之該輸出模式指示之一頻寬模式與指示該經寫碼頻寬之該資訊所指示之一頻寬模式不同;及 基於該第一經解碼語音輸出第二經解碼語音,該第二經解碼語音係根據該輸出模式產生。
  14. 如請求項13之方法,其中該解碼器經組態以進一步基於該音訊訊框之一能量位準來判定該解碼器之該輸出模式。
  15. 如請求項14之方法,其進一步包含基於該能量位準將該音訊訊框分類為一寬頻訊框或一頻帶有限訊框,其中該輸出模式係基於將該音訊訊框分類為該寬頻訊框或該頻帶有限訊框之一分類而判定。
  16. 如請求項15之方法,其中該第一經解碼語音具有該經寫碼頻寬且包括一低頻帶分量及一高頻帶分量,且其中基於該能量位準分類該音訊訊框包括:判定基於與該低頻帶分量相關聯之一第一能量量度及與該高頻帶分量相關聯之一第二能量量度的一比值;將該比值與一分類臨限進行比較;及回應於該比值大於該分類臨限,將該音訊訊框分類為該頻帶有限內容訊框。
  17. 如請求項16之方法,其進一步包含當該音訊訊框被分類為該頻帶有限訊框時,衰減該第一經解碼語音之該高頻帶分量以產生該第二經解碼語音。
  18. 如請求項16之方法,其進一步包含當該音訊訊框被分類為該頻帶有限訊框時,將與該高頻帶分量相關聯之一或多個頻帶的一能量值設定為零以產生該第二經解碼語音。
  19. 如請求項16之方法,其進一步包含判定與關聯於該第一經解碼語音之該低頻帶分量之多個頻帶的一第一集合相關聯的該第一能量量度。
  20. 如請求項19之方法,其中判定該第一能量量度包含判定多個頻帶之該第一集合之一頻帶子集的一平均能量值及將該第一能量量度設定為等於該平均能量值。
  21. 如請求項16之方法,其進一步包含判定與關聯於該第一經解碼語音之該高頻帶分量之多個頻帶的一第二集合相關聯的該第二能量量度。
  22. 如請求項21之方法,其進一步包含:判定多個頻帶之該第二集合中具有一最高經偵測能量值的一特定頻帶;及將該第二能量量度設定為等於該最高經偵測能量值。
  23. 如請求項13之方法,其中當該輸出模式包含一寬頻模式時,該第二經解碼語音與該第一經解碼語音實質上相同。
  24. 如請求項13之方法,其中回應於判定該音訊訊框為一作用訊框而執 行判定該解碼器之該輸出模式。
  25. 如請求項13之方法,其進一步包含:在該解碼器處接收該音訊串流之一第二音訊訊框;及回應於判定該第二音訊訊框為一非作用訊框,維持該解碼器之該輸出模式。
  26. 一種音訊頻寬選擇的器件,其包含:一接收器,其經組態以接收一音訊串流之一音訊訊框,該音訊訊框包括指示該音訊訊框之一經寫碼頻寬之資訊;及一解碼器,其經組態以:產生與該音訊訊框相關聯之第一經解碼語音;至少部分基於指示該經寫碼頻寬之該資訊及基於經接收作用音訊訊框之一計數來判定該解碼器之一輸出模式;及基於該第一經解碼語音輸出第二經解碼語音,該第二經解碼語音係根據該輸出模式產生。
  27. 如請求項26之器件,其中該音訊訊框之該經寫碼頻寬指示一第一頻寬,其中該音訊訊框係基於具有一第二頻寬之輸入音訊資料,其中該第一頻寬大於該第二頻寬,且其中該第二經解碼語音具有該第二頻寬。
  28. 如請求項26之器件,其中該解碼器經組態以進一步基於音訊訊框之一或多個計數而判定該解碼器之該輸出模式,該等音訊訊框之該一或多個 計數包括連續寬頻訊框之一計數、連續頻帶限制訊框之一計數、寬頻訊框之一相對計數、頻帶有限訊框之一計數或其等之一組合。
  29. 如請求項26之器件,其中該解碼器包括:一分類器,其經組態以將該音訊訊框分類為寬頻內容或頻帶有限內容;及一追蹤器,其經組態以維持由該分類器產生之一或多個分類的一記錄,其中該追蹤器包括一緩衝器、一記憶體或一或多個計數器中之至少一者。
  30. 如請求項26之器件,其中該接收器及該解碼器整合至一行動通信器件或一基地台。
  31. 如請求項26之器件,其進一步包含:一解調器,其耦接至該接收器,該解調器經組態以解調該音訊串流;一處理器,其耦接至該解調器;及一編碼器,其耦接至該處理器。
  32. 如請求項31之器件,其中該接收器、該解碼器、該解調器、該處理器、及該編碼器整合至一行動通信器件。
  33. 如請求項31之器件,其中該接收器、該解碼器、該解調器、該處理 器,及該編碼器整合至一基地台。
  34. 一種解碼器操作之方法,該方法包含:在一解碼器處產生與一音訊串流之一音訊訊框相關聯的第一經解碼語音,該音訊訊框包括指示該音訊訊框之一經寫碼頻寬之資訊;至少部分基於指示該經寫碼頻寬之該資訊及基於經接收作用音訊訊框之一計數來判定該解碼器之一輸出模式;及基於該第一經解碼語音輸出第二經解碼語音,該第二經解碼語音係根據該輸出模式產生。
  35. 如請求項34之方法,其進一步包含基於一比值分類該音訊訊框,該比值基於與該第一經解碼語音之一低頻帶分量相關聯之一第一能量量度及與該第一經解碼語音之一高頻帶分量相關聯之一第二能量量度,其中該輸出模式係進一步基於該音訊訊框之一分類而判定。
  36. 如請求項34之方法,其進一步包含:在該解碼器處接收該音訊串流之多個音訊訊框,該多個音訊訊框包括該音訊訊框及一第二音訊訊框;回應於接收該第二音訊訊框,在該解碼器處判定對應於該多個音訊訊框中與一特定頻寬相關聯之音訊訊框的一相對計數的一量度值;基於該解碼器之該輸出模式的一第一模式選擇一臨限,該第一模式與在該第二音訊訊框之前接收之該音訊訊框相關聯;及 基於該量度值與該臨限的一比較,將該輸出模式自該第一模式更新為一第二模式,該第二模式與該第二音訊訊框相關聯。
  37. 如請求項36之方法,其中該量度值經判定為被分類為與該特定頻帶相關聯的該多個音訊訊框之一百分比,其中該臨限被選為具有一第一值之一寬頻臨限或具有一第二值之一窄頻臨限,且其中該第一值大於該第二值。
  38. 如請求項36之方法,其進一步包含:在判定該量度值之前:判定該第二音訊訊框為一作用訊框;及判定與該第二音訊訊框之一低頻帶分量相關聯的一平均能量值;及回應於判定該平均能量值大於一臨限能量值且回應於判定該第二音訊訊框為該作用訊框,將該量度值自一第一值更新為一第二值,其中判定該量度值包括更新該量度值。
  39. 如請求項34之方法,其進一步包含:基於音訊訊框之一或多個計數在該解碼器處判定一量度值;及基於該解碼器之一先前輸出模式選擇一臨限,其中判定該解碼器之該輸出模式進一步基於該量度值與該臨限的一比較。
  40. 如請求項34之方法,其中該解碼器包括於一器件中,該器件包含一行動通信器件或一基地台。
TW108112945A 2015-04-05 2016-04-01 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件 TWI693596B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562143158P 2015-04-05 2015-04-05
US62/143,158 2015-04-05
US15/083,717 2016-03-29
US15/083,717 US10049684B2 (en) 2015-04-05 2016-03-29 Audio bandwidth selection

Publications (2)

Publication Number Publication Date
TW201928946A TW201928946A (zh) 2019-07-16
TWI693596B true TWI693596B (zh) 2020-05-11

Family

ID=57017020

Family Applications (2)

Application Number Title Priority Date Filing Date
TW108112945A TWI693596B (zh) 2015-04-05 2016-04-01 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件
TW105110643A TWI661422B (zh) 2015-04-05 2016-04-01 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW105110643A TWI661422B (zh) 2015-04-05 2016-04-01 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件

Country Status (9)

Country Link
US (2) US10049684B2 (zh)
EP (1) EP3281199B1 (zh)
JP (1) JP6545815B2 (zh)
KR (2) KR102308579B1 (zh)
CN (1) CN107408392B (zh)
AU (1) AU2016244808B2 (zh)
BR (1) BR112017021351A2 (zh)
TW (2) TWI693596B (zh)
WO (1) WO2016164232A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6411509B2 (ja) * 2014-07-28 2018-10-24 日本電信電話株式会社 符号化方法、装置、プログラム及び記録媒体
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
KR102398124B1 (ko) * 2015-08-11 2022-05-17 삼성전자주식회사 음향 데이터의 적응적 처리
US11054884B2 (en) * 2016-12-12 2021-07-06 Intel Corporation Using network interface controller (NIC) queue depth for power state management
CN116631417A (zh) 2017-01-10 2023-08-22 弗劳恩霍夫应用研究促进协会 音频解码器、提供解码的音频信号的方法、和计算机程序
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
TWI748215B (zh) * 2019-07-30 2021-12-01 原相科技股份有限公司 聲音輸出之調整方法及執行該調整方法之電子裝置
US11172294B2 (en) * 2019-12-27 2021-11-09 Bose Corporation Audio device with speech-based audio signal processing
CN112530454A (zh) * 2020-11-30 2021-03-19 厦门亿联网络技术股份有限公司 一种窄带语音信号检测方法、装置、系统和可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090306992A1 (en) * 2005-07-22 2009-12-10 Ragot Stephane Method for switching rate and bandwidth scalable audio decoding rate
US20120095758A1 (en) * 2010-10-15 2012-04-19 Motorola Mobility, Inc. Audio signal bandwidth extension in celp-based speech coder
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
DE60303689T2 (de) * 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
TWI343560B (en) * 2006-07-31 2011-06-11 Qualcomm Inc Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
CA2690433C (en) * 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
DE102008009720A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
SG185606A1 (en) * 2010-05-25 2012-12-28 Nokia Corp A bandwidth extender
US8548460B2 (en) * 2010-05-25 2013-10-01 Qualcomm Incorporated Codec deployment using in-band signals
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
IN2014DN03022A (zh) * 2011-11-03 2015-05-08 Voiceage Corp
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
BR112015017753B1 (pt) * 2013-01-29 2022-05-31 Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal.
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN105225668B (zh) * 2013-05-30 2017-05-10 华为技术有限公司 信号编码方法及设备
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
CN106409313B (zh) * 2013-08-06 2021-04-20 华为技术有限公司 一种音频信号分类方法和装置
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090306992A1 (en) * 2005-07-22 2009-12-10 Ragot Stephane Method for switching rate and bandwidth scalable audio decoding rate
US20120095758A1 (en) * 2010-10-15 2012-04-19 Motorola Mobility, Inc. Audio signal bandwidth extension in celp-based speech coder
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing

Also Published As

Publication number Publication date
US10049684B2 (en) 2018-08-14
KR20190130669A (ko) 2019-11-22
EP3281199C0 (en) 2023-10-04
EP3281199A1 (en) 2018-02-14
AU2016244808A1 (en) 2017-09-14
KR102047596B1 (ko) 2019-11-21
KR20170134461A (ko) 2017-12-06
EP3281199B1 (en) 2023-10-04
AU2016244808B2 (en) 2019-08-22
JP6545815B2 (ja) 2019-07-17
TW201703026A (zh) 2017-01-16
BR112017021351A2 (pt) 2018-07-03
TWI661422B (zh) 2019-06-01
US10777213B2 (en) 2020-09-15
US20160293174A1 (en) 2016-10-06
CN107408392A8 (zh) 2018-01-12
CN107408392A (zh) 2017-11-28
CN107408392B (zh) 2021-07-30
WO2016164232A1 (en) 2016-10-13
JP2018513411A (ja) 2018-05-24
TW201928946A (zh) 2019-07-16
KR102308579B1 (ko) 2021-10-01
US20180342255A1 (en) 2018-11-29

Similar Documents

Publication Publication Date Title
TWI693596B (zh) 用於音訊帶寬選擇之器件及裝置、操作一解碼器之方法及電腦可讀儲存器件
TWI640979B (zh) 用於編碼一音訊信號之裝置及設備、選擇用於編碼一音訊信號之一編碼器之方法、電腦可讀儲存裝置及選擇一調整參數之一值以使一選擇偏向用於編碼一音訊信號之一特定編碼器的方法
US9218820B2 (en) Audio fingerprint differences for end-to-end quality of experience measurement
US10103958B2 (en) Selecting a packet loss concealment procedure
CN107077849B (zh) 用于恢复音频信号的方法和设备
US9972334B2 (en) Decoder audio classification
JP2018513411A5 (zh)
RU2765985C2 (ru) Классификация и кодирование аудиосигналов
JP2013541731A (ja) 過渡フレームの符号化及び復号化
JP5518482B2 (ja) 低レベル信号の精度の損失を減少させる動的正規化のためのシステムと方法
WO2014000559A1 (zh) 语音频信号处理方法和编码装置
JP6522781B2 (ja) 利得フレームパラメータを生成するための装置、方法
WO2024110562A1 (en) Adaptive encoding of transient audio signals