TWI330355B - Systems, methods, and apparatus for detection of tonal components - Google Patents

Systems, methods, and apparatus for detection of tonal components Download PDF

Info

Publication number
TWI330355B
TWI330355B TW095145259A TW95145259A TWI330355B TW I330355 B TWI330355 B TW I330355B TW 095145259 A TW095145259 A TW 095145259A TW 95145259 A TW95145259 A TW 95145259A TW I330355 B TWI330355 B TW I330355B
Authority
TW
Taiwan
Prior art keywords
signal processing
value
encoding
iteration
threshold
Prior art date
Application number
TW095145259A
Other languages
English (en)
Other versions
TW200737128A (en
Inventor
Sharath Manjunath
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200737128A publication Critical patent/TW200737128A/zh
Application granted granted Critical
Publication of TWI330355B publication Critical patent/TWI330355B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuits Of Receivers In General (AREA)

Description

1330355 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於信號處理》 【先前技術】
藉由數位技術傳輸聲音已普遍存在,尤其存在於長途電 話、封包交換電話(例如卩語音傳輸(ν〇ΙΡ)),及數位無線電 話(例如蜂巢式電話)中。此迅速發展已引發判定在維持重構 浯音之感知品質的條件下,可經一通道發送之最小資訊量 的興趣。若僅藉由採樣及數位化來傳輸語音,則可能需要 大約為64千位元/秒(kbps)之資料傳輸率,以達成與習知類 比纜線電話之語音品質相當之語音品質。然而,經由使用 語音分析,繼以適當的編碼、傳輸,及在接收器上之重新 合成’可顯著降低資料傳輸率。 經配置以藉由擷取與人類語音產生模型相關之參數來壓 縮扣a之設備稱為"語音編碼器"。語音編碼器通常包括一 編碼器及解碼H。編碼詩輸人之語音信㈣分為時間 區塊(或"訊框"),分析各訊框㈣取特定的相關參數,且將 該等參數量化為二進位表示,例如_組位元或二進位資料 封包。資㈣包經通信通道(亦即有線或無線網路連接) 至包:解碼器之接收器。解碼器接收及處理資料封包,將 其反里化以產生參數,且接用命楚c曰,* Μ 1使用該等反量化參數重建語音訊 框0 語音編碼器之功能為藉由移 將數位化語音信號壓縮為低位 除語音中固有的自然冗餘而 疋率信號。數位壓縮係藉由 116976.doc 1330355 以一組參數來表示輸入語音訊框且採用量化從而以一組位 元表示該等參數而獲得。若輸入語音訊框具有位元數, 且由語音編碼器產生之相應資料封包具有位元數义,則該 曰編碼器可獲得之壓縮因子為=% 。挑戰在於保持經 解碼之語音之高聲音品質,同時達成目標壓縮因子。語音 編碼器之效能係視以下因素而定:(1)上述之語音模型或 分析與合成過程之組合的進行情況;及(2)參數量化過程以 目標位元率,即每訊框%位元執行的進行情況。因此,語 音模型之目標為在各訊框使用—小組參數的情況下捕捉語 音信號之資訊内容,從而提供目標聲音品質。 語音編碼器可實施為時域編碼器,其藉由採用高時解析 度處理嘗試捕捉時域語音波形,以同時編碼語音之小片段 (通常為5毫秒(ms)子訊框p對於各子訊框,可藉由此項技 術中已知之各種搜尋演算法自碼薄空間獲得高精度表示。 或者,語音編碼器可實施為頻域編碼器,其進行一分析過 程以捕捉具有一組參數之輸入語音訊框之短期語音頻譜, 且採用一相應合成過程以自頻譜參數重建語音波形。根據 已知置化技術(例如在A. Gersho及R.M. Gray,Vector
Quantization and Signal Compression (1992)中描述之量化 技術)’參數量化器藉由使用所儲存之碼向量之表示來表示 參數,而保留該等參數。 眾所熟知之時域語音編碼器為碼激發線性預測(Celp)編 碼器》此編碼器之一實例在L.B. Rabiner及R.W. Schafer,
Digital Processing of Speech Signals 396-453 (1978)中有描 116976.doc 1330355 述。在CELP編碼器中,藉由線性預測(Lp)分析移除語音信 號中之短期關聯或冗餘,此獲得短期共振峰濾波器之係 數。將短期預測濾波器應用於輸入語音訊框將產生LP殘餘 信號,其進一步經使用長期預測濾波器參數及連續隨機碼 薄而模型化及量化。因此,CELP編碼將編碼時域語音波形 之任務劃分為編碼LP短期濾波器係數及編碼Lp殘餘之獨 立任務。時域編碼可以固定速率(亦即對於各訊框使用相同 位元數或以可變速率(其中對於不同類型之訊框内容使 用不同位元率)進行。可變速率編碼器嘗試僅使用將編碼譯 碼器參數編碼至足以獲得目標品f之程度所需之位元量。 例示|±可老速率CELP編碼器在美國專利第5,414,796號 (Jacobs等人,1995年5月9日頒佈)中有描述。 時域編碼器(例如CELP編碼器)通常依賴每訊框之高位元 數%來保留時域語音波形之精確性。此等編碼器通常在每 訊框之位元數%相對較高(例如8kbps或以上)之情況下,傳 遞極佳語音品質’ J已成功地運用於較高速率的商業應用 中U ’在低位元率(4kbps及以下)情況下,時域編碼器 7能由於有限的可用位元數而無法保留高品質及強健效 舉例而言,低位元率下之有限的可用碼薄空間可削弱 習知時域編碼器之波形匹配能力。 語音編碼器可經配置以根據待編碼之信號的—或多個品 質來選擇料的編碼模式及/或速率。舉例而言,語音編碼 器可經配置以區分含有語音之訊框與含有非語音信號(例 如信號純音)之訊框,且使用不⑽碼模式以編碼語音訊框 116976.doc 1330355 及非語音訊框。 【發明内容】 一種根據一配置之信號處理方法包括對—數位化音訊信 號之一時間部分進行一編碼操作,其中該編碼操作:括; 序複數個迭代。在一實例中,該編碼操作為一用於計算一 線性預測編碼模型之參數的迭代程序。此方法包括在該有 序複數個迭代中之ϋ代上計算—與該編碼操作之一增 益相關的量測之-值。此方法包括為第—複數個臨限值中 之每一者判定該有序複數中之迭代且儲存該迭代之一指 示,在該迭代上,該計算值與一第一臨限值之間的一第一 關係的-狀態發生一改變。此方法包括比較該等儲存指示 中之至少-者與第二複數個臨限值中之至少—相應臨限 值。 一種根據另一配置之信號處理裝置包括用於對一數位化 音訊信號之一時間部分進行一編碼操作之構件,其中該編 碼操作包括有序複數個迭代。此裝置包括用於在該有序複 數個迭代中之每一迭代上計算一與該編碼操作之一增益相 關的量測之一值的構件。此裝置包括用於為第一複數個臨 限值中之每一者判定該有序複數中之迭代且用於儲存該迭 代之一指示之構件,在該迭代上,該計算值與該臨限值之 間的一第一關係的一狀態發生一改變。此裝置包括用於比 較該等儲存指示中之至少一者與第二複數個臨限值中之至 少一相應臨限值之構件。 一種根據另一配置之信號處理裝置包括一係數計算器, 116976.doc -9- 八置以進行一編碼操作,以基於一數位化音訊信號之 —時間部分計算複數個係數,其中該編碼操作包括有序複 數個迭代。此裝置包括一增益量測計算器,其經配置以在 該有序複數個迭代中之每—迭代上計算—與該編補作之 -增益相關的量測之一值。該裝置包括一第一比較單元, 其經配置以為第-複數個臨限值中之每—者判定該有序複 數中之迭代且儲存該送代之一指示,在該迭代上,該計算 值與該臨限值之間的一第一關係的一狀態發生一改變。該 裝置包括一第二比較單元,其經配置以比較該等儲存指示 中之至少一者與第二複數個臨限值中之至少一相應臨限 值。 【實施方式】 本文中描述用於以窄頻寬偵測具有頻譜峰值之信號(亦 稱為a調力量 音調”)之系統、方法及裝置。所述配置 之範圍包括使用通常已在語音編碼器中使用之線性預測编 碼(LPC)分析機制之參數進行此偵測之實施例,藉此相對於 使用獨立音調债測器之方法,降低運算複雜性。 除非其上下文有明確限制,否則術語"計算"在本文中用 於指示其任何普通意義,例如運算、產生值之列表及自該 列表中選擇。在本描述及中請專利範圍中使用術語"包含" 處,並不排除其他元件或操作。術語"A基於B”用於指示其 任何普通意義,包括以下情況:⑴"A等於B"及(ii)"A基於 至少B"。 曰調之實例包括電話中常碰到之特殊信號,例如呼叫過 116976.doc 1330355 程音調(例如回鈐音調、繁忙信號、號碼不可用音調、傳真 協定曰調,或其他信號傳輸音調)。音調分量之其他實例為 雙音調多頻(DTMF)信號,其包括來自組{697 Hz、77〇Hz、 852 Hz、941 Hz}中之一頻率及來自組{12〇9Hz、1336 Hz、 1477 Hz、ι633 Hz}中之一頻率。此等dtmf信號一般用於 按鍵式信號傳輸。使用者通常亦使用小鍵盤以在電話呼叫 期間產生DTMF音調’從而與呼叫之另一端上之自動系統
(例如聲音郵件系統或具有諸如選單之自動選擇機構之其 他系統)交互。 通常,吾人將音調信號定義為含有非常少的(例如少於八 個)音調之㈣。音調信號之頻譜包絡線在&等音調之頻率 處具有尖銳峰值,在此等音調處此峰值(如圖2之實例中所 示)附近之頻譜包絡線之頻寬遠較語音信號(如圖丨之實例中 所示)中的典型峰值附近之頻譜包絡線之頻寬小。舉例而 &,對應於音調分量之峰值的3_dB頻寬可小於Hz,且 可小於50 Hz、20 Hz、1〇 Hz或甚至5 Hz。
可需要偵測語音編碼器之信號輪入是否為與某類型之語 音信號相對的音調信號4調信號通f不能很好地通過語 音編碼器(尤其係在低位元率之情況下),且解碼後之結果通 常聽起來根本不像音調。音調信號之頻譜包絡線與語音信 號之頻譜包絡線不同,且語音編碼譯碼器之傳統分類過程 可無法為含有音調》量之訊框選擇合適的編喝模式。因 此’可需要偵測音調信號,以便可將適當的模式用於編碼 音調信號。 116976.doc 1330355 舉例而言,某些語音編碼譯碼器使用雜訊受激線性預測 (NELP)模式’以編碼無聲訊框。儘管式適用於類似 雜訊之波形,但此模式在用於編碼音調信號時,可能會產 生不良結果。包括原型波形内插(pwi)之波形内插(WI)模式 及原型音咼週期(ppp)模式,良好地適合用於編碼具有強週 期为畺之波形。然而,與相同速率之另一編碼模式相比, NELP或WI模式在用於編碼具有兩個或兩個以上音調分量 之信號(例如包括DTMF信號者)時,可產生不良結果。在低 位元率(例如半速率(例如4 kbps)、四分之一速率(例如2 kbps)或更低)下使用此等編碼模式(此可為增加系統能力所 需要),可能產生甚至更差的音調信號效能。可需要使用可 更普遍應用的編碼模式(例如碼激發線性預測(CELp)模式 或正弦語音編碼模式)’以編媽音調信號。 亦可需要控制音調編碼之速率。在自複數個速率中選擇 一速率以編碼輸入訊框之可變速率語音編碼器中,可尤其 需要此控制》舉例而言,為獲得特殊信號(例如回鈴或dtmf 音調)之高品質重現,可變位元率語音編碼譯碼器可經配 置,以使用最高可能的速率或充分高的速率,或特殊編碼 模式來編碼其中已偵測到至少一音調之存在的信號。 當對音調信號進行線性預測編碼(LPC)機制時,可能會出 現問題。舉例而言’音調信號之強頻譜峰值可致使相應的 LPC濾波器不穩定,可使Lpc係數至用於傳輸之另一形式 (例如線頻譜對、線頻譜頻率或導抗頻譜對)的轉換變得複 雜’及/或可降低量化效率。因此,可冑要憤測音調信號, 116976.doc -12· 1330355 使得可(例如藉由使超越特定階之LPC模型之參數變為零) 修改LPC機制。 圖3展示根據一揭示配置之方法M1〇〇之流程圖。任務 T100對數位化音訊彳§號之時間部分進行迭代編碼操作(例 如LPC分析)(其中,T1〇〇i指示第z•次迭代且γ指示迭代次 數)時間β卩分或"訊框"通常選得足夠短,使得預期可將信 號之頻譜包絡線保持相對穩定。一典型訊框長度為2〇毫 秒,其對應於典型採樣率8 kHz上之16〇個樣本,儘管可使 用認為適合特定應用之任何訊框長度或採樣率。在一些應 用中,訊框無重疊,而在其他應用中,使用重疊訊框機制。 在重疊訊框機制之一實例中,擴展各訊框以包括來自相鄰 的前一訊框及後一訊框之樣本。在另一實例中,擴展各訊 框以僅包括來自相鄰的前一訊框之樣本。在以下所述之特 定實例中’假設一無重疊訊框機制。 在如下表式中,線性預測編碼(LPC)機制將待編碼之信號 7模型化為激發信號w與該信號中之p個過去樣本之線性組 合的和: 其中c?表示輸入信號s之增益因子,且w表示樣本或時間索 引。根據此機制,可將輸入信號5模型化為驅動具有以下形 式之階全極點(或自回歸)濾波器之激發源信號M。 (1) 對於輸入彳5號之各時間部分(例如訊框),任務T1〇〇插取 116976.doc -13- 1330355 估計信號之長期頻譜包絡線的一組模型參數。通常,此擷 取以每秒50訊框之速率進行。特徵化此等參數之資訊可能 與其他資料(例如特徵化激發信號„之資訊)一起以某形式傳 送至解碼器,在該解碼器上,該資訊用於重建輸入信號 LPC模型之階ρ可為認為適合特定應用之任何值,例如 4、6、8、10、12、16、20 或 24。在一些配置中,任務 Τ1 〇〇 經配置以榻取作為一組户個濾波器係數Α之模型參數。在解 碼器上,此等係數可用於實施根據如圖4A中所示之直接形 式實現之合成濾波器。或者’任務T1〇〇可經配置以擷取作 為一組尸個反射係數h之模型參數’該等係數在解碼器上使 用’以實施根據如圖4B中所示之網格實現之合成濾波器。 直接形式實現通常較簡單,且運算成本較低,但LpC濾波 器係數較之反射係數,其對捨入及量化誤差之強健性較 差’使得網格實現在使用固定點運算或具有有限精度之系 統中係較佳的。(應注意’在此項技術之某些描述中,在上 述表式(1)中與在圖4A及4B中所示之實施例中,模型參數之 符號相反)。 通常,編碼器經配置以在傳輸通道上以量化形式傳輸模 型參數。LPC濾波器係數沒有界線,且可具有大的動態範 圍’且通常在量化前將此等係數轉換為另一形式,例如線 頻譜對(LSP)、線頻譜頻率(LSF)或導抗頻譜對(ISP)。在轉 換及/或量化前,亦可對模型參數進行其他操作,例如感官 加權(perceptual weight)。 亦需要編碼器傳輸關於激發信號w之資訊。某些編碼器债 116976.doc -14· 1330355 測且傳輸有聲語音信號之基頻或週期,使得解碼器使用彼 頻率上之脈衝波列作為用於有聲語音信號之激發及用於無 聲語音信號之隨機雜訊激發。其他編碼器或編碼模式使用 慮波is係數’以满取編瑪器上之激發信號Μ,且使用一成多 個碼薄來編碼該激發。舉例而言,CELP編碼模式通常使用 固定碼薄及適應性碼薄以模型化激發信號,使得將激發信 號一般編碼為用於固定碼簿之索引及用於適應性碼薄之索 引。可需要使用此CELP編碼模式以傳輸音調信號。 可根據用於什算LPC模型參數(例如渡波器係數及/或反 射係數)之各種已知之迭代編碼操作中之任一者來配置任 務Τ1 00。此等編碼操作通常經配置以藉由運算一組使均方 誤差最小化之係數來迭代地求解表式(ip此類型之操作通 常可分類為自相關法或協方差法。 自相關法自輸入信號之自相關函數之值開始,運算該組 濾、波器係數及/或反射係數《此編碼操作通常包括一初始化 任務’其中開視窗函數係應用於時間部分(例如訊框)以 將該部分外之信號變為零。可能需要使用在視窗之各末端 上具有低樣本加權之漸縮開視窗函數,此有助於降低視窗 外之分量的影響。舉例而言,可需要使用凸起餘弦視窗, 例如以下之漢明(Hamming)視窗函數: ιν[«] = .0·54-0·46(;Ο8^» 〇<«<//-1 0, 其他 其中iV為時間部分中之樣本的數目。 其他可使用之漸縮視窗包括漢明、佈雷克曼(Biackman)、 H6976.doc -15- 1330355 訊斯(Kaiser)及巴特萊特(Bartlett)視窗 根據例如以下之表式來計算: 開視窗函數無需對稱,使得視窗之一半與另一半可具有 :同加權、亦可使用混合式視窗’例如漢明·餘弦視窗或具 有不冋視窗之兩半(例如兩個不同大小的漢明視窗)的視窗。 可根據例如以下之表式來計算時間部分之自相關函數的 值:
視窗型部分可 > 、N-\—m ,可需要在運算迭代前,對自相關值進行—或多個預處 理操作。舉例而言,自相關值♦)可藉由進行例如以下之操 作而進行頻譜濾波: K(m)= '1.00003 R(m\
w = 0;
自相關值之預處理亦可包括正規化此等值(例如相對指 示時間部分之總能量之值及(〇))。 計算LPC模型參數之自相關法包括進行一迭代過程,以 求解包括一特普立茲(Toeplitz)矩陣之方程式》在自相關法 之某些實施例中,任務T1 00經配置以根據用於求解此等方 程式之眾所熟知的Levinson及/或Durbin遞回演算法中之任 一者進行一迭代系列。如以下假碼清單中所示,此演算法 使用反射係數h作為中間量,產生作為值i ^ 之濾波 器係數α,·: 116976.doc •16· 1330355 丑〇=m; for (/= 1; i ^p. / + +^ ^ L h 」/ (2) for Ο = 1; 7 < /; j + +) a(〇 = a0-D _ . a 蛘 k-丨; ’ } 其中,可如上所述對輸入自相關值進行預處理。 尽項表示在迭代/後剩餘的誤差(或殘餘)之能量。隨迭代 系列之執行,殘餘能量逐漸減少,使得瓦^心。圖5展示方 φ 法M100之實施例M110的流程圖,該方法包括經配置以根據 如上所述之演算法進行心、〜及尽之計算的任務T1 〇〇之實施 例T110,其中T11 〇 _ 0指示一或多個如本文中所述之初始化 及/或預處理任務,例如訊框之開視窗、自相關值之運算、 自相關值之頻譜濾波等。 在自相關法之其他實施例中,任務T100經配置以進行一 迭代系列’來計算反射係數Κ亦稱為偏相關(PARC0R)係 數、負PARC0R係數或Schur-Szego參數)而非濾波器係數 • 屮。可用於任務T100中以獲得反射係數之一演算法為 Leroux-Gueguen演算法,其使用脈衝回應估計值^作為中間 量’且其在以下假碼清單中表示: for (/ = -(p -1); i < pi i + +) e〇 (/) = R(i); for (m = l; m< p; m+ +) { t (3) for(/' = ~(p-\) + m; i <: p; i + +) (0 = em-\ (0 + K^m-\ (m - 〇; }
Leroux-Gueguen演算法通常使用替代陣列e之兩個陣列 116976.doc -17· 1330355 EP、ΕΝ來實施。圖6展示一如此之實施例之假碼清單,該 實施例在每一迭代上包括誤差(或殘餘能量)項E(h)之計 算。可用於自自相關值獲得反射係數心之其他眾所熟知之迭 代方法包括Schur遞回演算法,其可經配置以用於高效平行 運算。 如上所提及,反射係數可用於實施合成濾波器之網格實 現。或者可經由以下假碼清單中所示之遞回,自反射係數 獲得LPC濾波器係數: f〇r(/ = l; /<p; / + +) { α,(’)=毛; for (j = 1; y < /; j + +) α(〇 = α〇·.) + Λ } … 協方差法為可用於任務ΤΙ 〇〇以迭代地計算一組使均方誤 差最小化之係數的另一類編碼操作。協方差法開始於輸入 信號之協方差函數之值,且通常應用一分析視窗至誤差信 號而非輸入語音信號。在此情況下,待求解之矩陣方程式 包括一對稱正定矩陣而非特普立茲矩陣,使得Levins〇n_ Durbin及Leroux-Gueguen演算法不可用,但Ch〇lesky分解可 用於高效地求解濾波器係數α,·。然而,雖然協方差法保持高 的頻譜解析度,但其並不保證所得濾波器之穩定性。協方 差法之使用不如自相關法之使用普遍。 對於編碼操作之某些或所有迭代中之每一迭代,任務 Τ200計算與編碼操作之增益相關的相應量測值。可需要計 算作為初始信號能量(例如視窗型訊框之能量)之量測與當 前殘餘能量之量測之間的比率的增益量測。在一如此之實 116976.doc -18- 1330355 例中,根據以下表式來計算迭代;之增益量測G: Γ Ε0
Gi=J:。 在此情況下,因子G,表示至此之編碼操作之LPC預測增 益。該預測增益亦可根據以下表式自反射係數&運算:
Gn 在另一如此之實例中,可需要如以下表式中所示計算増 益量測以表示當前lpc預測誤差: 舉例而言,增益量測Gi_亦可根據亦包括乘積或五。 >1 與五,之間的比率作為因子或項之其他表式來計算。增益量 測Gi可在線性尺度上或在另一範圍中表示,例如在對數尺 度(例如log五。/£;或1〇§尽/五。)上表示。任務T2〇〇之其他實施 例基於殘餘能量(例如G, =五,_心)之變化來計算增益量 測。 通常’在各迭代(例如,如圖3及圖5中所示之任務T200-i) 上计算增益量測Gl,儘管亦有可能以僅每隔一個迭代或僅 在每二個迭代上等來計算增益量測G,的方式實施任務 T2〇〇 °以下假碼清單展示可用於進行任務T100及T200兩者 之實施例的上述假喝清單⑺之修改的一實例: 116976.doc •19- 1330355 五ο =及⑼; for (z = 1; i< p; /' + +) { 卜耶)-|a”邓W) for (y = 1; j < i; j + +) a(〇 = (4、
A =(1-VK·丨; J
Gi =E〇/Ei', } 圖7展示可用於進行任務T100及T200兩者之實施例的圖6中 之假碼清單之修改的一實例。 當被分析的信號中存在一或多個音調時,該等迭代中之 兩迭代之間的殘餘能量可快速下降。任務T300判定且記錄 第一迭代之指示,在該第一迭代上增益量測值與臨限值r 之間的關係之狀悲發生改變。舉例而言,對於增益量測作 為£。/£,·來計算之情況下,任務T3〇〇可經配置以記錄第一迭 代之指不,在該第一迭代上關係"> Γ"(或"G! & Γ,)之狀態 自假變為真,或在等價意義上,在該第一迭代上關係$ Γ”(或< Γ’’)自真變為假。舉例而言,對於增益量測作為 尽M。來計算之情況下,任務T3〇〇可經配置以記錄第一迭代 之指示,在該第一迭代上關係"σ·>Γ 真變為假,或在等價意義上,在該第4代上= (或"G,· < Γ")自假變為真。 "^在其上相關狀態發生改變之卜迭代之儲存指示亦稱為 ”停止命令”,且判定相關狀態改變是否已發生之操作亦稱 為"更新停止命令"β停止命令可儲存目標迭代之索引值域 可儲存索引值Ζ之某些其他指示。本文中假設任務D⑽經配 乂將各V止命令初始化為0預設值雖然亦明確涵蓋且因 116976.doc -20· 1330355 此揭示其中任務T300經配置以初始化各停止命令為某些其 他預設值(例如尸),或其中各別更新旗標狀態用於指示停止 命令是否保存一有效值之配置。在任務T300之後者類型之 配置中,舉例而言,若更新旗標狀態已改變以防止額外更 新’則假設相應的停止命令保存一有效值。 任務T300可經配置以維持一個以上之停止命令(例如兩
個或兩個以上)。亦即,任務T3〇〇可經配置以為之複數個《 個不同臨限值7)(其中中之每一者判定其上增益量測 值與臨限值7}之間的關係之狀態發生改變的第一迭代,且 儲存該迭代之指示(例如儲存至相應的記憶體位置)。對於其 中⑽斤調遞增之配置(例如G;=⑽),可需要配置級數中 之臨限值,使得7;.<7;+1。對於其中㈣!·單調遞減之配置(例 如6 =6/^)’可需要配置級數中之臨限值,使得&以州。在 一特定實例中,任務T300經配置以維持三個停止命令。一 組可用於此情況下之臨限值巧之一實例M = 68d:、k 8.1 dB及 Γ3 = 8.6 dB(例如對於 G =j^,)。 任務T30G可M g&置以在任務了2⑽每次(例如在任務了1〇〇 之各迭代上)計算增益量測G之值時,更新該(等)停止命 令,使得在迭㈣列完成時,停止命令為#前停止命令。 =^務伽可經配置,以在迭代系列完成後,( ^迭^處理已由任務伽記錄之各料代之增益量測 值G,來更新該(等)停止命令。 圖8展示可由任務T3〇〇 ㈣止命令之邏輯…、“及/或並仃地更新某數目 邏輯、·。構的—實例。在此實例中,該結構之 1 J6976.doc •21· 1330355 各模組7·判定增益量測是否大於(或者不小於)停止命令义之 相應臨限值2^若此結果為真,且停止命令之更新旗標亦 為真:則更新停止命令以指示迭代之索引,且改變更新旗 標狀態以防止停止命令之進一步的更新。
圖9A及圖9B展示可在任務T3〇〇之替代實施例中重現,以 串行及/或並行方式更新一組停止命令中之每一者的流裎 圖之實例。在此等實例中’僅在各別更新旗標仍為真之情 況下,評估關係之狀態。在圖9Β之實例中,停止命令在各 迭代上遞增,直至增益量測Gi達至(或者超過)臨限值乃,在 此點上任務Τ300藉由改變更新旗標之狀態來禁止停止命令 之進一步的遞增。 以下假碼清單展示可用於進行所有任務T1〇〇、Τ2〇〇及 Τ300之實施例的上述假碼清單(4)之修改的一實例。 五0=聊;
for〇=l;J<q;j++) { S_update(j) = i; 5 =0;} for (/ = 1; / < p; / + +) { J • /-1
λ(ο-ΣΟ·-λ - >=ι for (y = 1; y < /; j + +) af = _ k a(M). 丨; 7 …,
Gi = E>Qj, for(y =1; j^q\ 7++) { if (S_update(j)) {
Sj + +; if (G, > Tj) S_Update(J) = 〇; } ’ } 116976.doc -22- (5) 1330355 在此實例中’清單(5)包括如圖9B中所示之任務Τ300之一實 施例® 1〇展7^可用於進行所有任務Τ100、Τ200及Τ300之 實施例的圖7中之假碼清單之修改的—實例。 在一些配置中’可需要任務Τ300僅在一停止命令前之停 止命令的值已確定後,更新該停止命令。舉例而言,可需 要不同停止命令具有不同值(例如,具有預設值之停止命令 除外)。圖11展*可在任務Τ3〇〇之一替㈣施例中重現之模 、且之如此之實例,在任務Τ300中,暫停停止命令之更新, 直至前一停止命令之值已確定。 任務Τ400將停止命令中之一或多者與臨限值比較。圖12 展示用於任務Τ400之配置、以升序順序地測試停止命令之 測試程序的一實例。在此實例中,任務Τ400將各停止命令
Si與一相應上臨限值與下臨限值對(最後停止命令%除外, 其在此特定實例中僅相對於下臨限值而測試)比較,直至達 至關於時間部分之音調的決定。圖13展示以串行方式進行 用於Θ等於三之情況的此測試程序之任務丁4〇〇之一實施例 的流程圖。 如圖12中所示,一第一可能測試結果為停止命令具有小 於(或者不大於)相應下臨限值之值。此結果可表明在低迭代 索引上’可獲得較語音信號之預期更大的預測增益。在此 實例中,任務Τ400經配置以將時間部分分類為音調信號。 一第一可能測試結果為停止命令具有在下臨限值與上臨 限值之間的值,其可表明頻譜能量分佈為典型的語音信 號。在此實例中,任務Τ400經配置以將時間部分分類為非 116976.doc -23- 1330355 音調。 一第三可能測試結果為停止命令具有大於(或者不小於) 相應上臨限值之值。此結果可表明在低迭代索引上,可獲 得比語音信號之預期更小的預測增益。在此實例中此情 況下,任務T400經配置以繼續測試程序至下一停止命令广 圖14屐示時間部分之四個不同實例AD之增益量測&相 對迭代索引/的曲線《在此等曲線中,垂直轴表明増益G之 量值,水平軸表明迭代索引,·,且p具有值12。如該等曲線 上所表明,在此等實例中增益量測臨限值T!、A及丁3分別 分配值8、19及34,且停止命令臨限值Tli、Tui、Tu、丁… 及Τη分別分配值3、4、7、8&n。(通常,對於任何索引卜 TLi不必須與Tm相鄰,或Tui不必須小於丁叩+丨))。 使用此等臨限值,曲線A_D中所示所有時間部分將藉由圖 13中所示之任務丁4〇〇之特定實施例分類為音調。曲線A之 時間部分將分類為音調,因為Sl小於Tli。曲線8及〇之時間 部分將分類為音調,因為對於兩部分而言,Si大於τ⑴且部 分S2小於TL2。亦應注意曲線c展示其中兩個不同停止命令 具有相同值之實例。曲線D之時間部分將分類為音調,因為 Si及S2分別大於Sw及sU2,且S3小於TL3。 圖15展示用於任務T400之邏輯結構之一實例,其中可並 行地進行圖13中所示之測試。 可瞭解在圖13中所示之任務T400之實施例中,即便僅已 檢查停止命令中之第一者’ 一旦已作出音調決定,則測試 序列將終止。方法Ml 00之實施例範圍亦包括其中繼續測試 116976.doc -24- 1330355 序列之任務T400之配置。在一如此之配置中,若任一停止 命令具有小於(或者不大於)相應下臨限值之值,則將時間部 分分類為音調。在另一如此之配置中,若多數停止命令具 有小於(或者不大於)相應下臨限值之值,則將時間部分分類 為音調。 如圖3及圖5中所示,任務T400可經配置以在迭代系列完 成後執行。然而,方法Μ100之實施例的涵蓋範圍亦包括經 配置以在只要停止命令更新時即進行任務Τ4〇〇之實施例; 及經配置以在各迭代上進行任務Τ400之實施例。 方法Μ100之實施例範圍亦包括經配置以回應任務Τ400 之結果而進行一或多個動作之實施例。舉例而言,當被編 碼的訊框為音調時’可需要截去或終止LP或其他語音編碼 操作。如上所指出,音調信號之高頻譜峰值可導致Lpc滤 波器中之不穩定性,且在信號有峰時,Lpc係數至用於傳 輸之另一形式(例如線頻譜對、線頻譜頻率或導抗頻譜對) 之轉換亦會遭受損害。 方法Μ100之某些實施例可經配置以根據藉由停止命令 才曰示之迭代索引/(在該停止命令上達至任務Τ4 〇〇中之音調 分類)’截去LPC分析》舉例而言,此方法可經配置以藉由(例 如)將零值分配至用於索引丨及以上之LPc係數(例如濾波器 係數)而減小彼等係數之量值。此截斷可在迭代系列完成後 進行。或者’對於其中在各迭代上進行任務Τ4〇〇或只要停 止命令更新時即進行任務Τ4〇〇之此實施例,此截斷可包括 在達至第次迭代前,終止任務T1〇〇之送代系列。 H6976.doc -25· 1330355 如上所指出’方法M100之苴#奢竑加π /、他實施例可經配置以基於住 務Τ4 0 0之結果選擇合適的編蜗握★ 叼锔碼模式。通用編碼模式(例如穩 激發線性預測(CELP)或正弦編喝模式)可類似地傳遞任 波形。因此,圓滿地傳送音調至解碼器之一途經為強制編 碼器使用此編碼模式。現代語音編碼器通常應用判定如何 對各訊框進行編狀若干標準(❹速率極限),使得對特定 編碼模式之強制可需要超越許多其他決定。 ,法Μ100之實施例範圍亦包括具有經配置以識別該或 該等音調之頻率或類型之任務的實施例。在此情況下,可 能需要使用特殊編碼模式,以發送彼資訊而非編碼時間部 分。此方法可基於任務Τ400之結果開始頻率識別任務之執 行(例如與對彼訊框繼續語音編碼程序相反)。舉例而言,陷 波濾波器陣列可用於識別時間部分之最強頻率分量中之一 或多者中之每一分量的頻率。此濾波器可經配置以將頻譜 (或其某部分)劃分為具有(例如)1〇〇 Ηζ42〇〇 Ηζ之寬度的 槽。頻率識別任務可檢查時間部分之整個頻譜,或者僅檢 查選定頻率區域或槽(例如包括諸如DTmf信號之普通信號 傳輸音調之頻率的區域)。 在識別出DTMT信號之兩個音調之情況下,可需要使用特 殊編碼模式以傳輸對應於已識別之DTMF信號之數位,而非 音調本身或實際頻率之識別。頻率識別任務亦可經配置以 積測一或多個音調中之每一者的持續時間,此資訊可傳輸 至解碼器。進行方法Μ100之此實施例之語音編碼器亦可經 配置以在傳輸通道機制之旁通道(例如資料或信號傳輸通 ll6976.doc -26· 道)上,而非在訊務通道上傳輸諸如音調頻率、振幅及/或持 續時間之資訊至解碼器。 方法M100可用於語音編碼器之環境中或可獨立應用(例 如,用以提供除語音編碼器外之設備中之音調偵測圖i6A 展示根據一揭示配置之裝置A100之方塊圖,該揭示配置亦 可用於語音編碼器中,用作音調偵測器及/或用作另一設備 或系統之一部分。 裝置A100包括一係數計算器AU〇,其經配置以進行自一 數位化音訊信號之一時間部分計算複數個係數(例如濾波 器係數及/或反射係數)之一迭代編碼操作。舉例而言,係數 计算器A110可經配置以進行如本文中所述之任務丁1〇〇之實 施例。 係數計具器A11 〇可經配置以根據如本文中所述之自相關 法進行迭代編碼操作。圖16B展示裝置A100之實施例A200 的方塊圖’該裝置A1 00亦包括一經配置以計算該時間部分 之自相關值之自相關計算器A1 〇5。自相關計算器A105亦可 經配置以進行如本文中所述之自相關值之頻譜濾波。 裝置A100包括一増益量測計算器A12〇,其經配置以在有 序複數個迭代中之每一迭代上計算一與該編碍操作之一增 益相關的量測之一值。該增益量測值可為預測增益或預測 誤差°增益量測值可在該迭代上基於時間部分之能量的量 測與殘餘能量之量測之間的比率來計算。舉例而言,增益 量測計算器A120可經配置以進行如本文中所述之任務 T200之實施例。 116976.doc -27- 1330355 裝置A100亦包括一第一比較單元A130,其經配置以儲存 該規則複數中之該迭代之一指示,在該迭代上該計算值與 一第一臨限值之間的一第一關係的狀態發生改變。該迭代 之指示可實施為一停止命令,且第一比較單元A13〇可經配 置以更新一或多個停止命令。舉例而言,第一比較單元八13〇 可經配置以進行如本文中所述之任務T3〇〇之實施例。 裝置Α100亦包括一第二比較單元Α14〇,其經配置以比較 該儲存指示與一第二臨限值。第二比較單元Α14〇可經配置 以基於比較結果將該時間部分分類為音調抑或非音調。舉 例而言’第二比較單元八丨扣可經配置以進行如本文中所述 之任務Τ400之實施例。裝置Α1〇〇之又一實施例包括如下文 所述之模式選擇器202之一實施例,該模式選擇器經配置以 基於第二比較單元Α140之輸出選擇一編碼模式及/或一編 碼率。 裝置Α100之實施例之各種元件可實施為常駐於(例如)同 一晶片上或晶片組中之兩個或兩個以上晶片中的電子及/ 或光學設備,儘管亦涵蓋無此限制之其他佈置。此裝置之 一或多個元件可整體或部分地實施為一或多組經配置以在 一或多個邏輯元件(例如電晶體、閘)之固定或可程式化陣列 上執行的指令’該等固定或可程式化陣列可為(例如)微處理 器、故入式處理器、IP核、數位信號處理器、FpGA(場可程 式化閘陣列)、ASSP(特殊應用標準產品),及ASIC(特殊應 用積體電路)。 裝置A1 〇〇之實施例之一或多個元件可能用於進行任務或 H6976.doc • 28 · 執行不與裝置之操作直接相關的其他組指令集,例如與其 中嵌入該裝置之設備或系統之另一操作相關的任務。裝置 A10 0之實施例之-或多個元件亦可能具有共同的結構⑼ 如用於執行對應於不同時間上之不同元件的程式碼部分之 處理器、—組為進行對應於不同_間上之不同元件之任務 而執行的指令,或進行不同時間上之不同元件之操作的電 子及/或光學設備的佈置)。舉例而言,如上文中假碼清單 及(5),及圖7及圖1〇之假碼清單所示,裝置八1〇〇之一實施 例的一或多個元件甚至可實施為同一迴路之不同部分。 上述配置可用於一或多個經配置以採用CDMA(分碼多向 近接)空中介面之無線電話通信系統之設備(例如語音編碼 器然而,熟習此項技術者應瞭解包括本文中所述之特徵 的方法及裝置可常駐於採用熟習此項技術者已知的廣範圍 之技術的各種通信系統中之任一者中。舉例而言,熟習此 項技術者應瞭解如上所述之方法及裝置可應用於任何數位 通信系統,而與特定的實體及/或邏輯傳輸機制無關,且與 此系統為有線及/或無線系統、電路交換及/或封包交換系統 等無關,且明確涵蓋且揭示此等方法及/或裝置在此等系統 中之使用。 如圖17中所繪示,用於蜂巢式電話之系統通常包括複數 個行動用戶單元10、複數個基地台12、基地台控制器 (BSC)14 ’及一行動交換中心(MSC)16。MSC 16經配置以與 一習知公眾交換電話網路(?8丁1^)18連接。]^8(:16亦經配置 以與BSC 14連接。BSC 14經由回程線路與基地台12耦接。 116976.doc •29· 1330355 回程線路可經配置以支援包括(例如)Ε1/Τ1、ATM、IP、 ppp、訊框中繼、HDSL、ADSI^xDSL之若干已知介面中 之任"面。應瞭解在該系統中可存在兩個以上之BSC 14。各基地台12有利地包括至少一扇區(未圖示),各扇區包 含一全向天線或一自基地台12徑向地指向一特定方向之天 線或者’各扇區可包含兩個用於分集接收之天線。各基 地σ 12可有利地經設計以支援複數個頻率分配。在cdma 系統中’扇區及頻率分配之交集可稱為CDMA通道。基地 台12亦可已知為基地台收發器子系統(BTS) 12。或者,"基 地台"可在工業中用於指BSC 14及一或多個BTS 12全體。 BTS 12亦可表示"小區站點"12。或者,給定BTS 12之個別 扇區可稱為小區站點。行動用戶單元10通常為蜂巢式電話 或PCS電話10。此系統可經配置以根據IS 95標準或另一 CDMA標準來使用。此系統亦可經配置以經由一或多個封 包交換協定(例如VoIP)來載運聲音通信量。 在蜂巢式電話系統之典型操作期間,基地台12自行動單 元10之組接收反向鏈結信號集。行動單元10正進行電話通 話或其他通信。給定基地台12所接收之各反向鏈結信號在 彼基地台12内處理。所得資料轉發至BSC 14。BSC 14提供 通話資源分配及包括基地台12之間的軟交遞之配合的行動 性管理機能。BSC 14亦導引所接收之資料至MSC 16,其提 供用於與PSTN 18連接之額外的路徑選擇服務。類似地, PSTN 18與MSC 16連接’且MSC 16與BSC 14連接,其進而 控制基地台12以傳輸前向鏈結信號集至行動單元1〇之組。 116976.doc •30· 1330355 圖18展示-包括兩個編碼器1〇〇、1〇6之系統的圖形,該 系統可經配置以進行如本文_所揭示之任務测之一實施 例’及/或可經g&置以包括如本文中所揭示之裝置A⑽之一 實施例。第一編碼器100接收數位化語音樣本〆”),且為在 一傳輸媒體及/或通信通道1〇2上至第一解碼器ι〇4之傳輸 而編碼該等樣本外〇。解碼器1〇4解碼經編碼之語音樣本, 且合成輸出語音信號sSYNTH(n)。對於相反方向上之傳 輸,第二編碼器1〇6編碼數位化語音樣本咖), 一傳輸媒體及/或通信通道108上傳輸。第二解碼器ιι〇接收 且解碼經編碼之語音樣本,產生合成輸出語音信號 sSYNTH⑷。、編碼器100及解碼器11〇可一起在諸如蜂巢式 電話之收發器内實施。同樣,編碼器i 及解碼器1 可一 起在諸如蜂巢式電話之收發器内實施。 語音樣本5⑻表示已根據此項技術中之任一已知方法(例 如脈碼調變(PCM)、壓伸μ律或A律)數位化及量化之語音信 號。如在此項技術中已知,將語音樣本4”)編製為輸入資料 之訊框,其中各訊框包含預定數目之數位化語音樣本。 在一例示性配置中,採用8kHz之採樣率,其中各2〇毫秒訊 框包含160個樣本。在下述配置中,資料傳輸率可有利地以 訊框至訊框為基準,在全速率、半速率、四分之一速率及 八分之一速率(在一實例中,分別對應於13 2 kbps、6 2 kbps、2.6 kbps及1 kbps)之間變化。變化的資料傳輸率潛在 有利,在於可為含有相對較少的語音資訊之訊框選擇性採 用較低之位元率。如熟習此項技術者所瞭解,可使用其他 116976.doc •31 - 1330355 採樣率、訊框大小及資料傳輸率。 第一編碼器1〇〇及第二解碼器110一起包含一第—語音編 碼器或語音編碼譯碼器。該語音編碣器可經配置以用於任 何類型之經由有線及/或無線通道傳輸語音信號之通信設 備,該等通信設備包括以上參照圖17而描述之(例如)用^ 元、BTS或BSC。類似地,第二編碼器1〇6及第一解碼器ι〇4 一起包含一第二語音編碼器。熟習此項技術者應瞭解語音 編碼器可與數位信號處理器(DSP)、特殊應用積體電路 • (ASIC)、離散閘邏輯、韌體或任何習知可程式化軟體模組 及微處理器一起實施。軟體模組可常駐於RAM記憶體、快 閃6己憶體、暫存器或此項技術中已知之任何其他形式之可 寫儲存媒體中。或者,任何習知處理器、控制器或狀態機 可替代微處理器。特別為語音編碼而設計之例示性ASIC在 美國專利第5,727,123號(McDonough等人,1998年3月1〇曰 頒佈)及第5,784,532號(McDonough等人,1998年7月21曰頒 佈)中有描述。 籲 在圖19A中’可用於語音編碼器中之編碼器200包括一模 式選擇器202、一音高估計模組2〇4、一 lp分析模組2〇6、一 LP分析濾波器208、一 LP量化模組210,及一殘餘量化模組 212。輸入語音訊框ί⑻係提供至模式選擇器2〇2、音高估計 模組204、LP分析模組206,及LP分析濾波器208。模式選 擇器202可基於各輸入語音訊框之週期性、能量、信號 與雜訊比(SNR)或零點交叉率等特徵產生模式指示μ。模式 選擇器202亦可經配置以基於任務Τ4〇〇之結果,及/或第二 116976.doc •32· 1330355 比較單元A140之輸出產生對應於音調信號之偵測的模式指 示Μ 〇 模式Μ可指示如本文中所揭示之諸如CELP、NELP或ΡΡΡ 之編碼模式,且亦可指示編碼率。在圖19 Α中所示之實例 中,模式選擇器202亦產生模式索弓丨IM(例如用於傳輸之模 式指示Μ的經編碼型式)。美國專利第5,911,128號(DeJaco, 1999年6月8日頒佈)中描述根據週期性分類語音訊框之各 種方法。此等方法亦併入電信工業協會行業臨時標準 (Telecommunication Industry Association Industry Interim Standards)TIA/EIA IS-127及 TIA/EIA IS-733 中。美國專利第 6,691,084號(厘&11>1^让等人,2004年2月10日頒佈)中亦描述 一例示性模式決定機制。 音高估計模組204基於各輸入語音訊框咖)產生音高索引 Ip及延遲值PG。LP分析模組206對各輸入語音訊框進行線 性預測分析,以產生一組LP參數(例如濾波器係數幻。LP參 數由LP量化模組210接收,可能在轉換為另一形式(例如 LSP、LSF或LSP)後接收(或者此轉換可在模組210内發生)。 在此實例中,LP量化模組210亦接收模式指示Μ,藉此以模 式依賴方式進行量化過程。 LP量化模組210產生LP索引ILP(例如,產生一索引至量化 碼薄中)及一組經量化之LP參數a。除輸入語音訊框ί⑻外, LP分析濾波器208接收該組經量化之LP參數<5。LP分析濾波 器208產生LP殘餘信號,其表示輸入語音訊框〃⑻與基於 經量化之線性預測參數a之重構語音之間的誤差。LP殘餘 116976.doc -33 - 1330355 _及模式指频係提供至殘餘量化模組2i2。在此實例中, 該組經量化之LP參心亦提供至殘餘量化模組212。殘餘量 化模組212基於此等值產线餘索引Ir及經量化之殘餘信 號Φ*]。如圖18中所示之編碼器1〇〇及1〇6中之每一者可經配 置以包括編碼器200之一實施例及裝置Al〇〇之一實施例。 在圖19B中,可用於語音編碼器尹之解碼器3〇〇包括一 參數解碼模組302、-殘餘解碼模㈣4、_模式解碼模組 3 06及LP合成濾波器308。模式解碼模組3〇6接收且解碼 模式索引IM’從而自其產生模式㈣M。Lp參數解碼模組 302接收模式财〇>索引lLp。Lp參數解碼模組3〇2解碼所接 收之值,以產生一組經量化之Lp參數a。殘餘解碼模組 接收殘餘索引lR、音高索引Ip,及模式索引—殘餘解碼模 組304解碼所接收之值,以產生經量化之殘餘信號耐”]。經 里化之殘餘信號,及該組經量化之Lp參數a由Lp合成濾 波器308接收,該濾波器3〇8自其合成經解碼之輸出語音信 號可《]。如圖18中所示之解碼器104及11()中之每一者可經配 置以包括解碼器300之一實施例。 圖20展示用於模式選擇之任務的流程圖,該模式選擇可 藉由包括模式選擇器202之一實施例之語音編碼器來進 行。在任務4〇〇中,模式選擇器接收連續訊框中之語音信號 之數位樣本。在接收到給定訊框後,模式選擇器前進至任 務402。在任務402中,模式選擇器偵測訊框之能量。該能 量為該訊框之語音活動性之量測。語音偵測係藉由對數位 化語音樣本之振幅的平方進行求和,且將所得能量與臨限 116976.doc •34· 1330355 值相比來進行。任務402可經配置以基於背景雜訊之變化位 準來調適此臨限值。一例示性可變臨限值語音活動性偵測 器在前述之美國專利第5,414,796號中有描述。某些無聲語 音聲音可為能量極低之樣本,其可能被錯誤地編碼為背景 雜訊。為減小此類誤差之機會,如前述美國專利第5,414,796 號中所描述,可將低能量樣本之頻譜傾斜(例如第一反射係 數)用於區分無聲語音與背景雜訊。 在偵測到訊框之能量後,模式選擇器前進至任務404。(模 式選擇器202之一替代實施例經配置以自語音編碼器之另 一元件接收訊框能量)。在任務404中,模式選擇器判定所 偵測到之訊框能量是否足以將訊框分類為含有語音資訊之 訊框。若所偵測到之訊框能量低於預定臨限值,則語音編 碼器前進至任務406。在任務406中,語音編碼器將訊框編 碼為背景雜訊(亦即靜寂)。在一配置中,以1 /8速率(例如1 kbps)編碼背景雜訊訊框。在任務404中,若所偵測到之訊 框能量達至或超過預定臨限值位準,則訊框被分類為語 音,且模式選擇器前進至任務408。 在任務408中,模式選擇器判定訊框是否為無聲語音。舉 例而言,任務408可經配置以檢查訊框之週期性。各種已知 之週期性判定方法包括(例如)使用零點交叉,及使用正規化 自相關函數(NACF)。特定而言,零點交叉及NACF用於偵 測週期性在前述美國專利第5,911,128號及第6,691,084號中 有描述。此外,在電信工業協會臨時標準(Telecommunication Industry Association Interim Standards)TIA/EIA IS-127及 116976.doc -35- 1330355 TIA/EIA IS-733中併入用於區分有聲語音與無聲語音之上 述方法。若在任務408中,訊框被判定為無聲語音,則語音 編碼器前進至任務410。在任務41〇中,語音編碼器將訊框 編碼為無聲語音。在-配置中,以四分之一速率(例如2 6 kbps)編碼無聲語音訊框。若在任務4〇8中,訊框未被判定 為無聲語音,則模式選擇器前進至任務412。 在任務412中,模式選擇器判定訊框是否為過渡語音。任 務412可經配置以使用此項技術中已知之週期性偵測方法 (例如,如前述美國專利第5,91 U28號中所描述)。若訊框 被判定為過渡語音,則語音編碼器前進至任務414。在任務 414中,訊框被編碼為過渡語音(亦即自無聲語音至有聲語 音之過渡)。在一配置中,根據美國專利第6,260,017號(Das 等人,2_年7月1()日頒佈)t所描述之多脈衝内插編瑪方 法對過渡語音訊框進行編碼。CELp模式亦可用於編碼過渡 語音訊框。在另-配置中,以全速率(例如13.2以㈣編碼過 渡語音訊框。 若在任務412中,模式選擇器判定訊框為非過渡語音,則 語音編碼II前進至任務416。在任務416中,語音編碼器將 訊框編碼為有聲語音。在—配置中,可以半速率(例如62 kbps)或四分之-速率,使用ppp編碼模式對有聲語音訊框 進行編碼。亦可能以全速率使用PPP或其他編碼模式(例如 Π ·2 kbps、或8k CELp編碼器中之8 kbps)對有聲語音訊框進 行編碼。然而’熟習此項技術者應瞭解以半速率或四分之 一速率對有聲贿進行編碼允許編碼^藉㈣用有聲訊框 116976.doc • 36 - 之穩定狀態本性而銘成· 士 而節^有價值之頻寬。此外,無論用於編 碼有聲語音之速率如何,有利地使用來自過去訊框之資訊 對有聲語音進行編碼。 以上多模式語音編碼譯碼器之描述說明含有語音之輸入 訊框之處理。靡Ά咅,7土 m 使用訊框内容之分類過程以便選擇 編碼訊框之最佳模式。在以下部分將描述若干編碼器/解媽 =模式。不同之編碼器/解碼器模式根據不同之編碼模式而 操作特疋模式在展現料靠之語音信^⑷之編碼部分 上更為有效°如上所指出,模式選擇11202可經配置以基於 任務T400之結果及/或第二比較單元Ai4〇之輸出,超越如圖 2〇中所示(例如,由任務彻及/或412產生)之編碼決定。 在一配置令,選擇"碼激發線性預測”(CELP)模式,以對 分類為過渡語音之訊框進行編碼。CELp模式激發以線性預 測殘餘信號之量化型式激發線性預測聲道模型。在本文中 所描述之所有編碼器/解碼器中,CELp通常產±最精痛之語 音重現’但需要最高之位元率。在—配置中,咖卩模式以 約8500位元/秒進行編碼4另—配置中以全速率及半速 率中之選定速率進行訊框之CELp編碼。對應於音調信號之 偵測的CELP模式亦可根據任務T4〇〇之結果及/或第二比較 單元Α140之輸出來選擇。 亦可選擇"原型音高週期,,(ΡΡΡ)模式,以對分類 音之訊框進行編碼。有聲語音含ΜΡΡΡ模式利用之慢時變 週期分莖。ΡΡΡ模式僅編碼各訊框内音高週期之子集。笋音 信號之剩餘週期藉由在此等原型週期之間進行内插而°: 116976.doc •37- ΓΙ330355 構。藉由利用有聲語音之週期性,ρρρ能夠獲得較celm 之位兀率,且仍以感知上精確之方式重現語音信號。在一 配置中’PPP模式以3900位元/秒進行編碼。在另一配置中, 以全速率、半速率及四分之—速率中之選定速率進行訊框 之PPP編碼。亦可使用”波形内插”(WI)或"原型波形内插" (PWI)模式,以對分類為有聲語音之訊框進行編碼。 亦可選擇"雜訊激發線性預測"(NELP)模式,以對分類為 無聲語音之訊框進行編碼^ NELP使用經濾波之假隨機雜訊 信號,以模型化無聲語音。NELP對經編碼之語音使用最簡 單之模型,且因此獲得最低位元率。在一配置中,NELp模 式以1500位元/秒進行編碼。在另一配置中,以半速率及四 分之一速率中之選定速率進行訊框之NELP編碼。 同一編碼技術可頻繁地工作於不同位元率之上,從而具 有變化位準之效能β因此’不同之編碼器/解碼器可代表不 同之編碼技術’或工作於不同位元率之上的同一編碼技 術’或以上之組合。熟習此項技術者應瞭解編碼器/解碼器 模式之數目的增加將在選擇模式時允許更大之靈活性,其 可導致較低之平均位元率’但將增加整個系統内之複雜 性。用於任何給定系統之特定組合將由可用系統資源及具 體信號壤境指定。進行如本文中所揭示之任務Τ4 〇〇的一實 施例,及/或包括如本文中所揭示之裝置A1 〇〇之一實施例的 語音編碼器或其他裝置可經配置以根據任務丁4〇〇之結果及 /或第二比較單元A140之輸出選擇特定的編碼率(例如全速 率或半速率),其指示音調信號之偵測。 116976.doc -38- 1330355 提供所述配置之以上陳述,以允許任何熟習此項技術者 製造或使用本文中所揭示之方法及其他結構。本文中所展 示及描述之流程圖及其他結構僅為實例,且此等結構之其 他變型亦處於本揭示之範疇内❶可能對此等配置進行各種 修改,且本文中所提出之一般原則同樣可應用於其他配置。 本文中所描述之配置中之每一者可部分或整體地實施為 硬連線電路、製造為特殊應用積體電路之電路配置、或載 入至非揮發性儲存器中之韌體程式,或自資料儲存媒體載 入或載入至資料儲存媒體之作為機器可讀程式碼之軟體程 式,此程式碼為可由一邏輯元件陣列(例如微處理器或其他 數位信號處理單元)執行之指令。資料儲存媒體可為一儲存 元件陣列,例如半導體記憶體(其可包括且不限於動態或靜 態RAM(隨機存取記憶體)、R〇M(唯讀記憶體),及/或快閃 RAM) ’或鐵電記憶體、磁阻記憶體、雙向記憶體、聚合記 憶體或相變記憶體;或諸如磁碟及光碟之碟式媒體。應將 術語"軟體"理解為包括原始碼、組合語言碼、機器碼、二 進位碼、韌體、宏碼、微碼、可由一邏輯元件陣列執行之 指令的一或多個集合或序列,及此等實例之任何組合。 本文中所揭示之方法中之每一者亦可(例如,在以上所列 舉之一或多個資料儲存媒體中)確實地實施為可由包括一 邏輯元件陣列(例如處理器、微處理器、微控制器或其他有 限狀態機)之機器讀取及/或執行的一或多個指令集。因此, 本揭示案並不意欲受限於以上所示之配置,而係符合與本 文中以任何方式揭示之原則及新穎特徵一致、包括於形成 116976.doc -39- 1330355 原始揭示案之一部分之申請的隨附申請專利範圍中之最廣 範疇。 【圖式簡單說明】 圖1展示語音信號之頻譜之一實例。 圖2展示音調信號之頻譜之一實例。 圖3展示根據一揭示配置之方法M100之流程圖。 圖4A展示合成濾波器之直接形式實現之示意圖。 圖4B展示合成濾波器之網格實現之示意圖。 圖5展示方法M100之實施例M110之流程圖。 圖6展示用於Leroux-Gueguen演算法之實施例的假碼清 單。 圖7展示包括任務T100及T200之實施例的假碼清單。 圖8展示任務T300之邏輯結構之一實例。 圖9A及圖9B展示任務T300之流程圖之實例。 圖10展示包括任務T100、T200及T300之實施例的假碼清 單。 圖11展示任務T300之邏輯模組之一實例。 圖12展示用於任務T400之配置的測試程序之一實例。 圖13展示任務T400之實施例之流程圖。 圖14展示時間部分之四個不同實例A-D之增益量測G,·相 對迭代索引/的曲線。 圖15展示任務T400之邏輯結構之一實例。 圖16A展示根據一揭示配置之裝置A100之方塊圖。 圖16B展示裝置A100之實施例A200之方塊圖。 116976.doc -40- 1330355 圖17展示用於蜂i 式電話之系姑从田 _展示包括兩個編雨,的圖解。 圖19A展示編碼器 個解碼器之系統的圖解。 〜4塊圖。 圖19B展示解碼器之方塊圖。 圖2〇展示用於模式選擇之任務的流程圖。 【主要元件符號說明】
10 行動用戶單元 12 基地台 14 基地台控制器 16 行動交換中心 18 公眾交換電話網路 100 編碼器 102 傳輸媒體及/或通信通道 104 解碼器 106 編碼器 108 傳輸媒體及/或通信通道 110 解碼器 200 編碼器 202 模式選擇器 204 音高估計模組 206 LP分析模組 208 LP分析濾波器 210 LP量化模組 212 殘餘量化模組 116976.doc -41- 1330355 300 解碼器 302 LP參數解碼模組 304 殘餘解碼模組 306 模式解碼模組 308 LP合成濾波器 Α100 裝置 Α105 自相關計算器 Α110 係數計算器 A120 增益量測計算器 A130 第一比較單元 A140 第二比較單元 A200 裝置 M100、M110 方法 T100 、 T200 、 T300 、 T400 任務
116976.doc ·42·

Claims (1)

1330355 十、申請專利範圍: 1. 一種信號處理方法’該方法包含: 對一數位化音訊信號之一時間部分進行一編碼操作’ 其中該編碼操作包括有序複數個迭代; 在該有序複數個迭代中之每一迭代上,計算一與該編 碼操作之一增益相關的量測之一值; 為第一複數個臨限值中之每一者判定該有序複數中之 迭代且儲存該迭代之-指示,在該迭代上,該計算值與 該臨限值之間的一第一關係的一狀態發生一改變;及 比較該等儲存指示中之至少一者與第二複數個臨限值 中之至少一相應臨限值。 2. 如凊求項丨之信號處理方法,其中該編碼操作為一線性預 測編碼操作。
如請求項1之信號處理方法,其中該進行一編碼操作包括 計算複數個與該時間部分相關的濾波器係數。 2請求項3之信號處理方法,該方法包含為回應該比較之 、、-=果而減小該等渡波器係數中之至少一者之量值。 如請求们之信號處理方法,其中該進行一編碼操作包括 計算複數個與該時間部分相關的反射係數。 如=求項5之信號處理方法,其中該計算一與—增益相關 的里測之一值包括基於該複數個反射係數中之一 計算該值。 ^一 如明求項1之信號處理方法’其中該與該編碼操作之一增 益相關的量測為(A)—預測增益及(B) 一預測誤差中之二 116976.doc 如叫求項1之仏號處理方法,其中該比較該等儲存指示中 之至少-者與第二複數個臨限值中之至少—相應臨限值 包括比較該等儲存指示中之至少―者與—相應上臨限值 及一相應下臨限值中之每一者。 如吻求項1之信號處理方法,其中該與該編碼操作之一增 益相關的量測係基於(A)該時間部分之能量與(B)該編碼 操作之該相應迭代之一殘餘的能量之間的一比率。 10·如請求们之信號處理方法,其中對於該第一複數個臨限 值中之每一纟,該計算值與該臨限值之間的該第一關係 的該狀態(A)在該計算值大於該臨限值時,具有一第一 值,且(B)在該計算值小於該臨限值時,具有一不同於該 第一值之第二值。 11.如請求们之信號處理方法,該方法包含基於該比較之一 紇果而選擇一用於該時間部分之編碼模式。 12·:請求項R信號處理方法,該方法包含為回應該比較之 一結果而使用至少一碼薄索引以編碼該時間部分之一激 發信號。 13·如請求们之信號處理方法,該方法包含為回應該比較之 一結果而識別該時間部分所包括之一雙音調多頻信號。 如請求们之信號處理方法’該方法包含為回應該比較之 一結果而判定該時間部分之至少兩個頻率分量中之每一 者的一頻率。 15.如請求们之信號處理方法,豸方法包含基於料儲存指 116976.doc 1330355 示中之至少一者而決定該時間部分為(A) —語音信號及 (B)—音調信號中之一者, 其中該決定包括該比較該等儲存指示中之至少一者與 第一複數個臨限值中之至少一相應臨限值。 16_ —種資料儲存媒體,其具有描述如請求項1之方法的機器 可讀指令。 17. —種彳s號處理裝置,該裝置包含: 用於對一數位化音訊信號之一時間部分進行一編碼操 • 作之構件,其中該編碼操作包括有序複數個迭代; 用於在該有序複數個迭代中之每一迭代上計算一與該 、扁碍操作之一增益相關的量測之一值的構件; 用於為第一複數個臨限值中之每一者判定該有序複數 中之迭代且用於儲存該迭代之一指示的構件,在該迭代 上,該計算值與該臨限值之間的一第一關係的一狀態發 生一改變;及 18. 用於比較該等儲存指示中之至少一者與第二複數個臨 限值中之至少一相應臨限值之構件。 如請求項Π之信號處理裝置,其中該與該編碼操作之一 增益相關的量測為(A)—預測增益及(B)_預測誤差中之 一者。 19. 如請求们7之信號處理裝置’其中該與該編竭操作之一 增益相關的量測係基於(A)該時間部分 刀之此量與(B)該編 碼刼作之該相應迭代之一殘餘的能量之間的一比率 20. 如請求項17之信號處理裝置,其中該用於比較該等儲存 H6976.doc 1330355 指示中之至少一者與第二複數個臨限值中之至少一相應 臨限值之構件經配置,以比較該等儲存指示中之至少二 者與—相應上臨限值及一相應下臨限值中之每—者。乂 21. 如請求項17之信號處理裝置’其中對於該 。 限值中之每-者,該計算值與該臨 間的該第一關 係的該狀態(A)在該計算值大於該臨限值時,具有一第一 值,且(B)在該計算值小於該臨限值時具有—不同於該 第一值之第二值〇 ^ 22. 如請求項17之信號處理裂置,該裝置包含用於基於用於 比較之該構件的-輸出而選擇—用於該時間部分之編瑪 模式的構件。 23. 一種蜂巢式電話,其包括如請求項17之裝置且經配置以 基於用於比較之該構件的一輸出而進行如下操作中之至 少一者:(A)選擇-用於該時間部分之編碼模式,及⑻ 減小複數個係數中之至少一者的一量值。 24. —種信號處理裝置,該裝置包含: —-係數計算器,其經配置以進行—編碼操作以基於 -數位化音訊信號之-時間部分計算複數個係數,其中 該編碼操作包括有序複數個迭代; ’ —增益量測計算器,其經配置以在财序複數個迭代 中之每一迭代上計算-與該編碼操作之_增益相關的量 測之一值; -第-比較單元’其經配置以為第一複數個臨限值中 之每一者衫該㈣複數巾之迭代且料料代之一指 116976.doc -4 · 1330355 不’在該迭代上’該計算值與該臨限值之間的一第一關 係的一狀態發生一改變;及 一第二比較單元,其經配置以比較該等儲存指示中之 至乂一者與第二複數個臨限值中之至少一相應臨限值。 25.如吻求項24之信號處理裝置,其中該與該編碼操作之一 增益相關的量測為(A)—預測增益及(B) 一預測誤差中之 一者0
26.如請求項24之信號處理裝置,其中該與該編碼操作之一 增益相關的量測係基於(A)該時間部分之能量與(B)該編 碼操作之該相應迭代之一殘餘的能量之間的一比率。 27·如請求項24之信號處理裝置,其中該第二比較單元經配 置以比較該等儲存指示中之至少—者與—相應上臨限值 及一相應下臨限值中之每一者。 28.如請求項24之信號處理裝置,纟中對於該第—複數個臨 限值中之每-者,該計算值與該臨限值之間的該第一關 係的該狀態(A)在該計算值大於該臨限值時,具有一第一 值,且(B)在該計算值小於該臨限值時,具有一不同於該 第一值之第二值。 29. 如請求項24之信號處理裝置,該裳置包含一模式選擇 器’其經配置以基於該第二比較單元之—輸出而選擇用 於該時間部分之一編碼模式。 30. 一種蜂巢式電話,其包括如請求項24之裝置且經配置以 基於該第二比較單元之—輸出而進行如下操作_之至少 一者:㈧選擇-用於該時間部分之編碼模式及⑻減小 116976.doc 1330355
複數個係數中之至少一者的一量值。 31. —種語音編碼器,其包括如請求項24之裝置且經配置以 基於該第二比較單元之一輸出而進行如下操作中之至少 一者:(A)選擇一用於該時間部分之編碼模式,及(B)減小 複數個係數中之至少一者的一量值。 116976.doc
TW095145259A 2005-12-05 2006-12-05 Systems, methods, and apparatus for detection of tonal components TWI330355B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US74284605P 2005-12-05 2005-12-05

Publications (2)

Publication Number Publication Date
TW200737128A TW200737128A (en) 2007-10-01
TWI330355B true TWI330355B (en) 2010-09-11

Family

ID=38610000

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095145259A TWI330355B (en) 2005-12-05 2006-12-05 Systems, methods, and apparatus for detection of tonal components

Country Status (10)

Country Link
US (1) US8219392B2 (zh)
EP (1) EP1958187B1 (zh)
JP (1) JP4971351B2 (zh)
KR (1) KR100986957B1 (zh)
CN (1) CN101322182B (zh)
AT (1) ATE475171T1 (zh)
DE (1) DE602006015682D1 (zh)
ES (1) ES2347473T3 (zh)
TW (1) TWI330355B (zh)
WO (1) WO2007120316A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI794059B (zh) * 2022-03-21 2023-02-21 英業達股份有限公司 聲音處理方法及聲音處理裝置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5621852A (en) 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US8725501B2 (en) * 2004-07-20 2014-05-13 Panasonic Corporation Audio decoding device and compensation frame generation method
US8990073B2 (en) * 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
WO2009077950A1 (en) * 2007-12-18 2009-06-25 Koninklijke Philips Electronics N.V. An adaptive time/frequency-based audio encoding method
EP2237266A1 (en) * 2009-04-03 2010-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
US8730852B2 (en) * 2009-12-11 2014-05-20 At&T Intellectual Property I, L.P. Eliminating false audio associated with VoIP communications
CN102656627B (zh) * 2009-12-16 2014-04-30 诺基亚公司 多信道音频处理方法和装置
US8818806B2 (en) * 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
WO2013125257A1 (ja) * 2012-02-20 2013-08-29 株式会社Jvcケンウッド 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9167396B2 (en) * 2013-01-15 2015-10-20 Marvell World Trade Ltd. Method and apparatus to transmit data through tones
CN103428803B (zh) * 2013-08-20 2016-05-25 上海大学 一种联合机会网络编码的机会路由方法
CN106233381B (zh) * 2014-04-25 2018-01-02 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
CN106716929B (zh) * 2014-09-22 2019-03-08 英国电讯有限公司 创建用于在dsl连接上传输数据的信道的方法和装置
GB201617409D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201617408D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201704636D0 (en) 2017-03-23 2017-05-10 Asio Ltd A method and system for authenticating a device
GB2565751B (en) 2017-06-15 2022-05-04 Sonos Experience Ltd A method and system for triggering events
GB2570634A (en) 2017-12-20 2019-08-07 Asio Ltd A method and system for improved acoustic transmission of data
US11270721B2 (en) * 2018-05-21 2022-03-08 Plantronics, Inc. Systems and methods of pre-processing of speech signals for improved speech recognition
US11988784B2 (en) 2020-08-31 2024-05-21 Sonos, Inc. Detecting an audio signal with a microphone to determine presence of a playback device
CN112017617A (zh) * 2020-09-30 2020-12-01 许君君 一种提琴自动调弦装置及其运行方法
US20240015007A1 (en) * 2022-07-06 2024-01-11 Qualcomm Incorporated Systems and techniques for authentication and security

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4689760A (en) * 1984-11-09 1987-08-25 Digital Sound Corporation Digital tone decoder and method of decoding tones using linear prediction coding
GB8601545D0 (en) * 1986-01-22 1986-02-26 Stc Plc Data transmission equipment
EP0243561B1 (en) * 1986-04-30 1991-04-10 International Business Machines Corporation Tone detection process and device for implementing said process
US4723936A (en) 1986-07-22 1988-02-09 Versaflex Delivery Systems Inc. Steerable catheter
BR9206143A (pt) 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
DE69229584T2 (de) 1991-08-30 2000-07-20 Texas Instruments Inc., Dallas Telefonsignalklassifizierung und Verfahren und System zur Telefonnachrichtenablieferung
IN184794B (zh) 1993-09-14 2000-09-30 British Telecomm
CA2153170C (en) 1993-11-30 2000-12-19 At&T Corp. Transmitted noise reduction in communications systems
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
CA2149163C (en) * 1994-06-28 1999-01-26 Jeffrey Wayne Daugherty Detection of tones while minimizing incorrect identification of other sounds as tones
TW271524B (zh) 1994-08-05 1996-03-01 Qualcomm Inc
FR2734389B1 (fr) 1995-05-17 1997-07-18 Proust Stephane Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme
JP3522012B2 (ja) 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
JPH09152894A (ja) 1995-11-30 1997-06-10 Denso Corp 有音無音判別器
JPH10105194A (ja) * 1996-09-27 1998-04-24 Sony Corp ピッチ検出方法、音声信号符号化方法および装置
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
AU6425698A (en) 1997-11-27 1999-06-16 Northern Telecom Limited Method and apparatus for performing spectral processing in tone detection
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
JP2001007704A (ja) * 1999-06-24 2001-01-12 Matsushita Electric Ind Co Ltd トーン成分データの適応オーディオ符号化方法
US6275806B1 (en) 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
JP2001175298A (ja) * 1999-12-13 2001-06-29 Fujitsu Ltd 騒音抑圧装置
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
DE10134471C2 (de) 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US6590972B1 (en) 2001-03-15 2003-07-08 3Com Corporation DTMF detection based on LPC coefficients
US6873701B1 (en) 2001-03-29 2005-03-29 3Com Corporation System and method for DTMF detection using likelihood ratios
DE10121532A1 (de) 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
US20050159942A1 (en) 2004-01-15 2005-07-21 Manoj Singhal Classification of speech and music using linear predictive coding coefficients
US7457747B2 (en) 2004-08-23 2008-11-25 Nokia Corporation Noise detection for audio encoding by mean and variance energy ratio

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI794059B (zh) * 2022-03-21 2023-02-21 英業達股份有限公司 聲音處理方法及聲音處理裝置

Also Published As

Publication number Publication date
DE602006015682D1 (de) 2010-09-02
TW200737128A (en) 2007-10-01
WO2007120316A2 (en) 2007-10-25
CN101322182A (zh) 2008-12-10
US20070174052A1 (en) 2007-07-26
CN101322182B (zh) 2011-11-23
WO2007120316A3 (en) 2008-01-31
EP1958187B1 (en) 2010-07-21
KR100986957B1 (ko) 2010-10-12
JP2009518694A (ja) 2009-05-07
ES2347473T3 (es) 2010-10-29
KR20080074216A (ko) 2008-08-12
US8219392B2 (en) 2012-07-10
JP4971351B2 (ja) 2012-07-11
EP1958187A2 (en) 2008-08-20
ATE475171T1 (de) 2010-08-15

Similar Documents

Publication Publication Date Title
TWI330355B (en) Systems, methods, and apparatus for detection of tonal components
US6584438B1 (en) Frame erasure compensation method in a variable rate speech coder
US6324505B1 (en) Amplitude quantization scheme for low-bit-rate speech coders
TWI672691B (zh) 解碼方法
JP5037772B2 (ja) 音声発話を予測的に量子化するための方法および装置
US8032369B2 (en) Arbitrary average data rates for variable rate coders
KR100754591B1 (ko) 음성 코더에서 목표 비트율을 유지하는 방법 및 장치
US6324503B1 (en) Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
JP2007534020A (ja) 信号符号化
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
US6397175B1 (en) Method and apparatus for subsampling phase spectrum information
KR20020040910A (ko) 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩안선택 패턴을 사용하는 예측 음성 코더
KR100756570B1 (ko) 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치