TWI643186B - 高頻帶激勵信號生成 - Google Patents

高頻帶激勵信號生成 Download PDF

Info

Publication number
TWI643186B
TWI643186B TW104111025A TW104111025A TWI643186B TW I643186 B TWI643186 B TW I643186B TW 104111025 A TW104111025 A TW 104111025A TW 104111025 A TW104111025 A TW 104111025A TW I643186 B TWI643186 B TW I643186B
Authority
TW
Taiwan
Prior art keywords
signal
band
low
audio signal
voiced
Prior art date
Application number
TW104111025A
Other languages
English (en)
Other versions
TW201606757A (zh
Inventor
普雷文 庫瑪 瑞瑪達斯
丹尼爾J 辛德
史帝芬 皮爾瑞 維爾緹
維法克 雷真德倫
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201606757A publication Critical patent/TW201606757A/zh
Application granted granted Critical
Publication of TWI643186B publication Critical patent/TWI643186B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本發明提供一種特定方法,其包括在一器件處判定一輸入信號之一濁音分類。該輸入信號對應於一音訊信號。該方法亦包括基於該濁音分類控制該輸入信號之一表示之一包封的一量。該方法進一步包括基於該包封之該受控量調變一白雜訊信號。該方法亦包括基於該經調變白雜訊信號生成一高頻帶激勵信號。

Description

高頻帶激勵信號生成
本發明大體上係關於高頻帶激勵信號生成。
技術的進步已帶來更小且更強大的計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線計算器件,諸如攜帶型無線電話、個人數位助理(PDA)及尋呼器件,其體積小,重量輕,且易於使用者攜帶。更具體而言,攜帶型無線電話(諸如蜂巢式電話及網際網路協定(IP)電話)可經由無線網路傳達語音及資料包。另外,許多此等無線電話包括併入其中之其他類型之器件。舉例而言,無線電話亦可包括數位靜態攝影機、數位視訊攝影機、數位記錄器及音訊檔案播放器。
由數位技術傳輸語音係普遍的,尤其在長距離及數位無線電電話應用中。若藉由取樣及數位化傳輸話音,則大約為六十四千位元/秒(kbps)之資料速率可用於達成類比電話之話音品質。壓縮技術可用於減小經由頻道發送之資訊量,同時維持重新建構之話音之感知品質。經由在接收器處使用話音分析,繼之以寫碼、傳輸及重新合成,可達成資料速率的顯著減小。
用於壓縮話音之器件可用於許多電信領域中。舉例而言,無線通信具有許多應用,包括(例如)無線電話、尋呼、無線區域迴路、無線電話(諸如蜂巢式及個人通信服務(PCS)電話系統)、行動網際網路 協定(IP)電話及衛星通信系統。特定應用為用於行動用戶之無線電話。
已開發用於無線通信系統之各種空中介面,包括(例如)分頻多重存取(FDMA)、分時多重存取(TDMA)、分碼多重存取(CDMA)及分時同步CDMA(TD-SCDMA)。結合該等空中介面,已建立各種國內及國際標準,包括(例如)先進行動電話服務(AMPS)、全球行動通信系統(GSM)及臨時標準95(IS-95)。例示性無線電話通信系統為分碼多重存取(CDMA)系統。IS-95標準及其衍生標準(IS-95A、ANSI J-STD-008及IS-95B)(本文中統稱作IS-95)由電信工業協會(TIA)及其他公認標準機構頒佈以指定CDMA空中介面針對蜂巢式或PCS電話通信系統的使用。
IS-95標準隨後演進成諸如cdma2000及WCDMA的「3G」系統,該等「3G」系統提供更大容量及高速度封包資料服務。cdma2000之兩個變體由TIA發佈之文件IS-2000(cdma2000 1xRTT)及IS-856(cdma2000 1xEV-DO)呈現。cdma2000 1xRTT通信系統提供153kbps之波峰資料速率,而cdma2000 1xEV-DO通信系統定義範圍介於38.4kbps至2.4Mbps之資料速率集合。WCDMA標準體現於第三代合作夥伴計劃「3GPP」第3G TS 25.211號、第3G TS 25.212號、第3G TS 25.213號及第3G TS 25.214號中。先進國際行動電信(先進IMT)規範陳述「4G」標準。對於高行動性通信(例如,來自火車及汽車),先進IMT規範設定100百萬位元/秒(Mbit/s)之波峰資料速率用於4G服務,且對於低行動性通信(例如,來自行人及靜止使用者),先進IMT規範設定十億位元/秒(Gbit/s)之波峰資料速率。
使用藉由提取關於人類話音生成模型之參數來壓縮話音之技術的器件被稱為話音寫碼器。話音寫碼器可包含編碼器及解碼器。編碼器將傳入話音信號劃分成時間區塊或分析訊框。可將每一時間分段 (或「訊框」)之持續時間選擇為足夠短的,使得可預期信號之頻譜包封保持相對靜止。舉例而言,訊框長度可為二十毫秒,其對應於八千赫茲(kHz)取樣速率下之160個樣本,但可使用認為適於特定應用之任何訊框長度或取樣速率。
編碼器分析傳入話音訊框以提取某些相關參數,且隨後將參數量化成二進位表示(例如,位元集合或二進位資料封包)。將資料封包經由通信頻道(亦即,有線及/或無線網路連接)傳輸至接收器及解碼器。解碼器處理資料封包、去量化經處理資料封包以產生參數且使用經去量化之參數重新合成話音訊框。
話音寫碼器之功能為藉由移除話音中固有之自然冗餘而將經數位化話音信號壓縮成低位元速率信號。可藉由用參數集合表示輸入話音訊框及使用量化以藉由位元集合表示參數來達成數位壓縮。若輸入話音訊框具有位元數目Ni,且由話音寫碼器所產生之資料封包具有位元數目No,則由話音寫碼器所達成之壓縮因數為Cr=Ni/No。挑戰為在達成目標壓縮因數時保留經解碼話音之高語音品質。話音寫碼器之效能取決於:(1)話音模型或上文所描述的分析及合成處理程序之組合執行得多好,及(2)在No位元每訊框之目標位元速率下參數量化處理程序執行得多好。因此,話音模型之目標為對於每一訊框使用較小集合之參數擷取話音信號之本質或目標語音品質。
話音寫碼器大體上利用參數集合(包括向量)來描述話音信號。良好參數集合為感知上準確的話音信號之重新建構理想地提供低系統頻寬。音調、信號功率、頻譜包封(或共振峰)、振幅及相譜為話音寫碼參數之實例。
話音寫碼器可實施為時域寫碼器,其試圖藉由使用高時間解析度處理以一次編碼較小話音分段(例如,5毫秒(ms)之子訊框)來擷取時域話音波形。對於每一子訊框,借助於搜尋演算法找到來自碼簿空間 之高精確度代表。替代地,話音寫碼器可實施為頻域寫碼器,其試圖藉由參數集合(分析)擷取輸入話音訊框之短期話音頻譜及使用對應的合成處理程序以自頻譜參數重新產生話音波形。參數量化器藉由根據已知量化技術用所儲存的碼向量之表示來表示參數而保持參數。
一個時域話音寫碼器為碼激發線性預測(CELP)寫碼器。在CELP寫碼器中,藉由發現短期共振峰濾波器之係數的線性預測(LP)分析來移除話音信號中之短期相關性或冗餘。將短期預測濾波器應用於傳入話音訊框生成LP殘餘信號,藉由長期預測濾波器參數及後續隨機碼簿對該LP殘餘信號進行進一步模型化及量化。因此,CELP寫碼將編碼時域話音波形之任務劃分成編碼LP短期濾波器係數及編碼LP殘餘之單獨任務。可以固定速率(亦即,對於每一訊框,使用相同數目個位元No)或可變速率(其中,不同位元速率用於不同類型之訊框內容)執行時域寫碼。可變速率寫碼器試圖使用將參數編碼至足以獲得目標品質之位準所需要的位元量。
諸如CELP寫碼器之時域寫碼器可依賴於每訊框大量位元N0以保持時域話音波形之準確性。倘若每訊框位元數目No相對較大(例如,8kbps或高於8kbps),則此等寫碼器可遞送極好的語音品質。在低位元速率(例如,4kbps及低於4kbps)下,歸因於受限數目個可用位元,時域寫碼器可不能保持高品質及穩固效能。在低位元速率下,受限碼簿空間削減在較高速率商業應用中所部署的時域寫碼器之波形匹配能力。因此,低位元速率下之許多CELP寫碼系統操作遭受表徵為雜訊之感知顯著失真。
低位元速率下對CELP寫碼器的替代為在類似於CELP寫碼器之原理下操作的「雜訊激發線性預測」(NELP)寫碼器。NELP寫碼器使用經濾波偽隨機雜訊信號來模型化話音而非碼簿。由於NELP使用用於經寫碼話音之較簡單模型,因此NELP達成比CELP低之位元速率。 NELP可用於壓縮或表示清音話音或靜默。
以大約為2.4kbps之速率操作的寫碼系統在本質上大體上係參數的。亦即,此等寫碼系統藉由以常規時間間隔傳輸描述話音信號之音調週期及頻譜包封(或共振峰)的參數進行操作。說明此類參數寫碼器的為LP聲碼器。
LP聲碼器藉由每音調週期單一脈衝來模型化濁音話音信號。可擴增此基本技術以包括關於頻譜包封以及其他物質之傳輸資訊。儘管LP聲碼器提供大體上合理之效能,但其可引入表徵為蜂音之感知顯著失真。
近年來,已出現為波形寫碼器及參數寫碼器兩者之混合的寫碼器。說明此等混合寫碼器的為原型波形內插(PWI)話音寫碼系統。PWI話音寫碼系統亦可被稱為原型音調週期(PPP)話音寫碼器。PWI話音寫碼系統提供用於寫碼濁音話音之有效方法。PWI之基本概念為以固定時間間隔提取代表性音調循環(原型波形)、傳輸其描述及藉由在原型波形之間進行內插而重新建構話音信號。PWI方法可對LP殘餘信號抑或話音信號起作用。
在傳統電話系統(例如,公共交換電話網路(PSTN))中,信號頻寬限於300赫茲(Hz)至3.4千赫茲(kHz)之頻率範圍。在寬頻(WB)應用(諸如,蜂巢式電話及網際網路通訊協定語音(VoIP))中,信號頻寬可跨越50Hz至7kHz之頻率範圍。超寬頻(SWB)寫碼技術支援擴展至16kHz左右之頻寬。將信號頻寬自3.4kHz之窄頻電話擴展至16kHz之SWB電話可改良信號重新建構之品質、可懂度及自然度。
寬頻寫碼技術涉及編碼及傳輸信號之較低頻率部分(例如,50Hz至7kHz,亦被稱為「低頻帶」)。為了改良寫碼效率,可不完全編碼及傳輸信號之較高頻率部分(例如,7kHz至16kHz,亦被稱為「高頻帶」)。低頻帶信號之性質可用於生成高頻帶信號。舉例而言,可基 於低頻帶殘餘使用非線性模型(例如,絕對值函數)生成高頻帶激勵信號。當低頻帶殘餘藉由脈衝經稀疏寫碼時,由稀疏寫碼之殘餘生成的高頻帶激勵信號可在高頻帶之清音區域中導致偽訊。
揭示用於高頻帶激勵信號生成的系統及方法。音訊解碼器可在傳輸器件處接收由音訊編碼器編碼之音訊信號。音訊解碼器可判定特定音訊信號之濁音分類(例如,強濁音、弱濁音、弱清音、強清音)。 舉例而言,特定音訊信號的範圍可為強濁音(例如,話音信號)至強清音(例如,雜訊信號)。音訊解碼器可基於濁音分類控制輸入信號之表示之包封的量。
控制包封之量可包括控制包封之特性(例如,形狀、頻率範圍、增益及/或量值)。舉例而言,音訊解碼器可自經編碼音訊信號生成低頻帶激勵信號,且可基於濁音分類控制低頻帶激勵信號之包封之形狀。舉例而言,音訊解碼器可基於應用於低頻帶激勵信號之濾波器之截止頻率控制包封之頻率範圍。作為另一實例,音訊解碼器可藉由基於濁音分類調整線性預測寫碼(LPC)係數之一或多個極點來控制包封之量值、包封之形狀、包封之增益或其組合。作為另一實例,音訊解碼器可藉由基於濁音分類調整濾波器之係數來控制包封之量值、包封之形狀、包封之增益或其組合,其中該濾波器應用於低頻帶激勵信號。
音訊解碼器可基於包封之受控量調變白雜訊信號。舉例而言,相比在濁音分類為強清音時,經調變之白雜訊信號在濁音分類為強濁音時可更多地對應於低頻帶激勵信號。音訊解碼器可基於經調變之白雜訊信號生成高頻帶激勵信號。舉例而言,音訊解碼器可擴展低頻帶激勵信號且可組合經調變之白雜訊信號及經擴展之低頻帶信號來生成高頻帶激勵信號。
在一特定實施例中,一種方法包括在器件處判定輸入信號之濁音分類。該輸入信號對應於音訊信號。該方法亦包括基於濁音分類控制輸入信號之表示之包封的量。該方法進一步包括基於包封之受控量調變白雜訊信號。該方法包括基於經調變之白雜訊信號生成高頻帶激勵信號。
在另一特定實施例中,一種裝置包括濁音分類器、包封調整器、調變器及輸出電路。該濁音分類器經組態以判定輸入信號之濁音分類。該輸入信號對應於音訊信號。該包封調整器經組態以基於濁音分類控制輸入信號之表示之包封的量。該調變器經組態以基於包封之受控量調變白雜訊信號。該輸出電路經組態以基於經調變之白雜訊信號生成高頻帶激勵信號。
在另一特定實施例中,一種電腦可讀儲存器件儲存在由至少一個處理器執行時引起該至少一個處理器判定輸入信號之濁音分類的指令。該等指令在由至少一個處理器執行時進一步引起該至少一個處理器基於濁音分類控制輸入信號之表示之包封的量、基於包封之受控量調變白雜訊信號及基於經調變之白雜訊信號生成高頻帶激勵信號。
由所揭示實施例中之至少一者提供之特定優勢包括生成對應於清音音訊信號之平滑發聲合成音訊信號。舉例而言,對應於清音音訊信號之合成音訊信號可具有極少(或不具有)偽訊。本發明的其它方面、優點和特徵將在審閱申請案之後變得顯而易見,該申請案包括以下部分:附圖說明、實施方式及申請專利範圍。
100‧‧‧系統
102‧‧‧第一器件
104‧‧‧行動器件
116‧‧‧輸出信號
120‧‧‧網路
122‧‧‧激勵信號生成模組
130‧‧‧輸入信號
132‧‧‧位元串流
142‧‧‧揚聲器
146‧‧‧麥克風
152‧‧‧第一使用者
154‧‧‧第二使用者
156‧‧‧白雜訊
160‧‧‧濁音分類器
162‧‧‧包封調整器
164‧‧‧調變器
166‧‧‧輸出電路
168‧‧‧高頻帶合成器
170‧‧‧多工器
172‧‧‧高頻帶編碼器
174‧‧‧多工器
176‧‧‧傳輸器
180‧‧‧濁音分類
182‧‧‧信號包封
184‧‧‧經調變白雜訊
186‧‧‧高頻帶激勵信號
188‧‧‧合成高頻帶信號
190‧‧‧高頻帶位元串流
200‧‧‧解碼器
202‧‧‧解多工器
204‧‧‧低頻帶合成器
208‧‧‧濁音因數產生器
218‧‧‧位元串流
222‧‧‧激勵信號產生器
232‧‧‧位元串流
234‧‧‧合成低頻帶信號
236‧‧‧濁音因數
242‧‧‧參數
244‧‧‧低頻帶激勵信號
246‧‧‧諧性參數
300‧‧‧編碼器
302‧‧‧濾波器組
304‧‧‧低頻帶編碼器
334‧‧‧低頻帶信號
340‧‧‧高頻帶信號
342‧‧‧低頻帶位元串流
400‧‧‧方法
404‧‧‧操作
406‧‧‧操作
408‧‧‧操作
410‧‧‧操作
412‧‧‧操作
414‧‧‧操作
416‧‧‧操作
418‧‧‧操作
422‧‧‧代表性信號
426‧‧‧低通濾波器截止頻率
434‧‧‧雜訊增益
436‧‧‧諧波增益
438‧‧‧經縮放之經調變白雜訊
440‧‧‧經縮放之代表性信號
450‧‧‧低通濾波器
470‧‧‧曲線圖
482‧‧‧原始頻譜形狀
484‧‧‧第一頻譜形狀
500‧‧‧方法
508‧‧‧操作
510‧‧‧操作
512‧‧‧操作
516‧‧‧操作
518‧‧‧操作
526‧‧‧頻寬擴張因數
540‧‧‧經縮放之經濾波信號
542‧‧‧高頻帶LPC頻譜
544‧‧‧經濾波信號
570‧‧‧曲線圖
582‧‧‧原始頻譜形狀
584‧‧‧第一頻譜形狀
586‧‧‧第二頻譜形狀
600‧‧‧方法
610‧‧‧操作
612‧‧‧操作
614‧‧‧合成高頻帶信號
616‧‧‧操作
618‧‧‧操作
640‧‧‧經縮放之合成高頻帶信號
670‧‧‧曲線圖
682‧‧‧原始頻譜形狀
684‧‧‧第一頻譜形狀
686‧‧‧第二頻譜形狀
700‧‧‧方法
702‧‧‧操作
704‧‧‧操作
710‧‧‧操作
712‧‧‧操作
714‧‧‧操作
716‧‧‧操作
718‧‧‧操作
732‧‧‧經調變之雜訊增益
734‧‧‧未經調變之雜訊增益
736‧‧‧未經調變之白雜訊
740‧‧‧經縮放之經調變之白雜訊
742‧‧‧經縮放之未經調變之白雜訊
744‧‧‧經縮放之白雜訊
800‧‧‧方法
802‧‧‧操作
804‧‧‧操作
806‧‧‧操作
808‧‧‧操作
900‧‧‧器件
902‧‧‧數位至類比轉換器(DAC)
904‧‧‧類比至數位轉換器(ADC)
906‧‧‧處理器
908‧‧‧話音及音樂寫碼器解碼器(編解碼器)
910‧‧‧額外處理器
912‧‧‧回音消除器
922‧‧‧系統級封裝或系統單晶片器件
926‧‧‧顯示控制器
928‧‧‧顯示器
930‧‧‧輸入裝置
932‧‧‧記憶體
934‧‧‧編解碼器
936‧‧‧聲碼器編碼器
938‧‧‧聲碼器解碼器
940‧‧‧無線控制器
942‧‧‧天線
944‧‧‧電力供應器
946‧‧‧麥克風
948‧‧‧揚聲器
950‧‧‧收發器
956‧‧‧指令
圖1為說明包括器件之系統之特定實施例的圖,該器件可操作以執行高頻帶激勵信號生成;圖2為說明可操作以執行高頻帶激勵信號生成的解碼器之特定實施例的圖; 圖3為說明可操作以執行高頻帶激勵信號生成的編碼器之特定實施例的圖;圖4為說明高頻帶激勵信號生成之方法之特定實施例的圖;圖5為說明高頻帶激勵信號生成之方法之另一實施例的圖;圖6為說明高頻帶激勵信號生成之方法之另一實施例的圖;圖7為說明高頻帶激勵信號生成之方法之另一實施例的圖;圖8為說明高頻帶激勵信號生成之方法之另一實施例的流程圖;及圖9為根據圖1至圖8之系統及方法的可操作以執行高頻帶激勵信號生成的器件之方塊圖。
本文所描述之原理可應用於(例如)耳機、手持話機或經組態以執行高頻帶激勵信號生成之其他音訊器件。除非由其上下文明確限制,否則術語「信號」在本文中用以指示其通常意義中之任一者,包括如電線、匯流排或其他傳輸媒體上表達的記憶體位位置(或記憶體位置之集合)之狀態。除非由其上下文明確地限制,否則術語「生成」在本文中用以來指示其通常意義中之任一者,諸如計算或另外產生。除非由其上下文明確限制,否則術語「計算」在本文中用以指示其通常意義中之任一者,諸如計算、評估、平滑化及/或自複數個值進行選擇。除非由其上下文明確限制,否則術語「獲得」在本文中用以指示其通常意義中之任一者,諸如計算、推導、接收(例如,自另一組件、區塊或器件)及/或檢索(例如,自記憶體暫存器或儲存元件之陣列)。
除非由其上下文明確地限制,否則術語「產生」係用以指示其通常意義中之任一者,諸如計算、生成及/或提供。除非藉由其上下文明確地限制,否則術語「提供」係用以指示其通常意義中之任一 者,諸如計算、生成及/或產生。除非由其上下文明確限制,否則術語「耦接」係用以指示直接或間接的電或實體連接。若連接為間接的,則一般熟習此項技術者應充分地理解,在經「耦接」之結構之間可存在其他區塊或組件。
術語「組態」可用於對如藉由其特定上下文指示之方法、裝置/器件及/或系統的參考中。在本描述及申請專利範圍中使用術語「包含」之處,其並不排除其他元件或操作。術語「基於」(如在「A係基於B」中)用以指示其通常意義中之任一者,包括以下情況:(i)「基於至少」(例如,「A基於至少B」);及若在特定上下文中適當的,則(ii)「等於」(例如,「A等於B」)。在A係基於B的(i)包括基於至少的情況下,此可包括A耦接至B的組態。類似地,術語「回應於」用以指示其通常意義中之任一者,包括「至少回應於」。術語「至少一個」用以指示其通常意義中之任一者,包括「一或多個」。術語「至少兩個」用以指示其通常意義中之任一者,包括「兩個或兩個以上」。
除非特定上下文另有指示,否則通用地及互換地使用術語「裝置」及「器件」。除非另有指示,否則對具有特定特徵之裝置之操作的任何揭示內容亦明確地意欲揭示具有相似特徵的方法(且反之亦然),且對根據特定組態之裝置之操作的任何揭示內容亦明確地意欲揭示根據相似組態的方法(且反之亦然)。除非特定上下文另有指示,否則通用地且可互換地利使用術語「方法」、「處理程序」、「程序」及「技術」。術語「元件」及「模組」可用於指示較大組態之一部分。 以引用方式對文件之一部分的任何併入亦應被理解為併入在該部分內所引用之術語或變數的定義(其中此等定義出現在文件中之別處)以及在所併入部分中所引用之任何圖式。
如本文所使用,術語「通信器件」係指可用於經由無線通信網路之語音及/或資料通信的電子器件。通信器件之實例包括蜂巢式電 話、個人數位助理(PDA)、手持型器件、耳機、無線調制解調器、膝上型電腦、個人電腦等。
參考圖1,展示包括可操作以執行高頻帶激勵信號生成之器件的系統之特定實施例,且大體上將其指定為100。在特定實施例中,系統100之一或多個組件可整合至解碼系統或裝置中(例如,無線電話或寫碼器/解碼器(編解碼器)中)、整合至編碼系統或裝置中或該兩者中。在其他實施例中,系統100之一或多個組件可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元或電腦中。
應注意,在以下描述中,將由圖1之系統100執行之各種功能描述為由某些組件或模組執行。組件及模組之此劃分僅係為了說明。在替代實施例中,由特定組件或模組執行之功能可劃分為多個組件或模組。此外,在替代實施例中,圖1之兩個或兩個以上組件或模組可整合至單一組件或模組中。可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖1中所說明的每一組件或模組。
儘管圖1至圖9中所描繪之說明性實施例係關於高頻帶模型描述的,該高頻帶模型類似於用於增強型變數率編解碼器-窄頻-寬頻(EVRC-NW)中的模型,但說明性實施例中之一或多者可使用任何其他高頻帶模型。應理解,僅例如描述任何特定模型之使用。
系統100包括經由網路120與第一器件102通信的行動器件104。 行動器件104可耦接至麥克風146或與其通信。行動器件104可包括激勵信號生成模組122、高頻帶編碼器172、多工器(MUX)174、傳輸器176或其組合。第一器件102可耦接至揚聲器142或與其通信。第一器件102可包括經由高頻帶合成器168耦接至MUX 170之激勵信號生成模 組122。激勵信號生成模組122可包括濁音分類器160、包封調整器162、調變器164、輸出電路166或其組合。
在操作期間,行動器件104可接收輸入信號130(例如,第一使用者152之使用者話音信號,清音信號,或該兩者)。舉例而言,第一使用者152可與第二使用者154進行語音呼叫。第一使用者152可使用行動器件104,且第二使用者154可使用第一器件102用於語音呼叫。在語音呼叫期間,第一使用者152可向耦接至行動器件104之麥克風146說話。輸入信號130可對應於第一使用者152之話音、背景雜訊(例如,音樂、街道雜訊、另一個人的話音等)或其組合。行動器件104可經由麥克風146接收輸入信號130。
在特定實施例中,輸入信號130可為包括在自近似50赫茲(Hz)至近似16千赫茲(kHz)之頻率範圍中的資料的超寬頻(SWB)信號。輸入信號130之低頻帶部分及輸入信號130之高頻帶部分可分別佔據50Hz至7kHz及7kHz至16kHz之非重疊頻帶。在替代實施例中,低頻帶部分及高頻帶部分可分別佔據50Hz至8kHz及8kHz至16kHz之非重疊頻帶。在另一替代實施例中,低頻帶部分及高頻帶部分可重疊(例如,分別為50Hz至8kHz及7kHz至16kHz)。
在特定實施例中,輸入信號130可為具有近似50Hz至近似8kHz之頻率範圍的寬頻(WB)信號。在此實施例中,輸入信號130之低頻帶部分可對應於近似50Hz至近似6.4kHz之頻率範圍,且輸入信號130之高頻帶部分可對應於近似6.4kHz至近似8kHz之頻率範圍。
在特定實施例中,麥克風146可擷取輸入信號130,且在行動器件104處之類比至數位轉換器(ADC)可將經擷取輸入信號130自類比波形轉換成由數位音訊樣本組成之數位波形。數位音訊樣本可由數位信號處理器處理。增益調整器可藉由提高或降低音訊信號(例如,類比波形或數位波形)之振幅位準來調整增益(例如,類比波形或數位波形 之增益)。增益調整器可在類比抑或數位域中操作。舉例而言,增益調整器可在數位域中操作且可調整由類比至數位轉換器產生之數位音訊樣本。在增益調整之後,回音消除器可減小可已由揚聲器之輸出輸入麥克風146所產生的任何回音。數位音訊樣本可由聲碼器(語音編碼器-解碼器)「壓縮」。回音消除器之輸出可耦合至聲碼器預處理區塊,例如,濾波器、雜訊處理器、速率轉換器等。聲碼器之編碼器可壓縮數位音訊樣本且形成傳輸封包(數位音訊樣本之經壓縮位元之表示)。在特定實施例中,聲碼器之編碼器可包括激勵信號生成模組122。激勵信號生成模組122可生成高頻帶激勵信號186,如參考第一器件102所描述。激勵信號生成模組122可將高頻帶激勵信號186提供至高頻帶編碼器172。
高頻帶編碼器172可基於高頻帶激勵信號186編碼輸入信號130之高頻帶信號。舉例而言,高頻帶編碼器172可基於高頻帶激勵信號186生成高頻帶位元串流190。高頻帶位元串流190可包括高頻帶參數資訊。舉例而言,高頻帶位元串流190可包括以下中之至少一者:高頻帶線性預測寫碼(LPC)係數、高頻帶線譜頻率(LSF)、高頻帶線譜對(LSP)、增益形狀(例如,對應於特定訊框之子訊框之時間增益參數)、增益訊框(例如,對應於用於特定訊框之高頻帶與低頻帶之能量比率的增益參數)或對應於輸入信號130之高頻帶部分之其他參數。在特定實施例中,高頻帶編碼器172可使用向量量化器、隱式馬爾可夫模型(HMM)或高斯混合模型(GMM)中之至少一者判定高頻帶LPC係數。高頻帶編碼器172可基於LPC係數判定高頻帶LSF、高頻帶LSP或該兩者。
高頻帶編碼器172可基於輸入信號130之高頻帶信號生成高頻帶參數資訊。舉例而言,行動器件104之解碼器可模擬第一器件102之解碼器。行動器件104之解碼器可基於高頻帶激勵信號186生成合成音訊 信號,如參考第一器件102所描述。高頻帶編碼器172可基於合成音訊信號與輸入信號130之比較生成增益值(例如,增益形狀、增益訊框或該兩者)。舉例而言,增益值可對應於合成音訊信號與輸入信號130之間的差異。高頻帶編碼器172可將高頻帶位元串流190提供至MUX 174。
MUX 174可將高頻帶位元串流190與低頻帶位元串流進行組合以生成位元串流132。行動器件104之低頻帶編碼器可基於輸入信號130之低頻帶信號生成低頻帶位元串流。低頻帶位元串流可包括低頻帶參數資訊(例如,低頻帶LPC係數、低頻帶LSF或該兩者)及低頻帶激勵信號(例如,輸入信號130之低頻帶殘餘)。傳輸封包可對應於位元串流132。
傳輸封包可儲存在可與行動器件104之處理器共用的記憶體中。 處理器可為與數位信號處理器通信的控制處理器。行動器件104可經由網路120將位元串流132傳輸至第一器件102。舉例而言,傳輸器176可調變某一形式之傳輸封包(可將其他資訊附於該傳輸封包)且經由天線空中發送經調變資訊。
第一器件102之激勵信號生成模組122可接收位元串流132。舉例而言,第一器件102之天線可接收包含傳輸封包的某一形式之傳入封包。位元串流132可對應於脈碼調變(PCM)經編碼音訊信號之訊框。 舉例而言,在第一器件102處之類比至數位轉換器(ADC)可將位元串流132自類比信號轉換成具有多個訊框之數位PCM信號。
傳輸封包可「未由在第一器件102處之聲碼器之解碼器壓縮」。 未壓縮波形(或數位PCM信號)可被稱作重新建構之音訊樣本。重新建構之音訊樣本可由聲碼器後處理區塊後處理且可由回音消除器使用以移除回音。為清楚起見,聲碼器之解碼器及聲碼器後處理區塊可被稱作聲碼器解碼器模組。在一些組態中,回音消除器之輸出可由激勵信 號生成模組122處理。替代地,在其他組態中,聲碼器解碼器模組之輸出可由激勵信號生成模組122處理。
激勵信號生成模組122可自位元串流132提取低頻帶參數資訊、低頻帶激勵信號及高頻帶參數資訊。濁音分類器160可判定指示輸入信號130之濁音/清音性質(例如,強濁音、弱濁音、弱清音或強清音)之濁音分類180(例如,0.0至1.0之值),如參考圖2所描述。濁音分類器160可將濁音分類180提供至包封調整器162。
包封調整器162可判定輸入信號130之表示之包封。包封可為時變包封。舉例而言,包封可每輸入信號130之訊框更新超過一次。作為另一實例,可回應於接收輸入信號130之每一樣本的包封調整器162而更新包封。相比在濁音分類對應於強清音時,包封之形狀之變化程度在濁音分類180對應於強濁音時可更大。輸入信號130之表示可包括輸入信號130之(或輸入信號130之經編碼版本之)低頻帶激勵信號、輸入信號130之(或輸入信號130之經編碼版本之)高頻帶激勵信號或諧性擴展的激勵信號。舉例而言,激勵信號生成模組122可藉由擴展輸入信號130之(或輸入信號130之經編碼版本之)低頻帶激勵信號來生成諧性擴展之激勵信號。
包封調整器162可基於濁音分類180控制包封的量,如參考圖4至圖7所描述。包封調整器162可藉由控制包封之特性(例如,形狀、量值、增益及/或頻率範圍)來控制包封之量。舉例而言,包封調整器162可基於濾波器之截止頻率控制包封之頻率範圍,如參考圖4所描述。可基於濁音分類180判定截止頻率。
作為另一實例,包封調整器162可藉由基於濁音分類180調整高頻帶線性預測寫碼(LPC)係數之一或多個極點來控制包封之形狀、包封之量值、包封之增益或其組合,如參考圖5所描述。作為另一實例,包封調整器162可藉由基於濁音分類180調整濾波器之係數來控制 包封之形狀、包封之量值、包封之增益或其組合,如參考圖6所描述。可在變換域(例如,頻域)或時域中控制包封之特性,如參考圖4至圖6所描述。
包封調整器162可將信號包封182提供至調變器164。信號包封182可對應於輸入信號130之表示之包封的受控量。
調變器164可使用信號包封182來調變白雜訊156以生成經調變之白雜訊184。調變器164可將經調變之白雜訊184提供至輸出電路166。
輸出電路166可基於經調變之白雜訊184生成高頻帶激勵信號186。舉例而言,輸出電路166可組合經調變之白雜訊184與另一信號來生成高頻帶激勵信號186。在特定實施例中,另一信號可對應於基於低頻帶激勵信號生成之擴展信號。舉例而言,輸出電路166可藉由升取樣低頻帶激勵信號、對經升取樣信號應用絕對值函數、降取樣應用絕對值函數之結果及使用適應性白化來用線性預測濾波器(例如,四階線性預測濾波器)以頻譜方式平坦化經降取樣信號來生成擴展信號。在特定實施例中,輸出電路166可基於諧性參數縮放經調變之白雜訊184及另一信號,如參考圖4至圖7所描述。
在特定實施例中,輸出電路166可組合經調變之白雜訊之第一比率與未經調變之白雜訊之第二比率來生成經縮放之白雜訊,其中第一比率及第二比率係基於濁音分類180判定的,如參考圖7所描述。在此實施例中,輸出電路166可組合經縮放之白雜訊與另一信號來生成高頻帶激勵信號186。輸出電路166可將高頻帶激勵信號186提供至高頻帶合成器168。
高頻帶合成器168可基於高頻帶激勵信號186生成合成高頻帶信號188。舉例而言,高頻帶合成器168可基於特定高頻帶模型模型化及/或解碼高頻帶參數資訊,且可使用高頻帶激勵信號186來生成合成的高頻帶信號188。高頻帶合成器168可將合成高頻帶信號188提供至 MUX 170。
第一器件102之低頻帶解碼器可生成合成的低頻帶信號。舉例而言,低頻帶解碼器可基於特定低頻帶模型解碼及/或模型化低頻帶參數資訊,且可使用低頻帶激勵信號來生成合成的低頻帶信號。MUX 170可組合合成高頻帶信號188與合成低頻帶信號來生成輸出信號116(例如,經解碼音訊信號)。
輸出信號116可由增益調整器擴增或抑制。第一器件102可經由揚聲器142將輸出信號116提供至第二使用者154。舉例而言,增益調整器之輸出可藉由數位至類比轉換器自數位信號轉換成類比信號且經由揚聲器142放出。
由此,系統100可在合成音訊信號對應於清音(或強清音)輸入信號時使得能夠生成「平滑」發聲合成信號。可使用基於輸入信號之濁音分類調變之雜訊信號生成合成高頻帶信號。相比在輸入信號為強清音時,經調變之雜訊信號在輸入信號為強濁音時可更密切地對應於輸入信號。在特定實施例中,當輸入信號為強清音時,合成高頻帶信號可具有降低之稀疏性或不具有稀疏性,從而產生更平滑(例如,具有較少偽訊)之合成音訊信號。
參考圖2,揭示可操作以執行高頻帶激勵信號生成之解碼器之特定實施例,且大體上將其指定為200。在特定實施例中,解碼器200可對應於或包括於圖1之系統100中。舉例而言,解碼器200可包括於第一器件102、行動器件104或該兩者中。解碼器200可說明在接收器件(例如,第一器件102)處之經編碼音訊信號之解碼。
解碼器200包括耦接至低頻帶合成器204之解多工器(DEMUX)202、濁音因數產生器208及高頻帶合成器168。低頻帶合成器204及濁音因數產生器208可經由激勵信號產生器222耦接至高頻帶合成器168。在特定實施例中,濁音因數產生器208可對應於圖1之濁音分類 器160。激勵信號產生器222可為圖1之激勵信號生成模組122之特定實施例。舉例而言,激勵信號產生器222可包括包封調整器162、調變器164、輸出電路166、濁音分類器160或其組合。低頻帶合成器204及高頻帶合成器168可耦接至MUX 170。
在操作期間,DEMUX 202可接收位元串流132。位元串流132可對應於經脈碼調變(PCM)編碼之音訊信號之訊框。舉例而言,在第一器件102處之類比至數位轉換器(ADC)可將位元串流132自類比信號轉換成具有多個訊框之數位PCM信號。DEMUX 202可自位元串流132生成位元串流232之低頻帶部分及位元串流218之高頻帶部分。DEMUX 202可將位元串流232之低頻帶部分提供至低頻帶合成器204且可將位元串流218之高頻帶部分提供至高頻帶合成器168。
低頻帶合成器204可自位元串流232之低頻帶部分提取及/或解碼一或多個參數242(例如,輸入信號130之低頻帶參數資訊)及低頻帶激勵信號244(例如,輸入信號130之低頻帶殘餘)。在特定實施例中,低頻帶合成器204可自位元串流232之低頻帶部分提取諧性參數246。
諧性參數246可在位元串流232之編碼期間嵌入位元串流232之低頻帶部分中且可對應於輸入信號130之高頻帶中諧波與雜訊能量之比率。低頻帶合成器204可基於音調增益值判定諧性參數246。低頻帶合成器204可基於參數242判定音調增益值。在特定實施例中,低頻帶合成器204可自位元串流232之低頻帶部分提取諧性參數246。舉例而言,行動器件104可包括在位元串流132中之諧性參數246,如參考圖3所描述。
低頻帶合成器204可基於參數242及低頻帶激勵信號244使用特定低頻帶模型生成合成低頻帶信號234。低頻帶合成器204可將合成低頻帶信號234提供至MUX 170。
濁音因數產生器208可自低頻帶合成器204接收參數242。濁音因 數產生器208可基於參數242、先前濁音決策、一或多個其他因數或其組合生成濁音因數236(例如,0.0至1.0之值)。濁音因數236可指示輸入信號130之濁音/清音性質(例如,強濁音、弱濁音、弱清音或強清音)。參數242可包括輸入信號130之低頻帶信號之零交叉率、第一反射係數、低頻帶激勵中之適應性碼簿貢獻之能量與低頻帶激勵中適應性碼簿及固定碼簿貢獻之和之能量的比率、輸入信號130之低頻帶信號之音調增益或其組合。濁音因數產生器208可基於等式1判定濁音因數236。
濁音因數(Voicing Factor)=Σa i * p i +c, (等式1)
其中i {0,...,M-1},其中ai及c為權重,pi對應於特定經量測信號參數,且M對應於用於濁音因數判定之參數的數目。
在說明性實施例中,濁音因數(Voicing Factor)=-0.4231 * ZCR+0.2712 * FR+0.0458 * ACB_to_excitation+0.1849 * PG+0.0138 * prev_voicing_decision+0.0611,其中ZCR對應於零交叉速率,FR對應於第一反射係數,ACB_to_excitation對應於低頻帶激勵中適應性碼簿貢獻之能量與低頻帶激勵中適應性碼簿及固定碼簿貢獻之總和之能量的比率,PG對應於音調增益,且previous_voicing_decision對應於先前針對另一訊框計算之另一濁音因數。在特定實施例中,濁音因數產生器208可使用較高臨限值以用於將訊框分類為清音而非濁音。舉例而言,若將前述訊框分類為清音且該訊框具有滿足第一臨限值(例如,低臨限值)之濁音值,則濁音因數產生器208可將訊框分類為清音。濁音因數產生器208可基於以下各者判定濁音值:輸入信號130之低頻帶信號之零交叉速率、第一反射係數、低頻帶激勵中適應性碼簿貢獻之能量與低頻帶激勵中適應性碼簿及固定碼簿貢獻之總和之能量的比率、輸入信號130之低頻帶信號之音調增益或其組合。替代地,若訊框之濁音值滿足第二臨限值(例如,極低臨限值),則濁音因數產 生器208可將訊框分類為清音。在特定實施例中,濁音因數236可對應於圖1之濁音分類180。
激勵信號產生器222可自低頻帶合成器204接收低頻帶激勵信號244及諧性參數246,且可自濁音因數產生器208接收濁音因數236。激勵信號產生器222可基於低頻帶激勵信號244、諧性參數246及濁音因數236生成高頻帶激勵信號186,如參考圖1及圖4至圖7所描述。舉例而言,包封調整器162可基於濁音因數236控制低頻帶激勵信號244之包封的量,如參考圖1及圖4至圖7所描述。在特定實施例中,信號包封182可對應於包封之受控量。包封調整器162可將信號包封182提供至調變器164。
調變器164可使用信號包封182調變白雜訊156以生成經調變之白雜訊184,如參考圖1及圖4至圖7所描述。調變器164可將經調變之白雜訊184提供至輸出電路166。
輸出電路166可藉由組合經調變之白雜訊184及另一信號來生成高頻帶激勵信號186,如參考圖1及圖4至圖7所描述。在特定實施例中,輸出電路166可基於諧性參數246組合經調變白雜訊184及另一信號,如參考圖4至圖7所描述。
輸出電路166可將高頻帶激勵信號186提供至高頻帶合成器168。 高頻帶合成器168可基於高頻帶激勵信號186及位元串流218之高頻帶部分將合成高頻帶信號188提供至MUX 170。舉例而言,高頻帶合成器168可自位元串流218之高頻帶部分提取輸入信號130之高頻帶參數。高頻帶合成器168可使用高頻帶參數及高頻帶激勵信號186來基於特定高頻帶模型生成合成之高頻帶信號188。在特定實施例中,MUX 170可組合合成低頻帶信號234及合成高頻帶信號188來生成輸出信號116。
因此,當合成音訊信號對應於清音(或強清音)輸入信號時,圖2 之解碼器200可使得能夠生成「平滑」發聲合成信號。可使用基於輸入信號之濁音分類而調變之雜訊信號生成合成的高頻帶信號。相比在輸入信號為強清音時,經調變之雜訊信號在輸入信號為強濁音時可更密切地對應於輸入信號。在特定實施例中,當輸入信號為強清音時,合成高頻帶信號可具有降低之稀疏性或不具有稀疏性,從而產生更平滑(例如,具有較少偽訊)之合成音訊信號。另外,基於先前濁音決策判定濁音分類(或濁音因數)可減輕訊框之錯分類之效應且可產生濁音訊框與清音訊框之間的更平滑轉變。
參考圖3,揭示可操作以執行高頻帶激勵信號生成之編碼器之特定實施例,且大體上將其指定為300。在特定實施例中,編碼器300可對應於或包括於圖1之系統100中。舉例而言,編碼器300可包括於第一器件102、行動器件104或該兩者中。編碼器300可說明在傳輸器件(例如,行動器件104)處之音訊信號之編碼。
編碼器300包括耦接至低頻帶編碼器304、濁音因數產生器208及高頻帶編碼器172之濾波器組302。低頻帶編碼器304可耦接至MUX 174。低頻帶編碼器304及濁音因數產生器208可經由激勵信號產生器222耦接至高頻帶編碼器172。高頻帶編碼器172可耦接至MUX 174。
在操作期間,濾波器組302可接收輸入信號130。舉例而言,輸入信號130可經由麥克風146由圖1之行動器件104接收。濾波器組302可將輸入信號130分離成包括低頻帶信號334及高頻帶信號340之多個信號。舉例而言,濾波器組302可使用對應於輸入信號130之較低頻率子頻帶(例如,50Hz至7kHz)之低通濾波器生成低頻帶信號334且可使用對應於輸入信號130之較高頻率子頻帶(例如,7kHz至16kHz)之高通濾波器生成高頻帶信號340。濾波器組302可將低頻帶信號334提供至低頻帶編碼器304且可將高頻帶信號340提供至高頻帶編碼器172。
低頻帶編碼器304可基於低頻帶信號334生成參數242(例如,低頻 帶參數資訊)及低頻帶激勵信號244。舉例而言,參數242可包括低頻帶LPC係數、低頻帶LSF、低頻帶線譜對(LSP)或其組合。低頻帶激勵信號244可對應於低頻帶殘餘信號。低頻帶編碼器304可基於特定低頻帶模型(例如,特定線性預測模型)生成參數242及低頻帶激勵信號244。舉例而言,低頻帶編碼器304可生成低頻帶信號334之參數242(例如,對應於共振峰之濾波器係數),可基於參數242對低頻帶信號334進行反向濾波,及可自低頻帶信號334減去該反向濾波之信號來生成低頻帶激勵信號244(例如,低頻帶信號334之低頻帶殘餘信號)。 低頻帶編碼器304可生成包括參數242及低頻帶激勵信號244之低頻帶位元串流342。在特定實施例中,低頻帶位元串流342可包括諧性參數246。舉例而言,低頻帶編碼器304可判定諧性參數246,如參考圖2之低頻帶合成器204所描述。
低頻帶編碼器304可將參數242提供至濁音因數產生器208且可將低頻帶激勵信號244及諧性參數246提供至激勵信號產生器222。濁音因數產生器208可基於參數242判定濁音因數236,如參考圖2所描述。 激勵信號產生器222可基於低頻帶激勵信號244、諧性參數246及濁音因數236判定高頻帶激勵信號186,如參考圖2及圖4至圖7所描述。
激勵信號產生器222可將高頻帶激勵信號186提供至高頻帶編碼器172。高頻帶編碼器172可基於高頻帶信號340及高頻帶激勵信號186生成高頻帶位元串流190,如參考圖1所描述。高頻帶編碼器172可將高頻帶位元串流190提供至MUX 174。MUX 174可組合低頻帶位元串流342與高頻帶位元串流190來生成位元串流132。
因此,編碼器300可使得能夠模擬在接收器件處之解碼器,該解碼器使用基於輸入信號之濁音分類而調變之雜訊信號來生成合成音訊信號。編碼器300可生成高頻帶參數(例如,增益值),該等參數用於生成密切近似輸入信號130之合成音訊信號。
圖4至圖7為說明高頻帶激勵信號生成之方法之特定實施例的圖。可由圖1至圖3之系統100至300之一或多個組件執行圖4至圖7之方法中之每一者。舉例而言,可由圖1之高頻帶激勵信號生成模組122之一或多個組件、圖2及/或圖3之激勵信號產生器222、圖2之濁音因數產生器208或其組合執行圖4至圖7之方法中之每一者。圖4至圖7說明生成在變換域中、在時域中或在變換域抑或時域中表示之高頻帶激勵信號的方法之替代實施例。
參考圖4,展示高頻帶激勵信號生成之方法之特定實施例之圖,且大體上將其指定為400。方法400可對應於生成在變換域抑或時域中表示之高頻帶激勵信號。
方法400包括在404處判定濁音因數。舉例而言,圖2之濁音因數產生器208可基於代表性信號422判定濁音因數236。在特定實施例中,濁音因數產生器208可基於一或多個其他信號參數判定濁音因數236。在特定實施例中,若干信號參數可組合起作用來判定濁音因數236。舉例而言,濁音因數產生器208可基於位元串流232之低頻帶部分(或圖3之低頻帶信號334)、參數242、先前濁音決策、一或多個其他因數或其組合來判定濁音因數236,如參考圖2至圖3所描述。代表性信號422可包括位元串流232之低頻帶部分、低頻帶信號334或藉由擴展低頻帶激勵信號244生成之擴展信號。可在變換(例如,頻率)域或時域中表示代表性信號422。舉例而言,激勵信號生成模組122可藉由對輸入信號130、圖1之位元串流132、位元串流232之低頻帶部分、低頻帶信號334、藉由擴展圖2之低頻帶激勵信號244生成之擴展信號或其組合應用變換(例如,傅立葉變換)來生成代表性信號422。
方法400亦包括在408處計算低通濾波器(LPF)截止頻率,及在410處控制信號包封的量。舉例而言,圖1之包封調整器162可基於濁音因數236計算LPF截止頻率426。若濁音因數236指示強濁音音訊,則LPF 截止頻率426可較高,指示時間包封之諧波分量之較高影響。當濁音因數236指示強清音音訊時,LPF截止頻率426可較低,對應於時間包封之諧波分量之較低(或無)影響。
包封調整器162可藉由控制信號包封182之特性(例如,頻率範圍)來控制信號包封182之量。舉例而言,包封調整器162可藉由將低通濾波器450應用於代表性信號422來控制信號包封182之特性。低通濾波器450之截止頻率可實質上等於LPF截止頻率426。包封調整器162可藉由基於LPF截止頻率426追蹤代表性信號422之時間包封來控制信號包封182之頻率範圍。舉例而言,低通濾波器450可對代表性信號422進行濾波,使得經濾波信號具有由LPF截止頻率426定義之頻率範圍。為了說明,經濾波信號之頻率範圍可低於LPF截止頻率426。在特定實施例中,經濾波信號可具有與低於LPF截止頻率426之代表性信號422之振幅匹配的振幅且可具有高於LPF截止頻率426之低振幅(例如,實質上等於0)。
曲線圖470說明原始頻譜形狀482。原始頻譜形狀482可表示代表性信號422之信號包封182。第一頻譜形狀484可對應於藉由將具有LPF截止頻率426之濾波器應用於代表性信號422而生成之經濾波信號。
LPF截止頻率426可判定追蹤速度。舉例而言,相比在濁音因數236指示清音時,在濁音因數236指示濁音時可更快地追蹤(例如,更頻繁地更新)時間包封。在特定實施例中,包封調整器162可控制時域中之信號包封182之特性。舉例而言,包封調整器162可逐個樣本控制信號包封182之特性。在替代實施例中,包封調整器162可控制在變換域中表示之信號包封182之特性。舉例而言,包封調整器162可藉由基於追蹤速度追蹤頻譜形狀來控制信號包封182之特性。包封調整器162可將信號包封182提供至圖1之調變器164。
方法400進一步包括在412處將信號包封182與白雜訊156相乘。舉例而言,圖1之調變器164可使用信號包封182來調變白雜訊156以生成經調變之白雜訊184。信號包封182可調變在變換域或時域中表示之白雜訊156。
方法400亦包括在406處決定混合。舉例而言,圖1之調變器164可基於諧性參數246及濁音因數236判定待應用於經調變白雜訊184之第一增益(例如,雜訊增益434)及待應用於代表性信號422之第二增益(例如,諧波增益436)。舉例而言,可計算雜訊增益434(例如,介於0與1之間)及諧波增益436來匹配由諧性參數246所指示的諧波與雜訊能量之比率。調變器164在濁音因數236指示強清音時可增大雜訊增益434且在濁音因數236指示強濁音時可減小雜訊增益434。在特定實施例中,調變器164可基於雜訊增益434判定諧波增益436。在特定實施 例中,諧波增益436=
方法400進一步包括在414處將經調變白雜訊184及雜訊增益434相乘。舉例而言,圖1之輸出電路166可藉由將雜訊增益434應用於對經調變之白雜訊184來生成經縮放之經調變白雜訊438。
方法400亦包括在416處將代表性信號422及諧波增益436相乘。舉例而言,圖1之輸出電路166可藉由將諧波增益436應用於代表性信號422來生成經縮放之代表性信號440。
方法400進一步包括在418處將經縮放之經調變白雜訊438與經縮放之代表性信號440相加。舉例而言,圖1之輸出電路166可藉由將經縮放之經調變白雜訊438與經縮放之代表性信號440組合(例如,相加)來生成高頻帶激勵信號186。在替代實施例中,可由圖1之調變器164執行操作414、操作416或該兩者。高頻帶激勵信號186可在變換域或時域中。
因此,方法400可使得信號包封的量能夠藉由基於濁音因數236控制包封之特性來控制。在特定實施例中,可基於諧性參數246藉由增益因數(例如,雜訊增益434及諧波增益436)動態地判定經調變白雜訊184及代表性信號422之比例。可縮放經調變之白雜訊184及代表性信號422,使得高頻帶激勵信號186之諧波與雜訊能量之比率近似輸入信號130之高頻帶信號之諧波與雜訊能量之比率。
在特定實施例中,可經由處理單元(諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)、經由韌體器件或其任何組合來實施圖4之方法400。作為一實例,可由執行指令之處理器(如關於圖9所描述)執行圖4之方法400。
參考圖5,展示高頻帶激勵信號生成之方法之特定實施例的圖,且大體上將其指定為500。方法500可包括藉由控制在變換域中表示之信號包封的量、調變在變換域中表示之白雜訊或該兩者來生成高頻帶激勵信號。
方法500包括方法400之操作404、406、412及414。可在變換(例如,頻率)域中表示代表性信號422,如參考圖4所描述。
方法500亦包括在508處計算頻寬擴張因數。舉例而言,圖1之包封調整器162可基於濁音因數236判定頻寬擴張因數526。舉例而言,相比在濁音因數236指示強清音時,頻寬擴張因數526在濁音因數236指示強濁音時可指示更大頻寬擴張。
方法500進一步包括在510處藉由調整高頻帶LPC極點生成頻譜。 舉例而言,包封調整器162可判定與代表性信號422相關聯的LPC極點。包封調整器162可藉由控制信號包封182之量值、信號包封182之形狀、信號包封182之增益或其組合來控制信號包封182之特性。舉例而言,包封調整器162可藉由基於頻寬擴張因數526調整LPC極點來控 制信號包封182之量值、信號包封182之形狀、信號包封182之增益或其組合。在特定實施例中,可在變換域中調整LPC極點。包封調整器162可基於經調整LPC極點生成頻譜。
曲線圖570說明原始頻譜形狀582。原始頻譜形狀582可表示代表性信號422之信號包封182。可基於與代表性信號422相關聯的LPC極點生成原始頻譜形狀582。包封調整器162可基於濁音因數236調整LPC極點。包封調整器162可將對應於經調整LPC極點之濾波器應用於代表性信號422來生成具有第一頻譜形狀584或第二頻譜形狀586之經濾波信號。當濁音因數236指示強濁音時,經濾波信號之第一頻譜形狀584可對應於經調整LPC極點。當濁音因數236指示強清音時,經濾波信號之第二頻譜形狀586可對應於經調整LPC極點。
信號包封182可對應於所生成頻譜、經調整LPC極點、與具有經調整LPC極點之代表性信號422相關聯的LPC係數或其組合。包封調整器162可將信號包封182提供至圖1之調變器164。
調變器164可使用信號包封182調變白雜訊156來生成經調變白雜訊184,如參考方法400之操作412所描述。調變器164可調變在變換域中表示之白雜訊156。圖1之輸出電路166可基於經調變之白雜訊184及雜訊增益434生成經縮放之經調變白雜訊438,如參考方法400之操作414所描述。
方法500亦包括在512處將高頻帶LPC頻譜542及代表性信號422相乘。舉例而言,圖1之輸出電路166可使用高頻帶LPC頻譜542對代表性信號422進行濾波來生成經濾波信號544。在特定實施例中,輸出電路166可基於與代表性信號422相關聯的高頻帶參數(例如,高頻帶LPC係數)來判定高頻帶LPC頻譜542。為了說明,輸出電路166可基於圖2之位元串流218之高頻帶部分或基於自圖3之高頻帶信號340生成之高頻帶參數資訊來判定高頻帶LPC頻譜542。
代表性信號422可對應於自圖2之低頻帶激勵信號244生成之擴展信號。輸出電路166可使用高頻帶LPC頻譜542合成擴展信號來生成經濾波信號544。合成可在變換域中進行。舉例而言,輸出電路166可使用頻域中之倍增執行合成。
方法500進一步包括在516處將經濾波信號544及諧波增益436相乘。舉例而言,圖1之輸出電路166可將經濾波信號544與諧波增益436相乘來生成經縮放之經濾波信號540。在特定實施例中,可由圖1之調變器164執行操作512、操作516或該兩者。
方法500亦包括在518處將經縮放之經調變白雜訊438與經縮放之經濾波信號540相加。舉例而言,圖1之輸出電路166可組合經縮放之經調變白雜訊438及經縮放之經濾波信號540來生成高頻帶激勵信號186。可在變換域中表示高頻帶激勵信號186。
因此,方法500可使得信號包封的量能夠藉由基於濁音因數236在變換域中調整高頻帶LPC極點而控制。在特定實施例中,可基於諧性參數246藉由增益(例如,雜訊增益434及諧波增益436)動態地判定經調變白雜訊184與經濾波信號544之比例。可縮放經調變之白雜訊184及經濾波信號544,使得高頻帶激勵信號186之諧波與雜訊能量之比率近似輸入信號130之高頻帶信號之諧波與雜訊能量之比率。
在特定實施例中,可經由處理單元(諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)、經由韌體器件或其任何組合來實施圖5之方法500。作為一實例,可由執行指令之處理器(如關於圖9所描述)執行圖5之方法500。
參考圖6,展示高頻帶激勵信號生成之方法之特定實施例的圖,且大體上將其指定為600。方法600可包括藉由控制時域中之信號包封的量來生成高頻帶激勵信號。
方法600包括方法400之操作404、406及414及方法500之操作508。代表性信號422及白雜訊156可在時域中。
方法600亦包括在610處執行LPC合成。舉例而言,圖1之包封調整器162可藉由基於頻寬擴張因數526調整濾波器之係數來控制信號包封182之特性(例如,形狀、量值及/或增益)。在特定實施例中,可在時域中執行LPC合成。濾波器之係數可對應於高頻帶LPC係數。LPC濾波器係數可表示頻譜峰值。藉由調整LPC濾波器係數控制頻譜峰值可使得能夠基於濁音因數236控制白雜訊156之調變之程度。
舉例而言,當濁音因數236指示濁音話音時,可保持頻譜峰值。 作為另一實例,當濁音因數236指示清音話音時可平滑化頻譜峰值,同時保持整體頻譜形狀。
曲線圖670說明原始頻譜形狀682。原始頻譜形狀682可表示代表性信號422之信號包封182。可基於與代表性信號422相關聯的LPC濾波器係數生成原始頻譜形狀682。包封調整器162可基於濁音因數236調整LPC濾波器係數。包封調整器162可將對應於經調整LPC濾波器係數之濾波器應用於代表性信號422來生成具有第一頻譜形狀684或第二頻譜形狀686之經濾波信號。當濁音因數236指示強濁音時,經濾波信號之第一頻譜形狀684可對應於經調整LPC濾波器係數。當濁音因數236指示強濁音時,可保持頻譜峰值,如藉由第一頻譜形狀684所說明。當濁音因數236指示強清音時,第二頻譜形狀686可對應於經調整的LPC濾波器係數。當濁音因數236指示強清音時,可保持整體頻譜形狀,同時可平滑化頻譜峰值,如藉由第二頻譜形狀686所說明。信號包封182可對應於經調整濾波器係數。包封調整器162可將信號包封182提供至圖1之調變器164。
調變器164可使用信號包封182(例如,經調整濾波器係數)調變白雜訊156以生成經調變白雜訊184。舉例而言,調變器164可將濾波器 應用於白雜訊156以生成經調變白雜訊184,其中濾波器具有經調整的濾波器係數。調變器164可將經調變之白雜訊184提供至圖1之輸出電路166。輸出電路166可將經調變白雜訊184與雜訊增益434相乘來生成經縮放之經調變白雜訊438,如參考圖4之操作414所描述。
方法600進一步包括在612處執行高頻帶LPC合成。舉例而言,圖1之輸出電路166可合成代表性信號422來生成合成高頻帶信號614。可在時域中執行合成。在特定實施例中,可藉由擴展低頻帶激勵信號來生成代表性信號422。輸出電路166可藉由將使用高頻帶LPC之合成濾波器應用於代表性信號422來生成合成的高頻帶信號614。
方法600亦包括在616處將合成之高頻帶信號614與諧波增益436相乘。舉例而言,圖1之輸出電路166可將諧波增益436應用於合成之高頻帶信號614來生成經縮放之合成高頻帶信號640。在替代實施例中,圖1之調變器164可執行操作612、操作616或該兩者。
方法600進一步包括在618處將經縮放之經調變白雜訊438與經縮放之合成高頻帶信號640相加。舉例而言,圖1之輸出電路166可組合經縮放之經調變白雜訊438及經縮放之合成高頻帶信號640來生成高頻帶激勵信號186。
因此,方法600可使得信號包封的量能夠藉由基於濁音因數236調整濾波器之係數而控制。在特定實施例中,可基於濁音因數236動態地判定經調變白雜訊184與合成高頻帶信號614之比例。可縮放經調變之白雜訊184及合成之高頻帶信號614,使得高頻帶激勵信號186之諧波與雜訊能量之比率近似輸入信號130之高頻帶信號之諧波與雜訊能量之比率。
在特定實施例中,可經由處理單元(諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)、經由韌體器件或其任何 組合來實施圖6之方法600。作為一實例,可由執行指令之處理器(如關於圖9所描述)執行圖6之方法600。
參考圖7,展示高頻帶激勵信號生成之方法之特定實施例的圖,且大體上將其指定為700。方法700可對應於藉由控制在時域或變換(例如,頻率)域中表示之信號包封的量來生成高頻帶激勵信號。
方法700包括方法400之操作404、406、412、414及416。可在變換域或時域中表示代表性信號422。方法700亦包括在710處判定信號包封。舉例而言,圖1之包封調整器162可藉由將具有恆定係數之低通濾波器應用於代表性信號422來生成信號包封182。
方法700亦包括在702處判定均方根值。舉例而言,圖1之調變器164可判定信號包封182之均方根能量。
方法700進一步包括在712處將均方根值與白雜訊156相乘。舉例而言,圖1之輸出電路166可將均方根值與白雜訊156相乘以生成未經調變之白雜訊736。
圖1之調變器164可將信號包封182與白雜訊156相乘以生成經調變之白雜訊184,如參考方法400之操作412所描述。可在變換域或時域中表示白雜訊156。
方法700亦包括在704處判定經調變及未經調變之白雜訊之增益比例。舉例而言,圖1之輸出電路166可基於雜訊增益434及濁音因數236判定未經調變之雜訊增益734及經調變之雜訊增益732。若濁音因數236指示經編碼之音訊信號對應於強濁音音訊,則經調變之雜訊增益732可對應於較高比例之雜訊增益434。若濁音因數236指示經編碼之音訊信號對應於強清音音訊,則未經調變之雜訊增益734可對應於較高比例之雜訊增益434。
方法700進一步包括在714處將未經調變之雜訊增益734及未經調變白雜訊736相乘。舉例而言,圖1之輸出電路166可將未經調變之雜 訊增益734應用於未經調變之白雜訊736來生成經縮放之未經調變的白雜訊742。
輸出電路166可將經調變雜訊增益732應用於經調變之白雜訊184來生成經縮放之經調變白雜訊740,如參考方法400之操作414所描述。
方法700亦包括在716處將經縮放之未經調變之白雜訊742與經縮放之白雜訊744相加。舉例而言,圖1之輸出電路166可組合經縮放之未經調變之白雜訊742與經縮放之經調變白雜訊740來生成經縮放之白雜訊744。
方法700進一步包括在718處將經縮放之白雜訊744與經縮放之代表性信號440相加。舉例而言,輸出電路166可組合經縮放之白雜訊744與經縮放之代表性信號440來生成高頻帶激勵信號186。方法700可使用在變換(或時間)域中表示之代表性信號422及白雜訊156生成在變換(或時間)域中表示之高頻帶激勵信號186。
因此,方法700可使得未經調變之白雜訊736及經調變之白雜訊184之比例能夠基於濁音因數236藉由增益因數(例如,未經調變之雜訊增益734及經調變之雜訊增益732)而動態地判定。相比對應於基於經稀疏寫碼之低頻帶殘餘調變之白雜訊的高頻帶信號,用於強清音音訊之高頻帶激勵信號186可對應於具有較少偽訊之未經調變的白雜訊。
在特定實施例中,可經由處理單元(諸如中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)、經由韌體器件或其任何組合來實施圖7之方法700。作為一實例,可由執行指令之處理器(如關於圖9所描述)執行圖7之方法700。
參考圖8,展示高頻帶激勵信號生成之方法之特定實施例的流程 圖,且大體上將其指定為800。可由圖1至圖3之系統100至300之一或多個組件執行方法800。舉例而言,可藉由圖1之高頻帶激勵信號生成模組122之一或多個組件、圖2或圖3之激勵信號產生器222、圖2之濁音因數產生器208或其組合執行方法800。
方法800包括在802處在器件處判定輸入信號之濁音分類。該輸入信號可對應於音訊信號。舉例而言,圖1之濁音分類器160可判定輸入信號130之濁音分類180,如參考圖1所描述。輸入信號130可對應於音訊信號。
方法800亦包括在804處基於濁音分類控制輸入信號之表示之包封的量。舉例而言,圖1之包封調整器162可基於濁音分類180控制輸入信號130之表示之包封的量,如參考圖1所描述。輸入信號130之表示可為位元串流(例如,圖2之位元串流232)之低頻帶部分、低頻帶信號(例如,圖3之低頻帶信號334)、藉由擴展低頻帶激勵信號(例如,圖2之低頻帶激勵信號244)生成之擴展信號、另一信號或其組合。舉例而言,輸入信號130之表示可包括圖4至圖7之代表性信號422。
方法800進一步包括在806處基於包封之受控量調變白雜訊信號。舉例而言,圖1之調變器164可基於信號包封182調變白雜訊156。 信號包封182可對應於包封之受控量。為了說明,調變器164可調變時域中之白雜訊156,諸如圖4及圖6至圖7中。替代地,調變器164可調變在變換域中表示之白雜訊156,諸如圖4至圖7中。
方法800亦包括在808處基於經調變之白雜訊信號生成高頻帶激勵信號。舉例而言,圖1之輸出電路166可基於經調變之白雜訊184生成高頻帶激勵信號186,如參考圖1所描述。
因此,圖8之方法800可使得能夠基於輸入信號之包封之受控量生成高頻帶激勵信號,其中基於濁音分類控制包封之量。
在特定實施例中,可經由處理單元(諸如中央處理單元(CPU)、數 位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)、經由韌體器件或其任何組合來實施圖8之方法800。作為一實例,可由執行指令之處理器(如關於圖9所描述)執行圖8之方法800。
儘管圖1至圖8之實施例描述基於低頻帶信號生成高頻帶激勵信號,但在其他實施例中,可對輸入信號130進行濾波以產生多個頻帶信號。舉例而言,多個頻帶信號可包括較低頻帶信號、中等頻帶信號、較高頻帶信號、一或多個額外頻帶信號,或其組合。中等頻帶信號可對應於比較低頻帶信號更高之頻率範圍,且較高頻帶信號可對應於比中等頻帶信號更高之頻率範圍。較低頻帶信號及中等頻帶信號可對應於重疊或非重疊頻率範圍。中等頻帶信號及較高頻帶信號可對應於重疊或非重疊頻率範圍。
激勵信號生成模組122可使用第一頻帶信號(例如,較低頻帶信號或中等頻帶信號)來生成對應於第二頻帶信號(例如,中等頻帶信號或較高頻帶信號)之激勵信號,其中第一頻帶信號對應於比第二頻帶信號更低之頻率範圍。
在特定實施例中,激勵信號生成模組122可使用第一頻帶信號來生成對應於多個頻帶信號之多個激勵信號。舉例而言,激勵信號生成模組122可使用較低頻帶信號來生成對應於中等頻帶信號之中等頻帶激勵信號、對應於較高頻帶信號之較高頻帶激勵信號、一或多個額外頻帶激勵信號,或其組合。
參考圖9,描繪器件(例如,無線通信器件)之特定說明性實施例之方塊圖,且大體上將其指定為900。在各種實施例中,器件900可具有比圖9中所說明的更少或更多之組件。在說明性實施例中,器件900可對應於圖1之行動器件104或第一器件102。在說明性實施例中,器件900可根據圖4至圖8之方法400至800中之一或多者操作。
在特定實施例中,器件900包括處理器906(例如,中央處理單元(CPU))。器件900可包括一或多個額外處理器910(例如,一或多個數位信號處理器(DSP))。處理器910可包含話音及音樂寫碼解碼器(編解碼器)908及回音消除器912。話音及音樂編解碼器908可包括圖1之激勵信號生成模組122、激勵信號產生器222、圖2之濁音因數產生器208、聲碼器編碼器936、聲碼器解碼器938,或聲碼器編碼器936及聲碼器解碼器938兩者。在特定實施例中,聲碼器編碼器936可包括圖1之高頻帶編碼器172、圖3之低頻帶編碼器304或該兩者。在特定實施例中,聲碼器解碼器938可包括圖1之高頻帶合成器168、圖2之低頻帶合成器204或該兩者。
如所說明,激勵信號生成模組122、濁音因數產生器208及激勵信號產生器222可為可由聲碼器編碼器936及聲碼器解碼器938存取之共用組件。在其他實施例中,激勵信號生成模組122、濁音因數產生器208及/或激勵信號產生器222中之一或多者可包括於聲碼器編碼器936及聲碼器解碼器938中。
儘管將話音及音樂編解碼器908圖示為處理器910之組件(例如,專用電路及/或可執行程式碼),但在其他實施例中,話音及音樂編解碼器908之一或多個組件(諸如激勵信號生成模組122)可包括於處理器906、編解碼器934、另一處理組件或其組合中。
器件900可包括記憶體932及編解碼器934。器件900可包括經由收發器950耦接至天線942之無線控制器940。器件900可包括耦接至顯示控制器926之顯示器928。揚聲器948、麥克風946或該兩者可耦接至編解碼器934。在特定實施例中,揚聲器948可對應於圖1之揚聲器142。在特定實施例中,麥克風946可對應於圖1之麥克風146。編解碼器934可包括數位至類比轉換器(DAC)902及類比至數位轉換器(ADC)904。
在特定實施例中,編解碼器934可自麥克風946接收類比信號,使用類比至數位轉換器904將類比信號轉換成數位信號,及將數位信號提供至話音及音樂編解碼器908(諸如以脈碼調變(PCM)格式)。話音及音樂編解碼器908可處理數位信號。在特定實施例中,話音及音樂編解碼器908可將數位信號提供至編解碼器934。編解碼器934可使用數位至類比轉換器902將數位信號轉換成類比信號且可將類比信號提供至揚聲器948。
記憶體932可包括可由器件900之處理器906、處理器910、編解碼器934、另一處理單元或其組合執行以執行本文中所揭示之方法及處理程序(諸如,圖4至圖8之方法400至800中之一或多者)的指令956。
可經由專用硬體(例如,電路)藉由執行指令以執行一或多個任務之處理器或其組合來實施系統100至300之一或多個組件。作為一實例,記憶體932或處理器906、處理器910及/或編解碼器934之一或多個組件可為記憶體器件,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體器件可包括在由電腦(例如,編解碼器934中之處理器、處理器906及/或處理器910)執行時可引起電腦執行圖4至圖8之方法400至800中之一或多者的至少一部分的指令(例如,指令956)。作為一實例,記憶體932或處理器906、處理器910、編解碼器934之一或多個組件可為非暫時性電腦可讀媒體,其包括在由電腦(例如,編解碼器934中之處理器、處理器906及/或處理器910)執行時引起電腦執行圖4至圖8之方法400至800中之一或多者的至少一部分的指令(例 如,指令956)。
在特定實施例中,器件900可包括於系統級封裝或系統單晶片器件(例如,行動台數據機(MSM))922中。在特定實施例中,處理器906、處理器910、顯示控制器926、記憶體932、編解碼器934、無線控制器940及收發器950包括於系統級封裝或系統單晶片器件922中在特定實施例中,輸入器件930(諸如觸控式螢幕及/或小鍵盤)及電力供應器944耦接至系統單晶片器件922。此外,在特定實施例中,如圖9中所說明,顯示器928、輸入器件930、揚聲器948、麥克風946、天線942及電力供應器944在系統單晶片器件922外部。然而,顯示器928、輸入器件930、揚聲器948、麥克風946、天線942及電力供應器944中之每一者可耦接至系統單晶片器件922之組件,諸如介面或控制器。
器件900可包括行動通信裝置、智慧型電話、蜂巢式電話、膝上型電腦、電腦、平板電腦、個人數位助理、顯示器件、電視、遊戲控制台、音樂播放器、收音機、數位視訊播放器、數位影音光碟(DVD)播放器、調諧器、攝影機、導航器件、解碼器系統、編碼器系統或其任何組合。
在說明性實施例中,處理器910可為可操作的以執行參考圖1至圖8所描述之方法或操作之全部或一部分。舉例而言,麥克風946可擷取音訊信號(例如,圖1之輸入信號130)。ADC 904可將所擷取音訊信號自類比波形轉換成由數位音訊樣本組成之數位波形。處理器910可處理數位音訊樣本。增益調整器可調整數位音訊樣本。回音消除器912可減少可已由揚聲器948之輸出輸入麥克風946所產生的回音。
聲碼器編碼器936可壓縮對應於經處理話音信號之數位音訊樣本且可形成傳輸封包(例如,數位音訊樣本之經壓縮位元之表示)。舉例而言,傳輸封包可對應於圖1之位元串流132之至少一部分。傳輸封包可儲存在記憶體932中。收發器950可調變某一形式之傳輸封包(例 如,可將其他資訊隨附於該傳輸封包)且可經由天線942傳輸經調變資料。
作為另一實例,天線942可接收包括接收封包之傳入封包。可由另一器件經由網路發送接收封包。舉例而言,接收封包可對應於圖1之位元串流132之至少一部分。聲碼器解碼器938可解壓縮接收封包。 經解壓縮波形可被稱作重新建構之音訊樣本。回音消除器912可移除來自經重新建構之音訊樣本之回音。
執行話音及音樂編解碼器908之處理器910可生成高頻帶激勵信號186,如參考圖1至圖8所描述。處理器910可基於高頻帶激勵信號186生成圖1之輸出信號116。增益調整器可擴增或抑制輸出信號116。 DAC 902可將輸出信號116自數位波形轉換成類比波形且可將經轉換信號提供至揚聲器948。
結合所描述的實施例,揭示一種包括用於判定輸入信號之濁音分類的構件的裝置。輸入信號可對應於音訊信號。舉例而言,用於判定濁音分類之構件可包括圖1之濁音分類器160、經組態以判定輸入信號之濁音分類之一或多個器件(例如,執行在非暫時性電腦可讀儲存媒體處之指令的處理器)或其任何組合。
舉例而言,濁音分類器160可判定參數242,該等參數包括輸入信號130之低頻帶信號之零交叉率、第一反射係數、低頻帶激勵中之適應性碼簿貢獻之能量與低頻帶激勵中之適應性碼簿及固定碼簿貢獻之總和之能量的比率、輸入信號130之低頻帶信號之音調增益或其組合。在特定實施例中,濁音分類器160可基於圖3之低頻帶信號334判定參數242。在替代實施例中,濁音分類器160可自圖2之位元串流232之低頻帶部分提取參數242。
濁音分類器160可基於等式判定濁音分類180(例如,濁音因數236)。舉例而言,濁音分類器160可基於等式1及參數242判定濁音分 類180。為了說明,濁音分類器160可藉由計算零交叉率、第一反射係數、能量比率、音調增益、先前濁音決策、恆定值或其組合之加權總和來判定濁音分類180,如參考圖4所描述。
裝置亦包括用於基於濁音分類控制輸入信號之表示之包封的量的構件。舉例而言,用於控制包封之量的構件可包括圖1之包封調整器162、經組態以基於濁音分類控制輸入信號之表示之包封之量的一或多個器件(例如,執行在非暫時性電腦可讀儲存媒體處之指令的處理器)或其任何組合。
舉例而言,包封調整器162可藉由將圖1之濁音分類180(例如圖2之濁音因數236)乘以截止頻率縮放因數來生成頻率濁音分類。截止頻率縮放因數可為預設值。LPF截止頻率426可對應於預設截止頻率。 包封調整器162可藉由調整LPF截止頻率426來控制信號包封182的量,如參考圖4所描述。舉例而言,包封調整器162可藉由將頻率濁音分類與LPF截止頻率426相加來調整LPF截止頻率426。
作為另一實例,包封調整器162可藉由將圖1之濁音分類180(例如,圖2之濁音因數236)乘以頻寬縮放因數來生成頻寬擴張因數526。 包封調整器162可判定與代表性信號422相關聯的高頻帶LPC極點。包封調整器162可藉由將頻寬擴張因數526乘以極點縮放因數來判定極點調整因數。極點縮放因數可為預設值。包封調整器162可藉由調整高頻帶LPC極點來控制信號包封182之量,如參考圖5所描述。舉例而言,包封調整器162可藉由極點調整因數將高頻帶LPC極點調整至原始狀態。
作為另一實例,包封調整器162可判定濾波器之係數。濾波器之係數可為預設值。包封調整器162可藉由將頻寬擴張因數526乘以濾波器縮放因數來判定濾波器調整因數。濾波器縮放因數可為預設值。包封調整器162可藉由調整濾波器之係數來控制信號包封182之量,如參 考圖6所描述。舉例而言,包封調整器162可將濾波器之係數中之每一者乘以濾波器調整因數。
裝置進一步包括用於基於包封之受控量調變白雜訊信號的構件。舉例而言,用於調變白雜訊信號的構件可包括圖1之調變器164、經組態以基於包封之受控量調變白雜訊信號之一或多個器件(例如,執行在非暫時性電腦可讀儲存媒體處之指令的處理器)或其任何組合。舉例而言,調變器164可判定白雜訊156及信號包封182是否在同一域中。若白雜訊156在與信號包封182不同之域中,則調變器164可將白雜訊156轉換成在與信號包封182相同之域中或可將信號包封182轉換成在與白雜訊156相同之域中。調變器164可基於信號包封182調變白雜訊156,如參考圖4所描述。舉例而言,調變器164可將在時域中之白雜訊156及信號包封182相乘。作為另一實例,調變器164可褶積頻域中之白雜訊156及信號包封182。
裝置亦包括用於基於經調變之白雜訊信號生成高頻帶激勵信號的構件。舉例而言,用於生成高頻帶激勵信號的構件可包括圖1之輸出電路166、經組態以基於經調變之白雜訊信號生成高頻帶激勵信號之一或多個器件(例如,執行在非暫時性電腦可讀儲存媒體處之指令處理器)或其任何組合。
在特定實施例中,輸出電路166可基於經調變之白雜訊184生成高頻帶激勵信號186,如參考圖4至圖7所描述。舉例而言,輸出電路166可將經調變白雜訊184與雜訊增益434相乘來生成經縮放之經調變白雜訊438,如參考圖4至圖6所描述。輸出電路166可組合經縮放之經調變白雜訊438及另一信號(例如,圖4之經縮放之代表性信號440、圖5之經縮放之經濾波信號540或圖6之經縮放之合成高頻帶信號640)來生成高頻帶激勵信號186。
作為另一實例,輸出電路166可將經調變之白雜訊184與圖7之經 調變之雜訊增益732相乘來生成經縮放之經調變白雜訊740,如參考圖7所描述。輸出電路166可將經縮放之經調變白雜訊740及經縮放之未經調變之白雜訊742進行組合(例如,相加)來生成經縮放之白雜訊744。輸出電路166可組合經縮放之代表性信號440及經縮放之白雜訊744來生成高頻帶激勵信號186。
熟習此項技術者將進一步瞭解,結合本文所揭示之實施例所描述之各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由處理器件(諸如硬體處理器)執行之電腦軟體或兩者之組合。上文已大體上在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性經實施為硬體或可執行軟體取決於特定應用及強加於整個系統之設計約束而定。對於每一特定應用而言,熟習此項技術者可以變化之方式實施所描述之功能性,但不應將該等實施決策解釋為導致脫離本發明之範疇。
結合本文中所揭示之實施例而描述之方法或演算法的步驟可直接體現於硬體中、由處理器執行之軟體模組中,或兩者之組合中。軟體模組可駐存於記憶體器件中,諸如隨機存取記憶體(RAM)、磁電阻隨機存取記憶體(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、可卸除式磁碟或光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,使得處理器可自記憶體器件讀取資訊且將資訊寫入至記憶體器件。在替代方案中,記憶體器件可與處理器成一體式。處理器及儲存媒體可駐存於特殊應用積體電路(ASIC)中。ASIC可駐存於計算器件或使用者終端機中。在替代方案中,處理器及儲存媒體可作為離散組件駐存於計算器件或使用者終端機中。
提供所揭示之實施例的先前描述以使熟習此項技術者能夠製作或使用所揭示之實施例。對於熟習此項技術者而言,此等實施例之各種修改將易於顯而易見,且本文所定義之原理可在不脫離本發明之範疇的情況下應用於其他實施例。因此,本發明並非意欲限於本文中所展示之實施例,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。

Claims (30)

  1. 一種用於高頻帶激勵信號生成之方法,該方法包含:在一解碼器處提取一音訊信號之一濁音分類參數;基於該濁音分類參數判定一低通濾波器之一濾波器係數,該濾波器係數具有:在該濁音分類參數指示該音訊信號係一強濁音信號時之一第一值;在該濁音分類參數指示該音訊信號係一弱濁音信號時之一第二值,該第二值低於該第一值;在該濁音分類參數指示該音訊信號係一弱清音信號時之一第三值,該第三值低於該第二值;或在該濁音分類參數指示該音訊信號係一強清音信號時之一第四值,該第四值低於該第三值;對該音訊信號之一低頻帶部分進行濾波以生成一低頻帶音訊信號;基於該低通濾波器之該濾波器係數控制該低頻帶音訊信號之一時間包封之一振幅;基於該時間包封之該振幅調變一白雜訊信號以生成一調變白雜訊信號;基於一雜訊增益縮放該調變白雜訊信號以生成一縮放調變白雜訊信號;及以該縮放調變白雜訊信號混合該低頻帶音訊信號之一縮放版本以生成一高頻帶激勵信號,其係用於生成該音訊信號之一解碼版本。
  2. 如請求項1之方法,其中控制該時間包封之該振幅包含:將該低通濾波器應用於該低頻帶音訊信號以生成一濾波低頻帶音訊信號;及控制該時間包封之該振幅以匹配該濾波低頻帶音訊信號之一振幅,其中若該濾波低頻帶音訊信號之該振幅小於與該濾波器係數相關聯之一截止頻率,該濾波低頻帶音訊信號之該振幅匹配該低頻帶音訊信號之一振幅。
  3. 如請求項1之方法,其中該雜訊增益係基於該音訊信號之一高頻帶部分中諧波能量對雜訊能量之一比率。
  4. 如請求項1之方法,其中該低頻帶音訊信號包含一低頻帶激勵信號或一諧性擴展低頻帶激勵信號。
  5. 如請求項1之方法,其進一步包含基於該高頻帶激勵信號生成一合成高頻帶信號。
  6. 如請求項5之方法,其進一步包含基於該音訊信號之該低頻帶部分生成一合成低頻帶信號。
  7. 如請求項6之方法,其進一步包含組合該合成高頻帶信號及該合成低頻帶信號以生成該音訊信號之該解碼版本。
  8. 如請求項1之方法,其中該解碼器係經整合於一基地台中。
  9. 如請求項1之方法,其中該解碼器係經整合於一行動器件中。
  10. 一種用於高頻帶激勵信號生成之裝置,該裝置包含:一濁音分類器,其經組態以提取一音訊信號之一濁音分類參數,其中該輸入信號對應於一音訊信號;一包封調整器,其經組態以:基於該濁音分類參數判定一低通濾波器之一濾波器係數,該濾波器係數具有:在該濁音分類參數指示該音訊信號係一強濁音信號時之一第一值;在該濁音分類參數指示該音訊信號係一弱濁音信號時之一第二值,該第二值低於該第一值;在該濁音分類參數指示該音訊信號係一弱清音信號時之一第三值,該第三值低於該第二值;或在該濁音分類參數指示該音訊信號係一強清音信號時之一第四值,該第四值低於該第三值;及基於該低通濾波器之該濾波器係數控制一低頻帶音訊信號之一時間包封之一振幅,其中該音訊信號之低頻帶部分係經濾波以生成該低頻帶音訊信號;一調變器,其經組態以基於該時間包封之該振幅調變一白雜訊信號以生成一調變白雜訊信號;一乘法器,其經組態以基於一雜訊增益縮放該調變白雜訊信號以生成一縮放調變白雜訊信號;及一加法器,其經組態以用該縮放調變白雜訊信號混合該低頻帶音訊信號之一縮放版本以生成一高頻帶激勵信號,其係用於生成該音訊信號之一解碼版本。
  11. 如請求項10之裝置,其中該包封調整器係進一步經組態以:將該低通濾波器應用於該低頻帶音訊信號以生成一濾波低頻帶音訊信號;及控制該時間包封之該振幅以匹配該濾波低頻帶音訊信號之一振幅,其中若該濾波低頻帶音訊信號之該振幅小於與該濾波器係數相關聯之一截止頻率,該濾波低頻帶音訊信號之該振幅匹配該低頻帶音訊信號之一振幅。
  12. 如請求項10之裝置,其中該雜訊增益係基於該音訊信號之一高頻帶部分中諧波能量對雜訊能量之一比率。
  13. 如請求項10之裝置,其中該低頻帶音訊信號包含一低頻帶激勵信號或一諧性擴展低頻帶激勵信號。
  14. 如請求項10之裝置,其進一步包含一高頻帶合成器,其經組態以基於該高頻帶激勵信號生成一合成高頻帶信號。
  15. 如請求項14之裝置,其進一步包含一低頻帶合成器,其經組態以基於該音訊信號之該低頻帶部分生成一合成低頻帶信號。
  16. 如請求項15之裝置,其進一步包含一多工器,其經組態以組合該合成高頻帶信號及該合成低頻帶信號以生成該音訊信號之該解碼版本。
  17. 如請求項10之裝置,其中該濁音分類器、該包封調整器、該調變器、該乘法器、及該加法器係經整合於一基地台中。
  18. 如請求項10之裝置,其中該濁音分類器、該包封調整器、該調變器、該乘法器、及該加法器係經整合於一行動器件中。
  19. 一種用於高頻帶激勵信號生成之電腦可讀器件,該電腦可讀器件儲存在由經組態用於高頻帶激勵信號生成之一解碼器內之一處理器執行時引起該處理器執行以下操作之指令:提取一音訊信號之一濁音分類參數;基於該濁音分類參數判定一低通濾波器之一濾波器係數,該濾波器係數具有:在該濁音分類參數指示該音訊信號係一強濁音信號時之一第一值;在該濁音分類參數指示該音訊信號係一弱濁音信號時之一第二值,該第二值低於該第一值;在該濁音分類參數指示該音訊信號係一弱清音信號時之一第三值,該第三值低於該第二值;或在該濁音分類參數指示該音訊信號係一強清音信號時之一第四值,該第四值低於該第三值;對該音訊信號之一低頻帶部分進行濾波以生成一低頻帶音訊信號;基於該低通濾波器之該濾波器係數控制該低頻帶音訊信號之一時間包封之一振幅;基於該時間包封之該振幅調變一白雜訊信號以生成一調變白雜訊信號;基於一雜訊增益縮放該調變白雜訊信號以生成一縮放調變白雜訊信號;及以該縮放調變白雜訊信號混合該低頻帶音訊信號之一縮放版本以生成一高頻帶激勵信號,其係用於生成該音訊信號之一解碼版本。
  20. 如請求項19之電腦可讀器件,其中控制該時間包封之該振幅包含:將該低通濾波器應用於該低頻帶音訊信號以生成一濾波低頻帶音訊信號;及控制該時間包封之該振幅以匹配該濾波低頻帶音訊信號之一振幅,其中若該濾波低頻帶音訊信號之該振幅小於與該濾波器係數相關聯之一截止頻率,該濾波低頻帶音訊信號之該振幅匹配該低頻帶音訊信號之一振幅。
  21. 如請求項19之電腦可讀器件,其中該雜訊增益係基於該音訊信號之一高頻帶部分中諧波能量對雜訊能量之一比率。
  22. 如請求項19之電腦可讀器件,其中該低頻帶音訊信號包含一低頻帶激勵信號或一諧性擴展低頻帶激勵信號。
  23. 如請求項19之電腦可讀器件,其中該等操作進一步包含基於該高頻帶激勵信號生成一合成高頻帶信號。
  24. 如請求項23之電腦可讀器件,其中該等操作進一步包含基於該音訊信號之該低頻帶部分生成一合成低頻帶信號。
  25. 如請求項24之電腦可讀器件,其中該等操作進一步包含組合該合成高頻帶信號及該合成低頻帶信號以生成該音訊信號之該解碼版本。
  26. 一種用於高頻帶激勵信號生成之裝置,該裝置包含:用於提取一音訊信號之一濁音分類參數的構件;用於基於該濁音分類參數判定一低通濾波器之一濾波器係數的構件,該濾波器係數具有:在該濁音分類參數指示該音訊信號係一強濁音信號時之一第一值;在該濁音分類參數指示該音訊信號係一弱濁音信號時之一第二值,該第二值低於該第一值;在該濁音分類參數指示該音訊信號係一弱清音信號時之一第三值,該第三值低於該第二值;或在該濁音分類參數指示該音訊信號係一強清音信號時之一第四值,該第四值低於該第三值;用於對該音訊信號之一低頻帶部分進行濾波以生成一低頻帶音訊信號的構件;用於基於該低通濾波器之該濾波器係數控制該低頻帶音訊信號之一時間包封之一振幅的構件;用於基於該時間包封之該振幅調變一白雜訊信號以生成一調變白雜訊信號的構件;用於基於一雜訊增益縮放該調變白雜訊信號以生成一縮放調變白雜訊信號的構件;及用於以該縮放調變白雜訊信號混合該低頻帶音訊信號之一縮放版本以生成一高頻帶激勵信號的構件,該高頻帶激勵信號係用於生成該音訊信號之一解碼版本。
  27. 如請求項26之裝置,其進一步包含:用於基於該高頻帶激勵信號生成一合成高頻帶信號的構件;及用於基於該音訊信號之該低頻帶部分生成一合成低頻帶信號的構件。
  28. 如請求項27之裝置,其中用於組合該合成高頻帶信號及該合成低頻帶信號以生成該音訊信號之該解碼版本的構件。
  29. 如請求項26之裝置,其中該用於提取的構件、該用於判定的構件、該用於濾波的構件、該用於控制的構件、該用於調變的構件、該用於縮放的構件、及該用於混合的構件係經整合於一基地台中。
  30. 如請求項26之裝置,其中該用於提取的構件、該用於判定的構件、該用於濾波的構件、該用於控制的構件、該用於調變的構件、該用於縮放的構件、及該用於混合的構件係經整合於一基地台中。
TW104111025A 2014-04-30 2015-04-02 高頻帶激勵信號生成 TWI643186B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/265,693 2014-04-30
US14/265,693 US9697843B2 (en) 2014-04-30 2014-04-30 High band excitation signal generation

Publications (2)

Publication Number Publication Date
TW201606757A TW201606757A (zh) 2016-02-16
TWI643186B true TWI643186B (zh) 2018-12-01

Family

ID=52829451

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104111025A TWI643186B (zh) 2014-04-30 2015-04-02 高頻帶激勵信號生成

Country Status (28)

Country Link
US (2) US9697843B2 (zh)
EP (1) EP3138096B1 (zh)
JP (1) JP6599362B2 (zh)
KR (2) KR102433713B1 (zh)
CN (2) CN110827842B (zh)
AR (1) AR099952A1 (zh)
AU (1) AU2015253721B2 (zh)
BR (1) BR112016024971B1 (zh)
CA (1) CA2944874C (zh)
CL (1) CL2016002709A1 (zh)
DK (1) DK3138096T3 (zh)
ES (1) ES2711524T3 (zh)
HU (1) HUE041343T2 (zh)
IL (1) IL248562B (zh)
MX (1) MX361046B (zh)
MY (1) MY192071A (zh)
NZ (1) NZ724656A (zh)
PH (1) PH12016502137A1 (zh)
PL (1) PL3138096T3 (zh)
PT (1) PT3138096T (zh)
RU (1) RU2683632C2 (zh)
SA (1) SA516380088B1 (zh)
SG (1) SG11201607703PA (zh)
SI (1) SI3138096T1 (zh)
TR (1) TR201901357T4 (zh)
TW (1) TWI643186B (zh)
WO (1) WO2015167732A1 (zh)
ZA (1) ZA201607459B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102138320B1 (ko) * 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN105096958B (zh) 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
KR101860143B1 (ko) 2014-05-01 2018-05-23 니폰 덴신 덴와 가부시끼가이샤 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN109686378B (zh) * 2017-10-13 2021-06-08 华为技术有限公司 语音处理方法和终端
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
WO2020157888A1 (ja) * 2019-01-31 2020-08-06 三菱電機株式会社 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム
US11682406B2 (en) * 2021-01-28 2023-06-20 Sony Interactive Entertainment LLC Level-of-detail audio codec

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077280A1 (en) * 2000-05-02 2002-06-20 Judice J. Kevin Pharmaceutical compositions containing a glycopeptide antibiotic and a cyclodextrin
US20020184009A1 (en) * 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20060064301A1 (en) * 1999-07-26 2006-03-23 Aguilar Joseph G Parametric speech codec for representing synthetic speech in the presence of background noise
US20120016667A1 (en) * 2010-07-19 2012-01-19 Futurewei Technologies, Inc. Spectrum Flatness Control for Bandwidth Extension
US20130216053A1 (en) * 2010-02-26 2013-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for modifying an audio signal using envelope shaping

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
JP3343965B2 (ja) 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
ZA946674B (en) * 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
US6078880A (en) * 1998-07-13 2000-06-20 Lockheed Martin Corporation Speech coding system and method including voicing cut off frequency analyzer
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6665403B1 (en) * 1999-05-11 2003-12-16 Agere Systems Inc. Digital gyrator
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
GB2370435A (en) * 2000-12-22 2002-06-26 Nokia Mobile Phones Ltd A polar loop transmitter for a mobile phone
EP1256937B1 (en) * 2001-05-11 2006-11-02 Sony France S.A. Emotion recognition method and device
US6956914B2 (en) * 2001-09-19 2005-10-18 Gennum Corporation Transmit amplitude independent adaptive equalizer
US6985857B2 (en) * 2001-09-27 2006-01-10 Motorola, Inc. Method and apparatus for speech coding using training and quantizing
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US7155385B2 (en) * 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP3918734B2 (ja) * 2002-12-27 2007-05-23 ヤマハ株式会社 楽音発生装置
US7155386B2 (en) 2003-03-15 2006-12-26 Mindspeed Technologies, Inc. Adaptive correlation window for open-loop pitch
CN100508030C (zh) * 2003-06-30 2009-07-01 皇家飞利浦电子股份有限公司 一种编码/解码音频信号的方法及相应设备
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
MX2007012187A (es) 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
KR101118217B1 (ko) * 2005-04-19 2012-03-16 삼성전자주식회사 오디오 데이터 처리 장치 및 방법
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
KR100744352B1 (ko) * 2005-08-01 2007-07-30 삼성전자주식회사 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101197130B (zh) * 2006-12-07 2011-05-18 华为技术有限公司 声音活动检测方法和声音活动检测器
US8457953B2 (en) * 2007-03-05 2013-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for smoothing of stationary background noise
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
RU2394284C1 (ru) * 2009-03-24 2010-07-10 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8311817B2 (en) * 2010-11-04 2012-11-13 Audience, Inc. Systems and methods for enhancing voice quality in mobile device
JP5649488B2 (ja) * 2011-03-11 2015-01-07 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
CN102201240B (zh) * 2011-05-27 2012-10-03 中国科学院自动化研究所 基于逆滤波的谐波噪声激励模型声码器
US8972251B2 (en) * 2011-06-07 2015-03-03 Qualcomm Incorporated Generating a masking signal on an electronic device
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
WO2013066244A1 (en) * 2011-11-03 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of audio signals
KR101897455B1 (ko) * 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
EP2972567A4 (en) * 2013-03-11 2016-12-07 Ohio State Innovation Foundation MULTI-CARRIER PROCESSING SYSTEMS AND METHODS IN HEARING AID PROSTHETIC DEVICES
CN105264600B (zh) * 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
JP6407150B2 (ja) * 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
GB201406574D0 (en) * 2014-04-11 2014-05-28 Microsoft Corp Audio Signal Processing
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060064301A1 (en) * 1999-07-26 2006-03-23 Aguilar Joseph G Parametric speech codec for representing synthetic speech in the presence of background noise
US20020077280A1 (en) * 2000-05-02 2002-06-20 Judice J. Kevin Pharmaceutical compositions containing a glycopeptide antibiotic and a cyclodextrin
US20020184009A1 (en) * 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20130216053A1 (en) * 2010-02-26 2013-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for modifying an audio signal using envelope shaping
US20120016667A1 (en) * 2010-07-19 2012-01-19 Futurewei Technologies, Inc. Spectrum Flatness Control for Bandwidth Extension

Also Published As

Publication number Publication date
SA516380088B1 (ar) 2021-01-28
CN110827842A (zh) 2020-02-21
BR112016024971A8 (pt) 2021-07-13
CN106256000B (zh) 2019-12-24
SG11201607703PA (en) 2016-11-29
SI3138096T1 (sl) 2019-03-29
US9697843B2 (en) 2017-07-04
RU2683632C2 (ru) 2019-03-29
AU2015253721A1 (en) 2016-10-13
PL3138096T3 (pl) 2019-05-31
US20150317994A1 (en) 2015-11-05
KR102433713B1 (ko) 2022-08-17
KR20220117347A (ko) 2022-08-23
CL2016002709A1 (es) 2017-02-17
BR112016024971B1 (pt) 2022-10-04
CA2944874C (en) 2022-09-20
EP3138096B1 (en) 2018-11-14
DK3138096T3 (en) 2019-02-25
PT3138096T (pt) 2019-02-25
TR201901357T4 (tr) 2019-02-21
CN110827842B (zh) 2024-04-02
RU2016142184A (ru) 2018-05-30
MY192071A (en) 2022-07-25
KR102610946B1 (ko) 2023-12-06
CN106256000A (zh) 2016-12-21
MX361046B (es) 2018-11-26
HUE041343T2 (hu) 2019-05-28
ES2711524T3 (es) 2019-05-06
US20170270942A1 (en) 2017-09-21
ZA201607459B (en) 2018-11-28
JP2017517029A (ja) 2017-06-22
AR099952A1 (es) 2016-08-31
WO2015167732A1 (en) 2015-11-05
MX2016013941A (es) 2017-01-09
NZ724656A (en) 2021-12-24
EP3138096A1 (en) 2017-03-08
JP6599362B2 (ja) 2019-10-30
RU2016142184A3 (zh) 2018-11-09
US10297263B2 (en) 2019-05-21
PH12016502137A1 (en) 2017-02-06
TW201606757A (zh) 2016-02-16
CA2944874A1 (en) 2015-11-05
KR20170003592A (ko) 2017-01-09
IL248562A0 (en) 2016-12-29
BR112016024971A2 (pt) 2017-08-15
IL248562B (en) 2020-01-30
AU2015253721B2 (en) 2020-05-28

Similar Documents

Publication Publication Date Title
TWI643186B (zh) 高頻帶激勵信號生成
KR101849871B1 (ko) 고대역 신호 특성에 기초한 시간 이득 조정
US9818419B2 (en) High-band signal coding using multiple sub-bands