TWI327852B

TWI327852B - System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission

Info

Publication number: TWI327852B
Application number: TW095121673A
Authority: TW
Inventors: Steven Craig Greer; Philippe Gournay; Milan Jelinek
Original assignee: Nokia Corp
Priority date: 2005-06-18
Filing date: 2006-06-16
Publication date: 2010-07-21
Also published as: MY144785A; CN101213591B; HK1117631A1; WO2006136901A3; ES2629727T3; EP1897085B1; EP1897085A2; CN101213591A; JP5351206B2; CA2609945C; PL1897085T3; US7693708B2; US20060293885A1; WO2006136901A2; ZA200800461B; CA2609945A1; JP2011199875A; JP2008546341A

Description

九、發明說明：【發明戶斤廣之技術領域3 發明領域本發明之示範性實施例大致係關於用以不連續語音傳輸之系統與方法’且更具體地說’係關於用以於不連續語音傳輸期間，適應性地傳送舒適雜訊參數之系統與方法。 C先前技術3 發明背景不連續傳輸(DTX)使用於行動通訊系統中，以於語音暫停期間關閉無線傳送器。DTX之使用節省了行動臺中的功率並增加了電池再充電間所需之時間。其亦減少了一般干擾程度且如此改進傳輸品質。然而，在語音暫停期間，若頻道完全地切斷的話，一般與語音一起傳送之背景雜訊亦消失。結果為在通訊之接收端上不自然的聆聽音訊訊號（無聲）。取代於語音暫停期間完全地切斷傳輸，已發展了許多技術，藉此產生特性化背景雜訊之參數並以一低速率於空氣介面上之無聲描述符號(sn))框架中傳送。然後，可於接收側上使用這些通常稱為舒適雜訊(CN)參數之參數，以再生背景雜訊，其盡可能良好地反射在傳送側上之背景雜訊之頻譜和時_容。舒適雜訊參數—般包括語音編碼參數之子集合：具體地說為合成濾波器係數和增益參數。傳统上，CN參數係於語音暫停期間，以一固定速率於空亂介面上傳送’諸如第丨圖中所示的，其中包括這些參數之SID忙架係於非主動語音期間内每四個框架加以傳送。更八體地說例如在gsm胞元通訊系統之全速㈣)和增強 FR(EFR)語音頻道中，CN參數係以每24框架一次之速率傳送（即每480百萬分之—秒）。這意指⑶參數僅每秒更新兩 -人另一方面，在適應性多速率（AMR)和寬帶AMR (AMR-WB)纟統巾’ Qsf參^^以每8個框帛—次之速率傳送 (即160百萬分之一秒）’ CN參數更新速率為約每秒6次。此低傳輸速率無法精確地表示背景雜訊之頻譜和時間特性，因此在DTX期間’背景雜訊品f上的—些退化是無法避免的。然而，增加傳輸速率會減少DTX之好處，因減少了語音和CN參數之整體傳輸速率。 C考务明内】發明概要考慮前述背景，本發明之示範性實施例提供用以適應性傳送舒適雜訊(CN)參數之系統與方法，諸如在無聲描述符號(SID)框架，CN參數訊息或類似中者（這些訊息在此稱為SID框架而不失一般性）。根據本發明之示範性實施例， SID框架傳送之速率可以一目前雜訊值為基礎來適應性地修改或以其他方式選擇性地加以控制，諸如目前的語音對者厅、雜訊(或訊雜）比（SNR)。在此方面’在行動端點之操作期間’一諸如語音活動偵測器之端點實體能夠評估目前之 SNR值。然後，以此SNR值為基礎，諸如一不連續傳輸(DTx) 傳送器（例如TX-DTX處理器）之行動端點實體可選擇性地設定在一語音訊號之非主動期間内DTX傳送器傳送SID框架之速率。例如’在一高SNR(如超過2〇dB)上’ TX-DTX處理器1"組態為以較低頻率傳送SID框架（例如每50個框架），以藉此實現平均資料速率之明顯減少，代價僅為少許的性能退化。另一方面’在低SNR(例如20dB或以下）， TX-DTX可組態來以較高頻率傳送SID框架（例如每12個框架）’如此使得舒適雜訊可盡可能地維持自然。根據本發明之一示範性實施例之一觀點，提供一裝置，其包括用以於一不連續傳輸模式期間傳送語音訊號之至少一實體，其包括於語音暫停期間内傳送穿插有包括舒適雜訊參數之框架（例如Sid框架）之語音框架。該等實體包括一用以評估目前雜訊值之第一實體（例如語音活動偵測器-VAD)。例如，第一實體可適應性地以主動語音之一長期能量為基礎及以背景雜訊之一長期能量為基礎來評估一目前之訊雜比。又，例如，第一實體可適應性地以主動語音之-長期能量及背景雜訊之__長期能量之函數為基礎，以及以應用至該函數之修正因子為基礎來評估-目前之訊雜比。 >除第-實體之外，該裝置包括—用以選擇性地控制以該評估之目前賴料基礎於語音暫停顧㈣送包括舒適雜訊參數之框架之速率之第二實體(例如TX-DTX)。例如’第二實體可適應性地改為藉由改變介於—對應於一第雜訊值之最j、值與—對應於低於該第_雜訊值之第二雜訊值之最大_之料來選雜地控制料^第二實體可適應性地改為藉由當評估的目前雜訊值增加時減少速率， 1327852 且當評估的目前擁訊值減少時增加速率來選擇性地控制速率。

更具體地說’第二實體可適應性改為以評估的目前雜訊值為基礎來計算—間隔（比例之倒反），如此使得包括舒適 5雜訊參數之框架於計算之間隔上傳送。對在非主動期間内之框架來說，第二實體可進一步適應性改為判斷是否已抵達一計算的間隔之末端，且若已抵達-計算間隔之末端的話，傳送包括舒適雜訊參數之框架。另外，若尚未抵達〆计异間隔之末端的話，第二實體可適應性改為接收指示來 0傳送包括舒適雜訊參數之框架，諸如若一偵測到的背景雜訊大小變異超過一最大變異。根據本發明之其他觀點，提供方法與電腦程式產品 ^上面所指出與下面所朗的，本發明之讀性實施例 15

J 、電腦程式產品可解決先前技術所識別之問且可提供額外的好處。圖式簡單說明 &性地描述了本發明，現將參考附圖，」不—定依尺寸繪圖，其中： ’ 第1圖為無知述器(SI聊架，其於語音主動週期期間内於一固定間隔上加以傳送；第2圖為根據本發明之一示範性實施例之一通訊 =不意方塊圖，其包括-行動網路，-公共切換電㊉和一資料網路；第3圖為根據本發明之一示範性實施例之—行動端點 V> 1327852 之示意方塊圖；第4圖為根據本發明之示範性實施例之不連續傳輸 (DTX)技術操作之一行動無之魏性方塊圖；以及第5圖為—流㈣’其說明根據本發明之-示範性實施 5例適紐轉骑雜財數之料巾之^同步驟。 c實施方式】較佳實施例之詳細說明現將於下文中參考於其中已顯示本發明之較佳實施例之附圖來更完整地描述本發明。然而，本發明可實施於許 10多不同型式中且不應被理解為受限於在此提出之實施例；而疋，提供這些實施例，如此使得本揭示内容將完整和完全，且將完整地傳達本發明之範圍給熟悉技藝之人士。全文中類似的數字指稱類似的元件。參考第2圖，提供根據本發明之示範性實施例組態之一 15無線通訊網路之功能性說明。如第2圖中所示，本發明之示範性實施例之網路包括一行動端點10，諸如一行動電話。然而’應了解到’所說明及之後描述之行動電話僅說明從本發明之示範性實施例獲得好處之行動端點之一型式，且因此’不應用來限制本發明之範圍。在為了示範目的說明 20 及將於下文中描述行動端點之幾個實施例之同時，其他型式之行動端點，諸如可攜式數位助理(PDA)，呼叫器，追蹤裝置’膝上型電腦和其他型式之語音和文字通訊系統，可容易地使用本發明之示範性實施例。但本發明之示範性實施例之系統與方法可與許多種類之其他系統連結使用，在 9

V 行動通訊業内者和行動通訊業之外者皆可。如所示，一行動端點10包括一天線變換器12，其係用以根據許多不同的無線通訊技術來傳送和接收訊號。更具體地說，例如，行動端點可包括一用以在一或多個型式之胞元網路，個人通訊服務(PCS)和類似者中傳送訊號至一基地站或基地臺(BS) 14及從其接收訊號之天線轉換器。基地臺為一胞元網路之一部份，其包括一行動切換中心（Msc) 16和其他操作胞元網路所需之單元。Msc能夠在行動端點做呼叫和接收呼叫時，從行動端點安排呼叫和訊息之路徑進和出》MSC亦控制當端點與胞元網路註冊時訊息進出行動端點之饋送，並控制訊息對行動端點之進出一訊息中心 (未顯示）之饋送。如熟悉技藝之人士將體會到的，胞元網路亦可稱為一公共陸地行動網路(pLMN)丨8。 PLMN 18能夠根據許多不同的胞元通訊技術來提供通訊。在此方面，PLMN能夠根據許多第一代（1G)，第二代 (2G)，2.5G和/或第三代(3G)通訊技術之任一和/或許多其他月&夠根據本發明之實施例來操作之胞元通訊技術之任一來操作。例如，PLMN能夠根據GSM(全域行動通訊系統）， IS-136(時域多向近接-TDMA)，IS-95(劃碼多向近接 -CDMA) ’ Cdma2000 ’或奶证(增強資料GSM環境)通訊技術來操作。另外地或其他地，PLMN_根據-或多個增強 3G無線通訊技術來操作，諸如高速封包資料(HRPD)通訊技術，其包括例如—lXEV-DO(TIA/EIA/IS-856)和 / 或 1XEV-DV。再者，例如，pLMN*夠根據GpRS(一般射頻封 1327852 包服務），GPRS-基礎(例如通用行動電訊系統-umts)技術或類似者來操作。 MSC 16 ’以及因此PLMN 18可耦合至一公共切換電話網路(PSTN) 20 ’其繼而耦合至一或多個一般為多個之電路 5切換固定端點22，諸如線路和/或無線電話。PSTN能夠根據許多不同技術之任一來提供音訊通訊。例如，PSTN可根據劃時多工(TDM)技術，諸如64Kbps(CCIT)，和/或脈衝碼調變(PCM)技術，諸如56Kbps(ANSI)來操作。 PLMN 18(透過MSC 16)和PSTN 20可耦合至，電氣連接 10 至一封包切換網路’或以其他方式與之電氣通訊，該網路諸如一網際網路協定(11>)網路24。在PLMN和PSTN可直接耗合至IP網路之同時，在一實施例中，PLMN和PSTN藉由値別閘道(GTW) 26間接地耦合至IP網路。IP網路可耦合至一或多個封包切換固定端點28。另外，IP網路可耦合至一或 15 多個無線存取點(AP) 30，諸如一端點10之裝置可耦合至其上。在此方面，端點可以許多不同方式之任一方式輕合至 AP，諸如根據一低功率射頻(LPRF)技術者，諸如無線局本區域網路(WLAN)(例如IEEE 802.11)，藍芽和/或超寬帶 (UWB)技術。 20 現參考第3圖，其說明一將從本發明之示範性實施例獲利之行動端點1〇之方塊圖°行動端點包括許多不同的用以根據本發明之示範性實施例’包括較具體顯示和在此描述之那些來執行一或多個功能之裂置。然而應了解到，行動端點可包括用以執行一或多個類似功能之其他的裝置，而 11 1327852 不逆反本發明之精神和範圍。更具體地說，例如如第3圖中所示的，行動端點可包括一傳送器32，一接收器34，和諸如-處理器’控㈣36或類似者之裝置，其分別提供訊號給傳送器和接收器及從其接收訊號。這些訊號包括根據可 5應用胞元系統之空氣介面標準之發訊資訊，以及使用者語音和/或使用者產生之資肖。在此方面，行動端點可以一或多個空氣介面標準，通訊協定，調變型式和存取型式來操作。更具體地說，行動端點能夠根據許多第一，第二和/或第三代通訊協定或類似者之任一來操作。例如，行動端點 10能夠根據第二代(2G)無線通訊協定IS-136(TDMA)，GSM和 IS-95(CDMA)，以及如1XEV-DO和1XEV-DV之第三代協定來操作。一些窄帶AMPS(NAMPS)，以及TACS，行動端點亦可從本發明之指導獲利，雙模或較高模式之電話(例如數位/類比或TDMA/CDMA/類比電話）亦應如此。 15 應了解到控制器36包括用以實現行動端點1〇之音訊和邏輯功能所需之電路。例如，控制器可由一數位訊號處理器裝置’微處理器裝置，和許多不同的類比至數位轉換器，數位至類比轉換器和其他支援電路構成。行動端點之控制和訊號處理功能在這些裝置間根據其功能來加以指派。如 20 此，控制器亦包括在調變和傳送前迴旋編碼和内插訊息和資料之功能設施。再者，控制器可包括操作一或多個可儲存於記憶體中之軟體程式之功能設施。行動端點10亦包含一使用者介面’其包括一傳統耳機或喇叭38，一響鈴40，一麥克風42，一顯示器44，以及一 v> 12 1327852 使用者輸入介面，其之全部辑合至控制器36。允許行動端點接收資料之使用者輸入介面可包括許多允許行動端點接收資料之裝置之任〆，諸如一鍵盤46，一觸控顯示器（未_ 乔）或其他輸入裝置。在包括—鍵盤之實施例中，鍵盤包括 5傳統數字（〇-9)和相關按鍵(#，*)和其他用來操作行動端點之按鍵° 行動端點10亦巧*包括記憶體，諸如一用戶識別模板 (SI]Vi)48，一可移除之使用者識別模組(R-UIM)或類似者，其一般儲存相關於一行動用戶之資訊元件。除SIM之外，行 1〇動端點1〇可包括其他記憶體。在此方面，行動端點可包括揮發性記憶體50，諸如揮發性隨機存取記憶體(RAM)，其包栝一缓衝貯存區域’以供暫時儲存資料。行動端點亦可包栝其他非揮發性記憶體52，其可嵌入和/或可為可移除的。非揮發性記憶體可另外地或其他地包含一EEPROM， 15快閃記憶體或類似者。記憶體可儲存行動端點用來實現行動端點之功能之許多片段之資訊和資料之任一。例如，記憶體可包括一識別器，諸如一國際行動設備識別（JMEI) 碼，其能夠唯一地識別行動端點，諸如對MSC 16。行動端點10可進一步包括一紅外線傳接器54,或其他 20本地資料轉移裝置，如此使得資料可與其他裝置分享和/或從其獲，諸如透過一或多個Ap 30。資料之分享以及資料之遠端分享亦可根據許多不同的技術來加以提供。例如，

行動端點可包括一或多個射頻傳接器56，其能夠與其他射頻傳接器來分享資料，且可藉此作用如一WLAN和/或WAN 13 "面’如在此所描述的。另外地或或者地’行動端點可使用由藍芽特別利益小組所發展之藍芽無線技術來分享資料。現參考第4圖，其說明行動端點1〇之一功能性區塊圖，其係根據本發明之示範性實施例之不連續傳輸(〇τχ)技術來操作的。如所示，一麥克風42轉換一聲音為一電訊號，其被供應給一語音編碼器58。語音編碼器執行語音編碼為一較低速率，諸如以產生一或多個被轉移給一TX-DTX處理器60之語音參數之方式。TX_DTX處理器繼而在每次於正常傳輸模式巾舰語音贿，絲由麥克風所產生之訊號是否«σ曰或僅有背景雜訊。語音框架被傳送給一射頻單元62’其包含_傳接器和其他元件和射頻路徑所要求之功此。射頻單7〇傳送語音框架如在射頻介面上之—射頻上聯訊號至一BS 14，ΑΡ 30或類似者。行動端點10可被命令為DTX模式，以由BS 14所傳送之命令來做。當行動魅為在DTX模式㈣…語音活動债測器(彻)64分析由麥克風42難生之訊號來判斷由麥克風42所產生之訊號是否包含語音或僅有背景雜訊。例如如根據GSMit訊技賴定義的，獅更具體地說係分析由麥克風所產狀能量和簡改變。以其分析為基礎，獅產生-VAD旗標，其之狀態指示訊號是否包括語音 (獅叫或僅有背景雜訊(她=〇)。旗標被設定時 (VAD 1) ’在傳送端上負責不連續傳輪之功能，即處理器60(傳送DTX)傳送正t的語音框架。另—方面，當 1327852 VAD旗標未被設定(VAD=0)時，TX-DTX傳送SID(無聲描述器）框架，其包括背景雜訊相關之資訊’以於接收端上產生舒適雜訊(CN)。當VAD旗標之狀態從設定改變為未設定時，即，當在 5 訊號中未偵測到語音時，TX-DTX 60在計算背景雜訊之參數所需之一預先決定之數目之框架之後，從傳送由語音編碼器58所傳遞之編碼語音框架切換為產生SID框架。在由 TX-DTX所傳遞至射頻單元62之框架之控制位元中之— SP(語音）旗標指示所傳送之框架是否包令—正常的語音樞 10架(SP=1)或一SID框架(SP=0)。射頻單元62在最後一個語音框架之後，傳送一SID框架（SP=0)，其之後終止對射頻路徑之傳輸。TX-DTX處理器60在VAD旗標未設定時，繼續產生包含雜訊資訊之SID框架給射頻單元，且射頻單元繼續饋送這些框架給射頻路徑以更新在接收端上之雜訊參數。在許 15多不同的情況中，更新雜訊參數之這些SID框架可稱為舒適雜訊更新(CNU)框架。當VAD 64稍後偵測到來自語音編碼器58之參數之語音時，vAD設定VAD旗標以藉此將τχ·βΤχ 處理器導向為重新開始語音框架之連續傳輸(sp=1)。 TX-DTX處理器6〇產生SID框架，其表示背景雜訊不 20是藉由语音編碼器58轉換語音框架為SID框架之方式，就是藉由使用或另外與在行動端點中之一分離的舒適雜訊產生器(CNG)編碼器（未顯示)通訊之方式。例如，處理器可選擇來自正常語音參數中提供有關背景雜訊之大小和頻譜之資訊之那些參數做為雜訊參數。對應於許多語音框 15 架之持續時間之平均值可進一步包括於這些參數之内。每框架可包含對應數目之參數，從其可計算對應於那 -。a杷架之持續時間之值。這些雜訊參數然後可於框架中，以上述之方式來傳送至射頻路徑。取代當VAD 64偵 5測到語音時，傳送所有另外傳送之參數，那些參數之-部伤可由-SID碼字來取代，其包括一或多個二元零位元。其他不必要的參數亦可編碼為值零。在行動端點10之接收端上，射頻單元62從一BS 14, AP 30或類似者來接收—射頻下聯訊號(其包括一下聯框架）。射 1〇頻單元將下聯框架與下聯訊號分離，並應用下聯框架至一 RX-DTX處S器64(接收DTX)，其貞責在接收端上之不連續傳輸。在行動端點在正常傳輸模式中之情況中，RX DTX 處理器前饋接收到的語音框架至一語音解碼器66，其執行接收之參數之語音解碼》一解碼之語音訊號在一喇叭38上 15轉換成一音訊訊號。在行動端點在DTX模式中之情況中， RX-DTX處理器以許多不同的方式來處理從射頻單元接收到的框架，一般視下聯框架包括一正常語音框架或一SID框架而定。在此方面，RX_DTX可以框架之sp旗標為基礎來判斷框架型式。當sp旗標設定時(SP=1)，RX_DTX前送語音 20框架給语音解碼器。當SP旗標未設定時（SP=0)，RX-DTX 移至一狀態，其中其不是傳送以SID框架傳送之接收到的舒適雜訊(CN)參數為基礎所產生之編碼語音框架至語音解碼器66，就是使用一内部CNG解碼器或以其他方式與在行動端點中之一分離的CNG解碼器（未顯示）通訊，以直接提供— 16 1327852 訊號給·38。RX-DTX可在每次其触到一新的加框架時，更新用來產生舒適雜訊之參數。語音解碼器藉由產生 -訊號來解碼語音錢’其包括“雜訊，，，該職係、由似轉換成類似於在冑送端上所發生之音訊背景雜訊。如此避 5免了在DTX模式中會使聽者十分不喜之背景雜訊所傳達之語音和完全無聲間之波動。從相關於第3和4圖之一行動端點1〇之描述，應體會到行動端點之元件可由許多不同之裝置來實現，諸如硬體和/ 或韌體，單獨地和/或在一電腦程式產品之控制之下的。一 10般來說，行動端點可包括一或多個邏輯元件或實體，其係用以執行一或多個客戶應用之不同的功能。如將體會到的邏輯元件可以許多不同的方式來加以實現。在此方面，執行行動端點之功能之邏輯元件可實施於一積體電路組件中，其包括一或多個積體電路，其為與行動端點為—體的 15或者以其他方式通訊，或更具體地說，例如為行動端點之控制器36。積體電路之設計係藉由高度自動程序。在此方面，可得到複雜和強大的軟體工具用以轉換一邏輯層次之十為半導體電路設計，供姓刻和形成於一半導體基板上。這些軟體工具自動地繞線導體和定位元件於—半導體 20晶片上，其係使用良好建立之設計規則以及大的預先儲存之6又计拉組庫。一旦已完成半導體電路之設計，在一標準電子格式中之結果所得之設計（例如Opus，GDSII或類似者）可傳送給—半導體製造廠或“晶圓廠”以供製造。如於背景章節所指出的’在傳統的DTX技術中，包括 17 13.27852 舒適雜訊(CN)參數之SID框架係於空氣介面上以一固定速率於語音暫停期間傳送，諸如第1圖中所示的。然而在低傳送速率上，背景雜訊之頻譜和時間特性可能不正確地表示，造成背景雜訊之品質上之某些退化。然而，增加傳輸 5速率會減少DTX之好處’因為減少了語音和SID框架之整體傳輸速率。因此，根據本發明之示範性實施例，語音暫停期間之SID框架之傳輸速率，語音非主動期間或類似者可選擇性地以一目前雜訊值為基礎來加以控制，諸如目前的語音對背景雜訊（或訊雜）比（SNR) »如此，本發明之示範性實 10施例能夠較佳地以對訊號品質之減少的損害來實現減少平均資料速率之好處。現參考第5圖，其根據本發明之示範性實施例來以適應性地傳送CN參數之方法來說明不同的步驟（不失_般性地描述，如傳送於SID框架中）。如區塊68中所示的，在語音 15傳輸期間，行動端點1〇之語音編碼器58執行由麥克風2所產生之訊號之語音編碼，同時VAD 64分析那些訊號，諸如以上述之方式。又如上述，以訊號分析為基礎，VAD可產生一 VAD旗標，如此使得TX_DTX 6〇當VAD旗標設定時 (VAD=1)傳送正常語音框架，如區塊74和76中所示的。當 2〇 VAD旗標未設定時，TX_DTX傳送SID(無聲描述器）框架，其包括相關於背景雜訊之資訊’以在接收端上產生舒適雜訊(CN)。為根據本發明之示範性實施例來傳送SID框架，VAD 64(或其他行動端點實體）可計算或以其他方式評估一

18 1327852 SNR ’諸如以許吝吁夕不同方式之任一。例如在一示範性實施以主動（發聲和未發聲的）語音之長期能量 (ve)或僅以主動發聲語音之長期能量（LTE_)為基礎’以及Ί景雜訊之長期能量（卿_6)為基礎來評估 SNR(例如以分貝為單位來表示卜在這樣的情況中，VAD 可 10 藉由：先評估長期能量來評估蠢，諸如以許多不同方式之任:，如區塊70中所示的。例如，VAD可從VAD標記為“非主動，，之框架中（VAD=〇)來評估背景雜訊之長期能量。反之’VAD可從標記為“主動的，，(VAD= 1)之框架中評估主動語音之長期能量。或者，彻可僅從發聲之“主動的，，框架之主動語音來評估主動語音之長期能量。在這樣的情況中， VAD可應用-修正因子給這樣的發聲框架之能量，以藉此獲得主動語音之能量。 15 更具體地說，例如VAD 64(或其他行動端點實體）可藉由直接平均屬於相同活動類別（即非主動，主動等)之特定數目之框架之能量來評估背景雜訊或主動語音之長期能量。然而，為了考慮那二個訊號之大小之可能的演變，VAD亦可實現一遞歸方法。則對長期能量之遞歸評估來說，以目前之框架FrameEnergy之能量為基礎之典型之評估等式可 20 表示如下： LTEia alphaxLTEit (1 - alpha)xFrameEnergy ⑴ 對非主動框架之能量來說（當目前之框架為非主動時）；以及 19 1327852 =alphaxLTEvoiced Hl-alpha)xFmmeEnergy ⑺ 對發聲框架之能量來說(當目前框架為發聲時）。在等式⑴和(2)中吻ha表示具有介於_間之值之遺忘因子，其可為固定的或可變的(例如以能量演變為基礎）。 5更具體地說，例如值响可選擇為〇,99以增加雜訊大小或減少語音大小（緩慢的適應性修改）或者為⑽以減少雜訊大小或增加語音大小（快速適應性修改）。

已評估了主動或發聲語音之錢能量（LU mvoiced)和t景雜訊之長期能量(LTu，獅6何計 H)算或以其他方式來以個別之長期能量為基礎來評估該目前之SNR值’如區塊72中所示的。例如當VAD評估主動語音之長期能量時，VAD可根據下式來計算該目前之歐(以犯表示）： SNR ⑻=I〇.〇l〇g1()(LTEaetive/LTEinaetive) ⑶

15 另一方面，當VAD評估發聲語音之長期能量時，VAD 可直接地應用一修正因子至僅使用發聲框架之長期能量所評估之SNR，諸如根據下式： SNR ⑻=10.〇l〇glo(LTEactive/LTEinactive)-Delta (4) 在等式(4)中’ Delta表示一 SNR偏差。Delta SNR偏差可 2〇以許多不同方式之任一來設定，但在一示範性之實施例中’ Delta設至為28dB ’ 一先前實驗決定之值，來做為發聲樞架之長期能量和主動框架之長期能量間之比。在TX-DTX 60在一非主動期間内傳送一SID(無聲描述 20 1327852 器）框架(VAD=0)時，TX-DTX(或其他行動端點實體)可適應性地修改傳送SID框架之速率至目前之SNR值，諸如藉由線性地在一對應於一高SNR值之最小值和一對應於一低SNR 值之最大值之間改變該速率之方式。傳送SID框架之速率為 5 SID框架傳送之間隔之倒反。在此方面，TX-DTX可適應性地修改間隔SIDnuervai為目前之SNR值，或以其他方式以目前之SNR值為基礎來計算該間隔，如區塊78中所示的。例如根據一適應性修改技術，可線性地在一對應於一低SNR值 (SNRL0W)之一最小間隔值(INTmin)和一對應於一高snr值 10 (SNRHIGH)之一最大間隔值(INTMAX)之間來改變SID丨nterva丨之值。例如更具體地說’可適應性地修改SIDlnterva^至目前之SNR值，如下：

4.、订Umax _ 沉TMm、x(SNR(n、- SNR,nw ) 顺驗-織二 ⑹ 其中INTmin < SIDInterval < INTMAX。雖然在一示範性實 15施例中，可以許多不同之方式之任一來選擇該等值INTmin, SNRlow，ΙΝΤΜΑχ和SNRhigh ’但可如下選擇那些值： INTmin=12 SNRl〇w= 1 OdB INTmax=50

20 SNRHiGH=25dB 無論SIDInterval值究竟是如何適應性修改至目前的snr 直，TXD-DTX60(或者其他行動端點實體)可對在一非主動期間内之框架，以SID丨ntervai值為基礎來決定是否於該情況 21 \ 1327852 下傳送一SID框架或以黃他方式略過該框架。更具體地說，例如，對非主動期間内之框架來說，TX-DTX可先判斷是否已達到介於二連續SID框架之間之目前之間隔之末端，如區塊80中所示的》在此方面，若自TX-DTX傳送最後的SID框 5架之後已經過之框架週期之數目大於或等於值SIDlnterval，貝1JTX-DTX可傳送一新的SID框架，如區塊88中所示的。另外，VAD 64(或其他行動端點實體)可執行許多步驟來偵測快速的和/或重要的背景雜訊大小之變異，諸如Sid 間隔間（例如當尚未達到目前SID間隔之末端時），如區塊8〇 10 中所示的。更具體地說，例如，VAD可根據下列狀況來债測快速的和/或重要的背景雜訊大小之變異： 10.01og10(FrameEnergy) - 10.01ogIO(FrameEnergyLastSID) > MAXene^, ⑺ 其中FrameEnergyLastSm表示TX-DTX傳送之最後一個 15 SID框架之能量。又在先前指導中，MAXener_var表示最大能量變異，其可具有典型值4.0dB。或者，條件(7)中之能量量測可以其長期能5部份來取代以避免在背景雜訊之局部能量爆發上更新CNG模型，諸如根據下列條件(8): 10.01ogi〇(LTEinactive) - lO.OlogioCLTEina^^LastSID) > MAXENER VAr, 20 (8) 其中LTEinactjVe_LastSID表不最後一個SID框架之長期能量。然後，若條件(7)(或條件(8))符合的話，VAD可指導 TX-DTX(TX-DTX接收指示）來傳送一新的SID框架（參看區 22 1327852 塊88)。不然，目前要非主動框架被略過且TX-DTX不傳送一新的SID框架，如區塊86中所示的。

亦如所示，當VAD 64(或其他行動端點實體)偵測到一快速的和/或重要的變異時，VAD能夠但不必須重置背景雜 5 訊之長期能量LTEinaetive至目前框架之能量FrameEnergy，如區塊82中所示的。又，在TX-DTX 60被指示傳送一新的SID 框架之那些情況中，可但不必須重置最後一個傳送的SID框架之能量 FrameEnergyLastsm(對條件⑺）或 LTEinactive_LastSID (對條件（8))至目A框架之能量FrameEnergy，如區塊84中所不的。如上述，TX-DTX 60，VAD 64和其他行動端點實體對 ~~編碼訊號之每個框架執行上述之步驟。然而，在那些實體之第一操作之前，可初始化VAD和/或TX_DTX所使用之許多内部變數以供隨後使用。例如，發聲的和非主動框日長期月t* 量 LTEVC)iced 和LTEinactive可加以初始化至一預設值 (例如0)。又’ SID間隔值SIDinterval可被初始化至一預設值(例如8)。

再者，為了確定在測量長期能量以艮士^和，以及隨後SNR之測量上時考慮了足夠的框架，VAD料可使用二個發聲的和非主動框架之計數器。那些計數器隨後可初始化至一預設值(例如〇)。然後在操作期間，當評估等式 (1)或(2)之一執行時，對應的框架計數器增量一。因此，VAD 可組態來在二個計數器皆達到一最小值之前(例如5〇)壓抑 Sl〇間隔之適應性修改。 23 1327852 為了驗證本發明之示範性實施例之改進之效率，考慮在3GPP2 VMR-WB(變數速率多模式寬帶）中本發明之前述實施例之實現。表1比較對一傳統VMR_WB編碼器（“標準 DTX’’，對每8個非主動框架傳送之！ SH)框架），以及對一根據本發明之前述實施例組態之VMR_WB編碼器可變 DTX”)之DTX框架（即不*TX_DTX 6〇傳送之框架）之百分比。 VMR-WB 以 SNR=2〇dB SNR=10dB SNR=〇dB 標準DTX: 51.83% 48.95% 7.88% 可變DTX: 56.90% 51.75% 8.21% 增益 +5.07% +2.80% +0.33 表1

如可看到的’藉由實施例本發明之示範性實施例， K) TX-DTX可被控來於非主動期間内傳送較少的框架，且當 SNR增加時，較少框架之日分比增加。如此，本發明之: 範性實施例能夠進-步地減少平均資料速率，且減少對訊號品質之損害，因為在非主動期間内之傳送框架中之減少被耦合至SNR上之増加。 15 >上面參考本發明之示範性實施例所說明的，在語音暫停期間’語音非主動期間或類似者之迎框架之傳輸速率可選擇性地以目前的SNR為基礎來加以控制。然而，應了解到傳輸速率可以許多其他表示一目前擁訊值之值之任一或更多為基礎來選擇性地㈣，除了或取代目前之獄。 20例如，SID框架之傳輪速率可以一可從歡和一雜訊靜態量 24 1327852 測決定之目前雜訊值為基礎來選擇性地控制，諸如熟悉技藝之人士所熟知的。在這樣的情況中，系統與方法可如上述般操作’雖然如將體會到的，上面所給予之示範性值之一或更多可對應地加以修正。 5 雖然本發明之一示範性實施例已於上面顯示和描述，應了解到主動和非主動語音可分類和/或編碼，和/或sn)框架可以許多不同的方式之任_來產生而不違反本發明之精神與範圍。例如在一其他實施例中，一完整的“來源編碼器” 可置於麥克風42和射頻單元62之間以執行一語音編碼器 10 58，TX-DTX 60(包括CNG編碼器）和VAD 64之功能β在這樣一個實施例中，在主動語音期間，來源編碼器可對每個輸入語音框架來饋送射頻單元以一框架。另一方面，在非主動區段期間，CNG編碼器可時時饋送射頻單元以一框架，以目前之SNR值為基礎，諸如以上述之方式。然而， 15在此實施例中，SNR計算，SID更新速率適應性和傳送一新的SID框架之決定可全部以CNG編碼器來加以完成。為了進一步地了解本發明之示範性實施例之許多不同的觀點，請看下列參考之一或更多，其之全部之内容在此合併為參考文獻： 2〇增強全速率(EFR)語音訊務頻道之不連續傳輪(DTX)，第三代夥伴計劃，技術規格小組服務與系統觀點，3 Gpp 丁§ 46.081，2004年 12月； C.B. Southcott等人著’泛歐洲數位行動射無線系統之語音控制。全球電訊會議1989，以及90年代及之後之通訊 25 技術展示，CLOBECOM ’89，ΙΕΕΕ，27·30 1989 年 11 月 1070-1074 頁，vol.2 ; 適應性多速率（AMR)語音編碼；來源控制之速率操作’第三代夥伴計劃，技術規格小組服務與系統觀點，3GPP TS 26.093，2003年3月；以及適應性多速率-寬頻帶(AMR-WB)語音編碼；來源控制速率操作*第三代夥伴計劃，技術規格小組服務與系統觀點 ’ 3GPPTS 26.193，2004年 12月。根據本發明之一示範性觀點，系統之一或多個實體所執行之功能，諸如行動端點1〇 ’可以許多不同的裝置來執仃，諸如硬體和/或韌體，包括上述的那些，單獨地和/或在一電腦程式產品之控制之下。執行本發明之示範性實施例之或多個功能之電腦程式產品包括一電腦可讀取之儲存媒體’諸如非揮發性儲存媒體，和包括電腦可讀取之程式碼。P伤之軟體’諸如—系列電腦指令，其實施於電腦可讀取儲存媒體中者。統在此方面’第5圖為一根據本發明之示範性實施例之系 &和程式之流程圖。將了解到流程圖之每個區或步驟和&程圖中區塊之組合可以不同的裝置來實現，八。體體和/或軟體，其包括一或多個電腦程式指電腦或I體會到的任何這樣的⑽程式指令可載入於一 ^他可規劃之裝置·Μ即硬體) ，以產生一機器，如此現=行於電腦或其他可規劃之裝置上之指令建立用以實 '程圖區塊或步驟中所贿之功能之裝置。這些電腦 1327852 程式才曰令亦可儲存於_電腦可讀取之記憶體中，其可將一電腦或，、他可規劃之裝置導向為以一特定方式來作用，如 ^吏得儲存於電腦可讀取記憶體中之指令產生-製造物品’其包括實現在流程圖區塊或步釋中所描述之功能之指 5令裝置、。電腦程式指令亦可載入至一電腦或其他可規劃裝置、使#系列操作步驟執行於電腦或其他可規劃裝置上、產生f腦可貫現之程序，如此使得執行於電腦上或其他可規劃之裝置上之指令提供用以實現在流程圖區塊或步驟中所描述之功能之步驟。 10 目此’流程圖之區塊或步驟支援用以執行特定功能之裝置之組合，用以執行描述功能之步驟之組合，和用以執仃特疋功能之程式指令裝置。亦將了解到一或多個流程圖之區塊或者流程圖中之步驟及區塊或步驟之組合可以執行特定功能或步驟之特殊用途硬體為基礎之電腦系統，或特 15殊用途硬體和電腦指令之組合來加以實現。以前述描述為基礎，如以所附之圖式觀點讀取時，本發月之-些例子相關於—能夠適應性地傳送舒適雜訊(⑶）參數之系統應是明顯的。本發明之範例進一步相關於一適 2應性地傳送舒適雜訊(CN)參數之方法，其中該方法包含下 20列步驟：⑴實現不連續傳輸，其包括至少一主動期間和至少—非主動期間，其中實現不連續傳輸包括於至少一非主動期間之至少-情況下傳送至少一雜訊參數之集合；⑺評估目則雜訊值；以及(3)以目前之雜訊值為基礎來計算一門隔，其中雜訊參數之集合係於所計算之間隔上加以傳送 27 的。從前述描述和相關圖式所呈現之教導中獲得好處之孰 :技將想_，修改和其：π 並非受限於所揭示之特定實施例，以 =改，貫施例係預定包括於所附申請專利範圍之範圍、纽使祕定料，但它寵係-般性地和描述性地使用而非限制之目的。【圖式簡單說明】 10 第1圖為無聲描述器（SID)框架，其於語音通訊期間非主動週期期間内於一固定間隔上加以傳送；第2圖為根據本發明之—示範性實施例之一通訊系統之示意方塊圖’其包括-行動網路’―公共切換電話網路和一資料網路；第3圖為根據本發明之-示範性實施例之一行動端點 15 之示意方塊圖；第4圖為根據本發明之示範性實施例之不連續傳輸 (DTX)技術操作之一行動端點之功能性方塊圖；以及第5圖為一流程圖，其說明根據本發明之一示範性實施例適應性地傳送舒適雜訊參數之方法中之不同步驟。 20 【主要元件符號説明】 10··.端點 12.. .天線 14.. .基地臺 16…行動切換中心 2〇·.·公共切換電話網路 22，·.固定端點 24·..ΙΡ 網路 26...個別閘道 28 1327852

28...固定端點 50...揮發性記憶體 30...存取點 52...非揮發性記憶體 32...傳送器 54 …IR 34...接收器 56 …RF 36...控制器 58...語音編碼器 38...剩口八 60 …TX-DTX 40...振鈴 62...射頻單元 42...麥克風 64 …RX-DTX 44...顯示器 66...語音解碼器 46.. .鍵盤 48.. .51M 64...VAD 29

Claims

第95丨2丨673號申請案申請專利範圍修正 I 1月 ----iSjX2.l〇十、申請專利範圍： 1. 一種用以發送語音訊號的裝置，其包含—個處理器以及儲存可執行指令的_個記憶體，該等指令會響應處理器所做的執行而使得該裝置至少執行下列動作Μ 針對在—财連續發龍式巾之發⑼準ϋ個連音《，該發送包括在數餘音暫停貌^發送穿插著包括有數個舒適雜訊參數之數個訊框的數船吾音訊框；及接收代表目前雜訊程度的—個估算目前雜訊值；以選擇性地控制包括有數個舒適雜訊參數的該等訊框於數個語音暫停期間中基於該估算目前㈣值而被發送的速率。 / 額第1項之裝置，其中接收-個估算目前雜减的動作包含接收_個目前訊雜比，該目前訊雜比已基於作動5吾音的長期能量以及基於背景雜訊的長期能量而被估算。如㈣專利範圍第1項之襄置，其中接收-個估算目前 ==動作包含接收—個目前訊雜比’該目前訊雜比旦^個動發聲語音之長期能量與背景雜訊之長期能里的一個_以及基於細函數上所施因子而被估算。 " 如申請專利範圍第丨項之裝率之動作包含在該估算目置，其中選擇性地控制該速前雜訊值增加時減少該速

132.7852 率，並包含在該估算目前雜訊值減少時增加該速率。 5. 如申請專利範圍第1項之裝置，其中選擇性地控制該速率之動作包含在對應於一第一雜訊值的一個最小值和對應於一第二雜訊值的一個最大值之間改變該速率，其 5 中該第二雜訊值低於該第一雜訊值。 6. 如申請專利範圍第1項之裝置，其中選擇性地控制該速率之動作包含基於該估算目前雜訊值而計算一個間隔，其中包括有數個舒適雜訊參數的該等訊框係於所計算的該間隔被發送，並且其中，該記憶體針對在一個非 10 作動期間内的該等訊框而儲存可執行指令，該等指令響應於由該處理器所做的執行而使得該裝置更執行下列動作：判定是否已達到所計算的一個間隔的末端；若已達到所計算之該間隔之末端，則指示發送包括 15 有數個舒適雜訊參數的一個訊框；或若並未達到所計算的間隔之末端，則接收指示以為發送包括有數個舒適雜訊參數的一個訊框作準備。 7. 如申請專利範圍第6項之裝置，其中接收指示之動作包含為在當所檢測的一個背景雜訊程度變異超過一個最 20 大變異時發送包括有數個舒適雜訊參數的一個訊框而接收指示。 8. —種用以發送語音訊號的裝置，其包含：用以針對在一個不連續發送模式中之發送而準備數個語音訊號的至少一個裝置，該發送包括在數個語音 31 1327852 l!': 暫停期_發送穿插著包括有數個舒適雜訊參個訊框之數個語音訊框，該至少__崎置包含：

10 15

20 用以接收代表目前雜訊程度雜訊值的一第一裝置；以及的一個估算目前用以選擇性地控制包括有數個舒適雜訊的該等訊極於數個語音暫停期間中基於該估算目前雜訊值而被發送之速率的一第二裝置。目 9. -種包含處理器以及儲存可執行指令之記憶置，其中該等指令會響應於*該處理器所倣的執行、得該裝置至少執行下列動作：針對在一個不連續發送模式中之發送而準備數個語音訊號，該發送包括錄個語音暫停期間内發送穿插著包括有數個舒適雜訊參數之數個訊框的數個語音訊框；。接收一個語音訊號的一個估算目前雜訊值，該估算目則雜1值代表該語音訊號的目前雜訊程度；選擇性地控制包括有數個舒適雜訊參數的該等訊框於數個語音暫停期間内基於該估算目前雜訊值而被發送的速率。 10.如申請專利範圍第9項之裝置’其中接收—個估算目前雜訊值的動作包含接收一個目前訊雜比，該目前訊雜比已基於作動語音之長期能量以及基於背景雜訊的長期能量而被估該算。 U·如申請專利範圍第9項之裝置，其中選擇性控制該速率 32 ^/852 ^/852

10 15 20

年月之動作包含在該估算目前雜訊值增加時減少該速率，並包含在該估算目前雜訊值減少時增加該速率。 12.如申請專利範圍第9項之裝置，其中選擇性地控制該速率之動作包含在對應於一第一雜訊值的一個最小值和對應於一第二雜訊值的一個最大值之間改變該速率，其中該第二雜訊值低於該第一雜訊值。 13·—種用以發送語音訊號的裝置，其包含：一個發送器，用以於語音發送期間發送數個語音訊框’該發送器係組配來於數個語音暫停期間内發送穿插著包括有數個舒適雜訊參數之數個訊框的該等語音訊框，其中發送器係組配來以一個選擇性控制速率而於該等語音暫停期間内發送包括有該等舒適雜訊參數的該等訊框，該發送器係組配來在語音傳輸期間内的一或夕個情況下基於代表目前雜訊程度的一個估算目前雜訊值而選擇性地控制該速率。 14·如申請專利範圍第13項之裝置，其中該目前雜訊值包含一個目前訊雜比，並且其中該目前訊雜比係基於作動語音的長期能量以及基於背景雜訊的長期能量而被估算’其中該逮率係出於該目前訊雜比而被控制。 15♦如申請專利範圍第13項之裝置，其中該目前雜訊值包含一個目前訊雜比，並且其中該目前訊雜比係基於作動發聲語音之長期能量與背景雜訊之長期能量的一個函數以及基於在該函數上所施用的一個修正因子而被估 33 1327852

10 15

20 算，其中該速率係出於該目前訊雜比而被控制。 16. 如申請專利範圍第13項之裝置，其中該發送器係組配來在一個速率上發送包括有該等舒適雜訊參數的該等訊框，藉由在該估算目前雜訊值增加時減少該速率，以及藉由在該估算目前雜訊值減少時增加該速率，該速率被選擇性地控制。 17. 如申請專利範圍第13項之裝置，其中該發送器係組配來在一個速率上發送包括有該等舒適雜訊參數的該等訊框，藉由在對應於一第一雜訊值的一個最小值和對應於一第二雜訊值的一個最大值之間改變該速率，該速率被選擇性地控制，其中該第二雜訊值低於該第一雜訊值。 18. —種用以發送語音訊號之方法，其包含下列步驟：針對在一個不連續發送模式中之發送而準備數個語音訊號，該發送包括在數個語音暫停期間内發送穿插著包括有數個舒適雜訊參數之數個訊框的數個語音訊框；以及在該語音傳輸期間内的一或多個情況下，接收代表目前雜訊程度的一個估算目前雜訊值；以及選擇性地控制包括有數個舒適雜訊參數的該等訊框於數個語音暫停期間内基於該估算目前雜訊值而被發送的速率。 19. 如申請專利範圍第18項之方法，其中接收一個估算目前雜訊值之步驟包含接收一個目前訊雜比。 20. 如申請專利範圍第19項之方法，其中接收一個估算目前 34 1327852 —~gBnrrr 年月Q修(更)正冷換頁丨訊雜比之步驟包含接收一個目前訊雜比，該目前訊雜比已基於作動語音的長期能量以及基於背景雜訊的長期能量而被估算。 21. 如申請專利範圍第19項之方法，其中接收一個目前訊雜 5 比之步驟包含接收一個目前訊雜比，該目前訊雜比已基於作動發聲語音之長期能量與背景雜訊之長期能量的一個函數而被估算。 22. 如申請專利範圍第21項之方法，其中接收一個目前訊雜比之步驟包含針對已施用於該函數的一個修正因子而 10 接收一個目前訊雜比。 23. 如申請專利範圍第18項之方法，其中選擇性地控制該速率之步驟包含在該估算目前雜訊值增加時減少該速率，並包含在該估算目前雜訊值減少時增加該速率。 24. 如申請專利範圍第18項之方法，其中選擇性地控制該速 15 率之步驟包含在對應於一第一雜訊值的一個最小值和對應於一第二雜訊值的一個最大值之間改變該速率，其中該第二雜訊值低於該第一雜訊值。 25. 如申請專利範圍第18項之方法，其中選擇性地控制該速率之步驟包含基於該估算目前雜訊值而計算一個間 20 隔，包括有數個舒適雜訊參數的該等訊框係於所計算的的該間隔被發送，並且其中，針對在一個非作動期間内的該等訊框，該方法包含下列步驟：判定是否已達到所計算的一個間隔的末端；以及若已達到所計算之該間隔之末端的話，則指示發送 35 1327852

若並未達到所計算之該間隔的末端，則接收指示以發送包括有數個舒適雜訊參數的一個訊框。

26. 如申請專利範圍第25項之方法，其中接收指示之步驟包含為基於所檢測的一個背景雜訊程度變異發送包括有數個舒適雜訊參數的一個訊框而接收指示，該背景雜訊程度變異係基於介於一個目前訊框之能量和包括有數個舒適雜訊參數的一個最後發送訊框之能量之間的對數差而被檢測。 10 15 27. 如申請專利範圍第25項之方法，其中接收指示之步驟包含為基於所檢測的一個背景雜訊程度變異發送包括有數個舒適雜訊參數的一個訊框而接收指示，該背景雜訊程度變異係基於介於一個背景雜訊之長期能量與包括有數個舒適雜訊參數的一個最後發送訊框之長期能量間的對數差而被檢測。 28.如申請專利範圍第25項之方法，其中接收指示之步驟包含為在當所檢測的一個背景雜訊程度變異超過一個最大變異時發送包括有數個舒適雜訊參數的一個訊框而接收指示。 20 29. —種包含儲存有電腦可讀程式碼部份的電腦可讀儲存媒體之電腦程式產品，其中該電腦可讀程式部份會響應於由一個處理器所做的執行而使得一個裝置至少執行下列動作：針對在一個不連續發送模式中之發送而準備數個 36 1327852

10 15

語音訊號，該發送包括在數個語音暫停期間内發送穿插著包括有數個舒適雜訊參數之數個訊框的數個語音訊框；接收一個語音訊號的一個估算目前雜訊值，該估算目前雜訊值代表該語音訊號的目前雜訊程度；以及選擇性地控制包括有數個舒適雜訊參數的該等訊框於數個語音暫停期間内基於該估算目前雜訊值而被發送的速率。 30. 如申請專利範圍第29項之電腦程式產品，其中該第二可執行部份係組配來估算一個目前訊雜比，該目前訊雜比係基於作動語音的長期能量以及基於背景雜訊的長期能量而被估算。 31. 如申請專利範圍第29項之電腦程式產品，其中該第二可執行部份係組配來在該估算目前雜訊值增加時減少該速率，以及在該估算目前雜訊值減少時增加該速率。 32. 如申請專利範圍第29項之電腦程式產品，其中該第二可執行部份係組配來在對應於一第一雜訊值的一個最小值和對應於一第二雜訊值的一個最大值之間改變該速率，其中該第二雜訊值低於該第一雜訊值。 37