TWI327852B - System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission - Google Patents

System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission Download PDF

Info

Publication number
TWI327852B
TWI327852B TW095121673A TW95121673A TWI327852B TW I327852 B TWI327852 B TW I327852B TW 095121673 A TW095121673 A TW 095121673A TW 95121673 A TW95121673 A TW 95121673A TW I327852 B TWI327852 B TW I327852B
Authority
TW
Taiwan
Prior art keywords
noise
current
rate
voice
value
Prior art date
Application number
TW095121673A
Other languages
English (en)
Inventor
Steven Craig Greer
Philippe Gournay
Milan Jelinek
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Application granted granted Critical
Publication of TWI327852B publication Critical patent/TWI327852B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Description

九、發明說明: 【發明戶斤廣之技術領域3 發明領域 本發明之示範性實施例大致係關於用以不連續語音傳 輸之系統與方法’且更具體地說’係關於用以於不連續語 音傳輸期間,適應性地傳送舒適雜訊參數之系統與方法。 C先前技術3 發明背景 不連續傳輸(DTX)使用於行動通訊系統中,以於語音暫 停期間關閉無線傳送器。DTX之使用節省了行動臺中的功 率並增加了電池再充電間所需之時間。其亦減少了一般干 擾程度且如此改進傳輸品質。然而,在語音暫停期間,若 頻道完全地切斷的話,一般與語音一起傳送之背景雜訊亦 消失。結果為在通訊之接收端上不自然的聆聽音訊訊號(無 聲)。 取代於語音暫停期間完全地切斷傳輸,已發展了許多 技術,藉此產生特性化背景雜訊之參數並以一低速率於空 氣介面上之無聲描述符號(sn))框架中傳送。然後,可於接 收側上使用這些通常稱為舒適雜訊(CN)參數之參數,以再 生背景雜訊,其盡可能良好地反射在傳送側上之背景雜訊 之頻譜和時_容。舒適雜訊參數—般包括語音編碼參數 之子集合:具體地說為合成濾波器係數和增益參數。 傳统上,CN參數係於語音暫停期間,以一固定速率於 空亂介面上傳送’諸如第丨圖中所示的,其中包括這些參數 之SID忙架係於非主動語音期間内每四個框架加以傳送。更 八體地說例如在gsm胞元通訊系統之全速㈣)和增強 FR(EFR)語音頻道中,CN參數係以每24框架一次之速率傳 送(即每480百萬分之—秒)。這意指⑶參數僅每秒更新兩 -人另一方面,在適應性多速率(AMR)和寬帶AMR (AMR-WB)纟統巾’ Qsf參^^以每8個框帛—次之速率傳送 (即160百萬分之一秒)’ CN參數更新速率為約每秒6次。此 低傳輸速率無法精確地表示背景雜訊之頻譜和時間特性, 因此在DTX期間’背景雜訊品f上的—些退化是無法避免 的。然而,增加傳輸速率會減少DTX之好處,因減少了語 音和CN參數之整體傳輸速率。 C考务明内】 發明概要 考慮前述背景,本發明之示範性實施例提供用以適應 性傳送舒適雜訊(CN)參數之系統與方法,諸如在無聲描述 符號(SID)框架,CN參數訊息或類似中者(這些訊息在此稱 為SID框架而不失一般性)。根據本發明之示範性實施例, SID框架傳送之速率可以一目前雜訊值為基礎來適應性地 修改或以其他方式選擇性地加以控制,諸如目前的語音對 者厅、雜訊(或訊雜)比(SNR)。在此方面’在行動端點之操作 期間’一諸如語音活動偵測器之端點實體能夠評估目前之 SNR值。然後,以此SNR值為基礎,諸如一不連續傳輸(DTx) 傳送器(例如TX-DTX處理器)之行動端點實體可選擇性地 設定在一語音訊號之非主動期間内DTX傳送器傳送SID框 架之速率。例如’在一高SNR(如超過2〇dB)上’ TX-DTX處 理器1"組態為以較低頻率傳送SID框架(例如每50個框 架),以藉此實現平均資料速率之明顯減少,代價僅為少許 的性能退化。另一方面’在低SNR(例如20dB或以下), TX-DTX可組態來以較高頻率傳送SID框架(例如每12個框 架)’如此使得舒適雜訊可盡可能地維持自然。 根據本發明之一示範性實施例之一觀點,提供一裝 置,其包括用以於一不連續傳輸模式期間傳送語音訊號之 至少一實體,其包括於語音暫停期間内傳送穿插有包括舒 適雜訊參數之框架(例如Sid框架)之語音框架。該等實體包 括一用以評估目前雜訊值之第一實體(例如語音活動偵測 器-VAD)。例如,第一實體可適應性地以主動語音之一長期 能量為基礎及以背景雜訊之一長期能量為基礎來評估一目 前之訊雜比。又,例如,第一實體可適應性地以主動語音 之-長期能量及背景雜訊之__長期能量之函數為基礎,以 及以應用至該函數之修正因子為基礎來評估-目前之訊雜 比。 >除第-實體之外,該裝置包括—用以選擇性地控制以 該評估之目前賴料基礎於語音暫停顧㈣送包括舒 適雜訊參數之框架之速率之第二實體(例如TX-DTX)。例 如’第二實體可適應性地改為藉由改變介於—對應於一第 雜訊值之最j、值與—對應於低於該第_雜訊值之第二雜 訊值之最大_之料來選雜地控制料^第二實體可 適應性地改為藉由當評估的目前雜訊值增加時減少速率, 1327852 且當評估的目前擁訊值減少時增加速率來選擇性地控制速 率。
更具體地說’第二實體可適應性改為以評估的目前雜 訊值為基礎來計算—間隔(比例之倒反),如此使得包括舒適 5雜訊參數之框架於計算之間隔上傳送。對在非主動期間内 之框架來說,第二實體可進一步適應性改為判斷是否已抵 達一計算的間隔之末端,且若已抵達-計算間隔之末端的 話,傳送包括舒適雜訊參數之框架。另外,若尚未抵達〆 计异間隔之末端的話,第二實體可適應性改為接收指示來 0傳送包括舒適雜訊參數之框架,諸如若一偵測到的背景雜 訊大小變異超過一最大變異。 根據本發明之其他觀點,提供方法與電腦程式產品 ^上面所指出與下面所朗的,本發明之讀性實施例 15
J 、電腦程式產品可解決先前技術所識別之問 且可提供額外的好處。 圖式簡單說明 &性地描述了本發明,現將參考附圖,」 不—定依尺寸繪圖,其中: ’ 第1圖為無知述器(SI聊架,其於語音 主動週期期間内於一固定間隔上加以傳送; 第2圖為根據本發明之一示範性實施例之一通訊 =不意方塊圖,其包括-行動網路,-公共切換電㊉ 和一資料網路; 第3圖為根據本發明之一示範性實施例之—行動端點 V> 1327852 之示意方塊圖; 第4圖為根據本發明之示範性實施例之不連續傳輸 (DTX)技術操作之一行動無之魏性方塊圖;以及 第5圖為—流㈣’其說明根據本發明之-示範性實施 5例適紐轉骑雜財數之料巾之^同步驟。 c實施方式】 較佳實施例之詳細說明 現將於下文中參考於其中已顯示本發明之較佳實施例 之附圖來更完整地描述本發明。然而,本發明可實施於許 10多不同型式中且不應被理解為受限於在此提出之實施例; 而疋,提供這些實施例,如此使得本揭示内容將完整和完 全,且將完整地傳達本發明之範圍給熟悉技藝之人士。全 文中類似的數字指稱類似的元件。 參考第2圖,提供根據本發明之示範性實施例組態之一 15無線通訊網路之功能性說明。如第2圖中所示,本發明之示 範性實施例之網路包括一行動端點10,諸如一行動電話。 然而’應了解到’所說明及之後描述之行動電話僅說明從 本發明之示範性實施例獲得好處之行動端點之一型式,且 因此’不應用來限制本發明之範圍。在為了示範目的說明 20 及將於下文中描述行動端點之幾個實施例之同時,其他型 式之行動端點,諸如可攜式數位助理(PDA),呼叫器,追蹤 裝置’膝上型電腦和其他型式之語音和文字通訊系統,可 容易地使用本發明之示範性實施例。但本發明之示範性實 施例之系統與方法可與許多種類之其他系統連結使用,在 9
V 行動通訊業内者和行動通訊業之外者皆可。 如所示,一行動端點10包括一天線變換器12,其係用 以根據許多不同的無線通訊技術來傳送和接收訊號。更具 體地說,例如,行動端點可包括一用以在一或多個型式之 胞元網路,個人通訊服務(PCS)和類似者中傳送訊號至一基 地站或基地臺(BS) 14及從其接收訊號之天線轉換器。基地 臺為一胞元網路之一部份,其包括一行動切換中心(Msc) 16和其他操作胞元網路所需之單元。Msc能夠在行動端點 做呼叫和接收呼叫時,從行動端點安排呼叫和訊息之路徑 進和出》MSC亦控制當端點與胞元網路註冊時訊息進出行 動端點之饋送,並控制訊息對行動端點之進出一訊息中心 (未顯示)之饋送。如熟悉技藝之人士將體會到的,胞元網路 亦可稱為一公共陸地行動網路(pLMN)丨8。 PLMN 18能夠根據許多不同的胞元通訊技術來提供通 訊。在此方面,PLMN能夠根據許多第一代(1G),第二代 (2G),2.5G和/或第三代(3G)通訊技術之任一和/或許多其他 月&夠根據本發明之實施例來操作之胞元通訊技術之任一來 操作。例如,PLMN能夠根據GSM(全域行動通訊系統), IS-136(時域多向近接-TDMA),IS-95(劃碼多向近接 -CDMA) ’ Cdma2000 ’或奶证(增強資料GSM環境)通訊技 術來操作。另外地或其他地,PLMN_根據-或多個增強 3G無線通訊技術來操作,諸如高速封包資料(HRPD)通訊技 術,其包括例如—lXEV-DO(TIA/EIA/IS-856)和 / 或 1XEV-DV。再者,例如,pLMN*夠根據GpRS(一般射頻封 1327852 包服務),GPRS-基礎(例如通用行動電訊系統-umts)技術 或類似者來操作。 MSC 16 ’以及因此PLMN 18可耦合至一公共切換電話 網路(PSTN) 20 ’其繼而耦合至一或多個一般為多個之電路 5切換固定端點22,諸如線路和/或無線電話。PSTN能夠根據 許多不同技術之任一來提供音訊通訊。例如,PSTN可根據 劃時多工(TDM)技術,諸如64Kbps(CCIT),和/或脈衝碼調 變(PCM)技術,諸如56Kbps(ANSI)來操作。 PLMN 18(透過MSC 16)和PSTN 20可耦合至,電氣連接 10 至一封包切換網路’或以其他方式與之電氣通訊,該網路 諸如一網際網路協定(11>)網路24。在PLMN和PSTN可直接耗 合至IP網路之同時,在一實施例中,PLMN和PSTN藉由値 別閘道(GTW) 26間接地耦合至IP網路。IP網路可耦合至一 或多個封包切換固定端點28。另外,IP網路可耦合至一或 15 多個無線存取點(AP) 30,諸如一端點10之裝置可耦合至其 上。在此方面,端點可以許多不同方式之任一方式輕合至 AP,諸如根據一低功率射頻(LPRF)技術者,諸如無線局本 區域網路(WLAN)(例如IEEE 802.11),藍芽和/或超寬帶 (UWB)技術。 20 現參考第3圖,其說明一將從本發明之示範性實施例獲 利之行動端點1〇之方塊圖°行動端點包括許多不同的用以 根據本發明之示範性實施例’包括較具體顯示和在此描述 之那些來執行一或多個功能之裂置。然而應了解到,行動 端點可包括用以執行一或多個類似功能之其他的裝置,而 11 1327852 不逆反本發明之精神和範圍。更具體地說,例如如第3圖中 所示的,行動端點可包括一傳送器32,一接收器34,和諸 如-處理器’控㈣36或類似者之裝置,其分別提供訊號 給傳送器和接收器及從其接收訊號。這些訊號包括根據可 5應用胞元系統之空氣介面標準之發訊資訊,以及使用者語 音和/或使用者產生之資肖。在此方面,行動端點可以一或 多個空氣介面標準,通訊協定,調變型式和存取型式來操 作。更具體地說,行動端點能夠根據許多第一,第二和/或 第三代通訊協定或類似者之任一來操作。例如,行動端點 10能夠根據第二代(2G)無線通訊協定IS-136(TDMA),GSM和 IS-95(CDMA),以及如1XEV-DO和1XEV-DV之第三代協定 來操作。一些窄帶AMPS(NAMPS),以及TACS,行動端點 亦可從本發明之指導獲利,雙模或較高模式之電話(例如數 位/類比或TDMA/CDMA/類比電話)亦應如此。 15 應了解到控制器36包括用以實現行動端點1〇之音訊和 邏輯功能所需之電路。例如,控制器可由一數位訊號處理 器裝置’微處理器裝置,和許多不同的類比至數位轉換器, 數位至類比轉換器和其他支援電路構成。行動端點之控制 和訊號處理功能在這些裝置間根據其功能來加以指派。如 20 此,控制器亦包括在調變和傳送前迴旋編碼和内插訊息和 資料之功能設施。再者,控制器可包括操作一或多個可儲 存於記憶體中之軟體程式之功能設施。 行動端點10亦包含一使用者介面’其包括一傳統耳機 或喇叭38,一響鈴40,一麥克風42,一顯示器44,以及一 v> 12 1327852 使用者輸入介面,其之全部辑合至控制器36。允許行動端 點接收資料之使用者輸入介面可包括許多允許行動端點接 收資料之裝置之任〆,諸如一鍵盤46,一觸控顯示器(未_ 乔)或其他輸入裝置。在包括—鍵盤之實施例中,鍵盤包括 5傳統數字(〇-9)和相關按鍵(#,*)和其他用來操作行動端點之 按鍵° 行動端點10亦巧*包括記憶體,諸如一用戶識別模板 (SI]Vi)48,一可移除之使用者識別模組(R-UIM)或類似者, 其一般儲存相關於一行動用戶之資訊元件。除SIM之外,行 1〇 動端點1〇可包括其他記憶體。在此方面,行動端點可包括 揮發性記憶體50,諸如揮發性隨機存取記憶體(RAM),其 包栝一缓衝貯存區域’以供暫時儲存資料。行動端點亦可 包栝其他非揮發性記憶體52,其可嵌入和/或可為可移除 的。非揮發性記憶體可另外地或其他地包含一EEPROM, 15快閃記憶體或類似者。記憶體可儲存行動端點用來實現行 動端點之功能之許多片段之資訊和資料之任一。例如,記 憶體可包括一識別器,諸如一國際行動設備識別(JMEI) 碼,其能夠唯一地識別行動端點,諸如對MSC 16。 行動端點10可進一步包括一紅外線傳接器54,或其他 20本地資料轉移裝置,如此使得資料可與其他裝置分享和/或 從其獲,諸如透過一或多個Ap 30。資料之分享以及資料 之遠端分享亦可根據許多不同的技術來加以提供 。例如,
行動端點可包括一或多個射頻傳接器56,其能夠與其他射 頻傳接器來分享資料,且可藉此作用如一WLAN和/或WAN 13 "面’如在此所描述的。另外地或或者地’行動端點可使 用由藍芽特別利益小組所發展之藍芽無線技術來分享資 料。 現參考第4圖,其說明行動端點1〇之一功能性區塊圖, 其係根據本發明之示範性實施例之不連續傳輸(〇τχ)技術 來操作的。如所示,一麥克風42轉換一聲音為一電訊號, 其被供應給一語音編碼器58。語音編碼器執行語音編碼為 一較低速率,諸如以產生一或多個被轉移給一TX-DTX處理 器60之語音參數之方式。TX_DTX處理器繼而在每次於正常 傳輸模式巾舰語音贿,絲由麥克風所產生之訊號是 否«σ曰或僅有背景雜訊。語音框架被傳送給一射頻單 元62’其包含_傳接器和其他元件和射頻路徑所要求之功 此。射頻單7〇傳送語音框架如在射頻介面上之—射頻上聯 訊號至一BS 14,ΑΡ 30或類似者。 行動端點10可被命令為DTX模式,以由BS 14所傳送之 命令來做。當行動魅為在DTX模式㈣…語音活動债 測器(彻)64分析由麥克風42難生之訊號來判斷由麥克 風42所產生之訊號是否包含語音或僅有背景雜訊。例如如 根據GSMit訊技賴定義的,獅更具體地說係分析由麥 克風所產狀能量和簡改變。以其分析為基礎, 獅產生-VAD旗標,其之狀態指示訊號是否包括語音 (獅叫或僅有背景雜訊(她=〇)。旗標被設定時 (VAD 1) ’在傳送端上負責不連續傳輪之功能,即 處理器60(傳送DTX)傳送正t的語音框架。另—方面,當 1327852 VAD旗標未被設定(VAD=0)時,TX-DTX傳送SID(無聲描述 器)框架,其包括背景雜訊相關之資訊’以於接收端上產生 舒適雜訊(CN)。 當VAD旗標之狀態從設定改變為未設定時,即,當在 5 訊號中未偵測到語音時,TX-DTX 60在計算背景雜訊之參 數所需之一預先決定之數目之框架之後,從傳送由語音編 碼器58所傳遞之編碼語音框架切換為產生SID框架。在由 TX-DTX所傳遞至射頻單元62之框架之控制位元中之— SP(語音)旗標指示所傳送之框架是否包令—正常的語音樞 10架(SP=1)或一SID框架(SP=0)。射頻單元62在最後一個語音 框架之後,傳送一SID框架(SP=0),其之後終止對射頻路徑 之傳輸。TX-DTX處理器60在VAD旗標未設定時,繼續產生 包含雜訊資訊之SID框架給射頻單元,且射頻單元繼續饋送 這些框架給射頻路徑以更新在接收端上之雜訊參數。在許 15多不同的情況中,更新雜訊參數之這些SID框架可稱為舒適 雜訊更新(CNU)框架。當VAD 64稍後偵測到來自語音編碼 器58之參數之語音時,vAD設定VAD旗標以藉此將τχ·βΤχ 處理器導向為重新開始語音框架之連續傳輸(sp=1)。 TX-DTX處理器6〇產生SID框架,其表示背景雜訊不 20是藉由语音編碼器58轉換語音框架為SID框架之方式,就是 藉由使用或另外與在行動端點中之一分離的舒適雜訊產生 器(CNG)編碼器(未顯示)通訊之方式。例如,處理 器可選擇來自正常語音參數中提供有關背景雜訊之大小和 頻譜之資訊之那些參數做為雜訊參數。對應於許多語音框 15 架之持續時間之平均值可進一步包括於這些參數之内。每 框架可包含對應數目之參數,從其可計算對應於那 -。a杷架之持續時間之值。這些雜訊參數然後可於框 架中,以上述之方式來傳送至射頻路徑 。取代當VAD 64偵 5測到語音時,傳送所有另外傳送之參數,那些參數之-部 伤可由-SID碼字來取代,其包括一或多個二元零位元。其 他不必要的參數亦可編碼為值零。 在行動端點10之接收端上,射頻單元62從一BS 14, AP 30或類似者來接收—射頻下聯訊號(其包括 一下聯框架)。射 1〇頻單元將下聯框架與下聯訊號分離,並應用下聯框架至一 RX-DTX處S器64(接收DTX),其貞責在接收端上之不連續 傳輸。在行動端點在正常傳輸模式中之情況中,RX DTX 處理器前饋接收到的語音框架至一語音解碼器66,其執行 接收之參數之語音解碼》一解碼之語音訊號在一喇叭38上 15轉換成一音訊訊號。在行動端點在DTX模式中之情況中, RX-DTX處理器以許多不同的方式來處理從射頻單元接收 到的框架,一般視下聯框架包括一正常語音框架或一SID框 架而定。在此方面,RX_DTX可以框架之sp旗標為基礎來 判斷框架型式。當sp旗標設定時(SP=1),RX_DTX前送語音 20框架給语音解碼器。當SP旗標未設定時(SP=0),RX-DTX 移至一狀態,其中其不是傳送以SID框架傳送之接收到的舒 適雜訊(CN)參數為基礎所產生之編碼語音框架至語音解碼 器66,就是使用一内部CNG解碼器或以其他方式與在行動 端點中之一分離的CNG解碼器(未顯示)通訊,以直接提供— 16 1327852 訊號給·38。RX-DTX可在每次其触到一新的加框架 時,更新用來產生舒適雜訊之參數。語音解碼器藉由產生 -訊號來解碼語音錢’其包括“雜訊,,,該職係、由似 轉換成類似於在冑送端上所發生之音訊背景雜訊。如此避 5免了在DTX模式中會使聽者十分不喜之背景雜訊所傳達之 語音和完全無聲間之波動。 從相關於第3和4圖之一行動端點1〇之描述,應體會到 行動端點之元件可由許多不同之裝置來實現,諸如硬體和/ 或韌體,單獨地和/或在一電腦程式產品之控制之下的。一 10般來說,行動端點可包括一或多個邏輯元件或實體,其係 用以執行一或多個客戶應用之不同的功能。如將體會到 的邏輯元件可以許多不同的方式來加以實現。在此方面, 執行行動端點之功能之邏輯元件可實施於一積體電路組件 中,其包括一或多個積體電路,其為與行動端點為—體的 15或者以其他方式通訊,或更具體地說,例如為行動端點之 控制器36。積體電路之設計係藉由高度自動程序。在此方 面,可得到複雜和強大的軟體工具用以轉換一邏輯層次之 十為半導體電路設計,供姓刻和形成於一半導體基板 上。這些軟體工具自動地繞線導體和定位元件於—半導體 20晶片上,其係使用良好建立之設計規則以及大的預先儲存 之6又计拉組庫。一旦已完成半導體電路之設計,在一標準 電子格式中之結果所得之設計(例如Opus,GDSII或類似者) 可傳送給—半導體製造廠或“晶圓廠”以供製造。 如於背景章節所指出的’在傳統的DTX技術中,包括 17 13.27852 舒適雜訊(CN)參數之SID框架係於空氣介面上以一固定速 率於語音暫停期間傳送,諸如第1圖中所示的。然而在低傳 送速率上,背景雜訊之頻譜和時間特性可能不正確地表 示,造成背景雜訊之品質上之某些退化。然而,增加傳輸 5速率會減少DTX之好處’因為減少了語音和SID框架之整體 傳輸速率。因此,根據本發明之示範性實施例,語音暫停 期間之SID框架之傳輸速率,語音非主動期間或類似者可選 擇性地以一目前雜訊值為基礎來加以控制,諸如目前的語 音對背景雜訊(或訊雜)比(SNR) »如此,本發明之示範性實 10施例能夠較佳地以對訊號品質之減少的損害來實現減少平 均資料速率之好處。 現參考第5圖,其根據本發明之示範性實施例來以適應 性地傳送CN參數之方法來說明不同的步驟(不失_般性地 描述,如傳送於SID框架中)。如區塊68中所示的,在語音 15傳輸期間,行動端點1〇之語音編碼器58執行由麥克風2所產 生之訊號之語音編碼,同時VAD 64分析那些訊號,諸如以 上述之方式。又如上述,以訊號分析為基礎,VAD可產生 一 VAD旗標,如此使得TX_DTX 6〇當VAD旗標設定時 (VAD=1)傳送正常語音框架,如區塊74和76中所示的。當 2〇 VAD旗標未設定時,TX_DTX傳送SID(無聲描述器)框架, 其包括相關於背景雜訊之資訊’以在接收端上產生舒適雜 訊(CN)。 為根據本發明之示範性實施例來傳送SID框架,VAD 64(或其他行動端點實體)可計算或以其他方式評估一
18 1327852 SNR ’諸如以許吝 吁夕不同方式之任一。例如在一示範性實施 以主動(發聲和未發聲的)語音之長期能量 (ve)或僅以主動發聲語音之長期能量(LTE_)為基 礎’以及Ί景雜訊之長期能量(卿_6)為基礎來評估 SNR(例如以分貝為單位來表示卜在這樣的情況中 ,VAD 可 10 藉由:先評估長期能量來評估蠢,諸如以許多不同方式 之任:,如區塊70中所示的。例如,VAD可從VAD標記為“非 主動,,之框架中(VAD=〇)來評估背景雜訊之長期能量。反 之’VAD可從標記為“主動的,,(VAD= 1)之框架中評估主動語 音之長期能量。或者,彻可僅從發聲之“主動的,,框架之 主動語音來評估主動語音之長期能量。在這樣的情況中, VAD可應用-修正因子給這樣的發聲框架之能量,以藉此 獲得主動語音之能量。 15 更具體地說,例如VAD 64(或其他行動端點實體)可藉 由直接平均屬於相同活動類別(即非主動,主動等)之特定數 目之框架之能量來評估背景雜訊或主動語音之長期能量。 然而,為了考慮那二個訊號之大小之可能的演變,VAD亦 可實現一遞歸方法。則對長期能量之遞歸評估來說,以目 前之框架FrameEnergy之能量為基礎之典型之評估等式可 20 表示如下: LTEia alphaxLTEit (1 - alpha)xFrameEnergy ⑴ 對非主動框架之能量來說(當目前之框架為非主動 時);以及 19 1327852 =alphaxLTEvoiced Hl-alpha)xFmmeEnergy ⑺ 對發聲框架之能量來說(當目前框架為發聲時)。 在等式⑴和(2)中吻ha表示具有介於_間之值之遺 忘因子,其可為固定的或可變的(例如以能量演變為基礎)。 5更具體地說,例如值响可選擇為〇,99以增加雜訊大小或 減少語音大小(緩慢的適應性修改)或者為⑽以減少雜訊 大小或增加語音大小(快速適應性修改)。
已評估了主動或發聲語音之錢能量(LU mvoiced)和t景雜訊之長期能量(LTu,獅6何計 H)算或以其他方式來以個別之長期能量為基礎來評估該目前 之SNR值’如區塊72中所示的。例如當VAD評估主動語音 之長期能量時,VAD可根據下式來計算該目前之歐(以犯 表示): SNR ⑻=I〇.〇l〇g1()(LTEaetive/LTEinaetive) ⑶
15 另一方面,當VAD評估發聲語音之長期能量時,VAD 可直接地應用一修正因子至僅使用發聲框架之長期能量所 評估之SNR,諸如根據下式: SNR ⑻=10.〇l〇glo(LTEactive/LTEinactive)-Delta (4) 在等式(4)中’ Delta表示一 SNR偏差。Delta SNR偏差可 2〇以許多不同方式之任一來設定,但在一示範性之實施例 中’ Delta設至為28dB ’ 一先前實驗決定之值,來做為發聲 樞架之長期能量和主動框架之長期能量間之比。 在TX-DTX 60在一非主動期間内傳送一SID(無聲描述 20 1327852 器)框架(VAD=0)時,TX-DTX(或其他行動端點實體)可適應 性地修改傳送SID框架之速率至目前之SNR值,諸如藉由線 性地在一對應於一高SNR值之最小值和一對應於一低SNR 值之最大值之間改變該速率之方式。傳送SID框架之速率為 5 SID框架傳送之間隔之倒反。在此方面,TX-DTX可適應性 地修改間隔SIDnuervai為目前之SNR值,或以其他方式以目前 之SNR值為基礎來計算該間隔,如區塊78中所示的。例如 根據一適應性修改技術,可線性地在一對應於一低SNR值 (SNRL0W)之一最小間隔值(INTmin)和一對應於一高snr值 10 (SNRHIGH)之一最大間隔值(INTMAX)之間來改變SID丨nterva丨之 值。例如更具體地說’可適應性地修改SIDlnterva^至目前 之SNR值,如下:
4.、订Umax _ 沉TMm、x(SNR(n、- SNR,nw ) 顺驗-織二 ⑹ 其中INTmin < SIDInterval < INTMAX。雖然在一示範性實 15施例中,可以許多不同之方式之任一來選擇該等值INTmin, SNRlow,ΙΝΤΜΑχ和SNRhigh ’但可如下選擇那些值: INTmin=12 SNRl〇w= 1 OdB INTmax=50
20 SNRHiGH=25dB 無論SIDInterval值究竟是如何適應性修改至目前的snr 直,TXD-DTX60(或者其他行動端點實體)可對在一非主動 期間内之框架,以SID丨ntervai值為基礎來決定是否於該情況 21 \ 1327852 下傳送一SID框架或以黃他方式略過該框架。更具體地說, 例如,對非主動期間内之框架來說,TX-DTX可先判斷是否 已達到介於二連續SID框架之間之目前之間隔之末端,如區 塊80中所示的》在此方面,若自TX-DTX傳送最後的SID框 5架之後已經過之框架週期之數目大於或等於值SIDlnterval, 貝1JTX-DTX可傳送一新的SID框架,如區塊88中所示的。 另外,VAD 64(或其他行動端點實體)可執行許多步驟 來偵測快速的和/或重要的背景雜訊大小之變異,諸如Sid 間隔間(例如當尚未達到目前SID間隔之末端時),如區塊8〇 10 中所示的。更具體地說,例如,VAD可根據下列狀況來债 測快速的和/或重要的背景雜訊大小之變異: 10.01og10(FrameEnergy) - 10.01ogIO(FrameEnergyLastSID) > MAXene^, ⑺ 其中FrameEnergyLastSm表示TX-DTX傳送之最後一個 15 SID框架之能量。又在先前指導中,MAXener_var表示最大 能量變異,其可具有典型值4.0dB。或者,條件(7)中之能量 量測可以其長期能5部份來取代以避免在背景雜訊之局部 能量爆發上更新CNG模型,諸如根據下列條件(8): 10.01ogi〇(LTEinactive) - lO.OlogioCLTEina^^LastSID) > MAXENER VAr, 20 (8) 其中LTEinactjVe_LastSID表不最後一個SID框架之長期 能量。然後,若條件(7)(或條件(8))符合的話,VAD可指導 TX-DTX(TX-DTX接收指示)來傳送一新的SID框架(參看區 22 1327852 塊88)。不然,目前要非主動框架被略過且TX-DTX不傳送 一新的SID框架,如區塊86中所示的。
亦如所示,當VAD 64(或其他行動端點實體)偵測到一 快速的和/或重要的變異時,VAD能夠但不必須重置背景雜 5 訊之長期能量LTEinaetive至目前框架之能量FrameEnergy,如 區塊82中所示的。又,在TX-DTX 60被指示傳送一新的SID 框架之那些情況中,可但不必須重置最後一個傳送的SID框 架之能量 FrameEnergyLastsm(對條件⑺)或 LTEinactive_LastSID (對條件(8))至目A框架之能量FrameEnergy,如區塊84中所 不的。 如上述,TX-DTX 60,VAD 64和其他行動端點實體對 ~~編碼訊號之每個框架執行上述之步驟。然而,在那些實 體之第一操作之前,可初始化VAD和/或TX_DTX所使用之 許多内部變數以供隨後使用。例如,發聲的和非主動框日 長期月t* 量 LTEVC)iced 和LTEinactive可加以初始化至一預設值 (例如0)。又’ SID間隔值SIDinterval可被初始化至一預設值(例 如8)。
再者,為了確定在測量長期能量以艮士^和, 以及隨後SNR之測量上時考慮了足夠的框架,VAD料可使 用二個發聲的和非主動框架之計數器。那些計數器隨後可 初始化至一預設值(例如〇)。然後在操作期間,當評估等式 (1)或(2)之一執行時,對應的框架計數器增量一。因此,VAD 可組態來在二個計數器皆達到一最小值之前(例如5〇)壓抑 Sl〇間隔之適應性修改。 23 1327852 為了驗證本發明之示範性實施例之改進之效率,考慮 在3GPP2 VMR-WB(變數速率多模式寬帶)中本發明之前述 實施例之實現。表1比較對一傳統VMR_WB編碼器(“標準 DTX’’,對每8個非主動框架傳送之! SH)框架),以及對一根 據本發明之前述實施例組態之VMR_WB編碼器可變 DTX”)之DTX框架(即不*TX_DTX 6〇傳送之框架)之百分 比。 VMR-WB 以 SNR=2〇dB SNR=10dB SNR=〇dB 標準DTX: 51.83% 48.95% 7.88% 可變DTX: 56.90% 51.75% 8.21% 增益 +5.07% +2.80% +0.33 表1
如可看到的’藉由實施例本發明之示範性實施例, K) TX-DTX可被控來於非主動期間内傳送較少的框架,且當 SNR增加時,較少框架之日分比增加。如此,本發明之: 範性實施例能夠進-步地減少平均資料速率,且減少對訊 號品質之損害,因為在非主動期間内之傳送框架中之減少 被耦合至SNR上之増加。 15 >上面參考本發明之示範性實施例所說明的,在語音 暫停期間’語音非主動期間或類似者之迎框架之傳輸速率 可選擇性地以目前的SNR為基礎來加以控制。然而,應了 解到傳輸速率可以許多其他表示一目前擁訊值之值之任一 或更多為基礎來選擇性地㈣,除了或取代目前之獄。 20例如,SID框架之傳輪速率可以一可從歡和一雜訊靜態量 24 1327852 測決定之目前雜訊值為基礎來選擇性地控制,諸如熟悉技 藝之人士所熟知的。在這樣的情況中,系統與方法可如上 述般操作’雖然如將體會到的,上面所給予之示範性值之 一或更多可對應地加以修正。 5 雖然本發明之一示範性實施例已於上面顯示和描述, 應了解到主動和非主動語音可分類和/或編碼,和/或sn)框 架可以許多不同的方式之任_來產生而不違反本發明之精 神與範圍。例如在一其他實施例中,一完整的“來源編碼器” 可置於麥克風42和射頻單元62之間以執行一語音編碼器 10 58,TX-DTX 60(包括CNG編碼器)和VAD 64之功能β在這 樣一個實施例中,在主動語音期間,來源編碼器可對每個 輸入語音框架來饋送射頻單元以一框架。另一方面,在非 主動區段期間,CNG編碼器可時時饋送射頻單元以一框 架,以目前之SNR值為基礎,諸如以上述之方式。然而, 15在此實施例中,SNR計算,SID更新速率適應性和傳送一新 的SID框架之決定可全部以CNG編碼器來加以完成。 為了進一步地了解本發明之示範性實施例之許多不同 的觀點,請看下列參考之一或更多,其之全部之内容在此 合併為參考文獻: 2〇 增強全速率(EFR)語音訊務頻道之不連續傳輪(DTX), 第三代夥伴計劃,技術規格小組服務與系統觀點,3 Gpp 丁§ 46.081,2004年 12月; C.B. Southcott等人著’泛歐洲數位行動射無線系統之 語音控制。全球電訊會議1989,以及90年代及之後之通訊 25 技術展示,CLOBECOM ’89,ΙΕΕΕ,27·30 1989 年 11 月 1070-1074 頁,vol.2 ; 適應性多速率(AMR)語音編碼;來源控制之速率操 作’第三代夥伴計劃,技術規格小組服務與系統觀點,3GPP TS 26.093,2003年3月;以及 適應性多速率-寬頻帶(AMR-WB)語音編碼;來源控 制速率操作*第三代夥伴計劃,技術規格小組服務與系統 觀點 ’ 3GPPTS 26.193,2004年 12月。 根據本發明之一示範性觀點,系統之一或多個實體所 執行之功能,諸如行動端點1〇 ’可以許多不同的裝置來執 仃,諸如硬體和/或韌體,包括上述的那些,單獨地和/或在 一電腦程式產品之控制之下。執行本發明之示範性實施例 之或多個功能之電腦程式產品包括一電腦可讀取之儲存 媒體’諸如非揮發性儲存媒體,和包括電腦可讀取之程式 碼。P伤之軟體’諸如—系列電腦指令,其實施於電腦可讀 取儲存媒體中者。 統在此方面’第5圖為一根據本發明之示範性實施例之系 &和程式之流程圖。將了解到流程圖之每個區 或步驟和&程圖中區塊之組合可以不同的裝置來實現, 八。體體和/或軟體,其包括一或多個電腦程式指 電腦或I體會到的任何這樣的⑽程式指令可載入於一 ^他可規劃之裝置·Μ即硬體) ,以產生一機器,如此 現=行於電腦或其他可規劃之裝置上之指令建立用以實 '程圖區塊或步驟中所贿之功能之裝置。這些電腦 1327852 程式才曰令亦可儲存於_電腦可讀取之記憶體中,其可將一 電腦或,、他可規劃之裝置導向為以一特定方式來作用,如 ^吏得儲存於電腦可讀取記憶體中之指令產生-製造物 品’其包括實現在流程圖區塊或步釋中所描述之功能之指 5令裝置、。電腦程式指令亦可載入至一電腦或其他可規劃裝 置、使#系列操作步驟執行於電腦或其他可規劃裝 置上、產生f腦可貫現之程序,如此使得執行於電腦上 或其他可規劃之裝置上之指令提供用以實現在流程圖區塊 或步驟中所描述之功能之步驟。 10 目此’流程圖之區塊或步驟支援用以執行特定功能之 裝置之組合,用以執行描述功能之步驟之組合,和用以執 仃特疋功能之程式指令裝置。亦將了解到一或多個流程圖 之區塊或者流程圖中之步驟及區塊或步驟之組合可以執行 特定功能或步驟之特殊用途硬體為基礎之電腦系統,或特 15殊用途硬體和電腦指令之組合來加以實現。 以前述描述為基礎,如以所附之圖式觀點讀取時,本 發月之-些例子相關於—能夠適應性地傳送舒適雜訊(⑶) 參數之系統應是明顯的。本發明之範例進一步相關於一適 2應性地傳送舒適雜訊(CN)參數之方法,其中該方法包含下 20列步驟:⑴實現不連續傳輸,其包括至少一主動期間和至 少—非主動期間,其中實現不連續傳輸包括於至少一非主 動期間之至少-情況下傳送至少一雜訊參數之集合;⑺評 估目則雜訊值;以及(3)以目前之雜訊值為基礎來計算一 門隔,其中雜訊參數之集合係於所計算之間隔上加以傳送 27 的。 從前述描述和相關圖式所呈現之教導中獲得好處之孰 :技將想_,修改和其:π 並非受限於所揭示之特定實施例,以 =改,貫施例係預定包括於所附申請專利範圍之範 圍、纽使祕定料,但它寵係-般性地和描 述性地使用而非限制之目的。 【圖式簡單說明】 10 第1圖為無聲描述器(SID)框架,其於語音通訊期間非 主動週期期間内於一固定間隔上加以傳送; 第2圖為根據本發明之—示範性實施例之一通訊系統 之示意方塊圖’其包括-行動網路’―公共切換電話網路 和一資料網路; 第3圖為根據本發明之-示範性實施例之一行動端點 15 之示意方塊圖; 第4圖為根據本發明之示範性實施例之不連續傳輸 (DTX)技術操作之一行動端點之功能性方塊圖;以及 第5圖為一流程圖,其說明根據本發明之一示範性實施 例適應性地傳送舒適雜訊參數之方法中之不同步驟。 20 【主要元件符號説明】 10··.端點 12.. .天線 14.. .基地臺 16…行動切換中心 2〇·.·公共切換電話網路 22,·.固定端點 24·..ΙΡ 網路 26...個別閘道 28 1327852
28...固定端點 50...揮發性記憶體 30...存取點 52...非揮發性記憶體 32...傳送器 54 …IR 34...接收器 56 …RF 36...控制器 58...語音編碼器 38...剩口八 60 …TX-DTX 40...振鈴 62...射頻單元 42...麥克風 64 …RX-DTX 44...顯示器 66...語音解碼器 46.. .鍵盤 48.. .51M 64...VAD 29

Claims (1)

  1. 第95丨2丨673號申請案申請專利範圍修正 I 1月 ----iSjX2.l〇 十、申請專利範圍: 1. 一種用以發送語音訊號的裝置,其包含—個處理器以及 儲存可執行指令的_個記憶體,該等指令會響應 處理器所做的執行而使得該裝置至少執行下列動作Μ 針對在—财連續發龍式巾之發⑼準ϋ個 連音《,該發送包括在數餘音暫停貌^發送穿插 著包括有數個舒適雜訊參數之數個訊框的數船吾音訊 框; 及 接收代表目前雜訊程度的—個估算目前雜訊值;以 選擇性地控制包括有數個舒適雜訊參數的該等訊 框於數個語音暫停期間中基於該估算目前㈣值而被 發送的速率。 / 額第1項之裝置,其中接收-個估算目前 雜减的動作包含接收_個目前訊雜比,該目前訊雜比 已基於作動5吾音的長期能量以及基於背景雜訊的長期 能量而被估算。 如㈣專利範圍第1項之襄置,其中接收-個估算目前 ==動作包含接收—個目前訊雜比’該目前訊雜比 旦^個動發聲語音之長期能量與背景雜訊之長期能 里的一個_以及基於細函數上所施 因子而被估算。 " 如申請專利範圍第丨項之裝 率之動作包含在該估算目 置,其中選擇性地控制該速 前雜訊值增加時減少該速
    132.7852 率,並包含在該估算目前雜訊值減少時增加該速率。 5. 如申請專利範圍第1項之裝置,其中選擇性地控制該速 率之動作包含在對應於一第一雜訊值的一個最小值和 對應於一第二雜訊值的一個最大值之間改變該速率,其 5 中該第二雜訊值低於該第一雜訊值。 6. 如申請專利範圍第1項之裝置,其中選擇性地控制該速 率之動作包含基於該估算目前雜訊值而計算一個間 隔,其中包括有數個舒適雜訊參數的該等訊框係於所計 算的該間隔被發送,並且其中,該記憶體針對在一個非 10 作動期間内的該等訊框而儲存可執行指令,該等指令響 應於由該處理器所做的執行而使得該裝置更執行下列 動作: 判定是否已達到所計算的一個間隔的末端; 若已達到所計算之該間隔之末端,則指示發送包括 15 有數個舒適雜訊參數的一個訊框;或 若並未達到所計算的間隔之末端,則接收指示以為 發送包括有數個舒適雜訊參數的一個訊框作準備。 7. 如申請專利範圍第6項之裝置,其中接收指示之動作包 含為在當所檢測的一個背景雜訊程度變異超過一個最 20 大變異時發送包括有數個舒適雜訊參數的一個訊框而 接收指示。 8. —種用以發送語音訊號的裝置,其包含: 用以針對在一個不連續發送模式中之發送而準備 數個語音訊號的至少一個裝置,該發送包括在數個語音 31 1327852 l!': 暫停期_發送穿插著包括有數個舒適雜訊參 個訊框之數個語音訊框,該至少__崎置包含:
    10 15
    20 用以接收代表目前雜訊程度 雜訊值的一第一裝置;以及 的一個估算目 前 用以選擇性地控制包括有數個舒適雜訊 的該等訊極於數個語音暫停期間中基於該估算目 前雜訊值而被發送之速率的一第二裝置。 目 9. -種包含處理器以及儲存可執行指令之記憶 置,其中該等指令會響應於*該處理器所倣的執行、 得該裝置至少執行下列動作: 針對在一個不連續發送模式中之發送而準備數個 語音訊號,該發送包括錄個語音暫停期間内發送穿插 著包括有數個舒適雜訊參數之數個訊框的數個語音訊 框; 。 接收一個語音訊號的一個估算目前雜訊值,該估算 目則雜1值代表該語音訊號的目前雜訊程度; 選擇性地控制包括有數個舒適雜訊參數的該等訊 框於數個語音暫停期間内基於該估算目前雜訊值而被 發送的速率。 10.如申請專利範圍第9項之裝置’其中接收—個估算目前 雜訊值的動作包含接收一個目前訊雜比,該目前訊雜比 已基於作動語音之長期能量以及基於背景雜訊的長期 能量而被估該算。 U·如申請專利範圍第9項之裝置,其中選擇性控制該速率 32 ^/852 ^/852
    10 15 20
    年月 之動作包含在該估算目前雜訊值增加時減少該速率,並 包含在該估算目前雜訊值減少時增加該速率。 12.如申請專利範圍第9項之裝置,其中選擇性地控制該速 率之動作包含在對應於一第一雜訊值的一個最小值和 對應於一第二雜訊值的一個最大值之間改變該速率,其 中該第二雜訊值低於該第一雜訊值。 13·—種用以發送語音訊號的裝置,其包含: 一個發送器,用以於語音發送期間發送數個語音訊 框’該發送器係組配來於數個語音暫停期間内發送穿插 著包括有數個舒適雜訊參數之數個訊框的該等語音訊 框, 其中發送器係組配來以一個選擇性控制速率而於 該等語音暫停期間内發送包括有該等舒適雜訊參數的 該等訊框,該發送器係組配來在語音傳輸期間内的一或 夕個情況下基於代表目前雜訊程度的一個估算目前雜 訊值而選擇性地控制該速率。 14·如申請專利範圍第13項之裝置,其中該目前雜訊值包含 一個目前訊雜比,並且其中該目前訊雜比係基於作動語 音的長期能量以及基於背景雜訊的長期能量而被估 算’其中該逮率係出於該目前訊雜比而被控制。 15♦如申請專利範圍第13項之裝置,其中該目前雜訊值包含 一個目前訊雜比,並且其中該目前訊雜比係基於作動發 聲語音之長期能量與背景雜訊之長期能量的一個函數 以及基於在該函數上所施用的一個修正因子而被估 33 1327852
    10 15
    20 算,其中該速率係出於該目前訊雜比而被控制。 16. 如申請專利範圍第13項之裝置,其中該發送器係組配來 在一個速率上發送包括有該等舒適雜訊參數的該等訊 框,藉由在該估算目前雜訊值增加時減少該速率,以及 藉由在該估算目前雜訊值減少時增加該速率,該速率被 選擇性地控制。 17. 如申請專利範圍第13項之裝置,其中該發送器係組配來 在一個速率上發送包括有該等舒適雜訊參數的該等訊 框,藉由在對應於一第一雜訊值的一個最小值和對應於 一第二雜訊值的一個最大值之間改變該速率,該速率被 選擇性地控制,其中該第二雜訊值低於該第一雜訊值。 18. —種用以發送語音訊號之方法,其包含下列步驟: 針對在一個不連續發送模式中之發送而準備數個 語音訊號,該發送包括在數個語音暫停期間内發送穿插 著包括有數個舒適雜訊參數之數個訊框的數個語音訊 框;以及在該語音傳輸期間内的一或多個情況下, 接收代表目前雜訊程度的一個估算目前雜訊 值;以及 選擇性地控制包括有數個舒適雜訊參數的該 等訊框於數個語音暫停期間内基於該估算目前雜 訊值而被發送的速率。 19. 如申請專利範圍第18項之方法,其中接收一個估算目前 雜訊值之步驟包含接收一個目前訊雜比。 20. 如申請專利範圍第19項之方法,其中接收一個估算目前 34 1327852 —~gBnrrr 年月Q修(更)正冷換頁丨 訊雜比之步驟包含接收一個目前訊雜比,該目前訊雜比 已基於作動語音的長期能量以及基於背景雜訊的長期 能量而被估算。 21. 如申請專利範圍第19項之方法,其中接收一個目前訊雜 5 比之步驟包含接收一個目前訊雜比,該目前訊雜比已基 於作動發聲語音之長期能量與背景雜訊之長期能量的 一個函數而被估算。 22. 如申請專利範圍第21項之方法,其中接收一個目前訊雜 比之步驟包含針對已施用於該函數的一個修正因子而 10 接收一個目前訊雜比。 23. 如申請專利範圍第18項之方法,其中選擇性地控制該速 率之步驟包含在該估算目前雜訊值增加時減少該速 率,並包含在該估算目前雜訊值減少時增加該速率。 24. 如申請專利範圍第18項之方法,其中選擇性地控制該速 15 率之步驟包含在對應於一第一雜訊值的一個最小值和 對應於一第二雜訊值的一個最大值之間改變該速率,其 中該第二雜訊值低於該第一雜訊值。 25. 如申請專利範圍第18項之方法,其中選擇性地控制該速 率之步驟包含基於該估算目前雜訊值而計算一個間 20 隔,包括有數個舒適雜訊參數的該等訊框係於所計算的 的該間隔被發送,並且其中,針對在一個非作動期間内 的該等訊框,該方法包含下列步驟: 判定是否已達到所計算的一個間隔的末端;以及 若已達到所計算之該間隔之末端的話,則指示發送 35 1327852
    若並未達到所計算之該間隔的末端,則接收指示以 發送包括有數個舒適雜訊參數的一個訊框。
    26. 如申請專利範圍第25項之方法,其中接收指示之步驟包 含為基於所檢測的一個背景雜訊程度變異發送包括有 數個舒適雜訊參數的一個訊框而接收指示,該背景雜訊 程度變異係基於介於一個目前訊框之能量和包括有數 個舒適雜訊參數的一個最後發送訊框之能量之間的對 數差而被檢測。 10 15 27. 如申請專利範圍第25項之方法,其中接收指示之步驟包 含為基於所檢測的一個背景雜訊程度變異發送包括有 數個舒適雜訊參數的一個訊框而接收指示,該背景雜訊 程度變異係基於介於一個背景雜訊之長期能量與包括 有數個舒適雜訊參數的一個最後發送訊框之長期能量 間的對數差而被檢測。 28.如申請專利範圍第25項之方法,其中接收指示之步驟包 含為在當所檢測的一個背景雜訊程度變異超過一個最 大變異時發送包括有數個舒適雜訊參數的一個訊框而 接收指示。 20 29. —種包含儲存有電腦可讀程式碼部份的電腦可讀儲存 媒體之電腦程式產品,其中該電腦可讀程式部份會響應 於由一個處理器所做的執行而使得一個裝置至少執行 下列動作: 針對在一個不連續發送模式中之發送而準備數個 36 1327852
    10 15
    語音訊號,該發送包括在數個語音暫停期間内發送穿插 著包括有數個舒適雜訊參數之數個訊框的數個語音訊 框; 接收一個語音訊號的一個估算目前雜訊值,該估算 目前雜訊值代表該語音訊號的目前雜訊程度;以及 選擇性地控制包括有數個舒適雜訊參數的該等訊 框於數個語音暫停期間内基於該估算目前雜訊值而被 發送的速率。 30. 如申請專利範圍第29項之電腦程式產品,其中該第二可 執行部份係組配來估算一個目前訊雜比,該目前訊雜比 係基於作動語音的長期能量以及基於背景雜訊的長期 能量而被估算。 31. 如申請專利範圍第29項之電腦程式產品,其中該第二可 執行部份係組配來在該估算目前雜訊值增加時減少該 速率,以及在該估算目前雜訊值減少時增加該速率。 32. 如申請專利範圍第29項之電腦程式產品,其中該第二可 執行部份係組配來在對應於一第一雜訊值的一個最小 值和對應於一第二雜訊值的一個最大值之間改變該速 率,其中該第二雜訊值低於該第一雜訊值。 37
TW095121673A 2005-06-18 2006-06-16 System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission TWI327852B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US69142005P 2005-06-18 2005-06-18

Publications (1)

Publication Number Publication Date
TWI327852B true TWI327852B (en) 2010-07-21

Family

ID=37591556

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095121673A TWI327852B (en) 2005-06-18 2006-06-16 System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission

Country Status (12)

Country Link
US (1) US7693708B2 (zh)
EP (1) EP1897085B1 (zh)
JP (2) JP2008546341A (zh)
CN (1) CN101213591B (zh)
CA (1) CA2609945C (zh)
ES (1) ES2629727T3 (zh)
HK (1) HK1117631A1 (zh)
MY (1) MY144785A (zh)
PL (1) PL1897085T3 (zh)
TW (1) TWI327852B (zh)
WO (1) WO2006136901A2 (zh)
ZA (1) ZA200800461B (zh)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8284707B2 (en) * 2006-11-07 2012-10-09 Qualcomm Incorporated Hybrid power-saving mechanism for VoIP services
ES2394515T3 (es) * 2007-03-02 2013-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
CN101335003B (zh) 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
US8514754B2 (en) * 2007-10-31 2013-08-20 Research In Motion Limited Methods and apparatus for use in controlling discontinuous transmission (DTX) for voice communications in a network
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
US8374097B2 (en) * 2008-02-08 2013-02-12 Texas Instruments Incorporated Fast DRX for DL speech transmission in wireless networks
DE102008009718A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009720A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
KR101335417B1 (ko) * 2008-03-31 2013-12-05 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
EP2347619B1 (en) * 2008-10-16 2013-04-03 Telefonaktiebolaget L M Ericsson (PUBL) Apparatus and method of controlling sporadic transmissions of silence insertion descriptor (sid)
US8320553B2 (en) 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
EP2491548A4 (en) * 2009-10-19 2013-10-30 Ericsson Telefon Ab L M VOICE ACTIVITY METHOD AND DETECTOR FOR SPEECH ENCODER
KR20120034863A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 이동통신 단말기에서 오디오 신호 처리 방법 및 장치
CN102143605B (zh) * 2011-01-20 2016-02-24 中兴通讯股份有限公司 一种无线局域网中手机电视业务数据共享的方法和系统
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
CN103503062B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
CN103534754B (zh) * 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
US8751223B2 (en) * 2011-05-24 2014-06-10 Alcatel Lucent Encoded packet selection from a first voice stream to create a second voice stream
US8589153B2 (en) 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
EP2552172A1 (en) * 2011-07-29 2013-01-30 ST-Ericsson SA Control of the transmission of a voice signal over a bluetooth® radio link
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
US9065576B2 (en) * 2012-04-18 2015-06-23 2236008 Ontario Inc. System, apparatus and method for transmitting continuous audio data
US8868415B1 (en) * 2012-05-22 2014-10-21 Sprint Spectrum L.P. Discontinuous transmission control based on vocoder and voice activity
CA2894625C (en) * 2012-12-21 2017-11-07 Anthony LOMBARD Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
ES2688021T3 (es) 2012-12-21 2018-10-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adición de ruido de confort para modelar ruido de fondo a bajas tasas de bits
PL2959480T3 (pl) 2013-02-22 2016-12-30 Sposoby i urządzenia do ramek hangover transmisji przerywanej w kodowaniu dźwięku
US9179404B2 (en) * 2013-03-25 2015-11-03 Qualcomm Incorporated Method and apparatus for UE-only discontinuous-TX smart blanking
CN104217723B (zh) 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
KR102026792B1 (ko) * 2013-07-12 2019-09-30 삼성전자 주식회사 D2d 탐색 수행 방법 및 그 방법을 사용하는 단말
CN103687067A (zh) * 2013-12-27 2014-03-26 北京赢销通软件技术有限公司 一种基于无线网络的设备发现和实时通信的方法
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
CN104378474A (zh) * 2014-11-20 2015-02-25 惠州Tcl移动通信有限公司 一种降低通话输入噪音的移动终端及其方法
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
US10477470B2 (en) * 2016-02-08 2019-11-12 Qualcomm Incorporated Systems and methods for silent period operation during wireless communication
US11109440B2 (en) * 2018-11-02 2021-08-31 Plantronics, Inc. Discontinuous transmission on short-range packet-based radio links
US10855841B1 (en) * 2019-10-24 2020-12-01 Qualcomm Incorporated Selective call notification for a communication device
CN113571072B (zh) * 2021-09-26 2021-12-14 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI103700B1 (fi) 1994-09-20 1999-08-13 Nokia Mobile Phones Ltd Samanaikainen puheen ja datan siirto matkaviestinjärjestelmässä
FI110826B (fi) 1995-06-08 2003-03-31 Nokia Corp Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6519260B1 (en) * 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1204093A1 (en) * 2000-11-02 2002-05-08 Lucent Technologies Inc. Discontinuous comfort noise transmission
US7539615B2 (en) * 2000-12-29 2009-05-26 Nokia Siemens Networks Oy Audio signal quality enhancement in a digital network
US7768953B2 (en) 2001-10-19 2010-08-03 Interdigital Technology Corporation System for improved power savings during full DTX mode of operation in the downlink
KR100711280B1 (ko) * 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
US7027496B2 (en) 2003-04-04 2006-04-11 Nokia Corporation Method and apparatus providing unbiased signal-to-noise ratio estimation and its application to discontinuous transmission detection
US7587211B2 (en) * 2005-12-21 2009-09-08 Broadcom Corporation Method and system for adaptive multi rate (AMR) and measurements downlink adaptation

Also Published As

Publication number Publication date
ZA200800461B (en) 2008-12-31
JP2008546341A (ja) 2008-12-18
CN101213591B (zh) 2013-07-24
US7693708B2 (en) 2010-04-06
US20060293885A1 (en) 2006-12-28
MY144785A (en) 2011-11-15
JP5351206B2 (ja) 2013-11-27
ES2629727T3 (es) 2017-08-14
JP2011199875A (ja) 2011-10-06
WO2006136901A2 (en) 2006-12-28
CA2609945A1 (en) 2006-12-28
WO2006136901A3 (en) 2007-03-08
CA2609945C (en) 2012-12-04
EP1897085A2 (en) 2008-03-12
EP1897085B1 (en) 2017-05-31
PL1897085T3 (pl) 2017-10-31
CN101213591A (zh) 2008-07-02
HK1117631A1 (en) 2009-01-16

Similar Documents

Publication Publication Date Title
TWI327852B (en) System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
KR100468555B1 (ko) 무선 통신 시스템의 마이크로폰의 뮤팅
JP4110726B2 (ja) 聴力補正式の携帯電話機
CN102340599B (zh) 终端通话时的处理方法、终端以及处理系统
CN101990743B (zh) 用于话音呼叫的突发的不连续接收
US8432935B2 (en) Tandem-free intersystem voice communication
JP2008543194A (ja) オーディオ信号ゲイン制御装置及び方法
US6708147B2 (en) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US9642087B2 (en) Methods for reducing the power consumption in voice communications and communications apparatus utilizing the same
US20210272575A1 (en) Adaptive comfort noise parameter determination
JP2012514931A (ja) 統合インターネットプロトコル網のコーデックモード制御方法及び端末機
US9924303B2 (en) Device and method for implementing synchronous connection-oriented (SCO) pass-through links
KR20100030550A (ko) 원격통신 단말기
US7079838B2 (en) Communication system, user equipment and method of performing a conference call thereof
US7890142B2 (en) Portable telephone sound reproduction by determined use of CODEC via base station
Holma et al. Performance of adaptive multirate (AMR) voice in GSM and WCDMA
US9099095B2 (en) Apparatus and method of processing a received voice signal in a mobile terminal
US9154596B2 (en) Method and system for audio system volume control
JP2009027356A (ja) 通信装置
CN112334980B (zh) 自适应舒适噪声参数确定
JP2010130058A (ja) 無線電話機、無線電話機の制御方法、およびプログラム
EP1229518A1 (en) Speech recognition system, and terminal, and system unit, and method
JPH11122197A (ja) アラーム通知装置
JPWO2011039884A1 (ja) 音声通話装置
JPH1070425A (ja) 電話機