TWI390505B - 用於間斷傳輸及精確重製背景雜訊資訊之方法 - Google Patents
用於間斷傳輸及精確重製背景雜訊資訊之方法 Download PDFInfo
- Publication number
- TWI390505B TWI390505B TW095103828A TW95103828A TWI390505B TW I390505 B TWI390505 B TW I390505B TW 095103828 A TW095103828 A TW 095103828A TW 95103828 A TW95103828 A TW 95103828A TW I390505 B TWI390505 B TW I390505B
- Authority
- TW
- Taiwan
- Prior art keywords
- frame
- background noise
- transmitting
- state
- frames
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 72
- 230000005540 biological transmission Effects 0.000 title claims description 21
- 230000007704 transition Effects 0.000 claims description 35
- 238000001228 spectrum Methods 0.000 claims description 34
- 230000003595 spectral effect Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 17
- 230000001960 triggered effect Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 8
- 238000002156 mixing Methods 0.000 claims description 3
- 230000000087 stabilizing effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000008030 elimination Effects 0.000 description 5
- 238000003379 elimination reaction Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 101100476983 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SDT1 gene Proteins 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- Noise Elimination (AREA)
Description
本發明大體係關於網路通信。更明確地說,本發明係關於一種在無線通信系統中改良聲音品質、降低成本且提高效率同時降低頻寬要求的新穎且經改良之方法及裝置。
CDMA聲碼器使用一已知速率下之1/8訊框的連續傳輸來傳送背景雜訊資訊。需要丟棄或"消隱"大多數的此等1/8訊框以改良系統容量同時保持語音品質不受影響。因此,在此項技術中需要一種方法以便適當選擇並丟棄已知速率之訊框以減小傳送背景雜訊所需要的負擔。
鑒於上文,本發明的所描述之特徵大體係關於用於傳送背景雜訊的一或多種經改良之系統、方法及/或裝置。
在一實施例中,本發明包含一種傳送背景雜訊之方法,該方法包含以下步驟:傳輸背景雜訊;消隱用以傳送該背景雜訊之後續背景雜訊資料速率訊框;接收該背景雜訊且更新該背景雜訊。
在另一實施例中,傳送背景雜訊之方法進一步包含以下步驟:當藉由傳輸一新原型速率訊框而使該背景雜訊發生變化時,觸發該背景雜訊之更新。
在另一實施例中,傳送背景雜訊之方法進一步包含以下步驟:藉由對背景雜訊資料速率訊框濾波而觸發,將該背景雜訊資料速率訊框之能量與該等背景雜訊資料速率訊框
之平均能量比較,且若差異超出一臨限值則傳輸一更新背景雜訊資料速率訊框。
在另一實施例中,傳送背景雜訊之方法進一步包含以下步驟:藉由對背景雜訊資料速率訊框濾波而觸發,將該背景雜訊資料速率訊框之頻譜與背景雜訊資料速率訊框之平均頻譜比較,且若差異超出一臨限值則傳輸一更新背景雜訊資料速率訊框。
在另一實施例中,本發明包含一種用於傳送背景雜訊之裝置,其包含:一聲碼器,該聲碼器具有至少一個輸入及至少一個輸出,其中該聲碼器包含一具有至少一個輸入及至少一個輸出的解碼器以及一具有至少一個輸入及至少一個輸出的編碼器;至少一個智慧消隱裝置,其具有一記憶體以及至少一個輸入及至少一個輸出,其中該至少一個輸入之第一者可操作地連接至該聲碼器之該至少一個輸出,且該至少一個輸出可操作地連接至該聲碼器之該至少一個輸入;一去抖動緩衝器,其具有至少一個輸入及至少一個輸出,其中該至少一個輸出可操作地連接至該智慧消隱器之該至少一個輸入的第二者;及一網路堆疊,其具有至少一個輸入及至少一個輸出,其中該至少一個輸入可操作地連接至該去抖動緩衝器之該至少一個輸入且該至少一個輸入可操作地連接至該智慧消隱裝置之該至少一個輸出。
在另一實施例中,智慧消隱裝置經調適以執行儲存於記憶體中之一程序,該程序包含:傳輸背景雜訊,消隱用以傳送該背景雜訊之後續背景雜訊資料速率訊框,接收該背
景雜訊,及更新該背景雜訊之指令。
自下文的實施方式、申請專利範圍及圖式將易瞭解本發明之適用性的進一步範疇。然而,應瞭解儘管指示本發明之較佳實施例,但是僅以說明之方式給出實施方式及特定實例,因為熟習此項技術者將易瞭解本發明之精神及範疇內的各種變化及修改。
本文使用詞語"說明性"以意謂"充當一實例、例子或說明"。本文描述為"說明性"的任何實施例並非必須理解為較佳於或優於其它實施例。
在一全雙工會話期間,存在其中至少一方為"無聲"的許多例子。在此等"無聲"時間間隔期間,通道傳送背景雜訊資訊。背景雜訊資訊之適當通信為一影響涉及會話之雙方所感知的聲音品質之因素。在基於IP之通信中,當一方進入無聲時,可使用一封包向接收器發送指示該揚聲器已進入無聲且應重製或播放背景雜訊之訊息。可在每一無聲時間間隔開始時發送該封包。CDMA聲碼器使用已知速率下的1/8速率訊框之連續傳輸來傳送背景雜訊資訊。
陸上通訊線或纜線系統發送大多數的語音資料,因為不存在與用其它系統一樣多的對頻寬之限制。因此,可藉由連續發送全速率訊框來傳送資料。然而,在無線通信系統中,需要保留頻寬。在無線系統中保留頻寬之一個方法為減小所傳輸訊框之大小。舉例而言,許多CDMA系統連續發送1/8速率訊框以傳送背景雜訊。1/8速率訊框充當無聲
標誌訊框(無聲訊框)。與一全或半速率訊框相對比,藉由發送一較小訊框來保留頻寬。
本發明包含一種保留頻寬之裝置及方法,其包含丟棄或"消隱""無聲"訊框。丟棄或"消隱"大多數的此等1/8速率無聲(或背景雜訊)訊框改良系統容量同時將語音品質維持於可接受之水平。本發明之裝置及方法不限於1/8速率訊框,而是可用以選擇並丟棄用以傳送背景雜訊的已知速率之訊框以減小傳送該背景雜訊所需要之負擔。用以傳送背景雜訊之任何速率訊框可被認為是一背景雜訊速率訊框且可用於本發明中。因此,可用任何大小的訊框使用本發明,只要其用以傳送背景雜訊。此外,若背景雜訊在一無聲時間間隔中間發生變化,則本智慧消隱裝置更新通信系統以反映背景雜訊中之變化而不會顯著影響語音品質。
在CDMA通信中,當揚聲器進入無聲時,可使用一已知速率之訊框以便對背景雜訊編碼。在一說明性實施例中,將1/8速率訊框用於高資料速率(HDR)網際網路語音協定(VoIP)系統中。電信工業協會(TIA)標準IS-856描述了HDR,且其亦被稱為CDMA2000 1xEV-DO。在此實施例中,在一無聲週期期間每隔20毫秒(msec)發送一1/8速率訊框之連續串。此不同於全速率(速率1)、半速率(速率1/2)或四分之一速率(速率1/4)訊框,其可用以傳輸聲音資料。儘管1/8速率封包相對較小(意即,與全速率訊框相比具有較少位元),但是通信系統中之封包負擔可仍然相當大。因為排程器不可在聲音封包速率之間進行區分,所以此尤
為正確。排程器將系統資源分配至行動台以提供對資源之有效利用。舉例而言,最大產出量排程器藉由排程處於最佳無線電條件中之行動台而最大化單元產出量。循環排程器一次一個地將相同數目的排程槽分配至系統行動台。比例公平排程器以一按比例(使用者無線電條件)公平方式將傳輸時間指派至行動台。本方法及裝置可與許多類型之排程器一起使用,且不限於一個特定排程器。因為揚聲器通常在一會話之約60%為無聲,所以在無聲週期期間丟棄用以傳輸背景雜訊之大多數的此等1/8速率訊框藉由減小在此等無聲週期期間所傳輸之資料位元的總數量而提供系統容量增益。
語音品質通常不受影響的原因來自以此方式執行智慧消隱從而使得當需要時更新背景雜訊資訊的事實。除了增大容量以外,因為降低了頻寬要求,所以使用1/8速率訊框智慧消隱減小傳輸之總成本。在最小化對所感知之聲音品質之影響的同時實現所有此等改良。
本發明之智慧消隱裝置可與其中傳輸封包之任何系統(諸如許多聲音通信系統)一起使用。此包括(但不限於):與其它纜線系統進行通信之纜線系統,與其它無線系統進行通信之無線系統,及與無線系統進行通信之纜線系統。
背景雜訊之產生
在本文所描述之一說明性實施例中,存在兩個背景雜訊產生組份。此等組份包括雜訊之能級或音量及雜訊之譜頻特徵或"顏色"。圖1說明一產生背景雜訊35之裝置,背景
雜訊產生器10。將訊號能量15輸入至一雜訊產生器20。該雜訊產生器20為一小型處理器。其執行可導致其以一平均值為零之數字之隨機序列的形式輸出白雜訊25之軟體。將此白雜訊輸入至一線性預測係數(LPC)濾波器或線性預測編碼濾波器30。亦將LPC係數72輸入至LPC濾波器30。此等係數72可來自一碼簿登錄項71。LPC濾波器30使背景雜訊35之頻率特性成形。背景雜訊產生器10為對傳輸背景雜訊35之所有系統的概括,只要其使用音量及頻率來表示背景雜訊35。在一較佳實施例中,背景雜訊產生器10位於鬆弛碼激發線性預測(RCELP)解碼器40中,該鬆弛碼激發線性預測(RCELP)解碼器40位於聲碼器60之解碼器50中。參看圖2,其為使用1/8速率訊框70來播放雜訊35的具有鬆弛碼激發線性預測(RCELP)解碼器40的解碼器50之頂層圖。
在圖2中,將一封包訊框41及一封包類型訊號42輸入至一訊框錯誤偵測裝置43。亦將該封包訊框41輸入至RCELP解碼器40。該訊框錯誤偵測裝置43將一速率決策信號44及一訊框消除旗標訊號45輸出至RCELP解碼器40。RCELP解碼器40將一原始合成語音向量46輸出至一後濾波器47。該後濾波器47輸出一濾波後合成語音向量訊號48。
產生背景雜訊之此方法不限於CDMA聲碼器。多種其它語音聲碼器可應用傳送背景雜訊之此方法,該等其它語音聲碼器諸如增強型全速率(EFR)、自適應多速率(AMR)、增強型可變速率編解碼器(CODEC)(EVRC)、G.727、G.728及G.722。
儘管對於在一無聲時間間隔期間的背景雜訊89及對於在一會話期間的聲音而言,存在無限數目之能級及譜頻特性,但是通常可藉由一有限(相對較小)數目之值來描述無聲時間間隔期間的背景雜訊89。為了減小用於傳送背景雜訊資訊所需要之頻寬,可對特定系統之頻譜及能量雜訊資訊進行量化並將其編碼入儲存於一或多個碼簿65中之碼簿登錄項71、73中。因此,通常可藉由此等碼簿65中的有限數目之登錄項71、73來描述在無聲時間間隔期間出現的背景雜訊35。舉例而言,用於增強型可變速率編解碼器(EVRC)系統中之碼簿登錄項73可含有256個不同功率之1/8速率常數。通常,在EVRC系統內傳輸之任何雜訊將具有一對應於此等256個值之一者的功率位準。此外,每一數字解碼成3個功率位準,每一者用於一EVRC訊框內之每一子訊框。類似地,EVRC系統將含有一有限數量之登錄項71,其對應於與編碼之背景的雜訊35相關聯之頻譜。
在一實施例中,位於聲碼器60中之編碼器80可產生碼簿登錄項71、73。圖3中說明此。最終可將碼簿登錄項71、73解碼成初始值之一相當準確的近似值。一般技術者亦將認識到:用於雜訊編碼及重製的碼簿65中之容能15及頻率"顏色"係數72的用途可擴展至若干類型之聲碼器60,因為許多聲碼器60使用等效模式傳輸雜訊資訊。
圖3說明可用於本發明中之編碼器80之一實施例。圖3中,將兩個訊號輸入至編碼器80,語音訊號85及一外部速率命令107。將語音訊號或脈碼調變(PCM)語音樣本(或數
位訊框)85輸入至聲碼器60中之訊號處理器90,其將對訊號85進行高通濾波及自適應雜訊抑制濾波。將經處理或經濾波之脈碼調變(PCM)語音樣本95輸入至一模型參數估計器100,其判定是否偵測到聲音樣本。該模型參數估計器100將模型參數105輸出至一第一開關110。語音可界定為聲音與無聲之組合。若偵測到聲音(有效語音)樣本,則該第一開關110將模型參數105導引至一全或半速率編碼器115,且聲碼器60在一格式化封包125中以全或半速率訊框117輸出該等樣本。
若具有來自模型參數估計器100之輸入的速率判定器122決定對一無聲訊框編碼,則第一開關110將模型參數105導引至一1/8速率編碼器120,且聲碼器60輸出1/8速率訊框參數119。封包格式化模組124含有將該等參數119置入格式化封包125中之裝置。若如所說明地產生1/8速率訊框70,則聲碼器60可輸出一封包125,其含有對應於聲音或無聲樣本85之能量(FGIDX)73或頻譜能量值(LSPIDX1或LSPIDX2)71之碼簿登錄項。
速率判定器122應用聲音活動偵測(VAD)方法及速率選擇邏輯來判定待生成的封包之類型。將模型參數105及一外部速率命令訊號107輸入至速率判定器122中。速率判定器122輸出一速率決策信號109。
1/8速率訊框
在圖4中,160個PCM樣本表示一語音片段89,在此情況下,其由取樣20毫秒之背景雜訊而產生。將該等160個
PCM樣本分成三個區塊86、87及88。區塊86及87之長度為53個PCM樣本,而區塊88之長度為54個PCM樣本。可藉由一1/8速率訊框70表示該等160個PCM樣本,且因此可表示20毫秒之背景雜訊89。在一說明性實施例中,一1/8速率訊框70可含有高達16位元之資訊。然而,位元之數目可取決於系統之特定用途及要求而變化。在一例示性實施例中使用EVRC聲碼器60以將16位元分配入三個碼簿65中。圖4中說明此。最初8位元LSPIDX1(4位元)及LSPIDX2(4位元)表示經編碼之雜訊35的頻率成分,意即,重製背景雜訊35所需要之頻譜資訊。第二組8位元FGIDX(8位元)表示雜訊35之音量內容,意即,重製背景雜訊35所需要之能量。因為碼簿中僅含有有限數目之潛在容能,所以可藉由碼簿中之登錄項73表示此等音量之每一者。某些實施例之該登錄項73為8位元長。類似地,可藉由來自兩個不同碼簿之兩個登錄項71表示譜頻資訊。該兩個登錄項71的每一者較佳地大小上為4位元長。因此,該等16位元之資訊為用以表示雜訊35之音量及頻率特性的碼簿登錄項71、73。
在圖4中所展示之說明性實施例中,FGIDX碼簿登錄項73含有用以表示無聲樣本中之能量的能量值。LSPIDX1碼簿登錄項71含有"低頻率"頻譜資訊,且LSPIDX2碼簿登錄項71含有用以表示無聲樣本中之頻譜的"高頻率"頻譜資訊。在另一實施例中,將碼簿儲存於位於聲碼器60中之記憶體130中。記憶體130亦可位於聲碼器60之外部。在另一實施例中,含有碼簿的記憶體130可位於智慧消隱裝置或
智慧消隱器140中。圖5a中說明此。因為碼簿中之值不會改變,所以記憶體130可為ROM記憶體,儘管可使用任何許多不同類型之記憶體,諸如RAM、CD、DVD、磁芯等。
消隱1/8速率訊框
在一例示性實施例中,可將消隱1/8速率訊框70的方法在傳輸設備150與接收設備160之間分配。圖5A中展示此。在此實施例中,傳輸器150選擇背景雜訊之最佳表示且將此資訊傳輸至接收器160。傳輸器150追蹤取樣之輸入背景雜訊89中的變化,且使用觸發175(或其它通知之形式)判定何時更新雜訊訊號70並將此等變化傳送至接收器160。接收器160追蹤會話之狀態(通話、無聲),且用傳輸器150所提供之資訊產生"精確"背景雜訊35。可以多種方法實施消隱1/8速率訊框70之方法,如同,例如藉由使用邏輯電路、類比及/或數位電子產品、電腦執行之指令、軟體、韌體等。
圖5A亦說明其中可將解碼器50及編碼器80可操作地耦接於一單個裝置中的實施例。已在解碼器50及編碼器80周圍置放一虛線以表示聲碼器60內找到兩個設備。解碼器50及編碼器80亦可位於獨立裝置中。解碼器50為用於將一訊號自數位表示轉譯成合成語音訊號之設備。編碼器80將一取樣之語音訊號轉譯成壓縮且/或封包之數位表示。在一較佳實施例中,編碼器80將取樣之語音或PCM表示轉換成聲碼器封包125。一個此編碼表示可為數位表示。此外,在
EVRC系統中,許多聲碼器60具有一位於編碼器80中之高帶通濾波器,其具有約120 Hz之截止頻率。該截止頻率可隨不同聲碼器60而變化。
此外,在圖5A中,智慧消隱裝置140位於聲碼器60之外部。然而,在另一實施例中,可在聲碼器60之內部找到智慧消隱裝置140。參看圖5B。因此,可將消隱裝置140與聲碼器60整合為聲碼器裝置60之部分或可將其定位為一獨立裝置。如圖5A中所示,智慧消隱裝置140接收來自去抖動緩衝器180之聲音及無聲封包。去抖動緩衝器180執行許多功能,其中之一為將語音封包以如其被接收之次序而安置。網路堆疊185可操作地耦接接收器160的去抖動緩衝器180與自傳輸器150耦接至編碼器80的智慧消隱裝置邏輯區塊140。網路堆疊185用來將傳入訊框導引至其為其中之一部分之設備的解碼器50,或將訊框導引至另一設備的開關電路。在一較佳實施例中,堆疊185為一IP堆疊。可在不同通信通道上實施該網路堆疊185,且在一較佳實施例中該網路堆疊185結合無線通信通道而實施。
因為圖5A中所展示之兩個行動電話均可傳輸語音或接收語音,所以將智慧消隱裝置分裂成兩個區塊用於每一電話。如下文所討論關於特定的施行,語音之傳輸器150及接收器160皆可執行智慧消隱的程序。因此,可操作地耦接至解碼器50的智慧消隱裝置140為接收器160執行此等程序,而可操作地耦接至編碼器的智慧消隱裝置140為傳輸器150執行此等程序。
應指出,每一行動電話使用者既傳輸語音(發言)又接收語音(聆聽)。因此,智慧消隱裝置140亦可為一個位於執行傳輸及接收步驟之每一行動電話上的區塊或裝置。圖5C中說明此。在一較佳實施例中,智慧消隱裝置140為一微處理器,或可用以處理資訊、執行指令等的任何許多類比及數位器件,及類似物。
而且,時間規整器190可與智慧消隱裝置140一起使用。語音時間規整為擴展或壓縮語音片段之持續時間而不會顯著降級其品質的行為。圖5D及圖5E中說明時間規整,其分別展示一壓縮之語音片段192及一擴展之語音片段194的實例。圖5F展示包括時間規整器190功能的一端對端通信系統之施行。
在圖5D中,在語音片段89中之位置195,其中找到最大相關之位置係用作偏移。為了壓縮語音樣本,將某些片段重疊添加196,而如來自初始片段197複本其餘樣本。在圖5E中,位置200為找到最大相關之位置(偏移)。來自先前訊框之語音片段89a具有160個PCM樣本,而來自當前訊框之語音片段89b具有160個PCM樣本。為了擴展語音片段,將片段重疊添加202。經擴展之語音片段194為160個PCM樣本減去偏移樣本之數目,加上另外160個PCM樣本的總和。
對1/8速率訊框分類
1.過渡1/8速率訊框
在該說明性實施例中,可根據訊框在話音突峰之後的定
位對其分類。可將緊隨話音突峰之訊框稱為"過渡"。除背景雜訊89之外,其可含有某些殘餘聲音能量,或其可因為聲碼器聚合操作,如同,例如,當編碼器仍在估計背景雜訊時,而不準確。因此,此等訊框內所含有的資訊可不同於"雜訊"之當前平均音量位準。此等過渡訊框205可能不是無聲週期期間的"真實背景雜訊"之良好實例。另一方面,穩定訊框210含有平均音量位準中所反映之最小數量的聲音殘餘。
圖6及圖7展示兩個不同語音環境的無聲週期之開始。圖6含有來自一電腦之托架的雜訊之19條曲線,其中展示若干無聲週期之開始。每一曲線表示一試驗之結果。y軸表示相對於平均能量212的訊框能量增量。x軸表示訊框數目214。圖7含有來自在一多風日行走的雜訊之9個曲線,其中展示若干無聲週期之無聲的開始。y軸表示相對於平均能量212之訊框能量增量。x軸表示訊框數目214。
圖6展示一語音樣本,其中可認為1/8速率訊框70之能量在第二訊框之後為"穩定"。圖7展示在許多該等曲線中,樣本需用4個以上的訊框以便將訊框之能量聚合為一表示無聲時間間隔之值。當人停止發言,其聲音不會突然停止而是逐漸降低至無聲。因此需用幾個訊框以便將雜訊訊號沉降至一恆定值。因此,最初的幾個訊框為過渡的,因為其包括某些聲音殘餘或因為聲碼器設計。
2.穩定雜訊訊框
可將一無聲時間間隔期間在"過渡"雜訊訊框205之後的
彼等訊框稱為"穩定"雜訊訊框210。如上文所陳述,此等訊框顯示來自最後之話音突峰的最小影響,且因此提供對取樣之輸入背景雜訊89之良好表示。熟習此項技術者將認識到穩定背景雜訊35為一相對術語,因為背景雜訊35可顯著變化。
自穩定訊框分化過渡
存在用於自穩定1/8速率訊框210分化過渡1/8速率訊框205之若干方法。下文描述兩個此等方法。
固定計時器辨別
在一實施例中,可認為已知速率之最初N個訊框為過渡。舉例而言,對多個語音片段89之分析展示,存在可認為1/8速率訊框70在第五訊框之後為穩定的較高可能性。參看圖6及圖7。
差異辨別
在另一實施例中,傳輸器150可儲存穩定1/8速率訊框210的經濾波之能量值,且將其用作參考。在話音突峰之後,認為編碼之1/8速率訊框70為過渡直至其能量降低至該經濾波之值的增量之內。通常不比較頻譜,因為通常若訊框70之能量已聚合,則存在其頻譜資訊亦已聚合之較高可能性。
然而,存在背景雜訊35之特徵可自一個無聲週期至另一無聲週期而顯著變化的可能性,其導致穩定1/8速率訊框210具有不同於傳輸器150當前所儲存之值的經濾波之能量值。因此,編碼之1/8速率訊框的能量可不會降低至經濾
波之值的增量之內。為了解決此問題,亦可使用聚合超時以使得差異辨別方法更為穩固。因此,可認為差異方法為固定計時器方法之增強。
智慧消隱方法
在一實施例中,可使用一種使用過渡訊框值205之消隱1/8資料速率訊框或1/8速率訊框的方法。在另一實施例中,可使用穩定訊框值210。在一第三實施例中,一種消隱之方法可使用一"原型1/8速率訊框"215的用途。在此第三實施例中,該原型1/8資料速率訊框215用於在接收器側160處重製背景雜訊35。作為一說明,在初始化程序期間,可認為最初傳輸或接收之1/8速率訊框70為"原型"訊框215。原型訊框215表示正被傳輸器150消隱的另一1/8速率訊框70。只要取樣之輸入背景雜訊89變化,傳輸器150即將一已知值的新原型訊框215發送至接收器160。因為發送較少訊框,所以每一使用者將要求較少頻寬,從而可增大總容量。
傳輸器側智慧消隱方法
在該說明性實施例中,傳輸器側150傳輸話音突峰之後的至少最初N個過渡1/8速率訊框205。然後其消隱無聲時間間隔中的剩餘1/8速率訊框70。測試結果指示,僅發送一個訊框產生良好結果,且發送一個以上訊框可不足以改良品質。在另一實施例中,除最初一個或兩個過渡訊框之外,亦可傳輸後續過渡訊框205。
對於不可靠通道(高PER)中之操作,傳輸器150可在發送最後過渡1/8速率訊框205之後發送原型1/8速率訊框215。在一較佳實施例中,在最後過渡1/8速率訊框205之後(40至100毫秒)發送原型訊框215。在一實施例中,在最後過渡1/8速率訊框205之後80 ms發送原型訊框215。此延遲之傳輸具有改良接收器160的可靠性以偵測無聲週期之開始及至無聲狀態之轉變的目的。
在該說明性實施例中,在其餘的無聲時間間隔期間,若已觸發背景雜訊35之更新且若新原型1/8速率訊框215不同於所發送之最後一個速率訊框,則傳輸器150發送一新原型1/8速率訊框215。因此,不同於先前技術中所揭示的其中每隔20毫秒傳輸1/8訊框70之系統,本發明當取樣之輸入背景雜訊89已變化足以影響所感知之會話品質且觸發用於接收器160處的1/8訊框70之傳輸以更新背景雜訊35時傳輸該1/8訊框70。因此,當需要時傳輸1/8速率訊框70,極大地節省了頻寬。
圖8為說明某些實施例之藉由傳輸器執行的智慧消隱之程序800的流程圖。圖8中所說明之程序800可儲存為位於記憶體130中之軟體或韌體220中的指令。記憶體130可位於智慧消隱裝置140中或從智慧消隱裝置140分離。
在圖8中,傳輸器接收一訊框(在步驟300)。然後,接收器判定該訊框是否為無聲訊框(在步驟305)。若未偵測到傳送或含有無聲之訊框(例如,其為一聲音訊框),則系統轉變為有效狀態(在步驟310),且將訊框傳輸至接收器(在步
驟315)。
若該訊框為一無聲訊框,則然後系統檢查該系統是否處於無聲狀態(在步驟320)。若該系統並非處於無聲狀態(如同,例如,當無聲狀態=假),則該系統將轉變為無聲狀態(在步驟325),且將一無聲訊框發送至接收器(在步驟330)。若該系統處於無聲狀態(例如,無聲狀態=真),則該系統將檢查該訊框是否穩定(在步驟335)。
若該訊框為一穩定訊框210(在步驟335),則系統將更新統計(在步驟340)並檢查是否觸發更新212(在步驟345)。若觸發了更新212,則系統建立一原型(在步驟350)且將新原型訊框215發送至接收器160(在步驟355)。若未觸發更新212,則傳輸器150將不會將一訊框發送至接收器160,且返回至步驟300以接收一訊框。
若該訊框不穩定(在步驟335),則系統可傳輸過渡1/8速率訊框205(在步驟360)。然而,此特徵是可選的。
接收器側智慧消隱
在該說明性實施例中,在接收器側160上,智慧消隱裝置140保持追蹤會話之狀態。當接收器160接收到訊框時,其可向解碼器50提供該等所接收之訊框。當接收到一1/8速率訊框70時,接收器160轉變為無聲狀態。在另一實施例中,接收器160轉變為無聲狀態可基於超時。在又一實施例中,接收器160轉變為無聲狀態可基於1/8速率訊框70之接收及超時。當接收到一不同於一1/8速率訊框之速率訊框時,接收器160可轉變為有效狀態。舉例而言,當接
收到一全速率訊框或一半速率訊框時,接收器160可轉變為有效狀態。
在該說明性實施例中,當接收器160處於無聲狀態時,其可播放原型1/8速率訊框215。若在無聲狀態期間接收到一1/8速率訊框,則接收器160可用所接收之訊框更新原型訊框215。在另一實施例中,當接收器160處於無聲狀態時,若無1/8速率訊框70可用,則接收器160可播放最後接收之1/8速率訊框70。
圖9為說明藉由接收器160執行之智慧消隱之程序900的流程圖。可將圖9中所說明之程序900儲存為位於記憶體130中之軟體或韌體220中的指令230。記憶體130可位於智慧消隱裝置140中或與智慧消隱裝置140分離。此外,可將智慧消隱程序900之許多步驟儲存為位於軟體中的指令或位於記憶體130中的韌體。
接收器160接收一訊框(在步驟400)。首先,其判定該訊框是否為一聲音訊框(在步驟405)。若為"是",則接收器160設定其無聲狀態=假(在步驟410),然後接收器播放該聲音訊框(在步驟415)。若該所接收之訊框並非為一聲音訊框,則接收器160檢查該訊框是否為一無聲訊框(在步驟420)。若答案為"是",則接收器160檢查狀態是否為一無聲狀態(在步驟425)。若接收器160偵測到一無聲訊框,但無聲狀態為假(例如,接收器160處於聲音狀態),則接收器160轉變為無聲狀態(在步驟430),並播放所接收之訊框(在步驟435)。若接收器160偵測到一無聲訊框,且無聲狀態
為真,則接收器更新原型訊框215(在步驟440),並播放該原型訊框215(在步驟445)。
如上文所陳述,若所接收之訊框並非為一聲音訊框,則接收器160檢查其是否為一無聲訊框。若答案為否,則並未接收訊框(例如,其為一消除指示),且接收器160檢查狀態是否為一無聲狀態(在步驟450)。若狀態為無聲(例如,無聲狀態=真),則播放原型訊框215(在步驟455)。若狀態並非為無聲(例如,無聲狀態=假),則接收器160檢查是否已發生N個連續消除240(在步驟460)。(在智慧消隱中,一消除240本質上為一旗標。當預期但並未接收一訊框時,可由接收器取代消除240。)若答案為否,則並未發生N個連續消除240,且耦接至接收器160中之解碼器50的智慧消隱裝置140向解碼器50播放一消除240(在步驟465)(用於封包漏失隱蔽)。若答案為是,則已發生N個連續消除240,接收器160轉變為無聲狀態(在步驟470)並播放一原型訊框215(在步驟475)。
在一實施例中,使用智慧消隱裝置140及方法之系統為一網際網路語音協定系統,其中接收器160具有一可變計時器,且傳輸器150使用一每隔20毫秒發送訊框的固定計時器。此不同於一基於電路之系統,該系統中接收器160及傳輸器150均使用一固定計時器。因此,因為使用一可變計時器,所以智慧消隱裝置140可不必每隔20毫秒檢查訊框。而是,智慧消隱裝置140將在接獲要求時才檢查訊框。
如前文所陳述,當使用時間規整時,可擴展或壓縮一語音片段89。當揚聲器235將用完待播放之資訊時,解碼器50可開始運作。若解碼器50需要運作,則將自去抖動緩衝器180獲得一新訊框。然後執行智慧消隱方法。
圖10展示編碼器80將1/8速率訊框70連續發送至傳輸器150中之智慧消隱裝置140。同樣地,可操作地耦接至接收器160中之解碼器50的智慧消隱裝置140連續發送1/8速率訊框70。然而,在接收器160與傳輸器150之間不發送訊框之連續串。而是當需要時發送更新212。當未自傳輸器150接收到一訊框時,智慧消隱裝置140可播放消除240且播放原型訊框215。將一麥克風250附加至傳輸器150中之編碼器80,且將一揚聲器235附加至接收器160中之解碼器50。
背景雜訊之平坦度
在該說明性實施例中,當解碼器50偵測到一1/8速率訊框70時,接收器160在整個無聲時間間隔內僅可使用一個1/8速率訊框70來重製背景雜訊35。換言之,重複背景雜訊35。若存在一更新212,則每隔20毫秒發送相同的經更新之1/8速率訊框212以產生背景雜訊35。因為相同的1/8速率訊框可用於延長之時間週期,所以此可導致重建之背景雜訊35明顯缺乏變化或"平坦度",且對於收聽者而言此可為麻煩的。
在一實施例中,為了避免"平坦度",可將消除240而非原型1/8速率訊框215饋入接收器160處之解碼器50。圖10中說明此。該消除212將隨機性引入至背景雜訊35中,因
為解碼器50試圖重製其在消除212之前具有的訊框,藉此改變重建之背景雜訊35。在時間之0%與50%之間播放一消除212將在背景雜訊35中產生所要之隨機性。
在另一實施例中,可將隨機背景雜訊35"摻合"在一起。此包含將一先前之1/8速率訊框更新212a與一新的或後續之1/8速率訊框更新212b摻合,使背景雜訊35自該先前之1/8訊框更新值212a逐漸變化為該新的1/8訊框更新值212b。因此,期待地將隨機性或變化添加至背景雜訊35。如所展示,取決於新的更新速率訊框212b中的能量值是否大於或小於光前之速率更新訊框212a中的能量值,背景雜訊能級可逐漸增大(箭頭自先前之1/8訊框更新值212a向上指向新的1/8訊框更新值212b)或減小(箭頭自先前之1/8訊框更新值212a向下指向新的1/8訊框更新值212b)。圖11中說明此。
亦可使用碼簿登錄項70a、70b實現背景雜訊35中之此逐漸變化,其中所發送之訊框採取介於先前之1/8訊框更新值212a與新的1/8訊框更新值212b之間的碼簿登錄項值,自表示先前之1/8更新訊框212a的先前碼簿登錄項70a逐漸移動至表示新的更新訊框212b之碼簿登錄項70b。選擇每一中間碼簿登錄項70aa、70ab以模擬自先前之212a至新的更新訊框212b之遞增量△。舉例而言,在圖12中,藉由碼簿登錄項70a表示先前之1/8資料速率更新訊框212a。藉由表示自先前碼簿登錄項70a之遞增量△的中間碼簿登錄項70aa來表示下一訊框。藉由表示自先前碼簿登錄項70a之
遞增量2△的中間碼簿登錄項70ab來表示具有第一增量之訊框之後的訊框。圖12展示並非自傳輸器150發送具有自先前之更新212a之遞增量的碼簿登錄項70aa、70ab,而是自可操作地耦接至接收器160中之解碼器50的智慧消隱裝置140傳輸之。藉由傳輸器150未發送該等碼簿登錄項,將有利地有一傳輸器150所發送之更新212的減小。並未傳輸遞增量。其在兩個連續更新之間自動產生於接收器中以自一個背景雜訊35平穩地轉變為另一背景雜訊。
觸發一1/8速率原型更新
在該說明性實施例中,若已觸發背景雜訊35之更新且若新的1/8速率訊框70含有一不同於所發送之最後一個速率訊框的雜訊值,則傳輸器150在一無聲週期期間將一更新212發送至接收器160。以此方式在需要時更新背景資訊35。觸發可取決於若干因素。在一實施例中,觸發可基於訊框能量中之差異。
圖13說明程序1300,其中觸發可基於訊框能量中之差異。在此實施例中,傳輸器150保持由編碼器80所產生之每一穩定1/8速率訊框210之平均能量的經濾波之值(在步驟500)。然後,將最後發送之原型215中所含有的能量與每一穩定1/8資料速率訊框之當前經濾波的平均能量比較(在步驟510)。然後,判定最後發送之原型215中所含有的能量與當前經濾波之平均能量之間的差異或增量是否大於臨限值245(在步驟520)。若答案為是,則觸發一更新212且傳輸一含有新雜訊值之新的1/8速率訊框70(在步驟530)。背
景雜訊35之運作平均值用以計算差異以避免來自觸發一更新訊框212之傳輸的尖峰。基於品質或產出量,所使用之差異可為固定或自適應的。在步驟530之後,程序1300結束。
在另一實施例中,觸發可基於頻譜差異。此一實施例藉由圖14之程序1400說明,其中程序1400開始於步驟600。在此實施例中,傳輸器150保持由編碼器80所產生之穩定1/8速率訊框210中所含有之碼簿登錄項71、73之間的頻譜差異之每一碼簿65的經濾波之值(在步驟600)。然後,將此經濾波之頻譜差異與臨限值比較(在步驟610)。然後,判定最後傳輸之原型215的頻譜與穩定1/8速率訊框210中所含有之碼簿登錄項71、73之間的經濾波之頻譜差異之間的差異或增量是否大於其臨限值(SDT1及SDT2)235(在步驟620)。若大於該臨限值235,則觸發一更新212(在步驟630)。在步驟630之後,程序1400結束。
如上文所陳述,背景雜訊35之音量或能量中之變化及背景雜訊35之頻譜中之變化均可用作觸發175。在智慧消隱方法及裝置之先前運作試驗中,音量中2分貝(db)之變化已觸發更新訊框212。並且,40%的頻譜中之變化已用以觸發頻率變化212。
計算頻譜差異
如前文所陳述,一線性預測係數(LPC)濾波器(或線性預測編碼濾波器)用以擷取背景雜訊35之頻率特性。線性預測編碼為一藉由相同序列之先前樣本的線性組合來預測未
來樣本之方法。通常以一使得由兩個不同碼簿65產生之係數72的線性差異與碼簿65之頻譜差異成比例的方式而對頻譜資訊編碼。圖3中所示之模型參數估計器100執行LPC分析以產生一組線性預測係數(LPC)72及最佳間距延遲(τ)。其亦將LPC 72轉換為線頻譜對(LSP)。線頻譜對(LSP)為偽頻域中數位濾波器係數72的表示。此表示具有良好的量子化及內插特性。
在實施一ECRV聲碼器60之說明性實施例中,可使用以下兩個等式計算頻譜差異。
在上文之等式中,LSPIDX1為一含有"低頻率"頻譜資訊之碼簿65,且LSPIDX2為一含有"高頻率"頻譜資訊之碼簿65,值n及m為兩個不同碼簿登錄項71。值qrate為一量化LSP參數。其具有3個指數k、i、j。值k為對於LSPIDX1及LSPIDX2變化之表號,其中k=1,2。i為屬於相同碼簿登錄項71之一個量化元素,其中i=1,2,3,4,5。值j為碼簿登錄項71,例如,經由通信通道實際傳輸之數目。值j對應於m及n。因為計算兩個碼簿之間的差異需要兩個變量,所以上文之等式中使用值m及n替代j。在圖4中,藉由碼簿登錄項71表示LSPIDX1及LSPIDX2,且藉由碼簿登錄項73表示碼簿FGIDX。
每一碼簿登錄項71解碼成5個數。為了比較來自不同訊框之兩個碼簿登錄項71,對該等5個數之每一者的絕對差
異求和。結果為此等兩個碼簿登錄項71之間的頻率/頻譜"距離"。
圖15中繪製了"低頻率"LSP及"高頻率"LSP之頻譜碼簿登錄項71的變化。x軸表示碼簿登錄項71之間的差異。y軸表示具有x軸上所表示之差異的碼簿登錄項71之百分比。
建立一新的原型1/8速率訊框
當需要一更新時,可基於一碼簿65中所含有之資訊建立一新的原型1/8速率訊框70。圖4說明一含有來自前文所討論之三個碼簿65 FGIDX、LSPIDX1及LSPIDX2之登錄項的1/8訊框70。當建立一新的原型訊框215時,所選擇之碼簿65可用以表示當前背景雜訊35。
在一實施例中,傳輸器150將一由編碼器80產生之每一穩定1/8速率訊框210之平均能量的經濾波之值保持於一諸如儲存於記憶體130中之FGIDX碼簿65的"能量碼簿"65中。當需要一更新時,使用原型1/8速率訊框215將FGIDX碼簿65中最接近經濾波之值的平均能量值傳輸至接收器160。
在另一實施例中,傳輸器150保持含有由編碼器80產生的頻譜資訊之碼簿65的經濾波之直方圖。頻譜資訊可為"低頻率"或"高頻率"資訊,諸如儲存於記憶體130中之LSPIDX1(低頻率)或LSPIDX2(高頻率)碼簿65。對於一1/8速率訊框更新212而言,藉由在頻譜資訊碼簿65中選擇一其直方圖最接近經濾波之值的平均能量值,"最風行"之碼簿65用以產生一背景雜訊35之更新值。
藉由保持最後N個碼簿登錄項71之直方圖,某些實施例避免必須計算一表示1/8速率訊框之最新平均值的碼簿登錄項71。此表示操作時間減少。
觸發臨限值
可以若干方式設定一組觸發原型更新之臨限值245。此等方法包括(但不限於)使用"固定"及"自適應"臨限值245。在一實施固定臨限值之實施例中,將一固定值指派至不同臨限值245。此固定值目標可為負擔與背景雜訊品質之間之一所要的折衷。在一實施自適應臨限值之實施例中,可將一控制迴路用於每一臨限值245。該控制迴路目標為由每一臨限值245觸發之更新212的特定百分比。
用作目標之百分比可用不超出目標全域負擔之目的來界定。將此負擔界定為超過由編碼器80產生之穩定1/8速率訊框210之總數目而傳輸之更新212的百分比。控制迴路將每一臨限值245地保持追蹤經濾波之負擔。若該負擔高於該目標,則將使臨限值245增大一增量,否則使臨限值245減小一增量。
保持有效封包觸發
若未發送封包之時間週期超出一臨限時間,則其上發生通信之網路或實施聲音通信之應用軟體可變得混亂且認為雙方之間的通信已終止。然後其將使雙方斷開。為了避免發生此情形,在臨限時間過期之前發送一保持有效封包以更新原型。圖16中說明此一程序1600。如此圖所示,藉由量測自從發送最後更新212而流逝之時間開始程序1600(在
步驟700)。一旦量測流逝之時間後,判斷該流逝之時間是否大於臨限值245(在步驟710)。若該流逝之時間大於臨限值245,則觸發一更新212(在步驟720)。若(在步驟710),該流逝之時間沒有大於臨限值245,則程序1600返回步驟700以繼續量測該流逝之時間。
初始化
圖17為說明當初始化位於聲碼器60中之編碼器80及解碼器50時所執行之程序1700的流程圖。將編碼器80初始化為非無聲或聲音狀態(例如,Silence_State=假)(在步驟800)。用兩個參數初始化解碼器50:(i)狀態=無聲(意即,Silence_State=真)(810);及(ii)將原型設定為一安靜(低音量)訊框(例如,1/8訊框)(在步驟820)。因此,解碼器50最初輸出背景雜訊。其原因為,當初始化一呼叫時,傳輸器將不發送資訊直至完成連接,但是接收方需要播放某些聲音(背景雜訊)直至完成連接。
智慧消隱方法之額外應用
本文獻中所界定之演算法可易於延伸以結合RFC 3389而使用且可覆蓋本申請案中未列出之其它聲碼器。此等包括(但不限於)G.711、G.727、G.728、G.722等。
熟習此項技術者將瞭解可藉由使用任何多種不同工藝及技術來表示資訊及訊號。舉例而言,可藉由電壓、電流、電磁波、磁場或粒子、光場或粒子或者任何其中之組合來表示貫穿上文之描述可涉及之資料、指令、命令、資訊、訊號、位元、符號及晶片。
熟習此項技術者將進一步瞭解,可將結合本文所揭示之實施例而描述之各種說明性邏輯區塊、模組、電路及演算法步驟實施為電子硬體、電腦軟體或兩者之組合。為了清晰說明硬體及軟體之此種可互換性,上文已大體上根據其功能性描述了各種說明性組件、區塊、模組、電路及步驟。此種功能性是實施為硬體或是軟體取決於施加於整個系統之特定應用及設計限制。對於每一特定應用而言,熟習此項技術者可以各種不同方式實施所描述之功能性,但是此等實施決策不應解釋為導致偏離本發明之範疇。
可用經設計以執行本文所描述之功能的通用處理器、數位訊號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或其它可程式化邏輯設備、離散閘或電晶體邏輯、離散硬體組件或者任何其中之組合來實施或執行結合本文所揭示之實施例描述的各種說明性邏輯區塊、模組及電路。通用處理器可為微處理器,但是,處理器亦可為任何習知處理器、控制器、微控制器或狀態機。處理器亦可實施為計算設備之組合,例如一DSP與一微處理器的組合、複數個微處理器的組合、結合一DSP核心之一或多個微處理器的組合,或任何其它此類組態。
結合本文所揭示之實施例描述的方法或演算法之步驟可直接在硬體、由處理器執行之軟體模組或兩者之組合中實施。軟體模組可位於RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、可移動磁碟、CD-ROM或此項技術中已知之任何其它形式
之儲存媒體中。將一說明性儲存媒體耦接至處理器以使得處理器可自該儲存媒體讀取資訊且將資訊寫入該儲存媒體。或者,可將儲存媒體整合至處理器。處理器及儲存媒體可位於一ASIC中。該ASIC可位於使用者終端中。或者,處理器及儲存媒體可作為離散組件而位於使用者終端中。
提供對所揭示之實施例的先前描述以使任何熟習此項技術者能夠製作或使用本發明。熟習此項技術者將易瞭解此等實施例之各種修改,且本文所界定之一般原則可應用於其它實施例而不會偏離本發明之精神或範疇。因此,不希望本發明限於本文所展示之實施例,而是使其符合與本文所揭示之原則及新奇特點一致的最廣泛之範疇。
10‧‧‧背景雜訊產生器
15‧‧‧訊號能量/容能
20‧‧‧雜訊產生器
25‧‧‧白雜訊
30‧‧‧線性預測係數(LPC)濾波器/線性預測編碼濾波器
35‧‧‧背景雜訊/雜訊
40‧‧‧鬆弛碼激發線性預測(RCELP)解碼器/解碼器
41‧‧‧封包訊框
42‧‧‧封包類型訊號
43‧‧‧訊框錯誤偵測裝置
44‧‧‧速率決策信號
45‧‧‧訊框消除旗標訊號
46‧‧‧原始合成語音向量
47‧‧‧後濾波器
48‧‧‧濾波後合成語音向量訊號
50‧‧‧解碼器
60‧‧‧聲碼器/EVRC聲碼器/聲碼器裝置
65‧‧‧碼簿/能量碼簿/頻譜資訊碼簿
70‧‧‧1/8速率訊框/雜訊訊號/訊框
70a‧‧‧碼簿登錄項/先前碼簿登錄項
70b‧‧‧碼簿登錄項
70aa‧‧‧中間碼簿登錄項/碼簿登錄項
70ab‧‧‧中間碼簿登錄項/碼簿登錄項
71‧‧‧碼簿登錄項/頻譜碼簿登錄項/登錄項
72‧‧‧頻率"顏色"係數/線性預測係數(LPC)/數位濾波器係數
73‧‧‧碼簿登錄項/登錄項
80‧‧‧編碼器
85‧‧‧語音訊號/脈碼調變(PCM)語音樣本/數位訊框/訊號/聲音或無聲樣本
86‧‧‧區塊
87‧‧‧區塊
88‧‧‧區塊
89‧‧‧背景雜訊/語音片段
89a‧‧‧語音片段
89b‧‧‧語音片段
90‧‧‧訊號處理器
95‧‧‧脈碼調變(PCM)語音樣本
100‧‧‧模型參數估計器
105‧‧‧模型參數
107‧‧‧外部速率命令/外部速率命令訊號
109‧‧‧速率決策訊號
110‧‧‧第一開關
115‧‧‧全或1/2速率編碼器
117‧‧‧全或半速率訊框
119‧‧‧1/8速率訊框參數/參數
120‧‧‧1/8速率編碼器
122‧‧‧速率判定器
124‧‧‧封包格式化模組
125‧‧‧格式化封包/聲碼器封包/封包
130‧‧‧記憶體
140‧‧‧智慧消隱裝置/智慧消隱器/智慧消隱裝置邏輯區塊
150‧‧‧傳輸器/傳輸器側/傳輸設備
160‧‧‧接收器/接收器側/接收設備
175‧‧‧觸發
180‧‧‧去抖動緩衝器
185‧‧‧網路堆疊/堆疊
190‧‧‧時間規整器
192‧‧‧壓縮之語音片段
194‧‧‧擴展之語音片段
195‧‧‧位置(偏移)
197‧‧‧初始片段
200‧‧‧位置(偏移)
205‧‧‧過渡訊框/過渡雜訊訊框/過渡1/8速率訊框/過渡訊框值
210‧‧‧穩定訊框/穩定雜訊訊框/穩定1/8速率訊框/穩定訊框值
212‧‧‧消除/平均能量/更新/1/8速率訊框/訊框/更新訊
框/頻率變化/速率訊框更新
212a‧‧‧先前之1/8速率訊框更新/先前之訊框更新值/先前之速率更新訊框/先前之1/8訊框更新值/先前之1/8更新訊框/先前之更新
212b‧‧‧新的或後續之1/8速率訊框更新/新的1/8訊框更新值/新的更新速率訊框/新的更新訊框
214‧‧‧訊框數目
220‧‧‧軟體或韌體
230‧‧‧指令
235‧‧‧揚聲器
240‧‧‧消除
250‧‧‧麥克風
圖1為一背景雜訊產生器之方塊圖;圖2為一使用1/8速率訊框來播放雜訊的解碼器之頂層圖;圖3說明編碼器之一實施例;圖4說明一含有三個碼簿登錄項FGIDX、LSPIDX1及LSPIDX2之1/8速率訊框;圖5A為一使用智慧消隱的系統之方塊圖;圖5B為一使用智慧消隱的系統之方塊圖,其中該智慧消隱裝置整合入聲碼器中;圖5C為一使用智慧消隱的系統之方塊圖,其中該智慧消隱裝置包含一個執行本發明之傳輸及接收步驟的區塊或裝
置;圖5D為使用時間規整而壓縮的語音片段之一實例;圖5E為使用時間規整而擴展的語音片段之一實例;圖5F為一使用智慧消隱及時間規整的系統之邏輯方塊圖;圖6繪製在一電腦托架上無聲之開始處的相對於平均能量之訊框能量對訊框數目之曲線;圖7繪製在一多風環境中無聲之開始處的相對於平均能量之訊框能量對訊框數目之曲線;圖8為說明由傳輸器執行之一智慧消隱方法的流程圖;圖9為其說明由接收器執行之一智慧消隱方法的流程圖;圖10說明更新速率訊框之傳輸及消除之播放;圖11為能量值對時間之曲線,其中將一先前之1/8速率訊框更新與一後續之1/8速率訊框更新摻合;圖12說明使用碼簿登錄項將一先前之1/8速率訊框更新與一後續之1/8速率訊框更新摻合;圖13為說明基於訊框能量中之差異觸發一1/8速率訊框更新的流程圖;圖14為說明基於頻率能量中之差異觸發一1/8速率訊框更新的流程圖;圖15為LSP頻譜差異之曲線,其展示"低頻率"LSP與"高頻率"LSP之頻譜碼簿登錄項的變化;圖16為說明發送一保持有效封包之程序的流程圖;及
圖17為說明位於聲碼器中之編碼器及解碼器之初始化的流程圖。
50‧‧‧解碼器
60‧‧‧聲碼器/EVRC聲碼器/聲碼器裝置
65‧‧‧碼簿/能量碼簿/頻譜資訊碼簿
80‧‧‧編碼器
130‧‧‧記憶體
140‧‧‧智慧消隱裝置/智慧消隱器/智慧消隱裝置邏輯區塊
150‧‧‧傳輸器/傳輸器側/傳輸設備
160‧‧‧接收器/接收器側/接收設備
175‧‧‧觸發
180‧‧‧去抖動緩衝器
185‧‧‧網路堆疊/堆疊
220‧‧‧軟體或韌體
230‧‧‧指令
Claims (26)
- 一種在一第一器件與一第二器件之間傳送背景雜訊之方法,每一器件包括用於傳輸資料至另一裝置及自該另一器件接收資料之電路,該方法包含:產生一組訊框,該組訊框包含一第一訊框及一或多個後續背景雜訊訊框,該第一訊框用以傳送該背景雜訊;藉由使用該第一訊框自該第一器件傳輸該背景雜訊,該傳輸包含一第一資料速率,其中該傳輸進一步包含:基於一用於複數個背景雜訊訊框之碼簿登錄項的元件之絕對差異的和,比較一特定背景雜訊訊框與該複數個背景雜訊訊框之一平均頻譜;及若該等頻譜之一差異超過一頻譜臨限值,傳輸一更新背景雜訊訊框;判定是否後續背景雜訊訊框穩定或自聲音過渡;基於該判定而消隱至少一後續背景雜訊訊框,其中該消隱包含不傳輸一訊框;自該第二器件接收一背景雜訊訊框;及更新一與該第二器件相關聯之背景雜訊。
- 如請求項1之傳送背景雜訊的方法,其進一步包含過濾該背景雜訊訊框。
- 如請求項1之傳送背景雜訊的方法,其進一步包含播放背景雜訊,其中該播放背景雜訊包含:以一數字之隨機序列的形式輸出白雜訊;及擷取該白雜訊之一頻率特性。
- 如請求項1之方法,其進一步包含:在發送一更新背景雜訊訊框之前等待直至已發送該等背景雜訊訊框之至少其中之一,藉此傳輸一穩定背景雜訊訊框。
- 如請求項1之方法,其進一步包含:在發送一更新背景雜訊訊框之前等待直至最後過渡背景雜訊訊框已發送40至100 ms之後,藉此傳輸一穩定背景雜訊訊框。
- 如請求項1之傳送背景雜訊之方法,其進一步包含初始化一編碼器及一解碼器,其中該初始化一編碼器及一解碼器包含:將該編碼器之一狀態設定為一聲音狀態;將該解碼器之一狀態設定為一無聲狀態;及將一原型設定為一1/8資料速率訊框。
- 如請求項1之傳送背景雜訊之方法,其進一步包含摻合該背景雜訊。
- 如請求項1之傳送背景雜訊之方法,其進一步包含:若未接收到該背景雜訊資料訊框,則播放一消除。
- 如請求項1之傳送背景雜訊之方法,其中更新該背景雜訊包含傳輸一具有至少一碼簿登錄項的更新背景雜訊訊框。
- 如請求項1之傳送背景雜訊之方法,其中接收該背景雜訊包含:接收一訊框;判定該訊框是否為一聲音訊框;若該訊框為該聲音訊框,則判定一狀態是否為一聲音 狀態;若該狀態為該聲音狀態且該訊框為該聲音訊框,則播放該訊框;若該訊框並非為該聲音訊框,則檢查該訊框是否為一無聲訊框;若該訊框為該無聲訊框,則檢查該狀態是否為一無聲狀態;若該訊框為該無聲訊框且該狀態並非為該無聲狀態,則轉換為該無聲狀態且播放該訊框;若該訊框為該無聲訊框且該狀態為該無聲狀態,則產生一更新並播放該更新;若該訊框並非為該聲音訊框或該無聲訊框,則檢查該狀態是否為該無聲狀態;若該狀態為該無聲狀態且該訊框並非為該聲音訊框或該無聲訊框,則播放一原型訊框;若該狀態並非為該無聲狀態且該訊框並非為該聲音訊框或該無聲訊框,則檢查是否已發送N個連續消除;若尚未發送N個連續消除,該狀態並非為該無聲狀態且該訊框並非為該聲音訊框或該無聲訊框,則播放一消除;及若已發送N個連續消除,該狀態並非為該無聲狀態且該訊框並非為該聲音訊框或該無聲訊框,則轉換為該無聲狀態並播放該原型訊框。
- 如請求項2之傳送背景雜訊之方法,其進一步包含:若 未接收到訊框,則播放一消除。
- 如請求項7之傳送背景雜訊之方法,其中該摻合包含使該背景雜訊自一先前更新值逐漸變化為一新更新值。
- 如請求項8之傳送背景雜訊之方法,其中播放該消除少於或等於該時間之50%。
- 如請求項11之傳送背景雜訊之方法,其中播放該消除少於或等於該時間之50%。
- 一種操作一發送器以在一通信通道上傳送背景雜訊資訊至一接收器之方法,該方法包含:接收一訊框;判定該訊框是否為一無聲訊框;若該訊框並非為該無聲訊框,則轉換為一有效狀態並傳輸該訊框;若該訊框為該無聲訊框,則判定一狀態是否為一無聲狀態;若該訊框為該無聲訊框且該狀態並非處於該無聲狀態中,則轉換為該無聲狀態且將該無聲訊框發送至一接收器;若該訊框為該無聲訊框且該狀態處於該無聲狀態中,則判定該訊框是否穩定或自聲音過渡;若該訊框穩定,則更新統計資料且判定是否觸發了一更新;基於是否無聲訊框穩定或自聲音過渡而消隱該等無聲訊框; 若觸發了該更新,則建立且發送一原型訊框,其中該觸發包含:基於一用於複數個背景雜訊訊框之碼簿登錄項的元件之絕對差異的和,比較一特定背景雜訊訊框與該複數個背景雜訊訊框之一平均頻譜;及若該等頻譜之一差異超過一頻譜臨限值,傳輸一更新背景雜訊訊框;在以長於一臨限時間而消隱後續背景雜訊訊框之前傳輸一保持有效封包。
- 如請求項15之方法,其中傳輸該背景雜訊進一步包含:若該訊框不穩定,則傳輸過渡背景雜訊訊框。
- 如請求項15之方法,其中該觸發進一步包含:將一特定背景雜訊訊框之一能量與複數個該背景雜訊訊框之一平均能量相比較;及若該等能量之一差異超出一能量臨限值且該等頻譜的該差異超出該頻譜臨限值,則傳輸原型訊框。
- 如請求項17之方法,其中該臨限值等於或大於1 db。
- 如請求項17之方法,其中傳輸該原型訊框包含傳輸至少一碼簿登錄項。
- 如請求項15之方法,其中該臨限值等於或大於40%。
- 如請求項15之方法,其中傳輸該原型訊框包含:傳輸至少一碼簿登錄項。
- 如請求項19之方法,其中該至少一碼簿登錄項包含至少一能量碼簿登錄項及至少一頻譜碼簿登錄項。
- 如請求項22之方法,其中該更新包含一最常用之碼簿登錄項。
- 一種用於傳送背景雜訊之裝置,該裝置包含:一處理器;一記憶體,其與該處理器電通信;儲存於該記憶體之多個指令,該等指令藉由該處理器而可執行以:產生一組訊框,該組訊框包含一第一訊框及一或多個後續背景雜訊訊框,該第一訊框用以傳送該背景雜訊;藉由使用該第一訊框自一第一裝置傳輸該背景雜訊,該傳輸包含一第一資料速率,其中該傳輸進一步包含:基於一用於複數個背景雜訊訊框之碼簿登錄項的元件之絕對差異的和,比較一特定背景雜訊訊框與該複數個背景雜訊訊框之一平均頻譜;及若該等頻譜之一差異超過一頻譜臨限值,傳輸一更新背景雜訊訊框;判定是否後續背景雜訊訊框穩定或自聲音過渡;基於該判定而消隱該等後續背景雜訊訊框之至少一者,其中該消隱包含不傳輸一訊框;在以長於一臨限時間而消隱後續背景雜訊訊框之前傳輸一保持有效封包;自一第二裝置接收一背景雜訊訊框;及 更新一與該第二裝置相關聯之背景雜訊。
- 一種用於傳送背景雜訊之裝置,該裝置包含:產生構件,用於產生一組訊框,該組訊框包含一第一訊框及一或多個後續背景雜訊訊框,該第一訊框用以傳送該背景雜訊;傳輸構件,用於藉由使用該第一訊框自一第一裝置傳輸該背景雜訊,該傳輸包含一第一資料速率,其中該傳輸進一步包含:基於一用於複數個背景雜訊訊框之碼簿登錄項的元件之絕對差異的和,比較一特定背景雜訊訊框與該複數個背景雜訊訊框之一平均頻譜;及若該等頻譜之一差異超過一頻譜臨限值,傳輸一更新背景雜訊訊框;判定構件,用於判定是否後續背景雜訊訊框穩定或自聲音過渡;消隱構件,用於基於該判定而消隱該等後續背景雜訊訊框之至少一者,其中該消隱包含不傳輸一訊框;傳輸一保持有效封包之構件,用於在以長於一臨限時間而消隱後續背景雜訊訊框之前傳輸一保持有效封包;接收構件,用於自一第二裝置接收一背景雜訊訊框;及更新構件,用於更新一與該第二裝置相關聯之背景雜訊。
- 一種非暫時性電腦可讀取媒體,其包含可執行的指令用以: 產生一組訊框,該組訊框包含一第一訊框及一或多個後續背景雜訊訊框,該第一訊框用以傳送該背景雜訊;藉由使用該第一訊框自一第一器件傳輸該背景雜訊,該傳輸包含一第一資料速率,其中該傳輸進一步包含:基於一用於複數個背景雜訊訊框之碼簿登錄項的元件之絕對差異的和,比較一特定背景雜訊訊框與該複數個背景雜訊訊框之一平均頻譜;及若該等頻譜之一差異超過一頻譜臨限值,傳輸一更新背景雜訊訊框;判定是否後續背景雜訊訊框穩定或自聲音過渡;基於該判定而消隱至少一後續背景雜訊訊框,其中該消隱包含不傳輸一訊框;用於在以長於一臨限時間而消隱後續背景雜訊訊框之前傳輸一保持有效封包;自一第二器件接收一背景雜訊訊框;及更新一與該第二器件相關聯之背景雜訊。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US64919205P | 2005-02-01 | 2005-02-01 | |
US11/123,478 US8102872B2 (en) | 2005-02-01 | 2005-05-05 | Method for discontinuous transmission and accurate reproduction of background noise information |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200632869A TW200632869A (en) | 2006-09-16 |
TWI390505B true TWI390505B (zh) | 2013-03-21 |
Family
ID=36553037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095103828A TWI390505B (zh) | 2005-02-01 | 2006-02-03 | 用於間斷傳輸及精確重製背景雜訊資訊之方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8102872B2 (zh) |
EP (1) | EP1849158B1 (zh) |
JP (3) | JP2008530591A (zh) |
KR (1) | KR100974110B1 (zh) |
CN (1) | CN101208740B (zh) |
TW (1) | TWI390505B (zh) |
WO (1) | WO2006084003A2 (zh) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY149811A (en) * | 2004-08-30 | 2013-10-14 | Qualcomm Inc | Method and apparatus for an adaptive de-jitter buffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
KR20080003537A (ko) * | 2006-07-03 | 2008-01-08 | 엘지전자 주식회사 | 이동 단말기의 통화 중 노이즈 제거 방법 및 이를 위한이동 단말기 |
US10084627B2 (en) * | 2006-07-10 | 2018-09-25 | Qualcomm Incorporated | Frequency hopping in an SC-FDMA environment |
US8208516B2 (en) * | 2006-07-14 | 2012-06-26 | Qualcomm Incorporated | Encoder initialization and communications |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8848618B2 (en) * | 2006-08-22 | 2014-09-30 | Qualcomm Incorporated | Semi-persistent scheduling for traffic spurts in wireless communication |
US9064161B1 (en) * | 2007-06-08 | 2015-06-23 | Datalogic ADC, Inc. | System and method for detecting generic items in image sequence |
US8514754B2 (en) * | 2007-10-31 | 2013-08-20 | Research In Motion Limited | Methods and apparatus for use in controlling discontinuous transmission (DTX) for voice communications in a network |
CN100555414C (zh) | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
US8554550B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
US9202456B2 (en) * | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
CN102792760B (zh) * | 2010-02-25 | 2015-08-12 | 瑞典爱立信有限公司 | 为音乐关闭dtx |
US9020550B2 (en) * | 2010-03-29 | 2015-04-28 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and apparatuses for radio resource allocation and identification |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US9686815B2 (en) | 2011-11-02 | 2017-06-20 | Qualcomm Incorporated | Devices and methods for managing discontinuous transmission at a wireless access terminal |
US8774074B2 (en) * | 2011-11-02 | 2014-07-08 | Qualcomm Incorporated | Apparatus and method for adaptively enabling discontinuous transmission (DTX) in a wireless communication system |
JP2014167525A (ja) * | 2013-02-28 | 2014-09-11 | Mitsubishi Electric Corp | 音声復号装置 |
CN104378474A (zh) * | 2014-11-20 | 2015-02-25 | 惠州Tcl移动通信有限公司 | 一种降低通话输入噪音的移动终端及其方法 |
US20160323425A1 (en) * | 2015-04-29 | 2016-11-03 | Qualcomm Incorporated | Enhanced voice services (evs) in 3gpp2 network |
US9924451B2 (en) * | 2015-12-02 | 2018-03-20 | Motorola Solutions, Inc. | Systems and methods for communicating half-rate encoded voice frames |
CN107786317A (zh) * | 2016-08-31 | 2018-03-09 | 乐视汽车(北京)有限公司 | 一种降噪数据传输方法和设备 |
US10812216B2 (en) | 2018-11-05 | 2020-10-20 | XCOM Labs, Inc. | Cooperative multiple-input multiple-output downlink scheduling |
US10659112B1 (en) | 2018-11-05 | 2020-05-19 | XCOM Labs, Inc. | User equipment assisted multiple-input multiple-output downlink configuration |
US10756860B2 (en) | 2018-11-05 | 2020-08-25 | XCOM Labs, Inc. | Distributed multiple-input multiple-output downlink configuration |
US10432272B1 (en) | 2018-11-05 | 2019-10-01 | XCOM Labs, Inc. | Variable multiple-input multiple-output downlink user equipment |
CA3119325C (en) | 2018-11-27 | 2023-07-04 | XCOM Labs, Inc. | Non-coherent cooperative multiple-input multiple-output communications |
US11063645B2 (en) | 2018-12-18 | 2021-07-13 | XCOM Labs, Inc. | Methods of wirelessly communicating with a group of devices |
US10756795B2 (en) | 2018-12-18 | 2020-08-25 | XCOM Labs, Inc. | User equipment with cellular link and peer-to-peer link |
US11330649B2 (en) | 2019-01-25 | 2022-05-10 | XCOM Labs, Inc. | Methods and systems of multi-link peer-to-peer communications |
US10756767B1 (en) | 2019-02-05 | 2020-08-25 | XCOM Labs, Inc. | User equipment for wirelessly communicating cellular signal with another user equipment |
US10735057B1 (en) | 2019-04-29 | 2020-08-04 | XCOM Labs, Inc. | Uplink user equipment selection |
US10686502B1 (en) | 2019-04-29 | 2020-06-16 | XCOM Labs, Inc. | Downlink user equipment selection |
US11411778B2 (en) | 2019-07-12 | 2022-08-09 | XCOM Labs, Inc. | Time-division duplex multiple input multiple output calibration |
TWI721522B (zh) | 2019-08-12 | 2021-03-11 | 驊訊電子企業股份有限公司 | 音訊處理系統及方法 |
JP7191792B2 (ja) * | 2019-08-23 | 2022-12-19 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
US11411779B2 (en) | 2020-03-31 | 2022-08-09 | XCOM Labs, Inc. | Reference signal channel estimation |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE294441T1 (de) * | 1991-06-11 | 2005-05-15 | Qualcomm Inc | Vocoder mit veränderlicher bitrate |
JP3182032B2 (ja) * | 1993-12-10 | 2001-07-03 | 株式会社日立国際電気 | 音声符号化通信方式及びその装置 |
TW271524B (zh) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
FI103700B1 (fi) * | 1994-09-20 | 1999-08-13 | Nokia Mobile Phones Ltd | Samanaikainen puheen ja datan siirto matkaviestinjärjestelmässä |
JPH08254997A (ja) * | 1995-03-16 | 1996-10-01 | Fujitsu Ltd | 音声符号化・復号化方法 |
JPH08298523A (ja) * | 1995-04-26 | 1996-11-12 | Nec Corp | ルータ |
JP3157116B2 (ja) * | 1996-03-29 | 2001-04-16 | 三菱電機株式会社 | 音声符号化伝送システム |
GB2326308B (en) * | 1997-06-06 | 2002-06-26 | Nokia Mobile Phones Ltd | Method and apparatus for controlling time diversity in telephony |
JP3487158B2 (ja) * | 1998-02-26 | 2004-01-13 | 三菱電機株式会社 | 音声符号化伝送システム |
US6138040A (en) * | 1998-07-31 | 2000-10-24 | Motorola, Inc. | Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode |
US6311154B1 (en) * | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
JP4438127B2 (ja) * | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
DE69931783T2 (de) * | 1999-10-18 | 2007-06-14 | Lucent Technologies Inc. | Verbesserung bei digitaler Kommunikationseinrichtung |
US6522746B1 (en) | 1999-11-03 | 2003-02-18 | Tellabs Operations, Inc. | Synchronization of voice boundaries and their use by echo cancellers in a voice processing system |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
JP4221537B2 (ja) | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
US6907030B1 (en) * | 2000-10-02 | 2005-06-14 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for decoding multiplexed, packet-based signals in a telecommunications network |
US6631139B2 (en) * | 2001-01-31 | 2003-10-07 | Qualcomm Incorporated | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
US7103025B1 (en) * | 2001-04-19 | 2006-09-05 | Cisco Technology, Inc. | Method and system for efficient utilization of transmission resources in a wireless network |
US7031916B2 (en) * | 2001-06-01 | 2006-04-18 | Texas Instruments Incorporated | Method for converging a G.729 Annex B compliant voice activity detection circuit |
JP2003050598A (ja) * | 2001-08-06 | 2003-02-21 | Mitsubishi Electric Corp | 音声復号装置 |
US6832195B2 (en) * | 2002-07-03 | 2004-12-14 | Sony Ericsson Mobile Communications Ab | System and method for robustly detecting voice and DTX modes |
CN100477531C (zh) * | 2002-08-21 | 2009-04-08 | 广州广晟数码技术有限公司 | 用于对多声道数字音频信号进行压缩编码的编码方法 |
JP4292767B2 (ja) | 2002-09-03 | 2009-07-08 | ソニー株式会社 | データレート変換方法及びデータレート変換装置 |
RU2331933C2 (ru) | 2002-10-11 | 2008-08-20 | Нокиа Корпорейшн | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
US20060149536A1 (en) * | 2004-12-30 | 2006-07-06 | Dunling Li | SID frame update using SID prediction error |
-
2005
- 2005-05-05 US US11/123,478 patent/US8102872B2/en active Active
-
2006
- 2006-02-01 JP JP2007554203A patent/JP2008530591A/ja not_active Withdrawn
- 2006-02-01 WO PCT/US2006/003640 patent/WO2006084003A2/en active Application Filing
- 2006-02-01 KR KR1020077019996A patent/KR100974110B1/ko active IP Right Grant
- 2006-02-01 CN CN200680009183.7A patent/CN101208740B/zh active Active
- 2006-02-01 EP EP06720123A patent/EP1849158B1/en active Active
- 2006-02-03 TW TW095103828A patent/TWI390505B/zh active
-
2011
- 2011-06-22 JP JP2011138322A patent/JP5730682B2/ja active Active
-
2013
- 2013-01-04 JP JP2013000187A patent/JP5567154B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2006084003A3 (en) | 2006-12-07 |
US20060171419A1 (en) | 2006-08-03 |
JP5567154B2 (ja) | 2014-08-06 |
CN101208740B (zh) | 2015-11-25 |
TW200632869A (en) | 2006-09-16 |
EP1849158B1 (en) | 2012-06-13 |
JP2008530591A (ja) | 2008-08-07 |
CN101208740A (zh) | 2008-06-25 |
KR20070100412A (ko) | 2007-10-10 |
JP2013117729A (ja) | 2013-06-13 |
US8102872B2 (en) | 2012-01-24 |
WO2006084003A2 (en) | 2006-08-10 |
KR100974110B1 (ko) | 2010-08-04 |
JP2011250430A (ja) | 2011-12-08 |
JP5730682B2 (ja) | 2015-06-10 |
EP1849158A2 (en) | 2007-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI390505B (zh) | 用於間斷傳輸及精確重製背景雜訊資訊之方法 | |
JP2008530591A5 (zh) | ||
KR101960200B1 (ko) | 리던던시 기반의 패킷 송신 에러 복구 시스템 및 방법 | |
JP5543405B2 (ja) | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ | |
US6898566B1 (en) | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal | |
JP2011511962A (ja) | コンテキスト・デスクリプタ伝送のためのシステム、方法、および装置 | |
US20070160154A1 (en) | Method and apparatus for injecting comfort noise in a communications signal | |
KR20020093940A (ko) | 가변율 음성 코더에서 프레임 삭제를 보상하는 방법 | |
US8874437B2 (en) | Method and apparatus for modifying an encoded signal for voice quality enhancement | |
EP1554717B1 (en) | Preprocessing of digital audio data for mobile audio codecs | |
EP1977419A1 (en) | Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber's terminal over network and audio signal pre-processing apparatus of enabling the method | |
ULLBERG | Variable Frame Offset Coding |