TW469423B - Method of generating comfort noise in a speech decoder that receives speech and noise information from a communication channel and apparatus for producing comfort noise parameters for use in the method - Google Patents

Method of generating comfort noise in a speech decoder that receives speech and noise information from a communication channel and apparatus for producing comfort noise parameters for use in the method Download PDF

Info

Publication number
TW469423B
TW469423B TW088119423A TW88119423A TW469423B TW 469423 B TW469423 B TW 469423B TW 088119423 A TW088119423 A TW 088119423A TW 88119423 A TW88119423 A TW 88119423A TW 469423 B TW469423 B TW 469423B
Authority
TW
Taiwan
Prior art keywords
background noise
variability
noise parameter
scope
patent application
Prior art date
Application number
TW088119423A
Other languages
English (en)
Inventor
Ingemar Johansson
Roar Hagen
Erik Ekudden
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26807080&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW469423(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Application granted granted Critical
Publication of TW469423B publication Critical patent/TW469423B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Noise Elimination (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

4 G 9 4 2 3 A7 _ B7 五、發明說明(1〉 本專利主張1998年11月23日所申請之美國專利案號 60/109,555的 35 USC 119(e)(1)下的優先權。 發明範圍 本發明係通常有關於語音编碼,而更明確而言,係關於 語音編碼’其中非自然的背景雜訊是在無語音動作期間產 生。 發明背景 語音編碼器與解碼器係傳統性分別提供在無線電發射器 與無線電接收器,而且允許在無線電連結上的特定發射器 與接收器之間的語音通信。一語音編碼器及一語音解碼器 的組合時常稱爲語音编碼解碼器(coder)。一行動無線電話 (例如’一細胞式電話)是一傳統通信裝置範例,其典型包 括具有一語音編碼器之一無線電發射器、及具有一語音解 碼器之一無線電接收器。 在傳統以區塊爲基礎的語音编碼器,送來的語音信號會 被分成稱爲訊訊框的許多區塊。對於共同4仟赫電話頻寬 應用而T ’典型的訊訊框長度是20ms或160個取樣。該等 訊訊框可進一步分成副訊訊框,其典型長度是5ms或4〇個 取樣。 傳統線性預測性综合分析(LPAS)編碼器係使用語音製造 模型。描述聲道、高低音的模型參數可從輸入的語音信號 取出。變化緩慢的參數典型會於每一訊框計算。此參數的 範例係包括描述在產生語音裝置中的聲道之STp(短時期預 測)參數。STP參數的一範例係表示輪入語音信號頻譜形狀 -4- 本纸張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) --------訂---------線 經濟部智慧財產局員工消費合作社印製 4 6 9 4 2 3 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(2 ) 的線性預測係數(Lpc)。變比快速的參數範例係包括典型 於每個副訊框會被計算的高低與改革形狀/增益參數。 取得的參數係藉由使用適當已知的無向量與向量量化技 術而量子化。例如線性預測係數的Stp參數時常會轉換成 更適合於例如線頻譜頻率(LSFs)量子化的一表示。在量子 化之後’該等參數便會在通信通道上傳輸給解碼器。 在一傳統的LPAS解碼器,通常與上述相反的會達成,而 且邊音“號會被合成。後過;慮技術通常運用於合成語音信 號’以提高可感受到的品質。 對於許多通常背景雜訊類型而言,一較低於語音所需的 位元率可提供一相當好的信號模型。已存在行動系統可藉 著在背景雜訊過程中調整傳輸的位元率而利用此事實。在 使用連續傳輸技術的傳統系統,一可變率(VR)語音編碼器 能使用它最低的位元率。在傳統非連續的傳輸⑴τχ)方 法,當喇机·不動作的時候,該發射器便會停止傳送編碼的 語音訊框。在規則或不規則的間隔(典型是每5〇〇毫秒), 發射器會傳送適合於在解碼器減缓雜訊產生的語音參數。 減緩雜訊產生的這些參數(CNG)係慣例編碼成有時稱爲靜 音描述符號(SID)訊框。在接收器,該解碼器係使用在sid 訊框所接收的減緩雜訊參數,以便經由一傳統減緩雜訊注 入(CNI)演繹法而合成人爲雜訊。 當減緩雜訊在傳統DTX系統的解碼器中產生之時,雜訊 便時常會感受到非常靜態,而且非常不同於自在主動(非 DTX)模式所產生的背景雜訊。此感受的理由是DTX 味 -5- 本紙張尺度適用_國國家標準(CNS)A4規格(210 X 297公釐) in----11--裝!---訂---------線 r (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局貝工消費合作社印製 ^6 942 3 A7 ----B7 五、發明說明(3 ) 框並不會像正常語音訊框—樣時常傳送給接收器。在具有 DTX模式的LPAS寫解碼H,背景雜訊的頻譜與能量典型 會在數個訊框上被估計(例如,平均),而且該等估計的參 數然後會量化,並在通道上傳輸給解碼器。圖丨係描述可 產生上述估計背景雜訊(減緩雜訊)參數的一先前技藝減緩 雜訊編碼器範例。該等量化減緩雜訊參數典型會在每1〇〇 至500毫秒傳送。 使用一低更新率傳送SID訊框以取代傳送一般語音訊框 的優點是加倍的。例如,在一行動無線電傳收機的電池壽 命可延長,由於低功率消耗,而且由發射器所產生的干擾 可被降低,藉此提供較高的系統能力。 在一傳統解碼器,該等減緩雜訊參數可如圖2所示接收 及解碼》因爲解碼器並不時常像它正常接收語音參數來接 收新的減緩雜訊參數’所以在SID訊框所接收的該等減緩 雜訊參數典型會在23插入’以便在減緩雜訊合成中提供參 數的一平穩的演變。在合成操作方面,通常在2 5所示,該 解碼器可將增益比例化隨意雜訊(例如,白雜訊)激立與插 入的頻譜參數輸入給合成濾波器2 7。結果,該產生的減緩 雜訊sc(n)將會感受到相當大的靜止(,_靜態"),不管在編碼 器端(參考圖1 )的背景雜訊s(n)是否改變特性。此問題在於 較顯著的強烈背景變化,例如街道雜訊與嗔雜聲(例如, 餐廳雜訊),但亦出現在汽車雜訊情況。 完成解決此”靜態”減緩雜訊問題的一傳統方式只增加減 緩雜訊參數(例如’使用一較高SID訊框率)DTX的更新 本紙張尺度適用中画國家標準(CNS)A4規格(210 X 297公釐) --- ------------ *-------訂---------線 (請先閱讀背面之注$項再填寫本頁)
46 942 3 第88丨19423號專利申請案 中文說明書修正頁(9〇年8月) 五、發明説明( ) 率。使用此解決的問題情況是電池消耗(例如’在行動傳 收機)將會提高,因為該發射器必須時常操作’而且系统 能力將會降低,因為增加SiC)訊框率。因此’它通常在傳 統系統是可接受靜態背景雜訊。 因此’希望可避免與傳統減緩雜訊產生有關的上述缺 點。 根據本發明,慣例所產生的減緩雜訊參數是基於在編碼 器所經歷的實際背景雜訊屬性而修改。從修改參數所產 生的減緩雜訊可感受到低於慣例所產生減緩雜訊的靜 態,而且非常類似在編碼器所經歷的實際背景雜訊。 圖式之簡單說明 圖1係插述在一傳統語音編碼器的減緩雜訊參數產生圖 式。 圖2係描述在一傳統語音編碼器的減緩雜訊產生圖式。 圖3係根據本發明而描述在產生減緩雜訊所使用的一減 緩雜訊參數修改器。 圖4係描述圖3的修改器之一具體實施例。 圖5係描述圖4的變化性估計器之一具體實施例。 U丨 β.巧 本
Ί' 匕· r r
圖5 A描述圖5的選擇信號控制範例。 圖6係描述圖3_5的修改器之—具體實施例’其中圖5的 變化性估計器是部分在編碼器與部分在解碼器提供。 圖7描述可由圖3-6的修改器所執行的操作範例。 圖8描述圖7的估計步騾範例。 圖9係描述能實施圖3_8的修改器具體實施例之一語音通
本紙張尺度適用中興Η家標準(CNS) A4规格(210 X 297公复) ^ 6 942 3
信系統。 圖式之詳細説明 圖3係根據本發明而描述用以修改減緩雜訊參數的—減 緩雜訊參數修改器30。在圖3的範例,修改器3〇可在—輸 入33上接收該等傳統插入的減緩雜訊參數,例如來自圖2 的插入器2 3所輸出的頻譜與能量參數。修改器3 〇亦在輸 入3 1上接收與在編碼器上所經歷背景雜訊有關的頻譜與能 量參數。修改器30可基於在31所接收的該等背景雜訊參 數而修改接收的減緩雜訊參數,以便在35上產生修改的減 緩雜訊參數。該等修改的減緩雜訊參數然後可提供給例如 在傳統減緩雜訊合成操作中使用圖2的減緩雜訊合成部份 25。在35上所提供的修改減緩雜訊參數允許合成部份。 產生減緩雜訊,該減緩雜訊係再生語音編碼器的更正確實 際背景雜訊。 圖4描述圖3的減緩雜訊參數修改器3 〇的一具體實施 例。修改器3 0包括耦合至輸入3 i的一變化性估計器4 !, 爲了要接收背景雜訊的頻譜與能量參數。變化性估計器4 i 可以估計背景雜訊參數的變化性特性,並且在43上輸出表 不背景雜訊參數變化性的資訊。該變化性資訊的特徵是有 關平均値的參數變化性,例如參數變化、或來自平均値的 參數最大偏差。 在4 3的變化性資訊亦表示相關屬性 '參數在時間上的演 麦、或參數在時間上改變的其他測量。時間變化性資訊的 範例包括簡單的測量’例如參數(快或慢的變化)的變化 -8 - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) <請先閱讀背面之注意事項再填寫本頁) 裝-------訂---------線 經濟部智慧財產局員工消費合作社印製 4 6 942 3 經濟部智慧財產局貝工消费合作社印製 Α7 Β7 五、發明說明(6 ) 率、參數的變化 '平均的最大偏差、參數變化性特徵的其 他統計測量、與例如自相關器屬性的更進階測量、及來自 參數所估計的一自動迴歸(regressive)(AR)預測器之濾波器 係數。一簡單的變化測量率的範例是計數零交錯率,即 是,當從參數値順序的第一參數値看到最後參數値的時 候,參數符號變化的時間量。在4 3上來自估計器4 1所輸 出的資訊會輸入一組合器45,該组合器是將在43上的輸 出資訊與在3 3上所接收的插入減緩雜訊參數組合,爲了要 在35上產生修改的減緩雜訊參數。 圖5係描述圖4的變化性估計器4 1之一具體實施例。圖5 的估計器包括辖合至輸入31的一平均變化性決定器51, 用以接收背景雜訊的頻譜與能量參數。該平均變化性決定 器5 1可決定如上所述的平均變化性特徵。例如,如果圖3 的背景雜訊緩衝器37包括8個訊框與32個副訊框,那麼緩 衝頻譜與能量參數的變化性便能依下列分析。該等緩衝頻 譜參數的均衡(或平均)値可計算(慣例是在DTX编碼器完 成,以產生SID訊框),並從緩衝的頻譜參數値減去,藉此 產生頻譜偏差値向量。同樣地,緩衝的能量參數的平均副 訊框値可計算(慣例是在DTX編碼器完成,以產生SIE>訊 框)’然後從緩衝的副訊框能量參數値減去,藉此產生能 量偏差値向量β頻譜與能量偏離向量如此便包括頻譜與能 量參數的平均移除値。頻譜與能量偏離向量係經由一通信 路徑52從變化性決定器5 1至偏離向量儲存單元55溝通。 一係數計算器53亦耦合至輸入31,爲了要接收背景雜 -9· 本紙張尺度適用中固國家標準(CNS)A4規格(210 X 297公楚) — Ι1ΙΙΙΙΙΙΙΙΙ * 1 ! [ — — II ----— II-- (請先閱讀背面之沒意事項再填寫本頁) 469423 經濟部智慧財產局員工消費合作社印製 A7 B7 一 五、發明說明(7 ) 訊參數。該係數計算器5 3範例的操作是在相對的頻譜與能 量參數上執行傳統的A R估計。來自A R估計所產生的遽波 器係數係經由一通信路徑5 4從係數計算器5 3至一濾波器 5 7溝通。在5 3上所計算的濾波器係數可被定義,例如, 頻譜與能量參數的相對所有極濾波器。 在一具體實施例,係數計算器5 3可執行頻譜與能量 參數的第一階AR估計,以數傳統方式計算每一參數的瀘 波器係數al=Rxx(l)/Rxx(〇)e Rxx(〇)與Rxx(l)値是特殊參 數的傳統自相關値: |
; /V-J j * /?xr(0) = Ε Χ(Λ7) * X(/7) ⑴= ⑻ * 咖-1) /1=0 在這些Rxx計算,X表示背景雜訊(例如,頻譜或能量)參 數。a 1的正値通常表示參數變化緩慢,而且—負値通常表 示迅速變化。 根據一具體實施例,對於頻譜參數的每一訊框及能量參 數的每一副訊框而言,來自相對偏離向量的元件x(lc)能夠 是例如任意選取(經由儲存單元5 5的一 SELECT輸入),及 藉由使用相對的濾波器係數而由濾波器5 7過濾《來自濾波 器的輸出然後會經由例如一乘法器的-比例裝置5 9而藉由一 固定比例因素而比例處理。如圖5的χρβ)所示的依比例決 定輸出是提供给圖4的組合器45的輸入43。 -10- I —J 裝*-------訂---------線 ί請先閱讀背面之注意事項再填寫本頁} 本紙張尺度適用中园固家標牟(CNS)A4規格⑵〇 χ挪 ) 經濟部智慧財產局貝工消費合作社印製 46942 3 A7 ______ B7 五、發明說明(8 ) 在一具體實施例,在圖5A所述的圖式,—零交錯率決定 器50是在31上耦合,以便在37上接收緩衝的參數。該決 定器50可決定頻譜與能量參數的相對零交錯率。即是,或 在3 7上所緩衝的能量參數序列,而且亦是在3 7上所缓衝 的頻譜參數的序列,當以緩衝順序從第—參數看到最後參 數値的時候,零交錯率決定器50可決定在與參數値變化有 關符號的相對序列中的時間量。此零交錯率然後可使用在 5 6,以控制圖5的SELECT信號。 例如,對於一特定偏離向量而言,如果與該參數有關的 零交錯率相關當高(表示相當高的參數變化性),SElECT is號便可受到控制,以任意選取相當多頻率(時常是每一 訊框或副訊框)的偏離向量元件x(k);而且如果零交錯率是 相當低(表示相當低的參數變化性),以便可任意選取相對 少頻率(例如,時常少於每—訊框或副訊框)的偏離向量元 件x(k)。在其他的具體實施例,一特定偏離向量元件x(k) 的選擇頻率可以設定成—預定需要値。 圖4的組合器操作可將依比例決定的輸出xp(k)與傳統減 緩雜訊參數组合❶組合是頻譜參數的一訊框基礎上與在能 量參數的一副訊框基礎上執行,在一範例,組合器4 5可以 是一加法器’可將信號xp(k)加入傳統減緩雜訊參數。圖5 的依比例決定輸出xp(k)如此便可認爲是由組合器4 5所使 用的一干擾信號,以便干擾在3 3上所接收的傳統減緩雜訊 參數’爲了要產生輸入給減緩雜訊合成部分25的修改(或 干擾)的減緩雜訊參數(參考圖2-4)。 •11- 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 x 297公釐) ------------t--------訂---------線 <請先閲讀背面之注意事項再填寫本頁) ^ 6 94 2 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(9 ) 傳統減緩雜訊合成部分2 5能以傳統方式使用干擾的減緩 雜訊參數。由於傳統參數的混亂,所產生的減緩雜訊將會 是非完全隨意的變化性,其明顯會提高例如嘈雜聲與街道 雜訊及汽車雜訊的更多可變背景的感受品質。 在一範例的干擾信號xp(k)能以下式表示: xP(k)—βχ (bOx . x(k)- alx . Υχ . (xp(k-l)), 其中(011是依比例決定的因素,bOx和alx是濾波器係數,而 Yx是一頻寬擴展因素。 在圖5的虚線係描述省略濾波操作的一具體實施例,而 且干擾信號xp(k)包括依比例決定的偏離向量元件。 在某些具體實施例,圖3 - 5的修改器3 〇只在語音解碼器 (參考圖9 )提供,而且在其他的具體實施例,圖3_5的修改 器是分配在語音編碼器與語音解碼器之間(參考圖9的虛 線)。在修改器3 0只在解碼器提供的具體實施例,在圖3 所示的背景雜訊參數必須在例如解碼器確認。這可藉由在 37上的緩衝而達成,頻譜與能量參數的想要量(訊框與副 訊框)係經由傳輸通道而從編碼器接收。在一 DTX方法, 慣例可在解碼器使用的暗涵資訊可用來決定緩衝器3 7何時 包括與背景雜訊有關的唯獨參數。例如,如果緩衝器3 7能 緩衝N個訊框,而且如果殘留物的N個訊框是在語音分段 之後使用,在DTX模式(如傳統)的傳輸中斷之前,那麼這 些在切換成DTX模式之前的最後n個訊框便已知是只包^ 背景雜訊的頻譜與能量參數。這些背景雜訊參數然後可如 上所述由修改器3 0使用。 -12- 本纸張尺度適財關家標準(CNS)A4規格⑵〇 χ视公复.《y I----1! --------訂---------線 C請先閱讀背面之注音?事項再填寫本頁) 469423 A7 ----- B7 五、發明說明(ίο) 在修改器3 0分配在编碼器與解碼器之間的具體實施例, 平均變化性決定器5 1與係數計算器5 3可在編碼器提供。 因此’在此具體實施例的通信路徑5 2和5 4便類似用來將 傳統減緩雜訊參數從編碼器傳送給解碼器(參考圖丨和2 )的 傳統通信路徑。更特別是,如範例圖6所示,路徑5 2和5 4 的處理係經由一量化器(亦可參考圖丨)'一通信通道(亦可 參考圖1和2)、與一非量化部分(亦可參考圖2)而分別到儲 存單元55與濾波器57(亦可參考圖5)。無向量値與入尺濾 波器係數的量子化已知技術能與平均變化性與AR濾波器 係數資訊使用。 藉由傳統裝置,該編碼器知道背景雜訊的頻譜與能量參, 數何時可用平均變化性決定器5 1與係數計算器5 3的處 理,因爲這些相同的頻譜與能量參數使由編碼器慣例使 用’以產生傳統減缓雜訊參數。傳統編碼器典型可在許多 訊框上計算一平均能量與平均頻譜,而且這些平均頻譜與 能量參數可傳送給解碼器’當作減緩雜訊參數。因爲來自 係數计舁器5 3的遽波器係數與來自平均變化性決定器$ 1 的偏離向量必須橫跨如圖6所示的傳輸通道而從編碼器傳 送給解碼器’當該修改器是在編碼器與解碼器之間分配的 時候,便需要額外的頻寬。對照下,當該修改器完全提供 在解碼器的時候,沒有額外的頻寬需要實施。 圖7係描述上述的操作範例,此操作可由圖3,5的修改器 具體實施例執行。首先在7 1決定可用的頻譜與能量參數 (例如’在圖3的緩衝器3 7)是否與語音或背景雜訊有關。 •13- 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) 裝--------訂---------線 經濟部智慧財產局員工消費合作社印製
4 6 94 2 3 第88119423號專利申請案 中文說明書修正頁(90年8月) 五、發明説明( ) 11 如果可用的參數與背景雜訊有關,那麼例如平均變化性與 時間變化性的背景雜訊屬性便可在7 3估計。隨後在7 5, 插入的減緩雜訊參數會根據背景雜訊的估計屬性而受到干 擾。只在7 7偵測到背景雜訊,在7 5的干優程序便會持 績如果語音活動在7 7偵測到,那麼進一步背景雜訊參 數的可用性便可在7 1等候。
煩請委員明示 年,片日所提少 #:無變更賁質内容是否准予修正C € 圖8係描述可在圖7估計步驟73過程中執行的操作範 例。該處理在81認為是N個訊框與kN個副訊框,符合上 述N個緩衝訊框。在一具體實施例,N=8與k=4。具有N個 元件的頻譜偏離向量可在83獲得,而且具有kn個元件的 能量偏差向量可在85獲得。在87,一元件是從該等每一 偏離向量選取(例如,任意選取)。在8 9,濾波器係數會計 算,而且選定的向量元件因此會被濾波,在88,該等遽 波向量元件可依比例決定,為了要產生在圖7的步驟75使 用的干擾信號。圖8的虛線係符合圖5的虛線具體實施 例,即是*在濾波之中的具體實施例可被省略,而且依比 例決定偏離向量元件可當作干擾參數使用。 v圖9係描述能實施圖3-8的減緩雜訊參數修改器具體實施 例之一語音通信系統範例。一發射器XMTR包括一語音編 碼器91 ’其係經由一傳輸通道95而搞合至在一接收器 RCVR的語音解碼器93。圖9的其中一或兩發射器與接收 器可以是例如一無線電話、或一無線電通信系統其他元件 的部份。該通道9 5可包括例如一無線電通信通道。如圖9 所示’圖3-8的修改器具體實施例可在解碼器實施,或可 -14- 本紙張尺度逋用中國國家標竿(CNS) A4規格(210X297公着〉 修氬 猶充幕 4 6 942 3 η 第88119423號專利申請案 A7 中文說明書修正頁(90年8月)_B7 五、發明説明( ) 12 在如上所述與圖5和6有關的編碼器和解碼器(可參考虛線) 之間分配。. 對於技藝中熟諳此技術者很顯然可容易地實施圖3-9的 具體實施例,例如,藉著在傳統語音寫解碼器適度地修改 軟體、硬體或兩者。 上述的本發明可改良背景雜訊(在某些具體實施例沒有 額外的頻寬或功率成本)的本質。這使在語音寫解碼器的 語音與非語音模式之間切換更密切,因此更能由人耳接 受。 雖然本發明的具體實施例已在上面詳細描述,但是這未 局限本發明的範圍,本發明能以不同的具體實施例實施。 元件符號說明 23插入器 51變化性決定器 25合成操作(或合成成份) 52通信路徑 巧也本有"-變史贸货""是'&"予"正。 27合成濾波器 30修改器 3卜33輸入 35輸出 37背景雜訊緩衝器 41變化性估計器 43資訊輸出 45組合器 50零交錯率決定器 β 00 -orj 53係數計算器 54通信路徑 55偏離向量儲存單元 56選擇控制 57濾波器 59比例裝置 91語音編碼器 93語音解碼器 95傳輸通道 15 - 本紙張尺度通用中困國家摞準(CNS) A4规格(210X297公釐) 23專 94請 311申 8 二 28文 4第中 9 6 d
六、申請專利範圍 I .種自一通信通道接收語音與雜訊資訊的一語音解碼 器中產生減緩雜訊之方法,其包括·: 提供由該語音解碼器所正常使用的多數減緩雜訊參 數值,以產生減緩雜訊; 獲得表示一背景雜訊參數變化性的變化性資訊; 響應該變化性資訊,修改該減緩雜訊參數值,以產 生修改的減緩雜訊參數值;以及 使用該修改的減緩雜訊參數值產生減緩雜訊。 2.如申請專利範圍第1項之方法,其中該背景雜訊參數是 一頻譜參數。 3·如申請專利範園第1項之方法,其中該背景雜訊參數是 一能量參數。 4. 如申請專利範圍第1項之方法,其中該獲得步騾包括表 示一背景雜訊頻譜參數與一背景雜訊能量參數的變化 性之變化性資訊= 5. 如申請專利範圍第1項之方法,其中該獲得步騾包括計 算來自背景雜訊參數值的多數值的背景雜訊參數之一 平均值,並且從每一背景雜訊參數值減去該平均值, 以產生多數偏離值。 η 6. 如申請專利範圍第5項之方法,其中該修改步騾係包括 隨機選擇該等偏離值其中之一,藉由一比例因素而依 比例決定任意選定的偏離值,以產生一比例的偏離 值,及將該依比例決定的偏離值與該等其中一減緩雜 訊參數值組合,以產生該等其中一修改的減缓雜訊參 本紙浪尺度適用中國國家揉準(CNS) A4规格(210 X 297公釐)

Claims (1)

  1. 六、申請專利範園 數值。 7. 如申請專利範圍第1項之方法,其中該語音解碼器是在 一無線電通信裝置提供。 8. 如申請專利範圍第7項之方法’其中該語音解碼器是在 一細胞式電話提供。 9-如申請專利範圍第1項之方法,其中該獲得步騾係包括 該語音解碼器,以獲得該通信通道的獨立變化性資 訊。 10. 如申請專利範圍第1項之方法’其中該獲得步騾係包括 该语音解碼器,以便經由該通信通道而接收來自一語 音編碼器的該變化性資訊口 11. 如申請專利範圍第1項之方法,其中該變化性資訊係包 括平均變化性資訊,以表示該背景雜訊參數是如何與 該背景雜訊參數的一平均值有關。 4靖委員明示$"'^日所j之 私"本有無變更實質内容是一^准-。修正。 12-如申請專利範圍第1 1項之方法,其中該獲得步驟係包 括該背景雜訊參數多數值,以便在一段時間計算該背 景雜訊參數的一平均值,並且將該平均值與至少某些 背景雜訊參數值相比較,以產生該背景雜訊參數的平 均移除值。 13. 如申請專利範圍第1 2項之方法’其中該獲得步驟係包 括藉由使用多數該背景雜訊參數值,以計算遽波器係 數’並且根據濾波器係數濾波該背景雜訊參數的至少 某些平均移除值= 14. 如申請專利範圍第丨3項之方法,其中該最後提到使用 -2- 本紙張尺度通用中画g家橾準(CNS) A4规格(2l〇x 297公釐)
    A8 B8 C8 D8 六、申請專利範園 步驟係包括计异一_自動迴歸(regressive)預測器滤;皮器 的遽波器係數- 15. 如申請專利範圍第丨丨項之方法,其中該變化性資訊包 括表TF該背景雜訊參數如何在時間上改變的時間變 性資訊。 16. 如申請專利範圍第丨項之方法,其中該變化性資訊包括 表不該背景雜訊參數如何在時間上改變的時間變化性 資訊。 17· —種製造用於一語音解碼器中產生減緩雜訊的減緩雜 訊參數之裝置,該語音解碼器可接收來自一通信通道 的語音與雜訊資訊,該裝置包括: 一第一輸入,用以提供由該語音解碼器正常所使用 的多數減緩雜訊參數值,以產生減緩雜訊; 一第二輸入,用以提供一背景雜訊參數; 一修改器’其係耦合至該等第—及第二輸入,並且 響應遠背景雜訊參數的變化性特徵,用以修改該減緩 雜訊參數值,以產生修改的減緩雜訊參數值;以及 一輸出’其係耦合至該修改器,用以提供及修改在 產生減緩雜訊所使用的修改減緩雜訊參數值。
    如申請專利範圍第! 7項之裝置,其中該背景雜訊參數 是一頻譜參數- 19. 如申請專利範圍第1 7項之裝置,其中該背景雜訊參數 是一能量參數- 20. 如申請專利範圍第i 7項之裝置,其中該修改器包栝^ ' -3- 本紙張尺度適用中國g家樣準(CNS) A4規格(21〇 X 297公藿) 46 942 3 Λ一 一, 一: 、 9a r w A8 B8 C8 OS 六、申請專利範圍 變化性估計器’該變化性估計器係耦合至該第二輸 入’並且可響應該背景雜訊參數,用以產生該變化性 資訊。 。1 如申清專利紅圍第2 〇項之裝置,其中該變化性估計器 包括一平均變化性決定器,用以產生平均變化性資 訊’以表示該背景雜訊參數是如何隨著該背景雜訊參 數的—平均值改變。 22.如申請專利範圍第2 i項之裝置,其中該平均變化性決 定器是在該語音解碼器提供。 2j.如申請專利範圍第2 1項之裝置,其中該平均變化性決 定器是在一語音編碼器提供,該平均變化性決定器的 操作可經由該通信通道而與該語音解碼器溝通。 24. 如申請專利範圍第2 1項之裝置’其中該平均變化性決 定器係響應該背景雜訊參數的多數值,用以在某段時 段上计异該背景雜訊參數值之一平均值,而且進一步 操作可將該平均值與該等至少一些背景雜訊參數值相 比較,以產生該背景雜訊參數值的平均移除值。 25. 如申請專利範圍第2 4項之裝置’其中該變化性資訊係 包括時間變化性資訊,以表示該背景雜訊參數是如何 在時間上改變。 90. 8. 30 26. 如申請專利範圍第2 5項之裝置,其中該變化性估計器 係包括可響應該背景雜訊參數值的多數值之一係數計 算器’用以計算濾波器係數,該時間變化性資訊係包 括該等濾波器係數= 本紙張尺度逋用中a國家梯準(CNS) A4規格(210 X 297公釐) €%.Α.ί ABCD 六、申請專利範園 27. 如申凊專利範圍第2 6項之裝置,其中該等濾波器係數 是自動迴歸(regressive)預測器濾波器的濾波器係數^ 28. 如申請專利範圍第26項之裝置,其包括耦合至該係數 計算器的一濾波器,用以接收該等濾波器係數,並且 耦合至該平均變化性決定器,用以根據該等濾波器係 數而濾波該等其中至少一些平均移除的背景雜訊參數 值- 29. 如申請專利範圍第2 6項之裝置,其中該係數計算器是 在該語音解碼器提供中提供。 30. 如申請專利範圍第2 6項之裝置’其中該係數計算器在 一語音編碼器提供’該係數計算器的操作可經由該通 信通道而與該語音解碼器溝通。 31. 如申請專利範圍第2 0項之裝置,其中該變化性資訊包 括時間變化性資訊,以表示該背景雜訊參數如何在時 間上改變。 -5- 本Μ·張尺度適用t ®國家梯準(CNS) Α4规格(21〇Χ 297公釐)
TW088119423A 1998-11-23 1999-11-06 Method of generating comfort noise in a speech decoder that receives speech and noise information from a communication channel and apparatus for producing comfort noise parameters for use in the method TW469423B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10955598P 1998-11-23 1998-11-23
US09/391,768 US7124079B1 (en) 1998-11-23 1999-09-08 Speech coding with comfort noise variability feature for increased fidelity

Publications (1)

Publication Number Publication Date
TW469423B true TW469423B (en) 2001-12-21

Family

ID=26807080

Family Applications (1)

Application Number Title Priority Date Filing Date
TW088119423A TW469423B (en) 1998-11-23 1999-11-06 Method of generating comfort noise in a speech decoder that receives speech and noise information from a communication channel and apparatus for producing comfort noise parameters for use in the method

Country Status (12)

Country Link
US (1) US7124079B1 (zh)
EP (1) EP1145222B1 (zh)
JP (1) JP4659216B2 (zh)
KR (1) KR100675126B1 (zh)
CN (1) CN1183512C (zh)
AR (1) AR028468A1 (zh)
AU (1) AU760447B2 (zh)
BR (1) BR9915577A (zh)
CA (1) CA2349944C (zh)
DE (1) DE69917677T2 (zh)
TW (1) TW469423B (zh)
WO (1) WO2000031719A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI480857B (zh) * 2011-02-14 2015-04-11 Fraunhofer Ges Forschung 在不活動階段期間利用雜訊合成之音訊編解碼器
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
US6662155B2 (en) 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US7305340B1 (en) * 2002-06-05 2007-12-04 At&T Corp. System and method for configuring voice synthesis
ATE322733T1 (de) * 2002-07-02 2006-04-15 Teltronic S A U Verfahren zur synthese von komfortgeräusch-rahmen
FR2861247B1 (fr) * 2003-10-21 2006-01-27 Cit Alcatel Terminal de telephonie a gestion de la qualite de restituton vocale pendant la reception
DE102004063290A1 (de) * 2004-12-29 2006-07-13 Siemens Ag Verfahren zur Anpassung von Comfort Noise Generation Parametern
FR2881867A1 (fr) * 2005-02-04 2006-08-11 France Telecom Procede de transmission de marques de fin de parole dans un systeme de reconnaissance de la parole
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
CA2609945C (en) * 2005-06-18 2012-12-04 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
US20070038443A1 (en) * 2005-08-15 2007-02-15 Broadcom Corporation User-selectable music-on-hold for a communications device
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
RU2469419C2 (ru) * 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и устройство для управления сглаживанием стационарного фонового шума
GB2454470B (en) * 2007-11-07 2011-03-23 Red Lion 49 Ltd Controlling an audio signal
US20090154718A1 (en) * 2007-12-14 2009-06-18 Page Steven R Method and apparatus for suppressor backfill
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US8290141B2 (en) * 2008-04-18 2012-10-16 Freescale Semiconductor, Inc. Techniques for comfort noise generation in a communication system
ES2642906T3 (es) * 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
ES2681429T3 (es) * 2011-02-14 2018-09-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido en códecs de audio
BR112013020587B1 (pt) 2011-02-14 2021-03-09 Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
US20140278393A1 (en) 2013-03-12 2014-09-18 Motorola Mobility Llc Apparatus and Method for Power Efficient Signal Conditioning for a Voice Recognition System
US20140270249A1 (en) 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Estimating Variability of Background Noise for Noise Suppression
CN106169297B (zh) * 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
DK3217399T3 (en) * 2016-03-11 2019-02-25 Gn Hearing As Kalman filtering based speech enhancement using a codebook based approach

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630016A (en) 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
JP2541484B2 (ja) * 1992-11-27 1996-10-09 日本電気株式会社 音声符号化装置
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US5893056A (en) 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI480857B (zh) * 2011-02-14 2015-04-11 Fraunhofer Ges Forschung 在不活動階段期間利用雜訊合成之音訊編解碼器
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Also Published As

Publication number Publication date
KR100675126B1 (ko) 2007-01-26
CA2349944C (en) 2010-01-12
EP1145222B1 (en) 2004-05-26
WO2000031719A3 (en) 2003-03-20
CN1183512C (zh) 2005-01-05
AR028468A1 (es) 2003-05-14
JP2003529950A (ja) 2003-10-07
WO2000031719A2 (en) 2000-06-02
CA2349944A1 (en) 2000-06-02
JP4659216B2 (ja) 2011-03-30
AU1591100A (en) 2000-06-13
KR20010080497A (ko) 2001-08-22
EP1145222A2 (en) 2001-10-17
AU760447B2 (en) 2003-05-15
BR9915577A (pt) 2001-11-13
CN1354872A (zh) 2002-06-19
EP1145222A3 (en) 2003-05-14
DE69917677T2 (de) 2005-06-02
DE69917677D1 (de) 2004-07-01
US7124079B1 (en) 2006-10-17

Similar Documents

Publication Publication Date Title
TW469423B (en) Method of generating comfort noise in a speech decoder that receives speech and noise information from a communication channel and apparatus for producing comfort noise parameters for use in the method
AU763409B2 (en) Complex signal activity detection for improved speech/noise classification of an audio signal
JP6976934B2 (ja) ビットバジェットに応じて2サブフレームモデルと4サブフレームモデルとの間で選択を行うステレオ音声信号の左チャンネルおよび右チャンネルを符号化するための方法およびシステム
US9646616B2 (en) System and method for audio coding and decoding
JP5009910B2 (ja) レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US8718804B2 (en) System and method for correcting for lost data in a digital audio signal
KR102132798B1 (ko) 노이즈 신호 처리 및 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩 및 디코딩 시스템
US20110002266A1 (en) System and Method for Frequency Domain Audio Post-processing Based on Perceptual Masking
JP2004525540A (ja) 音声通信中に快適ノイズを発生するための方法およびシステム
US20100318352A1 (en) Method and means for encoding background noise information
EP3457402A1 (en) Signal processing method and device adaptive to noise environment and terminal device employing same
US6424942B1 (en) Methods and arrangements in a telecommunications system
EP1328923A1 (en) Perceptually improved encoding of acoustic signals
AU2001284606A1 (en) Perceptually improved encoding of acoustic signals
WO2024051412A1 (zh) 语音编码、解码方法、装置、计算机设备和存储介质
JP2003533902A5 (zh)
JP2003533902A (ja) 符号化されたドメインのエコーの制御
US8949121B2 (en) Method and means for encoding background noise information
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
RU2237296C2 (ru) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees