TW403891B - The changeable audio encoding and decoding method - Google Patents

The changeable audio encoding and decoding method Download PDF

Info

Publication number
TW403891B
TW403891B TW086111418A TW86111418A TW403891B TW 403891 B TW403891 B TW 403891B TW 086111418 A TW086111418 A TW 086111418A TW 86111418 A TW86111418 A TW 86111418A TW 403891 B TW403891 B TW 403891B
Authority
TW
Taiwan
Prior art keywords
source
sound source
sound
code
signal
Prior art date
Application number
TW086111418A
Other languages
English (en)
Inventor
Bunkei Matsuoka
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of TW403891B publication Critical patent/TW403891B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

ΚΙ 403891 ----_ΒΖ_ 五、發明說明(1 ) [發明所屬之技術領域] 本發明有關於可變率語音編碼和可變率解碼方法,在用 於語音資訊之傳送/儲存之語音編碼方式中,將可變率傳 送 fcb 較容晃之 CDMA(Code Division Multiple Acce.ss)方 式使用作為線路多工化方式,用在無線通信糸統,和利用 ^只(48711<:1'0110.113_1>3113€611*{{〇€16)交換之無線/有線通信 系統,另外,在用於語音之儲存用途等之可變率語音編碼 和解碼方法中,MCELP(Code E_xcited Linear Prediction)語音編碼方式作為基本演算法,用來控制音 源資訊參數之傳送/非傳送藉以使編碼率成為可變之方式。 [習知之技術] 在具有以CELP語音編碼方式作為基本方式之習知之可變 率語音編碼方法中,K處理框架為單位判定音源信號之傳 送/非傳送之具有可變率者包含有被揭示在日本國專利案 特開平7-3 6 49 5號公報之可變率語音編碼裝置之方法。圖9 表示該習知之可變率語音編碼方法之處理框架簞位之處理 步驟。該編碼處理是對於被分割成處理框架單位之語音信 號之輸入,以同一處理順序的實行。亦即,在目前之處理 框架之編碼處理結束後,輸入下一個處理框架之語音信號 ,從步驟SP1起開始編碼處理。首先在線型預測分析步驟 SP2進行語音信號之線型預測分析,抽出該處理框架之語 音信號作為表示頻譜資訊之線型預測參數。另外該線型預 测參數被另外編碼和送出。 然後,在音源編碼本探索步驟SP3,對於該處理框架之 本纸張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 一 - \ly — — — — — — illl — Ι. I -Γ I I k II I « — — — — — — I— — 1^- i (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 4 A7 403891 _B7_._ 五、發明說明(2 ) 輸入語音信號,以形成失真最小之方式獲得合成語音信號 ,依此方式選擇適應音源向量和雜音音源向量。此種處理 是記憶過去之驅動音源向量,對於適應音源編碼本和雜音 音源編碼本之輸出之最佳組合,順序使用在線型預測分析 步驟SP2所獲得之線型預測參數(量化後),將適應音源向 量和雜音音源向量加算後之信號,輸人到合成濾波器,選 擇被輸出之合成音信號和參考語音信號之輸入語音信號之 間之失真成為最小之組合,MA-b-S(Analysis by Synthesis)方法實現。 另外,適應音源編碼本是Μ語音信號之音距週期,時間 序列的輸出週期化之適應音源向量,雜音音源編碼本是記 憶多個由如同隨機雜音產生之時間序列之雜音音源向量和 將其輸出。其中,作為各個音源編碼本之構造是對於音源 進行增益之正規化,將時間序列並排者保持在編碼本,將 增益另外算出之進行編碼傳送之一般之構造,但是在Μ下 之說明中,各個音源向量包含音源增益。另外,在該過程 中,利用A-b-S方法,在獲得適應音源向量和雜音音源向 量之最佳組合之時刻,同時獲得合成音信號。 其次,在適應音源驅動合成語音信號合成步驟SP4,只 使用上述之音源編碼本探索步驟SP3所選擇之適應音源向 量,與音源編碼本探索步驟SP 3同樣的,使用合成濾波器 進行輸出。在下一個之送出判定步驟SP5,根據合成音品 質之臨界值之判定,經由制止雜音音源編碼本索引之傳送 ,用來實現可變率。 紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -5 - -----^-------'裝—‘----ί---訂---------線 (請先閱讀背面之注音3事項再填寫本頁) 經濟部智慧財產局員工消費合作杜印製 A7 403891 _____B7_· 五、發明說明(3 ) (請先閱讀背面之注意事項再填寫本頁) 亦即,在該送出判定步驟SP5,其實現是經由具備有: SNtt算出步驟SP5a,對於假想合成音,算出相對輸入語音 之SN比(信號對雜音之比臨界值比較步驟SP5b,用來使 該SN比和預先設定之某一個固定之臨界值進行比較;停止 轉送步驟SP5c,當該臨界值比較步驟SP5b判斷為即使制止 使用雜音音源編碼本索引,所獲得之語音品質亦超過該臨 界值時,就從被送出之編碼本索引中,制止雜音音源編碼 本索引之傳送;和通常送出步驟SP5d,在其他之情況時, 送出全部之編碼本索引。 在該送出判定步驟SP 5,於該處理框架之钃碼被送出之 後,在下一個之步驟SP6使該處理框架之編碼處理結束* 再度從步驟SP1起,開始下一個處理框架之處理*使其順 序的重複用來進行編碼處理。 經濟部智慧財產局員工消費合作社印製 因此,在日本國專利案特開平7-3 6 495號公報之可變率 語音編碼裝置中,對於只使用雜音音源向量合成之合成音 ,利用與上述者同樣之臨界值評估,用來進行制止該適應 音源編碼本索引之傳送之處理。但是,進行該處理之輸入 語音期間,因為大致被限定在週期性欠缺資訊之無音區間 ,所Μ不能改善語音之有音正常區賻之音質° [發明所欲解決之間題] CELP語音編碼方式之適應音源煽碼本所具有之任務是根 據語音之音距週期用來表現週期之構造,另外一方面之雜 音音源編碼本所具有之任務是對於適應音源編碼本不能表 現之成分,亦即除了音源資訊中之週期性成分以外之其餘 本紙張尺度適用中國國家標準(CNS)A4規格(210x 297公釐) ——6 - A7 403891 _B7_ 五、發明說明(4 ) 成分,Μ雜音成分補助。另外,經由使用其相加後所產生 之音源信號,可Μ用來提高編碼後之音源信號之再現性, 可Μ獲得高品質之合成音。 在圖9所示之上述之可變率語音編碼方法中,於如同語 音之有音正常區間之語音之週期性近似無變化之區間,所 進行之處理是大致制止雜音音源編碼本索引之傳送,只進 行適應音源編碼本索引之傳送。然而,在本來之雜音音湄 向量只有適應音源向量時,因為所具有之任務用來補肋不 能充分表現之週期構造,所Μ當雜音音源向量全部不用時 ,週期構造之表現會變為不充分,在該區間之音質,當與 使適應音源向量和雜音音源向量雙方重蠱藉Μ合成之合成 音比較時,會有大幅之音質劣化為其問題。 另外,在Μ上述方式構成之習知之裝置之方法中,因為 不使用傳送附加資訊之另外之構造,進行制止雜音音源 編碼本索引之傳送,只傳送適應音源編碼本索引之動作, 所W輸入語音區間之音質改善之實現會有困難為其問題。 另外,在圖9所示之上述之可變率語音編碼方法中,對 於該處理框架之輸入語音信號,算出只利用適應音源向量 獲得之合成音之相對輸入語音信號之SNR (信號對雜音之比 ),使其與預先設定之固定之臨界值進行比較,用來決定 雜音音源編碼本索引之送出之有無。然而,在通常之CELP 語音編碼方式中,對於處理框架單位Κ失真最小之基準進 行編碼,所Μ對於處理框架單位之合成音之輸入語音信號 之SHR*即使在連續之框架間亦隨時會有大的變化。因此 紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) _ 7 - (請先閱讀背面之注音?事項再填寫本頁) 裝 訂---------镍 經濟部智慧財產局員工消費合作社印製 A7 408891 五、發明說明(5 ) 在上述之固定之臨界值基準,例如在語音之正常區間等, 框架單位之各個編碼本索引之送出/非送出會變為混亂, 其結果是會有合成音變為不穩定之問題。 本發明用來解決上述之問題,其目的是提供可變率語音 編碼方法和可變率語音解碼方法,在制止雜音音源編碼本 索引之傳送,和只進行適應音源編碼本索引之傳送之輸入 語音狀態*亦不會有編碼效率之劣化,可Μ改善音質,和 可Κ事先防止輸出合成語音之變成不穩定。 [解決問題之手段] 在本發明之可變率語音編碼方法中,採用CELP語音編碼 方式,具有:適應音源編碼本,用來收納Μ音距週期使過 去之框架之音源信號重複之適應音源向量;和雜音音源編 碼本,用來收納雜音音源向量;其特戳是所具備之步驟有 :音源編碼本探索步驟,Κ所獲得之第1合成語音信號對輸 入語音信號之失真成為最小之方式,利用音源編碼本和雜 音音源編碼本,選擇適應音源向量和第1雜音音源向量和 將其輸出;假想參考語音信號合成步驟,使用適應音源向 量所產生之音源信號,製成假想參考語音信號;第2音源 編碼本探索步驟,Μ所獲得之第2合成語音信號對假想參 考語音信號之失真成為最小之方式,選擇對應到適應音源 向量之第2雜音音源向量;和編碼語送出序列選擇步驟, 依照第2合成語音信號之品質,用來制止對應到第1雜音音 源向量之雜音音源編碼本索引之送出。 另外,在本發明之可變率語音編碼方法中,其中編碼語 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 2.97公釐) (請先閲讀背面之注Λ.思事項再填寫本頁) 裝i>----Γ--訂---------線/ 經濟部智慧財產局員工消費合作社印製 8 403891 --------線, A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明( 6 ) 送 出 序 列 選 擇 步 驟 具 備 有 * ♦ 合 成 音 品 質 尺 度 化 步 驟 9 對於 輸 入 語 音 信 號 將 第 1合成語音信號和第2合 成 語 音 信 號及 假 想 參 考 語 音 信 號 之 品 質 替 換 成 數 值 尺 度 * * 臨 界 值 算 出步 驟 使 用 合 成 音 品 質 尺 度 化 步 驟 所 算 出 之 第 1合成語音信 號 之 品 質 和 假 想 參 考 語 音 信 m 之 品 質 1 算 出 比 較 臨 界 值; 臨 界 值 fcb 較 步 驟 9 用 來 使 比 較 臨 界 值 和 第 2合成語音信號 進 行 比 較 和 送 出 判 定 步 驟 9 依 照 臨 界 值 fcb 較 步 驟 之 比較 結 果 判 定 是 否 制 止 對 應 到 第 1雜音音源向量之雜音音源 編 碼 本 索 引 之 送 出 〇 另 外 在 其 次 之 本 發 明 之 可 變 率 語 音 解 碼 方 法 中 $ 採用 CELF 語 音 解 碼 方 式 9 具 有 ♦ ♦ 適 應 音 源 編 碼 本 9 用 來 收 納Μ 音 距 週 期 使 過 去 之 框 架 之 音 源 信 號 重 複 之 適 ntef m 音 源 向 量; 和 雜 音 音 源 編 碼 本 用 來 收 納 雜 音 音 源 向 量 其 特 徵 是所 具 備 之 步 驟 有 * 第 1合成音輸出步驟 在收訊到之序列包 含 有 適 應 音 源 編 碼 本 索 引 和 雜 音 音 源 編 碼 本 索 引 之 情 況時 9 收 訊 到 之 適 應 音 源 編 碼 本 索 引 和 雜 音 音 源 編 碼 本 索引 所 對 應 之 適 ite 懕 音 源 向 量 和 雜 音 音 源 向 量 之 雙 方 用 來 產 生音 源 9 使 用 該 音 源 用 來 輸 出 第 1合成音 ;假想參考語音信號 合 成 步 驟 9 在 收 訊 到 之 % 統 未 包 含 有 雜 音 音 源 編 碼 本 索引 之 情 況 時 9 Μ 收 訊 到 之 適 Itftr 愿 音 源 編 碼 本 索 引 所 對 邮 臞 之 ids ItfR 週懕 音 源 向 量 用 來 產 生 音 源 9 使 用 該 音 源 用 來 合 成 假 想 參 考語 音 信 號 « t 和 第 2合成音輸i B步驟 ,K所獲得之合成語音信 . 號 對 假 想 參 考 纽 音 信 號 之 失 真 成 為 最 小 之 方 式 9 選 擇 收訊 到 之 適 應 音 源 編 碼 本 索 引 所 示 之 適 ntp 懕 音 源 向 量 之 神1 對 應 之雜‘ ——:----1------裝----^——訂 (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 χ 297公釐) 403891 A7 ~~___B7________ 五、發明說明(7 ) 音音源向量,藉Μ輸出使用選擇婼果所合成之第2合成音。 [發明之實施形態] (請先閱讀背面之注意事項再填寫本頁) 下面將參照附圖用來詳细的說明本發明之實施形態。 ijfe形態1 . 阖1是流程圖,用來表示依照本發明之可變率語音編碼 方法之實施形態1。在圖1中,其與圖9之上逑習知之可變 率語音編碼方法之不同之處在於第2音源編碼本探索步驟 SP1 4和編碼語送出序列選擇步驟SP15。該第2音源編碼本 探索步驟SP 14所實行之處理是選擇對應到適應音源向量之 第2雜音音源向量,用來獲得對假想參考語音信號之失真 最小之第2合成語音信號。另外,編碼語送出序列選擇步 驟SP15所實行之處理是依照第2合成語音信號之品質,Γ 制止對應到第1雜音音源向量之索引送出。j 經濟部智慧財產局員工消費舍作社印製 另外,編碼語送出序列選擇步驟SP15之構成包含有合成 音品質尺度化步驟SP15a,臨界值算出步驟SP15b,臨界值 fcfc較步驟SP15c,傳送停止步驟SP15d和通常送出步驟SP5e 。另外,線型預測分析步驟SP11*音源編碼本探索步驟評 12,假想參考語音合成步驟SP13,因為與圖9之可變率語 $ 音編碼方法相同,所以Μ下只進行簡單之動作說明。 另外,在可變率語音編碼方法中,對於被分割成處理框 架單位之語音信號之輸入,Κ相同之處理流程順序的實行 處理。亦即,當先前之處理框架之編碼處理結束後,輸入 下一個框架之語音信號,從步驟SP10起開始編碼處理。實 行下一個之線型預測分析步驟SP11,音源編碼本探索步驟 冢紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 7~ A7 403891 —----—J___ 五、發明說明U ) SP12和假想之參考語音信號合成步驟SP13。 (請先閱讀背面之注意事項再填寫本頁) 該等處理以與習知者同樣之方法進行,在線型預測分析 步驄SP11輸出線型預测參數。然後在下一個之音源編碼本 探索步驟SP12,K參考語音作為輸入語音信號,選擇適應 音源向量和雜音音源向量用以獲得第1合成音信號,使其 與輸入語音信號之間之失真成為最小,和使第丨合成音信. 號一起被輸出。然後,在假想之參考語音信號合成步驟 SP13,輸出假想參考語音信號。 其次實行第2音源編碼本探索步驟SP14。在該處理中所 實行之處理是對於上述之假想合成語音信號,再度選擇雜 音音源向量用Μ獲得失真最小之第2合成音信號。亦即, Μ該第2合成音信號和假想參考語音信號合成步驟SP13所 獲得之假想參考語音信號之間之失真成為最小之方式,對 於音源編碼本探索步驟SP12所獲得之適應音源向量之最佳 組合之雜音音源向最,利用A-b-S方法選擇第2雜音音源向 量,藉K輸出第2合成音信號。 經濟部智慧財產局員工消費合作社印製 在本實施形態1中,音源編碼本探索步驟SP12之輸出之 第1雜音音源向量是傳送對象,因為第2雜音音源向量變成 非傳送,所Μ在第2音源編碼本探索步驟SP14,不需要輸 出第2雜音音源向量。 其次在編碼語送出序列選擇步驟SP15,進行判定是否傳 送第1雜音音源尚量。首先在合成音品質尺度化步驟SP15a ,對於先前之各個步驟所輸出之第1合成音信號,第2合成 音信號和假想參考語音信號,使其與該處理框架之輸入語 11 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 403891 A7 _____B7___ 五、發明說明(9 ) (請先閱讀背面之注音?事項再填寫本頁) 音信號進行比較,Μ數值尺度算出語音品質。該數值尺度 在本實施形態1中使用各個合成音信號和輸入語音信號之 SNR (信號雜音比)。 其次利用合成音品質尺度化步驟SP15a所獲得之各個合 成音信號之’S HR,使用臨界值算出步驟SP15b,用來算出判 定臨界值。在本實施形態中,使用Μ下所逑之算式用來算 出判定臨界值。在本實施形態中,該算式使用大量之資料 ,使用第1合成音信號,第2合成音信號和假想參考語音信 號,和輸入語音信號之SNR之統計性質(平均,分散),可 Μ使用進行定式化之方法實規。 [表1 ] 第1合成 第2合成 假想參考 音品質 音品質 音品質 平均(dB) 11.8 9.32 8.79 分散(dB) 7.22 7.40 7.43 經濟部智慧財產局員工消費合作社印製 表1是對於本實施形態之可變率語音編碼裝置,男聲/女 聲各5篇文章之輸入語音,涵蓋約6000個框架之箄1合成音 信號,第2合成音信號和假想參考語音信號,和輸入語音 信號之各個框架單位之SNR之平均和分敗之實例。由該表 t 中可K瞭解,第2合成音信號之SNR之平均值是將第1合成 音信號和假想參考語音信號之SNR之平均值内分成大約8: 2之比所取得之值,而且其分散大致相同。 對於各個SNR之分散,因為分別具有大致相等之值*所 Μ可K使用該內分比作為判定臨界值算出之基準。亦即* 12 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) A7 403891 _B7______ 五、發明說明(i〇 ) <請先閱讀背面之注意事項再填寫本頁) 求各個處理框架單位之第1合成音信號和假相參考語音信 號之相對輸入語音信號之SNR,K某一個固定比對其進内 分之方式,算出Μ該比(在表1之實例為大約8: 2)進行内分 之内分點之值作為判舍臨界值。 在臨界值比較步驟SP15c,使上述之算出之判定臨界值 和第2合成音信號之SNR進行比較。當第2合成音信號之SNR 低於被算出之判定臨界值時,就使用傳送停止.處理步驟 SP15d,停止第1雜音音源向量之傳送,當第2合成音信號 之S HR超過被算出之判定臨界值時*就使用通常送出處理 步驟SP15e *如通常之方式轉送第1雜音音源向量。由表1 之統計亦可Μ明瞭,在未傳送第1雜音音源向量之情況時 ,經由使用第2合成音信號,當與使用假想參考語音信號 之情況比較時,可Μ獲得品質良好之合成語音。 在編碼語送出序列選擇步驟SP15,在該處理框架之編碼 被送出之後,就在下一個之步驟SP1 6,使該處理框架之編 碼處理結束,從步驟SP 10起開始下一個處理框架之處理, 順序的對其進行重複之編碼處理。 經濟部智慧財產局員工消費合作社印製 在画2中,對於實施形態1之可變率語音編碼方法,使用 信號之流動用來說明其具體之動作。圖中之符號*是語音 信號輸入端,2是編碼輸出端。另外,符號3是線型預測分 析裝置* 4是適蠃音源編碼本,5是雜音音源編碼本,6是 合成濾波器。另外,符號7是最適音源選擇裝置,8是編碼 語送出序列選擇裝置,9是假想參考語音信號用緩衝器。 符號10、11、12、13是使用音源選擇開關,14是合成音輸 紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -1 ^ - 403891 a? B7 ------- 五、發明說明(11 ) (請先閱讀背面之注意事項再填寫本頁) 出對象選擇開關’ 15是參考語音選擇開醑’ 16是適應音源 婿益選擇裝置’ 17是雜音適應音源增益選擇裝置°另外’ 對於各個信號’ S1是輸入語音信號’ S2是線型預測參數, S3是瘕想參考語音信號’ S4是第1合成音信號’ S5是第2合 $胃信號,S6是音源編碼本選擇控制信號。 經濟部智慧財產局員工消費合作社印製 胃際上從語音信號輸入端1輸入該輸入語音S1。然後, 從編碼輸出端2輸出該編碼語送出序列選擇裝置8所選擇之 編碼序列。在線型預測分析裝置3被輸入有該輸人語音S1 ,藉Μ輸出線型預測參數S2。該線型預测參數S2可K進行 另外之量化,當作編碼序列之一部份的送出。適應音源編 碼本4和雜音音源編碼本5及適應音源增益選擇繡碼裝置16 和雜音適應音源增益選擇編碼裝置17均受音源編碼本選擇 控制信號S6之控制,用來輸出未包含增益之適應音源尚量 ,未包含增益之雜音音源向量,適應音源增益和雜音音源 增益,選擇後保持在等待下一個選擇之開始之狀態。另外 ,在本說明中,未包含增益之適應音源向量和適應音源增 益及未包含增益之雜音音源向量和雜音音源增益集合在一 起,分別稱為適應音源向量,雜音音源向量*該集合分別 Μ適應音源編碼本,雜音音源編碼本表示。 另外,合成滹波器6被輸入有得自線型預測參數S 2和適 應音源向量或雜音音源信號之組合之各種音源信號,藉Κ 對假想參考語音信號S3和合成音信號S4,S5進行合成。最 適音源選擇裝置7評佑參考語音信號S1或S3,和合成音信 號S4 ’ S5之間之失真,Μ使該失真成為最小之方式,選擇 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公1' 一 14 一 經濟部智慧財產局員工消費合作社印製 403891 A7 B7 五、發明說明(12) 未包含增益之適應音源向量,未包含增益之雜音音源向量 ,適應音源增益和雜音音源增益,用來調整和輸出音源編 碼本選擇控制信號S6。編碼語送出序列選擇裝置8被輸入 有輸入信號S1,假想參考語音信號S3,第1合成音信號S4 *和第2合成音信號S5,利用該等之品質和另外算出之臨 界值之評估,用來控制雜音音源編碼本索引之送出。 假想參考語音信號用緩衝器9用來暫時保存假想參考語 音信號作為音源編碼塊選擇用。使用音源選擇開關10、n 、i2、13用來控制作為選擇對象之音源向量和其組合。合 成音輸出對象選擇開關14,在合成該假想參考語音信號S3 之情況,和選擇合成該第1合成音信號S4,第2合成音信號 S5之情況,用來控制其輸出對象。參考語音選擇開關15在 音源選擇遴程中,從輸入語音信號S1和假想參考語音信號 S3之中選擇參考語音信號。適應音源增益選擇裝置16和雜 音適應音源增益選擇裝置17分別接受音源編碼本選擇控制 信號S6,用來調整各個音源向量所具有之增益。這時所選 擇之各個增益被編碼和送出。 下面將使用圖1和圖2用來說明本實施形態1之每一個步 驟之動作。另外,圖1之媒型預測分析步驟SP11·編碼語 送出序列選擇步驟SP15因為分別對應到圖2之線型預溯| & 析裝置3,編碼語送出序列選擇裝置8,所K以下之說明對 其進行省略。首先,在圖1中之音源編碼本探索步驟SP12 ,依下述方式連接圖2之使用音源選擇開關1〇,π, 12, 13和合成音輸出對象選擇開關14,參考語音選擇開關15, 本纸張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閲讀背面之注音2事項再填寫本頁) 袭----訂---------線 15 A7 B7 403891 五、發明說明(13 ) 然後進行開始。亦即*連接使用音源選擇開關10,將使用 音源選擇開關11連接到端子b側,將使用音源選擇開關12 遽接到端子b側,和連接使用音源選擇開關1 3。另外,將 合成音輸出對象選擇開關14連接到端子b側,和將參考語 .· 音選擇開關15連接到端子b側。 在此種連接狀態之圖2之信號流程是對合成濾波器6輸入 該適應音源向量和雜音信號向量之加算後之音源信號,從 合成滹波器輸出之合成語音信號,K對輸入語音信號S1之 失真成為最小之方式,輸出音源編碼本選擇控制信號S6* 用來選擇適應音源向量和雜音音源向量。該音源編碼本探 索步驟SP 12之處理結果是利用最終之來自合成濾波器6之 合成語音信號之輸出,獲得第1合成語音信號S4,選擇作 為其音源信號之適應音源向量和第1雜音音源向量。 其次,圖1之假想參考語音信號合成步驟SP13之實現是 使画2中之使用音源選擇開關10開路,將使用音源選擇開 關11連接到端子a側,將使用音湄選擇開關12連接到端子a 側,和將使用音源選擇開關13開路。另外,將合成音輸出 對象選擇開關14連接到端子a側,將參考語音選擇開關15 連接到端子b側。在此種連接狀態之圖2之信號流程是對合 成濾波器6輸入在音源編碼本探索步驟SP12所選擇之適應 音源向量作為音源信號,當作假想參考語音信號S3的輸出 *輸出到假想參考語音信號用緩衝器9和輸出到編碼音送 出序列選擇裝置8。 另外,圖1之第2音源編碼本探索步驟SP14之實現是在圖 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閱讀背面之注意事項再填寫本頁) ,裝---^----:11 訂---------線/'_ . 經濟部智慧財產局員工消費合作社印製 16 403S91 A7 ____B7 五、發明說明(14) 中 子 端 到 接 逋 11 11 關 開子 擇端 選到 源接 音連 J 2 用 1 使關 將開 ,擇 10選 關源 開音 擇用 選使 源將 音 , 用側 使 ί 接 遵 側 接 a 5 關 開 擇 選 音一語 考 參 ο 條 開則 3 俱 11 1D 關子 開端 擇到 選接 源連 i 4 音 1 用關 使開 將擇 和選 另 象 對 出 輸 音 成 合 將 滹 成 合 對 是 程 流 .號 信 之 源 音 應 適 之 擇 選 所 2 1 P S ns xk. 圖驟 之步 態索 狀探 接本 連碼 種編 此源 在音 。 在 側入 a 輸 子6® 端器 到波 之 量 向 源 音 音 雜 W輸罾 量61衝 向器緩 波 濾 成 合 使 Μ * 號 信 源 音 之 後 算 加 用 , 號式 信方 音 之 語小 考最 參為 想成 假真 在失 持之 保S3 被號 對信 號音 信語 音考 語參 成想 合假 之之 17 出 號. 信 制 控 擇 選 本 碼 編 源 音 出 輸 該 ° 量 向 源 音 音 雜 合 之 終 最 用 利 是 身 結 I: 理 處 之 4 1X P 5 驟 號 信 音 語. 成 合 2 第 得 獲 > 出 輸 之 號 信 步音. 索語 採成 本合 碼之 扁 6 鋸器 音 2 0 f 第成S5 量 向 源 音 音 雜 (請先閲讀背面之注意事項再填寫本頁) 態 形 施 實 本 第在 擇, 選外 , 另 中 Ί- 音 音 雜 之 明 說 所 止 為 前 百 音編 雜源 機音 随音 或雜 習是 學但 前 , 事·引 用索 利加 於附 對* 設量 假向 是之 態列 形序 成間 構時 之之 本得 碼獲 編所 源等 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 17 碼方法亦可K使用其他之方法,例如亦可Μ使用「Fast C E L P C 〇 d i n g B a s e d ο n A 1 g e b 1 i c C 〇 d e s j (J - P . A d 〇 u 1 , P. Mabilleau, M. Delprat, S. Morissette著,被記載 在 Proc. ICASSP* 87, pp 1957-1960(1987))之所謂之代 數激振編碼。 另外,使用該代數激振編碼之語音編碼方式包含有被掲 示在「05 40£1^之基本演算」(片岡章俊,林伸二*守谷 健弘,栗原祥子,間野-則著,NTT R&D,Vol . 45, pp _ 1 7 _ A7 403891 ^----- 五、發明說明.(1A) (請先閱讀背面之注意事項再填寫本頁) 325-330 » (1996))之 CS-ACELPC Conjugate-Structure Algebraic)方式 * 採用 ITU-T G. 729 8fc bps標準方式 ’ Μ 此種方式作為編碼之基本演算*亦可適於使用本實施形 1所示之可變率語音編碼方法。該ITU-T G. 729 8kbps標 準方式中之代數激振源是對於5msec區間(40個樣本)之副 框架,Μ 4儒脈波之位置和極性表示。另外,在音距週期 比副框架長度短之情況時,採用Μ音距週期使其重複之音 距週期化方法。另外*使用共輛構造(Conjugate-Structure) 之增 益量化 方法可 Κ 強化 誤差 耐性。 經濟部智慧財產局員工消費合作社印製 圖3〜圖6用來表示使用第2合成語音信號之效果•和用 來,說明使用該ΙΤϋ-Τ G. 729方式作為基本演算法,和使用 代數激振編碼作為雜音音源之情況時之波形之觀測結果。 另外,附加在圖中之各個信號之符號與圖2者對應。對於 圖3之輸入語音信號S1*在用Μ獲得圖4之第1合成音信號 S 4之過程中,第1雜音音源向量是在輸入語音信號S1附加 適應音源向量之週期性表現不足之部份,形成Μ微細之音 源構造亦可表現之脈波列。所獲得之第〗合成語音信號S4 對於輸入語音信號S1之微细構造亦可Κ充分的追隨。 其次如圖5所示*只使用在獲得第1合成音信號之過程中 所選擇之適應音源向量,在合成假想參考語音信號S3之情 況時,在框架内使一定之週期和振幅進行單純之重複,變 成接近之波形,促成出規在輸入語音信號S1之週期構造表 現不會有不足。在習知之可變率語音編碼方法中,在雜音 音源編碼本索引之停止傳送區間,因為以假想參考語音信 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 18 A7 B7 403891 五、發明說明(i6) 號S3直接使用作為合成音輸出,所以品質會大幅的劣化。 另外一方面,在如圖6所示之第2合成語音信號S5中,K 第2雜音音源向量用來補助適應音源向量之週期性表現之 不足部份*當與微细構造之表琨不足之假想參考語音信號 S3比較時,可以大幅的改善週期性表規。其中,第2雑音 音源向量之脈波極性可Μ使用副框架內之假想參考語音信 號S3之相同位置之極性。因此,即使在使用代數激振編碼 作為雜音音源之情況時,對於脈波位置和極性,在不傳送 一切資訊之編碼解碼側,可Κ獲得相同之第2雜音音源向 量。 另外*在CS-ACELP方式之本適用例中,構成只停止代數 激振編碼之位置和極性之傳送,在第1雜音音源向量之停 止傳送區間*第2雜音音源增益與通常之情況同樣的,進 行具有共轭構造之增益量化藉Κ傳送。第1雜音音源向 量之停止傳送Μ副框架單位判定。利用這種方式,在該適 用例中,於第1雜音音源向量之停止傳送區間,在每一個 (請先閱讀背面之注咅?事項再填寫本頁) -裝1:----L--訂---------線, 可 9 中 元 位 個 ο 8 之 架 框 減 元 位 個 4 3 或 元 位 個 經濟部智慧財產局員工消費合作社印製 向於 源對 音 , 音式 雜方 之 小 最 為 成 真 失 之 號 信 態音 形語 施考 實參 之想 述假 上對 照M 依 , 量 第 用 使M 可 為 因 時 補 行 進 造 構 期 週 之 源 音 之 規 表 能 不 最 向 源 音 應 適 用 利 只 亦 f 間 區 之 引 索. 本 碼 源 音 音 雜 11 第 傳 不 在 使M 所 化 劣 之 質 品 音 成 合 使 現 -實。M K 法施-可方實一 碼 編 音 語 率 變 可 之 小 很 成 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公楚) 403891 A7 B7 五、發明說明(17 ) (請先閱讀背面之注意事項再填寫本頁) 圖7表示依照本發明之可變率語音解碼方法之實施形態2 。該可變率語音解碼方法之構成包含有收訊序列判別步驟 SP21,用Μ輸出第1合成音之第1合成音輸出步驟SP22,用 Μ合成假想參考語音信號之假想參考語音信號合成步驟 SP23,和用Μ輸出第2合成音之第2合成音輸出步驟SP24。 在該可變率語音解碼方法中,其假想參考語音信號合成 步驟SP23與實施形態1之上述之假想參考語音合成步驟SP13 相同,故Μ下將其動作說明省略。另外,本發明之可變率 語音解碼方法,對於Μ處理框架單位接受之收訊編碼語条 統之輸入,Μ相同之處理流程順序的實行。亦即,當先前 之處理框架之解碼處理结束後,輸入下一個處理框架之對 應之收訊繡碼語序列,從步驟SP20開始解碼處理。 經濟部智慧財產局員工消費合作社印製 其次,在收訊序列判別步驟SP21,參考收訊序列長度, 判別在收訊序列是否包含有雜音音源編碼本索引。在該收 訊序列判別步驟SP21,當判斷為在收訊序列包含有雜音音 源編碼本索引之情況時*就在第1合成音輸出步驟SP22輸 出合成音。在該第1合成音輪出步驟SP 22,使用對應到所 收訊之適應音源編碼本索引和雜音音源編碼索引之適應音 源向量和雜音音源向量雙方所產生之音源,同時使用作為 收訊序列之一部份之被傳送之線型預測參數,將其輸入到 合成濾波器,藉Κ獲得第1合成語音信號。 另外一方面,在收訊序列判別步驟SP21,當判斷為在收 訊序列未包含有雜音音源編碼本索引之情況時,就利用Μ 下之步驟,進行與實施形態1所說明之編碼側之第2雜音音 -20 - 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 403891 A7 '--------------B7_______ 五、發明說明(18) (請先閱讀背面之注意事項再填寫本頁) •源編碼本探索步驟SP 13同樣之處理,藉以獲得第2合成語 音信號。亦即,首先利用假想參考語音信號合成步驟SP23 ’使用對應到所收訊之適應音源編碼本索引之適應音源向 量單獨獲得之假想合成音信號,同時使用作為收訊序列之 '部份之被傳送之線型預測參數,將其輸入到合成滤波器 *藉Μ獲得假想參考語音信號。 其次,在第2合成音輸出步驟SP24,Μ與假想參考語音 信號合成步驟SP23所獲得之假想參考語音信號之間之失真 成為最小之方式,對於音源編碼本探索步驟SP12所獲得之 適應音源向量和雜音音源向量之最佳組合,利用A-b-S方 法,選擇作為第2雜音音源,藉K輸出第2合成語音信號。 經由實行Μ上之各個步驟,在輸出該處理框架之合成語音 信號之後,在步驟SP2 5結束該處理框架之解碼處理,從步 驟SP20開始對應到下一個處理框架之處理,對此順序的重 複藉Μ進行解碼處理。 經濟部智慧財產局員工消費合作社印製 在圖8中,其與画2對應之部份附加相同之符號’對於本 實施形態2之可變率語音解碼方法,Μ信號之流程用來說 明其具體之動作。在該圖中,符號18是編碼輸入端,19是 合成音輸出端,另外,20是線型預測參數解碼裝置,21是 收訊序列判別裝置,22是輸入選擇開關,23、24是音源選 擇開關,25是合成音選擇開關。 其中,從編碼輸入端18輸入接收到之編碼’從合成音輸 出端19輸出合成語音。另外,線型預測參數解碼裝置20對 來自收訊序列之線型預測參数512進行解碼°收訊序列判別 ^紙張尺度適用中國國家標準(CNS)A4規格(21G χ 297公1) - 21 - 經濟部智慧財產局員工消費合作社印製 403891 a7 ___B7_____ 五、發明說明(19) 裝置21用來判斷來自收訊序列長度等之雜音編碼本索引是 否被傳送,和分割成每一個編碼參數的進行輸出。輸入選 擇開關2 2接受收訊序列判別裝置2〗之判別結果,用來變換 對音源編碼本之控制信號輸入。音源選擇開關23、24撵受 收訊序列判別裝置21之判別結果,用來變換輸入到合成濾 波器6之音源信號。合成音選擇開關25用來控制K合成濟 波器6合成之合成音之輸出對象。 下面將使用圖7和圖8用來說明本實施形態2之每一個步 驟之動作。另外,圖7之收訊序列判別步驟SP21,因為單 純的對應到圖8之收訊序列判別裝置21,所Μ K下之說明 將其省略。首先,圖7之第1合成音輸出步驟SP 27是Κ下述 之方式連接圖8之輸入選擇開關22,音源選擇開關23、24 和合成音選擇開關25*藉Κ進行開始。亦即,將輸入選擇 開關22連接到端子b,將音源選擇開闕23連接到端子a,將 音源選擇開闞24連接到端子a,和將合成音選擇開關25連 接到端子a。在此種連接狀態之圖8之信號流程是對合成滹 波器6輸入分別被傳送之索引所對應之適應音源向量和雜 音信號向量之加算後之音源信號,從合成·滅波器6輸出合 成語音信號,藉Μ獲得第1合成語音信號S4。 其次,圖7之假想參考語音合成步驟SP22之實現是將圖8 中之輸入選擇開關22連接到端子b,將音源選擇開關23連 接到端子b,將音源選擇開關24連接到端子b,和將合成音 選擇開關25連接到端子b。在此種連接狀態之圖8之信號流 程是對合成濾波器6輸入對應到被傳送之索引之適應音源 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐^ 71 (請先閱讀背面之注意事項再填寫本頁) ··' 裝 ir!hl— 訂·! I !綠 經濟部智慧財產局員工消費合作社印製 403891 A7 _B7_五、發明說明(20) 向量作為音源信號,從合成滹波器6輸出之合成語音信號 作為假想參考語音信號S3,將其輸出到假想參考語音信號 用緩衝器9。 其次,圖7之第2合成音輸出步驟SP24之實現是將圖8之 輸入選擇開關22連接到端子a *將音源選擇開關23連接到 端子a,將音源選擇開關2 4連接到端子a,將合成音選擇開 關25連接到端子a。在此種連接狀態之圖8之信號流程是對 合成濾波器6輸入對應到被傳送之索引之適應音源向量和 順序被輸出之雜音音源向量之加算術後者,作為音源信號 的輸入*從合成濾波器6輸出之合成語音信號,W對假想 (請先閲讀背面之注咅?事項再填寫本頁) 2 第音 擇合 選 2 第 9 為 作 號 信 音 成 合 之 得 獲 9 所 器果. 衝結 緩其 用, 號量 信向 音源 語音 考音 參雜 式 方 之 小 最 為 成 真 失 之 送 傳 止 停 之 量 向 源 音 音 雜 在 使 » 時 2 ο 態 出形 輸施 被實 的本 S 照 號依 信 態 形 施 實 之 逑 上 用 使 和 出 算 0 獨M 可 側 碼 解 在 2 , 第 間之 區示 向 源 音 音 雜 所方 I碼 解 音 語 率 變 可 之 現 實 所M 所 質 品 之 音 語 成 合 出 輸 高 3 提態 M形 可施 法實 中 5 f— 1 對 S 是 驟要 步只 化是 度但 尺, 質準 品基 音 化 成度 合尺 在為 作 比 態音 形雜 施號 實信 之R( 4^4 N "S 上用 在使 是 Μ 巨氪 距杉. um施 tr實 ec與 SPM k-可 Γ a » (b度 譜尺 頻值 rk數 ba之 , 真 離失 距之 In)間 ru形 St波 ep定 (C測 譜 Μ 頻可 倒等 數離 用 使 的 fl1v 樣 同 態 形 施 實 之 述. 上 在 值 界 臨 。 和 I b 身 5 效P1 之S 二 裝 樣驟 3¾步 同 1Γ出 態算 形值 施界 實臨 與-得中 獲丨 M 可 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 23 『---^---訂---------綠· 403891
五、發明說明(21) 比較步驟15c是依照SN比為單一之尺度進行比較判定之處 (請先閱讀背面之注意事項再填寫本頁) 理’但是也可以是如上所述之使用多個尺度進行比較判定 之處理。 在上述之實施形態1中,編碼語送出序列選擇步驟SP15 是構成在判斷可否送出雜音音源編碼本索引之前進行,但 是也可K構成將牖碼語送出序列選擇步驟SP15之輸出,作 為表示可停止送出之旗標,適應音源編碼本索引和雜音編 碼本索引’在上位之基頻帶信號處理部等之判斷,構成判 斷最終之雜音編碼本索引之送出,可以獲得與上述實施形 態1同樣之效果。 在上述之實_形態2中,收訊序列判別步驟SP21是構成 利用收訊編碼長度等,用Μ得知雜音編碼本索引之非傳送 ’但是也可Κ利用上位之基頻帶信號處理部等對其進行判 斷,構成接受旗標和必霤之最小限度之索引,可奴獲得與 上述之實施形態2同樣之效果。 [發明之效果] 經濟部智慧財產局員工消費合作社印製 如上所述,依照本發明時可以實瑰可變率語音編碼方法 ’其中Μ使所獲得之第1合成語音信號對輸入語音信號之 失真成為最小之方式,利用音源編碼本和雑音音源編碼本 ’選擇適應音源向量和第1雜音音源向量,和將其輸出, 使用Μ該適應音源向量產生之音源信號,用來製成假想參 考語音信號•以使所獲得之第2合成語音信號對假想參考 語音信號之失真成為最小之方式,選擇對應到適應音源向 量之第2雜音音源向量,依照第2合成語音信號之品質,制 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 24 A7 403891 _B7_ 五、發明說明(22) (請先閱讀背面之注意事項再填寫本頁) 止對應到第1雜音音源向量之雜音音源編碼本索引之送出 ,利用這種方式,即使在雜音音源編碼本索引變成非傳送 之情況時,在解碼側可K獨立的選擇,和可K使用共同之 雜音音源向量,和可Μ進行品質劣化很小之編碼。 另外,依照本發明時可Κ實現可變率語音編碼方法,其 中除了上逑者之外,對於輸入語音信號,將第1合成語音 信號和第2合成語音信號及假相參考語音信號之品質替換 成數值之尺度,用來算出比較臨界值,使該比較臨界值和 第2合成語音信號進行比較,依照比較之結果判定是否制 止對應到第1雜音音源向量之雜音音源編碼本索引之_出 ,利用這種方式,當與習知之使用在處理框架間被固定之 臨界值之情況比較時,因為可Κ依照各個處理框架單位之 合成音品質進行判定,所Μ可Κ進行更穩定之送出判定。 經濟部智慧財產局員工消費合作社印製 另外,依照本發明時可Κ實現可變率語音解碼方法,其 中在收訊到之序列包含有適應音源編碼本索引和雜音音源 編碼本索引之情況時,以收訊到之適應音源編碼本索引和 雜音音源編碼本索引所對應之適應音源向量和雜音向量雙 方用來產生音源,使用該音源用來輸出第1合成音,在收 訊到之序列未包含有雜音音源編碼本索引之情況時,Μ收 訊到之適應音源編碼本索引所對應之適應音源向量用來產 生音源,使用該音源用來合成假想參考語音信號,Μ所獲 得之合成語音信號對該假想參考語音信號之失真成為最小 之方式,選擇收訊到之適應音源編碼本索引所示之適應音 源向量之對應之雜音音源向量,藉Μ輸出使用選擇結果所 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) _ ο π _ A7 403891 _B7_ 五、發明說明(23 ) (請先閱讀背面之注意事項再填寫本頁) 合成之第2合成音,利用這種方式,即使在雜音音源編碼 本索引變成非傳送之情況時,亦可Μ獨立的選擇,而且由 編碼側使用,和可Μ使用共同之雜音音源向量,可Κ進行 品質劣化很小之編碼。 [附圖之簡單說明] 圖1是流程圖,用來表示本發明之實施形態1之可變率語 音編碼方法之處理步驟。 圖2是方塊圖,用來說明圖1之可變率語音編碼方法之信 號之流程。 圖3是信號波形圖,用來說明輸入語音信號之態樣。 圖4是信號波形圖,用來說明第1合成語音信號之態樣。 圖5是信號波形圖,用來說明假想參考語音信號之態樣。 圔6是信號波形圖,用來說明第2合成語音信號之態樣。 圖7是流程圖,用來表示本發明之實施形態2之可變率語 音解碼方法之處理步驟。 画8是方瑰圖,用來說明圖7之可變率語音解碼方法之信 號之流程。 經濟部智慧財產局員工消費合作社印製 圖9是流程圖,用來表示習知之可變率語音編碼方法之 處理步驟。.
[符號之說明] 1 ........語音信號輸入端 2 ........編碼輸出端 3 ........線型預測分析裝置 4 ........適應音源編碼本 26 本紙張尺度適用中國國家標準(CNS)A4規格(2】0 X 297公釐) 403891 A7 _ B7五、發明說明(·24 ) 5 6 7 8 9 本 碼 編器 源波 音滹 音成 雜合 置 裝 擇 選 源 音 適 最 器 置衝 裝緩 擇用 選號 列信 序 音 出語 送考 語參 碼想
ο 1J 經濟部智慧財產局員工消費合作社印製
23456789012345123 1 1 1 1 1 1 11222222s s S a b c C 關 關關關 擇 擇擇擇 選 選選選 源源源源 音 音 音 音 用 用用用 編假使使使使 置 關 裝 開置擇 置 擇裝選 裝 選關擇益 碼置 象開選增 解裝 對擇益源 端數別 出選增音端出參判 輸音源應入輸測列 音語音適 '輸音預序 成考應音碼成型訊 合參適雑編合線收 關 關關開 開開開擇 擇擇擇選 選選選音 入源源成 輸音音合 號 信 號數音 信參語 音 測考 語預參 入型想 輸線假 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) (請先閲讀背面之注音?事項再填寫本頁) 裝 n n n 一'J n 1 I n I J.HB -¾¾ 27 403891 a7 _B7_ 五、發明說明(25) 54 .......第1合成音信號 55 .......第2合成音信號 56 .......音源編碼本選擇控制信號 (請先閱讀背面之注意事項再填寫本頁) 裝 1T---------線 f 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 28

Claims (1)

  1. 403891 | 本夺涔《 D8 .; 1 範圍 1. 一種可變率語音編碼方法,採用CELP語音編碼方式, 具有:適應音源編碼本,用來收納Μ音距週期使過去之框 架之音源信號重複適應音源向量;和雜音音源編碼本,用 來收納雜音音源向量;其特徵是編碼率為可變之方式,所 具備之步驟有:音源編碼本探索步驟,Κ所獲得之第1合 成語音信號對輸入語音信號之失真成為最小之方式,利用 上述之音源編碼本和上述之雜音音源編碼本*選擇適應音 源向畺和第1雜音音源向量和將其輸出;假想參考語音信 號合成步驟,使用上述之適應音源向量所產生之音源信號 ,製成假想參考語音信號;第2音源編碼本探索步驟,Μ 所獲得之第2合成語音信號對上述之假想參考語音信號之 失真成為最小之方式,選擇對應到上述之適應音源向量之 第2雜音音源向量;和編碼語送出序列選擇步驟,依照上 述之第2合成語音信號之品質,用來制止對應到上述第1雜 出 送 之 引 索 本 碼 Μ 源第 音圍 音範 雜利 之專 量請 向申 源如 音 2 音 中 其 法 方 碼 編 音 語 率 變 可 之 項 (請先閱讀背面之注音?事項再填寫本頁) —訂---------線{ 經濟部智慧財產局員工消費合作社印製 度 尺 質 品 音第 成之 合述 : 上 有將 備, 具號 驟信 步音 擇語 選入 列輸 序之 出述 送上 語於 碼對 編, 之驟 逑步 上化 語 成 合 0^0 語 信 考 音 參 語 假?合 之 述 上 及 號 信 音 語 成 合 驟 步 出第 算述 值 上 界之 臨出 *, 算 度.所 尺驟 值步 數化 第成度 之換尺 逑替質 上質品 和品音 號之成 信號合 音信之 值 第 界.之 臨述 較上 比和 出值 算界 , 臨 質較 品比 之之 號述 信 上 音使 語來 考用 參 , 想驟 假步 述較 上比 和值 質界 品臨 之 ; 值 界 臨 照 依 •ν 驟 步 定 判 出 送 和 較 比 行 進 號 信 音 語 成 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 1 403891 | 本夺涔《 D8 .; 1 範圍 1. 一種可變率語音編碼方法,採用CELP語音編碼方式, 具有:適應音源編碼本,用來收納Μ音距週期使過去之框 架之音源信號重複適應音源向量;和雜音音源編碼本,用 來收納雜音音源向量;其特徵是編碼率為可變之方式,所 具備之步驟有:音源編碼本探索步驟,Κ所獲得之第1合 成語音信號對輸入語音信號之失真成為最小之方式,利用 上述之音源編碼本和上述之雜音音源編碼本*選擇適應音 源向畺和第1雜音音源向量和將其輸出;假想參考語音信 號合成步驟,使用上述之適應音源向量所產生之音源信號 ,製成假想參考語音信號;第2音源編碼本探索步驟,Μ 所獲得之第2合成語音信號對上述之假想參考語音信號之 失真成為最小之方式,選擇對應到上述之適應音源向量之 第2雜音音源向量;和編碼語送出序列選擇步驟,依照上 述之第2合成語音信號之品質,用來制止對應到上述第1雜 出 送 之 引 索 本 碼 Μ 源第 音圍 音範 雜利 之專 量請 向申 源如 音 2 音 中 其 法 方 碼 編 音 語 率 變 可 之 項 (請先閱讀背面之注音?事項再填寫本頁) —訂---------線{ 經濟部智慧財產局員工消費合作社印製 度 尺 質 品 音第 成之 合述 : 上 有將 備, 具號 驟信 步音 擇語 選入 列輸 序之 出述 送上 語於 碼對 編, 之驟 逑步 上化 語 成 合 0^0 語 信 考 音 參 語 假?合 之 述 上 及 號 信 音 語 成 合 驟 步 出第 算述 值 上 界之 臨出 *, 算 度.所 尺驟 值步 數化 第成度 之換尺 逑替質 上質品 和品音 號之成 信號合 音信之 值 第 界.之 臨述 較上 比和 出值 算界 , 臨 質較 品比 之之 號述 信 上 音使 語來 考用 參 , 想驟 假步 述較 上比 和值 質界 品臨 之 ; 值 界 臨 照 依 •ν 驟 步 定 判 出 送 和 較 比 行 進 號 信 音 語 成 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 1 403891 A8 B8 C8 D8 六、申請專利範圍 音 雜 1 第 述 上 到 應 0 尉出 止送 制之 否引 是索 定本 判碼 , 編 果源 結音 較音 比雜 之之 驟量 步向 較源 比音 , 框 式之 方去 碼過 解使 音期 語週 LP距 CE音 用 Μ 採納 , 收 法來 方用 碼, 解本 音碼 語編 率源 變音 可應 種適 一 : 3 有 具 本第 碼 .. 編有 源驟 音步 音之 雜備 和具 ♦, 所 量是 向徵 源特 音其 應 .· 適量 之向 複源 重.音 號音 信雜 源納 音收 之來 架用 本適適 碼述之 編上應 源之對 音到所 應訊引 適收索 有Μ本 含 , 碼 包時編 列況源 序情音 之之音 到引雜 訊索述 收本上 在碼和 , 編引 驟源索 步音本 出音碼 輸雜編 音和源 成引音 合索應 源 音 生 產 來 用 方 雙 之 量 向 源 音 音 雜第 和出 量輸 向來 源用 音源 應音 音 成 合 (請先閱讀背面之注音?事項再填寫本頁) 該 用 使 驟 步 成 合 號 信 音 語 考 參 想 假 , 用和 時量 ., 況向號 情源信 之 音 音 引應語 索適考 本之參 碼應想 編對假 源所成 音 引合 音索來 雜本用 有碼源 含編音 包源該 未音用 列應使 序適, 之之源 到到音 訊訊生 收收產 在Μ來 驟 步 出 輸 音 成 合 之 述 上 對 號 信 音 語 成 合 之 得 獲 所 Μ 式 方 之 小 最 為 成 真 失 之 號 信 音 語 考 參 想 第假 之 到 訊 收 擇 選 衣i -------訂---------線. 經濟部智慧財產局員工消費合作社印製 音 音 雜 之 應 對 之第 量之 向成 源合 音 所 應果 適結 之擇 示選 所用 n fee 弓 使 索出 本輸 碼 Μ 編藉 源, 音 量 應向 適源 音 成 合 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 2
TW086111418A 1997-03-04 1997-08-09 The changeable audio encoding and decoding method TW403891B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9049364A JPH10247098A (ja) 1997-03-04 1997-03-04 可変レート音声符号化方法、可変レート音声復号化方法

Publications (1)

Publication Number Publication Date
TW403891B true TW403891B (en) 2000-09-01

Family

ID=12828973

Family Applications (1)

Application Number Title Priority Date Filing Date
TW086111418A TW403891B (en) 1997-03-04 1997-08-09 The changeable audio encoding and decoding method

Country Status (8)

Country Link
US (1) US5875423A (zh)
EP (1) EP0863500A3 (zh)
JP (1) JPH10247098A (zh)
KR (1) KR100276035B1 (zh)
CN (1) CN1192563A (zh)
AU (1) AU689413B1 (zh)
CA (1) CA2218118C (zh)
TW (1) TW403891B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1163870C (zh) 1996-08-02 2004-08-25 松下电器产业株式会社 声音编码装置和方法,声音译码装置,以及声音译码方法
EP0883107B9 (en) * 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
EP0970463B1 (en) * 1997-03-25 2001-08-29 The Secretary Of State For Defence Speech analysis system
US6847960B1 (en) * 1999-03-29 2005-01-25 Nec Corporation Document retrieval by information unit
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6330532B1 (en) * 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
JP2001242896A (ja) * 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd 音声符号化/復号装置およびその方法
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
CN100369108C (zh) * 2003-12-18 2008-02-13 诺基亚公司 编码域中的音频增强的方法和设备
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
KR20170044849A (ko) * 2015-10-16 2017-04-26 삼성전자주식회사 전자 장치 및 다국어/다화자의 공통 음향 데이터 셋을 활용하는 tts 변환 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
EP0577488B9 (en) * 1992-06-29 2007-10-03 Nippon Telegraph And Telephone Corporation Speech coding method and apparatus for the same
US5408234A (en) * 1993-04-30 1995-04-18 Apple Computer, Inc. Multi-codebook coding process
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder
JP3685812B2 (ja) * 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
JP3265726B2 (ja) * 1993-07-22 2002-03-18 松下電器産業株式会社 可変レート音声符号化装置
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
JP3568255B2 (ja) * 1994-10-28 2004-09-22 富士通株式会社 音声符号化装置及びその方法
JP2697642B2 (ja) * 1994-11-24 1998-01-14 日本電気株式会社 Atm音声符号化装置
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus

Also Published As

Publication number Publication date
EP0863500A3 (en) 1999-03-17
CA2218118C (en) 2001-05-08
CA2218118A1 (en) 1998-09-04
US5875423A (en) 1999-02-23
EP0863500A2 (en) 1998-09-09
KR100276035B1 (ko) 2000-12-15
AU689413B1 (en) 1998-03-26
CN1192563A (zh) 1998-09-09
JPH10247098A (ja) 1998-09-14
KR19980079418A (ko) 1998-11-25

Similar Documents

Publication Publication Date Title
TW403891B (en) The changeable audio encoding and decoding method
US5940796A (en) Speech synthesis client/server system employing client determined destination control
JP4005359B2 (ja) 音声符号化及び音声復号化装置
US4903301A (en) Method and system for transmitting variable rate speech signal
CN104115220B (zh) 非常短的基音周期检测和编码
Bradbury Linear predictive coding
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
CN104781879A (zh) 用于对音频信号进行编码的方法和装置
CN104254886B (zh) 自适应编码浊音语音的基音周期
CN103383846A (zh) 改进语音丢包修补质量的语音编码方法
TW463143B (en) Low-bit rate speech encoding method
US20060015330A1 (en) Voice coding/decoding method and apparatus
JPH11259100A (ja) 励起ベクトルの符号化方法
JP3308764B2 (ja) 音声符号化装置
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
RU2248619C2 (ru) Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
KR100275777B1 (ko) 음소별 코드북 매핑에 의한 음색변환방법
JPH09149104A (ja) 擬似背景雑音生成方法
Wichman A Comparison of Speech Coding Algorithms ADPCM vs CELP
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2844672B2 (ja) 声帯声道型音声分析装置
JPH06130994A (ja) 音声符号化方法
JPH08160996A (ja) 音声符号化装置
JP2001094507A (ja) 擬似背景雑音生成方法
JPH06266399A (ja) 符号化装置及び音声符号化復号化装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees