TW412719B - Method and apparatus for reproducing speech signals and method for transmitting same - Google Patents
Method and apparatus for reproducing speech signals and method for transmitting same Download PDFInfo
- Publication number
- TW412719B TW412719B TW085109383A TW85109383A TW412719B TW 412719 B TW412719 B TW 412719B TW 085109383 A TW085109383 A TW 085109383A TW 85109383 A TW85109383 A TW 85109383A TW 412719 B TW412719 B TW 412719B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice signal
- encoding
- modified
- parameters
- parameter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 40
- 230000003595 spectral effect Effects 0.000 claims abstract description 12
- 230000002079 cooperative effect Effects 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 18
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 239000002131 composite material Substances 0.000 claims 2
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 68
- 239000013598 vector Substances 0.000 description 60
- 238000004364 calculation method Methods 0.000 description 40
- 238000006243 chemical reaction Methods 0.000 description 33
- 230000015572 biosynthetic process Effects 0.000 description 28
- 238000003786 synthesis reaction Methods 0.000 description 28
- 238000013139 quantization Methods 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 20
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000005284 excitation Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 235000015170 shellfish Nutrition 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000010977 jade Substances 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 235000010893 Bischofia javanica Nutrition 0.000 description 1
- 240000005220 Bischofia javanica Species 0.000 description 1
- 101100457838 Caenorhabditis elegans mod-1 gene Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 101150110972 ME1 gene Proteins 0.000 description 1
- 101000859864 Rattus norvegicus Gamma-crystallin E Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 101150040440 rpmB gene Proteins 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Telephone Function (AREA)
Description
A7 _B7 - -__ 五、發明説明(l) 發明背景 發明領域 (請先閱讀背面之注意事項再填寫本頁) 本發明係有關於用以重現語音訊號的方法及裝置,其 中輸入語音訊號被分成多個單位的框,且根據至少合成當 作正弦波形用以重現語音訊號而加以編碼來找出編碼參數 。本發明亦有關於用以傳送在內插編碼參數時所得到之修 改過的編碼參數之方法》 相關技術說明 現已知多種應用聲訊之統計特性以壓縮訊號的編碼方 法,該聲訊包含時域及頻域語音(speech)訊號及聲音( sound )訊號,且包含人類聽力系統的心理聲學特性。這 些編碼方法可概略分成時域編碼、頻域編碼及分析/合成 編碼。 經濟部中央標芈局員工消費合作社印聚 同時,隨著藉由在時間軸上之訊號處理的高效率語音 編碼方法,編碼激發線性預測(CE LP )例證,因爲從 解碼器輸出之訊號的處理需很多操作步驟,所以在時間軸 的速度轉換(修改)上仍碰到許多困難。 另外,因爲在解碼線性範圍中實施速度控制,所以上 述方法無法爲例如音高率轉換所使用。 因此,本發明的目的在於提供一用以重現語音訊號的 方法及裝置,及一用以傳送語音訊號的方法’其中在、一寬 廣範圍中,可輕易地實施高品質之.隹...寘速率的速度控制1 而音位及音高仍可維持不變。 本紙張尺度適用中國國家楯準(CNS ) A4規格(2丨0X 2们公釐) -4 - 412719 經濟部中央標率局員工消費合作社印製 五、發明説明 丨(2 ) 本 發 明 ~. 方 r'i"? 面 提 供 —, 種 用 以 根 據 藉 由 分 開 相 關 於 預 先 設 定 之 框 的 輸 入 語 音 訊 號 於 時 間 軸 上 並 且 在 框 的 基 礎 上 編 碼 被 如 此 分 開 之 輸 入 語 音 訊 號 所 獲 得 之 編 碼 參 數 來 重 現 輸 入 語 音 訊 號 的 方 法 該 方 法 包 含 內 插 編 碼 參 數 用 以 找 出 與 所 需 之 時 間 相 關 之 修 改 過 的 編 碼 參 數 並 且 根 據 所 修 改 之 編 碼 參 數 來 產 生 速 率 與 該 輸 入 語 音 訊 號 不 同 之 修 改 過 的 語 音 訊 號 的 步 驟 因 此 在 — 寬 廣 範 圍 中 可 輕 易 地 實 施 高 品 質 之 任 意 速 率 的 速 度 控 制 而 音 位 及 音 高 仍 可 維 持 不 變 Ο 本 發 明 另 ™- 方 面 提 供 —*· 種 用 以 重 現 語 音 訊 號 的 裝 置 9 其 中 輸 入 語 音 訊 m 的 產 生 亦根 據 編 碼 參 數 此 參 數 根 據 藉 由 分 開 相 關 於 預 先 設 定 之框 的 輸 入 語 音 訊 疏 於 時 間 軸 上 並 且 在 框 的 基 礎 上 編 碼 被 如 此 分 開 之 输 入 語 音 訊 號 而 被 獲 得 該 裝 置 包 含 用 以 內 插 編 碼 參 數 來 找 出 與 所 需 之 時 間 點 相 關 之 修 改 m 的 編 碼 參 數 並 且 根 據 所 修 改 之 編 碼 參 數 來 產 生 速 率 與 該 輸 入 語 音 訊 號 不 同 之 修 改 過 的 語 音 訊 號 之 內 插 機 稱 ΰ 因 此 其 可 以 調 整 傳 送 位 元 速 率 0 在 — 寬 廣 範 圍 中 可 輕 易 地 實 施 高 品 質 之 任 意 速 率 的 速 度 控 制 而 音 位 及 音 高 仍 可 維 持 不 變 0 本 發 明 又 ~' 方 面 提 供 一 種 用 以 傳 送 語 訊 號 的 方 法 Ϊ 其 中 編 碼 參 數 藉 由 分 開 相 關 於 預 先 設 定 之 框 的 輸 入 語 訊 號 於 時 間 軸 上 當 作 單 位 而 被 找 到 並 且 在 框 的 基 礎 上 藉 由 編 碼 此 分 開 之 輸 入 語 號 來 找 出 編 碼 參 數 被 如 此 找 到 之 編 碼 參 數 被 內 插 以 找 出 與 所 需 之 時 間 點 相 關 的 修 改 過 之 編 碼 參 數 並 且 傳 送 所 修 改 之 編 碼 參 數 而 因 此 致 使 傳 送 位 元 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -5 - A7 B7 五、發明説明(3 ) 速率之調整。 (請先閱讀背面之注意事項再填寫本頁) 藉由在時間軸上分開相關於預先設定之框的輸入語音 訊號,且編碼以框爲基礎的訊號來找出編碼參數,藉由內 插編碼參數來找出修改過的編碼參數,以及根據所修改之 編碼參數而藉由至少合成正弦波來重現語音訊號,在任何 速率下控制速度成爲可能β 較佳實施例說明: 請參考附圖,下文將詳細說明依據本發明之語音訊號 重現方法及裝置及傳送語音訊號之方法之較佳實施例° 首先,說明重現語音訊號的裝置,其中該裝置應用依 據本發明之重現語音訊號的方法及裝置。圖1顯示語音訊 號重現裝置1的配置,其中输入語音訊號被分裂成爲預先 設定之框來當作在時間軸上的單位,並且根據框來編碼以 找出編碼參數。根據這些編碼參數來合成正弦波及雜訊以 重現語音訊號。 經濟部中央榡隼局員工消費合作社印裝 尤其是有了本發明的語音訊號重現裝置1 1內插編碼 參數來找出與所需時間點有關之修改過的編碼參數,且根 據這些修改過的編碼參數來合成正弦波及雜訊。雖然根據 修改過之編碼參數來合成正弦波及雜訊,也可能至少合成 正弦波。 特別是聲訊重現裝置1包含一編碼單冗2 ’其用以將 進入輸入端1 0的語音訊號分成當作單元之框,且用以根 據框來編碼語音訊號以輸出編碼參數,例如線性頻譜對( 本紙張尺度適用中國國家標準(CMS ) Α4規格(210X297公釐) -6 ~ 經濟部中央標準局員工消費合作社印製 412719 __五、發明説明(4 ) LSP)參數、音高、有聲(V) /無聲(UV)或頻譜 振幅Am。聲訊重現裝置1亦包含一計算單元3,其用以 內插編碼參數來找出與所需之時間點有_之修改過的編碼 參數,及一解碼單元,其根據修改過的編碼參數來合成正 弦波及雜訊以输出所合成之語音參數於輸出端3 7。由一 控制器(未顯示出)來控制編碼單元2、用以計算修改過 之編碼參數的計算單元3及解碼單元6。 用以計算語音訊號重現裝置1之修改過編碼參數計算 單元3包含一周期修改電路4 ’其用以壓縮/解壓縮每次 預先設定之框所獲得之編碼參數的時間軸’且用以修改編 碼參數的輸出周期,以及一內插電路5 ’其用以內插周期 修改參數以產生與框基時間點有關之修改過的編碼參數’ 如圖2所示者》其後將說明用來計算修改過之編碼參數的 計算單元3。 首先說明編碼單元。編碼單元2及解碼單元6代表短 期預測殘值(r es i dua 1 s ),例如基於諧波編碼及雜訊觀 點的線性預測編碼(LP C)殘值。換言之,編碼單元2 及解碼單元6實施多頻帶激發(MB E )編碼或多頻帶激 發(Μ B E )分析。 隨著傳統的編碼激發線性預測(C E L Ρ )編碼, L P C殘值被直接向量量化成爲時間波形β因爲編碼單元 2以諧波編.碼或MB Ε分析來編碼殘值’可以用較少數目 之位元的諧波之頻譜包絡之振幅的向量書化上得到較平滑 之合成波形,而同時所合成之L P (:波#的濾波輸出亦具 {請先閱讀背面之注意事項再填寫本f ) 訂 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公浚} -7 - 412719 經濟部中央標準局貝工消費合作社印製 五、發明説明 ( 5 ) 1 1 高 度 悅 耳 的 音 質 0 此 時 使 用 由 本 發 明 人 在 JP Pat en t 1 1 Koka i Pu bl 1 C at ion J I D _ -A - -6 - 5 ] L 8 0 0中所提 1 1 出 之 維 數 轉 換 的 技 術 或 資 料 數 目 轉 換 技 術 來 量 化 頻 譜包 絡. 1 \ 的 振 幅 也 就 是 說 以 預 先 設 定 之 數 巨 的 向 量 維 數 來向 量 請 先 閲 \ 1 1 量 化 頻 譜 包 絡 之 振 幅 〇 讀 背 面 1 Ί I 圖 3 顯 示 編 碼 單 元 2 之 配 置 〇 被供 應 輸 入 端 1 0的 語 I 意 1 音 訊 號 藉 由 濾 波 器 1 1 iJE 過 濾 掉 不 需 要 之 頻 率 範 圍 的 訊號 9 事 項 1 1 再 1 I 並 且 隨 後 被 安 排 路 徑 至 線 性 預 測 編 碼 ( L P C ) 分 析電 路 填 寫 ,邋、. • ϊ 本 ••一 1 2 及 後 置 濾 波 電 路 2 1 0 ¥ S_^ 1 | L P C 分 析 電 路 1 2 藉 由 自 相 關 ( au t 0 —C or re 1 a t i on 1 1 ) 法 來 應 用 Hamm ί ng 窗於輸入訊號波形 以其長度爲 1 1 | 2 5 6 個 樣 本 之 等 級 當 作 一 區 塊 以 便 找 出 線 性 預 測係 數 1 訂 > 也 就 是 所 謂 的 a 參 數 〇 當 作 資 料 輸 出 單 位 的 框 間 隔爲 1 1 1 6 0 個 樣 本 的 等 級 9 如 果 取 樣 頻 率 例 如 爲 8 K Η Z, 則 1 1 1 6 0 個 樣 本 的 框 間 隔 對 應 2 0 毫 秒 〇 1 | 來 L Ρ C 分 析 電 路 1 2 的 a 參 數 被 傳 送 至 a 到 : L S P 轉 換 電 路 1 3 以 便 被 轉 換 成 線 性 頻 譜 對 ( L S P ) 1 1 | 參 數 〇 也 就 是 說 被 找 到 之 當 作 直 接 型 濾 波係 數 的 α參 數 1 I I 被 轉 換 成 例 如 1 0 個 也 就 是 爲 5 對 L S P 參 數 0 使用 例 1 ;| 如 Ne W 陽 Rap h s on 來 貢 施 此 種 轉 換 0 a 參 數 被 轉 換 成 1 L S P 參 數 的 原 因 爲 在 內 插特 性 上 L S P 參 數 優 於 a參 數 I I 0 來 白 a 到 L S P 轉 換 電 路 1 3 的 L S P 參 數 藉 由 1 I L S P 向 量 量 化 器 1 4 而 被 向 量 量 化 〇 可 在 進 行 至 向量 量 1 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 412719 經濟部中央標準局員工消費合作社印製 五、發明説明(6 ) 化之前找到此時之介於框間的差值。換言之,複數個框可 以被收集並且藉由矩陣量化而被量化。爲了量化’每2 〇 毫秒所計算的L S P參數以每一個框使用2 0毫秒的方式 而被向量量化9 係L SP向量量化的索引之來自L S P向量量化器 1 4的量化輸出在端點1 5處被取出》該量化的L S P向 量被安排路徑至L S P內插電路1 6。 L S P內插電路1 6內插每2 0毫秒被向量量化 L.S P向量用以提供8倍速率(eight fold rate).。亦 即,LSP向量被組構成每2. 5毫秒被更新一次。其原 因在於如果透過MB E編碼/解碼法而以分析/合成來處 理剩餘的波形,則所合成之波形的包絡呈現極平滑的波形 ,使得如果L P C係數每2 0毫秒劇烈地改變一次’則易 於產生怪異的聲音。如果LPC係數每2. 5毫秒逐漸地 改變,則可防止怪音的產生。 爲了茌該2. 5毫秒之間隙處使用LSP向量來後置 濾波輸入語音,而因此被內插,LSP參數藉由LSP到 α轉換電路17而被轉換成其例如10階之直接型濾波器 之係數的a參數。L S Ρ到α轉換電路1 7的輸出被安排 路徑至後置濾波電路21以便使用以2. 5毫秒之間隔速 度所更新之α參數來做後置濾波用以產生平滑的輸出。後 置濾波電路2 1的輸出被安排路徑至諧波/雜訊解碼電路 2 2,尤其是一多頻帶激發( ΜΒΕ)分析電路。 \/諧波/雜訊編碼電路2 2 (MB Ε分析電路)藉由與 (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標率(CNS ) A4規格(2丨OXM7公釐) -9 - 經濟部中丧標隼局員工消费合作社印製 A 7 B7 —-- ---- - - ——-- _«- - _____ -- 五、發明説明(7 ) mb E分析相似的方法分析後置濾波電路2 1的輸出。亦 即,該諧波/雜訊編碼電路2 2偵測音高並且計算各諧波 的振幅Am。諧波/雜訊編碼電路2 2亦執行有聲/無聲 辨識,且藉由維數將隨音高而改變之諧波的振幅Am之數 字轉換成固定數字。對於音高偵測而言,對音高偵測使用 輸入L PC殘值的自相關(於下文中說明)。 現請參考圖4,多頻帶激發(MB E )編碼的分析電 路之說明例,當作諧波/雜訊編碼電路2 2,將於下文中 說明。 有了 MB E分析電路,如圖4所示,模型之設計係根 據在同一時間點的頻帶中,亦即同一區塊或框中存在一有 聲部分及無聲部分的假設。 來自後置濾波電路2 1之線性預測編碼(L P C )的 殘值或L P C殘值被饋送至圖4的輸入端1 1 1。因此 MB E分析電路執行MB E分析,並且對輸入L P C殘值 編碼。 進入輸入端111的LPC殘值被送至音高提取單元 1 3、框取單元1 1 4及次區塊功率計算單元120,這 些單元將於下文中說明。 因爲輸入至音高提取單元_1 1 3者爲L P C殘值,所 以可藉由偵測殘值的自相關的最大值來執行音高偵測。音 高提取單元1 1 3藉由開放迴路搜尋來執行音高搜尋。所 提取的音高資料被安排路徑至其中藉由封閉迴路音高搜尋 來執行細微的音高搜尋單元1 1 6。 ^^^適用中國國家標準(〇~5)六4規格(210'<<297公釐) '~" -10 - (請先閲讀背面之注意事項再填寫本页) 訂 經濟部中央標導局買工消費合作社印掣 412719 A7 _B7_ 五、發明説明(8 ) 框取單元11 4應用預設之框取功能’例如Hamming 窗,至每一個N個樣本區塊,用以依序沿時間軸以L個樣 本框之間隔移動所框取的區塊。來自框取單元1 1 4的時 域資料串被一正交轉換單元以例如快速傅立葉轉換( F F T )來處理。 如果在發現區塊中的總頻帶爲無聲的(U V ),則次 區塊功率計算單元1 2 6提取一表示區塊之無聲訊號之時 間波形的包絡的特性量。 精微音高搜尋單元116被饋送入由音高提取單元 1 1 3所提取的整數數目之概略音高資料以及由正交轉換 單元1 1 5以F F T所產生之頻域資料。精微音高搜尋單 元11 6藉由以大約概略音高.資料數值之〇. 2至0. 5 的間隔內的土幾個樣本來產生擺動當作用以驅動至具有最 佳之小數點(浮點)的精微音高資料的中心°精微捜尋技 術使用由合成方法所做的分析並且選擇音高.,此音高在分 析時可給予最靠近原始功率頻譜之功率頻譜的功率頻譜。 也就是說,在由音高提取單元1 1 3發現之在當作中 心之概略音高上下的一些值被提供在例如〇_ 25的間隔 處β對於這些彼此間差別很小的值而言,可找到誤差的總 和在此情況下,如果音高被設定,頻寬被設定’ 而使得對頬域資料和激發訊號頻譜,使用功率頻譜來找到 誤差,因此,可以找到總頻帶的誤差和m ’對每 一音高值找到此誤差和厂™,並且選擇對應至最小誤差和 的音高作爲最佳音高。因此藉用精微音高搜尋單元來找到 本紙张尺度適用中國國家標準(CNS ) A4規格(2丨0X 297公釐) C請先閱讀背面之注意事項再填寫本頁) 訂 - 11 一 412719 經濟部中去標準局貝工消费合作社印掣
五、發明説明(9 ) 具有例如0 . 2 5的 音高的振幅 A 來計算振幅值。 在上文對精微音 的。但是,因爲在Μ 爲其中無聲區出現於 得需要對各頻帶產生 來自精微音高搜 用振幅計算單元1 1 有聲/無聲辨識單元 1 1 7中,對各頻帶 此辨識而使用雜訊對 此時•因爲根據 亦即諧波的數目,視 的範圍中,所以在每 在各頻帶中變動。因 固定頻寬的頻帶分類 辨識的結果變差》尤 4000Hz的預設 1 2個頻帶,而且以 N S R值之加權平均 以來自正交轉換 尋單元1 16的精微 118V的振幅 A 間隙之最佳精微音高,而且決定最佳 藉由有聲用振幅計算單元1 1 8 V 高搜尋的說明中,假設總頻帶爲有聲 B E分析/合成系統中所使用的模型 頻率軸上在相同的時間點處,所以變 有聲/無聲的辨識。 尋單元116的最佳音高及來自有^ 8 V之振幅 1 1 7中,4該有 的資料被饋送荽 聲/無聲辨識單?6 實施介於有聲與無聲之間的辨識,_ 信號比(N S R ) » 基本音高頻率所分裂之頻帶的數目’ 聲音的音高而變動於從大約8到6 3 一頻帶中之V/U旗標的數目同樣地 此在本實施例中,對每一預設數目之 集合V/U辨識的結果或者使ν/ϋ 其是包含聲頻範圍之例如0至 頻率範圍被分成ΝΒ個頻帶,譬如 預設之臨界值T h 2辨識每一頻帶之 值來判斷頻帶到頻帶的V/ UV。 單元1 1 5的頻域資料,來自音高搜 音高資料,來自有聲用振幅計算罩元 以及用來自有聲/無聲辨識單元 本紙張尺度適州中國國家標準(CNS ) A4规格(210x297公釐) (讀先閱讀背面之注意事項存填寫本X〕 ir -12 - 412719 經濟部中央摞华局月工消費合作社印掣 五、發明説明(10 ) 1 1 7的有聲/無聲(V/UV)辨識資料饋入無聲用振 幅計算單元1 1 8U °無聲用振幅計算單元1 1 8U藉由 產生振幅重新計算的效果而爲經由有聲/無聲辨識單元 1 1 7所找到爲無聲(U V )的頻帶再次找到振幅。無聲 .用振幅計算單元1 1 8 U爲發現係有聲(V)的頻帶直接 輸出來自有聲用振幅計算單元lj 8V的輸入值》 來自無聲用振幅計算單元118U的寶料被饋送至資 料數目轉換單元1 1 9,其爲一種取樣速率轉換器。資料 數目轉換單元119考慮從頻譜所分開之頻帶的數目和資 料的數目,最重要的是與音高不同之振幅資料的數目’.而 被使用來致使資料的數目固定。也就是說’如果有效的頻 率範圍上達例如3 4 0 OKHz,此視音高的情況而被有 效的頻率範圍分成8至6 3個頻帶’使得包含UV頻帶之 振幅 Affl uv之振幅資料 Am 的資料數目mMX+l在 8至6 3的範圍內改變。因此資也數目轉換單元1 1 9將 具有可變之資料數目m MX + 1轉換成固定的資料數目Μ ’ 例如4 4 6 資料數目轉換單元119將從一區塊中的最後一個資 料到該區塊中的第一個資料內插數值用以放大資料的數目 至Νρ·,這樣的假性資料附加至相對於頻率軸上的一個有 效區塊之振幅資料。然後,資料數目轉換單元1 1 9以過 取樣取率Os,例如8,來執行頻寬限制型過取樣,用以 找出0 S折之數目的振幅資料。此〇 S折數目((m MX+ 1 )x 〇s)的振幅資料被線性內插,以產生仍爲較大數目 (請先閱讀背面之注意事項再填莴本頁) 訂 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -13 - 412719 五、發明説明(11 ) Ν μ之資料,例如2 0 4 8個資料。數目Ν μ的資料被減去 十分之一用以轉換成預設之固定的數目Μ,例如4 4個資 料。 (請先閱讀背面之注意事項再填寫本頁) 爲了向量量化,來自資料數目轉換單元1 1 9的資料 (具有預設之固定.數目Μ的振幅資料)被送至向量量化器 2 3以提供資料數目爲Μ的向量,或者被組合成具有預定 之資料數目的向量》 來自精微音高捜尋單元116的音高資料經由轉換開 關2 7之固定端且_而被送至輸出端2 8。此技術被揭示於 J P Patent Application No. 5—185 32 5 ( 1 9 9 3 )中,如果區塊中的總頻帶爲無聲的(UV)而 因此音高資訊變得不需要時,此技術包含將表示代表無聲 訊號之時間波形的特性值的資訊切換成音高資訊。 經濟部中央標率局員工消費合作社印製 藉由處理N,譬如2 5 6,個樣本之資料來得到這些 資料。因爲區塊在相關於上面所述之L個樣本的框當作一 個單位的時間軸上前進,所以獲得以框爲基礎之所傳送的 資料《也就是說,在框的時間期間更新音高資料、V/U 辨識資料及振幅資料。當來自V/UV辨識單元1 1 7的 V/UV辨識資料,使用其頻帶的數目已經被減少或降低 至1 2的資料,或者使用指定在整個頻率範圍中介於有聲 (V)與無聲(UV)區域之間之界限的一個或多個位置 的資料係可能的,換句話說,頻帶的總數可以由V及U V 的其中之一來代表,或者可以用框爲基礎來實施V/UV 辨識* 本紙浪尺度適用中國國家標準(CNS > A4規格(210'乂297公釐) -14 - 412719 A7 B7 五、發明説明(l2 ) 如果發現整個區塊爲無聲的(uv),那麼一個例如 有2 5 6個樣本的區塊可被細分成多個次區塊,每一個次 區塊包含例如3 2個樣本,其被傳送至次區塊冪次計算單 元 1 2 6。 次區塊冪次計算單元1 2 6計算在區塊中全部樣本, 例如2 5 6個樣本,的平均冪次或均方根值(RMS值) 對在每一個次區塊中每一個樣本的平均冪次或均方根值的 比例或比值。 也就是說,如果找到例如第K個次區塊的平均冪次, 及本整個區塊的平均冪次,就能計算整個區塊之平均冪次 與第K個次區塊之平均冪次p(k)之比值的平方根。 如此所找到的平方根值視爲預設維數之向量,以便在 向量量化器1 2 7中執行向量量化,該向量量化器被配置 在相鄰於次區塊冪次計算單元。 經濟部中央標率局員工消費合作社印1Ϊ -----—、----— (請先聞讀背面之注意事項再填寫本頁) 向量量化器12 7產生8維8位元之直向量量化(碼 本大小爲2 5 6 )。用於此向量量化的輸出索引UV-3E ,亦即一代表性向量之碼,被送至轉換開關2 7之固定端 上_。對轉換開關2 7的固定端1被饋以來自精微音高捜尋 單元1 1 6的音高資料,而同時轉換開關2 7的輸出被饋 至輸出端2 8。 轉換開關2 7具有其切換由來自有聲/無聲辨識單元 1 1 7之辨識輸出訊號所控制,使得轉換開關2 7的可移 動接點分別當在區塊中至少有一頻帶被發現爲有聲(V ) 時被設定至固定端且以及當全數的頻帶均被發現爲有聲 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -15 - 41271¾ A7 .. _B7__ 五、發明説明(13 ) 時’被設定至固定端 (請先閱讀背面之注意事項再填寫本頁) 因此以次區塊爲基礎之標準化RM S值的向量量化輸 出藉由被插入一原來被用來傳送音高資訊之凹槽而被傳送 。亦即,如果區塊中的全部頻帶被發現爲無聲的(DV) ’不需音高資訊,使得只有來自V/UV辨識單元1 1 7 之V/UV辨識旗標被發現全部爲UV時,傳送向量量化 輸出索引以取代音高資訊。 轉回圖3,下文說明向量量化器2 3中頻譜包絡( A m )的加權向量量化。 向量量化器2 3爲一二級L維,例如4 4維,之配置 。亦即,爲4 4維且具有碼本大小爲3 2之來自向量量化 碼本之輸出向量的總和被乘上增益g i,而且最終的乘積 被用來當作4 4維頻譜包絡向量1之量化值。參考圖5, CBO、CB 1表示二形狀碼本,其輸出向量分別爲_§_〇 i 及玉_υ,其中,j客3 1。增益碼本CBg的輸出 爲gi,其爲純量值,其中〇^1 S3 1。最後輸出變成 S i ( X + ,)。 經濟部中央標率局貝工消費合作社印來 在L P C殘值之MB E分析上所得到並且被轉換成預 設維度的頻譜包絡Am被設定爲爲I。如何有效地量化1 係相當重要。 量化誤差能量E定義爲 E = iW{H^ ~ Hg,(%i + 8υ)}ΒΖ =J[WH (ϋ - gt (s^. + s,j) }D 2 其中H及W分別代表在L P C合成濾波器之頻率軸上 本紙張尺度適用中國國家標隼(CNS ) A4規格(2i〇X 297公釐) Μ Β7 五、發明説明(14 ) 的特性和用以加權在頻率軸上之聽覺加權的代表特性之矩 陣 量化誤差能量藉由自下式之頻率特性取樣對應之L維 例如4 4維的點而被找到。 H{z) (2) 其中ai,而1 S i gp,表示藉由分析目前框之 L P C所得到的α參數。 爲了計算,相鄰於1被填塞0,而有 ........... I» ’ 0,0,Q,…*.....,0以提供例如 256點資料。然後執行256點的FFT,並且對對應 於〇〜;r的點計算(r e2 + I ) m的值。接著,找到 所計算之值(r β2+ I:的倒數並且減去十分之一 至例如4 4點。給定一矩陣,其對角線元素對應這些倒數 〇該矩陣如下: ---^丨 J---1"! (讀先閱讀背面之注意事項再填寫本頁) -T -39 \h{\) 經濟部中央標隼局負工消費合作社印裝 Η·- 0 心) λ(〇] 給定聽覺加權矩陣W如下 1+Σ «ιλέζ-·1 W(z) ...(3) 本紙張尺度適用中國國家標隼(CNS > A4規格(21 Ox 297公釐) -17 - A7 B7 413719 五、發明説明(15 ) 其中oti爲輸入之L P C分析的結果,而;ίβ,;\_13爲 常 數 ♦ 使 得 9 經 由 示 例 } λ & - =0 . 4 及 λ b = 0 9 ^ 可 從 式 ( 3 ) 的 頻 率 特性 中 找 到矩陣W » 經 由 示例, 提 供 1 > a !; 1 \ ) ► 0L 2 λ b 2 r • ,α ρ λ b P 1 • 0 , 0 > • 0 來 給 定 2 5 6 點 的 資 料,其中執 丨行· F F T以 找 到 ( r 2 & C i + I 2 m C i ) 1 /2,其中 0 ^ i i ^ 1 2 8 "〇 然 後 t 提 供 1 » a 1 λ £ 1 > α ζ λ a 2 } , a ΙΪ X C 1 P 1 0 1 0 * 0 並 且 應用2 5 6 點 之 F F T 在 0 It 的 範 圍 內 之 1 2 8 點 處 來 計算分子的 頻 率 特性。 最 終 值 爲 ( r } e Ξ C i 〕 + I m 1 2 C i 3 ); 1/2 y 0 ^ i S 1 2 8 0 上式(3)的頻率特性可從下式找到: … /re2 [i] +Jni2 [i] w [二]H — VTe^TiTTi^vMTr 其中 i έΐ 28 經濟部中央摞隼局員工消費合作社印32 藉由下列用於例如4 4維向量之對應點的方法可找到 頻率特性》雖需使用線性內插以得到更準確的結果,但在 下例中卻使用最近點之值予以取代,亦即 ω [i] =ω0 [nint(128i/L)] 其中IS i SL·,且n i n t (x)爲一送回一最接近χ 的整數之函數。 至於Η,以相似的方法找到h ( 1 ) ,h ( 2 ), . . .,h ( L ),亦即 本紙張尺度顧中酬家鱗(CNS )順格Πιο x 297公釐) * —18 - 4^2719· A7 B7 五、發明説明(l6 H = Ά(0 心) 0 ,F = 'w(l) 0 w(2) 使得 0 h{L\ 0 ’ vv(L). WH= A(2)w(2) 0 …(4 ) . 0 h{l)w{L) 做爲一修改實施例,在首先找到Η (Z) W (Z)之後可 找到頻率特性,用以減少F F Τ運算的次數。 亦即: 户 . 1 + 2 ce; ζ (請先關讀背面之注意事項再填寫本頁) …⑸ 經濟部中央標準局員工消費合作社印製 H{z)w{zy 式(5)之分母展開成: I ρ γ p ^ ip 11-fZa/i'' ||l + 2ci[AaZ ' -l+^0tz~' I ''-l 八“丨 )f-丨 藉由設定 l,;31,ie2,...b2p,〇,〇, ...,Ο,形成例如256點的資料。然後,執行 2 5 6之F F Τ來提供振幅的頻率特性,使得 imsii] ^re· ·2 Vi] 其中 〇 S i S 1 2 8。 由此,下式 wh〇[l 一 . 成立,其中OSi客128 本纸張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -19 - 412719 A7 B7 五、發明説明() 17 對L維向量的每一個對應點找到其值^如果f F T的 點數少,那麼應可使用線性內插*但在此使用最接近之值 ,亦即 wA[ / j= wh〇 n mt rl28 給定以最接近之值作爲對角線元素的矩陣W"爲: wA⑴ 〇 wA(2) W,: …(6) Ο ^h{l) 上式(6)與式(4)爲相同之矩陣》 使用此矩陣,亦即加權之合成濾波器的頻率特性,式 (1 )被改寫成: E·- +I1;))|| ---(7) (請先閲讀背面之注意事項再填寫本頁) 訂· 經濟部中央標準局員工消費合作社印製 下面說明形碼本及增益碼本之學習方法。 首先,對於所有選擇與C B 0有關之碼向量玉的框 ,夹真的期望值被最小化,如果有Μ個此種框,其足以使 下式達最小 Μ 在此式(8)中,W’ K、x’ 1:、运1£及互^1£表示對 第Κ個框的加權、對第Κ個框的輸入、第Κ個框的增益及 用於第Κ個框之碼本CB1的輸出。 爲了使式(8 )最小化 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) —20 - 民國88年12月修正 五、發明說明(18 ) (心 +〜))}γ- 2{ijw;rwi zk-2§M (iL +ώ )w*rwix*
M '^gl G« +ιϊ* )wirwt
M =T7 2{i JwirW* Xk- 2gt (l« TsJk V*rWi Λ J. M kA+gl +2gl l^W;rW; llk - = — Wjt Wa 汐立 M Jc_l+2^J w7 w* iu }e〇 ---(1°) 所以 2Gjt wir wi wir Wa iu
My 2 ^w;r w 並且因此 S* W^Wjt} ' ' (11) 其中丨}-1表示反矩陣以及WK· T表示wK’的轉置矩陣 \ (請先閱讀背面之注意事項再填寫本頁) d 0 a— 111— ilmn — —.^^v 經濟部智慧財產局員工消費合作社印製 其次,考慮增益的最佳化。 藉由解下式而得爲了第k個框選擇增益之碼字元g 的失真之期望值Js。 我們得到 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -21 - 412719- A7 ——------:_:---—- 五、發明説明() 19 JL W f (請先閲請背面之注意事項再填寫本頁) +^,〇v/;rw; 〇:σ* +i[Jk)} (i 〇k ·*"λ3[^ }w^ Wj6 Ci a* IA )~ 0
Af A, 2 2L, w/ wi Ctoi +I,J= 2 ge (^〇rt +.S:rOw;rwiGL0, +llk) Λ-1
I
tU 2 2L* W;rv/i (l〇i +l[k) gc^^r7Z-:--…(L2) 3 K)w,wiCie,。 上式爲形互_〇i、_§_Ϊ1及增益g i給定最佳的質心條件 ,其中OSi客3 1,亦即一最佳解碼輸出。在替_§_^找 到最佳之解碼輸出的情況下可以爲玉_14找到最佳的解碼輸 出。. 其次,考慮最佳之編碼條件(最接近的鄰近條件)。 爲了量測失真,亦即Ε = || W, ( X - g 1 C S_〇i + 經濟部中央樣準局員工消費合作社印製 S_〇 i ) ) « 2而使式(7 )達最小之形_§_〇 i、玉^ i被浃定 在每次當爲每一個框給定輸入及加權矩陣W ’時。 固有地,爲 giCOSISSI) > S_〇! ( 0 ^ i ^ 3 1 )及呈^ ,· ( 0 S j S 3 1 )的所有組合找到E ’亦即 成循環方式(r 〇 u n d r 〇 b i n f a s h i ο η )的 3 2 X 3 2 X 3 2種組合,以便找到一組可給定最小E值的gi、 S_〇i ,,·,。但是,因爲這將導致大量的算術運算,所以編 本紙張尺度適用中國國家標準(CNS > A4規格(210 X297公釐) '^ -22 - A7 B7 412719 五、發明説明() 20 碼單元2爲形及增益執行序向搜尋。爲玉_〇 i及互^ 的3 2 X 3 2 = 1 0 2 4實施循環捜尋。在下文中爲簡化起見將 i + 立„1 i 寫成卫_111。 爲了更進一步簡化,上式可寫成 E=|W, ( - g ! ( s m )丨2,藉由設定 以及_i_w = W ’ s m,我們得到: (13) (請先閱讀背面之注意事項再填寫本頁) ^-IUv|i' +[U„ir III JIN' IU-Γ (14) 可以用 經濟部中央標準局員工消費合作社印製 因此,假設可確定對^::值有足夠的精準度 兩個步驟來實施搜尋:
(1 )搜尋使下式最大化之s W 及 (2 )搜尋最接近於下式之 XT :2..,. 如果使用原來的表示法重寫上式,可以用兩個步驟來 實施搜尋: 本紙張尺度適用中國國家榇準(CMS ) A4規格(21〇χ297公釐) -23 - 412719: A7 —____;_二 五、發明説明() 21 (1 ) ’搜尋一組!_〇 i、玉一 ϋ *其使下式最大化 XTW'TW' B妒(W 卩 ...(15) (2)1搜尋最接近於下式之gl XTW' TW' (•S/Sij、_ HW. (£〇,、) Is 式(15)給定最佳的編碼條件(最接近的鄰近條件 )。使用式(11)及(12)的質心條件,以及式( 1 5 )的條件,可以藉由廣義的Lloyd演算法(G L A )來同時訓練碼本CB〇' CB1及CBg。 參考圖3,經由轉換開關2 4將向量量化器2 3連接 至有聲用碼本2 5 V,以及連接至無聲用碼本2 5 U。藉 由仰賴來自諧波雜訊編碼電路2 2的V/UV辨識輸出來 控制轉換開關2 4的切換,使用有聲用碼本2 5 V和無聲 用碼本2 5 U分別對有聲及無聲執行向量量化。 碼本依賴對有聲(V) /無聲(UV)的判斷而切換 的原因在於,因爲在依據式(11) 、(12)之計算新 經濟部中央標準局員工消費合作社印製 的質心中執行加權之W 1£及2 1的平均,所以不希望在數 值方面有顯著差別的w g i做平均。 此時,編碼單元2使用被输入1的模方(η 〇 r m ) 所除的W — 亦即在式(1 1 ) 、(12) 、( 1 5 )的 處理方面事先以/ II HI代替。 當介於兩碼本之間的切換視ν/UV辨識而定時,訓 練資料爲有聲用碼本及無聲用碼本做準備而自個別的訓練 本紙張尺度通用中國國家標举(CNS ) A4規格(210X297公釐) ' -24 - 412719 A7 _ B7 五'發明説明() 22 資料被以類似的方式分布。 爲了減少ν/UV的位元數,編碼單元2使用單頻帶 激發(SBE),而且將一指定框視爲一有聲(V)框及 —無聲(UV)框,如果V的比率分別超過5 0 %或者其 他。 圖6、7顯示有聲用、無聲用以及有聲與無聲之組合 用輸入2L的平均值W ’ / || HI和加權的平均值,亦即不 必管介於有聲及無聲之間的差別處》 由圖6可以看到*雖然介於ϋ及UV間之增益( IIHI )的平均值係幾乎不同的,但是在頻率軸上2L其本 身的能量分布則並不隨V及U V而幾乎相同。但是,從圖 7中明顯可知加權之形狀在於V及U V 1之間不同,並且 加權係對V之低範圍比對U V之低範圍增加其位元指派這 樣的一種加權0這說明了藉由對V及UV分開訓練來獲得 較高性能之碼本公式的可行性。 經濟部中央標準局員工消費合作社印製 圖8顯示對三種示例的訓練方式,亦即對有聲(V) 、無聲(UV)以及對被組合在一起的有聲與無聲。也就 是說,在圖8中的曲線I、、及分別代別具有曲線i '上__、_£_之終端值爲3_ 72、7· 011和6_ 25之 僅對V,僅對UV以及對被組合在一起的V和UV之訓練 方式。 ,從圖8中看到V用碼本及υ V用碼本之訓練的分開導 致減小之輸出失真的期望值。雖然帶有僅ν之曲線t 之期望值的狀態稍微變差,但是就整體而言’期望值被改 本紙張尺度適用辛國國家標準((:泌)八4規格(210父297公釐) 412719 Λ7 A 7 ___, ._Β7_ 五、發明説明() 23 (請先閲讀背面之注意事項再填寫本頁) 善,因爲V用領域長於UV用領域。經由V及uv之發生 的頻率之示例,對長度爲1之僅V用及僅UV用之領域長 度的量測值爲0. 538及0. 462。因此,由圖8之 及立_的終端值,得到總失真的期望值爲 3. 72x0. 5 3 8 + 7. 0 1 1 x 0. 4 6 2 = 5 . 2 4 其表示與被組合在一起之V及UV訓練用的6. 25之失 真的期望值相較之下有大約0. 76dB的改進。 從訓練的方式判斷,在期望值方面的改進約0. 76 dB的等級。但是,已經發現如果爲一情況找尋SN比值 (S.N R )來處理在訓練集之外的四個男回答者及四個女 回答者的語音樣本,在該情況中,沒有實施量化,分開成 V及UV致使在分段SNR方面的改進爲1. 3dB的等 級,其原因爲假定V的比值明顯地高於UV的比值。 經濟部中央標準局員工消費合作社印製 須知當被向量量化器2 3而爲向量量化用之聽覺加權 所使用之加權W’正如由上式(6 )所定義的同時,考慮 暫時遮罩之加權W'可以藉由找到考慮過去的W |之目 前的加權W -而被找到。 至於在上式(6)中之wh(l) ,wh(2), .........w ti ( L ),那些在時間JL月ί計算的值,也就是對 第η個框,被表示成w h n ( 1 ) ,w h η ( 2 ).......... -w h n ( L )。 考慮在時間卫_之過去值的加權被定義爲An(i), 本紙張尺度適用中國國家襟準(CMS ) A4规格(210X297公釐) -26 - 經濟部中央標準局員工消費合作社印製 412719 A7 _ B7 五、發明説明() 24
1 芸 i S L ,貝(J Αη(ι) = λΑη„,(ι) + (1-X)whn(i) (whn( i) < An.,( i )) =whn⑴ (whn(i) > An.,(i)) 其中λ可以被設定而使得例如〇. 2,An( i ),其中 lSigL ·可以被用來作爲矩陣之對角線元素,其被用 來當作上述的加權。 \回到圖1,現在說明修.改過之編碼參數計算單元3。 語音訊號重現裝置1快速地經由修改過之編碼參數計算單 元3修改從編碼單元2輸出之編碼參數,並且經解碼單元 6解碼修改過的編碼參數,以便以兩倍於即時速度的速度 重現固態記錄的內容。因爲音高和音位維持不變,縱使是 一較高的重放速度,錄音內容仍能夠被聽到,即使以一上 升的速度來重現該錄音內容。 因快速修改編碼參數,修改過之編碼參數計算單元3 不需處理其後的解碼及輸出,並且能夠以相似的演算法很 容易地應付不同的固定速率。 參考圖9及圖11的流程圖|現在詳細說明語音訊號 重現裝置1之修改過之編碼參數計算單元3的操作。修改 過之編碼參數計算單元3係由周期修改電路4、內插電路 5所組成,如參考圖2所做之說明。 首先,在圖9的步驟1時*將如LSP、音高、V/ UV或 Am的編碼參數經由輸入端1 5 、28、29、 2 6饋入周期修改電路4 <設定音高爲Pch( η],設定 本紙張尺度ίϊ用中國國家標準(CNS ) Α4規格(210X297公釐) " -27 - ----^---;----::)------訂----^----^::,r (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 412719 A7 _. '_B7_ 五、發明説明() 25 V/UV 爲 VUv〔n〕,設定 Am 爲 a '〔η〕〔1〕, 以及設定LSP爲l3P〔n〕〔i〕。藉由修改過之編碼 參數計算單元3所最終計算的修改過之編碼參數被設定爲 mod_PCh〔m〕,rnod_vuv〔m〕> mod_ara〔m][l〕,及 mod— 1SI1〔 m ] 〔i〕 ,其中丄_表示諝波的數目,1_表示LS P的階數,而卫_、 m_對應至分別依序對應於在時間軸轉換前後之時間軸的索 弓[,。此時,0 < η<m<N2,而且、m的每 一個爲具有例如2 〇m s e c之框間隔的框索引。 如上所述,丄_表示諧波的數目。在恢復諧波的數目至 對應於諧波之實際數目的Am〔η〕 〔1〕之後以執行上 面的設定,或者亦可在Ara〔n〕C 1〕.的狀態中3 ( 1 =0至4 3 )執行上面的設定。亦即,可以在由解碼器解 碼之前或之後執行數目資料的轉換》 在步驟S 2時,周期修改電路4設定對應於原始時間 長度之框數爲Νι,而同時設定對應於改變後時間長度之 框數爲Ν2。然後,在步驟S 3時,周期修改電路4在時 間軸上壓縮1^1的語音至Ν2語音。亦即由周期修改電路4 所壓縮之時間軸壓縮的比值s pd被發現爲Ν2/Νι。 然後,在步驟S 4時,內插電路5設定對應至依序對 應於在時間軸轉換之後的時間軸索引之框數的里_爲2 » 然後,步驟S 5時,內插電路5找到兩.個框fI•。和 fn,及介於兩框fr。和fri與m/s p d之間的差’
左•及·右’*如果編碼框pCh、vuv、A„^lsr^W 本紙張尺度適用中國國家標準(匚阳)八4^見格(210乂297公釐) ' -28 - (請先閲讀背面之注意事項再填寫本頁) -*
I A7 B7 412719 五、發明説明() 26 *表示,則mo d — *〔m〕可以用通式表示 mod —氺〔m〕= *〔m/spd〕 其中〇Sm<N2。但因m/s p d不是整數,所以用於 m/ s p d的修改過之編碼參數藉由內插自f L m/ S p d和frl = f〇 + 1的兩個框而被產生。須知在圖 1 0中所顯示之介於框m/s p d及框frl之間的 關係,亦即關係: 左= m/ spd-fr〇 右=fri-m/s p d 成立· 經濟部中央標準局員工消費合作社印製 在圖1 0中之用於m/s p d的編碼參數,亦即修改 過的編碼參數,如同於步驟S時所顯示由內插所產生。可 簡單地藉由線性內插找到修改過的編碼參數,該線性內插 爲 mo 〔m〕= * 〔 fr〇〕X 右十 *〔 f Γ 1〕x 左 但如果隨著介於f 和之間的內插*就V/UV 而論,此二框不同,亦即如果兩框中的一框爲V,而另一 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -29 - 經濟部智慧財產局員工消費合作社印製 412719 B7 五、發明說明(27 ) 框爲UV,則不可以應用上面之逋式》因此,如在圖 11之步驟Sll ff_·中所示,內插電路5修改找尋 與這兩框f „及f 有聲和無聲的特性有關之編碼參數 的方式。 首先判斷有關是否兩框f 及f 爲有聲(V )或無 聲(UV) *如果發現框fr。及于^均爲有聲(V),那 麼程式轉移至所有的參數被線性內插於其中的步驟_ S 1 2 ..v而且修改過之編碼參數被_示成:. mod_pch[m] = pch[ff0]xright + pch[frl]xleft mod_am[m][l] = am[fr〇] [1 ]xright + am[frI] [1 ]xlef t 其中0 S 1 <L ·須知L表示能夠被拿來當作諧波之最大 可能的數目,並且* 0 >被填充於其中沒有諧波之a„〔 η〕〔1〕之內。如果介於框fr0及之間的諧波數不 同,則在執行內插時,副諧波的數值被假設爲0。如果在 通過資料數目轉換單元之前,L的數目可以被固定在例如 L = 43,且 0S1CL- * 另外*修改過之編碼參數亦可被表示成 mod— lsp〔m〕〔i〕=lsp〔f Γ〇〕〔 i〕x 右 +lSP〔:frl〕〔i〕x 左 其中OS i< I且I表示LSP之階數而通常爲10,以 及 mod 一 vuv〔m.〕=1 A7 0 I 1 n n n n ·1 u * n (請先閱讀背面之注f項再填寫本頁) 訂. --線- 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐〉 -30 - 412719 A7 B7 五、發明説明( 28 須知在有聲/無聲辨識方面,1及〇分成表示有聲( v )及無聲(ϋ V )。 如果在步驟s 1 1時判斷兩框fr。及皆非有聲( v ),則給定與在步驟S 1 3時所給定之相似的判斷,亦 即判斷是否框i r。及f rl二者均爲無聲(II V )。如果判 斷的結果爲是•亦即兩框示者均爲無聲(XIV),則內插 電路5設定P ch爲一固定值,並且藉由線性內插找到Am 、1 s n,該線性內插如下: mod „ PChCm] = MaxP i t ch 用來爲無聲藉由例如MaxPitch= 1 4 8而將音高的數值固 定於例如一最大值的固定值; mod_am〔m〕〔l〕=affl〔 +am〔frl〕 〔l〕x左 其中 〇Sl<MaxPitch: f r· 〇 ) 〔 1 〕X 右 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標孪局員工消費合作社印製 mod _ lsrJ〔m〕〔l〕=lSp〔fr〇〕〔i〕x 右 + 1 〔 f 〕 〔 i〕X 左 其中0盔i < I ;且 mod — vuv〔m〕=0。 如果兩框f x·。及f d二者皆爲無聲。則程式轉移至步 驟S 1 5,在此步驟中判斷是否框【π。爲有聲而框 本紙張尺度適用中國國家操準(CNS ) A4規格(210X297公嫠) #12719 at _____B7__ 五、發明説明() 29 爲無聲(UV)。如果判斷的結果爲是,亦即框frQ 爲有聲(V),且框frl爲無聲(UV),則程式轉移至 步驟S 1 6。如果判斷之結果爲否,亦即框亡r。爲無聲( UV),而框f rl爲有聲(V),則程式轉移至步驟 S 1 7 - 步驟s 1 6 f f .的處理指的是其中兩框fr0及frl 對V/UV而言不同,亦即其中框的其中之一爲有聲,而 另一框爲無聲的情形。此係考慮介於對V/UV而言爲不 同的兩框f r。與ί rl間的參數內插係不具任何意義的事實 。在此情況下,使用較接近時間m/s p d之框的參數值 ,而沒有實施內插。 如果框fr。爲有聲(V),並且參數frl爲無聲( UV),則程式轉移至在圖10中所顯示之、左/ (==m / s.p d — f r。)及'右一 ( = p d)的大 小互相比較於其中之步驟S 1 6,這致使給定有關框fx·。 及ir:L的那一個較接近於m/s p d的判斷,使用較接近 於in / s p d之框的參數值來計算修改過的編碼參數。 經濟部中央標準局負工消費合作社印製 {請先閱讀背面之注意事項再填寫本頁) 如果在步驟S 1 6時判斷的結果爲是,則是較大者'
右 > ,而因此是框(1^離111/3 ?(1較遠。所以在步驟S 1 8中使用較接近於m/s p d之框fr。的參數來找到修 改過的編碼參數,其參數爲: mod_pch[m;l = pch[fr0] · = aJff〇][l] (where 0 五 1 < m〇d_lsp[m][i] = 1sp[fr〇Hi] (where 0 < i < L) mod_vuv[m] = 1 本紙張尺度適用中國國家標準{ CNS ) A4規格(210X297公楚) -32 - 4127...9 A7 B7____ 五、發明説明() 30 如果在步驟s 1 6中判斷的結果爲否,即左会右,而 因此框f 較接近m / s p d,所以程式轉移至其中音高 在數值方面被最大化的步驟S 1 9 ,並且使用用於框frl 的參數,則修改過的編碼參數被設定而使得 m〇d_pcil[m] = MaxPitch = am[fr)][l] (where 0 < < MaxPitch/2) m〇d」sp[m]⑴=(where 0 s i < |_) mod_vuv(m] = 〇 然後,在步驟S 1 7中,回應在步驟S 1 5中的判斷 ,兩框f X·。及f d分別爲無聲(U V )及有聲(V ),則 以相似於步驟S 1 6的方式來給定決斷。亦即,在此狀況 下,不實施內插而使用較接近於m/s p d的框之參數值 〇 如果在步驟S 1 7中判斷的結果爲是,則在步驟 S 2 0中使音高的值最大化,而且爲剩餘的參數使用用於 較接近之框f r。的參數,則修改過的編碼參數被設定而使 得: m〇d_pch[m] = MaxPitch 經濟部中央標準局員Η消費合作社印製 (請先聞讀背面之注意事項再填寫本頁) m〇d一= Ά〇][1] (where Ο £ ( < MaxPitch) m〇d」sp[m:)[i] = lsp[f「〇][i;I. (where Ο s 'i < I) mod—vuv[m] = 0 如果在步驟s 1 7中判斷的結果爲否,因爲左^右, 而因此f ^較接近於m/s p d ’則程式轉移至其中具有 用於框f 之參數的幫助之步驟S 2 1 ,修改過的編碼參 數被設定而使得: 本紙浪尺度適用中國國家標準(CNS > A4規格(210X297公釐) -33 - 經濟部中央標準局貝工消費合作社印製 紙9 $ 五、發明説明() 31 mod-PCh[m] = Pch[fr丨] fnod_a(I![m]n] = am[fr|][i] (where Ο < ^' < L) m〇d_lsp[mHi] = lsp[ff(][n (where 0 < ( < L) mod—vuv[m) .= 1 ' 以此方式’內插電路5在圖9的步驟S 6中依據介於 兩框f r。與frl間的有聲(V)友無聲(UV)間的關係 而實施不同的內插操作。在步驟5 6的內插操作終止之後 ,程式轉移至其中m被增量的步驟s 7,步驟s 5及s 6 的操作步驟一直重複直到I的數值變成等2爲止。 此外,用於UV部份之短期Γ m s的序列逋常被用在 雜訊增益控制。但是文中設定此參數爲1 6 圖1 2顯示修改過編碼參數計算單元3的操作之示意 圖。爲編碼單元2每2 Ora s e c抽取一次編碼參數的模 型顯示於圖1 2之A中•修改過編碼參數計算單元3的周 期修改電路4設定周期爲1 5ms e c ’且順著時間軸產 生壓縮,如圖1 2之b中所顯示。在圖1 2之c中所顯示 的修改過之編碼參數如前所述地藉由與二框f μ及f 的 V/U V狀態一致的內插運算而被計算。 修改過編碼參數計算單元3有可能使在其中由周期修 改電路4及內插電路5的操作之序列倒轉。此即如在圖 1 3之B中所顯示,實施在圖1 3之A中所顯示的編碼參 數之內插,且如在圖1 3之C中所顯示,實施用以計算修 改過的編碼參數之壓縮。 來自修改過編碼參數計算單元3的修改過之編碼參數 本紙浪尺度適用中國國家標準(CNS ) A4規格(2ί〇Χ 297公釐) ' -34 - -----:--;----,-----^--^------ (請先聞讀背面之注意事項再填寫本頁) 4127.9 A7 A7 __;___B7_ 五、發明説明() 32 被饋送入在圖1中所顯示之解碼電路6。解碼電路6根據 修改過的編碼參數來合成正弦波及雜訊,並且在輸出端 3 7輸出合成的聲音。 參考在圖1 4、1 5說明解碼單元6。爲說明起見, 假設被供應至解碼單元6的參數爲一般之編碼參數。 參考圖1 4,一 L S Ρ的向量量化輸出,其對應於圖 3之終端15的输出,亦即所謂的索引(index), 被供應至終端3 1 〇 此輸入訊號被供應至一用於倒轉向量量化的反L S P 向量量化器3 2以產生後來被供應至用於L S P內插之 LSP內插電路3 3的線性頻譜對(LSP)資料,最終 的內插資料被一L S P至α轉換電路3 2轉換成線性預測 碼(LP C)的α參數。這些α參數被饋入合成濾波器 3 5。 經.濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事頃再填寫本頁) 有用於對應至在圖3中所顯示之編碼器的終端2 6之 输出的頻譜包絡(Am)的加櫂向量量化碼字元的索引資 料被洪應至圖1 4的終端4 1。有來自圖3之終端2 8的 音高資訊及表示在一 U V區塊內之時間波形的特性量之資 料被供應至終端4 3,而有來自圖3之終端2 9的V/ UV辨識資料被供應至終端4 6。 來自終端4 1的振幅Am之向量量化資料被饋入用於 倒轉向量量化之反向量量化器42(MBE)。最終的頻 譜包絡寶料被送至諧波/雜訊合成電路或者多頻帶激發合 成電路4 5,該合成電路4 5被饋以來自終端4 3的資料. 氏張尺度適用中國國家標準(CNS ) Α4規格(210x297公釐) -35 - 經濟部中央標準局貝工消費合作社印製 ___412719 37_ 五、發明説明() 33 ’其被一個介於音高資料與表示依據V/UV辨識資料之 用於UV框的波形之特性值的資料之間的轉換開關4 4所 切換’該合成電路4 5亦被饋以來自終端4 6的V/UV 辨識資料。 當作該合成電路45之說明性配置,隨後將參考圖 1 5來說明MB E合成電路的配置。 從合成電路4.5中取出相關於圖3之反濾波電路2 1 之輸出的L P C殘值資料。如此所取出的殘值資料被送至 合成電路3 5,在該合成電路3 5中*實施L P C合成來 產生被一後置濾波器3 6所過濾之時間波形資料而使得重 現的時域波形信號在輸出端37被取出。 當作該合成解碼4 5之示例,一MB E合成電路之說 明例將參考圖1 5加以說明。 參考圖1 5 ’來自圖1 4之反向量量化器4 2的頻譜_ 包絡資料實際爲L P C殘值之頻譜包封資料,被供應至輸 入端1 3 1。被饋送入終端43、4 6的資料與在圖14 中所顯示的資料相同。被供應至終端4 3的資料爲轉換開 關4 4所挑選,使得音高資料和表示UV波形之特性量的 資料分別被饋送入一有聲合成單元1 3 7及一反向量量化 器 1 5 2。 來自終端1 3 1之L P C殘值的頻譜振幅資料被送A 複數個用於反向轉換之資料逆轉換電路1 3 6。該複數個 資料逆轉換電路執行係由該複數個資料轉換單元119所 執行之轉換之倒轉的反向轉換。最終的振幅資料被饋送人 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) : ~ ' -36 - (请先閲讀背面之注意事項再填寫本頁.) ¥ 訂 經濟部中央標準局員工消費合作社印製 A7 412719 B7 五、發明説明() 34 有聲合成單元1 3 7及無聲合成單元1 3 8。經由轉換開 關4 4之固定端之獲自終端4 3的音高資料被饋送入合 成單元137、138。來自終端46的V/UV辨識資 料亦被饋送入合成單元137、1 38。 有聲合成單元1 3 7藉由例如餘弦或正弦波合成來合 成時域有聲波形,同時無聲合成單元1 3 8藉由一帶通濾 波器濾掉白雜訊來合成時域無聲波形。有聲波形及無聲波 形由加法器1 4 1加總在一起以便在輸出端1 4 2被取出 、如果V/UV碼當作V/UV辨識資料傳送,可在單 一分界點分割整個頻帶成爲一有聲(V)區及一無聲( UV)區,並且可根據此分界點得到以頻帶爲基礎之V/ UV辨識資料。如果在分析(編碼)側將頻帶退化至一固 定數目,例如1 2個頻帶,可提供具有相關於原始音高之 頻寬的變動數目之頻帶來消除此種頻帶退化》 下文說明無聲合成單元1 3 8之合成無聲的操作。 ·、.來自白雜訊產生器1 4 3的時域白雜訊信號波形被送 至一用以藉由具有一預定長度之例如2 5 6個樣本·的譬如 像Hamming窗之適當框取功能來框取的框取單元1 4 4。 所框取之信號波形然後被送至用以產生白雜訊之頻域能量 頻譜之STFT用短期傅立葉轉換(STFT)電路 145。來自STFT單元145的能量頻譜被送至頻帶 振幅處理單元1 4 6,在該頻帶振幅處理單元1 4 6中, 被認爲係UV之頻帶被乘以振幅 Am UV而同時被認爲 本紙張尺度適用中國國家標準(CNS ) A4規格(2[0X297公釐) (請先聞讀背面之注$項再填寫本頁)
X -37 - 經濟部中夬標準局員工消費合作社印製 五、發明説明() 35 係V之其他頻帶的頻寬被設定爲0。頻帶振幅處理單元 14 6被供應以振幅資料、音高及V/UV辨識資料。. 頻帶振幅處理單元146的輸出被送至ISTFT單 元1 47,在該I STFT單元1 47中,輸出藉由使用 原來的白雜訊之相位當作相位而被反向S T F T,用以轉 換成爲時域信號。I STFT單元147的輸出經由稍後 說明之能量分佈成型單元1 5 6及乘法器1 5 7而被送至 重疊及相加單元1 4 8,在該重疊及相加單元1 4 8中, 爲了致使原來連續波形的恢復而以在時間軸上之適當的加 權來重複、重疊及相加。以此方式,經由合成來產生連續 的時域波形。重疊及相加單元1 4 8的輸出訊號被送至加 法器1 4 1 β 如果在區塊中至少一頻帶爲有聲(V),在個別的合 成單元137、13 8中實施上述之處理。如果在區塊中 整個頻帶均爲UV,則轉換開關4 4使其可動接點4 4設 定至一固定端k,使得在無聲訊號之時間波形上的資訊取 代音高資訊而被送至反向量量化單元1 5 2。 亦即,對向量量化單元1 5 2饋入相關於來自圖4之 向量量化單元1 2 7的資料之資料。此資料被反向量量化 以得到用來抽取出無聲信號波形之特性量的資料。 ISTFT單元147的輸出具有被能量分佈成型 單元1 5 6在其被送至乘法器1 5 7之前所調整的時域能 量分佈。乘法器1 5 7將I STF T單元1 47的輸出. 乘上從向量置化單元1 5 2經由平整單元1 5 3所得到的 本紙浪尺度適用中國國家標準(CNS ) A4規格(2I0X297公釐) ----7--„----,.w-- (請先閲讀背面之注意事項再填寫本頁) _j 、tT- -38 - 412719 A7 ____ B7___ 五、發明説明() 36 訊號·> 感覺粗糙的快速增益變動可由平整單元1 5 3加以抑 制。 如此所合成的無聲訊號在無聲合成單元1 3 8處被取 出,並且被送至加法器141,在此加法器141中,其 加上來自有聲合成單元1 3 7的訊號,而使得當作MB E 合成输出的L D C殘值訊號在輸出端1 4 2處被取出》 這些L P C殘值訊號被送至圖1 4的合成濾波器3 5 用以重現最後重播的語音聲音。 語音信號在生裝置1致使修改過編碼參數計算單元3 在控制器|圖中未顯示出,的控制下計算修改過的編碼參 數,而且在修改過的編碼參數的幫助下合成爲時間軸壓縮 擴展之原始語音聲音的語音聲音" 在此情況下,使用來自修改過編碼參數計算單元3的 mod— 1 aE> C m ] 〔i〕以取代LSP反向量量化電 路3 2的輸出。使用修改過編碼參數mo d_lse〔m〕 經濟部中央標準局員工消費合作社印製 (請先閲讀背面之注意事項再填寫本頁) 〔i〕以取代固有向量解量化之值。修改過的編碼參數 mod— Isp〔m〕 〔i〕被送至用於LSP內插的 LSP內插電路3 3,而後被供應至LSP至α轉換電路 34,在此轉換電路34中,其被轉換·成被送至合成濾波 器35的線性預測碼(LPC)的α參數,9 另一方面,供應修改過的編碼參數m 〇 d — am〔 m 〕〔1〕以取代複數個資料轉換電路136的輸出或輸入 。對終端43、46分別饋送mod — Pch〔m〕及 本紙張尺度適用中國國家標準(CNS ) A4規格(21〇X297公釐) -39 - 經濟部中央標準局員工消費合作社印製 A7 _B7_____ 五、發明説明() 37 mod_vuv〔m〕》 該修改過的編碼參數mod — am〔m〕〔1.〕被送 至諧波/雜訊合成電路4 5當作頻譜包絡資料。對合成電 路4 5送入來自終端4 3的111〇(1_?£^〔111〕’此係經 由轉換開關4 4 ’且視辨識資料而定,而同時亦饋入來自 終端46的mod_vuv〔m〕。 藉由上述配置,如圖1 5中所顯示,使用上述之修改 過的編碼參數合成時間軸之壓縮擴展的原始語音訊號’以 便在輸出端3 7輸出。 因此,語音訊號重現裝置1解碼一陣列之修改過的編 碼參數mod — *〔 m 〕(〇客m<N2)以取代固有 陣列*〔n〕 (0客nSNi)。在解碼期間,框間隔可 以被固定爲例如像傳統上一樣2 Om s e c ·因此,如果 Ν2<Νι或Ν2>Νι,那麼分別完成隨著速度增加的時間 軸壓縮或者隨著速度降低的時間軸擴張。 如果如上所述地實施時間軸修改,則瞬間頻譜及音高 仍然沒有改變,使得不論在0. 5<spd<2的範圍內 之明顯的修改幾乎不會產生破壤。 有了此系統,因爲最終所獲得之參數串在被用2 0 m s e c的固有間隔來排列之後被解碼,所以可輕易地在 增加或減少方向上實現任意的速度控制。另一方面,可經 由同一處理而沒有轉變點來實行速度增加或減少。_ 因此可以用即時速度的兩倍來重現固態記錄的內容。 因爲音高及音位仍沒變動,儘管增加重播速度,例如如果 本紙張尺度適用中國國家標準(CNS } A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁)
-40 - 經濟部中央標準局貝工消費合作社印裝 4127^9 A7 ______B7_ 五 '發明説明()' 38 在較高速下實施重現,可能聽到固態記錄之內容。另—方 面’.至於語音編碼解碼(cordec),係一輔助操作,就像 在解碼及輸出之後的算術運算,爲C E L P編碼的使用之 所需,其可以被消除。 雖然修改過編碼參數計算單元3與上述的第一實施例 之解碼單元6隔離,但是在該解碼單元6中也可以提供計 算單元3 » 在藉由語音訊號重.現裝置1中的修改過編碼參數計算 單π 3來計算參數方面.,對A in的內插‘運算可以對向量量 化值或反向量量化值執行。 下文說明依據本發明之用以實施語音訊號傳送方法的 語音訊號傳送裝置5 0。參考圖1 6,語音訊號傳送裝置 5 0包含一發送器5 1,其用來根據以預設時域框爲單位 來分裂輸入語音訊號,並且以框爲基礎來編碼該輸入語音 訊號以便找尋編碼的參數,內插該編碼的參數而找到修改 過的編碼參數及用.以傳送修改過的編碼參數。語音訊號傳 送裝置5 0亦包含一接收器5 6,其用以接收修改過的編 碼參數及合成正弦波稆雜訊。 亦即,該發送器5 1包含一編碼器5 3,其用來根據 以預設之時域框爲單元來分裂輸入語音訊號,並且以框爲 基礎來編碼該輸入語音訊號以使抽取編碼的參數、一內插 器5 4,其用以內插該編碼的參數,.以便找得到修改過的 編碼參數,及一發送單元5 5 *其用以發送修改過的編碼 參數,該接收器5 6包含一接收單元5 7、一內插器5 8 本紙張夂度逋用中國國家標準(CNS ) A4规格(210X297公釐) ~ -41 - (請先閲讀背面之注意事領再填寫本頁)
經濟部中央標準局員工消費合作社印製 412719 a7 ___B7 _ 五、發明説明() 39 ,其用以內插該修改過的編碼參數,及一解碼單.元59, 其用以根據內插的參數來合成正弦波形及雜訊*以便在輸 出端6 0輸出所合成的語音訊號。. 編碼單元5 3及解碼單元5 9的基本操作和語音訊號 重現裝置1的基本操作相同,因此爲了簡單起見,省略其 詳細的說明。 藉由參考圖1 7的流程圖來說明發送器5 1的操作· 在流程圖中,共同顯示透過編碼單元5 3的編碼操作以及 透過內插器5 4的內插操作。 在步驟S31、S33中,編碼單元53抽取由 LSP、音高、Pch、V/UV及Am所組成的編碼參 數。尤其是L S P在步驟S 3 1中被內插器5 4所內插並 重新配置,且在步驟S 3 2中被量化,而同時在步驟 S 3 4中內插並重新配置音高p c h、V/UV及Am並 量化於步驟S 3 5。這些量化資料經由發送器5 5被傳送 到接收器5 6。 經由接收5 6之接收單元5 7所接收的量化資料被饋 至內插單元5 8,在此內插單元5 8中,該參數被內插旦 再行配置於步驟S 3 6中。在步驟S 3 7中藉由解碼單元 5 9來合成資料。 因此’爲了透過時間軸壓縮來增加速度,語音訊號傳 送裝置5 0內插參數且在傳送時間中修改參數框間隔。此 時’因爲接收期間,藉由以固定框間隔,例如2 〇 m s e c ,找到該參數來實施重現,所以可以爲了位元率 氏張尺度適财關家網^⑽…規格⑺狀加公釐) ' (請先聞讀背面之注意事項再填寫本頁)
-42 _ 41礼9 A7 B7 五、發明説明() 40 轉換而直接使用速度控制演算法。 亦即,假設如果爲速度控制而使用參數內插,則在解 碼器內實施參數內插。但如果在編碼器內實施此處理而使 時間軸壓縮的(十分之一取樣的)資料被編碼,並且被解 碼器所時間軸擴展(內插),則可以用spd比值來調整 傳送位元率。 如果傳送速率.爲例如1. 9 75 Kbps並且藉由設 定以雙倍速度來編碼而使s p d = 0 . 5 ,因爲以5秒的 速度實施編碼,而非固有之1 0秒的速度,所以傳送速率 成爲 1. 975x〇. 5 Kbps。 而且,在圖1 8之A中所顯示,在編碼單元5 ·3得到 的編碼參數被內插器5 4以例如3 Om s e c的任意間隔 所內插並重新配置,如在圖1 8之B中所顯示。如在圖 1 8之C中所顯示,在接收器5 6的內插器5 8中2 0 ms e c來內插且重新配置該編碼參數。 經濟部中央標準局員工消費合作社印製 (請先閲讀背面之注意事項再填寫本頁) 如果在解碼器內提供類似的電路模式計劃,則可能恢 復速度至原始值,而同時亦可能以高或低的速度聽到語音 聲音》亦即語音控制可以被用來當作可變的位元率編碼解 碼。 圖式簡述 圖1爲依據本發明第一實施例之語音訊號重現裝置配 置的示意方塊圖。 圖2爲顯示在圖1中所顯示之語音訊號重現裝置配置 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -43 - 4127..9 at _B7___ 五、發明説明() 41 的示意方塊圖* 圖3爲顯不在圖1中所顯狀之語音訊號重現裝置之編 碼器的方塊圖。 圖4爲顯示多頻帶激發(MB E )分桁電路之配置的 方塊圖,該電路當作編碼器之諧波/雜訊編碼電路之說明 例。 圖5圖示說明向量量化器之配置。 圖6係顯示用於有聲與無聲,以及被集合在一起之有 聲和無聲的輸入之平均值的圖表。 圖7係顯示用於有聲與無聲,以及被集合在一起之有 聲和無聲的位權/ II X II之平均值的圖表。 圖8係顯示用於有聲、無聲及被集合在一起之有聲與 無聲的向量量化之碼本的方式之圖表。 圖9爲顯示在圖1中所顯示之語/音訊號重現裝置中所 使用的修改過編碼參數計算電路之示意操作的流程圖。 圖1 0係顯示在時間軸上1由修改過編碼參數計算電 路所得到的修改過之編碼參數的示意圖。 經濟部中央橾準局負工消費合作.社印製 (請先閱讀背面之注意事項再填寫本頁) 圖1 1係顯示在圖1中所顯示之語音訊號重現裝置中 所使用之修改過編碼參數計算電路的詳細操作之流程圖。 圖1 2A、1 2B及1 2C爲顯示修改過編碼參數計 算電路之說明操作的示意圖。 圖1 3A、1 3 B及1 3 C爲顯示修改過編碼參數計 算電路之另一說明計算操作的示意圖夂 '圖1 4爲顯示在語音訊號重現裝置中所使用之解碼器/ 本紙張尺度適用中國國家標芈(CNS ) A4規格(210'乂297公釐) _ 44 一
Claims (1)
- 4 £8008 ^BaD六、申請导利範圍 第8 51 0 9 3 8 3號專利申請案 中文申請專利範圔修正本 民國88年12月修正 請 先 閲 讀 背 之 注 意 事 項 再 寫 本 頁 1 . 一種用以根據藉由將輸入語音訊號細分成在時間 軸上具有預定長度之框並且藉由以框爲基礎來編碼該輸入 語音訊號所決定之編碼參數.來重現該輸入語音訊號的方法 ,該方法包含步驟: .•內插該編碼參數,以便.決定與所需之時間點有關的修 改過的編碼參數;以及 根據修改過的編碼參數來產生在速率方面與該輸入語 音訊號不同的修改過的語音訊號。 2. 如申請專利範圍第1項之用以重現一輸入語音訊 號的方法,其中該修改過的語音訊號被至少依據修改過的 編碼參數來合成正弦波所產生。 3. 如申請專利範圍第2項之用以重現一輸入語音訊 號的方法,其中在內插之前或之後,藉由壓縮或擴展該參 數來改變參數周期。 ' 經濟部智慧財產局員工消費合作社印製 4. 如申請專利範圍第1項之用以重現一輸入語音訊 號的方法,其中藉由在編碼參數中所含的線性頻譜對參數 、音高及殘值(residual )頻譜包絡的線性內插來實施 該編碼參數的內插β 5. 如申請專利範圍第1項之用以重現一輸入語音訊 '號的方法,其中所使用的編碼參數係藉由將輸入語音訊號 的短期預測殘值表示成合成正弦波及雜訊,並且藉由對每 本紙張尺度適用t國國家標準(CNS)A4規格(210 X 297公釐) 418719 | 六、申請專利範圍 一個合成的正弦波及雜訊之頻譜資訊編碼所決定之這樣的 參數。 (請先閱讀背面之注意事項再填寫本頁> 6—種用以重現語音訊號的裝置,在該裝置中,根 據藉由將輸入語音訊號細分成在時間軸上具有預定長度之 框,並且藉由以框爲基礎來編碼該输入語音訊號所決定之 編碼參數、重現輸入語音訊號,該裝置包含: 內插機構,其用以內插編碼參數,以便決定與所需之 時間點有關的修改過的編碼參數;以及 語音訊號產生機構_其根據該修改過的編碼參數來產 生在速率方面與該輸入語音訊號不同的修改過的語音訊號 0 " 7. 如申請專利範圔第6項之用以重現語音訊號的裝 置’其中該語音訊號產生機構藉由至少依據該修改過的編 碼參數來合成該正弦波以便產生該修改過的語音訊號。 8. 如申請專利範圔第6項或第7項之用以重現語音 訊號的裝置,更包含周期改變機構,其位在該內插機構之 上游或下游處,用以壓縮或擴展參數也便改變參數周期。 經濟部智慧財產局員工消費合作社印製 9. 如申請專利範圍第6項或第7項之用以重現語音 訊號的裝置,其中該內插機構對在編碼參數中所包含的線 性頻譜對參數、音高及殘值頻譜包絡實施線性內插。 10. 如申請專利範圍第6項或第7項之用以重現語 音訊號的裝置,其中所使用的編碼參數係藉由將輸入語音 訊號的短期預測殘值表示成合成正弦波及雜訊,並且藉由 對合成的正弦波及雜訊之頻譜資訊編碼所決定之這樣的參 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐〉 -2 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15372395A JP3747492B2 (ja) | 1995-06-20 | 1995-06-20 | 音声信号の再生方法及び再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW412719B true TW412719B (en) | 2000-11-21 |
Family
ID=15568696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW085109383A TW412719B (en) | 1995-06-20 | 1996-08-03 | Method and apparatus for reproducing speech signals and method for transmitting same |
Country Status (17)
Country | Link |
---|---|
US (1) | US5926788A (zh) |
EP (1) | EP0751493B1 (zh) |
JP (1) | JP3747492B2 (zh) |
KR (1) | KR100472585B1 (zh) |
CN (1) | CN1154976C (zh) |
AT (1) | ATE205011T1 (zh) |
AU (1) | AU721596B2 (zh) |
BR (1) | BR9602835B1 (zh) |
CA (1) | CA2179228C (zh) |
DE (1) | DE69614782T2 (zh) |
ES (1) | ES2159688T3 (zh) |
MX (1) | MX9602391A (zh) |
MY (1) | MY116532A (zh) |
RU (1) | RU2255380C2 (zh) |
SG (1) | SG54343A1 (zh) |
TR (1) | TR199600519A2 (zh) |
TW (1) | TW412719B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8255211B2 (en) | 2004-08-25 | 2012-08-28 | Dolby Laboratories Licensing Corporation | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering |
US8417531B2 (en) | 2007-02-14 | 2013-04-09 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US10002621B2 (en) | 2013-07-22 | 2018-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US11996106B2 (en) | 2013-07-22 | 2024-05-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
US6202046B1 (en) | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6188980B1 (en) | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
US6260009B1 (en) | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
JP2000305599A (ja) | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
FR2796191B1 (fr) * | 1999-07-05 | 2001-10-05 | Matra Nortel Communications | Procedes et dispositifs de codage et de decodage audio |
US7092881B1 (en) * | 1999-07-26 | 2006-08-15 | Lucent Technologies Inc. | Parametric speech codec for representing synthetic speech in the presence of background noise |
US6535843B1 (en) * | 1999-08-18 | 2003-03-18 | At&T Corp. | Automatic detection of non-stationarity in speech signals |
JPWO2002058053A1 (ja) * | 2001-01-22 | 2004-05-27 | カナース・データー株式会社 | ディジタル音声データの符号化方法及び復号化方法 |
JP4680429B2 (ja) * | 2001-06-26 | 2011-05-11 | Okiセミコンダクタ株式会社 | テキスト音声変換装置における高速読上げ制御方法 |
US7400651B2 (en) * | 2001-06-29 | 2008-07-15 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
US6907632B2 (en) * | 2002-05-28 | 2005-06-21 | Ferno-Washington, Inc. | Tactical stretcher |
US7523032B2 (en) * | 2003-12-19 | 2009-04-21 | Nokia Corporation | Speech coding method, device, coding module, system and software program product for pre-processing the phase structure of a to be encoded speech signal to match the phase structure of the decoded signal |
ATE406652T1 (de) * | 2004-09-06 | 2008-09-15 | Matsushita Electric Ind Co Ltd | Skalierbare codierungseinrichtung und skalierbares codierungsverfahren |
EP1895511B1 (en) | 2005-06-23 | 2011-09-07 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
JP2007150737A (ja) * | 2005-11-28 | 2007-06-14 | Sony Corp | 音声信号ノイズ低減装置及び方法 |
WO2008108702A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Non-causal postfilter |
JP5190445B2 (ja) * | 2007-03-02 | 2013-04-24 | パナソニック株式会社 | 符号化装置および符号化方法 |
WO2009010831A1 (en) * | 2007-07-18 | 2009-01-22 | Nokia Corporation | Flexible parameter update in audio/speech coded signals |
EP3288034B1 (en) * | 2008-03-14 | 2019-02-20 | Panasonic Intellectual Property Corporation of America | Decoding device, and method thereof |
JP4999757B2 (ja) * | 2008-03-31 | 2012-08-15 | 日本電信電話株式会社 | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 |
CN101582263B (zh) * | 2008-05-12 | 2012-02-01 | 华为技术有限公司 | 语音解码中噪音增强后处理的方法和装置 |
US20100191534A1 (en) * | 2009-01-23 | 2010-07-29 | Qualcomm Incorporated | Method and apparatus for compression or decompression of digital signals |
WO2010111841A1 (zh) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
DK2242045T3 (da) * | 2009-04-16 | 2012-09-24 | Univ Mons | Talesyntese og kodningsfremgangsmåder |
JP5316896B2 (ja) * | 2010-03-17 | 2013-10-16 | ソニー株式会社 | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
KR20160070147A (ko) | 2013-10-18 | 2016-06-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념 |
JP6366706B2 (ja) | 2013-10-18 | 2018-08-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スピーチ関連のスペクトル整形情報を使用したオーディオ信号符号化と復号化の概念 |
CN107369455B (zh) | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN106067996B (zh) * | 2015-04-24 | 2019-09-17 | 松下知识产权经营株式会社 | 语音再现方法、语音对话装置 |
US10389994B2 (en) * | 2016-11-28 | 2019-08-20 | Sony Corporation | Decoder-centric UV codec for free-viewpoint video streaming |
JP6891662B2 (ja) * | 2017-06-23 | 2021-06-18 | 富士通株式会社 | 音声評価プログラム、音声評価方法および音声評価装置 |
CN108899008B (zh) * | 2018-06-13 | 2023-04-18 | 中国人民解放军91977部队 | 一种对空语音通信杂音模拟干扰方法和系统 |
KR101971478B1 (ko) | 2018-09-27 | 2019-04-23 | 박기석 | 차량용 차광막 장치 |
KR102150192B1 (ko) | 2019-04-04 | 2020-08-31 | 박기석 | 차량용 차광막 장치 |
KR20230114981A (ko) | 2022-01-26 | 2023-08-02 | 주식회사 스마트름뱅이 | 차량용 태양광 차단 및 발전 수행 장치 |
CN114511474B (zh) * | 2022-04-20 | 2022-07-05 | 天津恒宇医疗科技有限公司 | 血管内超声图像的降噪方法、系统、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
JPH07117562B2 (ja) * | 1988-10-18 | 1995-12-18 | 株式会社ケンウッド | スペクトラムアナライザ |
JP2823023B2 (ja) * | 1990-09-10 | 1998-11-11 | 富士通株式会社 | リンク配線用マトリクスプリント板におけるコネクタ接続方法 |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
US5479559A (en) * | 1993-05-28 | 1995-12-26 | Motorola, Inc. | Excitation synchronous time encoding vocoder and method |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
US5729694A (en) * | 1996-02-06 | 1998-03-17 | The Regents Of The University Of California | Speech coding, reconstruction and recognition using acoustics and electromagnetic waves |
FR2863874B1 (fr) * | 2003-12-18 | 2006-03-17 | Oreal | Composition demaquillante |
-
1995
- 1995-06-20 JP JP15372395A patent/JP3747492B2/ja not_active Expired - Lifetime
-
1996
- 1996-06-17 CA CA002179228A patent/CA2179228C/en not_active Expired - Fee Related
- 1996-06-17 US US08/664,512 patent/US5926788A/en not_active Expired - Lifetime
- 1996-06-18 MY MYPI96002452A patent/MY116532A/en unknown
- 1996-06-19 ES ES96304568T patent/ES2159688T3/es not_active Expired - Lifetime
- 1996-06-19 SG SG1996010099A patent/SG54343A1/en unknown
- 1996-06-19 DE DE69614782T patent/DE69614782T2/de not_active Expired - Lifetime
- 1996-06-19 MX MX9602391A patent/MX9602391A/es unknown
- 1996-06-19 EP EP96304568A patent/EP0751493B1/en not_active Expired - Lifetime
- 1996-06-19 CN CNB961110422A patent/CN1154976C/zh not_active Expired - Lifetime
- 1996-06-19 AT AT96304568T patent/ATE205011T1/de active
- 1996-06-19 AU AU56054/96A patent/AU721596B2/en not_active Ceased
- 1996-06-19 RU RU96111955/09A patent/RU2255380C2/ru not_active IP Right Cessation
- 1996-06-19 BR BRPI9602835-1A patent/BR9602835B1/pt not_active IP Right Cessation
- 1996-06-20 TR TR96/00519A patent/TR199600519A2/xx unknown
- 1996-06-20 KR KR1019960022517A patent/KR100472585B1/ko not_active IP Right Cessation
- 1996-08-03 TW TW085109383A patent/TW412719B/zh not_active IP Right Cessation
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8255211B2 (en) | 2004-08-25 | 2012-08-28 | Dolby Laboratories Licensing Corporation | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering |
TWI393120B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
US8417531B2 (en) | 2007-02-14 | 2013-04-09 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
TWI396187B (zh) * | 2007-02-14 | 2013-05-11 | Lg Electronics Inc | 用於將以物件為主之音訊信號編碼與解碼之方法與裝置 |
US8756066B2 (en) | 2007-02-14 | 2014-06-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US9449601B2 (en) | 2007-02-14 | 2016-09-20 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US10573334B2 (en) | 2013-07-22 | 2020-02-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US10984805B2 (en) | 2013-07-22 | 2021-04-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US10147430B2 (en) | 2013-07-22 | 2018-12-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US10311892B2 (en) | 2013-07-22 | 2019-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain |
US10332531B2 (en) | 2013-07-22 | 2019-06-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US10332539B2 (en) | 2013-07-22 | 2019-06-25 | Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10347274B2 (en) | 2013-07-22 | 2019-07-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10515652B2 (en) | 2013-07-22 | 2019-12-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US10002621B2 (en) | 2013-07-22 | 2018-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US10593345B2 (en) | 2013-07-22 | 2020-03-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for decoding an encoded audio signal with frequency tile adaption |
US10847167B2 (en) | 2013-07-22 | 2020-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US10134404B2 (en) | 2013-07-22 | 2018-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US11049506B2 (en) | 2013-07-22 | 2021-06-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US11222643B2 (en) | 2013-07-22 | 2022-01-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for decoding an encoded audio signal with frequency tile adaption |
US11250862B2 (en) | 2013-07-22 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US11257505B2 (en) | 2013-07-22 | 2022-02-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US11289104B2 (en) | 2013-07-22 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US11735192B2 (en) | 2013-07-22 | 2023-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US11769513B2 (en) | 2013-07-22 | 2023-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US11769512B2 (en) | 2013-07-22 | 2023-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US11922956B2 (en) | 2013-07-22 | 2024-03-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US11996106B2 (en) | 2013-07-22 | 2024-05-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
Also Published As
Publication number | Publication date |
---|---|
JPH096397A (ja) | 1997-01-10 |
MY116532A (en) | 2004-02-28 |
AU721596B2 (en) | 2000-07-06 |
BR9602835A (pt) | 1998-04-22 |
ES2159688T3 (es) | 2001-10-16 |
EP0751493A3 (en) | 1998-03-04 |
CN1145512A (zh) | 1997-03-19 |
DE69614782T2 (de) | 2002-05-02 |
CN1154976C (zh) | 2004-06-23 |
US5926788A (en) | 1999-07-20 |
AU5605496A (en) | 1997-01-09 |
ATE205011T1 (de) | 2001-09-15 |
EP0751493A2 (en) | 1997-01-02 |
JP3747492B2 (ja) | 2006-02-22 |
TR199600519A2 (tr) | 1997-01-21 |
EP0751493B1 (en) | 2001-08-29 |
CA2179228A1 (en) | 1996-12-21 |
RU2255380C2 (ru) | 2005-06-27 |
KR970003109A (ko) | 1997-01-28 |
BR9602835B1 (pt) | 2009-05-05 |
SG54343A1 (en) | 1998-11-16 |
KR100472585B1 (ko) | 2005-06-21 |
CA2179228C (en) | 2004-10-12 |
DE69614782D1 (de) | 2001-10-04 |
MX9602391A (es) | 1997-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW412719B (en) | Method and apparatus for reproducing speech signals and method for transmitting same | |
JP3557662B2 (ja) | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 | |
JP4132109B2 (ja) | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 | |
EP1262956B1 (en) | Signal encoding method and apparatus | |
EP0770989B1 (en) | Speech encoding method and apparatus | |
EP0772186B1 (en) | Speech encoding method and apparatus | |
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
EP1164579A2 (en) | Audible signal encoding method | |
EP0841656B1 (en) | Method and apparatus for speech signal encoding | |
JP4958780B2 (ja) | 符号化装置、復号化装置及びこれらの方法 | |
WO2004097796A1 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JPH06118995A (ja) | 広帯域音声信号復元方法 | |
JPH1091194A (ja) | 音声復号化方法及び装置 | |
EP1264303B1 (en) | Speech processing | |
JPH10214100A (ja) | 音声合成方法 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH09127985A (ja) | 信号符号化方法及び装置 | |
JPH09127987A (ja) | 信号符号化方法及び装置 | |
JPH09127998A (ja) | 信号量子化方法及び信号符号化装置 | |
KR100682966B1 (ko) | 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치 | |
JPH09127994A (ja) | 信号符号化方法及び装置 | |
JPH09127986A (ja) | 符号化信号の多重化方法及び信号符号化装置 | |
JP2000132195A (ja) | 信号符号化装置及び方法 | |
JPH01258000A (ja) | 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置 | |
JPH08248999A (ja) | 音声符号化復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |