TW412719B

TW412719B - Method and apparatus for reproducing speech signals and method for transmitting same

Info

Publication number: TW412719B
Application number: TW085109383A
Authority: TW
Inventors: Masayuki Nishiguchi
Original assignee: Sony Corp
Priority date: 1995-06-20
Filing date: 1996-08-03
Publication date: 2000-11-21
Also published as: MX9602391A; SG54343A1; BR9602835B1; AU5605496A; CA2179228A1; KR970003109A; EP0751493A3; DE69614782D1; BR9602835A; ES2159688T3; AU721596B2; CN1145512A; ATE205011T1; CN1154976C; EP0751493B1; CA2179228C; JP3747492B2; DE69614782T2; RU2255380C2; MY116532A

Description

A7 _B7 - -__ 五、發明説明（l) 發明背景發明領域 (請先閱讀背面之注意事項再填寫本頁) 本發明係有關於用以重現語音訊號的方法及裝置，其中輸入語音訊號被分成多個單位的框，且根據至少合成當作正弦波形用以重現語音訊號而加以編碼來找出編碼參數。本發明亦有關於用以傳送在內插編碼參數時所得到之修改過的編碼參數之方法》相關技術說明現已知多種應用聲訊之統計特性以壓縮訊號的編碼方法，該聲訊包含時域及頻域語音（speech)訊號及聲音（ sound )訊號，且包含人類聽力系統的心理聲學特性。這些編碼方法可概略分成時域編碼、頻域編碼及分析/合成編碼。經濟部中央標芈局員工消費合作社印聚同時，隨著藉由在時間軸上之訊號處理的高效率語音編碼方法，編碼激發線性預測（CE LP )例證，因爲從解碼器輸出之訊號的處理需很多操作步驟，所以在時間軸的速度轉換（修改）上仍碰到許多困難。另外，因爲在解碼線性範圍中實施速度控制，所以上述方法無法爲例如音高率轉換所使用。因此，本發明的目的在於提供一用以重現語音訊號的方法及裝置，及一用以傳送語音訊號的方法’其中在、一寬廣範圍中，可輕易地實施高品質之.隹...寘速率的速度控制1 而音位及音高仍可維持不變。本紙張尺度適用中國國家楯準（CNS ) A4規格（2丨0X 2们公釐） -4 - 412719 經濟部中央標率局員工消費合作社印製五、發明説明丨（2 ) 本發明 ~. 方 r'i"? 面提供 —，種用以根據藉由分開相關於預先設定之框的輸入語音訊號於時間軸上並且在框的基礎上編碼被如此分開之輸入語音訊號所獲得之編碼參數來重現輸入語音訊號的方法該方法包含內插編碼參數用以找出與所需之時間相關之修改過的編碼參數並且根據所修改之編碼參數來產生速率與該輸入語音訊號不同之修改過的語音訊號的步驟因此在 — 寬廣範圍中可輕易地實施高品質之任意速率的速度控制而音位及音高仍可維持不變 Ο 本發明另 ™- 方面提供 —*· 種用以重現語音訊號的裝置 9 其中輸入語音訊 m 的產生亦根據編碼參數此參數根據藉由分開相關於預先設定之框的輸入語音訊疏於時間軸上並且在框的基礎上編碼被如此分開之输入語音訊號而被獲得該裝置包含用以內插編碼參數來找出與所需之時間點相關之修改 m 的編碼參數並且根據所修改之編碼參數來產生速率與該輸入語音訊號不同之修改過的語音訊號之內插機稱 ΰ 因此其可以調整傳送位元速率 0 在 — 寬廣範圍中可輕易地實施高品質之任意速率的速度控制而音位及音高仍可維持不變 0 本發明又 ~' 方面提供一種用以傳送語訊號的方法 Ϊ 其中編碼參數藉由分開相關於預先設定之框的輸入語訊號於時間軸上當作單位而被找到並且在框的基礎上藉由編碼此分開之輸入語號來找出編碼參數被如此找到之編碼參數被內插以找出與所需之時間點相關的修改過之編碼參數並且傳送所修改之編碼參數而因此致使傳送位元本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -5 - A7 B7 五、發明説明（3 ) 速率之調整。 (請先閱讀背面之注意事項再填寫本頁) 藉由在時間軸上分開相關於預先設定之框的輸入語音訊號，且編碼以框爲基礎的訊號來找出編碼參數，藉由內插編碼參數來找出修改過的編碼參數，以及根據所修改之編碼參數而藉由至少合成正弦波來重現語音訊號，在任何速率下控制速度成爲可能β 較佳實施例說明：請參考附圖，下文將詳細說明依據本發明之語音訊號重現方法及裝置及傳送語音訊號之方法之較佳實施例° 首先，說明重現語音訊號的裝置，其中該裝置應用依據本發明之重現語音訊號的方法及裝置。圖1顯示語音訊號重現裝置1的配置，其中输入語音訊號被分裂成爲預先設定之框來當作在時間軸上的單位，並且根據框來編碼以找出編碼參數。根據這些編碼參數來合成正弦波及雜訊以重現語音訊號。經濟部中央榡隼局員工消費合作社印裝尤其是有了本發明的語音訊號重現裝置1 1內插編碼參數來找出與所需時間點有關之修改過的編碼參數，且根據這些修改過的編碼參數來合成正弦波及雜訊。雖然根據修改過之編碼參數來合成正弦波及雜訊，也可能至少合成正弦波。特別是聲訊重現裝置1包含一編碼單冗2 ’其用以將進入輸入端1 0的語音訊號分成當作單元之框，且用以根據框來編碼語音訊號以輸出編碼參數，例如線性頻譜對（本紙張尺度適用中國國家標準（CMS ) Α4規格（210X297公釐） -6 ~ 經濟部中央標準局員工消費合作社印製 412719 __五、發明説明（4 ) LSP)參數、音高、有聲（V) /無聲（UV)或頻譜振幅Am。聲訊重現裝置1亦包含一計算單元3，其用以內插編碼參數來找出與所需之時間點有_之修改過的編碼參數，及一解碼單元，其根據修改過的編碼參數來合成正弦波及雜訊以输出所合成之語音參數於輸出端3 7。由一控制器（未顯示出）來控制編碼單元2、用以計算修改過之編碼參數的計算單元3及解碼單元6。用以計算語音訊號重現裝置1之修改過編碼參數計算單元3包含一周期修改電路4 ’其用以壓縮/解壓縮每次預先設定之框所獲得之編碼參數的時間軸’且用以修改編碼參數的輸出周期，以及一內插電路5 ’其用以內插周期修改參數以產生與框基時間點有關之修改過的編碼參數’ 如圖2所示者》其後將說明用來計算修改過之編碼參數的計算單元3。首先說明編碼單元。編碼單元2及解碼單元6代表短期預測殘值（r es i dua 1 s )，例如基於諧波編碼及雜訊觀點的線性預測編碼（LP C)殘值。換言之，編碼單元2 及解碼單元6實施多頻帶激發（MB E )編碼或多頻帶激發（Μ B E )分析。隨著傳統的編碼激發線性預測（C E L Ρ )編碼， L P C殘值被直接向量量化成爲時間波形β因爲編碼單元 2以諧波編.碼或MB Ε分析來編碼殘值’可以用較少數目之位元的諧波之頻譜包絡之振幅的向量書化上得到較平滑之合成波形，而同時所合成之L P (：波#的濾波輸出亦具 {請先閱讀背面之注意事項再填寫本f ) 訂本紙張尺度適用中國國家標準（CNS ) A4規格（210 X 297公浚} -7 - 412719 經濟部中央標準局貝工消費合作社印製五、發明説明 ( 5 ) 1 1 高度悅耳的音質 0 此時使用由本發明人在 JP Pat en t 1 1 Koka i Pu bl 1 C at ion J I D _ -A - -6 - 5 ] L 8 0 0中所提 1 1 出之維數轉換的技術或資料數目轉換技術來量化頻譜包絡. 1 \ 的振幅也就是說以預先設定之數巨的向量維數來向量請先閲 \ 1 1 量化頻譜包絡之振幅〇讀背面 1 Ί I 圖 3 顯示編碼單元 2 之配置〇被供應輸入端 1 0的語 I 意 1 音訊號藉由濾波器 1 1 iJE 過濾掉不需要之頻率範圍的訊號 9 事項 1 1 再 1 I 並且隨後被安排路徑至線性預測編碼 ( L P C ) 分析電路填寫，邋、. • ϊ 本 ••一 1 2 及後置濾波電路 2 1 0 ¥ S_^ 1 | L P C 分析電路 1 2 藉由自相關 ( au t 0 —C or re 1 a t i on 1 1 ) 法來應用 Hamm ί ng 窗於輸入訊號波形以其長度爲 1 1 | 2 5 6 個樣本之等級當作一區塊以便找出線性預測係數 1 訂 > 也就是所謂的 a 參數〇當作資料輸出單位的框間隔爲 1 1 1 6 0 個樣本的等級 9 如果取樣頻率例如爲 8 K Η Z，則 1 1 1 6 0 個樣本的框間隔對應 2 0 毫秒〇 1 | 來 L Ρ C 分析電路 1 2 的 a 參數被傳送至 a 到 : L S P 轉換電路 1 3 以便被轉換成線性頻譜對 ( L S P ) 1 1 | 參數〇也就是說被找到之當作直接型濾波係數的 α參數 1 I I 被轉換成例如 1 0 個也就是爲 5 對 L S P 參數 0 使用例 1 ；| 如 Ne W 陽 Rap h s on 來貢施此種轉換 0 a 參數被轉換成 1 L S P 參數的原因爲在內插特性上 L S P 參數優於 a參數 I I 0 來白 a 到 L S P 轉換電路 1 3 的 L S P 參數藉由 1 I L S P 向量量化器 1 4 而被向量量化〇可在進行至向量量 1 1 1 本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） 412719 經濟部中央標準局員工消費合作社印製五、發明説明（6 ) 化之前找到此時之介於框間的差值。換言之，複數個框可以被收集並且藉由矩陣量化而被量化。爲了量化’每2 〇毫秒所計算的L S P參數以每一個框使用2 0毫秒的方式而被向量量化9 係L SP向量量化的索引之來自L S P向量量化器 1 4的量化輸出在端點1 5處被取出》該量化的L S P向量被安排路徑至L S P內插電路1 6。 L S P內插電路1 6內插每2 0毫秒被向量量化 L.S P向量用以提供8倍速率（eight fold rate).。亦即，LSP向量被組構成每2. 5毫秒被更新一次。其原因在於如果透過MB E編碼/解碼法而以分析/合成來處理剩餘的波形，則所合成之波形的包絡呈現極平滑的波形，使得如果L P C係數每2 0毫秒劇烈地改變一次’則易於產生怪異的聲音。如果LPC係數每2. 5毫秒逐漸地改變，則可防止怪音的產生。爲了茌該2. 5毫秒之間隙處使用LSP向量來後置濾波輸入語音，而因此被內插，LSP參數藉由LSP到 α轉換電路17而被轉換成其例如10階之直接型濾波器之係數的a參數。L S Ρ到α轉換電路1 7的輸出被安排路徑至後置濾波電路21以便使用以2. 5毫秒之間隔速度所更新之α參數來做後置濾波用以產生平滑的輸出。後置濾波電路2 1的輸出被安排路徑至諧波/雜訊解碼電路 2 2，尤其是一多頻帶激發（ ΜΒΕ)分析電路。 \/諧波/雜訊編碼電路2 2 (MB Ε分析電路）藉由與 (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標率（CNS ) A4規格（2丨OXM7公釐） -9 - 經濟部中丧標隼局員工消费合作社印製 A 7 B7 —-- ---- - - ——-- _«- - _____ -- 五、發明説明（7 ) mb E分析相似的方法分析後置濾波電路2 1的輸出。亦即，該諧波/雜訊編碼電路2 2偵測音高並且計算各諧波的振幅Am。諧波/雜訊編碼電路2 2亦執行有聲/無聲辨識，且藉由維數將隨音高而改變之諧波的振幅Am之數字轉換成固定數字。對於音高偵測而言，對音高偵測使用輸入L PC殘值的自相關（於下文中說明）。現請參考圖4，多頻帶激發（MB E )編碼的分析電路之說明例，當作諧波/雜訊編碼電路2 2，將於下文中說明。有了 MB E分析電路，如圖4所示，模型之設計係根據在同一時間點的頻帶中，亦即同一區塊或框中存在一有聲部分及無聲部分的假設。來自後置濾波電路2 1之線性預測編碼（L P C )的殘值或L P C殘值被饋送至圖4的輸入端1 1 1。因此 MB E分析電路執行MB E分析，並且對輸入L P C殘值編碼。進入輸入端111的LPC殘值被送至音高提取單元 1 3、框取單元1 1 4及次區塊功率計算單元120，這些單元將於下文中說明。因爲輸入至音高提取單元_1 1 3者爲L P C殘值，所以可藉由偵測殘值的自相關的最大值來執行音高偵測。音高提取單元1 1 3藉由開放迴路搜尋來執行音高搜尋。所提取的音高資料被安排路徑至其中藉由封閉迴路音高搜尋來執行細微的音高搜尋單元1 1 6。 ^^^適用中國國家標準（〇~5)六4規格（210'<<297公釐） '~" -10 - (請先閲讀背面之注意事項再填寫本页) 訂經濟部中央標導局買工消費合作社印掣 412719 A7 _B7_ 五、發明説明（8 ) 框取單元11 4應用預設之框取功能’例如Hamming 窗，至每一個N個樣本區塊，用以依序沿時間軸以L個樣本框之間隔移動所框取的區塊。來自框取單元1 1 4的時域資料串被一正交轉換單元以例如快速傅立葉轉換（ F F T )來處理。如果在發現區塊中的總頻帶爲無聲的（U V )，則次區塊功率計算單元1 2 6提取一表示區塊之無聲訊號之時間波形的包絡的特性量。精微音高搜尋單元116被饋送入由音高提取單元 1 1 3所提取的整數數目之概略音高資料以及由正交轉換單元1 1 5以F F T所產生之頻域資料。精微音高搜尋單元11 6藉由以大約概略音高.資料數值之〇. 2至0. 5 的間隔內的土幾個樣本來產生擺動當作用以驅動至具有最佳之小數點（浮點）的精微音高資料的中心°精微捜尋技術使用由合成方法所做的分析並且選擇音高.，此音高在分析時可給予最靠近原始功率頻譜之功率頻譜的功率頻譜。也就是說，在由音高提取單元1 1 3發現之在當作中心之概略音高上下的一些值被提供在例如〇_ 25的間隔處β對於這些彼此間差別很小的值而言，可找到誤差的總和在此情況下，如果音高被設定，頻寬被設定’ 而使得對頬域資料和激發訊號頻譜，使用功率頻譜來找到誤差，因此，可以找到總頻帶的誤差和m ’對每一音高值找到此誤差和厂™，並且選擇對應至最小誤差和的音高作爲最佳音高。因此藉用精微音高搜尋單元來找到本紙张尺度適用中國國家標準（CNS ) A4規格（2丨0X 297公釐） C請先閱讀背面之注意事項再填寫本頁) 訂 - 11 一 412719 經濟部中去標準局貝工消费合作社印掣

五、發明説明（9 ) 具有例如0 . 2 5的音高的振幅 A 來計算振幅值。在上文對精微音的。但是，因爲在Μ 爲其中無聲區出現於得需要對各頻帶產生來自精微音高搜用振幅計算單元1 1 有聲/無聲辨識單元 1 1 7中，對各頻帶此辨識而使用雜訊對此時•因爲根據亦即諧波的數目，視的範圍中，所以在每在各頻帶中變動。因固定頻寬的頻帶分類辨識的結果變差》尤 4000Hz的預設 1 2個頻帶，而且以 N S R值之加權平均以來自正交轉換尋單元1 16的精微 118V的振幅 A 間隙之最佳精微音高，而且決定最佳藉由有聲用振幅計算單元1 1 8 V 高搜尋的說明中，假設總頻帶爲有聲 B E分析/合成系統中所使用的模型頻率軸上在相同的時間點處，所以變有聲/無聲的辨識。尋單元116的最佳音高及來自有^ 8 V之振幅 1 1 7中，4該有的資料被饋送荽聲/無聲辨識單？6 實施介於有聲與無聲之間的辨識，_ 信號比（N S R ) » 基本音高頻率所分裂之頻帶的數目’ 聲音的音高而變動於從大約8到6 3 一頻帶中之V/U旗標的數目同樣地此在本實施例中，對每一預設數目之集合V/U辨識的結果或者使ν/ϋ 其是包含聲頻範圍之例如0至頻率範圍被分成ΝΒ個頻帶，譬如預設之臨界值T h 2辨識每一頻帶之值來判斷頻帶到頻帶的V/ UV。單元1 1 5的頻域資料，來自音高搜音高資料，來自有聲用振幅計算罩元以及用來自有聲/無聲辨識單元本紙張尺度適州中國國家標準（CNS ) A4规格（210x297公釐） (讀先閱讀背面之注意事項存填寫本X〕 ir -12 - 412719 經濟部中央摞华局月工消費合作社印掣五、發明説明（10 ) 1 1 7的有聲/無聲（V/UV)辨識資料饋入無聲用振幅計算單元1 1 8U °無聲用振幅計算單元1 1 8U藉由產生振幅重新計算的效果而爲經由有聲/無聲辨識單元 1 1 7所找到爲無聲（U V )的頻帶再次找到振幅。無聲 .用振幅計算單元1 1 8 U爲發現係有聲（V)的頻帶直接輸出來自有聲用振幅計算單元lj 8V的輸入值》來自無聲用振幅計算單元118U的寶料被饋送至資料數目轉換單元1 1 9，其爲一種取樣速率轉換器。資料數目轉換單元119考慮從頻譜所分開之頻帶的數目和資料的數目，最重要的是與音高不同之振幅資料的數目’.而被使用來致使資料的數目固定。也就是說’如果有效的頻率範圍上達例如3 4 0 OKHz，此視音高的情況而被有效的頻率範圍分成8至6 3個頻帶’使得包含UV頻帶之振幅 Affl uv之振幅資料 Am 的資料數目mMX+l在 8至6 3的範圍內改變。因此資也數目轉換單元1 1 9將具有可變之資料數目m MX + 1轉換成固定的資料數目Μ ’ 例如4 4 6 資料數目轉換單元119將從一區塊中的最後一個資料到該區塊中的第一個資料內插數值用以放大資料的數目至Νρ·，這樣的假性資料附加至相對於頻率軸上的一個有效區塊之振幅資料。然後，資料數目轉換單元1 1 9以過取樣取率Os，例如8，來執行頻寬限制型過取樣，用以找出0 S折之數目的振幅資料。此〇 S折數目（（m MX+ 1 )x 〇s)的振幅資料被線性內插，以產生仍爲較大數目 (請先閱讀背面之注意事項再填莴本頁) 訂本紙張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐） -13 - 412719 五、發明説明（11 ) Ν μ之資料，例如2 0 4 8個資料。數目Ν μ的資料被減去十分之一用以轉換成預設之固定的數目Μ，例如4 4個資料。 (請先閱讀背面之注意事項再填寫本頁) 爲了向量量化，來自資料數目轉換單元1 1 9的資料 (具有預設之固定.數目Μ的振幅資料）被送至向量量化器 2 3以提供資料數目爲Μ的向量，或者被組合成具有預定之資料數目的向量》來自精微音高捜尋單元116的音高資料經由轉換開關2 7之固定端且_而被送至輸出端2 8。此技術被揭示於 J P Patent Application No. 5—185 32 5 ( 1 9 9 3 )中，如果區塊中的總頻帶爲無聲的（UV)而因此音高資訊變得不需要時，此技術包含將表示代表無聲訊號之時間波形的特性值的資訊切換成音高資訊。經濟部中央標率局員工消費合作社印製藉由處理N，譬如2 5 6，個樣本之資料來得到這些資料。因爲區塊在相關於上面所述之L個樣本的框當作一個單位的時間軸上前進，所以獲得以框爲基礎之所傳送的資料《也就是說，在框的時間期間更新音高資料、V/U 辨識資料及振幅資料。當來自V/UV辨識單元1 1 7的 V/UV辨識資料，使用其頻帶的數目已經被減少或降低至1 2的資料，或者使用指定在整個頻率範圍中介於有聲 (V)與無聲（UV)區域之間之界限的一個或多個位置的資料係可能的，換句話說，頻帶的總數可以由V及U V 的其中之一來代表，或者可以用框爲基礎來實施V/UV 辨識* 本紙浪尺度適用中國國家標準（CNS > A4規格（210'乂297公釐） -14 - 412719 A7 B7 五、發明説明（l2 ) 如果發現整個區塊爲無聲的（uv)，那麼一個例如有2 5 6個樣本的區塊可被細分成多個次區塊，每一個次區塊包含例如3 2個樣本，其被傳送至次區塊冪次計算單元 1 2 6。次區塊冪次計算單元1 2 6計算在區塊中全部樣本，例如2 5 6個樣本，的平均冪次或均方根值（RMS值）對在每一個次區塊中每一個樣本的平均冪次或均方根值的比例或比值。也就是說，如果找到例如第K個次區塊的平均冪次，及本整個區塊的平均冪次，就能計算整個區塊之平均冪次與第K個次區塊之平均冪次p(k)之比值的平方根。如此所找到的平方根值視爲預設維數之向量，以便在向量量化器1 2 7中執行向量量化，該向量量化器被配置在相鄰於次區塊冪次計算單元。經濟部中央標率局員工消費合作社印1Ϊ -----—、----— (請先聞讀背面之注意事項再填寫本頁) 向量量化器12 7產生8維8位元之直向量量化（碼本大小爲2 5 6 )。用於此向量量化的輸出索引UV-3E ，亦即一代表性向量之碼，被送至轉換開關2 7之固定端上_。對轉換開關2 7的固定端1被饋以來自精微音高捜尋單元1 1 6的音高資料，而同時轉換開關2 7的輸出被饋至輸出端2 8。轉換開關2 7具有其切換由來自有聲/無聲辨識單元 1 1 7之辨識輸出訊號所控制，使得轉換開關2 7的可移動接點分別當在區塊中至少有一頻帶被發現爲有聲（V ) 時被設定至固定端且以及當全數的頻帶均被發現爲有聲本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -15 - 41271¾ A7 .. _B7__ 五、發明説明（13 ) 時’被設定至固定端 (請先閱讀背面之注意事項再填寫本頁) 因此以次區塊爲基礎之標準化RM S值的向量量化輸出藉由被插入一原來被用來傳送音高資訊之凹槽而被傳送。亦即，如果區塊中的全部頻帶被發現爲無聲的（DV) ’不需音高資訊，使得只有來自V/UV辨識單元1 1 7 之V/UV辨識旗標被發現全部爲UV時，傳送向量量化輸出索引以取代音高資訊。轉回圖3，下文說明向量量化器2 3中頻譜包絡（ A m )的加權向量量化。向量量化器2 3爲一二級L維，例如4 4維，之配置。亦即，爲4 4維且具有碼本大小爲3 2之來自向量量化碼本之輸出向量的總和被乘上增益g i，而且最終的乘積被用來當作4 4維頻譜包絡向量1之量化值。參考圖5， CBO、CB 1表示二形狀碼本，其輸出向量分別爲_§_〇 i 及玉_υ，其中，j客3 1。增益碼本CBg的輸出爲gi，其爲純量值，其中〇^1 S3 1。最後輸出變成 S i ( X + ,)。經濟部中央標率局貝工消費合作社印來在L P C殘值之MB E分析上所得到並且被轉換成預設維度的頻譜包絡Am被設定爲爲I。如何有效地量化1 係相當重要。量化誤差能量E定義爲 E = iW{H^ ~ Hg,(%i + 8υ)}ΒΖ =J[WH (ϋ - gt (s^. + s,j) }D 2 其中H及W分別代表在L P C合成濾波器之頻率軸上本紙張尺度適用中國國家標隼（CNS ) A4規格（2i〇X 297公釐） Μ Β7 五、發明説明（14 ) 的特性和用以加權在頻率軸上之聽覺加權的代表特性之矩陣量化誤差能量藉由自下式之頻率特性取樣對應之L維例如4 4維的點而被找到。 H{z) (2) 其中ai，而1 S i gp，表示藉由分析目前框之 L P C所得到的α參數。爲了計算，相鄰於1被填塞0，而有 ........... I» ’ 0，0，Q，…*.....，0以提供例如 256點資料。然後執行256點的FFT，並且對對應於〇〜；r的點計算（r e2 + I ) m的值。接著，找到所計算之值（r β2+ I：的倒數並且減去十分之一至例如4 4點。給定一矩陣，其對角線元素對應這些倒數〇該矩陣如下： ---^丨 J---1"! (讀先閱讀背面之注意事項再填寫本頁) -T -39 \h{\) 經濟部中央標隼局負工消費合作社印裝 Η·- 0 心） λ(〇] 給定聽覺加權矩陣W如下 1+Σ «ιλέζ-·1 W(z) ...(3) 本紙張尺度適用中國國家標隼（CNS > A4規格（21 Ox 297公釐） -17 - A7 B7 413719 五、發明説明（15 ) 其中oti爲輸入之L P C分析的結果，而；ίβ，；\_13爲常數 ♦ 使得 9 經由示例 } λ & - =0 . 4 及 λ b = 0 9 ^ 可從式 ( 3 ) 的頻率特性中找到矩陣W » 經由示例，提供 1 > a !; 1 \ ) ► 0L 2 λ b 2 r • ，α ρ λ b P 1 • 0 , 0 > • 0 來給定 2 5 6 點的資料，其中執丨行· F F T以找到 ( r 2 & C i + I 2 m C i ) 1 /2，其中 0 ^ i i ^ 1 2 8 "〇然後 t 提供 1 » a 1 λ £ 1 > α ζ λ a 2 } ， a ΙΪ X C 1 P 1 0 1 0 * 0 並且應用2 5 6 點之 F F T 在 0 It 的範圍內之 1 2 8 點處來計算分子的頻率特性。最終值爲 ( r } e Ξ C i 〕 + I m 1 2 C i 3 ); 1/2 y 0 ^ i S 1 2 8 0 上式（3)的頻率特性可從下式找到： … /re2 [i] +Jni2 [i] w [二]H — VTe^TiTTi^vMTr 其中 i έΐ 28 經濟部中央摞隼局員工消費合作社印32 藉由下列用於例如4 4維向量之對應點的方法可找到頻率特性》雖需使用線性內插以得到更準確的結果，但在下例中卻使用最近點之值予以取代，亦即 ω [i] =ω0 [nint(128i/L)] 其中IS i SL·，且n i n t (x)爲一送回一最接近χ 的整數之函數。至於Η，以相似的方法找到h ( 1 ) ，h ( 2 )， . . .，h ( L )，亦即本紙張尺度顧中酬家鱗（CNS )順格Πιο x 297公釐) * —18 - 4^2719· A7 B7 五、發明説明（l6 H = Ά(0 心) 0 ,F = 'w(l) 0 w(2) 使得 0 h{L\ 0 ’ vv(L). WH= A(2)w(2) 0 …(4 ) . 0 h{l)w{L) 做爲一修改實施例，在首先找到Η (Z) W (Z)之後可找到頻率特性，用以減少F F Τ運算的次數。亦即：户 . 1 + 2 ce； ζ (請先關讀背面之注意事項再填寫本頁) …⑸ 經濟部中央標準局員工消費合作社印製 H{z)w{zy 式（5)之分母展開成： I ρ γ p ^ ip 11-fZa/i'' ||l + 2ci[AaZ ' -l+^0tz~' I ''-l 八“丨 )f-丨藉由設定 l，；31，ie2，...b2p，〇，〇, ...，Ο，形成例如256點的資料。然後，執行 2 5 6之F F Τ來提供振幅的頻率特性，使得 imsii] ^re· ·2 Vi] 其中〇 S i S 1 2 8。由此，下式 wh〇[l 一 . 成立，其中OSi客128 本纸張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐） -19 - 412719 A7 B7 五、發明説明（） 17 對L維向量的每一個對應點找到其值^如果f F T的點數少，那麼應可使用線性內插*但在此使用最接近之值，亦即 wA[ / j= wh〇 n mt rl28 給定以最接近之值作爲對角線元素的矩陣W"爲： wA⑴ 〇 wA(2) W,: …(6) Ο ^h{l) 上式（6)與式（4)爲相同之矩陣》使用此矩陣，亦即加權之合成濾波器的頻率特性，式 (1 )被改寫成： E·- +I1；))|| ---(7) (請先閲讀背面之注意事項再填寫本頁) 訂· 經濟部中央標準局員工消費合作社印製下面說明形碼本及增益碼本之學習方法。首先，對於所有選擇與C B 0有關之碼向量玉的框，夹真的期望值被最小化，如果有Μ個此種框，其足以使下式達最小 Μ 在此式（8)中，W’ K、x’ 1：、运1£及互^1£表示對第Κ個框的加權、對第Κ個框的輸入、第Κ個框的增益及用於第Κ個框之碼本CB1的輸出。爲了使式（8 )最小化本紙張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐） —20 - 民國88年12月修正五、發明說明（18 ) (心 +〜))}γ- 2{ijw；rwi zk-2§M (iL +ώ )w*rwix*

M '^gl G« +ιϊ* )wirwt

M =T7 2{i JwirW* Xk- 2gt (l« TsJk V*rWi Λ J. M kA+gl +2gl l^W；rW； llk - = — Wjt Wa 汐立 M Jc_l+2^J w7 w* iu }e〇 ---(1°) 所以 2Gjt wir wi wir Wa iu

My 2 ^w；r w 並且因此 S* W^Wjt} ' ' (11) 其中丨}-1表示反矩陣以及WK· T表示wK’的轉置矩陣 \ (請先閱讀背面之注意事項再填寫本頁) d 0 a— 111— ilmn — —.^^v 經濟部智慧財產局員工消費合作社印製其次，考慮增益的最佳化。藉由解下式而得爲了第k個框選擇增益之碼字元g 的失真之期望值Js。我們得到本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐） -21 - 412719- A7 ——------：_：---—- 五、發明説明（） 19 JL W f (請先閲請背面之注意事項再填寫本頁) +^,〇v/；rw; 〇：σ* +i[Jk)} (i 〇k ·*"λ3[^ }w^ Wj6 Ci a* IA )~ 0

Af A, 2 2L, w/ wi Ctoi +I,J= 2 ge (^〇rt +.S：rOw；rwiGL0, +llk) Λ-1

I

tU 2 2L* W；rv/i (l〇i +l[k) gc^^r7Z-：--…(L2) 3 K)w,wiCie，。上式爲形互_〇i、_§_Ϊ1及增益g i給定最佳的質心條件，其中OSi客3 1，亦即一最佳解碼輸出。在替_§_^找到最佳之解碼輸出的情況下可以爲玉_14找到最佳的解碼輸出。. 其次，考慮最佳之編碼條件（最接近的鄰近條件）。爲了量測失真，亦即Ε = || W， ( X - g 1 C S_〇i + 經濟部中央樣準局員工消費合作社印製 S_〇 i ) ) « 2而使式（7 )達最小之形_§_〇 i、玉^ i被浃定在每次當爲每一個框給定輸入及加權矩陣W ’時。固有地，爲 giCOSISSI) > S_〇! ( 0 ^ i ^ 3 1 )及呈^ ,· ( 0 S j S 3 1 )的所有組合找到E ’亦即成循環方式（r 〇 u n d r 〇 b i n f a s h i ο η )的 3 2 X 3 2 X 3 2種組合，以便找到一組可給定最小E值的gi、 S_〇i ，,·，。但是，因爲這將導致大量的算術運算，所以編本紙張尺度適用中國國家標準（CNS > A4規格（210 X297公釐） '^ -22 - A7 B7 412719 五、發明説明（） 20 碼單元2爲形及增益執行序向搜尋。爲玉_〇 i及互^ 的3 2 X 3 2 = 1 0 2 4實施循環捜尋。在下文中爲簡化起見將 i + 立„1 i 寫成卫_111。爲了更進一步簡化，上式可寫成 E=|W， ( - g ! ( s m )丨2,藉由設定以及_i_w = W ’ s m，我們得到： (13) (請先閱讀背面之注意事項再填寫本頁) ^-IUv|i' +[U„ir III JIN' IU-Γ (14) 可以用經濟部中央標準局員工消費合作社印製因此，假設可確定對^::值有足夠的精準度兩個步驟來實施搜尋：

(1 )搜尋使下式最大化之s W 及 (2 )搜尋最接近於下式之 XT :2..,. 如果使用原來的表示法重寫上式，可以用兩個步驟來實施搜尋：本紙張尺度適用中國國家榇準（CMS ) A4規格（21〇χ297公釐） -23 - 412719： A7 —____；_二五、發明説明（） 21 (1 ) ’搜尋一組！_〇 i、玉一 ϋ *其使下式最大化 XTW'TW' B妒(W 卩 ...（15) (2)1搜尋最接近於下式之gl XTW' TW' (•S/Sij、_ HW. (£〇，、) Is 式（15)給定最佳的編碼條件（最接近的鄰近條件 )。使用式（11)及（12)的質心條件，以及式（ 1 5 )的條件，可以藉由廣義的Lloyd演算法（G L A )來同時訓練碼本CB〇' CB1及CBg。參考圖3，經由轉換開關2 4將向量量化器2 3連接至有聲用碼本2 5 V，以及連接至無聲用碼本2 5 U。藉由仰賴來自諧波雜訊編碼電路2 2的V/UV辨識輸出來控制轉換開關2 4的切換，使用有聲用碼本2 5 V和無聲用碼本2 5 U分別對有聲及無聲執行向量量化。碼本依賴對有聲（V) /無聲（UV)的判斷而切換的原因在於，因爲在依據式（11) 、（12)之計算新經濟部中央標準局員工消費合作社印製的質心中執行加權之W 1£及2 1的平均，所以不希望在數值方面有顯著差別的w g i做平均。此時，編碼單元2使用被输入1的模方（η 〇 r m ) 所除的W — 亦即在式（1 1 ) 、（12) 、（ 1 5 )的處理方面事先以/ II HI代替。當介於兩碼本之間的切換視ν/UV辨識而定時，訓練資料爲有聲用碼本及無聲用碼本做準備而自個別的訓練本紙張尺度通用中國國家標举（CNS ) A4規格（210X297公釐） ' -24 - 412719 A7 _ B7 五'發明説明（） 22 資料被以類似的方式分布。爲了減少ν/UV的位元數，編碼單元2使用單頻帶激發（SBE)，而且將一指定框視爲一有聲（V)框及 —無聲（UV)框，如果V的比率分別超過5 0 %或者其他。圖6、7顯示有聲用、無聲用以及有聲與無聲之組合用輸入2L的平均值W ’ / || HI和加權的平均值，亦即不必管介於有聲及無聲之間的差別處》由圖6可以看到*雖然介於ϋ及UV間之增益（ IIHI )的平均值係幾乎不同的，但是在頻率軸上2L其本身的能量分布則並不隨V及U V而幾乎相同。但是，從圖 7中明顯可知加權之形狀在於V及U V 1之間不同，並且加權係對V之低範圍比對U V之低範圍增加其位元指派這樣的一種加權0這說明了藉由對V及UV分開訓練來獲得較高性能之碼本公式的可行性。經濟部中央標準局員工消費合作社印製圖8顯示對三種示例的訓練方式，亦即對有聲（V) 、無聲（UV)以及對被組合在一起的有聲與無聲。也就是說，在圖8中的曲線I、、及分別代別具有曲線i '上__、_£_之終端值爲3_ 72、7· 011和6_ 25之僅對V，僅對UV以及對被組合在一起的V和UV之訓練方式。，從圖8中看到V用碼本及υ V用碼本之訓練的分開導致減小之輸出失真的期望值。雖然帶有僅ν之曲線t 之期望值的狀態稍微變差，但是就整體而言’期望值被改本紙張尺度適用辛國國家標準（（：泌）八4規格（210父297公釐） 412719 Λ7 A 7 ___, ._Β7_ 五、發明説明（） 23 (請先閲讀背面之注意事項再填寫本頁) 善，因爲V用領域長於UV用領域。經由V及uv之發生的頻率之示例，對長度爲1之僅V用及僅UV用之領域長度的量測值爲0. 538及0. 462。因此，由圖8之及立_的終端值，得到總失真的期望值爲 3. 72x0. 5 3 8 + 7. 0 1 1 x 0. 4 6 2 = 5 . 2 4 其表示與被組合在一起之V及UV訓練用的6. 25之失真的期望值相較之下有大約0. 76dB的改進。從訓練的方式判斷，在期望值方面的改進約0. 76 dB的等級。但是，已經發現如果爲一情況找尋SN比值 (S.N R )來處理在訓練集之外的四個男回答者及四個女回答者的語音樣本，在該情況中，沒有實施量化，分開成 V及UV致使在分段SNR方面的改進爲1. 3dB的等級，其原因爲假定V的比值明顯地高於UV的比值。經濟部中央標準局員工消費合作社印製須知當被向量量化器2 3而爲向量量化用之聽覺加權所使用之加權W’正如由上式（6 )所定義的同時，考慮暫時遮罩之加權W'可以藉由找到考慮過去的W |之目前的加權W -而被找到。至於在上式（6)中之wh(l) ，wh(2)， .........w ti ( L )，那些在時間JL月ί計算的值，也就是對第η個框，被表示成w h n ( 1 ) ，w h η ( 2 ).......... -w h n ( L )。考慮在時間卫_之過去值的加權被定義爲An(i)，本紙張尺度適用中國國家襟準（CMS ) A4规格（210X297公釐） -26 - 經濟部中央標準局員工消費合作社印製 412719 A7 _ B7 五、發明説明（） 24

1 芸 i S L ，貝(J Αη(ι) = λΑη„,(ι) + (1-X)whn(i) (whn( i) < An.,( i )) =whn⑴ (whn(i) > An.,(i)) 其中λ可以被設定而使得例如〇. 2，An( i )，其中 lSigL ·可以被用來作爲矩陣之對角線元素，其被用來當作上述的加權。 \回到圖1，現在說明修.改過之編碼參數計算單元3。語音訊號重現裝置1快速地經由修改過之編碼參數計算單元3修改從編碼單元2輸出之編碼參數，並且經解碼單元 6解碼修改過的編碼參數，以便以兩倍於即時速度的速度重現固態記錄的內容。因爲音高和音位維持不變，縱使是一較高的重放速度，錄音內容仍能夠被聽到，即使以一上升的速度來重現該錄音內容。因快速修改編碼參數，修改過之編碼參數計算單元3 不需處理其後的解碼及輸出，並且能夠以相似的演算法很容易地應付不同的固定速率。參考圖9及圖11的流程圖|現在詳細說明語音訊號重現裝置1之修改過之編碼參數計算單元3的操作。修改過之編碼參數計算單元3係由周期修改電路4、內插電路 5所組成，如參考圖2所做之說明。首先，在圖9的步驟1時*將如LSP、音高、V/ UV或 Am的編碼參數經由輸入端1 5 、28、29、 2 6饋入周期修改電路4 <設定音高爲Pch( η]，設定本紙張尺度ίϊ用中國國家標準（CNS ) Α4規格（210X297公釐） " -27 - ----^---；----::)------訂----^----^::,r (請先閱讀背面之注意事項再填寫本頁) 經濟部中央標準局員工消費合作社印製 412719 A7 _. '_B7_ 五、發明説明（） 25 V/UV 爲 VUv〔n〕，設定 Am 爲 a '〔η〕〔1〕，以及設定LSP爲l3P〔n〕〔i〕。藉由修改過之編碼參數計算單元3所最終計算的修改過之編碼參數被設定爲 mod_PCh〔m〕，rnod_vuv〔m〕> mod_ara〔m][l〕，及 mod— 1SI1〔 m ] 〔i〕，其中丄_表示諝波的數目，1_表示LS P的階數，而卫_、 m_對應至分別依序對應於在時間軸轉換前後之時間軸的索弓[,。此時，0 < η<m<N2，而且、m的每一個爲具有例如2 〇m s e c之框間隔的框索引。如上所述，丄_表示諧波的數目。在恢復諧波的數目至對應於諧波之實際數目的Am〔η〕〔1〕之後以執行上面的設定，或者亦可在Ara〔n〕C 1〕.的狀態中3 ( 1 =0至4 3 )執行上面的設定。亦即，可以在由解碼器解碼之前或之後執行數目資料的轉換》在步驟S 2時，周期修改電路4設定對應於原始時間長度之框數爲Νι，而同時設定對應於改變後時間長度之框數爲Ν2。然後，在步驟S 3時，周期修改電路4在時間軸上壓縮1^1的語音至Ν2語音。亦即由周期修改電路4 所壓縮之時間軸壓縮的比值s pd被發現爲Ν2/Νι。然後，在步驟S 4時，內插電路5設定對應至依序對應於在時間軸轉換之後的時間軸索引之框數的里_爲2 » 然後，步驟S 5時，內插電路5找到兩.個框fI•。和 fn，及介於兩框fr。和fri與m/s p d之間的差’

左•及·右’*如果編碼框pCh、vuv、A„^lsr^W 本紙張尺度適用中國國家標準（匚阳）八4^見格（210乂297公釐） ' -28 - (請先閲讀背面之注意事項再填寫本頁) -*

I A7 B7 412719 五、發明説明（） 26 *表示，則mo d — *〔m〕可以用通式表示 mod —氺〔m〕= *〔m/spd〕其中〇Sm<N2。但因m/s p d不是整數，所以用於 m/ s p d的修改過之編碼參數藉由內插自f L m/ S p d和frl = f〇 + 1的兩個框而被產生。須知在圖 1 0中所顯示之介於框m/s p d及框frl之間的關係，亦即關係：左= m/ spd-fr〇右=fri-m/s p d 成立· 經濟部中央標準局員工消費合作社印製在圖1 0中之用於m/s p d的編碼參數，亦即修改過的編碼參數，如同於步驟S時所顯示由內插所產生。可簡單地藉由線性內插找到修改過的編碼參數，該線性內插爲 mo 〔m〕= * 〔 fr〇〕X 右十 *〔 f Γ 1〕x 左但如果隨著介於f 和之間的內插*就V/UV 而論，此二框不同，亦即如果兩框中的一框爲V，而另一本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -29 - 經濟部智慧財產局員工消費合作社印製 412719 B7 五、發明說明（27 ) 框爲UV，則不可以應用上面之逋式》因此，如在圖 11之步驟Sll ff_·中所示，內插電路5修改找尋與這兩框f „及f 有聲和無聲的特性有關之編碼參數的方式。首先判斷有關是否兩框f 及f 爲有聲（V )或無聲（UV) *如果發現框fr。及于^均爲有聲（V)，那麼程式轉移至所有的參數被線性內插於其中的步驟_ S 1 2 ..v而且修改過之編碼參數被_示成：. mod_pch[m] = pch[ff0]xright + pch[frl]xleft mod_am[m][l] = am[fr〇] [1 ]xright + am[frI] [1 ]xlef t 其中0 S 1 <L ·須知L表示能夠被拿來當作諧波之最大可能的數目，並且* 0 >被填充於其中沒有諧波之a„〔 η〕〔1〕之內。如果介於框fr0及之間的諧波數不同，則在執行內插時，副諧波的數值被假設爲0。如果在通過資料數目轉換單元之前，L的數目可以被固定在例如 L = 43，且 0S1CL- * 另外*修改過之編碼參數亦可被表示成 mod— lsp〔m〕〔i〕=lsp〔f Γ〇〕〔 i〕x 右 +lSP〔：frl〕〔i〕x 左其中OS i< I且I表示LSP之階數而通常爲10，以及 mod 一 vuv〔m.〕=1 A7 0 I 1 n n n n ·1 u * n (請先閱讀背面之注f項再填寫本頁) 訂. --線- 本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐〉 -30 - 412719 A7 B7 五、發明説明（ 28 須知在有聲/無聲辨識方面，1及〇分成表示有聲（ v )及無聲（ϋ V )。如果在步驟s 1 1時判斷兩框fr。及皆非有聲（ v )，則給定與在步驟S 1 3時所給定之相似的判斷，亦即判斷是否框i r。及f rl二者均爲無聲（II V )。如果判斷的結果爲是•亦即兩框示者均爲無聲（XIV)，則內插電路5設定P ch爲一固定值，並且藉由線性內插找到Am 、1 s n，該線性內插如下： mod „ PChCm] = MaxP i t ch 用來爲無聲藉由例如MaxPitch= 1 4 8而將音高的數值固定於例如一最大值的固定值； mod_am〔m〕〔l〕=affl〔 +am〔frl〕〔l〕x左其中〇Sl<MaxPitch: f r· 〇 ) 〔 1 〕X 右 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標孪局員工消費合作社印製 mod _ lsrJ〔m〕〔l〕=lSp〔fr〇〕〔i〕x 右 + 1 〔 f 〕〔 i〕X 左其中0盔i < I ;且 mod — vuv〔m〕=0。如果兩框f x·。及f d二者皆爲無聲。則程式轉移至步驟S 1 5，在此步驟中判斷是否框【π。爲有聲而框本紙張尺度適用中國國家操準（CNS ) A4規格（210X297公嫠） #12719 at _____B7__ 五、發明説明（） 29 爲無聲（UV)。如果判斷的結果爲是，亦即框frQ 爲有聲（V)，且框frl爲無聲（UV)，則程式轉移至步驟S 1 6。如果判斷之結果爲否，亦即框亡r。爲無聲（ UV)，而框f rl爲有聲（V)，則程式轉移至步驟 S 1 7 - 步驟s 1 6 f f .的處理指的是其中兩框fr0及frl 對V/UV而言不同，亦即其中框的其中之一爲有聲，而另一框爲無聲的情形。此係考慮介於對V/UV而言爲不同的兩框f r。與ί rl間的參數內插係不具任何意義的事實。在此情況下，使用較接近時間m/s p d之框的參數值，而沒有實施內插。如果框fr。爲有聲（V)，並且參數frl爲無聲（ UV)，則程式轉移至在圖10中所顯示之、左/ (==m / s.p d — f r。）及'右一 ( = p d)的大小互相比較於其中之步驟S 1 6，這致使給定有關框fx·。及ir：L的那一個較接近於m/s p d的判斷，使用較接近於in / s p d之框的參數值來計算修改過的編碼參數。經濟部中央標準局負工消費合作社印製 {請先閱讀背面之注意事項再填寫本頁) 如果在步驟S 1 6時判斷的結果爲是，則是較大者'

右 > ，而因此是框（1^離111/3 ?(1較遠。所以在步驟S 1 8中使用較接近於m/s p d之框fr。的參數來找到修改過的編碼參數，其參數爲： mod_pch[m；l = pch[fr0] · = aJff〇][l] (where 0 五 1 < m〇d_lsp[m][i] = 1sp[fr〇Hi] (where 0 < i < L) mod_vuv[m] = 1 本紙張尺度適用中國國家標準{ CNS ) A4規格（210X297公楚) -32 - 4127...9 A7 B7____ 五、發明説明（） 30 如果在步驟s 1 6中判斷的結果爲否，即左会右，而因此框f 較接近m / s p d，所以程式轉移至其中音高在數值方面被最大化的步驟S 1 9 ，並且使用用於框frl 的參數，則修改過的編碼參數被設定而使得 m〇d_pcil[m] = MaxPitch = am[fr)][l] (where 0 < < MaxPitch/2) m〇d」sp[m]⑴=(where 0 s i < |_) mod_vuv(m] = 〇然後，在步驟S 1 7中，回應在步驟S 1 5中的判斷，兩框f X·。及f d分別爲無聲（U V )及有聲（V )，則以相似於步驟S 1 6的方式來給定決斷。亦即，在此狀況下，不實施內插而使用較接近於m/s p d的框之參數值〇如果在步驟S 1 7中判斷的結果爲是，則在步驟 S 2 0中使音高的值最大化，而且爲剩餘的參數使用用於較接近之框f r。的參數，則修改過的編碼參數被設定而使得： m〇d_pch[m] = MaxPitch 經濟部中央標準局員Η消費合作社印製 (請先聞讀背面之注意事項再填寫本頁) m〇d一= Ά〇][1] (where Ο £ ( < MaxPitch) m〇d」sp[m：)[i] = lsp[f「〇][i；I. (where Ο s 'i < I) mod—vuv[m] = 0 如果在步驟s 1 7中判斷的結果爲否，因爲左^右，而因此f ^較接近於m/s p d ’則程式轉移至其中具有用於框f 之參數的幫助之步驟S 2 1 ，修改過的編碼參數被設定而使得：本紙浪尺度適用中國國家標準（CNS > A4規格（210X297公釐） -33 - 經濟部中央標準局貝工消費合作社印製紙9 $ 五、發明説明（） 31 mod-PCh[m] = Pch[fr丨] fnod_a(I![m]n] = am[fr|][i] (where Ο < ^' < L) m〇d_lsp[mHi] = lsp[ff(][n (where 0 < ( < L) mod—vuv[m) .= 1 ' 以此方式’內插電路5在圖9的步驟S 6中依據介於兩框f r。與frl間的有聲（V)友無聲（UV)間的關係而實施不同的內插操作。在步驟5 6的內插操作終止之後，程式轉移至其中m被增量的步驟s 7，步驟s 5及s 6 的操作步驟一直重複直到I的數值變成等2爲止。此外，用於UV部份之短期Γ m s的序列逋常被用在雜訊增益控制。但是文中設定此參數爲1 6 圖1 2顯示修改過編碼參數計算單元3的操作之示意圖。爲編碼單元2每2 Ora s e c抽取一次編碼參數的模型顯示於圖1 2之A中•修改過編碼參數計算單元3的周期修改電路4設定周期爲1 5ms e c ’且順著時間軸產生壓縮，如圖1 2之b中所顯示。在圖1 2之c中所顯示的修改過之編碼參數如前所述地藉由與二框f μ及f 的 V/U V狀態一致的內插運算而被計算。修改過編碼參數計算單元3有可能使在其中由周期修改電路4及內插電路5的操作之序列倒轉。此即如在圖 1 3之B中所顯示，實施在圖1 3之A中所顯示的編碼參數之內插，且如在圖1 3之C中所顯示，實施用以計算修改過的編碼參數之壓縮。來自修改過編碼參數計算單元3的修改過之編碼參數本紙浪尺度適用中國國家標準（CNS ) A4規格（2ί〇Χ 297公釐) ' -34 - -----：--；----,-----^--^------ (請先聞讀背面之注意事項再填寫本頁) 4127.9 A7 A7 __;___B7_ 五、發明説明（） 32 被饋送入在圖1中所顯示之解碼電路6。解碼電路6根據修改過的編碼參數來合成正弦波及雜訊，並且在輸出端 3 7輸出合成的聲音。參考在圖1 4、1 5說明解碼單元6。爲說明起見，假設被供應至解碼單元6的參數爲一般之編碼參數。參考圖1 4，一 L S Ρ的向量量化輸出，其對應於圖 3之終端15的输出，亦即所謂的索引（index)，被供應至終端3 1 〇此輸入訊號被供應至一用於倒轉向量量化的反L S P 向量量化器3 2以產生後來被供應至用於L S P內插之 LSP內插電路3 3的線性頻譜對（LSP)資料，最終的內插資料被一L S P至α轉換電路3 2轉換成線性預測碼（LP C)的α參數。這些α參數被饋入合成濾波器 3 5。經.濟部中央標準局員工消費合作社印製 (請先閱讀背面之注意事頃再填寫本頁) 有用於對應至在圖3中所顯示之編碼器的終端2 6之输出的頻譜包絡（Am)的加櫂向量量化碼字元的索引資料被洪應至圖1 4的終端4 1。有來自圖3之終端2 8的音高資訊及表示在一 U V區塊內之時間波形的特性量之資料被供應至終端4 3，而有來自圖3之終端2 9的V/ UV辨識資料被供應至終端4 6。來自終端4 1的振幅Am之向量量化資料被饋入用於倒轉向量量化之反向量量化器42(MBE)。最終的頻譜包絡寶料被送至諧波/雜訊合成電路或者多頻帶激發合成電路4 5，該合成電路4 5被饋以來自終端4 3的資料. 氏張尺度適用中國國家標準（CNS ) Α4規格（210x297公釐） -35 - 經濟部中央標準局貝工消費合作社印製 ___412719 37_ 五、發明説明（） 33 ’其被一個介於音高資料與表示依據V/UV辨識資料之用於UV框的波形之特性值的資料之間的轉換開關4 4所切換’該合成電路4 5亦被饋以來自終端4 6的V/UV 辨識資料。當作該合成電路45之說明性配置，隨後將參考圖 1 5來說明MB E合成電路的配置。從合成電路4.5中取出相關於圖3之反濾波電路2 1 之輸出的L P C殘值資料。如此所取出的殘值資料被送至合成電路3 5，在該合成電路3 5中*實施L P C合成來產生被一後置濾波器3 6所過濾之時間波形資料而使得重現的時域波形信號在輸出端37被取出。當作該合成解碼4 5之示例，一MB E合成電路之說明例將參考圖1 5加以說明。參考圖1 5 ’來自圖1 4之反向量量化器4 2的頻譜_ 包絡資料實際爲L P C殘值之頻譜包封資料，被供應至輸入端1 3 1。被饋送入終端43、4 6的資料與在圖14 中所顯示的資料相同。被供應至終端4 3的資料爲轉換開關4 4所挑選，使得音高資料和表示UV波形之特性量的資料分別被饋送入一有聲合成單元1 3 7及一反向量量化器 1 5 2。來自終端1 3 1之L P C殘值的頻譜振幅資料被送A 複數個用於反向轉換之資料逆轉換電路1 3 6。該複數個資料逆轉換電路執行係由該複數個資料轉換單元119所執行之轉換之倒轉的反向轉換。最終的振幅資料被饋送人本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐) ： ~ ' -36 - (请先閲讀背面之注意事項再填寫本頁.) ¥ 訂經濟部中央標準局員工消費合作社印製 A7 412719 B7 五、發明説明（） 34 有聲合成單元1 3 7及無聲合成單元1 3 8。經由轉換開關4 4之固定端之獲自終端4 3的音高資料被饋送入合成單元137、138。來自終端46的V/UV辨識資料亦被饋送入合成單元137、1 38。有聲合成單元1 3 7藉由例如餘弦或正弦波合成來合成時域有聲波形，同時無聲合成單元1 3 8藉由一帶通濾波器濾掉白雜訊來合成時域無聲波形。有聲波形及無聲波形由加法器1 4 1加總在一起以便在輸出端1 4 2被取出、如果V/UV碼當作V/UV辨識資料傳送，可在單一分界點分割整個頻帶成爲一有聲（V)區及一無聲（ UV)區，並且可根據此分界點得到以頻帶爲基礎之V/ UV辨識資料。如果在分析（編碼）側將頻帶退化至一固定數目，例如1 2個頻帶，可提供具有相關於原始音高之頻寬的變動數目之頻帶來消除此種頻帶退化》下文說明無聲合成單元1 3 8之合成無聲的操作。 ·、.來自白雜訊產生器1 4 3的時域白雜訊信號波形被送至一用以藉由具有一預定長度之例如2 5 6個樣本·的譬如像Hamming窗之適當框取功能來框取的框取單元1 4 4。所框取之信號波形然後被送至用以產生白雜訊之頻域能量頻譜之STFT用短期傅立葉轉換（STFT)電路 145。來自STFT單元145的能量頻譜被送至頻帶振幅處理單元1 4 6，在該頻帶振幅處理單元1 4 6中，被認爲係UV之頻帶被乘以振幅 Am UV而同時被認爲本紙張尺度適用中國國家標準（CNS ) A4規格（2[0X297公釐） (請先聞讀背面之注$項再填寫本頁)

X -37 - 經濟部中夬標準局員工消費合作社印製五、發明説明（） 35 係V之其他頻帶的頻寬被設定爲0。頻帶振幅處理單元 14 6被供應以振幅資料、音高及V/UV辨識資料。. 頻帶振幅處理單元146的輸出被送至ISTFT單元1 47，在該I STFT單元1 47中，輸出藉由使用原來的白雜訊之相位當作相位而被反向S T F T，用以轉換成爲時域信號。I STFT單元147的輸出經由稍後說明之能量分佈成型單元1 5 6及乘法器1 5 7而被送至重疊及相加單元1 4 8，在該重疊及相加單元1 4 8中，爲了致使原來連續波形的恢復而以在時間軸上之適當的加權來重複、重疊及相加。以此方式，經由合成來產生連續的時域波形。重疊及相加單元1 4 8的輸出訊號被送至加法器1 4 1 β 如果在區塊中至少一頻帶爲有聲（V)，在個別的合成單元137、13 8中實施上述之處理。如果在區塊中整個頻帶均爲UV，則轉換開關4 4使其可動接點4 4設定至一固定端k，使得在無聲訊號之時間波形上的資訊取代音高資訊而被送至反向量量化單元1 5 2。亦即，對向量量化單元1 5 2饋入相關於來自圖4之向量量化單元1 2 7的資料之資料。此資料被反向量量化以得到用來抽取出無聲信號波形之特性量的資料。 ISTFT單元147的輸出具有被能量分佈成型單元1 5 6在其被送至乘法器1 5 7之前所調整的時域能量分佈。乘法器1 5 7將I STF T單元1 47的輸出. 乘上從向量置化單元1 5 2經由平整單元1 5 3所得到的本紙浪尺度適用中國國家標準（CNS ) A4規格（2I0X297公釐） ----7--„----,.w-- (請先閲讀背面之注意事項再填寫本頁) _j 、tT- -38 - 412719 A7 ____ B7___ 五、發明説明（） 36 訊號·> 感覺粗糙的快速增益變動可由平整單元1 5 3加以抑制。如此所合成的無聲訊號在無聲合成單元1 3 8處被取出，並且被送至加法器141，在此加法器141中，其加上來自有聲合成單元1 3 7的訊號，而使得當作MB E 合成输出的L D C殘值訊號在輸出端1 4 2處被取出》這些L P C殘值訊號被送至圖1 4的合成濾波器3 5 用以重現最後重播的語音聲音。語音信號在生裝置1致使修改過編碼參數計算單元3 在控制器|圖中未顯示出，的控制下計算修改過的編碼參數，而且在修改過的編碼參數的幫助下合成爲時間軸壓縮擴展之原始語音聲音的語音聲音" 在此情況下，使用來自修改過編碼參數計算單元3的 mod— 1 aE> C m ] 〔i〕以取代LSP反向量量化電路3 2的輸出。使用修改過編碼參數mo d_lse〔m〕經濟部中央標準局員工消費合作社印製 (請先閲讀背面之注意事項再填寫本頁) 〔i〕以取代固有向量解量化之值。修改過的編碼參數 mod— Isp〔m〕〔i〕被送至用於LSP內插的 LSP內插電路3 3，而後被供應至LSP至α轉換電路 34，在此轉換電路34中，其被轉換·成被送至合成濾波器35的線性預測碼（LPC)的α參數，9 另一方面，供應修改過的編碼參數m 〇 d — am〔 m 〕〔1〕以取代複數個資料轉換電路136的輸出或輸入。對終端43、46分別饋送mod — Pch〔m〕及本紙張尺度適用中國國家標準（CNS ) A4規格（21〇X297公釐） -39 - 經濟部中央標準局員工消費合作社印製 A7 _B7_____ 五、發明説明（） 37 mod_vuv〔m〕》該修改過的編碼參數mod — am〔m〕〔1.〕被送至諧波/雜訊合成電路4 5當作頻譜包絡資料。對合成電路4 5送入來自終端4 3的111〇(1_?£^〔111〕’此係經由轉換開關4 4 ’且視辨識資料而定，而同時亦饋入來自終端46的mod_vuv〔m〕。藉由上述配置，如圖1 5中所顯示，使用上述之修改過的編碼參數合成時間軸之壓縮擴展的原始語音訊號’以便在輸出端3 7輸出。因此，語音訊號重現裝置1解碼一陣列之修改過的編碼參數mod — *〔 m 〕（〇客m<N2)以取代固有陣列*〔n〕（0客nSNi)。在解碼期間，框間隔可以被固定爲例如像傳統上一樣2 Om s e c ·因此，如果 Ν2<Νι或Ν2>Νι，那麼分別完成隨著速度增加的時間軸壓縮或者隨著速度降低的時間軸擴張。如果如上所述地實施時間軸修改，則瞬間頻譜及音高仍然沒有改變，使得不論在0. 5<spd<2的範圍內之明顯的修改幾乎不會產生破壤。有了此系統，因爲最終所獲得之參數串在被用2 0 m s e c的固有間隔來排列之後被解碼，所以可輕易地在增加或減少方向上實現任意的速度控制。另一方面，可經由同一處理而沒有轉變點來實行速度增加或減少。_ 因此可以用即時速度的兩倍來重現固態記錄的內容。因爲音高及音位仍沒變動，儘管增加重播速度，例如如果本紙張尺度適用中國國家標準（CNS } A4規格（210X297公釐） (請先閲讀背面之注意事項再填寫本頁)

-40 - 經濟部中央標準局貝工消費合作社印裝 4127^9 A7 ______B7_ 五 '發明説明（）' 38 在較高速下實施重現，可能聽到固態記錄之內容。另—方面’.至於語音編碼解碼（cordec)，係一輔助操作，就像在解碼及輸出之後的算術運算，爲C E L P編碼的使用之所需，其可以被消除。雖然修改過編碼參數計算單元3與上述的第一實施例之解碼單元6隔離，但是在該解碼單元6中也可以提供計算單元3 » 在藉由語音訊號重.現裝置1中的修改過編碼參數計算單π 3來計算參數方面.，對A in的內插‘運算可以對向量量化值或反向量量化值執行。下文說明依據本發明之用以實施語音訊號傳送方法的語音訊號傳送裝置5 0。參考圖1 6，語音訊號傳送裝置 5 0包含一發送器5 1，其用來根據以預設時域框爲單位來分裂輸入語音訊號，並且以框爲基礎來編碼該輸入語音訊號以便找尋編碼的參數，內插該編碼的參數而找到修改過的編碼參數及用.以傳送修改過的編碼參數。語音訊號傳送裝置5 0亦包含一接收器5 6，其用以接收修改過的編碼參數及合成正弦波稆雜訊。亦即，該發送器5 1包含一編碼器5 3，其用來根據以預設之時域框爲單元來分裂輸入語音訊號，並且以框爲基礎來編碼該輸入語音訊號以使抽取編碼的參數、一內插器5 4，其用以內插該編碼的參數，.以便找得到修改過的編碼參數，及一發送單元5 5 *其用以發送修改過的編碼參數，該接收器5 6包含一接收單元5 7、一內插器5 8 本紙張夂度逋用中國國家標準（CNS ) A4规格（210X297公釐） ~ -41 - (請先閲讀背面之注意事領再填寫本頁)

經濟部中央標準局員工消費合作社印製 412719 a7 ___B7 _ 五、發明説明（） 39 ，其用以內插該修改過的編碼參數，及一解碼單.元59，其用以根據內插的參數來合成正弦波形及雜訊*以便在輸出端6 0輸出所合成的語音訊號。. 編碼單元5 3及解碼單元5 9的基本操作和語音訊號重現裝置1的基本操作相同，因此爲了簡單起見，省略其詳細的說明。藉由參考圖1 7的流程圖來說明發送器5 1的操作· 在流程圖中，共同顯示透過編碼單元5 3的編碼操作以及透過內插器5 4的內插操作。在步驟S31、S33中，編碼單元53抽取由 LSP、音高、Pch、V/UV及Am所組成的編碼參數。尤其是L S P在步驟S 3 1中被內插器5 4所內插並重新配置，且在步驟S 3 2中被量化，而同時在步驟 S 3 4中內插並重新配置音高p c h、V/UV及Am並量化於步驟S 3 5。這些量化資料經由發送器5 5被傳送到接收器5 6。經由接收5 6之接收單元5 7所接收的量化資料被饋至內插單元5 8，在此內插單元5 8中，該參數被內插旦再行配置於步驟S 3 6中。在步驟S 3 7中藉由解碼單元 5 9來合成資料。因此’爲了透過時間軸壓縮來增加速度，語音訊號傳送裝置5 0內插參數且在傳送時間中修改參數框間隔。此時’因爲接收期間，藉由以固定框間隔，例如2 〇 m s e c ，找到該參數來實施重現，所以可以爲了位元率氏張尺度適财關家網^⑽…規格⑺狀加公釐) ' (請先聞讀背面之注意事項再填寫本頁)

-42 _ 41礼9 A7 B7 五、發明説明（） 40 轉換而直接使用速度控制演算法。亦即，假設如果爲速度控制而使用參數內插，則在解碼器內實施參數內插。但如果在編碼器內實施此處理而使時間軸壓縮的（十分之一取樣的）資料被編碼，並且被解碼器所時間軸擴展（內插），則可以用spd比值來調整傳送位元率。如果傳送速率.爲例如1. 9 75 Kbps並且藉由設定以雙倍速度來編碼而使s p d = 0 . 5 ，因爲以5秒的速度實施編碼，而非固有之1 0秒的速度，所以傳送速率成爲 1. 975x〇. 5 Kbps。而且，在圖1 8之A中所顯示，在編碼單元5 ·3得到的編碼參數被內插器5 4以例如3 Om s e c的任意間隔所內插並重新配置，如在圖1 8之B中所顯示。如在圖 1 8之C中所顯示，在接收器5 6的內插器5 8中2 0 ms e c來內插且重新配置該編碼參數。經濟部中央標準局員工消費合作社印製 (請先閲讀背面之注意事項再填寫本頁) 如果在解碼器內提供類似的電路模式計劃，則可能恢復速度至原始值，而同時亦可能以高或低的速度聽到語音聲音》亦即語音控制可以被用來當作可變的位元率編碼解碼。圖式簡述圖1爲依據本發明第一實施例之語音訊號重現裝置配置的示意方塊圖。圖2爲顯示在圖1中所顯示之語音訊號重現裝置配置本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -43 - 4127..9 at _B7___ 五、發明説明（） 41 的示意方塊圖* 圖3爲顯不在圖1中所顯狀之語音訊號重現裝置之編碼器的方塊圖。圖4爲顯示多頻帶激發（MB E )分桁電路之配置的方塊圖，該電路當作編碼器之諧波/雜訊編碼電路之說明例。圖5圖示說明向量量化器之配置。圖6係顯示用於有聲與無聲，以及被集合在一起之有聲和無聲的輸入之平均值的圖表。圖7係顯示用於有聲與無聲，以及被集合在一起之有聲和無聲的位權/ II X II之平均值的圖表。圖8係顯示用於有聲、無聲及被集合在一起之有聲與無聲的向量量化之碼本的方式之圖表。圖9爲顯示在圖1中所顯示之語/音訊號重現裝置中所使用的修改過編碼參數計算電路之示意操作的流程圖。圖1 0係顯示在時間軸上1由修改過編碼參數計算電路所得到的修改過之編碼參數的示意圖。經濟部中央橾準局負工消費合作.社印製 (請先閱讀背面之注意事項再填寫本頁) 圖1 1係顯示在圖1中所顯示之語音訊號重現裝置中所使用之修改過編碼參數計算電路的詳細操作之流程圖。圖1 2A、1 2B及1 2C爲顯示修改過編碼參數計算電路之說明操作的示意圖。圖1 3A、1 3 B及1 3 C爲顯示修改過編碼參數計算電路之另一說明計算操作的示意圖夂 '圖1 4爲顯示在語音訊號重現裝置中所使用之解碼器/ 本紙張尺度適用中國國家標芈（CNS ) A4規格（210'乂297公釐） _ 44 一

Claims

4 £8008 ^BaD

六、申請导利範圍第8 51 0 9 3 8 3號專利申請案中文申請專利範圔修正本民國88年12月修正請先閲讀背之注意事項再寫本頁 1 . 一種用以根據藉由將輸入語音訊號細分成在時間軸上具有預定長度之框並且藉由以框爲基礎來編碼該輸入語音訊號所決定之編碼參數.來重現該輸入語音訊號的方法，該方法包含步驟： .•內插該編碼參數，以便.決定與所需之時間點有關的修改過的編碼參數；以及根據修改過的編碼參數來產生在速率方面與該輸入語音訊號不同的修改過的語音訊號。 2. 如申請專利範圍第1項之用以重現一輸入語音訊號的方法，其中該修改過的語音訊號被至少依據修改過的編碼參數來合成正弦波所產生。 3. 如申請專利範圍第2項之用以重現一輸入語音訊號的方法，其中在內插之前或之後，藉由壓縮或擴展該參數來改變參數周期。 ' 經濟部智慧財產局員工消費合作社印製 4. 如申請專利範圍第1項之用以重現一輸入語音訊號的方法，其中藉由在編碼參數中所含的線性頻譜對參數、音高及殘值（residual )頻譜包絡的線性內插來實施該編碼參數的內插β 5. 如申請專利範圍第1項之用以重現一輸入語音訊 '號的方法，其中所使用的編碼參數係藉由將輸入語音訊號的短期預測殘值表示成合成正弦波及雜訊，並且藉由對每本紙張尺度適用t國國家標準（CNS)A4規格（210 X 297公釐） 418719 | 六、申請專利範圍一個合成的正弦波及雜訊之頻譜資訊編碼所決定之這樣的參數。 (請先閱讀背面之注意事項再填寫本頁> 6—種用以重現語音訊號的裝置，在該裝置中，根據藉由將輸入語音訊號細分成在時間軸上具有預定長度之框，並且藉由以框爲基礎來編碼該输入語音訊號所決定之編碼參數、重現輸入語音訊號，該裝置包含：內插機構，其用以內插編碼參數，以便決定與所需之時間點有關的修改過的編碼參數；以及語音訊號產生機構_其根據該修改過的編碼參數來產生在速率方面與該輸入語音訊號不同的修改過的語音訊號 0 " 7. 如申請專利範圔第6項之用以重現語音訊號的裝置’其中該語音訊號產生機構藉由至少依據該修改過的編碼參數來合成該正弦波以便產生該修改過的語音訊號。 8. 如申請專利範圔第6項或第7項之用以重現語音訊號的裝置，更包含周期改變機構，其位在該內插機構之上游或下游處，用以壓縮或擴展參數也便改變參數周期。經濟部智慧財產局員工消費合作社印製 9. 如申請專利範圍第6項或第7項之用以重現語音訊號的裝置，其中該內插機構對在編碼參數中所包含的線性頻譜對參數、音高及殘值頻譜包絡實施線性內插。 10. 如申請專利範圍第6項或第7項之用以重現語音訊號的裝置，其中所使用的編碼參數係藉由將輸入語音訊號的短期預測殘值表示成合成正弦波及雜訊，並且藉由對合成的正弦波及雜訊之頻譜資訊編碼所決定之這樣的參本紙張尺度適用中國國家標準（CNS)A4規格（210 X 297公釐〉 -2 -