TWI257604B

TWI257604B - Method and system for pitch contour quantization in audio coding

Info

Publication number: TWI257604B
Application number: TW093130053A
Authority: TW
Inventors: Anssi Ramo; Jani Nurminen; Sakari Himanen; Ari Heikkinen
Original assignee: Nokia Corp
Priority date: 2003-10-23
Filing date: 2004-10-05
Publication date: 2006-07-01
Also published as: CN1882983A; WO2005041416A2; WO2005041416A3; US8380496B2; KR20060090996A; US20050091044A1; KR100923922B1; TW200525499A; ATE482448T1; CN1882983B; EP1676367A4; DE602004029268D1; US20080275695A1; EP1676367A2; EP1676367B1

Description

1257604 九、發明說明：【發明所屬之技術領域】種語音編碼器，尤其是允許編碼器。本發明係概括的涉及~ 一相當長的編碼延遲的語音【先前技術】在美國’在設計行動電辦已S考制視障者的方便性。行動電話製造商必f提供視障者適用的使用者介面。實際上’此意§胃著必需將表單以語音方法顯示。因此必需儘可能以較少的記憶體儲存這些聲訊函數。基本上此應用巾考$文字轉換為語^(TTS)的演算法。但是為了達到合理品質TTS輸出，需要使用大量的資料庫。因此，對於行動端，TTS不是一種方便的方式。隨者低量記憶體的使用，不接受由現在之TTS演算法提供的品質。在一基本上性的語音編碼器中，以稱為訊框的連續長度的分段處理輸入語音信號。在現在的語音編碼器中，訊框長度通常為i 0到3 0ms，且從下一訊框起的 5到1 5ms的前視段(lookahead)分段改變使用。訊框可以更進步分為多個次訊框。對於各一訊框，編碼器決定輸入信號的參數表示法。量化該參數，且經由一&訊頻道傳运或儲存在一儲存媒體中。在接收端，解碼器基於运今的參數架構一同步信號，如圖丨中所示者。二語音編碼的目的為在一給定編碼參數下辨識一最 =的品質，在對於某些應用中，語音編碼器的發展也考里到其他性能上問題。除了語音品質及位元速率外，下 1257604 文將更詳細說明的主要特徵包含編碼器的 §fl框的長度+可能的前視段定義），（主要由記憶體需求，對於頻道錯誤的感應度，聲瑪器的自動處理，及編碼語音的頻寬。而且，月π雜訊的可以應料_能階射神触難輪Γΐί碼器必需行的mrifi大部份實際語音編碼器、必需執，間，該間距對應到該基本鮮，激發線性預估(CELP)方法為基礎的編碼器；的未發聲部份也9長時段_賴滞（大略對等於該^ 距）〇在一代表性的語音編碼器中，以規則的間隔估計間距參數。使用在語音編碼器中的間距估測器可以大略區分為基礎數類：⑴使用語音之時域特徵的間距估測器， (ii)使用語音的頻域特性的間距估測器（iii)同時使用語音之時域及頻域特性的間距估測器。曰對於間距區域的量化中，大部份習知技術的解決方式（以規則的間隔估計間距）為使用純量量化。基本上，對於所有的間距值使用單一的量化器，且也連續傳送參數。也提出不同的解決方法。而且，使用一純量量化器，量化每秒的間距值，且在這些之間的數值應用一不同的量化器編碼。纟某些現有的編碼器中，量化器有兩種模 1257604 f ··無記憶朗鼓預賴型。#與基本的方法比較這些技術提供某些優點，但是只有部份的冗餘。要缺點為傳統上應用固定更新參數的量化技術土本上效率低，此係因為在間距值傳送時存在 =二？ί在間距參數量化中使用的連續更新參數相二（^ (^UQOHz)以可以處理間距改變快速的情况。但疋，在間距區域中的快速變動相當少。結部份的時間使用低的更新參數。【發明内容】本發明係有關於典型的的間距區域問題，其中該區相當地平坦，但是存在某些突發性的快速變純。因此4 可月b架構-分段性的間距區域，該間距區域可以很接近原來區域的㈣，但是編碼的資訊較少。不編碼該間距區域中的各個間距，只有對於量化的偏離改變處編碼定義該分段之間距區域的數點。在未發聲期間，在編瑪器及解碼哭中使用-固定_訂之間距值。在分段性間轉域中的: 個分段可以是線性或非線性的分段。因此，依據本發明的第一觀點，一種用於在聲訊編碼中改進編碼效率的方法’其中編碼聲訊信號以提供指示聲訊信號的參數，該參數包含間距區域數據，其中包含多個間距值，忒間距值表示在時間上的聲訊分段，該方法包含下列步驟.·· ~ / 基於該間距區域資料，產生多個簡化的間距區域分段候選項，各候選項對應到該聲訊信號的一次分段； 1257604 候選i:::3的::及-或多個先選擇的準則選擇該用選擇之sk擇之候選項之聲訊信號的次分段中應項的特徵編竭該間距區域資料。、異擇^候t明之—貫施例’在聲訊分段中之間距區域由 ^八Θ ’其對應到在聲訊分段中之連續的多個夕個選擇的候選項由—第—結束點及一第二二次:疋/，且其中該編碼包含步驟為提供指示開始點、舅使得允許解碼器基於該資訊而非間距區域資料重建在聲騎段巾的聲訊信號。在某些連續性之:欠分段中之間距值的數目等於或大於3。依據本發明之-實施例，由預先選擇的條件限制該產生的步驟，使得在各簡化的間距區域分段候選項的在對應之次分段中之各該間距值之間的偏離小於或等於預先決定的最大值。依據本發明之一實施例，該產生的候選項具有不同的長度，且該選擇係基於分段候選項的長度，且該預先選擇的準則包含選擇的候選項在分段候選項中具有最大的長度。依據本發明之一實施例，該選擇係基於該分段候選項的長度，且該預先選擇之準則包含：量測的偏離為具有相同長度的一群候選項中為最小者。 1257604 依據本發明之一實施例，各該簡化的間距區域分段候選項具有一開始點及一結束點，且該產生的步驟以調整該分段候選項的結束點的方式進行。該聲訊包令—語音信號。依據本發明之第二觀點，本發明提供一種用於編碼聲訊信號的編碼裝置，該聲訊信號包含間距區域資料，該間距區域資料包含多個表示時間中之聲訊分段的間距值，該編碼裝置包含：一用於接收間距區域資料的輸入端；以及 ,一資料處理模組，可回應該間距區域數據，產生多個 j化的間距區域分段候選項；各候選項對應到該聲訊的一次分段；其中該處理模組包含：一演算法，在各個簡化的間距區域分段候撰jg及在對

碼的間距區域數據，該編碼裝依據本發明之一實施例，該量該長度指示在次分段中該編碼的間置尚包含：一儲存裝置，

I操作該儲存裴置以連接到該量聲訊數據，以將聲訊數據儲存在 1257604 依據本發明之一电f 可操作該輪出端以連；二儲器尚包含-輪出端’ 域數據提料觸赫㈣因此縣碼的間距區傳送該:碼器尚包含-輸出端以碼器也基於該編碼的=以讀取的媒栌弟一硯^，本發明提供一種在一電子可中〜 =二實現的電腦軟體產品，其在-聲訊編碼裝置 =距==碼裝置提供參數以指示該聲訊，該參數表示時間中的聲訊分段，該軟==值，-些間距值距區l以基於該間距區域數據產生多個簡化的間段Γ5 77又項’各賴選項對應該聲訊巾的-次分 n ’餘在錢簡化的間縣域分段候選項及在對j冬人分段巾_職之間量測偏離值；以及 2碼器，基於該量剩的偏離及預先選擇的準則選 =Ί項tHiUb允許—量化模組應用該選擇之候員的特性編碼在聲訊之次分段中的間距區域數據，其中該聲訊對應到該選擇的候選項。依據本發明之第四觀點，本發明提供一種用於重建聲几的解碼裔’其中編碼聲訊以提供指示該聲訊的參數，該參數包含間距區域數據，該數據包含選擇表示時間中之聲訊分段的間距值，且其中時間中之聲訊分段中的間距區域 10 !2576〇4 數據由聲訊中的選擇連續的第二點定義該次分段，該解碼器包含：—第一點及一據入端，以接收指示定義該次分段之端點的聲訊數段重建权組’以基㈣接㈣聲訊數據重建該聲訊分依據本發明之一實施例，在一電子捭髀由々锯辞$ 數據依im:實施例，經由一通訊頻道傳送該聲訊中，以接㈣^^據解碼11㈣人以連接到該通訊頻道包含依據本發明之第五觀點，本發明提供—種電子裝置，示’其中編碼聲訊以提供指選ΐΠϊ ’該參數包含間距區域數據，該數據包含聲訊分段的間距值，且其中時間中之聲近：又：的Γ距區域數據由聲訊中的選擇連續的次分段於第二點定義該次分段，因此允許基、疋義該认分段的端點重建該聲訊分段；以及予_=^=該端點的聲訊數據且提供聲訊數據依據本發明之-實施例，本發明提供在一電子媒體中 5己、亲該聲訊’且其中操作該解碼器的輸入項以連接到用於 11 1257604 接收該聲訊數據的電子媒體中。依據本發明之一實施例，本發明提供經 “ 傳送該聲訊數據，且其中操作該解碼器的輪入C、訊頻道通訊頻道中，以接收該聲訊數據。 ⑴以連接到該機：T裝置可以是一行動式的終端機或-用於終端依據本發明的第六觀點，依據本發明一包含：喱逋訊網路，選擇基地台，以及選擇與該基地台進行通訊的行動台，其- 至少-台包含：一用於重建一聲訊的解碼器，=台中訊以提供指示該聲訊的參數，該參數包含、、扁碼聲該數據包含選擇表示時間中之聲訊分段的^距:域數據，時間中之聲訊分段中的間距區域數據由聲訊中二其中續的次分段近似，由—第—點及—第二點定義連因此允許基於定義該次分段的端點重建該聲訊刀段，一輸入端，用於接收指示該端點的聲叙二又；以及該聲訊數據予簡·。 W轉，且提供明由下文中的說明及圖2至6可以更進—步瞭解本發【實施方式】執行本發明之最佳模式應用分段間距區域，將具有偏離改他點傳送到解碼器中。因此，可以參考地 12 1257604 新速率。原則上’架構分段線性區域的方式改變數達到最小’而在-先指定的限制下與真的間距區域，，維持該偏離值。為果;前置作業必需相當長且最適化必需進行大ΐ 二；。可以應用相當簡單的技術而得到相當好儲^先前；明係基於在#音編碼器中使用的設計，以儲存先則錄下的聲訊信號。區域上，線性分段可以得到架構分段間距有效的最適化技術。對於各個線性分段，可以達到$不（1^_與真正區域的偏離達到最小者） :二t:瞭解錢性分段邊界外的區域。在此最的線^段。’需要考量兩種情況：第—缝分段及其他，止該第一;段的已固定，而411= 彳子，該線的開始點 ^而只有该結束點的位置可以最適化。先前it線性分段的例子中，該程柄開始為選擇該迭代運算，其方式為考量當該線的結束= ^匕的間距值，其相當接近該第三原始間距值。在已找出候選項後’試著找出所有可能的開始點及結束點的 13 1257604 °在各個原始的間距位置量測線性表示法的準確位置點均滿足準確度的準則，則接受該線距ί區域。而且’如果現在的線性及原始的間刀又之間的偏離小於在此迭代步驟中接受之其他線中間如果 =何-線時’騎擇現在的線作為如今可以找出的最佳線。如果試出之線中至少一線被接受，採取多於一 =於該分段後的重被程序，而維持該迭代運算何-項被接受，則結束該最適，適化期間發現的最佳結束點作為分段間距區：距值作為至今該線的之編後選擇第-間其方式為考量一或多個以點；:後開始迭代運算’ 測線性表科的準確度 =原始㈣距位置量在所有的這些位置均滿足選的線’如果段線性區域的-部份。^確度的翔時，則作為該分離小於在此迭代步驟發♦如果與原始間距區域的偏結束點的候選項作為^二f的其他的線的話，則選擇之線中至少一線時，則二:的結束？。如果接受試出出一或多個間距值後野於兮=迭代運算，其方式為在取十於§亥分段重複該程序。如果沒有 14 1257604 果山時’則結束該最適化的程序，則選擇在跌㈣找出的最佳結束點作為分段間距區域的-點0 的理ii述說Γ兩個例子中，可以先完成該迭代運算 ζ 二如果可以使用的連續間距值相當多 (Ί l/h 主耘序。此情況為如果已使用整個的前視段 (lookahead)時’如果結束語音動作或未發聲語音結祕。笛=疋如果6不 ,,,,^ /v ^ 〇果日^弟一種情況為限制一單一的線性箱的取大長度以更有效地編碼該點的位置。對於這兩種情況，可以對於迭代次數丨設間的取大牯間瑕小。圖4顯示該迭代運算。 ^找出該分段間距區域的新的線之後，編碼該線成位70串列的型式。各點必需給^兩數值：距值，及在區域新點及先前點之_時間距離。;^間不必對於該區域的第—點編碼時間距離。可以二量的量化器方便地編關距值。在使用聲訊機、定的編碼器的配置中，使用[l〇g2(imax)]編碼時間距離。如果需要的話，有可能使用某些沒有耗損的編瑪方式|如在時間距離值上的Huffman編碼。使用純量旦^ 工間距值。純量量化器包含3 2階（5位元）^使二石馬該 p(n)=p(n-l)+max 480p(n-l)' 8000 對其中η從2到3 2，且p(1)=19個樣本。因此， 15 1257604 於低頻率時允許，大的失真’其中已考量人類聲覺的特性。而且，人類聲訊系統的已知特徵已在對數域中的間距量化發生執行失真量測而加以利用。一本發明中考量原始間距區域的分段間距區域的例子顯示在圖2中’如圖2所示，各線性分段為_連結兩點之間的直線：一開始點及一結束點。例如圖2所示之分段間距區域的第二線段為連結t=1.22s的點及t；=29s的點的直線。在t=1.22s到t=1.29s的時段中的間距值數為8，包含開始點及結束點。 ’ /為了執行本發明，已分段間㈣域產生該直線編碼糸統有-額外的模組。如圖3所示，語音編碼系統丄包含一編碼模組1 〇，其具有一參數語音編碼器丄2以處理輸入的語音信號成為多個分段。對於各個分段，編碼态1 2決定咸輸入彳§號的參數表示法1 1 2。這此東^ 可以量化，或是為原始參數的未量化之型式，^視語音編碼系統而定。一與參數表示法有關的壓縮模組2 〇減少使用如軟體程式2 2的分段間距區域的間距區域。然後經由-量化模組2 4在分段n域上的點成為位元資料 1 2 0，其經一編碼兀，或儲存在一儲存介質3 〇中。在接收機端，使用偏離器4 0以基於在迄今的位元資料 3 0中的資訊產生合成的語音信號14 〇，該位元串指定分段間距區域及其他的語音參數。 s 在分段間距區域產生模組2 Q中的軟體程式2 2包含機器可讀取的編碼，其依據圖4之流程圖5 〇〇處理 16 1257604 m程圖5 〇〇顯示迭段距區域之分段的直線（參考圖2)。各直線有一開始 Ξ = ΪΓ士 ΐ束點Q(Pi)。對於該第一線段，選擇開始 5 m °對於所有的線段，選擇結束點 —點中定位該開始點，則在第二點上疋位職束點，則從第—點到第二關時段之間有 ;個間距值°因此’在步驟2中卜2。在步驟5 0 4 中’選擇結束ί為接近該時之第二點的間距值時在該間於第一分段’選擇開始點為在該時之第-點上或接近的間距值。在步驟5 Q 6中，量測該時 =第二點之時段中的間距值，且量測連結該開始點及結束點的直線之_偏離。另外，在某些間隔上量測備偏離:在步驟5 0 8中，該偏離與預定的錯誤值比較以決定是否現在的直線可以被接受為麵項。如果在該時段内在某㈣雜處的偏祕過科的錯誤值，則調整該結束點（如果該分段為第—分段時對於開始點），則該迭代運算的程序㈣步驟5 Q 6，直到沒有調整為止。如果接受現在的直線，如步驟5 〇 8中所述者，則在^驟5 1 Q中與㈣的結果比較，以決定其是否為迄今取佳的直線。該迄最佳的直線為在财相同丨中直線之間的絕對偏離的加總為最小者。在步驟5 i 2中儲存迄今最佳的直線。然後在步驟5 2 〇中調整該結束點，直到沒有進行任何的調整為止。當不再作為調整之後，在步驟5 2 〇中，決定是否 17 1257604 驟5 1 2中使用該儲存_ 伸今綠ί 或妓在步驟5 2 6中將丨增加而延〜、，、奴（否則如步驟5 2 4中所示，現在的i已等於可能在將{加1後，在步驟5 2 2中沒有可接、i段的直使用前先1的最佳線作為現在候遥項數目被限制，如設定一最大的限制， i it/平結束點與樣本點之間的差。在不同結束點之間的曰同it以設定以限制可能候選項的量。 =需瞭解，在圖2的分段間距區域中，第三線段只、包合卜11.29s及卜1.3〇s的間距值。此係因為t=1.3〇s 為分開兩語音信號分段的時間點。

必需瞭解只有在步驟中執行結束點或開始點的調整。例如調整Q(p〇的方式為在量化步驟中增加或減少值 Q(Pih但是，可以以更小或更大的步驟執行該調整。而且’最長的線或imax的限制可以設定在一大的數目，如 6 4。在此例子中，在開始點及結束點之間的時段（且因此i)產生相當大的改變。例如，在第四線段中的i等於5 ’其中第5線段中的i為2 3。但是，如果設定i®ax 為如5，則在大部份或所有線段中的時段（及i)相同。因此，當i改變且imax假設或為一固定數則均可以應用7 0。而且在步驟5 1 〇中用於選擇最佳候選項的分段候選項及間距之間的量測偏離可以是絕對差或其他偏離董測的合。分段候選項的產生為某些準則所限制，如該間距值及在該分段候選項中對應點之間的預定之最大絕對 18 1257604 差。例如，最大的差可以是5或1 0個量化的步驟，但是可以是一較小或較大的數目。而且上述說明的本發明可以加以修改，而不偏離本發明中修改間距量化的概念。首先，可以使用差值最適化技術i其次，修改的間距區域不必具有分段線性的特性’只疋可以維持傳送之間距數即可。第三，用於編碼間距及時間間隔的量化技術可以被修改。第四，有可能在間距估計期間架構不同的間距區域。而且’上述說明之實施例不是本發明的唯一配置。例如’可以自由選擇在決定新間距區域時使用的最適化技術。基於，新的間距區域不必為分段線性者。例如有可能使用量尺(splines)，多項式離散餘弦轉換等說明該區域。例如’一非線性的區域不必具有下列的型式： Q ⑻=Q(P〇)+ai[(Q(Pi)_Q(Po)/(trt。 +a2[(Q(pi)-Q(p〇)/(trt0))2(t-t〇) 2+… ti>tDt〇在此例子中，當需要更新結束點時，該式適足以提供舄要要的凋异法以只解碼一次即可得到需要的結果。一般的說明、可以將間距區域之最適化的簡化模型的搜尋方式公化，題化為數學上的最適化問題。假設f(t)表示說明在範1從0到tmax之間的原始間距區域的函數。而且g⑴ 表:簡化的間距區域’且d(f⑴，g⑴)表示在時間t時兩個區域之間的偏離。現在將解決的最適化問題為找出簡 19 1257604 f _，_)，對於;==小。八中h(·)定義最大距原始的間距、：tStmax， :偏離。從滿足該兩條件的間距區dt可允許離的區域函數達到最小化的條件為U，可以使得總偏 D']f(f(〇, m)， (1) 選擇此值為最後的解碼區域。 β般"而’上述說明的最適化問題為不可解出者。 Ϊ疋則==距區域模組固定以減少其-般性的 ϊ 解出。例如，在分段間距區域的模型为i ，g_離改變的點說明函數g(t)°假設如及、表不第n此類型之點的座標（1釦公^其中n在分段線性模型中這些點的點數）。該簡化的區域可以在叫線性分段中定義為： t—t g(t)=qn+—7~(qn+1~-qn)f〇r tn<t<tn+1 ^ ^nj»l (2) 其中KnSN-l。為了使得該定義完整，需要tn<tn+i，及tN=tmax。除外，需要所有的^值在從q—到如狀的範圍内。應用此模型，該最適化問題可以簡化以搜尋說明區域g⑴之點(tn，qn)的集合，其中該g⑴滿足條件⑴ 及(II)且使得式1中的總偏離最小化。現在，定義合理的 20 1257604 假設，即點的座標表示應用有限的解析度表示出，該問題變得可以解出者，此係因為點被防止在具有有限之可能的點位置的柵中。此假設不減少該公式的一般性，此係因為從最適化條件（I)中直接得到有限的準確度。該問題的解在最後節中公式化的有限的準確度可以應用多個不同的方法解出。在此說明兩種解決的方法。第一種方法在計算上較為複雜，但是均可以找出全區的最適化解，而第二種方法則較簡單，但是只有得到次最適化的結果。在兩種說明的方法中，吾人假設使用純量量化以編碼間距值qn ’應用其編瑪本C={ci ’ C2 ’ cm} ’且時間指示tn為某一時間單元T的整數倍。而且，吾人假設選擇 C及T，其方式為使得存在一解，且說明故一合理且額外的假設，即經由將N最小化而使得需要說明該區域的位元數達到最小（該N為需要定義簡化區域的點數）。全區的最適化方法使用下列直接的蠻力運算方法可以得到全區最適化的解：步驟1.開始，設定N=1 步驟2.設定N=N+1，可以應用現在的N找出一適當的分段線性模型，如果是，則進入步驟3。否則進行步驟2。步驟3.離開且編碼該簡化的區域。如果具有數個適當的區域條件，且選擇其中的一個，而使得式1的總偏 21 1257604 離達到最小。在步驟2的之測試的勃對所有適當的分段線性區域的丁候f為對於最適产化條件核 ⑴，qi)及(t2，q2)的所有線：、為具有滿足下列式之端點 d(f(tn),qn) <h(f(tn)) ⑶ 在此例子中’時間指示固本C中選擇出q丨及q2的數值，日&lU t2tmax攸編碼段。此次’此第一及最後的時間指示定為二： W ’其中時間指示t2可以在τ到口 :為0及 ^ ^ ^ ^ ^ 4 [max-丄内庫巳圍内調整，其級距為T。而且從編碼本c中選擇出qn的數值地，應用隨意的N ’該簡化的區域包含N _ i =裘且可以調整時間指示的N_2。、、艮『生刀I又，很容易看4上述的演算法中均可以得到最域候選項，此係因為步驟2中的核對方式匕的& 之故’迭代的減少保證可以滿足條件⑴，而且件j11) 中的總偏離達到最小。但是，也很容易看 + v恥3 尺寸增加，該演算法的複雜也隨著增加。二^問題的吾人可以聲明在最壞情況下，該演算法在=地說，選項中其成長如下：區域候 1257604 在上式中，b指示編碼本項的最大值，其滿足的條件且m=(tmax/T)-i。 x d中在實際的例子中，在最壞的情況下，這些變數是如b=3，且m=62，導致約h9x 1038的區域候選項。= 果，其結論為此理論上的最適化方法可以只使用'在火、、、° 和m為最小者（例如，當b=3及m=8，候選項的最二^ (worstcasenumber)為 5 8 9 8 2 4 )，且因此數不適於最實際的情況。去簡單的次最適化方法如上所述，如果該標的總是去找出全區最適化八几線性區域，則最適化的程序需要大量的計算。但是=段以應用非常簡單且在此節中說明的有效方法（結度只隨著增加的問題尺寸成線性長成）而得到彳艮好果。除了簡化外，此方法之一項優點為並沒有馬上严、、、Q 整個間距區域，而是需要一參考小的前置處理即可，理在簡化方法中的只要構思為—次只有對於—線分段進行最適化的處理。對於線性的分段，搜尋出田女長度的線可以使得與真正的區域之間的偏離$ 在相當小的粑圍内，此搜尋不需要使用在線性分段邊界外之區域的=識。、在此最適化的技術内，存在兩種情況’，此情況玎以分開為數區域··該第一線性分段及其他的線性分段。第二線性分段的例子發生在開始進行編碼時、'。另外，如果對於動作或未發聲的語音沒有傳送間距值的話，則在’傳送中的這些停止後的第―線性分段落在 23 1257604 兩端最適化。—線性分段的條件中，將線的性分段的最適，在f—分類的例子中，在先前之線端點的位置進行最適^定線性的開始點’且因此可以只佳端點：，的3子中，對於至今找出的線在最始該程序。铁德二二了及丁中選擇量化的間距值而開準確度(式3 )以:的得可以滿足需要化的間距值，在2 ° = ’ 1點的候選項為量值。在已杓+ 守，、可以相當點接近該原始的間距 lu^ ^ 時間間隔移動線性表示化的精賴，且應用::滿足準確準則時，則作為分段 ,.^〇H77而且，如果與原始間距區域的偏離二人驟期間可以接受的其他線時，選擇該線作 t 7找出的最佳線。如果接受候選項的處理期間時，、-姑。仃迭代程序、，其方式為在將t2增加-級距T後重硬〜長序。然後如沒有接受任何的線，則該最適化 =序，且選擇在先前迭代期間找出的^點作為分奴線性間距區域的第一點。在其他的線性分段的例子中，只有將端胃占的位置最適化，此係因為在先前線性分段的最適化期間，已固定 24 1257604 ，開；點之，。由選擇在固定開始作定位在τ間距值間 ί ΐη αγ作為至今找出之線的最佳端點而開始式為考量-或'多個步i，=此’開始該迭代程序’其方的仗、||逭讦W氐兮旦即tn=tn-i+2T。對於該線之端點的候l員了乂為该1化的間距值，下的原始間距值，使得可八田接、在新的tn 則。在找出該候選項後，需要之準確度的準性分段的鮮。彡㈣的其他步義似第— 該迭兩::::二:-個原因下可以完』前結束，而無法增加t 的間距區域在 f使用整個前置緩二以的傳送時。第二種情音的語音下已停止如大長度，以更有致地㉝為有可i限制單—線性部份的：情況，可以考量為經^該點的時間指示。對於該和端點之間的最大時間矩广於在可，之間距區域及在線1 的流程圖6 0 0中說明雖’而设定-限制t_x。在圖最適化程序。匕方法其中顯示單線性分段！流程圖6 0 〇顯示矣凡之直線之選擇的迭代不二奴間距區域之線性分段及-結束點Q(f(tn.))。^序^該直線為一開始·點Q(f(tn-: -結束點Q(f(tn-))迄八p於第一線段，開始點Q(f(tn-!)) 7已得到之相同i之直線之間的絕 25 1257604 偏離的最小合者。在步驟6 0 2中得到迄今得到之的最佳線。在步驟6 0 2中再度調整該結束點，直到沒有調整為止。當不再需要調整時，在步驟6 2 0中所決定者，此時η決定是否停止該迭代程序，且在步驟6 1 2中區域該最佳點作為現在的線段，或者是在步驟6 2 6中，經由將tn增加Τ而更進一步延伸該線段（除非在步驟6 2 4中決定現在的tn已等於tmax)。有可能在將tn增加T 後’在步驟6 2 2中決定不接受任何的延伸線。在此例子中，具有先前tn的最佳線作為現在線段的直線。可以限制候選項的數目。其方式為對於點結束點與樣本值的最大限制加以設定。在不同之結束點的候選項之間的間隔可以設定以限制可能之模型的數量。實際的配置在本文中介紹之間距區域的量化技術已包含在對於儲存應用之實際的語音編碼器中。該編碼器以相當低的位元速率約lkbps)下操作，且在可變期間的時段下（介於2 0到6 4 〇ms)中8KHz的輸入語音。在實際的應用中，使用簡單的次最適化方法，且在最適化區域中只有考量在現在之分段下的間距區域。在未發音或不動作的時段中’不編碼任何的間距貧訊。將變數T設定為1 〇ms，其等於該間距的估計間隔。而且，使用由估計的間距值pk (在1 〇ms的間隔）下形成的離散區域，大略估計連續的間距區域。結果，最適化條件(II)改變為·· 26 1257604 d(pk ^ g(kT) <h(pk) for all 0 <k <tmax/1 (5) 另外，應用下式的額外化而估計式1的總失真的最小化： 5Hg(kT))， (6) k=0 其中定義函數d為絕對錯誤，gpd(x，y)二|x-y|。以下式決定對於給定之間距值下之最大可允許之編碼錯誤的函數h : h(pk)=max(2? 480pk/8000) (7) 在間距值qn的純量量化中使用的編碼本C的產生中使用相同的函數。使用CfCp+hCc^)計算3 2階（5位元）之編碼本C的項目，其中d=19。此編碼本涵蓋在編碼器中使用的間距周期範圍，且與實驗的結果製造吻合。而且，該編碼本及函數h大略依循critical band的理論，其中人耳的頻率解析度假設隨著頻率的增加而減少。為了更進一步增強知覺的能力，在時數域中進行量化。在使用不同量化期間對於一分段編碼時間指示，但是對於分段的第一點並不編碼時間距離，此係因為總是為0之故。在不同的編碼方式中，使用其與先前在級距T的時間指數之間的時間距離編碼一給定的時間指數。更精確地說，經由將(tn-ty/TO-l轉換為二位元的表不5其中包含〔l〇g2(imax- 1)〕位元的方式編碼一給定的tn 27 1257604 度。在：1:=:以允許現在之線性線段的最大長率。如果將編碼之時的技巧以增加編碼的效指示t“且使ΐ一3於空：寺間指示，而非時間例子中，-較佳使:二=基礎程序的此歸_編碼’且直接對時間;離=編碼方法， ::===均及最大的匕 r!=域中辨識，：編；;:== 重。沒有應用初聽者測試間距量化的技術，但的聽力測试顯，存的編碼器包含工的減少大叫(只對於間距，則該j 但是變基::：區域相當的平整’ 的分段間距區域，但是;編之= 28 1257604 量化偏離改變之分如距區域的點。碼器同時減少-固定的内訂:間距值而且w間距頻率低時，聽力可，，尸的偏離。在可以今聽覺充:量 :二=:可以實際上減少位元 ί確的程度接近傳統上在5_ 兀里化态，母秒1 0 0間距區域）下摔作的間距法，有減少將位元=\的I㈣配置本發明中說明的方 ^减少將位TL速率更進—步減少到約8 s。本發明的主要應用包含：速率。有可⑧使用比習知技術的技術還要低的平均更新 -可以在解碼H巾架構分段間距區域，其使得可以很接近真正的間距區域。、的敏=發明考量人耳在低間距頻率下，對於間距改變〜本發明的技術可以減少位元速率。現在的應用一額外的處理單元進行侧編碼明存應用’其成功地在預錄聲訊的語音聲訊。所得的應用中，可以在電腦上記錄及編碼且解碼：::速率位元串儲存在行動終端機上儲存、、、通汛網路，如圖6所示，提供低速率的位 29 1257604 元串。圖6的示意圖顯示一通訊網路，該網路用於編碼與預錄之聲訊機構及類似應用相關的編碼器，係依據本發明進行。如該圖所示，網路包含多個基地台（BS)，其連接一切換之二次台（NSS)，也可以連結到其他的網路。該網路尚包含多個可以與基地台通訊的行動台（MS)。行動台可以是一行動終端機(MS)，通常稱為一完全的終端機。行動台可以是一用於該終端機的模組，而沒有顯示器，鍵盤，電池，盒子等。行動台也可以包含一解碼器 4 0，以接收來自壓縮模組2 0的位元串120 (參見圖3)。該壓縮模組20可以定位在該基地台中，該二次台中或在其他的網路中。雖然文中已應較佳實施說明本發明，但熟本技術者需了解可對上述加以更改及變更而不偏離本發明的精神及觀點。 30 1257604 【圖式簡單說明圖1的方塊圖顯示習知技術中的語音編碼系統。圖2為依據本發明實施例之分段式間距區域的例子。圖3的方塊圖顯示一依據本發明實施例的語音編碼系統。圖4的流程圖顯不對於產生^一分段式間距區域的迭代處理的例子。圖5的流程圖顯示一迭代程序的例子，係基於一最適的簡化模式產生分段性的間距區域。圖6的示意圖顯示可以實現本發明之通訊網路。【主要元件符號說明】 12 編碼 2 0 2 2 壓縮 2 4 量化器軟體 3 0 通訊頻道或儲存媒體 4 0 解碼器 4 1 量化器 4 2 軟體 5 0 行動端 11 0 輸入信號 112 參數 14 0 同步信號 31

Claims

1257604 十、申請專利範圍： 1.用於在聲訊編碼中改進編碼效率的方法，其中編碼聲訊信號以提供指示聲訊信號的參數，該參數包含間距區域數據，其中包含多個間距值，該間距值表示在時間上的聲訊分段，該方法包含下列步驟：基於該間距區域資料，產生多個簡化的間距區域分段候選項，各候選項對應到該聲訊信號的一次分段；量測各個簡化之間距區域分段候選項及該對應之次分段中之語音之間的偏離；基於該量測的偏離及一或多個先選擇的準則選擇該候選項中之一項；以及在對應到該選擇之候選項之聲訊信號的次分段中應用選擇之候選項的特徵編碼該間距區域資料。 2·如申請專利範圍第1項之方法，其中在聲訊分段中之間距區域由選擇的候選項近似，其對應到在聲訊分段中之連續的多個次分段，各該多個選擇的候選項由一第一結束點及一第二結束點所定義，且其中該編碼包含步驟為提供指示開始點的資訊，使得允許解碼器基於該資訊而非間距區域資料重建在聲訊分段中的聲訊信號。 3·如申請專利範圍第1項之方法，其中在某些連續之次分段中間距值的數目等於或大於3。 32 1257604 10.如申請專利範圍第2項之方法，其中至少一選擇的候選項為非線性分段。 11·一種用於編碼聲訊信號的編碼裝置，該聲訊信號包含間距區域資料，該間距區域資料包含多個表示時間中之聲訊分段的間距值’該編碼裝置包含：一用於接收間距區域資料的輸入端；以及一資料處理模組，可回應該間距區域數據，產生多個簡化的間距區域分段候選項；各候選項對應到該聲訊的一次分段；其中該處理模組包含：一演算法，在各個簡化的間距區域分段候選項及在對應之次分段中之該間距值之間可得到量測之偏離值；以及一演算法，基於該量測的偏離及先選擇的準則，選擇該候選項中之一項。 12. 如申請專利範圍第11項之編碼裝置，其中，尚包含：一量化模組，用於回應該選擇的候選項，而在對應的選擇候選項之聲訊的次分段中，應用該選擇之候選項的特徵，編碼該間距區域數據。 13. 如申請專利範圍第12項之編碼裝置，其中該量化 34 1257604 模組提供聲訊數據，該長度指示在次分段中該編碼的間距區域數據，該編碼裝置尚包含：一儲存裝置，可操作該儲存裝置以連接到該量化模組，因此可以接收該聲訊數據，以將聲訊數據儲存在一聲訊媒體中。. 14. 如申請專利範圍第12項之編碼裝置，其中尚包含一輸出端，可操作該輸出端以連接到一儲存體，因此將編碼的間距區域數據提供予該儲存體以儲存該數據。 15. 如申請專利範圍第12項之編碼裝置，其中尚包含一輸出端以傳送該編碼的間距區域數據到該解碼器中，因此允許該解瑪器也基於該編碼的間距區域數據’重建該聲訊。 16. —種在一電子可讀取的媒體中實現的電腦軟體產品，其在一聲訊編碼裝置中使用，該聲訊編碼裝置提供參數以指示該聲訊，該參數包含間距區域數據，該數據包含多個間距值，這些間距值表示時間中的聲訊分段，該軟體產品包含：一編碼器，以基於該間距區域數據產生多個簡化的間距區域分段候選項，各該候選項對應該聲訊中的一次分段；一編碼器，用於在各該簡化的間距區域分段候選項 35 1257604 及在對應的次分段中的間距值之間量測偏離值；以及一編碼器，基於該量測到的偏離及預先選擇的準則選擇該候選項中的一項，因此允許一量化模組應用該選擇之候選項的特性編碼在聲訊之次分段中的間距區域數據，其中該聲訊對應到該選擇的候選項。 17·—種用於重建聲訊的解碼器，其中編碼聲訊以提供指示該聲訊的參數，該參數包含間距區域數據，該數據包含選擇表示時間中之聲訊分段的間距值，且其中時間中之聲訊分段中的間距區域數據由聲訊中的選擇連續的次分段近似，由一第一點及一第二點定義該次分段，該解碼器包含：一輸入端，以接收指示定義該次分段之端點的聲訊數據；以及一重建模組，以基於該接收的聲訊數據重建該聲訊分段。 18. 如申請專利範圍第17項之解碼器，其中在一電子媒體中記錄該聲訊，且其中操作該解碼器的輸入項以連接到用於接收該聲訊數據的電子媒體中。 19. 如申請專利範圍第17項之解碼器，其中經由一通訊頻道傳送該聲訊數據，且其中操作該解碼器的輸入以連接到該通訊頻道中，以接收該聲訊數據。 36 1257604 20. —種電子裝置，包含一用於重建一聲訊的解碼器，其中編碼聲訊以提供指示該聲訊的參數，該參數包含間距區域數據，該數據包含選擇表示時間中之聲訊分段的間"距值、且其中時間中之聲訊分段中的間距區域數據由聲訊中的選擇連續的次分段近似，由一第一點及一第二點定義該次分段，因此允許基於定義該次分段的端點重建該聲訊分段；以及一用於接收指示該端點的聲訊數據且提供聲訊數據予該解碼器的輸入端。 21. 如申請專利範圍第20項之電子裝置，其中在一電子媒體中記錄該聲訊，且其中操作該解碼器的輸入項以連接到用於接收該聲訊數據的電子媒體中。 22. 如申請專利範圍第20項之電子裝置，其中經由一通訊頻道傳送該聲訊數據，且其中操作該解碼器的輸入以連接到該通訊頻道中，以接收該聲訊數據。 23. 如申請專利範圍第20項之電子裝置，其中尚包含一行動終端機。 24.—種通訊網路，包含：選擇基地台，以及 37 1257604 選擇與該基地台進行通訊的行動台，其中該行動台中至少一台包含：一用於重建一聲訊的解碼器，其中編碼聲訊以提供指示該聲訊的參數，該參數包含間距區域數據，該數據包含選擇表示時間中之聲訊分段的間距值，且其中時間中之聲訊分段中的間距區域數據由聲訊中的選擇連續的次分段近似，由一第一點及一第二點定義該次分段，因此允許基於定義該次分段的端點重建該聲訊分段；以及一輸入端，用於接收指示該端點的聲訊數據，且提供該聲訊數據予該解碼器。 38