TWI476760B

TWI476760B - 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法

Info

Publication number: TWI476760B
Application number: TW101104538A
Authority: TW
Inventors: Christian Helmrich; Guillaume Fuchs; Goran Markovic
Original assignee: Fraunhofer Ges Forschung
Priority date: 2011-02-14
Filing date: 2012-02-13
Publication date: 2015-03-11
Also published as: PL2676270T3; JP5914527B2; CN103493129A; ES2623291T3; TW201301265A; US9620129B2; KR101525185B1; SG192714A1; US20130332177A1; BR112013020588A2; CA2827266C; RU2573231C2; AR085217A1; RU2013142072A; MY166006A; AU2012217216B2; CA2827266A1; EP2676270A1; AR098480A2; KR20140139630A

Description

用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法

本發明係有關音訊編碼，以及係特別論及交換式音訊編碼，其中，就不同之時間部分，係使用不同之編碼演算法，來產生該編碼成之信號。

一些可就不同之音訊信號部分而決定不同之編碼演算法的交換式音訊編碼器係為所習見。有一個範例為一個界定在國際標準3GPP TS 26.290 V6.1.0 2004-12中所謂之擴展型寬頻調適性多位元率編解碼器或AMR-WB+編解碼器。在此技術性專利說明書中，係說明該編碼概念，其係基於AMR-WB編解碼器，藉由添加TCX(變換編碼激發)、頻寬擴展、和立體聲，來擴展該ACELP(代數碼激式線性預測)。該AMR-WB+音訊編解碼器，係在一個內部取樣頻率FS下，處理一些等於2048個樣本之輸入訊框。該內部取樣頻率，係受限於12,800至38,400 Hz之範圍。該等2048個樣本訊框，係被分割成兩個臨界取樣等頻帶。此會產生兩個對應於低頻(LF)和高頻(HF)帶的1024個樣本之超級訊框。每個超級訊框，係被分割成四個256-樣本訊框。該內部取樣率下之取樣，係藉由使用一個可重新取樣該輸入信號之可變取樣轉換方案來獲致。該等LF和HF信號，接著係使用兩個不同之解決方案來加以編碼。該LF信號係基於交換式ACELP和TCX，而使用"核心"編碼器/解碼器，來加以編碼及解碼。在該ACELP模態中，所使用為該標準化AMR-WB 編解碼器。該HF信號係使用一個頻寬擴展(BWE)方法，以相當少之位元(16位元/訊框)來加以編碼。

自編碼器傳輸至解碼器之參數，係該等模態選定位元、該等LF參數和HF信號參數。每個1024-樣本超級訊框有關之參數，係被分解成四個同等大小之封包。當該輸入信號為立體聲時，該等左右聲道，係使結合成一個ACELP-TCX編碼有關的一些單聲道信號，而該立體聲編碼，會接收兩者之輸入聲道。在該AMR-WB+解碼器結構中，該等LF和HF頻帶，係分開加以解碼。接著，該等頻帶係結合成一個合成濾波器組。若該輸出係僅受限於單聲道，該等立體聲參數便會被省略，以及該解碼器會在單聲道模態中運作。

該AMR-WB+編解碼器，在編碼該LF信號時，會就該等ACELP和TCX模態兩者，應用LP(線性預測)分析。該等LP係數，係在每個64-樣本子訊框下以線性方式加以內插。該LP分析取音框，係一個長度384樣本之半餘弦。該編碼模態係基於閉迴路合成分析法(ABS)來加以選擇。就ACELP訊框而言，唯有256個樣本訊框會被考慮，而在TCX模態中，可能會有256、512、或1024個樣本訊框。該ACELP編碼，係包括長期預測(LTP)分析合成代數碼本激勵。在該TCX模態中，一個知覺上加權之信號，係在該變換域中加以處理。該傅立葉變換之加權信號，係使用分割式多權量柵格量化(代數向量量化)來加以量化。該變換係在1024、512、或256個樣本取音框中加以計算。該激勵信號，係透過該逆加權濾波器，藉由逆濾波一個量化加權之信號，而加以恢復。為決定某一定之音訊信號部分，是否要使用該ACELP模態或該TCX模態來加以編碼，會使用一個閉迴路模態選擇或一個開迴路模態選擇。在一個閉迴路模態選擇中，會使用11個接續之嘗試。緊跟一個嘗試之後，在兩個要被比較之模態間，會作出一個模態選擇。該選擇標準，係該加權之音訊信號與該合成之加權音訊信號間的平均節段SNR(信號雜訊比)。因此，該編碼器會執行一個在兩者編碼演算法中的完整編碼，一個依據兩者編碼演算法的完整解碼，以及繼而編碼/解碼兩者運作之結果，係使與該原始信號作比較。因此，就每個編碼演算法而言，亦即，一方面是ACELP，以及另一方面是TCX，會得到一個節段SNR值，以及會使用上述藉由就該個別之子訊框橫跨該節段SNR值而平均化使橫跨一個訊框所決定而具有較佳之節段SNR值或具有較佳之平均節段SNR值的編碼演算法。

有一個附加之交換式音訊編碼方案，為所謂之USAC編碼器(USAC=聯合語音音頻編碼)。此編碼演算法，係說明在ISO/IEC 23003-3中。該一般性結構可說明如下。首先，其中有一個常見之前/後處理系統，其具有一個可操控立體聲或多聲道處理MPEG環場功能單元和一個用以產生該輸入信號之較高音訊頻率的參數示值之增強型SBR單元。接著，其中具有兩條分支，一個包括先進型音訊編碼(AAC)工具路徑，以及另一個包括線性預測編碼(LP或LPC域)式路徑，其復賦有之特色是，該LPC殘差係或以頻域表示或以時域表示。所有就AAC和LPC兩者所傳輸之頻譜，係表示在緊接量化和算術編碼後之MDCT域中。該時域表示係使用一個ACELP激勵編碼方案。該解碼器之功能，為要找出該位元流酬載中之量化音訊頻譜或時域表示的敘述，以及要解碼該等量化值和其他重建資訊。因此，該編碼器會執行兩個決策。第一項決策為要執行頻域對線性預測域模態決策有關之信號分類。第二項決策為要在線性預測域(LPD)內，決定某一信號部分，為或使用ACELP或使用TCX來加以編碼。

為在需要極低延遲之實況中，應用一個交換式音訊編碼方案，勢必要特別留意變換式編碼部分，因為此等編碼部分，會導入一個取決於該變換長度和取音框設計之特定延遲。所以，該USAC編碼概念，由於上述具有某一涉及變遷式取音框的相當可觀之變換長度和長度調適性(亦知名為區塊交換)的改進型AAC編碼分支所致，並不適用於極低延遲應用。

另一方面，該AMR-WB+編碼概念，由於該編碼器側要被使用的究為ACELP或TCX之決策所致，被發現會很是棘手。ACELP可提供一個良好之編碼，但在某一信號部分不適合該ACELP編碼模態時，可能會有顯著之音訊品質問題產生。因此，就品質之理由而言，一旦該輸入信號未包含語音，人們或許會傾向於使用TCX。然而，在低位元率下過多地使用TCX，將會造成一些位元率問題，因為TCX提供的是一個相當低之編碼增益。所以，當人們注視該編碼增益時，一旦有可能，彼等或許會使用ACELP，但正如先前所陳述，此會由於ACELP舉例而言就音樂和類似靜態信號而言並非最佳之事實，而造成一些音訊品質之問題。

該節段SNR計算，係一種品質計量，其可僅基於該結果，亦即，該原始之信號或該經編碼/解碼之信號間的SNR是否較佳，來決定該較佳之編碼模態，以致使用一個較佳之SNR中所產生的編碼演算法。然而，此始終勢必要在位元率限制條件下運作。所以，僅使用一個品質計量，諸如舉例而言，該節段SNR計量，已發現並不會總會在品質與位元率之間，產生最佳之折衷處理。

本發明之目的，係為提供一個用以編碼部份之音訊信號的先進概念。

此目的之達成，係藉由一種依據專利申請項第1項可編碼部份之音訊信號的裝置，或藉由一種依據專利申請項第14項可編碼部份之音訊信號的方法。

本發明基於之研究結果是，一個適用於較多暫態信號部分之第一編碼演算法與一個適用於較多靜態信號部分之第二編碼演算法間的較佳決策，可在該決策不但基於一個品質計量而且附加地基於一個暫態偵測結果時得到。雖然該品質計量僅著眼於與該原始信號相關之編碼/解碼鏈的結果，該暫態偵測結果，係附加地單單取決於該原始輸入音訊信號之分析。因此，上述最後決定究要以何者編碼演算法來編碼一個音訊信號部分之兩者計量，亦即，一方面之品質結果和另一方面之暫態偵測結果，的一個組合，已發現會在一方面之編碼增益與另一方面之音訊品質間，導致一個改善之折衷處理。

一個用以編碼一個音訊信號部分使就該音訊信號部分得到一個編碼成之音訊信號的裝置，包含一個暫態偵測器，其可決定一個暫態信號是否位於該音訊信號部分，使得到一個暫態偵測結果。該裝置進一步包含一個編碼器級段，其可針對該音訊信號，執行一個第一編碼演算法，此第一編碼演算法，係具有一個第一特性，以及可針對該音訊信號，執行一個第二編碼演算法，此第二編碼演算法，係具有一個不同於該第一特性之第二特性。在一個實施例中，上述與第一編碼演算法相關聯之第一特性，係較適合較多暫態之信號，以及上述與第二編碼演算法相關聯之第二特性，係較適合較多靜態之信號。典型地，該第一編碼演算法，係一個ACELP編碼演算法，以及該第二編碼演算法，係一個TCX編碼演算法，其可能基於一個改進型離散餘弦變換、FFT變換、或任何其他變換或濾波器組。此外，有一個處理器，被設置來決定何者編碼演算法所產生編碼成之音訊信號，更近似該音訊信號部分，以得到一個品質結果。此外，係設有一個控制器，其中，該控制器經配置，可決定該音訊信號部分有關編碼成之音訊信號在產生上，或藉由該第一編碼演算法，或藉由該第二編碼演算法。依據本發明，該控制器經配置，可執行此決策，使不僅基於該品質結果，而且附加地基於該暫態偵測結果。

在一個實施例中，該控制器經配置，可決定該第二編碼演算法，雖然當該暫態偵測結果，指出一個非暫態信號時，該品質結果係指出該第一編碼演算法有關的一個較佳品質。此外，該控制器經配置，可決定該第一編碼演算法，雖然當該暫態偵測結果，指出一個暫態信號時，該品質結果係指出該第二編碼演算法有關的一個較佳品質。

在又一實施例中，該暫態結果可在其中否定該品質結果之此一決策，係使用一個遲滯功能加以增強，以致於唯有當該第一編碼演算法已為之決定的較早信號部分之數目，小於某一預定數目時，該第二編碼演算法方會被決定。類似地，唯有當該第二編碼演算法在過去已為之決定的較早信號部分之數目，小於某一預定數目時，該第一編碼演算法方會被決定。一個出自該遲滯處理之優點是，彼等編碼模態間轉變之數目，就某些輸入信號而言會被縮減。該信號中之關鍵點處的轉變過於頻繁，就低位元率而言可能會清楚地產生一些可聽聞之假像。此等假像之可能性，係藉由體現該遲滯作用而使縮減。

在又一個實施例中，當該品質結果，就一個演算法編碼，指出一個有說服力之品質優點時，該品質結果相對於暫態偵測結果係屬有利。接著，上述比起另一個編碼演算法具有好甚多之品質結果的編碼演算法會被選定，而無論該信號是否為一個暫態信號。另一方面，當兩者編碼演算法間之品質差異並非如此高時，該暫態偵測結果可變為決定性。就此一目的而言，較佳的是不僅決定一個二元品質結果，而且決定一個定量性品質結果。一個二元品質結果，或將僅指出何者編碼演算法，會產生一個較佳之品質，而一個定量性品質結果，不僅會決定何者編碼演算法，會產生一個較佳之品質，而且會決定該對應之編碼演算法究有多好。另一方面，人們或亦可使用一個定量性暫態偵測結果，而一個二元暫態偵測結果，基本上或將同樣是充份的。

因此，一方面相對於位元率間之良好折衷處理，以及另一方面相對於品質，本發明可提供一個特殊之優點，因為就暫態信號而言，上述產生較低品質之編碼演算法會被選定。當該品質結果有利於舉例而言TCX決策時，該ACELP模態仍然會被採用，其或可能會產生一個約略降低之音訊品質，但最終會產生一個與使用該ACELP模態相關聯之較高的編碼增益。

另一方面，當該品質結果有利於一個ACELP訊框時，一個TCX決策仍然會就非暫態信號被採用。因此，該約略降低之編碼增益會被接受，使有利於一個較佳之音訊品質。

因此，本發明會在品質與位元率之間，產生一個改進之折衷處理，此基於之事實是，所考慮的不僅是該被編碼再被解碼之信號的品質，但除此之外，該實際要被編碼之輸入信號，亦會相對於其暫態特性加以分析，以及此暫態分析之結果會被使用，使附加地影響有關一個較適合暫態信號之演算法或一個較適合靜態信號之演算法的決策。

圖式簡單說明

本發明之又一實施例，繼而係藉由參照所附繪圖來加以例示，其中：第1圖例示依據一個實施例用以編碼部份之音訊信號的裝置之方塊圖；第2圖例示一個有關兩個不同之編碼演算法的列表和彼等適用之信號；第3圖例示該等品質狀況、暫態狀況、和遲滯狀況方面之概觀，彼等可彼此獨立地加以應用，但彼等較佳的是加以聯合地應用；第4圖例示一個可指出就不同之處境是否執行一個轉變的狀態表；第5圖例示一個用以決定一個實施例中之暫態結果的流程圖；第6a圖例示一個用以決定一個實施例中之品質結果的流程圖；第6b圖例示針對第6a圖之品質結果的更多細節；而第7圖則例示依據一個實施例用以編碼之裝置的更加詳細之方塊圖。

第1圖例示一個用以編碼在一條輸入線路10處所提供之音訊信號部分的裝置。該音訊信號部分，係輸入進一個暫態偵測器12內，以偵測是否有暫態信號位於該音訊信號部分內，使在線路14上面，得到一個暫態偵測結果。此外，有一個編碼器級段16提供，其中，該編碼器級段經配置，可針對該音訊信號，執行一個第一編碼演算法，該第一編碼演算法，具有一個第一特性。此外，該編碼器級段16經配置，可針對該音訊信號，執行一個第二編碼演算法，其中，該第二編碼演算法，具有一個不同於第一特性之第二特性。

附加地，該裝置包含一個處理器18，其可決定該等第一和第二編碼演算法中，何者編碼演算法，會產生一個編碼成而更近似該原始音訊信號部分之音訊信號。該處理器18係基於該線路20上面之此一決策，來產生一個品質結果。該線路20上面之品質結果和該線路14上面之暫態偵測結果兩者，會提供給一個控制器22。該控制器22經配置，可決定就該音訊信號部分編碼成之音訊信號，為或由該第一編碼演算法來產生，或由該第二編碼演算法來產生。就此一決策而言，不僅是該品質結果20會被使用，而且該暫態偵測結果14亦會被使用。此外，有一個輸出介面24，可選擇地提供，其中，該輸出介面，會輸出一個編碼成之音訊信號，而舉例而言，作為一個在線路26上面編碼成之信號的位元流或不同之示值。

在一個實現體中，在該編碼器級段16，藉由合成處理來執行一項分析的情況中，該編碼器級段16，會接收此音訊信號之同一部分，以及會藉由該第一編碼演算法，來編碼此音訊信號部分，使得到該音訊信號部分之第一編碼成之示值。此外，該編碼器級段，會使用該第二編碼演算法，來產生該音訊信號之同一部分的編碼成之示值。此外，該編碼器級段16，在藉由合成處理之此一分析中，係包含就該等第一編碼演算法和第二編碼演算法兩者有關之解碼器。有一個對應之解碼器，使用一個與該第一編碼演算法相關聯之解碼演算法，來解碼該第一編碼成之示值。此外，有一個用以執行又一個與該第二編碼演算法相關聯之解碼演算法的解碼器提供，以致最終該編碼器級段，不僅擁有兩個與該音訊信號之同一部分有關的編碼成之示值，而且亦擁有兩個與該線路10上面之原始音訊信號的同一部分有關之解碼成的示值。該兩解碼成之信號，接著會經由線路28提供給該處理器，以及該處理器會使兩者解碼之示值，與經由輸入端30得到之原始音訊信號的同一部分相比較。接著，每個編碼演算法有關之節段SNR會被決定。此所謂之品質結果，在一個實施例中，提供的不僅是該較佳之編碼演算法的示值，亦即，一個已產生一個較佳之SNR的為該第一編碼演算法或該第二編碼演算法之二元信號。附加地，該品質結果會指出一個定量性資訊，亦即，該對應之編碼演算法究有多好，舉例而言多少分貝。

在此一處境中，該控制器在完全取決於該品質結果20時，會經由線路32，來存取該編碼器級段，而使該編碼器級段，將該對應之編碼演算法早經儲存的編碼成之示值，轉送給該輸出介面24，以致該編碼成之示值，可表示該編碼成之音訊信號中的原始音訊信號之對應部分。

或者，當該處理器18，執行一個開迴路模態，以決定該品質結果時，兩者編碼演算法，並非必然要應用至一個且同一個音訊信號部分。取而代之的是，該處理器18，會決定何者編碼演算法屬較佳，以及接著，該編碼器級段16，係經由線路28加以控制，使僅應用該處理器所指出之編碼演算法，以及接著，該被選定之編碼演算法所產生的此一編碼成之示值，會經由該線路34，提供給該輸出介面24。

取決於該編碼器級段16之特定實現體，兩者編碼演算法，可能會在該LPC域中運作。在此一狀況中，諸如就ACELP為該第一編碼演算法以及TCX為該第二編碼演算法而言，會有一個常見之LPC預處理被執行。此LPC預處理，可能包括該音訊信號部分之LPC分析，其可決定該音訊信號部分有關之LPC係數。接著，有一個LPC分析濾波器，係使用該被決定之LPC係數來加以調整，以及該原始音訊信號，會被此LPC分析濾波器濾波。接著，該編碼器級段，會計算該LPC分析濾波器之輸出與該音訊輸入信號間的一個逐樣本之差異，藉以計算該LPC殘差信號，其接著會歷經一個開迴路模態中之第一編碼演算法或第二編碼演算法，或者其係如先前所說明，在一個閉迴路模態中，提供給兩者編碼演算法。或者，該LPC濾波器所為之濾波，和該殘差信號之逐樣本決策，可以該USAC標準中所說明之FDNS(頻域雜訊成形)技術來替換。

第2圖例示該編碼器級段之較佳實現體。就該第一編碼演算法而言，上述具有一個CELP編碼特性之ACELP編碼演算法會被使用。此外，此編碼演算法，係較適合暫態信號。該第二編碼演算法，具有某一編碼特性，其可使此第二編碼演算法，較適合非暫態信號。典型地，有一個類似TCX 之變換激勵編碼演算法會被使用，以及特言之，一個TCX 20編碼演算法係屬較佳，其具有一個20 ms之訊框長度(由於重疊所致，取音框長度可較高)，其使得第1圖中所例示之編碼概念，特別適合低延遲實現體，彼等在一些即時實況中係屬必需，諸如一些其中如在電話應用中以及特別是在行動電話或蜂巢式電話應用中具有雙通路通訊之實況。

然而，本發明在該等第一和第二編碼演算法之其他組合中，係附加地屬有用。典型地，上述較適合暫態信號之第一編碼演算法，可能包含任何習見之時域編碼器，諸如使用GSM之編碼器(G.729)，或任何其他時域編碼器。另一方面，該非暫態信號編碼演算法，可為任何習見之變換域編碼器，諸如MP3、AAC、AC3、或任何其他變換或濾波器排組式音訊編碼演算法。然而，就一個低延遲實現體而言，一方面是ACELP和另一方面是TCX之組合，其中，特別地，該TCX編碼器，可使基於一個FFT，或甚至更佳的是基於一個MDCT，而較佳的是具有一個短取音框長度。因此，兩者編碼演算法，係在上述藉由使用一個LPC分析濾波器使該音訊信號變換成該LPC域而取得之LPC域中運作。然而，該ACELP接著會在LPC-"時"-域中運作，而該TCX編碼器，會在該LPC-"頻"-域中運作。

繼而，第1圖之控制器22的較佳實現體，係在第3圖之環境背景中加以討論。

較佳的是，上述類似ACELP之第一編碼演算法與上述類似TCX 20之第二編碼演算法間的轉變，係使用三種條件來執行。該第一條件係第1圖之品質結果20所表示之品質條件。該第二條件係第1圖之線路14上面的暫態偵測結果所表示之暫態條件。該第三條件係一個遲滯條件，其係取決於該控制器22過去所為之決策，亦即，有關該音訊信號之較早部分。

該品質條件在體現上，可在該品質條件指出該第一編碼演算法與該第二編碼演算法間的一個大品質距離時，執行一個至該較高品質編碼演算法之轉變。舉例而言，當一個編碼演算法被決定，優於另一個編碼演算法時，舉例而言，多達一個dB SNR差異時，則該品質條件會決定一個轉變，或者換個角度而論，就該音訊信號實際考慮之部分，實際使用之編碼演算法，而無關乎任何暫態偵測或遲滯處境。

然而，當該品質條件，僅指出一個在兩者編碼演算法間之小品質距離時，諸如一或以下dB SNR差異之品質距離，而在該暫態偵測結果指出，該較低品質編碼演算法，係符合該音訊信號特性時，亦即，無論該音訊信號是否為暫態，有一個轉變至該較低品質編碼演算法可能會發生。然而，當該暫態偵測結果指出，該較低品質編碼演算法，並不符合該音訊信號特性時，則該較高之品質編碼演算法，勢必要被使用。在後者之情況中，再一次，該品質條件會決定該結果，但唯有當該較低品質編碼演算法與該音訊信號之暫態/靜態處境間的一個特定匹配並未配合在一起時。

該遲滯條件在與該暫態條件之組合中，係特別有用，亦即，其中，唯有當少於最後N個訊框已以另一個演算法加以編碼時，方會執行至該較低品質編碼演算法之轉變。在一些較佳之實施例中，N係等於五個訊框，但同樣可使用的，是其他較佳地低於或等於N個訊框或信號部分之值，彼等各包含某一超過以128個樣本為例之最小數目的樣本。

第4圖例示一個取決於某一定處境之狀態改變表。左欄指出就TCX或ACELP而言之較早訊框的數目為大於N或小於N之處境。

最後一行指出其中是否就TCX而言有一個大品質距離，或就ACELP而言有一個大品質距離。在此兩處境中，彼等係頭兩欄，以一個"X"表示之情況，會有一個改變被執行，以"0"表示之情況，則無改變被執行。

此外，該最後兩欄指出的處境是，當就TCX有一個小品質距離被決定時，以及當有一個暫態信號被偵測到時，或者當就ACELP有一個小品質距離被決定，以及該信號部分被偵測為屬非暫態時。

該最後兩欄之頭兩行兩者指出，當較早訊框之數目大於10時，該品質結果係屬決定性。因此，當其中就一個編碼演算法有一個來自過去之有說服力的指示時，則該暫態偵測亦下會發揮作用。

然而，當正在該兩編碼演算法中的一個之中編碼的較早訊框之數目小於N時，有一個在欄位40處所指出就暫態信號自TCX至ACELP之轉變會被執行。附加地，如欄位41所指出，有一個自ACELP至TCX之改變會被執行，即使是當由於吾等具有一個非暫態信號之事實所致，其中存在一個有利於ACELP之小品質距離時。當該最後LCLP訊框之數目小於N時，後繼之訊框亦會以ACELP來編碼，以及因而如欄位42處所指出，並不需要轉變。附加地，當TCX訊框之數目小於N時，以及當其中就ACELP存在一個小品質距離，以及該信號為非暫態時，當前之訊框便會使用TCX來編碼，以及如欄位43處所指出，並不需要轉變。因此，該遲滯之影響，藉由比較欄位42、43與此兩欄位上方的四個欄位，係清楚可見。

因此，本發明較佳的是，藉由一個暫態偵測器之輸出，來影響該閉迴路決策有關之遲滯。所以，如同在AMR-WB+中，其中無論採用的是TCX或ACELP，並不會有一個純閉迴路決策存在。取而代之的是，該閉迴路計算，會受到該暫態偵測結果之影響，亦即，每一個暫態信號部分，係在該音訊信號中被決定。所以，無論被計算的為一個ACELP訊框或一個TCX訊框之決策，並不僅取決於該閉迴路計算，或者一般而言，該品質結果卻是附加地取決於一個是否偵測到一個暫態。

換言之，該用以決定就當前之訊框究要使用何者編碼演算法之遲滯，可使表示如下：當就TCX而言之品質結果，略小於就ACELP而言之品質結果時，以及在當前考慮之信號部分，或者僅僅是當前之訊框，並非為暫態時，則TCX會被使用而非ACELP。

另一方面，當就ACELP而言之品質結果，略小於就TCX而言之品質結果時，以及當該訊框為暫態時，則所使用為ACELP而非TCX。較佳的是，有一個平坦度計量，係被計算為該暫態偵測結果，其係一個定量性數字。當該平坦度大於或等於某一定值時，則該訊框會被決定為屬暫態。另一方面，當該平坦度小於此臨界值時，則該訊框係被決定為非暫態。就一個臨界值而言，平坦度計量為二係屬較佳，而該平坦度之計算，係更詳細地說明於第5圖中。

此外，就該品質結果而言，一個定量性計量係屬較佳。當一個SNR計量，或者特別地，一個節段SNR計量被使用時，則如先前使用之術語"略小於"，可能意謂小於一分貝。因此，當就TCX和ACELP而言之SNR，彼此差異較大時，或者換個角度而論，當兩者SNR值間之絕對差異，大於一分貝時，則第3圖之品質條件，會單獨就該當前之音訊信號部分，而決定該編碼演算法。

上文所說明之決策，在該等過去的或較早的訊框之TCX或ACELP的暫態偵測或遲滯輸出或SNR，包括在該假設之條件中時，可進一步加以精心製作。因此，有一個遲滯被建立，其就一個實施例而言，在第3圖中係例示為條件3。特言之，第3圖例示的變更形式係當該遲滯輸出，亦即，有關過去之決策，被用來修飾該暫態條件時。

或者，一個基於較早之TCX或ACELP-SNR的進一步遲滯條件可能包括的是，一個有關該較低品質編碼演算法之決策，係唯有當相對於該較早之訊框的SNR差異之改變，為低於某一所舉為例之臨界值時，方會被執行。一個進一步之實施例，在該暫態偵測結果，為一個定量性數字時，可能包含一個或多個較早訊框有關之暫態偵測結果的用法。接著，一個至該較低品質編碼演算法之轉變，舉例而言，可能唯有當自較早之訊框至當前之訊框的定量性暫態偵測結果之改變，為再一次低於一個臨界值時，方會被執行。此等用以進一步修飾第3圖中之遲滯條件3的數字之其他組合，可證明係屬有用，以得到一方面為該位元率與另一方面為該音訊品質間之較佳折衷處理。

此外，如第3圖之環境背景中所例示及如先前所說明之遲滯條件可代替或附加又一個遲滯加以使用，後者舉例而言，係基於該等ACELP和TCX編碼演算法之內部分析資料。

繼而，係參照第5圖，來例示第1圖之線路14上面的暫態偵測結果之較佳決策。

在步驟50中，上述類似在線路10上面之PCM輸入信號的時域音訊信號，係經高通濾波，使得到一個高通濾波之音訊信號。接著，在步驟52中，上述可使等於該音訊信號部分之高通濾波信號的訊框，係被細分為以八個為例之多數子區塊。接著，在步驟54中，每個子區塊有關的一個能量值會被計算。此能量計算可包括平方化該子區塊中的每個樣本值，和繼而使該等平均化與否之平方化的樣本相加。接著，在步驟56中，係形成相鄰子區塊之配對。該等配對可包括：一個包含第一和第二子區塊之第一配對、一個包含第二和第三子區塊之第二配對、一個包含第三和第四子區塊之第三配對、等等。附加地，一個包含該較早之訊框的最後子區塊和該當前之訊框的第一子區塊之配對，同樣可被使用。或者，有其他形成配對之方式可被執行，諸如舉例而言，僅形成第一和第二子區塊之配對、第三和第四子區塊之配對、等等。接著，亦如在第5圖之區塊56中所概括，每個子區塊配對之較高的能量值會被選定，以及如步驟58所概括，係使除以該子區塊配對之較低能量值。接著，如第5圖之區塊60中所概括，步驟58就一個訊框而言之所有結果係使相結合。此結合可能包括使區塊58之結果相加及平均化，其中，該相加結果係除以配對數目，諸如當每個子區塊有八個配對在區塊56中被決定時的八個。區塊60之結果係該平坦度計量，其會被該控制器22使用，以決定一個信號部分是否為暫態。當該平坦度計量，大於或等於2時，會有一個暫態信號部分被偵測到，而當該平坦度計量低於2時，會有一個信號，被決定為非暫態或靜態。然而，其他在1.5與3間之臨界值，同樣可被使用，但2之臨界值已顯示會提供最佳之結果。

理當注意的是，其他之暫態偵測器同樣可被使用。一些暫態信號，可能附帶包含有聲語音信號。傳統上，一些暫態信號係包含鼓掌狀信號或響板或一些由談話字元"p"或"t"或等等得到之信號所組成的語言爆破音。然而，一些類似"a"、"e"、"i"、"o"、"u"之元音，在傳統解決方案中，並非意謂為暫態信號，因為彼等具有週期性聲門化或音調脈波之特性。然而，由於元音亦表示一些有聲語音信號，元音就本發明而言，亦被考慮為暫態信號。此等信號之偵測在完成上，除第5圖之程序外或替代地，可藉由一些可辨別有聲語音與無聲語音之語音偵測器，或者藉由評估與一個音訊信號相關聯之元資料，以及將該對應之部分為一個暫態或非暫態部分，指示給一個元資料評估器。

繼而，第6a圖在說明上係為例示第三種計算第1圖之線路20上面之品質結果的方式，亦即，該處理器18如何做較佳之配置。

在區塊61中，係說明一個閉迴路程序，其中，就每個多數之可能性而言，一個部分係使用該等第一和第二編碼演算法，來加以編碼及解碼。接著，在步驟63中，一個類似節段SNR之計量，係依據該等編碼及再次解碼之音訊信號與該原始信號間的差異來計算。此計量係就兩者編碼演算法加以計算。

接著，一個使用個別之節段SNR的平均節段SNR，係在步驟65中加以計算，以及此計算會就兩者編碼演算法再次加以執行，以致最終在步驟65中，會就該音訊信號之同一部分，產生兩個不同之平均SNR值。此等有關一個訊框之節段SNR值間的差異，係被用作第1圖之線路20上面的定量性品質結果。

第6b圖例示兩個方程式，其中，上部方程式係被用在區塊63中，以及下部方程式係被用在區塊65中。χ_w 代表該加權之音訊信號，以及代表該編碼及再次解碼之加權信號。

在區塊65中所執行之平均化，係橫跨一個訊框之平均化，其中，每個訊框係包含許多子訊框N_SF ，以及四個此等訊框，共同形成一個超訊框。因此，一個超訊框包含1024個樣本，一個個別之訊框，包含2056個樣本，以及第6b圖中之上部方程式或步驟63為之執行的每個子訊框，包含64個樣本。在區塊63中所使用之上部方程式中，n為樣本數目指數，以及N為該子訊框中等於63之最大樣本數目，而指示一個子訊框，為具有64個樣本。

第7圖例示本原創性類似第1圖之實施例用以編碼的裝置之又一實施例，以及相同之參考數字，係指明類似之元件。然而，第7圖例示該編碼器級段16之較詳細的表示圖，其包含一個用以執行加權和LPC分析/濾波之預處理器16a，以及此預處理器區塊16a，會將線路70上面之LPC資料，給該輸出介面24。此外，第1圖之編碼器級段16，包含16b處之第一編碼演算法和16c處之第二編碼演算法，彼等分別為該ACELP編碼演算法和該TCX編碼演算法。

此外，該編碼器級段16，可能或包含一個連接在該等區塊16d、16c前面之開關16d，或包含一個連接在該等區塊16b、16c後面之開關16e，其中，"前面"和"後面"係指稱信號流動方向，其自第7圖之頂部至底部，至少相對於區塊16a至16e。區塊16d將不會出現在一個閉迴路決策中。在此情況中，唯有開關16e將會出現，因為該等編碼演算法16b、16c兩者，係針對該音訊信號的一個且同一部分而運作，以及該被選定之編碼演算法的結果，將會被取出，以及會轉送給該輸出介面24。

然而，若一個開迴路決策或任何其他決策之執行，係在兩者編碼演算法針對一個且同一信號而運作之前，則該開關16e將不會出現，但該開關16d將會出現，以及該音訊信號的每個部分，將僅會使用該等區塊16b、16c中的一個來編碼。

此外，特別是就閉迴路模態而言，兩者區塊之輸出，如線路71、72所指明，係連接至該等處理器和控制器區塊18、22。該開關控制，係經由線路73、74，自該等處理器和控制器區塊18、22，至該等對應之開關16d、16e，而使發生。再次地，依據該實現體，該等線路73、74中，通常將僅有一個會在該處。

所以，該編碼成之音訊信號26，且姑不論其他資料，係包含一個ACELP或TCX之結果，其通常將會加上冗餘性編碼，諸如在輸入進該輸出介面24內之前，藉由Huffman編碼或算術編碼。附加地，該LPC資料70，會提供給該輸出介面24，以使納入該編碼成之音訊信號。此外，較佳的是將一個編碼模態決策，附加地包括進該編碼成之音訊信號內，後者會對一個解碼器指示，該音訊信號之當前部分，為一個ACELP或TCX部分。

雖然某些形貌已在一個裝置之環境背景中加以說明，此等形貌很明顯亦表示該對應方法之說明，其中，一個區塊或裝置，係相對於一個方法步驟或一個方法步驟之特徵。類似地，在一個方法步驟之環境背景中說明的形貌，亦表示一個對應之區塊或項目或一個對應之裝置的特徵之說明。

依據某一定實現體之規範，本發明之實施例，可體現在硬體或軟體中。該實現體在執行上，可使用一個數位儲存媒體，舉例而言，其上儲存有電子可讀取式控制信號之磁片、DVD、CD、ROM、PROM、EPROM、EEPROM、或快閃記憶體，彼等可與一個可程式規劃式電腦系統協動(或者有能力協動)，以執行該對應之方法。

某些依據本發明之實施例，包含一個具有電子可讀取式控制信號之非暫時性資料載送器，其係有能力與一個可程式規劃式電腦系統協動，以執行本說明書所說明之方法中的一個。

通常，本發明之實施例，可使體現為一個程式碼之電腦程式產品，該程式碼在運作上，可使該電腦程式產品，在一部電腦上面運行時，執行該等方法中的一個。該程式碼舉例而言，可能係儲存在一部機器可讀取式載體上面。

其他實施例包括上述用以執行本說明書所說明之方法中的一個之電腦程式，其係儲存在一部機器可讀取式載體上面。

換言之，本原創性方法的一個實施例，因而為一個電腦程式，其具有一個程式碼，其在該電腦程式在一部電腦上面運行時，可執行本說明書所說明之方法中的一個。

所以，本原創性方法之又一實施例，為一個資料載體 (或一個數位儲存媒體，或一個電腦可讀取式媒體)，其上記錄有上述用以執行本說明書所說明之方法中的一個之電腦程式。

所以，本原創性方法之又一實施例，為一個代表該用以執行本說明書所說明之方法中的一個之電腦程式的資料串流或信號序列。該資料串流或信號序列，舉例而言，經配置可能使經由一個資料通訊連接，舉例而言，經由網際網路，來加以轉移。

又有一個實施例，包括一個處理構件，舉例而言，一個電腦、或一個可程式規劃式邏輯裝置，其經配置或經調適可執行本說明書所說明之方法中的一個。

又有一個實施例，包括一個電腦，其上安裝有上述用以執行本說明書所說明之方法中的一個之電腦程式。

在某些實施例中，一個可程式規劃式邏輯裝置(舉例而言，一個現場可規劃邏輯閘陣列)，可能被用來執行本說明書所說明之方法的某些或所有功能性。在某些實施例中，一個現場可規劃邏輯閘陣列，可能與一個微處理器協動，以執行本說明書所說明之方法中的一個。通常，該等方法較佳的是由任何硬體裝置來執行。

上文所說明之實施例，係僅為例示本發明之原理。理應瞭解的是，本說明書所說明之佈置的修飾體和變更形式和細節，將為本技藝之其他專業人士所明瞭。所以，其預期係僅受限於緊接之專利申請項之界定範圍，而非受限於本說明書中之實施例的說明和解釋所呈現之特定細節。

10‧‧‧音訊信號

12‧‧‧暫態偵測器

14‧‧‧暫態檢測結果

16‧‧‧編碼器級段

16b‧‧‧第一編碼演算法(ACELP)

16c‧‧‧第二編碼演算法(TCX)

16d‧‧‧開關

16e‧‧‧開關

18‧‧‧處理器

20‧‧‧品質結果

22‧‧‧控制器

24‧‧‧輸出介面

26‧‧‧編碼成之音訊信號

28‧‧‧線路

30‧‧‧輸入端

32‧‧‧線路

34‧‧‧線路

40-43‧‧‧欄位

50-60,61,63,65‧‧‧運作

71,72,73,74‧‧‧線路

第1圖例示依據一個實施例用以編碼部份之音訊信號的裝置之方塊圖；第2圖例示一個有關兩個不同之編碼演算法的列表和彼等適用之信號；第3圖例示該等品質狀況、暫態狀況、和遲滯狀況方面之概觀，彼等可彼此獨立地加以應用，但彼等較佳的是加以聯合地應用；第4圖例示一個可指出就不同之處境是否執行一個轉變的狀態表；第5圖例示一個用以決定一個實施例中之暫態結果的流程圖；第6a圖例示一個用以決定一個實施例中之品質結果的流程圖；第6b圖例示針對第6a圖之品質結果的更多細節；而第7圖則例示依據一個實施例用以編碼之裝置的更加詳細之方塊圖。