TWI275253B - Method and encoder for encoding a signal - Google Patents

Method and encoder for encoding a signal Download PDF

Info

Publication number
TWI275253B
TWI275253B TW094112500A TW94112500A TWI275253B TW I275253 B TWI275253 B TW I275253B TW 094112500 A TW094112500 A TW 094112500A TW 94112500 A TW94112500 A TW 94112500A TW I275253 B TWI275253 B TW I275253B
Authority
TW
Taiwan
Prior art keywords
frame
excitation
signal
encoder
coding
Prior art date
Application number
TW094112500A
Other languages
English (en)
Other versions
TW200605518A (en
Inventor
Jari M Makinen
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of TW200605518A publication Critical patent/TW200605518A/zh
Application granted granted Critical
Publication of TWI275253B publication Critical patent/TWI275253B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

1275253 九、發明說明: 【發明所屬之技術領域】 本發明係關於一種通訊系統編碼器之訊號、編碼方 法。 、、 【先前技術】
細胞式通訊系統已非常普遍,這種系統常依據某種 標準或規格運作,這些標準或規格定義出一種通定 且/或進行連結時所用的參數。各種標準與規格例如有 GSM (全球行動通訊系統)、AMPS (進階行動;話服務 糸統)、WCDMA(寬頻分工多重掘取糸統)或第三代(3 G ) UMTS (全球行動通訊系統)、IMT 2000 (國際行動通訊 系統2000)等。 細胞式通訊系統與一般訊號處理系統通常會將訊號 壓縮以便減少可代表訊號的資訊量,舉例來說,聲音訊 號通常以類比訊號記錄,再用類比數位轉換器轉換成數 位訊號後編碼。細胞式通訊系統之編碼的訊號可透過無 線的空氣介面從基地台傳送至使用者的裝置,例如移動 式的終端裝置,此外也可如訊號處理系統常見的應用, 將編碼的聲音訊號儲存於媒體以便爾後還原。 編碼壓縮訊號,如細胞式通訊系統方可以最低的資 料|透過無線的空氣介面傳輸資料且維持良好的訊號品 質’此對細胞式通訊系統必須透過無線的空氣介面無線 電通迢的有限負載能力尤為重要。 理想的編碼方法儘可能將聲音訊號轉為最少的位元 1275253 以維持傳輸通道的品質並使解碼還原的聲音可以儘可能 近似原來的聲音,實務上則必須在編碼方法的位元速率 與所還原聲音的品質間做一取捨。 一壓縮編碼可為有損或無損,有損的壓縮會失掉某些 1矾且無法從壓縮後的訊號完全重建原訊號,無損的壓 細貝】元王保留所有資訊並可從壓縮後的訊號完全重建原 有號。聲音訊號有談話、音樂(非談話)或同時含有 =者的,因談話與音樂聲音訊號特性有所不同,因此要 "又叶=種能符合兩者編碼的方法有其困難,常見的編碼 方利於談話性質而較不利於音樂性質或非談話性質 S,因此,有必要設計一種適用於兩者的編碼方法, 惟〃先決條件則是要能夠事先分辨聲音的屬性。 要分辨聲音屬於談話或音樂/非談話並不容易, 精確度則視訊號的應用而定,如談話辨識或存槽 /、松索的應用其精確度就變得非常重要。 田 然而要發明一種能同時對以談話為主或以
的=音都有效率的編碼方法是可能的。一種適用音 樂的編喝方法同樣也適用於談話的聲音編碼, '所二 壓法並不表定選擇的是最佳 &、、、倍耳音訊竣的方法。 適應性多重位元率(AMR)編碼/解碼界 GSM/EDGE肖WCDMA通訊线之第三代合 許 劃(3GPP)發展出來的一種編碼方法,可預見也將 被運用在未來的封包交換網路上。ARM以代數碼激勵線 1275253 性預測(ACELP )編碼為基礎,AMR與AMR寬頻 (AMR-WB)編碼/解碼器分別含有8與9個活動位元傳 輸率並含有聲音靜止偵測(VAD)與不連續傳輸(DTX) 功能。AMR編碼/解碼器的取樣速率為8 kHz,AMR-WB 的取樣速率為16 kHz。
AMR與AMR_WB的編碼/解碼器詳細方法可在 3GPP TS26.090與3GPP TS26 19〇技術規格中找到, AMR-WB編碼/解碼器與vaD的更多細節可在3GPP TS26.194技術規格中找到。 另一種編碼方法AMR-WB(AMR-WB+)編碼/解碼器 係以兩種不同的激勵方法為基礎:脈衝相似激勵 (ACELP)與轉換編碼(TCX)激勵。ACEU^勵與在 原始AMR-WB編碼/解碼器所用的相同,Tcx激勵是 AMR-WB+的特定變化型。 ACELP激勵編碼偵測訊號在資料源如何生 訊號擷取模式參數,更深人來說,ACELp編碼係、基於= f聲音系ί的模式,把人的喉嚨與嘴巴模擬為線ί過濾 益’訊號是由錢刺激過濾㈣仙性震動產生^ 框’每個訊框都會經由、: 包含激勵參數、過濾器的係數和其他參數冒 以一個正確組態的解碼器再生輸入訊號。、M、,且簽數 AMR· WB+編碼/解碼n的線性預測 每一個訊框計算並把訊號的頻譜封套模擬為 7 1275253 為。線性預測編碼的結果稱為線性預測編碼激勵,透 ACELP激勵或TCX激勵予以編碼。 通常ACELP激勵會運用長程預測器與固定碼冊參 數’ TCX激勵則用快速富利葉轉換()。此外, AMR- WB編碼/解碼器的TCX激勵可從三種不同的訊框 長度(20、40或80ms )擇一使用。
TCX激勵已廣泛使用於非談話性質的聲音編碼,將 TCX激勵運用在非談話性質聲音編碼的優勢乃在使用 知覺遮罩與頻域編碼的緣故,惟即使TCX技術提供了較 佳的音樂訊號品質,其品質對週期性談話訊號卻不好。 反之以人類談話性質為基礎的編碼/解碼器,例如 ACELP,提供較佳的談話性質音訊品質,對音樂訊號的 因此一般來說ACELP激勵大部分用於談話性質訊 號的編碼,TCX激勵則大部分用於音樂與其它非兮=陡 質的訊號之編碼,但狀況也不全然如此,就如有日: 話性質的訊號會含有部分類似音樂的訊號、音樂 亦會含有部分類似談話性質的訊號,亦即有些I立:$ 同時含有談話與音樂,但是單獨以ACELP數 激勵為基礎的方法編碼,這樣所呈現的結果就不3一定是 AMR-WB激勵方式的選擇可以用下的方式争—· 首先也是最簡單的方是就是在編碼前進彳^訊^特性 的分析,先將訊號歸類為談話性質或者音樂性質/非°談話 1275253 性質的訊號後,再從ACELP與TCX選出最佳的激勵方 式,此謂之「前選擇」,不過這種方法並不適用於同時含 有談話性質與音樂性質的聲音訊號,其選擇結果並不最 適用於談話性質或音樂性質的訊號。
較複雜的方式是同時使用ACELP與TCX激勵編 碼,選擇基於綜合的聲音訊號較適用於哪一種編碼。訊 號的品質可用訊號雜訊類型的演算法衡量,這樣以綜合 分析類型為基礎的方法也叫做「強力攻擊」法,它經過 各種不同的激勵方式都計算過以後選擇最佳的一種以便 達到最佳結果,然而實務上卻因各種方法的計算複雜度 而不可行。 本發明實作的目標就是為提供一種至少能解決部分 上述問題的激勵選擇方法改良方式。 【發明内容】 本發明的第一部份為提供一通訊系統編碼器編碼訊 框的方法,上述方法包含以下步驟··計算與訊框相關的 第一組參數,該組參數包含過濾器排參數;第一階段, 用與第一組參數相關的先決狀況,從各種編碼方法選擇 一種編碼方法後計算與訊框相關的第二組參數;在第二 階段,用第一階段選出的編碼方法與第二組參數選出編 碼方法,再用第二階段選擇的編碼方法編碼訊框。 各種編碼方法最好含有第一激勵方法與第二激勵方 法。 第一組參數可用訊框的一個或多個頻寬能階為基礎 1275253 產生,由第一組參數相 階選出編碼方法。 ,、各種先決狀況尚無法在第一 第二組參數可能包含 LTP參數與關連參數。 J至父一個訊框頻暮參表^ 苐一激勵方法最好 第二激勵方法最好代數碼激勵的線性預測激勵,
崎轉換編碼激勵。 ,佺的編碼器是AMR-WB+編碼器。 當汛框用第二激勵方法編碼時,該編碼方法 用在第一階段與第二階段選擇出的第二激勵 ^ 編碼訊框的長度。 乃决采k擇 編碼訊框的長度的選擇可用訊框的訊號雜吒比 定。 ° 訊框有可能是音訊的訊框,音訊訊框最好包含談話 或非談話性質的訊號,非談話性質音訊可能含有音樂。 本發明的另一重點為提供一通訊系統中編碼訊框的 i 編碼器,所述的編碼器包含:用來計算與訊框相關的第 % :組參數之第一計算模組(該第一組參數含有過濾器排 多數)、以弟一組茶數為基礎選擇編瑪方法的第一階段選 擇板組、用來计鼻與§孔框相關的第二組蒼數之第二計管 模組、以第一階段之選擇與第二組參數與為基礎之選^ 、、扁石馬方法的苐一階段選擇模組,和一個用第二階段所選 擇的編碼方法編碼訊框的編碼模組。 本發明的另一重點是提供一通訊系統中編碼訊框的 方去。項之方法包含以下步驟:計算與訊框相關的第一 10 1275253 (該第-組參數含有過排參數)、 組參數選擇出第—激勵方法或第二激勵方= 將讯框用所選的方法編碼。 万法亚 【實施方式】 並不==t:些特別的例子,惟本發明的内涵 T系統1GG③含了類比轉數位(A/D) 1〇4、編碼器觸、發射器1〇8、接收器n〇 與數位轉類比(D/A)鳇拖哭1泣 各 ”、、时12 的元件 )轉換114等可建置部分基地台 通矾系統100包含一種或多種音源,例如第工圖中 有顯示、產生包含談話與/或非談話訊號音訊ι〇2的 夕,。類比訊號102被類比轉數位(A/D)轉換器1〇4 接收並將類比吼號1〇2將訊框用所選擇的編碼方法,以 訊框逐一轉換的方式轉為數位訊號105並產生編碼訊框 忉7。編碼器可用AMR_WB+編碼/解碼器或其它適用的 編碼/解碼器,以下將詳述相關細節。 編碼之訊框可以儲存在如數位錄音機的適當儲存媒 體以利稍後使用,也可如第1圖所示將編碼訊框輸入發 射器108將編碼之訊框1〇9傳輸出去。 _編碼之訊框1〇9被接收器11〇接收後將編碼訊框lU 輸入解碼器112。解碼器112解碼後將編碼訊框ln解壓 11 1275253 川解碼為112也含有用來針對每個接收到的編碼訊框 的:定日其在編石馬器中特定編碼方式的方法,解碼器112 、、擇疋為遥出解碼編碼訊框lu的方法。
角牛碼訊框以解碼訊號113的形式由解碼器112輸 ,再輸入到數位轉類比(D/A)轉換器、114以轉換數 =解碼訊號113為類比訊號116。類比訊號116可再 又t求處理,例如透過揚聲器轉換成聲音。 第2圖顯不第1圖本發明最佳實施例編碼器1〇6的 塊狀圖。編碼器106依AMR_WB+編碼/解碼器作業並從 AC^XP激勵與TCX激勵選擇一種以編碼訊號,選擇的 考Ϊ用分析編碼模組產生之參數的方式,針對輸入訊號 決定最佳編碼模式。 編碼器106包含一聲音啟動偵測(VAD)模組2〇2、 、、表性預測編碼(LPC )分析模組206、一長程預測(LTP ) 为析模組208與一激勵產生模組212。激勵產生模組212 用ACELP與TCX激勵之一將訊號編碼。 編碼器106也含有一個連接到第一階段選擇模組 204、第二階段選擇模組21〇與第三階段選擇模組214 的激勵選擇模組216,激勵選擇模組216決定激勵產生 模組212用來將訊號編碼的激勵方法為ACELP或TCX。 第一階段選擇模組204相連於VAD模組202與LPC 为析模組206之間,第二階段選擇模組21 〇連接在LTP 分析模組208與激勵產生模組212之間,第三階段選擇 模組214則連接在激勵產生模組212與編碼器ι〇6的輸 12 1275253 出之間。 編碼器106接收VAD模組的輸入訊號105並判斷輸 入訊號105是否含有活躍的音訊或靜止段落,訊號傳輸 到LPC分析模組206後以訊框逐一處理的方式加以處 理。
VAD模組也會計算用來選擇激勵方法的過濾器帶 值。在一靜止段落時,激勵選擇狀態在整個靜止段落不 會變更。 激勵選擇模組216決定了第一階段選擇模組204中 的第一激勵方法。第一激勵方法為ACELP激勵或TCX 激勵其中之一,並用來在激勵產生模組212中將訊號編 碼,若第一階段選擇模組204中無法定出激勵方法,則 其狀態為「未定義」。 激勵選擇模組216定出的第一激勵方法係從VAD模 組202收到的參數決定,尤其輸入訊號105會被VAD模 組202分成許多頻帶,每個頻帶中的訊號有其相對應的 能階,頻帶與其相對應的能階被第一階段選擇模組204 接收後傳到激勵選擇模組216,並用第一激勵選擇方法 進行訊號分析分類以決定屬性為談話或音樂類型。 第一激勵選擇方法可有分析較低與較高頻帶關係與 這些頻帶能階變化之功能,不同分析窗口與決策門檻也 可用在激勵選擇模組216中,其它與訊號相關的參數也 可被用來進行分析。 一個表示VAD模組202使用過濾器排300產生不同 13 1275253
頻帶的例子由第3圖表示。每個頻帶對應能階由統計分 析結果產生’過濾器排結構300包含第三次過濾器區塊 306、312、314、316、318 與 320,過濾器排 300 尚包含 有第五次過濾器區塊302、304、308、310與313。過濾 區塊的「次」若以取樣的數量來說,就是用來產生每個 輸出取樣的最大延遲。例如y(n)=a*x(n)+b*x(n-l)+c*x (n-2)+d*x(n_3)表示第三次過濾器的一個實例。 訊號301輸入過濾器排後由一系列的第三次與/或第 五次過濾器區塊處理產生過濾訊號帶4.8至6.4kHz 322、4.0 至 4·8 kHz 324、3.2 至 4.0kHz 326、2.4 至 3.2kHz 328、2.0 至 2.4kHz 330、1.6 至 2.0kHz 332、1.2 至 1.6kHz 334、0.8 至 1.2kHz 336、0.6 至 0.8kHz 338、0.4 至 0.6kHz 340、0.2 至 〇.4kHz 342、0·0 至 0.2kHz 344。 過濾訊號帶4.8至6.4kHz 322係由將訊號送過第五 階過濾區塊302再經過第五階過濾區塊304產生。過濾 訊號帶4.0至4·8 kHz 324係由將訊號送過第五階過濾區 塊302再經過第五階過濾區塊304與第三階過濾區塊 306產生。過濾訊號帶3·2至4.〇kHz 326係由將訊號送 過第五階過濾區塊302再經過第五階過濾區塊304與第 三階過濾區塊306產生。過濾訊號帶2·4至3.2kHz 328 係由將訊號送過第五階過濾區塊3〇2再經過第五階過濾 區塊308與第五階過濾區塊310產生。過滤訊號帶2.0至 2.4kHz 330係由將訊號送過第五階過濾區塊302再經過 第五階過滤區塊308與第五階過濾區塊3丨〇與第三階過 14 1275253
濾區塊312產生。過濾訊號帶1·6至2.0kHz 332係由將 訊號送過第五階過濾區塊302再經過第五階過濾區塊 308與第五階過濾區塊310與第三階過濾區塊312產 生。過濾訊號帶1.2至L6kHz 334係由將訊號送過第五 階過濾區塊302再經過第五階過濾區塊308與第五階過 濾區塊313與第三階過濾區塊314產生。過濾訊號帶0.8 至1.2kHz 336係由將訊號送過第五階過濾區塊302再經 過第五階過濾區塊308與第五階過濾區塊313與第三階 過濾區塊314產生。過濾訊號帶〇·6至0.8kHz 338係由 將訊號送過第五階過濾區塊302再經過第五階過濾區塊 308與第五階過濾區塊313與第三階過濾區塊316與第 三階過濾區塊318產生。過濾訊號帶〇·4至0.6kHz 340 係由將訊號送過第五階過濾區塊302再經過第五階過濾 區塊308與第五階過濾區塊313與第三階過濾區塊316 與第三階過濾區塊318產生。過濾訊號帶〇·2至0.4kHz 342係由將訊號送過第五階過濾區塊302再經過第五階 過濾區塊308與第五階過濾區塊313與第三階過濾區塊 316與第三階過濾區塊320產生。 過濾訊號帶〇·〇至〇.2kHz 344係由將訊號送過第五 階過濾區塊302再經過第五階過濾區塊308與第五階過 濾區塊313與第三階過濾區塊316與第三階過濾區塊 320產生。 激勵選擇模組216的參數分析,特別是訊號的分類 結果是用來從ACELP與TCX選出第一個用來在激勵產 15 1275253 生模組212進行訊號編碼的激勵方法,惟如果訊號分析 的結果無法分析出訊號為類似談話或類似音樂時,例如 分辨訊號是否具有談話或音樂的特性,就無法選出激勵 方法,或選擇的方法無法確定,那麼只能把選擇留待選 擇階段後再決定,例如特定的選擇可能要在LPC與LTP 分析後第二階選擇模組21〇決定。
、以下為一個用來選擇一激勵方法的第一激勵選擇方 法例子。 AMR-WB編碼/解碼器用該AMR-WB VAD過濾器 排決定一激勵方法,其中對每一個2〇1115輸入訊框而言, 訂出12個從〇到6400頻率範圍子帶訊號能量E(n),每 個子帶的能階可以透過從每個子帶將它的寬度(Hz)分 杳J月b階E(n)以標準化,得到每個子帶的標準化EN(n)能 階。 罘一 丨白仅的激勵遥擇模組2〇4其能階的標準差可^ 其12j固子帶分別用兩個窗戶計算:_短窗stdsh__
j長窗stdlong⑻。若為AMR_WB+,短窗的長度為心 訊框:的長度為16個訊框,用此演算法從目前訊4 力十面的3或15訊振(形成4與16訊框窗戶)J 來^异出兩個標準差值,且在VAD模組2 訊號105包含活躍的簦a么、奋/ 卜 J 算法可在遇到統計上^;^ 頓段落時做出更精確岐曲的延長談話/音樂1 於是計算每個訊框長與短窗的^個子帶平均標」 16
1275253 差’也計算stdalong與stdashort的平均標準差值。 每個音訊訊框其較低頻帶與較高頻帶間的關係可以 計算,AMR-WB+計算LevL·的方式為將從2至8較低頻 帶能階加總,並將加總結果用這些子帶(用Hz計)總 長度(頻覓)除之得到標準化值。對9至丨2的較高頻帶, 片這些子V此階總數後得到標準化值LevH。上述的例 子中最低子帶1在計算中沒用到的原因是它通常含有失 衡的能置,使得從其它子帶來的分配顯得太小而影響計 异結果。從以上的計量可得到Lppj值:
LPH=LevL/LevH 二此外每個訊框的移動平均LPHa之計算為用現在與 ,j個LPH值算出。現在訊框的高低頻關係LpHaF的 計算基於現有與前7個移動平均LPHa加縣數, 近現在加推值就越高。 —目前訊框的過濾區塊平均能階AVL·的計算是由將 每個過濾區塊輸出減掉背景噪訊之估算能階後 個被減去的㈣乘以相對應職區塊之最高頻加總,'如 2平衡有㈣少能量的麵子帶與較高能量的較低頻 子帶 〇 目如訊框總能量TotEG的計算可有將所有過遽區 的能階總和減去每個過濾器排估計背景噪音得出7 以上計算之後再用以下方式就可以決定要選. 或是TCX _枝,惟前提是當—給定旗^ 疋之後,其它旗標要全部清除以確保蚊間沒有衝突 17 1275253 首先比較長窗平均標準差值stdalong與第一起點值 TH1 ’例如〇·4。如果平均標準差值stdalong小於第一起 點值TH1 ’設定Tcx模式旗標以表示選擇TCX激勵方 法編碼’否則就比較低頻與高頻關係值LPHaF與第二起 點值TH2,例如280。 若較低頻與高頻關係值LPHaF大於第二起點值TH2 | 没疋TCX模式旗標,否則,標準差值stdal〇ng2逆轉值 φ 減去第一起點值TH1再加上第一個常數C1 (例如5)後 的總值與低頻與高頻關係值L p H a F進行如下之比較: Cl+(l/(stdalong - THl))>LPHaF (1) 如(1)的比較結果為真就設定TXC模式旗標以表 明运擇TCX激勵方法編碼,若結果為甲則標準差值 stdalong乘以第一被乘數M1 (例如_9〇)再加上第二常 數C2 (例如120),結果值與低頻與高頻關係值LpHaF _ 進行如下之比較: • (Ml*stdalong) +C2 < LPHaF (2) 如結果值小於低頻與南頻關係值LPHaF,換t之比 較式(2)的結果為真時,ACELP模式旗標被設定以表 明選擇ACELP激勵方法編碼,反之就設定一不確定模 式旗標表示無法從目前訊框決定激勵方法。 在目前訊框激勵方法決定的確定前可做更進一步的 檢視: 首先決定ACELP模式旗標或不確定模式旗標是否 18 1275253 力其中之一有設定便判斷目前訊框過減器排 平均能階值AVL是否大於 二二排 2〇〇〇),若鈇,趑下弟—起點值TH3 (例如 將TCX扠式旗標設定並清除ACELP模式 與不確定模式旗標。 供巧 管、右不確定权式旗標為設定時進行類似的計
;平:=標準差值鳥ng長窗之對應短窗之短 :十”不準差值stdash〇rt進行比較,惟使用稍微不 常數與起點值。 若平均‘準差值stdashort小於第四起點值th4 (例 如〇.2) ’設定TCX模式旗標以表明選擇Tcx激勵方法 編碼,否則標準差值stdashort之逆轉值減去第四起點值 THj再加上第三個常數c3 (例如2·5)後的總值與低頻 與南頻關係值LPHaF進行如下之比較: C3+(l/(stdashort — TH4))>LPHaF (3)
如(3)的比較結果為真就設定txc模式旗標以表 明選擇TCX激勵方法編碼,若結果為甲則標準差值 stdashort乘以第二被乘數M2 (例如-90)再加上第四常 數C4 (例如140),結果值與低頻與高頻關係值LPHaF 進行如下之比較: (M2*stdashort) +C4 < LPHaF (4) 如結果值小於低頻與高頻關係值LPHaF,換言之比 較式(4)的結果為真時,ACELP模式旗標被設定以表 明選擇ACELP激勵方法編碼,反之就設定一不確定模 19 1275253 式旗標表示無法從目前訊框決定激勵方法。 w 個階段進行目前訊框與前面訊框能階的檢視, 右目刖訊框總能量TotEO與前面訊框總能量T〇tE_丨之 的能量大於第五起點值TH5 (例如25)的話, 模式的旗標就會狀、TCX模式與科賴式旗標被清 Μ最,,若TCX模式旗標或不確定模式旗標有設定且 # 计=所得的目前訊框的過濾器排300的平均能階AVL大 於第二起點值TH3,加上目前訊框總能量小於第六起點 值丁H6 (例如60)時,設定ACELP模式旗標。 、當前述之第一激勵方法之選擇方法完成後,Tcx模 式旗標設定時在第一激勵區塊2〇4中TCX的第一激勵方 去被選定,或者ACELP模式旗標設定時在第一激勵區 ,204中ACELP的第二激勵方法被選定。但是若不確定 _ 杈式旗標設定時表示第一激勵選擇方法尚為決定一種激 勵方法,如此一來,當可做進一步的分析以決定選擇 ^CELP或TCX激勵時,在另一激勵選擇區塊(例如第 二階選擇模組210)選出ACELP或TCX激勵方法之一 種〇 前述的第一激勵選擇方法可以用以下的虛擬竭表 示: if (stdalong < TH1) SET TCX MODE else if (LPHaF>TH2) 20 1275253
SET TCX_MODE else if ((Cl+(l/(stdalong-THl))) >LPHaF)
SET TCX_MODE else if ((Ml *stdalong+C2)<LPHaF) SET ACELP_MODE else
SET UNCERTAIN_MODE if (ACELP_MODE or UNCERTAIN_MODE) and (AVL >TH3) SET TCX_MODE if (UNCERTAIN—MODE) if (stdashort<TH4)
SET TCX_MODE else if((C3+(l/(stdashorMH4))) > LPHaF)
SET TCX_MODE else if ((M2*stdashort+C4)<LPHaF) SET ACELP_MODE else SET UNCERTAIN_MODE If (UNCERTAIN_MODE) if ((TotE0/TotE-l)>TH5) SET ACELP_MODE if(TCX 一 MODE||UNCERTAIN—MODE)) if (AVL>TH3 and TotEO <TH6) 21 1275253
SET ACELP—MODE 弟卩白遠擇模組204完成後’上述方法也選出一訊 號編碼的第一激勵方法,訊號會從VAD模組2〇2送入 LPC分析模組206中,將訊框的訊號以逐一訊框的程序 處理。 藉由將訊框的殘留錯誤減至最低,LPC分析模組2〇6 _ 可定出一與該訊框相稱的LPC過濾器,一旦LpC過濾器 φ 定出之後,過濾器可由一組LPC過濾器係數來表示了^ 框由LPC分析模組206運用任何LPC分析模組定出的參 數(例如LPC過濾器係數)處理,參數傳送到LTp分折 ‘ 模組208中。 _ LPT分析模組208處理接收到的訊框與參數,特別 是LPT分析模組計算一 LTP參數,該參數與該訊框的基 礎頻率密切相關,它通常稱為「投擲落後」參數或「投 掷延遲」參數,以用淡話樣本的方式表示該談話性質訊 > 號之週期。另一由LTP分析模組208計算出來的參數是 與談話訊號基礎週期密切相關的LTP增加值。 LTP分析模組208處理的訊框與算出的參數送到激 勵產生模組212中,在其中訊框用ACELP或丁CX其中 之一個激勵方法編碼,而從ACELP與TCX選出一種激 勵方法係由激勵選擇模組216與第二階選擇模組21〇決 定產生。 第二階選擇模組210接收由LTP分析模組2〇8傳來 的訊框和由LPC分析模組206與LTP分析模組208計算 22 1275253 出來的參數,這些參數由激勵選擇模組216分析,用LPC 與LTP參數與從ACELP激勵與tcx激勵的標準化關連 ^定用於目前訊框的最佳的激翁方法,特別是激勵選擇 模組=16會分析從LPC分析模組2〇6、LTP分析模組208 來的芩數與用來從ACELP與TCX選出最佳激勵方式的 係數芩數。地二階選擇模組確認了由第一階選擇模組選 出_的第了激勵方法,或者,如果第一激勵方法尚無法由 ^一激勵選擇方法決定時,激勵選擇模組21〇在此階段 廷擇出最佳激勵方法。因此,編碼訊框激勵方法的選擇 會延遲到LTP分析完畢之後。 才不準化關連可在第二階選擇模組使用並以以下方式 計算:
NormCorr = V -7=^=~^, i=l ^jXi-T0 *
當訊框長度為N時,TO為一長度為N訊框的開放 回圈延遲Xi為第i個訊框編碼取樣,Xi_T〇為從Xi取樣 移除的T0取樣編碡訊框樣本。 、第二階激勵選擇也有些例外,即第一階選擇的 ACELP或TCX激勵方法可以改變或變為不選擇。
在安定的訊號中,目前訊框與前面訊框之最小延遲 與最大延遲值的差異低於一個預設起點值TH2,目前訊 框與前面訊框間的延遲變化可能不大,AMR-WB+的LTP 23
1275253 超過广我 雜狀況)與標準化關連的差異來瞭解它^度^連^戈 或前面訊框的差異低於—ϋ 增加,與標準化關連可視為高度關連*例如仏⑽ trSiTT^ 5 sd偵測。舉例而可:相鄰訊框的頻譜距離 (&十#式為目耵與前面訊框的阻抗頻譜對(ISP)伟數) =一二的第一起點值時,訊號可二為= J出係數疋從轉入該1SP代表的咖過濾器係數推 類似雜訊的訊號可用第二激勵方法編碼,例如 tcx。這種訊號的_可透過檢視LTp參數與訊框在頻 率域的平均解得到,若LTP參數穩^且/或平均頻率超 出-預定的起點值時,可判定訊框含有類似雜訊的訊號。 -個如下所述的演算法例可用於第二激勵選擇方 法· 假設VAD旗標有設定表示—活躍的音訊,並且第一 激勵方法已決定第一階選擇模組的結果為不確定(假設 定義為TCX—OR—ACELP ),賴第二激勵方法就可以以 下的方式選擇: 24 1275253
If (SDn> 0.2).
Mode = ACELP—MODE; else if (LagDifbuf<2 ) if (Lagn~ HIGH LIMIT or Lagn == LOW LIMIT){ if {Gainn-NormCorrn<QA and NormCorrn>0,9)
Mode = ACELP_MODE else
Mode = TCX^MODE else if (Ga//v W〇m?Co/rn < 0.1 and A/ormCoA?^ > 0·88) •Mode = ACELP—MODE else if (Gairin - NormCorrn > 0.2)
Mode = TCX—MODE else
NoMtcx = NoMtcx +1 if (MaxEnergybuf < 60 ) if (SDn> 0.15)
Mode = ACELP^MODE; else
NoMtcx = NoMtcx +1. 第n個訊框的頻譜距離SDn的計算用ISP參數計算 如下: sd⑻ ^jyspji^isP^M, i=0 其中ISPn為第η個訊框的ISP參數向量,ISPn(i)為 第i個元素。
LagDifbuf為含有先前1〇個訊框(20ms)開放迴圈 25 1275253 延遲值的緩衝區。
Lagn含有目前訊框n的兩個開放迴圈延遲值。 Gainn含有目前訊框η的兩個LTP增益值。 NormCorrn含有目前訊框η的兩個標準化關連值。 MaxEnergybuf含有能量值之緩衝區内的最大值,該 能量緩衝區含有目前與先前訊框(2〇ms)的最後六個值。 • 办心表示頻譜傾斜。 _ NoMtcx為如使用TCX激勵方法時,避免將長訊框 (80ms)用TCX編碼的旗標。 若一 VAD旗標設定表示一活躍的聲音訊號,且於第 一階選擇模組以選出第一激勵方法,例如ACELP。第一 - 激勵方法的決定要依以下的演算法加以確認,在此過程 中有可能會將激勵方法改換為TCX。 if (LagDifbUf<2)
if {NormCorrn < 0.80 and SDn < 0.1) Mode = TCX一 MODE; if (lphn > 200 and SDn < 0.1)
Mode = TCX MODE 若目前訊框的VAD旗標有設定且前面的超訊框(超 訊框是長度80ms且包含4個每個長度為20ms的訊框) 其中至少一個訊框的VAD旗標值為零,模式的選擇為 TCX权式’且TCX激勵產生80ms的訊框TCX80之功 能為關閉(TVoMicx旗標有設定)。 26 1275253
If (vadFlagold==0 and vadFlag==l and Mode==TCX_MODE)) NoMtcx = NoMtcx + 1 若VAD旗標有設定且第一激勵選擇方法為不確定 (TCX—〇R—ACELP)或TCX時第一激勵選擇方法以以 下演算法加以確認:
if {Gainn - NormCorrn < 0.006 and NormCorrn > 0.92 and Lagn > 21) DFTSum = 0; for (i=1; i<40; i++) { DFTSum - DFTSum + mag[\]] if (DFTSum > 95 and mag[0] < 5) {
Mode = TCX—MODE; else
Mode = ACELP—MODE; NoMtcx = NoMtcx +1 vadFlagold為前面訊框的VAD旗標,vadFiag為目前 訊框的VAD旗標。
NoMtcx旗標表示當所選的激勵方法為tcx時,應 避免在長訊框(80ms)用TCX激勵。
Mag為一由目前訊框的LP過濾器係數Ap產生的不 連續的傅利葉轉換(DFT)頻譜封套。 DFTSum為mag向量之前40個元素總和包含向量 mag的第一個元素(mag(0))。 第二階選擇模組21〇後的訊框傳輪到激勵產生模組 212,該模組將從LTP分析餘遞收到的訊框,與從 27 1275253 2: 的參數’用第二或第—階選擇模組210或 制。廷 勵方法編碼,編碼由激勵選擇模組216控 206、3產f 212所輸出的訊框是用LPC分析模組 ^斤# - ΜέΙ民吴且2〇8與激勵產生模組212決定的參數 H 框,簡碼蹄經由—帛三階選擇模組 若用ACELP激勵編碼訊框時,編碼的訊框直接通 f弟二階選擇模組214並輸出成為編碼訊框1〇7,然而 右用TCX激勵編碼訊框時,編碼赌長度要依超訊框中 已選擇的ACELP訊框數量而定,其巾超訊框是長度 〇ms且包含4個母個長度為2〇ms的訊框,換言之,所 編碼的tcx訊框長度依前面訊框的ACELp訊框而 定。 一 TCX編瑪訊框的最大長度為8〇ms,且可以用一
個單獨的80ms TCX編碼訊框(TCX80)、兩個40ms TCX _ 編碼訊框(TCX40)或四個20ms TCX編碼訊框(TCX20) 構成’、纟>4碼80ms TCX訊框的方法則由激勵選擇模組 2旁的第三階選擇模組214用前面訊框的ACELP數量 定之。 舉例來說,第三階選擇模組214能夠從激勵產生模 組212量測編碼訊框的訊噪比並依結果選擇要用2個 4〇ms編碼訊框或一個8〇ms編碼訊框。 第三激勵選擇階段只有在第一與第二激勵選擇階段 28
1275253 選擇的ACELP方法數量在一個8〇ms超訊
才算完成。以下的表—表示在第三忒 1擇階段^與之後可制方法組合,在第三激勵選擇 产料又會紅TCX ^法的贿長度,比m按照SN 定。 ^
(0,u,l) J ) (〇,u,n (0,1,2,2) NoMTcx 旌標 _ (1,〇,1,1) Γ (1AU) (1,0,2,2,) —-〜 (u,0,l) (u,〇,n (2,2,0,1) (1,1,1,0) (U,1,0) (2,2,1,0) (U,〇,〇,) (1,1,0,0) (2,2,0,0) (〇,〇,u) (〇,〇,i,n (0,0,2,2) (u,l,l) (U,l,l) (2,2,2,2) l (l,l,u) (2,2,2,2) (3,3,33) 0 此實施例選擇於高長程關連的週期性訊鵁(其中可 能含有談話性質訊號與瞬間訊號)用ACELP激勵,換 吕之某些種類的穩定訊號、類似噪音訊號與類似音調的 訊號會選用較適用於處理與編碼上述類型訊號頻率解析 度的丁CX激勵。 實施例的激勵方法選擇延遲但運用在目前訊框,因 此提供一個比以前認知較不複雜的訊號編碼方法,且記 憶的使用也較以前的認知方式有顯著的減低,這在記憶 體有限的移動式裝置尤其特為重要。 此外使用VAD模組、LPC與LTP分析模組來的參 29 I275253 數會產生訊號較精確的分類結果與較精確選擇最佳的編 碼激勵方法。 前述的討論與實施例都是以AMR-WB+編碼/解碼 為為基礎’但嫻熟技術的人都可知道實施例可同樣用於 其他種類的編碼/解碼器,於其中可用一種以上的激勵方
法以作為實施例的變化型與另種的實施例。 此外’ κ知例所述使用兩種激勵方法之一種’ ^ 或tcx’但热知技術的人都知道也可使用所述的 以外的其他激勵方法以作為實施例的變化裂與 另種的實施例。 編媽器 如電他種類的終端與移動式終r 超出ίϊϊίΜ的說Μ實施例來說明本發明’在 有各種所述之本發明範鳴的情形下仍 30 1275253 【圖式簡單說明】 第1圖顯示一可運用本發明實施例的通訊系統。 第2圖顯示一本發明實施例的塊狀圖。 第3圖為一本發明實施例的VAD過濾器排結構。 【主要元件符號說明】 100通訊系統
102談話與/或非談話訊號音訊 104類比轉數位轉換器 105數位訊號 106編碼器 10 7編碼訊框 108發射器 10 9編碼之訊框 110接收器 112解碼器 113解碼訊號 114數位轉類比轉換器 116類比訊號 202聲音啟動偵測模組 204第一階段選擇模組 206線性預測編碼分析模組 208長程預測分析模組 .210第二階段選擇模組 212激勵產生模組 31 1275253 214第三階段選擇模組 216激勵選擇模組 300過濾器排 301訊號 302、304、308、310、313 第五階過濾區塊 306、312、314、316、318、320 第三階過濾區塊
322過濾訊號帶4.8至6.4kHz 324過濾訊號帶4.0至4.8 kHz 326過濾訊號帶3.2至4.0kHz 328過濾訊號帶2.4至3.2kHz 330過濾訊號帶2.0至2.4kHz 332過濾訊號帶1.6至2.0kHz 334過濾訊號帶1.2至1.6kHz 336過濾訊號帶0.8至1.2kHz 338過濾訊號帶0.6至0.8kHz
340過濾訊號帶0.4至0.6kHz 342過濾訊號帶0.2至0.4kHz 344過濾訊號帶0·0至0.2kHz 32

Claims (1)

  1. I275253 十、申請專利範圍: 項之方 法包糾11編碼訊框的方法, 十介第一組與訊框相關的參數,該組參 濾器排參數; 數包含過 μ仃弟一階段的選擇,用與第-組參數相關的^ 备、件二各種編碼方法選擇—種編碼方法/關的先決 计异與訊框相關的第二組參數; 進仃第二階段的選擇,用第一個階段選屮&& 法鱼笫-έ日夾鉍〜〜^ IU I白仅廷出的編碼方 、田穿1>伙σ種編碼方法選出編碼方法;以及 用苐二階段選擇的編碼方法編碼訊框。 方^t申^利範㈣1項之枝,其切各種編碼 方法包含-弟-激勵方法與一第二激勵方法。種、,扁碼 3. 如申請專利範圍第1項之 組茶數係以訊框的一個或多個頻寬能階為基礎^:弟- 4. 如申請專利範圍第4之方法,於 匕 段時,用第—組參數先決條件尚無法·^Λ—。 5·如申請專利範圍第丨項之方法,並一 =數包含了至少一個訊框_參數,參數與= 33 !275253 ,專利範圍第2項之方法,其中第一激勵方
    法為代數石馬激勵的線性預测激Ml如切專利範圍帛2項之方法, 法為轉換編碼激勵。 其中第二激勵方 8·如申請專利範圍第2項之方 祕方法編碼,編碼方法 用在^訊框用第二 m㈣-麟方絲選擇編碼訊框的長度。 9.如申請專利範圍第8項之方法,复 度選擇以訊框的訊號雜訊比決^。-中、、扁碼訊框長
    10·如申請專利範圍第1項之方法 AMR-WB+編碼器。 訊框如申請專利範圍第1項之方法 其中的編碼器為 其中訊框為音訊 12·如申請專利範圍第1〇項之方法,复 框包含談話或非談話性質的訊號。 /、T的音訊訊 13.如申請專利範圍第η項之方法,其中的非談話 34 1275253 19. 如申請專利範圍第14所述的編碼器,其中第一 階段選擇模組用與第一組參數相關的先決狀況不選擇編 碼方法。 20. 如申請專利範圍第14所述的編碼器,其中所述 的第二組參數包含了至少一個訊框頻譜參數,LTP參數 與關連參數。 21. 如申請專利範圍第15所述的編碼器,含有: 用在第一階段選擇模組與第二階段選擇模組選擇出 的第二激勵方法,選擇編碼訊框的長度的第三階段選擇 模組。 22.如申請專利範圍第14所述的編碼器,其中編碼 訊框長度選擇以訊框的訊號雜訊比決定。
    23.如申請專利範圍第14所述的編碼器,其中的編 碼裔為AMR-WOi編碼。 24.如申請專利範圍第14所述的編碼器,其中訊框 為音訊訊框。 25.如申請專利範圍第14所述的編碼器,其中的音 36
TW094112500A 2004-04-21 2005-04-20 Method and encoder for encoding a signal TWI275253B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GBGB0408856.3A GB0408856D0 (en) 2004-04-21 2004-04-21 Signal encoding

Publications (2)

Publication Number Publication Date
TW200605518A TW200605518A (en) 2006-02-01
TWI275253B true TWI275253B (en) 2007-03-01

Family

ID=32344124

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094112500A TWI275253B (en) 2004-04-21 2005-04-20 Method and encoder for encoding a signal

Country Status (18)

Country Link
US (1) US8244525B2 (zh)
EP (1) EP1738355B1 (zh)
JP (1) JP2007534020A (zh)
KR (2) KR20080103113A (zh)
CN (1) CN1969319B (zh)
AT (1) ATE483230T1 (zh)
AU (1) AU2005236596A1 (zh)
BR (1) BRPI0510270A (zh)
CA (1) CA2562877A1 (zh)
DE (1) DE602005023848D1 (zh)
ES (1) ES2349554T3 (zh)
GB (1) GB0408856D0 (zh)
HK (1) HK1104369A1 (zh)
MX (1) MXPA06011957A (zh)
RU (1) RU2006139793A (zh)
TW (1) TWI275253B (zh)
WO (1) WO2005104095A1 (zh)
ZA (1) ZA200609627B (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA06012617A (es) * 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
JP2009503574A (ja) * 2005-07-29 2009-01-29 エルジー エレクトロニクス インコーポレイティド 分割情報のシグナリング方法
TW200737738A (en) * 2006-01-18 2007-10-01 Lg Electronics Inc Apparatus and method for encoding and decoding signal
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
WO2007119135A2 (en) * 2006-04-19 2007-10-25 Nokia Corporation Modified dual symbol rate for uplink mobile communications
JP4847246B2 (ja) * 2006-07-31 2011-12-28 キヤノン株式会社 通信装置、通信装置の制御方法、及び当該制御方法をコンピュータに実行させるためのコンピュータプログラム
MY152845A (en) * 2006-10-24 2014-11-28 Voiceage Corp Method and device for coding transition frames in speech signals
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
JP4410792B2 (ja) * 2006-12-21 2010-02-03 株式会社日立コミュニケーションテクノロジー 暗号化装置
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
EP2196028A4 (en) * 2007-09-20 2016-03-09 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING A SIGNAL
US8050932B2 (en) 2008-02-20 2011-11-01 Research In Motion Limited Apparatus, and associated method, for selecting speech COder operational rates
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
WO2010134759A2 (ko) * 2009-05-19 2010-11-25 한국전자통신연구원 Mdct-tcx 프레임과 celp 프레임 간 연동을 위한 윈도우 처리 장치 및 윈도우 처리 방법
CN101615910B (zh) * 2009-05-31 2010-12-22 华为技术有限公司 压缩编码的方法、装置和设备以及压缩解码方法
US20110040981A1 (en) * 2009-08-14 2011-02-17 Apple Inc. Synchronization of Buffered Audio Data With Live Broadcast
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) * 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
AR085361A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio
SG192721A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
AU2012217269B2 (en) 2011-02-14 2015-10-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
AR085218A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio
TWI476760B (zh) * 2011-02-14 2015-03-11 Fraunhofer Ges Forschung 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
EP2676266B1 (en) 2011-02-14 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Linear prediction based coding scheme using spectral domain noise shaping
MX2013009305A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio.
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
EP3611728A1 (en) * 2012-03-21 2020-02-19 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
US8645128B1 (en) * 2012-10-02 2014-02-04 Google Inc. Determining pitch dynamics of an audio signal
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CA2898572C (en) * 2013-01-29 2019-07-02 Martin Dietz Concept for coding mode switching compensation
US9147397B2 (en) * 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
EP3511935B1 (en) 2014-04-17 2020-10-07 VoiceAge EVS LLC Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
CN107424622B (zh) * 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
JP6086999B2 (ja) * 2014-07-28 2017-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法
CN104143335B (zh) * 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
CN105242111B (zh) * 2015-09-17 2018-02-27 清华大学 一种采用类脉冲激励的频响函数测量方法
CN111739543B (zh) * 2020-05-25 2023-05-23 杭州涂鸦信息技术有限公司 音频编码方法的调试方法及其相关装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479559A (en) * 1993-05-28 1995-12-26 Motorola, Inc. Excitation synchronous time encoding vocoder and method
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
JP2882463B2 (ja) * 1995-11-01 1999-04-12 日本電気株式会社 Vox判定装置
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
JP4221537B2 (ja) * 2000-06-02 2009-02-12 日本電気株式会社 音声検出方法及び装置とその記録媒体
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
FR2825826B1 (fr) * 2001-06-11 2003-09-12 Cit Alcatel Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US7120576B2 (en) * 2004-07-16 2006-10-10 Mindspeed Technologies, Inc. Low-complexity music detection algorithm and system

Also Published As

Publication number Publication date
GB0408856D0 (en) 2004-05-26
RU2006139793A (ru) 2008-05-27
BRPI0510270A (pt) 2007-10-30
ATE483230T1 (de) 2010-10-15
CA2562877A1 (en) 2005-11-03
US8244525B2 (en) 2012-08-14
TW200605518A (en) 2006-02-01
ES2349554T3 (es) 2011-01-05
CN1969319A (zh) 2007-05-23
WO2005104095A1 (en) 2005-11-03
DE602005023848D1 (de) 2010-11-11
EP1738355B1 (en) 2010-09-29
KR20070001276A (ko) 2007-01-03
US20050240399A1 (en) 2005-10-27
MXPA06011957A (es) 2006-12-15
CN1969319B (zh) 2011-09-21
AU2005236596A1 (en) 2005-11-03
EP1738355A1 (en) 2007-01-03
HK1104369A1 (en) 2008-01-11
KR20080103113A (ko) 2008-11-26
ZA200609627B (en) 2008-09-25
JP2007534020A (ja) 2007-11-22

Similar Documents

Publication Publication Date Title
TWI275253B (en) Method and encoder for encoding a signal
EP1719119B1 (en) Classification of audio signals
KR100879976B1 (ko) 부호화 모델 선택
CN103325377B (zh) 音频编码方法
TW563094B (en) Method and apparatus for high performance low bit-rate coding of unvoiced speech
RU2636685C2 (ru) Решение относительно наличия/отсутствия вокализации для обработки речи
JP2008503783A (ja) オーディオ信号のエンコーディングにおけるコーディング・モデルの選択
CN104969291A (zh) 执行用于增益确定的滤波的系统及方法
EP4276821A2 (en) Phase reconstruction in a speech decoder
JPH07225599A (ja) 音声の符号化方法
MXPA06009369A (es) Clasificacion de señales de audio

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees