TW201222532A - Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC) - Google Patents

Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC) Download PDF

Info

Publication number
TW201222532A
TW201222532A TW100136050A TW100136050A TW201222532A TW 201222532 A TW201222532 A TW 201222532A TW 100136050 A TW100136050 A TW 100136050A TW 100136050 A TW100136050 A TW 100136050A TW 201222532 A TW201222532 A TW 201222532A
Authority
TW
Taiwan
Prior art keywords
audio signal
samples
ratio
composable
signal
Prior art date
Application number
TW100136050A
Other languages
English (en)
Other versions
TWI486950B (zh
Inventor
Markus Multrus
Bernhard Grill
Max Neuendorf
Nikolaus Rettelbach
Guillaume Fuchs
Philippe Gournay
Roch Lefebvre
Bruno Bessette
Original Assignee
Fraunhofer Ges Forschung
Voiceage Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Voiceage Corp filed Critical Fraunhofer Ges Forschung
Publication of TW201222532A publication Critical patent/TW201222532A/zh
Application granted granted Critical
Publication of TWI486950B publication Critical patent/TWI486950B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Description

201222532 六、發明說明: 【發明所屬^技彳軒々員】 本發明係有關於音訊處理,及更明確言之係有關於用 以針對聯合統-語音與音訊編解碼器(usac)處理音訊與 提供較高時間粒度之裝置及方法。 L· jgtr ^ 如同其它音訊編解碼器般’ USAC具有固定框大小 (US’2_樣本/框)。_可能在_個框内部切換成較短 變換大小的有限集合,但框大小仍限㈣⑽統的時間性 解析度。針對傳統音訊編解碼器,為了提㈣___ 間粒度,取樣率增高,結果導致_個㈣持續時間縮短(例 如數毫秒)。但此點對USAC編解碼器並非容易可行。 USAC編解碼器包含得自傳統_般音訊編解碼器工具 諸如AAC(高階音訊編碼)變換編碼器、sbr(譜帶複製)及 MPEG環繞(MPEG=動晝專家群),加得自傳統語音編解碼器 工具諸如ACELP(ACELP=代數代碼激勵線性制)的組 合。ACELP及變換編碼器二者通常係在相同環境(亦即框大 小、取樣率)内的相同時間運轉且容易地切換:通常用於清 晰語音信號’使用ACELPX具;及科音樂 '混合信號, 則係使用變換編碼器。 ACELP工具在相同時間係限於只在較低取樣率工作。 對24千位元/秒,使用只有17〇75赫茲取樣率。對較高取樣 率’ ACELP工具效能開始顯著降低。變換編碼器以及sbr 及Μ P E G環繞可由遠較高的取樣率獲益,例如針對變換編碼 201222532 器的22050赫茲及針對SBR及MPEG環繞的44100赫茲。但至 目刖為止ACELP工具限制整個系統的取樣率,結果導致並 非最佳的系統,特別對音樂信號而言尤為如此。 本發明之目的係提出處理音訊信號之裝置與方法之改 良構思。本發明之目的係藉如申請專利範圍第丨項之裝置、 如申請專利範圍第15項之方法、如申請專利範圍第16項之 裝置、如申請專利範圍第18項之方法、及如申請專利範固 第19項之電腦程式加以解決。 目前USAC RM於大量操作點,從極低位元率諸如8千 位元/秒至於12 8千位元/秒及以上的位元率的透明品質之範 圍提供高編碼效能。為了達成在如此寬廣位元率範圍之此 種高品質,使用諸如MPEG環繞、SBR、ACELP及傳統變換 編碼器等工具之組合此種工具之組合當然要求工具互動操 作之聯合最佳化處理及置放此等工具之共用環境。 於此聯合最佳化處理程序中發現有些工具具有缺點在 於重新再現彳§號,該等信號暴露在中間位元率範圍(24千位 元/秒-32千位元/秒)之高時間結構。更明確言之, 繞、SBR、及FD變換編碼器(FD、TCX)(FD=頻域;Tcx= 變換編碼激勵)等工具,亦即於頻域操作的全部工具,當以 較间時間粒度操作時具有較佳效能,係與時域的較短框大 小相同。 比較最新技藝HE-A AC v2編碼器(高效率a AC v2編碼 器),發現目前US AC參考品質編碼器係以顯著較低取樣 率,但使用相同框大小(就樣本而言),於諸如24千位元/秒 201222532 及32千位元/秒之位元率操作。如此表示以毫秒計,框時間 顯著較長。為了補償此等缺陷,須增加時間粒度。如此可 藉提高取樣頻率或縮小框大小(例如用於使用固定框大小 之系統)而予達成。 有鑑於提高取樣頻率乃朝向SBR及MPEG環繞提高時 間動態信號效能之合理方式,如此無法用於全部核心編喝 器工具:眾所周知較高取樣頻率有利於變換編碼器,但同 時劇降ACELP工具效能。 【明内】 提出一種用以處理音訊信號之裝置。該裝置包含信說 處理器及組配器。該信號處理器係適用於接收具第一可級 配數目之音訊信號樣本之第一音訊信號框。此外,該音訊 信號係適用於藉可組配升頻取樣因數來升頻取樣該音訊作 號而獲得已處理音訊信號。又復,該信號處理器係適用於 輸出具第二可組配數目之該已處理音訊信號樣本之第二音 訊信號框。 該組配器係適用於基於組配資訊而組配該信號處理 器,使得當該第二可組配樣本數目對該第一可組配樣本數 目之第一比具有第一比值時,該可組配升頻取樣因數係等 於第一升頻取樣值。此外,該組配器係適用於組配該信鍊 處理器’使得當該第二可組配樣本數目對該第一可級配樣 本數目之不同第二比具有不同第二比值時,該巧組配升頻 取樣因數係等於不同第二升頻取樣值。該第一或第二比值 係非為整數值。 201222532 依康u述貫施例,信號處理器升頻取樣一音訊信號來 獲得已處理已升頻取樣之音訊信號。於前述實施例中,升 頻取樣因數為可組配且可以是個非整數值。組配能力及升 頻取樣因財以是個非錄值的事實增加 了裝置的彈性。 當該第一可組配樣本數目對該第一可組配樣本數目之不同 第一比具有不同第二比值時,該可組配升頻取樣因數係等 於不同第二升頻取樣值。如此,該裝置係適用於將該升頻 取樣因數與第-對第-音訊信號框之框長度(亦即樣本數 目)之比間之關係列入考慮。 於一實施例中,組配器係適用於組配該信號處理器使 得奚該第一可組配樣本數目對該第一可組配樣本數目之第 一比係大於該第二可組配樣本數目對該第一可組配樣本數 目之第―比時’該不同第二升頻取樣值係大於該第-升頻 取樣值。 依據—實施例,提示針對ϋ S A C編解碼器之新操作模式 (後文稱作為「額外設定值」),提升纽用於中㈣料率諸 如24千位it/秒及32千位元/秒之效能。發現針對此等操作 點’目刖USAC參考編解碼n的時間解析度過低。因而提示 藉縮小―編碼器框大小來提高此-時間解析度而未增 加核心編碼器之取樣率’及又復b)增高猶及MpEG環繞之 取樣率而未改變此等工具之框大小。 所提不的額外設定值大為改進系統彈性原因在於其 允許包括ACELP工具的系統在較高取樣率操作,諸如44【 及48千赫兹。由於此等取樣率為市場上典型要求的取樣 201222532 率,故預期如此將有助於USAC編解碼器的接受度。 目前MPEG統一語音與音訊編碼(USAC)工作項之新操 作模式藉由增加整個音訊編解碼器之時間粒度而提高整個 編解碼器之時間彈性。若(假設第二樣本數維持相同)第二比 係大於第一比,則第一可組配樣本數目減少,亦即第一音 訊信號框的框大小縮小。如此導致較高時間粒度在頻率 操作的且處理第一音訊信號框的全部工具之效能較佳。但 於此種高度有效操作模式中,也期望提高處理包含升頻取 樣音讯信號之第二音訊信號框的工具效能。此等工具的此 種效能增高可藉升頻取樣音訊信號之較高取樣率,換言 之,藉提高用於此種操作模式之升頻取樣因數而予實現。 此外’存在有工具諸如於USAC之ACELP解碼器,該工具不 在頻域操作,該工具處理第一音訊信號框,及當(原先)音訊 信號的取樣率相對低時,該工具的操作最佳。此等工具可 從问升頻取樣因數獲益,原因在於如此表示(原先)音訊信號 的取樣率比較升頻取樣音訊信號的取樣率而言為相對地 低。刚述實施例提出一種裝置係適用於提供針對在此種環 境有效操作模式之組態模式。 新操作模式藉增加整個音訊編解碼器之時間粒度而提 南整個編解碼器之時間彈性。 於—實施例中,該組配器係適用於組配該信號處理器 v、第—可組配樣本數目對該第一可組配樣本數目之 第比具有該第一比值時,該可組配升頻取樣因數係等於 δ亥第—比值,及其中該組配器係適用於組配該信號處理器 201222532 使得當該第二可組配樣本數目對該第一可組配樣本數目之 第二比具有該不同第二比值時,該可組配升頻取樣因數係 等於該不同第二比值。 於一實施例中,該組配器係適用於組配該信號處理器 使得當該第一比具有該第一比值時,該可組配升頻取樣因 數係等於2,及其中該組配器係適用於組配該信號處理器使 得當該第二比具有不同第二比值時,該可組配升頻取樣因 數係等於8/3。 依據又一實施例,該組配器係適用於組配該信號處理 器使得當該第一比具有該第一比值時,該第一可組配樣本 數目係等於1024及該第二可組配樣本數目係等於2048,及 其中該組配器係適用於組配該信號處理器使得當該第二比 具有不同第二比值時,該第一可組配樣本數目係等於768及 該第二可組配樣本數目係等於2048。 於一實施例中,提議導入USAC編解碼器之額外設定 值,此處核心編碼器係在較短框大小(768而非1024樣本)操 作。又復,提示於本脈絡中將SBR解碼器之重新取樣從2 : 1修改成8: 3’來許可SBR及MPEG環繞在較高取樣率操作。 此外,依據一實施例,核心編碼器之時間粒度係藉將 核心編碼器框大小從1024縮小成738樣本而予增高。藉此一 歩驟,核心編碼器之時間粒度係提面4/3而取樣率維持常 數:如此允許ACELP在適當取樣頻率(Fs)運轉。 此外,於SBR工具,施加比值8/3(至目前為止:比值2) •^重新取樣,將在3/8取樣頻率(Fs)的768核心編碼器框大小 201222532 轉成在取樣頻率(Fs)2048的輸出框大小。如此允許SBR工具 及MPEG環繞工具在傳統高取樣率(例如441〇〇赫茲)運轉。 如此’提供語音及音樂信號之良好品質’原因在於全部工 具係在其最佳操作點運轉。 於一實施例中,一核心解碼器模組用以解碼該音訊信 號來獲得一前處理音訊信號,具有多個分析濾波器排組通 道之一分析濾波器組用以將該第一前處理音訊信號從一時 域變換成一頻域來獲得包含多個子帶信號之一頻域前處理 音訊信號’一子帶產生器用以針對該頻域前處理音訊信號 製作及添加額外子帶信號,及具有多個合成濾波器排組通 道之一合成濾波器組用以將該第一前處理音訊信號從頻域 變換成時域來獲得該已處理音訊信號。該組配器可適用於 藉組配該合成濾波器排組通道數目或該分析濾波器排組通 道數目而組配該信號處理器來使得該可組配升頻取樣因數 係等於該合成濾波器排組通道數目對該分析濾波器排組通 道數目之一第三比。該子帶產生器可以是一譜帶複製器係 適用於複製該前處理音訊信號產生器之子帶信號來針對該 頻域前處理音訊信號製作該等額外子帶信號❶該信號處理 器又復可包含一MPEG環繞解碼器用以解碼該前處理音訊 信號來獲得包含立體聲或環繞聲道之一前處理音訊信號。 此外’該子帶產生器可適用於在針對該頻域前處理音訊信 號之該等額外子帶信號已經製作且添加至該頻域前處理音 訊信號後,將該頻域前處理音訊信號饋進該MPEG環繞解碼 201222532 §玄核心解碼器模組可包含一第一核心解碼器及一第一 核心解碼器,其中該第一核心解碼器可適用於在一時域操 作及其中該第二核心解碼器可適用於在一頻域操作。該第 一核心解碼器可以是一 ACELP解碼器及其中該第二核心解 碼器可為一 FD變換解碼器或一 TCIX變換解碼器。 於一實施例中,該ACELP編解碼器之超框大小係從 1024縮減至768樣本。如此可藉組合四個大小192( =個大 64之子框)之ACELP框成一個大小768之核心編碼器樞進」 (先前:組合四個大小256之ACELP框成一個大小768之核订 編碼器框)。另一項達成768樣本核心編碼器框大小的解夬 辦法例如係組合三個大小256(四個大小64之子樞、 ACELP框。 之 理器 依據又更一實施例,該組配器係適用於基於該級配 訊指示該音訊信號之第一可組配樣本數目或該已處理立^ k號之第二可組配樣本數目中之至少一者而組配該信就處 於另一實施例中,該組配器係適用於基於該組配 貝5民 而組配該信號處理器,其中該組配資訊指示該音訊信鱿 第一可組配樣本數目或該已處理音訊信號之第二可蚯配樣 本數目’其中該組配資訊為一組配指數。 ^ 又復,提供一種用以處理一音訊信號之裝置。該妒置 包含一信號處理器及一組配器。該信號處理器係適用於接 收具一第一可組配數目之音訊信號樣本之一第一音訊作鱿 框。此外,該信號處理器係適用於藉一可組配降頻取樣因 10 201222532 數來降頻取樣該音訊信號而獲得一已處理音訊信號。此 外,該信號處理器係適用於輸出具一第二可組配數目之該 已處理音訊信號樣本之一第二音訊信號框。 該組配器係適用於基於組配資訊而組配該信號處理 器,使得當該第二可組配樣本數目對該第一可組配樣本數 目之一第一比具有一第一比值時,該可組配降頻取樣因數 係等於一第一降頻取樣值。此外,該組配器係適用於組配 該信號處理器,使得當該第二可組配樣本數目對該第一可 組配樣本數目之一不同第二比具有一不同第二比值時,該 可組配降頻取樣因數係等於一不同第二降頻取樣值。該第 一或第二比值係非為整數值。 圖式簡單說 隨後將就附圖討論本發明之較佳實施例,附圖中: 第1圖顯示依據一實施例用以處理音訊信號之裝置, 第2圖顯示依據另一實施例用以處理音訊信號之裝置, 第3圖顯示依據一實施例由裝置所進行的升頻取樣處 理, 第4圖顯示依據又更一實施例用以處理音訊信號之裝 置, 第5a圖顯示依據一實施例核心解碼器模組, 第5b圖顯示依據第4圖實施例含依據第5a圖之核心解 碼器模組的用以處理音訊信號之裝置, 第6a圖顯示包含四個ACELP框之ACELP超框, 第6b圖顯示包含三個ACELP框之ACELP超框, 11 201222532 第7a圖顯示usAC之内設設定值, 第7b圖顯示依據一實施例USAC之額外設定值, 第8a、8b圖顯示依據MUSHRA方法之聽聞測驗結果,及 第9圖顯示依據另一實施例用以處理音訊信號之裝置。 【實施方式】 第1圖顯示依據一實施例用以處理音訊信號之裝置。該 裝置包含信號處理器110及組配器120。信號處理器110係適 用於接收具有第一可組配數目之音訊信號樣本145之第一 音訊信號框140。此外,信號處理器110係適用於藉可組配 升頻取樣因數來升頻取樣該音訊信號而獲得已處理的音訊 信號。又復,信號處理器係適用於接收具有第二可組配數 目之已處理音訊信號樣本155之第二音訊信號框150。 組配器120係適用於基於組配資訊ci來組配信號處理器 U〇’使得當第二可組配樣本數目對第一可組配樣本數目的 第—比具有第一比值時,可組配升頻取樣因數係等於第一 升頻取樣值。此外,組配器120係適用於組配信號處理器 使得當第二可組配樣本數目對第一可組配樣本數目的不同 第二比具有不同第二比值時,可組配升頻取樣因數係等於 不同第二升頻取樣值。第一或第二比值並非整數值。 依據第1圖之裝置例如可採用於解碼處理程序。 依據一實施例,組配器120可適用於組配信號處理器 使得當該第二可組配樣本數目對第一可組配樣本數目 的第二比係大於該第二可組配樣本數目對第一可組配樣本 數目的第一比時,不同的第二升頻取樣值係大於第一不同 12 201222532 升頻取樣值。於又一實施例中,組配器12〇係適用於基於組 配資訊ci來組配信號處理器110,使得當第二可組配樣本數 目對第一可組配樣本數目的第一比具有第一比值時,可組 配升頻取樣因數係等於第一比值,及其中,組配器120係適 用於組配信號處理器110使得當第二可組配樣本數目對第 —可組配樣本數目的不同第二比具有不同第二比值時,可 組配升頻取樣因數係等於不同第二比值。 於另一實施例中,組配器120係適用於組配信號處理器 110使得當該第一比具有第一比值時,該可組配升頻取樣因 數係等於2 ;及其中組配器120係適用於組配信號處理器110 使传s該第一比具有不同第二比值時,該可組配升頻取樣 因數係等於8/3。依據又一實施例,組配器120係適用於組 配信號處理器110使得當該第一比具有第一比值時,該第一 可乡且配樣本數係等於1024而該第二可組配樣本數係等於 2〇48 ;及其中組配器120係適用於組配信號處理器11〇使得 當該第二比具有不同第二比值時,該第一可組配樣本數係 等於768而該第二可組配樣本數係等於2048。 於一實施例中,組配器120係適用於基於組配資訊ci來 組配信號處理器110,其中該組配資訊ci指示升頻取樣因 數 '該音訊信號之第一可組配樣本數、及該已處理音訊信 就之第二可組配樣本數,其中該組配資訊為組配指數。 下表例示說明組配指數作為組配資訊的實例: 3數 coreCoderFrameLength sbrRatio outputFrameLength 2 --- 768 8:3 2048 3 1024 2:1 2048 13 201222532 其中「指數」指示組配指數,其中r c〇reC〇derFrameLength」 指示該音訊信號之第一可組配樣本數,其中「sbrRatio」指 示升頻取樣因數,及其中r outpUtFrameLength」指示該已 處理a 號之第二可組配樣本數。 第2圖例示說明依據另一實施例之裝置。該裝置包含信 號處理器205及組配器208。該信號處理器205包含核心解碼 器模組210、分析濾波器排組22〇、子帶產生器23〇、及合成 濾波器排組240。 核心解碼器模組210係適用於接收音訊信號狀1。於接 收音訊信號asl之後,核心解碼器模組21〇解碼該音訊信號 而獲得經前處理的音訊信號as2。然後,核心解碼器模組21〇 將於時域表示的該經前處理的音訊信號as2饋進分析濾波 器排組220。 分析攄波器排組220係適用於將經前處理的音訊信號 as2從時域變換為頻域來獲得包含多個子帶信號之頻域經 前處理的音訊信號as3。分析濾波器排組220具有可組配數 目之分析濾波器排組通道(分析濾波器排組頻帶> 分析濾波 器排組通道數目決定從該時域經前處理的音訊信號狀2所 產生的子帶信號數目。於一實施例中,分析濾波器排組通 道數目可藉設定可組配參數cl值而予設定。舉例言之,分 析濾波器排組220可經組配來具有32或24個分析濾波器排 組通道。於第2圖之實施例中,分析濾波器排組通道數目可 依據組配器208之組配資訊ci而予設定。將經前處理的音訊 信號as2變換成頻域後,分析濾波器排組220將該頻域經前 201222532 處理的音訊信號as3饋進子帶產生器23〇。 子帶產生器230係適用於針對頻域音訊信號泌產生額 外子帶信號。此外,子帶產生器23〇係適用於修改經前處理 的頻域音訊信號as3來獲得經修改之頻域音訊信號狀4,該信 號as4包含經前處理的頻域音訊信號狀3之子帶信號及由 π產生器230所產生的額外子帶信號。由該子帶產生器 所產生的額外子帶信號數目為可組配,於一實施例中,子 ▼產生器乃譜帶複製器(SBR)。然後子帶產生器23〇將經修 改之頻域經前處理的音訊信號as4饋進合成濾波器排組。 合成濾波器排組240係適用於將經修改之頻域經前處 • 理的音訊信號as4從頻域變換為時域來獲得時域已處理的 音訊信號as5。合成濾波器排組240具有可組配數目的合成 濾波器排組通道(合成濾波器排組頻帶)。合成濾波器排組通 道數目為可組配。於一實施例中,合成濾波器排組通道數 目可藉設定可組配參數c2值而予設定。舉例言之,合成滤 波器排組240可經組配來具有64個合成濾波器排組通道。於 第2圖之實施例中,組配器208的組配資訊ci可設定分析滤波 器排組通道數目。藉將經修改之頻域經前處理的音訊信號 as4變換成時域,獲得已處理的音訊信號as5。 於一實施例中,經修改之頻域經前處理的音訊信號as4 之子帶通道數目係等於合成濾波器排組通道數目。於此一 實施例中’組配器208係適用於組配由子帶產生器230所產 生的額外子帶通道數目。組配器208可適用於組配由子帶產 生器230所產生的額外子帶通道數目,使得藉組配器2〇8所 15 201222532 組配的合成濾波器排組通道c2數目係等於經前處理的頻域 音訊信號as3加上由子帶產生器230所產生的額外子帶通道 數目。藉此’合成濾波器排組通道數目係等於經修改之經 前處理的頻域音訊信號as4的子帶信號數目。 假設音訊信號asl具有取樣率sri,及假設分析濾波器排 組220具有cl分析濾波器排組通道及合成濾波器排組240具 有c2合成渡波器排組通道,已處理的音訊信號as5具有取樣 率 sr5 : sr5=(c2/cl)srl。 c2/cl決定升頻取樣因數u : u=c2/cl。 於第2圖之實施例十’升頻取樣因數11可設定為非為整 數值。舉例言之,升頻取樣因數11可設定為8/3之值,藉設 定分析濾波器排組通道數目:c丨=2 4及藉設定合成濾波器排 組通道數目:c2=64,使得: u=8/3=64/24。 假設子帶產生器230為譜帶複製器,依據一實施例譜帶 複製器可從原先子帶產生任意數目的額外子帶,其中所產 生的額外子帶數目對已經可用子帶數目之比無需為整數。 例如依據一實施例譜帶複製器可執行下列步驟: 於第-步驟中,譜帶複製器藉產生額外子帶數目而複 製子帶信號數目,其中所產生的額外子帶數目可以是已經 可用子帶數目的整數倍數。舉例言之,可從音訊信號的24 原先子帶㈣產生24(或例如48)額外子帶信號(例如子帶信
16 201222532 號總數可以雙倍或三倍)。 於第二步驟中,假設所需子帶信號數目為ci2而實際可 用子帶信號數目為ell,則可區分三種不同情況: 若C11等於C12,則可用子帶信號數目cll係等於需要的 子帶信號數目cl2。無需作子帶調整。 若C12小於ell,則可用子帶信號數目cU係大於需要的 子帶信號數目cl2。依據一實施例,可刪除最高頻率子帶作 唬。。舉例言之,若有64子帶信號可資利用且若只需料子帶 信號,則三個具最高頻率的子帶信號可被拋棄。 若C12大於ell,則可用子帶信號數目cU係小於需要的 子帶信號數目cl2。 依據一實施例,藉加上零信號亦即各個子帶樣本的振 幅值係等於零之信號作為額外子帶信號,可產生額外子帶 信號。依據另一實施例,藉加上偽隨機子帶信號亦即各個 子帶樣本之值包含偽隨機資料的信號作為額外子帶信號, 可產生額外子帶信號。於另一實施例中,藉拷貝最高子帶 信號樣本值或最高子帶信號且用來作為額外子帶信號(拷 貝子帶信號)之樣本值,可產生額外子帶信號。 依據一實施例於譜帶複製器中,可用基帶子帶可經拷 貝且用作為最高子帶,使得全部子帶皆經填補。該基帶子 帶可經拷貝兩次或多次來讓全部遺漏子帶皆以數值填補。 第3圖顯示依據一實施例由裝置所進行的升頻取樣處 理。例示說明時域音訊信號310及數個音訊信號31〇樣本 315。音訊信號於頻域變換例如時頻域來獲得包含三個子帶 17 201222532 信號330的頻域音訊信號32〇。(於本簡化實例中,係假設分 析濾波器排組包含三個通道。)然後頻域音訊信號之子帶信 號330可經複製來獲得三個額外子帶信號335,因而頻域音 訊信號320包含原先三個子帶信號33〇及所產生的三個額外 子帶k號335 ^然後,又產生兩個額外子帶信號338,例如 零信號、偽隨機子帶信號或拷貝子帶信號。然後頻域音訊 信號變換回時域,結果獲得具原先時域音訊信號31〇之取樣 率的8/3倍取樣率之時域音訊信號35〇。 第4圖例示說明依據又一實施例之裝置。該裝置包含信 號處理器405及組配器4〇8。信號處理器4〇5包含核心解碼器 模組210、分析濾波器排組22〇、子帶產生器23〇、及合成濾 波器排組240 ’相對應於第2圖實施例中的個別單元。此外, 信號處理器405包含MPEG環繞解碼器41 〇(MPS解碼器)用 以解碼經前處理的音訊信號而獲得具立體聲或環繞聲道之 經前處理的音訊信號。子帶產生器23〇係適用於針對該== 經前處理的音訊信號之額外子帶信號已經產生且已^至/ 頻域經前處理的音訊信號後,將頻域經前處理的音訊作該 饋進MPEG環繞解碼器410。 ^ 5號 第5a圖例示說明依據一實施例的核心解碼器模組。兮 核心解碼器模組包含第_核心解碼器51()及第二核心解^ 器520。第-核心解碼器·系適用於時域操作及其中第碼 核心解碼器52〇係適用於頻域操作。第& - 碼請為ACELP解碼器及第二核心解碼器52_ = 解碼器’例如AAC變換解碼器。於另_實施例中,第二核 18 201222532 心解碼器520為TCX變換解碼器。取決於到達音訊信號部分 asp是否含有語音資料或其它音訊資料,到達音訊信號部分 asp係藉ACELP解碼器51 〇或藉fd變換解碼器520處理。核心 解碼器模組之輸出為該音訊信號之一前處理部分pp_asp。 第5b圖顯示依據第4圖實施例含依據第5a圖之核心解 碼器模組的用以處理音訊信號之裝置。 於一實施例中,ACELP編解碼器之超框大小係從1024 樣本縮小至768樣本。如此可藉將四個大小192之ACELP框 (三個大小64之子框)組合成一個大小768的核心編碼器框而 達成(先前:四個大小256之ACELP框組合成一個大小1024 的核心編碼器框)。第6a圖例示說明包含四個ACELP框610 之ACELP超框605。ACELP框610各自包含三個子框615。 達成768樣本大小的核心編碼器框之另一解決辦法例 如係組合三個大小256之ACELP框(四個大小64之子框)。第 6b圖例示說明包含三個ACELP框630之ACELP超框625。 ACELP框630各自包含四個子框635。 第7b圖輪廓描繪從解碼器觀點所提示之額外設定且與 傳統U S A C設定作比較。第7 a及7 b圖輪廓描繪解碼器結構為 典型用在操作點為24千位元/秒或32千位元/秒。 於第7a圖中,例示說明USAC RM9(USAC參考模型9) 的内設設定音訊信號框係輸入QMF分析濾波器排組710。 QMF分析濾波器排組71〇具有32通道。qmf分析濾波器排組 710係適用於將時域音訊信號轉成頻域,其中該頻域音訊信 號包含32子帶。然後頻域音訊信號輸入升頻取樣器72〇β升 19 201222532 頻取樣器720係適用於藉升頻取樣因數2而升頻取樣該頻域 音訊信號。如此,藉該升頻取樣器產生包含64子帶的頻域 升頻取樣器輸出信號。升頻取樣器72〇為SBR(譜帶複製器) 升頻取樣器。如前文已述,譜帶複製器係採用來從輸入譜 帶複製器的較低頻子帶產生較高頻子帶。 然後經升頻取樣的頻域音訊信號饋進MPEG環繞(MPS) 解碼器730。MPS解碼器730係適用於將降混環繞信號解碼 來導出環繞信號之頻域通道。舉例言之,MPS解碼器730可 適用於產生頻域環繞信號之兩個升混頻域環繞通道。於另 一實施例中’ MPS解碼器730可適用於產生頻域環繞信號之 五個升混頻域環繞通道。然後頻域環繞信號之通道饋進 QMF合成濾波器排組740。QMF合成濾波器排組740係適用 於變換頻域環繞信號之通道成為時域來獲得環繞信號之時 域通道。 如圖可知,USAC解碼器係以其内設設定操作為2 : 1 系統。核心編解碼器係於一半輸出取樣率fouta 1024樣本/ 框的粒度操作。藉組合32頻帶分析QMF濾波器排組與以相 等速率運轉的64頻帶合成QMF排組,以因數2之升頻取樣係 在SBR工具内部暗示性地執行。SBR工具係於4^輸出大小 2048之框。 第7b圖例示說明所提示的針對USAC之額外設定。例示 說明QMF分析濾波器排組750、升頻取樣器760、MPS解碼 器770及合成濾波器排組780。 與内設設定相反,USAC編解碼器係以如同8/3系統所
S 20 201222532 提示的額外設定操作。核心編碼器係以輸出取樣率£。^的八 分之三運轉。於相同上下文,核心編碼器框大小縮小3/4之 因數。藉於SBR工具内部組合24頻帶分析QMF濾波器排組 與64頻帶合成濾波器排組,可達成於2〇48樣本框長度之輸 出取樣率fut。 此項設定允許針對核心編碼器及額外工具二者有遠更 增加的時間性粒度:鑑於諸如SBR及MPEG環繞等工具可以 較高取樣率操作,核心編碼器取樣率減低及反而框長度縮 短。藉此方式,全部組件可於其最佳環境工作。 於一貫細*例中’採用作為核心編碼器的A AC編碼器仍 然基於1/2 £0111取樣率而決定定標因數,即便aac編碼号係 於輸出取樣率fout的八分之三操作時亦如此。 下表提供用在USAC參考品質編碼器針對usac的取樣 率及框持續時間的細節數字。如表可知,於所提示的新設 定中的框持續時間可縮小達接近25%,結果導致針對全部 非靜態信號的正面效果,原因在於編碼雜訊的擴展也可以 相同比例減少。可達成此項減少而不增加核心編蜗器取樣 頻率,將使得ACELP工具移出其最佳操作範圍之外。 取樣率 核心編碼器 取樣率 SBR 每框持續時間 USAC内設 17075赫茲 34150赫茲 60毫秒 提示的新設定 16537.5 赫茲 44100赫茲 -----~_- 46毫秒 該表例示說明如以24千位元/秒用在參考品質編碼器 之針對内設及所提示之新設定的取樣率及框持續時間。 後文中,為了體現所提示之新設定針對USAC解碼器所 21 201222532 耑修改係以進一步細節描述。 至於變換編碼n ’藉以3/4因數定標變換及窗大小,容 易達成車父短的框大小。鑑於標準模式的FD編碼器以1〇24及 128的變換大小操作,藉新設定而導入大小768及96之額外 隻換。對TCS需要大小768、384及192的額外變換。除了依 ®係數載明新變換大小外,變換編碼器可維持不變。 有關ACELP玉具,總框大小需調適為768樣本。達成此 項目的的—個方式係讓框總體結構維持不變,四個192樣本 的ACELP框ϋ g己768樣本的各個框。調適為縮小的框大小係 藉將每框的數目從鐵至成。子框長度係 不變維持64樣本。為了允許子框數目減少,使用略為不同 的體系編碼5周性資訊·三彳_性值係分別以9、6及6位元使 用絕對-相對-相對體系編碼,替代於標準模型使用9、6、9 及6位元的絕對_相對_絕對_相對體系。但編碼調性資訊之其 匕方式亦屬可能。ACELP編解碼器的其它元件諸如ACELp 碼薄及多個量化器(〇>(:濾波器、增益等)維持不變。 達成768樣本的總框大小之另—種方式係將三個大小 256之ACELP框組合成為-個大小768之核心編碼器框。 SBR工具之功能維持不變。但除了 頻帶分析帶 外’需要24頻帶分析QMF來允許因數8/3之升頻取樣。 後文中,將解釋所提不之額外操作點對計算複雜度的 办日此點首先係以基於編解碼器工具基礎進行及於結束 時摘述。複雜度係對内設低取樣率模式作比較及對較高取 樣率模式作比較,如由USAC參考品f編碼器以較高位元率
22 201222532 使用,此點可媲美針對此等操作點之相對應he -AACv2 設 定。 有關變換編碼器,變換編竭器部件之複雜度隨著取樣 率及變換長度而縮放。所提示的核心編碼器取樣率粗略保 持不變。變換大小縮小3/4因數。藉此方式,計算複雜度減 夕接近相同因數’饭③混合基數辦法用於潛在FFT。 〜而σ之基於變換之解碼II複雜度預期比較目前 操作點略減,及比較高取樣操作模式減少達3/4之因數。 至於ACELP,ACELPjh具之複雜度主要為組合下列操 作: ' 錢的解碼:該項操作之複雜度係與每秒子框數目成 正比,而其又係與.編碼ϋ取樣頻率直接成正比(子框大 小於64樣本維持不變)。因而接近與新設定相同。 LPC渡波及其它合成操作,包括低音後滤》皮器:此項 操作的複雜度係與核心編碼器取樣頻率直接成正比,因而 接近相等。 總體而言’ ACELP解碼器之預期複雜度係預期比較目 前USAC操作點維持不變,及比較高取樣操作模式減少3/4 因數。 有關SBR ’對SBR複雜度的主要貢獻因子為qmf濾波 器排組。此處複雜度隨取樣率及變換大小而縮放。更明禮 言之,分析濾波器排組之複雜度粗略減少3/4因數。 至於MPEG環繞,MPEG環繞部件的複雜度隨著取樣率 而縮放。所提示的額外操作模式對MPEG環繞工具的複雜度 23 201222532 無直接影響。 總而言之,發現所提示的新操作模式之複雜度比低取 樣率模式略為更複雜,但當以較高取樣率模式(USAC RM9,高SR : 13.4 MOPS ’所提示的新操作點:12.8 MOPS) 操作時係低於USAC解碼器的複雜度。 對所測試的操作點,複雜度評估如下: USACRM9,於34.15千赫茲操作:約4.6WMOPS ; USAC RM9,於44.1 千赫茲操作:約5.6 WMOPS ; 所提示的新操作點:約5.0WMOPS。 因預期USAC解碼器在其内設組態中需要可處理高達 48千赫茲的取樣率,預期藉此所提示的新操作點不會帶來 缺點。 至於記憶體需求,所提示的額外操作模式要求額外 MDCT窗原型的儲存,其加總卿Q字組(32位元)以下的額 外ROM需求。鑑於總解碼器R〇M需求約為25千字組,此一 數字似乎可忽略不計。 收聽測試結果顯示音樂及混合測試項的顯著改良,而 居音項的品質未降級。此種額外設定係意_作為u就 編解碼器的額外操作模式。 依據MUSHRA方&的收聽測試係進行來評估於μ千位 元/秒單聲道__之新歧效能。下列條件含在該測試 中:隱藏參考;3·5千赫祕祕定;USAC WD7參考品質 (WD7@34.15千赫兹);於高取樣率操作之 (聰⑽·1千赫旬;及USAC WD7參考品質,所提示之新 24 201222532 設定(WD7一CE@44.1千赫茲)。 測試涵蓋得自USAC測試集的12個測試項目,及下列額 外項目· si02 :響板;絲絨:電子音樂;及木琴:音樂盒。 第8a及8bg|例示說明測試結果。22人參與收聽測試。 使用學生t機率分布進行評估。 用於平均分數的評估(95%顯著程度),可觀察到於441 千赫兹較高取樣率操作的WD7針對二項目(es〇1、哈利波特) 的表現顯然比WD7差。而WD7與該技術之特徵性WD7間未 觀察得顯著差異。 用於差異分數之評估,可觀察得於441千赫茲操作的 WD7針對六項目(es〇卜1〇uis raquin、比卜、 哈利波特、SpeechOverMusic—4)及對全部項目求取平均的表 現顯然比WD7差。表現較差的項目包括全部純語音項及其 中兩個混合語音/音樂項。又復可觀察得於441千赫茲操作 的WD7針對四項目(閃爍、拯救、si〇2、絲絨)表現顯著優於 WD7。全部此等項目皆含有音樂信號的顯著部分或歸類為 音樂。 針對接受測試的技術,可觀察得其效能針對五項(閃 爍、拯救、tel5、si〇2、絲絨)’及此外對全部各項求平均 時係優於WD7。其表現較佳的全部項目含有音樂信號之顯 著部分或歸類為音樂。未觀察得降級。 藉前述實施例提供中間USAC位元率之新設定。此項新 設定允許US AC編解碼器增加其針對全部相關工具的時間 性粒度,諸如變換編碼器、SBR及MPEG環繞而未犧牲 25 201222532 ACELP工罝的σ 〇 /、、。〇質。藉此方式,可改良中間位元率範圍之 ,特別係針對具有高時間性結構的音樂及混合信號。 ^ USAC系統彈性增益,原因在於包括ACELP工具的 USAC編解碼器現在係用在較寬廣取樣率範圍,諸如Μ」千 赫茲。 第9圖例示說明用以處理音訊信號之裝置。該裝置包含 信號處理器910及組配器92〇。信號處理器91〇係適用於接收 具有遠音訊信號之第一可組配樣本數目945的第一音訊信 號框940。信號處理器910係適用於藉可組配的降頻取樣因 數來降頻取樣該音訊信號而獲得已處理的音訊信號。此 外’彳§號處理益係適用於接收具有該已處理之音訊信號之 第二可組配樣本數目955的第二音訊信號框95〇。 組配器920係適用於基於組配資訊Ci2而組配信號處理 器910 ,使得當第二可組配樣本數目對第—可組配樣本數目 具有第一比值時,可組配降頻取樣因數係等於第一降頻取 樣值。此外,組配器920係適用於組配信號處理器91〇,使 得當不同第二可組配樣本數目對第一可組配樣本數目具有 不同第二比值時,可,组配降餘樣因數係等於不同第二降 頻取樣值。第一或第二比值係非整數值。 依據第9圖之裝置例如可運用於編碼程序。 雖然已經就裝置脈絡描述若干構面,顯然此等構面也 表示相對應方法的描述,此處區塊⑽置係相對應於方法 步驟或方法步驟特徵。同理,以方法步驟脈絡描述的構面 也表示相對應裝置的相對應區塊或項目或特徵之描述。 26 201222532 本發明分解信號可儲存在數位儲存媒體,或可在傳輸 媒體諸如無線傳輸媒體或有線傳輸媒體諸如網際網路上傳 輸。 取決於某些體現要求,本發明之實施例可於硬體或於 軟體體現。體現可使用數位儲存媒體進行,例如軟碟、 DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶 體’該等媒體具有可電子讀取控制信號儲存於其上,該等 媒體與可規劃電腦系統協作(或可協作)因而執行個別方法。 依據本發明之若干實施例包含具有可電子讀取控制信 號的非暫時性資料載體,其可與可規劃電腦系統協作,因 而執行此處所述方法中之一者。 一般而言’本發明之實施例可體現為具有程式代碼的 電細程式產品,當該電腦程式產品於電腦上跑時,程式代 碼可操作來執行該等方法中之—者。程式代碼例如可儲存 在機器可讀取載體上。 其它實施例包含儲存在機器可讀取載體上用以執行此 處所述方法中之一者的電腦系統。 換言之,因此本發明方法之實施例為具有程式代碼的 電腦程式’當該電難式於電腦上跑時,程式代碼可操作 來執行該等方法中之一者。 因此本發明方法之又一實施例為資料載體(或數位健 子媒體或電腦可續取媒體)包含用以執行此處所述方法中 之一者的電腦程式記錄於其上。 因此本發明方法之又一實施例為表示用以執行此處所 27 201222532 述方法中t *的電腦程式之資料串流或信號序列。資料 串流或^號序列例如可經組8&來透過資料通訊速結,例如 透過網際網路傳輪。 又〆實施例包含級配來或適用於執行此處所述方法中 之一者的,理裝置’諸如電腦或可規劃邏輯裝置。 又〆實施例包含電腦具有用以執行此處所述方法中之 一者的電胳》程式安巢於其上。 於若千實施例中,可規劃邏輯裝置(例如町現場規劃閘 陣列(FPGA))可用來執行部分或全部此處所述方法功能。於 若干實施例中,可現場規劃閘陣列可與微處理器協作來執 行此處所述方法中之一者。—般而言,該等方法較佳係藉 任一種硬體裝置執行。 前述實施例僅供舉例說明本發明原理。須瞭解此處所 述配置之修改及變化及其細節為熟諳技藝人士顯然易知。 因此意圖只受隨附之申請專利範圍之範圍所限而非受此處 實施例藉描述與解說目的所呈現之特定細節所限。 【阅式簡單說曰月】 第1圖顯示依據-實施例用以處理音訊信號之裝置, 第2圖顯示依據另-實施例用以處理音訊信號之裝置, 第3圖顯示依據-實施例由裝置所進行的升頻取樣處 理, 第4圖顯示依據又更一實施例用以處理音訊信號之裝 置, 第5a圖顯示依據-實施例核心解碼器模組, 28
S 201222532 第5b圖顯示依據第4圖實施例含依據第5a圖之核心解 碼器模組的用以處理音訊信號之裝置, 第6a圖顯示包含四個ACELP框之ACELP超框, 第6b圖顯示包含三個ACELP框之ACELP超框, 第7a圖顯不USAC之内設設定值, 第7b圖顯示依據一實施例USAC之額外設定值, 第8a、8b圖顯示依據MUSHRA方法之聽聞測驗結果,及 第9圖顯示依據另一實施例用以處理音訊信號之裝置。 【主要元件符號說明】 110、205、405、910…信號處理器 120、208、408、920...組配器 140、150、940、950·.·音訊信號框 145、155、315、945、955·.·樣本 210…核心解碼器模組 220…分析濾波器排組 230...子帶產生器 240…合成濾波器排組 310、350.··時域音訊信號 320···頻域音訊信號 330、335、338、340···子帶信號 410". MP解碼器
510…第一核心解碼器、ACELP 解竭器 520…第二核心解碼器、FD變換 解碼器 605、625 …ACELP超框 610、630...ACELP框 615、635".子框 710、750...QMP分析濾波器排組 720、760…升頻取樣器 730、770…MPEG環繞(MPS)解碼器 740、780...QMP合成濾波器排組 asl-5···音訊信號 ci、ci2...組配資訊 29

Claims (1)

  1. 201222532 七、申請專利範圍: 1. 一種用以處理一音訊信號之裝置,其係包含: 一信號處理器係適用於接收具一第一可組配數目 之音訊信號樣本之一第一音訊信號框,係適用於藉一可 組配升頻取樣因數來升頻取樣該音訊信號而獲得一已 處理音訊信號,及係適用於輸出具一第二可組配數目之 該已處理音訊信號樣本之一第二音訊信號框;及 一組配器係適用於組配該信號處理器, 其中該組配器係適用於基於組配資訊而組配該信 號處理器,使得當該第二可組配樣本數目對該第一可組 配樣本數目之一第一比具有一第一比值時,該可組配升 頻取樣因數係等於一第一升頻取樣值,及其中該組配器 係適用於組配該信號處理器,使得當該第二可組配樣本 數目對該第一可組配樣本數目之一不同第二比具有一 不同第二比值時,該可組配升頻取樣因數係等於一不同 第二升頻取樣值,及其中該第一或第二比值係非為整數 值。 2. 如申請專利範圍第1項之裝置,其中該組配器係適用於 組配該信號處理器使得當該第二可組配樣本數目對該 第一可組配樣本數目之第二比係大於該第二可組配樣 本數目對該第一可組配樣本數目之第一比時,該不同第 二升頻取樣值係大於該第一升頻取樣值。 3. 如申請專利範圍第1或2項之裝置,其中該組配器係適用 於組配該信號處理器使得當該第二可組配樣本數目對 30 201222532 該第一可組配樣本數目之第一比具有該第一比值時,該 可組配升頻取樣因數係等於該第一比值,及其中該組配 器係適用於組配該信號處理器使得當該第二可組配樣 本數目對該第一可組配樣本數目之第二比具有該不同 第二比值時,該可組配升頻取樣因數係等於該不同第二 比值。 4. 如前述申請專利範圍各項中任一項之裝置,其中該組配 器係適用於組配該信號處理器使得當該第一比具有該 第一比值時,該可組配升頻取樣因數係等於2,及其中 該組配器係適用於組配該信號處理器使得當該第二比 具有不同第二比值時,該可組配升頻取樣因數係等於 8/3。 5. 如前述申請專利範圍各項中任一項之裝置,其中該組配 器係適用於組配該信號處理器使得當該第一比具有該 第一比值時,該第一可組配樣本數目係等於1024及該第 二可組配樣本數目係等於2048,及其中該組配器係適用 於組配該信號處理器使得當該第二比具有不同第二比 值時,該第一可組配樣本數目係等於768及該第二可組 配樣本數目係等於2048。 6. 如前述申請專利範圍各項中任一項之裝置,其中該信號 處理器係包含: 一核心解碼器模組用以解碼該音訊信號來獲得一 前處理音訊信號, 具有多個分析遽波器排組通道之一分析濾波器組 31 201222532 用以將該第一前處理音 來獲得包衫個子抑;^纽:料變換成一頻域 -子帶η。 頻域前處理音訊信號, 作及添加額=:針r頻域前處理音訊信號製 組通道之-合成_組 得該已處理音訊信號信號從頻域變換成時域來獲 其中該組配器係適用 通道數目或該分。該合成渡波器排組 产理,來二=排組通道數目而組配該信號 ΐ==:Γ升頻取樣因數係等於該合成漉 =、.且通道數目對該分析遽波器排 7·==Γ〜,其中該子帶產生器為-谱帶複製益係適用於複製該前處理音訊 =針對該頻域前處理音訊信號製作該等額外 8. 如申請專利㈣第6或7項之裝置,其”㈣處理器進 -步包含-酬G環繞解郁心解碼該前處理音訊作 號來獲得包含立體聲或魏聲道之1處理音訊信號。, 其中該子帶產生器係適用於在針對該頻域前處理 音訊信號之該等額外子帶信號已經製作且添加至誃頻 域前處理音祕號後,將該頻域前處理音_號 MPEG環繞解碼器。 人 9.如申請專利範圍第6至8項中任一項之奘恶 衣置’其中該核心 32 201222532 解碼益模組包含_第_核心解碼器及 tm a , 币一核心解石 二第中:第-核心解碼器係適用於在_時域操作及其 玄第二核心解糾係適用於在-頻域操作。 10.如申請專利範圍第9項之裝置,其中該第_核心解Μ 係為-ACELP解碼器及其中該第二核心解碼器係為一 FD變換解碼器或一TCX變換解碼器。 11·如申請專利範圍第1()項之裝置,其中該織挪碼器係 適用於處理該第—音訊信號框,其中該第-音訊信號框 具有4 ACELP柜,及其中該等ACELp解碼器中之各者具 有192音訊信號樣本,此時該第一音訊信號框之該第— 可組配樣本數目係等於768。 12·如申請專利範圍第1〇項之裝置,其中該ACELP解碼器係 適用於處理該第一音訊信號框,其中該第一音訊信號框 具有3 ACELP框,及其中該等ACELP解碼器中之各者具 有256 θ成仏號樣本,此時該第一音訊信號框之該第— 可組配樣本數目係等於768。 13. 如前述申請專利範圍各項中任一項之裝置,其中該組配 器係適用於基於該組配資訊指示該音訊信號之第一可 組配樣本數目或該已處理音訊信號之第二可組配樣本 數目中之至少一者而組配該信號處理器。 14. 如前述申請專利範圍各項中任一項之裝置,其中該組配 器係適用於基於該組配資訊而組配該信號處理器,其中 該組配資訊指示該音訊信號之第一可組配樣本數目或 該已處理音訊信號之第二可組配樣本數目,其中該組配 33 201222532 資訊為一組配指數。 15. —種用以處理一音訊信號之方法,其係包含: 組配一可組配升頻取樣因數, 接收具有該音訊信號之一第一可組配樣本數目之 一第一音訊信號框,及 藉該可組配升頻取樣因數升頻取樣該音訊信號來 獲得一已處理音訊信號,及係適用於輸出具有該已處理 音訊信號之一第二可組配樣本數目之一第二音訊框;及 其中該可組配升頻取樣因數係基於組配資訊而經 組配使得當該第二可組配樣本數目對該第一可組配樣 本數目之一第一比具有一第一比值時該可組配升頻取 樣因數係等於一第一升頻取樣值,及其中該可組配升頻 取樣因數係經組配使得當該第二可組配樣本數目對該 第一可組配樣本數目之一不同第二比具有一不同第二 比值時,該可組配升頻取樣因數係等於一不同第二升頻 取樣值,及其中該第一或第二比值係非為整數值。 16. —種用以處理一音訊信號之裝置,其係包含: 一信號處理器係適用於接收具一第一可組配數目 之音訊信號樣本之一第一音訊信號框,係適用於藉一可 組配降頻取樣因數來降頻取樣該音訊信號而獲得一已 處理音訊信號,及係適用於輸出具一第二可組配數目之 該已處理音訊信號樣本之一第二音訊信號框;及 一組配器係適用於組配該信號處理器, 其中該組配器係適用於基於組配資訊而組配該信 34 201222532 號處理器,使得當該第二可組配樣本數目對該第一可組 配樣本數目之一第一比具有一第一比值時,該可組配降 頻取樣因數係等於一第一降頻取樣值,及其中該組配器 係適用於組配該信號處理器,使得當該第二可組配樣本 數目對該第一可組配樣本數目之一不同第二比具有一 不同第二比值時,該可組配降頻取樣因數係等於一不同 第二降頻取樣值,及其中該第一或第二比值係非為整數 值。 17. 如申請專利範圍第16項之裝置,其中該組配器係適用於 組配該信號處理器使得當該第二可組配樣本數目對該 第一可組配樣本數目之第二比係小於該第二可組配樣 本數目對該第一可組配樣本數目之第一比時,該不同第 二降頻取樣值係小於該第一降頻取樣值。 18. —種用以處理一音訊信號之方法,其係包含: 組配一可組配降頻取樣因數, 接收具有該音訊信號之一第一可組配樣本數目之 一第一音訊信號框,及 藉該可組配降頻取樣因數降頻取樣該音訊信號來 獲得一已處理音訊信號,及係適用於輸出具有該已處理 音訊信號之一第二可組配樣本數目之一第二音訊框;及 其中該可組配降頻取樣因數係基於組配資訊而經 組配使得當該第二可組配樣本數目對該第一可組配樣 本數目之一第一比具有一第一比值時該可組配降頻取 樣因數係等於一第一降頻取樣值,及其中該可組配降頻 35 201222532 取樣因數係經組配使得當該第二可組配樣本數目對該 第一可組配樣本數目之一不同第二比具有一不同第二 比值時,該可組配降頻取樣因數係等於一不同第二降頻 取樣值,及其中該第一或第二比值係非為整數值。 19. 一種電腦程式,當該電腦程式係藉一電腦或處理器執行 時係用以執行如申請專利範圍第15或18項之方法。
    36
TW100136050A 2010-10-06 2011-10-05 用以針對聯合統一語音與音訊編解碼器處理音訊信號與提供較高時間粒度之裝置與方法 TWI486950B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39026710P 2010-10-06 2010-10-06
PCT/EP2011/067318 WO2012045744A1 (en) 2010-10-06 2011-10-04 Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)

Publications (2)

Publication Number Publication Date
TW201222532A true TW201222532A (en) 2012-06-01
TWI486950B TWI486950B (zh) 2015-06-01

Family

ID=44759689

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100136050A TWI486950B (zh) 2010-10-06 2011-10-05 用以針對聯合統一語音與音訊編解碼器處理音訊信號與提供較高時間粒度之裝置與方法

Country Status (18)

Country Link
US (1) US9552822B2 (zh)
EP (1) EP2625688B1 (zh)
JP (1) JP6100164B2 (zh)
KR (1) KR101407120B1 (zh)
CN (1) CN103403799B (zh)
AR (2) AR083303A1 (zh)
AU (1) AU2011311659B2 (zh)
BR (1) BR112013008463B8 (zh)
CA (1) CA2813859C (zh)
ES (1) ES2530957T3 (zh)
HK (1) HK1190223A1 (zh)
MX (1) MX2013003782A (zh)
MY (1) MY155997A (zh)
PL (1) PL2625688T3 (zh)
RU (1) RU2562384C2 (zh)
SG (1) SG189277A1 (zh)
TW (1) TWI486950B (zh)
WO (1) WO2012045744A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2562384C2 (ru) * 2010-10-06 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)
JP6155274B2 (ja) * 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
AU2014204540B1 (en) * 2014-07-21 2015-08-20 Matthew Brown Audio Signal Processing Methods and Systems
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
CN108885877B (zh) * 2016-01-22 2023-09-08 弗劳恩霍夫应用研究促进协会 用于估计声道间时间差的设备及方法
CN109328382B (zh) * 2016-06-22 2023-06-16 杜比国际公司 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
JP7268301B2 (ja) 2018-08-10 2023-05-08 日本精工株式会社 テーブル装置
JP7103052B2 (ja) 2018-08-10 2022-07-20 日本精工株式会社 テーブル装置

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03286698A (ja) 1990-04-02 1991-12-17 Onkyo Corp ソフトドーム振動板
KR970011728B1 (ko) 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US6006108A (en) * 1996-01-31 1999-12-21 Qualcomm Incorporated Digital audio processing in a dual-mode telephone
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6208671B1 (en) * 1998-01-20 2001-03-27 Cirrus Logic, Inc. Asynchronous sample rate converter
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6275836B1 (en) * 1998-06-12 2001-08-14 Oak Technology, Inc. Interpolation filter and method for switching between integer and fractional interpolation rates
US6208276B1 (en) * 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
JP2000352999A (ja) * 1999-06-11 2000-12-19 Nec Corp 音声切替装置
WO2001099277A1 (en) * 2000-06-23 2001-12-27 Stmicroelectronics Asia Pacific Pte Ltd Universal sampling rate converter for digital audio frequencies
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP2004120182A (ja) * 2002-09-25 2004-04-15 Sanyo Electric Co Ltd デシメーションフィルタおよびインターポレーションフィルタ
JP4369946B2 (ja) * 2002-11-21 2009-11-25 日本電信電話株式会社 ディジタル信号処理方法、そのプログラム、及びそのプログラムを格納した記録媒体
CN1768476B (zh) * 2003-03-31 2010-06-09 Nxp股份有限公司 采样率转换器及方法,包括采样率转换器的设备
KR101149956B1 (ko) 2004-03-25 2012-06-01 디티에스, 인코포레이티드 스케일러블 무손실 음성 코덱 및 오서링 툴
DE102004043521A1 (de) 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US8108219B2 (en) * 2005-07-11 2012-01-31 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US7528745B2 (en) * 2006-02-15 2009-05-05 Qualcomm Incorporated Digital domain sampling rate converter
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US7912728B2 (en) * 2006-11-30 2011-03-22 Broadcom Corporation Method and system for handling the processing of bluetooth data during multi-path multi-rate audio processing
RU2507609C2 (ru) * 2008-07-11 2014-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и дискриминатор для классификации различных сегментов сигнала
WO2010003539A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal synthesizer and audio signal encoder
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8117039B2 (en) * 2008-12-15 2012-02-14 Ericsson Television, Inc. Multi-staging recursive audio frame-based resampling and time mapping
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
WO2010086461A1 (en) * 2009-01-28 2010-08-05 Dolby International Ab Improved harmonic transposition
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
RU2562384C2 (ru) * 2010-10-06 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)
AU2012230442B2 (en) * 2011-03-18 2016-02-25 Dolby International Ab Frame element length transmission in audio coding
WO2013163224A1 (en) * 2012-04-24 2013-10-31 Vid Scale, Inc. Method and apparatus for smooth stream switching in mpeg/3gpp-dash

Also Published As

Publication number Publication date
PL2625688T3 (pl) 2015-05-29
WO2012045744A1 (en) 2012-04-12
CN103403799A (zh) 2013-11-20
TWI486950B (zh) 2015-06-01
US9552822B2 (en) 2017-01-24
BR112013008463B8 (pt) 2022-04-05
EP2625688A1 (en) 2013-08-14
JP2013543600A (ja) 2013-12-05
CA2813859A1 (en) 2012-04-12
SG189277A1 (en) 2013-05-31
RU2013120320A (ru) 2014-11-20
AU2011311659A1 (en) 2013-05-02
CN103403799B (zh) 2015-09-16
KR101407120B1 (ko) 2014-06-13
EP2625688B1 (en) 2014-12-03
JP6100164B2 (ja) 2017-03-22
RU2562384C2 (ru) 2015-09-10
BR112013008463A2 (pt) 2016-08-09
ES2530957T3 (es) 2015-03-09
AU2011311659B2 (en) 2015-07-30
AR101853A2 (es) 2017-01-18
AR083303A1 (es) 2013-02-13
KR20130069821A (ko) 2013-06-26
US20130226570A1 (en) 2013-08-29
HK1190223A1 (zh) 2014-06-27
MY155997A (en) 2015-12-31
CA2813859C (en) 2016-07-12
MX2013003782A (es) 2013-10-03
BR112013008463B1 (pt) 2021-06-01

Similar Documents

Publication Publication Date Title
TW201222532A (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
RU2680195C1 (ru) Аудиокодер для кодирования многоканального сигнала и аудиодекодер для декодирования кодированного аудиосигнала
US7974713B2 (en) Temporal and spatial shaping of multi-channel audio signals
ES2663269T3 (es) Codificador de audio para codificar una señal de audio que tiene una porción similar a un impulso y una porción estacionaria
US8817992B2 (en) Multichannel audio coder and decoder
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
TWI576832B (zh) 產生帶寬延伸訊號的裝置與方法
CN105378832B (zh) 解码器、编码器、解码方法、编码方法和存储介质
EP1756807B1 (en) Audio encoding
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP2023539348A (ja) ミキシングノイズ信号に依存する多チャネル信号発生器、オーディオエンコーダ、および関係する方法
RU2809646C1 (ru) Генератор многоканальных сигналов, аудиокодер и соответствующие способы, основанные на шумовом сигнале микширования