TW201732781A - 使用頻譜域重新取樣來編碼或解碼多通道信號之裝置及方法 - Google Patents

使用頻譜域重新取樣來編碼或解碼多通道信號之裝置及方法 Download PDF

Info

Publication number
TW201732781A
TW201732781A TW106102409A TW106102409A TW201732781A TW 201732781 A TW201732781 A TW 201732781A TW 106102409 A TW106102409 A TW 106102409A TW 106102409 A TW106102409 A TW 106102409A TW 201732781 A TW201732781 A TW 201732781A
Authority
TW
Taiwan
Prior art keywords
sequence
spectral
output
time
block
Prior art date
Application number
TW106102409A
Other languages
English (en)
Other versions
TWI629681B (zh
Inventor
古拉米 福契斯
艾曼紐 拉斐里
馬庫斯 穆爾特斯
馬可斯 史奈爾
史蒂芬 多伊拉
馬汀 迪茲
葛倫 馬可維希
依萊尼 弗托波勞
史蒂芬 拜爾
渥爾夫剛 賈格斯
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201732781A publication Critical patent/TW201732781A/zh
Application granted granted Critical
Publication of TWI629681B publication Critical patent/TWI629681B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Control Of Eletrric Generators (AREA)
  • Emergency Protection Circuit Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一種用於編碼包含至少兩個通道之一多通道信號之裝置包含:一時間頻譜轉換器,其用於將該等至少兩個通道的樣本值之區塊之序列轉換成具有該等至少兩個通道的頻譜值之區塊之序列的一頻域表示,其中取樣值之一區塊具有一相關聯輸入取樣速率,且頻譜值之區塊之該等序列的頻譜值之一區塊具有高達與該輸入取樣速率相關之一最大輸入頻率的頻譜值;一多通道處理器,其用於將一聯合多通道處理應用於頻譜值之區塊之該等序列或頻譜值之區塊之重新取樣序列,以獲得包含與該等至少兩個通道相關之資訊的頻譜值之區塊之至少一個結果序列;一頻譜域重新取樣器,其用於在頻域中對該等結果序列之該等區塊重新取樣或用於在頻域中對該等至少兩個通道的頻譜值之區塊之該等序列重新取樣,以獲得頻譜值之區塊之一重新取樣序列,其中頻譜值之區塊之該重新取樣序列之一區塊具有高達不同於該最大輸入頻率之一最大輸出頻率的頻譜值;一頻譜時間轉換器,其用於將頻譜值之區塊之該重新取樣序列轉換成一時域表示,或用於將頻譜值之區塊之該結果序列轉換成包含取樣值之區塊之一輸出序列的一時域表示,該等取樣值具有不同於該輸入取樣速率的相關聯之一輸出取樣速率;及一核心編碼器,其用於編碼取樣值之區塊之該輸出序列,以獲得一經編碼多通道信號。

Description

使用頻譜域重新取樣來編碼或解碼多通道信號之裝置及方法
發明領域 本申請案係關於立體聲處理或一般而言多通道處理,其中多通道信號具有兩個通道(諸如,在立體聲信號之情況下,左通道及右通道)或多於兩個的通道(諸如,三個、四個、五個或任何其他數目個通道)。
發明背景 立體聲語音且特定言之會話式立體聲語音已接收到比立體聲音樂之儲存及廣播少得多的關注。實際上,在語音通訊中,現如今仍然主要使用單聲道傳輸。然而,隨著網路頻寬及容量增大,設想基於立體聲技術之通訊將變得愈加風行且帶來較佳收聽體驗。
為了高效儲存或廣播,在音樂之感知音訊寫碼中已對立體聲音訊材料之高效寫碼進行長時間研究。在波形保持至關重要之高位元速率下,已長時間使用已知為中間/旁側(M/S)立體聲的總和-差立體聲。對於低位元速率,已引入強度立體聲及近年來的參數立體聲寫碼。在不同標準中採用最新技術,如HeAACv2及Mpeg USAC。最新技術產生兩通道信號之降混且關聯緊密空間旁側資訊。
聯合立體聲寫碼通常相對於高頻解析度(亦即,低時間解析度,信號之時間頻率變換)來建置,且因而與大部分語音寫碼器中所執行之低延遲及時域處理不相容。此外,自生位元速率通常係高的。
另一方面,參數立體聲採用額外濾波器組,其作為預處理器定位於編碼器的前端中且作為後處理器定位於解碼器的後端中。因此,參數立體聲可與如ACELP之習知語音寫碼器一起使用,此係因為參數立體聲係以MPEG USAC進行。此外,聽覺場景之參數化可用最小量之旁側資訊達成,此適合於低位元速率。然而,如(例如)在MPEG USAC中,參數立體聲未針對低延遲特定設計且並不針對不同會話式情境傳遞不變品質。在空間場景之習知參數表示中,立體聲影像之寬度係藉由應用於兩個合成通道之去相關器人工再現且由藉由編碼器計算以及傳輸的通道間相干性(IC)參數來控制。對於大部分立體聲語音,加寬立體聲影像之此方式並不適合於重建完美直接聲音的語音之自然氛圍,此係因為完美直接聲音係由位於空間中之特定位置處的單一源產生(有時具有來自房間之某一迴響)。相比之下,樂器具有比語音大得多的自然寬度,此可藉由使通道去相關來模仿。
問題亦在用於非重合麥克風記錄語音時出現,如在麥克風彼此遠離時成A-B組態,或針對雙耳記錄或再現。可設想彼等情境以用於在電話會議中擷取語音或用於在多點控制單元(MCU)中用遠距離揚聲器建立虛擬聽覺場景。信號之到達時間因而在一個通道與另一通道之間不同,不同於用重合麥克風進行之記錄,如X-Y (強度錄音)或M-S(中間旁側錄音)。此等非時間對準的兩個通道之相干性之計算接著可錯誤地估計,此使得人工氛圍合成失敗。
與立體聲處理相關之先前技術參考為美國專利5,434,948或美國專利8,811,621。
文件WO 2006/089570 A1揭露近透明或透明的多通道編碼器/解碼器方案。多通道編碼器/解碼器方案另外產生波形型殘餘信號。此殘餘信號將與一或多個多通道參數一起傳輸至解碼器。與純粹的參數多通道解碼器相比,增強型解碼器由於額外殘餘信號而產生具有經改良輸出品質之多通道輸出信號。在編碼器側,左通道及右通道均藉由分析濾波器組來濾波。因而,對於每一子頻帶信號,針對子頻帶計算對準值及增益值。此對準因而在進一步處理之前執行。在解碼器側,執行去對準及增益處理,且接著藉由合成濾波器組來合成對應信號以便產生經解碼左信號及經解碼右信號。
另一方面,參數立體聲採用額外濾波器組,其作為預處理器定位於編碼器的前端中且作為後處理器定位於解碼器的後端中。因此,參數立體聲可與如ACELP之習知語音寫碼器一起使用,此係因為參數立體聲係以MPEG USAC進行。此外,聽覺場景之參數化可用最小量之旁側資訊達成,此適合於低位元速率。然而,如(例如)在MPEG USAC中,參數立體聲未針對低延遲特定設計,且整個系統展示非常高的演算法延遲。
發明概要 本發明之一目標為提供針對多通道編碼/解碼之經改良概念,其高效且在位置中以獲得低延遲。
此目標係藉由根據技術方案1的用於編碼多通道信號之裝置、根據技術方案24的用於編碼多通道信號之方法、根據技術方案25的用於解碼經編碼多通道信號之裝置、根據技術方案42的用於解碼經編碼多通道信號之方法或根據技術方案43的電腦程式而達成。
本發明係基於如下發現:多通道處理(亦即,聯合多通道處理)之至少一部分且較佳地所有部分在頻譜域中執行。具體言之,較佳在頻譜域中執行聯合多通道處理之降混操作,且另外,執行時間及相位對準操作或甚至用於分析聯合立體聲/聯合多通道處理之參數的程序。另外,頻譜域重新取樣係在多通道處理之後或甚至在多通道處理之前執行,以便提供來自一另外頻譜時間轉換器之一輸出信號,其已經處於隨後連接之核心編碼器所需的輸出取樣速率下。
在解碼器側,較佳再一次執行用於在頻譜域中自降混信號產生一第一通道信號及一第二通道信號之至少一操作,且較佳地,甚至在頻譜域中執行完整的反多通道處理。此外,提供時間頻譜轉換器以用於將經核心解碼信號轉換成頻譜域表示,且在頻域內,執行反多通道處理。頻譜域重新取樣係在多通道反處理之前執行或在多通道反處理之後執行,以此方式使得在最後,頻譜時間轉換器將頻譜重新取樣信號以意欲用於時域輸出信號之輸出取樣速率轉換至時域中。
因此,本發明允許完全避免任何計算密集型時域重新取樣操作。實情為,多通道處理將與重新取樣組合。在較佳實施例中,頻譜域重新取樣在減少取樣之情況下藉由截短頻譜而執行,或在增加取樣之情況下藉由對頻譜進行零填補而執行。此等簡單操作(亦即,一方面截短頻譜或另一方面對頻譜進行零填補,及較佳額外縮放,以便考慮諸如DFT或FFT演算法之頻譜域/時域轉換演算法中所執行的特定正規化操作)使頻譜域重新取樣操作以非常高效且低延遲之方式完成。
此外,已發現編碼器側上之至少一部分或甚至整個聯合立體聲處理/聯合多通道處理及解碼器側上之對應反多通道處理適合於在頻域中執行。此並不僅僅對於作為編碼器側上之最小聯合多通道處理的降混操作或作為解碼器側上之最小反多通道處理的升混處理有效。實情為,甚至編碼器側上之立體聲場景分析及時間/相位對準或解碼器側上之相位及時間去對準亦可在頻譜域中執行。上述情況適用於較佳地執行的編碼器側上之旁側通道編碼或解碼器側上之用於產生兩個經解碼輸出通道之旁側通道合成及使用。
因此,本發明之一優點為提供了比現有立體聲寫碼方案更加適合於立體聲語音轉換的新立體聲寫碼方案。本發明之實施例提供用於達成低延遲立體聲編解碼器及在切換式音訊編解碼器內整合針對語音核心寫碼器及基於MDCT之核心寫碼器的於頻域中執行之共同立體聲工具之新架構。
本發明之實施例係關於混頻來自習知M/S立體聲或參數立體聲之元素的混合式方法。實施例使用來自聯合立體聲寫碼之一些態樣及工具以及來自參數立體聲之其他態樣及工具。更特定而言,實施例採納在編碼器的前端以及在解碼器的後端進行之額外時間頻率分析及合成。時間頻率分解及反變換係藉由採用濾波器組或具有複數值之區塊變換來達成。來自兩個通道或多通道輸入,立體聲或多通道處理組合且修改輸入通道,以輸出稱為中間及旁側信號(MS)之通道。
本發明之實施例提供用於減小由立體聲模組引入且特定言之來自其濾波器組之成框及開窗的演算法延遲的解決方案。該解決方案提供多重速率反變換,其用於藉由以不同取樣速率產生相同立體聲處理信號而對如3GPP EVS之切換式寫碼器或在語音寫碼器(如ACELP)與一般音訊寫碼器(如TCX)之間切換的寫碼器進行饋給。此外,該解決方案提供適用於低延遲及低複雜系統之不同約束以及立體聲處理的開窗。此外,實施例提供用於在頻譜域中組合及重新取樣不同經解碼合成結果之方法,其中反立體聲處理同樣適用。
本發明之較佳實施例包含頻譜域重新取樣器中之多功能,其不僅產生頻譜值之單一頻譜域重新取樣區塊,而且另外產生對應於不同較高或較低取樣速率的頻譜值之區塊之一另外重新取樣序列。
此外,多通道編碼器經組配以在頻譜時間轉換器之輸出端處另外提供一輸出信號,其與輸入至編碼器側上之時間頻譜轉換器中的原始第一及第二通道信號具有相同的取樣速率。因此,在實施例中,多通道編碼器以原始輸入取樣速率提供至少一個輸出信號,其較佳用於基於MDCT之編碼。另外,至少一個輸出信號係以具體言之可用於ACELP寫碼之中間取樣速率提供,且以亦可用於ACELP編碼,但不同於另一輸出取樣速率之一另外輸出取樣速率另外提供一另外輸出信號。
此等程序可針對中間信號或針對旁側信號或針對自多通道信號導出之第一及第二通道信號之兩個信號(其中在僅具有兩個通道(例如,另外兩個低頻增強通道)之立體聲信號之情況下,第一信號亦可為左信號且第二信號可為右信號)而執行。
在另外實施例中,多通道編碼器之核心編碼器經組配以根據成框控制而操作,且立體聲後處理器及重新取樣器之時間頻譜轉換器及頻譜時間轉換器亦經組配以根據同步至核心編碼器之成框控制的另外成框控制而操作。執行同步,以使得核心編碼器之訊框之序列之每一訊框的開始訊框邊界或結束訊框邊界與一窗口之一重疊部分之一開始瞬時或一結束瞬時呈一預定關係,該窗口由時間頻譜轉換器或由頻譜時間轉換器針對取樣值之區塊之序列的每一區塊或針對頻譜值之區塊之重新取樣序列的每一區塊使用。因此,保證後續成框操作彼此同步地操作。
在另外實施例中,具有預看部分之預看操作係藉由核心編碼器執行。在此實施例中,較佳地,預看部分亦供時間頻譜轉換器之分析窗口使用,其中使用分析窗口之重疊部分,該重疊部分具有低於或等於預看部分之時間長度的時間長度。
因此,藉由使核心編碼器之預看部分與分析窗口之重疊部分彼此相等或藉由使重疊部分甚至小於核心編碼器之預看部分,立體聲預處理器之時間頻譜分析不會沒有任何額外演算法延遲地實施。為了確保此經開窗預看部分不過多地影響核心編碼器預看功能性,較佳使用分析窗口功能之反轉來糾正此部分。
為了確保此糾正以良好穩定性進行,使用正弦窗口形狀之平方根來替代正弦窗口形狀作為分析窗口,且使用1.5合成窗口之冪的正弦以達成在於頻譜時間轉換器之輸出端處執行重疊操作之前合成開窗之目的。因此,確保糾正函數採用與作為正弦函數之逆函數的糾正函數相比相對於量值減小的值。
然而,在解碼器側,較佳使用相同的分析及合成窗口形狀,當然,此係因為不需要糾正。另一方面,較佳在解碼器側使用時間間隙,其中時間間隙存在於解碼器側上之時間頻譜轉換器之分析窗口的前導重疊部分之終點與由多通道解碼器側上之核心解碼器輸出之訊框結束時的時間瞬時之間。因此,此時間間隙內之核心解碼器輸出樣本出於緊接著的立體聲後處理器之分析開窗之目的而不被需要,而僅僅係下一訊框之處理/開窗所需的。此時間間隙可(例如)藉由使用通常在分析窗口中間中之非重疊部分來實施,此導致重疊部分縮短。然而,亦可使用用於實施此時間間隙之其他替代例,但藉由中間的非重疊部分來實施時間間隙係較佳方式。因此,此時間間隙可用於在核心解碼器自頻域切換至時域訊框時的其他核心解碼器操作或較佳切換事件之間的平滑操作,或在參數變化或寫碼特性變化已經出現時用於可能有用的任何其他平滑操作。
較佳實施例之詳細說明 圖1說明用於編碼包含至少兩個通道1001、1002之多通道信號之裝置。在兩通道立體聲情境之情況下,第一通道1001在左通道中,且第二通道1002可為右通道。然而,在多通道情境之情況下,第一通道1001及第二通道1002可為多通道信號之通道中之任一者,諸如,一方面為左通道且另一方面為左環繞通道,或一方面為右通道及另一方面為右環繞通道。然而,此等通道配對僅為實例,且其他通道配對可視情況需要而應用。
圖1之多通道編碼器包含時間頻譜轉換器,其用於將至少兩個通道之取樣值之區塊的序列轉換成時間頻譜轉換器之輸出端處的頻域表示。每一頻域表示具有至少兩個通道中之一者的頻譜值之區塊之序列。特定言之,第一通道1001或第二通道1002之取樣值之區塊具有相關聯輸入取樣速率,且時間頻譜轉換器之輸出之序列的頻譜值之區塊具有高達與輸入取樣速率相關之最大輸入頻率的頻譜值。在圖1中所說明之實施例中,時間頻譜轉換器連接至多通道處理器1010。此多通道處理器經組配用於將聯合多通道處理應用於頻譜值之區塊之序列,以獲得包含與至少兩個通道相關之資訊的頻譜值之區塊之至少一個結果序列。典型多通道處理操作為降混操作,但較佳多通道操作包含隨後將描述之額外程序。
在一替代實施例中,多通道處理器1010連接至頻譜域重新取樣器1020,且頻譜域重新取樣器1020之輸出經輸入至多通道處理器中。此藉由虛連接線1021、1022來說明。在此替代實施例中,多通道處理器經組配用於不對由時間頻譜轉換器輸出的頻譜值之區塊之序列應用聯合多通道處理,而對可在連接線1022上獲得的區塊之重新取樣序列應用聯合多通道處理。
頻譜域重新取樣器1020經組配用於對由多通道處理器產生之結果序列重新取樣或對由時間頻譜轉換器1000輸出的區塊之序列重新取樣,以獲得可表示如以線1025所說明之中間信號的頻譜值之區塊之重新取樣序列,。較佳地,頻譜域重新取樣器另外執行對由多通道處理器產生之旁側信號的重新取樣,且因此亦輸出對應於如以1026所說明之旁側信號的重新取樣序列。然而,旁側信號之產生及重新取樣係可選的且並非低位元速率實施所需的。較佳地,頻譜域重新取樣器1020經組配用於出於減少取樣之目的而截短頻譜值之區塊或出於增加取樣之目的而對頻譜值之區塊進行零填補。多通道編碼器另外包含頻譜時間轉換器,其用於將頻譜值之區塊之重新取樣序列轉換成包含取樣值之區塊之輸出序列的時域表示,該等取樣值具有不同於輸入取樣速率之相關聯一輸出取樣速率。在替代實施例中,在頻譜域重新取樣在多通道處理之前執行之情況下,多通道處理器將經由虛線1023之結果序列直接提供至頻譜時間轉換器1030。在此替代實施例中,可選特徵為:另外,旁側信號係由多通道處理器產生,從而已經在重新取樣表示中,且旁側信號接著亦由頻譜時間轉換器進行處理。
最後,頻譜時間轉換器較佳提供時域中間信號1031及可選時域旁側信號1032,該等信號均可由核心編碼器1040進行核心編碼。一般而言,核心編碼器經組配用於對取樣值之區塊之輸出序列進行核心編碼,以獲得經編碼多通道信號。
圖2說明對解釋頻譜域重新取樣有用之頻譜圖表。
圖2中之上部圖表說明在時間頻譜轉換器1000之輸出端可獲得的通道之頻譜。此頻譜1210具有高達最大輸入頻率1211之頻譜值。在增加取樣之情況下,在延伸直至最大輸出頻率1221之零填補部分或零填補區域1220內執行零填補。由於意欲增加取樣,因此最大輸出頻率1221大於最大輸入頻率1211。
與此相比,圖2中之最低圖表說明藉由對區塊之序列減少取樣招致的程序。為此目的,區塊在截短區域1230內截短,使得1231處的截短頻譜之最大輸出頻率低於最大輸入頻率1211。
通常,與圖2中之對應頻譜相關聯之取樣速率為頻譜之最大頻率的至少2倍。因此,對於圖2中之上部情況,取樣速率將為最大輸入頻率1211的至少2倍。
在圖2之第二圖表中,取樣速率將為最大輸出頻率1221 (亦即,零填補區域1220之最高頻率)的至少兩倍。與此相比,在圖2中之最低圖表中,取樣速率將為最大輸出頻率1231 (亦即,在截短區域1230內之截短之後剩餘的最高頻譜值)的至少2倍。
圖3a至圖3c說明在某些DFT正向或反向變換演算法之情況下可使用的若干替代例。在圖3a中,考慮一情形,其中執行具有大小x之DFT,且其中正向變換演算法1311中並不出現任何正規化。在區塊1331,說明了具有不同大小y之反向變換,其中執行具有1/Ny 之正規化。Ny 係具有大小y之反向變換之頻譜值的數目。接著,較佳執行如區塊1321所說明的按Ny/ Nx 之縮放。
與此相比,圖3b說明一實施,其中正規化經分配至正向變換1312及反向變換1332。接著需要如區塊1322中所說明之縮放,其中反向變換之頻譜值的數目與正向變換之頻譜值的數目之間的關係的平方根有用。
圖3c說明又一實施,其中在執行具有大小x之正向變換之情況下,對正向變換執行完全正規化。因而,如區塊1333中所說明之反向變換在無任何正規化之情況下操作,使得並不需要如圖3c中之示意性區塊1323所說明的任何縮放。因此,視特定演算法而定,需要特定縮放操作或甚至不需要縮放操作。然而,較佳根據圖3a來操作。
為了使總延遲保持為低,本發明提供在編碼器側面的用於避免需要時域重新取樣器且藉由藉由在DFT域中對信號重新取樣來替換時域重新取樣器之方法。舉例而言,在EVS中,允許節約來自時域重新取樣器的0.9375 ms之延遲。頻域中之重新取樣係藉由零填補或截短頻譜及正確地對頻譜進行縮放來達成。
考慮輸入開窗信號x (以速率fx取樣,頻譜X大小為Nx )及同一信號之版本y (以速率fy重新取樣,頻譜大小為Ny )。取樣因數因而等於: fy/fx = Ny /Nx 在減少取樣之情況下,Nx >Ny 。藉由直接縮放且截短原始頻譜X,可在頻域中簡單地執行減少取樣: Y[k]=X[k].Ny /Nx ,其中k=0..Ny 在增加取樣之情況下,Nx <Ny 。藉由直接縮放且零填補原始頻譜X,可在頻域中簡單地執行增加取樣: Y[k]=X[k].Ny /Nx ,其中k=0… Nx Y[k]= 0,其中k= Nx …Ny
兩種重新取樣操作可藉由下式概述: Y[k]=X[k].Ny /Nx ,其中所有k=0…min(Ny ,Nx ) Y[k]= 0,其中所有k= min(Ny ,Nx )…Ny ,若Ny >Nx
一旦獲得新頻譜Y,即可藉由應用大小Ny 之相關聯反變換iDFT而獲得時域信號y: y = iDFT(Y)
為了跨不同訊框建構連續時間信號,接著對輸出訊框y開窗且將其重疊添加至先前獲得之訊框。
窗口形狀對於所有取樣速率相同,但窗口在樣本中具有不同大小且視取樣速率而以不同方式加以取樣。由於形狀係純粹從分析上定義,因此窗口之樣本的數目及其值可容易地導出。窗口之不同部分及大小在圖8a中可發現為目標取樣速率之函數。在此情況下,將重疊部分中之正弦函數(LA)用於分析及合成窗口。針對此等區域,遞增ovlp_size係數藉由下式給出: win_ovlp(k) = sin(pi*(k+0.5)/(2* ovlp_size));其中k=0..ovlp_size-1 而遞減ovlp_size係數藉由下式給出: win_ovlp(k) = sin(pi*(ovlp_size-1-k+0.5)/(2* ovlp_size));其中k=0..ovlp_size-1 其中ovlp_size係取樣速率之函數且在圖8a中給出。
新的低延遲立體聲寫碼為利用一些空間提示之聯合中間/側(M/S)立體聲寫碼,其中中間通道藉由主要單聲道核心寫碼器(單聲道核心寫碼器)來寫碼,且側通道在輔助核心寫碼器中進行寫碼。編碼器及解碼器原理描繪於圖4a及圖4b中。
立體聲處理主要在頻域(FD)中執行。視情況,某一立體聲處理可在頻率分析之前在時域(TD)中執行。ITD計算之情況正如此,ITD計算可在頻率分析之前計算並應用以用於在實行立體聲分析及處理之前即時地對準通道。替代地,ITD處理可直接在頻域中進行。由於如ACELP之常見語音寫碼器並不含有任何內部時間頻率分解,因此立體聲寫碼借助於在核心編碼器之前的分析及合成濾波器及在核心解碼器之後的分析合成濾波器組之另一階段來添加額外複合式調變濾波器組。在較佳實施例中,使用具有低重疊區域之過度取樣DFT。然而,在其他實施例中,可使用具有類似時間解析度之任何複合式時間頻率分解。在立體聲濾波器頻帶之後,參考如QMF之濾波器組或如DFT之區塊變換。
立體聲處理由計算空間提示及/或立體聲參數(如通道內時間差(inter-channel Time Difference;ITD)、通道間相位差(inter-channel Phase Difference;IPD)、通道間位準差(inter-channel Level Difference;ILD)及用於根據中間信號(M)預測旁側信號(S)之預測增益)組成。值得注意的,編碼器及解碼器兩者處之立體聲濾波器組在寫碼系統中引入額外延遲。
圖4a說明用於編碼多通道信號之裝置,其中,在此實施中,使用通道間時間差(ITD)分析在時域中執行某一聯合立體聲處理,且其中,使用置放於時間頻譜轉換器1000之前的時間移位區塊1410在時域內應用此ITD分析1420之結果。
接著,在頻譜域內,執行又一立體聲處理1010,其至少招致中間信號M之左邊及右邊的降混,且視情況,招致旁側信號S之計算,及儘管圖4a中未明確地說明,由可應用兩個不同替代例中之一者的圖1中所說明之頻譜域重新取樣器1020執行的重新取樣操作,亦即,在多通道處理之後或在多通道處理之前執行重新取樣。
此外,圖4a說明較佳核心編碼器1040之其他細節。特定言之,出於寫碼頻譜時間轉換器1030之輸出端處的時域中間信號m之目的,使用EVS編碼器。另外,出於旁側信號編碼之目的,執行MDCT寫碼1440及隨後連接之向量量化1450。
經編碼或經核心編碼之中間信號及經核心編碼之旁側信號經轉遞至將此等經編碼信號與旁側資訊一起多工之多工器1500。一種旁側資訊為在1421輸出至多工器(且視情況至立體聲處理元件1010)的ID參數,且其他參數為通道間位準差/預測參數、通道間相位差(IPD參數)或立體聲填充參數,如線1422處所說明。相應地,用於解碼由位元串流1510表示之多通道信號的圖4b裝置包含解多工器1520、核心解碼器(在此實施例中,由針對經編碼中間信號m之EVS解碼器1602及向量反量化器1603以及隨後連接之反MDCT區塊1604組成)。區塊1604提供經核心解碼之旁側信號s。使用時間頻譜轉換器1610將經解碼信號m、s轉換至頻譜域中,且接著,在頻譜域內,執行反立體聲處理及重新取樣。再次,圖4b說明一情形,其中自M信號至左L及右R之升混經執行,且另外,執行使用IPD參數之窄帶去對準,且另外,執行用於使用線1605上之通道間位準差參數ILD及立體聲填充參數來計算儘可能良好之左通道及右通道的另外程序。此外,解多工器1520不僅自位元串流1510提取線1605上之參數,而且提取線1606上之通道間時間差且將此資訊轉遞至區塊反立體聲處理/重新取樣器,且另外轉遞至區塊1650中之反時間移位處理,反時間移位處理在時域中執行,亦即,在由以輸出速率提供經解碼左信號及右信號之頻譜時間轉換器執行的程序之後,輸出速率(例如)不同於EVS解碼器1602之輸出端處的速率或不同於IMDCT區塊1604之輸出端處的速率。
立體聲DFT接著可提供進一步輸送至切換式核心編碼器之信號的不同取樣版本。用以寫碼之信號可為中間通道、側通道或左通道及右通道,或由兩個輸入通道之旋轉或通道映射產生的任何信號。由於切換式系統之不同核心編碼器接受不同取樣速率,因此重要特徵為立體聲合成濾波器組可提供多等級信號(multi-rated signal)。該原理在圖5中給出。
在圖5中,立體聲模組選取兩個輸入通道l及r作為輸入,且在頻域中將該等通道變換為信號M及S。在立體聲處理中,輸入通道最終可經映射或經修改以產生兩個新信號M及S。M將根據3GPP標準EVS單聲道或其經修改版本進一步寫碼。此編碼器為切換式寫碼器,在MDCT核心(在EVS情況下,TCX及HQ核心)與語音寫碼器(在EVS中,ACELP)之間切換。此編碼器亦具有始終以12.8kHz運行之預處理功能,及以根據操作模式變化之取樣速率(12.8kHz、16kHz、25.6kHz或32kHz)運行之其他預處理功能。此外,ACELP以12.8kHz或16kHz運行,而MDCT核心以輸入取樣速率運行。信號S可由標準EVS單聲道編碼器(或其經修改版本)或由針對其特性專門設計之特定旁側信號編碼器進行寫碼。亦能夠有可能跳過旁側信號S之寫碼。
圖5說明具有經立體聲處理之信號M及S之多重速率合成濾波器組的較佳立體聲編碼器細節。圖5展示時間頻譜轉換器1000,其以輸入速率(亦即,信號1001及1002具有之速率)執行時間頻率變換。明確地,圖5另外說明針對每一通道之時域分析區塊1000a、1000e。特定言之,儘管圖5說明顯式時域分析區塊(亦即,用於將分析窗口應用於對應通道之開窗程式),但應注意,在在本說明書中之其他位置,用於應用時域分析區塊之開窗程式被認為包括於經指示為某一取樣速率下之「時間頻譜轉換器」或「DFT」的區塊中。此外且相應地,頻譜時間轉換器之提及通常包括在實際DFT演算法之輸出處的用於應用對應合成窗口之開窗程式,其中,為了最終獲得輸出樣本,執行以對應合成窗口進行開窗的取樣值之區塊的重疊添加。因此,即使(例如)區塊1030僅提及「IDFT」,此區塊亦通常表示利用分析窗口對時域樣本之區塊的後續開窗以及此外後續的重疊加法運算,以便最終獲得時域m信號。
此外,圖5說明特定立體聲場景分析區塊1011,該區塊執行用以執行立體聲處理及降混之區塊1010中所使用的參數,且此等參數可(例如)為圖4a之線1422或1421上之參數。因此,區塊1011在該實施中可對應於圖4a中之區塊1420,其中甚至參數分析(亦即,立體聲場景分析)在頻譜域中進行,且特定言之利用未經重新取樣,但在對應於輸入取樣速率之最大頻率下的頻譜值之區塊之序列。
此外,核心解碼器1040包含基於MDCT之編碼器分支1430a及ACELP編碼分支1430b。特定言之,針對中間信號M之中間寫碼器且針對旁側信號s之對應側寫碼器執行基於MDCT之編碼與ACELP編碼之間的切換寫碼,其中,通常,核心編碼器另外具有通常對某一預看部分操作以便判定某一區塊或訊框是否使用基於MDCT之程序或基於ACELP之程序進行編碼的寫碼模式決定器。此外,或替代地,核心編碼器經組配以使用預看部分,以便判定諸如LPC參數等之其他特性。
此外,核心編碼器另外包含不同取樣速率下之預處理級,諸如以12.8 kHz操作之第一預處理級1430c及以由16 kHz、25.6 kHz或32 kHz組成之取樣速率群組的取樣速率操作之又一預處理級1430d。
因此,一般而言,圖5中所說明之實施例經組配以具有用於自輸入速率(其可為8 kHz、16或32 kHz)重新取樣成不同於8、16或32之輸出速率中之任一者的頻譜域重新取樣器。
此外,圖5中之實施例另外經組配以具有未經重新取樣之額外分支,亦即,由「輸入速率下之IDFT」說明的針對中間信號且視情況針對旁側信號的分支。
此外,圖5中之編碼器較佳包含一重新取樣器,其不僅重新取樣至第一輸出取樣速率,而且重新取樣至第二輸出取樣速率,以便具有用於預處理器1430c及1430d兩者之資料,該等預處理器可(例如)操作以執行某種濾波、某種LPC計算或較佳揭示於用於在圖4a之情況下已經提及之EVS編碼器之3GPP標準中的某種其他信號處理。
圖6說明用於解碼經編碼多通道信號1601之裝置的實施例。該解碼裝置包含核心解碼器1600、時間頻譜轉換器1610、頻譜域重新取樣器1620、多通道處理器1630以及頻譜時間轉換器1640。
此外,關於用於解碼經編碼多通道信號1601之裝置的本發明可在兩個替代例中實施。一個替代例為:頻譜域重新取樣器經組配以在執行多通道處理之前在頻譜域中對經核心解碼之信號重新取樣。此替代例由圖6中之實線來說明。然而,另一替代例為:在多通道處理之後執行頻譜域重新取樣,亦即,多通道處理以輸入取樣速率進行。此實施例在圖6中由虛線說明。
特定言之,在第一實施例中,亦即,在頻譜域重新取樣在多通道處理之前在頻譜域中執行之情況下,表示取樣值之區塊之序列的經核心解碼之信號將轉換成具有線1611處的經核心解碼之信號的頻譜值之區塊之序列的頻域表示。
另外,經核心解碼之信號不僅包含線1602處之M信號,而且包含線1603處之旁側信號,其中旁側信號在經核心編碼之表示中以1604說明。
接著,時間頻譜轉換器1610另外產生線1612上之旁側信號的頻譜值之區塊之序列。
接著,頻譜域重新取樣由區塊1620執行,且在線1621將關於中間信號或降混通道或第一通道的頻譜值之區塊之重新取樣序列轉遞至多通道處理器,且亦視情況,亦經由線1622將旁側信號的頻譜值之區塊之重新取樣序列自頻譜域重新取樣器1620轉遞至多通道處理器1630。
接著,多通道處理器1630對線1621及1622處所說明的來自降混信號及視情況來自旁側信號之序列的序列執行反多通道處理,以便輸出1631及1632處所說明的頻譜值之區塊之至少兩個結果序列。此等至少兩個序列接著使用頻譜時間轉換器轉換至時域中,以便輸出時域通道信號1641及1642。在線1615處所說明的另一替代例中,時間頻譜轉換器經組配以將經核心解碼之信號(諸如中間信號)饋送至多通道處理器。另外,時間頻譜轉換器亦可將經解碼旁側信號1603以其頻譜域表示饋送至多通道處理器1630,儘管此選項未在圖6中說明。接著,多通道處理器執行反處理,且輸出的至少兩個通道係經由連接線1635轉遞至頻譜域重新取樣器,該頻譜域重新取樣器接著經由線1625將重新取樣之至少此等兩個通道轉遞至頻譜時間轉換器1640。
因此,與在圖1之情況下已論述的情況有點類似,用於解碼經編碼多通道信號之裝置亦包含兩個替代例,亦即,在頻譜域重新取樣在反多通道處理之前執行之情況下,或替代地,在頻譜域重新取樣在輸入取樣速率下之多通道處理之後執行之情況下。然而,較佳地,執行第一替代例,此係因為第一替代例允許圖7a及圖7b中所說明的不同信號貢獻之有利對準。
此外,圖7a說明核心解碼器1600,然而,該核心解碼器輸出三個不同輸出信號,亦即:相對於輸出取樣速率之不同取樣速率下之第一輸出信號1601,輸入取樣速率(亦即,經核心編碼之信號1601下之取樣速率)下之第二經核心解碼之信號1602,且核心解碼器另外產生輸出取樣速率(亦即,圖7a中之頻譜時間轉換器1640之輸出端處最終預期的取樣速率)下之可操作且可用之第三輸出信號1603。
所有三個經核心解碼之信號被輸入至時間頻譜轉換器1610中,該時間頻譜轉換器產生頻譜值之區塊之三個不同序列1613、1611以及1612。
頻譜值之區塊之序列1613具有高達最大輸出頻率之頻率或頻譜值,且因此與輸出取樣速率相關聯。
頻譜值之區塊之序列1611具有高達一不同最大頻率之頻譜值,且因此,此信號並不對應於輸出取樣速率。
此外,信號1612頻譜值高達亦不同於最大輸出頻率之最大輸入頻率。
因此,序列1612及1611被轉遞至頻譜域重新取樣器1620,而信號1613不轉遞至頻譜域重新取樣器1620,此係因為此信號已與正確輸出取樣速率相關聯。
頻譜域重新取樣器1620將頻譜值之重新取樣序列轉遞至組合器1700,該組合器經組配以針對在重疊情形中對應之信號逐頻譜線地執行逐區塊組合。因此,在自基於MDCT之信號至ACELP信號之切換之間通常會存在交叉區域,且在此重疊範圍中,信號值存在且彼此組合。然而,當此重疊範圍結束且信號僅存在於信號1603中(例如,當信號1602例如不存在時)時,接著組合器在此部分中將不執行逐區塊頻譜線加法。然而,當轉接稍後出現時,逐區塊、逐頻譜線加法將在此交叉區域期間發生。
此外,如圖7b中所說明,連續加法亦可為可能的,其中執行區塊1600a處所說明的低音後置濾波器輸出信號,其產生可(例如)為來自圖7a之信號1601的間諧波錯誤信號。接著,在區塊1610中之時間頻譜轉換及後續頻譜域重新取樣1620之後,較佳在執行圖7b中之區塊1700中之加法之前執行額外濾波操作1702。
類似地,基於MDCT之解碼級1600d及時域頻寬擴展解碼級1600c可經由平滑轉換區塊1704耦接,以便獲得接著以輸出取樣速率轉換成頻譜域表示的經核心解碼之信號1603,使得對於此信號1613,頻譜域重新取樣並非必需的,但該信號可直接轉遞至組合器1700。立體聲反處理或多通道處理1603接著在組合器1700之後發生。
因此,與圖6中所說明之實施例相比,多通道處理器1630並不對頻譜值之重新取樣序列進行操作,而對包含頻譜值之至少一個重新取樣序列(諸如,1622及1621)的序列進行操作,其中該序列(多通道處理器1630對其進行操作)另外包含未必要重新取樣之序列1613。
如圖7中所說明,來自以不同取樣速率工作之DFT的不同經解碼信號已經時間對準,此係因為不同取樣速率下之分析窗口共用相同形狀。然而,頻譜展示不同大小及縮放。為了調和頻譜且使其相容,所有頻譜在添加至彼此之前以所要輸出取樣速率在頻域中重新取樣。
因此,圖7說明DFT域中之合成信號之不同貢獻的組合,其中頻譜域重新取樣係以如下方式執行:最後,待藉由組合器1700添加之所有信號已經獲得,且頻譜值延伸直至對應於輸出取樣速率之最大輸出頻率(亦即,低於或等於接著在頻譜時間轉換器1640之輸出端處所獲得的輸出取樣速率之一半)。
立體聲濾波器組之選擇對低延遲系統至關重要,且在圖8b中概述了可達成平衡點。其可使用DFT (區塊變換)或稱作偽低延遲QMF之CLDFB (濾波器組)。每一建議展示不同的延遲、時間以及頻率解析度。針對該系統,彼等特性之間的最佳折中必須要選擇。具有良好頻率及時間解析度係重要的。此係為何使用如建議3中之偽QMF濾波器組可成問題的原因。頻率解析度低。頻率解析度可藉由如MPEG-USAC之MPS 212中的混合式方法來增強,且頻率解析度具有明顯地增大複雜度及延遲之缺點。另一重要點為核心解碼器與反立體聲處理之間的在解碼器側處可獲得之延遲。此延遲愈大愈佳。舉例而言,建議2不能提供此延遲,且出於此原因而並非有價值的解決方案。出於此等上文所提及之原因,吾人在本說明書剩餘部分中將關注建議1、4以及5。
濾波器組之分析及合成窗口係另一重要態樣。在較佳實施例中,將相同窗口用於分析及合成DFT。在編碼器側及解碼器側處亦相同。對實現以下約束付出特殊注意力: • 重疊區域必須等於或小於MDCT核心及ACELP預看之重疊區域。在較佳實施例中,所有大小等於8.75 ms。 • 零填補應為至少約2.5 ms,用於允許在DFT域中應用通道之線性移位。 • 針對不同取樣速率:12.8 kHz、16 kHz、25.6 kHz、32 kHz以及48 kHz,窗口大小、重疊區域大小以及零填補大小必須用整數數目個樣本來表示。 • DFT複雜度應儘可能低,亦即,分裂基數實施中之DFT之最大基數應儘可能低。 • 時間解析度固定至10ms。
知道了此等約束,在圖8c中且在圖8a中描述建議1及4之窗口。
圖8c說明第一窗口,其由初始重疊部分1801、後續中部1803以及終止重疊部分或第二重疊部分1802組成。此外,第一重疊部分1801及第二重疊部分1802另外具有開始處的零填補部分1804及結束處的零填補部分1805。
此外,圖8c說明相對於圖1之時間頻譜轉換器1000或替代地圖7a之1610的成框所執行之程序。由元素1811 (亦即,第一重疊部分)、中間非重疊部分1813以及第二重疊部分1812組成的另一分析窗口與第一窗口重疊50%。第二窗口另外在其開始及結束處具有零填補部分1814及1815。此等零重疊部分係必需的,以便在位置中執行頻域中之寬頻時間對準。
此外,第二窗口之第一重疊部分1811在中間部分1803 (亦即,第一窗口之非重疊部分)結束時開始,且第二窗口之重疊部分(亦即,非重疊部分1813)在第一窗口之第二重疊部分1802結束時開始,如所說明。
當認為圖8c表示頻譜時間轉換器(諸如用於編碼器的圖1之頻譜時間轉換器1030,或用於解碼器的頻譜時間轉換器1640)上之重疊加法運算時,則由區塊1801、1802、1803、1805、1804組成之第一窗口對應於合成窗口,且由部分1811、1812、1813、1814、1815組成之第二窗口對應於下一個區塊的合成窗口。因而,窗口之間的重疊說明重疊部分,且以1820來說明該重疊部分,且該重疊部分之長度等於當前訊框處以二,且在較佳實施例中等於10 ms。此外,在圖8c之底部,用於計算重疊範圍1801或1811內之遞增窗口係數的分析方程式經說明為正弦函數,且相應地,重疊部分1802及1812之遞減重疊大小係數亦經說明為正弦函數。
在較佳實施例中,針對圖6、圖7a、圖7b中所說明之解碼器僅使用相同的分析窗口及合成窗口。因此,時間頻譜轉換器1616及頻譜時間轉換器1640使用完全相同的窗口,如圖8c中所說明。
然而,在特定言之關於後續建議/實施例1之某些實施例中,使用大體上符合圖1c之分析窗口,但用於遞增或遞減重疊部分之窗口係數將使用正弦函數之平方根來計算,正弦函數中之引數與圖8c中相同。相應地,使用正弦至冪1.5函數來計算合成窗口,但再次具有相同的正弦函數引數。
此外,應注意,歸因於重疊加法運算,正弦至冪0.5乘以正弦至冪1.5的乘法再一次產生正弦至冪2結果,其係具有能量守恆情形必需的。
建議1以DFT之重疊區域具有相同大小且與ACELP預看及MDCT核心重疊區域對準作為主要特性。編碼器延遲因而對於ACELP/MDCT核心而言相同,且立體聲不引入編碼器處之任何額外延遲。在EVS情況下及在使用如圖5中所描述之多重速率合成濾波器組方法之情況下,立體聲編碼器延遲低至8.75ms。
在圖9a中說明編碼器示意性成框,而在圖9e中描繪解碼器。在圖9c中以藍色虛線畫出編碼器之窗口且以紅色實線畫出解碼器之窗口。
建議1之一個主要問題在於編碼器處之預看經開窗。該問題可針對後續處理加以糾正,或在後續處理係為了考慮經開窗預看而採用之情況下,可保留開窗。情況可能如下:若DFT中所執行之立體聲處理修改輸入通道,且尤其在使用非線性運算時,在核心寫碼被繞過之情況下,經糾正或經開窗信號不允許達成完美重建構。
值得注意的,在核心解碼器合成窗口與立體聲解碼器分析窗口之間,存在1.25ms時間間隙,其可供核心解碼器後處理、頻寬擴展(BWE) (如對ACELP所使用之時域BWE)或某一平滑(在於ACELP核心與MDCT核心之間轉換的情況下)利用。
由於僅1.25 ms之此時間間隙低於此等運算之標準EVS所需的2.3125 ms,因此本發明提供在立體聲模組之DFT域內組合、重新取樣以及平滑切換式解碼器之不同合成部分的方法。
如圖9a中所說明,核心編碼器1040經組配以根據成框控制操作以提供訊框之序列,其中訊框以開始訊框邊界1901及結束訊框邊界1902為界。此外,時間頻譜轉換器1000及/或頻譜時間轉換器1030亦經組配以根據與第一成框控制同步之第二成框控制而操作。針對編碼器中之時間頻譜轉換器1000,且特定言之針對同時且完全同步地進行處理之第一通道1001及第二通道1002,藉由兩個重疊窗口1903及1904來說明成框控制。此外,成框控制在解碼器側亦可見,具體言之,針對圖6之時間頻譜轉換器1610的兩個重疊窗口,以1913及1914說明。此等窗口1913及1914經應用於核心解碼器信號,該信號較佳為(例如)圖6之單一單聲道或降混信號1610。此外,自圖9a顯而易見,針對取樣值之區塊之序列之每一區塊或針對頻譜值之區塊之重新取樣序列之每一區塊,核心編碼器1040之成框控制與時間頻譜轉換器1000或頻譜時間轉換器1030之間的同步使得訊框序列之每一訊框之開始訊框邊界1901或結束訊框邊界1902與由時間頻譜轉換器1000或頻譜時間轉換器1030所使用的重疊部分之開始瞬時或及結束瞬時呈預定關係。在圖9a中所說明之實施例中,該預定關係使得第一重疊部分之開始與相對於窗口1903之開始時間邊界重合,且另一窗口1904之重疊部分之開始與中間部分(諸如,圖8c之部分1803)之結束一致。因此,當圖8c中之第二窗口對應於圖9a中之窗口1904時,結束訊框邊界1902與圖8c之中間部分1813之結束一致。
因此,顯而易見,圖9a中之第二窗口1904之第二重疊部分(諸如,圖8c之1812)延伸超過結束或停止訊框邊界1902,且因此,延伸至以1905說明之核心寫碼器預看部分中。
因此,核心編碼器1040經組配以在對取樣值之區塊之輸出序列的輸出區塊進行核心編碼時使用預看部分(諸如預看部分1905),其中輸出預看部分在時間上位於輸出區塊之後。輸出區塊對應於以訊框邊界1901、1904為界之訊框,且輸出預看部分1905跟在核心編碼器1040之此輸出區塊之後。
此外,如所說明,時間頻譜轉換器經組配以使用分析窗口,亦即窗口1904,其具有時間長度上低於或等於預看部分1905之時間長度的重疊部分,其中位於重疊範圍中的對應於圖8c之重疊1812之此重疊部分被用於產生經開窗預看部分。
此外,頻譜時間轉換器1030經組配以較佳使用糾正函數來處理對應於經開窗預看部分之輸出預看部分,其中糾正函數經組配以使得分析窗口之重疊部分之影響減小或消除。
因此,圖9a中的在核心編碼器1040與降混1010/減少取樣1020區塊之間操作的頻譜時間轉換器經組配以應用糾正函數,以便撤銷藉由圖9a中之窗口1904施加之開窗。
因此,確定核心編碼器1040在將其預看功能性應用於預看部分1095時對離原始部分儘可能遠的部分而非對該預看部分執行預看功能。
然而,歸因於低延遲約束,且歸因於立體聲預處理器之成框與核心編碼器之間的同步,預看部分之原始時域信號並不存在。然而,糾正函數之應用確保由此程序招致之任何偽訊儘可能多地減少。
在圖9d、圖9e中更詳細地說明了關於此技術之一系列程序。
在步驟1910中,執行第零個區塊之DFT-1 以獲得時域中之第零個區塊。第零個區塊將已獲得用以圖9a中之窗口1903之左邊的窗口。然而,此第零個區塊未在圖9a中明確地說明。
接著,在步驟1912中,使用合成窗口對第零個區塊開窗,亦即,在圖1中所說明之頻譜時間轉換器1030中進行開窗。
接著,如區塊1911中所說明,執行藉由窗口1903獲得之第一區塊之DFT-1 ,以獲得時域中之第一區塊,且再一次使用區塊1910中之合成窗口對此第一區塊進行開窗。
接著,如圖9d中之1918所指示,執行第二區塊(亦即,藉由圖9a之窗口1904獲得之區塊)之反DFT,以獲得時域中之第二區塊,且接著使用合成窗口對第二區塊之第一部分進行開窗,如圖9d之1920所說明。然而,重要地,藉由圖9d中之項目1918獲得的第二區塊之第二部分並未使用合成窗口進行開窗,但如圖9d之區塊1922中所說明地經糾正,且為了糾正函數,使用分析窗口函數且分析窗口函數之對應重疊部分的反量。
因此,若用於產生第二區塊之窗口為圖8c中所說明之正弦窗口,則圖8c之底部的用於使方程式之重疊大小係數遞減的1/sin()被用作糾正函數。
然而,較佳將正弦窗口之平方根用於分析窗口,且因此,糾正函數為窗函數。此確保藉由區塊1922獲得之經糾正預看部分儘可能地接近預看部分內之原始信號,但當然並非原始左信號或原始右信號,而係藉由將左信號及右信號相加以獲得中間信號而已經獲得之原始信號。
接著,在圖9d中之步驟1924中,藉由在區塊1030中執行重疊加法運算以使得編碼器具有時域信號而產生由訊框邊界1901、1902指示之訊框,且藉由對應於窗口1903之區塊與先前區塊的先前樣本之間的重疊加法運算以及使用由區塊1920獲得的第二區塊之第一部分來執行此訊框。接著,將由區塊1924輸出之此訊框轉遞至核心編碼器1040,且另外,核心寫碼器另外接收該訊框之經糾正預看部分,且如步驟1926中所說明,核心寫碼器接著可使用由步驟1922獲得的經糾正預看部分來判定核心寫碼器之特性。接著,如步驟1928中所說明,核心編碼器使用在區塊1926中判定之特性對訊框進行核心編碼,從而最終獲得對應於訊框邊界1901、1902之經核心編碼訊框,其在較佳實施例中具有20 ms之長度。
較佳地,延伸至預看部分1905中的窗口1904之重疊部分具有與該預看部分相同之長度,但該重疊部分亦可比該預看部分短,但較佳地,該重疊部分不比該預看部分長,以使得立體聲預處理器不會引入由重疊窗口引起之任何額外延遲。
接著,程序繼續使用合成窗口對第二區塊之第二部分開窗,如區塊1930中所說明。因此,第二區塊之第二部分一方面藉由區塊1922進行糾正,且另一方面藉由合成窗口進行開窗(如區塊1930中所說明),此係因為接著需要此部分以用於供核心編碼器產生下一訊框,藉由將第二區塊之經開窗第二部分、經開窗第三區塊以及第四區塊之經開窗第一部分重疊相加,如區塊1932中所說明。自然地,第四區塊且特定言之第四區塊之第二部分將再一次經受如關於圖9d之項目1922中之第二區塊所論述的糾正操作,且接著,程序將再一次如之前所論述地重複。此外,在步驟1934中,核心寫碼器將使用第四區塊之經糾正第二部分來判定核心寫碼器特性,且接著,將使用經判定之寫碼特性來編碼下一訊框,以便在區塊1934中最終獲得經核心編碼之下一訊框。因此,分析(在對應合成中)窗口之第二重疊部分與核心寫碼器預看部分1905的對準確保可獲得極低延遲實施且此優點由如下事實引起:經開窗之預看部分係一方面藉由執行糾正操作且另一方面藉由應用分析窗口(不等於合成窗口,但施加較小影響)來定址,以使得可確保糾正功能與使用相同分析/合成窗口相比更穩定。然而,在核心編碼器經修改成操作其預看功能(其通常係判定關於經開窗部分之核心編碼特性必需的)之情況下,未必執行糾正功能。然而,已發現使用糾正功能優於修改核心編碼器。
此外,如之前所論述,應注意,在窗口(亦即,分析窗口1914)之終點與圖9b的由開始訊框邊界1901及結束訊框邊界1902界定之訊框的結束訊框邊界1902之間存在時間間隙。
特定言之,時間間隙相對於藉由圖6之時間頻譜轉換器1610應用之分析窗口以1920來說明,且此時間間隙相對於第一輸出通道1641及第二輸出通道1642亦可見120。
圖9f展示在時間間隙之情況下所執行之步驟的程序,核心解碼器1600對訊框或至少訊框最初部分進行核心解碼,直至時間間隙1920。接著,圖6之時間頻譜轉換器1610經組配以使用分析窗口1914將分析窗口應用於訊框之初始部分,分析窗口在訊框結束(亦即,時間瞬時1902)之前並不延伸,而僅延伸直至時間間隙1920開始。
因此,核心解碼器具有額外時間以對時間間隙中之樣本進行核心解碼及/或對時間間隙中之樣本進行後處理,如區塊1940處所說明。因此,時間頻譜轉換器1610已輸出第一區塊作為步驟1938之結果,此處核心解碼器可提供時間間隙中之剩餘樣本或可在步驟1940對時間間隙中之樣本進行後處理。
接著,在步驟1942中,時間頻譜轉換器1610經組配以使用將在圖9b中之窗口1914之後出現的下一個分析窗口對時間間隙中之樣本以及下一訊框之樣本開窗。接著,如步驟1944中所說明,核心解碼器1600經組配以解碼下一訊框或至少下一訊框之初始部分,直至時間間隙1920在下一訊框中出現。接著,在步驟1946中,時間頻譜轉換器1610經組配以對下一訊框中之樣本開窗,直至下一訊框之時間間隙1920,且在步驟1948中,核心解碼器將接著對下一訊框之時間間隙中之剩餘樣本進行核心解碼及/或對此等樣本進行後處理。
因此,此時間間隙(例如,當考慮圖9b實施例時,為1.25 ms)可藉由核心解碼器後處理、藉由頻寬擴展、藉由(例如)ACELP之情況下所使用之時域頻寬擴展或藉由ACELP與MDCT核心信號之間的傳輸轉換之情況下的某一平滑而採用。
因此,再一次,核心解碼器1600經組配以根據第一成框控制而操作以提供訊框之序列,其中時間頻譜轉換器1610或頻譜時間轉換器1640經組配以根據與第一成框控制同步之第二成框控制而操作,以使得訊框之序列之每一訊框的開始訊框邊界或結束訊框邊界與一窗口之重疊部分之開始瞬時或結束瞬時呈預定關係,該窗口由時間頻譜轉換器或由頻譜時間轉換器針對取樣值之區塊之序列的每一區塊或針對頻譜值之區塊之重新取樣序列的每一區塊使用。
此外,時間頻譜轉換器1610經組配以將一分析窗口用於對訊框之序列的具有在結束訊框邊界1902之前結束之重疊範圍的訊框開窗,從而在重疊部分之終點與結束訊框邊界之間留下時間間隙1920。核心解碼器1600因此經組配以平行於使用該分析窗口的該訊框之該開窗而對時間間隙1920中之樣本執行處理,或其中平行於由時間頻譜轉換器進行的使用該分析窗口的該訊框之該開窗而對該時間間隙執行另外的後處理。
此外,且較佳地,定位用於經核心解碼信號的後繼區塊之分析窗口,以使得該窗口之中間非重疊部分位於如圖9b之1920處所說明的時間間隙內。
在建議4中,總系統延遲與建議1相比擴大。在編碼器處,額外延遲來自立體聲模組。不同於建議1,完美重建構之問題在建議4中不再相關。
在解碼器處,核心解碼器與第一DFT分析之間的可獲得延遲為2.5ms,其允許執行習知重新取樣、組合以及不同核心合成與延伸頻寬信號之間的平滑,如其在標準EVS中所進行。
在圖10a中說明編碼器示意性成框,而在圖10b中描繪解碼器。在圖10c中給出窗口。
在建議5中,DFT之時間解析度減小至5ms。核心寫碼器之預看及重疊區域並未開窗,此係與建議4之共用優點。另一方面,寫碼器解碼與立體聲分析之間的可獲得延遲小,且需要如建議1中所建議之解決方案(圖7)。此建議之主要缺點為時間頻率分解之低頻解析度及減小至5ms之小重疊區域,其防止頻域中之大時間移位。
在圖11a中說明編碼器示意性成框,而在圖11b中描繪解碼器。在圖11c中給出窗口。
考慮到以上內容,相對於編碼器側,較佳實施例係關於多重速率時間頻率合成,其以不同取樣速率將至少一個經立體聲處理之信號提供至後續處理模組。模組包括(例如)語音編碼器(如ACELP)、預處理工具、基於MDCT之音訊編碼器(諸如TCX)或頻寬擴展編碼器(諸如時域頻寬擴展編碼器)。
相對於解碼器,執行立體聲頻域中之重新取樣的相對於解碼器合成之不同貢獻的組合。此等合成信號可來自語音解碼器(如ACELP解碼器)、基於MDCT之解碼器、頻寬擴展模組或來自後處理(如低音後置濾波器)的間諧波錯誤信號。
此外,關於編碼器及解碼器兩者,應用用於DFT之窗口或利用零填補、低重疊區域及跳躍大小(hopsize) (其對應於不同取樣速率(諸如12.9 kHz、16 kHz、25.6 kHz、32 kHz或48 kHz)下之整數數目個樣本)經變換之複數值係有用的。
實施例能夠達成低延遲的立體聲音訊之低位元速率寫碼。有效率地組合低延遲切換式音訊寫碼方案(如EVS)與立體聲寫碼模組之濾波器組經過特定設計。
實施例可在分佈或廣播所有類型之立體聲或多通道音訊內容(語音及相似音樂,在給定低位元速率下具有恆定感知品質)(諸如關於數位無線電、網際網路串流及音訊通訊應用)時使用。
圖12說明用於編碼具有至少兩個通道之多通道信號的裝置。多通道信號10一方面輸入至參數判定器100中且另一方面輸入至信號對準器200中。參數判定器100根據多通道信號一方面判定寬頻對準參數且另一方面判定多個窄頻帶對準參數。此等參數係經由參數線12輸出。此外,此等參數亦經由另一參數線14輸出至如所說明之輸出介面500。在參數線14上,諸如位準參數之額外參數自參數判定器100轉遞至輸出介面500。信號對準器200經組配以用於使用經由參數線10接收之寬頻對準參數及多個窄頻帶對準參數來對準多通道信號10之至少兩個通道,以在信號對準器200之輸出端處獲得已對準通道20。此等已對準通道20經轉遞至信號處理器300,其經組配以用於根據經由線20接收之已對準通道來計算中間信號31及旁側信號32。用於編碼之裝置進一步包含信號編碼器400,其用於編碼來自線之中間信號31及來自線之旁側信號32,以獲得線上之經編碼中間信號41及線上之經編碼旁側信號42。此等信號均轉遞至輸出介面500以用於產生輸出線處的經編碼多通道信號50。輸出線處的經編碼信號50包含來自線之經編碼中間信號41、來自線之經編碼旁側信號42、來自線14之窄頻帶對準參數及寬頻對準參數以及視情況來自線14之位準參數,且另外視情況包含由信號編碼器400產生且經由參數線43轉遞至輸出介面500的立體聲填充參數。
較佳地,信號對準器經組配以在參數判定器100實際上計算窄頻帶參數之前,使用寬頻對準參數對準來自多通道信號之通道。因此,在此實施例中,信號對準器200經由連接線15將寬頻已對準通道發送回至參數判定器100。接著,參數判定器100自已經相對於寬頻特性已對準多通道信號而判定多個窄頻帶對準參數。然而,在其他實施例中,判定該等參數而無需程序之此特定序列。
圖14a說明一較佳實施,其中執行招致連接線15的特定步驟序列。在步驟16中,使用兩個通道來判定寬頻對準參數,且獲得諸如通道間時間差或ITD參數之寬頻對準參數。接著,在步驟21中,使用寬頻對準參數藉由圖12之信號對準器200來對準兩個通道。接著,在步驟17中,在參數判定器100內使用已對準通道來判定窄頻帶參數,以判定多個窄頻帶對準參數,諸如多通道信號之不同頻帶的多個通道間相位差參數。接著,在步驟22中,使用針對此特定頻帶之對應窄頻帶對準參數來對準每一參數頻帶中之頻譜值。當針對每一頻帶(其窄頻帶對準參數可獲得)執行步驟22中之此程序時,接著已對準的第一及第二或左/右通道可獲得以用於由圖12之信號處理器300進行進一步信號處理。
圖14b說明圖12之多通道編碼器之又一實施,其中若干程序在頻域中執行。
具體言之,多通道編碼器進一步包含時間頻譜轉換器150,其用於將時域多通道信號轉換成至少兩個通道在頻域內之頻譜表示。
此外,如152所說明,在圖12中以100、200以及300說明之參數判定器、信號對準器以及信號處理器全部在頻域中操作。
此外,多通道編碼器且具體言之,信號處理器進一步包含頻譜時間轉換器154,其用於產生至少中間信號之時域表示。
較佳地,頻譜時間轉換器另外將亦藉由區塊152所表示之程序判定的旁側信號之頻譜表示轉換成時域表示,且圖12之信號編碼器400接著經組配以視圖12之信號編碼器400之特定實施而將中間信號及/或旁側信號進一步編碼為時域信號。
較佳地,圖14b之時間頻譜轉換器150經組配以實施圖4c之步驟155、156以及157。具體言之,步驟155包含提供一分析窗口,在其一個末端處具有至少一個零填補部分,且具體言之,在初始窗口部分處具有零填補部分且在終止窗口部分處具有零填補部分,如隨後例如在圖7中所說明。此外,該分析窗口另外具有在窗口之第一半及窗口之第二半處的重疊範圍或重疊部分,且另外,較佳地,中間部分為非重疊範圍,視具體情況而定。
在步驟156中,使用具有重疊範圍之分析窗口對每一通道進行開窗。具體言之,以獲得通道之第一區塊的方式,使用分析窗口對每一通道進行開窗。隨後,獲得同一通道之第二區塊,其具有與第一區塊之某一重疊範圍等,以使得在例如五次開窗操作之後,可獲得每一通道之經開窗樣本之五個區塊,該等區塊接著被獨立地變換成頻譜表示,如圖14c中之157處所說明。亦針對另一通道執行相同程序,以使得在步驟157結束時,可獲得頻譜值且具體言之複合頻譜值(諸如DFT頻譜值或複合子頻帶樣本)之區塊之序列。
在由圖12之參數判定器100執行的步驟158中,判定寬頻對準參數,且在由圖12之信號對準200執行的步驟159中,使用寬頻對準參數來執行循環移位。在再次由圖12之參數判定器100執行的步驟160中,針對個別頻帶/子頻帶判定窄頻帶對準參數,且在步驟161中,使用針對特定頻帶所判定之對應窄頻帶對準參數而針對每一頻帶使已對準頻譜值旋轉。
圖14d說明由信號處理器300執行之其他程序。具體言之,信號處理器300經組配以計算中間信號及旁側信號,如在步驟301所說明。在步驟302中,可執行旁側信號之某種進一步處理,接著,在步驟303中,將中間信號及旁側信號之每一區塊變換回至時域中,且在步驟304中,將合成窗口應用於藉由步驟303獲得之每一區塊,且在步驟305中,執行一方面針對中間信號之重疊加法運算且另一方面針對旁側信號之重疊加法運算,以最終獲得時域中間/旁側信號。
具體言之,步驟304及305之操作在中間信號及旁側信號之下一個區塊中導致自中間信號或旁側信號之一個區塊的一種平滑轉換,使得即使當任何參數變化出現(諸如通道間時間差參數或通道間相位差參數出現)時,此衰落在藉由圖14d中之步驟305獲得之時域中間/旁側信號中將仍然不可聽見。
圖13說明用於解碼在輸入線處接收的經編碼多通道信號50之裝置之實施例的方塊圖。
詳言之,信號由輸入介面600接收。連接至輸入介面600的有信號解碼器700及信號去對準器900。此外,信號處理器800一方面連接至信號解碼器700且另一方面連接至信號去對準器。
詳言之,經編碼多通道信號包含經編碼中間信號、經編碼旁側信號、關於寬頻對準參數之資訊以及關於多個窄頻帶參數之資訊。因此,線上之經編碼多通道信號50可與由圖12之輸出介面500輸出的完全相同。
然而,重要地,此處應注意,與圖12中所說明之內容相比,包括於某一形式之經編碼信號中的寬頻對準參數及多個窄頻帶對準參數可恰好為供圖12中之信號對準器200使用的對準參數,但替代地亦可為該等對準參數之逆值,亦即,具有逆值的可供藉由信號對準器200執行之完全相同之操作使用,以使得獲得去對準的參數。
因此,關於對準參數之資訊可為供圖12中之信號對準器200使用的對準參數或可為逆值,亦即,實際「去對準參數」。另外,此等參數通常將以隨後將關於圖8所論述之某一形式量化。
圖13之輸入介面600將關於寬頻對準參數及多個窄頻帶對準參數之資訊自經編碼中間/旁側信號分離,且經由參數線610將此資訊轉遞至信號去對準器900。另一方面,經編碼中間信號係經由線601轉遞至信號解碼器700且經編碼旁側信號係經由信號線602轉遞至信號解碼器700。
信號解碼器經組配以用於解碼經編碼中間信號以及解碼經編碼旁側信號,以獲得線701上之經解碼中間信號及線702上之經解碼旁側信號。此等信號供信號處理器800使用以用於根據經解碼中間信號及經解碼旁側信號來計算經解碼第一通道信號或經解碼左信號以及計算經解碼第二通道或經解碼右通道信號,且分別在線801、802上輸出經解碼第一通道及經解碼第二通道。信號去對準器900經組配以用於使用關於寬頻對準參數之資訊且另外使用關於多個窄頻帶對準參數之資訊而將線801上之經解碼第一通道及經解碼右通道802去對準,以獲得經解碼多通道信號,亦即,線901及902上的具有至少兩個經解碼且去對準通道之經解碼信號。
圖9a說明藉由來自圖13之信號去對準器900執行之步驟的較佳順序。具體言之,步驟910接收如在來自圖13之線801、802上可獲得的已對準之左通道及右通道。在步驟910中,信號去對準器900使用關於窄頻帶對準參數之資訊將個別子頻帶去對準,以便在911a及911b處獲得相位去對準之經解碼第一及第二或左及右通道。在步驟912中,使用寬頻對準參數將該等通道去對準,以使得在913a及913b處獲得相位及時間去對準之通道。
在步驟914中,執行任何其他處理,其包含使用開窗或任何重疊加法運算或一般而言任何平滑轉換操作,以便在915a或915b處獲得偽訊減少或無偽訊之經解碼信號,亦即,不具有任何偽訊之經解碼通道,儘管此處通常已存在一方面用於寬頻且另一方面用於多個窄頻帶的時變去對準參數。
圖15b說明圖13中所說明之多通道解碼器的較佳實施。
詳言之,來自圖13之信號處理器800包含時間頻譜轉換器810。
信號處理器更包含中間/旁側至左/右轉換器820,以便自中間信號M及旁側信號S計算左信號L及右信號R。
然而,重要地,為了藉由區塊820中之中間/旁側至左/右轉換來計算L及R,旁側信號S未必被使用。實情為,如隨後所論述,最初僅使用自通道間位準差參數ILD導出之增益參數來計算左/右信號。因此,在此實施中,旁側信號S僅使用於通道更新器830中,該通道更新器操作以便使用傳輸之旁側信號S提供較佳左/右信號,如旁通線821所說明。
因此,轉換器820使用經由位準參數輸入822獲得之位準參數而操作且實際上不使用旁側信號S,但通道更新器830接著使用旁側821而操作且視特定實施而使用經由線831接收之立體聲填充參數。信號對準器900因而包含相位去對準器及能量定標器910。能量縮放由藉由縮放因數計算器940導出之縮放因數來控制。縮放因數計算器940由通道更新器830之輸出饋給。基於經由輸入911接收之窄頻帶對準參數,執行相位去對準,且在區塊920中,基於經由線921接收之寬頻對準參數,執行時間去對準。最後,執行頻譜時間轉換930,以便最終獲得經解碼信號。
圖15c說明在一較佳實施例中通常在圖15b之區塊920及930內執行的步驟之另一順序。
具體言之,窄頻帶去對準通道經輸入至對應於圖15b之區塊920的寬頻去對準功能性中。在區塊931中執行DFT或任何其他變換。在時域樣本之實際計算之後,執行使用合成窗口之可選合成開窗。合成窗口較佳與分析窗口完全相同,或自分析窗口導出(例如,內插或抽取),但以某種方式取決於分析窗口。此相關性較佳地如此,以使得由兩個重疊窗口定義之乘法因數針對重疊範圍中之每一點總計為一。因此,在區塊中932中之合成窗口之後,執行重疊操作及後續加法運算。替代地,替代合成開窗及重疊/加法運算,執行每一通道的後續區塊之間的任何平滑轉換,以便獲得偽訊減少之經解碼信號,如在圖15a之情況下已論述。
當考慮圖6b時,很明顯,一方面針對中間信號(亦即,「EVS解碼器」)且針對旁側信號(反向量量化VQ-1 及反MDCT操作(IMDCT))之實際解碼操作對應於圖13著急哦信號解碼器700。
此外,區塊810中之DFT操作對應於圖15b中之元件810,且反立體聲處理及反時間移位之功能性對應於圖13之區塊800、900,且圖6b中之反DFT操作930對應於圖15b中之區塊930中之對應操作。
隨後,較詳細地論述圖3d。詳言之,圖3d說明具有個別頻譜線之DFT頻譜。較佳地,圖3d中所說明之DFT頻譜或任何其他頻譜為複合頻譜,且每一線為具有量值及相位或具有實部及虛部之複合頻譜線。
另外,該頻譜亦劃分成不同參數頻帶。每一參數頻帶具有至少一個且較佳超過一個的頻譜線。另外,該等參數頻帶自較低頻率增加至較高頻率。通常,寬頻對準參數為整個頻譜(亦即,在圖3d中之例示性實施例中,包含所有頻帶1至6之頻譜)之單一寬頻對準參數。
此外,提供多個窄頻帶對準參數,以使得存在每一參數頻帶之單一對準參數。此意謂頻帶之對準參數始終適用於對應頻帶內之所有頻譜值。
此外,除窄頻帶對準參數外,針每一參數頻帶亦提供位準參數。
與針對頻帶1至頻帶6之每一個參數頻帶提供之位準參數相比,較佳僅針對有限數目個較低頻帶(諸如頻帶1、2、3以及4)提供多個窄頻帶對準參數。
另外,針對排除較低頻帶之某一數目個頻帶(諸如,在例示性實施例中,頻帶4、5以及6)提供立體聲填充參數,同時存在較低參數頻帶1、2以及3之旁側信號頻譜值,且因此,針對此等較低頻帶(其中波形匹配係使用旁側信號本身或表示旁側信號之預測殘餘信號獲得),不存在立體聲填充參數。
如已陳述,較高頻帶中存在較多頻譜線,諸如,在圖3d中之實施例中,參數頻帶6中之七條頻譜線對參數頻帶2中之僅三條頻譜線。然而,自然地,參數頻帶之數目、頻譜線之數目以及參數頻帶內之頻譜線之數目及亦某些參數之不同極限將不同。
儘管如此,圖8說明參數之分佈及頻帶之數目,該等頻帶之參數係在與圖3d相比實際上存在12個頻帶之某一實施例中提供。
如所說明,位準參數ILD係針對12個頻帶中之每一者提供且經量化至由每頻帶五個位元表示之量化準確度。
此外,窄頻帶對準參數IPD僅針對直至2.5 kHz之邊界頻率的較低頻帶提供。另外,通道間時間差或寬頻對準參數僅提供作為整個頻譜之單一參數,但具有整個頻帶的由八個位元表示之極高量化準確度。
此外,提供相當粗糙量化之立體聲填充參數,由每頻帶三個位元表示且不用於低於1 kHz之較低頻帶,此係因為對於較低頻帶,將包括實際上經編碼旁側信號或旁側信號殘餘頻譜值。
隨後,概述編碼器側上之較佳處理。在第一步驟中,執行左及右通道之DFT分析。此程序對應於圖14c之步驟155至157。計算寬頻對準參數,且特定言之,較佳寬頻對準參數為通道間時間差(ITD)。執行L及R在頻域中之時間移位。替代地,亦可在時域中經此時間移位。接著執行反DFT,在時域中執行時間移位且執行額外正向DFT,以便在使用寬頻對準參數之對準之後再一次具有頻譜表示。
針對已移位L及R表示上之每一參數頻帶計算ILD參數(亦即,位準參數)及相位參數(IPD參數)。此步驟對應於(例如)圖14c之步驟160。經時間移位之L及R表示依據通道間相位差參數而旋轉,如圖14c之步驟161中所說明。隨後,如步驟301中所說明,計算中間信號及旁側信號,且較佳地,另外利用如隨後所論述之能量會話操作。此外,執行對S之預測,其利用依據ILD變化之M且視情況利用過去M信號(亦即,稍早訊框之中間信號)。隨後,執行中間信號及旁側信號之反DFT,其在較佳實施例中對應於圖14d之步驟303、304、305。
在最終步驟中,對時域中間信號m及視情況殘餘信號進行寫碼。此程序對應於藉由圖12中之信號編碼器400執行之程序。
在解碼器處,在反立體聲處理中,Side 信號係在DFT域中產生且首先根據Mid 信號預測為:其中g 為針對每一參數頻帶計算出之增益且為傳輸之通道間位準差(ILD)之函數。
可接著以兩種不同方式來優化預測之殘餘: -藉由對殘餘信號之二次寫碼:其中為針對整個頻譜傳輸之全域增益 -藉由已知為立體聲填充之殘餘預測,利用來自先前DFT訊框之先前經解碼Mid 信號頻譜來預測參數旁側頻譜:其中為針對參數頻帶傳輸之預測性增益。
兩個類型之寫碼優化可在同一DFT頻譜內混合。在較佳實施例中,對較低參數頻帶應用殘餘寫碼,而對剩餘頻帶應用殘餘預測。在於時域中合成殘餘旁側信號且藉由MDCT將該信號變換之後,殘餘寫碼在如圖12中所描述之較佳實施例中在MDCT域中執行。不同於DFT,MDCT係關鍵取樣且更適合於音訊寫碼。MDCT係數為直接藉由晶格向量量化而量化之向量,但可替代地藉由繼之以熵寫碼器之純量量化器寫碼。替代地,殘餘旁側信號亦可藉由語音寫碼技術在時域中寫碼或直接在DFT域中寫碼。
隨後,描述聯合立體聲/多通道編碼器處理或反立體聲/多通道處理之又一實施例。1. 時間頻率分析:DFT
重要的,來自由DFT進行之立體聲處理的額外時間頻率分解允許良好聽覺場景分析,同時不顯著增加寫碼系統之總體延遲。根據預設,使用10 ms之時間解析度(為核心寫碼器之20 ms成框的兩倍)。分析窗口及合成窗口相同且對稱。窗口在圖7中以16 kHz之取樣速率表示。可以觀察到,重疊區域受到限制以用於減小自生延遲,且亦添加零填補以抗衡在頻域中應用ITD時之循環移位,此後將對其進行解釋。2. 立體聲參數
立體聲參數可以立體聲DFT之時間解析度最大程度地傳輸。最小時,其可減小至核心寫碼器之成框解析度,亦即20ms。根據預設,當未偵測到瞬變時,在2個DFT窗口中每隔20ms計算參數。參數頻帶構成頻譜之非均勻且非重疊分解,後繼大致2倍或4倍之等效矩形頻寬(Equivalent Rectangular Bandwidth;ERB)。根據預設,將4倍ERB標度用於16kHz之頻寬(32kbps取樣速率,超寬頻立體聲)的總共12個頻帶。圖8概述組態之實例,其中立體聲旁側資訊係以約5 kbps傳輸。3.ITD 及通道時間對準之計算
藉由使用與相位變換之一般化交叉相關(GCC-PHAT)估計到達時間延遲(TDOA)來計算ITD:其中L及R分別為左通道及右通道之頻率頻譜。頻率分析可獨立於用於後續立體聲處理之DFT而執行或可共用。用於計算ITD之偽程式碼如下:L =fft(window(l)); R =fft(window(r)); tmp = L .* conj( R ); sfm_L = prod(abs(L).^(1/length(L)))/(mean(abs(L))+eps); sfm_R = prod(abs(R).^(1/length(R)))/(mean(abs(R))+eps); sfm = max(sfm_L,sfm_R); h.cross_corr_smooth = (1-sfm)*h.cross_corr_smooth+sfm*tmp; tmp = h.cross_corr_smooth ./ abs( h.cross_corr_smooth+eps ); tmp = ifft( tmp ); tmp = tmp([length(tmp)/2+1:length(tmp) 1:length(tmp)/2+1]); tmp_sort = sort( abs(tmp) ); thresh = 3 * tmp_sort( round(0.95*length(tmp_sort)) ); xcorr_time=abs(tmp(- ( h.stereo_itd_q_max - (length(tmp)-1)/2 - 1 ):- ( h.stereo_itd_q_min - (length(tmp)-1)/2 - 1 ))); %smooth output for better detection xcorr_time=[xcorr_time 0]; xcorr_time2=filter([0.25 0.5 0.25],1,xcorr_time); [m,i] = max(xcorr_time2(2:end)); if m > thresh itd = h.stereo_itd_q_max - i + 1; else itd = 0; end
ITD計算亦可概述如下。交叉相關係在獨立於頻譜平坦度量測進行平滑之前在頻域中計算。SFM在0與1之間定界。在類雜訊信號之情況下,SFM將為高(亦即約1)且平滑將微弱。在類載頻調信號之情況下,SFM將為低且平滑將變得較強。經平滑之交叉相關接著在變換回至時域之前藉由其振幅正規化。該正規化對應於交叉相關之相位變換,且已知展示比低雜訊且相對高迴響環境中之一般交叉相關好的效能。如此獲得之時域函數首先經濾波以用於達成更穩固之峰值峰化。對應於最大振幅之索引對應於左右通道之間的時間差(ITD)之估計。若最大值之振幅低於給定臨限值,則ITD之估計視為不可靠且經設定為零。
若在時域中應用時間對準,則在單獨DFT分析中計算ITD。移位係如下所述地進行:
移位需要編碼器處之額外延遲,其最大值等於可加以處置之最大絕對ITD。ITD隨時間之變化將藉由DFT之分析開窗來平滑。
替代地,時間對準可在頻域中執行。在此情況下,ITD計算及循環移位在同一DFT域(與此其他立體聲處理共用之域)中。循環移位由以下公式給出:
需要DFT窗口之零填補以用於利用循環移位來模擬時間移位。零填補之大小對應於可加以處置之最大絕對ITD。在較佳實施例中,零填補係藉由在兩端添加3.125ms之零而在分析窗口之兩側上均勻地分開。最大絕對可能ITD因而為6.25ms。在A-B麥克風設置中,其對應兩個麥克風之間的約2.15公尺之最大距離的最壞情況。ITD隨時間之變化藉由合成開窗及DFT之重疊相加來平滑。
重要的,時間移位繼之以已移位信號之開窗。與先前技術雙耳提示寫碼(Binaural Cue Coding;BCC)之主要區別為:時間移位係應用於經開窗信號,而非在合成階段進一步經開窗。因此,ITD隨時間之任何改變產生經解碼信號中之人工瞬變/點選。4.IPD 之計算及通道旋轉
IPD係在將兩個通道進行時間對準之後加以計算,且此針對每一參數頻帶或至少直至給定,依賴於立體聲組態。
IPD接著被應用於兩個通道以用於對準該等通道之相位:其中且b為頻率索引k所屬之參數頻帶索引。參數負責將相位旋轉之量分配在兩個通道之間,同時使該等通道之相位對準。依賴於IPD,但亦為該等通道之相對振幅位準ILD。若通道具有較高振幅,則該通道將被視為引導通道且與具有較低振幅之通道相比受相位旋轉影響較小。5. 總和差及旁側信號寫碼
對兩個通道之時間及相位經對準頻譜執行總和差變換,其方式為保存中間信號中之能量。其中在1/1.2與1.2(亦即,-1.58 dB與+1.58 dB)之間定界。該限制避免了當調整M及S之能量時的假像(aretefact)。值得注意地,此能量守恆在時間及相位已預先對準時較不重要。替代地,界限可增大或減小。
用M來進一步預測旁側信號S:其中,其中。替代地,最佳預測增益g可藉由將殘餘之均方誤差(MSE)及由先前方程式推導之ILD減至最小而發現。
殘餘信號可藉由兩種方式來模型化:藉由用M之延遲頻譜來預測該殘餘信號,或藉由在MDCT域中在MDCT域中直接對該殘餘信號進行寫碼。6. 立體聲解碼
中間信號X及旁側信號S首先如下所述地轉換為左通道L及右通道R: 其中每個參數頻帶之增益g係自ILD參數導出:,其中
對於低於cod_max_band之參數頻帶,用經解碼旁側信號來更新兩個通道:
對於較高參數頻帶,預測旁側信號且通道更新如下:
最後,將通道乘以複數值,其目標為恢復立體聲信號之原始能量及通道間相位: 其中其中a如先前所定義地定義及定界,且其中,且其中atan2(x,y)為x對y之四象限反正切。
最後,取決於傳輸之ITD,使通道在時間上或在頻域中時間移位。藉由反DFT及重疊加法來合成時域通道。
本發明之經編碼音訊信號可儲存於數位儲存媒體或非暫時性儲存媒體上,或可在傳輸媒體(諸如無線傳輸媒體或有線傳輸媒體,諸如網際網路)上傳輸。
儘管已在裝置之上下文中描述一些態樣,但顯而易見,此等態樣亦表示對應方法之描述,其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述之態樣亦表示對應裝置之對應區塊或項目或特徵的描述。
取決於某些實施要求,本發明之實施例可以硬體或軟體實施。實施可使用數位儲存媒體來執行,該媒體例如軟性磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體上儲存有電子可讀控制信號,電子可讀控制信號與可規劃電腦系統合作(或能夠合作)以使得執行各別方法。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統合作,以使得執行本文中所描述之方法中之一者。
大體而言,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品執行於電腦上時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含用於執行本文中所描述之方法中之一者的電腦程式,其儲存於機器可讀載體或非暫時性儲存媒體上。
換言之,本發明之方法之一實施例因此為具有用於當電腦程式在電腦上執行時執行本文中所描述之方法中之一者的程式碼之電腦程式。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),其包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。
因此,本發明之方法之又一實施例因此為資料串流或信號序列,其表示用於執行本文中所描述之方法中之一者的電腦程式。資料串流或信號序列可(例如)經組配以經由資料通訊連接(例如,經由網際網路)傳送。
又一實施例包含處理構件(例如,電腦或可規劃邏輯器件),其經組配或經調適以執行本文中所描述之方法中之一者。
又一實施例包含電腦,其上安裝有用於執行本文中所描述之方法中之一者的電腦程式。
在一些實施例中,可規劃邏輯器件(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器合作,以便執行本文中所描述之方法中之一者。大體而言,較佳由任何硬體裝置來執行該等方法。
上文所描述之實施例僅說明本發明之原理。應理解,對本文中所描述之配置及細節的修改及變化將對熟習此項技術者顯而易見。因此,其僅意欲由接下來之申請專利範圍之範疇限制,而非由借助於本文中之實施例之描述及解釋所呈現的特定細節限制。
10‧‧‧多通道信號 12‧‧‧參數線/寬頻時間對準參數 14‧‧‧參數線/窄頻帶相位對準參數 15‧‧‧連接線 16、17、21、22、155、156、157、158、159、160、161、301、302、303、304、305、910、912、914、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948‧‧‧步驟 20‧‧‧已對準通道 31、1025、M‧‧‧中間信號 32、1026、S‧‧‧旁側信號 41、m‧‧‧經編碼中間信號 42‧‧‧經編碼旁側信號 43、610‧‧‧參數線 50、1601‧‧‧經編碼多通道信號 100‧‧‧參數判定器 150、810、1000、1610‧‧‧時間頻譜轉換器 154、930、1030、1640‧‧‧頻譜時間轉換器 200‧‧‧信號對準器 300、800‧‧‧信號處理器 400‧‧‧信號編碼器 500‧‧‧輸出介面 600‧‧‧輸入介面 601、602‧‧‧信號線 701、702、801、802、831、901、902、921、1021、1022、1023、1605、1606、1421、1422、1615‧‧‧線 700‧‧‧信號解碼器 820‧‧‧中間/旁側至左/右轉換器 821‧‧‧旁通線 822‧‧‧位準參數輸入 R‧‧‧右信號 L‧‧‧左信號 830‧‧‧通道更新器 900‧‧‧信號去對準器 910‧‧‧相位去對準器及能量定標器 911‧‧‧輸入 911a、911b‧‧‧相位去對準之經解碼左/右通道 913a、913b‧‧‧相位及時間經去對準之通道 915a、915b‧‧‧偽訊減少之經解碼信號 920‧‧‧區塊/寬頻去對準 931、932、933、1311、1321、1331、1312、1322、1332、1313、1323、1333、1650‧‧‧區塊 940‧‧‧縮放因數計算器 1000a、1000b‧‧‧時域分析區塊 1001、1002‧‧‧通道/信號 1010、1630‧‧‧多通道處理器 1011‧‧‧特定立體聲場景分析區塊 1020、1620‧‧‧頻譜域重新取樣器 1031‧‧‧時域中間信號 1032‧‧‧時域旁側信號 1040‧‧‧核心編碼器 1210‧‧‧頻譜 1211‧‧‧最大輸入頻率 1220、1814、1815‧‧‧零填補部分 1221、1231‧‧‧最大輸出頻率 1230‧‧‧截短區域 1410‧‧‧時間移位區塊 1420‧‧‧ITD分析 1430a‧‧‧基於MDCT之編碼器分支 1430b‧‧‧ACELP編碼分支 1430c、1430d‧‧‧預處理級 1430e‧‧‧特定頻譜域側信號編碼器 1440‧‧‧MDCT寫碼 1450‧‧‧向量量化 1500‧‧‧多工器 1510‧‧‧位元串流 1520‧‧‧解多工器 s‧‧‧經核心解碼之旁側信號 1600‧‧‧核心解碼器 1600a‧‧‧低音後置濾波器解碼部分 1600b‧‧‧ACELP解碼部分 1600c‧‧‧時域頻寬擴展解碼級 1600d‧‧‧基於MDCT之解碼級 1602‧‧‧EVS解碼器 1603‧‧‧向量反量化器 1604‧‧‧反MDCT區塊 1611、1612、1613‧‧‧頻譜值之序列/信號 1621、1622‧‧‧頻譜值之重新取樣序列 1625‧‧‧重新取樣序列 1631、1632‧‧‧結果序列 1635‧‧‧連接線/結果序列 1641、1642‧‧‧時域通道信號/輸出通道 1700‧‧‧組合器 1701‧‧‧序列 1702‧‧‧額外濾波操作 1704‧‧‧平滑轉換區塊 1801‧‧‧初始重疊部分 1802、1812‧‧‧第二重疊部分 1803‧‧‧後續中間部分 1804‧‧‧開始處的零填補部分 1805‧‧‧結束處的零填補部分 1811‧‧‧元素/第一重疊部分 1813‧‧‧中間非重疊部分 1820‧‧‧重疊部分 1901‧‧‧開始訊框邊界 1902‧‧‧結束訊框邊界 1903、1904‧‧‧重疊窗口 1905‧‧‧預看部分 1913、1914‧‧‧窗口 1920‧‧‧時間間隙
隨後,關於隨附圖式詳細地論述本發明之較佳實施例,在隨附圖式中: 圖1為多通道編碼器之實施例之方塊圖; 圖2說明頻譜域重新取樣之實施例; 圖3a至圖3c說明用於執行在頻譜域中具有不同正規化及對應縮放的時間/頻率或頻率/時間轉換的不同替代例; 圖3d說明某些實施例的不同頻率解析度及其他頻率相關態樣; 圖4a為編碼器之實施例之方塊圖; 圖4b說明解碼器之對應實施例之方塊圖; 圖5說明多通道編碼器之較佳實施例; 圖6說明多通道解碼器之實施例之方塊圖; 圖7a說明包含組合器之多通道解碼器之又一實施例; 圖7b說明另外包含組合器(加法)之多通道解碼器之又一實施例; 圖8a說明展示若干取樣速率之窗口之不同特性的表; 圖8b說明作為時間頻譜轉換器及頻譜時間轉換器之實施的DFT濾波器組的不同建議/實施例; 圖8c說明具有10 ms時間解析度之DFT之兩個分析窗口的序列; 圖9a說明根據第一建議/實施例之編碼器示意性開窗; 圖9b說明根據第一建議/實施例之解碼器示意性開窗; 圖9c說明根據第一建議/實施例之編碼器及解碼器處的窗口; 圖9d說明說明糾正實施例之較佳流程圖; 圖9e說明進一步說明糾正實施例之流程圖; 圖9f說明用於解釋時間間隙解碼器側實施例之流程圖; 圖10a說明根據第四建議/實施例之編碼器示意性開窗; 圖10b說明根據第四建議/實施例之解碼器示意性窗口; 圖10c說明根據第四建議/實施例之編碼器及解碼器處的窗口; 圖11a說明根據第五建議/實施例之編碼器示意性開窗; 圖11b說明根據第五建議/實施例之解碼器示意性開窗; 圖11c說明根據第五建議/實施例之編碼器及解碼器; 圖12為信號處理器中的使用降混之多通道處理之較佳實施的方塊圖; 圖13為信號處理器內的具有升混操作之反多通道處理的較佳實施例; 圖14a說明出於對準通道之目的進行編碼的裝置中所執行之程序的流程圖; 圖14b說明頻域中所執行之程序的較佳實施例; 圖14c說明使用具有零填補部分及重疊範圍之分析窗口進行編碼之裝置中所執行之程序的較佳實施例; 圖14d說明用於編碼之裝置之實施例內所執行之其他程序的流程圖; 圖15a說明由用於解碼及編碼多通道信號之裝置之實施例執行的程序; 圖15b說明相對於一些態樣進行解碼之裝置的較佳實施;以及 圖15c說明在解碼經編碼多通道信號之架構中之寬頻去對準之情況下所執行的程序。
1000‧‧‧時間頻譜轉換器
1001、1002‧‧‧通道/信號
1010‧‧‧多通道處理器
1020‧‧‧頻譜域重新取樣器
1021、1022、1023‧‧‧線
1025‧‧‧中間信號
1026‧‧‧旁側信號
1030‧‧‧頻譜時間轉換器
1031‧‧‧時域中間信號
1032‧‧‧時域旁側信號
1040‧‧‧核心編碼器

Claims (43)

  1. 一種用於編碼包含至少兩個通道之一多通道信號之裝置,其包含: 一時間頻譜轉換器,其用於將該等至少兩個通道的樣本值之區塊之序列轉換成具有該等至少兩個通道的頻譜值之區塊之序列的一頻域表示,其中取樣值之一區塊具有一相關聯之輸入取樣速率,且頻譜值之區塊之該等序列的頻譜值之一區塊具有高達與該輸入取樣速率相關之一最大輸入頻率的頻譜值; 一多通道處理器,其用於將一聯合多通道處理應用於頻譜值之區塊之該等序列或頻譜值之區塊之重新取樣序列,以獲得包含與該等至少兩個通道相關之資訊的頻譜值之區塊之至少一個結果序列; 一頻譜域重新取樣器,其用於在頻域中對該等結果序列之該等區塊重新取樣或用於在頻域中對該等至少兩個通道的頻譜值之區塊之該等序列重新取樣,以獲得頻譜值之區塊之一重新取樣序列,其中頻譜值之區塊之該重新取樣序列之一區塊具有高達不同於該最大輸入頻率之一最大輸出頻率的頻譜值; 一頻譜時間轉換器,其用於將頻譜值之區塊之該重新取樣序列轉換成一時域表示,或用於將頻譜值之區塊之該結果序列轉換成包含取樣值之區塊之一輸出序列的一時域表示,該等取樣值具有不同於該輸入取樣速率的相關聯之一輸出取樣速率;以及 一核心編碼器,其用於編碼取樣值之區塊之該輸出序列,以獲得一經編碼多通道信號。
  2. 如請求項1之裝置, 其中該頻譜域重新取樣器經組配以出於減少取樣之目的而截短該等區塊或出於增加取樣之目的而對該等區塊進行零填補。
  3. 如請求項1或2之裝置, 其中該頻譜域重新取樣器經組配用於視該最大輸入頻率及視該最大輸出頻率而使用一縮放因數對區塊之該結果序列的該等區塊之該等頻譜值進行縮放。
  4. 如請求項3之裝置, 其中該縮放因數大於增加取樣情況下之縮放因數,其中該輸出取樣速率大於該輸入取樣速率,或其中該縮放因數低於減少取樣情況下之縮放因數,其中該輸出取樣速率低於該輸入取樣速率,或 其中該時間頻譜轉換器經組配以不使用關於頻譜值之一區塊的頻譜值之一總數的一正規化而執行一時間頻率變換演算法,且其中該縮放因數等於該重新取樣序列之一區塊的頻譜值之數目與該重新取樣之前的頻譜值之一區塊的頻譜值之數目之間的一商,且其中該頻譜時間轉換器經組配以基於該最大輸入頻率而應用一正規化。
  5. 如前述請求項中任一項之裝置, 其中該時間頻譜轉換器經組配以執行一離散傅立葉變換演算法,或其中該頻譜時間轉換器經組配以執行一反離散傅立葉變換演算法。
  6. 如請求項1之裝置, 其中該多通道處理器經組配以獲得頻譜值之區塊之一另外結果序列,且 其中該頻譜時間轉換器經組配用於將頻譜值之該另外結果所序列轉換成包含取樣值之區塊之一另外輸出序列的一另外時域表示,該等取樣值具有等於該輸入取樣速率的相關聯之一輸出取樣速率。
  7. 如前述請求項中任一項之裝置, 其中該多通道處理器經組配以提供頻譜值之區塊之一更另外結果序列, 其中該頻譜域重新取樣器經組配用於在頻域中對該更另外結果序列之該等區塊重新取樣,以獲得頻譜值之區塊之一另外重新取樣序列,其中該另外重新取樣序列之一區塊具有高達不同於該最大輸出頻率或不同於該最大輸入頻率之一另外最大輸出頻率的頻譜值,且 其中該頻譜時間轉換器經組配用於將頻譜值之區塊之該另外重新取樣序列轉換成包含取樣值之區塊之一更另外輸出序列的一更另外時域表示,該等取樣值具有不同於該輸出取樣速率或該輸入取樣速率的相關聯之一另外輸出取樣速率。
  8. 如前述請求項中任一項之裝置, 其中該多通道處理器經組配以僅使用一降混操作而產生一中間信號以作為頻譜值之區塊之該至少一個結果序列,或產生一額外旁側信號以作為頻譜值之區塊之一另外結果序列。
  9. 如前述請求項中任一項之裝置, 其中該多通道處理器經組配以產生一中間信號以作為該至少一個結果序列,其中該頻譜域重新取樣器經組配以將該中間信號重新取樣至具有不同於該最大輸入頻率之兩個不同最大輸出頻率的兩個單獨序列, 其中該頻譜時間轉換器經組配以將該兩個重新取樣序列轉換為具有不同取樣速率的兩個輸出序列,且 其中該核心編碼器包含用於以一第一取樣速率對該第一輸出序列進行預處理之一第一預處理器,或用於以一第二取樣速率對該第二輸出序列進行預處理之一第二預處理器,且 其中該核心編碼器經組配以對第一或第二經預處理信號進行核心編碼,或 其中該多通道處理器經組配以產生一旁側信號以作為該至少一個結果序列,其中該頻譜域重新取樣器經組配以將該旁側信號重新取樣至具有不同於該最大輸入頻率之兩個不同最大輸出頻率的兩個重新取樣序列, 其中該頻譜時間轉換器經組配以將該兩個重新取樣序列轉換為具有不同取樣速率的兩個輸出序列,且 其中該核心編碼器包含用於對該第一及該第二輸出序列進行預處理之一第一預處理器及一第二預處理器;且 其中該核心編碼器經組配以對第一或第二經預處理序列進行核心編碼。
  10. 如前述請求項中任一項之裝置, 其中該頻譜時間轉換器經組配以不用任何頻譜域重新取樣而將該至少一個結果序列轉換成一時域表示,且 其中該核心編碼器經組配以對該未重新取樣輸出序列進行核心編碼,以獲得該經編碼多通道信號,或 其中該頻譜時間轉換器經組配以在無該旁側信號情況下不用任何頻譜域重新取樣而將該至少一個結果序列轉換成一時域表示,且 其中該核心編碼器經組配以對該旁側信號之該未重新取樣輸出序列進行核心編碼,以獲得該經編碼多通道信號,或 其中該裝置進一步包含一特定頻譜域旁側信號編碼器。
  11. 如前述請求項中任一項之裝置, 其中該輸入取樣速率為包含8 kHz、16 kHz、32 kHz之取樣速率之一群組中的至少一個取樣速率,或 其中該輸出取樣速率為包含8 kHz、12.8 kHz、16 kHz、25.6 kHz以及32 kHz之取樣速率之一群組中的至少一個取樣速率。
  12. 如前述請求項中任一項之裝置, 其中該頻譜時間轉換器經組配以應用一分析窗口, 其中該頻譜時間轉換器經組配以應用一合成窗口, 其中該分析窗口之時間長度等於或為該合成窗口之時間長度的一整數倍數或整數分數,或 其中該分析窗口及該合成窗口各自在其一初始部分或一結束部分處具有一零填補部分,或 其中由該時間頻譜轉換器使用之一分析窗口或由該頻譜時間轉換器使用之一合成窗口各自具有一增大之重疊部分及一減小之重疊部分,其中該核心編碼器包含具有一預看部分的一時域編碼器或具有一核心窗口之一重疊部分的一頻域編碼器,且其中該分析窗口或該合成窗口之該重疊部分小於或等於該核心編碼器之該預看部分或該核心窗口之該重疊部分,或 其中該分析窗口及該合成窗口使得針對包含12.8 kHz、16 kHz、26.6 kHz、32 kHz、48 kHz之取樣速率之該群組的至少兩個取樣速率,該窗口大小、一重疊區域大小以及一零填補大小各自包含整數數目個樣本,或 其中一分裂基數實施中之一數位傅里葉變換之一最大基數低於或等於7,或其中一時間解析度固定至低於或等於該核心編碼器之一訊框速率之一值。
  13. 如前述請求項中任一項之裝置, 其中該核心編碼器經組配以根據一第一訊框控制而操作以提供訊框之一序列,其中一訊框以一開始訊框邊界及一結束訊框邊界為界,且 其中該時間頻譜轉換器或該頻譜時間轉換器經組配以根據同步至該第一訊框控制之一第二訊框控制而操作,其中訊框之該序列中之每一訊框的該開始訊框邊界或該結束訊框邊界與一窗口之一重疊部分之一開始瞬時或一結束瞬時呈一預定關係,該窗口由該時間頻譜轉換器針對取樣值之區塊之該序列的每一區塊使用或由該頻譜時間轉換器針對取樣值之區塊之該輸出序列的每一區塊使用。
  14. 如前述請求項中任一項之裝置, 其中該核心編碼器經組配以在對自具有相關聯之該輸出取樣速率的取樣值之區塊之該輸出序列獲得之一訊框進行核心編碼時使用一預看部分,該預看部分在時間上位於該訊框之後, 其中該時間頻譜轉換器經組配以使用一分析窗口,該分析窗口具有一時間長度低於或等於該預看部分之一時間長度的一重疊部分,其中該分析窗口之該重疊部分用於產生一經開窗預看部分。
  15. 如請求項14之裝置, 其中該頻譜時間轉換器經組配以使用一糾正函數來處理對應於該經開窗預看部分之一輸出預看部分,其中該糾正函數經組配以使得該分析窗口之該重疊部分之一影響減小或消除。
  16. 如請求項15之裝置, 其中該糾正函數與定義該分析窗口之該重疊部分之一函數相逆。
  17. 如請求項15或16之裝置, 其中該重疊部分與正弦函數之一平方根成比例, 其中該糾正函數與該正弦函數之該平方根之一倒數成比例,且 其中該頻譜時間轉換器經組配以使用與一(sin)1.5 函數成比例之一重疊部分。
  18. 如前述請求項中任一項之裝置, 其中該頻譜時間轉換器經組配以使用一合成窗口產生一第一輸出區塊且使用該合成窗口產生一第二輸出區塊,其中該第二輸出區塊之一第二部分為一輸出預看部分, 其中該頻譜時間轉換器經組配以使用該第一輸出區塊與排除該輸出預看部分的該第二輸出區塊之部分之間的一重疊加法運算而產生一訊框之取樣值, 其中該核心編碼器經組配以將一預看操作應用於該輸出預看部分,以便判定用於對該訊框進行核心編碼之寫碼資訊,且 其中該核心編碼器經組配以使用該預看操作之一結果對該訊框進行核心編碼。
  19. 如請求項18之裝置, 其中該頻譜時間轉換器經組配以使用該合成窗口產生在該第二輸出區塊之後的一第三輸出區塊,其中該頻譜時間轉換器經組配以使該第三輸出區塊之一第一重疊部分與使用該合成窗口開窗的該第二輸出區塊之該第二部分重疊,以獲得在時間上在該訊框之後的一另外訊框之樣本。
  20. 如請求項18及19之裝置, 其中該頻譜時間轉換器在產生該訊框之該第二輸出區塊時經組配以不對該輸出預看部分開窗,或糾正該輸出預看部分,用於至少部分地撤銷由該時間頻譜轉換器使用之一分析窗口之一影響,且 其中該頻譜時間轉換器經組配以針對該另外訊框執行該第二輸出區塊與該第三輸出區塊之間的一重疊加法運算以及用該合成窗口對該輸出預看部分開窗。
  21. 如請求項13至20中任一項之裝置, 其中該頻譜時間轉換器經組配, 以使用一合成窗口產生輸出樣本之一第一區塊及輸出樣本之一第二區塊, 以對該第一區塊之一第二部分與該第二區塊之一第一部分進行重疊加法,以產生輸出樣本之一部分, 其中該核心編碼器經組配以將一預看操作應用於該等輸出樣本之該部分以用於對在時間上位於該等輸出樣本之該部分之前的該等輸出樣本進行核心編碼,其中該預看部分不包括該第二區塊之樣本之一第二部分。
  22. 如請求項13之裝置, 其中該頻譜時間轉換器經組配以使用提供高於一核心編碼器訊框之一長度之兩倍之一時間解析度的一合成窗口, 其中該頻譜時間轉換器經組配以使用該合成窗口以用於產生輸出樣本之區塊且執行一重疊加法運算,其中該核心編碼器之一預看部分中之所有樣本係使用該重疊加法運算來計算,或 其中該頻譜時間轉換器經組配以將一預看操作應用於該等輸出樣本以用於對時間上位於該部分之前的輸出樣本進行核心編碼,其中該預看部分不包括該第二區塊之樣本之一第二部分。
  23. 如前述請求項中任一項之裝置, 其中該多通道處理器經組配以處理區塊之該序列以使用一寬頻時間對準參數獲得一時間對準且使用多個窄頻帶相位對準參數獲得一窄頻帶相位對準,且使用對準序列計算一中間信號及一旁側信號以作為該等結果序列。
  24. 一種用於編碼包含至少兩個通道之一多通道信號之方法,其包含: 將該等至少兩個通道的樣本值之區塊之序列轉換成具有該等至少兩個通道的頻譜值之區塊之序列的一頻域表示,其中取樣值之一區塊具有一相關聯之輸入取樣速率,且頻譜值之區塊之該等序列的頻譜值之一區塊具有高達與該輸入取樣速率相關之一最大輸入頻率的頻譜值; 將一聯合多通道處理應用於頻譜值之區塊之該等序列或頻譜值之區塊之重新取樣序列,以獲得包含與該等至少兩個通道相關之資訊的頻譜值之區塊之至少一個結果序列; 在頻域中對該等結果序列之該等區塊進行頻譜域重新取樣或在頻域中對該等至少兩個通道的頻譜值之區塊之該等序列進行重新取樣,以獲得頻譜值之區塊之一重新取樣序列,其中頻譜值之區塊之該重新取樣序列之一區塊具有高達不同於該最大輸入頻率之一最大輸出頻率的頻譜值; 將頻譜值之區塊之該重新取樣序列轉換成一時域表示或將頻譜值之區塊之該結果序列轉換成包含取樣值之區塊之一輸出序列的一時域表示,該等取樣值具有不同於該輸入取樣速率的相關聯之一輸出取樣速率;以及 對取樣值之區塊之該輸出序列進行核心編碼,以獲得一經編碼多通道信號。
  25. 一種用於解碼一經編碼多通道信號之裝置,其包含: 一核心解碼器,其用於產生一經核心解碼信號; 一時間頻譜轉換器,其用於將該經核心解碼信號之取樣值之區塊之一序列轉換成具有該經核心解碼信號之頻譜值之區塊之一序列的一頻域表示,其中取樣值之一區塊具有一相關聯之輸入取樣速率,且其中頻譜值之一區塊具有高達與該輸入取樣速率相關之一最大輸入頻率的頻譜值; 一頻譜域重新取樣器,其用於對該經核心解碼信號之頻譜值之區塊之該序列的頻譜值之該等區塊或藉由反多通道處理在頻域中獲得之至少兩個結果序列重新取樣,以獲得頻譜值之區塊之一重新取樣序列或至少兩個重新取樣序列,其中一重新取樣序列之一區塊具有高達不同於該最大輸入頻率之一最大輸出頻率的頻譜值; 一多通道處理器,其用於將一反多通道處理應用於包含區塊之該序列或區塊之該重新取樣序列的一序列,以獲得頻譜值之區塊之至少兩個結果序列;以及 一頻譜時間轉換器,其用於將頻譜值之區塊之該等至少兩個結果序列或頻譜值之區塊之該等至少兩個重新取樣序列轉換成包含取樣值之區塊之至少兩個輸出序列的一時域表示,該等取樣值具有不同於該輸入取樣速率之相關聯之一輸出取樣速率。
  26. 如請求項25之裝置, 其中該頻譜域重新取樣器經組配以出於減少取樣之目的而截短該等區塊或出於增加取樣之目的而對該等區塊進行零填補。
  27. 如請求項25或26之裝置, 其中該頻譜域重新取樣器經組配用於視該最大輸入頻率及視該最大輸出頻率而使用一縮放因數對區塊之該結果序列的該等區塊之該等頻譜值進行縮放。
  28. 如請求項25至27中任一項之裝置, 其中該縮放因數大於增加取樣情況下的縮放因數,其中該輸出取樣速率大於該輸入取樣速率,或其中該縮放因數低於減少取樣情況下的縮放因數,其中該輸出取樣速率低於該輸入取樣速率,或 其中該時間頻譜轉換器經組配以不使用關於頻譜值之一區塊的頻譜值之一總數的一正規化而執行一時間頻率變換演算法,且其中該縮放因數等於該重新取樣序列之一區塊的頻譜值之數目與該重新取樣之前的頻譜值之一區塊的頻譜值之數目之間的一商,且其中該頻譜時間轉換器經組配以基於該最大輸入頻率而應用一正規化。
  29. 如請求項25至28中任一項之裝置, 其中該時間頻譜轉換器經組配以執行一離散傅立葉變換演算法,或其中該頻譜時間轉換器經組配以執行一反離散傅立葉變換演算法。
  30. 如請求項25至29中任一項之裝置, 其中該核心解碼器經組配以產生具有不同於該輸入取樣速率之一另外取樣速率的一另外經核心解碼信號, 其中該時間頻譜轉換器經組配以將該另外經核心解碼信號轉換成具有該另外經核心解碼信號的值之區塊之一另外序列的一頻域表示,其中該另外經核心解碼信號之取樣值之一區塊具有高達不同於該最大輸入頻率且與該另外取樣速率相關之一另外最大輸入頻率的頻譜值, 其中該頻譜域重新取樣器經組配以在頻域中對該另外經核心解碼信號之區塊之該另外序列重新取樣,以獲得頻譜值之區塊之一另外重新取樣序列,其中該另外重新取樣序列之頻譜值之一區塊具有高達不同於該另外最大輸入頻率之該最大輸出頻率的頻譜值;以及 一組合器,其用於組合該重新取樣序列及該另外重新取樣序列,以獲得待由該多通道處理器處理之序列。
  31. 如請求項25至30中任一項之裝置, 其中該核心解碼器經組配以產生具有等於該輸出取樣速率之一另外取樣速率的一更另外經核心解碼信號, 其中該時間頻譜轉換器經組配以將該更另外序列轉換成一頻域表示, 其中該裝置進一步包含一組合器,該組合器用於在產生由該多通道處理器處理的區塊之該序列之一過程中組合頻譜值之區塊之該更另外序列及區塊之該重新取樣序列。
  32. 如請求項25至31中任一項之裝置, 其中該核心解碼器包含以下各者中之至少一者:一基於MDCT之解碼部分、一時域頻寬擴展解碼部分、一ACELP解碼部分及一低音後置濾波器解碼部分, 其中該基於MDCT之解碼部分或該時域頻寬擴展解碼部分經組配以產生具有該輸出取樣速率之該經核心解碼信號,或 其中該ACELP解碼部分或該低音後置濾波器解碼部分經組配而以不同於該輸出取樣速率之一取樣速率產生一經核心解碼信號。
  33. 如請求項25至32中任一項之裝置, 其中該時間頻譜轉換器經組配以將一分析窗口應用於多個不同經核心解碼信號中之至少兩者,該分析窗口具有時間上相同之大小或相對於時間具有相同形狀, 其中該裝置進一步包含一組合器,該組合器用於基於逐區塊而組合至少一個重新取樣序列與具有頻譜值高達該最大輸出頻率之區塊的任何其他序列,以獲得由該多通道處理器處理之該序列。
  34. 如請求項25至33中任一項之裝置, 其中由該多通道處理器處理之該序列對應於一中間信號,且 其中該多通道處理器經組配以使用包含於該經編碼多通道信號中之一旁側信號上的資訊來另外產生一旁側信號,且 其中該多通道處理器經組配以使用該中間信號及該旁側信號來產生該等至少兩個結果序列。
  35. 如請求項25至34中任一項之裝置, 其中該多通道處理器經組配以使用每個參數頻帶之一增益因數而將該序列轉換成用於一第一輸出通道之一第一序列及用於一第二輸出通道之一第二序列; 使用一經解碼旁側信號來更新一第一序列及該第二序列,或使用一旁側信號來更新該第一序列及該第二序列,該旁側信號係使用用於一參數頻帶之一立體聲填充參數自用於該中間信號之區塊之該序列的一稍早區塊預測; 使用關於該等多個窄頻帶相位對準參數之資訊來執行一相位去對準及一能量縮放;以及 使用關於一寬頻時間對準參數之資訊來執行一時間去對準,以獲得該等至少兩個結果序列。
  36. 如請求項25至35中任一項之裝置, 其中該核心解碼器經組配以根據一第一訊框控制而操作以提供訊框之一序列,其中一訊框以一開始訊框邊界及一結束訊框邊界為界, 其中該時間頻譜轉換器或該頻譜時間轉換器經組配以根據同步至該第一訊框控制之一第二訊框控制而操作, 其中該時間頻譜轉換器或該頻譜時間轉換器經組配以根據同步至該第一訊框控制之一第二訊框控制而操作,其中訊框之該序列之每一訊框的該開始訊框邊界或該結束訊框邊界與一窗口之一重疊部分之一開始瞬時或一結束瞬時呈一預定關係,該窗口由該時間頻譜轉換器針對取樣值之區塊之該序列的每一區塊使用或由該頻譜時間轉換器針對取樣值之區塊之該等至少兩個輸出序列的每一區塊使用。
  37. 如請求項25至36中任一項之裝置, 其中該經核心解碼信號具有訊框之該序列,一訊框具有該開始訊框邊界及該結束訊框邊界, 其中由該時間頻譜轉換器使用以用於對訊框之該序列之該訊框開窗的一分析窗口具有在該結束訊框邊界之前結束的一重疊部分,從而在該重疊部分之一終點與該結束訊框邊界之間留下一時間間隙,且 其中該核心解碼器經組配以平行於使用該分析窗口的該訊框之該開窗而對該時間間隙中之樣本執行一處理,或其中平行於使用該分析窗口的該訊框之該開窗而對該時間間隙中之該等樣本執行一核心解碼器後處理。
  38. 如請求項25至37中任一項之裝置, 其中該經核心解碼信號具有訊框之該序列,一訊框具有該開始訊框邊界及該結束訊框邊界, 其中一分析窗口之一第一重疊部分之一開始與該開始訊框邊界重合,且該分析窗口之一第二重疊部分之一終點位於該停止訊框邊界之前,使得一時間間隙存在於該第二重疊部分之該終點與該停止訊框邊界之間,且 其中用於該經核心解碼信號之一後繼區塊的該分析窗口經定位以使得該分析窗口之一中間非重疊部分位於該時間間隙內。
  39. 如請求項25至38中任一項之裝置, 其中由該時間頻譜轉換器使用之該分析窗口具有與由該頻譜時間轉換器使用之該合成窗口相同的形狀及時間長度。
  40. 如請求項25至39中任一項之裝置, 其中該經核心解碼信號具有訊框之一序列,其中一訊框具有一長度,其中排除由該時間頻譜轉換器應用之任何零填補部分的該窗口之該長度小於或等於該訊框之一長度的一半。
  41. 如請求項25至40中任一項之裝置, 其中該頻譜時間轉換器經組配 以針對該等至少兩個輸出序列之一第一輸出序列應用一合成窗口,以用於獲得經開窗樣本之一第一輸出區塊; 以針對該等至少兩個輸出序列之該第一輸出序列應用該合成窗口,以用於獲得經開窗樣本之一第二輸出區塊; 以將該第一輸出區塊及該第二輸出區塊重疊相加,以獲得該第一輸出序列之輸出樣本之一第一群組; 其中該頻譜時間轉換器經組配 以針對該等至少兩個輸出序列之一第二輸出序列應用一合成窗口,以用於獲得經開窗樣本之一第一輸出區塊; 以針對該等至少兩個輸出序列之該第二輸出序列應用該合成窗口,以用於獲得經開窗樣本之一第二輸出區塊; 以將該第一輸出區塊及該第二輸出區塊重疊相加,以獲得該第二輸出序列之輸出樣本之一第二群組; 其中該第一序列之輸出樣本之該第一群組及該第二序列之輸出樣本之該第二群組與該經解碼多通道信號之同一時間部分相關,或與該經核心解碼信號之同一訊框相關。
  42. 一種用於解碼一經編碼多通道信號的方法,其包含: 產生一經核心解碼信號; 將該經核心解碼信號之取樣值之區塊之一序列轉換成具有該經核心解碼信號之頻譜值之區塊之一序列的一頻域表示,其中取樣值之一區塊具有一相關聯之輸入取樣速率,且其中頻譜值之一區塊具有高達與該輸入取樣速率相關之一最大輸入頻率的頻譜值; 對該經核心解碼信號之頻譜值之區塊之該序列的頻譜值之該等區塊或藉由反多通道處理在頻域中獲得之至少兩個結果序列重新取樣,以獲得頻譜值之區塊之一重新取樣序列或至少兩個重新取樣序列,其中一重新取樣序列之一區塊具有高達不同於該最大輸入頻率之一最大輸出頻率的頻譜值; 將一反多通道處理應用於包含區塊之該序列或區塊之該重新取樣序列的一序列,以獲得頻譜值之區塊之至少兩個結果序列;以及 將頻譜值之區塊之該等至少兩個結果序列或頻譜值之區塊之該等至少兩個重新取樣序列轉換成包含取樣值之區塊之至少兩個輸出序列的一時域表示,該等取樣值具有不同於該輸入取樣速率的相關聯之一輸出取樣速率。
  43. 一種電腦程式,其當在一電腦或處理器上運行時用於執行如請求項24之方法或如請求項42之方法。
TW106102409A 2016-01-22 2017-01-23 使用頻譜域重新取樣來編碼或解碼多通道信號之裝置、方法及相關電腦程式 TWI629681B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
??16152453.3 2016-01-22
EP16152453 2016-01-22
EP16152450 2016-01-22
??16152450.9 2016-01-22
??PCT/EP2017/051208 2017-01-20
PCT/EP2017/051208 WO2017125559A1 (en) 2016-01-22 2017-01-20 Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling

Publications (2)

Publication Number Publication Date
TW201732781A true TW201732781A (zh) 2017-09-16
TWI629681B TWI629681B (zh) 2018-07-11

Family

ID=57838406

Family Applications (4)

Application Number Title Priority Date Filing Date
TW106102410A TWI643487B (zh) 2016-01-22 2017-01-23 使用訊框控制同步化技術來編碼或解碼多通道信號之裝置及方法
TW106102398A TWI628651B (zh) 2016-01-22 2017-01-23 用於編碼或解碼多通道信號的設備及方法、以及相關實體儲存媒體及電腦程式
TW106102409A TWI629681B (zh) 2016-01-22 2017-01-23 使用頻譜域重新取樣來編碼或解碼多通道信號之裝置、方法及相關電腦程式
TW106102408A TWI653627B (zh) 2016-01-22 2017-01-23 用以估計通道間時間差的裝置及方法與相關電腦程式

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW106102410A TWI643487B (zh) 2016-01-22 2017-01-23 使用訊框控制同步化技術來編碼或解碼多通道信號之裝置及方法
TW106102398A TWI628651B (zh) 2016-01-22 2017-01-23 用於編碼或解碼多通道信號的設備及方法、以及相關實體儲存媒體及電腦程式

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW106102408A TWI653627B (zh) 2016-01-22 2017-01-23 用以估計通道間時間差的裝置及方法與相關電腦程式

Country Status (20)

Country Link
US (7) US10535356B2 (zh)
EP (5) EP3405951B1 (zh)
JP (10) JP6412292B2 (zh)
KR (4) KR102219752B1 (zh)
CN (6) CN107710323B (zh)
AU (5) AU2017208580B2 (zh)
BR (4) BR112017025314A2 (zh)
CA (4) CA3011915C (zh)
ES (5) ES2790404T3 (zh)
HK (1) HK1244584B (zh)
MX (4) MX2018008889A (zh)
MY (4) MY189205A (zh)
PL (4) PL3405951T3 (zh)
PT (3) PT3405949T (zh)
RU (4) RU2693648C2 (zh)
SG (3) SG11201806241QA (zh)
TR (1) TR201906475T4 (zh)
TW (4) TWI643487B (zh)
WO (4) WO2017125559A1 (zh)
ZA (3) ZA201804625B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI708243B (zh) * 2018-03-19 2020-10-21 中央研究院 於分散式語音辨識中基於小波轉換之語音特徵壓縮及重建系統與方法

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010032992A2 (ko) * 2008-09-18 2010-03-25 한국전자통신연구원 Mdct기반의 코너와 이종의 코더간 변환에서의 인코딩 장치 및 디코딩 장치
CN107710323B (zh) 2016-01-22 2022-07-19 弗劳恩霍夫应用研究促进协会 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
MX2019005147A (es) 2016-11-08 2019-06-24 Fraunhofer Ges Forschung Aparato y metodo para codificar o decodificar una se?al multicanal usando una ganancia lateral y una ganancia residual.
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
EP4057281A1 (en) * 2018-02-01 2022-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis
KR102550424B1 (ko) 2018-04-05 2023-07-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 채널 간 시간 차를 추정하기 위한 장치, 방법 또는 컴퓨터 프로그램
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
EP3588495A1 (en) * 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
US11545165B2 (en) 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels
JP7092048B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 多地点制御方法、装置及びプログラム
EP3719799A1 (en) 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
CN114051711B (zh) * 2019-06-18 2023-07-18 雷蛇(亚太)私人有限公司 用于优化在无线人性化接口装置系统中的输入延迟的方法及设备
CN110459205B (zh) * 2019-09-24 2022-04-12 京东科技控股股份有限公司 语音识别方法及装置、计算机可存储介质
CN110740416B (zh) * 2019-09-27 2021-04-06 广州励丰文化科技股份有限公司 一种音频信号处理方法及装置
US20220156217A1 (en) * 2019-11-22 2022-05-19 Stmicroelectronics (Rousset) Sas Method for managing the operation of a system on chip, and corresponding system on chip
CN110954866B (zh) * 2019-11-22 2022-04-22 达闼机器人有限公司 声源定位方法、电子设备及存储介质
CN111131917B (zh) * 2019-12-26 2021-12-28 国微集团(深圳)有限公司 音频频谱实时同步方法、播放装置
JP7316384B2 (ja) 2020-01-09 2023-07-27 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
TWI750565B (zh) * 2020-01-15 2021-12-21 原相科技股份有限公司 真無線多聲道揚聲裝置及其多音源發聲之方法
CN111402906B (zh) * 2020-03-06 2024-05-14 深圳前海微众银行股份有限公司 语音解码方法、装置、引擎及存储介质
US11276388B2 (en) * 2020-03-31 2022-03-15 Nuvoton Technology Corporation Beamforming system based on delay distribution model using high frequency phase difference
CN111525912B (zh) * 2020-04-03 2023-09-19 安徽白鹭电子科技有限公司 一种数字信号的任意重采样方法及系统
CN113223503B (zh) * 2020-04-29 2022-06-14 浙江大学 一种基于测试反馈的核心训练语音选择方法
JP7491376B2 (ja) * 2020-06-24 2024-05-28 日本電信電話株式会社 音信号符号化方法、音信号符号化装置、プログラム及び記録媒体
CN115917643A (zh) * 2020-06-24 2023-04-04 日本电信电话株式会社 声音信号解码方法、声音信号解码装置、程序以及记录介质
CN116348951A (zh) * 2020-07-30 2023-06-27 弗劳恩霍夫应用研究促进协会 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序
WO2022074201A2 (en) 2020-10-09 2022-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension
BR112023006291A2 (pt) 2020-10-09 2023-05-09 Fraunhofer Ges Forschung Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro
JP2023549033A (ja) 2020-10-09 2023-11-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パラメータ平滑化を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
WO2022153632A1 (ja) * 2021-01-18 2022-07-21 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 信号処理装置、及び、信号処理方法
EP4243015A4 (en) 2021-01-27 2024-04-17 Samsung Electronics Co., Ltd. AUDIO PROCESSING APPARATUS AND METHOD
JP2024521486A (ja) 2021-06-15 2024-05-31 テレフオンアクチーボラゲット エルエム エリクソン(パブル) コインシデントステレオ捕捉のためのチャネル間時間差(itd)推定器の改善された安定性
CN113435313A (zh) * 2021-06-23 2021-09-24 中国电子科技集团公司第二十九研究所 一种基于dft的脉冲频域特征提取方法
JPWO2023153228A1 (zh) * 2022-02-08 2023-08-17
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置
WO2024053353A1 (ja) * 2022-09-08 2024-03-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 信号処理装置、及び、信号処理方法
WO2024074302A1 (en) 2022-10-05 2024-04-11 Telefonaktiebolaget Lm Ericsson (Publ) Coherence calculation for stereo discontinuous transmission (dtx)
EP4383254A1 (en) 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder
WO2024160859A1 (en) 2023-01-31 2024-08-08 Telefonaktiebolaget Lm Ericsson (Publ) Refined inter-channel time difference (itd) selection for multi-source stereo signals
WO2024202997A1 (ja) * 2023-03-29 2024-10-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ チャネル間時間差推定装置、及び、チャネル間時間差推定方法
WO2024202972A1 (ja) * 2023-03-29 2024-10-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ チャネル間時間差推定装置、及び、チャネル間時間差推定方法
CN117476026A (zh) * 2023-12-26 2024-01-30 芯瞳半导体技术(山东)有限公司 一种多路音频数据混音的方法、系统、装置及存储介质

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5526359A (en) 1993-12-30 1996-06-11 Dsc Communications Corporation Integrated multi-fabric digital cross-connect timing architecture
US6073100A (en) * 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6138089A (en) * 1999-03-10 2000-10-24 Infolio, Inc. Apparatus system and method for speech compression and decompression
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
FI119955B (fi) * 2001-06-21 2009-05-15 Nokia Corp Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7089178B2 (en) * 2002-04-30 2006-08-08 Qualcomm Inc. Multistream network feature processing for a distributed speech recognition system
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
CN100477531C (zh) * 2002-08-21 2009-04-08 广州广晟数码技术有限公司 用于对多声道数字音频信号进行压缩编码的编码方法
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7596486B2 (en) 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR100712409B1 (ko) * 2005-07-28 2007-04-27 한국전자통신연구원 벡터의 차원변환 방법
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US8112286B2 (en) * 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
US9275648B2 (en) * 2007-12-18 2016-03-01 Lg Electronics Inc. Method and apparatus for processing audio signal using spectral data of audio signal
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
CN101267362B (zh) * 2008-05-16 2010-11-17 亿阳信通股份有限公司 一种性能指标值正常波动范围的动态确定方法及其装置
KR101629862B1 (ko) 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP5551694B2 (ja) * 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 多くのスペクトルエンベロープを計算するための装置および方法
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
CN103000178B (zh) * 2008-07-11 2015-04-08 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
US8504378B2 (en) * 2009-01-22 2013-08-06 Panasonic Corporation Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR101316979B1 (ko) 2009-01-28 2013-10-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩
BRPI1009467B1 (pt) 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
JP5574498B2 (ja) 2009-05-20 2014-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、およびこれらの方法
CN101989429B (zh) 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
JP5031006B2 (ja) 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
CA2778205C (en) * 2009-10-21 2015-11-24 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
KR101445296B1 (ko) * 2010-03-10 2014-09-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 샘플링 레이트 의존 시간 왜곡 윤곽 인코딩을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 방법, 및 컴퓨터 프로그램
JP5405373B2 (ja) * 2010-03-26 2014-02-05 富士フイルム株式会社 電子内視鏡システム
MX2012011532A (es) 2010-04-09 2012-11-16 Dolby Int Ab Codificacion a estereo para prediccion de complejos basados en mdct.
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
PL3779977T3 (pl) 2010-04-13 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
BR122021003688B1 (pt) * 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
RU2562384C2 (ru) 2010-10-06 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)
FR2966634A1 (fr) 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
PL3035330T3 (pl) * 2011-02-02 2020-05-18 Telefonaktiebolaget Lm Ericsson (Publ) Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio
DK3182409T3 (en) * 2011-02-03 2018-06-14 Ericsson Telefon Ab L M DETERMINING THE INTERCHANNEL TIME DIFFERENCE FOR A MULTI-CHANNEL SIGNAL
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
AU2012217153B2 (en) * 2011-02-14 2015-07-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
EP2710592B1 (en) * 2011-07-15 2017-11-22 Huawei Technologies Co., Ltd. Method and apparatus for processing a multi-channel audio signal
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
EP2817803B1 (en) 2012-02-23 2016-02-03 Dolby International AB Methods and systems for efficient recovery of high frequency audio content
CN103366751B (zh) * 2012-03-28 2015-10-14 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
EP2834813B1 (en) 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
ES2571742T3 (es) 2012-04-05 2016-05-26 Huawei Tech Co Ltd Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal
KR20150012146A (ko) * 2012-07-24 2015-02-03 삼성전자주식회사 오디오 데이터를 처리하기 위한 방법 및 장치
WO2014043476A1 (en) * 2012-09-14 2014-03-20 Dolby Laboratories Licensing Corporation Multi-channel audio content analysis based upmix detection
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
JP5608834B1 (ja) * 2012-12-27 2014-10-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 映像表示方法
CA2900437C (en) * 2013-02-20 2020-07-21 Christian Helmrich Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap
EP2959479B1 (en) * 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
WO2016108655A1 (ko) * 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
US10568072B2 (en) 2014-12-31 2020-02-18 Lg Electronics Inc. Method for allocating resource in wireless communication system and apparatus therefor
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN107710323B (zh) * 2016-01-22 2022-07-19 弗劳恩霍夫应用研究促进协会 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI708243B (zh) * 2018-03-19 2020-10-21 中央研究院 於分散式語音辨識中基於小波轉換之語音特徵壓縮及重建系統與方法

Also Published As

Publication number Publication date
US20180322884A1 (en) 2018-11-08
CN107710323A (zh) 2018-02-16
CA3012159A1 (en) 2017-07-20
PT3405951T (pt) 2020-02-05
US20200194013A1 (en) 2020-06-18
PT3284087T (pt) 2019-06-11
JP2019502965A (ja) 2019-01-31
AU2017208576A1 (en) 2017-12-07
ES2965487T3 (es) 2024-07-09
US20180197552A1 (en) 2018-07-12
RU2704733C1 (ru) 2019-10-30
BR112018014916A2 (pt) 2018-12-18
AU2019213424B2 (en) 2021-04-22
US10706861B2 (en) 2020-07-07
KR102230727B1 (ko) 2021-03-22
US10535356B2 (en) 2020-01-14
CN115148215A (zh) 2022-10-04
TW201729180A (zh) 2017-08-16
AU2019213424A1 (en) 2019-09-12
CA3011914C (en) 2021-08-24
RU2705007C1 (ru) 2019-11-01
CN117238300A (zh) 2023-12-15
EP3503097A3 (en) 2019-07-03
WO2017125563A1 (en) 2017-07-27
MX2017015009A (es) 2018-11-22
US10861468B2 (en) 2020-12-08
PL3405951T3 (pl) 2020-06-29
ZA201804910B (en) 2019-04-24
RU2711513C1 (ru) 2020-01-17
MY189223A (en) 2022-01-31
BR112018014799A2 (pt) 2018-12-18
CA3011915A1 (en) 2017-07-27
CN108885879B (zh) 2023-09-15
US20220310103A1 (en) 2022-09-29
JP2021103326A (ja) 2021-07-15
EP3405948A1 (en) 2018-11-28
JP7270096B2 (ja) 2023-05-09
CA2987808A1 (en) 2017-07-27
JP6641018B2 (ja) 2020-02-05
TR201906475T4 (tr) 2019-05-21
EP3405951B1 (en) 2019-11-13
EP3405949A1 (en) 2018-11-28
SG11201806216YA (en) 2018-08-30
KR20180105682A (ko) 2018-09-28
AU2019213424B8 (en) 2022-05-19
WO2017125558A1 (en) 2017-07-27
CN108780649A (zh) 2018-11-09
EP3503097A2 (en) 2019-06-26
AU2019213424A8 (en) 2022-05-19
ES2773794T3 (es) 2020-07-14
AU2017208579A1 (en) 2018-08-09
US10424309B2 (en) 2019-09-24
PL3405949T3 (pl) 2020-07-27
US10854211B2 (en) 2020-12-01
US11887609B2 (en) 2024-01-30
JP2021101253A (ja) 2021-07-08
CN108780649B (zh) 2023-09-08
JP2019506634A (ja) 2019-03-07
AU2017208575B2 (en) 2020-03-05
JP6856595B2 (ja) 2021-04-07
AU2017208580B2 (en) 2019-05-09
TW201801067A (zh) 2018-01-01
EP3405948B1 (en) 2020-02-26
CA3011915C (en) 2021-07-13
EP3503097C0 (en) 2023-09-20
MY181992A (en) 2021-01-18
MY196436A (en) 2023-04-11
CN108885879A (zh) 2018-11-23
MX2018008887A (es) 2018-11-09
CA3012159C (en) 2021-07-20
CN107710323B (zh) 2022-07-19
JP6412292B2 (ja) 2018-10-24
KR20180104701A (ko) 2018-09-21
ES2790404T3 (es) 2020-10-27
AU2017208580A1 (en) 2018-08-09
AU2017208575A1 (en) 2018-07-26
RU2017145250A (ru) 2019-06-24
ZA201804625B (en) 2019-03-27
RU2693648C2 (ru) 2019-07-03
MX2018008890A (es) 2018-11-09
JP6626581B2 (ja) 2019-12-25
AU2017208576B2 (en) 2018-10-18
PL3284087T3 (pl) 2019-08-30
TWI629681B (zh) 2018-07-11
MY189205A (en) 2022-01-31
KR20180012829A (ko) 2018-02-06
EP3284087B1 (en) 2019-03-06
US20180322883A1 (en) 2018-11-08
JP2022088584A (ja) 2022-06-14
JP2019502966A (ja) 2019-01-31
JP2020170193A (ja) 2020-10-15
TWI628651B (zh) 2018-07-01
PT3405949T (pt) 2020-04-21
ES2727462T3 (es) 2019-10-16
EP3405951A1 (en) 2018-11-28
KR102083200B1 (ko) 2020-04-28
SG11201806241QA (en) 2018-08-30
KR102343973B1 (ko) 2021-12-28
JP6859423B2 (ja) 2021-04-14
KR102219752B1 (ko) 2021-02-24
EP3405949B1 (en) 2020-01-08
JP7053725B2 (ja) 2022-04-12
TW201729561A (zh) 2017-08-16
JP7258935B2 (ja) 2023-04-17
SG11201806246UA (en) 2018-08-30
JP7161564B2 (ja) 2022-10-26
KR20180103149A (ko) 2018-09-18
ES2768052T3 (es) 2020-06-19
BR112017025314A2 (pt) 2018-07-31
CA3011914A1 (en) 2017-07-27
JP2020060788A (ja) 2020-04-16
US20180342252A1 (en) 2018-11-29
MX2018008889A (es) 2018-11-09
RU2017145250A3 (zh) 2019-06-24
EP3503097B1 (en) 2023-09-20
BR112018014689A2 (pt) 2018-12-11
ZA201804776B (en) 2019-04-24
AU2017208579B2 (en) 2019-09-26
WO2017125562A1 (en) 2017-07-27
JP2018529122A (ja) 2018-10-04
JP2019032543A (ja) 2019-02-28
PL3503097T3 (pl) 2024-03-11
US11410664B2 (en) 2022-08-09
JP6730438B2 (ja) 2020-07-29
MX371224B (es) 2020-01-09
HK1244584B (zh) 2019-11-15
WO2017125559A1 (en) 2017-07-27
CN108885877B (zh) 2023-09-08
EP3284087A1 (en) 2018-02-21
TWI643487B (zh) 2018-12-01
CA2987808C (en) 2020-03-10
US20190228786A1 (en) 2019-07-25
TWI653627B (zh) 2019-03-11
CN108885877A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
JP7270096B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法